weiterbildung.swiss - Navigation

Das Schweizer Kursportal powered by:
Logo, SVEB - Schweizerischer Verband für Weiterbildung
fr it

CAS Data Engineering

Datum 30.08.24
Kursort ZHAW
St.-Georgen-Platz 2
8401 Winterthur
+41 58 934 79 79
Preis CHF 8000.-
Weiterbildungsgutscheine akzeptiert Nein

Beschreibung

Das Phänomen der stetig zunehmenden Menge und Verbreitung von Daten begleitet uns seit Jahrzehnten. Zu Beginn dieser Entwicklung entstanden Daten in Systemen, bei denen die gewünschte Funktionalität die Form und Verarbeitung der Daten vorgab. Heutzutage verbreiten sich aber auch Systeme, in denen ein Nutzen dank dem Einbezug vorhandener Daten gestiftet wird.

Ziel

Sie können im Anschluss an diesen CAS:

  • Fragestellungen identifizieren, denen mit dem Einbezug von Daten und unterschiedlichen Aufbereitungs- und Analysemethoden begegnet werden kann
  • für den Erkenntnisgewinn erforderliche Daten identifizieren und spezifizieren
  • Speicherlösungen konzeptionieren und Datenmodelle skizzieren
  • die wichtigsten Überlegungen im Bereich der Sicherheitsaspekte kennen
  • Daten mittels unterschiedlicher Vorgehensweisen beschaffen und in geeignete Speicherlösungen überführen
  • für die Datenpipeline geeignete Transformationsmethoden kennen und anwenden, um die Datenkompatibilität herzustellen
  • für die Datenpipeline geeignete Bereinigungsmethoden kennen und anwenden, um eine akzeptable Datenqualität herzustellen
  • Statistische Methoden und Modelle des maschinellen Lernens für die Analyse und Validation der Daten innerhalb des Data Engineering - Lebenszyklus kennen und anwenden
  • Statistische Methoden und Modelle des maschinellen Lernens für die Identifikation von Anomalien in Daten kennen und anwenden
  • Werkzeuge und Methoden für den Umgang mit natürlicher Sprache kennen und anwenden
  • Werkzeuge und Methoden für den Umgang mit Bilddaten kennen und anwenden
  • Werkzeuge und Methoden für den Umgang mit räumlichen Daten kennen und anwenden
  • Daten über ausgewählte Deployment-Lösungen bereitstellen und Datenübergänge automatisieren

Inhalt

Data Engineering wird je nach Definition als Teilbereich oder als Vorstufe des Data Science verstanden und befasst sich hauptsächlich mit den praktischen Aspekten der Datenbeschaffung und Zusammenführung, über den gesamten Datenaufbereitungskreislauf bis zur Analyse mit dem Ziel, eine qualitativ und quantitativ akzeptable Datengrundlage für die anschliessende Modellierung zu bieten.

Mit dem Wachstum der Datenmenge haben wir immer mehr Möglichkeiten, nützliche Produkte, Dienstleistungen und effektive Betriebe zu gestalten. Menschen in diversen Positionen, Funktionen und Rollen verfolgen ein breites Spektrum an Aufgaben, in denen Fragestellungen mit der Erfassung, Aufbereitung und Verarbeitung von Daten effektiver und effizienter beantwortet werden können. Im CAS Data Engineering vermitteln wir ein ebenso breites Spektrum an Werkzeugen und Methoden, welche Teilnehmende dazu befähigt, in ihrem beruflichen Alltag Daten mittels systematischer Techniken bereitzustellen, damit aus diesen ein konkreter Nutzen gewonnen werden kann.

Jeder Themenblock wird begleitet durch eine theoretische Einführung in die Thematik, die prozessorientierte Perspektive sowie praktische Übungen. Die Übungen finden mit öffentlich zugänglichen Daten aus den Bereichen Pharma & Gesundheit, Energie & Umwelt, Automobilindustrie, Versicherungen, Finanzen und Agrarwirtschaft statt. Es besteht ebenfalls die Möglichkeit, mit eigenen Daten zu arbeiten.

Modul 1: Werkzeuge und Methoden

1. Einführung

  • Definition von Data Engineering, Abgrenzung zu verwandten Themenbereichen
  • Motivation, Organisation, Anforderungen, Organisatorisches
  • Tools und Equipment (Programmier-, Abfrage- und Skriptsprachen, Umgebungen)

2. Data Ingestion

  • Formate und Datentypen
  • Datenquellen und -identifikation
  • API?s
  • Webscraping

3. Explorative Datenanalyse

  • Explorative Datenanalyse und -evaluation
  • Formen und Regeln der Visualisierung
  • Initiale Datenbereinigung
  • Clustering
  • Hypothesentest

4. Datenorganisation

  • Datenströme
  • Strukturierte Daten vs. unstrukturierte Daten
  • Datenarchitekturen (Datenbanken, Managementsysteme, Schnittstellen)
  • Relationale Datenbanken und zugehörige Abfragesprachen
  • Nicht-relationale Datenbanken und zugehörige Datenmodelle sowie Abfragesprachen
  • Daten- und Informationssicherheit

5. Transformation & Aggregation

  • Formen der Zusammenführung von Daten
  • Integration
  • Verteilte Systeme
  • Transformationsarchitekturen

6. Cleansing

  • Datenqualität
  • Die gängigsten Anomalien (uni- und multivariate Analyse)
  • Kompatibilitäten
  • Prognosen

Modul 2: Domänen und Daten

1. Analyse & Validation

  • Kurze Repetition statistischer Grundlagen
  • Panel-Daten
  • Analyse und Validation mit maschinellem Lernen
  • Maschinelles Lernen für Data Engineering (u.a. zur Erkennung von Anomalien)

2. Modell- und Ressourcen-Optimierung

  • Performance-Optimierung vs. Ressourcen-Optimierung
  • Modellbasierte Optimierung
  • Datenbasierte Optimierung
  • Umgebungsbasierte Optimierung

3. Natural Language Processing

  • Datenaufbereitung für und Anwendung von natürlicher Sprache

4. Bilddaten

  • Datenaufbereitung für und Anwendung von Bildern

5. Räumliche Daten

  • Analyse und Visualisierung räumlicher Daten

6. Distribution von Objekten

  • DevOps
  • Deployment
  • Container und Microservices

Wir arbeiten mit den folgenden Sprachen und Umgebungen:

Programmier-, Abfrage- und Skriptsprachen:

  • Python (Pandas, NumPy, Matplotlib, Seaborn, Scikit Learn)
  • SQL
  • Cypher
  • R
  • Visual Basic

Entwicklungsumgebungen:

  • OpenRefine
  • Anaconda (Jupyter Notebook / Lab, Spyder, PyCharm)
  • Google Colab
  • MS Visual Studio
  • MS Excel
  • MS Access

Datenbanken:

  • MySQL, MariaDB
  • MS Azure SQL Server (optional)
  • MongoDB
  • Neo4J (optional)
  • MS Azure Cosmos DB (optional)

Weitere:

  • Git
  • MS Shell / Terminal
  • Docker
  • Flask
  • Dash
  • QT Designer
  • Social Network Visualizer

Voraussetzung

Der Zertifikatslehrgang richtet sich an Absolventinnen und Absolventen von Hochschulen (FH/Universität) mit mind. 3 Jahren Berufserfahrung sowie an Berufsleute ohne Hochschulabschluss mit mind. 5 Jahren Berufserfahrung und entsprechenden Weiterbildungsausweisen (höhere Fachschule oder höhere Fachprüfung mit eidg. Fachausweis/Diplom).

Englischkenntnisse werden vorausgesetzt, weil im Studiengang mit englischer Literatur gearbeitet wird.

Über die definitive Zulassung entscheidet die Studienleitung.

Zielgruppe

Der CAS richtet sich an Fach- und Führungskräfte aus allen Branchen, welche ein Grundlagenverständnis für das Datenmanagement mitbringen, bereits Erfahrungen im generellen Umgang mit Daten gesammelt haben (bspw. durch den Besuch des CAS Data Competence for Business) und sich im Bereich der Sammlung, Aufbereitung, Validierung und Distribution von Daten vertiefen wollen. Idealerweise haben Sie bereits erste Erfahrungen mit 1 ? 2 Abfrage-, Programmier- oder Skriptsprachen gesammelt. Der CAS bereitet Sie darauf vor, Aufgaben im Bereich des Data Engineering selbst durchzuführen sowie auf einem fachlichen Niveau zu überwachen.

Bemerkung

  • CHF 8?000 für CAS Anmeldungen bis 30.06.2024*

    CHF 8?340 für CAS Anmeldungen ab 01.07.2024*

  • MAS-Teilnehmende erhalten einen Rabatt von CHF 1?000.00
  • die vollständigen Studiengebühren sind vor Studienbeginn zu begleichen
  • in den Studiengebühren sind die Einschreibe- und Prüfungsgebühren sowie sämtliche kursrelevanten Unterlagen enthalten

Weitere Informationen

Datum 30.08.24
Kursort ZHAW
St.-Georgen-Platz 2
8401 Winterthur
+41 58 934 79 79
Preis CHF 8000.-
Weiterbildungsgutscheine akzeptiert Nein
 
Mit Ihrem Besuch auf unserer Website stimmen Sie unserer Datenschutzerklärung und der Verwendung von Cookies zu. Dies erlaubt uns unsere Services weiter für Sie zu verbessern. OK