Modul 1: Data Preparation Toolbox

Über unseren Trainer

Unser Trainer René Nyffenegger hat sich seine ganze Karriere mit Leidenschaft und Erfolg dem Thema Daten-Analyse und Daten-Qualität gewidmet.
In der Praxis traf er häufig Daten-Konstellationen an, welche die Verwendung der Daten verunmöglichten. Erst Stunden oder Tage nach der intensiven Beschäftigung mit solchen Daten waren sie in der gewünschten Form, so dass die Daten-Analyse nicht nur möglich sondern zum Kinderspiel wurde.

Im Rahmen dieses Kurses gibt René seine Erfahrungen und Vorgehensweise an themeninteressierte Anwender weiter und zeigt auf, wie man mit etwas handwerklichem Geschick und Fleiss verblüffend einfach und schnell zu guten Resultaten kommt.

Data Preparation - eine Definition

Data Preparation umfasst das Sammeln, Zusammenführen, Organisieren und Strukturieren von Daten, damit nachfolgende Arbeitsschritte wie Visualisierungen, Machine Learning und Analytics umgesetzt werden können.

Die hauptsächlichen Bausteine der Datenaufbereitung sind Bereinigung, Validierung und Transformation. Dabei müssen häufig auch Daten aus verteilten Architekturen wie verschiedenen internen Systemen und externen Quellen zusammengeführt werden.

Einer der Hauptzwecke der Datenaufbereitung besteht darin, sicherzustellen, dass die für die Analyse bereitgestellten Informationen korrekt und konsistent sind, damit die Ergebnisse von BI- und Analyseanwendungen gültig sind (siehe dazu auch unsere Initiative zum Thema „Data Quality Matters“). Daten liegen häufig mit fehlenden Werten, Ungenauigkeiten, Redundanzen oder Formatfehlern vor, welche abgeglichen werden müssen.

Data Preparation kann somit verkürzt zusammengefasst werden als das Durchführen von Überprüfungen, das Korrigieren von Ungenauigkeiten und das Zusammenführen von Datensätzen.
Definition basierend auf dem empfehlenswerten Beitrag von Margaret Rouse im TechTarget Network.

Kursinhalte und Abgrenzung

Was René behandeln wird:

  • eine Auswahl von erprobten SQL-Konstrukten, die zur Aufbereitung von Daten verwendet werden können
  • wiederverwendbare Anwendungsbeispiele mit Regular Expression (RegEx)
  • ein Streifzug durch die Sprache R um zu zeigen, wie Daten mit minimalem Aufwand visualisiert werden können
  • good Practices aus 20 Jahren data-driven Tätigkeiten, inklusive anwendbaren Beispielen

Was dieser Kurs nicht ist:

  • es ist kein Basis-Einführungskurs in SQL

Kursziele

Die Teilnehmenden erhalten einen vertieften Einblick in die Möglichkeiten der Data Preparation. Die Vorteile eines strukturierten und in nachvollziehbare und wiederholbare Teilschritte gegliederten Vorgehens sind den Teilnehmenden bekannt. Zudem haben sie neue Herangehensweisen, Strategien und Werkzeuge zur Data Preparation kennen gelernt und können diese selbständig und Nutzen bringend einsetzen und erweitern.

Last but not least: Die Teilnehmenden tragen in ihren Projekten und Organisationen dazu bei, dass dem Thema Data Preparation mehr Beachtung geschenkt wird und sie leisten einen aktiven Beitrag zur Steigerung der Effektivität ihrer Tätigkeiten.

Hard Facts

Termin-Auswahl im Jahr 2019
- Donnerstag 20. Juni (ausgebucht)
- Dienstag 10. September (ausgebucht) 
- Donnerstag 7. November (es sind noch Plätze frei)

Dauer des Kurses
13.00 bis 17.30 Uhr, im Anschluss optionaler "After-Kurs-Drink" mit Networking-Potenzial

Durchführungsort
Open Mind Office
OMIS AG - Bankstrasse 6 - 8610 Uster

Investition
CHF 550

Maximale Teilnehmerzahl
10 Personen

Soft Facts

Trainer

René Nyffenegger, Senior Data Scientist

Zielpublikum
Personen, die für ein unternehmenskritisches Vorhaben verantwortlich sind und für die ungenügende Daten-Qualität ein Risiko-Faktor darstellt. 
Ganz allgemein sprechen wir Data Aficionados* und Data Aficionadas* an, sei es in umsetzender oder verantwortender Rolle wie zum Beispiel als Data Analyst, Quality Manager, Projektleitende, Business Analyst, CFO oder Release Manager.

Voraussetzungen
Daten-Affinität, Freude an technischen Details, gerne mit SQL-Kenntnissen und Datenbank-Verständnis

Mitnehmen
Open Mind Attitude

Gut zu wissen
- Der Kurs findet garantiert statt
- Laptop nicht nötig
- "After-Academy-Party" an der Bar des Open Mind Office - mit Networking-Potenzial

* kann übersetzt werden als LiebhaberIn, Enthusiast

Ich bin dabei

Hier geht's zur Anmeldung!

Gerne stehen wir Ihnen für Fragen und Hinweise unter +41 44 942 50 00 persönlich zur Verfügung.
Generelle Informationen zur data-driven Academy sind hier zu finden.