Seminar Datenaufbereitung

Hands-On Data Preparation

Die Entwicklung und Anwendung komplexer maschineller Lernverfahren hängt von einer effektiven und zielgerichteten Datenaufbereitung und der Sicherstellung einer guten Datenqualität ab. Viele Analysemethoden benötigen z.B. zwingend vollständige Daten. Deshalb muss ein Analyst neben der Datenqualität z.B. auch die Vollständigkeit der Daten überprüfen und fehlende Werte ggf. ergänzen (Missing Data Imputation). Weitere Datenaufbereitungsschritte wie z.B. Normalisieren, Balancieren, Feature/Instanz-Auswahl, Noise-Filtering, Sampling oder Diskretisieren können notwendig sein. Die Auswahl, Kombination und parametrische Anpassung dieser Verfahren hängt vom geplanten Analyseverfahren ab und ist oft ein zeitintensiver, iterativer Prozess.

Motivation

  • Verborgene Datenschätze
  • Einsatzszenarien für Big Data
  • Daten in Informationen umwandeln

Technologien zur Datenintegration

  • Aktuelle Technologien
  • Referenzinfrastrukturen

Datenvorbereitung, Datenqualitätsanalyse, -sicherstellung, Behebung von Defiziten

  • Daten verbinden/integrieren
  • Daten für die Analyse vorbereiten
  • Relevante Qualitätsmerkmale
  • Daten-/Informationsqualität bewerten
  • Qualitätsverbesserungsstrategien

Zusammenfassung und Ausblick

  • Erkenntnisse
  • Erfolgsfaktoren

In diesem Hands-on-Seminar zeigen wir Ihnen an konkreten Beispielen, wie Sie die Datenvorbereitung angehen und worauf Sie achten müssen. Dazu verwenden wir Fragestellungen aus dem Bereich der Prozessverbesserung. In praktischen Übungen (z.B. Jupyter Notebooks) vertiefen Sie Ihre Lernerfahrungen.

Anmeldung

AGB

Allgemeine Geschäftsbedingungen für die Teilnahme an Seminaren und Veranstaltungen des Fraunhofer IESE

Datenschutz

Selbstverständlich behandeln wir Ihre Daten vertraulich und geben sie nicht an Dritte weiter. Sie können der Einwilligung in die Verarbeitung Ihrer Daten jederzeit widersprechen.