Die Phase, die in Data-Science-Projekten den meisten Aufwand verschlingt, ist die der Datenvorbereitung. Es gibt kein Standardvorgehen, das alle potenziellen Datenvorbereitungsfragen abdeckt. In diesem Seminar lernen Sie, wie Sie die Effizienz der Datenvorbereitung erhöhen können, um mittels Datenanalysen schnellere Einblicke in Ihre Daten zu gewinnen.
Aus prozesstechnischer Sicht beschreibt der CRoss-Industry Standard Process for Data Mining (CRISP-DM) sechs wichtige Schritte für jedes Datenanalyseprojekt. Nachdem ein Business Understanding (Geschäftsverständnis) erreicht ist, müssen die erforderlichen Daten identifiziert und semantisch verstanden werden (Data Understanding / Datenverständnis). Dies erfordert Domänenwissen ebenso wie Wissen über Data Engineering und Datenanalyse. Das Datenverständnis ist deshalb der Startpunkt für die Datenaufnahme und die Datenvorbereitung.