Webinar »Datenaufbereitung«

Die wichtigsten Schritte der Datenaufbereitung auf den Punkt gebracht

Im Rahmen dieses Webinars beschäftigen wir uns tiefer mit »Data Preparation«, also der Datenaufbereitung, als zentraler Phase in der Datenanalytik. Dies geschieht anhand des »Cross Industry Standard Process for Data Mining (CRISP-DM)«. An Beispielen aus der Praxis werden wir hinter die wichtigsten Schritte der Datenaufbereitung schauen. Sie erhalten Einblick in die Schritte bezüglich der richtigen Auswahl von Daten, in das Bereinigen von Datensätzen sowie in das Integrieren, Transformieren, Konstruieren und Verdichten von Daten.

 

Datenschutz und Datenverarbeitung

Wir setzen zum Einbinden von Videos den Anbieter YouTube ein. Wie die meisten Websites verwendet YouTube Cookies, um Informationen über die Besucher ihrer Internetseite zu sammeln. Wenn Sie das Video starten, könnte dies Datenverarbeitungsvorgänge auslösen. Darauf haben wir keinen Einfluss. Weitere Informationen über Datenschutz bei YouTube finden Sie in deren Datenschutzerklärung unter: https://policies.google.com/privacy

Webinar »Datenaufbereitung« – Aufzeichnung vom 24. April 2020

Termin Bereits stattgefunden. Aufzeichnung vom April 2020 verfügbar
Dauer 60 Minuten 
Sprache deutsch 
Zielgruppe
Product Owner*innen, Product Manager*innen, Project Manager*innen

Dr. Jens Heidrich, Fraunhofer IESE
© Fraunhofer IESE

Prof. Dr. Jens Heidrich leitete bis Oktober 2023 die Hauptabteilung »Smart Digital Solutions« am Fraunhofer-Institut für Experimentelles Software Engineering IESE in Kaiserslautern. In dieser Funktion verantwortete er die Ausrichtung der Forschungsaktivitäten sowie deren Umsetzung im Rahmen nationaler und europäischer Förderprojekte.

Seit 2023 ist er als Forschungskoordinator im Bereich Zusammenarbeit mit Hochschulen tätig. Darüber hinaus ist er als Berater und Projektleiter in industriellen Transferprojekten tätig und hält Seminare und Anwenderworkshops zu verschiedenen Themen im Bereich Software Engineering und Data Science. Er ist Mitglied der Task Force »Data Science« der Gesellschaft für Informatik e.V. sowie in Programmkomitees diverser Workshops und Konferenzen auf nationaler und internationaler Ebene vertreten (z.B. ICSSP, PROFES, SEAA und SWQD).

Die Menge an verfügbaren Daten nimmt in allen Disziplinen und Branchen stetig zu. Dies eröffnet vollkommen neue Möglichkeiten der Datennutzung – zumindest in der Theorie. Denn in der Praxis fehlt oftmals selbst grundlegende Erfahrung in Data Literacy und Data Science.

Datenaufbereitung (Data Preparation) ist einer der wichtigsten Schritte des Data Management, um sinnvolle Analysen durchführen und datengetriebene Entscheidungen verlässlich treffen zu können. Bis zu 80 % der Projektzeit muss oftmals in die Aufbereitung der Daten fließen, da diese unvollständig, fehlerhaft oder widersprüchlich sind und damit nicht unmittelbar analysiert und verwendet werden können. Mehr denn je gilt die alte Informatiker-Weisheit »Garbage in, Garbage out«. Wenn die zu analysierenden Daten von schlechter Qualität sind, wird auch die beste Datenanalyse keine Wunder vollbringen.

Dieses Webinar bringt Klarheit in die Begrifflichkeiten, wie Data Literacy und Data Science, führt den Cross Industry Standard Process for Data Mining (CRISP-DM) ein und geht im Detail auf verschiedene Probleme und Lösungsansätze der Datenaufbereitung (Data Preparation) ein.