Maschinelles Lernen (Machine Learning)

Was ist Machine Learning?

Maschinelle Lernverfahren (engl. Machine Learning, ML) umfassen das Trainieren eines mathematischen Modells mit Trainingsdaten, welches dann dazu genutzt werden kann, Daten aus dem Einsatzkontext automatisiert auszuwerten. Damit das Modell nur die relevanten Aspekte der Eingangsdaten lernt, durchlaufen diese üblicherweise vorher eine Merkmalsextraktion. Bei Bilddaten wäre die Extraktion der häufigsten Farbe oder die Identifikation geometrischer Formen eine solche Merkmalsextraktion (engl. Feature Extraction).

Es gibt verschiedene Verfahren, die sich durch den Lernprozess unterscheiden: überwachtes Lernen, unüberwachtes Lernen, teilüberwachtes Lernen und verstärkendes Lernen. Als Modelle kommen z.B. Entscheidungsbäume, Regressionsanalysen, Cluster-Analysen oder künstliche neuronale Netze zum Einsatz.

blau, schwarz, grün, abstrakt, ki, machine learning, deep learning
© unsplash.com/getty-images; Fraunhofer IESE

Methoden des maschinellen Lernens


Überwachtes Lernen (Supervised Learning):
Vorhersagen und Prognosen nach einem Zielmuster (aus vorhandenen »gelabelten« Daten) für neue Daten, z.B. Verkehrsschilderkennung.


Unüberwachtes Lernen (Unsupervised Learning):
Erkennt selbstständig Muster und Zusammenhänge in Daten, z.B. für Cluster von gemeinsamen Interessen von Käufer*innen von Wein und Käse.


Teilüberwachtes Lernen (Semi-Supervised Learning):
Mischung aus überwachtem und unüberwachtem Lernen, um z.B. mit wenigen vorhandenen gelabelten Daten auszukommen, die i.d.R. kostenintensiv von Menschen klassifiziert werden müssen.


Verstärkendes Lernen (Reinforcement Learning):
Ein Belohnungssystem leitet das Lernen durch Zusatzdaten an. Beispiel: die zurückgelegte Wegstrecke zum Ziel, um für einen Roboter den kürzesten Weg durch ein Labyrinth zu finden.

Machine Learning vs. Deep Learning


Das Deep Learning ist ein Verfahren, welches sehr große neuronale Netze nutzt, um z.B. beim unüberwachten Lernen die Merkmalsextraktion mitzulernen, und dann ohne speziell gelabelte Daten auskommt. Das verwendete neuronale Netz ist aber deutlich komplexer, da mehr Stufen erforderlich sind und es müssen auch deutlich mehr Trainingsdaten eingesetzt werden müssen, um ein solches Netz zu trainieren.

 

 Vergleichstabelle ansehen

Wie funktioniert Maschinelles Lernen?

Anders als beim Programmieren von Software werden Modelle des Maschinellen Lernens mithilfe von Softwarewerkzeugen »angelernt«. Dieser Trainingsphase schließt sich eine Validierungsphase an, bevor das Modell in ein Softwaresystem integriert werden und eingesetzt werden kann.

Auch wenn das Anlernen bzw. die Lernphase sehr aufwendig ist, sind die resultierenden Modelle deutlich einfacher und damit auch in der Lage, Daten schnell zu analysieren. Das heißt, auch in eingebetteten Geräten oder in Apps auf Mobiltelefonen lassen sich ML-Anwendungen bis zu einer bestimmten Komplexität einsetzen.

Machine Learning benötigt pro zu betrachtendem Merkmal mind. 50-100 Datensätze, wenn die Merkmale in den Daten bekannt sind bzw. extrahiert werden können. Verfahren, wie Deep Learning, die ohne diese Merkmale auskommen, benötigen einige Tausend Daten pro Merkmal. So kommen sehr schnell sehr große Datenmengen zusammen.

Vor- und Nachteile von Machine Learning

Wenn große Datenmengen gleicher Art in Bezug auf Muster analysiert werden sollen (z.B. bei Bild- und Frequenzanalysen) oder auch Zusammenhänge in Daten identifiziert werden müssen, lassen sich mit maschinellen Lernverfahren deutlich schneller und einfacher Lösungen erstellen als durch algorithmische Verfahren.

blau, schwarz, grün, abstrakt, ki, machine learning, deep learning
© unsplash.com/getty-images; Fraunhofer IESE

Mithilfe maschineller Lernverfahren lassen sich teils erstaunliche Ergebnisse in unterschiedlichsten Anwendungsbereichen erzielen.

Vorteile maschineller Lernverfahren sind:

  • Automatisierte Lösung ohne »Programmieren«
  • Komplexe, auch unbekannte, Datenzusammenhänge können bei entsprechenden Voraussetzungen aufgelöst werden

Nachteile maschineller Lernverfahren sind:

  • Notwendigkeit umfangreicher, ggf. gelabelter Trainingsdaten
  • Schwierige bis unmögliche Nachvollziehbarkeit / Verständlichkeit
  • Aufwendige Validierung mit umfangreichen Testdaten
  • Verbleibende Validierungslücke nicht vorhersehbarer »falscher« Aussagen oder Vorhersagen bei den meisten Verfahren

Beispiele für Anwendungsfälle ansehen

Auswahl und Einsatz maschineller Lernverfahren

Zu den Entscheidungskriterien für die Auswahl des geeigneten Lernverfahrens gehören:

 

  • Anzahl der vorhandenen Daten
  • Anzahl der klassifizierten/gelabelten vorhandenen Daten
  • Charakteristik der Daten (Homogenität, Qualität (Vollständigkeit, Korrektheit, Genauigkeit), Anzahl der Datentypen usw.)
  • Ziel der Bewertung
  • Verfügbare Rechenleistung (eingebettetes Gerät oder Cloud-Umgebung)
  •  

    Es gibt viele Werkzeuge, Bibliotheken oder auch frei verfügbare Open Source Software für KI-Lösungen. Erste Ergebnisse lassen sich meist schneller erzielen als man zunächst meint.

    Wir unterstützen Sie gerne bei der Entwicklung Ihrer spezifischen Lösung und stellen Ihnen unser AI-Innovation Lab als Infrastruktur für die Evaluierung zur Verfügung. 

     

    Leistungsangebot ansehen