Big Data

Big Data Analytics – die Datenflut beherrschen

Die Diskussion über Big Data ist weitaus mehr als die geschickte und gewinnbringende Analyse von Internetdaten. Im Zeitalter von Industrie 4.0 und dem Aufkommen von Cyber-Physical Systems und schlussendlich hochgradig integrierten Digitalen Ökosystemen geht es darum, einen tatsächlich greifbaren Mehrwert für Unternehmen und Individuen aus der potenziellen Verfügbarkeit eines schier unendlich großen Datenschatzes zu schaffen. Bei Big Data in einem Digitalen Ökosystem spielen sowohl Daten aus klassischen eingebetteten Softwaresystemen als auch Business Information Systems sowie der Mensch als zentrale dritte Datenquelle eine herausragende Rolle. Dabei gilt es einerseits, die funktionale Sicherheit der beteiligten eingebetteten Systeme nicht zu gefährden, und andererseits, die Sicherheit der Daten innerhalb eines Digitalen Ökosystems nachhaltig sicherzustellen. Dies stellt auch die Voraussetzung dar, um eine Akzeptanz des Menschen als zentraler Figur eines Digitalen Ökosystems zu schaffen. Natürlich wirft Big Data einerseits viele Fragen für den Umgang von Nutzern mit Internetdiensten auf. Andererseits ermöglicht die Auswertung von Daten im Internet ohne Zweifel bessere, adressatengerechtere Angebote. In dem Maße, in dem die Digitalisierung alle Bereiche des Lebens immer stärker durchdringt, werden mehr Daten erzeugt, sodass auch Big Data eine Querschnittsrolle einnimmt.

Big Data Anwendungen – Unsere Forschungsthemen

Entscheidungsmodelle

In der heutigen Zeit wird eine Vielzahl von Daten über verschiedenste Systeme hinweg gesammelt, aber es ist vielfach unklar, wie diese Daten sinnvoll im Kontext der strategischen Ausrichtung und unter Berücksichtigung der Datensicherheit eingesetzt werden können. Das Fraunhofer IESE beschäftigt sich damit, wie Entscheidungsmodelle systematisch aus den Geschäftszielen heraus konstruiert und wie Daten entsprechend aggregiert bzw. verdichtet werden müssen, um eine effiziente Entscheidungsfindung zu ermöglichen.

Daten- und Informationsqualität

Ein weiteres Grundproblem bei Big Data Analytics stellt das Vertrauen in die Daten und die daraus abgeleiteten Informationen dar. Die Daten können aus unterschiedlichsten Systemen verschiedener Organisationen stammen und Details über die Art der Datensammlung und Qualitätssicherung sind nicht immer bekannt. Die explizite Modellierung der Daten inkl. der geforderten Qualitätscharakteristiken, wie Vollständigkeit, Konsistenz oder Aktualität der Daten, basieren auf Ansätzen aus dem Bereich der Softwarequalitätsmodellierung, mit der sich das Fraunhofer IESE beschäftigt.

Datenvisualisierung

Nicht alle Entscheidungen in einem Digitalen Ökosystem werden auf Basis eines automatisierbaren Regelkreises getroffen, sondern oft stehen Menschen hinter diesen Entscheidungen. Um Entscheidungsträger zu unterstützen, sind Visualisierungsmechanismen daher unabdingbar. Dabei wird grob zwischen Ansätzen zur Verdichtung und nutzergerechten Exploration von Big Data und Ansätzen zur effizienten algorithmischen Umsetzung der Visualisierung großer Datenmengen unterschieden. Beim Fraunhofer IESE beschäftigt man sich unter anderem damit, welche Visualisierungsmechanismen für Big Data geeignet sind und wie der Nutzer mit diesen interagieren muss, um effizient Entscheidungen treffen zu können.

Akzeptanz

Eine übergeordnete Fragestellung bei der Nutzung von Big Data in Digitalen Ökosystemen liegt in der Akzeptanz derartiger Systeme durch den Menschen als zentralem Nutzer. Unter Gewährleistung der Sicherheit der bereitgestellten Daten muss versucht werden, den Menschen möglichst zuverlässig und transparent als Datenquelle zu integrieren und ihn andererseits mit der Informationsvielfalt nicht zu überfrachten, sondern ihn mit einer der jeweiligen Entscheidungsfindung angemessenen Menge an Informationen zu versorgen.

Big Data Datenschutz und Datennutzungskontrolle

Zentrale Fragestellungen für Unternehmen im Kontext von Digitalen Ökosystemen sind Datenhoheit und Datenschutz. Sensible Daten wie z.B. Produktions- und Qualitätsdaten könnten zwar für Szenarien wie unternehmensübergreifende Produktionsdatenanalyse im Kontext von Automobilfertigung ein hohes Potenzial bieten, jedoch werden diese Daten von den Teilnehmern nicht frei bereitgestellt. Daher kommt der Forschung im Bereich Datenschutz für Big Data in Digitalen Ökosystemen eine besondere Bedeutung zu, da sie ein Kernhemmnis für unternehmensübergreifende Analysen eliminiert. Die Forschung am Fraunhofer IESE im Bereich Nutzungskontrolle ermöglicht es bereits durch entsprechend formulierte Regeln (so genannte Policies) und eine modifizierte Infrastrukturumgebung (Enforcement Framework), Daten, die die eigene Unternehmensgrenze verlassen, effektiv zu schützen. Diese Frameworks werden sukzessive auf die Erfordernisse von Big-Data-Technologien optimiert. Hier muss erforscht werden, ob die erforderliche Performanz in der Analyse der Daten bei der Kombination von existierender Nutzungskontrolltechnologie mit Big-Data-Technologien erreicht werden kann.

Big Data – die größten Herausforderungen

Es gilt, einige zentrale Aspekte von Big Data in Digitalen Ökosystemen zu beherrschen, wenn derartige Systeme Realität werden sollen. Herausforderung für die Praxis wird es beispielsweise sein, geeignete Infrastrukturen zu finden:

In Digitalen Ökosystemen arbeiten Unternehmen unterschiedlicher Größen in einem Ökosystem zusammen. Zur Analyse der Daten wird in den Unternehmen eine Big-Data-Infrastruktur mit entsprechender Rechenleistung bereitgestellt. Dies stellt Unternehmen vor mehrere Herausforderungen.

Gerade kleine und mittelgroße Unternehmen werden sich ggf. keine dedizierte Infrastruktur anschaffen wollen bzw. können. Hier müssen neue Lösungsstrategien gefunden werden:

Einerseits bietet der Trend zur Speicherung von Daten in der Cloud erste Ansätze für Big-Data-Analysen. Für die Untersuchung von sensiblen Daten sind aber auch Ansätze der zeitweisen Anmietung von Infrastruktur denkbar. Beide Ansätze sind als Big-Data-Analysen sozusagen „on-demand“ vorstellbar.

Problematisch ist weiterhin die voranschreitende Etablierung von unterschiedlichen, teilweise inkompatiblen Technologien zu Big Data Analytics:

Es entwickelt sich derzeit eine heterogene Landschaft von Big-Data-Anbietern, die sich in den digitalen Ökosystemen verschiedener Unternehmen unterschiedlich ausprägt. Für unternehmensübergreifende Analysen müssen sich aber de-facto Standards in einem Ökosystem, kompatible Schnittstellen zwischen den Anbietersystemen und eine geeignete, performante Zwischenschicht zum Datenaustausch etablieren.

Etablierung innovativer Geschäftsmodelle

Allgemein gilt, dass innovative Geschäftsmodelle eine zentrale Fragestellung in Digitalen Ökosystemen sind. Um diese realisieren zu können, müssten sich auch neue, teilweise noch nicht existierende Dienstanbieter gründen. Ein Beispiel dafür wäre das Angebot der oben genannten „on-demand“-Analysen. Häufig stellt sich jedoch für die potenziellen Beteiligten in einem solchen innovativen Geschäftsmodell im Digitalen Ökosystem die Frage nach dem Risikomanagement, bzw. nach der Tragfähigkeit eines solchen Geschäftsmodells. Wenn die Forschung Simulationsumgebungen für solche Smart Ecosystems im Sinne einer Rapid-Prototyping-Umgebung entwickelt, kann die Frage nach dem Mehrwert besser beantwortet werden. Wenn Verfahren und Big Data Technologien weiter ausgereift sind und den Datenschutz bei der Analyse und deren Daten gewährleisten können, werden die Hemmschwellen sinken.

Standardisierung

Für einen effizienten Datenaustausch zwischen Unternehmen, aber auch zwischen den Analyseergebnissen unterschiedlicher Technologien, wäre eine Standardisierung der Daten, deren Modellierungsverfahren und der Spezifikation der Datenqualitäten eine erhebliche Erleichterung. Viele Standardisierungsverfahren finden heute für eine konkrete Branche statt, z.B. im Maschinenbau, in der Automobilbranche, in der Finanzbranche. Charakteristisch für die Digitalen Ökosysteme von morgen sind jedoch folgende Punkte: am Ökosystem sind Teilnehmer unterschiedlichster Branchen beteiligt. Die Menge der Teilnehmer im Ökosystem kann dabei sehr variabel sein. Dies kann eine schnelle Standardisierung sehr erschweren und stellt daher eine der größten Herausforderungen dar.

Die zahlreichen denkbaren Applikationsszenarien in einem Digitalen Ökosystem können nicht mehr getrennt voneinander betrachtet werden, sondern sind eher als Ausschnitt eines sich ständig weiterentwickelnden Systems zu verstehen. In diesem System kommen neue Dienstleistungen und Organisationen hinzu und lösen über die Zeit hinweg andere wieder ab. Diese Verzahnung ist heute bereits im Bereich der Energiewirtschaft und der Elektromobilität zu beobachten, wo beispielsweise Elektrokraftfahrzeuge einerseits zwar Energie verbrauchen, andererseits aber auch als dezentrale Energiespeicher eingesetzt werden können. Ein weiteres Beispiel liegt in der Verknüpfung von Produktionstechnik und intelligenten Mobilitätssystemen. Ziel ist hier, die Transport- und Liegezeiten von Waren zu verkürzen und flexibel auf Umplanungen von Produktionsprozessen reagieren zu können.

Big Data Anwendungsbeispiele und Projekte

 

Automatisierung in Produktion und Anlagenbau

Gebr. Pfeiffer SE

Das Fraunhofer IESE unterstützte Gebr. Pfeiffer bei der Entwicklung und Umsetzung von intelligenten Algorithmen zum Mühlenschutz und zur prädiktiven Instandhaltung. 

PRO-OPT

BMWi-Projekt zur Erforschung und Evaluation von Big-Data-Lösungen für Unternehmen mit dem Ziel der Produktionsoptimierung unter Einhaltung von Datensicherheitsaspekten.

Werden Sie Data Scientist

Data Scientist Basic Level (zertifiziert) - Fraunhofer bietet ein dreistufiges Zertifikatsprogramm zum Data Scientist.

Seminar: Analyse des Potenzials von Big Data

Tipps für den Einsatz eines KI-Sprachmodells

Sie wollen von generativer KI wie beispielswiese ChatGPT profitieren und innovative Lösungen entwickeln? In unserem Blogbeitrag lesen Sie die 8 besten Tipps zu LLMs.