Big Data

Big Data – die Datenflut beherrschen

Die Diskussion über Big Data ist weitaus mehr als die geschickte und gewinnbringende Analyse von Internetdaten. Im Zeitalter von Industrie 4.0 und dem Aufkommen von Cyber-Physical Systems und schlussendlich hochgradig integrierten Smart Ecosystems geht es darum, einen tatsächlich greifbaren Mehrwert für Unternehmen und Individuen aus der potenziellen Verfügbarkeit eines schier unendlich großen Datenschatzes zu schaffen. Bei Big Data in einem Smart Ecosystem spielen sowohl Daten aus klassischen eingebetteten Softwaresystemen als auch Business Information Systems sowie der Mensch als zentrale dritte Datenquelle eine herausragende Rolle. Dabei gilt es einerseits, die funktionale Sicherheit der beteiligten eingebetteten Systeme nicht zu gefährden, und andererseits, die Sicherheit der Daten innerhalb eines Smart Ecosystems nachhaltig sicherzustellen. Dies stellt auch die Voraussetzung dar, um eine Akzeptanz des Menschen als zentraler Figur eines Smart Ecosystems zu schaffen. Akzeptanz umschließt dabei die Bereitschaft, Daten unter der Prämisse der Sicherheit in ein solches System einzugeben und gleichzeitig einen tatsächlichen Mehrwert aus der Nutzung der Daten zu ziehen. Natürlich wirft Big Data einerseits viele Fragen für den Umgang von Nutzern mit Internetdiensten auf. Andererseits ermöglicht die Auswertung von Daten im Internet ohne Zweifel bessere, adressatengerechtere Angebote. Aber das Internet im engeren Sinne ist eben nur einer von vielen Bereichen, in denen Big Data eine zunehmend wichtige Rolle spielen wird. In dem Maße, in dem die Digitalisierung alle Bereiche des Lebens immer stärker durchdringt, werden mehr Daten erzeugt, sodass auch Big Data eine Querschnittsrolle einnimmt.

Big Data – die größten Herausforderungen

Es gilt, einige zentrale Aspekte von Big Data in Smart Ecosystems zu beherrschen, wenn derartige Systeme Realität werden sollen. Herausforderung für die Praxis wird es beispielsweise sein, geeignete Infrastrukturen zu finden: In Smart Ecosystems arbeiten Unternehmen unterschiedlicher Größen in einem Ökosystem zusammen. Zur Analyse der Daten wird in den Unternehmen eine Big-Data-Infrastruktur mit entsprechender Rechenleistung bereitgestellt. Dies stellt Unternehmen vor mehrere Herausforderungen. Gerade kleine und mittelgroße Unternehmen werden sich ggf. keine dedizierte Infrastruktur anschaffen wollen bzw. können. Hier müssen neue Lösungsstrategien gefunden werden: Einerseits bietet der Trend zur Speicherung von Daten in der Cloud erste Ansätze für Big-Data-Analysen. Für die Untersuchung von sensiblen Daten sind aber auch Ansätze der zeitweisen Anmietung von Infrastruktur denkbar. Beide Ansätze sind als Big-Data-Analysen sozusagen „on-demand“ vorstellbar. Problematisch ist weiterhin die voranschreitende Etablierung von unterschiedlichen, teilweise inkompatiblen Technologien zur Big-Data-Analyse: Es entwickelt sich derzeit eine heterogene Landschaft von Big-Data-Anbietern, die sich in den Smart Ecosystems verschiedener Unternehmen unterschiedlich ausprägt. Für unternehmensübergreifende Analysen müssen sich aber de-facto Standards in einem Ökosystem, kompatible Schnittstellen zwischen den Anbietersystemen und eine geeignete, performante Zwischenschicht zum Datenaustausch etablieren.

Etablierung innovativer Geschäftsmodelle: Allgemein gilt, dass innovative Geschäftsmodelle eine zentrale Fragestellung in Smart Ecosystems sind. Um diese realisieren zu können, müssten sich auch neue, teilweise noch nicht existierende Dienstanbieter gründen. Ein Beispiel dafür wäre das Angebot der oben genannten „on-demand“-Analysen. Häufig stellt sich jedoch für die potenziellen Beteiligten in einem solchen innovativen Geschäftsmodell im Smart Ecosystem die Frage nach dem Risikomanagement, bzw. nach der Tragfähigkeit eines solchen Geschäftsmodells. Wenn die Forschung Simulationsumgebungen für solche Smart Ecosystems im Sinne einer Rapid-Prototyping-Umgebung entwickelt, kann die Frage nach dem Mehrwert besser beantwortet werden. Wenn Verfahren und Big Data Technologien weiter ausgereift sind und den Datenschutz bei der Analyse und deren Daten gewährleisten können, werden die Hemmschwellen sinken.

Standardisierung: Für einen effizienten Datenaustausch zwischen Unternehmen, aber auch zwischen den Analyseergebnissen unterschiedlicher Technologien, wäre eine Standardisierung der Daten, deren Modellierungsverfahren und der Spezifikation der Datenqualitäten eine erhebliche Erleichterung. Viele Standardisierungsverfahren finden heute für eine konkrete Branche statt, z.B. im Maschinenbau, in der Automobilbranche, in der Finanzbranche. Charakteristisch für die Smart Ecosystems von morgen sind jedoch folgende Punkte: am Ökosystem sind Teilnehmer unterschiedlichster Branchen beteiligt. Die Menge der Teilnehmer im Ökosystem kann dabei sehr variabel sein. Dies kann eine schnelle Standardisierung sehr erschweren und stellt daher eine der größten Herausforderungen dar.

Die zahlreichen denkbaren Applikationsszenarien in einem Smart Ecosystem können nicht mehr getrennt voneinander betrachtet werden, sondern sind eher als Ausschnitt eines sich ständig weiterentwickelnden Systems zu verstehen. In diesem System kommen neue Dienstleistungen und Organisationen hinzu und lösen über die Zeit hinweg andere wieder ab. Diese Verzahnung ist heute bereits im Bereich der Energiewirtschaft und der Elektromobilität zu beobachten, wo beispielsweise Elektrokraftfahrzeuge einerseits zwar Energie verbrauchen, andererseits aber auch als dezentrale Energiespeicher eingesetzt werden können. Ein weiteres Beispiel liegt in der Verknüpfung von Produktionstechnik und intelligenten Mobilitätssystemen. Ziel ist hier, die Transport- und Liegezeiten von Waren zu verkürzen und flexibel auf Umplanungen von Produktionsprozessen reagieren zu können.

Big Data – Unsere Forschungsthemen

Entscheidungsmodelle: In der heutigen Zeit wird eine Vielzahl von Daten über verschiedenste Systeme hinweg gesammelt, aber es ist vielfach unklar, wie diese Daten sinnvoll im Kontext der strategischen Ausrichtung und unter Berücksichtigung der Datensicherheit eingesetzt werden können. Das Fraunhofer IESE beschäftigt sich damit, wie Entscheidungsmodelle systematisch aus den Geschäftszielen heraus konstruiert und wie Daten entsprechend aggregiert bzw. verdichtet werden müssen, um eine effiziente Entscheidungsfindung zu ermöglichen.

Daten- und Informationsqualität: Ein weiteres Grundproblem bei Big-Data-Analysen stellt das Vertrauen in die Daten und die daraus abgeleiteten Informationen dar. Die Daten können aus unterschiedlichsten Systemen verschiedener Organisationen stammen und Details über die Art der Datensammlung und Qualitätssicherung sind nicht immer bekannt. Die explizite Modellierung der Daten inkl. der geforderten Qualitätscharakteristiken, wie Vollständigkeit, Konsistenz oder Aktualität der Daten, basieren auf Ansätzen aus dem Bereich der Softwarequalitätsmodellierung, mit der sich das Fraunhofer IESE beschäftigt.

Datenvisualisierung: Nicht alle Entscheidungen in einem Smart Ecosystem werden auf Basis eines automatisierbaren Regelkreises getroffen, sondern oft stehen Menschen hinter diesen Entscheidungen. Um Entscheidungsträger zu unterstützen, sind Visualisierungsmechanismen daher unabdingbar. Dabei wird grob zwischen Ansätzen zur Verdichtung und nutzergerechten Exploration von Big Data und Ansätzen zur effizienten algorithmischen Umsetzung der Visualisierung großer Datenmengen unterschieden. Beim Fraunhofer IESE beschäftigt man sich unter anderem damit, welche Visualisierungsmechanismen für Big Data geeignet sind und wie der Nutzer mit diesen interagieren muss, um effizient Entscheidungen treffen zu können.

Akzeptanz: Eine übergeordnete Fragestellung bei der Nutzung von Big Data in Smart Ecosystems liegt in der Akzeptanz derartiger Systeme durch den Menschen als zentralem Nutzer. Unter Gewährleistung der Sicherheit der bereitgestellten Daten muss versucht werden, den Menschen möglichst zuverlässig und transparent als Datenquelle zu integrieren und ihn andererseits mit der Informationsvielfalt nicht zu überfrachten, sondern ihn mit einer der jeweiligen Entscheidungsfindung angemessenen Menge an Informationen zu versorgen.

Big Data Datenschutz und Datennutzungskontrolle: Zentrale Fragestellungen für Unternehmen im Kontext von Smart Ecosystems sind Datenhoheit und Datenschutz. Sensible Daten wie z.B. Produktions- und Qualitätsdaten könnten zwar für Szenarien wie unternehmensübergreifende Produktionsdatenanalyse im Kontext von Automobilfertigung ein hohes Potenzial bieten, jedoch werden diese Daten von den Teilnehmern nicht frei bereitgestellt. Daher kommt der Forschung im Bereich Datenschutz für Big Data in Smart Ecosystems eine besondere Bedeutung zu, da sie ein Kernhemmnis für unternehmensübergreifende Analysen eliminiert. Die Forschung am Fraunhofer IESE im Bereich Nutzungskontrolle ermöglicht es bereits durch entsprechend formulierte Regeln (so genannte Policies) und eine modifizierte Infrastrukturumgebung (Enforcement Framework), Daten, die die eigene Unternehmensgrenze verlassen, effektiv zu schützen. Diese Frameworks werden sukzessive auf die Erfordernisse von Big-Data-Technologien optimiert. Hier muss erforscht werden, ob die erforderliche Performanz in der Analyse der Daten bei der Kombination von existierender Nutzungskontrolltechnologie mit Big-Data-Technologien erreicht werden kann.

Big Data Anwendungsbeispiele und Projekte

 

IUNO

BMBF-Projekt zur Entwicklung praxistauglicher Konzepte und Lösungen für IT-Sicherheit in der Industrie 4.0 im Verbund mit 20 Partnern aus Industrie und Forschung.

 

PRO-OPT

BMWi-Projekt zur Erforschung und Evaluation von Big-Data-Lösungen für Unternehmen mit dem Ziel der Produktionsoptimierung unter Einhaltung von Datensicherheitsaspekten.

Folgen Sie uns

Folgen Sie uns bei Twitter Besuchen Sie unser Xing-Profil Treffen Sie uns bei LinkedIn Unser Video-Channel bei Youtube