Services

Big Data

"Big Data" ist das Synonym für den intelligenten Umgang mit großen, heterogenen Datenmengen. Das Bundesministerium für Bildung und Forschung sieht darin eine der bedeutendsten Herausforderungen unserer Zeit. 

Big Data birgt große Potenziale für Wissenschaft wie auch für Wirtschaft. Es kann die Entscheidungsfindung in Unternehmen und die Art des Forschens in verschiedensten Wissenschaftsdisziplinen nachhaltig verändern. Gleichzeitig erfordert es einen besonders verantwortungsvollen Umgang mit den neuen intelligenten Big Data-Technologien.

Kompetenzen verzahnen: Aufbau von Big Data-Kompetenzzentren

Das Bundesministerium für Bildung und Forschung (BMBF) wird in den kommenden Jahren zwei Kompetenzzentren für Big Data aufbauen:

  • das Berlin Big Data Center (BBDC) unter der Leitung von Professor Markl an der TU Berlin und
  • das Competence Center for Scalable Data Services (ScaDS) an der TU Dresden.

Das Berlin Big Data Center wird automatisch skalierbare Technologien entwickeln, die riesige heterogene Datenmengen organisieren und aus ihnen Informationen gewinnen. Das Competence Center for Scalable Data Services in Dresden wird mit einem service-orientierten Ansatz Big Data-Lösungen für die Wissenschaft und die Industrie erforschen.

Forschung vorantreiben

Wissenschaft und Unternehmen setzen den Fokus auf die Extraktion nützlicher und verlässlicher Informationen aus riesigen Datenmengen und die Transformation dessen in für Menschen verwertbare Daten mithilfe von Algorithmen, die Datenanalysen in Echtzeit garantieren können. Die entwickelten Techniken und Werkzeuge sollen einen Beitrag zur Lösung der gesellschaftlichen Herausforderungen der Hightech-Strategie liefern.

Die neue Hightech-Strategie soll Deutschland auf dem Weg zum weltweiten Innovationsführer voranbringen und die Position als führende Wirtschafts- und Exportnation stärken.

Mit Daten und Big Data-Technologien verantwortungsvoll umgehen

Alle Anwendungsfälle von Big Data bergen neben Potenzialen auch Herausforderungen juristischer und gesellschaftlicher Art. Durch Big Data verschwinden die Grenzen zwischen personenbezogenen und nicht-personenbezogenen Daten. Nicht-personalisierte Daten können immer mehr auch auf einzelne Personen zurückgeführt werden.

Das BMBF beabsichtigt, die Fragen zum verantwortungsvollen Umgang mit Big Data anzugehen und die Ergebnisse in den gesellschaftlichen Diskurs einzubringen.

"Big Data wird sich letztendlich durchsetzen, weil nicht nur Datenwissenschaftler und Technologen davon profitieren, sondern auch Anwender aus der Geschäftswelt."

  • 150 Mio. versendete E-Mails
  • 700.000 Facebook-Logins
  • 20,8 Mio. WhatsApp-Nachrichten
  • 2,4 Mio. Google-Suchen
  • 2,78 Mio. angesehene Youtube-Videos
  • 69.000 Stunden Film angesehen auf Netflix
  • 38.000 Stunden Musik angehört auf Spotify
  • 347.000 neue Twitter-Tweets
  • 527.000 geteilte Snapchat-Fotos
  • 38.000 gepostete Instagram-Fotos
  • 972.000 Swipes auf Tinder
  • 51.000 App-Downloads von Apple
  • 203.000 $ Umsatz durch Amazon
  • 120 neue LinkedIn-Accounts


Jeder mag die Information, die einen Vorteil bringt.

Dank der Digitalisierung geht heute kein Wissen mehr verloren. 300 Mrd. Twitter-Nachrichten sind bis heute versendet worden und jede Sekunde kommen ca. 5.800 hinzu. Der Datenberg wird immer größer, ganz automatisch. Trends wie Cloud Computing und das Internet der Dinge begünstigen das Wachstum der Datenmassen noch. Auf der Suche nach Nutzen und Vorteil wird so viel gespeichert wie möglich. Die Datenmenge auf den Rechnern der Welt ist heute schon so groß, dass dafür bald ein neues Wort erfunden werden muss: das Yottabyte, eine Eins mit 24 Nullen. Natürlich wird es immer schwieriger, Zusammenhänge, Muster und Aussagen abzuleiten, je größer der Datenberg wird - Aber auch der aus den Daten gewonnene Nutzen ist umso größer, je reichhaltiger die Daten sind. 

Big Data macht Datenberge in Übergröße nutzbar.

Auch wenn die Daten nur lose zusammenhängen, sich schnell verändern, weiter wachsen oder lückenhaft sind, ist Big Data die digitale Lösung für das digitale Problem, aus der digitalen Datensammlung Erkenntnisse zu gewinnen. 

Data-Mining

Data-Mining nennt man das Suchen von Erkenntnissen in dem Datenberg. Ergebnisse sind Muster, Modelle, Aussagen oder Hypothesenüberprüfungen. Es werden beim Data-Mining nicht Daten gewonnen, sondern Wissen. 


Im Prinzip sind Datenbanken Ansammlungen von Merkmalsausprägungen. Auf diese Weise werden in Datenbanken wie in Tabellen Aussagen über Eigenschaften miteinander verknüpft. Beispielsweise werden im Telefonbuch Namen mit Adressen und Nummern in einer bestimmten Systematik verbunden. 

Bei Big Data sind diese Datenbanken riesig: Viele Merkmale und Ausprägungen in Reihen, Spalten, Zeitreihen, und mehrdimensionalen “Tabellen”. Die Untersuchung solcher multivariater Datenbanken erfordert enorme Rechenkapazitäten. Wenn auch Echtzeituntersuchungen, Import neuer Daten, schnelle und gleichzeitige Datenabfragen, Überschreibungen oder verschiedene Informationstypen wie Zahlen, Sprachen, Texte oder Bilder hinzukommen, wird deutlich, welche Leistung sich beispielsweise hinter der allgemeinverfügbaren Big Data-Anwendung Google verbirgt.

Tweets zu Restaurants oder Check-Ins bei Bars, wie sie bei Facebook möglich sind, können Hinweise darüber geben, wo schlechtes oder verdorbenes Essen angeboten wird. Eine Studie machte zielsicher Restaurants mit schlechter Hygiene ausfindig. Bei Katastrophen können aus der Twitterwolke Informationen zum Beispiel zum Ausmaß und zur besten Hilfsstrategie gewonnen werden. Wo brennt es am häufigsten? Wer ist am schlimmsten betroffen? Wie wohin mit der Hilfe?

Ähnlich wie Facebook aus dem Nutzerverhalten Rückschlüsse auf die wirtschaftliche und emotionale Situation der Nutzer ziehen kann – selbst zuverlässige Prognosen eines baldigen Beziehungsendes sind möglich – kann man künftige Krisenherde, Epidemien und sogar Verbrechen vorhersagen. Eine ganze Industrie versucht derzeit, die entsprechenden Techniken zu verbessern.

Aussagekraft der Daten

Neben unvollständigen und ungeordneten Datenbanken sind besonders manipulierte Datenbanken. fehlende Teile, veränderte Datenstrecken und hinzugefügte Extremwerte Probleme, die das Bild verzerren. Twitterbomben können punktuell politische Rennen verändern. Googlebomben prägen das Bild, das wir von öffentlichen Personen haben. Es ist eine kontroverse Frage, ob engagierte Gruppen die Online-Reputation von Personen (oder Unternehmen) derart dominieren dürfen und ob der unparteiische Analyse-Algorithmus von Google dieses Bild ohne redaktionelle Prüfung weitergeben soll. Aus technischer Sicht ist es leicht, solche prägenden Trends zu identifizieren, einige Manipulationsarten sind dadurch leicht erkennbar. Ein anderes Problem ist fehlende Seriosität bei der Auswertung von Daten: Wenn statistische Arbeitsregeln nicht ausreichend beachtet und im Vorfeld keine klaren Hypothesen aufgestellt werden, sind verschiedenste Ergebnisse denkbar, sodass die Zuverlässigkeit und Überprüfbarkeit leidet.


Probleme bei Big Data

Datenschutz, Repräsentativität, Korrelation, Qualität und Aussagekraft: Der Technik ist egal, wie sie genutzt oder verhunzt wird.

Das Thema Big Data ist so wichtig, ein sogenannter “Megatrend”, dass Eingeweihte Milliarden investieren und sich auf ein Risiko einlassen. Es sind keine fertigen Lösungen vorhanden, es muss die ganze Gesellschaft mitgenommen werden, um diese an den Vorteilen und Risiken der Technik teilhaben zu lassen. Die gesellschaftliche Diskussion wird entscheiden müssen, welche Rolle Moral, Psyche und Recht bei dieser Innovation spielen sollen.

Dabei ist ausreichend Konfliktpotenzial vorhanden: Überwachung, Feedback, Klassenordnung, Gruppierungen, Individualisierung und Anonymisierung, Kreditwürdigkeit, Gesundheitsdaten uvm.

Wirtschaftliche Bedeutung

Big Data ist vom Forschungskontext längst in die Welt der Industrie gerückt. Die Werbung ist nach Umsatz der größte Markt für Big Data-Dienstleistungen. Direkt danach kommt die Datenlizensierung. Unternehmen versprechen sich eine neue Welt des Wirtschaftens. Individuell an die Marktlage anpassbare Produktions- und Liefersysteme sollen Effizienz steigern und Kosten senken. Die Planung von Bedarf und Absatz auf Basis von bisher kaum zu berücksichtigenden Einflussfaktoren wird perfekte Geschäftsführung ermöglichen. 

Ebenso wichtig sind Stimmungsanalysen, die Produktattraktivität in Echtzeit abbilden können. Oder Medien, die systematisch das Befinden der Nutzer manipulieren können. 

Neue Technik führt zu neuen Geschäftsfeldern. Neue Lösungen für alte Probleme werden denkbar: Sharing Economy auf der Basis von Sensorüberwachung, Cloud-Services für allgemeinverfügbare Informationen, Werbewirkungsanalysen, Marktforschung, Betrugsverhinderung, Diagnostik in der Medizin, automatische und exakte Rechnungslegung im Energie- und Kommunikationsbereich. Die Welt wird verändert, überall.

Politische Bedeutung

Russland verpflichtete inländische Firmen zur Datensammlung. In Deutschland verfolgt der Innenminister mit der Vorratsdatenspreicherung das Ziel nationaler Sicherheit, in den USA haben die US-Geheimdienste aktiv an der Konzeption der Datenkraken Google, Facebook und Co. mitgewirkt. Informationen und Einfluss, die aus den Daten gewonnen werden, scheinen für Nationen existenzielle Werte zu sein. Von Rechnungsprüfung, Wirtschafts- und Sozialpolitik, Steuern und Netzwerkanalysen, bis hin zur Wahlkampfplanung birgt Big Data entscheidende Nutzungsmöglichkeiten.

In Wirtschaft wie in Politik wird erkennbar, wie schmerzhaft-notwendig es ist, die Daten- und Analysehoheit nicht einfach den Mächtigen zu überlassen. Der Schutz von Daten, Privatsphäre und Urheberrechten bekommt eine ganz neue Bedeutung.

Dass Fortschritte und Erfindungen dann am wirkungsvollsten sind, wenn sie allgemein zugänglich sind, ist eine Erkenntnis, die auch Big Data betrifft. Open Data, das Freistellen von Daten insbesondere aus Steuermitteln finanzierter Datenbanken, ist eine weltweite Bewegung geworden und lässt Big Data so zur demokratischen Kontrollinstanz werden. 

"Daten sind der Rohstoff der Zukunft" (Angela Merkel)

Empfehlen Sie diese Seite auf


...oder per Mail: