Big Data bedeutet eigentlich nur: Man sucht irgend etwas in einem Heuhaufen. Das können Nadeln, Münzen, Werkzeug, ein Nugget oder auch eine Schatzkarte sein. Man findet Muster. Das ist der erste
Schritt. Im zweiten Schritt verbindet man mathematisch die Muster oder einzelne Dinge aus dem
Heuhaufen miteinander, um Zusammenhänge zu finden. Zusammenhänge können sein:
• „Insassen von Gefängnissen haben einen niedrigeren Ruhepuls“.
• „In Orten mit einer hohen Dichte an Storchennestern werden mehr Kinder geboren.“
• „Die Schadenshöhe bei einem Brand nimmt proportional mit der Anzahl an Feuerwehrleuten vor Ort zu“.
Alle diese Aussagen sind richtig und statistisch bedeutsam belegt. Zusammenhänge sagen allerdings nichts über Kausalitäten aus – oder bringen doch die Dorfstörche die Kinder? Quatsch, das glaubt doch keiner, meinen Sie? Eine schöne Sammlung solcher
Scheinkorrelationen hat jüngst "Die Zeit" zusammengestellt.
Das Spektrum der Big Data Analyse Auch das ist Big Data:
Die FAZ interviewte Markus Morgenroth: „Wir können herausfinden, wer loyal ist“, sagt er. Morgenroth arbeitet bei Cataphora. Diese Firma beobachtet das Verhalten von Mitarbeitern in Unternehmen. Dazu werten sie auch die anonymisierten Mails von Mitarbeitern aus. Das ist echte Big Data Analyse, weil Unmengen an Daten zu durchforsten sind, um irgendwas im Heuhaufen zu finden. Ein mögliches Ergebnis: Performanceanalysen und Loyalitätsanalysen einzelner Mitarbeiter. Was in Amerika möglich ist, wäre in Deutschland undenkbar. In Amerika ist der Datenschutz wesentlich lockerer geregelt. Daten auf Dienstrechnern gelten in der Regel als Firmeneigentum.
Im Interview werden auch die Fallstricke solcher Analysen aufgezeigt. Und deutlich gemacht, wie wichtig das Wissen von Sprachwissenschaftlern, Psychologen, Sozialwissenschaftler bei der Interpretation dieser Daten sind.
Ich lasse meine E-Mails nicht öffentlich rumliegen Nutzen Sie Twitter? Facebook? Xing? LinkedIn? Die Dataminer auch. Was kann da passieren? Nicht nur die Themen, über die sie schreiben, auch Wörter, die Emotionen (Sentiment) ausdrücken und in Sätzen mit Faktenaussagen stehen, können Sie kennzeichnen. Big Data bedeutet in diesem Fall: Mustererkennung und Korrelation.
Das ist dann in Ordnung, wenn der Schutz, die Würde der Person gewährleistet ist. Nennt man ja “Datenschutz”. Das ist dann fragwürdig, wenn Sie persönlich als “Target” aus der Analyse rauspurzeln und dieses Profil meistbietend versteigert wird.
Big Data ist keine Marktforschung
Bei Big Data durchsuchen Sie riesige Heuhaufen und verkaufen jede gefundene Nadel direkt an den Meistbietenden. Bei Marktforschung durchsuchen Sie einen für eine Population repräsentativen Heuhaufen, merken sich die Schritte und die Methode, wie man Nadeln im Heuhaufen findet - und verkaufen dieses Wissen an den Auftraggeber. Der nutzt dies, um selbst in beliebigen Heuhaufen Nadeln zu finden. Fazit: In der Analyse von Big Data geht es mehr um das „Was“ als um das „Weshalb“.
Bei Big Data interessiert nicht, dass dieses Wissen kurzfristig unnütz werden kann, weil sich Medien und Nutzung durch Menschen schnell verändern können. Bei Big Data interessieren keine Einstellungen von Menschen, weil kein Modell das Verhaltens in Bezug auf Produkte oder Produktgruppen gefordert wird, sondern schnelle Erfolge. Selbst um den Preis, dass die Ergebnisse Artefakte sind, die bei einer Analyse großer Datenmengen schnell entstehen können. Die Störche bringen nicht die Kinder - aber die hohe Dichte an Störchen kann eventuell ein guter Indikator für die Ansiedelung eines "Baby-Marktes" sein.
Big Data mit den richtigen Tools analysiert ist nützlich, um Zusammenhänge schnell zu erkennen und handeln zu können. Big Data ist notwendig, wenn die Analyse mit Echtzeitdaten erfolgen soll. Big Data liefert Ergebnisse, die Maschine und deren Wirkung hingegen bleibt eine schwarze Kiste.
Oder mit den Worten von Heinrich Spoerl, dem Autor der "Feuerzangenbowle": “Also, wat is en Dampfmaschin? Da stelle mehr uns janz dumm. Und da sage mer so: En Dampfmaschin, dat is ene jroße schwarze Raum, der hat hinten un vorn e Loch. Dat eine Loch, dat is de Feuerung. Und dat andere Loch, dat krieje mer später.”
Lehrer Bömmel aus der Feuerzangenbowle – ein Protagonist von Big Data. Jetzt haben Sie jede Kaffeetafel wieder gewonnen.
Der Sozialwissenschaftler Hans-Werner Klein lebt mit seiner Familie in Bonn. Seine über 30 jährige Erfahrung als Marktforscher in Agenturen, der Industrie und in eigenen Unternehmen nutzt er zum einen als Wissensvermittler zwischen Daten und Menschen als DataBerata. Mit Prozess- und Technik-Koryphäen aus den Niederlanden und Kalifornien gründete er Twenty54Labs B.V., einen niederländischen „Werkzeugmacher für Informationsmanagement“. Klein hat gemeinsam mit Bernhard Keller und Dr. Stefan Tuschl das Buch „Die Zukunft der Marktforschung“ geschrieben, dass im Mai im Verlag Springer Gabler erscheint.