Social Media Image Analyse Wenn Bilder den Ton angeben

Donnerstag, 06. Juli 2017
Macht es einen Unterschied, wer codiert? Mensch oder Maschine?
Macht es einen Unterschied, wer codiert? Mensch oder Maschine?
© Pixabay.com

Auf Social Media Plattformen wie Facebook oder Instagram laden Menschen täglich Millionen Bilder hoch. Dank verbesserter Bilderkennungsverfahren lassen sich relevante Informationen zu Marken, Verwendungsorten und Emotionen aus diesen Bildern ableiten. In einem Test hat Kantar TNS die Bildkodierung durch Menschen und maschinelle Kodierung verglichen. Es zeigt sich, dass beide Verfahren vergleichbar gute Ergebnisse erzielen.

Eine Studie des Digital Anthropolgie Department der University College London (UCL), zeigte kürzlich für neun Länder die Nutzung von Bildern in sozialen Netzwerken. Über alle Länder hinweg wurde deutlich, dass die Sprache bildhafter wird.

Mehr als 80 Prozent der Posts in sozialen Netzwerken enthalten mittlerweile Bilder oder Videos. Diese ermöglichen es den Menschen Gefühle auszudrücken, die sie mittels Wörtern nicht ausdrücken können oder wollen. Zudem beinhalten Bilder kontextuelle Informationen, die aus Sicht der Personen uninteressant sind, jedoch in Bezug auf Marken wertvolle Insights geben können.

Andreas Großer

Andreas Großer
(Bild: Kantar TNS)
ist seit 2006 bei TNS und derzeit als Associate Director Data Processing bei Kantar Operations beschäftigt. Er studierte Verwaltungswissenschaften an der Uni Konstanz sowie Mathematik und Informatik an der FernUni Hagen.
Die Posts der Nutzer stellen somit für Unternehmen einen großen Datenschatz dar, um Informationen über Bedürfnisse, Wünsche, Einstellungen und Interessen ihrer Kunden zu bekommen. Der Bezug zur Marke etwa per Hashtag fehlt jedoch häufig im Text, sodass keine unmittelbaren Informationen darüber vorliegen, in welchen Kontext ein Kontakt der Marke mit der Person stattfindet. Hier erlauben nun moderne Analyseverfahren, Orte und unterschiedliche Objekte aus den Bildern zu extrahieren, um aus diesen weitere Informationen zu gewinnen.

Zudem wollen Personen mit den Bildern Stimmungen ausdrücken, die durch die im Bild vorkommenden Objekte symbolisiert werden. Durch eine Verbindung von Objekt und möglichen Stimmungen lässt sich eine weitere verbesserte Analyseebene herstellen.
Tiere gehen immer: Zu so einem Bild fallen Attribute wie süß, Liebe, Humor oder Mitgefühl erregend.
Tiere gehen immer: Zu so einem Bild fallen Attribute wie süß, Liebe, Humor oder Mitgefühl erregend. (Bild: Pixabay.com)
Die Bilder stellen Momente dar, die eine individuelle Erfahrung mit einem Produkt oder einer Marke in einem individuellen Kontext aus Zeit, Ort und Umgebung mit individuell unterschiedlichen Gefühlen, Einstellungen und Bedürfnissen verbinden. Markenentscheidungen und Markenbindung sind das Ergebnis vieler Momente - verarbeitet zu impliziten „Autopilot-Entscheidungen“ wie zu bewussten Entscheidungen, die in Richtung Verhalten, Nutzung neuer Produkte und Marken gehen.

Kantar TNS besitzt nun mit Recognology eine Inhouse-Plattform, die eine skalierbare Analyse mittels Crowd-Coding oder Machine-Coding erlaubt.

Dem Crowd-Working-Ansatz liegt die Vorstellung der Schwarmintelligenz zugrunde. Die zentrale Idee ist, dass die Masse von Menschen -  auf Englisch Crowd - Probleme besser lösen kann als es einzelne Individuen können. Wie in der klassischen manuellen Codierung kommen beim Crowd-Coding Personen zum Einsatz, die allerdings zuvor nicht für diese Tätigkeit ausgebildet worden sind. Sie sind keine Experten. Beim Crowd-Coding wird angenommen, dass der Mittelwert aller aggregierten Antworten der Crowd sich dem wahren Mittelwert annähert. Jeder Crowd-Coder bekommt eine kleinere Anzahl von Bildern zur Bearbeitung vorgelegt mit einer klaren Anweisung, was zu tun ist.

Beim Machine-Coding werden zumeist Convolutional Neurale Netzwerke (CNNs) eingesetzt, die die Objekte aus den Bildern extrahieren und in vorgegebene Kategorien einordnen. Als Dateninput kommen verschiedene Datenquellen in Frage.

Hier ein konkretes Beispiel

Kantar TNS hat nach Bildern eines bestimmten Laptop-Typs gesucht. Gefunden wurde ein recht breites Spektrum an Motiven. So haben wir Kategorien gewählt, nach denen die Kodierung zu erfolgen hatte. Gesucht wurden verschiedene Locations, die Art der gezeigten Technologie, welche Personen oder Tiere auf den Bildern zu sehen sind und ob Marken zu erkennen waren. Die automatisierte Vercodung der Bilder erfolgte ebenfalls nach den festgelegten Kategorien. In dem Tool können je nach Fragestellung der Studie die Kategorien adaptiert werden. Generelle Kategorien sind Autos, Design, Materialien, Handel oder Marken aus den Bereichen Technik, Handel oder Finanzdienstleistungen.

Der Vergleich von Machine-Coding und Crowd-Coding zeigte, dass das Programm ähnlich gut wie der Mensch in der Lage ist, ein korrektes Coding der Bilder vorzunehmen. Auf aggregierter Ebene zeigen sich nur geringe Unterschiede in den Prozentzahlen zwischen Crowdcoding und maschinelle Codierung. Das Ergebnis der maschinellen Kodierung war mithin „etwas schlechter“ als bei der Kodierung von Menschenhand.

Ein besonders interessanter Aspekt ist die Sentimentbetrachtung, die den Gesichtsausdruck einzelner Personen beschreibt. In der durchgeführten Case Study wurde nach drei unterschiedlichen Arten (happy/neutral/unhappy) unterschieden. Zukünftig soll jedoch eine weitere Differenzierung des Sentiments möglich sein (Ärger, Missfallen, Angst, Glück, Traurigkeit, Überraschung, Neutral). Zudem funktioniert die automatisierte  Sentimentkodierung mit Textmaterial - im Widerspruch zu den Aussagen der Anbieter von Social Media Analyseplattformen - noch nicht befriedigend. Damit stellt die Bildkodierung einen echten Vorteil bei der Sentimentkodierung dar.

Fazit

Die Integration von Bildinformationen auf der Basis einer automatisierten Vercodung für die Analyse von Social Media-Inhalten trägt der zunehmenden Bedeutung dieser Kommunikationsformen Rechnung und ist aufgrund qualitativ hochwertiger Technologien bereits einsetzbar. Durch die Flexibilität bei der Definition von Kategorien kann das Analyseverfahren in verschiedenen Bereichen eingesetzt werden. Interessant sind vor allem die Bilder, die individuelle Momentaufnahmen zeigen. Aus deren Analyse lassen sich Marken-KPIs ableiten, die vor allem im Zeitverlauf weitere Customer Insights liefern können.

Jetzt suchen >>
stats