Sprachgesteuerte Assistenten in der Marktforschung „Sprich mit mir!“

Dienstag, 24. Oktober 2017
Sprachassistenten und Marktforschung
Sprachassistenten und Marktforschung
© p&a

Immer mehr Menschen sprechen regelmäßig mit Maschinen. Nach Siri, Cortana und Alexa ist seit August 2017 auch Google Home in Deutschland als sprachgesteuerter Assistent verfügbar. Diese massive Veränderung von Interaktion zwischen Mensch und Maschine wird auch nicht spurlos an der Marktforschung vorbeigehen. Prof. Dr. Holger Lütters von der Hochschule für Technik und Wirtschaft Berlin beschreibt die Überlegungen bei der Entwicklung eines deutschsprachigen digitalen Sprachassistenten für das Befragungstool questfox von pangea labs.
Audioaufnahmen existieren in der Marktforschung bereits, seit es Aufnahmegeräte gibt. Nach der Aufnahme stehen aber aufwendige Transkriptionen an, die stets teuer und fehleranfällig sind. Diese Phase wird nun langsam dem Ende zu gehen. Ab sofort stehen der Marktforschung neue Möglichkeiten zur Erfassung von Sprache im Interview inklusive vieler automatisierter Auswertungen zur Verfügung. Dies ermöglicht eine intensivere Nutzung von Sprachaufzeichnungen und Sprachbefehlen. Technische Voraussetzungen für digitale Sprachassistenten

Der Anbieter pangea labs hat für sein Befragungstool questfox einen Assistenten für die Befragung via gesprochener Sprache entwickelt. Die erste Überlegung dabei war, ob man sich auf einen Anbieter oder eine bestimmte Technologie festlegen sollte. Relativ schnell war klar, dass der Ansatz mit möglichst wenig Abhängigkeit von externer Kompatibilität auskommen soll. Ein Sprachassistent für die neue Hardwarekategorie der Smart-Home-Geräte wie Alexa kam nicht infrage. Die Ergebnisse würden sich derzeit noch nicht für die Marktforschung eignen, da diese Geräte bislang nur in wenigen Haushalten im Einsatz sind und deren Bewohner ganz besondere Charakteristiken haben.

Prof. Dr. Holger Lütters

Prof. Dr. Holger Lütters
(Bild: Andreas Rentz / gettyimages.com)
ist Hochschullehrer für Marketing an der HTW Berlin und begleitet als wissenschaftlicher Beirat der pangea labs die Entwicklung der digitalen Marktforschung.
Es stehen jedoch in beinahe jedem Haushalt mehrere funktionsfähige Geräte mit Mikrofon, wie Smartphones oder Laptops, zur Verfügung, welche die Erreichbarkeit von großen Teilen der Bevölkerung sicherstellen. Doch der Sprachassistent sollte nicht in eine App für eine bestimmtes Betriebssystem verbannt werden, sondern als Web-Anwendung unabhängig vom eingesetzten Betriebssystem funktionieren. Zum Einsatz kommt daher der in den Browser des Gerätes eingebaute Sprachassistent. Dies erscheint für die Zwecke der Marktforschung besonders wichtig, da es darum geht, potenziell möglichst viele Menschen zu erreichen. Eine Interaktion via Browser funktioniert auf Desktop-PCs, Smartphones, Tablets, aber auch Smart- TVs sind mit Mikrofon ausgestattet. Weitere smarte Geräte werden folgen und können dann direkt auch für die Marktforschung genutzt werden.

Verschiedene Hürden im Prozess überwinden

Noch nicht alle im Markt etablierten Browser erlauben die Nutzung von Sprachtechnologie. Der Internet Explorer ist nicht in der Lage, Sprache zu erfassen. Safari von Apple erlaubt Derartiges ebenfalls nicht. Firefox kann erst in den sehr aktuellen Versionen mit Spracheingabe umgehen.

Dieses Problem wird in den kommenden Monaten durch Updates verschwinden, kann aber bei einigen Usern – insbesondere im B2B-Umfeld – noch Jahre fortbestehen. Während Laptops, Tablets und Smartphones bereits im Auslieferungszustand mit einem Mikrofon ausgestattet sind, hat der klassische PC selten ein Mikrofon eingebaut. Aber selbst wenn die Technik vorhanden ist, haben viele Nutzer – der Autor eingeschlossen – aufgrund komplexer Software-Konfigurationen immer wieder Probleme, das Mikrofon auch zu nutzen.
Questfox Digital Research Voice Assistant
Questfox Digital Research Voice Assistant (Bild: pangea labs/p&a)
Wenn eine Webseite auf das eingebaute Mikrofon zugreifen will, muss eine Genehmigung zur Nutzung eingeholt werden. Dies ist bei jeder Verwendung der Sprachassistenten erforderlich. Die Nutzer erlernen derzeit weltweit erst, was es bedeutet, mit einem Gerät zu sprechen. Es ist zu erwarten, dass eine kritische Klientel diese letzte Voraussetzung verweigern wird. Im Rahmen der Marktforschung sollte über diese Anforderung immer und wiederkehrend unbedingt im Fragebogen aufgeklärt werden.

Die Nutzung eines Mikrofons stellt auch im Jahr 2017 noch immer eine Hürde im Forschungsprozess dar, die jedoch überwindbar ist. Wenn die technischen Voraussetzungen und die Einwilligung gegeben sind, kann Sprache aufgenommen werden. Im nächsten Schritt muss die Sprache dann automatisiert transkribiert werden. Die Idee, originale Kommentare von Kunden per Sprachaufzeichnung in die Marktforschung zu integrieren, ist nicht neu. Neben der reinen Aufnahme ist insbesondere die Umwandlung des gesprochenen  Wortes in geschriebenen Text eine Herausforderung der Entwicklung. Hier kommen die digitalen Sprachassistenten zum Zuge. Über die Integration der Sprachassistenten ist es möglich, die Technologie in bestehende Befragungstools zu integrieren. Die Anbieter Amazon, IBM und Google sowie verschiedene kleinere Anbieter bieten hierzu ihre kostenpflichtigen Services an.

Die Entwicklung ist in verschiedenen Sprachen unterschiedlich gut entwickelt. Englisch beherrschen alle Tools sehr gut. Bereits bei der Sprache Deutsch gibt es allerdings starke Unterschiede in der Qualität der Dienste. Die Services können sowohl einzeln als auch parallel integriert werden. Bei der Entwicklung des Sprachassistenten für die Marktforschung wurden mehrere Services getestet, die dann in neuen Fragetypen für die Marktforschung gemündet sind. Zu erwarten ist, dass einige dieser Dienste sich durch Machine-Learning-Algorithmen permanent selbst verbessern. Wer vor wenigen Jahren Google Translate noch belächelt hat, wird heute zugeben müssen, dass dort ernsthafte Dinge entstanden sind. Es darf davon ausgegangen werden, dass die Entwicklung der Sprachassistenzdienste nicht weniger rasant mit Qualitätssprüngen aufwartet.

Talk2Me in der Software questfox integriert

Die pangea labs GmbH aus der Schweiz entwickelt Befragungssoftware unter dem Label Device agnostisch. Dies bedeutet, dass eine Befragung ohne die Notwendigkeit der Installation von besonderen Tools auf nahezu jedem internetfähigen Gerät benutzbar sein soll. Der jetzt entwickelte digitale Sprachassistent Talk2Me soll dieselben Bedingungen erfüllen und wurde in das Marktforschungstool questfox integriert. Nach den ersten Tests haben sich drei neue Fragetypen für die Marktforschung herauskristallisiert. Diese berücksichtigen die neuen Möglichkeiten der Technologie, legen aber auch besonderen Wert auf die Einhaltung von Datenschutzstandards der Anonymisierung. Ein Überblick über die Funktionen:
  • Audio Recorder: Der Audio Recorder nimmt gesprochene Sprache auf und erlaubt späteres Anhören. Dieser Fragetyp eignet sich für O-Töne von Konsumenten.
  • Talk2Me: Dieser neuartige Fragetyp übersetzt die gesprochene Sprache unmittelbar in Text. Der Befragte kann den Text danach noch anpassen und korrigieren. Auch kann die Aufnahme mehrfach angesteuert werden, um längere Gedanken in verbalen Abschnitten zu einer Frage zu Protokoll zu geben. Der Befragte hat die volle Kontrolle über die Daten, die nach seiner Bestätigung an die Befragungssoftware gesendet werden.
  • Background Speech2Text: Die ersten Tests mit einer live Umwandlung von Gesprochenem in geschriebenen Text mit Talk2Me hat einige Testanwender erschreckt. Um diesen Effekt zu vermeiden, wurde eine Variante implementiert, bei der diese Umwandlung im Hintergrund unsichtbar stattfindet. Der Nutzer hat das Gefühl, in ein Mikrofon zu sprechen, die Umwandlung erfolgt automatisch, ohne seinen Input. Etwaige Erkennungsfehler können hier jedoch nicht mehr korrigiert werden.
Alle neuen Fragetypen können derzeit auch optional im Original-Audioformat abgespeichert werden und stehen damit für weitere Zwecke zur Verfügung. Neben den vielen neuen Textanalyse-Tools sind auch weitere Möglichkeiten, wie etwa die Erkennung der Stimmfrequenz denkbar. In einem ersten Schritt soll eine Auswertung der Originalkommentare mit Sprachanalyse-Tools möglich sein.

Die Umsetzung der Talk2Me-Idee erfolgte unter der Prämisse der Automatisierung. Die Aufgabe besteht in der Erstellung einer integrierten Lösung, die auch das Problem der Auswertung von großen Textmengen löst. Die Textdaten können mit den existierenden Tools auch ausgewertet werden. So kann etwa eine Tagcloud der wichtigsten verwendeten Begriffe automatisiert erstellt werden.

Der nächste Schritt besteht in der Integration einer Schnittstelle (API) zur semantischen Analyse der Textdaten. Durch eine Kooperation mit dem Kölner Experten für Textanalyse, dem Unternehmen insius, wird es möglich, die gesprochenen Texte einer semantischen Auswertung zuzuführen. Somit entstehen neue Erhebungs- und Auswertungsverfahren für die befragende Marktforschung.

Die neue Technologie wird dazu führen, dass größere Befragungszielgruppem erschlossen werden können, als bisher für die Marktforschung zugänglich waren. Diese vermeintlich kleine Idee birgt die Möglichkeit der verstärkten Nutzung von offenen Fragen und besseren Zugang zu der Konsumentenmeinung. War die Qualität solch offener Antworten bisher stets von der Bildung und der Fähigkeit des Probanden, sich schriftlich auszudrücken, abhängig, werden in Zukunft soziodemografische Unterschiede bei offenen Fragen eine geringere Rolle spielen.

Die digitalen Sprachassistenten sollten dazu führen, dass auch Zielgruppen, die sich in der schriftlichen Äußerung nicht sehr wohlfühlen, nun offen und vielleicht auch spontaner ihre Meinung abgeben können. Die Entwicklung wird vielleicht noch wichtiger, wenn wir den Blick in Richtung weniger entwickelter Länder mit geringer Alphabetisierung richten. Mit dem digitalen Sprachassistenten wird es der Marktforschung möglich sein, Menschen digital zu interviewen, die nicht gut lesen und schreiben können.

Eine erfreuliche Begleiterscheinung der technischen Möglichkeiten ist die Annäherung qualitativer und quantitativer Forschung. Qualitative Forscher verstehen den Nutzen dieser Idee sofort und sehen die eigenen Möglichkeiten in der digitalen Forschung damit beschleunigt. Anbieter quantitativer Methoden können nun sehr viel einfacher qualitative Ansätze in die eigenen Forschungsdesigns einbauen.

Ängste, Nachteile und Datenschutz beachten

Natürlich gibt es auch immer Skeptiker. In Bezug auf die Smart-Home-Geräte werden die ersten Stimmen laut, die vor den digitalen Assistenten warnen und eine dauerhafte Überwachung durch eingeschaltete Mikrofone fürchten. Diese Sorgen sind nicht vollkommen unberechtigt und sehr ernst zu nehmen. Überlegungen zur Verwendung der digitalen Sprachassistenz in der Marktforschung sollten daher dringend Transparenz über die Verfahren schaffen und die gespeicherten Inhalte genau definieren. Technisch ist mehr möglich, als der Anwender vertragen kann.

Die Branchenverbände DGOF, ADM und BVM sind daher aufgefordert, für die Verwendung digitaler Sprachassistenz in der Marktforschung Richtlinien für die korrekte Nutzung im Rahmen der Marktforschung zu entwerfen. Diese sollten nicht in Verboten und Einschränkungen münden, sondern realistisch die Szenarien der Zukunft mit den Anforderungen an Datenschutz und Persönlichkeitsrechte der Teilnehmer berücksichtigen. Wenn wir uns in Deutschland Beschränkungen auferlegen, die uns im internationalen Wettbewerb benachteiligen, können wir die Entwicklung sprachgestützter Marktforschung direkt dem Wettbewerb aus dem Silicon Valley überlassen.

So wie bei der Erfindung des Telefons erste Regeln im Umgang mit der Innovation definiert wurden, sollten wir ein zum Erkenntnisstand passendes Regelwerk für die Nutzung digitaler Sprachassistenten in der Marktforschung entwerfen und stetig weiterentwickeln. Nach heutigem Kenntnisstand gehört hierzu die vollständige Anonymisierung der gesprochenen Sprache und der transkribierten Daten. Dazu sollte der Anwender explizit sein Einverständnis über die weitere Verwendung der durch ihn generierten Daten behalten, die im Rahmen einer Befragung erhoben werden.

Die Kosten sind im Vergleich zur heute durchgeführten manuellen Transkription von Voice-Dateien beinahe zu vernachlässigen. Das cloudbasierte Modell berücksichtigt die tatsächlich verwendete Rechnerleistung. Hierbei kennen sogar die Anbieter noch nicht die genauen Preise. Es empfiehlt sich daher, für derartige Projekte einen Budgetdeckel für die Bestandteile mit Sprachinteraktion zu definieren, um nicht von den Kosten überrascht zu werden. Tendenziell wird es aber eher überraschen, wie leistungsfähig und günstig diese Technologien bereits heute sind.

Akzeptanz der Technologie für die Marktforschung

Experimente zur Mensch-Computer-Interaktion haben stets belegt, dass Menschen gerne auch mit Geräten sprechen. Wir Menschen sprechen sogar oft mit Geräten – „Mach schon, Drucker!“–, die uns gar nicht verstehen können. Nun kann der Marktforscher auch ohne Programmierkenntnisse die gesprochenen Antworten erfassen und auswerten.

Die ersten Tests mit dem questfox Digital Research Voice Assistent verliefen positiv. Dennoch gab es immer wieder Menschen, die – unabhängig von den technischen Gegebenheiten – schlichtweg keine Sprachinteraktion wünschen. Dies könnte sich aber schon bald ändern, wenn die Bevölkerung durch Siri, Alexa und Cortana an Spracheingaben mehr gewöhnt ist. Es ist zu vermuten, dass sie mit einem geeigneten Incentive durchaus auch ein verbales Interview mit einem Sprachassistenten führen würden. In der telefonischen Marktforschung gibt es bisher nur selten Incentives für den Teilnehmer. Selbst wenn in Zukunft eine Kompensation ausgelobt würde, wären die Kosten dieser Interviewform immer noch weitaus geringer und würden die Entwicklung weiter beschleunigen.

Marktforschung, die heute auf Klicks und Fingertipps angewiesen ist, muss Konzepte entwickeln, bei denen sie auch aus eigener Kraft forschen kann, wenn sich die digitalen Assistenten durchsetzen. Es ist davon auszugehen, dass Bildschirme wieder auf dem Rückzug sein werden, wenn die Steuerung mittels Verbalisierung umfassend funktioniert. Befragungen, die auf Papier oder via Bildschirm stattfinden, werden dann substituiert durch sprachgesteuerte Interviews. Der Weg dahin ist nicht mehr weit. Das hier vorgestellte Modell hat noch nicht alle Optionen der Sprachsteuerung ausgeschöpft. Was darüber hinaus noch in der Analyse möglich ist, hat die GfK in diesem Jahr mit einem Voice Analytics Tool bereits eindrucksvoll dargestellt. Es bleibt also für alle Beteiligten noch viel zu erforschen, bis wir den Umgang mit den neuen Ideen beherrschen. Wir stehen noch ganz am Anfang der Entwicklung, aber die Tür zu neuen Formen der Forschung ist nun aufgestoßen. 

aus planung&analyse 5/2017
Jetzt suchen >>
stats