Spätestens seit dem Release von ChatGPT ist klar, Künstliche Intelligenz wird in (fast) jeder Branche gewaltigen Einfluss haben – auch in der Marktforschung. Das Wunderkind aus dem Hause OpenAI kann aber bei weitem nicht alles, was mithilfe von Algorithmen möglich ist. Das auf Natural Language Processing (NLP) spezialisierte Deep-Tech-Startup Tucan.ai spürt die Auswirkungen von KI sowohl als Nutzer als auch als Entwickler. Lukas Rintelen und Florian Peschl berichten, wie die Technologien nutzbringend in der qualitativen Forschung eingesetzt werden können.

Tucan (links) studierte an der Wirtschaftsuniversität in Wien und der Erasmus School of Economics in Rotterdam internationale Volks- und Betriebswirtschaftslehre. Er ist Gründer der Podcast-Plattform RecTag sowie Mitgründer und Geschäftsführer von Tucan.ai, einem auf NLP und Software as a Service (SaaS) spezialisierten Deep-Tech-Startup mit Sitz in Berlin. Florian Peschl studierte am University College London (UCL) Sozial- und Politikwissenschaft, bevor er für einige Jahre als Analyst und Journalist für Think Tanks, Medien und öffentliche Institutionen wie Chatham House, Forbes und den Österreichischen Nationalrat tätig war. Seit Ende 2021 unterstützt er Tucan.ai mit strategischen Marketing- und Kommunikationsaktivitäten.

NLP in der qualitativen Forschung

Was NLP alles kann 1. Datenerfassung und Zusammenfassung. Automatische Datenerfassung umfasst sowohl das Lesen von Texten sowie die Aufzeichnung und Transkription von Gesprächen als auch die Zusammenfassung von Inhalten. Mithilfe von KI können diese Prozesse nicht nur ausgelagert und beschleunigt werden, sondern werden auch präziser, objektiver und transparenter. So können etwa Tools je nach Bedarf lautsprachliche (Interjektionen), bereinigte (korrekte Grammatik) oder zusammenfassende Transkripte erstellen. Interviews und Fokusgruppen lassen sich damit sehr einfach skalieren.

2. Textanalyse und Themenerkennung. IBM schätzt, dass rund 80 Prozent aller Daten weltweit unstrukturiert und folglich unbrauchbar sind. Textanalyse kann mit linguistischen und maschinellen Lerntechniken den Informationsgehalt von Text-Datensätzen erkennen und strukturieren. Dabei werden ähnliche Methoden wie beim quantitativen Text-Mining eingesetzt, doch es geht neben der Modellierung auch darum, Muster und Trends aufzudecken.

Bei der Themenmodellierung werden Textcluster mit gemeinsamen Themen in Gruppen markiert. Man kann sich dies ähnlich wie das Tagging von Schlüsselwörtern vorstellen, also die Extraktion und tabellarische Auflistung wichtiger Wörter aus einem Text. Bei der Extraktion geht es darum, wiederkehrende Themen aus Datensätzen herauszufiltern, etwa um eine bessere Vorstellung davon zu bekommen, worüber sich bestimmte Zielgruppen Gedanken machen.

NLP-Modelle können zudem die Daten, die ihnen zur Verfügung gestellt werden – zum Beispiel die Ergebnisse einer Studie –, mit anderen ähnlichen Ressourcen vergleichen. Auf diese Weise werden etwaige Widersprüche erkannt oder Lücken „aufgefüllt”. Dies geht freilich nur, wenn die KI über den Kontext zahlreicher anderer Datenpools verfügt.

3. Satzeinbettung und Schlüsselworterkennung. Einer der bisher erfolgreichsten Anwendungsfälle von NLP in der qualitativen Forschung ist die KI-gestützte Satzeinbettung. Im Wesentlichen geht es hier um die Zuteilung von Wörtern zu passenden beziehungsweise sinngemäßen Meinungen. Satzeinbettung erleichtert etwa die Verarbeitung großer Datenmengen sowie automatisierte Extraktion der wichtigsten Aussagen aus qualitativen Interviews.

Die Extraktion von Schlüsselwörtern ist eine Analysetechnik, mit der automatisch die am häufigsten verwendeten und wichtigsten Wörter und Ausdrücke aus einem Text herausgezogen werden. Sie eignet sich insbesondere, um den Inhalt von Texten zusammenzufassen und die wichtigsten diskutierten Themen besser zu verstehen.

4. Sentimentanalyse. Ähnlich verhält es sich mit der Sentimentanalyse, bei der die Absichten und Meinungen hinter den gesammelten Textdaten ermittelt werden. Während die Textanalyse den Daten einen Sinn gibt, enthüllt die Stimmungsanalyse die Emotionen und Meinungen, die einem Text oder einem Gespräch zugrunde liegen. Auf diese Weise werden subjektive Empfindungen auf abstrakte Darstellungen reduziert. Natürlich gehen dabei aber, wie bei jeder Datenanalyse, auch einige Nuancen verloren.

Dynamische und authentische Einblicke

(Automatic Speech Recognition, ASR) ist nach Large Language Models (LLM) wie ChatGPT der am schnellsten wachsende Bereich. Dabei werden gesprochene Wörter in Text umgewandelt. Die Systeme arbeiten sehr präzise und sind daher ideal für Aufgaben wie die Protokollierung und Transkription oder die Zuordnung einzelner Sprecher geeignet. Bei der Erkennung von mehreren Sprechern in lauter Umgebung sowie bei Akzenten und Dialekten haben manche Tools allerdings noch ihre Schwierigkeiten.(NLU) ist ein weiteres innovatives NLP-Element. Es geht über die reine Transkription hinaus und versucht, die Bedeutung hinter den Wörtern zu erkennen. NLU eignet sich etwa für Stimmungsanalysen, zur Kodierung und zur Absichtserkennung. Das Training gestaltet sich jedoch komplex, da es große Mengen an akribisch kodierten Sprachdaten benötigt.ermöglichen es Programmen, oft auch virtuelle Assistenten genannt, informative Gespräche mit Menschen zu führen. Sie können automatisch Daten erheben und personalisierte Antworten geben, kämpfen aber in der Regel noch damit, subtile Sprachformen wie Idiome oder Sarkasmus richtig einzuordnen.Richtig angewandt kann NLP zum einen helfen, den Personal Bias zu verringern. Jedes Mal, wenn eine Person etwas wahrnimmt, wird der Inhalt durch subjektive Erfahrungen und Meinungen gefiltert. Das bringt eine gewisse Art von Voreingenommenheit mit sich, vor der auch Forscher nicht gefeit sind. Eine herkömmliche Gegenmaßnahme besteht darin, zwei Analysten mit demselben Datensatz zu beschäftigen. Das dauert lange und ist teuer. NLP ist da eine viel effizientere Lösung. Die KI ist unbestechlich. Wichtig ist bei all den Programmen, dass man auf ein kontrolliertes Training der Modelle achtet.In der qualitativen Forschung werden NLP-Tools zur Aufbereitung, Analyse und Extraktion von Erkenntnissen aus aufgezeichneten Interviews und Fokusgruppen eingesetzt. So können gesprochene Daten schnell und genau transkribiert werden und es stehen große Mengen an Freitext-Daten zur Verfügung, die andernfalls nicht erfasst würden.NLP-basierte Tools können auch zur Analyse von Transkripten verwendet werden, um Schlüsselthemen, Kernaussagen und Muster zu identifizieren. Sie helfen, spezifische Nuancen der Sprache zu ermitteln, wie etwa Tonfall, Betonung und nonverbale Hinweise. Darüber hinaus ermöglicht der automatisierte Charakter dieser Applikationen die Analyse größerer Datensätze, was zu repräsentativen und robusteren Ergebnissen führen kann. Dies macht sie kosteneffizient.Mithilfe der genannten Anwendungsfelder von NLP lassen sich nicht nur zusätzliche und meist bessere qualitative Erkenntnisse gewinnen, sondern Befragungen und Analyse auch wesentlich kontextsensibler gestalten – zum Beispiel, weil Interviewer und Moderatoren einem Skript folgen, das laufend von einem Computer angepasst wird. Fragen können so stets in einem direkten Zusammenhang mit vorherigen Antworten gestellt werden, selbst bei einer sehr hohen Anzahl an Interviews oder Fokusgruppen.NLP kann traditionelle Forschungsmethoden und -prozesse optimieren sowie ein dynamischeres und authentischeres Verständnis von Zielgruppen und Märkten erlangen. Vermutlich werden wir künftig auch immer konversationellere Erhebungen sehen. Das sind scheinbar zusammenhanglose Äußerungen in einem Gespräch, für die sich aber dennoch ein Kontext herstellen lässt. So können Vertiefungsfragen in Echtzeit gestellt werden.So viel steht fest: NLP wird die qualitative Forschung nachhaltig beeinflussen. Tiefgreifende, explorative Fähigkeiten, zu denen Menschen im Interview in der Lage sind, lassen sich von KI-Systemen (noch) nicht durchführen. Aber der Einsatz von KI macht qualitative Forschung schneller, kostengünstiger und praktikabler und unterstützt erfahrene Analysten.Erschienen in