Online Special Big Data Analytics

Warum Twitter ohne Zeitungen ärmer wäre

   Artikel anhören
© imago images / ZUMA Press
Beiträge von Tageszeitungen gehören in der Corona-Krise zu den wichtigsten Quellen, auf die in Twitter verlinkt wird. Dies zeigt eine Analyse der Zeitungsmarktforschung Gesellschaft (ZMG). Damit ist klar: Zeitungen gehören zum Social Web. Thomas Halamuda und Johannes Göpel von der ZMG zeigen wie Big Data hilft, das Informationsverhalten während der Krise besser zu verstehen.
In Krisenzeiten werden Nachrichten wichtig. Die Menschen möchten auf dem Laufenden bleiben, sie wollen nichts verpassen und immer die aktuellen Entwicklungen verfolgen. Auch die Corona-Pandemie hat das gezeigt: Alle Nachrichtenmedien wurden intensiver genutzt, auch von jungen Menschen, die ansonsten wenig fernsehen oder keine Zeitung lesen. Ein anderes Medium zur Verbreitung von Nachrichten ist Twitter. Der Micro-Blogging-Dienst, bei dem jeder Nutzer seine eigenen Kurztexte (seit November 2017 sind 280 Zeichen erlaubt) in die Welt schicken kann, erreicht nach eigenen Angaben jeden Tag 166 Millionen aktive Nutzer in aller Welt. Nicht nur US-Präsident Trump nutzt ihn, um einen direkten Kontakt mit Millionen von Internet-Nutzern zu bekommen. In einem großen Land mit mehreren Zeitzonen sind Tweets manchmal schneller als die klassischen Nachrichtenmedien. In Deutschland nutzen laut ARD/ZDF-Onlinestudie 2019 fünf Prozent der Deutschen den Dienst mindestens einmal im Monat. Darunter sind viele Multiplikatoren: Journalisten, Politiker, PR-Experten und Wissenschaftler. Sie verwenden Twitter für Recherchen und schnelle Information. Viele Tweets verweisen auf andere Quellen – Links zu Beiträgen in anderen Online-Medien. So ist Twitter auch ein relevanter Distributionsweg für journalistische Online-Artikel, gerade in Krisenzeiten.
Die Autoren
Thomas Halamuda und Johannes Göpel
© ZMG
Thomas Halamuda (links) ist stellvertretender Forschungsleiter der Zeitungsmarktforschung Gesellschaft ZMG. Nach Stationen bei Fraport und Dentsu Aegis Resolutions ist er seit sechs Jahren bei der ZMG tätig. Sein Fokus liegt auf multivariater Werbewirkungsforschung und der Automatisierung von Marktforschungsprodukten.  Seit 2019 ist er Mitglied in der Technischen Kommission der AGOF.


Johannes Göpel ist (Junior-) Projektleiter und Data Engineer bei der ZMG. Er vereint sozialwissenschaftliches Know-How mit Informatik und gründete bereits während seines Studiums sein erstes Start-Up. Sein besonderes Interesse liegt in der Kombination klassischer sozialwissenschaftlicher Verfahren mit Big Data- und Machine Learning Methoden.
Deshalb wollten wir bei der ZMG untersuchen, auf welche Quell-Medien von Twitter-Nutzern bevorzugt referenziert wird. Dabei konzentrierten wir uns auf journalistische Online-Angebote von Radio- und TV-Sendern, Magazinen und natürlich Tageszeitungen. Diese Zahlen können als ein Indikator für die Relevanz der Ursprungsmedien im Informationsverhalten während der Corona-Zeit interpretiert werden.

Der stetige Strom von Tweets in der Analyse

Für die Studie wurde eine Stichprobe von Twitter-Meldungen zu einschlägigen Hashtags zur Corona-Problematik im Zeitraum vom 10. bis 21. April 2020 untersucht. Der Hashtag # ist das Etikett, mit dem eine Mitteilung vom Verfasser einem bestimmten Thema zugeordnet wird. Dadurch ist der Anschluss an eine laufende Diskussion möglich. Ebenso dienen Hashtags den Nutzern zur schnellen Orientierung und Suche nach interessanten Inhalten. Wir wählten die Hashtags #Corona und #Covid19, die zu der Zeit zu den am meisten genutzten gehörten – sie wurden auf der Twitter-Startseite als „Trending Topics“ aufgelistet. Weiterhin haben wir uns entschieden, nur deutschsprachige Tweets einzusammeln.

Bei der vorliegenden Big-Data-Analyse gab es eine Reihe technischer und methodischer Herausforderungen: Neue Accounts wurden angelegt, die sich noch in keiner menschlichen Filterblase befinden, damit die Verzerrung durch die algorithmisch ausgespielten Tweets minimiert wird. Über die offizielle Schnittstelle (Streaming API) von Twitter erhält man einen kontinuierlichen Strom an Daten, der mit sehr unterschiedlicher Intensität im Tagesverlauf fließt, mit deutlichen Spitzen bei wichtigen Ereignissen, die zeitgleich kommentiert werden. So entschieden wir uns für eine Cloud Lösung (auf Basis des Open-Source-Systems Kubernetes), um dynamisch und je nach Last zusätzliche Ressourcen anzufordern und wieder freigeben zu können. Gleichzeitig konnten wir damit unser System permanent auf Funktionstüchtigkeit überwachen.


Alle gesammelten Tweets wurden in einer NoSQL-Datenbank abgespeichert, um sie nach der Untersuchungsperiode zu analysieren. Wir interessierten uns besonders für Tweets mit einer Verlinkung auf eine externe Internet-Adresse. Viele Twitter-Nutzer verwenden beim Verlinken Abkürzungen (URL Shorts). Diese Kurzlinks wurden aufgelöst und gingen mit ihrer Ziel-Adresse in die Analyse ein. Gefunden wurden zahlreiche Tweets, die zwar das Hashtag verwenden, aber nicht auf das Thema Bezug nehmen. Dieser Spam etwa für pornografische Angebote und Glücksspiele wurde aufgrund der Zieladresse herausgefiltert. Insgesamt kamen so 87.164 Links aus 470.720 Tweets in der bereinigten Datenbank zusammen und wurden weiter analysiert. Für diese Anzahl von Tweets waren 115.000 einzelne Nutzer verantwortlich, 26 Prozent von ihnen haben mindestens einen Link geteilt.
Top 10 der verlinkten Domains
© ZMG
Top 10 der verlinkten Domains
Schaut man sich die Auszählung der veröffentlichten Links an, wird deutlich, dass viele auf andere Social-Media-Posts verweisen. Dazu gehören in erster Linie andere Tweets auf Twitter, aber auch Beiträge auf Instagram, Facebook, Youtube und anderen sozialen Netzwerken. Die Top 4 der verlinkten Domains sind somit Social-Media-Seiten: Twitter, Youtube, Instagram und change.org (eine Plattform für Online-Petitionen). Erst an fünfter Stelle kommt mit der Tagesschau ein Nachrichtenmedium. Schauen wir uns nur die zehn meist verlinkten Nachrichtenmedien an, so sind die Hälfte davon Online-Angebote von Zeitungen.
Top 10 der verlinkten Nachrichtenseiten
© ZMG
Top 10 der verlinkten Nachrichtenseiten

Zeitungsangebote sind wichtig

Wir haben die verlinkten Domains nach dem jeweiligen Stammmedium gruppiert. Wenn die Medienmarke der Website zu einem TV-Sender gehört (wie z.B. tagesschau.de), wurde die Seite entsprechend zugeordnet. Nach dieser Einteilung sind Angebote von Tageszeitungen die zweitwichtigste Mediengruppe, auf die Twitter-Nutzer verweisen.

Dieses Ergebnis zeigt, dass Zeitungsangebote ein wichtiger Baustein für die Meinungsbildung in sozialen Medien rund um den Corona-Virus waren. Über die Links in den Twitter-Beiträgen erreichten journalistische Beiträge aus den Zeitungs-Websites zusätzliche Internet-Nutzer. Daraus lässt sich schließen, dass Social Media kein reiner Ersatz für journalistische Angebote sind, sondern im Gegenteil: Nachrichten und Berichte von Tageszeitungen und anderen journalistischen Quellen sind Teil des Social Webs und bringen redaktionelle Qualität und anspruchsvolle Inhalte zu Menschen, die ansonsten seltener solche Medien nutzen.
Verlinkte Nachrichtenquellen nach Stammmedium
© ZMG
Verlinkte Nachrichtenquellen nach Stammmedium
Die Untersuchung über die Nachrichtenquellen von Twitter-Meldungen liefert natürlich nur einen Schnappschuss. Das Verhalten der Social-Web-Nutzer ist komplexer, Unmengen relevanter Tweets, die nicht mit den ausgewählten Hashtags versehen sind, gingen nicht in die Stichprobe ein, ganz zu schweigen von Beiträgen auf anderen Social-Media-Plattformen wie Instagram oder Facebook. Trotzdem können zwei bedeutsame Schlussfolgerungen aus der Studie gezogen werden: Tageszeitungen waren in der Krise für viele Social-Media-Nutzer eine wichtige Quelle, ihre Beiträge gehören zur Welt des Social Web. Außerdem zeigt die Studie, dass Big-Data-Analysen von Social-Media-Daten uns zusätzliche wertvolle Erkenntnisse zum Informationsverhalten der Deutschen liefern können.
Bitte loggen Sie sich hier ein, damit Sie Artikel kommentieren können. Oder registrieren Sie sich kostenlos für H+.
Ich habe die Datenschutzbestimmungen zur Kenntnis genommen und akzeptiere diese.
stats