#2 Toolkits und Methoden

In diesem Beitrag werden unterschiedliche Social Listening Tools und Methoden der digitalen Datenanalyse vorgestellt, die in den Forschungsreports zum Einsatz kommen. Der Eintrag dient also dazu, unsere Vorgehensweise in der Datenerhebung und -aufbereitung sowie typische Analyseroutinen zu beschreiben und transparent zu machen. Der Überblick wird fortlaufend zu unseren Berichten aktualisiert und erweitert.

Linkfluence

Unsere wichtigste Datenquelle und meist erster Analysezugang ist das multifunktionale, KI-gestützte kommerzielle Social Listening Tool Linkfluence. Darüber ist es uns möglich, quasi in Echtzeit eine Vielzahl an Social-Media Plattformen sowie Online-Nachrichtenportale, Webseiten und Blogs zu beobachten (Monitoring), die Inhalte anhand einer Vielzahl von Kriterien direkt im Programminterface zu untersuchen und die Daten für weitere Analysen herunterzuladen. Linkfluence deckt viele verschiedene Plattformen und Online-Medien ab. Wir untersuchen hauptsächlich die großen Social-Media Plattformen Facebook, Twitter, Instagram und YouTube sowie Online-Nachrichtenseiten und Webblogs. Daten von TikTok und Messenger-Diensten wie Telegram sind über Linkfluence nicht zugänglich.

Es gibt grundsätzlich zwei verschiedene Zugänge, die Daten zu erheben:

Erstens: Über eine Query (Suchanfrage): Linkfluence sammelt dabei kontinuierlich jeglichen Online-Content auf den gewählten Plattformen, der eine Kombination von Schlüsselbegriffen, Hashtags, Mentions, Phrasen etc. enthält. Dieser Zugang eignet sich gut, um themenbezogene Fragestellungen zielgerichtet auswerten zu können.

Abbildung 1 zeigt ein Beispiel einer Query, die wir zum Klimadiskurs im Kontext der Flutkatastrophe im Juli 2021 aufgesetzt haben. Das Tool trägt ab dem Zeitpunkt des Erstellens dieser Abfrage nun alle Online-Beiträge zusammen, in denen mindestens einer der Begriffe innerhalb der linken Klammer und gleichzeitig mindestens ein Begriff aus der rechten Klammer vorkommen. Mit dem Sternchen (*) wird zusätzlich ausgedrückt, dass bspw. auch Komposita – also „Flutkatastrophe“ oder „Ökodiktatur“ – berücksichtigt werden. Diese Daten können jetzt anhand diverser Analysekategorien (Anzahl der Posts, Reichweite, Interaktionen, Zeitreihen, Hashtags, Bilder u.v.m.) benutzerdefiniert ausgewertet oder als Datensatz heruntergeladen werden.

Zweitens: Über Quellensets: Linkfluence bietet auch die Möglichkeit, Quellensets – also Listen von Social-Media-Accounts bzw. Webadressen – zusammenzustellen und fortlaufend alle Inhalte dieser Akteur:innen zu sammeln. Dieser Ansatz ist vor allem dann interessant, wenn die Forschungsfrage nicht an ein bestimmtes Thema geknüpft ist, sondern vielmehr dem Social-Media-Verhalten von politischen oder gesellschaftlichen Gruppen nachspüren möchte. Abbildung 2 zeigt die Verteilung unserer bisher erstellen Quellensets auf den unterschiedlichen Plattformen. Diese werden kontinuierlich erweitert.

 


Abbildung 2: Verteilung der Quellensets über die Plattformen (Stand 14.12.2021)

Twitter Explorer

Der Twitter Explorer ist ein Tool zur Erhebung, Visualisierung und Auswertung von Twitter-Daten. Grundsätzlich stehen zwei Anwendungen zur Verfügung:

Erstens: Der Collector: Mit dem Collector können Twitter-Daten – also Tweets und Retweets sowie diverse Metadaten (Autor:in, Datum, Followeranzahl etc.) – über die Twitter-API (Application Programming Interface) heruntergeladen werden. Dies geschieht über die Eingabe von einem oder mehreren Keywords, die in den Tweets des gewünschten Datensatzes vorkommen müssen. Aufgrund technischer Beschränkungen ist es jedoch nur möglich, die Daten maximal eine Woche rückwirkend zu erheben.

Zweitens: Der Visualizer: Mit dem Visualizer können die erhobenen Daten auf drei unterschiedliche Arten visualisiert werden:

  • Als Timeline (Abbildung 3): Auf einer Zeitleiste werden die Anzahl der Tweets und Retweets abgetragen. So können Trends im jeweiligen Datensatz festgestellt werden.

  • Als Retweet-Netzwerk (Abbildung 4): In dieser interaktiven Visualisierung werden User:innen als Knoten und Retweets untereinander als Kanten angezeigt. Durch diese Verbindungen bildet sich ein Netzwerk und darin unterschiedliche Cluster heraus. Gruppen von User:innen, die sich gegenseitig häufig retweeten und damit meist auch inhaltliche Übereinstimmungen haben, stehen also enger beieinander. Diese Gruppen können über das Menü auf der linken Seite auch farblich markiert werden (auto-color nodes by), wodurch eine bessere Übersichtlichkeit erreicht wird. Die Größe der Knoten kann ebenfalls über das Menü mit unterschiedlichen Parametern belegt werden. In der Standardeinstellung bezieht sie sich auf die Anzahl der Retweets, die der:die entsprechende User:in aufweist (Es kann bspw. auch die Zahl der Follower:innen angezeigt werden). Die einzelnen Knoten können interaktiv mit einem Mausklick angesteuert werden. Unter USER INFORMATION ist eine Schnittstelle zu Twitter zu finden und es werden die in dem Datensatz geretweeteten Tweets oder auch die gesamte Timeline des:der User:in angezeigt.

  • Als  Hashtag-Netzwerk (Abbildung 5): Technisch funktioniert das Hashtag-Netzwerk analog zum Retweet-Netzwerk. Es werden jedoch statt User:innen Hashtags und deren Verbindungen untereinander angezeigt. Hashtags, die häufig miteinander verwendet werden, bilden dementsprechend ebenfalls Cluster heraus. Auf diese Weise können Narrative, Themen und Debatten nachgezeichnet und analysiert werden.


Download des Beitrages als PDF-Dokument.