Wie wir Tweetclouds erstellen

Wir haben für Mitte-Links und Mitte-Rechts sogenannte Tweetclouds der Herbstsession 2012 erstellt. Hier geben wir einen kleinen Einblick hinter die Kulissen und erklären unsere Vorgehensweise.

Tweetclouds sind Darstellungen der Inhalte von Tweets. Für die Herbstsession 2012 haben wir pro Fraktion im Parlament eine Tweetcloud erstellt. Dafür haben wir die drei Wochen inklusive Wochenenden angeschaut: 10.–30. September 2012. In diesem Zeitraum haben wir alle Tweets der Parlamentsmitglieder zusammen mit den Metadaten heruntergeladen. Diese Inhalte visualisieren wir mittels sogenannter Tagclouds – wobei wir in diesem Zusammenhang von “Tweetclouds” sprechen, um Missverständnissen vorzubeugen (Tagclouds haben nichts mit Twitter-Tags/Hashtags gemein). Vor der Erstellung der Tweetclouds wurden folgende Elemente entweder anhand der Metadaten oder mittels Textanalyse aus den Tweets herausgefiltert:

  • Hyperlinks, wie zum Beispiel http://www.parlament.ch
  • User-Mentions, wie zum Beispiel @BR_Sprecher
  • gängige aber allgemeine Hashtags ohne politische Botschaft, wie zum Beispiel #parlCH
  • die häufigsten Wörter in der Sprache des jeweiligen Tweets: für Deutsch also zum Beispiel “es”, “ein”, “dass” oder “also”. Dazu musste zuerst die Sprache eines Tweets bestimmt werden. Hierfür haben wir eine automatische Methode eingesetzt, welche die Sprache eines Tweets als Deutsch, Französisch, Italienisch oder Englisch klassifiziert.
  • Parteinamen (diese werden zur Selbstpromotion übermässig häufig eingesetzt)

Von Hashtags wurde jeweils das # entfernt. Schliesslich wurden alle getwitterten Begriffe in Grossschreibweise umgewandelt. Das stellt sicher, dass zum Beispiel “Gesetz” und ein (nach)lässig getwittertes “gesetz” als dasselbe Wort angeschaut werden.

About Ralph Straumann, Filip Zirin, Tom Wider

Siehe Informationen über die einzelnen Autoren unter Über SoMePolis > Unser Team.
This entry was posted in Post and tagged , , , , , . Bookmark the permalink.