Comment nous produisons les tweetclouds

Pour la session d’automne 2012, nous avons créé des tweetclouds pour les groupes parlementaires centre-gauches et centre-droites. Ici, nous donnons un aperçu dans les coulisses de la production des tweetclouds et expliquons notre démarche.

Nous avons examiné les trois semaines (y compris les week-ends) de la session d’automne: 10e à 30e Septembre 2012. Nous visualisons les tweets envoyé par les politicien-ne-s pendant la session à l’aide de soi-disant tweetclouds. Ceux-ci donc sont l’affichage du contenu des tweets. Ils sont, en effet, des tagclouds/nuages de tags de textes intégraux de tweets (nous préférons les appeler “tweetclouds” pour éviter les malentendus, car les nuages de tags n’ont rien en commun avec les (hash)tags chez Twitter).

Pour la session de l’automne 2012, un tweetcloud a été créé pour chaque groupe parlementaire. Nous avons téléchargé les textes intégraux de tous les tweets d’un groupe parlementaire y compris les métadonnées et nous avons filtré les éléments suivants, soit à partir des métadonnées ou d’une analyse de texte:

  • des liens, comme par exemple http://www.parlament.ch
  • les soi-disant user-mentions, comme par exemple @BR_Sprecher
  • hashtags communes, mais général et sans un message politique, comme par exemple #parlCH
  • les mots les plus fréquents dans la langue d’un tweet: pour français par exemple “il”, “un”, “ça” ou “donc”. Pour ça nous avons du déterminer la langue (dominante) de chaque tweet. Pour cela, nous avons utilisé une méthode automatique, qui classe la langue de tweets choisissant parmi allemand, français, italien et anglais.
  • les noms des partis (ceux-ci sont utilisés souvent pour l’auto-promotion)

Puis on a éliminé le # des hashtags. Enfin, tous les mots ont été converties en minuscules. Cela garantit que, par exemple, “Loi” et “loi” peuvent être considérés comme le même mot.

About Ralph Straumann, Filip Zirin, Tom Wider

Siehe Informationen über die einzelnen Autoren unter Über SoMePolis > Unser Team.
This entry was posted in Post and tagged , , , , , . Bookmark the permalink.