Twitter Statistik der letzten drei Monate

Für ein Seminar habe ich vor 3 Monaten damit begonnen, Statistiken über den Microblogging-Dienst Twitter zu ermitteln, da ich keinerlei brauchbare Statistiken über den beliebten Microblogging-Dienst im Internet gefunden habe. Aus diesem Grund, habe ich ein kleines Java Programm geschrieben, das über die Twitter-API alle 15 Minuten die Public Timeline bei Twitter abholt und die dort gefundenen Daten in einer Datenbank speichert. Durch die fortlaufende ID der Postings war es dann möglich, die Nachrichten (=Tweets) pro Tag zu ermitteln. Nachfolgend seht ihr eine Grafik über die Tweets pro Tag:

tweetsperday

Der erste und der letzte Tag in der Statistik sind nicht vollständig erfasst worden und zeigen deshalb einen kleineren Wert. Ich habe bisher davon abgesehen, sie aus der Statistik herauszunehmen. Auffällig ist, dass die meisten Tweets unter der Woche geschrieben werden und sowohl samstags als auch sonntags weniger Tweets geschrieben werden. Zu Weihnachten und Neujahr sackte die Zahl der Tweets pro Tag auch etwas ab, wobei man aber sagen kann, dass seit Jahreswechsel die Zahl der Tweets pro Tag stärker zunahm als Ende des letzten Jahres.
Ein international stark beachtetes Ereignis, die Amtseinführung Barack Obamas am 20. Januar 2009, lässt sich in meiner Twitterstatistik als eindeutiger "Zacken" in der Grafik erkennen, denn an diesem Tag wurden mehr Nachrichten über den Microblogging-Dienst verschickt. Der Tag, an dem bisher die meisten Tweets geschrieben wurde, war der 20. Februar 2009 mit 3.9 Millionen Tweets pro Tag.
Insgesamt sieht man, dass die Zahl der über Twitter versendeten Nachrichten kontinuierlich zunimmt.

Aus der Public Timeline von Twitter kann man neben der Tweets pro Tag auch die Quelle der Nachrichten ablesen. Mit der Quelle hat man dann die Möglichkeit die Top 10 der bei Twitter verwendeten Clients zu erfassen. Der Vorteil gegenüber einfachen Webstatistiken, wie z.B. über Compete.com, liegt darin, dass man hier nicht nur die Seitenzugriffe über den Webbrowser erfasst, sondern auch Nachrichten, die z.B. per SMS versendet werden (im Diagramm "txt").

favclients

Auffällig ist dabei, dass seit Beginn der Messung, der RSS Dienst Twitterfeed sich auf den zweiten Platz vorgeschoben hat, während Twitterific (ein Client für MacOS und iPhone) und Twhirl Plätze verloren haben und SMS einen respektablen 4. Platz erreicht. Bei Twitterfeed kann man davon ausgehen, dass die diversen Nachrichtenagenturen, die seit Anfang 2009 bei Twitter vertreten sind, diesen Dienst verwenden, um ihre Nachrichten an Twitter weiterzuleiten.

Falls ihr diese Statistik irgendwo weiterverwenden möchtet, so würde ich euch bitten einen Kommentar, ein Trackback oder eine Mail zu hinterlassen :-).

Statistikerfassung für Twitter?

Für unser Seminar zum Thema "Microblogging" habe ich in den vergangenen Wochen versucht, einige Statistiken zu finden. Leider gibt es dazu entweder nur ganz altes Zeug – naja, zumindest schon ein halbes Jahr alt – oder nur benutzerspezifische Statistiken. Nun könnte man die Webseitenstatistiken von Twitter.com verwenden, was allerdings auch nicht optimal ist, da man hier die Info über die Twitter-Clients und SMS Tweets verliert. Aus diesem Grund habe ich ein kleines Skript geschrieben, das mir alle 15min die "Public Timeline" über die Twitter-API abholt. Die ID der Tweets ist aufsteigend, wodurch ich hoffe, eine Tagesstatistik von den Tweets machen zu können. Bleibt nur zu hoffen, dass wir bis zu unserer Präsentation genug Daten zusammenbekommen. Vielleicht fallen mir auch noch ein paar andere Statistiken ein, die ich aus den Informationen der Public Timeline herausholen kann.

Kurz was zum Skript: Ich verwende dafür die Java Twitter Bibliothek Twitter4j in Kombination mit der Java Persistence API in Kombination mit Oracle Toplink mit einer MySQL Datenbank im Hintergrund. Das Programm wird alle 15min per Cronjob auf einer Linux Maschine gestartet und macht erstmal nichts anderes als die Daten 1:1 in der Datenbank abzuspeichern. Zukünftig notwendige Tabellen für die Auswertungen werde ich aus den "Rohdaten" der Public Timeline erstellen können.
Je nachdem ob sich diese Statistik als sinnvoll erweist, werde ich den Quellcode nach dem Seminar hier zur Verfügung stellen.

twitterstatistics