Statistikerfassung für Twitter?

Für unser Seminar zum Thema “Microblogging” habe ich in den vergangenen Wochen versucht, einige Statistiken zu finden. Leider gibt es dazu entweder nur ganz altes Zeug - naja, zumindest schon ein halbes Jahr alt - oder nur benutzerspezifische Statistiken. Nun könnte man die Webseitenstatistiken von Twitter.com verwenden, was allerdings auch nicht optimal ist, da man hier die Info über die Twitter-Clients und SMS Tweets verliert. Aus diesem Grund habe ich ein kleines Skript geschrieben, das mir alle 15min die “Public Timeline” über die Twitter-API abholt. Die ID der Tweets ist aufsteigend, wodurch ich hoffe, eine Tagesstatistik von den Tweets machen zu können. Bleibt nur zu hoffen, dass wir bis zu unserer Präsentation genug Daten zusammenbekommen. Vielleicht fallen mir auch noch ein paar andere Statistiken ein, die ich aus den Informationen der Public Timeline herausholen kann.

Kurz was zum Skript: Ich verwende dafür die Java Twitter Bibliothek Twitter4j in Kombination mit der Java Persistence API in Kombination mit Oracle Toplink mit einer MySQL Datenbank im Hintergrund. Das Programm wird alle 15min per Cronjob auf einer Linux Maschine gestartet und macht erstmal nichts anderes als die Daten 1:1 in der Datenbank abzuspeichern. Zukünftig notwendige Tabellen für die Auswertungen werde ich aus den “Rohdaten” der Public Timeline erstellen können.
Je nachdem ob sich diese Statistik als sinnvoll erweist, werde ich den Quellcode nach dem Seminar hier zur Verfügung stellen.

twitterstatistics