Opernfollower Belin
Opernfollower Belin

Wer folgt den Berliner Opernhäusern auf Twitter? Eine Einladung zur Analyse

Am Anfang stand die Frage: »Was eint Menschen, die sich für Berliner Opernhäuser interessieren?«. Diese Frage ist erstmal sehr abstrakt. Was zeichnet diese Menschen aus – außer ihre Vorliebe für Opern in Berlin? Gibt es Unterschiede zwischen den Followern der Opernhäuser? Sind Follower der Staatsoper Unter den Linden aktiver? Diese kleine Untersuchung versucht, Antworten zu geben.

Um dazu eine erste Annäherung zu wagen, grenzte ich die betrachtete Gruppe weiter ein. Über das Analyse-Programm KNIME und eine Twitter API (= Schnittstelle) lies sich eine zufällig generierte Stichprobe von 300 Followern (jede Oper hat etwa 15.000 Follower) herunterladen. Dies wurde für jedes der drei auf Twitter vorhandenen Opernhäuser getan (die Neuköllner Oper ist leider nicht auf Twitter).

Für jede Oper wurden folgende Informationen über jeden der 300 Follower in eine Excel-Tabelle übertragen:

  • ID
  • Name
  • Twittername (@mustermann)
  • Profilbeschreibung
  • Zeitzone
  • Sprache
  • Anzahl Follower
  • Anzahl gesendeter Tweets
  • Anzahl vergebene Likes

Eine einfache Sortierung nach der Anzahl der Follower ergab bereits eine „Perle“ unter den Twitterern. Doch dazu später mehr. Diese Follower führte ich in einer gemeinsamen Excel-Tabelle zusammen, in der nun 898 (2 Follower der Komischen Oper waren Doubletten) Follower von Berliner Opernhäuser vorhanden waren.

Da einige der Follower nicht nur einer Oper, sondern mehreren Häusern folgten, kamen diese doppelt oder dreifach vor. Ich stand als vor der Frage: Wie viel Prozent der Follower sind überhaupt einzelne Menschen? Die grobe Vereinfachung, der Summe aus aller Followern der 3 Opernhäuser ergebe zwar eine beeindruckende Zahl an Menschen, die sich für Berliner Opern interessieren – doch wie viele einzelne Menschen sind das in Wirklichkeit? Folgen 15.000 der Staatsoper auch gleichzeitig der Deutschen Oper ergibt dies keine Interessensgruppe von 30.000, sondern 15.000.

Also sortierte ich die Follower nach zwei Kategorien.

  1. Eindeutige Opernfollower: folgen genau einem Opernhaus
  2. Multiple Follower: folgen mindestens zwei Opernhäusern

Somit wurde in 4 Gruppen segmentiert:

  1. Komische Oper Follower
  2. Staatsoper Follower
  3. Deutsche Oper Follower
  4. Multiple Follower

Nur so lässt sich trennscharf ein Unterschied zwischen den einzelnen Häusern ausmachen. Bereinigt ergab dies für die Stichprobe:

  • Gesamt: 64% (579/898) der Follower sind einzelne Personen („Unique Follower“)
  • Deutsche Oper: 18% (103/579) Unique Follower
  • Staatsoper: 21% (124/579) Unique Follower
  • Komische Oper: 24% (140/579) Unique Follower
  • Multiple Opern: 37% (212/579) Unique Follower

Nehmen wir nun an, dass diese Stichprobe (898/45.700 = 2%) repräsentativ für die Grundgesamtheit (45.700) der Follower ist, lässt sich tendenziell sagen:

  • Gesamt: rd. 29.000 (64% von 45.700) Twitterer sind einzelne Personen, die sich entweder für eine Oper oder mehrere Opern in Berlin interessieren
  • rd. 5.000 (18%) folgen nur der Deutschen Oper
  • rd. 6.000 (21%) folgen nur der Staatsoper
  • rd. 7.000 (24%) folgen nur der Komischen Oper
  • rd. 10.000 (37%) folgen mehrern Opernhäusern

[tweetshareinline tweet=“Es interssieren sich nicht 45.700 Menschen auf Twitter für die Berliner Opernhäuser, sondern nur 29.000.“ username=“KulturData“] Außerdem lässt sich vermuten, dass ein Twitterer, der bereits einer Oper folgt, auch anderen Opernhäusern nicht abgeneigt ist.

Die nächste Frage ist: Wie aktiv sind die Follower der einzelnen Häuser? Um dies darzustellen, wurden die Follower in ein Punktdiagramm überführt. Als y-Achse wurde die Followeranzahl der Follower eingetragen, als x-Achse die Anzal der Tweets der Follower. Um die daraus resultierenden Datenpunkte den Opernhäusern (bzw. den Multiplen Followern) zuzuordnen, wurden die Punkte zu Formen umgewandelt. Ein 0 zeigt nun an, dass der Datenpunkt/Follower nur der Deutschen Oper folgt. Die weiteren Formen werden in der Legende erklärt.

Um auch die Anzahl der „Likes“ anzuzeigen, die ein Twitterer vergibt, wurde der geformte Datenpunkte auch noch gefärbt. Damit kein Regenbogen dabei herauskommt, wurde die Anzahl der „Likes“ mit Hilfe des k-means Algorithmus in 3 Cluster unterteilt. Blau bedeutet viele „Likes“, gelb mittel, rot wenig. Auch dies wird in der Legende dargestellt.

Der Benutzer des Diagrammes kann mit Hilfe der Maus einen Bereich aus der Darstellung herausnehmen oder gerade nur diesen Bereich anzeigen. Das ist vor allem im Gebiet der wenigen Follower und wenigen Tweets sinnvoll, um es übersichtlicher zu halten.

Die Einteilung in Follower und Tweets wird in dieser Untersuchung als „Relevanz“ bezeichnet. Es wird davon ausgegangen, dass viele Follower und viele Tweets zu einer hohen Relevanz des Twitterers führt. Diese Twitterer sind für die Opernhäuser besonders als Influencer relevant, da sie eine hohe Reichweite generieren können.

Die Übersicht

Opernfollower Belin

Die Übersicht finden Sie hier. Das Auffälligste sind wohl die beiden Ausreißer: Ein Twitterer hat etwa 1,4 Mio. Follower, aber nur 20.000 Tweets. Ein anderer hat etwa 2.000 Follower, jedoch stolze 200.000 Tweets. Nun lüften wir das im ersten Abschnitt genannte Geheimnis: Dieser Follower heißt Craig Venegas Alvarado, oder besser bekannt als DJ King Assassin, ein Produzen, der mit Eazy-E und weiteren Größen des Hip Hop zusammen gearbeitet hat.
Nicht gerade jemand, den man als Follower der Deutschen Oper erwarten würde. Ob dieser bewusst der Deutschen Oper folgt, sei an dieser Stelle dahin gestellt. Ein Blick in das Ticketing System der Oper würde Auskunft geben. Eine Analyse seiner Tweets könnte darüber hinaus Auskunft geben, wird in dieser Analyse jedoch nicht weiter verfolgt. Falls jemand mehr weiß: bitte an info [at]kulturdata.de eine Mail verfassen.

Um aus dieser Masse an Daten nun eine Übersicht über die Relevanz der Follower zu erhalten, wurde der Median der Follower als auch der Median der Tweets pro Opernhaus betrachtet. Es wurde dabei der Median statt dem arithmetischen Mittel verwendet, um den Einfluss der Ausreißer einzuschrenken.

Fazit: Relevanz und Aktivität

Der Übersicht lässt sich entnehmen, dass die Follower, die nur der Komischen Oper folgen, tendenziell häufiger twittern als auch mehr Follower aufweisen können und somit relavanter sind, als die Follwer der anderen Opernhäuser. Twitterer, die mehreren Opernhäusern folgen, haben überdurchschnittlich viele Follower, jedoch unterdurchschnittlich viele Tweets. Nimmt man nun einen wilkürlichen Twitterer und weiß, dass dieser mehr als 80.00 Tweets abgesetzt hat und man raten müsste, welchem Opernhaus er folgt, wäre die Komische Oper tendenziell eine gute Wahl.

Falls jemand weitere, bessere Erkenntnisse aus diesem Datensatz ziehen kann, wäre ich an diesen interessiert. Gerne in die Kommentare schreiben.


Verwendete Software:

  • KNIME
  • Tableau Public
  • Microsoft Excel
  • Twitter