Veranstaltungsübersicht in München | Python Projekt

Ich wollte herausfinden, ob es bestimmte Termine gibt, an denen in München besonders viele Veranstaltungen stattfinden. Gibt es ein Datum, an dem am meisten los ist bzw. wann ist am wenigsten los?

Veranstaltungen benötigen Tickets – und Tickets kaufen die meisten bei Eventim. Also sollte die Übersicht auf Eventim.de eine gute Stichprobe abbilden, wie viele Veranstaltungen in München stattfinden.

Die Vorgehensweise

Technisch hatte ich mir überlegt, „einfach“ die Veranstaltungstitel und die Veranstaltungstermine von der Webseite herunterzuladen (über das sogenannte Webscrapping). Diese dann in einer Tabelle darzustellen und die Veranstaltungen pro Tag zusammenzurechnen. So hätte ich eine Anzahl an verschiedenen Veranstaltungen pro Tag. Klingt easy, hat mich aber einige Wochenenden gekostet …

Leider hat Eventim.de (seit dem Relaunch?) das Webscrapping der Webseiteninhalte schwieriger (bis unmöglich?) gemacht. Die Webseite erkennt, dass ich kein »echter« Besucher bin und blockiert mich sofort.

Disclaimer

Veranstaltungen, wie Ausstellungen oder Veranstaltungen, die mehrtägig stattfinden, werden in dieser Übersicht nicht betrachtet. Gründe: Technische Schwierigkeiten; die Tatsache, dass nicht impliziert werden soll, dass wirklich ALLE Veranstaltungen in der Analyse vorkommen und die Frage, ob ständige Events wirklich eine Veranstaltung darstellen. Aber vor allem wusste ich nicht, wie ich mit dem unregelmäßigen „von-bis“ Datumsformat umgehen sollte …

Daten von MünchenTicket

Nach vielen Versuchen, die Blockade von Eventim zu umgehen, habe ich einfach die Flinte ins Korn geworfen und mir eine anderen Webseite gesucht. In München ist das kein Problem, da mit dem städtischen Anbieter »MünchenTicket« ein ebenso verbreiteter Anbieter von Tickets vorhanden ist.

Dort ist das Webscrapping kein Problem.

Falls MünchenTicket jedoch etwas dagegen hat, schreibt mir bitte eine E-Mail an info[]kulturdata.de

Bitte nicht verklagen 🙂

Bitte um Verbesserungen

Da ich nicht gerade erfahren im Umgang mit Python und Webscrapping bin, freue ich mich über eure Verbesserungen im Code und der Datenverarbeitung. Ihr findet das Projekt auf Github.

Als mein kleines Python Script endlich fehlerfrei lief, hatte ich einen richtigen Heureka-Moment. 5 Minuten später stand ich jedoch wieder vor anderen Problemen im Code, um die Daten auch weiterverarbeiten zu können. Tja, that’s life.

Die beiden Python Scripte auf Github

  • Das 1. Script lädt Informationen von MünchenTicket in eine csv-datei
  • Das 2. Script bearbeitet diese Daten so, dass ein
  • Datenvisualisierungstool (in meinem Fall das kostenlose „Tableau Public“) damit umgehen kann.

Das bisherige (beta) Ergebnis findet ihr nun hier als Link zu Tableau Public und als Grafik. Wenn ihr auf das Bild klickt, gelangt ihr zu einer interaktiven Version.

Erklärungsversuche

  • In der Grafik sieht man in der x-Achse einen Zeitstrahl von Februar 2020 bis Januar 2021.
  • Die y-Achse zeigt die Anzahl der Veranstaltungen an einem Tag.

Zuerst wird klar, dass wohl noch nicht viele Veranstalter ihre Veranstaltungen in MünchenTicket hochgeladen haben. Nach dem Tag mit den meisten Veranstaltungen (=31.12.2020) finden sich – bisher – nur wenige veranstaltungsreiche Tage. Stand Februar 2020 sind nur etwa 2.500 Veranstaltungen bei MünchenTicket eingerichtet.

Außerdem geht die Anzahl der Veranstaltungen pro Tag von März bis Juli 2020 steil zurück. Ob das wirklich bedeutet, dass es weniger Veranstaltungen werden ist jedoch fraglich. Bekanntlich ist die Weihnachtszeit ab November bis Dezember die Zeit mit den meisten Veranstaltungen.

Ich mutmaße daher, dass die Veranstalter ihr Programm für die nächste Saison ab August 2020 noch nicht auf MünchenTicket hochgeladen haben. Da ich die Datenbasis erneuern kann, können wir in ein paar Wochen mal die Diagramme neu erstellen und dann einen Vergleich ziehen.

Der Tag mit den wenigsten Veranstaltungen in den kommenden Monaten ist der 11. April 2020 – ein Tag vor Ostersonntag. Generell ist an Ostern nicht viel los – vermutlich, da viele im Ski-Urlaub sind.

Gruppierung nach Wochentag

Wenn wir uns die Verteilung anschauen, erkennen wir, dass die Anzahl der Veranstaltungen innerhalb weniger Tage sehr schwankt. Über eine Stichprobe komme ich darauf, dass es an den Wochentagen liegen könnte. Über diesen Link sehen wir nun die Anzahl der Veranstaltungen gruppiert nach Wochentag.

Fail: In der ersten Fassung dieses Beitrages ist mir an dieser Stelle aufgefallen, dass der Mittwoch fehlte. Grund war ein Tippfehler im Script … FUCK!

Holger, Noobie

Wie es aussieht, sind Donnerstag bis Samstag die beliebtesten Wochentage für Veranstaltungen in München. Erwartet hätte ich eher den Samstag & Sonntag. Was meint ihr woher das kommt? Twittert mir an @KulturData

Aussicht

In einem nächsten Step würde ich mir anschauen, ob es nicht doch interessanter wäre, die größere Datenbasis von München.de mit den vielen kleinen Events anzuschauen (dort ist das Datum auch regelmäßiger 😇) Die Daten sind dort auch sehr gut strukturiert und damit für ein Webscrapping-Projekt bestens geeignet.

1 thought on “Veranstaltungsübersicht in München | Python Projekt

Comments are closed.