Close

Alle Konzertprogramme der New Yorker Philharmoniker

Als Leonard Bernstein sein Debüt bei den New Yorker Philharmonikern hatte, war er wohl nicht in bester Verfassung. Die Nacht davor verbrachte er in einem Club, spielte Boogie-Woogie am Klavier und zehrte wohl noch von einem Kater.

Doch Bruno Walter fiel am 14. November 1943 unerwartet aus. Bernstein musste ran.

15 Jahre später, 1958, begann dann die erste Saison der New Yorker Philharmonikern mit Leonard Bernstein als Dirigenten. 11 Jahre blieb er dort die gestalterische Kraft am Pult. Dank der Open Data Initiative der New Yorker Philharmoniker ist diese Zeitspanne nun bis hin zum abendlichen Konzertprogramm einsehbar. Über das Data Visualisierungstool „Tableau Public“ habe ich in nächtlichen Stunden diese Daten interaktiv aufbereitet. Damit lässt sich die Frage beantworte: Welches Stück wurden zwischen dem ersten Konzert am  7. Dezember 1842 und Heute am häufigsten gespielt? Welche Komponisten bevorzugte welcher Dirigent? Welche Komponisten erlebte eine Renaissance? Welche wurden nur ein einziges Mal aufgeführt?

Hier geht’s zu Visualisierung.

Methode

Zuerst fand ich auf Kaggle.com, einer Wettbewerbsplattform für Data Science, die Daten der NYPhil als CSV Datei. Diese lässt sich bereits über Excel öffnen und als Tabelle formatieren, um einen groben Überblick über die Datenlage zu erhalten. Da es mir bei diesen Daten mehr um eine Visualisierung ging als um eine Datenanalyse entschied ich mich für das Tool „Tableau Public“ mit dem sich kostenlos Datenvisualisierungen erstellen lassen. Eine erste Visualisierung der Daten zeigte jedoch etwas sehr seltsames: Der Dirigent Harry Bicket habe Händels „Messiah“ so häufig gespielt, dass das Werk als das häufigste der gesamten Historie der NYPhil anzusehen sei. Der enorme Abstand ließ mich stutzig werden.

Ein Blick in die Excel Tabelle zeigte (wenn auch mit häufigem Aufhängen des Programmes), dass die Verzerrung daher kam, dass die Aufarbeitung der Daten nicht wie gedacht war. Bei jedem Solisten wurde eine neue Spalte erstellt. Ergo zählte es das Werk als mehrfach aufgeführt. Um diesen Umstand in einer solch großen Datenansammlung Herr zu werden, recherchierte ich weiter. Dann stieß ich auf Dr. Kris Shaffer, der sowohl Musikwissenschaftler, als auch Data Science ist und sich mit dem Datenpaket der NYPhil auseinander gesetzt hatte. Er konnte mithilfe von R die Daten so abändern, dass diese Doppelungen entfielen:

The performance history is organized in a hierarchical format ― more-or-less lists of lists of lists. (See the README file on GitHub for an explanation.) It’s an intuitive way to organize the data, but it makes it difficult to do exploratory data analysis. So I spent more time than I care to admit unpacking the hierarchical structure into a flat, two-dimensional „tidy“ structure, where each row is an observation (in this case, a piece of music that appears on a particular program) and each column is a variable or measurement (in this case, things like title, composer, date of program, performance season, conductor, soloist(s), performance venue, etc.).

 

Er bietet sehr spannende Einblicke und Erklärungen über die Konzerthistorie der NYPhil – lesenwert! Diese bereinigten Daten musste ich dann wiederum bei der Umwandlung der CSV Datei in eine Excel Datei (Tableau Public akzeptiert nur diese) bereinigen. Der Grund dafür war ein Problem mit der Verwendung der Kommata. Die Solisten wurden nicht sauber in einer Spalte aufgezeigt, daher habe ich diese herausgelöscht.

Ein anderer Autor, den ich entdeckt habe, hat die Doppelungen nicht beachtet. Seine Erkenntnisse sind daher mit Vorsicht zu beachten. In meiner Darstellung sehe ich zwar zur Zeit keine Probleme mehr, aber findige Leser werden sicher noch etwas aufspüren – ich freue mich auf Feedback und eure Erklärungen.

Ausblick/Ideen

  1. Es gibt einen weiteren Datensatz der NYPhil: Alle Abonnentendaten. Was zeichnet diese aus?
  2. Die Konzertprogramme als „Programmgenerator“ für Konzerthäuser bereitstellen: Was passt gut zusammen? Vlt. lässt sich da was mit Gephi machen.
  3. Eure Ideen?

Hat dir der Beitrag gefallen?

Dann melde dich einfach kostenlos beim KulturData+ Abonnement an und erhalte unregelmäßig Zusammenstellungen von Artikeln zur digitalen Transformation im Kulturmanagement: https://kulturdata.de/das-kulturdata-abo/ ✌️

3 thoughts on “Alle Konzertprogramme der New Yorker Philharmoniker

  1. Die Beraterin Kate Prescott hat vor einigen Jahren auf dem Deutschen Orchestertag ein solches Analyse-Projekt vorgestellt. Sehr spannend. Hier der Link zu einem Data-Mining-Vortrag bei der League of American Orchestras: https://kulturdata.de/alle-konzertprogramme-der-new-yorker-philharmoniker/

    In Deutschland wird da noch zu wenig getan. Der Deutsche Bühnenverein führt sehr genaue Statistiken im Jahrbuch für Statistik und in „Wer spiele Was?“, die Daten sind aber nicht öffentlich verfügbar…

    1. Liebe*r rgl,
      vielen Dank für den Hinweis, wäre sehr an dem Vortrag interessiert. Leider haben Sie aus Versehen den falschen Link gepostet.

      Dass die Statistiken des Bühnenvereines nicht öffentlich – und nicht mal als Excel/CSV verfügbar – sind, finde ich auch schade.

      Herzliche Grüße
      Holger Kurtz, KulturData.de

Comments are closed.