Studienprojekt Music Map 2020: Wer macht in der Umgebung Musik?

Moodle:

UseCase: Wenn ich beruflich unterwegs bin, will ich abends oft kein "soziales Bier" trinken, sondern viel lieber aktiv Musik machen. Mit meiner Tuba ist das z.B. in einer Blaskapelle oder einem Posaunenchor in der Umgebung als Gastbläser leicht möglich: Einfach den*die Leiter*in anrufen und fragen "Probt ihr heute abend? Dürfte ich als Gastbläser dazukommen?". Fast immer ist man herzlich willkommen!

  • Musik ist nur ein Beispiel. Sicherlich gilt ähnliches auch für das Training des örtlichen Fußballvereins, die Brettspiel-Gruppe, die Tango-Milonga.

Problem: Wie bekommt man heraus, welcher Verein sich heute in der Nähe zur Probe / zum Training trifft?

Falls eine Community sich bereits auf einer modernen Social Media Plattformen vernetzt hat, kann man die Umkreis-Suche anwerfen. Die Szene der Musik-Gruppen ist leider weniger innovativ organisiert. (Manche sagen: Der Musiker an sich ist konservativ.) Typischerweise gibt es händisch gepflegte Homepages und Übersichts-Seiten wie z.B. diese hier:

Es kann also sehr aufwändig werden, für einen bestimmten Tag eine Musikgruppe in der Umgebung zu finden.

Für dieses Problem suchen wir eine Lösung.

Teil 1

Wir scrapen die Homepages der Musik-Gruppen und suchen mit spaCy (s.U.) gezielt nach Ort, Wochentag und Zeit der Probe (sowie natürlich die üblichen Kontaktdaten).

Die Ergebnisse werden ...

  • mit Fundort in einer einfachen Datenstruktur abgelegt (z.B. Tabelle, YAML-Datei etc; Lösung muss ohne Datenbank funktionieren) und ...
  • ... von einem Menschen überprüft, ggf. korrigiert, ggf. ergänzt

Bei einem erneuten Scraping-Durchlauf werden die manuell bestätigten Daten gezielt gesucht: Daten, die vom Scraping bestätigt werden, werden grün, neue Daten gelb, abweichende Daten (z.B. wenn die Probe verschoen wurde) rot markiert.

Sprache: Python (ist ja klar); Bibliotheken:

siehe auch http://jbusse.de/2019_ws_dsci/dsci-pcn-2019.html

Wichtig: Der Kern von Teil 1 besteht in der Textanalyse der gescrapten Text-Homepages mit spaCy. Das ist auch der Kern des Studienprojekts. Den Rest beschränken wir auf das Notwendigste.

Teil 2

Wir laden die Proben unserer Musikgruppen mit Ort und Wochentag in eine Map wie z.B. Google-Maps oder OpenStreetMap hoch.

Ab jetzt ist eine Umkreis-Suche möglich!

Teil 2 kann ggf. auch als eigenständige Bachelorarbeit vergeben werden.