email_2018-11-15

Liebe Teilnehmer der Veranstaltung Data Science,

am Wochenende ist ja unser nächster Workshop.

Gespräche mit Studierenden und eigene Erfahrungen haben ergeben, dass ich in meiner bisherigen Planung zu hohe Ziele angestrebt hatte. Bowles ist anspruchsvoller als es zunächts den Anschein hatte. Was tun?

  • Einerseits können Sie sich Python und die nötigen Bibliotheken nur aneignen, sobald Sie wissen, was Sie überhaupt tun und anstreben sollen: Da hilft uns das Buch, es gibt uns den theoretischen Rahmen vor.
  • Andererseits sind viele von uns - mich eingeschlossen - in Bezug auf die einschlägigen Bibliotheken und Datentypen in Python eben noch nicht weit genug, um all die schönen Sachen aus Bowles auch selbst in Python umsetzen zu können. Das Buch bleibt so gesehen theoretisch.

Für den Workshop am kommenden Wochenende schlage ich also vor, dass wir auf informierterer Ebene die gleiche Frage bearbeiten, die uns auch schon im Sommersemester beschäftigt hat:

  • Wie könnte man das lernen, was man bräuchte, um mit Penalty Based Regression eigenständig eine Competition wie Titanic angehen zu können?

Im Detail wollen wir insbesonder wissen: Welche Bibliotheken stehen uns zur Vefügung? Wofür brauchen wir numpy, pyndas, scikit? Wie macht man das, was im Buch steht, mit den Bibliotheken?

  • Im vorangehenden Workshop haben wir ja ein http://jbusse.de/2018_ws_dsci/dsci_w1.html#Vorgehensmodell dazu schon skizziert.
  • Ziel am komenden Wochenende ist es, dieses Vorgehensmodell mit Bezug auf die Bibliotheken zu konkretisieren. Ideal wäre ein Plan für den Transfer von Bowles auf Titanic.

Wir betreiben also am kommenden Wochenende Wissensmanagement in Tradition der Vorgänger-Veranstaltung im SS 2018. Von der Arbeitsform her gehen wir wie folgt vor:

  • Anschauen der Code-Beispiele von Bowles: Was macht er? Wozu macht er es, wie geht er vor? Wie interpretiert er die Ausgabe?
  • Wie könnte man einzelne Code-Snippets von Bowles Zuhilfenahme von numpy und pandas reproduzieren?
  • Mit welcher Strategie können wir Titanic "nach Art von Bowles" bearbeiten?

Ihre Vorbereitung dazu ist nach wie vor Bowles: Mindestens ganz grob müssen Sie eine Übersicht haben, worum es in den Kapiteln 1-5 überhaupt geht, und die wichtigsten Grundbegriffe verstehen. Und ja, idealerweise haben Sie all das auch verstanden, auch wenn Sie noch nicht wissen, wie man das in der Praxis selbst umsetzt.