Challenge: Wikipedia-Artikel “Gewässer”

(Exkurse, Erwägungen und Einsichten zum vorliegenden Gewässer-Beispiel siehe auch Exkurse zu “Gewässer”.)

Der Diskurs um geeignete Darstellungsweisen in unserer Arbeitsgruppe ist eng mit verfügbaren Tools verknüpft. Wir denken uns eine Challenge aus.

Gegeben sei ein Gegenstandsbereich, der von Drittautoren bereits mehr oder weniger vorstrukturiert ist, z.B.

Aufgabe: Stellen Sie den Inhalt dieses Wikipedia-Artikels mit einem geeigneten Tool als Ontologie dar.

  • in einer “normalen”, d.h. nicht semantisch strukturierten Mindmap

  • mit einer formalen Begriffsanalyse (ggf. Tool Toskana?)

  • in Protegé als OWL-Ontolgie

  • als SKOS-Thesaurus

  • als SKOS-Taxonomie (experimentell)

Beurteilungskriterien:

  • Wie lange dauert es (Arbeitsschritte, Zeit in Minuten oder Stunden), bis 50 / 80 / 90% des Inhalts dargestellt sind? Hintergund:

    • Weil auch bei dieser Aufgabe vermutlich das Paretoprinzip gilt, sollten die ersten 50% leicht möglich sein.

    • Die Aufgabe wollen wir schon bei 80% als “im wesentlichen erfüllt” ansetzen.

    • Wir vermuten, dass es ein paar Klassen oder Beispiele gibt, die nicht gut passen: Die dokumentieren wir als “Problem”, lassen uns aber keine grauen Haare wachsen. Ob wir 90% Inhalt abdecken können ist also unklar.

  • Wie vollständig ist das 80%-Modell? (Beurteilung durch einen Ontologie-Experten)

  • Wie verständlich ist das 80%-Modell? (Beurteilung durch einen Domain-Experten mit Grundkenntnissen im Ontologiewesen)

Bei dieser Übung spielt natürlich die Tool-Beherrschung (z.B. Shortcuts des Mindmap-Tools) eine wesentliche Rolle. Wir gehen davon aus, dass die zugehörigen Tools faktisch zumindest vom Autor eines Wettbewerb-Beitrags weitgehend beherrscht werden, aber nicht unbedingt von allen anderen Teilnehmern beherrscht werden müssen.

Ergänzung 2020-12-17: Es geht nicht darum, einen engen Begriff des Gewässers zu modellieren, sondern tatsächlich darum, möglichst alle irgendwie relevanten Begriffe und Inhalte des o.A. Wikipedia-Artikels in eine Ontologie zu überführen.

  • Spannend wird das z.B. beim Gewässerbett, das selbst natürlich kein Gewässer, sehr wohl jedoch Teil der Meronomy von Gewässer ist.

  • Wir gehen dabei davon aus, dass die im Wikipedia-Artikel vorgegeben Taxonomie nicht optimal sein muss und ggf. noch verbessert werden kann.

Ergänzung 2020-12-18: Tatsächlich fehlt noch eine ganz wichtige Spec für die Challenge: Die sog. Ontologie-Kompetenzfragen. Implizit kennen wir die aus unserer Diskussion, sie sind aber noch nicht klar aufgeschrieben.

Beispielmodelle und -Visualisierungen

hochstrukturierer Text

Inhaltsverzeichnis und Aufbau des Wikipedia-Artikel “Gewässer”

Mindmap (“normal”, nicht semantisch strukturiert)

Illustrierende Übersicht aus dem Wikipedia-Artikel Gewässer, Abbildung “Klassifikation der Gewässer”, Autor unbekannt:

Abbildung "Klassifikation der Gewässer"

(Backlink: https://de.wikipedia.org/wiki/Gew%C3%A4sser#/media/Datei:Gewaesserdiagramm.png, Lizenz: CC BY-SA 3.0)

Formale Begriffsanalyse / formal concept analysis (FCA)

Der Wikipedia-Artikel Formale Begriffsanalyse > Beispiel zieht als Beispiel für einen formalen Kontext den Gegenstandsbereich Gewässer heran.

Im Wikipedia-Artikel schön zu sehen:

  • links: formaler Kontext als Tabelle, mit *Spaltenüberschriften = Merkmale, hier: temporär, fließend, natürlich, stehend, konstant, maritim

    • Zeilen = Gegenstände, hier: Bach, Fluss, Haff, Kanal, Lache, Pfuhl, Pfütze, Rinnsal, Strom, Maar, Meer, See, Teich, Tümpel, Weiher

  • rechts ein “Liniendiagramm entsprechend der Tabelle Gewässer auf der linken Seite”, nämlich die folgende Abbildung:

Liniendiagramm eines Begriffsverbands zu verschiedenen Gewässer-Arten. Erzeugt mit Hilfe von ToscanaJ

(Backlink: https://de.wikipedia.org/wiki/Formale_Begriffsanalyse#/media/Datei:FBA_Gew%C3%A4sser_2_30.svg, Lizenz: CC0)

OWL-Ontolgie “Gewässer” in Protegé

Diese interessante Aufgabe wird dem Leser zur Übung anheimgestellt ;-)

GenDifS-Mindmap

(Diese Mindmap folgt der Syntax von GenDifS 0.3 vom Jan 2021, und müsste noch in die derzeit aktuelle Syntax von GenDifS 0.5 übersetzt werden. Aber die Idee wird auch in der alten Syntax deutlich.)

Mindmap: