Exkurse zu “Gewässer”

Exkurse anlässlich des Gewässer-Beispiels Challenge: Wikipedia-Artikel “Gewässer”.

Gruppierungen

Um Dinge eines Gegenstandsbereichs begrifflich in Beziehung zu setzen ist es hilfreich, ihre Beschreibungen in verschiedene Gruppen einzuteilen. Obige Grammatik von Ding-Benenungen kann uns als Faustregel dabei unterstützen.

Vorgehen:

(1) Nehme eine eine (idealerweise gut strukturierte, notfalls auch nur glossar-artige) Darstellung zu den Dingen aus einem interessierenden Gegenstandsbereich (domain of interest).

(2) Extrahiere aus der zugrundegelegten Darstellung eine Menge von typischen Eigenschaften, durch die sich Dinge unterscheiden. Oft - aber bei weitem nicht immer - werden diese Eigenschaften sprachlich mit sogenannten Eigenschaftwörtern wiedergegeben:

  • grammatisch vor allem Adjektive: z.B. schnell, langsam

  • stellvertretend aber auch Verbformen, die als Eigenschaft auftreten können: z.B. fließend, stehend

  • dort, wo es kein natürlichsprachliches Eigenschaftswort gibt, notfalls auch grob konstruiert: z.B. süßwasser-artig, höhlen-artig, fijord-artig

(3) Untersuche, welche dieser typischen Eigenschaften zusammengehören, und gruppiere sie zu Eigenschaftsmengen

  • suche passende Benennungen für Eigenschaftsmengen: das sind dann unsere Facetten.

  • z.B. warmblütig, kaltblütig -> Temperament; weiß, rot, braun, schwarz -> Farbe; männlich, weiblich -> Geschlecht

(4) Differenziere die Elemente unserer Facetten:

  • Kann man sie in eine Ordnung bringen? z.B. weiß - hell - grau - schwarz; dauerhaft - gelegentlich - nie

  • Gibt es Antonyme? z.B. männlich vs. weiblich

All diese Schritte rekonstruieren ein intuitives sprachliches Vorverständnis und ordnen ein solches. Wir behalten im Auge, das dieses Vorverständnis für unsere Modellierung gleichermaßen hilfreich wie fehlleitend sein kann. Da eine Ontologie aber eine kommunizierbare Strukturierung einer immer auch sprachlich mitgeteilten Domäne sein soll ist es jedenfalls eine gute Strategie, sich des eingeführten Sprachgebrauchs zumindest dort, wo er verwendbar ist, auch zu bedienen.

Interessant an diesem Vorgehen ist die Gruppierung von Bezeichnern:

  • Eigenschaft

    • sprachlich: im allgemeinen durch Eigenschaftswörter mitgeteilt

    • mathematisch: Werte auf einer Achse im n-dimensionalen Merkmalsraum

    • Informatik: Attributwert; Pandas: –

  • Facette: eine Gruppe von zueinander in semantischer Beziehung stehenden Eigenschaften

    • sprachlich: (unklar)

    • mathematisch eine Dimension (Achse) im n-dimensionalen Merkmalsraum

    • Informatik: Attribut; Pandas: column

  • Einwort-Benennung von Dingen

    • sprachlich: im allgemeinen Hauptwörter, in DE auch Komposita (schwarzes, männliches Pferd = Rapphengst)

    • mathematisch ein Unterraum des Merkmalsraums

Die deutsche Seite Wikipedia > Gewässer

https://de.wikipedia.org/wiki/Gew%C3%A4sser

Facetten

Unsere Facetten sind Gruppen von Eigenschaften, mit denen sich Gewässer feiner unterscheiden lassen. Unser Wikipedia-Artikel enthält ca 15 Facetten mit insgesamt ca. 50 Eigenschaften:

  • Salzgehalt: salzwasser-artig, süßwasser-artig, brackwasser-artig

  • Lage des Wasserkörpers: über der Erde liegend, unterirdisch, quellen-artig, schwinden-artig

  • Stellung im Gewässersystem: binnen-artig, meeres-artig (hier konstruieren wir uns die fehlen Adjektive), festlandnah

  • Entstehungstyp: natürlich entstanden, künstlich

  • Strömungsverhalten: strömend, strömungsfrei, stehend

  • Zugänglichkeit: offen, geschlossen

  • Größe: sehr groß, groß, klein

  • Tiefe: tief, mäßig tief, flach

  • Entwässerung: exorheisch, endorheisch

  • Zirkulationstyp: amiktisch, meromiktisch, holomiktisch

  • Wasserführung im Zeitverlauf: perennierend, intermittierend, periodisch, episodisch, ephemer

  • Trophiestufe: oligotroph, mesotroph, eutroph, hypertroph

  • ökologischer Zustand: sehr gut, gut, mäßig, unbefriedigend, schlecht

  • Gewässerfarbe: dunkeltrüb, helltrüb, klar

  • Sättigung mit Wasser: phreatisch

  • Trennung vom Meer: Inselkette, Festland, Meeresschwelle, Meerenge

Man sieht leicht:

  • die einzelnen Attributwerte sind eindeutig einzelnen Attributen zuordenbar.

  • Attributwerte verschiedener Attribute lassen sich im Prinzip beliebig kombinieren.

Diese Eigenschaftsmengen aufzustellen (und geeignet zu visualisieren) ist eine der zentralen Aufgaben beim Erstellen einer GenDifS-Taxonomie.

Einwort-Benennungen

Einwort-Benennungen ungefähr in der Reihenfolge ihres Auftretens im Wikipedia-Artikel https://de.wikipedia.org/wiki/Gew%C3%A4sser:

Binnengewässer | Fließgewässer | Stillgewässer | Quelle | Schwinde | Vorfluter | Strom | Fluss | Bach | Gerinne | Kanal | Schifffahrtskanal | Stauhaltung | Schleusenstrom | Höhlenfluss | Kluftwasser | See | Stausee | Weiher | Teich | Tümpel | Pfütze | Höhlensee | Kaverne | Zisterne | Nebenmeer | Meer | Randmeer | Mittelmeer | Binnenmeer | Küstengewässer | Totwasser | Stillwasser | Druckstollen | Sickerströmung | Oberflächengewässer | Quelle | Hungerquelle | Brackwasser | Rückstaubereich | Vorfluter | Pfütze | Wadi | Rivier | Überlauf | Sumpfgebiet | Moorgebiet | Schmelzwassersee | Gieße | Klinge | Brack | Fleet | Wetterung | Grundwasser | Küstengewässer | Meeresgewässer | Straßenseitengraben | Bewässerungsgraben | Entwässerungsgraben | Heilquelle | Kalksee | Alpenabfluss | Schwarzwasserfluss | Weißwasserfluss | Klarwasserfluss (ca 60 Einwort-Benennungen)

Wir haben auch Einzelne namentlich genannte Gewässer als Beispiele, die jedoch im Folgenden nicht relevant sind:

Aubach (Wiehl) | Fehmbacher Weiher | „Märchendom“ in den Feengrotten | Müritz | Ilz | Donau | Inn | Passau | Amazonas | Rio Negro | Alaknanda | Bhagirathi | Ganges | Vorderrhein | Hinterrhein | Rio Solimões

Merkmals-Implikation

Es gibt Gegenstandsbereiche, in denen nicht jede Kombination von Merkmalsausprägungen (Facetten, Foci) möglich ist. So wird z.B. in der Praxis nur bei Binnengewässern, nicht jedoch bei Meeren zwischen Oberflächen- und unterirdischen Gewässern unterschieden. (Nur ein Logiker käme auf die Idee, ein Meer als Oberflächengewässer zu bezeichnen). Und auch nur für Binnengewässer kann sinnvoll angegeben werden, ob sie ins Meer (exorheisch) oder auf andere Art uns Weise (endorheisch) entwässern.

In solchen Fällen könnte man von einer Merkmals-Implikation sprechen: Wenn bekannt ist, dass bei einem Gewässer die Lage des Wasserkörpers oberirdisch ist, dann folgt daraus, dass dieses Gewässer ein Binnengewässer ist: Das Merkmal “oberirdisch” erzwingt das Merkmal “binnen-artig”.

  • (Eine Merkmals-Implikation ist gleichbedeutend mit einer Teilmengen-Beziehung der zugehörigen Extensionen der durch die Merkmale intensional beschriebenen Mengen.)

  • In einer GPDSCL-Klassifikation wird man Gewässer zuerst nach Meer- oder Binnengewässern, und nur Binnengewässer nach ober- oder unterirdischen Gewässern unterscheiden. Der wesentliche Schritt in der Konstruktion einer GPDSCL-Klassifikation besteht darin, solche Implikationen zu erkennen und geeignet zu modellieren.

In obigem Gewässer-Beispiel haben wir ca 50 Eigenschaften, die in ca 15 Facetten gruppiert sind. Wenn wir annehmen, dass jede Facette im Durchschnitt 3 Werte hat, sind in der Größenordnung 3^15 verschiedene Merkmals-Kombinationen möglich.

Wir verfügen aber lediglich über ca 60 Einwort-Bezeichner. Eine Durchsicht der Einwort-Bezeichner zeigt, dass es für einige wenige “x+1 Gewässer” entsprechende Einwortbezeichner gibt:

  • z.B. Gewässer, salzwasser-artig = Salzwasser; Gewässer, süßwasser-artig = Süßwasser; Gewässer, brackwasser-artig = Brackwasser

Die meisten Einwort-Bezeicher bezeichnen also Dinge, die sich durch mehr als eine einzelne Eigenschaft von anderen Dingen unterscheiden.

englische Wikipedia-Seite Body of Water

https://de.wikipedia.org/wiki/Gew%C3%A4sser -> In anderen Sprachen -> EN -> https://en.wikipedia.org/wiki/Body_of_water

Hier sind ca. 80 Einwort-Begriffe alphabetisch aufgeführt und normalsprachlich erklärt. Im Gegensatz zur DE-Seite ist hier so gut wie keine Vorstruktur erkennbar.

  • Tatsächlich handelt es sich hierbei um nicht mehr als ein Glossar.

  • Es wird einen deutlich größeren Aufwand kosten, hier eine Ordnung aufzubauen, die der Strukturiertheit des DE-Artikels entspricht.

  • Vermutlich ist diese Seite eine interessante Grundlage für eine FCA?

  • Interessant: Einige der normalsprachlichen Erklärungen nehmen Bezug auf andere Begriffe des Glossars. Können wir das für unsere Strukturierung nutzen?

Letzte Zeile!