AKWI 2022

Kernkonzepte der Taxonomiesprache GenDifS

Talk auf dem AKWI 2022 Berlin, Prof. Dr. Johannes Busse, HAW Landshut

Diese Seite: http://jbusse.de/gendifs/akwi2022.html

Die Sprache GenDifS

Schnitzel-Ontologie in GenDifS

Einen Gegenstandsbereich zu verstehen heißt zu verstehen, welche Unterscheidungen einen Unterschied machen.

GPDS-Pattern

SKOS Primer > 4.1 Collections of Concepts:

milk
  <milk by source animal>
    cow milk
    goat milk
    buffalo milk

GenDifS:

Semantik des GPDS-Patterns in OWL

Person
  BY has_health_status SOME health_value
    healthy_person
      SOME good_health_value

Formalisierung von BY SOME so, dass ein OWL-Reasoner damit etwas anfangen kann. Stand der Technik in OWL siehe W3C Working Group Note 17 May 2005: Representing Specified Values in OWL > Pattern 2: Values as subclasses partitioning a ‘feature’:

Diese Formalisierung kann aber in Protege auch von erfahrenen Ontologen nur sehr aufwändig, fehleranfällig und unübersichtlich notiert werden. GenDifS kompiliert jedes einzelne BY SOME in ein (sehr ähnliches) solches Pattern.

Erklärung der Semantik von BY SOME in OWL2 incl. ausführlicher Darstellung des OWL-RL-Inferencings am Bsp. Milch siehe Milch (DE) (http://jbusse.de/gendifs/x_milch_DE.html).

Keine Sprachelemente

GenDifS verzichtet auf alle Elemente mit expliziter oder impliziter Negation (Disjoint Classes, All Values From)

  • Inferencing-Komplexität bleibt überschaubar

  • keine Stratifikation (W) erforderlich

kein Domain und Range:

  • wird zu oft FALSCH als Integritäts-Bedingung verstanden,

  • ist aber eine Entailment-Regel

keine assoziative Relationen:

  • unklare Semantik (siehe “Problemfall REL”)

kein “All Values From”: Diskussion siehe Some and Only (SOMLY).

Sprachergänzung: SUP

SUP, Superclasses: extensionale Definition einer Menge durch die UND-Verknüfung mehrere Obermengen:

Unklare Semantik von REL

https://en.wikipedia.org/wiki/Semantic_network:

REL ist für die Wissensmodellierung kognitiv hoch relevant, hat aber oft eben keine klassifikatorische Funktion. Vorsicht unklare Semantik! Insbesondere die Angabe von Domain und Range für has oder lives_in wäre in obigem Beispiel nicht korrekt. Ausführliche Diskussion von REL siehe Die unklare Semantik von assoziativen Relationen.

Nebeneinander von OWL und SKOS

@prefix : <http://some.locati.on/ns/default#> . # OWL T-Box
@prefix cpt: <http://some.locati.on/ns/cpt#> . # concepts

:Kuh                           # OWL T-Box
   rdfs:subClassOf :Tier .
   
cpt:Kuh                        # SKOS Concepts
   rdf:type skos:Concept ;
      skos:broader cpt:Tier .

eingebauter Inferencing-Test

@prefix : <http://some.locati.on/ns/default#> . # OWL T-Box
@prefix ex: <http://some.locati.on/ns/ex#> . # OWL A-Box

ex:Milch_ID_571743754          # OWL Examples A-Box
   a :Milch ;
   :Milch_hat_Herkunft ex:Kuh_ID_571743754 ;
   gendifs:classifyLike ex:Kuhmilch_ID_571743754 .
ex:Kuhmilch_ID_571743754 a :Kuhmilch .
ex:Kuh_ID_571743754 a :Kuh .

typischer UseCase

Rekonstruktion und graphische Modellierung grundlegender Fachterminologie als Taxonomie, mit Unterstützung aller Phasen:

  • früh, explorativ, nicht notwendig konsistent

  • konsistent und semantisch wohldefiniert

  • Überarbeitung und Versionierung

GenDifS ist keine allgemeine Notation für allgemeine Ontologien, sondern eine domänenspezifische Sprache zur Notation von Klassifikationen: Die Sprach GenDifS will andere Notationen ergänzen, ohne in Konkurrenz zu treten, erhebt keinen umfassenden Vollständigkeitsanspruch:

  • Vollständigkeit ist kein Eval-Kriterium

  • Passung, Ergänzung, Komplementarität hingegen sehr wohl!

Grundbegriffe Semantic Web

Z.B. das Modul “Wissensrepräsentation”, hier auf Grundlage von Denny Vrandečić, Ontology Evaluation (Dissertation 2010), hier Chapter 2: Terminology. z.B. Originaltext S.25:

Visualisierte Grundbegriffe SemWeb in GenDifS

Statistik: 250 Knoten, darunter 100 Blattknoten

Ausführlicher: Denny Vrandecic: Ontology Evaluation

Was denotiert ein URI?

Die Grenze zwischen digitaler Welt und analoger Wirklichkeit: Semiotisches Dreieck trifft RDF. Hier geht es nun wirklich um Ontologie in anspruchsvollem philosophischem Sinn.

Ausführlicher und Diskusison: rdf11 Konzepte

DSR-Evaluation

Aus dem CfP des AKWI 2021:

Es wird erwartet, dass sich die wissenschaftlichen Beiträge an der folgenden Struktur orientieren:

  1. Motivation und Lösungsansatz

  2. Forschungsmethodik und Vorgehensweise

  3. Verwandte Ansätze (Related Resaerch)

  4. Ergebnisse und ggf. deren Anwendung

  5. Evaluierung und Diskussion der Ergebnisse und des Vorgehens.

Teilartefakte:

  • Modellierungsmethode (bisher nicht weiter ausgearbeitet)

  • primär die Sprache: Sprachkern (hier GPDS-Pattern, SUP) + Ergänzungen

  • sekundär: die Sprache im Kontext von konkreter Syntax, Editor, Entwicklungsumgebung, Methode etc.

  • Compiler-Implementierung (bisher quick and dirty)

Interesse aus praxisbezogener Modellierungs-Sicht:

  • Wie adäquat gibt das Modell die Domäne wieder?

  • Vorgehen: Erzeuge eine Reihe von Mikro-Beispielen und diskutiere die zugehörige Modellierung: Siehe Website, Abschnitt Examples.

Interesse aus philosophischer Sicht:

  • Gelingt es GenDifS, auch frühe Übergänge von der rein sprachlichen zur ersten formalen Repräsentation zu unterstützen?

  • Vorgehen: Analytische Philosophie, siehe Übergänge vom Wort zum Begriff.

Eval einer Sprache

As a result […] a theory of design in information systems, of necessity, is in a constant state of scientific revolution (Kuhn 1996). Technological advances are the result of innovative, creative design science processes. If not capricious, they are at least arbitrary (Brooks 1987) with respect to business needs and existing knowledge.

Innovations, such as […] high-level languages […], have had dramatic and at times unintended impacts on the way in which information systems are conceived, designed, implemented, and managed. (Hevner et al: Design Science in Information Systems Research. MIS Quarterly Vol. 28 No. 1, pp. 75-105/March 2004, p.79-81; dieser Textauszug online: http://jbusse.de/Hevner-fp6-fp13/fp13.html)

Wie kann man eine Sprache Evaluieren? Aussagen über Sprachen:

  • “In jeder Programmiersprache gibt es neue gedankliche Knoten zu lösen” (Prof. Werner Zorn, ca. 1986)

  • “Die Grenzen meiner Sprache bedeuten die Grenzen meiner Welt” (Wittgenstein, Traktatus)

  • “Man erblickt nur, was man schon weiß und versteht” (Goethe)

Sprache muss unterstützen (Schwierigkeit zunehmend):

  • neue Dinge zu sehen

  • alte Dinge neu zu sehen

  • Neues zu denken

Indikatoren

  • Aha-Effeke

  • Fremdheitserfahrung

  • konzisere, treffendere, schönere, differenziertere Formulierungen

Neue Ontologiesprache -> neue philosophische Ontologie? Nicht unbedingt. Aber wenn GenDifS Unterscheidungen klarer zu unterscheiden ermöglicht, sind wir vollauf zufrieden.

Danke für Ihre Aufmerksamkeit.