Ebenen von Ontologien

Das sog. “Semantic Web” modelliert einen Gegenstandsbereich durch die Definition und Vernetzung von Begriffen; es entsteht ist im Wortsinn ein weltweit verknüpftes semantisches Netz. Die Knoten (Begriffe, Inhalts-Bausteine) und Kanten (Links, Relationen) dieses Netzes sind mit Etiketten versehen, die die Bedeutung - die Semantik - der Teilnetze und ihren Inhalten einheitlich definieren.

Die folgende Abbildung (Copyright ©2005 W3C® (MIT, ERCIM, Keio), from http://www.w3.org/TR/swbp-classes-as-values/ ) zeigt ein solches Teilnetz exemplarisch:

www.w3.org_TR_swbp-classes-as-values_fig1.jpg

Im Spiel sind hier vier z.T. quer zueinander stehende Ebenen:

  • Auf Sach-Ebene werden die Dinge selbst beschrieben und in Beziehung zueinander gesetzt.

    • Im obigen Beisiel wird das Objekt Lions: Life in the Pride mit dem Objekt Lion mittels der Relation cd:subject in Beziehung gesetzt.

    • schriftlich-grafisch werden im obigen Beispiel die Dinge selbst durch gelbe Rechtecke wiedergegeben.

  • Auf der Metaebene werden Klassen und Beziehungs-typen definiert. Die Metaebene gibt vor, welche Verknüpfungen auf der Sachebene strukturell angemessen oder erlaubt sind, oder was sich aus Verknüpfungen auf der Sachebene schlussfolgern lässt.

    • Im obigen Beispiel werden z.B. Lion oder Book als Klassen definiert.

    • schriftlich-grafisch werden im obigen Beispiel Klassen durch blaue Ellipsen wiedergegeben.

  • Auf der Meta-Metaebene wird diskutiert, welche Strukturen der Metaebene zugrundeliegen.

    • In unserem Beispiel gibt es offensichtlich Klassen, Instanzen und Reationen.

Semantik vs. Syntax

Das Semantic Web zeichnet sich dadurch aus, dass nicht die Syntax (das Format) von Inhalten, sondern die Semantik (die Bedeutung) von Inhalten vernetzt wird.

Eine Syntax, d.h. ein Datei-Format gibt an, in welcher Form Daten abgelegt sind und wie sie gelesen werden können. Eine Syntax entspricht der Rechtschreibung eines Satzes.

  • Beispiel: Der Satz Das Buch ‘Löwen im Rudel’ handelt von Löwen ist syntaktisch korrekt, es folgt der Satzstruktur Subjekt-Phrase > Prädikat > Objekt-Phrase.

  • Bekannte Text-Formate sind z.B. Office, plaintext, XML

  • Einschlägige Daten-Formate aus dem Semantic Web sind z.B. RDF/XML, Turtle, RDF striped, RDFa, OWL/XML, OWL Manchester Syntax uns einige mehr.

Eine Semantik gibt – ergänzend zur Syntax – Auskunft über die Bedeutung von Daten. Die Datenhaltung dazu ist in vielen Dateiformaten möglich und im Prinzip unabhängig von bestimmten Datei-Formaten. Deshab ist es auch möglich – und nötig – nahzu beliebige Datenformate in eine einheitliche Bedeutungs-Schicht zu überführen. (Man nennt dies dann semantische Datenintegration. )

  • Beispiel: Der Satz Das Buch ‘Löwen im Rudel’ handelt von Löwen ist semantisch korrekt: Beide in ihm enthaltenen Aussagen ‘Löwen im Rudel’ ist ein Buch und ‘Löwen im Rudel’ beschreibt das Leben von Löwen treffen zu.

  • Einschlägige Sprachen, um eine Semantik zu definieren, sind z.B. Web Ontology Language (OWL), Frame Logik oder Rich Description Framework (RDF).

Zwar lässt sich das Verhältnis von Syntax und Semantik in einem Ebenenmodell beschreiben. Dies wird sowohl im Semantic Web Stack W wie auch in der Sprachlehre als das Verhältnis von Syntax, Semantik und Pragmatik behandelt.

Für die Erkundung verschiedener Ebenen von Ontologien hilft uns diese Unterscheidung jedoch nicht weiter; sie wurde hier nur aufgezeigt, um Verwechslungen zu vermeiden.

Sachebene und Metaebene: Aussagen und ihre Terminologie

Die Sachebene stellt die eigentliche Faktenbasis dar. Sie wird bisweilen auch Aussagen-Ebene (box of assertions) genannt. Sie wird hauptsächlich vom End-User und Domänen-Experten erstellt In unserem Beispiel ist die Sachebene textuell gegeben durch Begriffe wie “Lion”, “African Lion” oder Relationen wie “dc:subject” oder “rdf:type”.

Die Meta-Ebene – man spricht hier bisweilen auch von der Terminologie (terminology box) – entwickelt das Begriffs-System, das für die Etikettierung (hauptsächlich der Kanten) des Netzes verwendet wird In unserem Beispiel gehört das Kanten-Etikett “rdfs:subclassOf” zur Metaebene: Hier wird zum Beispiel ausgedrückt, dass jedes Element der Klasse “Lion” automatisch auch ein Element der Klasse “Animal” ist. Es entsteht eine sogenannte “Klassifikation”.

Kanten der mit der Etikettierung “rdf:type” verbinden die Aussagen-Ebene mit der Terminologie-Ebene. In unserem Beispiel wird ausgedrückt, dass das Objekt “The African Lion” ein Element der Klasse “Book” ist. das Verfahren, eine solche Klassenmitgliedschaft festzustellen, wird “Klassierung” oder “Prädikation” genannt.

Wie schon in der aristotelischen Logik ist es durchaus möglich, dasselbe Ding gleichzeitig verschiedenen Klassen zuzuordnen. In der Praxis des Knowledge Engineerings ist dies sogar der Normalfall: Fast nie lässt sich die Terminologie eines Gegenstandsbereichs als ein Baum von Begriffen rekonstruieren. Meist entsteht ein Netz (eine sog. Polyhierarchie) von Begriffen.

Oft werden die vielen Begriffe einer Terminologie noch in Ebenen zunehmender Allgemeinheit geordnet:

Es entstehen Schichten von Terminologien. Aus der hier entwickelten systematischen Sicht handelt es sich hierbei um eine interne Partitionierung von Begriffsmengen, jedoch nicht um Meta-Ebenen in eigentlichem Sinn.

Eine Übersicht über verschiedne upper level Ontolgien gibt http://en.wikipedia.org/wiki/Upper_ontology_%28information_science%29

Meta-Metaebene: Ontologiesprachen

Die Ontologie-Sprache gibt implizit die Codierung vor, mit der sich Begriffssysteme definieren und ineinander übersetzen lassen. In unserem Beispiel werden die Möglichkeiten der Codierung durch die grafischen Modellierungs-Primitive gegeben, wie z.B. “Klasse” (ovaler Knoten), “Instanz” (rechteckiger Knoten) oder “Eigenschaft” (gerichtete beschriftete Kante mit einfachem Pfeil)

Die formale Semantik einer Ontologiesprache zu klären ist Spezialistenarbeit. Ein elegantes Verfahren ist die Übersetzung einer abstrakteren Ontologiesprache in eine andere Ontologiesprache, deren Semantik bereits geklärt ist. Auch hier ensteht eine Schichtung von Ontologiesprachen. Als unterste Schicht – gewissermaßen die formale Basis – wird wird meist die Prädikatenlogik der ersten Stufe herangezogen. Meta-Meta-Metaebene: Hintergrundannahmen einer Ontologiesprache

Für uns interessant ist die Einsicht, dass auch eine Ontologiesprache eine zwar nur schriftliche, aber dennoch eine Sprache in eigentlichem Sinn ist. Als Sprache gibt sie vor, was gesagt werden kann, prägt den Modellen – und sogar unserer Weltsicht? – ihre impliziten Strukturen auf.

Diese Strukturen selbst aufzudecken und zu beschreiben – und nach Laune auch teilweise formal zu modellieren – gehört zur gehobenen Methodenlehre des Ontology Engineerings.

Auf dieser Meta-Meta-Meta-Ebene werden dann Begriffe wie “open resp. closed world assumption”, “class vs. frame” oder “entity attribute value views” diskutiert.

Es ist diese Ebene, auf der Ontology Engineering in philosophischem Sinn ontologisch relevant wird – und zwar gerade auch für die Praxis: Ein Knowledge Engineer würde einen schweren Fehler begehen, die hiermit verbundenen philosophischen Konzepte nicht zu kennen oder feine Unterschiede zwischen den verschiedenenen Sprachen zu übersehen.

In der Praxis kann ein Knowledge Engineer Formalisierungen weder bauen noch kommunizieren – und schon gar nicht einem Wissensarbeiter ihre Bedeutung aufzeigen – wenn er nicht die konzeptuellen (sic!) Grundlagen seiner Modelle erklären und ihre Schranken aufzeigen kann.