# Präsentation 2023-03-03 * Terminologie und Ontologie: WordNet trifft SKOS * Prof. Dr. Johannes Busse, HAW Landshut * Freitag, 3. März 2023, 11:30 – 12:00 Über diese Präsentation: * online: [jbusse.de/dtt2023](http://jbusse.de/dtt2023/index.html) -> [Präsentation 2023-03-03](http://jbusse.de/dtt2023/praesentation.html) * kein ppt, sondern eine statische html-Website, konsistent verlinkt * Cross-Media publishing * Aufsatz und Präsentation nicht als Senke, sondern offener Quelltext in Markdown: * Technik: * weiterführende Inhalte: {doc}`ergaenzungen` ## Zusammenfassung ```{figure} ../images/Guarino_2006_Figure_4_The_ontological_precision.jpg --- width: 100% name: fig-ontological-precision_2 --- TBD ``` Quelle: {term}`Guarino 2006`, entnommen aus {term}`ISKO Biagetti 2021` > Controlled vocabularies solve the problems of homographs, synonyms and polysemes by a bijection between concepts and preferred terms. Man sieht hier waagrecht: **Verfeinerung einer Tennis-Terminologie** * Catalog: Liste von Wörtern * Glossar: ... mit normalsprachlichen Definitionen; 1:1 - Entsprechung zwischen Term und Konzept * Taxonomie: ... UNKLAR, Thematisierung später * Thesaurus: Konzepte stehen im Fokus, hierarchische und semantische Relationen, SKOS * Datenbank-, objektorientiertes Schema * axiomatische Theorie = Ontologie = formale Logik! Auch denkbar: **Wechsel der Ebenen:** * Thesaurus beschreibt Gegenstands-Konzepte, wie hier *Tennis* oder im folgenden *Schnitzel* * Ontologie beschreibt die Thesaurus-Konzepte wie `NT` oder `RT`, die die Gegenstands-Konzepte ordnen. In dieser Abbildung nicht enthalten: WordNet (s.u.) ## Einführendes Beispiel ``` prefix cpt: cpt:Schnitzel "escalope"@en "cutlet"@en "шни́цель"@ru cpt:Schweineschnitzel "pork cutlet"@en "свино́й шни́цель"@ru cpt:Kalbschnitzel "veal cutlet"@en cpt:Kinderschnitzel ``` Hier zeigen: * informelle Notation, kann z.B. auch in einer Mindmap gepflegt werden * Selbstwahrnehmung: Angst vor Notation? Unnötig! Präfix `cpt:`: * Kürzel für `http://jbusse.de/dtt2023/cpt.html#term-` * Ersetzung: aus `cpt:Schnitzel` wird . **TBL Linked Data Principles** > * Use URIs as names for things > * Use HTTP URIs so that people can look up those names. > * When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL) > * Include links to other URIs. so that they can discover more things. > > Quelle: Tim Berners-Lee, ## SKOS ```{figure} ../images/WD-swbp-skos-core-guide-20051102_img_ex-ukat.png --- width: 100% --- 'Economic cooperation'', aus {term}`SKOS Core Guide (2005)` ``` hier auch RDF erklären: * hier violette runde Knoten: {term}`Resources ` * hier weiße rechteckige Knoten: {term}`Literale ` - und zwar hier Zeichenketten (Strings) * Pfeile: Object- und Data-Properties * skos:narrower, skos:broader: kennen wir aus dem Thesaurus * skos:prefLabel, skos:altLabel: zeigen auf Benennungen, Terme ```{figure} ../images/WD-swbp-skos-core-guide-20051102_img_ex-concept.png --- width: 100% --- ex:love rdf:type skos:Concept ``` Quelle: Notieren kann man das in der Sprache *Turtle* (*.ttl) als ein *Tripel*: ``` ex:love rdf:type skos:Concept . ``` ## Die Struktur von SKOS ``` ## Klassen der Ontologie SKOS, TBox skos:Concept rdf:type owl:Class . skos:Collection rdf:type owl:Class . skos:ConceptScheme rdf:type owl:Class . ## Exemplare eines Knowledge Graphs, ABox ex:Schnitzel rdf:type skos:Concept . ``` Immer dann, wenn `x BT y` zutrifft, trifft automatisch auch `y NT x` zu: ``` skos:broader rdf:type owl:ObjectProperty ; owl:inverseOf skos:narrower . skos:narrower rdf:type owl:ObjectProperty ; owl:inverseOf skos:broader. ``` Definition der Properties, mit denen man Benennungen definieren kann: ``` skos:prefLabel rdf:type owl:AnnotationProperty rdfs:domain skos:Concept ; skos:altLabel rdf:type owl:AnnotationProperty rdfs:domain skos:Concept ; ``` VORISCHT vor Domain und Range: sehr spezielle Semantik! ``` skos:broader rdfs:domain skos:Concept ; rdfs:range skos:Concept . ``` Mehr: {doc}`e_skos` ## WordNet ```{figure} ../images/ShellTankeSeckenheimerStrMA.png --- width: 100% --- ``` > "Our gas station around the corner is open seven days a week, day and night." ```{figure} ../images/WordNet31_day1234.png --- width: 100% name: wordnet-day1234_2 --- WordNet > day {15180180} S: (n) day#1, twenty-four hours#1, twenty-four hour period#1, 24-hour interval#1, solar day#1, mean solar day#1 (time for Earth to make a complete rotation on its axis) ... ``` Quelle: {term}`Princeton WordNet` -> [Use Wordnet Online > "day"](http://wordnetweb.princeton.edu/perl/webwn?s=day&sub=Search+WordNet&o2=&o0=1&o8=1&o1=1&o7=1&o5=&o9=&o6=&o3=1&o4=&h=000100000000000) **Synset** > The core concept in WordNet is the synset. A synset groups words with a synonymous meaning, such as {car, auto, automobile, machine, motorcar}. Another sense of the word "car" is recorded in the synset {car, railcar, railway car, railroad car}. Although both synsets contain the word "car", they are different entities in WordNet because they have a different meaning. * Synonym, Antonym: besteht zwischen Word Senses * Hypernym (Oberbegriff, {term}`skos:broader`): besteht zwischen Synsets (!) ( -> "Figure 1. The class hierarchy of the WordNet schema"). * normalsprachliche Erklärung: auch hier auf Synset-Ebene! Mehr: {doc}`e_wordnet` ## OntoLex Lemon ```{figure} ../images/Lemon_OntoLex_Core.png --- width: 100% name: fig-ontolex-lemon_2 --- OntoLex Lemon ``` Quelle: Mehr: {doc}`e_ontolex-lemon` (was-ist-eine-ontologie)= ## Was ist eine Ontologie? {term}`Gruber 1995` (Hervorhebungen JB): > An ontology is an explicit specification of a conceptualization. > definitions associate the names of entities in the universe of discourse \[...\] with > * human-readable text describing what the names mean, and > * formal axioms that constrain the interpretation and well-formed use of these terms. > Formally, an ontology is the statement of a logical theory. {term}`Gruber 2008`: > Ontologies are typically specified in languages that allow abstraction away from data structures and implementation strategies; in practice, the languages of ontologies are closer in expressive power to first-order logic than languages used to model databases. Mehr: ## Ergebnisse * SKOS ist eine Ontologie * die mit SKOS erzeugte Struktur ist ein Thesaurus, aber keine Ontologie **subjektive Einschätzung JB** * Ontologien sind *rocket science*. * Einstieg in Terminologie und Ontologie: SKOS ist meistens ausreichend. * WordNet ist anders, als man denkt: Hineindenken lohnt sich! xxx