Lessons#
Einzelne Unterrichts-Sitzungen, von Studierenden durchgeführt; vorwiegend konservativ als Seminarvortrag; Note aufgrund der schriftlichen Ausarbeitung.
Worum geht es, was sind LOD? Kontextwissen, Einführungstexte:
[Pet23] https://www.researchgate.net/publication/372019855_Linked_Open_Data_Zukunftsweisende_Strategien
[CParejaLora20] https://www.researchgate.net/publication/340549953_Open_Data-Linked_Data-Linked_Open_Data-Linguistic_Linked_Open_Data_LLOD_A_General_Introduction
Bücher, in denen man erst mal nachschauen kann:
cimiano2020: [CCMG20b] bzgl. Linguistik tiefgehend, für viele andere Themen eine kurze Einführung aus Vogelperspektive
swwo2020: [AHG20]: bzgl RDF + semantischer Modellierung tiefgehend
Lesson Linked Data#
(ggf. WIF, nicht KI)
JB 2024-04-26: Thema wurde von JB schon intensiver behandelt; ggf. erwitern / zusammenlegen mit Lesson Linked Open Government Data?
Was ist mit Linked Data gemeint?
zum Einlesen ggf. Kapitel [SWWO: Linked data] https://doi.org/ > 10.1145/3382097.3382103
insbesondere TBL, das Dokument mit der Tasse: https://www.w3.org/DesignIssues/LinkedData.html
Hint
https://www.w3.org/DesignIssues/LinkedData.html expectations of behavior:
Use URIs as names for things.
Use HTTP URIs so that people can look up those names.
When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL).
Include links to other URIs, so that they can discover more things.
Es gibt ein Machtwort von TBL zum http-range-14
Problem Lesson http range 14: Hier schon Zusammenhang herstellen.
Datenbank über LOD Schaemata:
Interessant wäre:
Wie kommen diese Abbildungen zustande, was bedeuten die Kanten?
Wie können wir diese Quellen nutzen?
Weitere Literatur vielleicht doch nicht, weil zu speziell / zu technisch:
[CNAraujoF+24] https://www.researchgate.net/publication/377651479_Linked_data_to_streaming_data_sensors_sources_for_direct_access
cimiano2020, Chapter 9: Converting Language Resources into Linked Data. [CCMG20a]
Lesson Linked Open Government Data#
(ggf. WIF nicht KI)
[QA24] https://www.researchgate.net/publication/378970862_Linked_Open_Government_Data_Still_a_Viable_Option_for_Sharing_and_Integrating_Public_Data
[PC23] https://www.researchgate.net/publication/373939304_Linking_of_the_2021_Census_to_massive_linked_administrative_data_to_understand_coverage_and_quality
[MP22] https://www.researchgate.net/publication/369259162_Institutional_Repositories_in_the_Linked_Open_Data_Cloud
wichtiges Thema: https://www.govdata.de/neues/-/blogs/hochwertige-datensatze … Durchführungsverordnung …
Lesson http range 14#
Problem, Diskussion, Lösung ausführlich darstellen. Einstiegs-Literatur siehe HTTPRange-14
Dublin Core#
Lesson Wikidata and DBpedia#
https://doi.org/10.1007/978-3-319-74497-1_14 Abián, D., Guerra, F., Martínez-Romanos, J., Trillo-Lado, R. (2018). Wikidata and DBpedia: A Comparative Study. https://www.researchgate.net/publication/322999234_Wikidata_and_DBpedia_A_Comparative_Study
[LIJ+15] https://www.researchgate.net/publication/259828897_DBpedia_-_A_Large-scale_Multilingual_Knowledge_Base_Extracted_from_Wikipedia
Lesson SKOS#
JB 2024-04-26: https://www.jbusse.de/dtt2023/e_skos.html
JB 2024-04-26: SKOS Begriffe sind Instanzen, keine Klassen! z.B. Personen, Dokumente, Begriffe (PDK): https://www.jbusse.de/semauth/pdkSandboxOntologies.html#ID_1976288145
2024-04-26: Visualisierung JB des SKOS-Schema: https://www.jbusse.de/semauth/smmm2013_ anwendung_schema-visualisierung.html
Bibliographie:
Grundlagen:
https://dini-ag-kim.github.io/skos-einfuehrung/ (auf github: dini-ag-kim/skos-einfuehrung)
swwo2020, Chapter SKOS—managing vocabularies with RDFS-Plus https://doi.org 10.1145/3382097.3382109
Lesson Wordnet#
JB 2024-04-26: https://www.jbusse.de/dtt2023/e_wordnet.html
diskutieren u.a.:
Beispiel online: “day”
Synset
Datenschema
Wordnet per API anfragen
Bibliographie:
dann auch Babelnet hinzunehmen, oder extra Sitzung?
Bibliographie:
[NBC+21]
cimiano2020-Chap12-ApplyingLinkedData2020
andere abgeleitete große Knowledge Graphs:
Lesson Ontolex Lemon#
JB 2024-04-26: Text siehe https://www.jbusse.de/dtt2023/e_ontolex-lemon.html, insbesondere die
Literatur:
(eine) Original-Publikation (von mehreren): cimiano2020, “Chapter 4: Modelling Lexical Resources as Linked Data” [CCMG20c]
Online:
[DSG19] (https://www.researchgate.net/publication/335464807_OntoLex-Lemon_as_a_Possible_Bridge_between_WordNets_and_Full_Lexical_Descriptions)
Anwendung: [Abg20] https://www.researchgate.net/publication/342391981_Using_Ontolex-Lemon_for_Representing_and_Interlinking_Lexicographic_Collections_of_Bavarian_Dialects
mehr ggf. auch https://www.jbusse.de/dtt2023/e_ontolex-lemon.html
DCAT-AP dot de#
JB 2024-04-26: Die Hauptklassen von https://www.w3.org/TR/vocab-dcat-3/
Vorsicht vor Abbildung: https://www.w3.org/TR/vocab-dcat-3/images/dcat-all-attributes.svg : Hier wird Vererbung suggeriert. Gibt es aber nicht in RDF(S): Semantik? Diskussion von “Vererbung” siehe Exkurs: Ontologie vs. OO
insbesondere die Klassen dcat:catalog und dcat:dataset
Literatur:
https://www.w3.org/TR/vocab-dcat-3/ (ersetzt https://www.w3.org/TR/vocab-dcat-2/)
[ABC+23] https://www.researchgate.net/publication/376659718_The_W3C_Data_Catalog_Vocabulary_Version_2_Rationale_Design_Principles_and_Uptake
[WKJ+23] https://www.researchgate.net/publication/373254543_An_Extensive_Methodology_and_Framework_for_Quality_Assessment_of_DCAT-AP_Datasets
[NRC+23] https://bibaccess.fh-landshut.de:2673/content/pdf/10.1007/978-3-031-41138-0_14?pdf=chapter toc
noch mehr Literatur:
Dataset Exchange Use Cases and Requirements. W3C Working Group Note 17 January 2019. https://www.w3.org/TR/dcat-ucr/
Data on the Web Best Practices: Data Quality Vocabulary. W3C Working Group Note 15 December 2016 https://www.w3.org/TR/vocab-dqv/
[Fra21] Vom Datenkatalog zum Wissensgraph — Forschungsdaten im konzeptuellen Modell von FRBR https://epub.uni-regensburg.de/44952/
DCAT in Bezug auf WEMI:
Data described in a catalog can come in many formats, ranging from spreadsheets, through XML and RDF to various specialized formats. DCAT does not make any assumptions about these serialization formats of the datasets but it does distinguish between the abstract dataset and its different manifestations or distributions. (https://www.w3.org/TR/vocab-dcat-2/#introduction)
The original Recommendation [VOCAB-DCAT-1] published in January 2014 provided the basic framework for describing datasets. It made an important distinction between a dataset as an abstract idea and a distribution as a manifestation of the dataset. (https://www.w3.org/TR/vocab-dcat-3/#motivation)
the base specification of DCAT at W3C only considers relationships between a catalogue and the datasets described in the catalogue, and between a dataset and the distributions that represent the manifestations of the dataset. (https://joinup.ec.europa.eu/release/dcat-ap-how-model-dataset-series)
Lesson RDFS#
Anknüpfen an RDF (Inhalte siehe Lesson RDF 1.2 im Detail) … dann das “S” erklären in RDFS
legacy aus 2024, aber für unsere Zwecke geeigneter, weil stabil: https://www.w3.org/TR/rdf11-schema/
[AHG20], Chapter RDF Schema https://dl.acm.org/doi/10.1145/3382097.3382106
aktuell in Arbeit ist RDFS 1.2 https://www.w3.org/TR/rdf12-schema/
Grundlegende Konzepte#
RDF Schema 1.1, W3C Recommendation 25 February 2014, https://www.w3.org/TR/rdf11-schema/
https://www.w3.org/TR/rdf11-schema/#ch_classes, insbesondere
Intension (Vorsicht: nicht Intention)), extension (Frege Abendstern)
Klasse als Instanz der eigenen Extension? Barbier-Paradox
https://www.w3.org/TR/rdf11-schema/#ch_properties, insbesondere
basic facilities
subProperty
rdfs:range, rdfs:domain
Entailment, logische Ableitung, ausmaterialisieren, implizites Wissen explizit machen:
RDF 1.1 Semantics, W3C Recommendation 25 February 2014, https://www.w3.org/TR/rdf11-mt/
9.2.1 Patterns of RDFS entailment (Informative) https://www.w3.org/TR/rdf11-mt/#patterns-of-rdfs-entailment-informative
RDF 1.1 Turtle, Terse RDF Triple Language. W3C Recommendation 25 February 2014 https://www.w3.org/TR/turtle/
Lesson RDFS plus#
Grundlagen:
[AHG20], Chapter RDFS plus https://dl.acm.org/doi/10.1145/3382097.3382107
[AHG20], Chapter Using RDFS-Plus in the wild https://dl.acm.org/doi/10.1145/3382097.3382108, vor allem bezogen auf Linked Open Government Data, z.B. data.gov, aber vor allem auch BRD und Europa
Lesson Named Graphs#
[THylandWood20] https://www.researchgate.net/publication/338379947_RDF_11_Knowledge_Representation_and_Data_Integration_Language_for_the_Web
[RSE22] https://www.researchgate.net/publication/365352358_Easy_and_Complex_New_Perspectives_for_Metadata_Modeling_Using_RDF-Star_and_Named_Graphs
[Sil15] https://www.researchgate.net/publication/270897734_A_Methodology_for_Citing_Linked_Open_Data_Subsets
Lesson SPARQL#
Grundlagen:
swwo2020, Chapter Querying the Semantic Web—SPARQL https://doi.org 10.1145/3382097.3382104
SHAQL#
Grundlagen:
swwo2020, Chapter Extending RDF: RDFS and SCHACL https://doi.org 10.1145/3382097.3382105
Studienprojekt#
[BEBB+18] https://www.researchgate.net/publication/319327893_RDF_Dataset_Profiling_-_a_Survey_of_Features_Methods_Vocabularies_and_Applications
[VetroCT+16] https://www.researchgate.net/publication/295394863_Open_data_quality_measurement_framework_Definition_and_application_to_Open_Government_Data
[MSBP15] https://www.researchgate.net/publication/283633191_Towards_automatic_topical_classification_of_LOD_datasets
https://bibaccess.fh-landshut.de:2673/content/pdf/10.1007/978-3-031-41138-0_15?pdf=chapter toc
Unterrichte#
Dieser Abschnitt: Lessons, die von JB vorbereitet wurden
Lesson FRBR#
F wie Funktional#
Das Framework FRBR ist entstanden aus einer gleichnamigen Studie [IFLAStudyGroup06]
Studie 2006
Lernziel: Kennenlernen von Fragestellung, Vorgehensweise der FRBR-Studie von 2006 (online: https://www.ifla.org/wp-content/uploads/2019/05/assets/cataloguing/frbr/frbr-deutsch.pdf).
Bitte im Text lokalisieren, nachverfolgen:
Ziel der Studie:
Ziel ist es, einen klar definierten, strukturierten Rahmen zur Verfügung zu stellen, um die in bibliografischen Datensätzen verzeichneten Daten mit den Bedürfnissen der Benutzer dieser Datensätze in Verbindung zu setzen. (ebd, S.7)
Vorgehensweise:
Für diese Studie wurden die Merkmale auf einer logischen Ebene definiert. Das heißt, die Merkmale werden bezüglich der Eigenschaften der Entitäten ausgedrückt, so wie ein Benutzer sie betrachten würde, und nicht als spezifische Datenelemente, wie sie von Katologisierern beschrieben würden. (S.30)
Welches Typ von Modell wurde in der Ergebnissicherung verwendet? Wie „funktioniert“ dieser Modelltyp? Spielt dieser Typ von Modell heute noch eine Rolle?
Abschnitte:
Kap 1.2. Ansatz
Kap 2. Ziele, Umfang und Methodik
Kap 3. Entitäten
3.1. Übersicht
3.2.1 bis 3.2.4: WEMI
4.1 Merkmale von Entitäten
weitere Literatur:
Weiterentwicklung
Welche wichtigsten Weiterentwicklungen nach 2006 gibt es?
Status heute: : Integration mit CIDOC-CRM
Wichtiger Meilenstein:
Editors: Chryssoula Bekiari, Martin Doerr, Patrick Le Bœuf, Pat Riva; Contributors: Trond Aalberg, Jérôme Barthélémy, Chryssoula Bekiari: FRBRoo v. 3.0: FRBR object-oriented definition and mapping from FRBRER, FRAD and FRSAD.
Vorgängerversion: Version 2.4, November 2015, https://www.ifla.org/wp-content/uploads/2019/05/assets/cataloguing/FRBRoo/frbroo_v_2.4.pdf
aktuelle Version 3.0: https://www.cidoc-crm.org/frbroo/ModelVersion/frbroo-v.-3.0 -> https://www.cidoc-crm.org/frbroo/sites/default/files/FRBRoo_V3.0.pdf
interessant hier:
The Manifestation entity was defined in FRBRER in such a way that its definition could be interpreted as covering something physical and conceptual at the same time: it was defined in turn as the “physical embodiment” of an expression of a work and as an entity that represents all the physical objects that bear the same characteristics. Discussion with members of the original FRBR Study Group [ footnote 8: Tom Delsey and Beth Dulabahn participated in the Working Group’s first meeting in Paris in 2003. ] showed that the Manifestation entity was actually meant as an entity all instances of which are sets; and sets, in the mathematical sense of the term, can have more than one member, or just one member (in which case they are called singletons). (1.2.2. Refinement of Group 1 Entities, S.16f, Herv. im Original)
Werk vs. Expression#
Lernziele:
kennenlernen des Begriffs Werk (auch im Unterschied zur Expression) aus FRBR
Quellen:
IFLA LRM https://www.isko.org/cyclo/lrm
aktuell: https://sta.dnb.de/doc/RDA
Auftrag: Recherchieren Sie den Ursprung und ggf. Versionen der folgenden Abblildung (Quelle hier: https://www.isko.org/cyclo/work):
Auftrag:
Erläutern Sie und geben Sie Beispiele für den Unterschied zweichen “same work, new expression” und “new work”
Entwicklen Sie Faustregeln, anhand derer wir feststellen können , „wie unterschiedlich“ zwei Werke sind?
Woher stammt die obige Abbildung, wer ist die Autorin?
Wie werden Work und Expression im Modell FRBRoo definiert? Welche Erweiterung(en) liefert dieses Modell?
Wie werden Work und Expression definiert im Library Reference Model (LRM) von 2017?
Expression, Manifestation, Item#
Unterschied Expression, Manifestation, Item
Quellen:
konventionell in FRBR: F2 Expression und F3 Manifestation Product Type
WEMI in FRBR 2006 kurz darstellen
Problem in in LRMoo [BDLBoeufR21] (online: https://www.cidoc-crm.org/frbroo/sites/default/files/LRMoo_V0.7(draft 2021-06-29).pdf): Manifestation ist eine eine Subclass einer Expression:
F1 Work
F2 Expression
F3 Manifestation
F34 Controlled Vocabulary
E24 Physical Human-Made Thing
F5 Item
Genauer: Im Dokument https://www.cidoc-crm.org/frbroo/sites/default/files/LRMoo_V0.7(draft 2021-06-29).pdf besteht folgende Klassenhierarchie: F3 Manifestation Subclass of: F2 Expression
(S.20)
Das wurde so auch in die aktuelle Version https://cidoc-crm.org/sites/default/files/cidoc_crm_version_7.1.3.pdf übernommen.
In https://www.cidoc-crm.org/frbroo/sites/default/files/FRBRoo_V2.4.pdf (2015) war es dagegen noch keine Subclass-Beziehung.
Wenn wir uns auf die alten FRBR Dokumente beziehen und auch das Buch von Heidrun Wiesenmüller (https://www.basiswissen-rda.de/, ISBN 978-3-11-053868-7) gut lesen, scheint diese Subclass-Beziehung falsch zu sein: Gemäß RDA sind Manifestation und Expression zwei ziemlich verschiedene Dinge, in OWL jedenfalls disjointe Klassen. TBD, klären … und für die veranstaltung LOGD ein gutes Beispiel, wie schwierig es sein kann, eine Ontologie zu erstellen.
weitere Dokumente:
https://www.ifla.org/wp-content/uploads/2019/05/assets/cataloguing/frbrrg/frbr-oo-v9.1_pr.pdf
https://cidoc-crm.org/sites/default/files/cidoc_crm_version_7.1.3.pdf
FRBR für digitale Entitäten: FaBiO
FaBiO, the FRBR-aligned Bibliographic Ontology https://sparontologies.github.io/fabio/current/fabio.html (2019)
Weitere verwandte Quellen:
http://www.sparontologies.net/: “SPAR LogoThe Semantic Publishing and Referencing Ontologies, a.k.a. SPAR Ontologies, form a suite of orthogonal and complementary OWL 2 DL ontology modules for the creation of comprehensive machine-readable RDF metadata for every aspect of semantic publishing and referencing”
Diskussion im Skript: WEMI digital
Lesson CIDOC#
(Hinweis zur Aussprache: CIDOC ist kein EN-Begriff, also nicht “saidok”, sondern einfach auf DE “sidok”.)
Einstieg: https://de.wikipedia.org/wiki/CIDOC_Conceptual_Reference_Model
Homepage: https://www.cidoc-crm.org/
Aktuelle Version: Definition of the CIDOC Conceptual Reference Model, Version 7.1.3, February 2024
[BBC+24]
Kerndokument: CIDOC CRM Special Interest Group, Version 7.1.3, February 2024: https://cidoc-crm.org/Version/version-7.1.3, Status: Official (ISO Correspondence)
Lizenz: CC BY 4.0
Zeigen: Ausschnitte aus der Klassenhierarchie: CIDOC CRM Class Hierarchy Table 3: CIDOC CRM Class Hierarchy, p.48ff … mit Fokus auf E73 Information Object … Mehrfachvererbung! …
interessante Klassen:
E71 Human-Made Thing
E28 Conceptual Object
E89 Propositional Object (frbr:work)
E73 Information Object
E90 Symbolic Object
E73 Information Object
E41 Appellation
E42 Identifier (rdf:IRI)
E55 Type (skos:Concept)
E73 Information Object (frbr:expression)
E31 Document
E32 Authority Document
E33 Linguistic Object
[BDLBoeufR21] https://www.cidoc-crm.org/frbroo/sites/default/files/LRMoo_V0.7(draft 2021-06-29).pdf: Mapping von FRBRoo nach CIDOC CRM
E89 Propositional Object
F1 Work
E73 Information Object
F2 Expression
F3 Manifestation
E24 Physical Human-Made Thing
F5 Item
Als OWL-Ontologie: http://erlangen-crm.org/ - erlangen-crm/ecrm: ecrm_current.owl , ecrm based on 7.1.3 iso version, last month
Merkzettel, weitere interessante Aspekte:
Adopting the principle of monotonicity has active consequences for the basic manner in which classes and properties are designed and declared in the CIDOC CRM. In particular, it forbids the declaration of complement classes, i.e. classes solely defined by excluding instances of some other classes. * [BBC+24], S. 29
konkrete Fragestellung, noch weiter recherchieren: Wie reagiert DC auf die Entwicklungen in FRBR und RDA, hier CIDOC?
Lesson RDF 1.2 im Detail#
Material:
RDF 1.2 auf Papier ausgedruckt, ersatzweise in einem pdf-Reader mit Annotationsmöglichkeit (lediglich ein Smartphone reicht nicht)
Wir lesen Teile des Textes im Detail, und verstehen ihm im Idealfall vollständig.
Ergebnissicherung:
mindestens eine Graph-Visualisierug
später dann ggf. auch eine GenDifS-Mindmap ähnlich http://jbusse.de/gendifs/x_denny_vrandecic_ontology_evaluation.html
Einzelne Unterrichst-Sitzungen, die idealerweise teilnehmeraktivierend als moderierte Gruppenarbeit durchgeführt werden könnten.
Grundlagen:
[], Chapter 3 RDF—The basis of the Semantic Web https://dl.acm.org/doi/10.1145/3382097.3382101
Lesson Parkhausdaten#
siehe vorläufig https://www.jbusse.de/logd/aehnlichkeit-von-csv-dateien#logd-bsp-parkhausdaten-2024-04-19
2024-04-26 Uebersicht#
Diese Lesson: Vorausschau Zusammenhänge
SKOS#
Merkzettel#
This study provides evidence that ChatGPT can generate accurate records that conform to multiple metadata standards. [ … ] ChatGPT was able to generate both accurate existing authority records and entirely original ones, and it could generate records using both RDA and Dublin Core standards. https://www.researchgate.net/publication/374430098_From_ChatGPT_to_CatGPT_The_Implications_of_Artificial_Intelligence_on_Library_Cataloging
https://www.researchgate.net/publication/327964780_Dublin_core_State_of_art_1995_to_2015