Semiotik von vernetzten offenen Metadaten (LOMDS)

Semiotik von vernetzten offenen Metadaten (LOMDS)#

Liebe Leserin, lieber Leser,

Sie halten hier ein Dokument in der Hand, das wir immer noch “Buch” nennen wollen, auch wenn Sie dieses Werk vermutlich gar nicht als Papier-, sondern eher als pdf- oder html-Exemplar vor sich haben. Im vordigitalen Zeitalter war ein Buch vorwiegend eine in sich abgeschlossene Ansammlung von Informationen, Verweise nach Außen waren auf Zitate und ein Literaturverzeichnis beschränkt. Moderne digitale Informationsprodukte zeichnen sich dagegen durch Entgrenzung aus: Durch Links können digitale Texte als ein strukturierter, zentraler Ausgangspunkt eines weit verzweigten Netzes aus Informationen gestaltet werden. Die Linked Data Community würde vielleicht sagen: Digitaler Content ist vernetzer Content.

Auch den vorliegenden Text haben wir als eine Kombination von Buch und Online-Material gestaltet. Die Papierfassung ist hinreichend abgeschlossen und vollständig, um sie offline lesen zu können. Wer mehr wissen will, greift über die Links aus der digitalen Fassung auf weitergehendes Material zu – insbesondere solches, das auf Papier nur noch bedingt darstellbar ist, wie z.B. Python-Code in Form von ausführbaren Jupyter Notebooks oder Dateien zum Download.

Für Sie als menschlichen Leser liest sich der vorangegangene Absatz völlig selbstverständlich, ja geradezu trivial. Bei genauerem Hinsehen ist jedoch nicht ganz klar, was mit den Begriffen “Link” oder “Zugriff” oder “Material” gemeint ist. Was bedeutet ein Link? (a) Die einzelne Nachricht, verstanden als physikalischer Fluss von Nullen und Einsen, die wir als Antwort auf eine http-Anfrage von einem Internet-Server erhalten und die wir z.B. durch Größe und sha256-Prüfsumme beschreiben können? (b) Die Datei, die wir z.B. durch das Format, die zugehörige Anwendung oder das Erstellungsdatum etc. beschreiben können? (c) Der in der Datei manifestierte Text, allgemein: das in der Datei manifestierte symbolische Modell, das wir als Schrift, Diagramm, Bild, Musiknoten usw. bezeichnen können? (d) Die Idee, die Vorstellung, das Bild, das im Kopf eines Menschen entsteht, der ein symbolisches Modell liest? (e) Ein Ding (Ereignis, Individuum, Allgemeines usw.) in der analogen Welt, das menschliches Denken und Handeln als eine Erscheinungsform einer bestimmten Idee wiedererkennt?

Was Sie hier gerade kennengelernt haben ist eine grundlegende Unterscheidung, die im Bibliothekswesen unter WEMI bekannt ist. Das Werk ist eine Vorstellung, eine Idee. Die Expression ist z.B. der schriftliche Ausdruck eine Idee. Die Manifestation codiert einen schriftlichen Ausdruck z.B. als pdf- oder Ebook-Datei. Das Exemplar (EN: Item) ist das Ergebnis eines Downloads einer Byte-Folge auf der Festplatte oder im RAM-Speicher eine Ebook-Readers.

Wir glauben, dass WEMI bestens geeignet ist, um mehr Klarheit in die Bedeutung von Links zu bringen. Tatsächlich kann man dieses Büchlein lesen als eine Einführung in Linked Open Data vor dem Theoriehintergrund von WEMI. Wir stoßen hierbei auf ein Problem. So bekannt WEMI im Bibliothekswesen ist, so unbekannt ist es außerhalb. Das kann daran liegen, dass WEMI Differenzierungen eingeführt, die alles andere als trivial sind – WEMI ist nicht Teil des Allgemeinwissens. Die mangelnde Bekanntheit kann aber auch daran liegen, dass die technologischen Grundlagen von Linked Open Data ebenfalls nicht trivial sind und nur zögerlich auch von der Bibliothekswissenschaft als Thema erkannt werden. WEMI wurde für vorwiegend für statische Dokmente entickelt, aber auch mit digitalen Manifestationen wie einem Buch in Form einer PDF-Datei kommt WEMI perfekt zurecht. Konzeptuell schwieriger wird es mit WEMI, wenn es um die Erfassung von digitalen Ressourcen geht, die nicht mehr der Dokument-Metapher entsprechen. Die in Europa einschlägige Bibliotheksnorm RDA kennt zwar sog. integrierende Ressourcen wie Webites oder Datenbanken, die sich nicht als ein klar angegrenztes statisches Dokument beschreiben lassen – aber wie spezifisch mit RDF-basierten Datenbanken (?), Knowledge Graphs (?), Datensätzen (?) umzugehen ist, ist in WEMI konzeptuell weitgehend unklar.

Tatsächlich kann man dieses Büchlein auch als einen Tranfer verstehen, wie sich WEMI auf Linked Open Data sachlich angemessen anwenden lässt. Wir hoffen hier einen Beitrag zur informationswissenschaftlichen Theorieentwicklung leisten zu können.

Zielgruppe der Darstellung sind Experten und Expertinnen aus der Informationswissenschaft, die in einer Rolle als Datenverantwortliche ihre technologische Expertise vertiefen wollen … Menschen, die es mit der Integration und Verwaltung von Daten zu tun haben … Fokus für alle diese Rollen: insbesondere auch Metadatenhaltung; auch Metadaten sind ja Daten, mit Spezialisierung Daten über Daten … in Linkd Open Data (LOD) geht es Vernetzung, Integration, Qualität, Herkunft, Versionsgeschichte, Verschlagwortung, Terminologie, Bedeutung von Daten und Metadaten.

Dieser Text bleibt nicht bei einer Einführung in LOD und zugehörige Vokabulare stehen. Weitergehend führen wir in die neue Modellierungssprache GenDifS – kurz für Genus Proximum Differencia Specifica – ein, mit der Vokabulare zur Beschreibung von LOD rasch und übersichtlich entwickelt werden können. Mit GenDifS lassen sich im OpenSource Mindmap-Programm freemind/freeplane Taxonomien grafisch modellieren und in verschiedene Sprachen des Semantic Web übersetzen. Tatsächlich kann dieses Büchlein als der theoretische Hintergrund von GenDifS verstanden werden.

Wikipedia. Theorien lassen sich nicht voraussetzungslos entwicklen, und natürlich auch nicht die vorliegende Einführung in dieses Thema. Wir werden einige anspruchsvolle Begriffe klären müssen, und dabei auf weitere noch anspruchsvollere Begriffe stoßen. Wer hier in keinen unendlichen Regress geraten will, muss letztlich auf die kommunikative Kraft der natürlichen Sprache vertrauen.

Sprache funktioniert oft dort am besten, wo sie ungezwungen benutzt wird und nicht als Problem thematisiert wird. Wenn wir in diesem Büchlein einen Begriff explizit thematisieren und in der Folge auch kritisch anfragen wollen, werden wir uns zunächst vergewissern, welchen Konsens es dazu bereits gibt. Das ist dann auch der Kontext, in dem wir auch Wikipedia für zitierfähig halten: Wir interpretieren Wikipedia als eine systematisch vernetzte Dokumentation von Konsens, der auch uns als begrifflicher Ausgangspunkt dienen kann.

Textelemente. Die vorliegende Version vom Stand November 2024 hat noch sehr vorläufigen Charakter. Viele Inhalte sind noch nicht ausgearbeitet. Redaktionelle Hinweise vom Autor an sich selbst sind im Schreibprozess in einem orangen Kasten Important eingefügt. In der Endfassung ist kein gelber Kasten mehr enthalten.

Important

Auch wenn erst später relevant: Schon hier wenigstens kurz die wesentlichen Gesetze nennen, insbesondere Open-Data-Gesetz, E-Government-Gesetz (EGovG), Informationsfreiheitsgesetz.

Kurze glossarartige Erklärungen einzelner Begriffe oder auch kurze Ausschnitte aus wichtigen Normen stellen wir in einer blauen Box mit individueller Überschrift dar.

BMBF: Open Data

https://www.bmbf.de/bmbf/de/service/open-data/open-data_node.html

Offene Daten (Open Data) bieten weitreichende Nutzungspotenziale für Wissenschaft, Wirtschaft und die Zivilgesellschaft. Sie sind ein Grundbaustein für Open Government - also für offenes Regierungs- und Verwaltungshandeln. […] Mit Umsetzung des Open-Data-Gesetzes unterstreicht die Bundesregierung, dass Deutschland das Potenzial von offenen Daten fördern möchte.

Ausgewählte Abschnitte dieses Büchleins werden auch in meinen Vorlesungen “Linked Open Government Data” und “Semantic Web” der HAW Landshut eingesetzt. Arbeitsaufträge zur Bearbeitung in den Übungen werden später auf der das Buch begleitenden Website zusammengefasst; vorläufig jedoch sind sie noch direkt in den Text eingearbeitet und in einem grünen Kasten Tip ausgezeichnet.

Tip

Stellen Sie vergleichend die Inhalte des Open-Data-Gesetzes und des Informationsfreiheitsgesetzes dar!

Python Code sollte grundsätzlich auf die Website ausgegliedert sein, nur dort ist er mittelfristig aktuell zu halten. So würde Python-Code hier im Buch aussehen:

print("Hallo Welt!")
Hallo Welt!

Turtle-Code:

@prefix cpt: <http://example.net/namespace/cpt#> .
@prefix owl: <http://www.w3.org/2002/07/owl#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix skos: <http://www.w3.org/2004/02/skos/core#> .

cpt:BY_14_intersection a skos:Collection ;
    rdfs:label "cpt:Schnitzel BY cpt:serviert_an FROM cpt:Sauce" ;
    skos:member cpt:Jägerschnitzel .

admonition > tab-set

https://jupyterbook.org/en/stable/content/components.html#tab-content

My first tab

My second tab with some code!

https://jupyterbook.org/en/stable/content/components.html#control-columns-of-a-grid

A

B

C

D