Master-Seminar IM 820: Semantisches Wissensmanagement

NEU 2019-10-18:

  • Um eine Vertretung des verstorbenen Kollegen Seel zu ermöglichen, mussten wir unser Seminar stundenplantechnisch eine Woche nach hinten von geraden auf ungerade KW verschieben. Die Vortrags-Übersicht unten ist entsprechend angepasst.

Unter dem Titel ""semantisches Wissensmanagement" wollen wir Knowledge Graphs in den Blick nehmen, in denen wir in Form von Terminologien und Ontologien Weltwissen modellieren.

Koordinaten:

  • Mi 8:45-12:00 an geraden ungeraden KW
  • Raum J1 07 (neu seit 2019-11-25)

Beginn: Themenverteilung in KW 40, also erste Semesterwoche:

  • Mi 2.10.2019 um 10:30 Uhr

nach Vereinbarung ggf auch ein WE Fr 16-21 + Sa 9-16 Uhr statt 3*Mi?  NEIN, d.h. wir bleiben beim 2-Wochen-Rhythmus

Moodle:

Treffen KW 42:

  • 8:45-11:00 Uhr
  • Jeder stellt 5 Min lang sein Thema vor: Spezial-Aufsatz und zugehörige Grundlagen aus den Grundlagen-Artikeln

Die Literaturauswahl des Seminars ist weitgehend identisch mit der Veranstaltung Knowledge Graphs Seminar (FSS 2019) von Prof. Dr. Paulheim der The Data and Web Science Group der Universität Mannheim.

Grundlagen

Übersicht

  • Paulheim, H.: Knowledge graph refinement: A survey of approaches and evaluation methods
  • Ehrlinger, L., & Wöß, W.: Towards a Definition of Knowledge Graphs
  • Suchanek, F., & Weikum, G.: Knowledge harvesting from text and web sources

Hintergrund

  • Bonatti, P.A., Cochez, M., Decker, S., Polleres, A., and Presutti, V. (eds.): Knowledge Graphs: New Directions for Knowledge Representation on the Semantic Web
  • Färber, M., Bartscherer, F., Menne, C., & Rettinger, A.: Linked data quality of dbpedia, freebase, opencyc, wikidata, and yago
  • Ringler, D., & Paulheim, H. One knowledge graph to rule them all? Analyzing the differences between DBpedia, YAGO, Wikidata & co

Einzelne Vorträge

KW 45 Intro Suchanek Suchanek, F., & Weikum, G.: Knowledge harvesting from text and web sources
Wikidata Vrandečić, Denny, and Markus Krötzsch. Wikidata: a free collaborative knowledgebase
Intro Ehrlinger Ehrlinger, L., & Wöß, W.: Towards a Definition of Knowledge Graphs
DBpedia Lehmann, Jens, et al. DBpedia–A Large-scale, Multilingual Knowledge Base Extracted from Wikipedia.
KW 47 Probase Wu, Wentao, et al. Probase: A probabilistic taxonomy for text understanding
WordNet und GermaNet Verena Henrich and Erhard Hinrichs: Consistency of Manual Sense Annotation and Integration into the TüBa-D/Z Treebank.
YAGO Mahdisoltani, Farzaneh, Joanna Biega, and Fabian M. Suchanek. Yago3: A knowledge base from multilingual wikipedias.
KW 49 WebIsA Seitner, Julian, et al. A Large DataBase of Hypernymy Relations Extracted from the Web
DeepDive Shin, Jaeho, et al. Incremental knowledge base construction using deepdive
NELL Carlson, Andrew, et al. Coupled semi-supervised learning for information extraction
ConceptNet Speer, Robert, and Catherine Havasi. Representing General Relational Knowledge in ConceptNet 5
DS DIADEM Furche, Tim, et al. DIADEM: thousands of websites to a single database
BabelNet Navigli, Roberto, and Simone Paolo Ponzetto. BabelNet: Building a very large multilingual semantic network
KW 51 Cyc Lenat, Douglas B. CYC: A large-scale investment in knowledge infrastructure
Knowledge Vault Dong, Xin, et al. Knowledge vault: A web-scale approach to probabilistic knowledge fusion
[vergleich] Ringler, D., & Paulheim, H. One knowledge graph to rule them all? Analyzing the differences between DBpedia, YAGO, Wikidata & co
KnowItAll/ReVerb Etzioni, Oren, et al. Open information extraction: The second generation
RDF(S), SKOS

Vorgehen

Kurzpräsentation KW 42: lediglich text-immanent; in den folgenden Wochen dann

Lit.-Recherche

  • zitierte Literatur scannen: auf welche Grundlagen bezieht sich der Text?
  • Bezüge zu den Grundlagen-Aufsätzen herstellen
  • Vorwärts-Suche: Finde (neuere) Aufsätze, die den Text zitieren

eigene Nachforschung

  • Welche Entwicklung gab es seitdem?
  • In welchen Zusammenhängen / wofür wird die Technik heute genutzt?
  • Vergleich mit anderen Texten aus der Gruppe Manual Curation | Creation from Wikipedia | Creation from Unstructured Text / Web Sources
  • Evaluationen: Wie leistungsfähig ist die Wissensrepräsentation für ihren jeweiligen Zweck?

Präsentation halten:

  • Zeit: 20-30 Min

Inhalte Präsentation

bitte mit Seiten-Nummern ...

verwendeter Formalismus

technisch

  • Lizenz, Zugänglichkeit
  • Größe, Abdeckung

Erstellung und Pflege

  • manuell? harvesting von Quelle? andere?

Evaluationen

  • Was heißt "Erfolgsquote"?
  • Fachbegriffe erwähnt: precision, recall etc
  • "Faktenchecker": ground truth, gold standard
  • Konsistenz, Kohärenz etc.
  • Sinnhaftigkeit der Evaluationen, Maße, Werte ...

Ausarbeitung

ca 2k Wörter +-10%

DE oder EN beliebig

Aufbau z.B. http://jbusse.de/traktate/AbstractPlusDiskussion.html, aber gerne auch anders

Abbildungen: ausschließlich selbst hergestellte (um Abdruckrechte nicht einholen zu müssen)

Abgabe bis 15.2.2020 auf Moodle