Projektinformation
Dieses Projekt beschäftigt sich mit der Aufbereitung von Texten aus einer Sammlung
medizinischer Fachartikel (ZBmed) als Grundlage für die semantische Suchmaschine Broccoli.
Bearbeiter: Jan Kelch
Betreuer: Prof. Hannah Bast
Zeitraum: Wintersemester 2011/12
Projektgrundlage
Die Grundlage dieses Projektes ist eine Sammlung von medizinischen Fachartikeln (ZBmed). ZBmed umfasst
über 1.000.000 Artikel unterschiedlicher Journale. Die Artikel liegen im PDF-Format vor und sind teilweise durch
Metadaten ergänzt. Die Metadaten zu den Artikeln liegen je nach Journal in eigenen XML/SGML-Formaten vor.
Projektziel
Das Ziel des Projektes war, die Texte der Fachartikel für die semantische Suchmaschine Broccoli aufzubereiten.
Dafür müssen bestimmte Entitäten, welche von Broccoli berücksichtigt werden sollen, in den Texten markiert werden.
Die zu erkennenden Entitäten sollen dabei den Titeln englischer Wikipedia-Artikel entsprechen.