content top

Dieses Projekt beschäftigt sich mit der Aufbereitung von Texten aus einer Sammlung medizinischer Fachartikel (ZBmed) als Grundlage für die semantische Suchmaschine Broccoli.

Bearbeiter: Jan Kelch

Betreuer: Prof. Hannah Bast

Zeitraum: Wintersemester 2011/12


Die Grundlage dieses Projektes ist eine Sammlung von medizinischen Fachartikeln (ZBmed). ZBmed umfasst über 1.000.000 Artikel unterschiedlicher Journale. Die Artikel liegen im PDF-Format vor und sind teilweise durch Metadaten ergänzt. Die Metadaten zu den Artikeln liegen je nach Journal in eigenen XML/SGML-Formaten vor.


Das Ziel des Projektes war, die Texte der Fachartikel für die semantische Suchmaschine Broccoli aufzubereiten. Dafür müssen bestimmte Entitäten, welche von Broccoli berücksichtigt werden sollen, in den Texten markiert werden. Die zu erkennenden Entitäten sollen dabei den Titeln englischer Wikipedia-Artikel entsprechen.

content top