Das Forschungsfeld der Themenentdeckung und -verfolgung[1] (Topic Detection and Tracking , TDT; auch event-based information organization) befasst sich mit der Entwicklung von Technologien, die es ermöglichen, Nachrichten aus dem Fernsehen, dem Internet oder Radio zu erfassen und diese dann in einzelne Meldungen zu trennen und in bestimmte Themengebiete oder ein Themengebiet einzuordnen. Sie finden zum Beispiel beim Nachrichtendienst Google News Anwendung.

Die Forschung wurde von der DARPA mit dem Ziel vorangetrieben, Nachrichtenanalysten den Umgang mit der wachsenden Informationsflut zu erleichtern.

Im Gegensatz zur traditionellen Aufgabe des Information Retrieval wird kein eindeutiger Informationsbedarf eines Suchenden vorausgesetzt, sondern das Erkennen neuer Themen angestrebt.

Das Problem wird in fünf Aufgaben unterteilt[2]

  1. Segmentierung: Trennung von Texten in einzelne Meldungen
  2. Themenentdeckung: Identifizierung neuer Themengebiete und Gruppierung der Meldungen nach Themengebiet
  3. Cluster-Erkennung: Einteilung eingehender Meldungen nach Themengebieten
  4. Themenverfolgung: Finden weiterer Meldungen zu einem Themengebiet
  5. Link-Erkennung: Bestimmung, ob zwei zufällig gewählte Meldungen sich mit einem gemeinsamen Themengebiet befassen

Zur Bewältigung der Aufgaben werden Techniken des Information Retrieval, des Text Mining und der Computerlinguistik eingesetzt.[3]

Einzelnachweise Bearbeiten

  1. Themenentdeckung und -verfolgung (Memento vom 25. Juli 2014 im Internet Archive), Publikation von Wolfgang G. Stock
  2. Topic Detection and Tracking. Event-based Information Organization. In: James Allan (Hrsg.): The Information Retrieval Series. Vol. 12. Springer, 2002, ISBN 978-0-7923-7664-4, S. 3 f. (eingeschränkte Vorschau in der Google-Buchsuche).
  3. Juha, Makkonen, Helena Ahonen-Myka, Marko Salmenkivi: Simple Semantics in Topic Detection and Tracking. In: Information Retrieval. Vol. 7, Nr. 3. Springer, 2004, S. 347–368, doi:10.1023/B:INRT.0000011210.12953.86.

Literatur Bearbeiten

  • James Allan (Hrsg.): Topic Detection and Tracking. Event-based Information Organisation. Kluwer, Boston MA u. a. 2002, ISBN 0-7923-7664-1 (Kluwer International Series on Information Retrieval 12).