Natural Language Toolkit

Bibliotheken und Programmen in Python für Anwendungen der Computerlinguistik (NLP)

Das Natural Language Toolkit (NLTK) ist eine Zusammenstellung von Bibliotheken und Programmen der Programmiersprache Python (von Version 2.6 an) für Anwendungen der Computerlinguistik. Das NLTK ist quelloffen und wird unter der Apache-Lizenz vertrieben.[4]

Natural Language Toolkit
Basisdaten

Entwickler NLTK-Entwicklerteam (ursprünglich Steven Bird, Ewan Klein und Edward Loper)
Aktuelle Version 3.8.1[1]
(2. Januar 2023)
Betriebssystem plattformübergreifend
Programmiersprache Python[2]
Kategorie Computerlinguistik
Lizenz Apache 2.0[3]
deutschsprachig ja
nltk.org

Die Entwicklung des NLTK begann im Jahr 2001 an der University of Pennsylvania unter Edward Loper und Steven Bird, die das Projekt seither gemeinsam mit Ewan Klein leiten.[5] Da das NLTK in erster Linie zu Lehrzwecken entwickelt und dementsprechend angelegt wurde, ist eine umfangreiche Dokumentation, inklusive eines begleitenden, von den NLTK-Entwicklern selbst verfassten Lehrbuchs zur (symbolischen wie auch statistischen) Sprachverarbeitung in Python[6] fester Bestandteil des Projekts. Verbreitung fand das NLTK daher insbesondere im Lehrbereich der Linguistik bzw. Computerlinguistik, des Information Retrieval und maschinellen Lernens sowie den Kognitionswissenschaften; es kann und wird darüber hinaus jedoch auch in der Forschung eingesetzt.

Literatur Bearbeiten

Weblinks Bearbeiten

Einzelnachweise Bearbeiten

  1. Release 3.8.1. 2. Januar 2023 (abgerufen am 27. April 2023).
  2. The nltk Open Source Project on Open Hub: Languages Page. In: Open Hub. (abgerufen am 19. Oktober 2018).
  3. NLTK License
  4. https://github.com/nltk/nltk/wiki/FAQ
  5. http://code.google.com/p/nltk/wiki/People
  6. Bird, Steven; Ewan Klein; Edward Loper (2009): Natural Language Processing with Python, O’Reilly Media Inc., ISBN 0-596-51649-5.