Hilfe:Wikidata/Daten aus Wikidata beziehen

Wikidata bietet als Datenbank die Möglichkeit, faktische Aussagen (z.B. die Einwohnerzahl einer Stadt) in strukturierter Form zu beziehen. Diese Informationen können unmittelbar im Artikelnamensraum verwendet werden. Dabei müssen allerdings einige Bedingungen eingehalten werden.

Diese Seite stellt dar, wie der Abruf von Informationen aus Wikidata technisch funktioniert, welche Richtlinien und Leitfäden es gibt und wo die Vor- und Nachteile dieses automatischen Informationsbezugs liegen.

Datenstruktur und Aufbau Bearbeiten

Wikidata ist eine zentrale Datenbank, die Daten in strukturierter Form bereithält. Wikidata enthält sogenannte „Items“, jedes Item bezeichnet einen Gegenstand (beispielsweise: Die Stadt Magdeburg im Item Magdeburg (Q1733)). Jedes Item enthält eine individuelle ID, beginnend mit dem Buchstaben Q mit anschließender Ziffernfolge.

Zu jedem Item wiederum enthält Wikidata Aussagen in Form von „Tripeln“. So finden sich im Item Magdeburg (Q1733) verschiedene Aussagen, beispielsweise „Magdeburg ist eine Landeshauptstadt“, „Magdeburg liegt in Sachsen-Anhalt“ und „Magdeburg hat Einwohner: 235.723“. Hieran kann man bereits den Aufbau der Tripel erkennen: Zuerst steht das Item, über das eine Aussage getroffen wird (hier: Magdeburg, rot gekennzeichnet), dann eine „Eigenschaft“ (auch: „Property“), welche durch die Aussage beschrieben wird (blau gekennzeichnet), und schließlich die eigentliche Aussage (grün gekennzeichnet). Auch jede Property hat eine individuelle ID, beginnend mit einem P, gefolgt von einer Zahl.

Zusätzlich können zu jeder Aussage weitere Informationen über die Aussage oder ihre Gültigkeit gespeichert werden. Dies erfolgt durch „Qualifikatoren“. Bei der Aussage „Magdeburg hat Einwohner: 235.723“ wird so beispielsweise durch einen Qualifikator festgelegt, dass diese Aussage am 31. Dezember 2015 gültig war – eine wichtige Aussage, immerhin unterliegen Einwohnerzahlen ständiger Veränderung. In ähnlicher Art und Weise können Fundstellen gespeichert werden, die die Aussagen belegen.

Vor- und Nachteile sowie Anwendungsmöglichkeiten Bearbeiten

Da die Aussagen auf Wikidata in strukturierter Form vorliegen, können sie automatisiert ausgelesen und weiterverarbeitet werden. Alle Wikimedia-Projekte sind an Wikidata „angeschlossen“ und können somit direkt im Artikeltext Informationen aus Wikidata beziehen.

Informationen aus Wikidata direkt in einen Artikel einzubinden, kann überall dort sinnvoll sein, wo der Artikel eine einfache Information ohne jeden Interpretationsspielraum bietet und es gleichzeitig absehbar ist, dass sich diese Information bald oder regelmäßig ändert. Ein gutes Beispiel sind die Einwohnerzahlen oder der Bürgermeister einer Stadt oder die Anzahl der bisherigen Fußballspiele eines Fußballspielers, aber auch viele andere Szenarien sind denkbar. Weniger sinnvoll hingegen ist die Abfrage von Informationen, wenn sich diese Information nicht ändern wird. Die Aussage, dass Magdeburg in Sachsen-Anhalt liegt, kann daher besser fest in den Artikel geschrieben werden – sie aus Wikidata zu beziehen, bietet keinerlei Vorteil.

Besonders gut eignet sich der Datenbezug innerhalb einer Infobox, wo ohnehin Informationen in strukturierter Form präsentiert werden. Eine Infobox kommt entsprechend in einigen Aspekten einer Datenbank nahe. Im Artikel-Fließtext muss dahingegen besonders gut geprüft werden, ob ein Datenbezug von Wikidata angemessen ist.

Die Vorteile von einer Einbindung von Informationen aus Wikidata:

  • Veränderliche Informationen werden sofort in den Artikel übernommen, sobald sie auf Wikidata aktualisiert wurden. Dies kann die Aktualität des Artikels deutlich erhöhen, insbesondere dann, wenn das Artikelthema im deutschsprachigen Raum nicht im Interessensfokus steht und die Daten auf Wikidata gut gepflegt sind.
  • Strukturierte und häufig veränderliche Daten sind in einer Datenbank besser aufgehoben: Die Informationen können zentral gepflegt werden, es ist nur ein Update notwendig, sodass alle Wikipedia-Sprachversionen (und externe Projekte) profitieren können.
  • Die regelmäßige Aktualisierung von häufig veränderlichen Daten (Beispiel: Einsatzzahlen von Fußballspielern) bläht die Artikel-Versionsgeschichte auf, während der Update direkt auf Wikidata erfolgen könnte.

Demgegenüber stehen allerdings auch Nachteile:

  • Für neue Benutzer ist es möglicherweise nicht sehr intuitiv, wenn im Artikel Informationen erscheinen, die sie im Wikitext nicht finden und daher dort nicht ändern können.
  • Auch Wikidata als frei bearbeitbare Datenbank ist potentiell Vandalismus ausgesetzt. Je nach Konfiguration der Beobachtungsliste ist dieser schwieriger zu entdecken als Vandalismus direkt im Artikeltext.

Technische Umsetzung Bearbeiten

Die einfachste Möglichkeit, einen Wert aus Wikidata zu beziehen, ist die Nutzung der Parserfunktion {{#property:}}. Diese Funktion ermöglicht es, eine bestimmte Aussage aus dem Wikidata-Item zu beziehen, mit dem die Seite verknüpft ist. Die Parserfunktion erwartet die Angabe der Property, die bezogen werden soll. Im Artikel Magdeburg würde also der Aufruf von {{#property:P1082}} die Einwohnerzahl der Stadt zurückliefern (P1082 bezeichnet die Property für Einwohnerzahlen auf Wikidata: Einwohnerzahl (P1082)). Die Verwendung von {{#property:}} ist einfach und recht ressourcenschonend, kann allerdings nur sehr einfache Abfragen realisieren.

Für komplexere Anwendungsszenarien bietet sich das Modul:Wikidata an. Dabei handelt es sich um ein Lua-Modul, das stetig weiterentwickelt wird und bereits komplexe Vorhaben umsetzen kann. Andere Wikipedia-Sprachversionen verfügen zumeist ebenfalls über ein Wikidata-Lua-Modul; leider sind die Module nicht miteinander kompatibel und die Entwicklung des jeweiligen Moduls verläuft bislang dezentral.

Das Modul wird über {{#invoke:Wikidata}} aufgerufen. Die Dokumentation des Moduls findet sich unter Wikipedia:Lua/Modul/Wikidata/de. Hier werden die einzelnen aufrufbaren Funktionen erklärt und anhand von Beispielen dargestellt. Zu beachten ist, dass einige dieser Funktionen ressourcenintensiv sind und daher den Aufbau der Seite verlangsamen können (um bis zu zehn Sekunden). Außerdem werden zum teil „aufwändige“ (expensive) Lua-Parserfunktionen verwendet, sodass bei der vielfachen Verwendung des Moduls innerhalb einer Seite die zulässigen Limits erreicht werden können, was dazu führt, dass keine weiteren Aufrufe des Moduls realisiert werden können.

Bedingungen und Richtlinien Bearbeiten

Die Rahmenbedingungen, die eingehalten werden müssen, um im Artikelnamensraum Daten aus Wikidata anzeigen zu lassen, wurden von der Community in einem Meinungsbild abgesteckt: Meinungsbilder/Nutzung von Daten aus Wikidata im ANR.

In diesem Meinungsbild wurde beschlossen:

Zudem hat es sich als sinnvoll erwiesen, alle Artikel, die Daten aus Wikidata beziehen, in mindestens eine Unterkategorie der Kategorie:Wikipedia:Seite verwendet Daten von Wikidata einzusortieren. Dies dient der erleichterten Wartung.

Der direkte Datenbezug im Artikelnamensraum hat sich noch nicht flächendeckend durchgesetzt, auch nicht an Stellen, an denen er sinnvoll erscheint. Bevor in einem Fachbereich, in dem bisher noch keine Informationen aus Wikidata bezogen wurden, Artikel oder Infoboxen entsprechend umgestellt werden, sollte dies also zur Diskussion gestellt werden, um unnötige Konflikte zu vermeiden.