Wikipedia:Technik/Cloud/giftbot/weblinksuche

Abkürzung: WP:HT/weblinksuche, WP:HT/giftbot/weblinksuche
giftbot/weblinksuche
(Weblinksuche)

führt eine Suche nach in Seiten enthaltenen URL durch ähnlich Spezial:Weblinksuche, ist jedoch nach Namensräumen filterbar und es können weitere Platzhalter benutzt werden. Anders als auf der Spezialseite wird auch die Gesamtzahl der Treffer (URL, nicht Trefferseiten) angegeben.

Mittels der multilingualen Version linksearch können auch anderssprachige Wikipedia-Versionen analysiert werden.

Syntax für die zu suchende URL Bearbeiten

Platzhalter

  • Als Platzhalter können % und _ benutzt werden.
  • % steht für beliebig viele (auch null) Zeichen.
  • _ steht für genau ein Zeichen.
  • Ist die URL am Ende nicht vollständig, muss sie mit einem Prozentzeichen abgeschlossen werden (anders als auf der Spezialseite!).
  • Beispiele:
    • http://%.wikipedia.org/wiki/%
    • http://www.wiki_edia.org/
  • Sollen die Zeichen % oder _ Teil der URL sein, müssen sie mit \ maskiert werden.
  • Beispiele:
    • http://de.wikipedia.org/wiki/\%25-Darstellung
    • http://de.wikipedia.org/wiki/Erster\_Weltkrieg

Protokoll

  • Im Gegensatz zur Spezialseite muss das Protokoll immer mit angegeben werden.
  • Zu beachten ist dabei allerdings, dass es auch protokollrelative URLs gibt, bei denen die Protokollangabe fehlt, diese beginnen dann mit //.

URL und URL-Parameter Bearbeiten

Nachstehend sind die Parameter aufgelistet, wie sie in der URL benutzt werden.

  • Die Basis-URL lautet: https://giftbot.toolforge.org/weblinksuche.fcgi
  • Daran ist mit einem vorangehenden Fragezeichen ? die Parameterliste anzuhängen.
  • Es folgen Zuweisungen name=Wert
  • Dabei darf Wert keine Leerzeichen enthalten; muss bei bestimmten Zeichen ggf. kodiert werden.
  • Die einzelnen Zuweisungen name=Wert sind durch & voneinander zu trennen.
target
Suchmuster für die URL
namespace
Nummer des Namensraums, auf den die Treffer beschränkt werden sollen
Keine Angabe: Alle Namensräume
associated
1 – Namensräume sowohl für Inhaltsseite wie auch zugeordnete Diskussionsseite durchsuchen
0 (Vorgabe) – nur direkt angegebenen namespace= analysieren, ansonsten alle Namensräume
limit
Maximalzahl der Treffer pro Ergebnisseite
Keine Angabe: 100
offset
Laufende Nummer des Treffers, ab dem die Ergebnissseite angezeigt werden soll
Keine Angabe: 0 (ab dem ersten)

Es wird ein interaktives Formular angezeigt.

  • Anschließend folgt in Reihenfolge der gefundenen URL die Trefferliste.

Aktualität Bearbeiten

Unter normalen Umständen werden schon innerhalb von Sekunden die URL-Änderungen im Artikel auch in der Giftbot/Weblinksuche sichtbar. Manchmal kommt es jedoch vor, dass die zugrundeliegende Datenbank „s5“ nur verzögert aktualisiert wird. Mit diesem Link kann man überprüfen, ob die Datenbank aktuell ist: Replag reported by heartbeat_p – wenn bei „s5“ eine Verzögerung von 0 angegeben ist, dann ist die Datenbank, und damit auch das Ergebnis der Giftbot/weblinksuche aktuell. Eine Verzögerung bei „s5“ hat eine negative Auswirkung auf eine Vielzahl von Werkzeugen. Bei stundenlanger Verzögerung und zusätzlich stark steigender Tendenz (Zunahme von 55 sek innerhalb einer Minute) kann eine Fehlermeldung auf Phabricator nützlich sein.

Quellcode Bearbeiten

Entwicklerin Bearbeiten