Wikipedia Diskussion:WikiProjekt Weblinkwartung/Domains im Fokus/giftbot 1000

Anzahl Vorlageneinbindungen Bearbeiten

mM wäre es sinnvoll bei den Vorlagen auch die Anzahl der Einbindungen im ANR zu ergänzen, dann sieht man (hoffentlich) ziemlich direkt, ob eine Vorlage Änderungsbedarf hat: Ist die Anzahl der Einbindungen größer als die Anzahl der defekten Links, kann der vorlagengenerierte Link nicht tot sein.--Mabschaaf 15:47, 24. Okt. 2015 (CEST)Beantworten

hm ich hätte da eine Liste vom letzten Dump: Wikipedia:WikiProjekt_Weblinkwartung/Domains_im_Fokus/ANR_mehr_als_100_Links_pro_Domain. Ich weiß aber nicht, ob das die gleiche Datenbasis ist. Frohes Schaffen — Boshomi ☕⌨☺  17:35, 24. Okt. 2015 (CEST)Beantworten
Ich meine nicht die Anzahl der Links pro Domain im ANR, sondern die Anzahl der Vorlageneinbindungen im ANR.--Mabschaaf 17:51, 24. Okt. 2015 (CEST)Beantworten
Ich habe umseitig den Link zu Jarry1250's Template transclusion count eingefügt.  Frohes Schaffen — Boshomi ☕⌨☺  18:48, 24. Okt. 2015 (CEST)Beantworten

1911encyclopedia.org Bearbeiten

@Giftpflanze: warum war diese Domain nicht in der Liste? Ist jetzt nicht mehr so wichtig, da ich schon einen Botauftrag fertig eingestellt habe, aber ich wollte das in der Tabelle eintragen, dass das erledigt ist. Bei mir gibt die Domain Status 410 zurück. Frohes Schaffen — Boshomi ☕⌨☺  17:13, 25. Okt. 2015 (CET)Beantworten

Ich habe sie ausgenommen, da ja eh schon lange bekannt war, dass die Domain defekt ist, und man versucht, die Links zu reparieren. – Giftpflanze 17:30, 25. Okt. 2015 (CET)Beantworten

letzte Spalte Bearbeiten

@Boshomi: Siehst Du eine Möglichkeit, die letzte Spalte vorne mit Hilfe dieser Liste zumindest halbautomatisch zu füllen? Die Links dort lassen sich ja alphabetisch sortieren, bei Vergleich der Anzahl toter Links mit der Anzahl der Vorlagenverwendungen kann man sofort sehen, ob der tote Link aus der Vorlage kommen kann (ist die Anzahl Verwendungen größer als die Anzahl toter Links, kann es nicht die Vorlage sein) - wäre vielleicht hilfreich, das auch noch zu vermerken. Damit müsste der Blick klar werden, wo der größte Handlungsbedarf besteht.--Mabschaaf 12:23, 14. Nov. 2015 (CET)Beantworten

ich schau es mir mal an.  Frohes Schaffen — Boshomi ☕⌨☺  12:27, 14. Nov. 2015 (CET)Beantworten
Inzwischen erledigt, siehe giftbot 1000. Ich bin mir nicht ganz sicher ob ich alle Domains gefunden habe, da die notwendigen Regexp-Strings schon recht kompliziert wurden, aber der Großteil dürfte passen. Frohes Schaffen — Boshomi ☕⌨☺  15:07, 15. Nov. 2015 (CET)Beantworten

Aktualisierung Bearbeiten

Hallo Boshomi, Giftpflanze, gibt es eine Möglichkeit die Liste zu aktualisieren oder ist das erst nach der nächsten Überprüfung möglich? Viele dieser Links wurden ja schon korrigiert und eine aktualisierte Liste würde die Arbeit etwas erleichtern. Grüße --Der Buckesfelder  Disk.  bewerten  E-Mail 08:02, 12. Jan. 2016 (CET) -- Der Buckesfelder  Disk.  bewerten  E-Mail 08:04, 12. Jan. 2016 (CET)Beantworten

Weil ich nicht weiß, ob ihr diese Seite beobachtet, hier mal einen Ping -> @Giftpflanze, Boshomi: --Der Buckesfelder  Disk.  bewerten  E-Mail 22:50, 12. Jan. 2016 (CET)Beantworten
Ich antworte mal mit meinem bescheidenen Halbwissen: Aktualisieren wird erst mit dem nächsten GiftBot-Lauf kommen. Das funktioniert ja so:
  1. Giftbot prüft alle Weblinks fünf mal im Abstand von zwei Wochen (siehe Wikipedia:WikiProjekt_Weblinkwartung#Statistik)
  2. Die 556.698 defekten Links aus dem Sep-Nov-Lauf wurden dann sortiert und nach Domains ausgewertet, das Ergebnis steht vorne.
  3. Die möglicherweise ursächlichen Vorlagen daneben zu schreiben war schon sehr aufwändig (ein weiterer Bot-Auftrag, ausgeführt von Luke081515)
  4. GiftBot hat aktuell keine Informationen darüber, wie viele der defekten Links auf seiner Liste stand heute und jetzt noch in den Artikeln stehen, also auch, ob sich Fixe auf einzelne Links oder via Vorlage direkt auf Hunderte Links beziehen. Die Liste wird nun quasi blind abgearbeitet - mit der kleinen Feinheit, dass direkt bevor ein Eintrag auf der Disku landet, nochmal geprüft wird, ob der Link überhaupt noch im Artikel steht
  5. Ist der nächste Lauf komplett (letzte Prüfung am 15.1., dann noch mal rund eine Woche zur Datenauswertung) könnte die Liste vermutlich was die linken Spalten angeht recht schnell neu erstellt werden, die rechte Spalte dazu ist wieder kniffelig.
Hope that helps...--Mabschaaf 23:06, 12. Jan. 2016 (CET)Beantworten
Im Dezember hatte ich RL-bedingt wenig Zeit. Was mir demnächst wirklich helfen würde, wäre eine aktualisierte vollständig dwl20.out-Liste wie ich schon mal bekommen habe. Insbesondere ein leftjoin mit der alten Liste, könnte für größere Domains so manch nützliche Lösungen aufdecken. Heute ist auf http://dumps.wikimedia.org/dewiki/ ein neuer Dump vorhanden, wäre also zeitlich derzeit ideal, wenn die Daten zum Dump annähernd synchron wären. Die Listen der häufigsten Domains und Pfade könnte ich dann auch selbstständig aufbauen.  Frohes Schaffen — Boshomi ☕⌨☺  23:42, 12. Jan. 2016 (CET)Beantworten