Wikipedia Diskussion:WikiProjekt Interwikilinks/Commonslinks

Verlegung

Bearbeiten

Ich verlege mal die Diskusion hierher, ist passender, für Interessierte ist hier der Anfang der Entwicklung zu dieser Seite dort zu finden: Benutzer_Diskussion:Jeremiah21#Commonslinks --Jeremiah21 20:15, 11. Sep. 2010 (CEST)Beantworten

Fehlerliste

Bearbeiten

Merlissimo, kann ich einfach die defekte Commonslinks Liste hier zusätzlich einbauen ? Oder muss der Bot gesagt bekommen, das er das soll ... wenn das funktioniert wollte ich dann sofort aus der Bilderliste aussteigen und da nur noch nen Link hierher einbauen. --Jeremiah21 20:15, 11. Sep. 2010 (CEST)Beantworten

Ich muss dem Bot das erst beibringen - dazu muss ich in mehreren Skripten etwas ändern. Ich hatte vor Bio-Vorschlage und defekte Commonslinks nur noch hier zu listen und auf der Bilderseite nur noch die fehlenden Bilder.
Wegen der Commonsvorschläge (vor allem bei Kategorien) kann es manchmal Probleme geben. Wenn diese nicht Commonscat, Commons_cat oder Commons (direkt oder indirekt) benutzen erkennt mein Bot nicht, dass dort schon ein Commonslink existiert. Ich hatte deswegen z.B. hier etwas umgebaut. Falls diese Methode irgendwo nicht möglich ist, brauche ich den Namen der Vorlage um sie im Script einbauen zu können. Merlissimo 01:38, 12. Sep. 2010 (CEST)
Achso: Im Moment läuft es so, dass die Taxonparameter einmal im Monat auf den anderen DB-Cluster kopiert werden und täglich frisch die Parameter mit der Commons-Kategorien abgeglichen und die fehlenden Commonslinks ermittelt werden. Weil die Laufzeit der Query recht schlecht ist (wegen normalisieren der Namen) hatte ich ein Limit von 100 Einträgen eingebauen müssen.
Jetzt habe ich das so vorbereitet, dass jede Woche einmal die Suchvorschläge in eine Tabelle geschrieben werden. Dort habe ich ein Limit von 400 pro Methode (derzeit drei: Taxon, Artikel-IW, Kat-IW) gesetzt. Das kann ich das irgendwann Nachts DB-Intern laufen lassen und ist damit nicht mehr zeitkritisch.
Auf diese Seite werden dann zweimal die Woche davon 500 Vorschläge (damit immer mind. zwei Suchmethoden, damit es nicht zu langweilig ist) hier gelistet. Sortierung weiterhin nach ArtikelID, damit man "frische" Artikel (meist konfliktanfälliger) besser meiden kann.
Die abgearbeiteten Einträge löscht du ja eh selbst und mit mehr Vorschlägen bist du flexibler wie und wann du Lust hast. Dadurch dass der Bot nicht mehr sooft läuft wird der Toolserver entlastet. Die Limits kann man aber auch noch erhöhen. Merlissimo 02:01, 12. Sep. 2010 (CEST)
Das mit den 400 pro Sorteist gut, das man den Mut nicht verliert, weil man die Gesamtanzahl kennt *g* PS:mal den TrigonBot anschubsen, wegen den Abschnitten hier drunter ;-) --Jeremiah21 23:30, 15. Sep. 2010 (CEST)Beantworten
Wegen Einbau in Vorlage: Vorlage:KsPB-Allgemein-Kategorien und Commons --Jeremiah21 14:37, 18. Sep. 2010 (CEST)Beantworten

BKL

Bearbeiten

BKL irgendwie rausnehmen, jedenfalls sagen die das: Wikipedia:Begriffsklärung#Verlinkung .. oder irgendwo zur Diskussion stellen ? --Jeremiah21 19:47, 12. Sep. 2010 (CEST) Ergänzung: oder umgekehrten Weg, in welchen Begriffsklärungen Commonslinks sind, die müssten ja raus .. --Jeremiah21 10:15, 14. Sep. 2010 (CEST)Beantworten

Ich hatte das schon gesehen ;-). Ich wollte aber erstmal sehen, was so an BKS auftaucht und übrig bleibt. Bisher waren alle Commons-IW auf BKS falsch und sie werden verschwinden, weil ich sie bereits auf Commons korrigiert habe [1] [2] [3] [4]. Ob auch mal ein IW von einer Commonscat auf eine BKS sinnvoll sein kann bleibt deshalb noch abzuwarten. In dem Fall müsste ich die BKS wirklich aus den Vorschlägen rausnehmen. Merlissimo 00:00, 16. Sep. 2010 (CEST)
Dann war ich dusselig... ich hatte nur Netz als BKL und auf Commons, und hab die anderen BKL dann ignoriert.. also erst kontrollieren ob die iw überhaupt richtig sind ist da die bessere Alternative, ganzer Vorgang erledigt ;-) --Jeremiah21 10:24, 16. Sep. 2010 (CEST)Beantworten

andere Projekte

Bearbeiten

Grundsatzfrage: Dehnen wir das ganze irgendwann auch auf andere Projekte aus? Hintergrund: ich habe im Projekt Syntaxkorrektur gesehen, das Links zu Schwesterprojekten in der Form:

als Fehler gemeldet werden, wenn man aber

schreibt, kommt das gleiche Linkziel raus, und wäre wieder unter Weblinks zu packen und kein Fehler mehr. Also im Endeffekt würde ich solche Dinge dann in die Ideenliste packen. --Jeremiah21 10:24, 14. Sep. 2010 (CEST)Beantworten

Du meist ich sollte http://toolserver.org/~sk/cgi-bin/checkwiki/checkwiki.cgi?project=dewiki&view=only&id=68 nach commons filtern und hier ausgeben? Merlissimo 00:09, 16. Sep. 2010 (CEST)
hm, so weit hab ich gar nicht gedacht.... ich schau mir das CheckWiki nochmal genauer an und meld mich dann wieder, weil sonst ist das doppelte Arbeit --Jeremiah21 10:29, 16. Sep. 2010 (CEST)Beantworten
so, nu hab ich mal bisserl nachgedacht ;-) Grundsätzlich sind sich die Themen von hier und Link zu einem anderen Wikiprojekt (82) sowie Link zu einer anderen Sprache (68) aus dem Projekt Syntaxkorrektur recht nahe. Nur ein Anfang in dem Bereich zu finden ist äusserst schwer, da es viel zu stark durcheinandergewürfelt ist und vollkommen verschiedene Grundlagen zu den verschiedenen unerwünschten Verlinkungen führen (Weblinks/Quellen/Refs/usw). Erinnert mich etwas an den Anfang der Commonscat-Korrekturen, das waren auch tausende die man häppchenweise abarbeiten konnte, und nach eienr Weile hat man alles gesehen und die Fehlerquote sinkt. Vielleicht bin ich auch von deinen Listen verwöhnt. Auch ist das ganze ja keine Commons-Spezielle Sache mehr und man startet auf ein größeres Feld, was aber wahrscheinlich Zeittechnisch kritisch wird. Lösung ? keine Ahnung, wollte nur Gedanken loswerden, passieren muss deswegen auf keinen Fall was, kann aber auch sein das ich vollkommen wirr im Kopf bin ;-) --Jeremiah21 18:16, 29. Sep. 2010 (CEST)Beantworten
Das ganze geht effizienter abzufragen, wenn bugzilla:14473 live kommt. Ich würde die paar Monate noch warten und dann schauen, was man mit den Daten in der neuen Tabelle anfangen kann. Merlissimo 21:26, 30. Sep. 2010 (CEST)

Sonderfälle

Bearbeiten

... ich weiss nicht weiter...--Jeremiah21 20:34, 30. Sep. 2010 (CEST)Beantworten

de-Seite Commonscat-Vorschlag Bemerkung
Netz {{Commonscat|Nets}} Commonscat in BKL nicht erlaubt
Kataster {{Commonscat|Kadaster, Netherlands}} falsche iw, Löschung auf Commons wurde revertiert
Der Link VON Commons ist imo im Grund richtig, nur macht eine Commonsverlinkung NACH Gebäuden in denen sich Katasterämter befinden im deutschen Artikel wenig Sinn. Ich seh' aber auch kein allgemeines Konzept, dass man in der Query berücksichtigen könnte (z.B. waren viele Links nach de-BKS einfach nur falsch gezielt). Die Problemfälle sollten sich am Anfang der Liste sammeln.
Ich hatte allerdings gedacht, dass sich dort schneller mind. ein Dutzend Problemfälle ergeben werden. Die Fälle am Anfang sollte man leicht ignorieren können. Ich würde einfach mal abwarten wollen bis es ein paar mehr werden. Merlissimo 21:37, 30. Sep. 2010 (CEST)
oki, sammeln mach ich eh (na ja, bisher hab ich sie gelöscht, aber das wohl unpraktisch wenn man mal nachschauen will was so überbleibt) wegen Probleme... na ja.. nen ganz paar erledige ich mit Bauchschmerzen, aber ich werd mal zusehen die drin zu lassen damit du mal drüberschauen kannst --Jeremiah21 21:49, 30. Sep. 2010 (CEST)Beantworten
Bearbeiten
Von Bot-Anfragen hierher verschoben von --Minderbinder 10:47, 25. Mär. 2011 (CET)Beantworten

Hallo, ab und an finde ich Artikel ohne Commons-Cat-Link, obwohl eine entsprechende Kategorie auf Commons schon vorhanden ist. Wenn nicht alle kategorisierten Bilder im Artikel verwendet werden, dann ist ein solcher Link aktuell ein Mehrwert. Aber auch wenn nur ein oder zwei Bilder kategorisiert sind, die alle schon im Artikel sichtbar sind, kann sich diese Situation ändern: durch Artikelumgestaltung oder durch mehr Dateien auf Commons. Wäre es für einen Bot möglich, folgenden Algorithmus zu durchlaufen:

  1. Finde alle Artikel OHNE, die weder die Vorlage:Commonscat noch die Vorlage:Commons enthalten.
  2. Bilde von OHNE die Teilmenge OHNE-INTER, also Artikel mit Interwikilinks.
  3. Überprüfe für jeden Artikel in OHNE-INTER, ob mindestens ein anderssprachiger Interwiki-Artikel die entsprechende Vorlage Commonscat oder Commons verwendet. In der nl:WP wären das zum Beispiel nl:Sjabloon:Commonscat und nl:Sjabloon:Commons. Man könnte diese Überprüfung auf die großen und aktiven Wikipedias beschränken, also z.B. die Big Ten von www.wikipedia.org: en, fr, it, pl, ja, es, ru, pt, nl. Wenn ja, füge den Artikel der Menge OHNE-INTER-JA zu und speichere für jeden Artikel darin den jeweiligen Commonscat- oder Commons-Link.
  4. Bilde von OHNE die Teilmenge OHNE-DATEI, also Artikel mit mindestens einer eingebundenen Commons-Datei.
  5. Bilde von OHNE die Teilmenge OHNE-HOMONYM, also Artikel, deren Lemma als Commons-Kategorie existiert.
  6. Bilde von OHNE-DATEI und OHNE-HOMONYM die Kreuzmenge OHNE-DATEI-HOMONYM, und speichere für jeden Artikel darin den jeweiligen Commonscat-Link.

Ob der Bot die Links dann gleich setzt, die Mengen als Wartungsliste ausgibt, einen Vermerk auf die Artikel-DS schreibt, o.ä. wäre noch zu diskutieren. Erst mal geht es mir um das Finden. --Minderbinder 08:26, 24. Mär. 2011 (CET)Beantworten

Ohne den Vorschlag durch Verdoppelung der Arbeitslast erschlagen zu wollen: Es gibt durchaus auch den umgekehrten Fall, dass ein Artikel einen Commons-Link enthält, aber mit keinem einzigen Bild daraus bebildert ist. Mag in Einzelfällen Gründe haben (Kategorie enthält gar keine Bilder, rechtliche Gründe, stattdessen dewiki-lokale Bilder eingebunden, Commonsbilder eignen sich nur zur Vertiefung und nicht zur direkten Artikelbebilderung, ...), ist in den meisten Fällen wohl aber ein Fehler. Von den Artikeln MIT (mit Commons-Link) wäre also die Teilmenge MIT-KEINBILD (ohne eingebundene Bilder, evt. weitergehend: ohne eingebundene Commons-Bilder; möglichst Länderflaggen-Icons, Bausteinsymbole und dergleichen ignorierend) ebenfalls ein geeigneter Kandidat für eine (dann allerdings in jedem Fall händische) Untersuchung. --YMS 10:24, 24. Mär. 2011 (CET)Beantworten
Das wäre ein Job für den Krdbot, da er viele der dafür nötigen Sachen sowieso hat. Ich schau mir das bei Gelegenheit an. --Krd 18:20, 24. Mär. 2011 (CET)Beantworten
Das klingt gut. Bitte sprich mich an, wenn du noch mehr Details willst. Ein paar Ideen hätte ich noch auf Lager, aber ich will niemanden mit einem Sack voll Feature-Requests erschlagen. @YMS Im Prinzip richtig, aber der Mehrwert von MIT-KEINBILD dürfte gering sein. Irgendein Mensch hat den Commonslink mal gesetzt, der wird ja drauf geschaut haben, ob es verwertbare Bilder gab. Außerdem geht die Situation ja direkt aus dem Artikel hervor: da ist ein Commonslink, aber kein Bild. --Minderbinder 18:27, 24. Mär. 2011 (CET)Beantworten
Wikipedia:WikiProjekt_Interwikilinks/Commonslinks. Wenn es wieder einen Abarbeiter geben sollte, lass ich das Script wieder laufen. Neue Ideen, wie man Vorschläge finden kann, können auf die dortige Disk, aber als ich den Bot wegen Abarbeitungsinaktivität stoppte waren noch mehrere tausend Vorschläge in meiner DB übrig (die Liste dort ist auf 500 Vorschläge beschränkt), obwohl alle Vorschläge noch weitere hochwertige Kriterien erfüllen (nicht nur ein Bild, usw). Merlissimo 20:07, 24. Mär. 2011 (CET)
Dann aktivier das bitte wieder, und pack es vielleicht gleich mit in die Navileiste rein. --Krd 20:50, 24. Mär. 2011 (CET)Beantworten

Könnte man die Listen irgendwie nach Fachgebieten auseinanderdröseln, so dass man das den Fachportalen übergeben könnte? So sind zum Beispiel viele Biologie-Artikel dabei, das Portal ist ja sehr rührig. --Minderbinder 14:10, 25. Mär. 2011 (CET)Beantworten

Für die Biologen gab es mal Wikipedia:Redaktion_Biologie/Bearbeitungsbausteine_Biologie#Commons Vorschläge. Wie du umseitig siehst wird zum Auffinden dieser Vorschläge der lateinische Name aus der Taxobox ausgelesen und mit den Kategoriennamen auf Commons verglichen, die die Taxonavigation-Vorlage enthalten. Infos zum entstehen dieser und vor allem der Biologie-Liste siehe Benutzer_Diskussion:Jeremiah21#Commonslinks. Von den Biologen gab es den größten Protest wegen der Entfernung von Commons-Bausteine zu nicht existierenden Commons-Kategorien. Deswegen hatten sie eine Extra-Liste von der aber trotz Info an die Redaktion (Wikipedia_Diskussion:Redaktion_Biologie/Archiv/Juli_2010#Commons-Links) NIE etwas von den Biologen abgearbeitet wurde. Außer Jeremiah21 hat eigentlich niemand wirklich irgendwelche Commonsvorschläge umgesetzt. Deswegen hatte ich irgendwann auch das Skript abgestellt, nachdem Jeremiah21 hier inaktiv wurde.
Ich hatte die Vorschlagsliste vom Bot früher einmal wöchentlich aktualisieren lassen und zweimal in der Woche wurden die Ergebnisse auf der umseiten Liste aktualisiert. Da ich nicht so recht überzeugt bin, ob sich das nun ändert, werde ich das Script in nächster Zeit versuchsweise ein paar Mal manuell anstoßen. Der Resourcenverbrauch des Scripts ist recht groß und lohnt sich nur, falls das auch wirklich jemand nutzt.
Dein Vorschlag auf anderen Wikipedia-Sprachen zu suchen ist durch die Commonsinterwikis bereits halbwegs enthalten. Es gibt nur nicht auf allen Projekten Bots, die die Interwikis nach Commons übertragen. Aber solange noch genug Vorschläge vorhanden sind, braucht es die Ausdehnung der Suche auf andere Sprachprojekte noch nicht.
Die Query, die ich benutze ist bei einem Hit deutlich teurer, als bei einem Nicht-Hit. Jede der drei derzeitigen Suchmethoden (Taxobox, Kategorieninterwiki, Artikelinterwiki) bricht deswegen nach maximal 400 Treffern ab. Ich besitze deshalb keine vollständige Liste. Merlissimo 21:10, 26. Mär. 2011 (CET)
Bin da, gebt mir ne Woche, dann sieht man ob ich genug Energie entwickel ;-) --Jeremiah21 15:11, 17. Apr. 2011 (CEST)Beantworten
Der Krdbot kann einfache Fälle auch automatisch erledigen, allerdings könnte man nochmal überlegen, ob man {{Commonscat|xxx}} oder {{Commonscat|xxx|{{PAGENAME}}}} oder {{{{Commonscat|xxx|dt. Übersetzung von xxx}} haben möchte (wobei letzterer Fall natürlich nicht mehr automatisch machbar ist). --Krd 15:40, 17. Apr. 2011 (CEST)Beantworten
Also ich hatte mal die Erfahrung gemacht, das einige sehr empfindlich auf falsche Verlinkungen eines Bots reagieren(da war ich der Bot), ein "drüberschauen" ist immer empfehlenswert (auch wenn ich nu Monate aus dem Thema bin). Da reicht schon ein falscher IW auf Commons, da finde ich die Merlbot Liste schon ganz gut... es ist zwar ein stupides arbeiten, aber mir kommt das entgegen, vielleicht bin ich aber auch da nicht der richtige Ansprechpartner... zu den Verlinkungen, auch da nur aus der Erfahrung: Egal was man macht, es ist in Augen einiger immer falsch, nur der erste Parameter ist der kleinste gemeinsame Nenner. Gerade PAGENAME (Vorlage in Vorlage) wurde von einigen entfernt, zweiter Parameter ist dann ja wieder eine nicht korrekte Wiedergabe des Linkziels, welches nunmal englisch ist. Natürlich würde mir ein Bot auch gefallen, dann arbeite ich nur an Fehlerlisten. Auch die Positionierung des Commonscat Links ist verschieden, da oft der Weblinks Absatz fehlt. Im Moment bleib ich bei meiner Art, auch um mich wieder ins Thema einzuarbeiten, --Jeremiah21 16:03, 17. Apr. 2011 (CEST)Beantworten
Der Bot basiert auf der vom Merlbot erzeugten (umseitigen) Liste. Im Moment ist nur implementiert: "wenn Weblinks-Abschnitt vorhanden, dann setzte Commonslink an den Anfang". Das scheint gängige Praxis zu sein. Wenn kein Weblinks-Abschnitt da ist, kommt man manuell vermutlich besser zurecht. Die Bot-Edits müssen natürlich auf grobe inhaltliche Fehler durchgesehen werden, wobei dann auch der IW-Link auf Commons zu korrigieren ist. Das ist aber deutlich weniger Arbeit, als alles manuell zu machen. Allerdings möchte ich den Botlauf nun erstmal ein paar Tage aussetzen, um eventuelle Reaktionen auf die bereits gemachten Edits abzuwarten. --Krd 16:21, 17. Apr. 2011 (CEST)Beantworten
Hm, das sieht ja so aus, als wäre ich wegen des Bots wieder zurückgekommen, das is aber wirklich Zufall. Ich finde den Bot gut so, also bräuchte ich ja eine Liste was der Bot nicht machen will/kann. Mal gucken was so rum kommt die Tage, uns hetzt ja keiner ;-) --Jeremiah21 16:39, 17. Apr. 2011 (CEST)Beantworten
Von der Variablen pagename als 2. Parameter halte ich auch wenig, da nach späteren Verschiebung eventuell Klammern oder sonst was erscheinen können. Im Script kann man beim Einfügen natürlich {{Commonscat|xxx|{{subst:PAGENAME}}}} verwenden, sofern das Sinn ergibt.
(wegen bk den Edit zuvor nicht gesehen) @Jeremiah21: Ich hatte die Liste zwischendruch eingestellt, weil sich nach dir niemand mehr drum gekümmert hat.

Merlissimo 16:40, 17. Apr. 2011 (CEST)

Bio Vorschläge

Bearbeiten

Merlissimo, du hast doch bei den Bio Vorschlägen noch cat file > 3 drin, oder ? Wie ist das mit solchen Fällen ? : Euchresta {{Commonscat|Euchresta}} .. verlinken brauch ich da nichts, weil leer, kann der Bot das auseinanderhalten ? (Unterkategorie(en) leer) --Jeremiah21 20:51, 18. Apr. 2011 (CEST)Beantworten

Bedingung ist bei allen Vorschlaglisten cat_files > 2 OR cat_subcats > 0 . Ich habe cat_subcats mal auf > 1 geändert, so dass mind. zwei Kategorien enthalten sein müssen. Merlissimo 21:16, 18. Apr. 2011 (CEST)

Kategorie Ausnahme

Bearbeiten

sorry, heute nerv ich. Bitte Artikel der Kategorie Obsolete_Schreibung aus den Vorschlagsliste rausnehmen. --Jeremiah21 21:02, 18. Apr. 2011 (CEST)Beantworten

Ne, weil darum sollte sich eigentlich mein Bot auf Commons kümmern. Nur hat mein Bot da soviel entfernt, dass sie in der Zusammenfassungzeile zusätzlich den Grund haben wollen, warum der Bot dort einen Interwiki entfernt hat. Das braucht etwas Programmieraufwand, weshalb der gerade nicht läuft.
Ich könnte aber die Kategorie mit ins BKS-Tool aufnehmen, dann kannst du es direkt sehen. Merlissimo 21:19, 18. Apr. 2011 (CEST)
Bearbeiten

Da die negativen Kritiken bisher überschaubar sind und keine der bisherigen Edits revertiert oder geändert wurden, lasse ich jetzt "Commonscat-Name == PAGENAME" durchlaufen. Die Taxa folgen dann in Kürze. Merlissimo, kannst Du dann diese Liste auf mindestens tägliches Update schalten? Das direkte Abfragen aus Deiner DB wäre auch nach wie vor interessant, wenn Du dafür Zeit findest. --Krd 19:39, 19. Apr. 2011 (CEST)Beantworten

Der Krdbot ist jetzt erstmal durch, d.h. hier könnte nun verstärkt manuell zugepackt werden. Ich würde vorschlagen, klare Fehltreffer vorläufig hier: Wikipedia Diskussion:WikiProjekt Interwikilinks/Commonslinks#Negativliste zu sammeln. (Bisher beachtet der Merlbot diese allerdings nicht nicht.) BKLs sollen sicher generell keine Weblinks bekommen, und über die Kategorien müsste man vielleicht nochmal diskutieren. --Krd 19:33, 28. Apr. 2011 (CEST)Beantworten

Noch ne Liste

Bearbeiten

Moin, Krds Seite Benutzer:Krdbot/Defekte Schwesterprojektlinks hat mich inspiriert, mal etwas kräftiger zu bohren was Commons-Kategorien betrifft:

Von den rund 2000 Links sind etwas über 300 abgearbeitet, wobei die Links auf nicht existierende Seiten bisher noch gar nicht auf der Liste sind. Gruß, --Achim (Diskussion) 20:22, 30. Mai 2016 (CEST)Beantworten