Benutzer Diskussion:Fg68at/Baustelle/Portalinventur

Letzter Kommentar: vor 16 Jahren von Fg68at in Abschnitt Entwicklung Dez. 2007

Vorgeschichte Nov. 2007

Bearbeiten

Portalinventur

Inventur

Problemstellung:

  • Gruppe 1: Ich habe etwa 7 WP-Seiten auf denen Wikilinks existieren, sie bilden ein Front-Portal und Serviceseiten und ein paar Kategorien.
  • Gruppe 2: Dann gibt es etwas 10 Seiten die einen Gesamtüberblick zum Thema bieten sollen und wo alles sortiert enthalten sein soll.

Jetzt möchte ich alle Lemma wissen, die auf den Seiten der Gruppe 1 vorkommen, nicht aber auf den Seiten der Gruppe 2 nicht vorkommen. Umgekehrt ist es nicht notwendig. Kann jemand so etwas "automatisch" machen, programmieren? Hat schon jemand so etwas? An wen sollte ich mich wenden? --Franz (Fg68at) 15:28, 20. Nov. 2007 (CET)Beantworten

Noch etwas wäre nett: Alle Lemma die da dann vorkommen nach Artikel-ID sortiert. Dies um für Wikipedia-Archäologie die ältesten heraussuchen zu können. Weiß schon, dass die Artikel mit der niedrigsten ID zuerst nach Alphabet sortiert sind, aber ab einem gewissen Punkt nicht mehr. --Franz (Fg68at) 15:46, 20. Nov. 2007 (CET)Beantworten

Ich kenne jetzt nichts automatische, aber mit einigen Abfragen und vergleichen sollte man das hinbekommen. Ich würde sagen, das muss in handarbeit geschehen. Der Umherirrende 16:26, 20. Nov. 2007 (CET)Beantworten
Wenn die „Inventur“ nur einmalig oder sehr selten gemacht werden soll, wäre manuell vermutlich der geringste Aufwand. Ansonsten würde ich das mit Javascript und Greasemonkey „basteln“, nicht weil das unbedingt ideal ist, sondern für mich momentan am wenigsten overhead verursachen würde. Das Ergebnis nach Artikel-ID zu sortieren stellt keinen nennenswerten zusätzlichen Programmieraufwand dar. Interessieren würde mich noch, ob mit „Lemma , die auf den Seiten der Gruppe 1 vorkommen, nicht aber auf den Seiten der Gruppe 2 nicht vorkommen“ das gleiche gemeint ist wie mit „Lemma , die auf den Seiten der Gruppe 1 und Gruppe 2 vorkommen“? -- ParaDox 17:32, 20. Nov. 2007 (CET)Beantworten
':-) Ja, das kommt vom herumeditieren. Nein, es ist nicht das gleiche gemeint. Habe es korrigiert. Das mit den Artikel-IDs brauch ich nur ein mal, da würde ich auch händisch eine Liste der Lemmas erstellen. Die Inventur soll selten vorgenommen werden, so vielleicht alle 2 Monate oder halben Jahre. Ich schaff es nur nicht die vorderen Edits der Gruppe 1 im Auge zu behalten. Manuell heißt für mich derzeit: auf jedes Lemma gehen und dort unter "Link auf diese Seite" nachschauen ob eine der anderen Seiten drinnensteht. Wenn ich das mache, brauch ich ca. eine Woche und das ist mir eindeutig zu lang. Oder hat jemand einen besseren Vorschlag, ein Verfahren? Irgendetwas halbautomatisches würde auch gehen. zB eine sortierte Liste, die ich dann durchschaue, da bin ich recht gut. Ein paar Stunden investiere ich dann schon. Javascript hab ich mir noch nicht gegeben. Da bin ich völlig unbedarft. Mal schaun, vielleicht find ich jemanden. Ah, einer fällt mir ein, der hat auch Wiki-Erfahrung. --Franz (Fg68at) 16:29, 21. Nov. 2007 (CET)Beantworten
Auch weil ich vom MediaWiki API (bisher) keine Ahnung habe, und ebenso wenig Ahnung von den Client-Plattformen (Python – Java – .NET – Ruby) für die verfügbaren API Access Libraries usw. usw., wäre ich sicherlich langsam, falls ich übermütig genug werden sollte, es zu versuchen, mit JavaScript und ohne API Access Libraries. Bis wann möchtest/brauchst du die erste „Inventur“? Wo fände ich ggf. eine Übersicht über „Gruppe1 (etwa 7 WP-Seiten) und Gruppe2 (etwa 10 Seiten)“? -- ParaDox 10:20, 22. Nov. 2007 (CET)Beantworten
Das wäre nett. :-) JS ohne alles wird wahrscheinlich reichen, kein Prob. Wann ich sie möchte? Sobald es möglich ist. :-) Eilt aber überhaupt nicht. Oder brauchst du eher Druck um zu arbeiten. ;-)
Gruppe 1 sind die direkt im LGB-Portal eingebundenen Seiten incl. "Neue Artikel" und die Kategorien.
Gruppe 2 sind die mit der Themenliste verknüften Seiten.
Wenn man das alles rausholen könnte und ich eine Liste bekomme mit
| Lemma | Wikiseitenname/Kategoriename |
sortiert nach dem Lemma und es immer in derselben Reihenfolge kommt (Themeliste, Portalseite, Kategorie) wäre auch schon geholfen. --Franz (Fg68at) 17:07, 22. Nov. 2007 (CET)Beantworten

Hallo Franz, „die Inventur“ habe ich nicht vergessen, und daher die Diskussion aus dem Archiv kopiert, um sie hier fortzusetzen, wenn es dir so recht ist. Gruß, -- ParaDox 21:04, 24. Nov. 2007 (CET)Beantworten

Wunderbar!
Gruppe 1;
Gruppe 2;
Weiß ja nicht was kommt, lasse mich sehr gerne überraschen:
Es könnte auch noch interessant sein zu wissen ob ein Artikel auf 2 Themenlisten verlinkt ist. Dies kann, muss aber nicht unütz sein. (zB Sonstige Personen ist eher unnütz. Eine Zeit lang habe ich Grenzfälle dort und wo anders eingetragen, einfach aus Angst. Manche umgetragen und nicht ausgetragen.) Bei einer Liste würde ich das auch sehen.
Die Themenliste gibt es ja vor allem, weil ich sehr wenig mit Kategorien "einfangen kann". Aber sie ist auch gut, wenn man so sieht, was einem unter dem Hintern weggelöscht wird. Danke einmal im vorhinein. --Franz (Fg68at) 00:42, 25. Nov. 2007 (CET)Beantworten

Sehr gut

Bearbeiten

Wow, ist gut geworden. Und wow, schon so viele! 8-| Und so manche Konstuktionen kenn ich noch gar nicht. :-) Bitte daher folgendes noch zu Gruppe 2 dazunehmen.

Gruppe 2 Zusatz

(Sind über die Kat Lebenspartnerschaft drinnen, kann ich aber derzeit nicht brauchen)

und

--Franz (Fg68at) 02:40, 28. Nov. 2007 (CET)Beantworten

Hi Franz, es freut mich, dass du dich freust. In „Gruppe 2 Zusatz“ enthält Kategorie:Hochzeitsbrauch 64 Artikel, und in Kategorie:Unterhaltsrecht sind es 16. Mit Portal:Homo- und Bisexualität/Themenliste/Liste von LGBT-Organisationen müssen aus 81 weiteren Artikeln alle enthaltenen Lemmas herausgefischt werden. Da das noch weitgehend manuell (also nur halbwegs halbautomatsch) gemacht wird (bis ganz automatisch ist/wäre es noch ganz schön weit, für mich zumindest, denn dazu müsste ich noch etliches technische Lernen), musst du dich etwas gedulden. So lange es also noch nur halbwegs halbautomatsch geht, bitte ich darum, nicht zu häufig das erstellen einer neuen Datanbasis zu wünschen. Besser erst mal eine Weile (mehrfach) gründlich nachdenken, und alle Neuerungen/Erweiterungen/Wünsche zusammenfassen. MfG, -- ParaDox 12:42, 28. Nov. 2007 (CET) Ups, falsch gedacht, daher müssen doch nur aus 3 weiteren seiten alle enthaltenen Lemmas herausgefischt werden. Könnte also heute/morgen noch was werden ;-)  MfG, -- ParaDox 12:54, 28. Nov. 2007 (CET)Beantworten

Entwicklung Dez. 2007

Bearbeiten

Hi Franz, wollte dir nur mitteilen, dass ich (so) stetig (wie mir möglich) nun an einer Vollautomatisierung arbeite. Es stellt sich heraus, dass deine tolle „Portalinventur-IDEE“ auch für Portal:Transgender und Intersexualität ganz nützlich sein kann. Weil die Datenbasis vom Themengebiet Transgender und Intersexualität nicht annähernd so umfangreich ist ( aber natürlich auch, weil mir vertrauter ;), mache ich z.Zt. die Entwicklungsarbeit damit, natürlich so, dass das Ergebnis dann auch für das Themengebiet Homo- und Bisexualität anwendbar bleibt bzw. wird. Um mitzubekommen ob/wann die Entwicklung voranschreitet, solltest du folgende Seiten beobachten:

Um zu merken ob neue Unterseiten entstanden sind, verwende

Wie den <div id=“...“>-Tags im Quelltext von inventurDaten zu entnehmen ist, habe ich die „…Gruppe1“ (FrontEnd) unterteilt in „…GruppeKategorien“ und „…GruppePortalseite“. Diese werden dann in den Abschnitten der inventurAuswertung unter dem Akronym „KP“ zusammengefasst. Neu ist auch, dass rote Links (z.Zt.) auch erfasst werden. MfG, -- ParaDox 17:15, 4. Dez. 2007 (CET)Beantworten

Na freut mich, wenn ich eine gute Idee hatte, die auch anders brauchbar ist. :-) Ja, dort ist das auch recht nett. --Franz (Fg68at) 11:11, 21. Jan. 2008 (CET)Beantworten