Arbeitsanweisung für den Importupload von mehr als 1000 Versionen

Vorbereitungen Bearbeiten

  1. Zunächst müssen die Werkzeuge PSPad und Opera installiert werden, falls man sie noch nicht auf dem Rechner hat. Diese werden benötigt, um große Dateien zu bewältigen.
  2. Das persönliche monobook muss mit dieser Anweisung erweitert werden.

ImportUpload am Beispiel des Kölner Doms (zwecks Auslagerung von Artikelteilen) Bearbeiten

Diese Methode ist veraltet! Mit Benutzer:Brackenheim/export.js können in einem alle Version gedownloadet werden.

Der Kölner Dom hat aktuell 1820 Versionen (Stand 2012: Revionsnr. 98515655 vom 18. Jan. 2012, 08:32:38) dienen:

  1. Die ersten 1000 Versionen werden wie bei einem "normalen" Importwunsch exportiert (Häkchen rausnehmen bei "Nur die aktuelle Version der Seite exportieren" nicht vergessen!)
    -> Die XML-Datei sollte jetzt 19,8 MB haben.
  2. Die XML-Datei mit PSPad öffnen und in der Befehlszeile <title>Kölner Dom</title> den Seitennamen auf die gewünschte Benutzerunterseite ändern (Bsp.: <title>Benutzer:Importupload/Baustelle Kölner Dom</title>). Danach zur Sicherheit unter einem neuen Namen (Bsp.: Neu.xml) abspeichern.
  3. In Neu.xml mit "Strg+Ende" ans Ende der Datei springen und von da aus mit der Suchfunktion (Strg+F) und der Sucheingabe "<rev" rückwärts suchend die Revions-Nr. der letzten Version suchen (hier: <id>41717171</id>).
  4. Mit dem Browser Opera die Seite https://de.wikipedia.org/w/index.php?title=Benutzer:DerHexer/Exportpage&action=edit aufrufen. Es öffnet sich eine zunächst leere Seite und ein script fragt vier Infos ab:
    1. Export-Wiki? -> de.wikipedia (für ImportUploads aus anderssprachigen Wikipedias entsprechend das Sprachkürzel ändern)
    2. Export-Lemma? -> Kölner Dom
    3. Exportid? -> Hier die vorher gesuchte Nr. der letzten Version mit 1 addiert angeben, also: 41717171 + 1 -> 41717172
    4. Export-Anzahl -> Standardwert: 25 (mal 10 zu exportierende Versionen); kann erhöht oder erniedrigt werden, wenn die Exportdatei zu langsam wächst oder zu schnell zu groß wird
  5. Nach Bestätigung der Eingabe solange warten, bis sich die Exportpage gefüllt hat. Sobald dies geschehen ist, mit "Strg+A" den gesamten Inhalt markieren und mit "Strg+X" ausschneiden.
  6. Jetzt zurück nach PSPad in die noch geöffnete Exportdatei Neu.xml mit mit "Strg+Ende" ans Dateiende springen.
  7. Mit "Strg+V" den Inhalt der Zwischenablage in die Datei hinter das letzte </revision> einfügen und abspeichern.
  8. Erneut mit der Suchfunktion nach der Revions-Nr. der letzten Version suchen und den timestamp prüfen (hier: <id>58024585</id> <timestamp>2009-03-17T23:20:30Z</timestamp>)
  9. Der timestamp von 2009 zeigt, dass noch nicht alle Versionen exportiert wurden, daher müssen die Schritte 3 bis 8 solange wiederholt werden, bis die aktuelle Version erreicht ist.
  10. Nach dem vollständigen Export sollte die neue XML-Datei jetzt 63,8 MB haben. Es hat sich allerdings gezeigt, dass Dateien über ~50 MB den Upload stark verlangsamen, daher sollten größere Dateien immer in etwa 50 MB große Blöcke zerlegt werden.

Teilung von zu großen XML-Dateien (>50 MB) Bearbeiten

  1. In Neu.xml mit "Strg+Pos1" zum Anfang der Datei springen und dann alles von "<mediawiki..." bis einschließlich dem <id>...</id> hinter <title> markieren und mit "Strg+C" in die Zwischenablage kopieren (hier: bis <id>42220</id>).
  2. Mit "Strg+N" und der Auswahl "XML" aus der angezeigten Liste eine neue Datei Neu1.xml anlegen. Dann in die Datei klicken, mit "Strg+A" den möglichen Inhalt markieren mit "Entf" löschen. Schließlich mit "Strg+V" den Inhalt aus der Zwischenanlage in die neue Datei einfügen.
  3. Mit der Enter-Taste in die nächste Zeile und mit der Backspace/Rückschritttaste an den Anfang dieser Zeile springen. Dort den Befehl </page> eingeben. Noch einmal in die nächste Zeile springen und den Befehl </mediawiki> eingeben.
  4. Mit einem Klick auf den Reiter Neu.xml, um zur alten Datei zurückzukehren.
  5. Jetzt wird's etwas unpräzise: Da nur rund 50 MB gebraucht, aber rund 60 MB vorhanden sind, müssen etwa 10 MB (entspricht etwa 1/6 der Datei) entfernt werden. Man klickt also in der Scrollleiste auf ungefähr das fünfte Sechstel und landet irgendwo im Quelltext. Jetzt langsam so lange weiter nach unten scrollen, bis das nächste Mal der Befehl <revision> auftaucht.
  6. Vor den Befehl <revision> klicken, "Strg+Umschalt" gedrückt halten und "Ende" drücken. Es müsste jetzt bis zum Ende der Datei, d.h. nach dem letzten </revision> alles markiert sein. Den markierten Teil mit "Strg+X" ausschneiden.
  7. Nach Klick auf die Registerkarte Neu1.xml wieder in die neu angelegte Datei gehen und zwischen </id> und </page> (am besten in einer Leerzeile) mit Strg+V das Kopierte einfügen.
  8. Nun beide Dateien abspeichern.
  9. Bei noch größeren Dateien, bei denen eine Teilung nicht ausreicht, werden mit dem gleichen System die nächsten Versionen in eine neue, zweite Datei exportiert bis die wieder über 50 MB groß ist (dann eine neue Datei anlegen etc. pp.)
  10. Zum Schluss werden die einzelnen Dateien nacheinander - sinnvollerweise in der richtigen Reihenfolge - hochgeladen.