Diese thematische Übersicht verfolgt einen ähnlichen Zweck wie die Stichproben. Hier wurde allerdings die Verteilung der Wikipedia-Artikel innerhalb der MSN Encarta geprüft. Die Tabelle zeigt die Verteilung der 13.377 Artikel, die in beiden Werken mit gleichem Artikelnamen existieren, sortiert nach Kategorien.

Es liegt der Wikipedia-Stand vom 10. April 2004 zu Grunde.

Kategorie Schnittmenge
Wikipedia/MSN Encarta
MSN Encarta gesamt
Bildende Kunst 357
2,67 %
3271
6,6 %
Biologie/Medizin 1869
13,97 %
5890
11,88 %
Musik/Darstellende Kunst 481
3,59 %
3523
7,1 %
Geographie 3296
24,64 %
9343
18,84 %
Geschichte 1384
10,35 %
7839
15,81 %
Naturwissenschaft/Technik 1901
14,21 %
5286
10,66 %
Politik/Gesellschaft 2455
18,35 %
7915
15,96 %
Religion/Philosophie 1061
7,93 %
2972
6 %
Sprache/Literatur 573
4,28 %
3541
7,14 %
Gesamtanzahl 13377 49580

Hallo Wikipedianer, aus reiner Neugier habe ich hier mal eine aktuelle Vergleichsstatistik zwischen der Microsoft Encarta 2004 DVD-Version (+ alle Updates bis Dezember 04) und der Wikipedia vom 18. Februar 2005. Natürlich ist diese Statistik nicht repräsentativ, da es lediglich 30 Stichproben von Enzyklopädien mit mehr als 100.000 Begriffen sind, jedoch schöne, für mich nicht mehr überraschende Ergebnisse:

Die "Kriterien" bzw. die ausgewählten Artikel kommen wie folgt zustande:

  1. Artikel, die mit Spezial:Randompage (wirklich zufällig) aufgerufen wurden
  2. "Manueller Zufall" – da die MS Encarta keine Zufallsfunktion besitzt, nimmt man den Cursor und scrollt willkürlich in der Artikelleiste (unter Wegsehen vom Monitor) nach oben und unten und klicke irgendwann einmal kurz links davon – ziemlich zufälliger Artikel also;)
  3. "Artikel, die größer sein sollten": Sind im Wesentlichen 10 Artikel, von denen man in einer Enzyklopädie "viel Information" erwarten kann. Sicherlich ist dies die subjektivste Auswahl, allerdings scheint diese sich wenigstens zum Teil mit der Menge des Inhalts zu decken (="mehr Text")

Nicht gezählt wurden die Kategorie-Einordnungen (hat Encarta nicht, Gleichheit muss sein) etwaige "Bearbeiten"- oder (c)-Tags (encarta- und wikispezifisch) und der eigentlichen Überschrifttitel (der mindestens 1x im Text vorkommt).

Hier die Liste:

Suchbegriff Wortanzahl in der Wikipedia Medienanzahl (Wiki) Wortanzahl in der Encarta Medienanzahl (Encarta)
10 Begriffe aus der Wikipedia mit Spezial:Randompage
Scott Nearing 282 0 (nicht vorhanden)
Forza Nuova 73 0 (auch nicht in "Italien"/"Parteien")
Fernanda Montenegro 98 0
Vaterschaftstest 858 0
Wildspitze 105 1 Foto 29 1 Foto
Bürokonzept 477 6 Abbildungen 0
Département Corse-du-Sud 282 0 (1 Nebensatz in "Korsika")
August (Sachsen-Weißenfels) 547 0
Bachbunge 148 1 Foto 0
Letten (Volk) 75 0 (1 Satz in "Lettland") 1 Foto in "Lettland"
10 Begriffe aus der Encarta, "manuell zufällig" gewählt
Koala 595 1 Foto 429 2 Fotos
Michel Serrault 94 210
Karlsruhe (Landkreis) 858 (Landkreis Karlsruhe) 2 Abbildungen 23
Terbium 596 1 Periodensystem 116 1 Periodensystem
GEMA 859 51
Cassone kein eigener Eintrag; in Truhe 26 Wörter //
und schon als Begriffserklärung da:) (22 Wörter)
37
Bedlington Terrier 279 1 Foto 211 1 Foto
Oviedo 18 257 1 Landkarte + 1 Photo
Weltausstellung 740 1 Abbildung 164 5 Fotos, eine 360°-Abbildung
Aura 155 (allgemeine Begriffserklärung) 143 1 Foto "Kirlian-Photographie"
10 Begriffe, die eigentliche größere Artikel hervorrufen sollten
Microsoft 3418 (+Kategorie:Microsoft mit 60 Artikeln) 1004 1 Foto ("guess who")
Polen 2546 (+Unterartikel, z.B. Polen (Volk)) 11 Abbildungen 13241 (!) 23 Abbildungen
Milch 1267 1 Foto und gesprochen 483
Hollywood 203 1 Foto 164 1 Foto und 1 Karte
Duden 1077 1 Foto 218
Konrad Duden 203 218
Compact Disk 2064 2 Fotos 341 1 Animation
Papier 5130 8 Abbildungen 2950 8 Abbildungen
Pythagoras 1007 2 Abbildungen 466 1 Abbildung und 1 Foto
Tabak 804 6 Fotos 744 4 Fotos

Und was für ein Fazit kann man (verlässlich) daraus schließen? Vermutlich keins, aber es fällt auf,

  • dass die Wikipedia einen Haufen kleinerer Artikel hat, was mich sehr freut. ("lieber ein Stub als Nichts")
  • dass die Encarta wenig große Artikel hier vorzuweisen hatte, bis auf einen, der riesig ist (Polen)
  • dass es, salopp gesagt, 25:5 für uns steht, feine Sache :)
  • dass wir mehr Medien brauchen, da ist uns die Encarta (auch aus lizenzrechtlichen Gründen noch ein ganzes Stück voraus!)

Wer mehr Statistiken hat oder welche erstellen will, soll hiermit gerne dazu angeregt sein, da ich nur noch die Encarta 04 DVD als Vergleichsmöglichkeit habe. In den nächsten Wochen werde ich eine ähnliche "Studie" für die englische Wikipedia basteln. In diesem Sinne erstmal euer euch informierender --Roger Zenner -!- 21:08, 18. Feb 2005 (CET)

Erweitert: --Roger Zenner -!- 21:50, 18. Feb 2005 (CET)