Sammelbilderproblem

mathematisches Problem

Das Sammelbilderproblem, Sammlerproblem, Sammelalbenproblem oder Problem der vollständigen Serie befasst sich mit der Frage, wie viele Bilder einer Serie, die man einzeln nicht gezielt, sondern nur als zufällige Auswahl kaufen kann, zu erwerben sind, um ein Sammelalbum zu vervollständigen. Es kann als mathematisches Problem formuliert und seine Lösung versucht werden.

Sport-Sammelbilder

Beim klassischen Sammelbilderproblem geht man davon aus, dass alle Bilder zufällig gemischt und verdeckt gekauft werden und alle Motive gleich häufig vorkommen. Die letztere Voraussetzung ist aber beispielsweise bei Sammelkartenspielen nicht erfüllt, da hier das Vorkommen einzelner Karten stark variiert. Es konnte zudem nachgewiesen werden, dass bei vielen Sammelbilderserien die Bilder nicht zufällig gemischt werden. Eine weitere wichtige Rolle spielt die Möglichkeit des Nachkaufens und Tauschens von Karten. Das klassische Sammelbilderproblem ist in dieser allgemeinen Problemstellung bisher noch nicht gelöst worden.

Mit Hilfsmitteln der Wahrscheinlichkeitstheorie sowie Monte-Carlo-Simulationen können Sammelstrategien optimiert werden, um das Sammelalbum möglichst kostengünstig zu füllen. Für eine optimierte Sammelstrategie konnte eine Lösung unter veränderten, praxisrelevanten Annahmen gefunden werden.

Das Sammelbilderproblem ist aufgrund der Beliebtheit der Fußball-Sammelalben eines der wenigen mathematischen Probleme, über die regelmäßig in den Massenmedien berichtet und diskutiert wird.

Geschichte Bearbeiten

 
Historisches Eishockey-Sammelbild

Die Tradition von Sammelbildern reicht bis in das 19. Jahrhundert zurück, wo sie als Produktzugaben z. B. bei Schokolade oder Zigaretten aufkamen. Eine Variante bestand darin, dass Coupons gesammelt werden mussten und der Sammler nach Einsendung einer vollständigen Serie eine Prämie erhielt.[1] In den 1930er-Jahren erschienen Bilder von Film- oder Sportstars auf der Deckelinnenseite von Eiscremepackungen.[2] Aber es gab auch schon früh andere Sammelobjekte, z. B. Buttons oder Figuren in Cornflakespackungen.[3] Erst in den 1960er-Jahren haben sich vermehrt Sammelalben etabliert, bei denen die Bilder verdeckt in Tüten oder Päckchen verkauft werden, d. h. ohne dass der Sammler weiß, welche Bilder er erhält. Mit der Einführung von Fußballsammelalben, vorangetrieben durch die Firma Panini, wurde das Sammeln zu einem Massenphänomen, insbesondere zu Welt- oder Europameisterschaften. Mittlerweile sind Sammelalben zu Standard-Merchandising-Artikeln z. B. für Kinofilme geworden.

Die grundlegenden kombinatorischen Betrachtungen gehen bereits auf Markow zurück.[4] Die konkrete mathematische Behandlung begann 1930 mit George Pólya, der das Problem aus Sicht des Herstellers darstellt:

„Jede Packung unserer Ware enthält zwei verschiedene Blumenbilder; die volle Kollektion umfasst 72 verschiedene Blumenbilder. Wer eine volle Kollektion sammelt und einsendet, erhält kostenlos eine Prämie. Der Verkäufer, der solche Reklame macht, muss sich vernünftigerweise die Frage vorlegen: Wie groß ist die Durchschnittszahl der verkauften Packungen pro Prämie?“[1]

Diese Arbeit prägte daher den Namen als Coupon Collector’s Problem. Teilweise wurde es auch als Dixie Cup Problem[5] bezeichnet (nach den Eiscremebechern, die nach der Herstellerfirma als Dixie Cup bezeichnet wurden). Beginnend mit William Fellers Standardwerk zur Wahrscheinlichkeitstheorie[6] haben sich zahlreiche Mathematiker mit dem Sammelbilderproblem beschäftigt. Dadurch hat sich das Sammelbilderproblem als klassische mathematische Aufgabe etabliert.

Manchmal wird die Aufgabe auch als Sammelbilderparadoxon bezeichnet, weil überraschend viele Bilder benötigt werden, um das Album ohne Tauschen oder Nachkaufen zu vervollständigen. Für Pólyas Blumenbilderkollektion muss man im Durchschnitt 174 Päckchen, also 348 Blumenbilder sammeln (bei nur 72 unterschiedlichen Bildern), für das Sammelalbum zur Fußball-Europameisterschaft 2016 benötigt man sogar 4828 Bilder (bei 680 unterschiedlichen Bildern) – offenbar wächst das Verhältnis der im Mittel benötigten Bilder zur Anzahl der unterschiedlichen Bilder stärker als linear.

Das klassische Sammelbilderproblem Bearbeiten

Das klassische Sammelbilderproblem stellt die Frage, wie viele Sammelbilder ein Einzelsammler im Mittel kaufen muss, um eine vollständige Serie von   Sammelbildern zu erhalten, wenn er auf Tauschen und Nachkaufen verzichtet und jedes Bild einzeln kauft.[7] Schon Pólya hatte die klassische Aufgabe definiert und wie folgt begründet:

„Die Käufer tauschen ihre Bilder aus oder werfen sie fort, der Verkäufer kann ein Bild vorenthalten usw. Wie man sieht, kann die Nichterfüllung der Voraussetzungen sowohl die eine als auch die andere Partei begünstigen und eben deshalb scheint mir die Berechnung der Durchschnittszahl unter den besagten Voraussetzungen zumindest als erste Orientierung einen gewissen Wert zu haben.“[1]

Annahmen Bearbeiten

Im klassischen Sammelbilderproblem werden die folgenden Annahmen getroffen:[7][8]

  • A1: Die Bilder werden bei der Herstellung gut gemischt, d. h. rein zufällig auf die Päckchen verteilt.
  • A2: Alle Bilder kommen gleich häufig vor.
  • A3: In einem Päckchen kommt kein Bild doppelt vor.

Der Ergebnisraum kann als Menge der möglichen Sammelbilderfolgen definiert werden:

 
 
Urnenmodell des Sammelbilderproblems mit sechs Bildern

Mathematisch entspricht das Sammelbilderproblem einem Urnenmodell mit Zurücklegen, und zwar bedeuten die gezogenen Zahlen die Nummern der Sammelbilder. Gesucht wird die Anzahl der Ziehungen, die nötig ist, bis jede Zahl mindestens einmal gezogen wurde. Dies bedeutet, dass die einzelnen gezogenen Nummern der Sammelbilder eine diskrete Gleichverteilung besitzen.

Wahrscheinlichkeitsverteilung der Füllung eines 4er-Albums Bearbeiten

Gesucht ist die Wahrscheinlichkeit   mit dem  -ten Kauf ein 4er-Album zu füllen. Die Bilder kommen beim Kauf gleich häufig vor. Die Wahrscheinlichkeit, ein bestimmtes Bild zu kaufen, ist also  . Wir betrachten die Situation vor dem  -ten Kauf, die das Album füllt:   ist die Wahrscheinlichkeit einer Multinomialverteilung, dass beim  -ten Kauf genau ein Bild fehlt, also jedes der 3 anderen Bilder schon mindestens einmal in der Sammlung vorhanden ist:

 

Die Summationsindizes  ,  ,  ,   geben jeweils die Anzahl der Exemplare der einzelnen Bilder an.   ist die Anzahl der Exemplare des 1. Bilds,   ist die Anzahl der Exemplare des 2. Bilds usw. Die Summationsindexe sind natürliche Zahlen größer oder gleich 1. Zur Berechnung der ersten Einzelwahrscheinlichkeit wird über alle   Darstellungen   summiert, sodass die Summe dieser   positiven ganzen Zahlen gleich   ist. Entsprechendes gilt für die anderen Einzelwahrscheinlichkeiten.

Weil die 4 Einzelwahrscheinlichkeiten für   gleich sind, kann man den obigen Ausdruck vereinfachen:

 

Es fehlt genau ein Bild, d. h. mit dem  -ten Kauf wird unabhängig vom fehlenden Bild das Album mit der Wahrscheinlichkeit   gefüllt. Daraus ergibt sich die gesuchte Wahrscheinlichkeit:

 

Dieses Resultat kann leicht auf ein Album mit   Bildern verallgemeinert werden. Für   gilt dann

 

Diese Verteilung ist eine Verallgemeinerung der negativen Binomialverteilung[9], mit welcher man das Sammelbilderproblem für den Fall   beschreiben kann.

Wenn   ist, kann ein Album mit   Bildern mit dem  -ten Kauf offensichtlich nicht vervollständigt werden. Dann ist  , weil dann die durch das Summenzeichen definierte Summe leer, also gleich 0 ist.

Um die Wahrscheinlichkeit, dass das Album nicht mit dem  -ten Kauf, sondern nach   Käufen, also spätestens mit dem  -ten Kauf, vollständig ist, zu bestimmen, muss die Summe   gebildet werden. Wegen   für   ist  . Für   ist auch die summierte Wahrscheinlichkeit offensichtlich gleich 0.

Die summierte Wahrscheinlichkeit kann auch einfacher mit der Formel

 

berechnet werden. Die Einzelwahrscheinlichkeit, mit dem  -ten Kauf das Album mit   Bildern zu vervollständigen, ist also gleich[10][11]

 

Zahlenbeispiel Bearbeiten

Die Wahrscheinlichkeit, dass das 4er-Album nach 12 Käufen vollständig ist, beträgt

 

Die Einzelwahrscheinlichkeit, das 4er-Album mit dem 12. Kauf zu vervollständigen, ergibt sich als Differenz aus dieser und der Wahrscheinlichkeit, dass das Album schon nach dem 11. Kauf vollständig ist:

 

Verallgemeinerung für m von N Bildern Bearbeiten

Diese Formel lässt sich verallgemeinern. Die Wahrscheinlichkeit, dass nach   Käufen, also spätestens mit dem  -ten Kauf,   der   Bilder mindestens einmal vorkommen, ist

 

Für den Spezialfall   ergibt sich die oben erwähnte summierte Wahrscheinlichkeit  . Die Wahrscheinlichkeit, dass schon nach   Käufen   der   Bilder mindestens einmal vorkommen, ist nach Definition   und die Wahrscheinlichkeit, dass beim nächsten Kauf kein neues Bild hinzukommt, ist  . Die Differenz ist also die Einzelwahrscheinlichkeit, mit dem  -ten Kauf zum ersten Mal   verschiedene Bilder zu erhalten:

 

Päckchen Bearbeiten

Sammelbilder werden in der Regel nicht einzeln, sondern in Päckchen mit   Bildern, häufig auch Tüten oder Booster genannt, verkauft. Dabei wird vom Hersteller garantiert, dass innerhalb eines Päckchens kein Bild mehrfach vorkommt.

Es wurde bewiesen, dass Annahme A3 für die Sammelbilder der Firma Panini aufgrund des speziellen Verpackungsprozesses mit der Verpackungsmaschine Fifimatic erfüllt ist.[8]

Die allgemeine Lösung ist komplizierter,[12][7] aber der Vergleich der Ergebnisse ergibt, dass der Effekt der Päckchen eher gering ist, wenn die Päckchengröße   im Verhältnis zur Gesamtzahl   der Sammelbilder klein ist. Dies bedeutet für die meisten praktischen Anwendungen, dass die Päckchengröße vernachlässigt werden kann, denn die Wahrscheinlichkeit   für das Ereignis  , dass es in einem Päckchen mindestens ein mehrfach vorkommendes Sammelbild gibt, beträgt wie beim Geburtstagsparadoxon

 

Die Wahrscheinlichkeit   für das Gegenereignis   (siehe Ereignis (Wahrscheinlichkeitstheorie) - Komplement und Differenz), dass jedes Bild der Sammelbilderserie höchstens einmal im Päckchen vorkommt, beträgt

 

Wartezeit bis zum nächsten neuen Bild Bearbeiten

Die Zufallsvariable   ordnet jedem Ergebnis   die Anzahl der Käufe zu, die gemacht werden müssen, um nach der  -ten verschiedenen Karte wieder eine neue, von den bisher gekauften verschiedene  -te Karte zu bekommen. Dies entspricht der Wartezeit bis zum nächsten neuen Bild.[13]

 
Histogramm einer Simulation (100.000 Realisierungen) am Beispiel von 150 Karten. Man erkennt die große Streuung: Im schlechtesten Fall mussten 2522 Karten gekauft werden.

Da beim ersten Kauf sicher ein neues Bild kommt, ist die Wahrscheinlichkeit  . Beim Kauf des zweiten Bildes ist sie  . Diese Zufallsvariable ist geometrisch verteilt. Allgemein ergibt sich:

 

Als Erwartungswert für   ergibt sich:

 

Dies bedeutet insbesondere, dass man, um das letzte fehlende Bild der Sammlung zu erhalten, im Mittel   Bilder kaufen muss. Das sind aber genauso viele Bilder, wie man überhaupt sammeln muss, und erklärt, warum das Sammeln ohne Tauschen und Nachkaufen so teuer ist.

Wahrscheinlichkeitsverteilung für die Anzahl der Käufe Bearbeiten

Die Zufallsvariable

 

gibt an, wie viele Käufe gemacht werden müssen, um alle   Karten zu besitzen. Dies ist die Summe der Wartezeiten (Anzahl der Käufe) für die 1., 2., 3. …,  -te Karte, die von den bisher gekauften Karten verschieden ist. Die stochastisch unabhängigen Zufallsvariablen   sind jeweils geometrisch verteilt. Ihre Summe   besitzt eine diskrete Phasenverteilung. Die Wahrscheinlichkeitsverteilung kann durch Auswertung der zugehörigen Markow-Kette[14] oder rekursiv[15] berechnet werden.

Im allgemeineren Fall gibt die Zufallsvariable

 

an, wie viele Käufe gemacht werden müssen, um genau   der   Karten zu besitzen.

Erwartungswert Bearbeiten

 
Mittlere Anzahl S benötigter Bilder (Erwartungswert) für eine vollständige Serie aus n Bildern mit Standardabweichung (grau)

Weil die einzelnen Erwartungswerte   existieren, existiert auch der Erwartungswert   für die neue Zufallsvariable:

 

Das folgt aus der Linearität des Erwartungswerts.

Dann gilt:

 

  ist die  -te Partialsumme der harmonischen Reihe.   ist also der Faktor, der angibt, wie viel Mal mehr Bilder man kaufen muss im Vergleich zur Größe   des Sammelalbums. Für große   gilt die Näherung durch den natürlichen Logarithmus:   mit der Euler-Mascheroni-Konstante  , also

 

Der Erwartungswert für die Wartezeit im allgemeineren Fall, dass genau   der   Karten vorkommen, ist

 

Varianz Bearbeiten

Da die Wartezeiten auf die jeweils nächsten neuen Bilder geometrisch verteilt und unabhängig sind, ergibt sich mit   für die Varianz   der Anzahl der zu sammelnden Bilder die endliche Summe

 

Die letzte Ungleichung folgt aus der Konvergenz unendlichen Reihe   des sogenannten Basler Problems und der asymptotischen Entwicklung der harmonischen Reihe.

Im abgebildeten Koordinatensystem wächst die Standardabweichung mit   stark an.

Anzahl der verschiedenen Bilder Bearbeiten

Die Wahrscheinlichkeit, dass der Käufer nach   Käufen ein bestimmtes der   Bilder besitzt, sei  . Am einfachsten ist es, zuerst die Wahrscheinlichkeit zu berechnen, dass das Bild nach   Käufen noch nicht vorhanden ist, d. h. dass alle   Karten eines der anderen   Bilder zeigen. Diese Wahrscheinlichkeit ist  . Gesucht ist die Wahrscheinlichkeit für das Gegenereignis, also

 

Erwartungswert Bearbeiten

Ist die Zufallsvariable   definiert als die Anzahl der verschiedenen Bilder, die nach   Käufen vorkommen, dann ist diese Zufallsvariable binomialverteilt mit der Erfolgswahrscheinlichkeit  . Für den Erwartungswert gilt dann

 

Varianz Bearbeiten

Für die Varianz der Anzahl der verschiedenen Bilder nach   Käufen gilt

 

Nachkaufen Bearbeiten

Die meisten Hersteller bieten an, eine bestimmte Anzahl   von Bildern, häufig 50, nachzukaufen, in der Regel zu einem erhöhten Preis. Außerdem kann man gezielt bestimmte Sammelbilder kaufen, z. B. in speziellen Sammlerbörsen oder Online-Shops. Die wichtige Frage ist, wann sich Nachkaufen lohnt.

Fehlen noch   Bilder und ein bestimmtes Bild wird zum Preis von   angeboten, so lohnt sich der Kauf, wenn im Mittel die Kosten geringer sind als die Kosten für das nächste Bild beim normalen Sammeln. Sei   der normale Preis eines einzelnen Bildes, so lohnt sich der Kauf,[16] wenn

 

Wenn die Möglichkeit besteht,   Bilder nachzukaufen, so lohnt es sich am meisten, diese komplett am Ende nachzukaufen. Man müsste sonst im Mittel[17]

 

Bilder kaufen, statt   Bilder nachzukaufen, und dieser Spareffekt kann sehr groß sein.[18]

Die erwartete Anzahl der zu kaufenden Bilder reduziert sich auf

 

Dies bedeutet, dass der Faktor drastisch reduziert und in erster Näherung nur noch vom Verhältnis der Albumgröße zur Anzahl der Nachkaufbilder abhängt und nicht direkt von der Albumgröße.[16] Dies ermöglicht eine vereinfachte Berechnung der mittleren Kosten des Sammelalbums.

Tauschen Bearbeiten

Eine weitere wichtige Erweiterung ist das Tauschen von doppelt im Besitz befindlichen Karten. Dies geschieht traditionell im Freundeskreis, zunehmend aber auch in organisierten Tauschbörsen z. B. über das Internet. In der mathematischen Modellierung wird in der Regel das faire Tauschen betrachtet, d. h. es wird jeweils ein Bild gegen ein anderes getauscht. Auch wird angenommen, dass die   Tauschpartner kooperieren und solange gemeinsam sammeln und fair tauschen, bis jeder Sammler sein Album gefüllt hat. Dies entspricht dem Fall, dass ein Sammler   Sammelalben vervollständigt.

Für diesen Fall wurde bisher keine geschlossene Lösung gefunden; am Beispiel des WM-Albums wurde per Simulation gezeigt,[19] dass der Effekt erheblich ist. Asymptotisch gilt für den Mittelwert bei einer festen Anzahl   von Tauschpartnern[5]

  für  

Dies zeigt den Effekt des Tauschens: Während der erste Sammler im Mittel   Karten kaufen muss,[20] braucht jeder weitere Sammler im Mittel nur   zusätzlich zu kaufen. Mit dieser Formel kann man grob abschätzen, wie viel Geld man durch das Tauschen sparen kann. Z. B. würden sich die Kosten für zwei Tauschpartner durch faires Tauschen auf etwa 60 % der Kosten eines Einzelsammlers reduzieren.

In einem Jugend-forscht-Projekt wurde für das Szenario faires Tauschen mit Nachkaufen der Faktor   durch umfangreiche Simulationen untersucht, wobei   die mittlere Anzahl insgesamt zu kaufender Bilder aller Tauschpartner ist. Der Faktor   gibt mithin an, wie viel Mal mehr Bilder jeder Sammler am Ende im Mittel gekauft hat, als das vollständige Album Bilder enthält. Während ohne Tauschen und Nachkaufen der Faktor für einen Einzelsammler gut durch den natürlichen Logarithmus der Anzahl der Sammelbilder angenähert werden kann (bzw. dem doppelten Logarithmus für eine große Anzahl von Tauschpartnern), konnte plausibel experimentell belegt werden, dass bei fairem Tauschen mit Nachkaufen, bei festem Nachkaufprozentsatz,   strebt, wenn die Anzahl der tauschenden Sammler   strebt.[16]

Kritik der klassischen Annahmen Bearbeiten

Die Annahmen des klassischen Sammelbilderproblems werden häufig als unrealistisch kritisiert und insbesondere im Internet kursieren Gerüchte, dass die Hersteller entweder Bilder künstlich verknappen oder die Bilder nicht ordentlich mischen, d. h. zu viele Doppelte vorkommen oder manche Bilder zu selten.

Ein Journalist von Spiegel online untersuchte die Annahme A2 für das Sammelalbum zur Fußball-Weltmeisterschaft 2014 zusammen mit der Website stickermanager.com. Durch die Betrachtung des aufbereiteten Datenbestandes von 8,33 Millionen Einträgen kam der Statistiker Christian Hesse zu dem Ergebnis: „Die gravierenden Unterschiede lassen sich mit dem Wirken des Zufalls allein nicht erklären“. Dabei wurde angenommen, dass die Onlineumfrage repräsentativ ist. Allerdings galt dies nur für die deutsche Edition; z. B. bei der Schweizer Edition, die separat produziert wird und optisch unterscheidbar ist, traten die 2,36 Millionen registrierten Sticker gleichmäßig häufig auf.[21]

In einer Untersuchung des Herstellungsprozesses konnte nachgewiesen werden, dass bei der Verpackung der Sammelbilder von Topps und Panini systematische Abweichungen bzw. Muster entstehen, die sich signifikant vom zufälligen Mischen unterscheiden. Für den Verpackungsprozess der Panini-Sammelbilder konnte nachgewiesen werden, dass statt   möglicher verschiedener Päckchen (unter Annahme A1 bei Päckchengröße  ) nur maximal   verschiedene Päckchen vorkommen können. Dies wirkt sich allerdings nicht nachteilig für den Sammler aus.[8]

Dies bedeutet, dass die Annahmen des klassischen Sammelbilderproblems, insbesondere A1, in der Praxis nicht erfüllt sind.

Optimierte Sammelstrategie Bearbeiten

Für die Kombination von Tauschen und Nachkaufen unter den klassischen Annahmen gibt es bisher keine analytischen Ergebnisse. Per Simulation wurde nachgewiesen,[19] dass das Potenzial solcher optimierter Strategien erheblich ist. Es wird allerdings davon ausgegangen, dass in einem Display (das sind Verpackungen für den Handel mit 50 oder 100 Päckchen) keine Doppelten vorkommen. Dies ist allerdings nur in Einzelfällen korrekt. Stattdessen wurde nachgewiesen, dass in einem Display weniger Doppelte vorkommen, als bei zufälliger Mischung erwartet würden.[8] Außerdem sind Displays günstiger als der Kauf einzelner Päckchen.

Die Empfehlung aufgrund der Simulationsergebnisse ist die folgende optimierte Sammelstrategie:

  1. Kauf eines Displays
  2. Kauf weiterer Päckchen und Tausch möglichst vieler Bilder, bis nur noch die möglichen Nachkaufbilder fehlen
  3. Nachkauf am Schluss der maximal erlaubten Zahl von Bildern beim Hersteller

Die optimierte Strategie und die damit verbundenen Kosten wurden in einem öffentlichen Experiment des Göttinger Tageblatts für das Sammelalbum zur Fußball-Europameisterschaft 2016 mit guter Genauigkeit bestätigt.[22]

Sind in einem Display   Bilder und kommen darunter   unterschiedliche Bilder vor, so gilt[23]

 

Allerdings ist die klassische Annahme der Sammelgemeinschaften[5] heute nicht mehr realistisch, da überwiegend spontan in Tauschbörsen oder über das Internet getauscht wird.[22] Nimmt man an, dass der Sammler   fehlende Bilder nach dem Kauf des Displays vor dem Nachkaufen tauschen kann, so ergibt sich[23] mit dem Anteil   der Tauschbilder

 

Auch die Varianz V der Anzahl der zu sammelnden Bilder kann unter diesen Annahmen bestimmt werden[23]

 

Damit können die Kosten des Sammelbilderalbums für die optimierte Sammelstrategie unter realistischen Annahmen abgeschätzt werden und das Sammelbilderproblem ist unter diesen Annahmen gelöst.

Das allgemeine Sammelbilderproblem Bearbeiten

Im allgemeinen Sammelbilderproblem kann die Wahrscheinlichkeit für jedes Bild unterschiedlich sein, und zwar  . Dies ist der allgemeinste Fall einer diskreten Wahrscheinlichkeitsverteilung. Die Lösung ist nicht mehr mit elementarer Wahrscheinlichkeitsrechnung herleitbar, sondern nur mit erzeugenden Funktionen. Für den Mittelwert ergibt sich[17]

 

Hiermit kann man für einen Sammler ohne Nachkaufen die mittlere Anzahl benötigter Karten für Trading Card Games berechnen.

Beispiele Bearbeiten

Würfel Bearbeiten

 
Spielwürfel

Für pädagogische Zwecke wird häufig das Sammelbilderproblem mit Hilfe eines normalen Spielwürfels eingeführt und veranschaulicht.[24] In der Praxis könnte dies z. B.   Sammelfiguren entsprechen, die einem Produkt beigemischt sind.

Man muss durchschnittlich 14,7-mal werfen, um jede Augenzahl mindestens einmal zu bekommen,[25] denn es gilt

 

Nimmt man die Päckchengröße   an (dies entspricht Würfeln mit zwei Würfeln unter Ausschluss eines Paschs), so erhält man

 

Augenzahlen, d. h. man muss im Durchschnitt   mal würfeln, da mit einem Wurf zwei Würfel (mit verschiedenen Augenzahlen) geworfen werden. Es gilt  , d. h. man kann erwarten, durch das Päckchen im Mittel mindestens ein Bild zu sparen.

Eine einfache Erweiterung besteht darin, mit zwei unterscheidbaren Würfeln zu spielen und damit ein Sammelalbum mit   Sammelbildern zu simulieren. Für den Einsatz im Schulunterricht wurde ein entsprechendes Sammelspiel entwickelt, mit dem verschiedene Sammelstrategien ausprobiert werden können.[26] Dies entspricht dem von Rewe herausgegebenen offiziellen DFB-Sammelalbum zur Fußball-Europameisterschaft 2016, wobei die Sammelbilder hier eine Produktzugabe für je 10 € Einkaufswert darstellen und nicht nachgekauft werden können. Hier benötigt man als Einzelsammler zum Vervollständigen schon fast 150 Sammelbilder. Das Tauschen bekommt eine besondere Bedeutung, denn beim fairen Tauschen müsste jeder weitere Sammler dann nur etwa 67 Bilder sammeln, und das wäre gleichzeitig auch der Grenzwert bei sehr vielen Tauschpartnern.[5]

Pokémon Bearbeiten

 
Pokémon-Sammelkarten

Angenommen, es gäbe 150 verschiedene Motive auf den Pokémon-Karten, die man kaufen muss, und die Karten seien einzeln verpackt. Wenn es sich um ein klassisches Sammelalbum handelte, dann müsste ein Einzelsammler ohne Nachkaufen im Mittel ungefähr 839 Karten kaufen.

Allerdings ist Pokémon in Wirklichkeit ein Trading Card Game, d. h. es gibt mehr als 5 unterschiedliche Kartentypen mit unterschiedlichen Seltenheiten, von normal bis extrem selten. Den großen Unterschied kann man schon bei zwei Kartentypen erkennen, bei denen z. B. 30 von 150 Karten halb so häufig auftreten wie im klassischen Sammelbilderspiel. Dann müsste der Einzelsammler schon im Mittel etwa 1213 Karten kaufen. Gibt es 10 sehr seltene Karten, die zehnmal seltener auftreten, dann brauchte er sogar etwa 4372 Karten. Dies bedeutet, dass Nachkaufen und Tauschen noch eine größere Bedeutung besitzen als bei den klassischen Sammelbildern.

Fußballsammelbilder Bearbeiten

Das Paninialbum zur Fußball-Europameisterschaft 2016 mit 680 Bildern kostet mindestens 95,20 € bei einem regulären Preis von 14 Cent pro Bild. Dies wäre gleichzeitig auch der erwartete Preis für das letzte fehlende Bild, wenn man es normal sammeln würde. Für den Faktor gilt  . Dies ergibt für einen Einzelsammler ohne Tauschen und Nachkaufen eine mittlere Anzahl zu kaufender Bilder von etwa 4828 (d. h. 965,5 Päckchen) und entspricht etwa 676 €. Aber auch die Standardabweichung ist groß (869 Bilder), d. h. in etwa 95,4 % aller Fälle müsste ein Einzelsammler zwischen 3090 und 6566 Bilder sammeln. Dies verdeutlicht, dass unbedingt getauscht und nachgekauft werden sollte, um die Kosten zu verringern.

Der Einfluss der Päckchen ist gering, bei Fünfer-Päckchen beträgt   nur ungefähr 0,016, d. h. bei etwa jedem 60. Päckchen müsste man ein doppeltes Bild erwarten, wenn die Karten zufällig gemischt würden. Dieser Einfluss wird häufig überschätzt oder falsch eingeschätzt.[27] Bei exakter Rechnung muss man im Mittel etwa 963,2 Päckchen kaufen,[28] d. h. die Ersparnis beträgt im Mittel nur 12 Bilder und kann daher auch in Anbetracht der großen Standardabweichung praktisch vernachlässigt werden.

Kann man 50 Bilder nachkaufen, spart man etwa 3060 Bilder, d. h. dann braucht man näherungsweise im Mittel nur 1768 Karten zu kaufen sowie 50 Nachkaufkarten. Dies kostet dann etwa 257 € bei 20 Cent pro Nachkaufbild (ohne Berücksichtigung des Päckchen-Effekts). Auch die Standardabweichung sinkt auf etwa 82 Bilder, d. h. in etwa 95,4 % aller Fälle müsste ein Einzelsammler zwischen 1604 und 1936 Bilder sammeln.

Bei einer unendlich großen Sammelgemeinschaft wäre der Faktor für jeden Sammler etwa 1,88, d. h. jeder müsste im Mittel etwa 1275 Bilder kaufen, was einem Preis von etwa 179 € entspricht. Für das Album zur Fußball-Weltmeisterschaft 2014 wurde abgeschätzt,[19] dass man mit einer optimierten Sammelstrategie das Sammelalbum für etwa 125 € füllen kann. Berücksichtigt man die Preiserhöhung und die zusätzlichen Sammelbilder des EM-Albums, so ergibt sich mit dieser Strategie ein Preis von etwa 150 €.[29] In einem öffentlichen Sammelexperiment wurde dies mit 155 € Kosten bestätigt.[22] Im Grenzfall des konsequenten Nachkaufens mit einer unendlich großen Sammelgemeinschaft würden sich 98,20 € pro Sammler ergeben.

Das Paninialbum zur Fußball-Weltmeisterschaft 2018 unterscheidet sich mit 682 Bildern praktisch nicht vom Album zur Europameisterschaft.[30] Der wesentliche Unterschied ist der höhere Preis mit 18 Cent pro Bild, d. h. das Album kostet regulär mindestens 122,76 €. Alle anderen klassischen Ergebnisse können durch einfache Umrechnung abgeleitet werden. Unter realistischen Annahmen, z. B.  ,   und einem Preis von 75 € pro Display, ergeben sich für die optimierte Strategie mittlere Kosten von etwa 184 €.[23] Die Streuung ist relativ klein, 99 % der Sammler könnten unter diesen Annahmen das Album für Kosten zwischen 176 € und 193 € füllen. Verzichtet der Sammler auf das Tauschen, muss er dagegen im Mittel 276 € bezahlen. Tauscht er alle Doppelten, so braucht er im Mittel nur 111 €. Ähnliche Ergebnisse wurden per Simulation bestätigt.[31]

Einzelnachweise Bearbeiten

  1. a b c George Pólya: Eine Wahrscheinlichkeitsaufgabe in der Kundenwerbung. ZAMM – Zeitschrift für Angewandte Mathematik und Mechanik, Band 10, Heft 1, 1930, S. 96–97.
  2. NewsTimes: Commemorative Dixie cups can be collectibles. Abgerufen am 28. April 2016.
  3. Kellogs Memorabilia and Collectibles. Abgerufen am 28. April 2016.
  4. Andrei Andrejewitsch Markow: Wahrscheinlichkeitsrechnung. Teubner, Berlin, 1912, S. 101–108.
  5. a b c d Donald J. Newman, Lawrence Shepp: The double dixie cup problem. American Mathematical Monthly 67 (1960), S. 58–61.
  6. William Feller: An introduction to probability theory and its applications. Band 1: Wiley, New York 1950, ISBN 0-471-25708-7, S. 225.
  7. a b c Norbert Henze: Stochastik für Einsteiger. 10. Auflage. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-658-03076-6, S. 192ff.
  8. a b c d Niklas Braband, Sonja Braband und Malte Braband: Das Geheimnis der Fifimatic. Junge Wissenschaft, Nr. 114, 2017, S. 26–32.
  9. Negative Binomial Distribution, Marseken, Susan F., Surhone, Lambert M., Timpledon, Miriam T., Betascript Publishing
  10. Steffi Kroll: Kombinatorik
  11. Norbert Henze: Stochastik für Einsteiger. 10. Auflage. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-658-03076-6, S. 187–196.
  12. Wolfgang Stadje: The Collector’s Problem with Group Drawings. Advances in Applied Probability, Vol. 22, No. 4 (Dec., 1990), pp. 866–882.
  13. Elke Warmuth, Walter Warmuth: Elementare Wahrscheinlichkeitsrechnung: Vom Umgang mit dem Zufall. Vieweg + Teubner 1998, ISBN 978-3-519-00225-3, S. 128–129.
  14. Sammelbilderproblem systematisch lösen mithilfe der Schulmathematik (PDF; 358 kB).
  15. Andreas Binzenhöfer, Tobias Hoßfeld: Warum Panini Fußballalben auch Informatikern Spaß machen. In: Hans-Georg Weigand (Hrsg.): Fußball – eine Wissenschaft für sich. Königshausen & Neumann, Würzburg 2006, S. 181–191.
  16. a b c Niklas Braband und Sonja Braband: Nicht mehr über Sammelbilder ärgern! Junge Wissenschaft, Ausgabe Nr. 110, 2016, S. 16–24.
  17. a b Philippe Flajolet, Danièle Gardy, Loÿs Thimonier: Birthday paradox, coupon collectors, caching algorithms and self-organizing search. (GZIP; 77 kB) In: Discrete Applied Mathematics. Vol. 39, 1992, S. 207–229.
  18. Holger Dambeck: EM-Sticker: Mathe-Tricks machen Panini-Sammeln günstiger. Spiegel Online, 31. Mai 2012.
  19. a b c Sylvain Sardy und Yvan Velenik: Paninimania: sticker rarity and cost-effective strategy. Swiss Statistical Society, Bulletin nr. 66 (2010), S. 2–6.
  20. Doron Zeilberger: How Many Singles, Doubles, Triples, Etc., Should The Coupon Collector Expect?
  21. Panini-WM-Sticker: Millionen-Stichprobe zeigt massive Ungleichverteilung. Spiegel online, 19. Juni 2014, abgerufen am 19. Juni 2014.
  22. a b c Andreas Fuhrmann: Fuhrmanns EM-Stickerblog. Abgerufen am 27. August 2016
  23. a b c d Niklas Braband, Sonja Braband, Malte Braband: A Useful Solution of the Coupon Collector's Problem. 26. Februar 2017, arxiv:1702.08874 [math].
  24. Elke Warmuth, Stefan Lange: Mathematik Anders Machen – Eine Initiative zur Lehrerfortbildung. Abgerufen am 30. April 2016.
  25. Holger Dambeck: WM-Album. So teuer kommt der Sammelbildwahn. Spiegel Online, 30. Juni 2011.
  26. Frank Förster: Alle (zwei) Jahre wieder: Fußballbilder. In: Hans Humenberger und Martin Bracke (Hrsg.): Neue Materialien für einen realitätsbezogenen Mathematikunterricht 3: ISTRON-Schriftenreihe (Realitätsbezüge im Mathematikunterricht). Springer, Heidelberg 2016, S. 58–67.
  27. Wales Online: A maths genius worked out exactly how much it will cost to fill your Panini Euro 2016 album. Abgerufen am 4. Mai 2016.
  28. Cross Validated: Expectation of collecting stickers in groups. Abgerufen am 4. Mai 2016.
  29. Das Einmaleins der Panini Sticker. In: dw.com. Deutsche Welle, 12. Mai 2016, abgerufen am 14. Mai 2016.
  30. Presse-Factsheet. Panini Verlags GmbH, 19. März 2018, abgerufen am 27. März 2018 (deutsch).
  31. Laurie Belcher: Football Crazy, Probability Mad: How much does it really cost to complete the World Cup 2018 Sticker album? In: Goodscienceblog. 12. März 2018, abgerufen am 30. März 2018.