MNIST-Datenbank

Sammlung handgeschriebener Ziffern

Die MNIST-Datenbank (Modified National Institute of Standards and Technology database[1]) ist eine öffentlich verfügbare Datenbank von handgeschriebenen Ziffern. Wobei jede Ziffer als 28 × 28 Pixel großes Graustufen-Bild gespeichert ist[1]. Die MNIST-Datenbank besteht aus 60.000 Beispielen im Trainingsdatensatz und 10.000 Beispielen im Testdatensatz. Der Datensatz dient dem Trainieren von Klassifikatoren, unter anderem Convolutional Neural Networks, im weiteren Sinne dem Maschinellen Lernen bzw. der Künstlichen Intelligenz. Eine der MNIST-Datenbank nachempfundene Bilddatenbank ist die Fashion-MNIST[2] von Zalando, ebenfalls bestehend aus 60.000 Beispielen im Trainingsdatensatz und 10.000 Beispielen im Testdatensatz. François Chollet, einer der Keras-Hauptentwickler sieht MNIST nicht mehr als relevanten Benchmark[3] an, allerdings wird die MNIST-Datenbank gerne als Einsteigerbeispiel für maschinelles Lernen[4][5] verwendet.

Beispiele aus dem MNIST-Testdatensatz

Einzelnachweise Bearbeiten

  1. a b THE MNIST DATABASE of handwritten digits. Yann LeCun, Courant Institute, NYU Corinna Cortes, Google Labs, New York Christopher J.C. Burges, Microsoft Research, Redmond, abgerufen am 22. Juli 2020 (englisch).
  2. Fashion-MNIST. zalando, abgerufen am 23. Juli 2020 (englisch).
  3. Lots of issues with MNIST, but most of all, it is really not representative of CV tasks. Please at least try CIFAR10, of comparable size. François Chollet (Twitter tweet), abgerufen am 23. Juli 2020 (englisch).
  4. Intro to TensorFlow for Deep Learning. Abgerufen am 23. Juli 2020 (englisch).
  5. Tutorial. Abgerufen am 23. Juli 2020 (englisch).