Histogram of oriented gradients

Hilfsmittel zur Erkennung von Objekten in digitalen Fotos

Das Histogram of oriented gradients (HOG) ist ein Hilfsmittel zur Merkmalsgewinnung in der Bildverarbeitung. Es wird insbesondere zur Detektion von Personen auf Fotos verwendet.[1] In einer Arbeit bei Udacity wurde im Jahr 2017 auch der Einsatz zur Erkennung von bewegten Kraftfahrzeugen in einem Video demonstriert.[2][3] Zur Objekterkennung ist immer ein Trainingsvorgang erforderlich. Die Größe des Trainingsdatensatzes hat einen Einfluss auf die Qualität der Objekterkennung. Bei HOG benötigt dieses Training deutlich weniger Beispiele und kann deutlich schneller als z. B. bei Haar-Wavelets durchgeführt werden.[4]

Links das Original und rechts das mit Scikit-image berechnete und visualisierte HOG

Der grundlegende Gedanke ist, dass Aussehen und Form von Objekten innerhalb eines Fotos auch ohne näheres Wissen über die Positionen von Kanten oder Ecken durch die Verteilung der lokalen Intensität oder der Anordnung der Kanten dargestellt werden kann. Daher wird das Bild in Teilbereiche zerlegt und für jeden Teilbereich werden die Orientierungen aller Kanten bestimmt und deren Anzahl als Histogramm gespeichert.

Eine weitere Anwendung ist, dass auf diese Weise die Ähnlichkeit zwischen verschiedenen Bildern bestimmt werden kann – ähnlich wie bei der Scale-invariant feature transform (SIFT).

Robert K. McConnell hat das grundsätzliche Verfahren bereits 1986 in einem Patent beschrieben,[5] bekannt wurde das Konzept und die Bezeichnung „Histogram of oriented gradients“ durch eine Veröffentlichung von Navneet Dalal and Bill Triggs im Jahr 2005,[1] welche zu diesem Zeitpunkt am Institut national de recherche en informatique et en automatique forschten.

Software Bearbeiten

 
Mit Dlib erstellte Visualisierung eines trainierten HOG-Detectors zur Gesichtserkennung.

In freien Software-Bibliotheken zur Bildverarbeitung wie Scikit-image[6], OpenCV[7][8] und Dlib[9] sind Methoden zur Berechnung des HOG enthalten.

Literatur Bearbeiten

  • Dalal, Navneet; Triggs, Bill. Histograms of oriented gradients for human detection. In: Computer Vision and Pattern Recognition, 2005. CVPR 2005. IEEE Computer Society Conference on. IEEE, 2005. S. 886–893. doi:10.1109/CVPR.2005.177

Einzelnachweise Bearbeiten

  1. a b Navneet Dalal and Bill Triggs: Histograms of Oriented Gradients for Human Detection. Abgerufen am 5. Januar 2019 (englisch).
  2. Mithi: Vehicle Detection with HOG and Linear SVM. In: Towards Data Science. 28. März 2017, abgerufen am 5. Januar 2019 (englisch).
  3. Mithi Sevilla: A vehicle detection and tracking pipeline with OpenCV, histogram of oriented gradients (HOG), and support vector machines (SVM). In: GitHub. 25. Dezember 2018, abgerufen am 5. Januar 2019 (englisch).
  4. Davis King: Dlib 18.6 released: Make your own object detector! 3. Februar 2014, abgerufen am 7. Januar 2019 (englisch).
  5. Patent US4567610A: Method of and apparatus for pattern recognition. Angemeldet am 22. Juli 1982, veröffentlicht am 28. Januar 1986, Anmelder: Wayland Research Inc, Erfinder: Robert K. McConnell.
  6. Histogram of Oriented Gradients. In: scikit-image – docs. Abgerufen am 5. Januar 2019 (englisch).
  7. HOGDescriptor Struct Reference. In: OpenCV. Abgerufen am 5. Januar 2019 (englisch).
  8. Histogram of Oriented Gradients. In: Learn OpenCV. Abgerufen am 5. Januar 2019 (englisch).
  9. Image Processing. In: dlib C++ Library. Abgerufen am 5. Januar 2019 (englisch).