Hauptmenü öffnen

Wikipedia β

Logo von reCAPTCHA
Beispiel einer reCAPTCHA-Eingabebox

reCAPTCHA ist ein Captcha-Dienst. Der vollautomatische öffentliche Turing-Test soll sicherstellen, dass eine bestimmte Handlung im Internet von einem Menschen und nicht von einem Bot vorgenommen wird. reCAPTCHA wird gleichzeitig zum Digitalisieren von Büchern, Zeitschriften und von Hausnummern und Straßennamen aus Google Street View verwendet.

Inhaltsverzeichnis

GeschichteBearbeiten

Laut einer Hochrechnung der Carnegie Mellon University verbringen Internetnutzer weltweit pro Tag 150.000 Stunden damit, Captchas zu lösen.[1] Die Regelmäßigkeit und Unentgeltlichkeit dieser Arbeitsleistung führte zu der Idee, sie für sinnvolle Zwecke einzusetzen. Der Informatiker Luis von Ahn, der im Jahr 2000 maßgeblich an der Erfindung des CAPTCHA-Verfahrens beteiligt war, entwickelte daraus im Jahr 2007 ein System namens reCAPTCHA, das bei der Buch-Digitalisierung eingescannte Wörter, die die Texterkennungssoftware nicht erkennt, durch die Eingabe von CAPTCHAs optimiert. Das System bezog seine Wörter anfangs aus einem Bereich des Internet Archive, der sich mit dem Digitalisieren von Büchern beschäftigt. Zudem half der Dienst bei der Digitalisierung des Archivs aller verfügbaren 130 Jahrgänge der New York Times:[2] Innerhalb weniger Monate nach Beginn dieses Projekts im Jahr 2009 waren bereits 20 Jahrgänge digitalisiert.

Am 16. September 2009 wurde bekannt, dass Google das Unternehmen reCAPTCHA gekauft hat.[3] Google profitiert dadurch, weil es Teil seines Betätigungsfeldes ist, Bücher und andere Druckerzeugnisse zu digitalisieren.[4][5] Im März 2012 wurde bestätigt, dass Google inzwischen auch Hausnummern von Google Street View erkennen lässt, um die Datenbasis für Google Maps zu optimieren.[6][7] Seit etwa Oktober 2015 werden auch vermehrt Straßenschilder angezeigt, deren erkannte Straßennamen ebenfalls zu Verbesserung von Street View benutzt werden.[8] Teilweise werden nur noch diese Straßenschilder und Hausnummern zur Erkennung angezeigt und nicht mehr Ausschnitte aus eingescannten Büchern.

Funktion und VerwendungBearbeiten

Auf jedem CAPTCHA sind zwei Wörter abgebildet: Eines ist dem System bereits bekannt und bestätigt, das andere ist ein unerkanntes Wort aus einem Digitalisierungsprojekt.

Der Nutzer wirkt durch dieses CAPTCHA kostenlos am Schrifterkennungsprojekt reCAPTCHA mit (siehe Crowdsourcing). Es ist aber durch die Eingabe nur eines Wortes auch möglich das Captcha erfolgreich zu lösen. Dazu muss das aus einem Digitalisat stammende Wort weggelassen werden. Es gibt Plugins zur Integration in populäre Webapplikationen wie Lifetype, WordPress, TYPO3, Drupal, vBulletin, phpBB, Joomla oder MediaWiki. Viele Millionen Menschen beteiligen sich so an dem Projekt, ohne die genaue Absicht des Projekts zu kennen, und stellen ihre Leistung zur Verfügung.

Es lässt sich statistisch herausfinden, ob die Eingabe eines Benutzers korrekt ist: Die Wortkombination wird innerhalb eines sehr kurzen Zeitraums mehreren Benutzern zugleich präsentiert und die häufigste Eingabe wird als richtig angenommen.

No CAPTCHA reCAPTCHABearbeiten

Im Jahr 2013 begann reCAPTCHA damit, verhaltensorientierte Analysen in CAPTCHAs zu implementieren. Hierbei werden unter anderem Browser-Interaktionen des Benutzers untersucht, um eine Wahrscheinlichkeit zu errechnen, ob der Benutzer ein Mensch ist. Wird der Benutzer mit hoher Wahrscheinlichkeit als Mensch identifiziert, wird ein einfaches Auswahlfeld “I’m not a robot” präsentiert, welches mit einem Mausklick bestätigt werden muss. In Fällen, in denen der Aufrufer nicht mit hinreichender Sicherheit als Mensch identifiziert werden kann, wird zusätzlich ein im Vergleich zu älteren Versionen „wesentlich schwierigeres“ Captcha angezeigt. Ende 2014 begann Google damit, den neuen Mechanismus in den meisten seiner öffentlich zugänglichen Dienste zu verwenden.[9]

WeblinksBearbeiten

  Commons: ReCAPTCHA – Sammlung von Bildern, Videos und Audiodateien

EinzelnachweiseBearbeiten

  1. What is reCAPTCHA. Carnegie Mellon University, 27. Januar 2004. [31. März 2006]
  2. Jessie Scanlo: Luis von Ahn: The Pioneer of "Human Computation", BusinessWeek, 3. November 2008, Zugriff am 28. Januar 2012
  3. Teaching computers to read: Google acquires reCAPTCHA. In: Official Google Blog. 16. September 2009, abgerufen am 5. November 2011 (englisch).
  4. googleblog.blogspot.com
  5. zdnet.de
  6. Google nutzt Streetview-Fotos für reCAPTCHA
  7. Sarah Perez: Google Now Using ReCAPTCHA To Decode Street View Addresses. techcrunch.com, 29. März 2013, abgerufen am 9. September 2013
  8. Stop a bot. Improve a map. reCAPTCHA improves our knowledge of the physical world by creating CAPTCHAs out of text visible on Street View imagery As people verify the text in these CAPTCHAs, this information is used to make Google Maps more precise and complete. So if you’re a Google Maps user, your experience (and everyone else’s) will be even better. google.com; abgerufen am 6. Februar 2016
  9. Are you a robot? Introducing “No CAPTCHA reCAPTCHA”. In: Google Online Security Blog. 3. Dezember 2014, abgerufen am 13. August 2015 (englisch).


Produkte der Google Inc. (Liste)
Suchwerkzeuge: Google | Google Shopping | Google Scholar | Google Goggles
Webanwendungen:
Datenorganisation: Blogger.com | YouTube | Google Developers | Google Fotos | Google Kalender | Google-Konto | Google Drive | Picasa-Webalben | Panoramio | Google Sites | Google Play | Google Wallet | Google Keep
Kommunikation: Google Groups | Gmail | Inbox by Gmail | Google Kontakte | Google Talk | Hangouts | Google+
Informationsangebote: Google News | Google Books | Google Maps | Google Übersetzer | Google Street View | Google Trends | Art Project
Weiteres: AdWords | AdSense | Analytics | G Suite | App Engine | FeedBurner | Page Speed | reCAPTCHA | Takeout | VirusTotal
Software
Toolbar | Earth | Picasa | Google Chrome | Google Chrome OS | Google Now
Android: Android | Google Play Store | Android Wear | Android TV | Android Auto | Android Pay
Hardware:
Pixel | Nexus | Chromebook | Chromecast | Google Glass | Google Cardboard
Sonstige Dienste:
Google Guice | Go | SPDY | WebM | WebP | Dart
Googleplex (Unternehmenssitz) | Google File System | Google Summer of Code | Google.org | Google I/O