Google vient d'annoncer le rachat de la société reCaptcha, spécialisée dans la lutte contre la fraude anti-robots dans les formulaires web. Sa technologie, basée sur le scan de vieux ouvrages et d'articles de presse papier, pourrait être utilisée à l'avenir dans de nombreux outils du moteur de recherche ...

Google vient d'annoncer officiellement sur son blog le rachat de la société reCaptcha, qui propose un outil gratuit de lutte contre le spam par les robots dans les formulaires web, en demandant de ressaisir à la main une suite de lettres ou de chiffres proposés dans une image.

Ce procédé, couramment appelé "Captcha" (pour Completely Automated Public Turing test to Tell Computers and Humans Apart) permet d'être sûr qu'il s'agit d'un être humain, et non d'un robot, qui envoie les données au site web. Le système reCaptcha, à base de scan de mots issus de la presse papier et de vieux ouvrages (rendant difficile la reconnaissance automatique) est utilisé par plus de 100 000 sites web de par le monde. Google devrait utiliser cette technologie pour de nombreux outils parmi lesquels Google books et et Google News Archive Search.

reCaptcha
Source de l'image : Google
reCaptcha 2
Source de l'image : reCaptcha

Plus d'infos :
- http://recaptcha.net/
- http://fr.wikipedia.org/wiki/CAPTCHA

Source(s) :
- Teaching computers to read: Google acquires reCAPTCHA (Google)

Articles connexes sur ce site :
- Le générateur de mots clés de Google n'est pas très poli... (5 février 2008)
- Google lorgne vers l'OCR (13 septembre 2006)
- Google commence à scanner des documents et à les proposer dans ses résultats (4 novembre 2008)
- Un brevet sur la reconnaissance de textes dans les images et les vidéos pour Google (7 janvier 2008)

Toutes les pages du réseau Abondance pour la requête OCR...

Toutes les pages du Web pour la requête OCR...