Google a annoncé la semaine dernière qu'il commençait à utiliser de façon significative l'OCR (Optical Character Recognition pour Reconnaissance Optique de Caractères) pour scanner des documents papier afin de reconnaître les textes qui y étaient imprimés. Tout document papier ainsi reconnu devient alors un document numérique "comme un autre", susceptible d'apparaître dans les pages de résultats du moteur de recherche.

Les résultats sont alors présentés sous la forme d'un fichier PDF, la version originale étant visualisable grâce au lien "View as HTML" :

Google OCR 1
 
Google OCR 2
 
Source de l'image : Google

Plus d'infos :
http://www.google.com/

Source(s) :
A picture of a thousand words? (Google)

Articles connexes sur ce site :
- Google lorgne vers l'OCR (13 septembre 2006)
- Un brevet sur la reconnaissance de textes dans les images et les vidéos pour Google (7 janvier 2008)

Toutes les pages du réseau Abondance pour la requête ocr...
Toutes les pages du Web pour la requête ocr...