Je lisais récemment un article qui expliquait comment, sur la base d'informations très sommaires, des internautes utilisateurs "anonymes" des moteurs de recherche, avaient été retrouvés. Reprenons les faits : l'été dernier, AOL a mis en ligne de façon "accidentelle" un fichier de requêtes effectuées sur son moteur de recherche aux Etats-Unis. Ce fichier contenait deux choses : les requêtes saisies sur le moteur et, pour chacune d'entre elle, un numéro d'internaute. On savait ainsi que, par exemple, l'utilisateur 123456, avait saisi tel et tel mot clé. Bien entendu, aucun utilisateur n'était décrit sous une autre forme que ce "matricule"... Mais on avait à disposition l'ensemble des requêtes effectuées par une seule et même personne. Et bien, cela a suffi pour que quelques observateurs fassent des recherches et arrivent à identifier certaines personnes, retrouvant leur nom, leur adresse, leur numéro de téléphone rien qu'en analysant les recherches qu'elles avaient faites sur le moteur.

 

A la réflexion, on se dit que, effectivement, nos mots clés peuvent nous "trahir" et révéler bien des choses sur nous... Pensez-y lorsque vous taperez vos prochaines requêtes et vous verrez... En allant plus loin, je me dis même que les moteurs de recherche nous connaissent vraiment très bien... Trop bien ? Possible... En effet :

 

- Ils connaissent nos goûts et nos attentes au travers des mots clés que nous tapons dans leurs formulaires de recherche. De plus, ils savent quand nous les saisissons et ont donc quelques informations sur les moments pendant lesquels nous sommes devant notre écran...

 

- Ces centres d'intérêts, ils les connaissent non seulement au travers du moteur "Web" classique, mais aussi au travers de nos investigations sur les moteurs d'actualités (et leur système d'alertes par mail, redoutables révélateurs de nos thèmes de veille), sur les livres, les catalogues, le cinéma, les blogs, les images, les vidéos, et j'en passe bien d'autres...

 

- Ils savent aussi ce que l'on achète en ligne au travers des comparateurs de prix ou tout simplement des moteurs web que nous utilisons pour trouver des informations sur des produits particuliers... Des outils comme les solutions de paiement Paypal ou Google Checkout peuvent aussi donner des informations intéressantes...

 

- Les moteurs savent bien sûr tout de notre équipement informatique : PC/Mac, système d'exploitation utilisé, taille de l'écran, navigateur, etc. puisque ces informations sont fournies par le protocole Web. Autant de données commercialement intéressantes...

 

- Les barres d'outils et les clics que nous faisons dans les pages de résultats dévoilent les sites que nous allons visiter. Y pensons-nous toujours lorsque nous décidons de nous "divertir" en ligne ? ;-))

 

- La géolocalisation qui, au vu des enjeux publicitaires énormes qu'elle génére, fait de plus en plus de progrès, indique, parfois à quelques kilomètres près, où nous nous situons géographiquement parlant...

 

- Avec les systèmes de "comptes utilisateurs" que proposent tous les grands moteurs / portails actuels, ce sont bon nombre de données personnelles que nous indiquons : adresse postale, numéro de téléphone, parfois, sexe, date de naissance, etc. Voire nos coordonnées bancaires si l'on veut être payé par virement lorsqu'on affiche des liens contextuels sur nos sites...

 

- Les webmails, outils de partage d'informations et messageries instantanées dévoilent nos connaissances et nos relations, personelles et professionnelles... Et que dire des outils communautaires et de "réseaux sociaux" ?

 

- Quant à notre agenda, des outils comme Google Calendar s'en chargent très bien... hébergés sur les serveurs du moteur et pas sur nos machines...

 

- Bien entendu, les fichiers de nos ordinateurs sont lus par les outils de "Desktop Search" disponibles, et nos fichiers Word et Excel vont de plus en plus être disponibles en ligne, partageables par plusieurs utilisateurs et... hébergés à distance sur les serveurs des moteurs. Donc potentiellement lisibles à tout moment par un tiers...

 

- Et si l'on parlait de nos déplacements personnels ou professionnels ? Ne pensez-vous pas que des outils comme Google Maps, Virtual Earth ou Yahoo! Local fournissent de très nombreuses informations aux outils de recherche ?

 

- Et les moteurs verticaux, spécifiques à une thématique donnée, comme ceux que proposent certains outils spécialisés pour les enfants ou les étudiants ? Et oui, nos chères petites têtes blondes n'y échappent pas....

 

- Et encore, je passerai sous silence nos "déviances" analysables pourtant sur des moteurs de recherche d'images et de vidéos car chacun sait bien que cela ne nous régarde pas... 🙂

 

Bref, à la réflexion, il est étonnant de voir à quel point les moteurs de recherche actuels peuvent, potentiellement, obtenir des informations d'ordre privé sur nous. Bien sûr, cela ne signifie pas qu'il le font, qu'ils recoupent toutes ces données, et il n'est nullement l'objet de ce post de dire que les moteurs sont des "Big Brother" à la solde des gouvernements et qui savent tout de nous à la minute près.

 

Le but, ici, est plutôt de relever l'incroyable potentiel que détiennent ces outils en matière de pénétration de nos vies privées et les éventuelles dérives que cela peut générer. Il ne faut pas l'oublier... Et cela ne concerne pas que Google, qui est assez régulièrement attqué sur ce sujet. La problématique est identique pour TOUS les moteurs. Peut-être faudra-t-il que des groupes de travail soient créés, si ce n'est déjà fait, pour appréhender ce phénomène qui peut bien nous dépasser rapidement et proposer quelques gardes-fous salutaires...

 

Bien entendu, le but de ce post n'est pas nonplus d'instaurer une panique dans la tête des utilisateurs. Je reste moi-même un inconditionnel des moteurs de recherche que j'utilise à longueur de journée. Mais je me dis que je devrais peut-être parfois faire attention à la façon dont je m'en sers car parfois, j'ai l'impression qu'ils me connaissent mieux que je ne me connais moi-même...