Nous continuons notre série de questions/réponses avec Google en abordant un point dont il est souvent question sur le web et les forums spécialisés : l'impact de la validation W3C d'un site sur le référencement Google.

En effet, le W3C a mis en place un validateur qui permet d'indiquer combien d'erreurs et d'alertes (s'il y en a) une page web renvoie en fonction des standards HTML du W3C. Si aucune erreur et/ou alerte n'est renvoyée, cela signifie que la page en question est 100% conforme au standard.

Certains référenceurs recommandent à leurs clients d'avoir un site web 100% conforme HTML. D'autres demandent à ce que le site se rapproche le plus possible d'une validité parfaite.

On entend également dire parfois que le taux de validité W3C serait un critère de pertinence pour Google. Plus une page est fidèle au standard W3C, mieux elle serait classée dans les résultats.

Nous avons donc posé la question au service "Search Quality" de Google : qu'en est-il de ce critère de validité W3C ? Le fait qu'une page passe avec succès le test du validateur W3C peut-il faire en sorte qu'elle soit mieux classée dans les résultats du moteur de recherche ?...

Question Abondance : Le fait que les pages d'un site soient 100% valides W3C apporte-t-il un plus en termes de "ranking" sur Google (en dehors d'autres avantages apportés par cette compatibilité comme le bon affichage dans les navigateurs, la bonne analyse du code, la conformité avec un standard reconnu, etc.) ?
 

La réponse de Google : Il peut s'avérer utile et positif d'utiliser un code conforme aux standards W3C, car il sera plus facilement explorable par les moteurs de recherche, et plus facile à manipuler par le(s) webmaster(s). Toutefois, les pages 100% valides W3C ne sont pas directement favorisées dans leur classement sur Google.
Nous conseillons aux webmasters de se focaliser sur l'utilisateur avant tout, et faire en sorte que les pages soient compatibles avec différents navigateurs et appareils (mobiles, tablettes, pc, etc) est à notre sens prioritaire par rapport à la validation W3C.
Pour plus d'informations sur le sujet, nous conseillons les vidéos suivantes :

- Why doesn't google.com validate? :

- Is HTML validation necessary for ranking? :

Notre commentaire : la réponse de Google est assez claire : le fait qu'une page soit valide ou non lors du passage au test W3C n'est pas un critère de pertinence de Google et ne fera pas en sorte que la page soit mieux positionnée.
En revanche, il sera intéressant d'effectuer ce test et de lister les erreurs renvoyées pour voir si certaines d'entre elles ne peuvent pas perturber l'analyse du code par le moteur. Une balise de lien (A) ouverte et non fermée, par exemple (et c'est le cas le plus fréquent), peut très bien s'afficher dans le navigateur mais poser quelques problèmes à Google ou Bing lorsqu'ils liront le code. Mais, à notre sens, la majeure partie des erreurs renvoyées par le validateur n'ont aucun impact en SEO. Cela ne veut pourtant pas dire qu'il ne faut pas s'en assurer...
Mais, une fois d'éventuelles erreurs de code détectées et pouvant perturber cette analyse, ne comptez pas sur une validation W3C à 100% pou rêtre mieux classé sur Google...
Ceci dit, nous ne prenons en compte ici que l'aspect "référencement naturel", il existe bien sûr bien d'autres motivations pour vouloir proposer en ligne un code "propre", ce qui est une bonne chose...
Mais l'impact sur le référencement est certainement très faible. Il existe d'ailleurs de très nombreux sites renvoyant plusieurs centaines d'erreurs au validateur W3C qui sont extrêmement bien référencés...

Rappel des précédentes Questions à Google :
1. Les underscores dans les URL
2. Web 2.0, Contenu caché et pénalités Google
3. La pondération des liens entrants - ou backlinks
4. Les redirections multiples en cascade
5. Modification de la vitesse de crawl des spiders
6. Référencement et hébergement mutualisé
7. Sitemaps et nombre d'URL indexées
8. Référencement et redirections 301
9. Google prend-il en compte l'attribut Longdesc ?
10. Le nombre de pages d'un site web indexées par Google
11. Mots clés et Google Webmaster Tools
12. Les 3 chiffres dans les URL sont-ils obligatoires pour être indexé dans Google Actualités ?
13. Google et le Content Spinning
14. Duplicate Content Dust et balise canonical