Nous continuons notre série de questions/réponses avec Google en abordant un point dont il est souvent question sur le web et les forums spécialisés : l'impact de la validation W3C d'un site sur le référencement Google.
En effet, le W3C a mis en place un validateur qui permet d'indiquer combien d'erreurs et d'alertes (s'il y en a) une page web renvoie en fonction des standards HTML du W3C. Si aucune erreur et/ou alerte n'est renvoyée, cela signifie que la page en question est 100% conforme au standard.
Certains référenceurs recommandent à leurs clients d'avoir un site web 100% conforme HTML. D'autres demandent à ce que le site se rapproche le plus possible d'une validité parfaite.
On entend également dire parfois que le taux de validité W3C serait un critère de pertinence pour Google. Plus une page est fidèle au standard W3C, mieux elle serait classée dans les résultats.
Nous avons donc posé la question au service "Search Quality" de Google : qu'en est-il de ce critère de validité W3C ? Le fait qu'une page passe avec succès le test du validateur W3C peut-il faire en sorte qu'elle soit mieux classée dans les résultats du moteur de recherche ?...
Question Abondance : Le fait que les pages d'un site soient 100% valides W3C apporte-t-il un plus en termes de "ranking" sur Google (en dehors d'autres avantages apportés par cette compatibilité comme le bon affichage dans les navigateurs, la bonne analyse du code, la conformité avec un standard reconnu, etc.) ? La réponse de Google : Il peut s'avérer utile et positif d'utiliser un code conforme aux standards W3C, car il sera plus facilement explorable par les moteurs de recherche, et plus facile à manipuler par le(s) webmaster(s). Toutefois, les pages 100% valides W3C ne sont pas directement favorisées dans leur classement sur Google. - Why doesn't google.com validate? : - Is HTML validation necessary for ranking? : |
Notre commentaire : la réponse de Google est assez claire : le fait qu'une page soit valide ou non lors du passage au test W3C n'est pas un critère de pertinence de Google et ne fera pas en sorte que la page soit mieux positionnée.
En revanche, il sera intéressant d'effectuer ce test et de lister les erreurs renvoyées pour voir si certaines d'entre elles ne peuvent pas perturber l'analyse du code par le moteur. Une balise de lien (A) ouverte et non fermée, par exemple (et c'est le cas le plus fréquent), peut très bien s'afficher dans le navigateur mais poser quelques problèmes à Google ou Bing lorsqu'ils liront le code. Mais, à notre sens, la majeure partie des erreurs renvoyées par le validateur n'ont aucun impact en SEO. Cela ne veut pourtant pas dire qu'il ne faut pas s'en assurer...
Mais, une fois d'éventuelles erreurs de code détectées et pouvant perturber cette analyse, ne comptez pas sur une validation W3C à 100% pou rêtre mieux classé sur Google...
Ceci dit, nous ne prenons en compte ici que l'aspect "référencement naturel", il existe bien sûr bien d'autres motivations pour vouloir proposer en ligne un code "propre", ce qui est une bonne chose...
Mais l'impact sur le référencement est certainement très faible. Il existe d'ailleurs de très nombreux sites renvoyant plusieurs centaines d'erreurs au validateur W3C qui sont extrêmement bien référencés...
Rappel des précédentes Questions à Google :
1. Les underscores dans les URL
2. Web 2.0, Contenu caché et pénalités Google
3. La pondération des liens entrants - ou backlinks
4. Les redirections multiples en cascade
5. Modification de la vitesse de crawl des spiders
6. Référencement et hébergement mutualisé
7. Sitemaps et nombre d'URL indexées
8. Référencement et redirections 301
9. Google prend-il en compte l'attribut Longdesc ?
10. Le nombre de pages d'un site web indexées par Google
11. Mots clés et Google Webmaster Tools
12. Les 3 chiffres dans les URL sont-ils obligatoires pour être indexé dans Google Actualités ?
13. Google et le Content Spinning
14. Duplicate Content Dust et balise canonical
c’est une question de bon sens
« la majeure partie des erreurs renvoyées par le validateur n’ont aucun impact en SEO », merci
merci pour ce post !!! c’est interessant
Faire un site avec un code propre est juste une histoire de bon sens… Quand on aime le travail bien fait, on y pense même pas mais on le fait naturellement.
Merci d’avoir traiter le sujet, ce qui m’as permis de filer droit et de corriger quelques erreurs,effectivement les like box ou autre widget ne sont pas reconnu valide,
Je me posais aussi la question de la pose du logo w3c sur notre site (le faite que google vois le lien de rappel a la validation rentre en jeu dans l’algorythme google?)…ou cela ne ferais qu’allourdire notre site d’une image de plus?
Google veut dire, en termes langue de bois, que ce n’est pas *du tout* pris en compte, sinon ils ne formuleraient pas leur réponse ainsi. Bien sûr si les balises sont n’importe comment, les googlebots auront du mal à extraire le texte et les liens, m’enfin en général les erreurs sont sur des attributs inutiles.. Mettre un logo w3c ne fait qu’alourdir la page, l’intérêt est juste de montrer aux visiteurs qu’ils surfent sur un site bien conçu, pour ceux qui connaissent le w3C en tout cas… C’est mon opinion en tout cas. Car jamais Google ne dira exactement comment fonctionne exactement son algorithme, tout le monde pense savoir, mais personne ne le sait, ils ont intérêt à garder ça secret dans l’intérêt de ne pas retrouver des sites pourris contourner les barrières pour se trouver dans les résultats.
@ SEOFever : je trouve que c'est un excellent résumé 🙂
Olivier
J'en étais arrivé à la même conclusion. A priori pas d'impact mais autant faire quelque chose de propre.
Je ne pense pas que cela change dans les temps proche, analyser la validité du code source est extrêmement gourmand en ressource machine. Vu que Google accélère l'indexation des pages, c'est un frein.
A l'échèle mondiale, avec des milliards de pages, ce sont des ressources gigantesques… et inutile…
Pour ma part un site valide W3C ne peut être qu'un plus
Je ne comprends pas où se trouve le problème avec ce genre de question récurrente. Il existe des entités qui réfléchissent et statuent sur l'avenir du web et de ses technologies (associations comme le W3C, l'IETF, des groupes de travail, etc). Ces structures travaillent à la publication de normes et standards, qui sont ensuite suivis et implémentés par les éditeurs logiciels (avec plus ou moins de rigueur et de succès – j'anticipe les réactions des anti-Microsoft Windows Explorer -)
Ca, c'est pour la couche logicielle : le code du site web.
Le référencement vient indépendamment : structure des templates via l'intégration web, contenu, balisage sémantique, optimisation in-page, netlinking, etc.
L'impact SEO provient amha surtout du fait qu'un code valide maximise la compatibilité, et donc expose potentiellement le site à un public plus large : ça ne garantit en rien la quantité mais assure une qualité minimum (user experience). Ce qui pourra se retrouver dans les metrics : taux de rebond, durée moyenne sur la page, etc…
@Gpenverne : oui je pense que c'est ce qui est dit dans l'article 🙂 sachant que la notion de "validité" est large. Exemple : si un élément de charte graphique (donc pas une image au sens propre du terme, pour laquelle ce qui suit sera important) n'a pas d'attribut ALT, ça sortira une erreur au validateur. Pourtant l'impact SEO sera nul. Il en est de même pour de très nombreux points pris en compte par le validateur et qui n'ont pas d'impact réel en SEO. Donc l'analyse W3C est intéressante pour détecter d'éventuel souci d'analyse mais, par expérience, 80% des erreurs renvoyées par le validateur n'ont aucune incidence sur le référencement du site…
a+
Olivier
PS : la réponse de Google me semble très claire au contraire : la validité W3C n'est pas un critère de pertinence de Google. Point. 🙂
Il est vrai que la réponse de Google ne sert pas à grand chose … Ceci dit, je pense que la validité W3C est sûrement utile pour le référencement : même si les googleBots sont rodés à cette exercice, il me semble plus facile de parser du contenu valide (techniquement parlant). Non ?
@Nicolas, e-seo : OK mais en quoi est-ce de la langue de bois selon toi ?
Quelques arguments seraient sympas pour étayer la réponse et faire avancer la discussion. Merci !
Olivier
Je te trouve bien gentil avec la réponse apportée à la question…J'y vois pour ma part encore une langue de bois de la taille d'un Terre-Lune…
Ce moteur m'exaspère dans sa volonté d'être gentil avec les agences de ref ou webmaster alors que leur but est de leur mettre la misère…
il est quand même notable que les bouton +1 et like ne sont pas ( par defaut)compatible w3c… ce qui confirme bien qu'un 100% n'est pas indispensable
(perso a part les like, +1 et un ou deux target=new dans les liens qui trainent mon site es valide W3C)
Entièrement d’accord avec Réf, c’est une histoire de bon sens d’autant plus lorsque qu’on sait que la propreté du codage à des conséquences sur le positionnement général d’un site sur Google. (vitesse de chargement, erreurs CSS, non valide W3C…)