Balises sémantiques, données structurées, rich snippets, Schema.org, toutes ces 'appellations (pas toujours bien) contrôlées' ne désignent pas toutes les mêmes informations et les mêmes finalités. Pourtant, la structuration sémantique des contenus devient aujourd'hui aussi importante que le fait d'obtenir une meilleure visibilité dans les SERP...
Sur le Web, on entend souvent parler de "balises sémantiques" (ou de "données structurées" selon l'appellation googlienne), alors que ces patronymes désignent en fait deux domaines connexes mais différents :
- Les "rich snippets" ou enrichissement des pages de résultats de Google à l'aide d'informations textuelles ou graphiques (photos, étoiles, nombre d'avis, prix, disponibilité, temps de préparation...) pour certains types de données très spécifiques (produits, avis, recettes de cuisine, événements, personnes, entreprises, musique, apps, vidéos, etc.).
- Les balises Schema.org, format introduit par les 3 moteurs majeurs en 2011, pour unifier les différents standards existants jusqu'alors (microdonnées, RDFa, microformats).
On s'aperçoit qu'il existe souvent une confusion entre ces deux possibilités. Pourtant, le format Schema.org est clairement beaucoup plus large que les "rich snippets" et propose de nombreuses balises n'ayant aucun impact sur l'affichage d'une page dans les SERP de Google.
Du coup, en règle générale, les éditeurs de site web s'en tiennent strictement aux cas prévus pour les rich snippets afin d'obtenir une meilleure visibilité dans ces SERP : une fiche produit, une recette de cuisine, un contenu avec avis d'internaute recevront donc les précieuses balises et, si Dieu (en fait, Google...) le veut, ces données apparaîtront dans les résultats du moteur. D'une certaine façon, on peut également placer l'authorship dans cette optique (même si sa visibilité dans les SERP va se réduire).
L'amélioration sémantique des contenus pour une meilleure analyse des moteurs
Mais il ne faut pas oublier que les balises Schema.org sont beaucoup plus "riches" et diversifiées que cela. Elle proposent une multitude de possibilités, expliquées sur le site officiel et permettant surtout de mieux expliciter, sémantiquement parlant, de quoi parle la page web.
Bien sûr, cela n'aura aucun impact sur l'affichage du lien dans les résultats du moteur. En revanche, et c'est là l'une des raisons d'exister de Schema.org, ces indications "balisent" le contenu et fait en sorte de le "structurer", d'indiquer au moteur "de quoi parle la page", bref, de lui mâcher le travail de compréhension et d'analyse des textes indexés. Et si le moteur comprend mieux, analyse mieux, on peut assez facilement penser que la page sera mieux positionnée... Quelque part, c'est aussi ce qu'apporte (entre autres fonctionnalités) l'HTML5 par rapport à l'HTML "classique" dans une optique plus technique : une meilleure compréhension de la structure du code de la page. Schema.org, pour sa part, gère plutôt la partie rédactionnelle.
N'oubliez donc pas ces balises (quelques exemples : santé, action, emplacement géographique, magasin, etc.) qui sont, finalement, assez peu utilisées par les développeurs alors qu'elles peuvent réellement aider votre SEO. Les explorer peut réellement vous aider dans votre recherche de visibilité...
Des algorithmes comme Hummingbird nous font passer de l'ère de la statistique à celle de la sémantique, de la notion de mot clé à celle de concept. Et il y a fort à parier qu'à l'avenir, le standard Schema.org aura son mot à dire dans notre travail au quotidien. Alors, pourquoi ne pas l'intégrer dès maintenant ? Le jeu en vaut certainement la chandelle...
Source de l'image : Abondance |
En tous cas, pour le moment google semble super bien soignée les sites qui jouent le jeu avec les shema.org. Attention cependant à ne pas démultiplié le nombre de métadata différents (atom-feed etc..). Pour la question du scraping c’est certainement vrai mais du coup çà en devient cornélien. Pour le moment, personnellement j’ai choisi shema.org, au moindre srapping avéré sur mes sites eh bien on aviseras alors. Pour le moment il ne semble pas y avoir le feu de ce côté la. Je me trompe peut-être.
Je me suis toujours demandé si le but des balises schema.org n’était pas d’aider les moteurs à scraper du contenu… Quand on voit le nombre d’infos qui s’affichent sur certaines pages de résultats (notamment à travers le knowledge graph) on peut décemment se poser la question….
@Eric Crashprices : cet article ne pousse en rien les gens à intégrer les rich snippets, mais bien les balises Schema.org. Ce qui n’est pas pareil 🙂
Bon courage our la suite ! (par expérience, de nombreux sites que j’ai audités n’avaient pas les rich snippets dans les SERP pour de micro-problèmes de codage ; les pages passaient pourtant très bien sur l’outil de test de Google. Mais un efois que le code a été corrigé, tout est revenu à la normale).
Cordialement
C’est bien beau de vouloir pousser les gens à intégrer les rich snippets mais de notre cote nous essayons d’intégrer depuis plusieurs semaines le prix et les mentions stock ou hors stock dans les résultats de recherche sans succès. Tout est pourtant bien configuré, les tests dans webmaster tools sont positifs mais rien ne s’affiche.
J’aime ce genre d’articles simples et précis ! Je pense aussi que les balises proposées par Schema.org sont plus intéressantes mais on est souvent tenté de se focaliser sur les « rich snippets » pour augmenter le taux de clics vers son site. Un résultat avec des étoiles ou des prix affichés semble apporter plus de confiance à l’internaute.
Est-ce qu’il existe des études sur l’amélioration du positionnement dû aux balises Schema.org ? (Une étude comparative sur une sélection de sites ayant ou non intégré des balises schema.org et les impacts sur leur positionnement. Je ne sais pas si ce genre d’études est possible d’ailleurs !)
C’est à double tranchant comme vous l’avez si bien remarqué.
Apres, si cela rend l’utilisation du moteur de recherche plus pertinente …ça ne peut être que bénéfique.
On oublie l’intérêt que cela représente pour eux, on se bande les yeux, on bouche les oreilles et de toute manière je craint que l’on ai le choix ! Tout problème a sa solution 🙂
En fin de compte, et pour répondre à la question posée en titre, il faut bien dire que tout dépend de l’exigence de google. Si aujourd’hui, ce moteur de recherche exige des balises sémantiques, alors il faut tous s’y mettre, et si demain, il serait amené à changer de décision, et bien l’on devra s’y adapter.
Je réfléchissais aussi à une implémentation de ces données structurées sur nos sites, Google semble en tenir compte comme tu y fais allusion.
Mais à terme, les SERPs ne vont elles pas devenir des guirlandes de Noël ? Avec les étoiles, les photos des profils G+, les previews Wikipédia, Youtube et j’en passe… ça plus les pubs, ça fait beaucoup je trouve…
Enfin, si ça améliore le SEO des clients hein… 🙂
Parfait pour des nouvelles règles sur nos/vos crawler 😉
Rien qu’hier avec leurs expérimentations sur les listes de tutoriel, on peut etre certain que ca vient de là.
C’est vrai que même si Google ou certain en font parfois un peu trop sur la technologie sémantique et la mystérieuse intelligence artificielle qui permettrait de tout comprendre, le balisage sémantique est une aide précieuse pour le moteur. (par définition, sans balisage, il peut être très imprécis).
Le revert de la médaille, c’est la tendance de google a vouloir conserver l’internaute dans ses pages de résultat. Offrir a google sur un plateau des extraits « vérifiés et structurés » de son contenu, cette richesse optimisée lui permet d’améliorer encore la richesse de ses extrait de contenu, a tel point que dans de nombreux cas, l’internaute a déjà la réponse sur la page de Google et ne va plus sur le site.
Cette alerte, @Olivier viens de la souligner il y a quelques jours (https://www.abondance.com/actualites/20140626-14037-knowledge-graph-commence-afficher-tutoriels-scrape-web-vergogne.html ). Faut-il investir du temps et de l’argent sur ce balisage? Faut-il en espérer un meilleur classement, visibilité, taux de clic ?
Beaucoup d’interrogation restent en suspend…