Dans un article publié sur Advanced Web Ranking, la Knowledge Graph Manager Genie Jones se penche sur le cas des entités. Véritable force motrice de la transformation des SERPs, les entités sont utilisées par les moteurs de recherche pour mieux comprendre les intentions des utilisateurs. Aujourd’hui indispensables, ces entités sont un atout stratégique majeur pour les entreprises. En voici les raisons.
Ce qu'il faut retenir :
- Utilisées par les moteurs pour mieux comprendre les contenus, les entités sont désormais incontournables en SEO
- Elles favorisent entre autres le classement des pages dans les SERPs et l’apparition des Rich Snippets
- Elles peuvent aussi améliorer la crédibilité d'un site dans son domaine
- Optimiser les entités s'inscrit dans une stratégie SEO globale
Que sont les entités en SEO ?
Il est essentiel de différencier la notion d’entités de celle de « mots-clés », qui correspondent simplement à une suite de lettres. Les entités, tout du moins tel qu’on peut les définir dans le contexte du SEO, donnent leur sens aux mots-clés (qui ont besoin de contexte).
En outre, l’autrice rappelle que le concept de web sémantique remonte à l’acquisition par Google en 2010 de Freebase de Metaweb, qui posera les fondamentaux de ce qui deviendra plus tard le Knowledge Graph.
L’apport des entités au contenu
En quoi les moteurs de recherche peuvent capitaliser sur les entités ? Genie Jones liste 5 grands aspects.
Les entités améliorent la compréhension du contexte
Comme évoqué précédemment, les mots-clés seuls ne sont pas suffisants pour fournir du contexte et permettre de comprendre vraiment la signification du contenu. En utilisant un algorithme de traitement du langage naturel, les robots d’indexation peuvent repérer et répertorier les concepts dont traite une page.
Pour obtenir un aperçu des entités que Google s’attend à voir lorsqu’il essaie de classer un contenu dans une thématique particulière, il est possible d’utiliser des outils d’extraction d’identités dédiés. L’autrice évoque la solution proposée par InLinks, société avec laquelle est collabore.
Les entités aident Google à comprendre ce qui est important
En plus d’énumérer les entités, Google attribue un « score de saillance » aux idées détectées dans les contenus. Ce score permet d’identifier les entités les plus significatives, les plus pertinentes ou les plus importantes pour le document. Derrière cette notion de score, on retrouve plusieurs approches :
- La méthode de pondération TF-IDF : elle tient compte du fait que certains concepts peuvent être mentionnés plus fortement que d’autres, sans que cela n’ait de signification utile. Cette méthode est en particulier utilisée afin d’éviter le « bourrage d’entités ». En d’autres termes, mentionner 100 fois la même entité n’est pas un facteur de classement.
- La saillance positionnelle : elle se rapporte à la position des principales entités dans le document. Par exemple, le fait de placer des entités en début de texte, dans le titre et l’intro, indique souvent qu’elles ont plus de poids.
- La saillance sémantique : au-delà de la compréhension des entités individuelles et de leur fréquence, leur importance et leur positionnement, les Large Language Models (LLM) peuvent également prendre en compte la manière dont les entités sont liées les unes aux autres sur la base d’une pertinence sémantique pure.
Pour résumer, cela signifie qu'en utilisant plusieurs entités interconnectées contribuant à la compréhension d’un seul et même concept, un site a davantage de chance d’être bien classé.
Les entités renforcent les structures de liens internes
Les moteurs de recherche analysent comment les entités sont reliées entre elles au sein d’un site web, en examinant par exemple la relation entre un produit et son fabricant, ou un auteur et ses œuvres. La qualité et la pertinence du contenu reliant ces entités jouent un rôle important dans le classement. Une structure de liens internes basée sur les entités aide à créer une cartographie des différents sujets traités, améliorant ainsi sa compréhension par les moteurs.
Genie Jones conseille de se concentrer sur une entité principale par page, en utilisant des ancres contextuellement pertinentes pour lier les pages de services/catégories principales, afin de favoriser l’engagement et l’autorité du site sur le sujet concerné.
Les entités permettent de clarifier le contenu grâce aux données structurées
Le balisage Schema permet de clarifier le contenu d’un page en fournissant des données structurées aux moteurs de recherche pour aider ces derniers à mieux comprendre les entités mentionnées.
En utilisant des exemples concrets liés à des entités et en les associant à des références externes, comme Wikipedia, il est ainsi possible de désambiguïser les informations présentes sur la page. Tous les experts du secteur s’accordent à dire que cette démarche est cruciale pour optimiser la pertinence et la visibilité des pages dans les SERPs.
Les entités s’attaquent à la racine de l’intention de l’utilisateur
En SEO, l’intention de l’utilisateur est fondamentale, et s’émancipe désormais des catégories traditionnelles (informationnelle, commerciale, navigationnelle et transactionnelle) auxquelles s’étaient habitués les professionnels du secteur jusqu’à maintenant. Le Knowledge Graph joue un rôle clé en s’adaptant aux nuances de l’intention de l’internaute, à travers l’analyse des verbes utilisés dans les requêtes de recherche initiales, mettant en exergue une compréhension profonde des relations entre entités.
Cette approche permet une interprétation plus précise de l’intention, aboutissant à des résultats de recherche plus pertinents. Elle illustre également l’importance de penser en termes d’entités plutôt qu’en termes de mots-clés.
Que peuvent offrir les entités SEO pour les entreprises ?
L'intégration des entités dans les stratégies SEO est essentielle pour répondre à l'évolution des SERPs et aux exigences de Google en matière d'expérience, d'expertise, d'autorité et de fiabilité (E-E-A-T).
Optimiser un site pour les entités peut contribuer à améliorer la crédibilité et la confiance, en lui permettant de se distinguer des concurrents. Cela implique de lier le contenu du site à des entités et des marques reconnues pour renforcer son autorité. Par ailleurs, aligner le contenu avec des entités fiables, comme le permet la balise « sameAs », est primordial pour asseoir la réputation de sa marque dans son domaine.
De plus, travailler sur les entités peut avoir pour effet de favoriser l’apparition des Rich Snippets et des Knowledge Panels dans les SERPs. Ces éléments peuvent par exemple offrir un aperçu des informations liées à un restaurant, en mettant en exergue son menu, ses heures d’ouverture ou les avis clients. Comme le note l’autrice de l’article, l’apparition des Knowledge Panels est l’un des changements les plus significatifs dans les pages de résultats. Dans cette perspective, les données structurées relatives à un produit sont essentielles pour favoriser sa présence.
Obtenir un meilleur classement en optimisant ses entités s’inscrit dans une stratégie SEO globale, incluant notamment la rédaction de pages de catégorie ou de pages mères optimisées pour les entités, elles-même reliées à des articles de blog faisant autorité..
Bill Slawski a démystifié le TF-IDF en 2019 en réaction à un article paru dans Search Engine Land :
https://x.com/bill_slawski/status/1147280180966129665?s=20