Quelques infos sur Google (et Bing parfois) et son moteur de recherche, glanées ici et là de façon officieuse ces derniers jours, avec au programme cette semaine quelques réponses à ces angoissantes questions : Google suit-il les liens présents sur les pages désindexées ? Comment Google prend-t-il en charge les croissances exponentielles de contenus ? Pourquoi Bing n’affichera plus de nouveaux contenus de Reddit ? L’IA est-elle digne de confiance en SEO ? Faut-il bloquer les crawlers GoogleOther ?
Google ne suit pas les liens sur les pages désindexées |
Dans l’épisode SEO Office Hours de juillet 2024, John Mueller a expliqué que le fait de bloquer le crawl d’une page laisse entendre que les liens internes ou externes présents sur la pages ne sont pas pertinents. « Vous pouvez bloquer l’indexation des pages que vous ne voulez pas voir apparaître, c’est votre décision, mais si une partie importante de votre site web n’est liée qu’à partir de la page bloquée, cela rendra la recherche beaucoup plus difficile. » |
Source : Search Engine Journal |
Taux de fiabilité : |
Comme le précise Roger Montti dans son article, le fait de faire cohabiter une direction noindex avec un follow rend l’indication complétement inefficace. Google ne suivra pas des liens sur des pages non indexées. |
Google peut considérer comme nouveau un site qui a considérablement grossi |
John Mueller a averti que la croissance exponentielle d’un contenu peut déclencher une réévaluation du site par Google, le considérant comme un nouveau site. Une augmentation significative, comme le fait de passer de 10 000 à 100 000 produits, peut inciter Google à réévaluer la façon dont il affiche le site. |
Source : Search Engine Journal |
Taux de fiabilité : |
Étant donné le temps que peut prendre Google pour réévaluer un site (plusieurs mois), le plus judicieux est d’ajouter progressivement du contenu. |
Bing n’affichera plus de nouveaux contenus issus de Reddit |
Microsoft a confirmé que Reddit avait bloqué Bing et d'autres moteurs de recherche en mettant à jour son fichier robots.txt, le 1er juillet 2024. Microsoft respecte cette directive et ne crawle plus le site. Reddit a précisé que ce blocage n'est pas lié à son partenariat avec Google, mais découle de l'incapacité des autres moteurs à garantir l'utilisation appropriée de leur contenu. En conséquence, les résultats de Reddit ne seront plus actualisés sur Bing. |
Source : Search Engine Land |
Taux de fiabilité : |
Que l’explication donnée par Reddit soit vraie ou non, difficile de ne pas être un minimum suspicieux étant donné le récent accord signé avec Google. |
Ne faites pas confiance à l’IA pour obtenir des conseils en SEO |
John Mueller de Google déconseille d'utiliser les modèles de langage (LLM) pour obtenir des conseils SEO, car ces derniers apprennent des informations potentiellement erronées. Cette remarque a été faite en réponse à une suggestion contradictoire de Google Gemini sur l'utilisation de l'outil de désaveu de Google. Gary Illyes de Google avait déjà exprimé des réserves similaires. |
Source : Search Engine Roundtable |
Taux de fiabilité : |
Qu’il s’agisse de conseils relatifs au SEO, la santé, la finance ou n’importe quel autre domaine, il est essentiel de prendre les informations fournies par l’IA avec de grosses pincettes. De nombreux exemples ont en effet déjà démontré les limites de ces outils. |
Google déconseille de bloquer les crawlers GoogleOther |
Gary Illyes a averti que bloquer le robot GoogleOther pouvait affecter divers produits et services Google, bien que cela n'impacte pas directement les résultats de recherche indexés par Googlebot. GoogleOther est utilisé pour des recherches et développements internes, et inclut trois types de crawlers : général, image et vidéo. Bloquer GoogleOther pourrait limiter les opportunités liées à de futurs produits ou fonctionnalités de Google, mais le choix dépend des priorités de chaque site. |
Source : Search Engine Journal |
Taux de fiabilité : |
Bloquer ou ne pas bloquer ? Telle est la question ! A moins d’avoir quelque chose à cacher à Google ou de ne pas vouloir laisser la firme de Mountain View utiliser des informations pour son usage interne, il n’est pas forcément utile de bloquer GoogleOther. |