Quelques infos sur Google (et Bing parfois) et son moteur de recherche, glanées ici et là de façon officieuse ces derniers jours. Au programme, cette semaine : A quoi peut correspondre une hausse soudaine du crawling ? Pourquoi Google ne privilégie-t-il pas toujours la source originale d'un contenu ?

Voici une petite compilation des informations fournies par les porte-paroles officiels de Google ces derniers jours sur différents réseaux informels (Twitter, Hangouts, forums, conférences, etc.). Donc « gossips » (rumeur) + Google = « Goossips » 🙂

La communication du moteur de recherche étant parfois plus ou moins sujette à caution, nous indiquons, dans les lignes ci-dessous, le niveau de confiance (taux de fiabilité) que nous accordons à l'information fournie par Google (de 1 à 3 étoiles, 3 étoiles représentant le taux de confiance maximal) - et non pas à la source qui en parle.

Une hausse soudaine du crawling n’est pas forcément une bonne nouvelle
Dans une publication sur LinkedIn, Gary Illyes a expliqué que les pics soudains d’activité de Googlebot pouvaient indiquer un problème. La première raison la plus courante est la présence d’espaces infinis (pages de calendrier, liste de produits filtrables à l’infini) qui peuvent surcharger les robots. La seconde raison peut être liée à un piratage du site, qui peut se retrouver inondé de pages indésirables, attirant ainsi les robots d’indexation. Le conseil de Gary Illyes : « traitez les hausses soudaines et inattendues de l’exploration comme un symptôme d’un problème, jusqu’à ce que vous puissiez prouver le contraire. »
Source : Search Engine Roundtable
Taux de fiabilité :
Une hausse soudaine d’activité du robot d’indexation n’est pas toujours une nouvelle réjouissante. Avant de sabrer le champagne, portez attention aux informations fournies par la Search Console et aux logs pour vérifier tout problème éventuel.

 

 

Google ne privilégie pas toujours la source originale d’un contenu
Dans la dernière édition du SEO Google Office Hours, John Mueller a expliqué que les résultats de recherche ne montraient pas toujours la source originale d’un contenu. Lorsqu’un contenu est syndiqué ou republié sur d’autres plateformes, celles-ci peuvent apparaître dans les résultats de recherche avant le site original. La question est donc de savoir s’il est préférable de se faire connaître en divers endroits ou s’il vaut mieux concentrer vos efforts sur votre site internet. Comme le dit John Mueller : « en fin de compte, il s’agit d’une décision commerciale de votre part. »
Source : Search Engine Roundtable
Taux de fiabilité :
Pour éviter de voir votre contenu original se faire cannibaliser par d’autres sites, l’idéal reste encore de placer un noindex sur les versions alternatives (quand c’est possible), ou de garder votre contenu uniquement sur votre site principal.