Goossip : Contenu semi-caché, Autorité, Reconnaissance d'images et RankBrain

Quelques infos sur Google et son moteur de recherche, glanées ici et là de façon officieuse ces derniers jours, avec la prise en compte (ou non) du contenu semi-visible dans des onglets ou accordéons, le poids de l'autorité d'un site lorsque Google découvre un nouveau contenu, la lecture des textes dans les images et l'interaction entre l'algorithme RankBrain et le crawl d'un site...

Voici une petite compilation des informations fournies par les porte-paroles officiels de Google ces derniers jours sur différents réseaux informels (Twitter, Hangouts, Google+, forums). La communication de Google étant les plus souvent très sujette à caution, nous indiquons, dans les lignes ci-dessous, le niveau de confiance (taux de fiabilité) que nous accordons à l'information fournie par Google (de 1 à 3 étoiles, 3 étoiles représentant le taux de confiance maximal) - et non pas à la source qui en parle.

Sujet Information Taux  de  fiabilité Source
Contenu semi-caché  Gary Illyes a répété sur un forum la position de Google sur le contenu semi-caché (donc semi-visible, soit affiché dans un onglet ou un accordéon par exemple et visible uniquement en cliquant sur l'onglet ou une zone spécifique (signe "+" ou autre)) : ce contenu est indexé s'il n'est pas affiché dynamiquement (dont s'il est présent dans le code HTML dès le premier affichage de la page) mais il aura un poids moins fort. Ce contenu n'apparaitra pas non plus dans le "snippet" (affichage du résultat dans la SERP). Il s'agit juste d'un rappel de points déjà connus mais parfois mal interprétés, car la première annonce avait été tout sauf claire... ArobaseNet
Autorité du site  John Mueller a indiqué que, lorsque Google découvre une page pour la première fois (désolé du pléonasme...), la "note d'autorité" du site peut avoir un poids important puisque le moteur ne connait pas vraiment le contexte de ce contenu (pas de liens, etc.). La confiance (trust) que Google aura dans ce site pourra alors faire monter la page (ou pas) dans les résultats en attendant que d'autres signaux viennent apporter plus d'informations. Comportement assez logique, selon nous... Search Engine Roundtable
Reconnaissance d'images  Information étonnante de la part de Gary Illyes sur Twitter : actuellement, Google ne lit pas les textes présents dans les images, que ce soit via des techniques d'OCR (Reconnaissance Optique de Caractères) ou autres. Vraiment étonnant car Google a investi dans ce domaine, a montré en 2014 qu'il savait aller assez loin dans le domaine de la reconnaissance d'images et même géolocaliser directement des photos en reconnaissant les paysages qu'elles représentent. Alors, un simple texte dans une image, cela ne doit pas être bien sorcier pour lui... Search Engine Roundtable
RankBrain  John Mueller a indiqué sur Twitter que RankBrain n'affecte en rien le crawl d'un site. Logique puisque cet algorithme n'intervient pas du tout au niveau du crawl et de l'indexation mais bien lors de l'analyse des critères de pertinence (ou de non-pertinence) d'une page... Search Engine Roundtable
logo-infos-google
Infos Google. Source de l'image : Google