Quelques infos sur Google et son moteur de recherche, glanées ici et là de façon officieuse ces derniers jours, avec la prise en compte (ou non) du contenu semi-visible dans des onglets ou accordéons, le poids de l'autorité d'un site lorsque Google découvre un nouveau contenu, la lecture des textes dans les images et l'interaction entre l'algorithme RankBrain et le crawl d'un site...
Voici une petite compilation des informations fournies par les porte-paroles officiels de Google ces derniers jours sur différents réseaux informels (Twitter, Hangouts, Google+, forums). La communication de Google étant les plus souvent très sujette à caution, nous indiquons, dans les lignes ci-dessous, le niveau de confiance (taux de fiabilité) que nous accordons à l'information fournie par Google (de 1 à 3 étoiles, 3 étoiles représentant le taux de confiance maximal) - et non pas à la source qui en parle.
Sujet | Information | Taux de fiabilité | Source |
Contenu semi-caché | Gary Illyes a répété sur un forum la position de Google sur le contenu semi-caché (donc semi-visible, soit affiché dans un onglet ou un accordéon par exemple et visible uniquement en cliquant sur l'onglet ou une zone spécifique (signe "+" ou autre)) : ce contenu est indexé s'il n'est pas affiché dynamiquement (dont s'il est présent dans le code HTML dès le premier affichage de la page) mais il aura un poids moins fort. Ce contenu n'apparaitra pas non plus dans le "snippet" (affichage du résultat dans la SERP). Il s'agit juste d'un rappel de points déjà connus mais parfois mal interprétés, car la première annonce avait été tout sauf claire... | ArobaseNet | |
Autorité du site | John Mueller a indiqué que, lorsque Google découvre une page pour la première fois (désolé du pléonasme...), la "note d'autorité" du site peut avoir un poids important puisque le moteur ne connait pas vraiment le contexte de ce contenu (pas de liens, etc.). La confiance (trust) que Google aura dans ce site pourra alors faire monter la page (ou pas) dans les résultats en attendant que d'autres signaux viennent apporter plus d'informations. Comportement assez logique, selon nous... | Search Engine Roundtable | |
Reconnaissance d'images | Information étonnante de la part de Gary Illyes sur Twitter : actuellement, Google ne lit pas les textes présents dans les images, que ce soit via des techniques d'OCR (Reconnaissance Optique de Caractères) ou autres. Vraiment étonnant car Google a investi dans ce domaine, a montré en 2014 qu'il savait aller assez loin dans le domaine de la reconnaissance d'images et même géolocaliser directement des photos en reconnaissant les paysages qu'elles représentent. Alors, un simple texte dans une image, cela ne doit pas être bien sorcier pour lui... | Search Engine Roundtable | |
RankBrain | John Mueller a indiqué sur Twitter que RankBrain n'affecte en rien le crawl d'un site. Logique puisque cet algorithme n'intervient pas du tout au niveau du crawl et de l'indexation mais bien lors de l'analyse des critères de pertinence (ou de non-pertinence) d'une page... | Search Engine Roundtable |
Infos Google. Source de l'image : Google |
Au niveau du contenu semi-caché : une expérience de cloaking m’a donné le même résultat. Un texte blanc sur fond blanc est bien indexé et trouvable sur Google (en forçant un peu la recherche avec des » « ) mais n’apparaît pas dans le snippet.
Comme il a été stipulé qu’il s’agit encore de rumeurs donc je préfère personnellement attendre que cela n’en soit plus pour y ajouter foi. Comme pour Pagerank, sa suppression a fait le tour du web il y a quelques années avant d’avoir été concrètement exécutée par Google.
Le TBPR, pas le PR :))