Google a récemment mis à jour ses directives concernant la suppression d'images de son index de recherche, offrant plus de clarté et de détails techniques.
Ce qu'il faut retenir :
- Google a ajouté des détails pour clarifier la documentation sur la suppression d'images ;
- Les nouvelles directives expliquent comment agir rapidement dans les situations d'urgence et abordent la problématique de l'accès aux images hébergées externement ;
- Des clarifications ont été apportées sur l'utilisation des caractères spéciaux et génériques dans le fichier robots.txt et l'impact de la balise noimageindex sur l'indexation des images.
Mise à jour des directives de Google
Il y a quelques jours, Google a actualisé ses recommandations à propos de la suppression d'images de son index de recherche. Voici les sujets qui ont connu des modifications :
- Comment supprimer rapidement des images ;
- Que faire lorsqu'il n'y a pas d'accès au CDN qui héberge les images ou si le CMS ne propose pas de moyen de bloquer l'indexation ;
- Des détails sur l'utilisation de robots.txt pour les images ;
- Comment utiliser les caractères génériques dans le fichier robots.txt ;
- Une mise en garde concernant l'utilisation de la balise noimageindex.
Cette mise à jour de la documentation vise à fournir une meilleure compréhension des procédures à suivre pour les propriétaires de sites souhaitant mieux contrôler la présence de leurs contenus visuels dans les résultats de recherche.
Suppression rapide des images en cas d'urgence
Pour les situations d'urgence nécessitant une suppression rapide des images, Google recommande l'utilisation de son outil de suppression. Néanmoins, cette action est temporaire et, sans une suppression ou un blocage effectif sur le site, les images pourraient réapparaître dans les résultats de recherche une fois la demande de suppression expirée. L’utilisation de l’outil de suppression seul ne suffit pas.
Gestion des images hébergées externement
Un défi courant pour les gestionnaires de contenu est l'accès aux images hébergées sur des CDN (réseaux de diffusion de contenu) ou des CMS (systèmes de gestion de contenu) qui ne permettent pas un blocage facile des images avec l’en-tête HTTP noindex X-Robots-Tag ou robots.txt. Google suggère dans ces cas la suppression complète des images du site.
Clarifications sur l'utilisation de robots.txt
Les directives révisées apportent des éclaircissements sur l'utilisation du fichier robots.txt pour bloquer l'indexation des images.
“Les règles peuvent inclure des caractères spéciaux pour plus de flexibilité et de contrôle. Plus précisément, le caractère * correspond à n'importe quelle séquence de caractères, ce qui vous permet de faire correspondre plusieurs chemins d'image avec une seule règle.”
L'introduction d’un exemple concret sur l'utilisation des caractères génériques vise à faciliter la gestion de l'indexation des images à grande échelle :
“# Caractère générique dans le nom de fichier pour
# images partageant un suffixe commun. Par exemple,
# animal-picture-UNICORN.jpg et
# animal-picture-SQUIRREL.jpg
# dans le répertoire « images »
# correspondront à ce modèle.”
Mise en garde contre la balise noimageindex
Une attention particulière est accordée à la balise noimageindex, soulignant que son utilisation sur une page empêchera l'indexation des images y étant intégrées, mais pas si ces mêmes images sont présentes sur d'autres pages, car elles pourront être indexées via ces pages.
Google recommande d’utiliser l’en-tête de réponse HTTP noindex X-Robots-Tag pour vous assurer qu’une image est bloquée quelle que soit l’endroit où elle est présente.