La société Synodiance a mis en place un test SEO sur les différences façons de désindexer un contenu. Les résultats sont différents selon les techniques utilisées...
La société Synodiance vient de publier une étude basée sur les observations faites sur un site de test (ananas-seo.com, voir illustration ci-dessous) concernant les différentes méthodes de désindexation d'un contenu auprès de Google : robots.txt, directive X-Robots-Tag et balise meta robots "noindex".
Voici les principaux résultats de cette analyse :
- Désindexation "naturellement" d'un contenu via HTTP 404/410 : fonctionne si les contenus ne reçoivent pas trop de maillage interne/externe. Désindexation constatée en 45 à 55 jours.
- Blocage de l'indexation ou désindexation d'un contenu avec une Meta Noindex : fonctionne si les contenus sont accessibles par les robots d’exploration. Désindexation constatée en 15 jours.
- Blocage de l'indexation ou désindexation d'un contenu via X-robots tag Noindex : très efficace, plus technique, la directive est dans l’entête HTTP du document. Désindexation constatée en 15 jours.
- Désindexation d'un contenu avec directive Noindex dans le robots.txt : non officielle mais reconnue par les principaux robots d’exploration, peut être utile selon les cas. Désindexation constatée en 15 jours.
Un article complémentaire est également consacré à ce test SEO. Bien sûr, celui-ci n'est réalisé que sur un seul site, ce qui réduit sa portée, mais il n'en reste pas moins intéressant...
Source de l'image : Abondance |
Merci pour cet article très détaillé et t simple à comprendre en même temps.
En complément, voici une question/reponse sur comment desindexer des pages dupliquées https://questions-seo.fr/22/contenu-duplique-a-cause-de-la-fonction-tri-des-produits-comment-eviter-les-penalites-seo
Merci pour les conseils, je me rappelle j’avais supprimé un article sans le mettre en noindex, résultats pendant des mois google m’affichait des erreurs d’exploration avec le lien de l’article supprimé dans GWT 😉
Bonne continuation.
Etude intérréssante, avec beaucoup de mais et de si. la technique la plus tangible pour optimiser les temps de desindexation d’une page quelque soit la volumetrie, l’autorite….reste la suppresion via gwt. A peine quelques heures pour un site entier…sous réserve du suivi des spécifications d’implementation.
Au sujet de la 410, une erreur s’est glissée dans la présentation. il est vrai que google a dit la traiter de la même manière, mais ils sont revenus sur cette décision en la personne de John Wu qui a precisé:
I followed up on the 404 vs 410 thing with the team here. As mentioned by some others here & elsewhere, we have generally been treating them the same in the past.However, after looking at how webmasters use them in practice we are now treating the 410 HTTP result code as a bit “more permanent” than a 404. So if you’re absolutely sure that a page no longer exists and will never exist again, using a 410 would likely be a good thing
la 410 est sous utilisé surtt pour des sites de petites annonces, emplois….a la volumetrie titanesque et aux contenus volatiles…
Bonjour,
merci pour votre commentaire.
Gérer la désindexation d’URLs est adaptée via GWT pour des sites à faible volume puisque l’action est manuelle. Dans le cas de site à gros volume, centaine de milliers d’URLs voire au delà du million, un process de désindexation via des directives implémentées est incontournable.
Pour ce qui est de la 404/410, j’avais effectivement vu passé cette info. Mais sans vouloir contredire Mr John WU, la 410 n’a quasiment aucun impact sur la désindexation. Je l’ai vérifié sur des sites d’autorité à gros volume d’URLs.
Très intéressant comme test, donc si on veut supprimer rapidement du contenu, on peut essayer de faire Noindex pendant quelques semaines, puis 410 ?
une directive Noindex suffit et comme expliqué dans l’étude la 410 est considérée de la même manière qu’une 404 côté Google donc moins stratégique en terme de désindexation.
Le problème c’est que je souhaite supprimer définitivement l’URL et pas seulement la désindexé, mais le plus rapidement possible.
SI c’est sur votre site, il suffit de supprimer le contenu (404/410) et de passer ensuite par les webmaster tools. c’est très rapide.
Si c’est sur un site qui ne vous appartient pas, il faut demander à son propriétaire de faire la même chose. c’est souvent plus compliqué 🙂
Le problème c’est que j’ai plusieurs dizaines de milliers d’url qui sont concernés.
Pour Webmastertool, vous parlez de la suppression d’URL dans l’onglet Index Google ?
Bonjour et merci pour la reprise du test Ananas SEO !
Nous allons prochainement commencer une deuxième série de test sur la désindexation et une autre étude sur le SEO vidéo à venir aussi prochainement…
A très bientôt !