Nous continuons notre série de questions/réponses avec Google en abordant une question qui pose souvent quelques problèmes aux webmasters : comment intégrer son site web dans Google Actualités si ses articles ne possèdent pas 3 chiffres dans ses URL ?
Rappelons en effet que Google demande certaines contraintes sur les URL pour accepter un site dans son outil Google actualités :
- Le contenu proposé doit être unique. Une URL doit pointer vers un article et un seul. En clair, une suite de brèves, affichées dans une même page, ne sera pas recevable.
- L'URL doit être exclusive à un article. Si, sous une même URL, un article différent est publié chaque jour, ce contenu ne sera pas non plus indexé. Exemple : www.votresite.com/la-news-du-jour.html.
- Comme le dit l'aide en ligne de Google, l'URL associée à chaque article doit comporter un numéro unique composé d'au moins trois chiffres. Par exemple, nous ne pouvons pas explorer un article dont l'URL est la suivante : http://www.google.com/actualites/article23.html. Nous pouvons en revanche explorer un article dont l'URL est la suivante : http://www.google.com/actualites/article234.html. Sachez que si le seul nombre contenu dans l'URL est composé d'une série de quatre chiffres semblant correspondre à une année, comme http://www.google.com/actualites/article2006.html, nous ne serons pas en mesure de l'explorer.
La règle est donc la suivante : pour être indexé dans Google News, un site web doit proposer, pour les URL de ses articles, une suite d'au moins 3 chiffres consécutifs dont le format ne ressemble pas à celui d'une date (la plupart du temps, on intègre un numéro de référence ou similaire).
Oui, mais comment faire si les URL de votre site ne répondent pas à cette contrainte, pour quelque raison que ce soit ? Nous avons donc posé la question au service "Search Quality" de Google...
Question Abondance : L'indexation d'un site dans Google Actualités demande à ce que les URL contiennent une suite de 3 chiffres. Cela signifie-t-il qu'un site ne répondant pas à cette contrainte n'a aucune possibilité d'être indexé sur votre outil ? La réponse de Google : Non, si un site web n'a pas la possibilité d'intégrer cette suite de chiffres dans les URL de ses pages, il aura toujours la possibilité de créer un Sitemap pour Google Actualités. Dans ce cas, la contrainte de la suite numérique dans les URL n'est plus valable et un site web n'ayant pas ces chiffres dans ses URL pourra quand même être potentiellement indexé (s'il répond aux autres critères de recevabilité). |
Notre commentaire : bonne nouvelle, la contrainte des 3 chiffres minimum dans les URL n'est donc pas incontournable, puisqu'un Sitemap spécifique pour Google Actualités peut pallier le problème. Attention cependant :
- Les Sitemaps Google Actualités génèrent, eux aussi, quelques contraintes qu'il vous faudra prendre en compte (ils doivent contenir uniquemement les articles des deux jours précédents, ne doivent pas contenir plus de 1 000 URL, etc., plus d'infos ici)
- Le fait d'avoir un tel Sitemap (ou la suite de chiffres dans l'URL) ne veut pas dire que le site sera obligatoirement indexé, mais qu'il sera "recevable" par Google Actualités. Le site peut ensuite être accepté ou rejeté en fonction d'autres critères.
Rappel des précédentes Questions à Google :
1. Les underscores dans les URL
2. Web 2.0, Contenu caché et pénalités Google
3. La pondération des liens entrants - ou backlinks
4. Les redirections multiples en cascade
5. Modification de la vitesse de crawl des spiders
6. Référencement et hébergement mutualisé
7. Sitemaps et nombre d'URL indexées
8. Référencement et redirections 301
9. Google prend-il en compte l'attribut Longdesc ?
10. Le nombre de pages d'un site web indexées par Google
11. Mots clés et Google Webmaster Tools
Et si ont met les URL avec le mode des dates dans wordpress sa marche peut être ???
@RP : oui test effectué. En fait :
– Le fait que les sites qui sont sur la Home de Google News aient tous les 3 chiffres dans leur URL est pour moi logique : pour avoir accès à cette home, il faut être un « gros » site d’actus. Et tous les gros sites d’actus connaissent aujourd’hhui cette régle des 3 chifres et l’ont implémenté dans leurs URL.
– Pour ce qui est de la communication de Gogle, je suis d’accord, elle est assez floue et ambigue. j’en ai déjà parlé avec eux plusieurs fois… Mais j econfirme : si un site n’a pas les 3 chiffres dans ses URL, le probleme sera compensé par un sitemap Googlenews (voir mon commentaire précédent).
Cordialement
Vous semblez très affirmatif dans votre commentaire suivant la réponse de Google. Avez-vous réalisé un test suite à cette déclaration pour pouvoir entériner la chose?
Il semble qu’il y ait (comme souvent) une double communication de la part de Google. Sur le support d’aide aux éditeurs (http://support.google.com/news/publisher/bin/answer.py?hl=fr&answer=40787&topic=2484652&ctx=topic), il est écrit :
« URL des articles. Pour que notre système explore seulement les nouveaux articles, veillez à attribuer des URL uniques et permanentes, contenant au moins trois chiffres. »
Les constats réalisés dans le commentaire précédent semble démontrer que pour qu’un site soit indexé correctement dans Google News, il faut bien ces 3 chiffres. Pour s’en convaincre, il suffit de se rendre sur la page d’accueil : news.google.com.
Bonjour
Je confirme le fait que certains articles sont indexés dans Google News sans numéros dans les URL, j’en ai vu passer un certain nombre (sans me rappeler le sources, désolé). Mais ces sites avaient un sitemap XML spécifique pour Google News…
Cordialement
Bonjour,
Merci pour cet article : cela semble être une des dernières sources fr de Google en France sur son module actualités.
Cependant il me semble que le point des URLs sans suite de 3 chiffres soit peu vérifiée dans la pratique. Pour travailler de près ou de loin sur l’opti SEO GG News depuis 2007, je n’ai jamais vu d’articles indexés et rankés sans cette suite numérique.
Je ne suis pas le seul d’ailleurs à l’indiquer (cf la prez au SMX http://www.slideshare.net/GuillaumeG slide10 / Contacts chez des SEO, …)
Sur GG News FR, aucun article sans ces 3 chiffres n’est présent. Ceux sans suite numérique ont peut être des problèmes de ranking ;-). Aux US, nous avons des artcles avec année / mois / jour http://www.nytimes.com/2012/06/24/arts/television/ann-curry-and-the-ratings-for-today.html, …. En France, j’aurai des articles indexés sans ID mais avec un millésime.
Ce que je constate :
1 /Google n’a pas besoin d’avoir des IDs uniques. Nous retrouvons plusieurs articles indexés avec 2012/06/22 provenant de hosts différents. Donc ID (au sens classique) et date fonctionnent, alors qu’il y 2 ou 3 ans, nous avions besoin d’une suite de 3 chiffres uniques sans ressembler à 199 ou 200.
2 /Google aurait toujours besoin d’une suite de 3 chiffres dans une URL pour l’indexer dans Google News. 2012 fonctionne. Voir SI 1999 fonctionnerait aussi 🙂
Ce serait bien d’avoir une mise à jour de l’info, car si un site part sur des URLs sans suite numérique, il est forte probable que GG Actus soit égal à zéro en traf.
Bjr
dans ce cas, faites une suite de 5 chiffres et tout devrait bien se passer 🙂
news-00001.htm
news-00002.htm
news-00003.htm
cdt
Si je comprends bien le TOP serait de mettre une suite logique de 3 chiffres dans les news + création d'un sitemap dédié aux news :
news001.htm
news002.htm
news003.htm
Si mon site génère un nombre important de news ? et que j'arrive à 1001, 1002… est ce que je vais baisser dans les critères de prise en compte de news ? je vais arrivé à 2011 et Google va prendre cela comme une news+année ?
Merci