Quelques infos sur Google (et Bing parfois) et son moteur de recherche, glanées ici et là de façon officieuse ces derniers jours, avec au programme cette semaine quelques réponses à ces angoissantes questions : Google utilise-t-il plusieurs algorithmes linguistiques ? Peut-on utiliser des caractères « exotiques » dans les URL, notamment pour les filtres à facettes ?
Voici une petite compilation des informations fournies par les porte-paroles officiels de Google ces derniers jours sur différents réseaux informels (Twitter, Hangouts, forums, conférences, etc.). Donc « gossips » (rumeur) + Google = « Goossips » 🙂
La communication du moteur de recherche étant parfois plus ou moins sujette à caution, nous indiquons, dans les lignes ci-dessous, le niveau de confiance (taux de fiabilité) que nous accordons à l'information fournie par Google (de 1 à 3 étoiles, 3 étoiles représentant le taux de confiance maximal) - et non pas à la source qui en parle.
Algorithmes et Langues |
John Mueller a indiqué sur Reddit que Google utilise « la plupart du temps » les mêmes algorithmes de recherche pour toutes les langues, mais que certaines langues nécessitent un algorithme spécifique pour les traiter. Par exemple, certaines langues ne séparent pas les mots par des espaces. Il est donc nécessaire d'utiliser un algorithme différent de celui utilisé par Google pour les langues qui utilisent des espaces comme séparateur. Il a également rappelé que deux contenus traduits ne sont pas considérés comme du contenu dupliqué et qu'il ne peut définir l'équivalence pour un pays ou un autre sans la balise Hreflang : « Il est impossible pour nous de comprendre que ce contenu spécifique est équivalent pour un autre pays ou une autre langue. Il y a tellement de différences locales qui sont toujours possibles. » |
Source : Search Engine Journal, Search Engine Roundtable |
Taux de fiabilité : |
On savait qu'il n'existait qu'un index et qu'un algorithme général pour toutes les langues. A priori, ce n'est pas tout à fait vrai avec certains algorithmes spécifiques pour certaines langues. Mais cela ne concerne à notre avis qu'un nombre très limité de langages. Gérer un moteur de recherche au niveau mondial, ce n'est pas simple... 🙂 ... |
Filtres à facettes |
John Mueller a indiqué sur Twitter que ce n'était pas une bonne idée que de créer des URL avec des caractères non standards pour les filtres à facettes. Ainsi, il est déconseillé d'utiliser des virgules ou des parenthèses dans ce type d'URL. Il vaut mieux s'en tenir au schéma classique avec des points d'interrogation ? et des esperluettes &, en complément des traits d'union - et des signe égal =. |
Source : Search Engine Roundtable |
Taux de fiabilité : |
S'aventurer sur des URL un peu « exotiques » n'est effectivement clairement pas une bonne idée, d'autant plus que la plupart des CMS aujourd'hui permettent de créer des URL « SEO friendly »... |
Goossips : Algorithmes et Langues, URL des Filtres à Facettes. Source : Google