Depuis quelques jours, un document de 43 pages appelé "Google Quality Rater Guidelines" circule sur le Web. Il est important puisqu'il décrit les critères d'évaluation humaine utilisés par les googlers-évaluateurs pour indiquer si une recherche sur Google est pertinente ou pas. Le document explique également comment détecter le spam dans les pages de résultats de Google. En revanche, on ne sait pas comment ce document interne s'est retrouvé sur le Web...
Voici son sommaire :
Part 1: Rating Guidelines ................. 2
1. The Role of the Quality Rater .............. 2
2. Researching and Understanding the Query ................ 2
3. Query Types ................. 4
4. Rating Scale ................. 5
5. Non-Rating Categories .......... 10
6. Spam Labels ............. 13
7. Flags............... 13
Part 2: Using EWOQ ....................... 14
1. Introduction ................ 14
2. Accessing the EWOQ Rating Interface ......... 14
3. Rating............. 14
4. Rating Home Screenshot.................. 15
5. Rating Home Screenshot - after clicking on the show Tasks available link ... 16
6. Rating Task Screenshot.................... 17
7. Resolving Tasks (Re-rating Unresolved Tasks) / Moderators ........ 20
8. Managing Your Task List................. 23
9. Commenting Etiquette.......... 24
Part 3: Rating Examples................ 25
1. Introduction ................ 25
2. Named Entities .......... 25
3. Informational Queries ............ 28
4. Targeted Information Queries ........... 30
5. Queries That Ask for a List ................ 31
Part 4: Webspam Guidelines ..................... 32
1. PPC Pages .................. 33
2. Parked Domains ...................... 34
3. Thin Affiliates............. 34
4. Hidden Text and Hidden Links .......... 36
5. JavaScript Redirects.............. 37
6. Keyword stuffing..................... 37
7. 100% frame ................. 38
8. Sneaky redirects ..................... 38
Part 5: Quick Guide to Quality Rating .................... 40
Part 6: Quick Guide to Webspam Recognition................... 42
Bonne lecture...
Source de l'image : Google
Même illégale, une traduction complète serait intéressante. Et il est possible qu’il existe déjà une trad, mais ça faut demander aux quality raters français 🙂
Pour ce qui est de la traduction:
1) C’est à Google de le faire, il me semble que la société semble financièrement en état de payer un traducteur par lanque?
2) Toute traduction « sauvage » même bénévole est contraire au droit de propriété intellectuelle de Google, ce document leur appartient, donc le droit de traduction aussi, ne confondons pas Google avec Wikipedia!
Je me lance dans la V.O du document mais d’accord avec les précédents commentaires : vivement une V.O.S.T 🙂
Une traduction dans la langue de Molière serait effectivement très intéressant ! 😀
Je me demande si quelqu’un a déjà traduit le document. Perso je n’ai toujours pas eu le temps de le faire, mais j’espère le faire un de ces 4.
J’avais une série de documents plus anciens (2005) intitulés « random query evaluation guidelines ».
Le programme existe depuis encore plus longtemps puisqu’on peut trouver des versions de ce doc qui datent de 2003:
http://www.searchbistro.com/guide.pdf
Il y a effectivement des points très intéressants comme la segmentation des requêtes, les critères de rating, la partie sur le spam… Mais le plus intéressant c’est de découvrir que Google fait faire des tests de qualité aléatoires à grande échelle… et dans toutes les langues.