La Wayback Machine, véritable mémoire du Web depuis presque 20 ans, a connu une importante dotation qui va lui permettre d'améliorer son site web d'ici deux ans...
Le site de la Wayback Machine vient d'annoncer qu'une nouvelle version de son outil incroyablement utile, permettant de plonger dans les anciennes versions de sites web de la Toile, allait voir le jour pour donner accès aux près de 440 milliards de pages web, images ou vidéos déjà compilées depuis 19 ans.
Fabuleuse mémoire du Web, la Wayback Machine verra sa nouvelle mouture mise en ligne en 2017. Son code sera réécrit, le crawl (un milliard de pages par semaine actuellement) sera augmenté et optimisé, l'interface utilisateur revue et, surtout, il sera possible d'y effectuer des recherches par mots clés.
Les concepteurs du site travaillent également avec Wikimedia pour remplacer les liens cassés dans l'encyclopédie Wikipedia par des liens vers la Wayback Machine pour retrouver la version (un peu comme un "cache" finalement) de la page disparue. Bref, vivement 2017 !
Le site web de la Wayback Machine. Source de l'image : Abondance |
Excellente chose. Si seulement on pouvait aussi retrouver, dans les forums de discussion archivés par Wayback tous les fils et commentaires. Un exemple : je suis une passionnée d’opéra, et quand je recherche Opéra Giocoso, il y a seulement la liste des fils ; malheureusement, je ne peux pas aller plus loin. Et pour certains sites comme Danser en France, on ne voit plus les photos. Serait-ce possible que l’on puisse remédier à ces inconvénients. J’en serai heureuse. Merci beaucoup en tout cas
Une bonne nouvelle, même si 2017 reste assez éloigné dans le temps.
On pourrait imaginer d’autres solutions basées sur des scrap open source, tels que common crawl.
On ne le dit pas assez: Dans le web actuel, il n’y a pas seulement un manque de sang neuf (les « petits sites innovateurs »), mais il y a aussi un taux de mortalité croissant (que je ne sais cependant pas chiffrer).
Facebook et encore plus des sites genre tripadvisor sont remplis de comptes ou de pages sur des opérateurs, des événements, des activités qui n’existent plus, ce qui ne prête pas le plus souvent à conséquence fâcheuses (sauf une perte de temps de l’internaute), mais n’a aucun intérêt.
De surcroît, le web est, comme le reste du monde, rempli de communications à connotation publicité/marketing directes ou indirectes et tout cela est fort éphémère et avec le recul sans grand intérêt..
Si Wayback Machine est bien utile dans certains cas, je crois quand même qu’ils devraient se fixer des critères et des limites. Vouloir ressusciter les liens de référence morts de Wikipedia, c’est aussi dans beaucoup de cas donner du poids à des informations qui en fait n’en avaient pas et dont la source a disparu à juste titre.
Bonne nouvelle ! Mais s’il y a un système de recherche par mot-clé sur les pages disparues, cela ne va pas aider à préserver le droit d’auteur..
Possible d’y faire une recherche par mot-clé : un Google intégré? 😉