La confrontation entre les plateformes de contenu et les entreprises d'IA continue de s'intensifier lorsque Reddit a recemment annonce qu'il bloquerait Wayback Machine un outil de stockage web populaire d'Internet Archive qui scanne et stocke la plupart des publications des commentaires et des informations publiques sur la plateforme.
La raison avancee par Reddit est qu'ils ont des preuves que certaines entreprises d'IA profitent de Wayback Machine pour collecter des donnees eviter les frais d'autorisation et exploiter les informations des utilisateurs.
Cette decision signifie que Wayback Machine ne pourra plus stocker les publications les commentaires ou les informations de profil de Reddit a l'exception du contenu apparaissant sur la page d'accueil de Reddit.com.
Cette demarche intervient dans un contexte ou cette plateforme de reseau social renforce le controle des donnees et est prete a cooperer avec les entreprises d'IA mais seulement lorsqu'elles acceptent de payer des frais.
Auparavant Reddit avait affirme qu'il ne limiterait pas les 'artisans de bonne volonte' comme Internet Archive. Cependant cette position a change lorsqu'il a ete decouvert que certaines parties soutenant l'IA exploitaient illegalement des donnees via Wayback Machine.
Archives Internet et machine de Wayback
Fondee en 1996 aux Etats-Unis l'Internet Archive est une organisation a but non lucratif fondee par l'ingenieur informatique Brewster Kahle dans le but de construire un stockage complet et public sur Internet. La plus celebre est Wayback Machine un outil permettant aux utilisateurs d'acceder aux versions archivees des sites Web du passe.
Internet Archive offre un acces gratuit a de nombreux types de contenu numerique des sites web des logiciels de la musique des films aux publications imprimees...
La plupart des donnees sont collectees automatiquement via un systeme de crawler afin de preserver les informations publiques et de lutter contre la 'fuite' des donnees numeriques.
Selon Brewster Kahle l'Internet Archive n'est pas seulement une bibliotheque numerique mais aussi une'solution de protection culturelle' face aux fluctuations technologiques. M. Brewster Kahle a compare le projet a un effort pour recreer la 'Bibliotheque d'Alexandrie' de l'epoque moderne en veillant a ce que les connaissances humaines soient conservees pour les generations futures.
Le blocage de Wayback Machine par Reddit montre de nouveaux tensions a l'ere de l'IA ou la frontiere entre la protection des droits de propriete des donnees et le maintien d'un internet ouvert devient de plus en plus difficile a definir.