Technologie

Reddit bloque Wayback Machine en raison de préoccupations concernant l'exploitation des données par l'IA

Quoc Duong DNUM_BDZAIZCACF 16:44

Reddit va restreindre l'accès de Wayback Machine à la plupart des contenus pour empêcher l'IA d'exploiter les données, permettant ainsi uniquement la sauvegarde de la page d'accueil et des titres populaires.

Résumé rapide :

Reddit limite la Wayback Machine à la sauvegarde uniquement de la page d'accueil et des titres populaires.

Motif : inquiétudes concernant les entreprises d’IA qui exploitent des données en violation de la politique.

Reddit avait auparavant bloqué l'API et obligé les moteurs de recherche à payer pour les données.

Reddit a confirmé avoir découvert que plusieurs entreprises d'IA récupéraient des données de la Wayback Machine d'Internet Archive, en violation de ses règles de plateforme. Par conséquent, le réseau social limitera l'accès à la Wayback Machine, lui permettant ainsi d'archiver uniquement la page d'accueil de Reddit.com et une liste de titres populaires, plutôt que des publications, des commentaires ou des profils d'utilisateurs entiers comme auparavant.

Reddit chặn Wayback Machine vì lo ngại dữ liệu bị AI khai thác

Reddit exige que l'Internet Archive se conforme à ses politiques de confidentialité et supprime le contenu supprimé avant de restaurer l'accès complet, a déclaré le porte-parole Tim Rathschmidt.

Reddit a indiqué que les restrictions seraient progressivement mises en place à partir d'aujourd'hui. L'entreprise a contacté Internet Archive à l'avance pour l'informer de cette décision et a exprimé des inquiétudes quant au contenu supprimé de la Wayback Machine par le passé.

Ce n'est pas la première fois que Reddit bloque des scrapers de données. En 2023, Reddit a modifié sa politique relative aux API, forçant plusieurs applications tierces à fermer, car elles ne pouvaient plus payer pour l'accès aux données, apparemment parce que les API étaient utilisées pour entraîner l'IA.

L'année dernière, Reddit a signé un accord pour fournir des données à Google pour la recherche et l'entraînement de l'IA, et a commencé à bloquer les autres grands moteurs de recherche s'ils ne payaient pas. L'entreprise a également conclu un accord avec OpenAI, mais a poursuivi Anthropic en justice en juin 2024 pour avoir prétendument continué à collecter des données malgré ses promesses d'arrêter.

Mark Graham, directeur de la Wayback Machine, a déclaré que l'Internet Archive entretient une relation de longue date avec Reddit et discute toujours de la question.

Journal Nghe An en vedette

Dernier

x
Reddit bloque Wayback Machine en raison de préoccupations concernant l'exploitation des données par l'IA
ALIMENTÉ PARUNCMS- UN PRODUIT DENEKO