Reddit блокирует Wayback Machine из-за опасений по поводу сбора данных с помощью ИИ
Reddit ограничит доступ Wayback Machine к большей части контента, чтобы помешать ИИ извлекать данные, разрешив сохранять только домашнюю страницу и популярные заголовки.
Краткое описание:
Reddit ограничивает Wayback Machine сохранением только домашней страницы и популярных заголовков.
Причина: опасения относительно компаний, занимающихся разработкой ИИ, которые занимаются сбором данных с нарушением политики.
Reddit ранее заблокировал API и потребовал от поисковых систем платить за данные.
Reddit подтвердил, что обнаружил, что несколько компаний, занимающихся разработкой искусственного интеллекта, собирают данные с Wayback Machine, принадлежащей Internet Archive, нарушая правила платформы. В связи с этим социальная сеть ограничит доступ к Wayback Machine, разрешив архивировать только главную страницу Reddit.com и список популярных заголовков, а не целые публикации, комментарии или профили пользователей, как раньше.

Reddit требует от Архива Интернета соблюдать свою политику конфиденциальности и удалить удаленный контент перед восстановлением полного доступа, заявил пресс-секретарь Тим Ратшмидт.
Reddit заявил, что ограничения будут вводиться постепенно, начиная с сегодняшнего дня. Компания заранее связалась с Internet Archive, чтобы сообщить о решении, и ранее выражала обеспокоенность по поводу кражи контента с Wayback Machine.
Reddit не в первый раз блокирует сборщики данных. В 2023 году Reddit изменил свою политику в отношении API, вынудив несколько сторонних приложений закрыться из-за того, что они не смогли позволить себе платить за доступ к данным — предположительно, из-за того, что API использовались для обучения ИИ.
В прошлом году Reddit заключил соглашение о предоставлении данных Google для поиска и обучения искусственного интеллекта и начал блокировать другие крупные поисковые системы в случае неуплаты. Компания также достигла соглашения с OpenAI, но в июне 2024 года подала в суд на Anthropic за якобы продолжающийся сбор данных, несмотря на обещание прекратить это.
Марк Грэм, директор Wayback Machine, заявил, что Internet Archive имеет давние отношения с Reddit и все еще обсуждает этот вопрос.