技术

Reddit 因担心数据被 AI 挖掘而屏蔽 Wayback Machine

国阳 DNUM_BDZAIZCACF 16:44

Reddit 将限制 Wayback Machine 访问大部分内容,以防止 AI 挖掘数据,仅允许保存主页和热门标题。

快速摘要:

Reddit 限制 Wayback Machine 仅保存主页和热门标题。

原因:担心人工智能公司违反政策挖掘数据。

Reddit 之前屏蔽了 API,并要求搜索引擎为数据付费。

Reddit 证实,已发现多家人工智能公司正在从互联网档案馆的 Wayback Machine 中抓取数据,这违反了其平台政策。因此,该社交网络将限制 Wayback Machine 的访问,使其只能存档 Reddit.com 主页和热门标题列表,而不能像以前那样存档完整的帖子、评论或用户个人资料。

Reddit chặn Wayback Machine vì lo ngại dữ liệu bị AI khai thác

Reddit 发言人 Tim Rathschmidt 表示,Reddit 要求互联网档案馆遵守其隐私政策并删除已删除的内容,然后才能恢复完全访问权限。

Reddit 表示,这些限制措施将从今天开始逐步实施。该公司已提前联系互联网档案馆,告知其这一决定,并曾表达过对 Wayback Machine 内容被抓取的担忧。

这并非 Reddit 首次封杀数据抓取工具。2023 年,Reddit 修改了其 API 政策,迫使一些第三方应用因无力支付数据访问费用而关闭——据报道,原因是这些 API 被用于训练 AI。

去年,Reddit 签署了一项协议,向谷歌提供数据用于搜索和人工智能训练,并开始屏蔽其他主要搜索引擎,前提是它们不付费。该公司还与 OpenAI 达成了和解,但于 2024 年 6 月起诉了 Anthropic,指控其在承诺停止的情况下继续抓取数据。

Wayback Machine 主管马克·格雷厄姆 (Mark Graham) 表示,互联网档案馆与 Reddit 有着长期的合作关系,并且仍在讨论这个问题。

特色义安报纸

最新的

x
Reddit 因担心数据被 AI 挖掘而屏蔽 Wayback Machine
供电内容管理系统- 产品