《大英百科全书》起诉 OpenAI：10 万篇文章训练 AI 引发版权争议

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

经典知识库巨头 《大英百科全书》（Encyclopaedia Britannica）及其子公司 韦氏词典（Merriam-Webster）在曼哈顿联邦法院提起诉讼，指控 OpenAI 在未获许可的情况下，滥用受版权保护的内容训练其人工智能模型 ChatGPT。

1. 诉讼背景

起诉书称：
- OpenAI 复制了近 10 万篇百科条目和词典条目，用于训练 ChatGPT；
- AI 输出的内容摘要与原文“几乎逐字相同”，构成版权侵权；
- 这种行为可能导致用户流失，直接影响原网站流量和商业价值；
- 同时，OpenAI 在生成内容中引用大英百科信息，可能误导公众以为获得官方授权，涉及商标侵权。

原告要求：
1. 经济赔偿；
2. 法院发布禁令，阻止进一步侵权行为。

2. AI 公司立场

面对类似版权诉讼，OpenAI 及其他 AI 公司通常提出：
- 使用版权内容属于 “合理使用”（Fair Use）；
- 模型训练是对数据的统计学习，并非直接复制内容。

然而，《大英百科全书》此举凸显了传统内容创作者与 AI 企业之间日益紧张的版权博弈，也引发业界对训练数据合法性、AI 输出权属以及内容责任的广泛讨论。

3. 行业影响

版权意识升级：AI 模型训练中使用的文档、书籍、网页等，可能面临严格版权审查；
法律界定不明：合理使用边界、生成内容归属、商标和误导性引用仍需法律明确；
AI 数据策略调整：企业可能需要购买授权数据或使用开源/自有数据集，以规避潜在法律风险。

4. 结论

此次诉讼是继 Perplexity AI 版权争议后，《大英百科全书》维护知识产权的又一重大行动。随着生成式 AI 在知识服务领域的扩张，版权问题、数据使用授权及内容责任将成为 AI 公司必须直面的核心挑战。

技术与法律交汇的新前沿：AI 模型训练便利了知识获取，但版权保护仍不可忽视。

66 次点击 ∙ 0 人收藏

登录后收藏

0 条回复