经典知识库巨头 《大英百科全书》(Encyclopaedia Britannica)及其子公司 韦氏词典(Merriam-Webster)在曼哈顿联邦法院提起诉讼,指控 OpenAI 在未获许可的情况下,滥用受版权保护的内容训练其人工智能模型 ChatGPT。
起诉书称:
- OpenAI 复制了近 10 万篇百科条目和词典条目,用于训练 ChatGPT;
- AI 输出的内容摘要与原文“几乎逐字相同”,构成版权侵权;
- 这种行为可能导致用户流失,直接影响原网站流量和商业价值;
- 同时,OpenAI 在生成内容中引用大英百科信息,可能误导公众以为获得官方授权,涉及商标侵权。
原告要求:
1. 经济赔偿;
2. 法院发布禁令,阻止进一步侵权行为。
面对类似版权诉讼,OpenAI 及其他 AI 公司通常提出:
- 使用版权内容属于 “合理使用”(Fair Use);
- 模型训练是对数据的统计学习,并非直接复制内容。
然而,《大英百科全书》此举凸显了传统内容创作者与 AI 企业之间日益紧张的版权博弈,也引发业界对训练数据合法性、AI 输出权属以及内容责任的广泛讨论。
此次诉讼是继 Perplexity AI 版权争议后,《大英百科全书》维护知识产权的又一重大行动。随着生成式 AI 在知识服务领域的扩张,版权问题、数据使用授权及内容责任将成为 AI 公司必须直面的核心挑战。
技术与法律交汇的新前沿:AI 模型训练便利了知识获取,但版权保护仍不可忽视。