在 AI 公司因训练数据引发的版权争议持续发酵之际,自由软件组织 Free Software Foundation(FSF)提出了一个不同于传统赔偿模式的诉求:如果 AI 公司使用其版权内容训练模型,更希望获得的是“用户自由”而非金钱补偿。
此次争议源于 AI 公司 Anthropic 在训练模型时,从影子图书馆 Library Genesis 下载了 700 多万本书籍。随后公司与部分图书作者达成和解,并开始联系相关作者提供经济补偿。
在这些书籍中,包括由 Sam Williams 撰写的传记作品 Free as in Freedom: Richard Stallman's Crusade for Free Software,该书讲述了自由软件运动创始人 Richard Stallman 的故事。
这本书由 O'Reilly Media 与 FSF 共同出版,并采用 GNU Free Documentation License(GNU FDL)发布。这是一种自由许可证,允许用户在无需支付费用的情况下复制、分发和修改内容。
FSF 表示,对经济补偿本身兴趣并不大。如果 AI 公司使用其版权材料训练模型,更理想的“补偿”应是扩大用户自由,包括:
换句话说,FSF 希望 AI 公司遵循类似自由软件的理念,让 AI 系统也具备可研究、可修改和可再分发的自由。
这一立场反映出 AI 时代的一种新矛盾:
一方面,大模型训练依赖海量公开或半公开数据;另一方面,许多 AI 公司却选择封闭模型和数据。
FSF 的观点是,如果 AI 系统建立在自由知识之上,那么其成果也应该在一定程度上回馈公众。
随着 AI 版权诉讼在全球不断增加,围绕 数据使用权、模型开放程度以及知识共享的讨论,很可能成为未来 AI 产业治理的重要议题。