AI 大模型的版权风暴：行业巨头面临 7500 亿美元赔偿风险

AI 资讯
8 月 16 日
编辑

小强

近年来，随着人工智能技术的飞速发展，大型 AI 模型的训练数据来源问题日益成为业界关注的焦点。许多知名企业在构建其 AI 模型时，似乎都选择了使用大量未授权的版权内容作为数据。这一「秘密配方」引发了激烈的法律争论，并将硅谷的科技巨头们推上了风口浪尖。

2023 年，《纽约时报》首次向 OpenAI 和微软提起诉讼，正式揭开了这场法律之战的序幕。不久后，Meta 因其 Llama 模型涉嫌使用盗版书籍而面临集体诉讼，而 Anthropic 也因为其 Claude 模型的训练数据受到指控。所有主要玩家几乎都面临着法律挑战，究竟在未经授权的情况下，使用受版权保护的作品作为 AI 训练数据，是否属于「合理使用」?

2025 年 6 月，法院在对 Anthropic 案的裁决中给出了一个重要信号: 尽管模型训练本身可能被视为一种高度「变革性」的使用，但如果数据来源涉及盗版，基本上就无法逃避侵权的指控。预计 Anthropic 可能面临高达 7500 亿美元的赔偿，这一消息令所有 AI 公司心惊胆战。

为了满足对数据的需求，各大模型公司采用了多种「创意」方式来获取数据，有的甚至游走在法律边缘。例如，OpenAI 利用网络爬虫广泛抓取网络内容，甚至在抓取过程中清除版权信息; 而在高质量文本资源逐渐枯竭后，AI 公司又转向视频和纸书等其他格式的数据，利用技术手段进行提取。

此外，有些公司甚至选择了直接使用盗版书籍。例如，Meta 在训练 Llama 模型时，就被指控使用来自「影子图书馆」的盗版书籍。与此相反，苹果等保守派企业则选择通过合法授权和自有数据来规避法律风险。

在法律诉讼的推进中，版权方的策略逐渐转变，焦点不再是 AI 如何使用数据，而是数据的获取是否合法。法院的裁决表明，虽然 AI 的训练行为可能不构成直接侵权，但盗版资源的使用将受到严厉打击。

如今，AI 行业面临着一场前所未有的版权战争，如何在法律边缘游走并实现创新，成为了科技巨头们亟需解决的问题。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

AI 大模型的版权风暴：行业巨头面临 7500 亿美元赔偿风险

Nvidia 投资 5 亿美元，Cohere 公司估值达 68 亿美元

ChatGPT 或将引入广告！OpenAI 高管首度松口，用户破 7 亿仍难盈利

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

​Nvidia 投资 5 亿美元，Cohere 公司估值达 68 亿美元

ChatGPT 或将引入广告！OpenAI 高管首度松口，用户破 7 亿仍难盈利

腾讯元宝 —— 基于混元大模型的 AI 助手新势力

​Figma 推出新工具，助力 AI 更精准地转换设计为代码

文档解析 LLM MonkeyOCR 震撼登场:3B 小模型完胜 Gemini

火山引擎正式发布​豆包大模型 1.6 和豆包·视频生成模型 Seedance 1.0 pro

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

Nvidia 投资 5 亿美元，Cohere 公司估值达 68 亿美元

Figma 推出新工具，助力 AI 更精准地转换设计为代码

火山引擎正式发布豆包大模型 1.6 和豆包·视频生成模型 Seedance 1.0 pro