AI 数据版权新纪元:Real Simple Licensing 协议引发行业关注

随着) 行业面临日益严峻的版权问题,尤其是在 与版权方达成 15 亿美元和解后,许多企业开始重视其训练数据的合法性。目前,有多达 40 起未授权数据使用的诉讼案正在进行中,其中包括一起因 制作超人形象而被起诉的案件。

在没有有效的授权体系的情况下,AI 公司可能面临大规模的,这让行业前景堪忧。为了应对这一挑战,一群技术专家和网络出版商联合推出了一项名为 RealSimpleLicensing(RSL) 的新系统,旨在实现大规模的数据授权。该系统已经得到了 Reddit、Quora 和 Yahoo 等大型网络出版商的支持,但行业内能否形成合力,吸引主要的 AI 实验室参与仍然是个未知数。

RSL 的联合创始人 EckartWalther 表示,他们的目标是创建一个可以在互联网上广泛应用的训练数据授权体系。他指出,「我们需要为互联网提供机器可读的许可协议,而 RSL 正是解决这一问题的工具。」

多年来,诸如数据提供者联盟等组织一直在推动更清晰的数据采集实践,但 RSL 是第一个旨在提供实际技术和法律基础设施的尝试。技术上,RSL 协议定义了出版商可以为其内容设定的具体许可条款,这包括 AI 公司是否需要定制许可或采用知识共享 (CreativeCommons) 条款。参与的网页将把条款纳入其 「robots.txt」 文件,以便轻松识别哪些数据受哪些条款保护。

在法律层面,RSL 团队建立了一个名为 RSLCollective 的集体许可组织,旨在为出版商谈判条款并收取版税,类似于音乐行业的 ASCAP 或电影行业的 MPLC。目前,已经有许多知名出版商加入了这一集体,包括 Yahoo、Reddit 和 Medium 等。

尽管如此,确定 具体使用哪些训练数据以计算版税的挑战依然存在。对于实时获取网络数据的产品,如摘要,数据使用的追踪相对简单,但如果训练过程未被记录,确认特定文档是否被某个) 使用就变得困难重重。

尽管存在这些挑战,RSL 的创建者们相信 AI 公司能够应对。「他们在之前的某些授权协议中已经需要能够报告数据使用情况,因此这并不是不可能的,」RSL 的另一位联合创始人 DougLeeds 表示。「只要足够好,就能让人们得到应有的报酬。」

最后,RSL 的未来能否成功,关键在于 AI 公司是否愿意接受这一新体系。随着越来越多的 AI 行业领袖呼吁建立这样的系统,RSL 团队希望他们能够信守承诺。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

AI 赋能核电运营:Nuclearn 完成 1050 万美元 A 轮融资,服务全球 65 座核反应堆

2025-9-11 1:23:13

AI 资讯

​Realbotix 与 Grupo Kuo 达成合作 将 AI 机器人引入西班牙和葡萄牙

2025-9-12 1:20:41

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索