随着 AI 公司走向成熟,高质量数据的争夺已经成为整个行业最激烈的战场之一,催生了 Mercor、Surge 等公司,其中最引人注目的是 AlexandrWang 创立的 ScaleAI。但如今 Wang 已经转身执掌 Meta 的 AI 业务,许多投资人看到了机会,愿意为那些在训练数据收集方面拥有令人信服新策略的公司提供资金。
YCombinator 毕业生 Datacurve 就是这样一家公司,专注于为软件开发提供高质量数据。周四,该公司宣布完成 1500 万美元 A 轮融资,由 Chemistry 的 MarkGoldberg 领投,来自 DeepMind、Vercel、Anthropic 和 OpenAI 的员工参与投资。此前该公司还完成了 270 万美元种子轮融资,前 Coinbase 首席技术官 BalajiSrinivasan 参与了投资。
Datacurve 采用赏金猎人系统来吸引熟练的软件工程师完成最难获取的数据集。公司为这些贡献付费,迄今已分发超过 100 万美元的赏金。
但联合创始人 SerenaGe 表示,
Ge 说,我们把这当作一个消费产品来对待,而不是数据标注操作。他们花了大量时间思考如何优化,让他们想要的人感兴趣并进入平台。
这一点在训练后数据需求变得更加复杂的当下尤为重要。早期模型在简单数据集上训练,而今天的 AI 产品依赖复杂的强化学习环境,这些环境需要通过特定和战略性的数据收集来构建。随着环境变得更加复杂,数据要求在数量和质量上都变得更加严苛,这一因素可能会让 Datacurve 这样的高质量数据收集公司获得优势。
作为一家早期公司,Datacurve 目前专注于软件工程领域,但 Ge 表示这种模式同样适用于金融、营销甚至医学等领域。
Ge 解释说,他们现在正在做的是为训练后数据收集创建一个基础设施,吸引并留住各自领域的高水平人才。
在 AI 模型训练进入新阶段的背景下,数据质量的重要性正在超越数据数量。ScaleAI 曾经凭借规模化的数据标注服务占据市场主导地位,但随着 Wang 离开去 Meta 担任要职,市场格局开始松动。Datacurve 的赏金猎人模式和消费产品思维,为这个竞争激烈的赛道带来了新的可能性。从投资阵容来看,来自








