前谷歌 CEO 投资的初创公司发布 240 亿参数化学推理模型，准确率超越多种领先模型

AI 资讯
25 年 6 月 18 日
编辑

小强

在人工智能领域，大模型的研究不断进展，尤其是在推理能力的提升上。最近，由前谷歌 CEO 埃里克・施密特投资的初创公司 FutureHouse，开源了一个名为 ether0 的化学任务推理模型，参数规模高达 240 亿。这一模型在不需要额外领域预训练的情况下，通过后训练技术，展现出强大的化学领域能力，尤其是在数据需求上相比于传统领域专用模型显著减少。

推理模型的应用不仅限于简单的选择题测试，FutureHouse 团队希望通过 ether0 改变这种现状，推动科学推理的深入研究。为了构建该模型，研究团队从大量的学术论文中整理了化学实验数据，追踪分子特性如溶解度和气味，并将这些数据转化为可验证的科学问题。

ether0 基于 Mistral-Small-24B 架构，利用强化学习进行训练，并处理了 640，730 个实验数据相关的化学问题，涵盖 18 类任务，包括合成可行性、血脑屏障渗透性和气味分析等。为了提升模型性能，研究团队引入了推理行为蒸馏和动态课程学习等技术。

在性能评估方面，ether0 与多种通用大语言模型（如 Claude、o1）及化学专用模型 (如 ChemDFM、TxGemma) 进行了对比。结果显示，ether0 在开放答案 (OA) 类别中准确率最高，选择题 (MCQ) 方面也具备强大的竞争力。其在某些任务上的准确率甚至达到了竞争对手的两倍以上。

此外，ether0 在训练成本上也展现出显著的优势，要达到相似的反应预测准确率，传统的非推理型模型需要消耗 50 倍以上的数据。尽管 ether0 在独立基准测试中难以与其他模型及人类表现进行交叉验证，但其能够对未经过训练的分子结构进行有效推理。

总之，ether0 不仅能理解自然语言提问，还能通过自然语言进行推理，最终生成分子结构，特别擅长于类药分子的设计。尽管目前仍处于原型阶段，但其已为未来构建通用科学推理模型奠定了坚实的基础。

划重点:

🌟Ether0 是由 FutureHouse 开源的 240 亿参数化学推理模型。

📈该模型的准确率在多个任务中超越了 GPT-4.1 和 DeepSeek-R1 等领先模型。

💰训练 ether0 所需的数据量显著低于传统非推理型模型。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

前谷歌 CEO 投资的初创公司发布 240 亿参数化学推理模型，准确率超越多种领先模型

从「懂创作」到「超长待机」：百度文心大模型赋能数字人，助力电商营销变革

月之暗面发布全新开源模型 Kimi-Dev-72B，打破编程基准记录

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

从 「懂创作」 到 「超长待机」：百度文心大模型赋能数字人，助力电商营销变革

​月之暗面发布全新开源模型 Kimi-Dev-72B，打破编程基准记录

支付宝宣布为 AI 开发者提供国内首个 「AI 打赏」 服务

未来已来！Hengbot 发布 Sirius 机器狗，能跳舞会踢球，还有 AI 陪聊

重磅消息！GPT-5 即将登场，带你体验全新多模态 AI 时代！

京东具身智能战略全面提速 JoyInside 合作版图曝光

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

从「懂创作」到「超长待机」：百度文心大模型赋能数字人，助力电商营销变革

月之暗面发布全新开源模型 Kimi-Dev-72B，打破编程基准记录

支付宝宣布为 AI 开发者提供国内首个「AI 打赏」服务