昆仑万维重磅发布 Skywork-R1V 3.0:跨模态推理能力直逼人类专家!

近日,昆仑万维正式发布了其全新模型 Skywork-R1V3.0,宣称在多模态推理方面达到了前所未有的高度,甚至与人类初级专家的水平不相上下。该模型在训练过程中采用了强化学习策略,使得其在复杂逻辑建模与跨学科知识泛化方面取得了显著进展。

Skywork-R1V3.0 是基于上一代 Skywork-R1V2.0 进行 「冷启动」,利用高质量的蒸馏数据和拒绝采样技术,成功构建了一个强大的多模态推理训练集。这一模型的设计不仅仅局限于文本,还涵盖了图像处理,使得其在图像与文本之间的推理能力得到了显著提升。

据介绍,Skywork-R1V3.0 的训练依赖于仅约 1.2 万条监督微调样本和 1.3 万条强化学习样本,展现了 「小数据激发大能力」 的独特优势。在权威的综合性多模态评测 MMMU 中,Skywork-R1V3.0 以 76.0 分的成绩领先,超越了 -3.7-Sonnet(75.0 分) 和 -4.5(74.4 分) 等闭源模型,证明了其卓越的跨模态理解能力。

在具体的应用场景中,Skywork-R1V3.0 在物理、逻辑和数学推理等多个领域均表现出色。例如,在物理推理的评测中,该模型分别取得了 52.8 分和 31.5 分的最佳开源成绩,显示出其对复杂物理问题的理解能力。此外,在逻辑推理测试中,Skywork-R1V3.0 也取得了 59.7 分的佳绩。

该模型在数学推理方面同样不容小觑,在 MathVista、MathVerse 和 MathVision 等评测中分别获得 77.1 分、59.6 分和 52.6 分的优异成绩,明显优于其他开源模型。这些出色的表现使得 Skywork-R1V3.0 在当前的开源多模态推理领域中成为了一个强有力的竞争者。

Skywork-R1V3.0 的发布标志着多模态推理技术的一个新高峰,它的强大性能和开源特性将极大促进 技术的进一步发展。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

国内团队创造历史!「人类最后的考试」 首次得分突破 30 分,AI 竞争再升级!

2025-7-10 1:20:30

AI 资讯

香港首个 AI 问答系统上线,带你畅游智能时代

2025-7-10 1:20:38

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索