近日,昆仑万维正式发布了其全新开源模型 Skywork-R1V3.0,宣称在多模态推理方面达到了前所未有的高度,甚至与人类初级专家的水平不相上下。该模型在训练过程中采用了强化学习策略,使得其在复杂逻辑建模与跨学科知识泛化方面取得了显著进展。
Skywork-R1V3.0 是基于上一代 Skywork-R1V2.0 进行 「冷启动」,利用高质量的蒸馏数据和拒绝采样技术,成功构建了一个强大的多模态推理训练集。这一模型的设计不仅仅局限于文本,还涵盖了图像处理,使得其在图像与文本之间的推理能力得到了显著提升。
据介绍,Skywork-R1V3.0 的训练依赖于仅约 1.2 万条监督微调样本和 1.3 万条强化学习样本,展现了 「小数据激发大能力」 的独特优势。在
在具体的应用场景中,Skywork-R1V3.0 在物理、逻辑和数学推理等多个领域均表现出色。例如,在物理推理的评测中,该模型分别取得了 52.8 分和 31.5 分的
该模型在数学推理方面同样不容小觑,在 MathVista、MathVerse 和 MathVision 等评测中分别获得 77.1 分、59.6 分和 52.6 分的优异成绩,明显优于其他开源模型。这些出色的表现使得 Skywork-R1V3.0 在当前的开源多模态推理领域中成为了一个强有力的竞争者。
Skywork-R1V3.0 的发布标志着多模态推理技术的一个新高峰,它的强大性能和开源特性将极大促进 AI 技术的进一步发展。









