在 8 月 28 日发布的中文多模态视觉语言模型测评基准 (SuperCLUE-VLM) 榜单中,Gemini-2.5-Pro 以总分 74.99 分位居第一,OpenAI 的 GPT-5(high) 以 68.59 分排在第二位。
该基准基于中文场景特点,围绕基础认知、视觉推理和视觉应用三大核心维度构建评测体系,力求为多模态视觉语言模型的发展提供客观、公正的评估标准。
此次评测共涵盖了 Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5(high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest 等共计 15 个多模态模型,涵盖国内外主流模型。
最终,Gemini-2.5-Pro 以总分 74.99 分位居第一,OpenAI 的 GPT-5(high) 以 68.59 分排在第二位,而百度的 ERNIE-4.5-Turbo-VL 则与其他国内模型并列,显示出强劲的市场竞争力。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。