智谱 AI 开源 GLM-4.1V-Thinking: 多模态推理模型再突破

智谱 正式最新一代通用视觉模型 GLM-4.1V-Thinking,基于 GLM-4V 架构,新增思维链推理机制,显著提升复杂认知任务能力。该模型支持图像、视频、文档等多模态输入,擅长长视频理解、图像问答、学科解题、文字识别、文档解读、Grounding、GUIAgent 及代码生成等多样化场景,覆盖千行百业的应用需求。

GLM-4.1V-9B-Thinking 在 28 项权威评测中表现卓越,其中 23 项达成 10B 级模型最佳成绩,18 项持平或超越 72B 参数的 Qwen-2.5-VL,涵盖 MMStar、MMMU-Pro、ChartQAPro、OSWorld 等基准测试。其 9 亿参数规模结合高效推理能力,使其可在单张 3090 显卡上运行,且提供免费商用授权,极大降低了开发者门槛。

智谱 AI 表示,GLM-4.1V-Thinking 通过强化学习与课程采样技术,优化了跨领域推理能力,展现出对复杂问题的深度思考与解决能力。模型已上线 ,供全球开发者免费体验。业界认为,此举将推动多模态 AI 在教育、科研、商业等领域的广泛应用,标志着智谱 AI 在通用道路上的又一里程碑。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

智谱 AI 重磅开源 GLM-4.1V-Thinking!多模态推理新王者,挑战全球顶尖模型

2025-7-3 1:21:23

AI 资讯

亚马逊 Alexa + 助手用户突破百万,智能语音体验再升级

2025-7-3 1:21:41

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索