豆包大模型 1.6-vision 正式发布,对比上一代综合成本降低约 50%

火山引擎官微今日宣布,正式发布大模型 1.6-vision。据介绍,豆包大模型 1.6-vision 是豆包家族首个具备工具调用能力的视觉深度思考模型,拥有更强的通用多模态理解和推理能力,并支持 ResponsesAPI。

豆包大模型 1.6-vision 包括三大优势,包括:

调用工具,视觉理解更精准。以工具调用的差异化能力,将图像融入其思维链中,实现对图片的定位、剪裁、点选、画线、缩放、旋转等精细处理。并通过模拟人类从 「从全局扫描到局部聚焦」 的视觉推理过程,在增强推理可解释性的同时,可高效精准地完成图像操作。

应用开发更高效。支持 ResponsesAPI,可自主选择调用工具,大幅度减少 Agent 开发过程中的代码量,提升开发效率,让开发者应用开发更加高效。

更高模型性价比。对比上一版视觉理解模型 Doubao-1.5-thinking-vision-pro,综合成本降低约 50%,以更低成本解锁更强性能,性价比再次跃升!

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

火山引擎发布豆包大模型 1.6-vision 视觉理解能力实现重大突破

2025-10-1 1:21:31

AI 资讯

斯坦福顶尖科学家许主洪加盟阿里通义

2025-10-1 1:21:49

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索