火山引擎发布豆包最新图像编辑、同传模型,加速 Agent 开发落地

7 月 30 日,火山引擎在其主办的 FORCELinkAI 创新巡展·厦门站活动上,发布系列新模型及 云原生服务升级成果,包括豆包·图像编辑模型 3.0、同声传译模型 2.0,以及全新升级的豆包大模型 1.6 系列,同时推出扣子核心能力、企业自有模型托管方案等工具,为企业及开发者构建 Agent、落地 提供全栈支持。

图: 火山引擎总裁谭待发布最新豆包模型

豆包系列新模型面向企业开放

针对 AI 图像编辑中 「听不懂指令、误改内容、生成效果差」 的痛点,火山引擎推出豆包·图像编辑模型 3.0(SeedEdit3.0)。该模型通过强化指令遵循能力、图像保持能力及生成质量,让用户仅凭自然语言即可完成消除冗余、调整光影、替换元素等操作,还能实现风格转换、材质变换、姿势调整等创新修图场景。该模型广泛适用于影像创作、营销等领域,企业用户可在火山方舟调用其 API,个人用户则能通过即梦或 进行体验。

最新发布的豆包·同声传译模型 2.0(Seed-LiveInterpret2.0),突破传统 「级联模型」 局限,采用全双工框架将语音延迟从 8-10 秒降至 2-3 秒,实现文本与语音同步生成。更支持 0 样本声音复刻,无需提前录制即可实时生成同音色外语语音,甚至匹配方言口音,大幅提升跨语言沟通沉浸感。

豆包大模型 1.6 系列也进行了升级。其中,极速版 Doubao-Seed-1.6-flash 模型在保持强大视觉理解能力的同时,强化了代码、推理、数学等能力,适配智能巡检、手机助手等大规模商业化场景。该模型 TPOT(首 Token 输出时间) 低至 10ms,为业界领先; 成本上,在 0-32k 输入文本长度区间 (企业最常用),每百万 tokens 输入仅 0.15 元、输出 1.5 元,在客户使用案例中,已实现延迟下降 60%、成本降低 70%。

此外,全模态向量化模型 Seed1.6-Embedding 首次实现 「文本+图像+视频」 混合模态融合检索,助力企业构建更强大的多模态知识库,在权威测评中包揽多模态全面任务及中文文本的最优成绩。

优化 AI 云原生服务,加速 Agent 开发落地

为助力 Agent 端到端开发与落地,火山引擎持续优化 AI 云原生全栈服务。7 月 26 日,AIAgent 开发平台扣子核心能力正式开源,涵盖一站式可视化开发工具 「扣子开发平台 (CozeStudio)」 和全链路管理工具 「扣子罗盘 (CozeLoop)」,采用 Apache2.0 许可证,用户可在 GitHub 下载。开源仅三天,CozeStudio 星标数破万,CozeLoop 星标数超 3000。火山引擎为其提供全面支持,企业 AI 平台 HiAgent 可调用其能力,云基础产品支持一键部署。

针对有模型定制需求的企业,火山引擎依托火山方舟模型单元推出自有模型托管方案。企业无需运维底层 GPU 资源及复杂配置,即可实现自研模型全托管,享受弹性算力,自主选择部署方式与机型,精准控制时延,且无需为业务低谷期付费,目前已开放邀测。

同时,火山方舟升级 API 体系,推出 ResponsesAPI。该 API 具备原生上下文管理能力,支持多轮对话链式管理及文本、图像等多模态数据衔接,结合缓存能力可降低 80% 成本; 还支持单次请求联动多工具与模型组合响应,将智能助手 Agent 开发从 460 行代码、1-2 天,缩减至 60 行代码、1 小时,大幅提升效率。

此次系列发布进一步完善了火山引擎 AI 生态布局,为企业与开发者提供从基础模型到开发工具的全链条支持,加速 AI 在各行业的落地应用。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

OWL 团队开源一款多智能体 Manus 类工具 Eigent

2025-7-31 1:21:01

AI 资讯

Anthropic 计划融资 30 亿至 50 亿美元,估值将涨至 1700 亿美元

2025-7-31 1:21:07

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索