DeepSeek-V3.1 发布:更高思考效率 更强 Agent 能力

8 月 21 日,深度求索科技有限公司正式发布了其最新版本的 模型——-V3.1。此次升级标志着公司在迈向 Agent 时代方面迈出了坚实的第一步,为用户提供了一个更加强大、高效且多功能的解决方案。

DeepSeek-V3.1 的发布带来了多项重大改进。首先,该版本引入了混合推理架构,使得一个模型能够同时支持思考模式与非思考模式,为用户提供了更灵活的选择。在思考模式下,DeepSeek-V3.1-Think 相较于之前的 DeepSeek-R1-0528 版本,能够在更短的时间内给出答案,显著提高了思考效率。此外,通过 Post-Training 优化,新模型在工具使用与任务中的表现也得到了大幅提升。

为了更好地服务用户,官方 App 与网页端模型已同步升级至 DeepSeek-V3.1。用户可以通过点击 「深度思考」 按钮,轻松实现思考模式与非思考模式之间的自由切换。同时,DeepSeekAPI 也进行了同步升级,其中`deepseek-chat`对应非思考模式,`deepseek-reasoner`对应思考模式,且上下文容量已扩展至 128K。此外,APIBeta 接口还新增了对`strict`模式的 FunctionCalling 支持,确保输出的 Function 满足 schema 定义。

DeepSeek-V3.1 还增强了对 AnthropicAPI 格式的支持,使得用户能够轻松地将该模型的能力接入 ClaudeCode 框架。这为开发者提供了更大的灵活性,进一步拓展了模型的应用场景。

在工具调用和智能体支持方面,DeepSeek-V3.1 也取得了显著进步。在编程智能体测评中,无论是使用内部框架还是在命令行终端环境下进行复杂任务测试,DeepSeek-V3.1 相较于之前的版本都有了明显的提升。在搜索智能体测评中,DeepSeek-V3.1 在多项指标上也取得了较大提升,尤其是在需要多步推理的复杂搜索测试和多学科专家级难题测试中,其性能已大幅领先于之前的版本。

此外,DeepSeek-V3.1 在思考效率方面也进行了优化。经过思维链压缩训练后,V3.1-Think 在输出 token 数减少 20%-50% 的情况下,各项任务的平均表现与 R1-0528 持平。同时,在非思考模式下,V3.1 也能够有效控制输出长度,保持与之前版本相同的模型性能。

为了进一步推动技术的与共享,DeepSeek-V3.1 的 Base 模型已在 和魔搭平台开源。Base 模型在 V3 的基础上重新进行了外扩训练,增加了 840Btokens 的训练量。

在价格方面,深度求索科技有限公司宣布,自北京时间 年 9 月 6 日凌晨起,将对 DeepSeek 开放平台 API 接口调用价格进行调整,执行新版价格表,并取消夜间时段优惠。在 9 月 6 日前,所有 API 服务仍按原价格政策计费,用户可继续享受当前优惠。同时,公司已进一步扩容 API 服务资源,以更好地满足用户的调用需求。

开源链接:

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base

官方文档:

https://api-docs.deepseek.com/zh-cn/guides/anthropic_api

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

阿里分拆斑马智行赴港上市: 智能汽车操作系统迎来独立发展

2025-8-22 1:21:27

AI 资讯

企业已向生成式 AI 投资大量资金,但 95% 的回报为零

2025-8-22 1:21:44

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索