华为发布盘古大模型 5.5：五大基础模型升级深度思考模型将上线

在今日下午举行的华为开发者大会 HDC2025 主题演讲中，华为常务董事、华为云计算 CEO 张平安宣布正式发布盘古大模型 5.5，标志着自然语言处理（NLP）、计算机视觉 (CV)、多模态、预测、科学计算五大基础模型迎来全面升级。

盘古自然语言处理 NLP 大模型方面，全新的 718B 深度思考模型作为由 256 个专家组成的 MoE 大模型，在知识推理、工具调用、数学等领域的能力实现大幅提升，处于行业领先地位。盘古大模型基于昇腾云的全栈软硬件训练而成，彰显了昇腾架构打造世界一流大模型的实力。此外，盘古大模型 5.5 在高效长序列、低幻觉、快慢思考融合、Agent 等特性上进行了升级，通过自适应快慢思考合一技术，使模型能根据问题难易程度自动切换思考模式，整体推理效率提升 8 倍。盘古深度研究 DeepDiver 借助长链难题合成、渐进式奖励等技术，在网页搜索、常识性问答等应用上展现出高效执行能力，如 5 分钟内完成超过 10 跳的复杂问答、生成万字以上专业调研报告，显著提升了工作效率。

在盘古预测大模型领域，采用业界首创的 triplettransformer 统一预训练架构，对不同行业的数据进行统一编码和处理，极大提升了预测精度和跨行业、跨场景的泛化性。

盘古科学计算大模型方面，华为云持续深化其与科学应用领域的结合。深圳气象局基于盘古升级了「智霁」大模型，实现 AI 集合预报，更直观地反映天气系统演变可能性，减少预报误差。重庆市气象局针对成渝地区降水特点，打造了「天资・12h」气象大模型，提升灾害天气日内预报预警能力。深圳能源则采用盘古进行中短期风光水发电量预测，减少弃电现象，提升能源开发效率。

盘古计算机视觉 CV 大模型方面，华为云发布了全新 MoE 架构的 300 亿参数视觉大模型，这是目前业界最大的视觉模型，全面支持多维度、泛视觉的感知、分析与决策。同时，盘古 CV 大模型通过跨维度生成模型，构建了工业场景稀缺的泛视觉故障样本库，极大提升了业务场景的可识别种类与精度。

盘古多模态大模型方面，全新发布了基于盘古多模态大模型的世界模型，为智能驾驶、具身智能机器人的训练构建数字物理空间，实现持续优化迭代。在智能驾驶领域，盘古世界模型能生成大量训练数据，无需依赖高成本的路采，为智能驾驶的发展提供了有力支持。

此外，在华为云盘古大模型 5.5 发布后，其进一步拓展应用场景，推出了五款具备深度思考能力的行业自然语言大模型。这五款大模型分别为盘古医学 Thinking 大模型、盘古金融 Thinking 大模型、盘古政务 Thinking 大模型、盘古工业 Thinking 大模型以及盘古汽车 Thinking 大模型，旨在为不同行业提供更专业、更智能的自然语言处理解决方案。据悉，这五款大模型很快将正式上线，届时将为各行业带来更加高效、精准的自然语言处理体验。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

华为发布盘古大模型 5.5：五大基础模型升级深度思考模型将上线

华为云发布盘古 5.5：三元组编码架构引领预测大模型新潮流！

ChatGPT 新笔记工具发布：隐形记录，智能整理会议精华

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

华为云发布盘古 5.5：三元组编码架构引领预测大模型新潮流！

ChatGPT 新笔记工具发布：隐形记录，智能整理会议精华

特斯拉 Robotaxi 无人出租车正式测试：全自动驾驶迈向新里程碑！

从文本生成到指令编辑 OmniGen2 重塑开源多模态模型应用场景

蚂蚁集团加速推进 AI 医疗健康，推出全新大模型应用 「AQ」

「6 月 30 日 AI 日报」 百度开源文心大模型 4.5 系列；通义千问多模态生成模型 Qwen VLo

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

蚂蚁集团加速推进 AI 医疗健康，推出全新大模型应用「AQ」

「6 月 30 日 AI 日报」百度开源文心大模型 4.5 系列；通义千问多模态生成模型 Qwen VLo