AI 日报：智谱视觉推理模型 GLM-4.5V 开源；达摩院开源三项具身智能核心技术；360 智脑推出 Light-IF 系列模型

欢迎来到【AI 日报】栏目! 这里是你每天探索人工智能世界的指南，每天我们为你呈现 AI 领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新 AI 产品应用。

新鲜 AI 产品点击了解:https://www.aibase.cn/

1、智谱 GLM-4.5V 开源发布: 全球 100B 级最佳视觉推理模型

智谱宣布推出并开源了全球 100B 级效果最佳的开源视觉推理模型 GLM-4.5V，这是该公司在通向通用人工智能（AGI）道路上的又一重要探索性成果。

【AiBase 提要:】

🤖GLM-4.5V 总参数达到 106B，在 41 个视觉多模态榜单中达到 SOTA 性能

🎯具备全场景视觉推理能力，包括图像推理、视频理解、GUI 任务等

💡新增"思考模式"开关，平衡效率与效果

💰API 价格低至输入 2 元/Mtokens，输出 6 元/Mtokens

2、阿里达摩院开源三项具身智能核心技术

在世界机器人大会上，阿里达摩院宣布开源三项自研核心技术:VLA 模型 RynnVLA-001-7B、世界理解模型 RynnEC 以及机器人上下文协议 RynnRCP。这一举措旨在推动数据、模型与机器人本体的兼容适配，打通具身智能开发的完整流程。

【AiBase 提要:】

🚀开源三项核心技术:VLA 模型、世界理解模型、机器人上下文协议

🔗RynnRCP 实现从传感器数据到机器人动作执行的完整工作流程

👁️RynnVLA-001 从第一人称视角视频学习人类操作技能

🌍RynnEC 从 11 个维度全面解析场景物体，无需依赖 3D 模型

详情链接:https://github.com/alibaba-damo-academy/RynnRCP

3、苹果即将升级 AppleIntelligence 至 GPT-5，推动 Siri 与写作工具智能化

苹果公司近日宣布，计划在即将发布的 iOS26、iPadOS26 和 macOSTahoe26 系统更新中，将其 AppleIntelligence 中的 ChatGPT 核心模型升级至最新的 GPT-5 版本。

【AiBase 提要:】

🚀苹果将在 iOS26 等系统更新中将 ChatGPT 模型升级至 GPT-5，以提升 Siri、写作工具和视觉智能的性能。

🚀新版本将引入多语言实时翻译及屏幕内容分析功能，增强设备在跨语言交流和信息处理方面的能力。

🚀苹果还首次向开发者开放设备端 API，支持第三方应用接入，提供低延迟和高隐私的 AI 体验。

4、高德全面接入通义大模型推出首个地图 AI 原生 Agent

阿里巴巴集团高德地图联合通义实验室发布全球首个 AI 原生地图，推出「小高老师」智能体，实现全链路语音交互与复杂任务推理导航。

【AiBase 提要:】

🎙️内置智能体「小高老师」，支持音频/文本等多模态交互，支持随时打断的全双工语音。

🧠基于 36 万亿 token 预训练的 Qwen 大模型，实现空间语义深度理解与高效调度近百种内部工具。

🗂️联合推出复杂 POI 推理 Agent，可拆解多重约束并整合实时信息，提供精准推荐与导航。

🔍依托自研 DeepResearch 框架，具备规划、反思、工具调用等完整 Agent 能力。

5、宇树科技将出征首届世界人形机器人运动会，硬件将被多队采用

宇树科技将于 8 月 14 日至 17 日参加首届世界人形机器人运动会。宇树透露，除其自有团队外，赛场上还将有多支队伍使用宇树机器人硬件参赛，但会搭配各自自研的算法。

【AiBase 提要:】

🤖除宇树自有团队外，赛场上还将有多个队伍使用宇树的机器人硬件参赛，但会搭配各自研发的算法。

🏟️此次运动会汇聚了天工、加速进化、松延动力、傅利叶、星海图等国内头部人形机器人企业，以及来自美国、德国、澳大利亚、巴西、日本等 16 个国家的共计 280 支队伍。

🔧宇树科技的参与不仅展示了其在人形机器人硬件方面的实力，也体现了其设备在开放生态中的广泛应用和竞争力。

6、ClaudeAI 推出历史对话记忆功能，支持多背景切换

Anthropic 为 ClaudeAI 上线「记忆功能」，可自动记忆并复用用户历史对话中的背景信息，实现跨会话无缝衔接，并支持多背景隔离切换，目前仅向付费用户开放。

【AiBase 提要:】

🔄支持为不同项目设定独立背景，工作/生活场景一键切换，保持上下文延续。

💰先行面向 ClaudeMax、Team、Enterprise 付费用户，Pro 版后续跟进，免费用户暂未开放。

⚙️用户可在「设置—搜索和参考聊天」中手动启用或查看记忆内容。

🤖与 ChatGPT 手动预设不同，Claude 采用自动提取机制，体验更「无感」但可控性稍弱。

7、360 智脑推出 Light-IF 系列模型显著提升复杂指令遵循能力

360 智脑发布 Light-IF 系列模型，以「预览-自检式推理+信息熵控制」框架专治「懒惰推理」，在四大基准全面领先，小参数即可越级打大模型，并全部开源。

【AiBase 提要:】

🎯创新 Light-IF 框架: 难度感知指令生成→Zero-RL 强化→推理模式过滤→熵保持冷启动→熵自适应正则，显著抑制「只会复述不检查」的懒惰推理。

📈权威评测霸榜:Light-IF-32B 在 SuperCLUE 拿下 0.575，领先第二名 13.9 个百分点;Light-IF-1.7B 小模型反超 Qwen3-235B-A22B 等超大模型。

🔓全面开源: 模型权重将陆续上线 HuggingFace，冷启动数据集与训练代码同步发布 GitHub，并联合 SuperCLUE 推出中文评测基准 SuperCLUE-CPIFOpen。

8、字节跳动推出视频字幕无痕擦除方案基于 DiT 大模型打造

字节跳动发布全球首个基于 DiT 大模型的「视频字幕无痕擦除」方案，实现像素级修复、多语言适配、一键「擦除-翻译-口型同步」，助力短剧出海与跨境电商全球化。

【AiBase 提要:】

🎞️两大核心:DiT 视频字幕擦除大模型+字体级分割模型，像素级精准修复，告别马赛克/模糊/闪烁。

🌐多语言支持: 突破中英限制，覆盖小语种，形成「擦除-翻译-口型同步」一站式闭环。

⚙️工程落地: 万集数据验证，成功率 100%; 分布式分镜计算，效率提升数倍。

详情地址：https://console.volcengine.com/vod/

9、昆仑万维发布开源世界模型 Matrix-Game2.0: 实时生成分钟级高连贯视频

昆仑万维发布全球首个开源交互式世界模型 Matrix-Game2.0，实时生成分钟级 25fps 高连贯视频，支持无语言提示的纯视觉驱动交互，已在 GTA、Minecraft 等场景落地。

【AiBase 提要】

🚀开源首发: 业内首个通用场景实时长序列开源世界模型，持续迭代全面开放。

📹分钟级生成:25fps 连续视频，物理规律与场景语义理解大幅提升，可直接用于游戏/影视/VR。

🎮视觉驱动交互: 摒弃语言提示，3D 因果 VAE+多模态扩散 Transformer 逐帧响应用户动作，跨域适应多风格场景。

10、昆仑万维开源 Matrix-3D 大模型: 用单张图像可生成高质量全景视频

昆仑万维开源 Matrix-3D: 单图即可生成 360°可漫游 3D 全景视频，轨迹一致、几何精准，全面开放代码与数据集。

【AiBase 提要】

🌐单图生成 3D 世界: 打破多视角依赖，直接由单张图像产出高质量全景视频与可探索 3D 场景。

🎥轨迹引导一致性: 用 Mesh 渲染图驱动扩散模型，保证相机轨迹下的时空一致，减少伪影与遮挡。

⚙️双路径重建: 超分+结构优化慢工出细活;Transformer 前馈网络极速推理，兼顾质量与效率

详情：https://github.com/SkyworkAI/Matrix-3D

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

AI 日报：智谱视觉推理模型 GLM-4.5V 开源；达摩院开源三项具身智能核心技术；360 智脑推出 Light-IF 系列模型

MiniMax 推出全球首个 AI 智能体再创作市场，15 万美元奖金池开启创作新模式

宇树科技将出征首届世界人形机器人运动会，硬件将被多队采用

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

MiniMax 推出全球首个 AI 智能体再创作市场，15 万美元奖金池开启创作新模式

宇树科技将出征首届世界人形机器人运动会，硬件将被多队采用

DeepSeek 是什么？

蚂蚁国际发布 AI 金融平台 Cockpit，开启智能代理驱动的新金融时代

​零售行业的未来：全球首个开源 VLA 大模型 GroceryVLA 正式发布

​硅基流动完成数亿元融资，用户数突破 600 万

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

零售行业的未来：全球首个开源 VLA 大模型 GroceryVLA 正式发布

硅基流动完成数亿元融资，用户数突破 600 万