每天三分钟了解当日 AI 大事件,助你洞悉 AI 行业趋势、创新 AI 产品应用。
更多 AI 资讯访问:
1、腾讯开源轻量级混元-A13B 模型 1 张中低端 GPU 卡即可部署
腾讯发布混元大模型家族的新成员混元-A13B 模型,采用专家混合 (MoE) 架构,总参数规模达 800 亿,激活参数为 130 亿,大幅降低推理延迟与计算开销,为个人开发者和中小企业提供更具性价比的 AI 解决方案。该模型在数学、科学和逻辑推理任务中表现出色,支持调用工具生成复杂指令响应。
体验入口:https://hunyuan.tencent.com/
开源地址:https://github.com/Tencent-Hunyuan。
2、可灵 AI 推出 「视频音效」 功能,实现 「所见即所听」 沉浸体验
可灵 AI 全系列视频模型上线 「视频音效」 功能,用户生成视频时可同步生成立体声音效,实现 「所见即所听」。升级的 「音效生成」 功能新增 「视频生音效」 模块,基于自研多模态视频生音效模型 Kling-Foley,实现音画帧级对齐。该功能已向所有用户限时免费开放。
3、BlackForest 震撼开源 FLUX.1Kontext[dev]: 媲美 GPT-4o 的图像编辑
BlackForestLabs 开源图像编辑模型 FLUX.1Kontext[dev],基于 12 亿参数的流匹配变换器架构,支持消费级硬件运行。其核心功能是上下文感知与精准编辑,能理解文本和图像输入,实现真正上下文生成与编辑,支持多次迭代编辑。
开源地址:https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev
Github:https://github.com/black-forest-labs/flux。
4、OpenAI 发布 DeepResearchAPI 新模型:o3/o4-mini-deepresearch
OpenAI 推出两款 DeepResearchAPI 新模型 o3-deep-research 和 o4-mini-deep-research,专为高阶分析和深度信息合成设计,支持自动化网页搜索、数据分析、代码执行等功能。定价方面,o3 模型每 1000 次调用价格为 10 至 40 美元,o4-mini 价格更低,为 2 至 8 美元。
5、1999 元起! 小米 AI 眼镜颠覆智能穿戴,拍摄、支付、音乐一镜全能!
小米推出
6、迅雷发布下载 MCP 服务一句话让 Al 自动下载
迅雷推出下载 MCP 服务,用户只需 「一句话」 就能让 AI 自动完成下载任务。该服务适配 PC 版迅雷和 NAS 迅雷,目前所有用户均可免费使用迅。雷 MCP 具备在国内外多个主流大模型应用接入的能力,如纳米 AI、扣子空间、Cursor、CherryStudio 等。
7、一键生成爆款视频!HeyGenAI 视频 Agent 席卷内容创作界!
HeyGen 推出 AI 视频 Agent,通过简单素材上传,自动完成从故事规划、脚本编写到镜头选择的整个视频制作流程,几分钟内即可获得可直接发布的专业级视频内容。支持多种视频类型,操作流程简便,无需专业视频编辑技能,智能化提示引导用户轻松上传素材并设定创作需求,AI 完成从脚本到成片的全部工作。
8、重磅! 谷歌开源 Gemma3n 多模态模型,手机也能跑出云端 AI 性能
谷歌发布并开源端侧多模态大模型 Gemma3n,为手机、平板、笔记本等端侧设备带来强大多模态功能。提供 E2B 和 E4B 两个版本,原始参数量分别为 5B 和 8B,但内存占用仅相当于传统 2B 和 4B 模型,分别只需 2GB 和 3GB 内存即可运行。原生支持图像、音频、视频和文本的多模态输入处理,支持 140 种文本语言和 35 种语言的多模态理解。
开源地址:https://huggingface.co/collections/google/gemma-3n-685065323f5984ef315c93f4