欢迎来到 AIbase
每天三分钟了解当日 AI 大事件,助你洞悉 AI 行业趋势、创新 AI 产品应用。
更多 AI 资讯访问
1. 百度重磅开源文心大模型 4.5 系列,十款新模型亮相!
百度正式发布文心大模型 4.5 系列并完全开源,包含多种参数配置的十款新模型,使用飞桨框架训练推理,FLOPs 利用率 47%,在文本多模态基准测试中表现优异,提供一站式使用指南和工具,方便开发者精调部署,已上传至 HuggingFace、GitHub 等平台。
体验地址:https://yiyan.baidu.com
HuggingFace:https://huggingface.co/baidu)
GitHub:https://github.com/PaddlePaddle/ERNIE
2. 通义千问发布多模态统一理解与生成模型 QwenVLo
QwenVLo 多模态大模型发布,基于 Qwen-VL 系列升级,采用渐进式生成方式,精准看懂世界并高质量再创造,支持开放指令编辑修改生成,具备多语言指令能力,可进行图文输入输出,目前处于预览阶段,体验地址为 QwenChat 平台。
体验地址:chat.qwen.ai
3. 阿里 Ovis-U1 震撼发布: 多模态 AI 三合一,开源赋能全球开发者
阿里巴巴国际 AI 团队发布 Ovis-U1 多模态大模型,3 亿参数,集成多模态理解、文生图像和图像编辑功能,采用创新架构设计,基于 Python3.10 等技术栈构建,训练中引入合规性检查算法,代码模型权重等已公开,助力多领域应用。
项目:(https://huggingface.co/AIDC-AI/Ovis-U1-3B)
4. 华为开源盘古 7B 稠密和 72B 混合专家模型
华为开源盘古 7B 稠密模型、72B 混合专家模型及升腾推理技术,践行升腾生态战略,推动大模型技术研究与行业应用,相关模型权重代码已上线开源平台,邀请开发者等下载使用反馈。
5. 一张图即可生成爆款视频! 美图 MOKI「AI 创意广告」 限时免费
美图 MOKI 推出 「AI 创意广告」 功能,用户上传图片选择模板即可生成专业级视频,集成七大主流视频生成模型,体验地址为 www.moki.cn,可完成从创意到成片的完整流程。
体验地址:www.moki.cn
6.Gemini2.5ProAPI 免费回归,开发者社区热烈响应
谷歌 Gemini2.5ProAPI 重新纳入 GoogleAIStudio 免费层级,该模型多模态和推理能力强,支持多种输入类型,此次免费回归为开发者提供创新机会,免费计算资源翻倍,社区反应积极。
7. 豆包 「深入研究」 功能在豆包 APP、网页版及电脑版开启测试
豆包 APP 等平台开启 「深入研究」 功能测试,可整合海量深度信息生成研究报告或可视化网页结果,用户输入指令几分钟获定制化报告,还支持一键转播客形式。
8.
小米 「AI 百宝箱」 内测结束,计划 7 月 5 日暂停服务,内测收集了数据反馈,非放弃项目而是进行数据整理等战略规划,小米在 AI 领域持续投入探索构建多层次全场景 AI 生态。
9. 新开源 AI 系统 OmniGen2: 像 GPT-4o 一样融合了图像和文本生成
北京人工智能研究院推出 OmniGen2 开源系统,专注文本图像生成编辑等,采用独立解码路径,基于 Qwen2.5-VL-3B 变换器,使用自定义扩散变换器,有反思机制,性能在多个基准测试中出色,将发布到 HuggingFace 平台。
项目:https://huggingface.co/OmniGen2/OmniGen2
10. 知乎 「直答」 升级知识库功能,深度融合社区内容打造沉浸式 AI 问答体验
知乎 「直答」 升级知识库功能,深度融合社区内容,带来沉浸式阅读等创新功能,旨在提供沉浸式多场景 AI 问答体验,扩大答主内容影响力,降低用户查询成本。









