-
通义千问发布多模态统一理解与生成模型 Qwen VLo
近日,QwenVLo 多模态大模型正式发布,该模型在图像内容理解与生成方面取得了显著进展,为用户带来了全新的视觉创作体验。据介绍,QwenVLo 在继承原有 Qwen-VL 系列模型优势的基础上,进行了全面升级。该模型不仅能够精准 「看懂」 世界,更能基于理解进行高质量的再创造,真正实现了从感知到生成的跨越。用户现在可以在 QwenChat(chat.qwen.ai) 平台上直接体验这一新模型。QwenVLo 的独…- 0
- 0
-
一键生成爆款视频!HeyGen AI 视频 Agent 席卷内容创作界!
近日,AI 视频生成领域的领军企业 HeyGen 推出了一款革命性的 AI 视频 Agent,为视频内容创作带来了全新突破。据 AIbase 了解,这款 AI 视频 Agent 能够通过简单的素材上传,自动完成从故事规划、脚本编写到镜头选择的整个视频制作流程,让用户在几分钟内即可获得可直接发布的专业级视频内容。这一创新功能不仅大幅降低了视频创作门槛,还为广告、短视频、产品演示等场景提供了高效解决方案。一键创作,智能高效 H…- 0
- 0
-
重磅! 谷歌开源 Gemma3n 多模态模型,手机也能跑出云端 AI 性能
谷歌于本周五凌晨正式发布并开源全新端侧多模态大模型 Gemma3n,这一突破性产品为手机、平板、笔记本等端侧设备带来了此前只能在云端体验的强大多模态功能。核心特性: 小体积大能力 Gemma3n 提供 E2B 和 E4B 两个版本,虽然原始参数量分别为 5B 和 8B,但通过架构创新,其内存占用仅相当于传统 2B 和 4B 模型,分别只需 2GB 和 3GB 内存即可运行。该模型原生支持图像、音频、视频和文本的多模态输入处理,支持 14…- 0
- 0
-
YouTube 在搜索结果中添加 AI 摘要,测试对话式 AI 工具扩展
近日,YouTube 宣布将推出两项新的人工智能 (AI) 功能,旨在提升用户的观看体验。其中一项功能类似于 AI 概览,将出现在搜索结果中,而另一项则是对话式 AI 工具的扩展访问。这些新功能的推出,将为用户提供更加智能化的内容搜索和互动方式。主要的新功能是全新的 AI 搜索结果轮播。目前,这一功能仅对美国的 YouTubePremium 会员开放。当用户搜索诸如 「夏威夷最佳海滩」 等内容时,YouTube 可能会生成一…- 0
- 0
-
1999 元起!小米 AI 眼镜颠覆智能穿戴,拍摄、支付、音乐一镜全能!
6 月 26 日,小米在 「人·车·家生态」 发布会上正式推出其首款人工智能穿戴产品——小米 AI 眼镜。这款集时尚设计与尖端科技于一身的智能眼镜,以轻量化设计、强大的 AI 功能和多场景应用为亮点,迅速成为市场关注的焦点。据 AIbase 了解,小米 AI 眼镜不仅具备第一人称拍摄、语音助手和开放式耳机功能,还通过创新的电致变色技术为用户带来个性化体验,定价从 1999 元 (约 275 美元) 起,目前已在中国市场正式开售。轻量化…- 0
- 0
-
谷歌推出 Offerwall 工具: 帮助出版商应对 AI 搜索冲击,测试显示收入提升 9%
AIbase 报道—功能特性与应用场景 Offerwall 允许出版商为网站读者提供多种内容访问方式,包括小额支付、参与调查、观看广告等选项。出版商还可添加自定义选项,如订阅新闻通讯等。该工具现已在 GoogleAdManager 中免费提供,并由 AI 智能决定何时向访客展示,以最大化参与度和收益。经过超过一年的测试,已有 1000 家出版商参与试用。谷歌与第三方合作伙伴 Supertab 合作,支持用户通过小额支付…- 0
- 0
-
这家 AI 驱动的创业工作室计划每年孵化 10 万家新公司
近年来,创业热潮愈演愈烈,尤其是在疫情影响下,很多人开始重新审视自己的职业发展。在这样的背景下,亨里克・维尔德林 (HenrikWerdelin) 创办了名为 Audos 的初创工作室,计划利用人工智能技术帮助普通人实现创业梦想。他的目标是每年孵化 10 万家新公司,而不再局限于过去在 Prehype 时帮助的几十家。Audos 位于纽约,维尔德林与他的合伙人尼古拉斯・索恩 (NicholasThorne) 希望借助 A…- 0
- 0
-
谷歌重启 AI 驱动的 「Ask Photos」 功能,提升搜索速度!
近日,谷歌宣布其 AI 驱动的 「AskPhotos」 搜索工具将重新开放访问,并对该功能进行了一系列改进。在此之前,谷歌曾悄然暂停了该工具的推出,以便进一步优化用户体验。「AskPhotos」 工具由谷歌的 GeminiAI 模型提供支持,用户可以通过提出复杂的问题来快速找到所需的照片。尽管该功能具有很大的潜力,但在本月初,谷歌照片团队的一位成员在社交媒体平台 X 上表示,当前的工具在延迟、质量和用户体验方面仍未…- 0
- 0
-
ElevenLabs 推出 Voice Design v3 只需一句话,生成任何你想要的声音
近日,AI 语音技术领域的领军企业 ElevenLabs 正式发布其最新语音设计工具 VoiceDesignv3,为内容创作者和开发者带来了前所未有的语音生成体验。据 AIbase 了解,这款工具通过简单的文本提示即可生成高度拟人化的语音,支持 70 多种语言和数百种本地化口音,极大地提升了语音的表达力和真实感。VoiceDesignv3 的发布标志着 AI 语音技术在个性化和情感表达方面的重大突破。一键生成个性化语音…- 0
- 0
-
OpenAI 发布 Deep Research API 新模型:o3/o4-mini-deep research
OpenAI 于 2025 年 6 月 26 日宣布推出两款全新的 DeepResearchAPI 模型:o3-deep-research-2025-06-26 和 o4-mini-deep-research-2025-06-26,标志着其在自动化研究与复杂任务处理领域的重大突破。这两款模型专为高阶分析和深度信息合成设计,支持开发者通过 API 实现自动化的网页搜索、数据分析、代码执行等功能,为企业、研究人员和开发者提供了…- 0
- 0
-
巨人网络 《太空杀》 推出 AI 原生 「残局对决」: 三大国产大模型入局,打造多维智能竞技
巨人网络旗下的社交推理游戏**《太空杀》 近日上线了全新的 AI 原生玩法——「残局对决」。此次更新联合了阿里通义千问、腾讯混元、字节豆包这三大国产大模型,共同打造了游戏行业首个 「多用户与 AI 智能体混合对抗」**的创新竞技机制。这不仅是 《太空杀》AI 原生玩法的重要升级,也标志着国产大模型在游戏场景落地应用的前沿探索。相较于传统的人机对抗和 AI 陪玩模式,「残局对决」 在 AI 玩法创新上实现了显著突破。该玩法基…- 0
- 0
-
谷歌推出实验性 AI 试穿应用 Doppl: 虚拟时尚新体验
谷歌于本周四在美国 iOS 和 Android 平台推出了一款名为 Doppl 的实验性新应用,旨在通过人工智能技术,让用户直观地看到不同服装穿在自己身上的效果。这款应用利用 AI 生成用户穿着服装的虚拟形象,甚至能将静态图像转换为动态视频,为用户提供沉浸式的试穿体验。Doppl 的核心功能在于允许用户上传自己的全身照片,然后通过导入服装照片或截图,在自己的数字版本上进行虚拟试穿。无论是你在旧货店发现的心仪服装,还…- 0
- 0
-
OpenAI 宣布 2025 年开发者大会将在旧金山举办,预计吸引 1500 多名开发者参与
OpenAI 已正式公布了其下一届开发者大会 (DevDay) 的时间和地点,定于 2025 年 10 月 6 日在旧金山举行。这次大会将吸引超过 1500 名开发者参加,预计将成为迄今为止规模最大的一次开发者活动。此次 DevDay 的议程丰富多彩,包含多个重要环节。大会将设有现场直播的主题演讲,届时将分享 OpenAI 在人工智能领域的最新进展和未来愿景。此外,参与者还可以参加针对最新模型和工具的实操工作坊,获取第一手的使…- 0
- 0
-
惊天内幕!Anthropic 因训练 AI 销毁数百万本书籍,版权纠纷再升级!
生成式人工智能因其可靠性不足、巨大能耗以及未经授权使用版权材料而备受争议。然而,最近一起针对人工智能公司 Anthropic 的法庭案件揭示了一个更令人震惊的真相: 为了训练其 AI 助手,该公司竟然销毁了数百万本实体书籍。在这起案件中,法官发现 Anthropic 为构建其语言模型 Claude,进行了大规模的书籍销毁行为。这家科技公司购买了大量实体书籍,随后通过撕下装订线和扫描书页的方式将其数字化,这一过程不…- 0
- 0
-
可灵 AI 推出 「视频音效」 功能,实现 「所见即所听」 沉浸体验
可灵 AI 近日宣布,其全系列视频模型已正式上线**「视频音效」 功能**,为用户带来革命性的沉浸式体验。现在,用户在生成视频的同时,可以同步生成立体声音效,真正实现 「所见即所听」。不仅如此,平台原有的 「音效生成」 功能也得到了升级,新增了**「视频生音效」 模块**。这意味着用户可以上传自己的视频或调用历史作品,一键匹配合适的音效。这项功能的强大之处在于,它基于可灵自研的多模态视频生音效模型 Kling-F…- 0
- 0
-
腾讯开源轻量级混元-A13B 模型 1 张中低端 GPU 卡即可部署
腾讯正式发布并开源混元大模型家族的新成员——混元-A13B 模型。该模型采用基于专家混合 (MoE) 架构,总参数规模达 800 亿,激活参数为 130 亿,在保持顶尖开源模型效果的同时,大幅降低了推理延迟与计算开销,为个人开发者和中小企业提供了更具性价比的 AI 解决方案。据腾讯方面介绍,混元-A13B 模型在极端条件下仅需 1 张中低端 GPU 卡即可部署,用户可通过 Github、HuggingFace 等技术社区下载使用…- 0
- 0
-
全球独角兽榜单出炉!SpaceX、字节跳动和 OpenAI 荣登前三甲
胡润研究院近日发布了 《2025 全球独角兽榜》,这份榜单令人瞩目,列出了自 2000 年后成立、估值超过 10 亿美元的非上市公司。根据榜单统计,全球独角兽企业的数量已达到 1523 家,创下历史新高! 在这个数量惊人的榜单中,美国以 758 家的独角兽数量高居榜首,中国则以 343 家紧随其后,印度和英国分别位列第三和第四。榜单的明星无疑是 SpaceX,凭借 26000 亿元人民币的估值,首次成为全球最高价值的独角兽。马斯…- 0
- 0
-
「6 月 27 日 AI 日报」 腾讯开源轻量级混元-A13B 模型;可灵 AI 推 「视频音效」 功能
欢迎来到 AIbase【AI 日报】 栏目! 每天三分钟了解当日 AI 大事件,助你洞悉 AI 行业趋势、创新 AI 产品应用。更多 AI 资讯访问:https://www.aibase.com/zh1、腾讯开源轻量级混元-A13B 模型 1 张中低端 GPU 卡即可部署腾讯发布混元大模型家族的新成员混元-A13B 模型,采用专家混合 (MoE) 架构,总参数规模达 800 亿,激活参数为 130 亿,大幅降低推理延迟与计算开销,为个人开发者和…- 0
- 0
-
Suno 收购 WavTool,强化 AI 音乐编辑工具 amid 音乐版权争议
AI 音乐公司 Suno 在本周四宣布收购 WavTool,这是一款基于浏览器的 AI 数字音频工作站 (DAW)。此举旨在增强 Suno 在歌曲创作和制作方面的编辑能力。WavTool 于 2023 年推出,提供多种功能,包括音频分离、AI 音频生成和 AI 音乐助手,预计将与 Suno 最新推出的编辑界面相结合。虽然此次收购的具体条款尚未公开,但公司发言人表示,大部分 WavTool 的员工已经加入了 Suno 的产品和工程团队,至于…- 0
- 0
-
未来已来!Hengbot 发布 Sirius 机器狗,能跳舞会踢球,还有 AI 陪聊
Hengbot 公司正式推出了其最新的 Sirius 机器狗,这款机器狗不仅在敏捷运动方面表现出色,还集成了 OpenAI 的大语言模型,能够进行语音对话,甚至跳舞和踢足球,真是一位多才多艺的 「宠物」! 根据 Hengbot 的介绍,Sirius 机器狗具有 「快速运动」 的能力,它能随着音乐律动而跳舞,还能与主人 「握手」。其腿部和头部内部配备了 14 个运动轴,以及名为 「Neurocore」 的专属关节,使得它的动作更加自…- 0
- 0
-
重磅!中国首个海洋开源大模型 「沧渊」 问世,助力海洋智能时代!
中国首个海洋领域的开源大模型 OceanGPT(沧渊) 在浙江杭州正式发布。这一创新成果由浙江大学海洋精准感知技术全国重点实验室牵头研发,标志着中国在海洋科技领域迈出了重要一步。OceanGPT 具备基础的海洋专业知识问答能力,能够对声呐图像、海洋观测图等多模态数据进行自然语言解读。这一能力使得 OceanGPT 在处理复杂的海洋数据时,表现出色。该模型还采用了一种领域知识增强的 「慢思考」 推理机制,这意味着…- 0
- 0
-
OpenAI 与微软高层通话!未来合作关系悬念重重
在人工智能领域的竞争日趋激烈之际,OpenAI 首席执行官萨姆・奥特曼与微软首席执行官萨蒂亚・纳德拉日前进行了电话沟通,双方讨论了未来的合作关系。这一消息在奥特曼周二的播客采访中透露,他表示与纳德拉的对话主要集中在如何修改双方的投资条款及未来股权的问题上。据了解,微软是 OpenAI 的重要投资者,近期双方在投资细节上产生了一些分歧,特别是关于微软未来持股的规模。如果双方无法在这些关键问题上达成共识,微…- 0
- 0
-
WhatsApp 推出 AI 消息摘要功能,Meta AI 可总结个人聊天记录
WhatsApp 近日推出全新 AI 消息摘要功能,允许用户通过 MetaAI 对个人聊天记录进行智能总结。该功能目前已在美国推出英语版本,计划于今年晚些时候扩展至更多国家和语言。用户可通过点击展开聊天中所有未读消息的按钮来访问这一功能。与直接显示原始消息不同,WhatsApp 使用 MetaAI 生成用户错过内容的项目符号摘要,避免了冗长信息的阅读负担。Meta 特别强调该功能采用了" 隐私处理"…- 0
- 0
-
AI 初创公司 Scale AI 被曝使用谷歌文档泄露客户机密信息
近期,人工智能初创公司 ScaleAI 陷入了一场严重的数据安全风波。这家估值不菲、并被 Meta 以 148 亿美元收购 49% 股份的公司,被曝出竟然使用公共的谷歌文档来存储包括 Meta、谷歌和 xAI 在内的众多客户的绝密信息。谷歌文档是一款便捷的协作工具,但其 「邀请或完全公开」 的共享方式,显然与任何公司的严格安全标准格格不入。据报道,任何知道 ScaleAI 文档链接的人,都可以轻易访问这些包含绝密项目、电子邮件…- 0
- 0
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了 {{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵 ID:×
没有优惠劵可用!