不只是生成视频: 谷歌 Veo3 惊艳亮相,可自动玩数独、解迷宫

根据研究部门的最新披露,其视频生成模型 Veo3 在视觉 领域取得了突破性进展,被誉为达到了 「-3」 时刻。在对 Veo3 进行了一系列测试后,研究人员发现,该模型不仅限于视频生成,还能在无需额外训练的情况下,自动完成多项复杂的视觉任务。

在用 18,384 个最简单的视频生成任务进行测试时,Veo3 展示出惊人的多功能性,包括寻找物体、修复照片、玩迷宫、解决数独等。具体来说,Veo3 能够:

  • 理解图像: 自动识别图像中的边缘、轮廓、物体位置、颜色和形状等基本视觉元素。

  • 理解物理原理: 具备基本的物理认知,例如能够分辨出哪些物体会漂浮,哪些会下沉,并理解光的反射方式。

  • 进行手动编辑: 像 「自动版 Photoshop」 一样,Veo3 可以执行复杂的图片编辑任务,如去除背景、添加文字,甚至将照片转换为油画风格。

  • 具备 「理性」 能力: 在面对迷宫图像时,它能够自主规划并绘制出穿过迷宫的路径。

谷歌研究部门认为,Veo3 的这一突破标志着视觉 AI 领域进入了新的发展阶段,其通用性和自主任务解决能力堪比领域的 GPT-3。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

特斯拉全力推进 「擎天柱」 规模化生产,马斯克称其将成公司最重要产品

2025-9-30 1:22:32

AI 资讯

风投巨头押注 AI 改造传统服务业:General Catalyst 投入 15 亿美元,目标实现软件级利润率

2025-9-30 1:22:48

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索