不只是生成视频: 谷歌 Veo3 惊艳亮相，可自动玩数独、解迷宫

AI 资讯
25 年 9 月 30 日
编辑

小强

根据谷歌研究部门的最新披露，其视频生成模型 Veo3 在视觉 AI 领域取得了突破性进展，被誉为达到了「GPT-3」时刻。在对 Veo3 进行了一系列测试后，研究人员发现，该模型不仅限于视频生成，还能在无需额外训练的情况下，自动完成多项复杂的视觉任务。

在用 18，384 个最简单的视频生成任务进行测试时，Veo3 展示出惊人的多功能性，包括寻找物体、修复照片、玩迷宫、解决数独等。具体来说，Veo3 能够:

理解图像: 自动识别图像中的边缘、轮廓、物体位置、颜色和形状等基本视觉元素。
理解物理原理: 具备基本的物理认知，例如能够分辨出哪些物体会漂浮，哪些会下沉，并理解光的反射方式。
进行手动编辑: 像「自动版 Photoshop」一样，Veo3 可以执行复杂的图片编辑任务，如去除背景、添加文字，甚至将照片转换为油画风格。
具备「理性」能力: 在面对迷宫图像时，它能够自主规划并绘制出穿过迷宫的路径。

谷歌研究部门认为，Veo3 的这一突破标志着视觉 AI 领域进入了新的发展阶段，其通用性和自主任务解决能力堪比自然语言处理领域的 GPT-3。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

给 TA 打赏

共 {{data.count}} 人

人已打赏

特斯拉全力推进「擎天柱」规模化生产，马斯克称其将成公司最重要产品

2025-9-30 1:22:32

风投巨头押注 AI 改造传统服务业：General Catalyst 投入 15 亿美元，目标实现软件级利润率

2025-9-30 1:22:48

❯

解锁会员权限

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了 {{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续 {{item.count}} 天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵 ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部