Vidu Q1 震撼升级: 参考转视频支持最多七张图像，AI 视频生成再创新高

AI 资讯
25 年 7 月 10 日
编辑

小强

中国 AI 视频生成领域领军者 Vidu 近日宣布，其 Q1 模型迎来重大升级，推出了全新的「参考转视频」（Reference-to-Video）功能，允许用户上传最多七张参考图像，生成视觉一致性极高的 1080p 视频。这一功能突破了传统 AI 视频生成在多场景和多主体一致性上的瓶颈，为创作者提供了前所未有的灵活性和创作自由。

参考转视频: 七张图像解锁复杂叙事

ViduQ1 的「参考转视频」功能是此次更新的核心亮点。用户可上传最多七张参考图像，包括人物、场景、道具等元素，结合文本提示词生成高质量视频。ViduQ1 通过先进的语义融合技术，确保多张图像中的元素在视频中保持高度一致，避免了传统 AI 视频生成中常见的场景断裂或角色失真问题。

例如，用户可上传一张人物照片、一张森林背景和一张动物图像，输入提示词:「一名女性在森林中弹吉他，猫头鹰停在树枝上。」ViduQ1 能够智能生成包含吉他演奏动作、森林环境和猫头鹰的视频，画面细节如服装纹理、背景光影和动物动作均高度逼真。这一功能为动画、短视频和广告创作者提供了强大的工具，显著降低了复杂场景的制作门槛。

多主体一致性: 打造连贯视觉体验

ViduQ1 的多主体一致性（Multiple-EntityConsistency）技术是其核心竞争力之一。用户可通过上传不同类型的参考图像 (如角色、物体、环境)，生成包含多主体互动的视频，且每个主体的特征在整个视频中保持稳定。例如，上传一张角色照片、一件花纹服装和一辆自行车图片，ViduQ1 可生成一段角色穿着指定服装、骑行自行车的流畅视频，细节如花纹和自行车造型均与参考图像高度吻合。

与上一代模型相比，Q1 在画面细节和动作流畅度上显著提升，支持多角度镜头切换和动态场景过渡，确保 360°视角下的视觉一致性。这一功能尤其适合动漫、游戏预告片和虚拟场景模拟等需要复杂叙事的场景，为专业创作者提供了接近传统影视制作的创作体验。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

Vidu Q1 震撼升级: 参考转视频支持最多七张图像，AI 视频生成再创新高

参考转视频: 七张图像解锁复杂叙事

多主体一致性: 打造连贯视觉体验

Hugging Face 重磅开源 SmolLM3：3B 参数小模型媲美 4B 巨头，128K 上下文引领高效 AI 新风潮！

飞书重磅发布多款 AI 新品，打造企业级「豆包」

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

{{userData.name}} 已认证

参考转视频: 七张图像解锁复杂叙事

多主体一致性: 打造连贯视觉体验

相关文章：

Hugging Face 重磅开源 SmolLM3：3B 参数小模型媲美 4B 巨头，128K 上下文引领高效 AI 新风潮！

飞书重磅发布多款 AI 新品，打造企业级 「豆包」

谷歌智能手表迎来 AI 助手 Gemini，圈选搜索功能全新升级

Liquid AI 重磅开源 LFM2：边缘 AI 新王者，速度与效率双突破！

马斯克宣布 Grok 推出动漫 AI 伴侣功能，动态语音与定制风格引领潮流

​Anthropic 估值飙升至 1000 亿美元，年收入增长四倍

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

飞书重磅发布多款 AI 新品，打造企业级「豆包」

Anthropic 估值飙升至 1000 亿美元，年收入增长四倍