Vidu Q1 震撼升级: 参考转视频支持最多七张图像,AI 视频生成再创新高

中国 视频生成领域领军者 Vidu 近日宣布,其 Q1 模型迎来重大升级,推出了全新的 「参考转视频」(Reference-to-Video) 功能,允许用户上传最多七张参考图像,生成视觉一致性极高的 1080p 视频。这一功能突破了传统 在多场景和多主体一致性上的瓶颈,为提供了前所未有的灵活性和创作自由。

参考转视频: 七张图像解锁复杂叙事

ViduQ1 的 「参考转视频」 功能是此次更新的核心亮点。用户可上传最多七张参考图像,包括人物、场景、道具等元素,结合文本生成高质量视频。ViduQ1 通过先进的语义融合技术,确保多张图像中的元素在视频中保持高度一致,避免了传统 AI 视频生成中常见的场景断裂或角色失真问题。

例如,用户可上传一张人物照片、一张森林背景和一张动物图像,输入提示词:「一名女性在森林中弹吉他,猫头鹰停在树枝上。」ViduQ1 能够智能生成包含吉他演奏动作、森林环境和猫头鹰的视频,画面细节如服装纹理、背景光影和动物动作均高度逼真。这一功能为动画、短视频和创作者提供了强大的工具,显著降低了复杂场景的制作门槛。

多主体一致性: 打造连贯视觉体验

ViduQ1 的多主体一致性 (Multiple-EntityConsistency) 技术是其核心竞争力之一。用户可通过上传不同类型的参考图像 (如角色、物体、环境),生成包含多主体互动的视频,且每个主体的特征在整个视频中保持稳定。例如,上传一张角色照片、一件花纹服装和一辆自行车图片,ViduQ1 可生成一段角色穿着指定服装、骑行自行车的流畅视频,细节如花纹和自行车造型均与参考图像高度吻合。

与上一代模型相比,Q1 在画面细节和动作流畅度上显著提升,支持多角度镜头切换和动态场景过渡,确保 360°视角下的视觉一致性。这一功能尤其适合动漫、游戏预告片和虚拟场景模拟等需要复杂叙事的场景,为专业创作者提供了接近传统影视制作的创作体验。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

Hugging Face 重磅开源 SmolLM3:3B 参数小模型媲美 4B 巨头,128K 上下文引领高效 AI 新风潮!

2025-7-10 1:20:51

AI 资讯

飞书重磅发布多款 AI 新品,打造企业级 「豆包」

2025-7-10 1:20:57

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索