超长视频生成的新突破！LongVie 框架让创作无界限

AI 资讯
25 年 8 月 21 日
编辑

小强

在过去的两年中，视频生成技术经历了惊人的进步，尤其是短视频的创作。然而，制作超过一分钟的高质量、风格统一的超长视频仍然是一项巨大的挑战。对此，上海人工智能实验室联合南京大学、复旦大学、南洋理工大学 S-Lab 以及英伟达等机构，共同推出了 LongVie 框架，系统性解决了这一领域中的核心问题。

LongVie 的目标是让超长视频的生成变得更加可控和一致。团队发现，传统的视频生成模型在处理长视频时，常常面临时序不一致和视觉退化等难题。前者主要表现为画面细节与内容不连贯，后者则指随着视频时长的增加，画面颜色和清晰度的下降。

为了解决这些问题，LongVie 从「控制信号」和「初始噪声」两个方面入手。首先，团队提出了「控制信号全局归一化」策略，这意味着在生成视频时，不再只在单一片段内进行归一化，而是统一整个视频段的控制信号，从而提升跨片段的连贯性。其次，他们引入了「统一噪声初始化」策略，确保各个片段共享同一初始噪声，这样可以从源头上减少不同片段之间的视觉漂移。

在解决视觉退化问题上，LongVie 采用了多模态精细控制方法。单一模态的控制常常无法提供稳定的约束，而 LongVie 结合了密集控制信号（如深度图）和稀疏控制信号 (如关键点)，并引入退化感知训练策略，使得模型在处理长视频时，能够保持更高的画质和细节。

此外，LongVie 还推出了 LongVGenBench，这是首个专为可控超长视频生成设计的基准数据集，包含 100 个超过 1 分钟的高分辨率视频，旨在推动该领域的研究与评测。根据定量指标和用户评测结果，LongVie 在多个评估上超越了现有技术，赢得了用户的高度偏好，达到了 SOTA（最先进技术）水平。

随着 LongVie 框架的问世，超长视频生成将迎来新的时代，创作者们将能够在更大的自由度下实现自己的创意。

项目地址：https://vchitect.github.io/LongVie-project/

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

超长视频生成的新突破！LongVie 框架让创作无界限

百度 2025 年第二季度财报发布：AI 收入超 100 亿，核心净利润大增 35%

浙大团队破解 AI 生成难题：让机器学会" 深思熟虑" 而非" 冲动决策"

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

​百度 2025 年第二季度财报发布：AI 收入超 100 亿，核心净利润大增 35%

浙大团队破解 AI 生成难题：让机器学会" 深思熟虑" 而非" 冲动决策"

谷歌支付 1 亿美元和解 14 年广告收费诉讼，涉及超 91 万页证据材料

OpenAI 宣布付费 ChatGPT 用户突破 300 万，增长势头强劲

Google AI Studio 政策变动:Gemini2.5Pro 模型免费访问遭 「限流」

字节跳动重磅推出豆包 1.6 与 Seedance1.0，成本大幅降低

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

百度 2025 年第二季度财报发布：AI 收入超 100 亿，核心净利润大增 35%

Google AI Studio 政策变动:Gemini2.5Pro 模型免费访问遭「限流」