新一代 AI 视频生成模型 LTX-2 发布: 完整叙事高清视频一键生成

技术迅猛发展的背景下,Lightricks 公司近日发布了其最新研发的 模型——LTX-2。这一模型能够一次性生成长达 20 秒的完整 4K 叙事高清视频,配有声音和口型同步,为视频创作带来了革命性的进展。

LTX-2 的核心技术在于其音画同步生成能力,传统的 AI 视频生成工具往往只能生成无声视频,随后需要人工添加配音。而 LTX-2 则在同一个扩散过程中同时生成画面与声音,确保角色的嘴型与语音、爆炸的音效与光线、走路的节奏与脚步声完全同步。这一创新使得生成的视频更具真实性和连贯性。

此外,LTX-2 支持最高 4K 分辨率和 50 帧每秒的输出,画面质量堪比电影级别。其连贯性和稳定性在视频生成领域中也达到了新的高度,成为首个能够稳定生成原生 4K 视频的开源 。这意味着,们可以直接将生成的视频用于电影、或宣传片,而不再是简单的 AI 动画草图。

该模型还支持多种输入方式,包括文字、图片和草图,允许创作者对视频的镜头角度、物体动作、时间节奏等进行精细控制。这种创作自由度的提高使得可以更好地表达自己的创意。此外,内置的 LoRA(Low-RankAdaptation) 微调机制让用户能够以少量素材训练出专属风格模型,确保视频在不同场景中的一致性。

LTX-2 的另一个显著优势是其本地运行能力,用户无需连接云端,也不被锁定在收费平台上。该模型可在消费级 GPU 上运行,预计将在 年秋季开放源代码、模型权重及训练流程,为创作者、开发者和研究者提供更多的控制权和隐私保障。

Lightricks 公司计划于今年晚些时候将 LTX-2 的代码和性能基准,进一步推动 AI 视频生成技术的发展。用户可以通过官方平台体验这一新模型,期待在未来的 AI 创作领域,LTX-2 能够成为视频制作的 「游戏规则改变者」。

随着 LTX-2 的发布,视频创作的门槛将进一步降低,更多的创作者有机会借助这一先进技术实现自己的创意与梦想。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

​月之暗面推出新型混合线性注意力架构 「Kimi Linear」

2025-11-1 1:20:51

AI 资讯

​OpenAI 或将于明年上市,估值可达万亿!

2025-11-1 1:21:08

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索