新一代 AI 视频生成模型 LTX-2 发布: 完整叙事高清视频一键生成

AI 资讯
25 年 11 月 1 日
编辑

小强

在 AI 技术迅猛发展的背景下，Lightricks 公司近日发布了其最新研发的 AI 视频生成模型——LTX-2。这一模型能够一次性生成长达 20 秒的完整 4K 叙事高清视频，配有声音和口型同步，为视频创作带来了革命性的进展。

LTX-2 的核心技术在于其音画同步生成能力，传统的 AI 视频生成工具往往只能生成无声视频，随后需要人工添加配音。而 LTX-2 则在同一个扩散过程中同时生成画面与声音，确保角色的嘴型与语音、爆炸的音效与光线、走路的节奏与脚步声完全同步。这一创新使得生成的视频更具真实性和连贯性。

此外，LTX-2 支持最高 4K 分辨率和 50 帧每秒的输出，画面质量堪比电影级别。其连贯性和稳定性在视频生成领域中也达到了新的高度，成为首个能够稳定生成原生 4K 视频的开源 AI 模型。这意味着，创作者们可以直接将生成的视频用于电影、广告或宣传片，而不再是简单的 AI 动画草图。

该模型还支持多种输入方式，包括文字、图片和草图，允许创作者对视频的镜头角度、物体动作、时间节奏等进行精细控制。这种创作自由度的提高使得内容创作者可以更好地表达自己的创意。此外，内置的 LoRA（Low-RankAdaptation）微调机制让用户能够以少量素材训练出专属风格模型，确保视频在不同场景中的一致性。

LTX-2 的另一个显著优势是其本地运行能力，用户无需连接云端，也不被锁定在收费平台上。该模型可在消费级 GPU 上运行，预计将在 2025 年秋季开放源代码、模型权重及训练流程，为创作者、开发者和研究者提供更多的控制权和隐私保障。

Lightricks 公司计划于今年晚些时候将 LTX-2 的代码和性能基准开源，进一步推动 AI 视频生成技术的发展。用户可以通过官方平台体验这一新模型，期待在未来的 AI 创作领域，LTX-2 能够成为视频制作的「游戏规则改变者」。

随着 LTX-2 的发布，视频创作的门槛将进一步降低，更多的创作者有机会借助这一先进技术实现自己的创意与梦想。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

新一代 AI 视频生成模型 LTX-2 发布: 完整叙事高清视频一键生成

月之暗面推出新型混合线性注意力架构「Kimi Linear」

OpenAI 或将于明年上市，估值可达万亿！

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

​月之暗面推出新型混合线性注意力架构 「Kimi Linear」

​OpenAI 或将于明年上市，估值可达万亿！

iOS26.1 开发者预览版发布: 苹果 AI 支持多语言，AirPods 翻译功能升级

Qwen 发布全新 AI 模型 Qwen3-Max：不仅能写代码，还能自主思考

争议应用 Neon Mobile 冲上美区 App Store 第二：录制通话数据卖给 AI 公司，用户隐私换零花钱

京东重磅推出国产芯片驱动的 xLLM 推理引擎

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

月之暗面推出新型混合线性注意力架构「Kimi Linear」

OpenAI 或将于明年上市，估值可达万亿！