美团推出 LongCat-Video 视频生成模型，原生支持 5 分钟级连贯输出

AI 资讯
25 年 10 月 28 日
编辑

小强

近日，美团正式发布了其最新的视频生成模型——LongCat-Video，标志着其在人工智能领域迈出了重要一步。LongCat-Video 旨在帮助 AI 更好地理解和重构真实世界，推动世界模型的研究进展。作为一种能够模拟物理规律和场景逻辑的智能系统，LongCat-Video 为 AI 提供了「看见」世界运行本质的能力。

该模型基于 DiffusionTransformer（DiT）架构，能够处理多种视频生成任务，包括文本生成视频、图像生成视频以及视频续写。其独特之处在于，不同的生成任务无需额外模型适配，形成了一个完整的任务闭环。例如，文本生成视频能够生成 720p、30fps 的高清视频，精准解析文本指令，并展现出色的语义理解和视觉呈现能力。图像生成视频则严格保留参考图像的各项特征，确保动态过程符合物理规律。视频续写功能则是 LongCat-Video 的核心优势之一，能够根据多帧前序内容续接视频，为长视频生成提供了强有力的技术支持。

LongCat-Video 具备出色的长视频生成能力，能够连续输出长达 5 分钟的视频，且在生成过程中不出现质量损失。模型通过先进的技术手段，有效避免了色彩漂移和画质降解，保证了跨帧时序一致性和物理运动合理性。此外，LongCat-Video 还结合了块稀疏注意力和条件 token 缓存机制，大幅提高了长视频生成的效率，解决了以往长视频生成在时长与质量之间的矛盾。

在高分辨率和高帧率的视频生成中，LongCat-Video 通过多重优化策略，提升了推理速度，确保了生成质量与效率的最佳平衡。该模型经过严格的内部与公开基准测试，展现出卓越的通用性能，综合能力达到开源领域的领先水平。

LongCat-Video 的发布为创作者开启了长视频创作的新旅程，让视频生成变得更加简单高效。

🌟GitHub:

https://github.com/meituan-longcat/LongCat-Video

🌟HuggingFace:

https://huggingface.co/meituan-longcat/LongCat-Video

🌟ProjectPage:

https://meituan-longcat.github.io/LongCat-Video/

划重点:

🌟LongCat-Video 是美团推出的一款视频生成模型，旨在推动 AI 理解真实世界。

🎥该模型支持文本生成、图像生成和视频续写三种核心任务，实现了高质量视频生成。

⚡LongCat-Video 在长视频生成方面具备显著优势，能够稳定输出 5 分钟的连贯视频。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

美团推出 LongCat-Video 视频生成模型，原生支持 5 分钟级连贯输出

Google Earth AI「地球大脑」上线！Gemini 一键预测洪水、藻华、野火，全球灾害预警从数周缩短至几分钟

零一万物宣布高管任命联合创始人沈鹏飞领衔加速 ToB/ToG「一把手工程」

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

Google Earth AI「地球大脑」 上线！Gemini 一键预测洪水、藻华、野火，全球灾害预警从数周缩短至几分钟

零一万物宣布高管任命 联合创始人沈鹏飞领衔 加速 ToB/ToG「一把手工程」

一文读懂大语言模型：从原理到应用

日本 AI 逆袭全球！Shisa V2 405B 开源发布，碾压 GPT-4 的日语神器来了！

打破碎片化！Eywa 携手 CrossCurve 重塑去中心化金融流动性格局

Grok 接管推特算法！小号也能爆红，新人起号迎来黄金时代？

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

Google Earth AI「地球大脑」上线！Gemini 一键预测洪水、藻华、野火，全球灾害预警从数周缩短至几分钟

零一万物宣布高管任命联合创始人沈鹏飞领衔加速 ToB/ToG「一把手工程」