Bilibili 开源动漫视频生成模型 AniSora V3 版，一键生成多种风格动漫视频镜头

Bilibili（B 站）宣布其开源动漫视频生成模型 AniSora 迎来重大更新，正式发布 AniSoraV3。作为 Index-AniSora 项目的一部分，V3 版本在原有基础上进一步优化了生成质量、动作流畅度和风格多样性，为动漫、漫画及 VTuber 内容创作者提供了更强大的工具。AIbase 深入解读 AniSoraV3 的技术突破、应用场景及行业影响。

技术升级: 更高质量与精准控制AniSoraV3 基于 Bilibili 此前开源的 CogVideoX-5B 和 Wan2.1-14B 模型，结合强化学习与人类反馈（RLHF）框架，显著提升了生成视频的视觉质量和动作一致性。其支持一键生成多种风格的动漫视频镜头，包括番剧片段、国创动画、漫画视频改编、VTuber 内容）等

核心升级包括:

时空掩码模块（SpatiotemporalMaskModule）优化:V3 版本增强了时空控制能力，支持更复杂的动画任务，如精细的角色表情控制、动态镜头移动和局部图像引导生成。例如，提示「五位女孩在镜头放大时起舞，左手上举至头顶再下放至膝盖」能生成流畅的舞蹈动画，镜头与角色动作同步自然。
数据集扩展:V3 继续依托超过 1000 万高质量动漫视频片段（从 100 万原始视频中提取）进行训练，新增数据清洗流水线，确保生成内容的风格一致性和细节丰富度。
硬件优化:V3 新增对华为 Ascend910BNPU 的原生支持，完全基于国产芯片训练，推理速度提升约 20%，生成 4 秒高清视频仅需 2-3 分钟。
多任务学习:V3 强化了多任务处理能力，支持从单帧图像生成视频、关键帧插值到唇部同步等功能，特别适合漫画改编和 VTuber 内容创作。

在最新基准测试中，AniSoraV3 在 VBench 和双盲主观测试中，角色一致性和动作流畅度均达到业界顶尖水平（SOTA），尤其在复杂动作 (如违反物理规律的夸张动漫动作) 上表现突出。

开源生态: 社区驱动与透明发展

AniSoraV3 的完整训练和推理代码已于 2025 年 7 月 2 日在 GitHub 上更新，开发者可通过 HuggingFace 访问模型权重及 948 个动画视频的评估数据集。Bilibili 强调，AniSora 是「对动漫世界的开源礼物」，鼓励社区协作优化模型。用户需填写申请表并发送至指定邮箱（如 yangsiqian@bilibili.com）以获取 V2.0 权重和完整数据集访问权限。

V3 还引入了首个针对动漫视频生成的 RLHF 框架，通过 AnimeReward 和 GAPO 等工具对模型进行微调，确保输出更符合人类审美和动漫风格需求。社区开发者已开始基于 V3 开发定制化插件，例如增强特定动漫风格（如吉卜力风）的生成效果。

应用场景: 从创意到商业

AniSoraV3 支持多种动漫风格，包括日本动漫、国产原创动画、漫画改编、VTuber 内容及恶搞动画（鬼畜动画），覆盖 90% 的动漫视频应用场景。具体应用包括:

单图转视频: 用户上传一张高质量动漫图像，配合文本提示（如「角色在向前行驶的车中挥手，头发随风摆动」），即可生成动态视频，保持角色细节和风格一致。
漫画改编: 从漫画帧生成带唇部同步和动作的动画，适合快速制作预告片或短篇动画。
VTuber 与游戏: 支持实时生成角色动画，助力独立创作者和游戏开发者快速测试角色动作。
高分辨率输出: 生成视频支持高达 1080p，确保在社交媒体、流媒体平台上的专业呈现。

AIbase 测试显示，V3 在生成复杂场景（如多角色交互、动态背景）时，相比 V2 减少了约 15% 的伪影问题，生成时间缩短至平均 2.5 分钟 (4 秒视频)。

AniSoraV3 的发布进一步降低了动漫创作门槛，使独立创作者和小型团队能以低成本实现高质量动画制作。相比 OpenAI 的 Sora 或 Kling 等通用视频生成模型，AniSoraV3 专注于动漫领域，填补了市场空白。与字节跳动的 EX-4D 相比，AniSoraV3 更专注于 2D/2.5D 动漫风格，而非 4D 多视角生成，展现了不同的技术路线。

项目:https://t.co/I3HPKPvsBV

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

Bilibili 开源动漫视频生成模型 AniSora V3 版，一键生成多种风格动漫视频镜头

开源生态: 社区驱动与透明发展

应用场景: 从创意到商业

Topview Avatar 2 震撼发布！AI 数字人革新电商带货，模特时代终结？

Perplexity 推出每月 200 美元「Max」订阅服务，解锁高级 AI 模型与独家功能

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

{{userData.name}} 已认证

开源生态: 社区驱动与透明发展

应用场景: 从创意到商业

相关文章：

Topview Avatar 2 震撼发布！AI 数字人革新电商带货，模特时代终结？

Perplexity 推出每月 200 美元 「Max」 订阅服务，解锁高级 AI 模型与独家功能

DeepSeek 专家混合模型优势

​报道称马斯克的 AI 初创公司 xAI 获得 TPG 的债务融资支持

​AMD 收购 Brium，向 Nvidia 发起 AI 硬件挑战

英伟达与港大携手推出新型视觉注意力机制，提升高分辨率生成速度超 84 倍！

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

Perplexity 推出每月 200 美元「Max」订阅服务，解锁高级 AI 模型与独家功能

报道称马斯克的 AI 初创公司 xAI 获得 TPG 的债务融资支持

AMD 收购 Brium，向 Nvidia 发起 AI 硬件挑战