当前位置:首页 > 元宇宙 > AI

B站开源动漫视频生成模型 AniSora V3 版,速度更快、质量更高

来源: 责编: 时间:2025-07-09 12:05:31 174观看
导读 7 月 7 日消息,B站团队的开源动漫视频生成模型 AniSora 于 7 月 2 日更新到 AniSora V3 预览版。作为 Index-AniSora 项目的一部分,V3 版本在原有基础上进一步优化了生成质量、动作流畅度和风格多样性,为动漫、

7 月 7 日消息,B站团队的开源动漫视频生成模型 AniSora 于 7 月 2 日更新到 AniSora V3 预览版。rjr28资讯网——每日最新资讯28at.com

作为 Index-AniSora 项目的一部分,V3 版本在原有基础上进一步优化了生成质量、动作流畅度和风格多样性,为动漫、漫画及 VTuber 内容创作者提供了更强大的工具。rjr28资讯网——每日最新资讯28at.com

rjr28资讯网——每日最新资讯28at.com

AniSora 支持一键生成多种动漫风格的视频镜头,包括番剧片段、国创动画、漫画改编、VTuber 内容、动画 PV、鬼畜(MAD)等。rjr28资讯网——每日最新资讯28at.com

rjr28资讯网——每日最新资讯28at.com

AniSora V3 基于B站此前开源的 CogVideoX-5B 和 Wan2.1-14B 模型,结合强化学习与人类反馈(RLHF)框架,显著提升了生成视频的视觉质量和动作一致性。其支持一键生成多种风格的动漫视频镜头,包括番剧片段、国创动画、漫画视频改编、VTuber 内容等。rjr28资讯网——每日最新资讯28at.com

核心升级包括:rjr28资讯网——每日最新资讯28at.com

时空掩码模块(Spatiotemporal Mask Module)优化:V3 版本增强了时空控制能力,支持更复杂的动画任务,如精细的角色表情控制、动态镜头移动和局部图像引导生成。例如,提示“五位女孩在镜头放大时起舞,左手上举至头顶再下放至膝盖”能生成流畅的舞蹈动画,镜头与角色动作同步自然。rjr28资讯网——每日最新资讯28at.com

数据集扩展:V3 继续依托超过 1000 万高质量动漫视频片段(从 100 万原始视频中提取)进行训练,新增数据清洗流水线,确保生成内容的风格一致性和细节丰富度。rjr28资讯网——每日最新资讯28at.com

硬件优化:V3 新增对华为 Ascend910B NPU 的原生支持,完全基于国产芯片训练,推理速度提升约 20%,生成 4 秒高清视频仅需 2-3 分钟。rjr28资讯网——每日最新资讯28at.com

多任务学习:V3 强化了多任务处理能力,支持从单帧图像生成视频、关键帧插值到唇部同步等功能,特别适合漫画改编和 VTuber 内容创作。rjr28资讯网——每日最新资讯28at.com

在最新基准测试中,AniSora V3 在VBench和双盲主观测试中,角色一致性和动作流畅度均达到业界顶尖水平(SOTA),尤其在复杂动作 (如违反物理规律的夸张动漫动作) 上表现突出。rjr28资讯网——每日最新资讯28at.com

V3 还引入了首个针对动漫视频生成的RLHF 框架,通过 AnimeReward 和 GAPO 等工具对模型进行微调,确保输出更符合人类审美和动漫风格需求。社区开发者已开始基于 V3 开发定制化插件,例如增强特定动漫风格(如吉卜力风)的生成效果。rjr28资讯网——每日最新资讯28at.com

AniSora V3 支持多种动漫风格,包括日本动漫、国产原创动画、漫画改编、VTuber 内容及恶搞动画(鬼畜动画),覆盖 90% 的动漫视频应用场景。具体应用包括:rjr28资讯网——每日最新资讯28at.com

单图转视频:用户上传一张高质量动漫图像,配合文本提示(如“角色在向前行驶的车中挥手,头发随风摆动”),即可生成动态视频,保持角色细节和风格一致。rjr28资讯网——每日最新资讯28at.com

漫画改编:从漫画帧生成带唇部同步和动作的动画,适合快速制作预告片或短篇动画。rjr28资讯网——每日最新资讯28at.com

VTuber 与游戏:支持实时生成角色动画,助力独立创作者和游戏开发者快速测试角色动作。rjr28资讯网——每日最新资讯28at.com

高分辨率输出:生成视频支持高达 1080p,确保在社交媒体、流媒体平台上的专业呈现。rjr28资讯网——每日最新资讯28at.com

AIbase 测试显示,V3 在生成复杂场景(如多角色交互、动态背景)时,相比 V2 减少了约 15% 的伪影问题,生成时间缩短至平均 2.5 分钟(注:4 秒视频)。rjr28资讯网——每日最新资讯28at.com

相比 OpenAI 的 Sora 或 Kling 等通用视频生成模型,AniSora V3 专注于动漫领域。与字节跳动的 EX-4D 相比,AniSora V3 更专注于 2D / 2.5D 动漫风格,而非 4D 多视角生成。rjr28资讯网——每日最新资讯28at.com

附开源地址:rjr28资讯网——每日最新资讯28at.com

https://github.com/bilibili/Index-anisora/tree/mainrjr28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-14452-0.htmlB站开源动漫视频生成模型 AniSora V3 版,速度更快、质量更高

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 清华大学唯一持股具身智能企业“星动纪元”完成近 5 亿元 A 轮融资

下一篇: 字节跳动开源其 AI IDE 工具核心组件 Trae-Agent

标签:
  • 热门焦点
  • 数字虚拟人23年最新变化!

    作者:小资来源:米塔之家自2021年元宇宙“爆炸”后,作为现实世界连接元宇宙的媒介之一,大批虚拟人跑步入场。到了2022年底,据天眼查数据显示,我国目前企业名称或经营范围
  • 蓝标亏钱、Meta裁员:天下秀还值得砸钱元宇宙吗?

    日前,天下秀数字科技集团正式公布了2022年报及2023年一季报。报告显示,2022年天下秀实现营收41.29亿元,同比下滑8.48%;归母净利润1.8亿元,同比下滑49.2%,几乎出现了盈利腰斩的态势
  • 上、中、下游加深融合,搭建元宇宙产业全景

    元宇宙产业链涉及多种技术和多个领域。在上游,聚集着大量的技术厂商,提供元宇宙相关的硬件和软件支持;在中游,内容运营与分发领域也吸引着越来越多的企业以VR内容
  • 花房集团上市,走向元宇宙新征程

    文 | 港股研究社作者 | 熊生12月12日,花房集团在港交所成功上市,首日便受到追捧,当日最高涨幅达28.75%。继360、360数科、鲁大师后,这是“红衣教主”周
  • 高通成立欧洲XR实验室;ICICB计划进军元宇宙......

    扩展现实(XR)通过计算机将真实与虚拟相结合,打造了一个可人机交互的虚拟环境,将AR、VR、MR多种技术相融合,为体验者带来了虚拟世界与现实世界之间无缝转换的“沉浸
  • 暴涨100倍的NFT worlds 会是未来元宇宙的雏形吗?

    NFT Worlds 系列产品于 2021 年 10 月 5 日免费铸造,该NFT系列是将传统的中心化电子游戏minecraft 与去中心化资产相结合。传统游戏Minecraft 对用户定制非常开
  • 以太坊面临来自Fantom的巨大挑战

    众所周知,区块链和加密货币项目经常因其对环境的影响而受到批评。但是有一个非营利性的加密货币和区块链项目说它比其他的更环保。今天老雅痞就给大家聊一聊加
  • 大厂打造元宇宙平台的业务重心是什么?

    知名市场研究机构IDC发布《2022年中国元宇宙市场十大预测》报告,其中提出互联网大厂各自独立布局元宇宙平台。事实上,在2021年的最后一个季度,包括Meta、英伟达、
  • Steam 禁止NFT和加密货币原因曝光

    近日,Valve(V社)总裁Gabe Newell接受PC Gamer采访时解释了该平台禁止NFT和加密货币的原因。早在2021年10月18日,PC Gamer就报道Steam推出的新规:使用区块链或允许交
Top