当前位置:首页 > 元宇宙 > AI

昆仑万维开源 SkyReels-V2 模型,开启生成“无限时长”视频时代

来源: 责编: 时间:2025-04-24 11:33:19 146观看
导读 4 月 21 日消息,昆仑万维今日正式发布并开源 SkyReels-V2—— 全球首个使用扩散强迫(Diffusion-forcing)框架的无限时长电影生成模型,其通过结合多模态大语言模型(MLLM)、多阶段预训练(Multi-stage Pretraining)、强

4 月 21 日消息,昆仑万维今日正式发布并开源 SkyReels-V2—— 全球首个使用扩散强迫(Diffusion-forcing)框架的无限时长电影生成模型,其通过结合多模态大语言模型(MLLM)、多阶段预训练(Multi-stage Pretraining)、强化学习(Reinforcement Learning)和扩散强迫(Diffusion-forcing)框架来实现协同优化。官方表示,该模型将突破视频生成技术边界,开启“无限时长电影生成”新时代。DG928资讯网——每日最新资讯28at.com

附开源地址如下:DG928资讯网——每日最新资讯28at.com

SkyReels-V2

GitHub 地址:https://github.com/SkyworkAI/SkyReels-V2DG928资讯网——每日最新资讯28at.com

论文地址:https://arxiv.org/abs/2504.13074DG928资讯网——每日最新资讯28at.com

SkyReels-A2

HuggingFace 地址:https://huggingface.co/ Skywork / SkyReels-A2DG928资讯网——每日最新资讯28at.com

GitHub 地址:https://github.com/SkyworkAI/SkyReels-A2DG928资讯网——每日最新资讯28at.com

论文地址:https://arxiv.org/ pdf/2504.02436DG928资讯网——每日最新资讯28at.com

据介绍,现有技术在提升稳定的视觉质量时往往牺牲运动动态效果,为了优先考虑高分辨率而限制视频时长(通常为 5-10 秒),并且由于通用多模态大语言模型(MLLM)无法解读电影语法(如镜头构图、演员表情和摄像机运动),导致镜头感知生成能力不足。这些相互关联的限制阻碍了长视频的逼真合成和专业电影风格的生成。DG928资讯网——每日最新资讯28at.com

为此应运而生的 SkyReels-V2 则在技术上实现了突破,还提供了多种有用的应用场景,包括故事生成、图生视频、运镜专家和多主体一致性视频生成(SkyReels-A2)。DG928资讯网——每日最新资讯28at.com

DG928资讯网——每日最新资讯28at.com

DG928资讯网——每日最新资讯28at.com

DG928资讯网——每日最新资讯28at.com

SkyReels-V2 现已支持生成 30 秒、40 秒的视频,且具备生成高运动质量、高一致性、高保真视频的能力。DG928资讯网——每日最新资讯28at.com

官方表示,SkyReels-V2 在运动动态方面表现优异,能够生成流畅且逼真的视频内容,满足电影制作中对高质量运动动态的需求。DG928资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12530-0.html昆仑万维开源 SkyReels-V2 模型,开启生成“无限时长”视频时代

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 行业首款,智元发布具身智能一站式开发平台 Genie Studio

下一篇: 选 AI 比选对象还难!“起名黑洞”OpenAI 的新模型,到底怎么选?

标签:
  • 热门焦点
Top