当前位置:首页 > 科技  > 数码

阿里云万相2.1视频大模型开源,8.2GB显存轻松驾驭,性能超越Sora等竞品

来源: 责编: 时间:2025-02-26 12:26:19 251观看
导读阿里云近日宣布了一项重大举措,正式开源其视觉生成基座模型——万相2.1(Wan)。此次开源行动采用了极为宽松的Apache2.0协议,意味着全球开发者将能够无限制地访问和使用这一前沿技术。万相2.1模型包含14B和1.3B两种参数规

阿里云近日宣布了一项重大举措,正式开源其视觉生成基座模型——万相2.1(Wan)。此次开源行动采用了极为宽松的Apache2.0协议,意味着全球开发者将能够无限制地访问和使用这一前沿技术。t3m28资讯网——每日最新资讯28at.com

万相2.1模型包含14B和1.3B两种参数规格,阿里云不仅开放了全部推理代码,还提供了相应的权重文件。这一举措极大地方便了开发者进行文生视频和图生视频等任务的探索。开发者可以在Github、HuggingFace和魔搭社区等多个平台上轻松下载并体验这一模型。t3m28资讯网——每日最新资讯28at.com

据悉,14B参数的万相模型在指令遵循、复杂运动生成、物理建模以及文字视频生成等多个领域均展现出了卓越的性能。在评测集VBench中,万相2.1以86.22%的总分力压群雄,包括Sora、Luma、Pika等国内外知名模型,成功登顶。而1.3B版本的测试结果同样令人瞩目,它不仅超越了更大尺寸的开源模型,还逼近了部分闭源模型的表现。尤为该版本能够在消费级显卡上流畅运行,仅需8.2GB显存即可生成480P视频,这对于二次模型开发和学术研究来说无疑是一个巨大的福音。t3m28资讯网——每日最新资讯28at.com

t3m28资讯网——每日最新资讯28at.com

t3m28资讯网——每日最新资讯28at.com

万相视频模型采用了先进的DiT架构和线性噪声轨迹Flow Matching范式,并在此基础上研发了高效的因果3D VAE和可扩展的预训练策略等创新技术。特别是在3D VAE方面,万相团队通过实现特征缓存机制,成功支持了任意长度视频的编码和解码,实现了对无限长1080P视频的高效处理。通过将空间降采样压缩提前,万相模型在不损失性能的前提下,进一步减少了29%的推理时内存占用,从而提升了整体运行效率。t3m28资讯网——每日最新资讯28at.com

t3m28资讯网——每日最新资讯28at.com

在多个维度的测试中,万相模型均展现出了业界领先的表现。特别是在运动质量、视觉质量、风格和多目标等14个主要维度以及26个子维度的测试中,万相模型斩获了5项第一,充分证明了其强大的技术实力和广泛的应用潜力。t3m28资讯网——每日最新资讯28at.com

t3m28资讯网——每日最新资讯28at.com

对于想要深入了解和使用万相模型的开发者来说,以下是一些开源地址的链接:t3m28资讯网——每日最新资讯28at.com

Github:https://github.com/Wan-Videot3m28资讯网——每日最新资讯28at.com

HuggingFace:https://huggingface.co/Wan-AIt3m28资讯网——每日最新资讯28at.com

魔搭社区:https://modelscope.cn/organization/Wan-AIt3m28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-133592-0.html阿里云万相2.1视频大模型开源,8.2GB显存轻松驾驭,性能超越Sora等竞品

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 我国人形机器人技术新飞跃:任意地形自主站立,迈向智能新篇章

下一篇: 迈巴赫车主控诉尊界S800测试事件,江汽集团正面回应争议

标签:
  • 热门焦点
  • 6月安卓手机性价比榜:Note 12 Turbo断层式碾压

    6月份有一个618,虽然这是京东周年庆的日子,但别的电商也都不约而同的跟进了,反正促销没坏处,厂商和用户都能满意。618期间一些产品也出现了历史低价,那么各个价位段的产品性价比
  • 印度登月最关键一步!月船三号今晚进入环月轨道

    8月5日消息,据印度官方消息,月船三号将于北京时间今晚21时30分左右开始近月制动进入环月轨道。这是该探测器能够成功的最关键步骤之一,如果成功将开始围
  • Rust中的高吞吐量流处理

    作者 | Noz编译 | 王瑞平本篇文章主要介绍了Rust中流处理的概念、方法和优化。作者不仅介绍了流处理的基本概念以及Rust中常用的流处理库,还使用这些库实现了一个流处理程序
  • 服务存储设计模式:Cache-Aside模式

    Cache-Aside模式一种常用的缓存方式,通常是把数据从主存储加载到KV缓存中,加速后续的访问。在存在重复度的场景,Cache-Aside可以提升服务性能,降低底层存储的压力,缺点是缓存和底
  • 分布式系统中的CAP理论,面试必问,你理解了嘛?

    对于刚刚接触分布式系统的小伙伴们来说,一提起分布式系统,就感觉高大上,深不可测。而且看了很多书和视频还是一脸懵逼。这篇文章主要使用大白话的方式,带你理解一下分布式系统
  • 之家push系统迭代之路

    前言在这个信息爆炸的互联网时代,能够及时准确获取信息是当今社会要解决的关键问题之一。随着之家用户体量和内容规模的不断增大,传统的靠"主动拉"获取信息的方式已不能满足用
  • 如何使用JavaScript创建一只图像放大镜?

    译者 | 布加迪审校 | 重楼如果您曾经浏览过购物网站,可能遇到过图像放大功能。它可以让您放大图像的特定区域,以便浏览。结合这个小小的重要功能可以大大改善您网站的用户体验
  • 一篇文章带你了解 CSS 属性选择器

    属性选择器对带有指定属性的 HTML 元素设置样式。可以为拥有指定属性的 HTML 元素设置样式,而不仅限于 class 和 id 属性。一、了解属性选择器CSS属性选择器提供了一种简单而
  • 8月见!小米MIX Fold 3获得3C认证:支持67W快充

    这段时间以来,包括三星、一加、荣耀等等有不少品牌旗下的最新折叠屏旗舰都得到了不少爆料,而小米新一代折叠屏旗舰——小米MIX Fold 3此前也屡屡被传
Top