当前位置:首页 > 科技  > 手机

华为宣布开源盘古7B稠密和72B混合专家模型

来源: 责编: 时间:2025-06-30 18:32:58 230观看
导读 快科技6月30日消息,华为今日正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术。华为表示:“此举是华为践行昇腾生态战略的又一关键举措,推动大模型技

快科技6月30日消息,华为今日正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术。fqj28资讯网——每日最新资讯28at.com

华为表示:“此举是华为践行昇腾生态战略的又一关键举措,推动大模型技术的研究与创新发展,加速推进人工智能在千行百业的应用与价值创造。”fqj28资讯网——每日最新资讯28at.com

根据华为官网显示:fqj28资讯网——每日最新资讯28at.com

盘古Pro MoE 72B模型权重、基础推理代码,已正式上线开源平台。fqj28资讯网——每日最新资讯28at.com

基于昇腾的超大规模MoE模型推理代码,已正式上线开源平台。fqj28资讯网——每日最新资讯28at.com

盘古7B相关模型权重与推理代码将于近期上线开源平台。fqj28资讯网——每日最新资讯28at.com

华为宣布开源盘古7B稠密和72B混合专家模型fqj28资讯网——每日最新资讯28at.com

据悉,基于MoGE架构构建的盘古Pro MoE大模型(72B总参数、16B激活参数)在昇腾300I Duo和800I A2可实现更优的专家负载分布与计算效率(321 tokens/s和1528 tokens/s)。fqj28资讯网——每日最新资讯28at.com

而在模型能力方面,盘古Pro MoE在新一期业界权威大模型榜单SuperCLUE上交出了超能打的成绩。fqj28资讯网——每日最新资讯28at.com

和其他动辄千亿以上的大模型相比,如DeepSeek-R1具有671B参数,盘古Pro MoE以72B总参数量达到了59分,千亿参数量以内大模型排行并列国内第一。fqj28资讯网——每日最新资讯28at.com

并且,16B激活参数量可以媲美其他厂商更大规模的模型。fqj28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-22-165454-0.html华为宣布开源盘古7B稠密和72B混合专家模型

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 自家人都看不上!三星S25采购LPDDR5X:美光比例多年来首超自家

下一篇: 曝iPhone 17系列备货量有点保守 业内人士:没有杀手级应用

标签:
  • 热门焦点
  • K60 Pro官方停产 第三方瞬间涨价

    虽然没有官方宣布,但Redmi的一些高管也已经透露了,Redmi K60 Pro已经停产且不会补货,这一切都是为了即将到来的K60 Ultra铺路,属于厂家的正常操作。但有意思的是该机在停产之后
  • 小米平板5 Pro 12.4简评:多专多能 兼顾影音娱乐的大屏利器

    疫情带来了网课,网课盘活了安卓平板,安卓平板市场虽然中途停滞了几年,但好的一点就是停滞的这几年行业又有了新的发展方向,例如超窄边框、高刷新率、多摄镜头组合等,这就让安卓
  • 2023 年的 Node.js 生态系统

    随着技术的不断演进和创新,Node.js 在 2023 年达到了一个新的高度。Node.js 拥有一个庞大的生态系统,可以帮助开发人员更快地实现复杂的应用。本文就来看看 Node.js 最新的生
  • 一文看懂为苹果Vision Pro开发应用程序

    译者 | 布加迪审校 | 重楼苹果的Vision Pro是一款混合现实(MR)头戴设备。Vision Pro结合了虚拟现实(VR)和增强现实(AR)的沉浸感。其高分辨率显示屏、先进的传感器和强大的处理能力
  • Golang 中的 io 包详解:组合接口

    io.ReadWriter// ReadWriter is the interface that groups the basic Read and Write methods.type ReadWriter interface { Reader Writer}是对Reader和Writer接口的组合,
  • .NET 程序的 GDI 句柄泄露的再反思

    一、背景1. 讲故事上个月我写过一篇 如何洞察 C# 程序的 GDI 句柄泄露 文章,当时用的是 GDIView + WinDbg 把问题搞定,前者用来定位泄露资源,后者用来定位泄露代码,后面有朋友反
  • 使用AIGC工具提升安全工作效率

    在日常工作中,安全人员可能会涉及各种各样的安全任务,包括但不限于:开发某些安全工具的插件,满足自己特定的安全需求;自定义github搜索工具,快速查找所需的安全资料、漏洞poc、exp
  • 雅柏威士忌多款单品价格大跌,泥煤顶流也不香了?

    来源 | 烈酒商业观察编 | 肖海林今年以来,威士忌市场开始出现了降温迹象,越来越多不断暴涨的网红威士忌也开始悄然回归市场理性。近日,LVMH集团旗下苏格兰威士忌品牌雅柏(Ardbeg
  • 自研Exynos回归!三星Galaxy S24系列将提供Exynos和骁龙双版本

    年初,全新的三星Galaxy S23系列发布,包含Galaxy S23、Galaxy S23+和Galaxy S23 Ultra三个版本,全系搭载超频版骁龙8 Gen 2,虽同样采用台积电4nm工艺制
Top