当前位置:首页 > 科技  > 手机

华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应

来源: 责编: 时间:2025-07-07 09:52:01 214观看
导读 2025年6月30日,华为正式宣布开源盘古7B参数的稠密模型、盘古Pro MoE 72B混合专家模型和基于昇腾的模型推理技术。随后一项由@HonestAGI 发布于GitHub的针对盘古大模型的研究引发业界热议,该研究的作者认为,华

2025年6月30日,华为正式宣布开源盘古7B参数的稠密模型、盘古Pro MoE 72B混合专家模型和基于昇腾的模型推理技术。随后一项由@HonestAGI 发布于GitHub的针对盘古大模型的研究引发业界热议,该研究的作者认为,华为推出的盘古大模型(Pangu Pro MoE)与阿里巴巴发布的通义千问Qwen-2.5 14B模型在参数结构上存在高相似度。w4T28资讯网——每日最新资讯28at.com

HonestAGI 通过测试比较称,Pangu Pro MoE模型与Qwen-2.5 14B模型在注意力参数分布上的平均相关性高达0.927,远超其他模型对比的正常范围(业内同类模型对比通常不超过0.7)。w4T28资讯网——每日最新资讯28at.com

华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应w4T28资讯网——每日最新资讯28at.com

由于深度学习模型的训练具有高度随机性,涉及复杂的数据采样、权重初始化及优化路径。两个模型在众多注意力参数上呈现近乎一致的分布,其自然发生的概率极低。因此,这种极高的相似度,立即引发其涉嫌“抄袭”的质疑。w4T28资讯网——每日最新资讯28at.com

随后,有自称是盘古大模型团队的人在GitHub上进行了回应,否认抄袭指控,并且认为该作者的评估方法不科学。w4T28资讯网——每日最新资讯28at.com

该用户表示,使用论文中描述的方法,评估了以下模型比较:w4T28资讯网——每日最新资讯28at.com

pangu-72b-a16b vs. Qwen2.5-14b = 0.92baichuan2-13b vs. Qwen1.5-14b = 0.87baichuan2-13b vs. pangu-72b-a16b = 0.84baichuan2-13b vs. Qwen2.5-14b = 0.86w4T28资讯网——每日最新资讯28at.com

可以看到不同其他相近参数规模的模型在该评估方法下也得到了与Qwen-2.5 14B模型高度相似的结果。这表明该论文和指标缺乏实际意义。盘古团队进一步并重申没有抄袭。w4T28资讯网——每日最新资讯28at.com

对于该回应,HonestAGI 表示,其无法信服盘古大模型团队的说法。HonestAGI 称,“盘古仍然显示出高的相似度,对吧?我们很高兴看到您成功复现了我们的结果!事实上,任何分类问题都有一个阈值来识别决策边界(例如,本例中疑似值为0.9)。这主要是一个用于初步比较的工具,而盘古‘不幸地’在我们开始进一步调查之前触发了这个警告信号。我们并非仅仅基于注意力参数就做出判断。这只是动机。……”w4T28资讯网——每日最新资讯28at.com

随后,HonestAGI 还提供了 Qwen 和 Hunyuan A13B 之间的比,结果显示二者在不同层级上展现出截然不同的内部模式,这表明它们拥有截然不同的架构和学习到的表征。显然,HonestAGI提供该对比数据是想说明其测试方法没有问题。w4T28资讯网——每日最新资讯28at.com

华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应w4T28资讯网——每日最新资讯28at.com

不过,目前HonestAGI似乎已经下线了之前关于盘古大模型的研究报告。但是,HonestAGI 在新的回应中表示,“我们计划在论文终定稿并提交所有代码后,将其提交给同行评审会议(可能是 ICLR 或之后的会议?)。”w4T28资讯网——每日最新资讯28at.com

另外,值得注意但是,通过查询盘古大模型团队官方发布在国内代码托管平台Gitcode(类似国外的Github)的“盘古Pro”大模型代码,可以发现其“'Open Source Software Notice”当中的赫然出现了关于“transformers”组件的版权声明“Copyright notice:Copyright 2024 The Qwen team, Alibaba Group and the HuggingFace Team. All rights reserved.” 显然这段说明的意思是,其所用到的“transformers”组件的版权所有人是Qwen团队、阿里巴巴集团和HuggingFace团队。w4T28资讯网——每日最新资讯28at.com

华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应w4T28资讯网——每日最新资讯28at.com

需要指出的是,该代码是由“Ascend Tribe”——盘古大模型团队官方发布,并不是其他第三方进行发布的。由此也有不少网友认为这是“实锤”抄袭的证据。w4T28资讯网——每日最新资讯28at.com

不过,业内人士表示,这是一份标准的开源声明,当盘古大模型团队使用了第三方开发的开源软件时,根据开源许可要求,是必须需要向用户说明的法律义务。而在这份声明当中,只能表明盘古大模型当中用了阿里巴巴Qwen团队 和 HuggingFace共同开发的“transformers”组件,并且使用的是“Apache License 2.0”协议。该协议它允许任何人自由地使用、修改和分发该软件,甚至用于商业产品中。所以,这份声明只反应了盘古大模型团队用了一些开源代码,并且遵守了开源协议,并不能证明抄袭。w4T28资讯网——每日最新资讯28at.com

盘古大模型团队正式回应w4T28资讯网——每日最新资讯28at.com

7月5日下午16:59分,隶属于华为的负责开发盘古大模型的诺亚方舟实验室发布声明对于“抄袭”指控进行了官方回应。w4T28资讯网——每日最新资讯28at.com

诺亚方舟实验室表示,盘古Pro MoE开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来,在架构设计、技术特性等方面做了关键创新,是全球首个面向昇腾硬件平台设计的同规格混合专家模型,创新性地提出了分组混合专家模型(MoGE)架构,有效解决了大规模分布式训练的负载均衡难题,提升训练效率。w4T28资讯网——每日最新资讯28at.com

不过,诺亚方舟实验室也承认,“盘古Pro MoE开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。我们始终坚持开放创新,尊重第三方知识产权,同时提倡包容、公平、开放、团结和可持续的开源理念。”w4T28资讯网——每日最新资讯28at.com

华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应w4T28资讯网——每日最新资讯28at.com

此外,芯智讯发现,有百度贴吧网友爆料称,负责盘古大模型的开发的诺亚方舟负责人王云鹤在内网也针对此事做了回应,回应内容的核心是两个:1、盘古大模型是基于昇腾芯片进行训练的,与Qwen所用的训练硬件是不同的;2、盘古大模型当中所使用的Llama和Qwen的组件都是已经开源的,并不是抄袭。w4T28资讯网——每日最新资讯28at.com

华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应w4T28资讯网——每日最新资讯28at.com

总结来看,目前尚无证据证实盘古大模型存在抄袭阿里Qwen的“实锤”证据,HonestAGI 所发布的质疑论文所采用的测试方法的可靠性也有待进一步验证,毕竟其并未完全公开其测试代码,更何况HonestAGI 已经下线了之前的质疑论文。至于盘古大模型当中确实有采用Qwen的开源代码,但这部分的代码本就是开源代码,盘古大模型团队的相关的声明做法也是合规的,只能说盘古大模型并不是从零起步的绝对原创,如果只是用了部分开源组件,也并不属于抄袭。w4T28资讯网——每日最新资讯28at.com


文章出处:芯智讯

本文链接:http://www.28at.com/showinfo-22-166886-0.html华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 小米13系列新品展望 将拥有极窄下巴快11月发

下一篇: 不再是字母!华为智界车标将于本月落地 老车主可享

标签:
  • 热门焦点
  • CSS单标签实现转转logo

    转转品牌升级后更新了全新的Logo,今天我们用纯CSS来实现转转的新Logo,为了有一定的挑战性,这里我们只使用一个标签实现,将最大化的使用CSS能力完成Logo的绘制与动画效果。新logo
  • 学习JavaScript的10个理由...

    作者 | Simplilearn编译 | 王瑞平当你决心学习一门语言的时候,很难选择到底应该学习哪一门,常用的语言有Python、Java、JavaScript、C/CPP、PHP、Swift、C#、Ruby、Objective-
  • 量化指标是与非:挽救被量化指标扼杀的技术团队

    作者 | 刘新翠整理 | 徐杰承本文整理自快狗打车技术总监刘新翠在WOT2023大会上的主题分享,更多精彩内容及现场PPT,请关注51CTO技术栈公众号,发消息【WOT2023PPT】即可直接领取
  • JavaScript学习 -AES加密算法

    引言在当今数字化时代,前端应用程序扮演着重要角色,用户的敏感数据经常在前端进行加密和解密操作。然而,这样的操作在网络传输和存储中可能会受到恶意攻击的威胁。为了确保数据
  • Python异步IO编程的进程/线程通信实现

    这篇文章再讲3种方式,同时讲4中进程间通信的方式一、 Python 中线程间通信的实现方式共享变量共享变量是多个线程可以共同访问的变量。在Python中,可以使用threading模块中的L
  • JVM优化:实战OutOfMemoryError异常

    一、Java堆溢出堆内存中主要存放对象、数组等,只要不断地创建这些对象,并且保证 GC Roots 到对象之间有可达路径来避免垃 圾收集回收机制清除这些对象,当这些对象所占空间超过
  • 三星推出Galaxy Tab S9系列平板电脑以及Galaxy Watch6系列智能手表

    2023年7月26日,三星电子正式发布了Galaxy Z Flip5与Galaxy Z Fold5。除此之外,Galaxy Tab S9系列平板电脑以及三星Galaxy Watch6系列智能手表也同期
  • iQOO 11S评测:行业唯一的200W标准版旗舰

    【Techweb评测】去年底,iQOO推出了“电竞旗舰”iQOO 11系列,作为一款性能强机,该机不仅全球首发2K 144Hz E6全感屏,搭载了第二代骁龙8平台及144Hz电竞
  • 苹果140W USB-C充电器:采用氮化镓技术

    据10 月 30 日 9to5 Mac 消息报道,当苹果推出新的 MacBook Pro 2021 时,该公司还推出了新的 140W USB-C 充电器,附赠在 MacBook Pro 16 英寸机型的盒子里,也支
Top