当前位置:首页 > 科技  > 网络

李开复旗下“零一万物”回应大模型被指抄袭:做法确实不妥 将修改争议张量名

来源: 责编: 时间:2023-11-15 17:11:31 372观看
导读 快科技11月15日消息,AI 大模型创业公司“零一万物”正式公开回应了其Yi大模型涉嫌抄袭LLaMA事件,称做法确实不妥,将会按照外界建议修改争议张量(Tensor)名。零一万物由创新工场董事长兼CEO李开复于今

快科技11月15日消息,AI 大模型创业公司“零一万物”正式公开回应了其Yi大模型涉嫌抄袭LLaMA事件,称做法确实不妥,将会按照外界建议修改争议张量(Tensor)名rC228资讯网——每日最新资讯28at.com

李开复旗下“零一万物”回应大模型被指抄袭:做法确实不妥 将修改争议张量名rC228资讯网——每日最新资讯28at.com

零一万物由创新工场董事长兼CEO李开复于今年创办,并在本月初宣布推出Yi-34B和Yi-6B两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。rC228资讯网——每日最新资讯28at.com

李开复旗下“零一万物”回应大模型被指抄袭:做法确实不妥 将修改争议张量名rC228资讯网——每日最新资讯28at.com

然而在不久前,开发者ehartford在Yi-34B的Hugging Face开源主页上表示,称该模型使用了Meta LLaMA的架构,只对两个张量名称进行了修改,分别为input_layernorm和post_attention_layernorm。rC228资讯网——每日最新资讯28at.com

同时ehartford还表示,其希望该公司在模型被大量使用之前考虑重命名张量以符合LLaMA架构,并将这一更改应用到官方模型中。rC228资讯网——每日最新资讯28at.com

李开复旗下“零一万物”回应大模型被指抄袭:做法确实不妥 将修改争议张量名rC228资讯网——每日最新资讯28at.com

零一万物开源团队总监Richard Lin昨天承认,修改Llama张量名的做法不妥,将会按照外界建议把“修改后的张量名称从Yi改回LLaMA”。rC228资讯网——每日最新资讯28at.com

Richard Lin表示,出现这一问题主要是由于开发人员疏忽导致,开发人员为了满足测试要求,在代码中进行了几次重命名,但是后面忘记将张量名称修改回LLaMA了。rC228资讯网——每日最新资讯28at.com

李开复旗下“零一万物”回应大模型被指抄袭:做法确实不妥 将修改争议张量名rC228资讯网——每日最新资讯28at.com

不过另一名开发者JosephusCheung则表示,既然官方已经宣布修改Yi大模型张量名称,那么Yi便是LLaMA的衍生作品,因为其推理部分和模型定义都是“LLaMA”的一部分rC228资讯网——每日最新资讯28at.com

目前Richard Lin暂未对此进行回复。rC228资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-17-25937-0.html李开复旗下“零一万物”回应大模型被指抄袭:做法确实不妥 将修改争议张量名

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 腾讯第三季度本土游戏收入327亿元 同比增长5%

下一篇: 腾讯第三季度财报发布:微信月活达13.36亿!超QQ一倍多

标签:
  • 热门焦点
  • K60 Pro官方停产 第三方瞬间涨价

    虽然没有官方宣布,但Redmi的一些高管也已经透露了,Redmi K60 Pro已经停产且不会补货,这一切都是为了即将到来的K60 Ultra铺路,属于厂家的正常操作。但有意思的是该机在停产之后
  • 中兴AX5400Pro+上手体验:再升级 双2.5G网口+USB 3.0这次全都有

    2021年11月的时候,中兴先后发布了两款路由器产品,中兴AX5400和中兴AX5400 Pro,从产品命名上就不难看出这是隶属于同一系列的,但在外观设计上这两款产品可以说是完全没一点关系
  • Rust中的高吞吐量流处理

    作者 | Noz编译 | 王瑞平本篇文章主要介绍了Rust中流处理的概念、方法和优化。作者不仅介绍了流处理的基本概念以及Rust中常用的流处理库,还使用这些库实现了一个流处理程序
  • 把LangChain跑起来的三个方法

    使用LangChain开发LLM应用时,需要机器进行GLM部署,好多同学第一步就被劝退了,那么如何绕过这个步骤先学习LLM模型的应用,对Langchain进行快速上手?本片讲解3个把LangChain跑起来
  • SpringBoot中使用Cache提升接口性能详解

    环境:springboot2.3.12.RELEASE + JSR107 + Ehcache + JPASpring 框架从 3.1 开始,对 Spring 应用程序提供了透明式添加缓存的支持。和事务支持一样,抽象缓存允许一致地使用各
  • 谷歌KDD'23工作:如何提升推荐系统Ranking模型训练稳定性

    谷歌在KDD 2023发表了一篇工作,探索了推荐系统ranking模型的训练稳定性问题,分析了造成训练稳定性存在问题的潜在原因,以及现有的一些提升模型稳定性方法的不足,并提出了一种新
  • 这款新兴工具平台,让你的电脑效率翻倍

    随着信息技术的发展,我们获取信息的渠道越来越多,但是处理信息的效率却成为一个瓶颈。于是各种工具应运而生,都在争相解决我们的工作效率问题。今天我要给大家介绍一款效率
  • 三分钟白话RocketMQ系列—— 如何发送消息

    我们知道RocketMQ主要分为消息 生产、存储(消息堆积)、消费 三大块领域。那接下来,我们白话一下,RocketMQ是如何发送消息的,揭秘消息生产全过程。注意,如果白话中不小心提到相关代
  • 大厂卷向扁平化

    来源:新熵作者丨南枝 编辑丨月见大厂职级不香了。俗话说,兵无常势,水无常形,互联网企业调整职级体系并不稀奇。7月13日,淘宝天猫集团启动了近年来最大的人力制度改革,目前已形成一
Top