当前位置:首页 > 科技  > 网络

1.5T内存挑战英伟达!8枚芯片撑起3个GPT-4:华人AI芯片独角兽估值365亿

来源: 责编: 时间:2023-09-22 20:09:40 535观看
导读 高端GPU持续缺货之下,一家要挑战英伟达的芯片初创公司成为行业热议焦点。8枚芯片跑大模型,就能支持5万亿参数(GPT-4的三倍) 。这是独角兽企业SambaNova刚刚发布的新型AI芯片SN40L——型号中40代表是

高端GPU持续缺货之下,一家要挑战英伟达的芯片初创公司成为行业热议焦点。qDG28资讯网——每日最新资讯28at.com

8枚芯片跑大模型,就能支持5万亿参数(GPT-4的三倍) 。qDG28资讯网——每日最新资讯28at.com

这是独角兽企业SambaNova刚刚发布的新型AI芯片SN40L——qDG28资讯网——每日最新资讯28at.com

型号中40代表是他们第四代产品,L代表专为大模型(LLM)优化:高达1.5T的内存,支持25.6万个token的序列长度。qDG28资讯网——每日最新资讯28at.com

1.5T内存挑战英伟达!8枚芯片撑起3个GPT-4:华人AI芯片独角兽估值365亿qDG28资讯网——每日最新资讯28at.com

CEO Rodrigo Liang表示,当前行业标准做法下运行万亿参数大模型需要数百枚芯片,我们的方法使总拥有成本只有标准方法的1/25。qDG28资讯网——每日最新资讯28at.com

SambaNova目前估值50亿美元(约365亿人民币),累计完成了6轮总计11亿美元的融资,投资方包括英特尔、软银、三星、GV等。qDG28资讯网——每日最新资讯28at.com

1.5T内存挑战英伟达!8枚芯片撑起3个GPT-4:华人AI芯片独角兽估值365亿qDG28资讯网——每日最新资讯28at.com

他们不仅在芯片上要挑战英伟达,业务模式上也说要比英伟达走的更远:直接参与帮助企业训练私有大模型。qDG28资讯网——每日最新资讯28at.com

目标客户上野心更是很大:瞄准世界上大的2000家企业。qDG28资讯网——每日最新资讯28at.com

1.5TB内存的AI芯片qDG28资讯网——每日最新资讯28at.com

新产品SN40L,由台积电5纳米工艺制造,包含1020亿晶体管,峰值速度638TeraFLOPS。qDG28资讯网——每日最新资讯28at.com

与英伟达等其他AI芯片更大的不同在于新的三层Dataflow内存系统。qDG28资讯网——每日最新资讯28at.com

520MB片上SRAM内存qDG28资讯网——每日最新资讯28at.com

65GB的高带宽HBM3内存qDG28资讯网——每日最新资讯28at.com

以及高达1.5TB的外部DRAM内存qDG28资讯网——每日最新资讯28at.com

1.5T内存挑战英伟达!8枚芯片撑起3个GPT-4:华人AI芯片独角兽估值365亿qDG28资讯网——每日最新资讯28at.com

与主要竞品相比,英伟达H100高拥有80GB HBM3内存,AMD MI300拥有192GB HBM3内存。qDG28资讯网——每日最新资讯28at.com

SN40L的高带宽HBM3内存实际比前两者小,更多依靠大容量DRAM。qDG28资讯网——每日最新资讯28at.com

Rodrigo Liang表示,虽然DRAM速度更慢,但专用的软件编译器可以智能地分配三个内存层之间的负载,还允许编译器将8个芯片视为单个系统。qDG28资讯网——每日最新资讯28at.com

1.5T内存挑战英伟达!8枚芯片撑起3个GPT-4:华人AI芯片独角兽估值365亿qDG28资讯网——每日最新资讯28at.com

除了硬件指标,SN40L针对大模型做的优化还有同时提供密集和稀疏计算加速。qDG28资讯网——每日最新资讯28at.com

他们认为大模型中许多权重设置为0,像其他数据一样去执行操作很浪费。qDG28资讯网——每日最新资讯28at.com

他们找到一种软件层面的加速办法,与调度和数据传输有关,但没有透露细节,“我们还没准备好向公布是如何做到这一点的”。qDG28资讯网——每日最新资讯28at.com

咨询机构Gartner的分析师Chirag Dekate认为,SN40L的一个可能优势在于多模态AI。qDG28资讯网——每日最新资讯28at.com

GPU的架构非常严格,面对图像、视频、文本等多样数据时可能不够灵活,而SambaNova可以调整硬件来满足工作负载的要求。qDG28资讯网——每日最新资讯28at.com

目前,SambaNova的芯片和系统已获得不少大型客户,包括世界排名前列的超算实验室,日本富岳、美国阿贡国家实验室、劳伦斯国家实验室,以及咨询公司埃森哲等。qDG28资讯网——每日最新资讯28at.com

业务模式也比较特别,芯片不单卖,而是出售其定制技术堆栈,从芯片到服务器系统,甚至包括部署大模型。qDG28资讯网——每日最新资讯28at.com

1.5T内存挑战英伟达!8枚芯片撑起3个GPT-4:华人AI芯片独角兽估值365亿qDG28资讯网——每日最新资讯28at.com

为此,他们与TogetherML联合开发了BloomChat,一个1760亿参数的多语言聊天大模型。qDG28资讯网——每日最新资讯28at.com

BloomChat建立在BigScience组织的开源大模型Bloom之上,并在来自OpenChatKit、Dolly 2.0和OASST1的OIG上进行了微调。qDG28资讯网——每日最新资讯28at.com

训练过程中,它使用了SambaNova独特的可重配置数据流架构,然后在SambaNova DataScale系统进行训练。qDG28资讯网——每日最新资讯28at.com

1.5T内存挑战英伟达!8枚芯片撑起3个GPT-4:华人AI芯片独角兽估值365亿qDG28资讯网——每日最新资讯28at.com

这也是这家公司大被投资者热捧之外的大争议点之一,很多人不看好一家公司既做芯片又做大模型。qDG28资讯网——每日最新资讯28at.com

给每家大企业打造150个大模型qDG28资讯网——每日最新资讯28at.com

在与The Next Platform网站交流时,CEO Rodrigo Liang表示:qDG28资讯网——每日最新资讯28at.com

用于大模型训练的公开数据已快耗尽,但对参数数量的追求还在不断增加。qDG28资讯网——每日最新资讯28at.com

各种大模型的性能相差只有几个百分点,这不是大家应该玩的游戏。qDG28资讯网——每日最新资讯28at.com

他认为大模型与生成式AI商业化的下一个战场是企业的私有数据,尤其是大企业。qDG28资讯网——每日最新资讯28at.com

这些企业坐拥大量的数据,但自己不知道其中大部分内容是什么。qDG28资讯网——每日最新资讯28at.com

1.5T内存挑战英伟达!8枚芯片撑起3个GPT-4:华人AI芯片独角兽估值365亿qDG28资讯网——每日最新资讯28at.com

对于企业私有大模型的形态,SambaNova也有与众不同的观点。qDG28资讯网——每日最新资讯28at.com

他们认为终企业内部不会运行一个GPT-4或谷歌Gemini那样的超大模型,而是根据不同数据子集创建150个独特的模型,聚合参数超过万亿。qDG28资讯网——每日最新资讯28at.com

相当于把GPT-4等大模型内部的Mixture of Experts(专家混合)架构扩展到整个系统,称为Composition of Experts(专家合成)。qDG28资讯网——每日最新资讯28at.com

在企业运转的每个节点运行一个完整且经过专门调整的基础模型,分别用法律语料库、制造语料库、风险管理语料库、财富管理语料库、客户销售语料库、客户支持语料库等等不同数据训练。qDG28资讯网——每日最新资讯28at.com

这些专家模型之间通过一种软件路由或负载平衡器联在一起,收到推理请求后决定具体向哪个模型推送提示词。qDG28资讯网——每日最新资讯28at.com

1.5T内存挑战英伟达!8枚芯片撑起3个GPT-4:华人AI芯片独角兽估值365亿qDG28资讯网——每日最新资讯28at.com

这一策略与GPT-4和谷歌Gemini等做法形成鲜明对比,巨头大多希望创建一个能泛化到数百万个任务的巨型模型。qDG28资讯网——每日最新资讯28at.com

分析师认为技术上可能谷歌的做法性能更强,但SambaNova的方法对企业来说更实用。qDG28资讯网——每日最新资讯28at.com

没有任何一个模型或人能完整访问企业的所有数据,限制每个部门能访问的专家模型,就能限制他们能访问的数据。qDG28资讯网——每日最新资讯28at.com

斯坦福系芯片公司,华人工程师主力qDG28资讯网——每日最新资讯28at.com

SambaNova成立于2017年,2020年之前都比较低调。qDG28资讯网——每日最新资讯28at.com

联创3人都是斯坦福背景,连产品系列名Cardinal(深红色)都是斯坦福的昵称与代表颜色。qDG28资讯网——每日最新资讯28at.com

CEO Rodrigo Liang是前Sun/甲骨文工程副总裁,也有人将这个名字解读为暗指甲骨文老对头IBM的DeepBlue(深蓝)。qDG28资讯网——每日最新资讯28at.com

1.5T内存挑战英伟达!8枚芯片撑起3个GPT-4:华人AI芯片独角兽估值365亿qDG28资讯网——每日最新资讯28at.com

另外两位联合创始人都是斯坦福教授。qDG28资讯网——每日最新资讯28at.com

CTO Kunle Olukotun是电气工程教授,因多核芯片架构方面的研究而闻名,开发了首批支持线程级推测 (TLS) 的芯片之一。qDG28资讯网——每日最新资讯28at.com

Christopher Ré是计算机科学副教授,重点研究方向机器学习和数据分析的速度和可扩展性。qDG28资讯网——每日最新资讯28at.com

1.5T内存挑战英伟达!8枚芯片撑起3个GPT-4:华人AI芯片独角兽估值365亿qDG28资讯网——每日最新资讯28at.com

此外团队中还有不少华人工程师。qDG28资讯网——每日最新资讯28at.com

从官网公开信息来看,SambaNova的领导团队中,至少有3名华人。qDG28资讯网——每日最新资讯28at.com

Jonathan Chang,拥有UC伯克利的机械工程学士学位以及南加州大学的MBA学位。qDG28资讯网——每日最新资讯28at.com

他在构建高增长方面拥有20多年的经验。加入SambaNova之前,Chang在特斯拉工作了近9年。qDG28资讯网——每日最新资讯28at.com

Marshall Choy,此前曾担任甲骨文公司系统产品管理和解决方案开发副总裁,监督了数十个行业的企业硬件和软件产品的上市。qDG28资讯网——每日最新资讯28at.com

Penny Li,在EDA工具和微处理器设计方面拥有超过27年的经验。此前,她曾在IBM和甲骨文工作过。qDG28资讯网——每日最新资讯28at.com

如果去领英搜索还能发现更多华人团队成员。qDG28资讯网——每日最新资讯28at.com

1.5T内存挑战英伟达!8枚芯片撑起3个GPT-4:华人AI芯片独角兽估值365亿qDG28资讯网——每日最新资讯28at.com

目前SambaNova包含SN40L芯片的人工智能引擎已上市,但定价没有公开。qDG28资讯网——每日最新资讯28at.com

根据Rodrigo Liang的说法,8个SN40L组成的集群总共可处理5万亿参数,相当于70个700亿参数大模型。qDG28资讯网——每日最新资讯28at.com

全球2000强的企业只需购买两个这样的8芯片集群,就能满足所有大模型需求。qDG28资讯网——每日最新资讯28at.com

参考链接:qDG28资讯网——每日最新资讯28at.com

[1]https://spectrum.ieee.org/ai-chip-sambanovaqDG28资讯网——每日最新资讯28at.com

[2]https://www.nextplatform.com/2023/09/20/sambanova-tackles-generative-ai-with-new-chip-and-new-approach/qDG28资讯网——每日最新资讯28at.com

[3]https://sambanova.ai/resources/qDG28资讯网——每日最新资讯28at.com


文章出处:量子位

本文链接:http://www.28at.com/showinfo-17-11135-0.html1.5T内存挑战英伟达!8枚芯片撑起3个GPT-4:华人AI芯片独角兽估值365亿

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 任正非谈农村学英文困难:不学英文 农村孩子永远就是农民

下一篇: 被谷歌地图坑惨:一用户被导航至断桥 落水后溺亡

标签:
  • 热门焦点
  • 三言两语说透设计模式的艺术-单例模式

    写在前面单例模式是一种常用的软件设计模式,它所创建的对象只有一个实例,且该实例易于被外界访问。单例对象由于只有一个实例,所以它可以方便地被系统中的其他对象共享,从而减少
  • 之家push系统迭代之路

    前言在这个信息爆炸的互联网时代,能够及时准确获取信息是当今社会要解决的关键问题之一。随着之家用户体量和内容规模的不断增大,传统的靠"主动拉"获取信息的方式已不能满足用
  • 多线程开发带来的问题与解决方法

    使用多线程主要会带来以下几个问题:(一)线程安全问题  线程安全问题指的是在某一线程从开始访问到结束访问某一数据期间,该数据被其他的线程所修改,那么对于当前线程而言,该线程
  • 从零到英雄:高并发与性能优化的神奇之旅

    作者 | 波哥审校 | 重楼作为公司的架构师或者程序员,你是否曾经为公司的系统在面对高并发和性能瓶颈时感到手足无措或者焦头烂额呢?笔者在出道那会为此是吃尽了苦头的,不过也得
  • 为什么你不应该使用Div作为可点击元素

    按钮是为任何网络应用程序提供交互性的最常见方式。但我们经常倾向于使用其他HTML元素,如 div span 等作为 clickable 元素。但通过这样做,我们错过了许多内置浏览器的功能。
  • 拼多多APP上线本地生活入口,群雄逐鹿万亿市场

    Tech星球(微信ID:tech618)文 | 陈桥辉 Tech星球独家获悉,拼多多在其APP内上线了“本地生活”入口,位置较深,位于首页的“充值中心”内,目前主要售卖美食相关的
  • 小米MIX Fold 3配置细节曝光:搭载领先版骁龙8 Gen2+罕见5倍长焦

    这段时间以来,包括三星、一加、荣耀等等有不少品牌旗下的最新折叠屏旗舰都得到了不少爆料,而小米新一代折叠屏旗舰——小米MIX Fold 3此前也屡屡被传
  • 消息称小米汽车开始筛选交付中心:需至少120个车位

    IT之家 7 月 7 日消息,日前,有微博简介为“汽车行业从业者、长三角一体化拥护者”的微博用户 @长三角行健者 发文表示,据经销商集团反馈,小米汽车目前
  • 最薄的14英寸游戏笔记本电脑 Alienware X14已可以购买

    2022年1月份在国际消费电子展(CES2022)上首次亮相的Alienware新品——Alienware X14现在已经可以购买了,这款笔记本电脑被誉为世界上最薄的 14 英寸游戏笔
Top