当前位置:首页 > 科技  > 通信

Hot Chips 2023 :世界首颗面向数据中心的RISC-V 处理器,每周期可解码8条指令

来源: 责编: 时间:2023-09-12 14:39:27 643观看
导读 Hot chips的全称是A Symposium on High Performance Chips,于每年八月份在斯坦福大学举行。不同于其他行业会议以学术研究为主,HotChips是一场产业界的盛会,各大处理器公司会在每年的会上展现他们最新的产品以及在研的

Hot chips的全称是A Symposium on High Performance Chips,于每年八月份在斯坦福大学举行。不同于其他行业会议以学术研究为主,HotChips是一场产业界的盛会,各大处理器公司会在每年的会上展现他们最新的产品以及在研的产品。Sg028资讯网——每日最新资讯28at.com

我们不但看到了来自英特尔、AMD、Arm这些传统处理器巨头的展示,还看到了存储双雄三星和SK海力士的分享。此外,RISC-V服务器芯片新贵Ventana也在本届大会上分享了公司Veyron V1的细节。Sg028资讯网——每日最新资讯28at.com

Ventana Veyron V1 被认为是首款面向数据中心的RISC-V处理器。接下来让我们看看该款处理器有何过人之处。Sg028资讯网——每日最新资讯28at.com

以下内容来源于中国台湾媒体科技新报,作者:痴汉水球Sg028资讯网——每日最新资讯28at.com

处理器业界一直有一种观点:Arm 是下个RISC / Unix 服务器,而RISC-V 是下个Arm(Arm Is The New RISC / Unix,RISC-V Is The New Arm)。Sg028资讯网——每日最新资讯28at.com

云端巨头纷纷自行打造处理器,继Calxeda、Applied Micro、AMD、Marvell、Nvidia和三星等制造Arm服务器芯片的第一波尝试,博通(Broadcom)、高通(Qualcomm)和Nuvia第二波努力,Arm指令集兼容处理器由AWS自研Graviton和Arm推出Neoverse引领第三波浪潮, 终于冲破数据中心大门。Sg028资讯网——每日最新资讯28at.com

对崭新工作覆载,云端巨头也没有「非 x86 不可」需求,同等性能的云端实例(Cloud Instance),相较 x86,Arm 也有 30%~40% 性价比优势,注定 Arm 成为超大规模云服务的首选。Sg028资讯网——每日最新资讯28at.com


1.jpgSg028资讯网——每日最新资讯28at.com

▲ 兼容 RISC-V 指令集的 Veyron V1 是首款「数据中心等级」RISC-V 处理器。Sg028资讯网——每日最新资讯28at.com

分别掌握移动平台和高效能运算市场的Arm与x86,近来因自由度极高崛起的RISC-V多半用于低功耗嵌入式平台,但也不乏企图将RISC-V推入数据中心的公司。新创Ventana Microsystems 2022年12月发布兼容64位RISC-V指令集的Veyron V1处理器,采用类AMD EPYC的Chiplet设计,允许客户购买CPU模组和I/O Hub(含存储器控制器和PCIe),最多可扩展到192个核心(12个CPU模组),然后整合自己的加速器,实作出一颗完整芯片。Sg028资讯网——每日最新资讯28at.com

Veyron V1 处理器有不少值得留意的巧思,即使觉得反正数据中心的高阶服务器处理器都长那个样子。Sg028资讯网——每日最新资讯28at.com

图片Sg028资讯网——每日最新资讯28at.com

Sg028资讯网——每日最新资讯28at.com


▲ 对还不知道客户在哪里的新创公司,目标不外乎有讲跟没讲一样的「只要我们能找到需求」。Sg028资讯网——每日最新资讯28at.com


图片Sg028资讯网——每日最新资讯28at.com

Sg028资讯网——每日最新资讯28at.com


▲ 一个Veyron V1处理器CPU Chiplet含16个核心(台积电5纳米),接着跟有DDR内存控制器和PCIe等功能的I/O Hub(推测是台积电6纳米)结合,最多可延展至192个核心,并整合特定领域加速器。Sg028资讯网——每日最新资讯28at.com


图片Sg028资讯网——每日最新资讯28at.com

Sg028资讯网——每日最新资讯28at.com


▲ 更多Veyron V1处理器关键规格:每个时钟周期最多可解码8个指令、每个核心有1MB L2快取,全部核心共享的L3快取最高容量48MB,服务器该有的特性如虚拟化、内存数据保护、和防御旁路攻击(Side-band Attack)等。Sg028资讯网——每日最新资讯28at.com


图片Sg028资讯网——每日最新资讯28at.com

Sg028资讯网——每日最新资讯28at.com


▲ 对应指令集以 RV64GC(意指 RISC-V 64-bit, extensions G and C) 为基础再延伸。让人讶异的是,Veyron V1 支持「可在虚拟机架设虚拟机器」的巢状虚拟化(Nested Virtualization),这个连 Arm Neoverse N1 都做不到。Sg028资讯网——每日最新资讯28at.com


图片Sg028资讯网——每日最新资讯28at.com

Sg028资讯网——每日最新资讯28at.com


▲ Veyron V1 核心微架构的相关细节,但说穿了跟其他高效能处理器如出一辙,像追求能效、与指令管线解耦的分支预测与指令撷取、执行单元将部份相连指令融合为单一运算等。Sg028资讯网——每日最新资讯28at.com


RFQZnpKAJ5eztOrzTCHa7OvwgjA/640?wx_fmt=png" data-w="1080" data-index="8" _width="100%" crossorigin="anonymous" alt="图片" data-fail="0" style="margin: 0px; padding: 0px; outline: 0px; max-width: 100%; box-sizing: border-box; overflow-wrap: break-word !important; vertical-align: middle; height: auto !important; width: 677px; visibility: visible !important;"/>Sg028资讯网——每日最新资讯28at.com

Sg028资讯网——每日最新资讯28at.com


▲ Veyron V1 指令快取颇具特色:充当 L1 / L2 大型化 512kB 指令快取,搭配一块当指令循环缓冲区(Loop Buffer)的超小型 L0 快取。Sg028资讯网——每日最新资讯28at.com


图片Sg028资讯网——每日最新资讯28at.com

Sg028资讯网——每日最新资讯28at.com


▲ Veyron V1 指令流水线全貌,坦白讲,画成这样的确很难理解。Sg028资讯网——每日最新资讯28at.com


图片Sg028资讯网——每日最新资讯28at.com

Sg028资讯网——每日最新资讯28at.com


▲ Veyron V1 为了确保每时钟周期可撷取并解码 8 个指令,从分支预测、指令快取、指令 TLB、指令撷取到指令预先解码,都要有因应配套措施。Sg028资讯网——每日最新资讯28at.com


图片Sg028资讯网——每日最新资讯28at.com

Sg028资讯网——每日最新资讯28at.com


▲ Veyron V1 内存加载和回存单元,每时钟周期可同时执行总计四个加载/回存。Sg028资讯网——每日最新资讯28at.com


图片Sg028资讯网——每日最新资讯28at.com

Sg028资讯网——每日最新资讯28at.com


▲ Veyron V1 单一 CPU 模组最多 16 核,L3 快取最高容量是48MB,并兼具快取数据一致性协议的窥探过滤器(Snoop Filter)角色。Sg028资讯网——每日最新资讯28at.com


图片Sg028资讯网——每日最新资讯28at.com

Sg028资讯网——每日最新资讯28at.com


▲ Veyron V1 打从一开始就走 Chiplet 路线,兼容 Arm 制定的 AMBA CHI(Coherent Hub Interface)接口。Sg028资讯网——每日最新资讯28at.com


图片Sg028资讯网——每日最新资讯28at.com

Sg028资讯网——每日最新资讯28at.com


▲ 128核Veyron V1,主频为3.6GHz、功耗280W时,性能可超越40核英特尔Xeon8380、64核AMD EPYC7763和64核AWS Graviton3,但能否抗衡英特尔第四代Xeon-SP和AMD第四代EPYC就有点存疑。Sg028资讯网——每日最新资讯28at.com


图片Sg028资讯网——每日最新资讯28at.com

▲ Veyron V1的CPU模组使用台积电5纳米制程参考实作:16核心结合48MB L3快取内存(每核心3MB),耗电量约 40W。Sg028资讯网——每日最新资讯28at.com

但有件事不得不提:Veyron V1 看来并没有 SIMD 或向量执行单元,这对上有 AVX-512 的 AMD Zen 4c 会非常吃亏。Sg028资讯网——每日最新资讯28at.com

至于「RISC-V进军数据中心」,Ventana Microsystems 的Veyron V1处理器可谓开了第一枪,但缺乏矢量运算能力的Veyron V1,追求吞吐量应用(如视讯编码器和绘图相关)会非常吃亏,即便下一版Veyron V2补回,RISC-V生态系统依然远不如Arm和x86成熟,必须另外编写软件支持向量扩展。以前Arm试图将自己塑照成x86替代品的过程,就多次面临软件支援难题,RISC-V只会面对更艰巨的挑战。Sg028资讯网——每日最新资讯28at.com

Ventana Microsystems计划是,客户应能在第二季或第三季收到Veyron V1处理器样品,届时就能知道世界首颗数据中心等级RISC-V处理器,究竟有多大能耐。Sg028资讯网——每日最新资讯28at.com

Sg028资讯网——每日最新资讯28at.com



Sg028资讯网——每日最新资讯28at.com


本文链接:http://www.28at.com/showinfo-20-9340-0.htmlHot Chips 2023 :世界首颗面向数据中心的RISC-V 处理器,每周期可解码8条指令

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: SEMI报告:2023年第二季度全球半导体设备出货金额比去年同期下降2%

下一篇: 总规模约3.627亿米!中国移动启动数据线缆产品第二批次集采

标签:
  • 热门焦点
  • 帅气纯真少年!日本最帅初中生选美冠军出炉

    日本第一帅哥初一生选美大赛冠军现已正式出炉,冠军是来自千叶县的宗田悠良。日本一直热衷于各种选美大赛,从“最美JK”起到“最美女星&r
  • 不容错过的MSBuild技巧,必备用法详解和实践指南

    一、MSBuild简介MSBuild是一种基于XML的构建引擎,用于在.NET Framework和.NET Core应用程序中自动化构建过程。它是Visual Studio的构建引擎,可在命令行或其他构建工具中使用
  • 如何正确使用:Has和:Nth-Last-Child

    我们可以用CSS检查,以了解一组元素的数量是否小于或等于一个数字。例如,一个拥有三个或更多子项的grid。你可能会想,为什么需要这样做呢?在某些情况下,一个组件或一个布局可能会
  • 一文搞定Java NIO,以及各种奇葩流

    大家好,我是哪吒。很多朋友问我,如何才能学好IO流,对各种流的概念,云里雾里的,不求甚解。用到的时候,现百度,功能虽然实现了,但是为什么用这个?不知道。更别说效率问题了~下次再遇到,
  • JVM优化:实战OutOfMemoryError异常

    一、Java堆溢出堆内存中主要存放对象、数组等,只要不断地创建这些对象,并且保证 GC Roots 到对象之间有可达路径来避免垃 圾收集回收机制清除这些对象,当这些对象所占空间超过
  • 2023年,我眼中的字节跳动

    此时此刻(2023年7月),字节跳动从未上市,也从未公布过任何官方的上市计划;但是这并不妨碍它成为中国最受关注的互联网公司之一。从2016-17年的抖音强势崛起,到2018年的“头腾
  • 一条抖音4亿人围观 ! 这家MCN比无忧传媒还野

    作者:Hiu 来源:互联网品牌官01 擦边少女空降热搜,幕后推手曝光被网友誉为“纯欲天花板”的女网红井川里予,近期因为一组哥特风照片登上热搜,引发了一场互联网世界关于
  • ESG的面子与里子

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之三伏大幕拉起,各地高温预警不绝,但处于厄尔尼诺大“烤”之下的除了众生,还有各大企业发布的ESG报告。ESG是“环境保
  • 三星Galaxy Z Fold5今日亮相:厚度缩减但仍略显厚重

    据官方此前宣布,三星将于7月26日也就是今天在韩国首尔举办Unpacked活动,届时将带来带来包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy
Top