当前位置:首页 > 科技  > 芯片

AI GPU 变得更加“饥饿”:功耗之谜与挑战

来源: 责编: 时间:2023-11-28 09:32:57 316观看
导读近年来,人工智能数据中心的能耗问题引起广泛关注。这一现象的主要原因之一是由于人工智能工作负载的不断增加,人工智能GPU和处理器的迅速发展,以及其他硬件需求的提高。在此过程中,人工智能GPU功耗的飙升引人注目,例如,2022

近年来,人工智能数据中心的能耗问题引起广泛关注。这一现象的主要原因之一是由于人工智能工作负载的不断增加,人工智能GPU和处理器的迅速发展,以及其他硬件需求的提高。YWC28资讯网——每日最新资讯28at.com


YWC28资讯网——每日最新资讯28at.com

在此过程中,人工智能GPU功耗的飙升引人注目,例如,2022年的H100功耗高达700W,相较于Nvidia 2020年的A100,增加了近一倍。AI服务器不仅运行高功耗的GPU,还需要处理电力的CPU和网卡。YWC28资讯网——每日最新资讯28at.com


YWC28资讯网——每日最新资讯28at.com

AI工作负载,尤其是与训练相关的负载,对计算资源有巨大需求,包括配备AI GPU、专用ASIC或CPU的服务器。人工智能集群的规模取决于模型的复杂性和规模,对功耗起着主导作用。更庞大的人工智能模型需要更多的GPU,从而增加了总体能源需求。例如,一个拥有22,000个H100 GPU的集群使用700个机架,总密度为80 kW,需要约31兆瓦的电力,不包括冷却等基础设施需求。YWC28资讯网——每日最新资讯28at.com


YWC28资讯网——每日最新资讯28at.com

这些集群和GPU通常在整个训练过程中几乎满负荷运行,确保平均能耗几乎与峰值功耗相同。机架密度在30kW到100kW之间,具体取决于GPU的数量和型号。YWC28资讯网——每日最新资讯28at.com


YWC28资讯网——每日最新资讯28at.com

网络延迟在人工智能数据中心的功耗中也起着至关重要的作用。支持分布式训练过程中强大GPU所需的高速数据通信,对复杂的网络基础设施至关重要。对高速网络电缆和基础设施的需求进一步增加了总体能耗。YWC28资讯网——每日最新资讯28at.com


YWC28资讯网——每日最新资讯28at.com

考虑到人工智能工作负载对ASIC、GPU、CPU、网卡和SSD的高耗电需求,冷却成为一项严峻挑战。高机架密度和计算中产生的巨大热量使得有效的冷却解决方案至关重要。然而,空气和液体冷却方法的高成本也对用于人工智能工作负载的数据中心的功耗产生重大影响。YWC28资讯网——每日最新资讯28at.com


YWC28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-27-34391-0.htmlAI GPU 变得更加“饥饿”:功耗之谜与挑战

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 印度平板电脑出货量Q3环比增长41%

下一篇: 晶片业迎DDR5时代,厂商迎战记忆体需求潮

标签:
  • 热门焦点
  • 直屏旗舰来了 iQOO 12和K70 Pro同台竞技

    旗舰机基本上使用的都是双曲面屏幕,这就让很多喜欢直屏的爱好者在苦等一款直屏旗舰,这次,你们等到了。据博主数码闲聊站带来的最新爆料称,Redmi下代旗舰K70 Pro和iQOO 12两款手
  • 三言两语说透设计模式的艺术-简单工厂模式

    一、写在前面工厂模式是最常见的一种创建型设计模式,通常说的工厂模式指的是工厂方法模式,是使用频率最高的工厂模式。简单工厂模式又称为静态工厂方法模式,不属于GoF 23种设计
  • 摸鱼心法第一章——和配置文件说拜拜

    为了能摸鱼我们团队做了容器化,但是带来的问题是服务配置文件很麻烦,然后大家在群里进行了“亲切友好”的沟通图片图片图片图片对比就对比,简单对比下独立配置中心和k8s作为配
  • 使用LLM插件从命令行访问Llama 2

    最近的一个大新闻是Meta AI推出了新的开源授权的大型语言模型Llama 2。这是一项非常重要的进展:Llama 2可免费用于研究和商业用途。(几小时前,swyy发现它已从LLaMA 2更名为Lla
  • 这款新兴工具平台,让你的电脑效率翻倍

    随着信息技术的发展,我们获取信息的渠道越来越多,但是处理信息的效率却成为一个瓶颈。于是各种工具应运而生,都在争相解决我们的工作效率问题。今天我要给大家介绍一款效率
  • 使用Webdriver-manager解决浏览器与驱动不匹配所带来自动化无法执行的问题

    1、前言在我们使用 Selenium 进行 UI 自动化测试时,常常会因为浏览器驱动与浏览器版本不匹配,而导致自动化测试无法执行,需要手动去下载对应的驱动版本,并替换原有的驱动,可能还
  • 为什么你不应该使用Div作为可点击元素

    按钮是为任何网络应用程序提供交互性的最常见方式。但我们经常倾向于使用其他HTML元素,如 div span 等作为 clickable 元素。但通过这样做,我们错过了许多内置浏览器的功能。
  • 当家的盒马,加速谋生

    来源 | 价值星球Planet作者 | 归去来自己“当家”的盒马,开始加速谋生了。据盒马官微消息,盒马计划今年开放生鲜供应链,将其生鲜商品送往食堂。目前,盒马在上海已经与
  • 华为发布HarmonyOS 4:更好玩、更流畅、更安全

    在8月4日的华为开发者大会2023(HDC.Together)大会上,HarmonyOS 4正式发布。自2019年发布以来,HarmonyOS一直以用户为中心,经历四年多的发展HarmonyOS已
Top