随着生成式AI的崛起,GPU算力需求持续增长。然而,高昂的GPU价格和供不应求的市场环境给许多企业和研究机构带来了挑战。为了解决这一问题,AWS近日推出了一项创新服务——「亚马逊弹性运算云(EC2)机器学习容量区块」(Amazon Elastic Compute Cloud Capacity Blocks for ML),允许客户在需要的时候租用GPU算力,以执行特定的AI相关任务。
这项新的服务让客户能够预约NVIDIA H100 Tensor Core GPU实例,并在EC2 UltraCluster中获取低延迟、高吞吐量的连接,以便进行分散式训练。客户可以根据需要灵活地安排GPU算力的使用时间点以及时数,从而降低整体费用。
这项服务特别适合那些只需要在少数工作中使用到昂贵的GPU资源的情况。通过EC2容量区块,客户可以在1到14天内保留GPU算力容量,从1个到64个丛集,每个丛集配置8颗GPU(最高为512颗GPU),从而可以灵活地执行各种AI工作负载。
该服务最早可提前8周预约,并已在亚马逊的美国东部(俄亥俄州)区域推出。这项服务的推出不仅能帮助客户降低成本,同时也为AWS提供了将GPU资源效率最大化的机会,确保了相关的营收。然而,这些GPU资源的价格将根据实际的供需情况动态浮动。
AWS新的GPU租赁服务为那些需要执行AI工作负载但又面临GPU价格和供应挑战的客户提供了新的选择。通过按需租赁GPU算力,客户可以更灵活地满足其特定需求,同时降低了整体费用。
本文链接:http://www.28at.com/showinfo-27-25505-0.htmlAWS推出GPU租赁服务:降低AI工作负载成本
声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com
下一篇: 蓝队竞技启动:半导体和金融等行业参与其中