当前位置：首页 > 元宇宙 > AI

大模型时代：算力浪费竟超50%！百度AI计算部负责人揭秘算力成本之谜

来源：责编：时间：2024-09-15 15:17:19 202观看

导读【ITBEAR】9月15日消息，在AI大模型时代，算力成本已成为业界关注的焦点。百度系统架构师、百度智能云AI计算部负责人王雁鹏近日分享了关于如何有效降低万卡集群算力开支的见解，提出了五大解决方案。王雁鹏指出，随着深度学

【ITBEAR】9月15日消息，在AI大模型时代，算力成本已成为业界关注的焦点。百度系统架构师、百度智能云AI计算部负责人王雁鹏近日分享了关于如何有效降低万卡集群算力开支的见解，提出了五大解决方案。

王雁鹏指出，随着深度学习技术的不断发展，GPU集群规模已达万卡级别，这使得大模型时代的算力成本远超人力成本。为了应对这一挑战，他提出了包括搭载RDMA网络、采用自动并行策略、确保训练稳定性、动态分配算力以及实现多芯异构混训在内的五大策略。

据ITBEAR了解，RDMA网络的应用在AI集群中显得尤为重要。与传统的IB网络相比，RDMA网络更适合AI集群的需求，它优先考虑吞吐量而非延迟，从而有效提升了AI集群的带宽有效率和模型性能。

此外，王雁鹏还强调了自动并行策略在AI集群演进中的重要性。通过采用“边计算边通信”的方式和显存优化的切分策略，百度成功提高了模型性能，甚至超越了开源模型和人工调优模型的效果。

在谈到训练稳定性时，王雁鹏表示，稳定不间断的任务运行对于AI训练至关重要。百度通过一系列技术手段，如Hang检测、慢节点检测等，确保了文心一言大模型的有效训练时长比例超过99%。

针对资源利用率问题，王雁鹏提出了训练一体的解决方案。通过动态分配算力流量和资源，百度百舸异构计算平台成功将资源利用率从50%提升至90%，从而有效应对了主流模型训练中的劣势。

最后，王雁鹏探讨了多芯异构混训在解决算力卡脖子问题中的关键作用。他提出，通过搭建跨芯沟通库和采用Accelerator抽象设计方法，百度实现了在千卡和万卡规模下性能损失的最小化。

展望未来，王雁鹏透露百度将继续在三个核心技术上寻求突破：实现更高效的拓扑和拥塞控制、扩大跨地域RDMA网络范围以及进一步提升训练故障恢复速度。这些技术突破将为百度在未来十万卡级别的AI集群竞争中占据有利地位提供有力支持。

关键词：#百度# #AI大模型# #算力成本# #RDMA网络# #多芯异构混训#

本文链接：http://www.28at.com/showinfo-45-7221-0.html大模型时代：算力浪费竟超50%！百度AI计算部负责人揭秘算力成本之谜

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇： Xbox遭遇挫折，XGP业务受困，微软游戏未来如何破局？

下一篇：马斯克放大招：三个月打造全球最大GPU集群，竟还嫌不够？再加10万个！

标签：

热门焦点

中文在线的“元宇宙”故事，资本听腻了？

被誉为“元宇宙”龙头之一的中文在线，这下尴尬了。2022年1月11日，中国移动通信联合会元宇宙产业委员会揭牌，接纳涉足“元宇宙”的8家上市公司，包括中青宝、天下秀
米哈游推出元宇宙品牌；VR/AR老牌企业当红齐天完成B轮+融资

今日热点：苹果AR/VR头显的FaceTime或基于Memojis和SharePlay构建而成；VR/AR老牌企业当红齐天完成B轮+融资；米哈游推出元宇宙品牌HoYoverse；国产VR射击游戏《Contra
2021年中国智慧城市行业概览：AI慧眼独具，赋能“双碳”目标

中国智慧城市试点项目主要集中于东南地区以及华中地区，受制于应用场景分散以及行业地域建设差异，目前中国智慧城市存在较多弊端，未来数量有望持续突破。中国智慧
Meta、谷歌、微软竞相涌入元宇宙，小型企业该如何伺机而动？

目前来看元宇宙不会影响到小型企业的发展，但在接下来的十年内可能会发生很多变化。很多有商业头脑的企业家都在密切关注着元宇宙的发展。元宇宙这个词，你一定或
索尼公布PSVR 2头显渲染图；社区开发者发布Quest版《我的世界》

近日热点：索尼正式公布PSVR 2头显及控制器官方渲染图；入局元宇宙，鸿海科技与XRSPACE签订合作备忘录；研究人员表示面部追踪可增强VR操控体验；社区开发者QuestCraft发
2022年元宇宙系列报告：UGC当道，XR带来新交互体验

UGC作为元宇宙的主要内容创作模式，已经越来越多的呈现于游戏、娱乐、社交、传媒等方面，UGC模式勾勒了元宇宙的边界，现今元宇宙UGC模式的主要呈现方式以元宇宙概念
头顶光环无数却估值极低，以太坊这位&——quot;最强杀手&——quot;有望涅槃重生？

作者：五火球教主提起Dfinity（ICP），你的第一感觉可能与我一样，这是一个让人十分纠结的项目。之所以纠结，一方面他的团队阵容强大，各种来自前英特尔、IBM、coinbase、fa
a16z：元宇宙办公会取代实体办公室吗？

6位不同的专家对未来的工作发表看法----元宇宙--沉浸式的、基于区块链的虚拟世界，大多数日常活动最终会在这里发生--但仍然只是一个概念。但它是一个拥有宝贵不
解决NFT流动性问题：一文了解Floor DAO

流动性是证券市场上的一个术语，流动性是指资产在不影响其市场价格的情况下可以转换为现成现金的效率，流动性最强的资产是现金本身。现在让我们试着从流动性的角

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

大模型时代：算力浪费竟超50%！百度AI计算部负责人揭秘算力成本之谜

中文在线的“元宇宙”故事，资本听腻了？

米哈游推出元宇宙品牌；VR/AR老牌企业当红齐天完成B轮+融资

2021年中国智慧城市行业概览：AI慧眼独具，赋能“双碳”目标

Meta、谷歌、微软竞相涌入元宇宙，小型企业该如何伺机而动？

索尼公布PSVR 2头显渲染图；社区开发者发布Quest版《我的世界》

2022年元宇宙系列报告：UGC当道，XR带来新交互体验

头顶光环无数却估值极低，以太坊这位&——quot;最强杀手&——quot;有望涅槃重生？

a16z：元宇宙办公会取代实体办公室吗？

解决NFT流动性问题：一文了解Floor DAO

最新推荐

欧盟人工智能法案：四种AI系统风险类型的划分及监管措施

上、中、下游加深融合，搭建元宇宙产业全景

元宇宙是推动NFT发展的初始家园

重温 1602 年：DAO 是新的企业范式吗？

NFT教育要从娃娃抓起！这些青少年艺术家已经赚取了几千万美金

TX加入的NFT数字收藏品，元宇宙的破圈之路?

猜你喜欢

热门推荐

相关资讯