当前位置:首页 > 科技  > 芯片

Akamai推出AI推理解决方案,性能提升显著

来源:icspec 责编: 时间:2025-04-18 06:51:48 172观看
导读Akamai宣布推出一款名为Akamai Cloud Inference的战略级AI推理解决方案。该方案基于其全球分布式云平台打造,与传统超大规模云架构相比,其吞吐量提升3倍,延迟降低60%,成本减少86%。Akamai云技术部门首席运营官兼总经理Ada
Akamai宣布推出一款名为Akamai Cloud Inference的战略级AI推理解决方案。该方案基于其全球分布式云平台打造,与传统超大规模云架构相比,其吞吐量提升3倍,延迟降低60%,成本减少86%。
Akamai云技术部门首席运营官兼总经理Adam Karon表示,训练类似于绘制地图,需要集中式超算中心;而推理则更像实时导航,必须在靠近用户的边缘完成。据Gartner数据,2025年约75%的数据将产生于传统云区域之外,传统云架构在响应速度和数据传输成本方面已显不足。
Akamai Cloud Inference依托覆盖130个国家、4200多个节点的分布式网络,构建了独特的“云-边协同”架构。通过与NVIDIA、VAST Data等生态伙伴合作,该方案整合了GPU加速计算、向量数据库实时检索以及WebAssembly边缘执行的完整技术栈。
该解决方案创新性地结合了CPU、GPU和定制化ASIC VPU,根据不同推理场景动态分配资源。同时,Akamai与NVIDIA AI Enterprise生态系统深度整合,利用Triton、TAO Toolkit、TensorRT和NVFlare优化NVIDIA GPU上的AI推理性能。
此外,Akamai通过VAST Data实时数据访问、可扩展对象存储及Aiven/Milvus向量数据库技术,构建了支持检索增强生成(RAG)的智能数据架构,实现了微调模型的安全存储与全球范围内的低延迟AI推理。
Akamai还通过Linode Kubernetes Engine企业版与新发布的Akamai App平台,集成了KServe、Kubeflow等开源工具,构建了支持PB级性能自动扩展的容器化AI推理平台,并优化了混合多云部署和成本控制。
据悉,Akamai与Fermyon等Wasm供应商合作,将WebAssembly技术集成到无服务器架构中,使开发者能够在边缘端执行轻量化LLM推理,为延迟敏感型应用提供支持。

本文链接:http://www.28at.com/showinfo-27-145221-0.htmlAkamai推出AI推理解决方案,性能提升显著

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: TrendForce:国际形势变化将推动2Q25存储器合约价涨幅扩大

下一篇: 韩国AI初创公司RLWRLD获1500万美元融资

标签:
  • 热门焦点
  • K60 Pro官方停产 第三方瞬间涨价

    虽然没有官方宣布,但Redmi的一些高管也已经透露了,Redmi K60 Pro已经停产且不会补货,这一切都是为了即将到来的K60 Ultra铺路,属于厂家的正常操作。但有意思的是该机在停产之后
  • 女孩租房开2小时空调用完100元电费引热议:5级能耗惹不起 月薪过万电费也交不起

    近日,江苏苏州一女孩租房当天充值了100元电费,开着空调不到2小时发现电费已用完。对于为什么这个快,房东表示,电表坏了这种情况很多,之前也遇到过,给租客换
  • 得物效率前端微应用推进过程与思考

    一、背景效率工程随着业务的发展,组织规模的扩大,越来越多的企业开始意识到协作效率对于企业团队的重要性,甚至是决定其在某个行业竞争中突围的关键,是企业长久生存的根本。得物
  • 破圈是B站头上的紧箍咒

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之每年的暑期档都少不了瞄准追剧女孩们的古偶剧集,2021年有优酷的《山河令》,2022年有爱奇艺的《苍兰诀》,今年却轮到小破站抓住了追
  • 得物宠物生意「狂飙」,发力“它经济”

    作者|花花小萌主近日,得物宣布正式上线宠物鉴别,通过得物App内的“在线鉴别”,可找到鉴别宠物的选项。通过上传自家宠物的部位细节,就能收获拥有专业资质认证的得物鉴
  • 品牌洞察丨服务本地,美团直播成效几何?

    来源:17PR7月11日,美团App首页推荐位出现“美团直播”的固定入口。在直播聚合页面,外卖“神枪手”直播间、美团旅行直播间、美团买菜直播间等均已上线,同时
  • 阿里大调整

    来源:产品刘有媒体报道称,近期淘宝天猫集团启动了近年来最大的人力制度改革,涉及员工绩效、层级体系等多个核心事项,目前已形成一个初步的“征求意见版”:1、取消P序列
  • AI芯片初创公司Tenstorrent获三星和现代1亿美元投资

    Tenstorrent是一家由芯片行业资深人士Jim Keller领导的加拿大初创公司,专注于开发人工智能芯片,该公司周三表示,已经从现代汽车集团和三星投资基金等
  • 世界人工智能大会国际日开幕式活动在世博展览馆开启

    30日上午,世界人工智能大会国际日开幕式活动在世博展览馆开启,聚集国际城市代表、重量级院士专家、国际创新企业代表,共同打造人工智能交流平台。上海市副市
Top