当前位置:首页 > 元宇宙 > AI

PyTorch 架构优化库 torchao 正式发布,可大幅提升 AI 模型效率

来源: 责编: 时间:2024-10-05 19:24:56 16观看
导读 10 月 2 日消息,据 PyTorch 新闻稿,PyTorch 旗下架构优化库 torchao 现已正式发布,该优化库主要专注于模型的量化和稀疏性优化,能够在保证性能的同时降低模型的计算成本和 RAM 用量,从而提升模型运行效率,附 GitHub

10 月 2 日消息,据 PyTorch 新闻稿,PyTorch 旗下架构优化库 torchao 现已正式发布,该优化库主要专注于模型的量化和稀疏性优化,能够在保证性能的同时降低模型的计算成本和 RAM 用量,从而提升模型运行效率,附 GitHub 页面地址(点此访问)。civ28资讯网——每日最新资讯28at.com

据介绍,torchao 提供了一系列优化工具集,可以帮助 LLaMA 3等流行的 AI 模型提升性能,其支持 float8、int4 等低精度数据类型,能够有效减少硬件开销和RAM用量。civ28资讯网——每日最新资讯28at.com

civ28资讯网——每日最新资讯28at.com

官方举例,在 LLaMA 3 70B 模型的预训练中,torchao 提供的 float8 训练流程可将模型计算速度提升 1.5 倍。开发者只需利用 convert_to_float8_training 函数,即可将模型训练转换为 float8,从而轻松实现模型高效训练。civ28资讯网——每日最新资讯28at.com

在推理方面,torchao 提供多种量化方法,包括权重量化(Weight-Only Quantization)和动态激活量化(Dynamic Activation Quantization),用户可以自有选择适合的量化策略,以获得最佳的模型推理性能。civ28资讯网——每日最新资讯28at.com

在稀疏性优化方面,torchao 可以优化模型参数计算效率,据称可让 ViT-H 模型的推理速度提升 5%。同时,torchao 还可以将权重量化为 int4,并将键值缓存量化为 int8,可令 LLaMA 3.1 8B 在完整的 128K 上下文长度下仅占用 18.9GB 的显存。civ28资讯网——每日最新资讯28at.com

civ28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-8027-0.htmlPyTorch 架构优化库 torchao 正式发布,可大幅提升 AI 模型效率

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: OpenAI 发布 Realtime API,助力第三方应用集成其语音合成技术

下一篇: 非 Transformer 架构 AI 模型 Liquid 问世,号称性能“凌驾 Meta Llama 微软 Phi”

标签:
  • 热门焦点
  • AI界地震!美国对OpenAI展开调查!监管风暴来袭!

    AI界地震!美国对OpenAI展开调查!监管风暴来袭!

    来源:清元宇宙还记得5月OpenAI在国会山听证会上的自信、坦诚、游刃有余的问答吗?那时的Sam Altman可谓意气风发,在耐心、友好的国会议员面前,就AI立法、大模型安全性问题侃侃而
  • 在元宇宙卖酸奶,这波联动燃爆了!

    在元宇宙卖酸奶,这波联动燃爆了!

    来源:品牌头版 或许,每个人心中都住着一个小馋孩。可能是童年时百吃不厌,觉得新奇又有趣的跳跳糖;可能是味道香甜,咬下一口嘎嘣脆的扁桃仁;还有可能,是某种不知为什么,就是很爱吃的
  • 挖来Meta AR高管,难道苹果也要进军元宇宙?

    挖来Meta AR高管,难道苹果也要进军元宇宙?

    “被曝光”的才是最吸引人的产品,相信有关注过苹果硬件消息的朋友们都明白这样的道理。往近了说有苹果“即将发布”的iPhone SE 3和M2芯片,往远了说有“折叠屏iP
  • 星展银行(DBS)计划推出零售数字资产交易服务

    星展银行(DBS)计划推出零售数字资产交易服务

    2月14日消息,新加坡星展银行CEO Piyush Gupta在财报会议上表示,计划于2022年年底前推出零售数字资产交易服务。据悉,DBS于2021年初开设了机构数字资产交易平台,全
  • 城市数字孪生标准化白皮书(2022版)

    城市数字孪生标准化白皮书(2022版)

    当前,城市数字孪生已经发展成为支撑智慧城市的重要技术手段。城市数字孪生通过在数字空间对城市物理空间和社会空间进行全要素表达、全过程呈现、全周期可溯,实
  • Web3 去中心化身份管理系统的历史、现状与展望

    Web3 去中心化身份管理系统的历史、现状与展望

    身份、数字资产和在线资料的映射最近在区块链行业获得了极大的关注。新技术正在形成架构,这将进一步为去中心化和以用户为中心的机制铺平道路。本文将讨论以下
  • NFT艺术家Hayley Rincon 专访:我的迷幻数字艺术之路

    NFT艺术家Hayley Rincon 专访:我的迷幻数字艺术之路

    Hayley Rincon是一位令人印象深刻才华横溢的创作者,她的作品呈现出迷幻的气息。今天就来聊聊她的艺术作品,和她自己的数字艺术之路。Hayley是加利福尼亚湾区的有
  • 扎克伯格演示了一种“造物主”式的元宇宙语音机器人工具

    扎克伯格演示了一种“造物主”式的元宇宙语音机器人工具

    前身为Facebook的Meta公司今天展示了一个人工智能系统的Demo,该系统使人们能够通过语音命令生成或导入虚拟世界中的事物。该公司认为这个被称为 "Builder Bot "
  • NFT世界的艺术家名单

    NFT世界的艺术家名单

    我们汇编了以下艺术家的名单,它包括每个艺术家的简短概述。当然,这份名单肯定不全面,还有很多很多艺术家、哲学家和商业领袖为世界贡献了不可估量的价值。而他们
Top