当前位置：首页 > 元宇宙 > AI

70B 模型秒出 1000token，代码重写超越 GPT-4o，来自 OpenAI 投资的代码神器 Cursor 团队

来源：责编：时间：2024-05-21 09:03:28 342观看

导读 70B 模型，秒出 1000token，换算成字符接近 4000！研究人员将 Llama3 进行了微调并引入加速算法，和原生版本相比，速度足足快出了快了 13 倍！不仅是快，在代码重写任务上的表现甚至超越了 GPT-4o。这项成果，来自爆火的 AI

70B 模型，秒出 1000token，换算成字符接近 4000！

研究人员将 Llama3 进行了微调并引入加速算法，和原生版本相比，速度足足快出了快了 13 倍！

不仅是快，在代码重写任务上的表现甚至超越了 GPT-4o。

这项成果，来自爆火的 AI 编程神器 Cursor 背后团队 anysphere，OpenAI 也参与过投资。

要知道在以快著称的推理加速框架 Groq 上，70B Llama3 的推理速度也不过每秒 300 多 token。

Cursor 这样的速度，可以说是实现了近乎即时的完整代码文件编辑。

有人直呼好家伙，如果把 Cursor 魔改后的 Llama3 放到 Groq 上，是不是每秒能跑出上万 token 了。

更是有人激动地说，在大模型领域，我们正在消除“延时”这一概念。

引入全新推理加速算法

作者此次设计的加速方法，主要是用来解决一种名为“Fast Apply”的任务，即对代码内容进行快速修改并应用。

首先需要说明的是，虽然说任务最终实现的效果是代码的局部修改，但是实际操作过程中，输出并非是只有变化的内容，而是直接全局重写。

这样做的原因，是团队在预先测试后做出的选择 —— 他们发现，除了 Claude-3-Opus，大多数模型在真・局部修改任务上的表现都不理想。

之所以会这样，主要有以下三个原因：

首先是直接重写时会输出更多 token，使得有更多的前向传递来确定正确的解决方案。

其次，模型的训练数据也大部分都是完整代码，对局部修改相对陌生。

此外，大模型糟糕的数学运算也无法保证能在输出差异时正确处理行号。

（不过作者认为这仍然是一个有潜力的未来研究方向。）

确定了采用全局重写的方案后，Cursor 团队使用了任务相关的数据对 Llama3 进行了微调。

所采用的数据有真实编辑数据与合成数据两大来源，按照 1:4 的比例进行了混合。

其中合成数据是指用 GPT-4 生成代码编辑的建议，然后用其他模型将这些建议“应用”到原始代码上。

为了提高数据集的质量，作者还对小文件、重复文件和无变化样本进行了下采样。

为了评估这些模型的表现，作者让它们处理了 450 个代码编辑任务（每个都不超过 400 行），并用 Claude3-Opus 对输出进行了打分。

最终，作者微调出的 70B Llama3 模型，表现几乎与 Claude3-Opus-diff 匹配，并且优于 GPT-4-Turbo 和 GPT-4o。

至此的微调解决了性能问题，但不难看出此时的 Llama3 速度依然很慢，每秒只能输出不到 300 个字符（注意是字符，不是词也不是 token）。

而让改写工作快到飞起的，还有另一项秘密武器。

针对代码改写任务，Cursor 团队专门引入了一种名为预测性编辑（speculative edits）的算法。

这种方式用一种先验算法来对多个后续 token 进行预测，然后再用本体大模型进行验证，降低了大模型的调用次数，从而减轻了运算量。

这种先验算法来自于代码任务的一个特点 —— 相比于其他文本，其词表更小，且语法结构、缩进规则等拥有更高的确定性，利用先验知识可以更精准预测未来的 token。

这样的做法也与 GPT-4 和 Meta 有着共通之处 ——

传统的语言模型推理推理速度较慢的原因，主要是预测下一个 token 的过程通常是自回归的，即模型在生成每个 token 时，都要考虑之前生成的所有 token。

为了降低运算量，以 GPT-4 为代表的大模型，使用了名为预测解码（speculative decoding）的加速算法，通过小的近似模型提前进行预测，然后再让本体大模型对预测结果进行验证。

Cursor 和 GPT-4 的区别就在于，前者的小“模型”是一种更确定的算法，而后者只是模型规模减小，本质上仍是概率预测。

Meta 这边则是推出了一次性预测多个后续 token 的算法，用 n 个独立的输出头并行预测 n 个未来 token，结果发现在编程任务上表现尤其优异，原因是由于编程语言的逻辑结构更严谨，知识的内在联系更紧密。

当然，Cursor 对这种特点利用更为充分，没有用注意力头，而是直接拿更确定的算法来做多 token 预测。

最终的结果就是，预测算法为 70B 的 Llama3 带来了近 13 倍的速度提升，而测评表现没有任何损失。

此外，作者还与企业 AI 模型基础设施平台 fireworks.ai 合作，利用其优化的推理引擎和定制化的硬件环境，进一步提高了模型的运行效率。

未来，团队还计划进行知识蒸馏，并把预测编辑算法迁移到更小的 8B Llama3，并扩展到更多的编程语言和任务。

同时，对于 Cursor 团队研究过但并未采用的真・局部修改（Diff）算法，作者也计划进行改进。

One More Thing

在实验当中，作者不仅用预测算法加速了 Llama3，也实现了对 GPT4-Turbo 的加速。

不过作者并没有介绍具体在 GPT 当中如何实现，而是留做了思考题，还搞了一场“有奖竞猜”。

能够正确解答的人将获得 1 个月的 Cursor 会员；如果能在 vllm 和 TensorRT-LLM 中实现预测加速，将分别获得半年和一年的会员。

如果你感觉有思路的话，不妨挑战试试（手动狗头）。

参考链接：

https://cursor.sh/blog/instant-apply#user-content-fnref-feel-difference

本文来自微信公众号：量子位（ID：QbitAI），作者：克雷西

本文链接：http://www.28at.com/showinfo-45-4331-0.html70B 模型秒出 1000token，代码重写超越 GPT-4o，来自 OpenAI 投资的代码神器 Cursor 团队

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：文生图 AI 巨头 Stability AI 被曝欠下近 1 亿美元，正与投资者洽谈融资事宜

下一篇：中国电信已在上海建成单集群的万卡智算资源池，智算规模达 13EFLOPS

标签：

热门焦点

元娲2.7上线：虚拟人视频制作速度疯狂翻倍！

来源：清元宇宙炎炎夏日努力工作的Q仔的电脑都冒烟儿啦～今天要给大家介绍两个新小伙伴——小元和小娲，他们将给大家解读元娲2.7版本重磅更新内容～大家掌声欢迎～～～本次更
这场虚拟人争夺战，互联网巨头下场先赢一半？

撰文/ 孟会缘近两年间，要论引得无数互联网巨头竞折腰的一大热门产业，莫过于元宇宙领域中的数字人了。作为继数字藏品之后，开发元宇宙的又一重点落地项目，互联网
刷完一场元宇宙世界杯音乐盛典，我爽了

作者|刘小土编辑|李春晖你有多久没完整追过一场音乐盛典了？三刷都不嫌多的那种。按照惯例，每逢年底，直播、长短视频、音乐平台便会抢着端上来几场音乐盛典。搁以
在数字世界再造世界杯，元宇宙体育正变得越来越丰满

撰文/ 葱鲔鱼本届世界杯可能不是最精彩的一届，却绝对是看点十足的一届：后疫情时代的首届世界杯、耗资2200亿美元打造的“史上最贵”世界杯、足坛黄金
2022年6款最佳的NFT稀有度查询工具

NFT正在风靡全球，但拥有一个你自认为看起来很酷的 NFT 是不够的，因为它还应该是稀有的，稀有度会影响每个 NFT 的价值。因此，如果您打算投资 NFT，则需要使用 NFT 稀
2022年元宇宙系列报告：UGC当道，XR带来新交互体验

UGC作为元宇宙的主要内容创作模式，已经越来越多的呈现于游戏、娱乐、社交、传媒等方面，UGC模式勾勒了元宇宙的边界，现今元宇宙UGC模式的主要呈现方式以元宇宙概念
重温 1602 年：DAO 是新的企业范式吗？

作者：Andrew Singer“ 将你的选票委托给行业有能力的专家，将使所有者在这些公司的管理中拥有更强大、更清晰的话语权。”1602 年，荷兰东印度公司成立，许多人认为
数字经济、数据要素与数字治理

深入理解数字经济与数据要素，有利于更准确理解和把握数字治理的基本规律，构建面向未来的健康的数字治理体系，也才能更好地理解元宇宙的治理框架。一、数字经济
暴涨100倍的NFT worlds 会是未来元宇宙的雏形吗？

NFT Worlds 系列产品于 2021 年 10 月 5 日免费铸造，该NFT系列是将传统的中心化电子游戏minecraft 与去中心化资产相结合。传统游戏Minecraft 对用户定制非常开

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

70B 模型秒出 1000token，代码重写超越 GPT-4o，来自 OpenAI 投资的代码神器 Cursor 团队

元娲2.7上线：虚拟人视频制作速度疯狂翻倍！

这场虚拟人争夺战，互联网巨头下场先赢一半？

刷完一场元宇宙世界杯音乐盛典，我爽了

在数字世界再造世界杯，元宇宙体育正变得越来越丰满

2022年6款最佳的NFT稀有度查询工具

2022年元宇宙系列报告：UGC当道，XR带来新交互体验

重温 1602 年：DAO 是新的企业范式吗？

数字经济、数据要素与数字治理

暴涨100倍的NFT worlds 会是未来元宇宙的雏形吗？

最新推荐

元宇宙里掀起回忆杀？这波虚拟怀旧营销主打一个极限反差

中国区块链产业生态地图报告（2021）

餐桌上怎么变出元宇宙？

Kitten Coup社区反转Cool Kittens NFT骗局

权限风波过后 X2Y2如何挑战OpenSea？

初探元宇宙

猜你喜欢

热门推荐

相关资讯