当前位置:首页 > 科技  > 软件

上下文1.6万token的编程大模型来了!与Stable Diffusion出自同门,一次吃5个Python文件不费劲

来源: 责编: 时间:2023-08-09 23:01:48 186观看
导读一个Stable Diffusion还不够!Stability AI再放杀手锏,进击代码生成领域:推出了一款自称具有革命性的编码工具StableCode。敲重点的是,StableCode不仅支持Python、Go、Java、JavaScript、C、Markdown、C++等多种编程语言。

一个Stable Diffusion还不够!Stability AI再放杀手锏,进击代码生成领域:dvl28资讯网——每日最新资讯28at.com

推出了一款自称具有革命性的编码工具StableCode。dvl28资讯网——每日最新资讯28at.com

敲重点的是,StableCode不仅支持Python、Go、Java、JavaScript、C、Markdown、C++等多种编程语言。dvl28资讯网——每日最新资讯28at.com

还直接把上下文长度拉到16000个token。dvl28资讯网——每日最新资讯28at.com

图片图片dvl28资讯网——每日最新资讯28at.com

好家伙,网友直呼疯批:dvl28资讯网——每日最新资讯28at.com

图片图片dvl28资讯网——每日最新资讯28at.com

这波还直接戳中网友痛点:dvl28资讯网——每日最新资讯28at.com

我们真的很需要一个能够将整个代码库塞进上下文的工具。dvl28资讯网——每日最新资讯28at.com

图片图片dvl28资讯网——每日最新资讯28at.com

上下文窗口16000token

官网显示,StableCode模型具有30亿参数,将提供基础模型、指令模型、长上下文窗口模型三种不同的模型,帮助开发人员编码。dvl28资讯网——每日最新资讯28at.com

图片图片dvl28资讯网——每日最新资讯28at.com

StableCode在HPC(高性能计算)集群上,使用5600亿代码token的编程语言数据集starcoder-data对基础模型进行了训练。dvl28资讯网——每日最新资讯28at.com

StarCoder是HuggingFace和ServiceNow合作成立的开放科学合作组织BigCode于五月份开源的针对代码的大模型。dvl28资讯网——每日最新资讯28at.com

Stability AI首席研究科学家Nathan Cooper对VentureBeat表示:dvl28资讯网——每日最新资讯28at.com

我们非常喜欢BigCode,因为他们在数据治理、模型治理和模型训练方面做了惊人的工作,我们用了他们的数据集,并对其进行了额外的过滤和清理,同时也用在了构建长上下文窗口的模型,在我们的集群上进行了训练。dvl28资讯网——每日最新资讯28at.com

对于复杂的编程任务,StableCode则针对特定用例进行了指令调优。dvl28资讯网——每日最新资讯28at.com

在基础模型的基础上,用约120000个Alpaca格式的“代码指令-回答”对训练了指令模型。dvl28资讯网——每日最新资讯28at.com

图片图片dvl28资讯网——每日最新资讯28at.com

△StableCode指令生成对给定指令响应的代码。

此外,为了满足用户对上下文窗口长度的需求,StableCode的长上下文窗口模型直接将上下文窗口拉长至16000个token,是此前开源模型的2-4倍。dvl28资讯网——每日最新资讯28at.com

△与类似大小的模型(3B)进行的 HumanEval 基准比较。△与类似大小的模型(3B)进行的 HumanEval 基准比较。dvl28资讯网——每日最新资讯28at.com

不仅为用户提供了可单行、多行自动完成建议的工具,还允许用户同时查看编辑相当于五个中等大小的Python文件,允许更专业复杂的代码生成prompt。dvl28资讯网——每日最新资讯28at.com

下面是一个StableCode利用Pytorch深度学习库完成一个相对复杂的Python文件展示(灰色文本显示了StableCode的预测)。dvl28资讯网——每日最新资讯28at.com

图片图片dvl28资讯网——每日最新资讯28at.com

使用了RoPE的方法

此外,StableCode也是用到了Transformer架构,不同于StarCoder用ALiBi(线性偏差的注意力)的方法定位模型输出,StableCode则是使用了RoPE(旋转位置嵌入)的方法。dvl28资讯网——每日最新资讯28at.com

Cooper表示:dvl28资讯网——每日最新资讯28at.com

在Transformer模型中,ALiBi方法倾向于更加重视当前的token,而不是过去的token。这对于代码生成来说不是一个理想的方法,因为代码没有固定的叙述结构,没有明确的开始、中间和结束。代码的功能可以在应用流程的任何点被定义。所以我们使用RoPE,它没有这种偏见。dvl28资讯网——每日最新资讯28at.com

StableCode目前还处于早期阶段,初始发布的目标是观察开发者如何接受和使用这个模型。dvl28资讯网——每日最新资讯28at.com

我们将与社区进行互动合作,看看他们会提出哪些有趣的方向,并针对开发者领域进行生成式探索 。dvl28资讯网——每日最新资讯28at.com

研究主管Christian Laforte也浅聊了StableCode的目标:dvl28资讯网——每日最新资讯28at.com

与Stable Diffusion帮助世界上任何人成为艺术家类似,我们希望StableCode模型能让任何有好点子但却遇到问题的人,能够编写一个解决问题的程序。dvl28资讯网——每日最新资讯28at.com

看到Stability AI再放大招的这波操作,有网友在去测试Github Copilot的路上来了个掉头:dvl28资讯网——每日最新资讯28at.com

图片图片dvl28资讯网——每日最新资讯28at.com

还有网友希望“预定”下一次动作:dvl28资讯网——每日最新资讯28at.com

真的很想看Stability AI在文本转语音方面,做些类似谷歌SoundStorm(声音风暴)的事啊。dvl28资讯网——每日最新资讯28at.com

图片图片dvl28资讯网——每日最新资讯28at.com

此外,StableCode目前已经开源啦!dvl28资讯网——每日最新资讯28at.com

参考链接:
[1]https://venturebeat.com/programming-development/stability-ai-launches-stablecode-an-llm-for-code-generation/
[2]https://twitter.com/StabilityAI/status/1688931312122675200dvl28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-5096-0.html上下文1.6万token的编程大模型来了!与Stable Diffusion出自同门,一次吃5个Python文件不费劲

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 八个 Visual Studio Code 扩展,提升软件开发生产力

下一篇: 透过源码,捋清楚循环依赖到底是如何解决的!

标签:
  • 热门焦点
  • 石头自清洁扫拖机器人G10S评测:多年黑科技集大成之作 懒人终极福音

    石头自清洁扫拖机器人G10S评测:多年黑科技集大成之作 懒人终极福音

    科技圈经常能看到一个词叫“缝合怪”,用来形容那些把好多功能或者外观结合在一起的产品,通常这样的词是贬义词,但如果真的是产品缝合的好、缝合的实用的话,那它就成了中性词,今
  • iPhone卖不动了!苹果股价创年内最大日跌幅:市值一夜蒸发万亿元

    iPhone卖不动了!苹果股价创年内最大日跌幅:市值一夜蒸发万亿元

    8月5日消息,今天凌晨美股三大指数高开低走集体收跌,道指跌0.41%;纳指跌0.36%;标普500指数跌0.52%。热门科技股也都变化极大,其中苹果报181.99美元,跌4.8%,创
  • 2023 年的 Node.js 生态系统

    2023 年的 Node.js 生态系统

    随着技术的不断演进和创新,Node.js 在 2023 年达到了一个新的高度。Node.js 拥有一个庞大的生态系统,可以帮助开发人员更快地实现复杂的应用。本文就来看看 Node.js 最新的生
  • Golang 中的 io 包详解:组合接口

    Golang 中的 io 包详解:组合接口

    io.ReadWriter// ReadWriter is the interface that groups the basic Read and Write methods.type ReadWriter interface { Reader Writer}是对Reader和Writer接口的组合,
  • 微信语音大揭秘:为什么禁止转发?

    微信语音大揭秘:为什么禁止转发?

    大家好,我是你们的小米。今天,我要和大家聊一个有趣的话题:为什么微信语音不可以转发?这是一个我们经常在日常使用中遇到的问题,也是一个让很多人好奇的问题。让我们一起来揭开这
  • 虚拟键盘 API 的妙用

    虚拟键盘 API 的妙用

    你是否在遇到过这样的问题:移动设备上有一个固定元素,当激活虚拟键盘时,该元素被隐藏在了键盘下方?多年来,这一直是 Web 上的默认行为,在本文中,我们将探讨这个问题、为什么会发生
  • 一个注解实现接口幂等,这样才优雅!

    一个注解实现接口幂等,这样才优雅!

    场景码猿慢病云管理系统中其实高并发的场景不是很多,没有必要每个接口都去考虑并发高的场景,比如添加住院患者的这个接口,具体的业务代码就不贴了,业务伪代码如下:图片上述代码有
  • 苹果公司要求三星和LG Display生产「无边框」OLED iPhone显示屏

    苹果公司要求三星和LG Display生产「无边框」OLED iPhone显示屏

    据 The Elec 报道,苹果已要求其供应商为未来的 iPhone 型号开发「无边框」OLED 显示面板。苹果显然已要求三星和 LG Display 开发新的 OLED 显示面
  • 苹果MacBook Pro 2021测试:仍不支持平滑滚动

    苹果MacBook Pro 2021测试:仍不支持平滑滚动

    据10月30日9to5 Mac 消息报道,苹果新的 14 英寸和 16 英寸 MacBook Pro 2021 上市后获得了不错的评价,亮点包括行业领先的性能,令人印象深刻的电池续航,精美丰
Top