当前位置:首页 > 科技  > 软件

综合性能全面提升,书生・浦语 2.0 在阿里云魔搭开源首发

来源: 责编: 时间:2024-01-18 17:31:33 173观看
导读 1 月 17 日,上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式发布新一代大语言模型书生・浦语 2.0(InternLM2),模型开源可免费授权商用。该模型在阿里云魔搭社区(ModelScope)上首发。InternLM2 的核心

1 月 17 日,上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式发布新一代大语言模型书生・浦语 2.0(InternLM2),模型开源可免费授权商用。该模型在阿里云魔搭社区(ModelScope)上首发。bLk28资讯网——每日最新资讯28at.com

InternLM2 的核心理念在于回归语言建模的本质,致力于通过提高语料质量及信息密度,实现模型基座语言建模能力获得质的提升,进而在数理、代码、对话、创作等各方面都取得长足进步,综合性能达到同量级开源模型的领先水平。bLk28资讯网——每日最新资讯28at.com

InternLM2 在 2.6 万亿 token 的高质量语料上训练得到。沿袭第一代书生・浦语(InternLM)的设定,InternLM2 包含 7B 及 20B 两种参数规格及基座、对话等版本,满足不同复杂应用场景需求。秉持“以高质量开源赋能创新”理念,上海 AI 实验室继续提供 InternLM2 免费商用授权。bLk28资讯网——每日最新资讯28at.com

阿里云魔搭社区已开设书生・浦语“模型品牌馆”专页,聚合该系列所有模型及体验接口,并推出了相关最佳实践教程,提前跑通模型的部署、推理和微调流程供开发者快速上手。在魔搭社区书生・浦语 2 模型页,开发者还可点击“Notebook 快速开发”,一键拉起阿里云人工智能平台 PAI,在云上对模型进行快速开发和部署。bLk28资讯网——每日最新资讯28at.com

bLk28资讯网——每日最新资讯28at.com

▲魔搭社区书生・浦语 2 模型页截图

魔搭社区开源地址bLk28资讯网——每日最新资讯28at.com

魔搭书生・浦语 2.0 最佳实践bLk28资讯网——每日最新资讯28at.com

此前 9 月,书生・浦语 InternLM-20B 开源也以魔搭社区作为首发平台。作为国内规模最大的 AI 模型社区,魔搭聚集了国内头部人工智能机构贡献的 2700 多款 AI 模型,并成为诸多顶尖大模型的首发阵地。在魔搭上,开发者可一站式进行模型体验、下载、推理、调优、定制,并可调用阿里云免费算力,目前魔搭上开发者超过 360 万,模型下载量已破亿。bLk28资讯网——每日最新资讯28at.com

回归语言建模本质,筑牢大模型能力基础bLk28资讯网——每日最新资讯28at.com

上海 AI 实验室联合团队研究认为,对于大模型的研究应回归语言建模本质,通过更高质量的语料以及更高的信息密度,筑牢大模型能力基础。bLk28资讯网——每日最新资讯28at.com

为此,联合团队提出了新一代的数据清洗过滤技术,发展了多维度数据价值评估、高质量语料驱动的数据富集、针对性的数据补齐等方面的技术方法。bLk28资讯网——每日最新资讯28at.com

目前,InternLM 背后的数据清洗过滤技术经历三轮迭代升级,使用约 60% 训练数据即可达到使用第二代数据训练 1T token 的表现,模型训练效率大幅提升。bLk28资讯网——每日最新资讯28at.com

A graph of a number of dataDescription automatically generated with medium confidencebLk28资讯网——每日最新资讯28at.com

▲第三代数据清洗过滤技术大幅度提升模型训练效率

基于第三代数据清洗过滤技术,InternLM2 语言建模能力显著增强。bLk28资讯网——每日最新资讯28at.com

支持 200K 超长上下文,实现长文本中“大海捞针”bLk28资讯网——每日最新资讯28at.com

长语境输入及理解能力能显著拓展大模型的应用场景,然而,大模型有限的上下文长度仍为学界及业界的重要难题。bLk28资讯网——每日最新资讯28at.com

通过拓展训练窗口大小和改进位置编码,InternLM2 支持 200K token 的上下文,能够一次性接受并处理约 30 万汉字(约五六百页的文档)的输入内容,准确提取关键信息,实现长文本中“大海捞针”。bLk28资讯网——每日最新资讯28at.com

bLk28资讯网——每日最新资讯28at.com

▲InternLM2“大海捞针”试验效果

性能全面提升,综合能力领先的开源模型bLk28资讯网——每日最新资讯28at.com

研究人员定义了语言、知识、推理、数学、代码、考试等六个能力维度,在 55 个主流评测集上对多个同量级模型的表现进行了综合评测。结果显示,InternLM2 的 7B 及 20B 版本性能在同量级模型中表现优异。在典型测试集上,InternLM2 只用 20B 参数的中等规模,即在整体表现上达到与 ChatGPT 比肩的水平。bLk28资讯网——每日最新资讯28at.com

bLk28资讯网——每日最新资讯28at.com

▲InternLM2 与 ChatGPT 的评测结果对比

与此同时,综合性能增强带来下游任务全方位能力提升。bLk28资讯网——每日最新资讯28at.com

优秀的对话和创造体验bLk28资讯网——每日最新资讯28at.com

研究测试表明,InternLM2-Chat 可精准理解和遵循用户意图,具备较强的共情能力和丰富的结构化创作能力。bLk28资讯网——每日最新资讯28at.com

bLk28资讯网——每日最新资讯28at.com

▲InternLM2 能够在对话中与用户“共情”

进行课程大纲等结构化创作时,InternLM2 可精准遵循用户提出的格式、数量、内容等要求;编写《流浪地球 3》剧本时,InternLM2 具备丰富的合理想象,如外星遗迹、量子纠缠的引入等,同时故事表现了人类面对危机时的勇气和团结精神。bLk28资讯网——每日最新资讯28at.com

工具调用能力整体升级bLk28资讯网——每日最新资讯28at.com

基于更强大、更具泛化性的指令理解、工具筛选与结果反思等能力,InternLM2 可支持复杂智能体的搭建,支持对工具进行多轮有效调用及多步骤规划,完成复杂任务。bLk28资讯网——每日最新资讯28at.com

联合团队针对多种任务构建了细粒度工具调用评测集 T-Eval,InternLM2-Chat-7B 在该评测集上表现超越了 Claude-2.1 和目前的开源模型,性能接近 GPT-3.5。bLk28资讯网——每日最新资讯28at.com

数理推理:会做题,还会可视化分析bLk28资讯网——每日最新资讯28at.com

InternLM2 在不依靠外部工具的情况下,100 以内简单运算准确率近 100%,1000 以内准确率达 80% 左右。在 GSM8K 和 MATH 评测中,InternLM2-20B 表现超过 GPT-3.5。bLk28资讯网——每日最新资讯28at.com

为应对复杂计算,InternLM2-Chat 还可借助代码解释器编写代码进行计算,或对推理的结果进行形式化验证,从而解决更加复杂的计算问题。bLk28资讯网——每日最新资讯28at.com

基于这些能力,InternLM2 还具备了数据分析和可视化实用能力,进一步贴近用户使用场景。bLk28资讯网——每日最新资讯28at.com

bLk28资讯网——每日最新资讯28at.com

向 InternLM2 输入国家统计局公布的“2023 年 3-11 月份规模以上工业企业主要财务指标(分行业)”,InternLM2 能够分析数据并绘制折线图bLk28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-64371-0.html综合性能全面提升,书生・浦语 2.0 在阿里云魔搭开源首发

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 微服务和无服务器架构时代的持续测试

下一篇: 云鲸智能扫拖一体机器人 J4 入选界面 2023“理想的生活”好物榜

标签:
  • 热门焦点
  • 直屏旗舰来了 iQOO 12和K70 Pro同台竞技

    直屏旗舰来了 iQOO 12和K70 Pro同台竞技

    旗舰机基本上使用的都是双曲面屏幕,这就让很多喜欢直屏的爱好者在苦等一款直屏旗舰,这次,你们等到了。据博主数码闲聊站带来的最新爆料称,Redmi下代旗舰K70 Pro和iQOO 12两款手
  • 中兴AX5400Pro+上手体验:再升级 双2.5G网口+USB 3.0这次全都有

    中兴AX5400Pro+上手体验:再升级 双2.5G网口+USB 3.0这次全都有

    2021年11月的时候,中兴先后发布了两款路由器产品,中兴AX5400和中兴AX5400 Pro,从产品命名上就不难看出这是隶属于同一系列的,但在外观设计上这两款产品可以说是完全没一点关系
  • 天猫精灵Sound Pro体验:智能音箱没有音质?来听听我的

    天猫精灵Sound Pro体验:智能音箱没有音质?来听听我的

    这几年除了手机作为智能生活终端最主要的核心之外,第二个可以成为中心点的产品是什么?——是智能音箱。 手机在执行命令的时候有两种操作方式,手和智能语音助手,而智能音箱只
  • 从 Pulsar Client 的原理到它的监控面板

    从 Pulsar Client 的原理到它的监控面板

    背景前段时间业务团队偶尔会碰到一些 Pulsar 使用的问题,比如消息阻塞不消费了、生产者消息发送缓慢等各种问题。虽然我们有个监控页面可以根据 topic 维度查看他的发送状态,
  • 这款新兴工具平台,让你的电脑效率翻倍

    这款新兴工具平台,让你的电脑效率翻倍

    随着信息技术的发展,我们获取信息的渠道越来越多,但是处理信息的效率却成为一个瓶颈。于是各种工具应运而生,都在争相解决我们的工作效率问题。今天我要给大家介绍一款效率
  • 2023年,我眼中的字节跳动

    2023年,我眼中的字节跳动

    此时此刻(2023年7月),字节跳动从未上市,也从未公布过任何官方的上市计划;但是这并不妨碍它成为中国最受关注的互联网公司之一。从2016-17年的抖音强势崛起,到2018年的“头腾
  • 大厂卷向扁平化

    大厂卷向扁平化

    来源:新熵作者丨南枝 编辑丨月见大厂职级不香了。俗话说,兵无常势,水无常形,互联网企业调整职级体系并不稀奇。7月13日,淘宝天猫集团启动了近年来最大的人力制度改革,目前已形成一
  • 三翼鸟智能家居亮相电博会,让用户体验更真实

    三翼鸟智能家居亮相电博会,让用户体验更真实

    2021电博会在青岛国际会展中心开幕中,三翼鸟直接把“家”搬到了现场,成为了展会的一大看点。这也是三翼鸟继9月9日发布了行业首个一站式定制智慧家平台后的
  • 世界人工智能大会国际日开幕式活动在世博展览馆开启

    世界人工智能大会国际日开幕式活动在世博展览馆开启

    30日上午,世界人工智能大会国际日开幕式活动在世博展览馆开启,聚集国际城市代表、重量级院士专家、国际创新企业代表,共同打造人工智能交流平台。上海市副市
Top