当前位置:首页 > 科技  > 软件

国产130亿参数大模型免费商用!性能超Llama2-13B,支持8k上下文,哈工大已用上

来源: 责编: 时间:2023-08-09 23:03:27 408观看
导读国产大模型,再次迎来新玩家!XVERSE-13B,开源即免费商用。来自前腾讯副总裁、腾讯AI lab创始人姚星创立的明星独角兽元象,公司成立一年即完成1.2亿美元融资。此次开源的大模型,它支持40多种语言、8192上下文长度。在多项中

国产大模型,再次迎来新玩家!HTF28资讯网——每日最新资讯28at.com

XVERSE-13B,开源即免费商用HTF28资讯网——每日最新资讯28at.com

来自前腾讯副总裁、腾讯AI lab创始人姚星创立的明星独角兽元象,公司成立一年即完成1.2亿美元融资。HTF28资讯网——每日最新资讯28at.com

此次开源的大模型,它支持40多种语言、8192上下文长度。在多项中英文测评中,性能超过了同尺寸(130亿参数)的LIama2、Baichuan等。HTF28资讯网——每日最新资讯28at.com

图片HTF28资讯网——每日最新资讯28at.com

目前,哈尔滨工业大学已经率先用上。HTF28资讯网——每日最新资讯28at.com

国产百亿大模型免费商用

据介绍,XVERSE-13B大模型主要有这几个方面的特点。HTF28资讯网——每日最新资讯28at.com

模型架构方面,它是基于标准Transformer架构(Decoder-only),支持8K上下文长度,据称这也是目前同尺寸标准模型中最长。这样一来,可满足更多轮对话,减少遗忘现象,以及输入更多内容完成复杂任务。HTF28资讯网——每日最新资讯28at.com

训练数据上,构建了1.4万亿tokens的数据集,包含中、英、俄、西等40多种语言。HTF28资讯网——每日最新资讯28at.com

而为了充分利用训练数据,他们在分词策略上,基于BPE(Byte-Pair Encoding)算法,使用上百 GB 语料训练了一个词表大小为 100,278 的分词器。HTF28资讯网——每日最新资讯28at.com

这样一来,能够同时支持多语言,而无需额外扩展词表。HTF28资讯网——每日最新资讯28at.com

此外,还在训练框架上进行了算子、通信、并行策略及调度等方面的优化,包括高效算子、显存优化、并行调度策略、数据-计算-通信重叠、平台和框架协同等自研技术,使得千卡集群上的峰值算力利用率达到 58.5%,据介绍位居业界前列。HTF28资讯网——每日最新资讯28at.com

作为通用大模型,它支持文本生成、自动化写作、数据分析、知识问答、多语言翻译、个性化交互、人物角色扮演、专业小助手等功能。HTF28资讯网——每日最新资讯28at.com

具体到各项能力测评上,他们选取了 MMLU(英文)、 C-Eval(中文)、AGIEval(中英) 、GAOKAO-Bench(中英)、GAOKAO-English(英文)等在内的评测集。HTF28资讯网——每日最新资讯28at.com

比如在MMLU测评中,其综合评分达到55.1分,在多个维度超过了同参数规模的主流模型。HTF28资讯网——每日最新资讯28at.com

图片HTF28资讯网——每日最新资讯28at.com

(MMLU 由加州大学伯克利分校等高校共同打造,集合了科学、工程、数学、人文、社会科学等领域的 57 个科目,主要目标是对模型的英文跨学科专业能力进行深入测评。其内容涵盖从初级水平到高级专业水平)HTF28资讯网——每日最新资讯28at.com

还有在C-Eval、AGIEval和GAOKAO-Bench等中文测评中,分别以54.7、41.4以及53.9分超越了其他模型。HTF28资讯网——每日最新资讯28at.com

图片HTF28资讯网——每日最新资讯28at.com

目前,XVERSE-13B代码采用 Apache-2.0 协议,向学术研究完全开源,企业只需简单登记,即可免费商用。HTF28资讯网——每日最新资讯28at.com

哈工大已经率先使用大模型推进相关研究工作。哈工大计算机科学与技术学院张伟男教授表示:HTF28资讯网——每日最新资讯28at.com

开源是互联网时代主流模式,不仅能贡献社区,推动技术持续创新,还能利用协同解决算法透明性、稳定性、公众信任度等共性问题。HTF28资讯网——每日最新资讯28at.com

来自元象XVERSE团队

随着XVERSE-13B的发布,国产大模型迎来了新玩家:HTF28资讯网——每日最新资讯28at.com

元象XVERSE,2021年3月成立,专注于AI与元宇宙技术服务。HTF28资讯网——每日最新资讯28at.com

创始团队来自腾讯游戏、Adobe、微软、IBM、麦肯锡等公司。创始人是前腾讯副总裁姚星,他曾亲手创立了腾讯AI lab以及机器人实验室Robotics X,并兼管腾讯技术工程事业群(TEG)多个技术部门。HTF28资讯网——每日最新资讯28at.com

他也是腾讯在受AlphaGo震动决定战略布局AI时的一号位负责人,代表腾讯全球挖人组队,也代表腾讯喊出了口号:AI in All。在此期间曾主导推出了绝艺、绝悟、云深智药等行业代表性产品和应用,张潼张正友都曾向他汇报。HTF28资讯网——每日最新资讯28at.com

图片HTF28资讯网——每日最新资讯28at.com

2022年3月,元象完成A与A+轮融资1.2亿美元,投资机构包括腾讯、高榕资本、五源资本、高瓴创投、红杉中国、淡马锡和CPE源峰等。HTF28资讯网——每日最新资讯28at.com

在3D和AI技术领域,已自主研发出行业领先的“端云协同” 3D互动技术,主打零门槛、一站式、高品质的元宇宙体验。HTF28资讯网——每日最新资讯28at.com

目前客户包括澳门大三巴、腾讯音乐、央视、一汽大众、阿迪达斯、邮储银行等企业。HTF28资讯网——每日最新资讯28at.com

GitHub链接:
https://github.com/xverse-ai/XVERSE-13B
参考链接:
https://huggingface.co/xverse/XVERSE-13BHTF28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-5181-0.html国产130亿参数大模型免费商用!性能超Llama2-13B,支持8k上下文,哈工大已用上

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: SpringBoot3基础用法

下一篇: TIOBE 8 月榜单:Julia 首次进入前 20 名

标签:
  • 热门焦点
  • 鸿蒙OS 4.0公测机型公布:甚至连nova6都支持

    华为全新的HarmonyOS 4.0操作系统将于今天下午正式登场,官方在发布会之前也已经正式给出了可升级的机型产品,这意味着这些机型会率先支持升级享用。这次的HarmonyOS 4.0支持
  • 中兴AX5400Pro+上手体验:再升级 双2.5G网口+USB 3.0这次全都有

    2021年11月的时候,中兴先后发布了两款路由器产品,中兴AX5400和中兴AX5400 Pro,从产品命名上就不难看出这是隶属于同一系列的,但在外观设计上这两款产品可以说是完全没一点关系
  • 6月安卓手机性能榜:vivo/iQOO霸占旗舰排行榜前三

    2023年上半年已经正式过去了,我们也迎来了安兔兔V10版本,在新的骁龙8Gen3和天玑9300发布之前,性能榜的榜单大体会以骁龙8Gen2和天玑9200+为主,至于那颗3.36GHz的骁龙8Gen2领先
  • 2023 年的 Node.js 生态系统

    随着技术的不断演进和创新,Node.js 在 2023 年达到了一个新的高度。Node.js 拥有一个庞大的生态系统,可以帮助开发人员更快地实现复杂的应用。本文就来看看 Node.js 最新的生
  • 一条抖音4亿人围观 ! 这家MCN比无忧传媒还野

    作者:Hiu 来源:互联网品牌官01 擦边少女空降热搜,幕后推手曝光被网友誉为“纯欲天花板”的女网红井川里予,近期因为一组哥特风照片登上热搜,引发了一场互联网世界关于
  • 阿里大调整

    来源:产品刘有媒体报道称,近期淘宝天猫集团启动了近年来最大的人力制度改革,涉及员工绩效、层级体系等多个核心事项,目前已形成一个初步的“征求意见版”:1、取消P序列
  • 苹果、三星、惠普等暂停向印度出口笔记本和平板电脑

    集微网消息,据彭博社报道,在8月3日印度突然禁止在没有许可证的情况下向印度进口电脑/平板及显示器等产品后,苹果、三星电子和惠普等大公司暂停向印度
  • 国行版三星Galaxy Z Fold5/Z Flip5发布 售价7499元起

    2023年8月3日,三星电子举行Galaxy新品中国发布会,正式在国内推出了新一代折叠屏智能手机三星Galaxy Z Fold5与Galaxy Z Flip5,以及三星Galaxy Tab S9
  • iQOO Neo8 Pro评测:旗舰双芯加持 最强性能游戏旗舰

    【Techweb评测】去年10月,iQOO推出了一款Neo7手机,该机搭载了联发科天玑9000+,配备独显芯片Pro+,带来了同价位段最佳的游戏体验,一经上市便受到了诸多用
Top