当前位置:首页 > 科技  > 软件

国产130亿参数大模型免费商用!性能超Llama2-13B,支持8k上下文,哈工大已用上

来源: 责编: 时间:2023-08-09 23:03:27 409观看
导读国产大模型,再次迎来新玩家!XVERSE-13B,开源即免费商用。来自前腾讯副总裁、腾讯AI lab创始人姚星创立的明星独角兽元象,公司成立一年即完成1.2亿美元融资。此次开源的大模型,它支持40多种语言、8192上下文长度。在多项中

国产大模型,再次迎来新玩家!Z7E28资讯网——每日最新资讯28at.com

XVERSE-13B,开源即免费商用Z7E28资讯网——每日最新资讯28at.com

来自前腾讯副总裁、腾讯AI lab创始人姚星创立的明星独角兽元象,公司成立一年即完成1.2亿美元融资。Z7E28资讯网——每日最新资讯28at.com

此次开源的大模型,它支持40多种语言、8192上下文长度。在多项中英文测评中,性能超过了同尺寸(130亿参数)的LIama2、Baichuan等。Z7E28资讯网——每日最新资讯28at.com

图片Z7E28资讯网——每日最新资讯28at.com

目前,哈尔滨工业大学已经率先用上。Z7E28资讯网——每日最新资讯28at.com

国产百亿大模型免费商用

据介绍,XVERSE-13B大模型主要有这几个方面的特点。Z7E28资讯网——每日最新资讯28at.com

模型架构方面,它是基于标准Transformer架构(Decoder-only),支持8K上下文长度,据称这也是目前同尺寸标准模型中最长。这样一来,可满足更多轮对话,减少遗忘现象,以及输入更多内容完成复杂任务。Z7E28资讯网——每日最新资讯28at.com

训练数据上,构建了1.4万亿tokens的数据集,包含中、英、俄、西等40多种语言。Z7E28资讯网——每日最新资讯28at.com

而为了充分利用训练数据,他们在分词策略上,基于BPE(Byte-Pair Encoding)算法,使用上百 GB 语料训练了一个词表大小为 100,278 的分词器。Z7E28资讯网——每日最新资讯28at.com

这样一来,能够同时支持多语言,而无需额外扩展词表。Z7E28资讯网——每日最新资讯28at.com

此外,还在训练框架上进行了算子、通信、并行策略及调度等方面的优化,包括高效算子、显存优化、并行调度策略、数据-计算-通信重叠、平台和框架协同等自研技术,使得千卡集群上的峰值算力利用率达到 58.5%,据介绍位居业界前列。Z7E28资讯网——每日最新资讯28at.com

作为通用大模型,它支持文本生成、自动化写作、数据分析、知识问答、多语言翻译、个性化交互、人物角色扮演、专业小助手等功能。Z7E28资讯网——每日最新资讯28at.com

具体到各项能力测评上,他们选取了 MMLU(英文)、 C-Eval(中文)、AGIEval(中英) 、GAOKAO-Bench(中英)、GAOKAO-English(英文)等在内的评测集。Z7E28资讯网——每日最新资讯28at.com

比如在MMLU测评中,其综合评分达到55.1分,在多个维度超过了同参数规模的主流模型。Z7E28资讯网——每日最新资讯28at.com

图片Z7E28资讯网——每日最新资讯28at.com

(MMLU 由加州大学伯克利分校等高校共同打造,集合了科学、工程、数学、人文、社会科学等领域的 57 个科目,主要目标是对模型的英文跨学科专业能力进行深入测评。其内容涵盖从初级水平到高级专业水平)Z7E28资讯网——每日最新资讯28at.com

还有在C-Eval、AGIEval和GAOKAO-Bench等中文测评中,分别以54.7、41.4以及53.9分超越了其他模型。Z7E28资讯网——每日最新资讯28at.com

图片Z7E28资讯网——每日最新资讯28at.com

目前,XVERSE-13B代码采用 Apache-2.0 协议,向学术研究完全开源,企业只需简单登记,即可免费商用。Z7E28资讯网——每日最新资讯28at.com

哈工大已经率先使用大模型推进相关研究工作。哈工大计算机科学与技术学院张伟男教授表示:Z7E28资讯网——每日最新资讯28at.com

开源是互联网时代主流模式,不仅能贡献社区,推动技术持续创新,还能利用协同解决算法透明性、稳定性、公众信任度等共性问题。Z7E28资讯网——每日最新资讯28at.com

来自元象XVERSE团队

随着XVERSE-13B的发布,国产大模型迎来了新玩家:Z7E28资讯网——每日最新资讯28at.com

元象XVERSE,2021年3月成立,专注于AI与元宇宙技术服务。Z7E28资讯网——每日最新资讯28at.com

创始团队来自腾讯游戏、Adobe、微软、IBM、麦肯锡等公司。创始人是前腾讯副总裁姚星,他曾亲手创立了腾讯AI lab以及机器人实验室Robotics X,并兼管腾讯技术工程事业群(TEG)多个技术部门。Z7E28资讯网——每日最新资讯28at.com

他也是腾讯在受AlphaGo震动决定战略布局AI时的一号位负责人,代表腾讯全球挖人组队,也代表腾讯喊出了口号:AI in All。在此期间曾主导推出了绝艺、绝悟、云深智药等行业代表性产品和应用,张潼张正友都曾向他汇报。Z7E28资讯网——每日最新资讯28at.com

图片Z7E28资讯网——每日最新资讯28at.com

2022年3月,元象完成A与A+轮融资1.2亿美元,投资机构包括腾讯、高榕资本、五源资本、高瓴创投、红杉中国、淡马锡和CPE源峰等。Z7E28资讯网——每日最新资讯28at.com

在3D和AI技术领域,已自主研发出行业领先的“端云协同” 3D互动技术,主打零门槛、一站式、高品质的元宇宙体验。Z7E28资讯网——每日最新资讯28at.com

目前客户包括澳门大三巴、腾讯音乐、央视、一汽大众、阿迪达斯、邮储银行等企业。Z7E28资讯网——每日最新资讯28at.com

GitHub链接:
https://github.com/xverse-ai/XVERSE-13B
参考链接:
https://huggingface.co/xverse/XVERSE-13BZ7E28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-5181-0.html国产130亿参数大模型免费商用!性能超Llama2-13B,支持8k上下文,哈工大已用上

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: SpringBoot3基础用法

下一篇: TIOBE 8 月榜单:Julia 首次进入前 20 名

标签:
  • 热门焦点
  • 6月iOS设备性能榜:M2稳居榜首 A系列只能等一手3nm来救

    没有新品发布,自然iOS设备性能榜的上榜设备就没有什么更替,仅仅只有跑分变化而产生的排名变动,毕竟苹果新品的发布节奏就是这样的,一年下来也就几个移动端新品,不会像安卓厂商,一
  • 6月安卓手机好评榜:魅族20 Pro蝉联冠军

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年6月1日至6月30日,仅限国内市场。第一名:魅族20 Pro好评率:95%5月份的时候魅族20 Pro就是
  • 线程通讯的三种方法!通俗易懂

    线程通信是指多个线程之间通过某种机制进行协调和交互,例如,线程等待和通知机制就是线程通讯的主要手段之一。 在 Java 中,线程等待和通知的实现手段有以下几种方式:Object 类下
  • 十个简单但很有用的Python装饰器

    装饰器(Decorators)是Python中一种强大而灵活的功能,用于修改或增强函数或类的行为。装饰器本质上是一个函数,它接受另一个函数或类作为参数,并返回一个新的函数或类。它们通常用
  • Python异步IO编程的进程/线程通信实现

    这篇文章再讲3种方式,同时讲4中进程间通信的方式一、 Python 中线程间通信的实现方式共享变量共享变量是多个线程可以共同访问的变量。在Python中,可以使用threading模块中的L
  • Temu起诉SHEIN,跨境电商战事升级

    来源 | 伯虎财经(bohuFN)作者 | 陈平安日前据外媒报道,拼多多旗下跨境电商平台Temu正对竞争对手SHEIN提起新诉讼,诉状称Shein“利用市场支配力量强迫服装厂商与之签订独家
  • 苹果、三星、惠普等暂停向印度出口笔记本和平板电脑

    集微网消息,据彭博社报道,在8月3日印度突然禁止在没有许可证的情况下向印度进口电脑/平板及显示器等产品后,苹果、三星电子和惠普等大公司暂停向印度
  • 三星电子Q2营收60万亿韩元 存储业务营收同比仍下滑超过50%

    7月27日消息,据外媒报道,从三星电子所发布的财报来看,他们主要利润来源的存储芯片业务在今年二季度仍不乐观,营收同比仍在大幅下滑,所在的设备解决方案
  • 联想YOGA 16s 2022笔记本将要推出,屏幕支持触控功能

    联想此前宣布,将于11月2日19:30召开联想秋季轻薄新品发布会,推出联想 YOGA 16s 2022 笔记本等新品。官方称,YOGA 16s 2022 笔记本将搭载 16 英寸屏幕,并且是一
Top