当前位置：首页 > 科技 > 互联网

百川智能发布Baichuan 2，文理兼备全面领先LLaMA 2

来源：责编：时间：2023-09-07 10:55:25 439观看

导读 9月6日消息，在北京市科学技术委员会、中关村科技园区管理委员会、北京市海淀区政府的指导下，百川智能召开主题为“百川汇海，开源共赢”的大模型发布会，中科院院士张钹亲临现场并发表致辞。会上，百

9月6日消息，在北京市科学技术委员会、中关村科技园区管理委员会、北京市海淀区政府的指导下，百川智能召开主题为“百川汇海，开源共赢”的大模型发布会，中科院院士张钹亲临现场并发表致辞。会上，百川智能宣布正式开源微调后的Baichuan 2-7B、Baichuan 2-13B、Baichuan 2-13B-Chat与其4bit量化版本，并且均为免费可商用。

百川智能此次还开源了模型训练的Check Point，并宣布将发布 Baichuan 2 技术报告，详细介绍Baichuan 2 的训练细节，帮助大模型学术机构、开发者和企业用户更深入的了解其训练过程，更好地推动大模型学术研究和社区的技术发展。

Baichuan 2下载地址：https://github.com/baichuan-inc/Baichuan2

文理兼备性能优异，全面领先 LlaMA2

Baichuan 2-7B-Base 和 Baichuan 2-13B-Base，均基于 2.6万亿高质量多语言数据进行训练，在保留了上一代开源模型良好的生成与创作能力，流畅的多轮对话能力以及部署门槛较低等众多特性的基础上，两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。其中Baichuan 2-13B-Base相比上一代13B模型，数学能力提升49%，代码能力提升46%，安全能力提升37%，逻辑推理能力提升25%，语义理解能力提升15%。

本次开源的两个模型在各大评测榜单上的表现优秀，在MMLU、CMMLU、GSM8K等几大权威评估基准中，以绝对优势领先LLaMA2，相比其他同等参数量大模型，表现也十分亮眼，性能大幅度优于LLaMA2等同尺寸模型竞品。

更值得一提的是，根据MMLU等多个权威英文评估基准评分 Baichuan2-7B以70亿的参数在英文主流任务上与130亿参数量的LLaMA2持平。

7B参数模型的Benchmark成绩

13B参数模型的Benchmark成绩

Baichuan2-7B和Baichuan2-13B不仅对学术研究完全开放，开发者也仅需邮件申请获得官方商用许可后，即可以免费商用。

国内首创全程开源模型训练Check Point，助力学术研究

大模型训练包含海量高质量数据获取、大规模训练集群稳定训练、模型算法调优等多个环节。每个环节都需要大量人才、算力等资源的投入，从零到一完整训练一个模型的高昂成本，阻碍了学术界对大模型训练的深入研究。

本着协作和持续改进的精神，百川智能本次开源了模型训练从220B到2640B全过程的 Check Ponit。这对于科研机构研究大模型训练过程、模型继续训练和模型的价值观对齐等极具价值，将极大推动国内大模型的科研进展，开源训练模型过程对国内开源生态尚属首次。

技术报告揭示训练细节，繁荣开源生态

当前大部分开源模型在开源过程中只是对外公开自身的模型权重，很少提及训练细节，企业、研究机构、开发者们只能在开源模型的基础上做有限的微调，很难进行深入研究。

秉持更开放、更透明的理念，为帮助从业者深入了解Baichuan 2的训练过程和相关经验，更好地推动大模型社区的技术发展。百川智能在发布会上宣布，公开Baichuan 2的技术报告。技术报告将详细介绍Baichuan 2 训练的全过程，包括数据处理、模型结构优化、Scaling law、过程指标等。报告链接：
https://baichuan-paper.oss-cn-beijing.aliyuncs.com/Baichuan2-technical-report.pdf

百川智能自成立之初，就将通过开源方式助力中国大模型生态繁荣作为公司的重要发展方向。成立不到四个月，便相继发布了Baichuan-7B、Baichuan-13B两款开源免费可商用的中文大模型，以及一款搜索增强大模型Baichuan-53B，两款开源大模型在多个权威评测榜单均名列前茅，目前下载量超过500万次。

不仅如此，在今年创立的大模型公司中，百川智能是唯一一家通过《生成式人工智能服务管理暂行办法》备案，可以正式面向公众提供服务的企业。凭借行业领先的基础大模型研发和创新能力，此次开源的两款Baichuan 2大模型，得到了上下游企业的积极响应，腾讯云、阿里云、火山方舟、华为、联发科等众多知名企业均参加了本次发布会并与百川智能达成了合作。

未来，百川智能将在开源大模型领域持续深耕，将更多的技术能力、前沿创新开放出来，与更多的合作伙伴们共同助力中国大模型生态蓬勃发展。

本文链接：http://www.28at.com/showinfo-21-8035-0.html百川智能发布Baichuan 2，文理兼备全面领先LLaMA 2

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：探营2023外滩大会：6G、脑纹核身、刷脸识狗等黑科技提前揭晓

下一篇： ASML CEO承诺年底前交付首台High-NA EUV光刻机每台售价3亿美元

标签：

热门焦点

太卷！Redmi MAX 100英寸电视便宜了：12999元买Redmi史上最大屏

8月5日消息，从小米商城了解到，Redmi MAX 100英寸巨屏电视日前迎来官方优惠，到手价12999元，比发布价便宜了7000元，在大屏电视市场开卷。据了解，Redmi MAX 100
Rust中的高吞吐量流处理

作者 | Noz编译 | 王瑞平本篇文章主要介绍了Rust中流处理的概念、方法和优化。作者不仅介绍了流处理的基本概念以及Rust中常用的流处理库，还使用这些库实现了一个流处理程序
一文看懂为苹果Vision Pro开发应用程序

译者 | 布加迪审校 | 重楼苹果的Vision Pro是一款混合现实（MR）头戴设备。Vision Pro结合了虚拟现实（VR）和增强现实（AR）的沉浸感。其高分辨率显示屏、先进的传感器和强大的处理能力
这款新兴工具平台，让你的电脑效率翻倍

随着信息技术的发展,我们获取信息的渠道越来越多,但是处理信息的效率却成为一个瓶颈。于是各种工具应运而生,都在争相解决我们的工作效率问题。今天我要给大家介绍一款效率
Temu起诉SHEIN，跨境电商战事升级

来源 | 伯虎财经（bohuFN）作者 | 陈平安日前据外媒报道，拼多多旗下跨境电商平台Temu正对竞争对手SHEIN提起新诉讼，诉状称Shein“利用市场支配力量强迫服装厂商与之签订独家
破圈是B站头上的紧箍咒

来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之每年的暑期档都少不了瞄准追剧女孩们的古偶剧集，2021年有优酷的《山河令》，2022年有爱奇艺的《苍兰诀》，今年却轮到小破站抓住了追
年轻人的“职场羞耻感”，无处不在

作者：冯晓亭陶淘李欣张琳马舒叶来源：燃次元“人在职场，应该选择什么样的着装？”近日，在网络上，一个与着装相关的帖子引发关注，在该帖子里，一位在高级写字楼亚洲金
四年持续更迭坚持探索行业无人之境，HarmonyOS 4带来五大升级多项创新

除了华为每年新发布的旗舰手机系列，上亿花粉更加期待鸿蒙系统每次的跨版本大更新。8月4日，HarmonyOS 4于HDC 2023正式发布，这也是该系统历经四年的再
iQOO Neo8系列新品发布会

旗舰双芯更强更Pro

百川智能发布Baichuan 2，文理兼备全面领先LLaMA 2

太卷！Redmi MAX 100英寸电视便宜了：12999元买Redmi史上最大屏

Rust中的高吞吐量流处理

一文看懂为苹果Vision Pro开发应用程序

这款新兴工具平台，让你的电脑效率翻倍

Temu起诉SHEIN，跨境电商战事升级

破圈是B站头上的紧箍咒

年轻人的“职场羞耻感”，无处不在

四年持续更迭坚持探索行业无人之境，HarmonyOS 4带来五大升级多项创新

iQOO Neo8系列新品发布会

最新推荐

猜你喜欢

热门推荐

相关资讯