当前位置:首页 > 元宇宙 > AI

中国电信 AI 研究院完成首个全国产化万卡万参大模型训练,TeleChat2-115B 对外开源

来源: 责编: 时间:2024-10-01 17:07:26 203观看
导读 9 月 28 日消息,“中国电信人工智能研究院”官方公众号今天宣布,中国电信人工智能研究院(注:下文称 TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型,并正式对外开源首个基于全国产化万卡集群和

9 月 28 日消息,“中国电信人工智能研究院”官方公众号今天宣布,中国电信人工智能研究院(注:下文称 TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型,并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型 —— 星辰语义大模型 TeleChat2-115B。eTB28资讯网——每日最新资讯28at.com

eTB28资讯网——每日最新资讯28at.com

官方表示,这项科研成果标志着国产大模型训练真正实现全国产化替代,正式进入全国产自主创新、安全可控的新阶段。eTB28资讯网——每日最新资讯28at.com

TeleChat2-115B 基于中国电信自研的天翼云“息壤一体化智算服务平台”和人工智能公司“星海 AI 平台”训练完成。据介绍,其在保证训练精度的前提下利用多种优化手段提升模型训练效率和稳定性,实现了 GPU 同等算力计算效率超 93% ,模型有效训练时长占比超 98% 。eTB28资讯网——每日最新资讯28at.com

针对超大参数模型训练,TeleAI 采用了大量小模型进行 Scaling,进而验证不同模型结构的有效性。同时,在数据配比方面,基于小模型实验结果反馈,采用回归预测模型,得到较优数据配比。eTB28资讯网——每日最新资讯28at.com

在 Post-Training(后训练)方面,TeleAI 首先针对数学、代码和逻辑推理等内容合成了大量问答数据,用于 SFT(监督式微调)第一阶段模型训练。eTB28资讯网——每日最新资讯28at.com

其次,其采用迭代式更新策略,使用模型对提示词数据进行指令复杂性提升与多样性扩充,通过模型合成和人工标注提升答案质量,并利用拒绝采样获取优质 SFT 数据及 RM(奖励模型)代表性数据,用于 SFT 训练和 DPO(偏好对齐)训练,以及模型效果迭代。eTB28资讯网——每日最新资讯28at.com

附开源地址eTB28资讯网——每日最新资讯28at.com

GitHub:eTB28资讯网——每日最新资讯28at.com

https://github.com/Tele-AI/TeleChat2eTB28资讯网——每日最新资讯28at.com

Gitee:eTB28资讯网——每日最新资讯28at.com

https://gitee.com/Tele-AI/tele-chat2eTB28资讯网——每日最新资讯28at.com

ModelScope:eTB28资讯网——每日最新资讯28at.com

https://modelscope.cn/models/TeleAI/TeleChat2-115BeTB28资讯网——每日最新资讯28at.com

Modelers:eTB28资讯网——每日最新资讯28at.com

https://modelers.cn/models/TeleAI/TeleChat2-115BeTB28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-8018-0.html中国电信 AI 研究院完成首个全国产化万卡万参大模型训练,TeleChat2-115B 对外开源

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 苏黎世联邦理工学院研究:AI 可 100% 绕过谷歌 reCAPTCHA V2 验证

下一篇: OpenAI:计划五年内将 ChatGPT 每月订阅费用提高到最高 44 美元

标签:
  • 热门焦点
  • 拯救XR,苹果力不从心

    来源 | 光子星球撰文 | 文烨豪 编辑 | 吴先之 苹果终于呈上了它的“答卷”。 北京时间6月6日凌晨,苹果2023年全球开发者大会(WWDC)如期举行。作为苹果CEO库克口中&ld
  • “任何国产元宇宙都是假元宇宙”

    上个月,华语乐坛的优质偶像之一,DOTA2资深玩家林俊杰,在国外元宇宙产品分布式大陆(Decentraland)上买了三块虚拟地产,花了12.3万美元(也就是人民币接近80万)。截至目
  • 美国一区块链风投公司宣布成立2.5亿美元web3投资新基金

    No.1 俄罗斯财政部长: 在俄罗斯禁止比特币就如禁止互联网一样2月16日消息,俄罗斯财政部长安东·西卢安诺夫(Anton Siluanov)表示,在俄罗斯禁止加密货币就跟禁止互
  • 以太坊升级将会带来的5个改变

    以太坊自2015年诞生以来就广受欢迎,但最近其昂贵的交易费用和低可扩展性对执行复杂的应用程序产生了负面作用,用户对以太坊改进的需求也日益急迫。以太坊2.0已进
  • Meta展示AI系统Builder Bot;《Pistol Whip》增加派对模式

    今日热点:Meta展示AI系统Builder Bot;招聘信息显示Meta正在探索具有蜂窝连接功能的VR/AR头显;英国VR工作室Coatsink Games正在为PSVR 2开发新游戏;VR节奏射击游戏
  • 「国产良心」NFT嘲讽了谁?

    2月23日,一个名为「国产良心」的NFT项目被许多活跃的加密用户注意到。该项目的官网风格尤为「不正经」,它丝毫没有避讳自己的小作坊出身,还将「中国人不骗中国人
  • 音乐家如何利用NFTs来提高歌迷参与度

    "音乐是一种语言,不以特定的文字说话。它用情感说话,如果它在骨子里,它就在骨子里。" - Keith Richards音乐激励着我们,使我们流泪,使我们充满狂喜,并抚慰我们的灵魂
  • FTX 加密货币交易所开始向游戏公司提供加密服务

    据媒体报道,业内领先的加密货币交易所FTX宣布将涉足游戏领域。该公司表示,计划推出自己的游戏部门作为中介,专注于为传统游戏公司提供加密相关服务。此举将有助于
  • 多位全国政协委员提交元宇宙提案,国金证券称元宇宙仍处初期投资阶段

    财联社|区块链日报2日讯 今日《元宇宙新鲜事》有:全国政协委员刘伟建议出台“元宇宙中国”的顶层设计方案;国金证券称元宇宙仍处初期投资庞大获利不易阶段;阿联酋
Top