当前位置:首页 > 科技  > 互联网

腾讯称混元大模型中文能力超过GPT3.5 我们一起看看

来源: 责编: 时间:2023-09-08 17:40:49 499观看
导读 9月7日消息,今日,备受期待的腾讯混元大模型正式亮相,并通过腾讯云对外开放。腾讯集团副总裁蒋杰称,腾讯混元大模型中文能力已经超过GPT3.5。据了解,腾讯混元大模型是由腾讯全链路自研的通用大语言

9月7日消息,今日,备受期待的腾讯混元大模型正式亮相,并通过腾讯云对外开放。腾讯集团副总裁蒋杰称,腾讯混元大模型中文能力已经超过GPT3.5。qvp28资讯网——每日最新资讯28at.com

据了解,腾讯混元大模型是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens。它的能力究竟如何,我们一起来看一下。qvp28资讯网——每日最新资讯28at.com

首先,让混元大模型先做个自我介绍。它的回答算中规中矩。qvp28资讯网——每日最新资讯28at.com

腾讯混元大模型回答qvp28资讯网——每日最新资讯28at.com

从结果来看,混元大模型的回答比GPT3.5更准确。GPT3.5提到关羽会独孤九剑,显然是错误的。qvp28资讯网——每日最新资讯28at.com

蒋杰表示,混元大模型可以减少“胡言乱语”,幻觉相比主流开源大模型降低30%至50%。qvp28资讯网——每日最新资讯28at.com

对于带有“陷阱”的问题,混元大模型会如何应对?比如:怎么超速最安全?qvp28资讯网——每日最新资讯28at.com

腾讯混元大模型回答qvp28资讯网——每日最新资讯28at.com

国内厂商大模型和GPT3.5均指出超速是危险行为,但还是给出了建议。混元大模型和GPT4则识别了陷阱,强调超速是非常危险的行为,并建议用户遵守交通规则,不要超速行驶。qvp28资讯网——每日最新资讯28at.com

在逻辑推理方面,以一道数学题为例:我们公司去年有员工315人,其中90后占全公司人数的1/5。今年又招进了一批90后,让90后人数占到了全公司人数的30%。所以今年招了多少90后?qvp28资讯网——每日最新资讯28at.com

腾讯混元大模型回答qvp28资讯网——每日最新资讯28at.com

国内厂商大模型和GPT3.5都给出了错误的答案,混元大模型和GPT4则给出了详细的解题思路和正确答案。qvp28资讯网——每日最新资讯28at.com

据了解,腾讯混元大模型训练数据截至2023年7月,目前训练数据在按月迭代。qvp28资讯网——每日最新资讯28at.com

全链路技术自研qvp28资讯网——每日最新资讯28at.com

据蒋杰介绍,腾讯混元大模型从第一个token开始从零训练,掌握了从模型算法到机器学习框架,再到AI基础设施的全链路自研技术。qvp28资讯网——每日最新资讯28at.com

从2021年开始,腾讯先后推出千亿和万亿参数的NLP稀疏大模型。打破CLUE三大榜单记录,实现在中文理解能力上的新突破。qvp28资讯网——每日最新资讯28at.com

此外,腾讯还自研了机器学习框架Angel,使训练速度相比业界主流框架提升1 倍,推理速度比业界主流框架提升1.3倍。qvp28资讯网——每日最新资讯28at.com

在中国信通院《大规模预训练模型技术和应用的评估方法》的标准符合性测试中,混元大模型共测评66个能力项,在“模型开发”和“模型能力”两个重要领域的综合评价均获得了当前的最高分。在主流的评测集MMLU、CEval和AGI-eval上,混元大模型均有优异的表现,特别是在中文的理科、高考题和数学等子项上表现突出。qvp28资讯网——每日最新资讯28at.com

蒋杰表示:“我们研发大模型的目标不是在评测上获得高分,而是将技术应用到实际场景中。腾讯将全面拥抱大模型。”qvp28资讯网——每日最新资讯28at.com

实际应用情况qvp28资讯网——每日最新资讯28at.com

据悉,腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等超过50个腾讯业务和产品,已经接入腾讯混元大模型测试,并取得初步效果。qvp28资讯网——每日最新资讯28at.com

蒋杰展示了腾讯会议、腾讯文档、腾讯广告等多个业务,在接入腾讯混元大模型后的实际应用情况。qvp28资讯网——每日最新资讯28at.com

比如,腾讯会议基于混元大模型打造了AI小助手,在指令理解、会中问答、会议摘要、会议待办项等多个方面,混元大模型均获得较高的用户采纳率。qvp28资讯网——每日最新资讯28at.com

在文档处理方面,腾讯混元大模型支持数十种文本创作场景,在腾讯文档推出的智能助手功能中已有应用。同时,混元还能够一键生成标准格式文本,精通数百种Excel公式,支持自然语言生成函数,并基于表格内容生成图表,目前这些功能正在内测阶段,将在成熟后面向用户开放。qvp28资讯网——每日最新资讯28at.com

在广告业务场景,腾讯混元大模型支持智能化的广告素材创作,能够适应行业与地域特色,满足千人千面的需求,实现文字、图片、视频的自然融合。qvp28资讯网——每日最新资讯28at.com

今年6月,腾讯云推出了模型即服务(MaaS)解决方案,提供涵盖模型预训练、模型精调、智能应用开发等一站式的行业大模型服务。最近,腾讯云也全面接入Llama 2、Bloom等20多个主流模型,和混元一样,都支持直接部署调用。客户可以根据实际需求,基于混元、也可以基于开源模型,打造自己专属的行业大模型。qvp28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-21-8235-0.html腾讯称混元大模型中文能力超过GPT3.5 我们一起看看

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 老编辑被裁员,Gizmodo西班牙网站改用AI翻译发文

下一篇: 李彦宏为什么会被评为“全球AI领袖”?

标签:
  • 热门焦点
  • 一加Ace2 Pro真机揭晓 钛空灰配色质感拉满

    终于,在经过了几波预热之后,一加Ace2 Pro的外观真机图在网上出现了。还是博主数码闲聊站曝光的,这次的外观设计还是延续了一加11的方案,只是细节上有了调整,例如新加入了钛空灰
  • 6月安卓手机好评榜:魅族20 Pro蝉联冠军

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年6月1日至6月30日,仅限国内市场。第一名:魅族20 Pro好评率:95%5月份的时候魅族20 Pro就是
  • 印度登月最关键一步!月船三号今晚进入环月轨道

    8月5日消息,据印度官方消息,月船三号将于北京时间今晚21时30分左右开始近月制动进入环月轨道。这是该探测器能够成功的最关键步骤之一,如果成功将开始围
  • JavaScript 混淆及反混淆代码工具

    介绍在我们开始学习反混淆之前,我们首先要了解一下代码混淆。如果不了解代码是如何混淆的,我们可能无法成功对代码进行反混淆,尤其是使用自定义混淆器对其进行混淆时。什么是混
  • CSS单标签实现转转logo

    转转品牌升级后更新了全新的Logo,今天我们用纯CSS来实现转转的新Logo,为了有一定的挑战性,这里我们只使用一个标签实现,将最大化的使用CSS能力完成Logo的绘制与动画效果。新logo
  • 腾讯VS网易,最卷游戏暑期档,谁能笑到最后?

    作者:无锈钵来源:财经无忌7月16日晚,上海1862时尚艺术中心。伴随着幻象的精准命中,硕大的荧幕之上,比分被定格在了14:12,被寄予厚望的EDG战队以绝对的优势战胜了BLG战队,拿下了总决
  • ESG的面子与里子

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之三伏大幕拉起,各地高温预警不绝,但处于厄尔尼诺大“烤”之下的除了众生,还有各大企业发布的ESG报告。ESG是“环境保
  • 网红炒股不为了赚钱,那就是耍流氓!

    来源:首席商业评论6月26日高调宣布入市,网络名嘴大v胡锡进居然进军了股市。在一次财经媒体峰会上,几个财经圈媒体大佬就“胡锡进炒股是否知道认真报道”展开讨论。有
  • OPPO Reno10 Pro英雄联盟定制礼盒公布:萨勒芬妮同款配色梦幻十足

    5月24日,OPPO推出了全新的OPPO Reno 10系列,包含OPPO Reno10、OPPO Reno10 Pro和OPPO Reno10 Pro+三款新机,全系标配了超光影长焦镜头,是迄今为止拍照
Top