当前位置:首页 > 元宇宙 > AI

国产 1400 亿参数知未智能 KDF 大模型发布,聚焦金融和商业垂直领域

来源: 责编: 时间:2023-08-15 18:47:50 348观看
导读7月25日消息,近日,北京知未智能科技有限公司在上海举行发布会,正式推出知未智能 KDF 大模型,以及一系列基于该模型研发的金融行业工具,为相关行业的产业发展助力。知未智能 KDF 大模型是一款专注于金融和商业领域的中文模

7月25日消息,近日,北京知未智能科技有限公司在上海举行发布会,正式推出知未智能 KDF 大模型,以及一系列基于该模型研发的金融行业工具,为相关行业的产业发展助力。2GH28资讯网——每日最新资讯28at.com

知未智能 KDF 大模型是一款专注于金融和商业领域的中文模型。在其训练数据中,以中文为主,融合了大量的金融数据,从而大幅提升了模型在商业和金融问题处理方面的能力。2GH28资讯网——每日最新资讯28at.com

值得一提的是,为了保证模型的通用能力,训练数据还融合了部分英文和代码数据,以确保模型具备处理多种任务的能力。在训练过程中,知未智能 KDF 大模型采用了基于 PyTorch 优化的 GELU 非线性激活函数,这种优秀的激活函数有助于更精确地捕获复杂数据特征,保障了整个开发、训练和部署过程的高效运行。2GH28资讯网——每日最新资讯28at.com

2GH28资讯网——每日最新资讯28at.com

为了在保证效果的同时提高可扩展性,开发团队对模型的网络结构进行了深度优化。与 LLaMA 模型相比,知未智能 KDF 大模型在每一层使用更少的参数,有效降低了计算需求和内存占用。与此同时,网络深度也得到了加强,从而让模型具备了更强大的表示能力,能够学习到更为复杂的数据特征。2GH28资讯网——每日最新资讯28at.com

据ITBEAR科技资讯了解,在训练过程中,开发团队还重新调整了注意力层的 Bias,并引入了 Flash Attention 技术,以节省显存并提高模型训练和推理速度。得益于这项技术的应用,知未智能 KDF 大模型在有限的硬件资源下也能实现更高效的运行。2GH28资讯网——每日最新资讯28at.com

基准测试结果显示,知未智能 KDF 大模型在七个自然语言处理任务中展现出稳定的性能。在一些任务中,如 iFlytek 和 CMNLI,其表现相对出色。在 ExamQA 和 OCNLI 测试中,各模型的表现大致相同,凸显了该模型处理不同类型文本和领域知识方面的能力。2GH28资讯网——每日最新资讯28at.com

CEO 段清华表示,现有通用大模型在具体行业应用性和中文能力方面存在局限性,因此知未智能选择从零开始训练 KDF 大模型,以提升其中文能力和行业适用性。他强调,在打造这款“功能强大、性能优越”的中文模型过程中,开发团队深入理解技术细节,并将持续推动公司产品的开发创新。2GH28资讯网——每日最新资讯28at.com

目前,知未智能 KDF 大模型已在Hugging Face上开源,并将不限制商业使用,为行业发展和应用提供更多可能性。2GH28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-937-0.html国产 1400 亿参数知未智能 KDF 大模型发布,聚焦金融和商业垂直领域

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 智能化改进助力宝马生产线:AI降低成本提高效率

下一篇: 英特尔与埃森哲联手推出34个开源AI参考套件,助力AI部署

标签:
  • 热门焦点
  • 新周期,谁在坚守窄门?

    来源:锦缎今日的投资者恐怕已经忘记了,在OpenAI创造出ChatGPT这一杀器的前夜,生成式AI也曾经是一道窄门,窄到连马斯克都差点失去了信心。在当时的舆论眼中,AGI的道路不够性感,不够
  • 虚拟人再升级,企业可以解放双手了?

    来源:伯虎财经今天想跟大家来唠唠AI,其实聊到这个话题很多人都不陌生了。在ChatGPT和AIGC大热背后,还有一位低调的“大佬”——虚拟人。比如咱们熟知的虚
  • B端难做:留给魔珐科技的时间不多了

    来源:零态LT元宇宙泡沫正在碎裂,进入2023年后这一赛道热度一直在递减。今年2月,微软解散了成立仅四个月的工业元宇宙部门;今年3月,该公司2017年收购的虚拟现实社交平台AltspaceVR
  • 在数字世界再造世界杯,元宇宙体育正变得越来越丰满

    撰文/ 葱鲔鱼本届世界杯可能不是最精彩的一届,却绝对是看点十足的一届:后疫情时代的首届世界杯、耗资2200亿美元打造的“史上最贵”世界杯、足坛黄金
  • 保时捷推出虚拟超跑,车企元宇宙营销这么香?

    保时捷又出超跑了,不过这次不是在现实世界,而是在虚拟世界。这款Vision Gran Turismo概念车,由保时捷和日本视频游戏开发工作室Polyphony Digital联合打造,将于202
  • 国内涌现70余家数字藏品平台:合规、流量与利润在博弈

    作者:杨郑君2月16日,迅雷链企业数字藏品服务平台正式上线,继阿里、腾讯、京东、百度、网易等之后,又一家互联网企业正式加入到火热的数字藏品平台的竞争中。除互联
  • 从英式拍到荷兰拍,看传统金融拍卖玩法如何玩转NFT市场交易

    作者:鲁拍卖是一种从古至今的商业活动。从古代的典当到现代的拍卖市场、我们熟知的拍卖行,以及知名街头艺术家Bansky名画拍卖成功后,竟自毁粉碎,现价值又翻倍的拍
  • Web 3如何改变传统HR

    互联网自诞生以来,经历了三次迭代。Web1是第一阶段,包括ISP服务器上的个人网页或免费的虚拟主机服务。然后Web2出现了,它引入了动态的用户生成内容、互操作性、增
  • 从NFT数字收藏,洞察数字音乐版权市场发展趋势

    去年8月9日,腾讯音乐布局NFT数字收藏,在腾讯应用宝发布幻核app,腾讯音乐的提前布局示意着未来区块链技术将对数字音乐版权市场进行改造升级。作者从深层测分析为
Top