在科技日新月异的今天,来自各大科创巨头的大语言模型 (LLM)* 的涌现象征着人工智能 (AI) 正迈向一个崭新的纪元,人工智能技术正成为驱动经济发展、促进生产效能提升以及优化用户体验的重要引擎。作为全球前沿科技先行者,理光以其前瞻性的视野和卓越的科研实力,在人工智能领域锐意进取,持续突破。2024 年 6 月 3 日,理光携手日本理化学研究所创新智能综合研究中心,利用共同研发的指令数据,成功优化了其日语大语言模型,显著提升了模型的指令遵循性能。这一日语大模型研发领域里程碑式的突破再次彰显了理光在人工智能领域的领先地位。
锐意创新,攻克日语大语言模型难关
攻克日语大语言模型发展道路上的重重难关,理光展现了令人瞩目的科研成果。相较于英语大语言模型 (LLM) 的迅猛发展,日语 LLM 的研发曾因语言特性和数据收集难题而相对滞后。日语独特的语法和表达方式,使得基于英语的模型难以直接迁移应用。同时,日语数据资源的稀缺、品质参差不齐以及多样性不足,也为研发工作增添了难度。
然而,理光凭借其在科技领域的深厚积累和开拓进取的创新精神,成功克服了这些难题。通过与日本理化学研究所的紧密合作,理光获得了适用于日语大模型训练的指令数据,并巧妙地将其融入 LLM 的训练中。理光使用指令数据集“ichikara-instruction”(包含 10329 条指令) 对其研发的 130 亿参数日语大语言模型进行了指令调优。这一调优过程旨在减少模型预测与用户期望之间的偏差,确保模型能够更准确地遵循人类的指令。通过表 1 数据可以了解到,经过调优,LLM 的指令遵循性能得分从 1.19 分跃升至 3.02 分。对理光最初开发的 3556 条理光制造数据集的调优结果显示,该模型在同一基准测试中的得分同样显著增长。这一进展体现了模型在理解和执行人类指令方面的巨大进步,也证明了数据质量对于提升 LLM 性能的重要性。
此外,表 2 数据对摘要任务的独立评估进一步彰显了理光数据集的优越性,特别是在长文本摘要方面。为了满足客户对人工智能摘要生成功能的高需求,理光将这一领域作为研发重点,并在数据开发上取得了显著成果。截至 2024 年 5 月底,理光已成功开发超过 5000 个教学数据集,这些数据集将广泛应用于公司提供的各类人工智能解决方案中,为客户提供更加卓越、高效的服务体验。这一系列的突破不仅彰显了理光在前沿科技领域的强大实力,也为日语大语言模型的探索、优化与创新树立了新的行业标杆。
照亮未来,专用 LLM 启示企业数字化转型方向
在数字化转型的浪潮中,理光凭借其在数字化服务领域的深厚积累和对前沿技术的敏锐洞察,专注于为企业提供全面、高效的数字化解决方案。面对日本社会劳动力减少与老龄化的挑战,众多企业开始寻求运营创新,而人工智能的引入成为这些企业提高生产率和实现工作方式升级的关键。为此,理光致力于为企业量身定制专属的人工智能模型 (专用 LLM), 这一模型深度结合行业知识、业务细节以及企业特定的专业术语和短语,经过大量数据训练,确保能精准理解并满足企业的业务需求,从而在数字化转型的征程中为企业提供强有力的支持。
理光凭借其日语大语言模型的研发实力,结合企业的独特信息与知识,已成功开发出适用于不同领域的高精度专用 LLM。这些模型不仅易于定制,且高度适应日语语法,答案准确性高,能够充分发挥日本公司信息资产的价值。自 2024 年 4 月起,理光开始在云环境中提供这些专用 LLM, 助力客户在办公室和工作场所实现数字化转型。展望未来,理光将继续致力于为客户提供符合其业务需求、可灵活应用于各行业的人工智能服务,并不断结合具体工作场景,开发更多基于专用 LLM 的人工智能工具,为企业的数字化转型之路提供坚实的保障。
在日语大语言模型研发领域的探索与突破中,理光展现出了其深厚的技术底蕴和卓越的创新能力,这一成就不仅巩固了其在人工智能科技领域的领先地位,更为那些寻求数字化转型、渴望在数字时代中脱颖而出的企业提供综合解决方案。展望未来,理光将持续深化与各界的战略合作,积极拓宽人工智能技术的应用边界,推动科技与产业的深度融合,携手全球合作伙伴共同描绘一幅更加智能高效、人人“悦享工作”的数字蓝图。
*LLM:Large Language Model (大型语言模型)。通过理解句子中相隔较远的单词之间的关系,结合上下文的语言环境,来处理自然语言中存在的有多重含义和有歧义的内容。这项技术可以像人类一样精确地执行“回答自然句子问题”和“文档摘要提炼”等指令过程,而且也很容易学习。
本文链接:http://www.28at.com/showinfo-26-99924-0.html数字化转型新动力:理光研发专用 LLM,助力企业提升数字化转型
声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com