当前位置:首页 > 元宇宙 > AI

谷歌推出 DataGemma:基于可信数据源提高 AI 准确度,减少幻觉

来源: 责编: 时间:2024-09-14 16:06:21 30观看
导读 9 月 13 日消息,科技媒体 maginative 昨日(9 月 12 日)发布博文,报道谷歌公司基于谷歌数据共享(Data Commons)中的真实世界统计数据,推出了开放权重 Gemma 模型的新版本 DataGemma。语言模型当前面临的一大难题就是

9 月 13 日消息,科技媒体 maginative 昨日(9 月 12 日)发布博文,报道谷歌公司基于谷歌数据共享(Data Commons)中的真实世界统计数据,推出了开放权重 Gemma 模型的新版本 DataGemma。Fko28资讯网——每日最新资讯28at.com

Fko28资讯网——每日最新资讯28at.com

语言模型当前面临的一大难题就是幻觉(Hallucinations),尤其是大语言模型(LLMs)在处理数值或统计数据时,这一问题变得尤为棘手,因此精确性至关重要。Fko28资讯网——每日最新资讯28at.com

谷歌的 Data Commons 是一个存储库,汇集了来自联合国和疾病控制与预防中心等可信组织收集的超过 2400 亿个数据点。Fko28资讯网——每日最新资讯28at.com

通过利用这一庞大的统计数据集,基于 Gemini 的 DataGemma 能够显著提升模型准确性,确保其输出基于真实可信的现实世界信息。Fko28资讯网——每日最新资讯28at.com

Fko28资讯网——每日最新资讯28at.com

DataGemma 方法的核心在于两种关键技术:检索交错生成(RIG)和检索增强生成(RAG)。这两种方法通过在生成过程中将模型基于现实世界数据,从而减少幻觉现象。Fko28资讯网——每日最新资讯28at.com

简要介绍两项技术如下:Fko28资讯网——每日最新资讯28at.com

RIG:Fko28资讯网——每日最新资讯28at.com

通过主动查询可信来源,再生成回答的方式运作。在接收到提示词之后,DataGemma 会识别查询中的统计数据点,并从数据共享平台获取准确信息。Fko28资讯网——每日最新资讯28at.com

Fko28资讯网——每日最新资讯28at.com

例如,若被问及“全球可再生能源的使用量是否有所增加?”,该模型会在回答中穿插实时统计数据,确保事实准确性。Fko28资讯网——每日最新资讯28at.com

RAG:Fko28资讯网——每日最新资讯28at.com

在生成回答之前,会从数据共享平台检索相关信息,进一步提升了回答的质量。借助其长上下文窗口(由 Gemini 1.5 Pro 实现),DataGemma 确保了回答的全面性,引入了表格和脚注以提供更深层次的上下文,从而减少了虚构内容的出现。Fko28资讯网——每日最新资讯28at.com

Fko28资讯网——每日最新资讯28at.com

谷歌对 RIG 和 RAG 的研究尚处于初期阶段,但初步成果令人鼓舞。通过将现实世界数据嵌入回复中,DataGemma 模型在处理数值事实和统计查询方面展现出显著提升。研究团队已发表论文详述其方法,强调这些技术如何帮助 LLMs 判断何时依赖外部数据与内部参数。Fko28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-7165-0.html谷歌推出 DataGemma:基于可信数据源提高 AI 准确度,减少幻觉

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 安卓和 iOS 版谷歌 Gemini AI 应用新增 Gems 及管理器

下一篇: OpenAI o1 模型登场:开启 AI 通用复杂推理新篇章,模拟人类思考、处理问题

标签:
  • 热门焦点
Top