当前位置:首页 > 科技  > 网络

每10份音频就有8份被胡编 OpenAI语音转录工具被曝存重大缺陷

来源: 责编: 时间:2024-10-29 08:07:32 168观看
导读 生成式人工智能领域的领军者OpenAI,曾吹嘘其人工智能转录工具Whisper具有接近 “人类水平的稳定性和准确性”。然而,随着该转录工具在各行各业被越来越多地普及使用,其问题似乎也正开始凸显—&

生成式人工智能领域的领军者OpenAI,曾吹嘘其人工智能转录工具Whisper具有接近 “人类水平的稳定性和准确性”。o4028资讯网——每日最新资讯28at.com

然而,随着该转录工具在各行各业被越来越多地普及使用,其问题似乎也正开始凸显——根据业内媒体对十多位软件工程师、开发人员和学术研究人员的采访,如今Whisper所存在的一个重大缺陷已愈发不容忽视:它很容易会编造大段文字,甚至是整段句子。o4028资讯网——每日最新资讯28at.com

这些业内专家表示,一些编造出的文字——在行业内被称为“幻觉”,可能包括种族言论、暴力措辞,乃至完全杜撰出的医疗建议。o4028资讯网——每日最新资讯28at.com

专家们越来越担心这种“胡编乱造”可能造成严重后果,因为Whisper当前正被全球多个行业用于翻译和转录采访内容、生成文本以及为视频制作字幕。o4028资讯网——每日最新资讯28at.com

虽然OpenAI曾警告不应在“高风险领域”使用该工具,但目前一些美国医疗中心都正开始使用基于Whisper的工具,来记录患者与医生间的对话。o4028资讯网——每日最新资讯28at.com

据经常使用Whisper的研究人员和工程师表示,他们在工作中经常会遇到该工具出现“幻觉”。例如,密歇根大学的一名研究人员在研究公共会议的转录准确率时发现,他所审核的每十份音频转录中,便有八份存在“幻觉”。o4028资讯网——每日最新资讯28at.com

一位机器学习工程师则称,在他分析的100多个小时的Whisper转录中,他初发现大约有一半存在“幻觉”。第三位开发人员指出,在他用Whisper创建的26000份记录中,几乎每一份都发现了胡编乱造的现象。o4028资讯网——每日最新资讯28at.com

即使是在那些录制良好的简短音频样本里,问题也依然存在。在近的一项研究中,计算机科学家们在审查的超过13000个清晰音频片段中发现有187个存在“幻觉”问题。o4028资讯网——每日最新资讯28at.com

研究人员表示,这种趋势将导致在数百万段录音中出现数以万计的错误转录。o4028资讯网——每日最新资讯28at.com

每10份音频就有8份被胡编 OpenAI语音转录工具被曝存重大缺陷o4028资讯网——每日最新资讯28at.com

后果严重o4028资讯网——每日最新资讯28at.com

曾在拜登政府领导白宫科技政策办公室工作的Alondra Nelson表示,这种错误可能会造成“非常严重的后果”,尤其是在医院里。o4028资讯网——每日最新资讯28at.com

目前,包括明尼苏达州的曼卡托诊所和洛杉矶儿童医院在内的超过30000名临床医生和40个卫生系统,已开始使用法国AI诊疗公司Nabla基于Whisper打造的工具。o4028资讯网——每日最新资讯28at.com

Nabla公司的首席技术官Martin Raison表示,该工具根据医学语言进行了微调,以转录和总结医生与病人间的互动。该工具转录的就诊记录目前已多达约700万次。该公司官员还指出,他们知道Whisper会产生幻觉,并正在努力解决这个问题。o4028资讯网——每日最新资讯28at.com

目前担任普林斯顿高等研究院教授的Nelson表示,“没有人希望出现误诊。(该领域)应该有更高的标准。”o4028资讯网——每日最新资讯28at.com

目前,Whisper还被用于为聋人和听力障碍者制作字幕——这是一个特别容易因出现错误转录而陷入困境的人群,因为聋人和听力障碍者完全无法识别“隐藏在所有文本中”的编造内容。o4028资讯网——每日最新资讯28at.com

这种幻觉在Whisper中的普遍存在,已促使众多专家、倡导者和OpenAI前员工呼吁美国政府考虑制定人工智能法规。o4028资讯网——每日最新资讯28at.com

他们指出,OpenAI至少需要解决这一缺陷。今年2月因担心公司的发展方向而从OpenAI辞职的工程师William Saunders就表示,如果OpenAI愿意优先解决这个问题,这个问题似乎是可以解决的。而如果你长期把它放在那里,而人们对它的功能过于自信,并把它集成到所有这些其他系统中,那就有麻烦了。o4028资讯网——每日最新资讯28at.com

虽然大多数开发人员都认为转录工具不可避免会拼错单词或出现其他错误,但不少工程师和研究人员表示,他们从未见过其他人工智能转录工具像Whisper一样容易产生幻觉。o4028资讯网——每日最新资讯28at.com

目前,该工具已被集成到OpenAI旗舰聊天机器人ChatGPT的某些版本中,同时也是甲骨文和微软云计算平台的内置产品,为全球数千家公司提供服务。它还可用于将文本转录和翻译成多种语言。o4028资讯网——每日最新资讯28at.com

仅在上个月,开源人工智能平台HuggingFace上的一个Whisper新版本就被下载了420多万次。该平台的机器学习工程师Sanchit Gandhi表示,Whisper是流行的开源语音识别模型,从呼叫中心到语音助手,都内置了Whisper。o4028资讯网——每日最新资讯28at.com

康奈尔大学教授Allison Koenecke和弗吉尼亚大学教授Mona Sloane,目前已研究了他们从卡内基梅隆大学的研究资料库TalkBank中获得的数千个简短音频片段。他们发现,近40%的幻听是有害的或令人担忧的,因为说话者的原意可能被曲解或歪曲。o4028资讯网——每日最新资讯28at.com

研究人员并不确定Whisper和类似工具产生幻觉的原因,但软件开发人员表示,这些胡编乱造往往发生在出现停顿、背景声音或音乐播放时。OpenAI此前在网上披露的信息中曾建议,不要在决策情境中使用Whisper,因为准确性上的缺陷会导致结果上的明显缺陷。o4028资讯网——每日最新资讯28at.com

而针对新爆料,有OpenAI发言人回应称,OpenAI会在接下来的模型更新中加入相应的反馈机制。o4028资讯网——每日最新资讯28at.com

每10份音频就有8份被胡编 OpenAI语音转录工具被曝存重大缺陷o4028资讯网——每日最新资讯28at.com


文章出处:财联社

本文链接:http://www.28at.com/showinfo-17-122484-0.html每10份音频就有8份被胡编 OpenAI语音转录工具被曝存重大缺陷

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 特斯拉或被踢出科技七巨头 华尔街正重新评估 奈飞成备选!

下一篇: 世纪大互通!京东物流接入天猫后 菜鸟全面接入京东平台

标签:
  • 热门焦点
  • JavaScript 混淆及反混淆代码工具

    介绍在我们开始学习反混淆之前,我们首先要了解一下代码混淆。如果不了解代码是如何混淆的,我们可能无法成功对代码进行反混淆,尤其是使用自定义混淆器对其进行混淆时。什么是混
  • 从 Pulsar Client 的原理到它的监控面板

    背景前段时间业务团队偶尔会碰到一些 Pulsar 使用的问题,比如消息阻塞不消费了、生产者消息发送缓慢等各种问题。虽然我们有个监控页面可以根据 topic 维度查看他的发送状态,
  • 分布式系统中的CAP理论,面试必问,你理解了嘛?

    对于刚刚接触分布式系统的小伙伴们来说,一提起分布式系统,就感觉高大上,深不可测。而且看了很多书和视频还是一脸懵逼。这篇文章主要使用大白话的方式,带你理解一下分布式系统
  • 19个 JavaScript 单行代码技巧,让你看起来像个专业人士

    今天这篇文章跟大家分享18个JS单行代码,你只需花几分钟时间,即可帮助您了解一些您可能不知道的 JS 知识,如果您已经知道了,就当作复习一下,古人云,温故而知新嘛。现在,我们就开始今
  • 三分钟白话RocketMQ系列—— 如何发送消息

    我们知道RocketMQ主要分为消息 生产、存储(消息堆积)、消费 三大块领域。那接下来,我们白话一下,RocketMQ是如何发送消息的,揭秘消息生产全过程。注意,如果白话中不小心提到相关代
  • 重估百度丨“晚熟”的百度云,能等到春天吗?

    ©自象限原创作者|程心排版|王喻可2016年7月13日,百度云计算战略发布会在北京举行,宣告着百度智能云的正式启程。彼时的会场座无虚席,甚至排队排到了门外,在场的所有人几乎都
  • 拼多多APP上线本地生活入口,群雄逐鹿万亿市场

    Tech星球(微信ID:tech618)文 | 陈桥辉 Tech星球独家获悉,拼多多在其APP内上线了“本地生活”入口,位置较深,位于首页的“充值中心”内,目前主要售卖美食相关的
  • 网红炒股不为了赚钱,那就是耍流氓!

    来源:首席商业评论6月26日高调宣布入市,网络名嘴大v胡锡进居然进军了股市。在一次财经媒体峰会上,几个财经圈媒体大佬就“胡锡进炒股是否知道认真报道”展开讨论。有
  • 荣耀Magicbook V 14 2021曙光蓝版本正式开售,拥有触摸屏

    荣耀 Magicbook V 14 2021 曙光蓝版本正式开售,搭载 i7-11390H 处理器与 MX450 显卡,配备 16GB 内存与 512GB SSD,重 1.48kg,厚 14.5mm,具有 1.5mm 键盘键程、
Top