当前位置:首页 > 元宇宙 > AI

亚马逊推出全新 AI 语音模型 Nova Sonic,叫板 OpenAI 和谷歌

来源: 责编: 时间:2025-04-11 07:49:39 208观看
导读 4 月 9 日消息,亚马逊发布了名为 Nova Sonic 的新一代生成式 AI 模型,该模型能够原生处理语音并生成自然流畅的语音。据亚马逊声称,Nova Sonic 在速度、语音识别以及对话质量等关键指标的基准测试中,表现可与 Ope

4 月 9 日消息,亚马逊发布了名为 Nova Sonic 的新一代生成式 AI 模型,该模型能够原生处理语音并生成自然流畅的语音。据亚马逊声称,Nova Sonic 在速度、语音识别以及对话质量等关键指标的基准测试中,表现可与 OpenAI 和谷歌的前沿语音模型相媲美。sie28资讯网——每日最新资讯28at.com

sie28资讯网——每日最新资讯28at.com

Nova Sonic 的问世是亚马逊对新兴 AI 语音模型的有力回应,例如为 ChatGPT 语音模式提供支持的模型,相较于亚马逊早期的 Alexa 等较为刻板的模型,这些新模型在语音交互时更加自然。sie28资讯网——每日最新资讯28at.com

Nova Sonic 通过亚马逊的 Bedrock 开发者平台提供给用户,该平台是用于构建企业级 AI 应用的工具,Nova Sonic 则通过一个全新的双向流式 API 进行接入。在一份新闻稿中,亚马逊称 Nova Sonic 是市场上“最具成本效益”的 AI 语音模型,其价格比 OpenAI 的 GPT-4o 便宜约 80%。sie28资讯网——每日最新资讯28at.com

据亚马逊高级副总裁兼人工通用智能(AGI)部门首席科学家罗希特・普拉萨德介绍,Nova Sonic 的部分组件已经为亚马逊升级版数字语音助手 Alexa+ 提供了动力支持。sie28资讯网——每日最新资讯28at.com

普拉萨德表示,与竞争对手的 AI 语音模型相比,Nova Sonic 在将用户请求路由到不同 API 方面表现出色。这一能力使得 Nova Sonic 能够知晓何时需要从互联网获取实时信息、解析专有数据源,或者在外部应用程序中采取行动,并使用合适的工具来完成任务。sie28资讯网——每日最新资讯28at.com

在双向对话中,Nova Sonic 会等待“合适的时机”发言,会考虑到说话者的停顿和打断等情况。此外,Nova Sonic 还能够为用户的语音生成文本记录,开发者可以将这些文本用于各种应用场景。sie28资讯网——每日最新资讯28at.com

据普拉萨德介绍,Nova Sonic 在语音识别错误方面比其他 AI 语音模型更少,这意味着该模型即使在用户咕哝、说错话或者处于嘈杂环境中时,也相对擅长理解用户的意图。在一项衡量跨语言和方言的语音识别基准测试 —— 多语言 LibriSpeech 中,亚马逊表示 Nova Sonic 在英语、法语、意大利语、德语和西班牙语上的平均单词错误率(WER)仅为 4.2%。也就是说,在这些语言中,该模型每 100 个单词中大约有 4 个与人工转录的结果不同。sie28资讯网——每日最新资讯28at.com

注意到,在另一项衡量多人参与的高音量互动的基准测试 —— 增强多方互动中,亚马逊称 Nova Sonic 在单词错误率方面比 OpenAI 的 GPT-4o-transcribe 模型准确率高出 46.7%。Nova Sonic 还拥有行业领先的速度,其平均感知延迟为 1.09 秒,亚马逊表示。这一速度比为 OpenAI 的实时 API 提供动力的 GPT-4o 模型更快,后者响应时间为 1.18 秒,这是根据人工分析的基准测试结果得出的。sie28资讯网——每日最新资讯28at.com

普拉萨德称,Nova Sonic 是亚马逊构建人工通用智能(AGI)这一更广泛战略的一部分,公司定义 AGI 为“能够在计算机上完成人类所能做的一切事情的 AI 系统”。展望未来,普拉萨德表示,亚马逊计划推出更多能够理解不同模态(包括图像、视频和语音)的 AI 模型,以及“其他在将事物引入物理世界时相关的感官数据”。sie28资讯网——每日最新资讯28at.com

由普拉萨德负责的亚马逊 AGI 部门,如今似乎在公司产品战略中扮演着越来越重要的角色。就在上周,亚马逊刚刚推出了 Nova Act 的预览版,这是一个使用浏览器的 AI 模型,似乎为 Alexa+ 和亚马逊的“代我购买”功能的部分元素提供了支持。普拉萨德表示,从 Nova Sonic 开始,公司希望将更多内部的 AI 模型提供给开发者使用,以助力他们构建各种应用。sie28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12144-0.html亚马逊推出全新 AI 语音模型 Nova Sonic,叫板 OpenAI 和谷歌

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 皮尤报告:美国公众对 AI 态度消极

下一篇: 三星进军 AI 机器人领域,Ballie 本周公开亮相

标签:
  • 热门焦点
  • FMIFAwards奖项即将揭晓!

    来源:X增强现实FMIF Awards未来元宇宙创新奖是由未来元宇宙创新论坛、ARinChina以及多家投资机构、媒体、研究院联合发起的一项评选活动。旨在推动新技术的融合与集成低成本
  • 《蜘蛛侠》火了,超级英雄就该这么演

    燃次元(ID:chaintruth)原创作者 | 陶 淘编辑 | 曹 拿下豆瓣8.8分、IMDB 9.1的高分,6月2日在全球同步上映的《蜘蛛侠:纵横宇宙》(以下简称《蜘蛛侠》),上映不足一周,便在国内“
  • 中国虚拟数字人如何横向拓展市场需求,探索发展场景?

    通过5G、AI等新技术更新换代,虚拟数字人为诸多下游行业带来新的发展机会。虚拟数字人技术以其简化性和精品性持续拓展泛娱乐、金融、教育、政务、医疗、零售等
  • 现在的元宇宙:一款低配版的科幻游戏

    在2021年的岁末之际,不禁感叹元宇宙元年之热闹,从元宇宙NFT头像,到元宇宙数字地产,再到元宇宙旅游景区等等,仿佛科幻感十足的元宇宙眨眼间就从人们的概念认知中完全
  • 避坑指南:远离具有这些特性的NFT

    关于NFT,在我们的文章中一直以来都是常驻嘉宾,不止因为NFT背后隐藏的潜力,更因为在这个NFT世界里冥冥之中仿佛有一双幕后的手,OpenSea、库里、ERC115、视觉中国、
  • 元宇宙社交时代,华丽归来的超级QQ秀重构虚拟社交场景

    作者:狂人 不知不觉间,QQ已经迎来了第23个生日。作为国内社交平台的起点,QQ可谓是睥睨全网,不仅有庞大的用户群体,还将虚拟形象及QQ整合成在线虚拟社区,开启了时髦
  • 重温 1602 年:DAO 是新的企业范式吗?

    作者:Andrew Singer“ 将你的选票委托给行业有能力的专家,将使所有者在这些公司的管理中拥有更强大、更清晰的话语权 。”1602 年,荷兰东印度公司成立,许多人认为
  • 知名艺术家打造去中心化“好莱坞”:一部电影一个DAO

    根据市场追踪网站 DappRadar 的数据,随着 NFT 的“出圈”与加密货币的普及,NFT 市场在 2021 年的销售额达到约 250 亿美元,而 2020 年仅为 9490 万美元,同比增超 2
  • 虚拟邓丽君后,数字人赛道开启3.0时代

    “如果右脑时代来临,虚拟世界将是对人类才华的无限放大。” 郭晓喆称,开发数字人形象时,自己的团队在内部“卷”了一下:“当我们翻阅大量历史典籍的时候,苏小妹找到
Top