当前位置:首页 > 元宇宙 > AI

阿里云通义千问开源两款语音基座模型,识别效果优于 OpenAI Whisper

来源: 责编: 时间:2024-07-12 08:25:23 253观看
导读 7 月 9 日消息,阿里云通义千问开源了两款语音基座模型 SenseVoice(用于语音识别)和 CosyVoice(用于语音生成)。SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测,有以下特点:多语言识别:采用超过 40

7 月 9 日消息,阿里云通义千问开源了两款语音基座模型 SenseVoice(用于语音识别)和 CosyVoice(用于语音生成)。2yF28资讯网——每日最新资讯28at.com

2yF28资讯网——每日最新资讯28at.com

SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测,有以下特点:2yF28资讯网——每日最新资讯28at.com

多语言识别:采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型2yF28资讯网——每日最新资讯28at.com

富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果;支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测2yF28资讯网——每日最新资讯28at.com

高效推理:SenseVoice-Small 模型采用非自回归端到端框架,推理延迟极低,10s 音频推理仅耗时 70ms,15 倍优于 Whisper-Large2yF28资讯网——每日最新资讯28at.com

微调定制:具备便捷的微调脚本与策略,方便用户根据业务场景修复长尾样本问题2yF28资讯网——每日最新资讯28at.com

服务部署:具有完整的服务部署链路,支持多并发请求,支持的客户端语言有 python、c++、html、java 与 c#等2yF28资讯网——每日最新资讯28at.com

与开源情感识别模型进行对比,SenseVoice-Large 模型可以在几乎所有数据上都达到了最佳效果,而 SenseVoice-Small 模型同样可以在多数数据集上取得超越其他开源模型的效果。2yF28资讯网——每日最新资讯28at.com

2yF28资讯网——每日最新资讯28at.com

CosyVoice 模型同样支持多语言、音色和情感控制,该模型在多语言语音、零样本语音生成、跨语言语音克隆和指令跟随等功能方面表现出色。2yF28资讯网——每日最新资讯28at.com

附相关链接:2yF28资讯网——每日最新资讯28at.com

SenseVoice:https://github.com/FunAudioLLM/SenseVoice2yF28资讯网——每日最新资讯28at.com

CosyVoice:https://github.com/FunAudioLLM/CosyVoice2yF28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-5094-0.html阿里云通义千问开源两款语音基座模型,识别效果优于 OpenAI Whisper

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: “国内首款破局性 AI 开发工具”,中国电信发布星辰软件工厂:产品文档生成代码

下一篇: 振兴乡村发展 助力青少年教育 中国三星连续十一年蝉联企业社会责任榜外企第一

标签:
  • 热门焦点
  • 《蜘蛛侠》火了,超级英雄就该这么演

    燃次元(ID:chaintruth)原创作者 | 陶 淘编辑 | 曹 拿下豆瓣8.8分、IMDB 9.1的高分,6月2日在全球同步上映的《蜘蛛侠:纵横宇宙》(以下简称《蜘蛛侠》),上映不足一周,便在国内“
  • “啫喱”超越微信登顶:首款“元宇宙社交App”会昙花一现吗?

    作者| 赤木瓶子如何终结“昙花一现”的命运,是潮流社交产品的长期命题,如今,在元宇宙浪潮的洗礼下,这一命题正在迎来新的可能性。近段时间,一款名为“啫喱”的社交A
  • 从虚拟餐厅到虚拟时装秀,行业巨头掀起元宇宙商标注册潮

    自从 Facebook 更名为 Meta 后,关于元宇宙的讨论愈发激烈,这一词汇也越来越多的出现在我们的视野里。这是一个非常有趣的话题。伴随着争论,有些人认为是马克·扎
  • 纽约街头出现NFT自动贩卖机

    一家初创公司宣布在纽约市开放一台NFT自动售货机,允许任何人——即使是没有加密资产的人也能购买NFT。该交易平台名为Neon,上个月完成了一轮300万美元的种子募捐
  • 以用户为中心,Web3和区块链如何将用户放在首位

    竞争优势正在改变竞争优势是每个企业都在努力争取的,由谷歌、Facebook和Netflix等大型科技公司主导的市场中,两大重要类别的竞争优势十分突出。第一个竞争优势来
  • 元宇宙需要的5个重要安全功能

    元宇宙的可能用途使其成为一个令人难以置信的概念,但是,就像科技界的任何事物一样,需要做一些事情来控制其使用。元宇宙的安全功能需要仔细考虑和开发,以保护用户
  • 美国单曲排行榜Billboard和World of Women合作推出NFT杂志封面

    今天,Billboard宣布与流行的NFT头像集World of Women(WoW)建立新的伙伴关系,向NFT生态系统又迈进了一步。在这次合作中,WoW的创建者Yam Karkai将帮助这个音乐行业巨
  • 元宇宙收割了谁

    作者:晓宇资本将元宇宙看作下一代互联网的门票,画大饼、割韭菜就成了一大选项。2021年被称为元宇宙元年。在这一年里,先是号称元宇宙第一股的沙盒游戏Roblox盛装
  • 爆发在即的Layer2赛道百花齐放,谁将是领跑者?

    还记得几年前最早我们提起ETH扩容,首先想到就是Layer2,而Layer2里,首先想到的是闪电网络,状态通道,Plasma…然后折腾了几年,发现并没有什么用,许多项目方和资本也等不
Top