当前位置:首页 > 科技  > 软件

11个优秀开源TTS引擎

来源: 责编: 时间:2024-01-03 11:36:19 333观看
导读TTS引擎用于实现文本到语音的转换。随着人工智能的普及以及数字设备应用的增加,相关系统对语音识别以及文语转换技术日益依赖,TTS正在变得越来越重要。在这项技术的帮助下,可以将文本内容转换为录音。可以帮助视觉障碍的

TTS引擎用于实现文本到语音的转换。随着人工智能的普及以及数字设备应用的增加,相关系统对语音识别以及文语转换技术日益依赖,TTS正在变得越来越重要。9nF28资讯网——每日最新资讯28at.com

在这项技术的帮助下,可以将文本内容转换为录音。可以帮助视觉障碍的人理解文本内容,可以让开车的人听取一个文本工作报告,甚至模拟某个人的声音播报一段内容、演唱一个歌曲,实现虚拟主播、虚拟歌手。9nF28资讯网——每日最新资讯28at.com

本文主要查找收集了一些较好的开源TTS引擎。这些项目有助于我们更加了解TTS的功能。9nF28资讯网——每日最新资讯28at.com

9nF28资讯网——每日最新资讯28at.com

1.CoQui TTS

https://github.com/coqui-ai/TTS9nF28资讯网——每日最新资讯28at.com

这是一个在研究和生产中经过了实战考验的TTS深度学习工具包,可以以200毫秒的延迟进行流传输,支持13种语言(包括中文)。9nF28资讯网——每日最新资讯28at.com

2.mozilla TTS

https://github.com/mozilla/TTS9nF28资讯网——每日最新资讯28at.com

TTS是一个用于文本到语音生成的高级库。旨在实现易于训练、高速度和高质量的最佳平衡。 提供预训练模型,以及用于测量数据集质量的工具,支持用于产品和研究的20多种语言,包括支持中文。9nF28资讯网——每日最新资讯28at.com

3.OpenTTS

https://github.com/synesthesiam/opentts9nF28资讯网——每日最新资讯28at.com

OpenTTS是TTS最有效的开源模型之一。因为该模型支持包括中文在内的多种语言。9nF28资讯网——每日最新资讯28at.com

4.MaryTTS

https://github.com/marytts/marytts9nF28资讯网——每日最新资讯28at.com

MARY Text-to-Speech 语音合成是一个多语言TTS平台,支持英语(英国和美国)、法语、德语、意大利语、俄语等语言。9nF28资讯网——每日最新资讯28at.com

产品特点:9nF28资讯网——每日最新资讯28at.com

  • 使用预处理技术,如tokenizer和数值扩展。
  • 它采用多线程网络架构,并行处理多个请求。
  • 它本质上是灵活的,因此您可以使用纯Java模型和外部模型。
  • 它使用XML结构来提高透明度,并且对于普通用户来说易于理解。

5.eSpeak

https://github.com/espeak-ng/espeak-ng9nF28资讯网——每日最新资讯28at.com

eSpeak是一个紧凑的开源TTS引擎,可运行于Windows和Linux。支持100多种语种和语音(包括中文普通话)。9nF28资讯网——每日最新资讯28at.com

产品特点:9nF28资讯网——每日最新资讯28at.com

  • 这个平台可以很容易地完成文本到语音的转换。这有助于系统理解文本的含义。
  • 它带有两个合成器:eSpeakinG合成器,通过声音添加技术转换元音和响亮的辅音,以完成声音。Klatt合成器使用类似的技术,但使用减法合成。它使用数字滤波器来理解辅音、元音和响音之间的区别。
  • 因为它的差异化技术和将文本转换为语音的速度优势,这个工具在2010年被谷歌翻译使用。
  • 声音的音质清晰悦耳。

6.Mimic

https://github.com/MycroftAI/mimic39nF28资讯网——每日最新资讯28at.com

Mimic是一个快如闪电的开源TTS引擎。9nF28资讯网——每日最新资讯28at.com

产品特点:9nF28资讯网——每日最新资讯28at.com

  • 由于它基于FLITE技术,您可以自定义语音的声音。
  • 它是一个低延迟平台,并且只占用少量的资源。
  • 它可以在Linux、Android和Windows上无缝运行。

目前,该工具正在为患有语言障碍的人带来逼真的声音。9nF28资讯网——每日最新资讯28at.com

9nF28资讯网——每日最新资讯28at.com

7.CMU Flite TTS

https://github.com/festvox/flite9nF28资讯网——每日最新资讯28at.com

Festival Lite通常被称为Flite。它是一个小型的运行时引擎,被认为是最快的TTS引擎之一。9nF28资讯网——每日最新资讯28at.com

由于它是一个开源引擎,并且是免费的,可以基于这个项目做许多自定义功能。因此,许多公司都选择了这个TTS引擎。9nF28资讯网——每日最新资讯28at.com

核心特点:9nF28资讯网——每日最新资讯28at.com

  • 可以用于小型和大型文件。
  • 它是线程安全的,其最新版本提供了一个轻松的TTS转换。
  • 它与Windows、Linux和Android兼容。
  • 它还提供多种语言版本。

9nF28资讯网——每日最新资讯28at.com

8.MBROLA

https://github.com/numediart/MBROLA9nF28资讯网——每日最新资讯28at.com

MBROLA是Multi-Band Resynthesis OverLap Add的缩写,也是最常用的开源TTS引擎之一。它支持多种语言。9nF28资讯网——每日最新资讯28at.com

功能特点:9nF28资讯网——每日最新资讯28at.com

  • 提供多语种数据库。
  • 它对于内部文本到语音的转换非常有用。
  • 它以前是一个非商业软件,但现在作为开源TTS引擎推出。
  • 它提供了令人愉快的音质,具有一致性、准确性的声音音高。

9nF28资讯网——每日最新资讯28at.com

9.mandarin-tts

https://github.com/ranchlai/mandarin-tts9nF28资讯网——每日最新资讯28at.com

这是一个模块化的中文普通话TTS语音合成框架,旨在支持研究和快速产品开发。9nF28资讯网——每日最新资讯28at.com

主要功能包括:9nF28资讯网——每日最新资讯28at.com

  • 所有模块都可通过YAML配置,
  • 支持并可配置说话者嵌入/韵律嵌入/多流文本嵌入,
  • 适配器支持各种声码器(VocGAN、hifi-GAN、waveglow、melGAN),从而可以容易地进行不同声码器之间的比较,
  • 支持持续时间/音调/能量方差预测器,并且可以容易地添加其他方差,

9nF28资讯网——每日最新资讯28at.com

10.FCH-TTS

https://github.com/atomicoo/FCH-TTS9nF28资讯网——每日最新资讯28at.com

一个快速语音合成模型,适用于英语、普通话/中文、日语、韩语、俄语和藏语。9nF28资讯网——每日最新资讯28at.com

11.rhasspy piper

https://github.com/rhasspy/piper9nF28资讯网——每日最新资讯28at.com

9nF28资讯网——每日最新资讯28at.com

piper是一个快速的本地语音合成系统,并针对Raspberry Pi 4(树莓)进行了优化。 支持包括中文在内的多种语言。9nF28资讯网——每日最新资讯28at.com

使用DEMO如:9nF28资讯网——每日最新资讯28at.com

echo 'Welcome to the world of speech synthesis!' | /  ./piper --model en_US-lessac-medium.onnx --output_file welcome.wav

本文链接:http://www.28at.com/showinfo-26-56598-0.html11个优秀开源TTS引擎

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: Prometheus Go client library 详解

下一篇: 去测试化真的可行吗?

标签:
  • 热门焦点
  • Automa-通过连接块来自动化你的浏览器

    1、前言通过浏览器插件可实现自动化脚本的录制与编写,具有代表性的工具就是:Selenium IDE、Katalon Recorder,对于简单的业务来说可快速实现自动化的上手工作。Selenium IDEKat
  • K8S | Service服务发现

    一、背景在微服务架构中,这里以开发环境「Dev」为基础来描述,在K8S集群中通常会开放:路由网关、注册中心、配置中心等相关服务,可以被集群外部访问;图片对于测试「Tes」环境或者
  • Flowable工作流引擎的科普与实践

    一.引言当我们在日常工作和业务中需要进行各种审批流程时,可能会面临一系列技术和业务上的挑战。手动处理这些审批流程可能会导致开发成本的增加以及业务复杂度的上升。在这
  • 在线图片编辑器,支持PSD解析、AI抠图等

    自从我上次分享一个人开发仿造稿定设计的图片编辑器到现在,不知不觉已过去一年时间了,期间我经历了裁员失业、面试找工作碰壁,寒冬下一直没有很好地履行计划.....这些就放在日
  • .NET 程序的 GDI 句柄泄露的再反思

    一、背景1. 讲故事上个月我写过一篇 如何洞察 C# 程序的 GDI 句柄泄露 文章,当时用的是 GDIView + WinDbg 把问题搞定,前者用来定位泄露资源,后者用来定位泄露代码,后面有朋友反
  • 国行版三星Galaxy Z Fold5/Z Flip5发布 售价7499元起

    2023年8月3日,三星电子举行Galaxy新品中国发布会,正式在国内推出了新一代折叠屏智能手机三星Galaxy Z Fold5与Galaxy Z Flip5,以及三星Galaxy Tab S9
  • 引领旗舰级影像能力向中端机普及 OPPO K11 系列发布 1799 元起

    7月25日,OPPO正式发布K系列新品—— OPPO K11 。此次 K11 在中端手机市场长期被忽视的影像板块发力,突破性地搭载索尼 IMX890 旗舰大底主摄,支持 OIS
  • 朋友圈可以修改可见范围了 苹果用户可率先体验

    近日,iOS用户迎来微信8.0.27正式版更新,除了可更换二维码背景外,还新增了多项实用功能。在新版微信中,朋友圈终于可以修改可见范围,简单来说就是已发布的朋友圈
  • 最薄的14英寸游戏笔记本电脑 Alienware X14已可以购买

    2022年1月份在国际消费电子展(CES2022)上首次亮相的Alienware新品——Alienware X14现在已经可以购买了,这款笔记本电脑被誉为世界上最薄的 14 英寸游戏笔
Top