2023年中国语音合成声学(TTS)行业词条报告 头豹研究院 2023-05-30(1页) 附下载
发布机构:头豹研究院发布时间:2023-05-30大小:3.48 MB页数:共1页上传日期:2023-05-31语言:中文简体

2023年中国语音合成声学(TTS)行业词条报告头豹研究院2023-05-30.pdf

摘要:近年来,智能语音行业多家企业在上市程序上折戟沉沙。2月19日,上交所发布公告称,云知声和其保荐人中金公司于2021年2月18日向上交所提交了撤回IPO申请文件。根据规定,上交所决定终止云知声的发行上市审核。智能语音在上市程序上的表现不禁让市场疑惑,作为AI领域的重要组成部分,智能语音为何屡屡受挫,长期亏损?是技术原因还是市场导致?本文主要关注于智能语音中合成语音(TTS)部分的市场现状,了解TTS技术的现状,产业链情况,分析了TTS的技术应用场景以及未来的发展难点和趋势。1.语音合成(TTS)行业定义语音合成又称文语转换(TexttoSpeech,TTS)技术,是语音处理领域的一个重要研究方向,旨在让机器生成自然动听的人类语音。语音合成技术既可以单独适用于不同的场景之内,也可以作为尾部环节嵌入到语音交互的整体方案之中。语音合成的应用可以划分为单向语音输出类和交互类,单一使用单向语音输出类或交互类的场景并不多见,导航技术、阅读、配音、语音播报等场景下,单向语音输出应用比例较大,智能客服、智能机器人、泛娱乐产业、教育等场景下,交互类语音合成使用较多。2.语音合成(TTS)行业分类语音合成技术内部分为前端和后端。前端主要负责文本的语言解析和处理,其处理内容主要包括语种、分词、词性预测、多音字处理、韵律预测、情感等。把文本上的发音的这些信息都预测出来之后,将信息送给TTS的后端系统,后台声学系统融合这些信息之后,将内容转化为语音。后端声学系统发展历程较长,从第一代的语音拼接合成,到第二代的语音参数合成,到第三代端到端合成,后端声学系统的智能化程度逐步增加,训练素材需要标记的详细程度和难度也在逐步减弱。

免责声明:
1.本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。
2.如发布机构认为违背了您的权益,请与我们联系,我们将对相关资料予以删除。
3.资源付费,仅为我们搜集整理和运营维护费用,感谢您的支持!

合集服务:
单个细分行业的合集获取请联系行研君:hanyanjun830

关于上传者

文档

180

粉丝

0

关注

0
相关内容
加入星球
开通VIP,可免费下载 立即开通
开通VIP
联系客服 扫一扫

扫一扫
联系在线客服

公众号

扫一扫
关注我们的公众号

在线反馈
返回顶部