(共14张PPT)
合成技术
语音
洛天依 (VOCALOID虚拟歌手)
以Yamaha公司的VOCALOID3语音合成引擎为基础制作的全世界第一款VOCALOID中文声库和虚拟形象
语音合成技术
语音合成是利用计算机模拟人的发音而产生人造语音的技术。
语音合成技术的应用场景
1、导航系统
2、叫号系统
3、查询系统
语音识别技术
语音合成技术
声音→文字
文字→声音
体验语音合成技术
音库定制
导航中的林志玲语音,真的是一条条录出来的吗?
语音合成的过程——以 高德地图为例
前期准备
语音库
语音合成的过程
文本
大家/上午/好
语言处理
对将要转换的文本进行语法和词法分析,同时对文本进行分割,并根据特定的语境,形成特定的音素。
词典规则
1.语言处理
32个音素:b、p、m、f、z、c、s、d、t、n、1、zh、ch、sh、r、j、q、x、g、k、h、ng,a、o、e、ê、i、u、ü、-i[ ](前i)和-i[ι](后i)、er
语音合成的过程
文本
大家/上午/好
语言处理
韵律处理
进一步参照人类语言中的韵律规则进行调整,规划出音段特征,如音高、音长和音强等,使合成的语音能正确地表达语意,听起来更加自然。
2.韵律处理
词典规则
语音合成的过程
文本
大家/上午/好
语言处理
单元拼接
韵律处理
调用语音库中的音素单元,进行拼接和平滑处理,从而形成语音。
3.语言处理
词典规则
语音库
语音合成的过程
文本
大家/上午/好
语音输出
语言处理
语言处理
韵律处理
讯飞、阿里......
语音合成技术实践
本课作业
完成问卷作业