第二单元 第6课 语音合成技术 课件+教案+素材 浙教版(2023)信息科技八年级下册

文档属性

名称 第二单元 第6课 语音合成技术 课件+教案+素材 浙教版(2023)信息科技八年级下册
格式 zip
文件大小 81.3MB
资源类型 试卷
版本资源 浙教版
科目 信息技术(信息科技)
更新时间 2026-02-25 00:00:00

文档简介

(共27张PPT)
第二单元 第6节
语音合成技术
(浙教版)八年级

1
核心素养目标
3
新知讲解
5
拓展延伸
7
板书设计
2
新知导入
4
课堂练习
6
课堂总结
课后作业
8
01
核心素养目标
信息意识
计算思维
数字化学习与创新
信息社会责任
能够认识到语音合成在导航、叫号等场景的价值,理解技术应用的责任与未来发展方向。
能够通过 AI 开放平台实践文本转语音,尝试不同发音人合成,创新探究语音合成的实践方式。
能够学会分析语音合成的基本步骤,对比规则分词与统计分词的差异,理解技术实现的逻辑规律。
能够了解语音合成的应用场景与技术发展脉络,理清从早期样本训练到端到端合成的演进过程。
03
新知讲解
第六节:语音合成技术
学习目标
通过对语音合成应用的体验,能初步理解语音合成技术的基本过程和原理,体会语音合成技术在生活中的运用。
03
新知讲解
第六节:语音合成技术
03
新知讲解
在电子导航系统中,用你自己的声音进行语音播报,为什么只需录制少量语音就可以实现
你知道让机器能够比较自然地发音的关键是什么吗
03
新知讲解
语音合成是利用计算机模拟人的发音而产生人造语音的技术。通俗地讲,就是将文本转换成人类可以听得懂并且流利的语音。
03
新知讲解
一、语音合成的应用场景
语音合成技术已广泛应用于日常生活中。例如,语音合成技术应用于车载导航系统,当出现新的路况时,车载导航系统能即时语音播报消息,应用于医院、银行等场所的叫号系统,能播报任意一个用户的姓名,也应用于电话查询系统,如考试成绩的查询等。随着人工智能的发展,合成语音的自然度和音质均得到明显的改善,已非常接近人类的自然语音发声。
03
新知讲解
二、语音合成的过程
语音合成的基本过程为:先将文本分解成音素,经过韵律处理后,再根据音素在语音库中找到发音单元,并输出拼接的发音单元,从而形成语音,如图6-1所示。
03
新知讲解
1.语音处理
对将要转换的文本进行语法和词法分析,同时对文本进行分割,并根据特定的语境,形成特定的音素。
汉语中,词是构成句子的最小单位。在句子中的词语有确定的语音、语义和语法功能。词可以是一个字,也可以是多个字构成。因此在处理中文文本时,需要进行分词处理。计算机对中文进行文本分词有各种方法,如基于规则的规则分词法,基于统计的统计分词法。
03
新知讲解
早期,科学家认为计算机对自然语言处理的过程与人类学习一门语言类似,试图用算法描述语法、词性和构词法等规则,并导人语言学知识,从而建立基于规则的自然语言处理。基于规则的方法需要专家们的配合,要以人力方式全面考虑所有可能的情况。随着规则数量和团队人数的增加,需要考虑的问题也越来越多,系统难以拓展。
统计分词是基于语料库的分析,从训练的语言数据中自动或半自动获取语言的统计知识,有效地建立语言模型,并对句子进行单词划分,划分结果运用统计方法计算概率,获取概率最大的分词方式。统计分词在很大程度上依赖训练语言数据的规模,训练的语言数据越多,效果越好,分词越准确。
03
新知讲解
2.韵律处理
在音素分析的基础上,进一步参照人类语言中的简律规则进行调整,规划出音段特征,如音高、音长和音强等,使合成语音能正确地表达语意,听起来更加自然。
3.单元拼接
在语言规律和韵律规律已经明确的基础上,调用语音库中的音素单元,进行拼接和平滑处理,从而形成语音。
03
新知讲解
以前,创建一个高质量的语音合成模型需要大量真人原声作为样本进行机器学习,样本量会超过10小时或10000句。现在,基于深度神经网络的端到端语音合成系统,只需采集半小时左右、500句真人原声录音,通过语音模型,即可惟妙惟肖地复原真人原声。
基于深度神经网络的端到端语音合成,借助训练好的声学模型,可以根据输人文本直接合成语音。
03
新知讲解
亲身体验
韵律
韵律是一个听觉感知的概念。在自然语言中,说话者使用语调、节奏和重音等方式来表达意向和情感,使得字词的搭配、音调更加和谐,这些韵律特征是自然语音的重要组成部分。
03
新知讲解
三、语音合成的实践
通过人工智能开放平台提供的软件开发工具包,可以把文本文件转换成语音文件;也可以采用在线合成语音的方式,先输入文本,再输出相应的语音信息。例如,利用人工智能开放平台,将输人的文本信息转换成语音,识别过程如图6-2所示。图6-3为平合语音合成代码示例。
03
新知讲解
日积月累
在人工智能开放平台、APP或软件中,将一段文本信息分别转换成语音。
打开 AI 开放平台或语音合成 APP,进入文本转语音功能。输入或粘贴目标文本,按需选择音色、语速、语调。点击合成按钮,等待 AI 生成语音。生成后可在线试听,确认效果后下载音频文件。操作简单易懂,无需专业技术,不同平台流程相近,能快速把文字转为自然流畅的语音。
03
新知讲解
随堂练习
1.在人工智能开放平台中,改变不同的“发音人”,将同一文本内容转换成不同发本的语音。
2.研究一个生活中语音合成的应用案例,尝试剖析语音合成技术的实现过程。打开想象的翅膀,展望未来语音合成的应用等。
车载导航是生活中典型的语音合成应用,可实时清晰播报路线与安全提示。其实现过程为先对文本进行语句拆分、读音标注等预处理,再通过声学模型提取音色、语调特征,最后合成流畅自然的语音。未来语音合成可定制专属情感音色,精准适配各地方言,广泛应用于智能助老、有声读物、虚拟陪伴等场景,让交互更贴近真人,为生活带来更多便利与温度。
04
课堂练习
一、选择题
1、将文本信息转换为语音的技术是( )
A. 语音合成 B. 语音识别
C. 图像识别 D. 数据加密
2、下列不属于语音合成应用的是( )
A. 车载导航播报 B. 有声小说朗读
C. 录音转文字 D. 智能音箱播报
A
C
04
课堂练习
3、语音合成的首要步骤是( )
A. 文本预处理 B. 语音采集
C. 音频输出 D. 特征分析
4、能让合成语音更自然的操作是( )
A. 调整音色语速 B. 随意删减文字
C. 增大环境噪音 D. 缩短文本长度
A
A
04
课堂练习
二、判断题
1、语音合成的核心是把文字转化为流畅语音。( )
2、语音合成与语音识别是完全相同的技术。( )
3、智能助老设备的语音提醒用到语音合成。( )
4、文本预处理是语音合成的重要环节。( )
5、未来语音合成可实现情感化、方言化发音。( )

X



05
拓展延伸
语言合成技术
05
拓展延伸
语音合成流程
语音合成先对文本进行分词、标音等预处理,再提取语言特征,通过声学模型生成语音信号,最终输出流畅音频。文本处理规范、模型优化,能让合成语音更清晰自然,是技术实现的核心环节。
05
拓展延伸
合成技术演进
早期语音合成生硬机械,如今 AI 端到端模型大幅提升自然度。深度学习让语音合成能模拟语调、停顿,贴近真人发音,不仅效率提升,还能适配多场景,推动技术从实用走向拟人化。
05
拓展延伸
合成应用未来
未来语音合成可定制情感与专属音色,精准适配方言与特殊场景。在智能助老、有声阅读、虚拟交互中广泛应用,打破语言与沟通障碍,让语音交互更有温度,成为生活智能化的重要支撑。
08
板书设计
语音合成技术
一、语音合成的应用场景
二、语音合成的过程
三、语音合成的实践
课后作业:
1、实践文本转语音,尝试不同音色并分析效果,畅想其生活应用场景。
https://www.21cnjy.com/recruitment/home/fine中小学教育资源及组卷应用平台
第2.6课《语音合成技术》教学设计
课题 语音合成技术 单元 第二单元 学科 信息技术 年级 八年级
核心素养目标 信息意识:能够了解语音合成的应用场景与技术发展脉络,理清从早期样本训练到端到端合成的演进过程。计算思维:能够学会分析语音合成的基本步骤,对比规则分词与统计分词的差异,理解技术实现的逻辑规律。数字化学习与创新:能够通过 AI 开放平台实践文本转语音,尝试不同发音人合成,创新探究语音合成的实践方式。信息社会责任:能够认识到语音合成在导航、叫号等场景的价值,理解技术应用的责任与未来发展方向。
教学重点 能够了解语音合成的应用场景与技术发展脉络,理清从早期样本训练到端到端合成的演进过程。
教学难点 能够认识到语音合成在导航、叫号等场景的价值,理解技术应用的责任与未来发展方向。
教学过程
教学环节 教师活动 学生活动 设计意图
导入新课 第2.6课 语音合成技术一、新知引入1、学习目标:通过对语音合成应用的体验,能初步理解语音合成技术的基本过程和原理,体会语音合成技术在生活中的运用。(播放视频)在电子导航系统中,用你自己的声音进行语音播报,为什么只需录制少量语音就可以实现 你知道让机器能够比较自然地发音的关键是什么吗 观视频思考导航语音播报、机器自然发音关键 引导学生聚焦语音合成核心逻辑
讲授新课 新知讲解:语音合成是利用计算机模拟人的发音而产生人造语音的技术。通俗地讲,就是将文本转换成人类可以听得懂并且流利的语音。一、语音合成的应用场景语音合成技术已广泛应用于日常生活中。例如,语音合成技术应用于车载导航系统,当出现新的路况时,车载导航系统能即时语音播报消息,应用于医院、银行等场所的叫号系统,能播报任意一个用户的姓名,也应用于电话查询系统,如考试成绩的查询等。随着人工智能的发展,合成语音的自然度和音质均得到明显的改善,已非常接近人类的自然语音发声。二、语音合成的过程语音合成的基本过程为:先将文本分解成音素,经过韵律处理后,再根据音素在语音库中找到发音单元,并输出拼接的发音单元,从而形成语音,如图6-1所示。1.语音处理 对将要转换的文本进行语法和词法分析,同时对文本进行分割,并根据特定的语境,形成特定的音素。 汉语中,词是构成句子的最小单位。在句子中的词语有确定的语音、语义和语法功能。词可以是一个字,也可以是多个字构成。因此在处理中文文本时,需要进行分词处理。计算机对中文进行文本分词有各种方法,如基于规则的规则分词法,基于统计的统计分词法。早期,科学家认为计算机对自然语言处理的过程与人类学习一门语言类似,试图用算法描述语法、词性和构词法等规则,并导人语言学知识,从而建立基于规则的自然语言处理。基于规则的方法需要专家们的配合,要以人力方式全面考虑所有可能的情况。随着规则数量和团队人数的增加,需要考虑的问题也越来越多,系统难以拓展。 统计分词是基于语料库的分析,从训练的语言数据中自动或半自动获取语言的统计知识,有效地建立语言模型,并对句子进行单词划分,划分结果运用统计方法计算概率,获取概率最大的分词方式。统计分词在很大程度上依赖训练语言数据的规模,训练的语言数据越多,效果越好,分词越准确。2.韵律处理在音素分析的基础上,进一步参照人类语言中的简律规则进行调整,规划出音段特征,如音高、音长和音强等,使合成语音能正确地表达语意,听起来更加自然。 3.单元拼接在语言规律和韵律规律已经明确的基础上,调用语音库中的音素单元,进行拼接和平滑处理,从而形成语音。以前,创建一个高质量的语音合成模型需要大量真人原声作为样本进行机器学习,样本量会超过10小时或10000句。现在,基于深度神经网络的端到端语音合成系统,只需采集半小时左右、500句真人原声录音,通过语音模型,即可惟妙惟肖地复原真人原声。基于深度神经网络的端到端语音合成,借助训练好的声学模型,可以根据输人文本直接合成语音。亲身体验韵律 韵律是一个听觉感知的概念。在自然语言中,说话者使用语调、节奏和重音等方式来表达意向和情感,使得字词的搭配、音调更加和谐,这些韵律特征是自然语音的重要组成部分。三、语音合成的实践通过人工智能开放平台提供的软件开发工具包,可以把文本文件转换成语音文件;也可以采用在线合成语音的方式,先输入文本,再输出相应的语音信息。例如,利用人工智能开放平台,将输人的文本信息转换成语音,识别过程如图6-2所示。图6-3为平合语音合成代码示例。日积月累在人工智能开放平台、APP或软件中,将一段文本信息分别转换成语音。答:打开 AI 开放平台或语音合成 APP,进入文本转语音功能。输入或粘贴目标文本,按需选择音色、语速、语调。点击合成按钮,等待 AI 生成语音。生成后可在线试听,确认效果后下载音频文件。操作简单易懂,无需专业技术,不同平台流程相近,能快速把文字转为自然流畅的语音。四、随堂作业1.在人工智能开放平台中,改变不同的“发音人”,将同一文本内容转换成不同发本的语音。2.研究一个生活中语音合成的应用案例,尝试剖析语音合成技术的实现过程。打开想象的翅膀,展望未来语音合成的应用等。答:车载导航是生活中典型的语音合成应用,可实时清晰播报路线与安全提示。其实现过程为先对文本进行语句拆分、读音标注等预处理,再通过声学模型提取音色、语调特征,最后合成流畅自然的语音。未来语音合成可定制专属情感音色,精准适配各地方言,广泛应用于智能助老、有声读物、虚拟陪伴等场景,让交互更贴近真人,为生活带来更多便利与温度。四、课堂练习完成课堂练习18-20页。五、拓展延伸1、语言合成技术(观看视频)2、语音合成流程3、合成技术演进4、合成应用未来 列举导航、叫号等生活应用,分析技术价值对比规则分词与统计分词差异,绘制合成流程图用 AI 平台文本转语音,尝试不同发音人并记录效果讨论端到端合成相比传统方式的进步改变发音人合成同一文本,对比音色差异完成 18-20 页课堂练习观看视频拓展认知 让学生感知技术实用价值理解技术步骤与实现逻辑提升数字化实践能力明晰技术演进优势检验实践操作与观察能力巩固学生知识掌握程度拓宽学生知识视野
课后作业 1、实践文本转语音,尝试不同音色并分析效果,畅想其生活应用场景。 布置作业 拓展学生的学习能力
课堂板书 观看板书 强调教学重点内容。
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://www.21cnjy.com/" 21世纪教育网(www.21cnjy.com)
同课章节目录