第二单元 第5课 语音识别技术 课件+教案+素材 浙教版(2023)信息科技八年级下册

文档属性

名称 第二单元 第5课 语音识别技术 课件+教案+素材 浙教版(2023)信息科技八年级下册
格式 zip
文件大小 68.1MB
资源类型 试卷
版本资源 浙教版
科目 信息技术(信息科技)
更新时间 2026-02-25 00:00:00

文档简介

中小学教育资源及组卷应用平台
第2.5课《语音识别技术》教学设计
课题 语音识别技术 单元 第二单元 学科 信息技术 年级 八年级
核心素养目标 信息意识:能够了解语音识别的基本过程与原理,理清声学模型、语言模型的作用及技术应用脉络。计算思维:能够学会分析语音识别的步骤,通过模式匹配、概率统计理解技术逻辑,提升对语音交互的认知效率。数字化学习与创新:能够通过 AI 开放平台、APP 实践语音识别,用表格统计准确率,创新探究语音识别的实践方式。信息社会责任:能够认识到语音识别的便利,关注方言识别、环境噪声等影响,理解技术应用的责任与优化方向。
教学重点 能够了解语音识别的基本过程与原理,理清声学模型、语言模型的作用及技术应用脉络。
教学难点 能够认识到语音识别的便利,关注方言识别、环境噪声等影响,理解技术应用的责任与优化方向。
教学过程
教学环节 教师活动 学生活动 设计意图
导入新课 第2.5课 语音识别技术一、单元导入1、学习目标:1.能理解语音识别、语音合成和图像识别的基本过程和原理。2.初步理解人工智能的基础算法。3.初步理解机器学习的基本原理。4.能利用人工智能技术进行创意设计。机器能够像人类一样,会听、会看、会说、会思考、会学习、会行动吗 想要让机器具有这样的智能,就需要运用语音识别、图像识别、语音合成等一系列的人工智能技术。二、新知引入1、学习目标:通过对语音识别应用的体验,理解语音识别的基本过程和原理,了解声学模型和语音模型,感受语音识别带来的便利。(播放视频) 为什么智能音箱能听懂人们的问题 你认为如何让人工智能听懂家乡的方素 明确单元学习内容目标观视频思考智能音箱听懂指令、方言识别方法 让学生明晰单元学习方向引导学生聚焦语音识别核心逻辑
讲授新课 新知讲解:语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。其最大优势在于使得人机用户界面更加自然和容易使用。一、语音识别的过程语音识别一般会经历以下基本过程:通过数模转化得到一个数字声音信号,再对该声音信号进行预处理和特征提取,将该特征在声学模型中进行模式识别得到音素序列,最后将该音素序列在语言模型中查找概率最高的文本,并输出识别结果。语音识别的过程如图5-1所示。1.声音数字化声音数字化是指将连续变化的声音物理信号,每隔一段时间,测得模拟信号的电压值,给出该电压值相应的量化值,并在计算机中用0和1表示,将模拟信号转换为数字信号。2.信号预处理对输人的语音信号进行预处理,如降噪、消除录制声音时的杂音、回声等等,得到一个比较干净的语音信号。 3.特征提取 特征提取就是每隔一定时间,把声音的音高、音长、音强和音色等特征提取出来的过程。 4.模式匹配 模式匹配就是将提取出来的特征在声学模型中进行比对,得到一组音素序列。音素是根据语音的自然规律划分出的最小的语音单位。汉语拼音中的“a、0、e、b、p、m...”等声母、韵母可视为一个个音素。例如“国家”这个单词包含“g、uo、j、i、a”这些音素,把音素按语言规律组合起来,就构成了每个单词的发音。模式匹配是一种最原始、最基本的模式识别方法,在人工智能中有着广泛的应用。知识链接模式识别 人工智能中的模式识别是根据某个类别数据的共有模式,即模型(特征),对数据进行检测识别或分类。模型的建立可以是直接给予某一事物的各种特征描述,或给子菜一事物的海量数搭样本,让机器通过样本来自己发现特征。5.语言处理语言处理需要借助语言模型。声学模型识别出的单个音素,经过语言模型可以我出该音素出现概率最高的一个同语。不同单词之间的搭配,在语句中出现的概率是不一样的。一般来说,常见的词语出现的概率比生僻的词语出现的概率高。例如,在“世界旅泌去十大景点点”中,“世界”出现的概率肯定高于“事件”,因此语言处理时会优先输出“世界”这个概率高的单词。“旅游”和“事件”搭配同时出现的概率,肯定低于“旅游”和“世界”这个单词搭配的概率,因此语言处理时会优先输出“世界”这个概率高的单词。同时,单词和单词之间的搭配应符合语言习惯。知识链接语言模型对搜集到的海量语句进行分析统计,获得单词与单词之间搭配的概率关系,从而形成语言模型。二、语音识别的实践人工智能开放平台集成了大量声学和语言模型,通过这些平台提供的软件开发工具包,可以把录制的声音传送到平台并进行识别,再返回识别结果。如利用人工智能开放平台的开发工具包,识别录制的myaudio.wav文件中的语音信息,识别程序(部分)如图5-2所示,识别过程及结果如图5-3所示。亲身体验尝试在人工智能开放平台、APP或相关软件中,将录制的myaudio.wav文件分别转换成文本。 答:打开人工智能开放平台或语音转写 APP,进入语音识别功能,上传myaudio.wav音频文件,选择对应语言与识别模式,点击转写按钮。等待 AI 完成处理,即可获取转换后的文本,可简单校对并保存结果,完成音频转文本操作。日积月累语音识别的准确率与声学模型及语言模型都密切相关。如果声学模型是用普通话训练的,那么识别方言语音,正确率就相对较低。通过及时更新地名、网络流行语等词汇,在语言模型中改变单词之间的搭配概率,可以有效地提高新单词的识别率。语音识别的准确率还与录音时周边环境的噪音、录音设备的质量等因素有关。三、随堂作业1.录制一段语音,在人工智能开放平台、APP或软件中,将录制的语音分别转换成文本,并统计转换后文本的准确率。 录制的语音文件名:包含文字(不含标点)的数量:50个。观看表格2.选择不同的“发音人”或者方言对同一段文本信息进行录制,然后在同一个平台、APP或软件中进行测试,并统计识别正确率。文本信息中包含文字(不含标点)的数量:50个。平台、APP或软件名称:讯飞听见观看表格四、课堂练习完成课堂练习21-23页。五、拓展延伸1、声纹识别技术(观看视频)2、语音识别原理3、语音识别应用4、识别技术挑战 拆解声音数字化、预处理等五步流程,绘制简易流程图分析模式识别在语音匹配中的应用逻辑举例说明词语搭配概率对识别结果的影响用 AI 平台 / APP 上传音频转文字,记录操作流程讨论方言、噪声、设备对识别的影响及优化方向录制语音测试准确率,对比不同发音人 / 方言识别效果完成 21-23 页课堂练习观看视频拓展认知 让学生理解技术原理与步骤深化对技术核心的认知帮助学生掌握语言模型作用提升数字化实践能力落实信息社会责任素养检验学生实践与分析能力巩固学生知识掌握程度拓宽学生知识边界
课后作业 1、实践语音转文字操作,分析发音、环境等对识别准确率的影响并总结。 布置作业 拓展学生的学习能力
课堂板书 观看板书 强调教学重点内容。
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://www.21cnjy.com/" 21世纪教育网(www.21cnjy.com)(共30张PPT)
第二单元 第5节
语音识别技术
(浙教版)八年级

1
核心素养目标
3
新知讲解
5
拓展延伸
7
板书设计
2
新知导入
4
课堂练习
6
课堂总结
课后作业
8
01
核心素养目标
信息意识
计算思维
数字化学习与创新
信息社会责任
能够认识到语音识别的便利,关注方言识别、环境噪声等影响,理解技术应用的责任与优化方向。
能够通过 AI 开放平台、APP 实践语音识别,用表格统计准确率,创新探究语音识别的实践方式。
能够学会分析语音识别的步骤,通过模式匹配、概率统计理解技术逻辑,提升对语音交互的认知效率。
能够了解语音识别的基本过程与原理,理清声学模型、语言模型的作用及技术应用脉络。
03
新知讲解
单元导入
第二单元:智能技术初体验
学习目标
1.能理解语音识别、语音合成和图像识别的基本过程和原理。
2.初步理解人工智能的基础算法。
3.初步理解机器学习的基本原理。
4.能利用人工智能技术进行创意设计。
03
新知讲解
单元导入
机器能够像人类一样,会听、会看、会说、会思考、会学习、会行动吗 想要让机器具有这样的智能,就需要运用语音识别、图像识别、语音合成等一系列的人工智能技术。
03
新知讲解
第五节:语音识别技术
学习目标
通过对语音识别应用的体验,理解语音识别的基本过程和原理,了解声学模型和语音模型,感受语音识别带来的便利。
03
新知讲解
第五节:语音识别技术
03
新知讲解
为什么智能音箱能听懂人们的问题
你认为如何让人工智能听懂家乡的方素
03
新知讲解
语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。其最大优势在于使得人机用户界面更加自然和容易使用。
03
新知讲解
一、语音识别的过程
语音识别一般会经历以下基本过程:通过数模转化得到一个数字声音信号,再对该声音信号进行预处理和特征提取,将该特征在声学模型中进行模式识别得到音素序列,最后将该音素序列在语言模型中查找概率最高的文本,并输出识别结果。语音识别的过程如图5-1所示。
03
新知讲解
1.声音数字化
声音数字化是指将连续变化的声音物理信号,每隔一段时间,测得模拟信号的电压值,给出该电压值相应的量化值,并在计算机中用0和1表示,将模拟信号转换为数字信号。
2.信号预处理
对输人的语音信号进行预处理,如降噪、消除录制声音时的杂音、回声等等,得到一个比较干净的语音信号。
03
新知讲解
3.特征提取
特征提取就是每隔一定时间,把声音的音高、音长、音强和音色等特征提取出来的过程。
4.模式匹配
模式匹配就是将提取出来的特征在声学模型中进行比对,得到一组音素序列。音素是根据语音的自然规律划分出的最小的语音单位。汉语拼音中的“a、0、e、b、p、m...”等声母、韵母可视为一个个音素。例如“国家”这个单词包含“g、uo、j、i、a”这些音素,把音素按语言规律组合起来,就构成了每个单词的发音。模式匹配是一种最原始、最基本的模式识别方法,在人工智能中有着广泛的应用。
03
新知讲解
知识链接
模式识别
人工智能中的模式识别是根据某个类别数据的共有模式,即模型(特征),对数据进行检测识别或分类。模型的建立可以是直接给予某一事物的各种特征描述,或给子菜一事物的海量数搭样本,让机器通过样本来自己发现特征。
03
新知讲解
5.语言处理
语言处理需要借助语言模型。声学模型识别出的单个音素,经过语言模型可以我出该音素出现概率最高的一个同语。不同单词之间的搭配,在语句中出现的概率是不一样的。一般来说,常见的词语出现的概率比生僻的词语出现的概率高。例如,在“世界旅泌去十大景点点”中,“世界”出现的概率肯定高于“事件”,因此语言处理时会优先输出“世界”这个概率高的单词。“旅游”和“事件”搭配同时出现的概率,肯定低于“旅游”和“世界”这个单词搭配的概率,因此语言处理时会优先输出“世界”这个概率高的单词。同时,单词和单词之间的搭配应符合语言习惯。
03
新知讲解
知识链接
语言模型
对搜集到的海量语句进行分析统计,获得单词与单词之间搭配的概率关系,从而形成语言模型。
03
新知讲解
二、语音识别的实践
人工智能开放平台集成了大量声学和语言模型,通过这些平台提供的软件开发工具包,可以把录制的声音传送到平台并进行识别,再返回识别结果。如利用人工智能开放平台的开发工具包,识别录制的myaudio.wav文件中的语音信息,识别程序(部分)如图5-2所示,识别过程及结果如图5-3所示。
03
新知讲解
亲身体验
尝试在人工智能开放平台、APP或相关软件中,将录制的myaudio.wav文件分别转换成文本。
打开人工智能开放平台或语音转写 APP,进入语音识别功能,上传myaudio.wav音频文件,选择对应语言与识别模式,点击转写按钮。等待 AI 完成处理,即可获取转换后的文本,可简单校对并保存结果,完成音频转文本操作。
03
新知讲解
日积月累
语音识别的准确率与声学模型及语言模型都密切相关。如果声学模型是用普通话训练的,那么识别方言语音,正确率就相对较低。通过及时更新地名、网络流行语等词汇,在语言模型中改变单词之间的搭配概率,可以有效地提高新单词的识别率。语音识别的准确率还与录音时周边环境的噪音、录音设备的质量等因素有关。
03
新知讲解
随堂作业
1.录制一段语音,在人工智能开放平台、APP或软件中,将录制的语音分别转换成文本,并统计转换后文本的准确率。
录制的语音文件名:包含文字(不含标点)的数量:50个。
序号 平台名称、APP或软件名称 识别出正确的文字数量 准确率
1 百度智能云语音识别 45 90%
2 讯飞听见 47 94%
3 微信语音转文字 42 84%
4 剪映语音转文字 44 88%
03
新知讲解
随堂作业
2.选择不同的“发音人”或者方言对同一段文本信息进行录制,然后在同一个平台、APP或软件中进行测试,并统计识别正确率。
文本信息中包含文字(不含标点)的数量:50个。平台、APP或软件名称:讯飞听见
序号 录制者姓名 采用的语言(在空格中打钩) 识别出正确的文字数量 准确率
1 小明 普通话√ 方言口 48 96%
2 小红 普通话√ 方言口 47 94%
3 小李 普通话口 方言√ 35 70%
4 小王 普通话口 方言√ 32 64%
04
课堂练习
一、选择题
1、实现语音转换成文字的核心技术是( )
A. 语音识别 B. 图像识别
C. 数据存储 D. 网络加速
2、哪种发音的语音识别准确率通常更高( )
A. 标准普通话 B. 地方方言
C. 含糊发音 D. 小声低语
A
A
04
课堂练习
3、语音识别的基本步骤不包括( )
A. 音频采集 B. 特征分析
C. 文字转语音 D. 结果输出
4、用 AI 开放平台做语音转文本,首先要( )
A. 上传音频文件 B. 直接复制结果
C. 打印文档 D. 清理数据
C
A
04
课堂练习
二、判断题
1、标准普通话比方言更易被语音识别准确识别。( )
2、环境噪音会降低语音识别的正确率。( )
3、语音识别只能把文字变成声音。( )
4、发音清晰能提高语音识别的准确率。( )
5、我们可借助 AI 工具完成语音转文字操作。( )

X



05
拓展延伸
声纹识别技术
05
拓展延伸
语音识别原理
语音识别先采集音频,提取声音特征,再通过声学、语言模型匹配,最终输出文字。标准普通话、安静环境能大幅提升识别准确率,是语音转文字的核心逻辑。
05
拓展延伸
语音识别应用
语音识别已融入生活,如智能助手、会议转写、视频自动字幕等。AI 开放平台降低使用门槛,无需专业技术,上传音频即可实现语音转文字,便捷高效。
05
拓展延伸
识别技术挑战
方言、口音、环境噪音是语音识别的主要难题。不同地域方言差异大,嘈杂场景会干扰特征提取,目前技术仍在优化,未来将实现更精准的多场景适配。
08
板书设计
语音识别技术
一、语音识别的过程
二、语音识别的实践
课后作业:
1、实践语音转文字操作,分析发音、环境等对识别准确率的影响并总结。
https://www.21cnjy.com/recruitment/home/fine
同课章节目录