(共28张PPT)
人教中图版普通高中教科书
第一章 认识数据与大数据
1.1数据、信息与知识
1.2数字化与编码
1.3数据科学与大数据
了解字符编码
理解声音编码实现过程,知道采样、量化、编码三个步骤
知道影响音频质量的因素,掌握音频存储容量(未压缩)的计算方法
学习目标
编码
编码是信息按照某种规则和格式从一种形式或者格式转换为另一种形式或格式的过程。通过编码,人们可以方便地存储、检索和使用数据。
数据编码
数据编码指的是用预先规定的办法将文字、数字或其他对象编成可以存储在计算机里的数值。
现实世界的各种符号
(文本、图形、图像、音频、视频等)
二进制数
现实世界的感觉
(视、听、触)
计算机
计算机
(编码)
(解码)
字符编码
字符是人与计算机交互过程中不可或缺的重要内容,它是多种文字和符号的总称。由于计算机只识别0和1,因此在处理各种字符时,就需要将字符转换为计算机可以识别的二进制数据。
ASCII码:ASCII ((American Standard Code for Information Interchange): 美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要用于显示英文字母、常用的数字符号、标点符号和一些控制符号。到目前为止共定义了128个字符。
字符编码
计算机中应用最广泛的ASCII码用8位二进制码表示信息。 字符占用一个字节,汉字占用两个字节。
计算机内存储单位与换算
计算机存储的最小单位:二进制位,也叫比特(bit或b)
计算机存储的基本单位:字节(Byte或B)
8个位(比特)=1个字节 8bit=1Byte
0 1 0 0 0 0 0 1
位bit
1个字节(B)
不一样?
声音编码
振幅反映响度的强弱
时间
振幅
频率反映音调的高低:人耳能听到声波频率范围是20-20000Hz
声音编码
时间
传输中易受干扰
失真、噪音
时间
振幅
声音编码
声音编码
声音数字化的步骤:采样、量化和编码
以相等的时间间隔(通常为1秒)测得多少个声音模拟信号的值。
用多少个采样点表示
时间
1s
2s
3s
4s
5s
1
2
3
4
5
声音采样
振
幅
声音采样
每秒采集1次
每秒采集2次
采样点越多还是越少质量更好?
声音采样
时间
1s
2s
3s
4s
5s
1
2
3
4
10
5
6
7
8
9
采样频率:每秒采样声音的次数,单位为赫兹 (Hz)。
振幅
采样频率越高声音还原度越好;但记录数据越多,存储容量越高。
声音采样
时间
1s
2s
3s
4s
5s
2
1
4
5
1
3
5
7
5
2
声音量化
将采样点的值分级量化,变换到最接近的数字。
用有限个数近似表示原来连续变化的值。
0
1
2
3
4
5
6
7
量
化
值
声音量化
1s
2s
3s
4s
5s
2
1
4
5
1
3
5
7
5
2
量
化
值
0
1
2
3
4
5
6
7
12
14
时间
1s
2s
3s
4s
5s
5
2
9
10
2
7
11
15
11
5
0
2
4
6
8
11
9
5
3
1
10
13
15
7
量
化
值
3位
二进制
4位
二进制
10
11
5
5
几位
二进制
声音量化
分级越多还是越少质量更好?
12
14
时间
1s
2s
3s
4s
5s
5
2
9
10
2
7
11
15
11
5
0
2
4
6
8
量化值
11
9
5
3
1
10
13
15
7
量化位数:表示量化值的二进制位数。
量化位数越多,声音越接近原始信号,音频的质量越好;但所占存储容量也越大。
声音量化
样本序号 1 2 3 4 5
量化值(十进制) 5 2 9 10 7
二进制编码 0101 0010 1001 1010 0111
样本序号 6 7 8 9 10
量化值(十进制) 11 15 11 5 2
二进制编码 1011 1111 1011 0101 0010
声音编码
WAV
声音质量高
所占存储容量较大
声音编码-未压缩
无损压缩:还原压缩数据后与压缩前相同
AAAEEEEEEEEEE
优化数据
排列方式
A03E10
声音编码-无损压缩
APE
有损压缩:损失信息,提高压缩比例,减少存储容量
MP3
AMR
声音编码-有损压缩
类型 音频格式文件
无压缩 WAV
无损压缩 APE
有损压缩 MP3、AMR
声音编码
不一样?
影响音质的因素
模拟
信号
声音采样
声音量化
声音编码
数字
信号
采集模拟值
分级量化
确定编码规则
数据压缩
(文件格式)
量化位数
采样频率
还有吗?
影响音质的因素
声音录制时的音源数量或回放时相应的扬声器数量
影响音质的因素
声道数
单声道
双声道
环绕声
= 采样频率×量化位数×声× 时间(秒)/8(字节)
音频文件存储容量
例:一首100s的双声道音频,采样频率为44.1kHz,量化位数为16,计算该音频所占的存储容量。
44100×16×8×100 /8 = 17640000B ≈ 17MB
未压缩
存储容量计算
音频文件存储容量的计算
声音
编码
声音数字化的过程
音频文件
计算与格式
采样:确定采样点
编码:确定编码规则
量化:确定量化值
采样频率
压缩方式(文件格式)
音频质量影响因素
常见音频文件格式
量化位数
声道数
小结
Q1. 声音编码的实现需要经历哪三个过程?
Q2. 对于同一个原始音频,声音编码时参数分别为采样率10kHz、量化位数4位和采样率44.1kHz、量化位数16位,哪一种音频质量更好?
Q3. 无损压缩后的数据可否还原成压缩前的样子?
课后练习