粤教版(2019)信息技术 必修1 1.2 数据编码 课件(共85张PPT)

文档属性

名称 粤教版(2019)信息技术 必修1 1.2 数据编码 课件(共85张PPT)
格式 pptx
文件大小 7.0MB
资源类型 教案
版本资源 粤教版(2019)
科目 信息技术(信息科技)
更新时间 2023-01-09 10:28:39

图片预览

文档简介

(共85张PPT)
1.2数据编码
1.2数据编码
数据编码概述
数据编码概述
数据编码是指用一个编码符号代表一条信息或一串数据。
地区、出生日期、性别等个人信息
1.2数据编码
字符编码
字符编码
字符编码
计算机字符编码是将文字、符号用计算机可以识别的二进制来表示。
字符编码
字符编码
I love you
字符 二进制
I 000
空格 001
l 010
o 011
v 100
e 101
y 110
u 111
000001010011100101001110011111
000 001 010 011 100 101 001 110 011 111
I _ l o v e _ y o u
字符编码
字符编码
字符 二进制
I 000
空格 001
l 010
o 011
v 100
e 101
y 110
u 111
字符 二进制
I 000
空格 001
l 010
o 011
v 100
e 101
y 110
u 111
I love you
000001010011100101001110011111
I love you
字符编码
字符编码
早期的编码标准是美国信息交换标准代码,即ASCII编码。
ASCII码是用8位二进制数为所有的英文字母、阿拉伯数字、常用的可见控制符、标点符号、运算符建立编码表,从而实现将字符转换为0和1。
字符编码
字符编码
ASCII编码
字母 C
0110 0011
ASCII编码后来被国际标准化组织ISO接受为国际标准ISO 646
字符编码
字符编码
ASCII编码存在不足:
只有8位,最多只能表示256个字符,实际只定义了128个字符。
无法表示汉字。
字符编码
字符编码
处理汉字的简体中文编码GB码
如GB 2312
繁体中文的BIG5码
国际化标准组织和Unicode组织联合制定了“统一码”,也叫Unicode字符集
在我国Unicode字符集通过UTF-8、UTF-16、GB18030-2005编码等来实现
字符编码
字符编码
计算机基本的存储单位受到了IBM System/360系统所采用的字符编码的影响。
存储一个二进制“0”或“1”,称为“1位”,或者 “1bit”
8个二进制位组成1个字节(Byte)
1.2数据编码
声音和图像编码思路
声音和图像编码思路
声音和图像编码思路
声音和图像编码经历采样、量化、编码三个步骤。
声音和图像编码思路
声音和图像编码思路
采样:采集典型的信息代替部分连续的信息
上面采样的本质,就是把连续的颜色,变成离散的颜色。
声音和图像编码思路
声音和图像编码思路
量化:建立典型信息,并用典型信息去替代采样信息的过程。
量化的目的就是用有限的信息,去替代无限的信息的过程。
颜色 二级制
01
00
声音和图像编码思路
声音和图像编码思路
编码:通过编码表把信息转为二进制。
颜色 二级制
01
00
01 00 01
声音和图像编码思路
声音和图像编码思路
采样和量化的过程都会使的信息损失,出现失真的情况
需要选择合适采样率和量化位数,使失真保持在我们能接受的范围
1.2数据编码
声音编码
采样
采样
采样
采样
采样
采样
采样
采样
每秒钟在声音上采集的点的个数,称为采样率,以赫兹为单位
常见的声音采样率为44.1kHz,也就是每秒钟采集44100个振幅点
采样
采样
采样
采样
采样
采样
声音量化
声音量化
声音量化:
把采样所获得的无数的振幅值,近似的用有限个数的数值来表示。
声音量化
声音量化
使用3位二进制数去表示声音的种类,也就是量化位数为3位,能表示8种不同声音
量化等级值 二进制
1 000
2 001
3 010
4 011
7 100
8 101
9 110
0 111
声音编码
采样振幅值图
声音编码
量化等级和采集振幅值对比
声音编码
声音编码
量化
声音编码
声音编码
量化位数越高,它代表的标准声音种类就越多,用量化等级值去替换样本值时,可以选择的量化等级值就越多,替换以后出现的误差就越少,声音就越接近原始声音。
声音编码
编码
量化等级值 二进制
1 000
2 001
3 010
4 011
7 100
8 101
9 110
0 111
000001010011100101110111
声音编码
声音编码
数字化声音所占的存储容量取决于采样率、量化位数、声道数和时长。
声音存储空间=
采样率×量化位数×声道数×时长÷8
声音编码
声音编码
一首100秒的双声道音乐,采样率为44.1khz,量化位数为16位,它的容量就是多少?
44.1 × 1000 × 16 × 100 × 2 ÷ 8 ÷ 1024 ÷ 1024 ≈ 17(MB)
声音编码
声音编码
常见的音频文件格式有:
WAV
MP3
WMA
AMR
APE
1.2数据编码
图像编码
图像编码
图像编码
一副图像可以看作是由许多彩色或者灰度的点组成的,这些点按纵横排列,被称为像素。
像素
图像编码
图像编码
建立量化表
111111111…010010001101110101101……01011101011111111
编码:
水平32像数
垂直32像数
图像编码
图像编码
垂直像数
水平像数
3位二进制数就是
3位色彩深度
图像编码
图像编码
图像的存储容量=
水平像数×垂直像数×色彩深度÷ 8
图像编码
图像编码
图像采样时,图像的像素数量越多,图像就越接近真实图片
图像编码
图像编码
4*4像素
3位色深
图像编码
图像编码
8*8像素
3位色深
图像编码
图像编码
16*16像素
3位色深
图像编码
图像编码
32*32像素
3位色深
图像编码
图像编码
600*600像素
3位色深
图像编码
图像编码
色彩深度也影响图像的品质
图像编码
图像编码
1位色彩深度
只能表示2种颜色
图像编码
图像编码
3位色彩深度
可以表示8种颜色
图像编码
图像编码
采用高像素和高色彩深度,会使得图片的容量变大。
图像编码
图像编码
常见的位图图像文件格式有:
JPG
PNG
GIF
BMP(BMP位图格式是图像文件的一种基本格式,由于未经压缩,BMP文件占用的存储空间会比较大)
1.2数据编码
数据压缩思路
压缩分类
从压缩的原理对压缩分类
压缩分类
预测编码
基本思想是利用已被编码的点的数据值,预测邻近的一个像素点的数据值
变换编码
基本思想是将图像的光强矩阵变换到系数空间上,然后对系数进行编码压缩。
统计编码
根据信息出现概率的分布特性而进行的压缩编码。比如霍夫曼编码。
压缩分类
按照压缩方法是否产生失真分类
压缩分类
无失真压缩(无损压缩)
有失真压缩(有损压缩)
压缩分类
无损压缩
压缩分类
无损压缩要求解压以后的数据和原始数据完全一致。解压后得到的数据是原数据的复制,是一种可逆压缩。 无损压缩法去掉或减少数据中的冗余,恢复时再重新插到数据中,因此是可逆过程 。
根据目前的技术水平,无损压缩算法一般可以把普通文件的数据压缩到原来的1/2-1/4。一些常用的无损压缩算法有赫夫曼(Huffman)算法和LZW(Lenpel-Ziv & Welch)压缩算法
一般文件压缩软件如:RAR、zip、7z等都是无失真压缩。
文件的压缩一般就采用无损压缩
压缩分类
有损压缩
压缩分类
解压以后的数据和原始数据不完全一致,是不可逆压缩方式。有失真压缩还原后,不影响信息的表达 。
图像、视频、音频数据的往往多于我们的视觉系统和听觉系统所能接收的信息,丢掉一些数据而不至于对声音或者图像所表达的意思产生误解,但可大大提高压缩比。图像、视频、音频数据的压缩比可高达100:1,但人的主观感受仍不会对原始信息产生误解。
图像、视频、音频数据的压缩就可以采用有损压缩方法
压缩分类
有损压缩
有损压缩
文件可以有损压缩吗?


1.2数据编码
常见数据压缩算法
常见的无损压缩算法
空间冗余压缩
常见的压缩算法
小蛋糕 小蛋糕 小蛋糕 小蛋糕 小蛋糕 小蛋糕 小蛋糕 小蛋糕 小蛋糕 小蛋糕 小蛋糕 小蛋糕
11个小蛋糕
怎样表示一个分为11份的蛋糕?
常见的无损压缩算法
空间冗余压缩
常见的压缩算法
一幅图像表面上各采样点的颜色之间往往存在着空间连贯性,比如右图,图片的背景的颜色都是灰色,还有连续蓝色的电脑屏,连续白色的写字板,颜色都一样。这些颜色相同的块就可以压缩。
比如说,第一行像素基本都一样,假设亮度值Y是这么存的 [105 105 105…….105],如果共100个像素,那需要1Byte*100。
采用空间压缩:
[105, 100],表示接下来100个像素的亮度都是105,那么只要2个字节,就能表示整行数据了!岂不是压缩了!
常见的无损压缩算法
行程编码(RLE)
常见的压缩算法
如有文件内容为:
AAAABBBBDDDDDDEEEEEEECCCCC
可以压缩为:4A4B6D7E5C
行程编码是一种空间冗余压缩算法,一般文件压缩就是采用这种方式。
BMP .TIFF及AVI等格式文件的压缩均采用此方法。
常见的无损压缩算法
霍夫曼编码
常见的压缩算法
根据图像、文件中表示相同的颜色、数据出现的概率不同,对于出现频率高的赋(编)予较短字长的码,对出现频率小的编于较长字长的码,从而减少总的代码量,但不减少总的信息量。
霍夫曼编码是根据信息出现概率的分布特性而进行的压缩编码,和行程编码一样,是一种统计编码
常见的无损压缩算法
根据目前的技术水平,无损压缩算法一般可以把普通文件的数据压缩到原来的1/2-1/4。一些常用的无损压缩算法有赫夫曼(Huffman)算法、行程编码算法和LZW(Lenpel-Ziv & Welch)压缩算法等。
常见的压缩算法
常见的有损压缩算法
视觉冗余
常见的压缩算法
人类的视觉系统由于受生理特性的限制,对于图像场的注意是非均匀的,人对细微的颜色差异感觉不明显。
例如,人类视觉的一般分辨能力为26灰度等级,而一般的图像的量化采用的是28灰度等级,即存在视觉冗余。
人类的听觉对某些信号反映不太敏感,使得压缩后再还原有允许范围的变化,人也感觉不出来。
这两张图片的灰度级不一样,你能分辨出来吗
常见的有损压缩算法
时间冗余(主要针对视频)
常见的压缩算法
运动图像(视频)一般为位于一时间轴区间的一组连续画面,其中的相邻帧往往包含相同的背景和移动物体,只不过移动物体所在的空间位置略有不同,所以后一帧的数据与前一帧的数据有许多共同的地方,这种共同性是由于相邻帧记录了相邻时刻的同一场景画面,所以称为时间冗余。
如下图所示,其实1秒30帧,每一帧之间都是33ms,这么短,前后帧的变话很少,也许只有嘴巴动了,背景没动。
常见的压缩算法
常见压缩方式汇总
常见的压缩算法
空间冗余 —— 物理相关性
结构冗余 —— 如纹理
熵冗余 —— 编码冗余,可逆编码
动态冗余 —— 时间相关性
知识冗余 —— 已具有的先验知识
视觉冗余 —— 超出人眼能辨别的信息
例如:DCT编码
将在空域上描述的图象,经过某种变换(通常采用,余弦变换、傅立叶变换、沃尔什变换等),在某种变换域里进行描述。在变换域里,首先降低了图象的相关性;其次通过某种图象处理(如频域的二维滤波)以及熵编码,则可进一步压缩图象的编码比特率。
这种变换常用于JPEG图像压缩。
常见的有损压缩算法
有损压缩是利用了人类对图像或声波中的某些频率成分不敏感的特性,允许压缩过程中损失一定的信息;虽然不能完全恢复原始数据,但是所损失的部分对理解原始图像的影响缩小,却换来了大得多的压缩比。
有损压缩广泛应用于语音,图像和视频数据的压缩。
常见的压缩算法
压缩的要素
以图像为例:图像压缩的要素
压缩的要素
压缩比
压缩前后文件大小之比,越高越好,但受速度、消耗资源等的影响。
图像质量
还原后与原图像相比,评估的方法有客观评估和主观评估。
压缩与解压缩速度
与压缩方法和压缩编码的算法有关,一般压缩比解压缩计算量大,因而压缩比解压缩慢。
1.2数据编码
视频编码的思路
视频的基本概念

视频的基本概念
帧(Frame),是视频文件的基本单位,一帧就是构成视频的一副静态画面。
一帧
视频的基本概念
帧速率(FPS)
视频的基本概念
帧速率(Frame Per Second),帧速率是指每秒钟刷新的图片的帧数,也指画面每秒传输帧数。
注意区分不是射击游戏中的FPS
First-Person Shooter Game
对影片内容而言,帧速率指每秒所显示的静止帧格数。要生成平滑连贯的动画效果,帧速率一般不小于8;而电影的帧速率为24fps。捕捉动态视频内容时,此数字愈高愈好。
视频的基本概念
常见帧速率(FPS)
视频的基本概念
电影 —— 24
NTSC —— 30
PAL —— 25
视频的基本概念
视频分辨率
视频的基本概念
视频分辨率是用于度量视频一帧图像的横向和纵向上的有效像素,和图像的高/宽像素值是一样的。
视频的320X180是指它在横向320像素和纵向180像素上,视频的分辨率高,看起来清晰;否则就模糊了。(放大时有效像素间的距离拉大,而显卡会把这些空隙填满,也就是插值,插值所用的像素是根据上下左右的有效像素“猜”出来的“假像素”,没有原视频信息),严格意义上的分辨率是指单位长度内的有效像素值ppi。差别就在这里。图像的高/宽像素值的确和尺寸无关,但单位长度内的有效像素值ppi和尺寸就有关了,显然尺寸越大ppi越小。
视频的基本概念
常见的视频分辨率
视频的基本概念
视频的基本概念
隔行Interlaced(i)与逐行Progressive(p)的区别
视频的基本概念
隔行Interlaced
视频的基本概念
隔行Interlaced(i)与逐行Progressive(p)的区别
视频的基本概念
逐行Progressive
视频的基本概念
视频分辨率在现实中的标准
视频的基本概念
广电标准:
标清 D1-720x576
高清>=1280x720p
举例:1280x720p,
1920x1080i(FULL-HD)
1920x1080p(FULL-HD)
公司 标清/流畅 高清 超清
搜狐 480p 480p 576p
优酷 336p 432p 622p
奇异 360p 480p 720p
土豆 256p~360p 480p 576~720p
视频的基本概念
视频编码
视频数据是以一定速度连续播放的一组图像形成的,这些静态图像被称为帧。当连续图像变化超过24帧每秒时,根据视觉暂留原理,就会形成流畅的视频画面。

一个视频=图像+声音
一张原始图像(1920x1080),如果每个像素32bit表示,图像需要的存储空间大小?
视频编码到底要做什么
视频编码
如果视频是1920x1080,30fps, 1小时,忽略声音。那不压缩大概需要存储空间大小?
1920x1080x32/8 = 8294400 Byte,大约8M。
8Mx30x60*60 = 864000M
都800多G了!疯了吧!
压缩
视频编码:图像编码+声音编码
视频编码到底要做什么
视频编码
压缩
视频编码最重要的就是
帧内压缩编码:
对每一帧的图片内容进行压缩编码,包括在采样、量化中等视频数字化过程中及之后使用空间冗余压缩、视觉冗余压缩、行程编码等各种压缩方式。
帧间压缩编码:
通过使用预测编码、时间冗余编码等方式进行压缩编码。
视频编码
视频编码的常见的方法:
视频编码
预测编码
基本思想是利用已被编码的点的数据值,预测邻近的一个像素点的数据值
变换编码
基本思想是将图像的光强矩阵变换到系数空间上,然后对系数进行编码压缩
视频编码
视频编码的基本思路:
视频编码
空间冗余 —— 物理相关性
结构冗余 —— 如纹理
熵冗余 —— 编码冗余,可逆编码
动态冗余 —— 时间相关性
知识冗余 —— 已具有的先验知识
视觉冗余 —— 超出人眼能辨别的信息
常用的视频编码
常用的视频编码
MPEG-2 MPEG-4
H.263 H.264
Sorenson VP6
VP8
常用的视频编码采用的视频格式(容器)
视频格式
ASF AVI WMV
MP4 3GP MKV
FLV F4V
WebM