(共21张PPT)
数据编码
年 级:高 一 学 科:信息技术(人教中图版)
目 录
知 识 拓 展
4
字 符 编 码
1
声 音 编 码
2
图 像 编 码
3
小 结
5
数据编码
编码是信息按照某种规则和格式从一种形式或者格式转换为另一种形式或格式的过程。通过编码,人们可以方便地存储、检索和使用数据。
湘J 58888
数据编码
数据编码指的是用预先规定的办法将文字、数字或其他对象编成可以存储在计算机里的数值。
现实世界的各种符号
(文本、图形、图像、音频、视频等)
二进制数
现实世界的感觉
(视、听、触)
计算机
计算机
(编码)
(解码)
字符编码
字符是人与计算机交互过程中不可或缺的重要内容,它是多种文字和符号的总称。由于计算机只识别0和1,因此在处理各种字符时,就需要将字符转换为计算机可以识别的二进制数据。
ASCII码:ASCII ((American Standard Code for Information Interchange): 美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要用于显示英文字母、常用的数字符号、标点符号和一些控制符号。到目前为止共定义了128个字符。
字符编码 计算机内存储单位与换算
计算机存储的最小单位——二进制位,也叫比特(bit或b)
计算机存储的基本单位——字节(Byte或B)
8个位(比特)=1个字节 8bit=1Byte
0 1 0 0 0 0 0 1
位bit
1个字节(B)
字符编码
国家信息交换用汉字编码字符标准
1980年颁布信息交互用汉字编码字符集GB2312-80,选用6763个汉字:一个汉字占两个字节。
2000年扩充字符集,发布新国家标准GB18030,收录27484个汉字;采用单字节、双字节和四字节的变长编码。
Unicode称为统一编码、标准万国码。目前广泛使用的UTF-8是它的一种编码方案,采用1-4字节的变长方案,英文单字节,常用汉字采用3字节编码。
声音编码
模拟信号
采 样
量化
编码
数字信号
声音编码
模拟信号
采 样
量化
编码
数字信号
根据奈奎斯特采样定理,如果以一定时间间隔对某个信号进行采样,并且采样频率高于该信号最高频率的两倍,则采样值包含了原信号的全部信息。
声音编码
模拟信号
采 样
量化
编码
数字信号
采 样
量化
编码
采样频率越大,声音越真实,数据量越大。对于音频信号,常用的采样频率有三种:
44.1kHz、22.05kHz、11.025kHz。
量化级数越大,声音质量越好,但占存储空间也越大,量化位数一般为8位和16位。
转化为二进制数,二进制位数越多,占存储空间越大。
数字音频的质量取决于:
采样频率 量化位数 声道数
声音编码
声音编码
图像编码
图像的数字化:将现实中的图像信息,通过数码相机、智能手机、电脑摄像头、扫描仪等等,以及相关软件将其数字化过程。
一幅图像可以看作由许多彩色或各种级别灰度的点组成的,这些点按横纵进行排列,被称为像素,每个像素的颜色值都用一个或多个二进制位来存储。这就是我们常说的位图,在windows中未经压缩的位图一般是指BMP文件。
图像编码
位图采用位映射存储格式,即将每一个像素映射为一个数据,存放在以字节为单位的矩阵中。例如,在下图所示的一位黑白图像中,共有32×2个像素,如果将黑白素分别映射为1和0,下图就应该是如下编码:
11111111000001101000011011111111
10000001011000110111110010000001
这就是该黑白图像的二进制编码。每8位一个字节,下面包含的图形数据为32x2÷8=8个字节。
图像编码
位图图像由像素构成,像素是描述图像的最小单位。
分辨率:水平方向的像素个数*垂直方向的像素个数。
图像的采样:按一定的空间间隔自左到右、自上而下提取画面信息,将一副连续的模拟图像在空间上转换成若干个离散的像素点,每个像素点呈现不同的颜色。
分辨率越高图像还原度越高,也就越清晰,图像占用的存储空间就越大
图像编码
图像的量化:将采样得到的每个像素点的颜色或亮度用若干位二进制数表现出来。
量化位数也称为颜色深度:记录每个像素点的颜色或亮度所需的二进制位数。
颜色深度越大,图像的色彩就越丰富,图像占用的存储空间就越大。
图像编码 位图图像存储空间计算
未经压缩的位图存储空间=分辨率x颜色深度/8(字节)
64x64x1/8=512(Byte) 64x64x4/8=2048(Byte) 64x64x8/8=4096(Byte)
知识拓展 视频的数字化
视频是连续的图像序列,由连续的图像帧构成,一帧即为一幅图像。由于人眼的视觉暂留效应,当帧序列以一定的速率播放时,我们看到的就是动作连续的视频。我国使用的PAL制式每秒25帧,有些国家使用的是NTSC制式,每秒显示30帧。
思考:一段未经压缩的PAL制式视频,时长5秒,16位色彩,分辨率1080x720,需要占用多大的存储空间(Byte)
小 结
1、什么是数据编码
2、字符编码:美国信息交换标准代码(ASCII码),汉字编码(GB2312,GB18030等),Unicode码(万国码,UTF-8)
3、声音编码:将声音模拟信号,采样,量化,编码为数字信号。
4、图像编码:利用扫描、摄像等技术将模拟图像采样,量化,编码为数字图像。
5、视频编码