(共23张PPT)
粤教版普通高中教科书
信息技术 必修1
1.2 数据编码
1.2.1 模拟信号与数字信号 & 1.2.2 编码的基本方式
1.2 数据编码
为什么计算机要对数据进行编码?
模拟信号与数字信号的表示方式?
如何对文字、图片、声音等数据进行编码?
如何计算与表示计算机中数据的大小?
学习目标
为什么计算机要对数据进行编码?(数据的哪一个基本特性?)
数据“二进制”的基本特性表示:”在计算机中,数据以二进制(0、1)的形式进行存储、加工。“
故无论是数字、字母、汉字、图片、视频、音频等类型的数据要想被计算机处理的话,首先要把这个类型的数据数字化(二进制化)—— 编码的本质
数据编码
1.2.1 数字信号与模拟信号
模拟信号
模拟信号
物理量
连续变化的
物理量
连续变化的声波
1、模拟信号是传导能量的一种,但能量会在传输的过程中受多种因素的干扰而不断的减弱,比如通过空气等介质传播的声音。
2、有线电话、无线广播都是通过模拟信息信号来传递信息的。
模拟信号的衰减示意图
数字信号
数字信号
数字
离散时间信号的
数字
何为离散?
离散与连续是相对的,1~5是连续的,1,2,3,4,5是离散的,因为1,2之间仍有许多值。
例如:在实际中我们看到的是时时刻刻发生的,时间是绝对连续的。但在计算机中的视频,只是每隔一段时间采集一张照片然后连续播放形成的,是时间上离散、结果(照片)上连续的。
采集样本
量化信号
量化结果后转换为二进制
数字信号
1、数字信号抗干扰能力强,且因为都是数字,有利于存储、加密与纠错,从而具有较强的保密性和可靠性。
2、现代网络都是以数字信号传递信息的。
例如:大学生A用手机给大学生B同学发了一段文字,A其实传递的是一段特定规则转化后的二进制数字,然后B再将这段数字按照特定规则解析为文字。
LOVE
01001100 01001111 01010110 01000101
LOVE
大学生A
解析
转换
大学生B
数字信号
数字
离散时间信号的
数字
1.2.2 编码的基本方式
文字编码-英文、数字、符号
ASCII码(American Standard Code for Information Interchange)是美国信息交换标准代码,用8位二进制数即1个字节为所有的英文字母(大小写52个)、阿拉伯数字(10个)和常用的不可见控制符(33个)以及标点符号、运算符号等(33个)建立了对应的二进制编码。
28 = 256
n个二进制数的十进制数表示范围是0-2n-1,共能表示2n个不同的数字
文字编码-英文、数字、符号
从右边ASCII码表可知,英文字母A和a的编码分别为01000001(十进制数65)和01100001(十进制数97)。
高四位
低四位
文字编码-汉字
1980年由中国国家标准总局发布的《信息交换用汉字编码字符集》(GB 2312)一共收录了7445个字符,包括6763个汉字和682个其他符号。GB 2312主要分为两部分:编号127之前的符号跟ASCII码所表示的意义相同,属于单字节码;编号127之后的符号统一用两个字节(16位二进制数)表示,包含了几乎所有的简体中文字。
使用8位二进制表示的ASCII码,可以表示从00000000~11111111,共计256种不同的二进制数,用来表示字母、数字以及标点符号等绰绰有余(128个)。但汉字上万个,使用8位二进制来表示显然是不够的。汉字也需要一套专门的编码方案。
216 = 65536
图像编码
当我们给图片放大时会发现什么?
图片的本质是由一个一个带颜色的小方格组成的,这个小方格我们就称为“像素’点。像素点的个数越多代表图像质量越高,越清晰,同时占用的存储空间也就越大。比如:我们看视频常见的1080P,指的是视频播放时每张画面的分辨率为1920×1080像素。
分辨率 = x方向的像素数 × y方向的像素数
x
y
图像编码-举例
在”我的世界”游戏中,无论是高山还是大树,都是由一个个不同小方块组建的,我们图像中的像素就相当于小方块。大家也可利用小方块自由的创造。
图像编码
理解了图像在组成原理之后,我们只需要将每一个像素点数字化即可,就可以在计算机中进行存储、加工了。图像分为黑白图像和彩色图像。
对于黑白图像,每个像素的颜色使用8位二进制表示,我们称为图像量化位数,对应的十进制取值范围是0~255,可以表示28即256种不同亮度的黑白色。不同的数字代表着颜色亮度的不同,其中0代表纯黑(没有亮度),255代表纯白,数字越大颜色越浅,数字越小颜色越深。
255
0
图像编码-彩色图像
RGB色彩模式是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的。不同比例的红、绿、蓝可以构建出人类视力所能感知的所有颜色。
对于彩色图像,每个像素的颜色有3个8位二进制,即3个0~255的十进制数字组成,可以组合出224即16777216不同的颜色,这三个数字分别对应着不同比例的红、绿、蓝三种颜色。然后再将三个十进制数字转换为二进制,由此实现了彩色图像数字化。
图像编码-彩色图像实践
打开电脑上的”画图“软件,单击”编辑颜色“,体验不同颜色的RGB。
rgb颜色对照表(部分)
255 0 0代表红色
160 32 240 代表紫色
声音编码
采集样本
按照适当的时间间隔采集各个时刻的声音样本。使其转换为时间上离散、幅度上连续的脉冲信号。
量化信号
将无限多个采样信息近似地有限个数的数字来表示。
编码
量化结果后转换为二进制数
由此完成了声音的数字化。
将声音进行编码,也即声音数字化,需要经过“采样”-“量化”-“编码”三步
如何计算与表示计算机中数据的大小?
1、首先,计算机是有一个个0和1构成的,每个0和1是称为1个二进制位(bit),位是计算机存储的最小单位。例如1010的占用计算机空间大小为4位。
2、 但在显示中我们无论是英文还是汉字或者图片,都需要使用多个二进制位来表示,在之前的案例中,我们通常喜欢使用8位二进制位一组,8个二进制能表示出256种不同的数字。所以8个二进制位我们称为1个字节(Byte),字节是计算机存储的基本单位。例如1010101010101010的占用计算机空间大小为16位,也就是2个字节。
3、其余单位以1024为最小进率。因为210 = 1024,比较方便计算机计算,其次1024最接近1000,方便人类计算。
进率表
单位 进率 中文 备注
bit(b) 位 最小单位
Byte(B) 1B = 8b 字节 最基本单位
KB 1KB = 1024B 千字节
MB(M) 1MB = 1024KB 兆字节
GB(G) 1GB = 1024MB 千兆字节
TB 1TB = 1024GB 太字节
……
数据大小练习
1、若规定英文占1个字节,汉字占2个字节,则“我爱China”在计算机中占用空间大小为?
2*2B+5*1B = 4B + 5B = 9B
2、小明买了一张电话卡,该卡有一年30G的流量套餐,假设小明每天使用上网使用200M流量,问小明该卡流量可以使用多少天。
30G = 30 * 1024M = 30720M
30720M ÷ 200M ≈ 154天
3、一张图片的分辨率为1024*1024,图形量化位数24位,问该图片在计算机中的占用空间为?(单位转换至MB)
图片大小计算公式 = 图像分辨率 * (图像量化位数 ÷ 8)B
1024 * 1024 * (24÷8)B = 3MB
总结
第四章 程序设计基础
练习作业
预习1.3信息的特征,看看数据与信息的关系以及信息有哪些特性?