(共31张PPT)
认识数据编码
高一信息组
龙旭
项目二
目
录
体验探索
1
数字化及其作用
2
二进制与数字转换
3
数字编码
4
数据压缩
5
第
一
章
体验探索
体验探索
共享单车
共享单车是一种新型共享经济
网上购物
就是通过互联网检索商品信息,并通过电子订购单发出购物请求,然后填上私人支票帐号或信用卡的号码,厂商通过邮购的方式发货,或是通过快递公司送货上门。
网络通信
网络通信是通过网络将各个孤立的设备进行连接,通过信息交换实现人与人,人与计算机,计算机与计算机之间的通信。
体验探索
体验数字化生活
信息技术的发展与普及为我们创造了一个全新的数字化生活环境。例如,共享单车、在线购物、网络通信和远程医疗等,它们在给我们带来生活便利的同时,也在逐渐地改变着我们的生活方式。
单击此处添加文本单击此处添加文本
单击此处添加文本
单击此处添加文本单击此处添加文本单击此处添加文本
体验数字化生活
第
二
章
数字化及其作用
数字化及其作用
模拟信号
其信号波形可以表示为时间的连续函数
数字信号
它在取值上是离散的、不连续的,例如以“0”和“1”
来表示二进制数字信号。
数字化及其作用
生活在数字化世界
数字化是将复杂多样的事物属性或特征转化为计算机可处理对象的过程。这些信息被数字化后可以更方便地在数字设备中存储、处理和传输。
数字化及其作用
数字图书馆
数字图书馆就是虚拟的、没有围墙的图书馆,是基于网络环境下共建共享的可扩展的知识网络系统,是超大规模的、分布式的、便于使用的、没有时空限制的、可以实现跨库无缝链接与智能检索的知识中心。
第
三
章
二进制与数制转换
二进制与数据转换
二进制的基数为2,两个基本数码是0和1;
采用逢二进一的进位规则,例如1+1=10;
不同的数位对应不同的权值,权值用基数的幂表示。
二进制
二进制与数据转换
由于计算机中的操作需要通过二进制来实现,因此计算机中的数值计算就需要将十进制数转换成二进制数。
二进制与数据转换
十进制整数转换为二进制数可采用除2反向取余法,
二进制与数据转换
按权相加法
第
四
章
数据编码
数据编码
通过数据编码,人们可以方便地存储、检索和使用数据。
数据编码
车牌号
身份证
门牌号
准考证
身份证
数据编码
车牌号
身份证
门牌号
准考证
车牌号
数据编码
车牌号
身份证
门牌号
准考证
准考证
准考证号为14位数字,其中前两位数字为年份代码,取该年份的后两位数字,如2003年的年份代码为“03”。第3,4位数字为省份代码,我省的省份代码为“43”。我省高考准考证号省略前4位数字,只取后10位,用10位阿拉伯数字编排。前两位为市(区)代码,第3,4位为县(区)代码,第5位为考试类型代码,第6位为科类代码,最后4位为顺序号。
数据编码
车牌号
身份证
门牌号
准考证
门牌号
门牌号指钉在门上标明街道名称和房子号码的牌子。门牌号代表着家家户户具体地址的门牌号,对于本地人来说是“脸”,对于外地人来说是“眼”。
数据编码
字符编码
字符是人与计算机交互过程中不可或缺的重要内容,它是多种文字和符号的总称,由于计算机只识别0和1,因此在处理各种字符时,就需要将字符转换为计算机可以识别的二进制数据。
数据编码
计算机中存储一个“0”或“1”占用1个二进制位(bit),8个二进制位组成1字节(byte),ASCI编码用1字节表示英文字母、数字和常见字符。在GB
18030-2005中,大部分常用汉字采用2字节编码。
数据编码
数据编码
声音的编码
声波的振幅反映了声音响度的强弱,声波的频率反映了声音音调的高低。应用计算机处理声音时,需要将声波的模拟信号转换为数字信号,也就是声音的数字化,编码是其中重要的一步。通常,声音数字化的基本方法是按照一定的时间间隔采集声波的振幅,并将其转换为二进制数序列,即通过采样、量化和编码来实现。
数据编码
声音的编码
对于采样所获得的量值,要进行分级量化,就是将采样值变换到最接近的数字值,即用有限个数的数值近似地表示原来连续变化的值。
数据编码
编码计算
通常,音频所占的存储容量取决于采样频率、量化位数、声道数和时长,其计算公式为:
音频所占的存储容量=采样频率×量化位数×声道数×时长/8
声音编码
数据编码
编码计算
一幅图像可以看作由许多彩色或各种级别灰度的点组成的,这些点按横纵进行排列,被称为像素。
图像所占的存储容量=水平像素数×垂直像素数×颜色深度/8
图像与视频编码
第
五
章
数据压缩
数据压缩
无损压缩
无损压缩指对压缩后的数据进行还原后,得到的数据与压缩前完全相同。
有损压缩
有损压缩指在压缩过程中会损失一定的信息,压缩后的数据无法还原成压缩前的样子。
课后作业
课后作业
(1)了解常见的音频文件格式
(2)了解常用的图像文件格式
认识数据编码第一单元
数据与信息
项目二
探究计算机中的数据表示———认识数据编码
第一课时
认识数据编码
■教材分析
本项目旨在落实课标中“知道数据编码的基本方式”这一内容要求,让学生在体验数值、文本、声音、图像的基本编码方法的过程中,了解在数字化工具中存储数据的一般原理与方法。这部分内容理论性强,且对于高中生有一定难度。
教材继续延用“鸟类研究”这一项目情境,从“将鸟类研究过程中采集的数据数字化后存入计算机”这一需求出发,以生活中的编码为切入点,按照各类数据编码的原理及特点设计了三个活动———从树牌号认识编码、了解数值数据和文本数据的编码、了解声音和图像的数字化,引导学生探究各类数据在计算机中的表示方法,学习数值、文本、声音、图像等类型数据的基本编码方法,增强信息意识、发展计算思维、提升数字化学习能力。
■教学目标
(1)了解数据编码的意义和作用,体会数据编码的基本思想与方法。
(2)经历数值数据编码的过程,掌握数值数据编码的基本方法。
(3)了解计算机处理文本数据的基本过程,知道常用的文本数据编码方式。
■教学准备
(1)软硬件环境:机房,音频编辑软件,图像处理软件。
(2)教学素材:各类数据编码实例和编码表,用于体验活动的声音文件和图像文件。
■教学重点
编码的意义与作用,数值、文本、声音、图像等类型数据的基本编码方式。
■教学难点
数字化工具中存储数据的一般原理与方法。
■教学过程
一、导入
列举生活中的各种编码实例,如身份证号、车牌号、学籍号、条形码、二维码等,引出编码。
让学生谈谈这些号码中各数字所代表的含义。
二、分析生活中的实例
以树牌号编码“2130198”为例,引导学生分析编码中承载的信息、编码的方法,总结编码的规则。
提出问题:
(1)如果2区11子区中有10
023
棵树,以上的编码规则是否适用?
(2)1
位十进制数能表示多少种情况?
2
位、3
位十进制数呢?
(3)n
位十进制数能表示多少种情况?
引导学生深入思考编码位数与编码可表示情况之间的关系。
学生思考:生活中的编码。
(1)了解身份证号的编码规则,分析一代身份证号与二代身份证号的区别,思考目二代身份证号的原因。
(2)根据本校实际情况,设计适用的学籍号编码规则,保证每位学生拥有一个唯的学籍号。
(3)在班级内分享自己的学籍号编码方案,说明如何保证无重码,以及在什么情下需要修改编码规则、如何修改。
三、编码
(1)编码的概念
编码(eOcoEiOH)是指用预先规定的方法将文字、数字或其他对象转换成规定的符号组合、或将信息、数据转换为规定的脉冲电信号。
(2)编码的功能和意义
鉴别:编码是对象的唯一标识。通过辨识编码可以找到其唯一对应的对象。邮政编码对应的地区是唯一的、身份证号对应的人是唯一的,包裹单上的条形码对应的包裹也是唯一的。
排序:编码的符号都有一定的顺序,比较容易进行排序。
专用含义:编码一般都会包含一定的含义。例如,本项目的树牌号中包含着所在区和子区的信息,身份证号码中包含着出生日期的信息。
在计算机中,编码一般是指用预先规定的方法将数字、文字、图像、声音、视频等对象编成二进制代码的过程
。
四、数值数据编码
要想用计算机存储和处理数据,必须先对它们进行编码,将它们转换成由“0”和“1”组成的二进制代码。对不同类型的数据,应采用不同的编码方法。
数值数据,又称为数字数据,是可用于算术运算的具体的数值。
1.数制
数值数据通常采用数数制来表达,如,1打等于12
个,用的是十二进;1小时等于60
分钟,用的是六十进制;1米等于10分米,用的是十进制。
生活中常用的是十进制数,它的基数为10,由10个基本数码(0、1、2、3、4、5、6、7、8、9)组成,逢10进1。例于,十进制数328.56
中,3、2、8、5、6
所代表的数值大小分别如图1-20
所示。其中,100、101
等称为位权,以小数点为界,向左(整数部分)各位的位权依次为100、101、102
……向右(小数部分)各位的位权依次为10-1、10-2……
二进制是计算技术广泛采用的一种数制,它的基数为2.同样,以小数点为界,向左(整数部分)各位的位权依次为20、21、22
……向右(小数部分)各位的位权依次为2-1、2-2……例如,二进制数110.11中,各位数字所代表的数值大小分别如图1-21所示。
2.数值数据的编码
数值数据的编码过程如图1-22所示
(1)转换
要用计算机?存储和处理数值数据,首先要将其转换为二进制数。十进制数转换为二进制数,整数部分的转换方法是除
2反向取余,小数部分的转换方法是乘2
正向取整。如图1-23
和图
1-24
所示,将十进制数
37.375
转为为二进制数,首先将其整数部分和小数部分分别转换为二进制数,然后再合并,得到(37.375)10=(100101.011)2。
例如,鸟的数量是21只,这个数值数据在计算机中是如何表示的呢?
计算机中的数值数据是以补码的方式表示的,以十进制数+21和-21的8位编码为例,它们的二进制数、原码、反码和补码分别如下。
(2)编码
计算机中数值数据的编码分为原码、反码和补码,其编码规则见表1-3。通常情况下,
计算机用一个数的最位存放符号,即用0、1表示正负符号,正数为
0,负数为
1,这个二进制位数称为符号位。
3.文本数据的编码
记录鸟类活动时需要记录鸟的名称,例如灰眠雀鹏的学名是?Alcippe?Morrisonia对这些由字母构成的数据,计算机是如何存储和表示的呢?
字母、数字、标点符号等,称为西文字符。计算机在存储和处理这些西文字符时,需要为每个字符规定一个由0和1组成的代码。目前,国际上普遍采用的西文字符编码标准是
ASCII?13(?American?Standard?Code?for?Information?Interchange美国标准信息交换代码)。
(1)西文字符的编码
ASCⅡ码分为标准ASCI码和扩展ASCI码。标准
ASCII码也叫基础ASCI码,使用7个二进制位来表示西文字符,包括所有的大写和小写字母、数字0到9、标点符号,以及在美式英语中使用的特殊控制字符。扩展ASC码用8个二进制位来表示字符,第8位用于确定附加的128个特殊符号字符、外来语字母和图形符号。
(2)汉字的编码
常用汉字有近5000个,这种信息容量要用2个节长即16位二进制编码才能满足。1980年,中国国家标准总局发布了中华人民共和国国家标准GB2312—1980《信息交换用汉字编码字符集—基本集》,又称为国标码。国标码用2个字节表示一个汉字,其中每个字节的最高位为0。例如,“大”字的国标码为010010011。
国标码在计算机内部存储和处理时会与ASC码发生冲突,例如“4s的ASC码在计算机中的表示也是10001001为了解决这个问题,汉字编码在计算机内的表示在国标码基础上稍做改动,将每个字节的最高位设为1,这被称为机内码(简称内码)。例如大”字的机内码为10110111机内码是用最高位均为1的2个字节表示一个汉字,是计算机内部存储、处理汉字所使用的统一编码
3)unicode
全世界有上百种语言,人们希望有一种编码,能将世界上所有的符号都纳入其中,每一个符号都给予一个独一无二的编码。
Unicode应运而生。
Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。1990年开始研发,1994年正式公布。它为每种语言中的每个字符设定了统一且唯一的二进制编码,以满足跨语言、跨平台进行文本转换和处理的要求。目前的
Unicode字符分为17组编排,每组称为
Plane(平面),每个
Plane拥有6553个码位,共1114112个码位。
Unicode一般用2个字节表示一个字符(非常偏僻的字符用4个字节)。但是,一篇英文文章,用
Unicode编码比用ASC编码需要多一倍的存储空间。于是,又出现了把
Unicode编码转化为“可变长编码”的UTF-8编码。UTF-8编码把一个
Unicode字符根据不同的数字大小编码成1~6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4~6个字节。
Unicode的实现方式还有UTF-16和UTF-32等。
(4)小知识:
标准ASCII码用7个二进制位表示
1
个字符,如,字母A的ASCII码是1000001,符号#的
ASCII码是
0100011。
由于标准ASCII码只能表示
128
个字符,无法满足西文字符编码的需要,后来又扩充了128
个字符,称为扩展ASCII码。
4.思考与讨论
常用汉字有近
5000
个,一个汉字的编码要用
2
个字节表示,而不是
1
个字节,这是为什么?