1.3 数据采集与编码 第3_4课时 教案 2022—2023学年浙教版(2019)高中信息技术必修1

文档属性

名称 1.3 数据采集与编码 第3_4课时 教案 2022—2023学年浙教版(2019)高中信息技术必修1
格式 docx
文件大小 18.9KB
资源类型 教案
版本资源 浙教版(2019)
科目 信息技术(信息科技)
更新时间 2022-08-06 09:21:36

图片预览

文档简介

1.3 数据采集与编码
第3课时 字符编码、条形码与二维码
首先我们来看编码,这里有一些编码的例子。
中间这个呢是我们周董的歌谱。左边是红绿灯,右边是电视剧的一个名场面。编码就是信息按照某种规则或格式从一种形式转化为另一种形式的过程。
我们知道信息是可加工处理的,那么也就是意味着它可以从形态x转换到形态y。
所以我们可以对信息进行编码,编码的逆过程叫做解码。
同学们一定扫描过二维码,扫描二维码就是个解码的过程。
我不知道有没有同学使用过二维码生成器,它可以把自己想要传递的一些信息生成二维码。
生成二维码的过程就是编码的过程。
计算机编码是按照既定的规则将文字、数字、图像、声音、视频等对象变成可计算机中可以处理的数据的过程。
左边都是我们人能读懂的数据,但是计算机它只能读懂0或1,也就是二进制。所以我们要对这些数据进行编码。
什么叫内码?内码就是数字、符号、汉字、图像、声音、视频等在计算机内部的编码。
我们来看计算机中的容量单位,计算机的最小容量单位是位或者叫比特,英文bit,简称小b。计算机中的位专门指二进制位,大家可以理解成一个只能存储0或1的小盒子。
一个位能表达的信息非常有限,所以我们把八个“小盒子”组成一个小组,叫做字节,英文Byte,简称大B。
字节是计算机的基本容量单位,那么八位二进制能表示几种信息呢?我们学过乘法原理啊,八个二进制,每一位都可以表示0或1。那么八位,应该是八个二连乘,也就是二的8次方,是256种信息。
下面我们来看一些问题:
16位二进制能表示多少种信息,2的16次。
1000种信息需要几位二进制?
对于这类,问我们y种信息需要多少位二进制的,根据二进制表示信息的规律,我们只需要列出不等式2^x>=y,求x的最小值就可以了。
可以解得x的最小值是10,2的10次方是1024,绰绰有余了。
当然计算机中还有一些更大的存储容量单位,他们之间的换算都是1024,所以我们只要记住他们的大小顺序就可以了。
我们来看条形码和二维码,条形码一般是13位的,它是宽度不等的多个黑条和白条,按照一定的编码规则生成的。中国普遍采用EAN13条形码,也就是用13位去表示信息。
我们再来看看二维码,二维码大家肯定都见过、用过。相较于一维条形码,二维码存储量更大,功能也更强大。我们使用过程中也一定要注意安全隐患,有的二维码它可能是病毒的链接。我们有的时候去街边,会看到有人摆摊,写着扫码送小礼品。不建议大家去扫,大家也不知道扫出来或者什么东西啊。
接下来我们来看字符编码,这个呢是我们的键盘,键盘上呢有数字,字母,还有符号等等。字符指的就是各种文字符号的总称,我们想用计算机来加工处理字符的话,也需要用二进制来进行编码。
上面是我们人能读懂的书,那么下面是计算机的工作的数据,ASCII码,它的全称叫做American Standard Code for Information,翻译过来叫美国信息交换标准代码。
同学们现在把教材翻到171页,观察一下ASCII码表。ASCII码表有多少个字符?128种。
我们计算机一般在用到数字作为序号的时候,大多时候是从0开始的,所以大家先对[0,n-1]或者[0,n)这个模式有点印象。
ASCII码用0~127编码,其中零的十进制ASCII码是48,小a的十进制ASCII码是97,大a的十进制码是65,两者相差32。
我们来看ASCII码的一些规律,首先ASCII码从0~127共128个代码。我们知道2的7次方就等于128,但是计算机容量的基本单位是1字节也是8位,所以我们ASCII码是7位编码,8位存储。也就是说,每个编码前加0。
ASCII码的范围,最小是0,最大十进制是127,十六进制是7F,二进制是一个0后面7个1。
这个7F大家要记住,后面我们做题有用的。
ASCII码包含了33个控制字符,10个阿拉伯数字,26个大写英文字母,26个小写英文字母,一些英文标点符号和运算符等等。
数字、字母是按顺序依次排列的。其中数字ASCII码值<大写英文字母ASCII码值<小写英文字母ASCII码值。小写字母的ASCII码值,比对应大写字母的ASCII码值大32。
【和学生一起推算ASCII码】
我们再来看汉字编码。关于汉字编码,我们需要解决这4个问题:怎样将汉字输入计算机?在计算机内部怎样处理汉字?在各计算机之间怎样交换汉字信息?计算机怎样实现汉字信息的输出(显示)?
我们先简单概述一下这些问题的解决方案。输入汉字使用输入码,或者叫做外码。输入码就是输入法的编码,常用的输入码有拼音码、五笔字型码等。在输入汉字后,计算机使用过一种2个字节,且每个字节最高位都是1的编码存储汉字,我们称之为处理码,或者机内码。在两台计算机之间如果要交换汉字信息,则需要使用交换码,最常用的汉字交换码是区位码。如果要显示字形,则需要使用字形码。
接下来我们对这些汉字编码进行详细介绍。
首先我们看如何输入汉字。
众所周知,我们键盘上只有26个字母,在输入时,我们需要把上万个或者常用的几千个汉字和26个字母对应起来。
有的同学已经想到了,我们在小学时学过汉语拼音,这就是一种输入码,是音码的一种。比如输入汉字的“汉”,使用han即可。
当然老一辈人可能没学过汉语拼音,就可以使用五笔字型码,是形码的一种,一些专业的打字员为了追求速度,也会使用五笔字型码。比如输入王,输入4个G即可。
接下来我们来看如何交换汉字。
汉字交换码(GB2312-80)又称国标码,区位码,全称为《信息交换用汉字编码及字符集》,由一张94×94的表格组成在计算机中,用第一个字节标记区码,第二个字节标记位码,因此,存储一个汉字字符需用两个字节。比如存储“啊”就是1601,即第16区第01位。
那么在计算机中如何处理汉字呢。
处理码是计算机内部用于信息处理的汉字代码,也称为机内码或内码。每个汉字有了确定二进制代码,但这个代码在计算机内部处理时会与ASCII码冲突,将国标码每个字节的首位置为1就得到了汉字机内码,非常方便。
【表格:对比ASCII和汉字】
【课堂实践——UE查看内码】
【拓展——区位码、国标码、机内码的关系】
最后我们来看计算机是怎样实现汉字的输出(显示)的。
为了字符的输出和打印,开发了字形码,俗称字体。
常见的字形码有两种表示方式:点阵方式和矢量方式。
比如中文字模就是点阵方式,其本质就是一张只有黑色和白色的图片,放大后会失真。矢量方式则不会出现失真。
1.3 数据采集与编码
第4课时 图像、声音与视频编码
首先是图像编码。通过前面课程的学习,我们知道,编码是按既定规则将文字、数字、图像、声音、视频等对象变成可在计算机中处理的数值的过程。
编码的目的就是把人能读懂的数据转换为计算机能读懂的数据。解码是编码的逆过程,即把计算机能读懂的数据转换为人能读懂的数据。
模拟信号转换为数字信号,要经过采样、量化和编码3个步骤。
我们来看图像的分类。图像主要分为位图和矢量图。我们知道数据的表现形式有图形和图像。一般而言,图形指的是矢量图,图像指的是位图。
位图:由像素点(Pixel)组成,每个像素点在位图中都有特定的位置和颜色信息。位图真实地再现了一个物体的原型,利用数码相机、扫描仪等输入设备获取的实际景物的影像描述。
可以看到,放大后,我们可以清晰地看到位图的像素点。
矢量图:用计算机根据公式等绘制的由简单的点、直线、曲线、圆、方框等基本元素组成,是真实物体的模型化、抽象化和线条化的表现方式。我们各个品牌以及学校的logo就是矢量图,这些logo的特点是使用颜色种类相对较少。
【对比矢量图和位图】
我们来看像素。位图是由许多小方块组成。这些小方块就称为像素(pixel),简称px。
像素是描述图像的最小单位。
位图的总像素数=宽度像素*高度像素。就好像铺的瓷砖一样,横着的块儿数*竖着的块儿数就是要用的总瓷砖块儿数。
位图在计算机中如何编码呢?
我们刚刚已经讲了像素点这个概念。在有了像素点以后我们就要对每个像素点进行编码。
图像的数字化,就是把模拟图像转换成数字图像,要经过采样、量化和编码3个步骤。
采样就是采集像素点,量化就是考虑一个像素点用几位去表示。
那么每个像素的颜色如何编码呢?
n位二进制能表示2^n种颜色,每种颜色所占的二进制位数即颜色位深度/量化位数。
黑白两色用几位二进制编码呢?我们可以用0代表黑,1代表白,所以1位二进制就够了。
我们来看未压缩BMP图片的容量计算。
位图(BMP)存储容量=水平像素×垂直像素×颜色位深度/8(单位:Byte)
我们如何理解记忆这个公式呢?
首先考虑采集了多少个像素点,就是水平像素*垂直像素,再考虑每个像素点用几位二进制位去量化。把以上提到的参数都乘起来,就可以得到图片的容量。
课本中给的公式没有/8,单位是位。考虑到计算机的基本容量单位是字节,所以推荐同学们/8。
下面向大家介绍常见的颜色模式。首先要清楚的一点,根据二进制表示数据的规律,n位二进制可以表示2^n种不一样的数据,所以2^n色和n位色是同义词。
第一个是黑白图片,这和我们生活中所说的黑白照片有所不同,我们平常说的黑白照片指的是256级灰度图片,是由黑白2色和254种不一样的灰色组成的照片。黑白图片因为只有2种颜色,所以用1位二进制就够了。同理,256色或者256级灰度==8位色。
RGB/8模式,指的是红、绿、蓝3个分量各用8位,所以是24位色。
我们来看图像的压缩。在图像、音频、视频等多媒体文件中,都存在着大量的冗余。
数据压缩: 在不损失有用信息前提下,按照一定的编码规则对数据进行重新组合,以去除数据冗余。使文件更少地占用存储空间和缩短传输时间。
压缩主要分为两种,无损压缩和有损压缩。
无损压缩:压缩后的数据进行还原后,得到的数据与压缩前完全相同,比如压缩包
有损压缩:在压缩过程中会损失一定的信息,压缩后的数据无法还原成压缩前的数据。音视频的压缩,经常采用有损压缩的方式。
以音频为例,人的听觉范围是20~20000Hz,那么在这一范围之外的信息我们可以直接删除。
接下来我们来看声音编码。声音的数字化,是把模拟声音变成数字声音。同样要经过采样、量化、编码3个步骤。
书本和PPT上给出的采样的定义比较晦涩难懂,我们简单来说,就是隔一段时间采集一个声音的样本点。
采样频率:每秒的采样样本数叫做采样频率,单位赫兹(Hz),如44.1KHz。
我们注意,这里的赫兹是物理上的单位,也就是说这里的K就是1000,而不是1024。
我们再来看量化。
量化:将信号的连续无限多个可能的取值近似地用有限个离散值来表示。
先将整个幅度划分为有限个小幅度的集合,将采样得到的振幅瞬时值往最接近的整数取整,每个样本点对应的整数值即为纵坐标。
【结合图讲解量化的过程】
量化位数:数字信号幅值被划分为2^n个级数,n称为量化位数,是描述每个采样点值的二进制位数。常用的量化位数为8位、16位。
采样频率越高,我们采集到的数字信息和原始的模拟信息越接近。
量化位数越高,我们量化后的数字信息和原始的模拟信息越接近。
值得注意的是,采样频率、量化位数的增高,都会使得文件的容量变大,所以我们要在3者中寻找一个平衡。
在采样和量化后,我们就可以进行编码了。一个比较简单的方法,就是把量化的十进制数,转换为二进制数来存储。
声音容量的计算。
Wave容量=采样频率(赫兹)×时间(秒)×量化位数(b)×声道数/8 (单位:字节B)
我们如何理解记忆这个公式呢?
采样频率×时间,我们就得到了采集的总样本点数,当然如果是立体声,我们要采集双倍的样本点。再考虑每个样本点用几位二进制去量化。把以上的参数都乘起来,就可以得到音频的容量。
这三条规律我们刚刚已经讲过了,请同学们暂停视频,稍作理解记忆。
这边有个1411Kbps,是什么意思呢?
bps:全称bits per second,中文叫比特每秒或者位每秒,是表示传输速率的单位。
如宽带网速100Mbps,理论最高下载速度是100/8,即12.5MB/s。
所以比特率×时间就是容量计算的另一个公式。
我们再来看视频编码。
视频的原理比较简单,它是由连续的图像帧组成的。
fps:全称frames per second,即帧每秒,是帧率的单位,帧率数字越大,视频、游戏等越流畅
如在进行和平精英游戏时,建议画质流畅,帧率尽可能高(目前最高支持90fps)
中国电视制式(PAL):每秒显示25帧(25张图片),即25fps
欧美电视制式(NTSC):每秒显示30帧(30张图片),即30fps
当然我们要注意,上述公式用于计算无声未压缩视频的容量。这里的视频是有声压缩视频,所以我们只能使用总比特率×时间进行计算。
【介绍多媒体压缩标准】