1.3数据采集与编码 课件2021—2022学年浙教版(2019)必修1数据与计算(69张PPT)

文档属性

名称 1.3数据采集与编码 课件2021—2022学年浙教版(2019)必修1数据与计算(69张PPT)
格式 pptx
文件大小 66.3MB
资源类型 教案
版本资源 浙教版(2019)
科目 信息技术(信息科技)
更新时间 2021-12-21 11:10:40

图片预览

文档简介

(共69张PPT)
第一章 数据与信息
1.3数据采集与编码
数据获取
人工方式 观察实验
传统采集方式
纸、笔
互联网物联网 网络 器件
现代化的采集方式
传感器、网络爬虫等


1.3.1数据采集
计算机技术的应用,使得数据的处理方式发生了巨大的改变,数据的处理效率也得到了极大的提高。

思考:在视频中出现了哪些数据采集的方式?
传感器获取来自自然信源的数据 。
一种能感受被测量并按照一定的规律转换成可用输出信号的器件或装置,通常由敏感元件和转换元件组成。
小区入门车辆管理
传感器

1、摄像头
2、声音传感器
3、重力感应器、陀螺仪
4、光线传感器:根据光线强弱来改变屏幕亮度
5、温度传感器
6、磁场传感器:指南针、导航、记录运动速度、地理
位置等等
手机中有多少传感器?
网络爬虫可在短时间内获取大量网络数据。
网络爬虫也是通过网页中的超链接在网页间进行跳转,根据需求按获取某一方面的网页数据,然后用专门的软件进行处理分析。
网络爬虫(网页蜘蛛)
信号数据可用于表示任何信息,如符号、文字、语音、图像等。
从表现形式上可归结为两类:模拟信号和数字信号,模拟信号与数字信号的区别可根据幅度取值是否离散来确定。
1.3.2 数字化
模拟信号
数字信号
模拟信号(Analog signal)以连续变化的物理量存在,如水银温度表呈现的温度值,电流表指针指向的电流值等。平时我们听到的声音、看到的电视图像都是模拟信号。
模拟信号
用电信号模拟自然界信号源发出的信号。
数字信号(Discrete-time signal)取值上是离散的,不连续的信号。在信息技术中,这种信号表示的数据是指可被计算机存储、处理的二进制数据。
人为抽象出来的在时间上的不连续信号,
计算机中存储的信号。
数字信号
1100111010
数字化——模拟信号转换为数字信号
模数转换
(A/D)
模拟量
数字量
(可存储)
电流电压
声音
声音文件
话筒
声卡
采样、量化
如将语音通过计算机的麦克风、声卡等设备存储在计算机中。
模拟信号
数字信号
数字化
从模拟信号转换到数字信号一般要经过采样、量化和编码这样三个过程,最终变成由一连串由0和1来代表的脉冲数字信号。
模拟信号
采 样
量 化
编 码
模拟信号
数字信号
模数转换器ADC (数字化)
数模转换器DAC
文字 图片 视频 声音
111001010101001101010101010010……
二进制
问题讨论
既然计算机只能处理数字信号,那么是不是意味着不再需要模拟信号了?请结合生活实例进行说明
练一练
1.计算机中的数据是用( )表示的
A.字母
B. ASCII码
C.二进制数字代码
D.英文
C
练一练
2.下列工具中不能把模拟图像转换成数字图像的是( )
A.扫描仪
B.数码相机
C.智能手机
D.打印机
C
练一练
3. 不是将模拟音频数字化需要经过的步骤是( )
A.采样 B.量化 C.编码 D.输入
D
练一练
4.关于信息数字化的描述,错误的是( )
A.可以利用扫描仪、照相机、手机等采集设备
B.非数字化信息转化成数字信息,只需要经过采样、量化两个过程,无需要编码
C.数字化是将非数字化信息要转化成二进制数字
D.需通过数字设备存储和加工
B


十六
除基倒取余
商为零止
按权展开
相乘相加
1位16进制=4位二进制
8 4 2 1 法
1.3.3 数制

小白鼠实验
思考
十进制(D) 二进制(B) 十六进制(H)
0 0000 0
1 0001 1
2 0010 2
3 0011 3
4 0100 4
5 0101 5
6 0110 6
7 0111 7
8 1000 8
9 1001 9
10 1010 A
11 1011 B
12 1100 C
13 1101 D
14 1110 E
15 1111 F
智能手机在我们的日常生活中占的比重越来越多,甚至超过了我们的亲人、朋友。离开智能手机我们吃饭不方便、看电影不方便、骑共享单车不方便……这都取决于智能手机一个无敌的功能——扫码
1.3.4 编码
编码是信息按照某种规则或格式,从一种形式转换为另一种形式的过程。
生活中的编码:邮政编码、身份证、电话号码……
计算机中的编码:
字符编码 条形码 二维码
声音编码 图像编码 视频编码
数字信号
11100101010100110101010101001010110100……
二进制
计算机存储的最小单位:二进制位
1100111010
11100101010100110101010101001010110100……
存储单位
1个二进制数0或1:1bit (b、位、比特)
计算机内的最小单位
8个二进制数0或1:1Byte (B、字节)
计算机存储的基本单位
1
1 0 0 0 1 0 0 0
8b=1B
0
b
B
KB
GB
排一排
MB




1GB=1024MB
=?KB
= B
= b
1bit(比特、位、b )用来存储一位二进制数
8b= 1B(Byte、字节)
1024B=1KB
1024KB=1MB
1024MB=1GB
1GB=1024MB=1024 KB=1024 B=1024 ×8b
数字
字母
符号
它们是如何转换成计算机能够识别的二进制?
国际上普遍采用的西文字符编码是ASCII码(美国信息交换标准码)英文编码 ASCII码。
常用的汉字编码有外码、交换码、机内码和字形码。
ASCII码和汉字编码
ASCII 码
ASCII码从0到127,共128个代码。
包含33个控制字符、10个阿拉伯数字、26个大写英文字母、26个小写英文字母与一些标点符号和运算符。
彼此是按顺序排列的。
最小: 0 00 000000 最大: 127 7F 01111111
A和a的编码差多少?
32
65
32
97
空格的编码:
A的编码:
a的编码:
十(D)
0 0 0 0 0 0 0
ASCII码
二进制规则:
n个二进制位最多能表示2n种不同的编码状态
7个二进制位最多能表示27=128种不同的编码状态
1 1 1 1 1 1 1
——1字节
ASCII码用一个字节的后7位来表示字符,最高位不用,一般为0。
0 0 0 0 0 0 0 0
0 1 1 1 1 1 1 1
ASCII码——1字节
十六进制
在一个伸手不见五指的白天,发生了一起命案,死者在死后留下了死亡信息 —— 一组十六进制的数,聪明的福尔摩胡老师发现这组密码竟然和ASCII码有关,请同学们一起破译密码!
54 4F 4D
ASCII码(十)
在一个伸手不见五指的白天,发生了一起命案,死者在死后留下了死亡信息 —— 一组十六进制的数,聪明的福尔摩胡老师发现这组密码竟然和ASCII码有关,请同学们一起破译密码!
84 79 77
T O M
T O M
84 79 77
嫌疑犯是被逮捕了!
汉字编码
1 汉字外码(输入码)
汉字输入
汉字存储
汉字显示
汉字打印
1
2
3
3
2 处理码(机内码、内码)
3 字形码
4 区位码(交换码、国标码、GB2312-80)
汉字传输
4
1.输入码、外码
向计算机输入汉字的方法有两类:一类是自动识别方式,包括汉字字形识别与语音自动识别;另一类就是进行输入码输入(又称外码输入)。
输入码有拼音码、字形码。
汉字输入法根据输入码分为很多种方式,如图a和图b所示的输入码分别属于(  )
图a   图b
A.音码,形码 B.形码,音形码
C.音码,形音码 D.形码,音码
C
汉字交换码(GB2312-80)又称国标码、区位码,全称为《信息交换用汉字编码及字符集》,由一张94×94的表格组成在计算机中,用第一个字节标记区码,第二个字节标记位码,因此,存储一个汉字字符需用两个字节。
2.交换码
在学习了“信息的编码”后,小陈对一些自己常用的QQ表情进行二进制编码练习,如图所示:
若“   ”的二进制编码为“0100”,则“   ”的二进制编码为(  )
A.1110 B.1011 C.1001 D.0111
00 01 10 11
00
01
10
11
B
计算机内部用于处理汉字信息的代码称为处理码,又称机内码、内码。汉字机内码由区位码的每个字节+常数160构成。需要注意的是ASCII码和Unicode码的交换码和处理码是统一的。
3.处理码、机内码、内码



F r e e S t y l e
内码观察软件
如用内码观察软件16进制显示“PC个人电脑”这几个字的内码:50 43 B8 F6 C8 CB B5 E7 C4 D4,问“个”字内码是什么?
50 43 B8 F6 C8 CB B5 E7 C4 D4
P
C




为了字符的输出和打印,开发了字形码,俗称字体。常见的字形码有两种表示方式:点阵方式和矢量方式。标准字体(字形码)有黑体、宋体、仿宋体、隶书和楷体等五种。英文字符一般采用矢量方式表示,汉字一般采用点阵方式表示。
4.字形码
某字库采用点阵方式描述汉字字形,点阵规模为16×16,每个点用1个二进制位表示,“0”表示白点,“1”表示黑点,逐行编码。汉字“和”的字形如右图所示,下列描述正确的是 ( )
A、该汉字字形编码需要16×16个字节
B、该汉字字形第一行编码需要2个字节
C、该汉字字形编码的第一个字节内容是OFH
D、该汉字字形编码的最后一个字节内容是FFH
B
条形码
条形码(barcode) 是将宽度不等的多个黑条和白条,按照一定的编码规则排列,用以表达一组信息的图形标识符。
目前国际上有多种条形码编码方式,下图为我国普遍采用的EAN13条形码。
二维码
二维码(2-dimensional bar code) 是用某种特定的几何图形按一定规律在平面上(二维方向)分布的黑白相间的图形记录数据符号信息。
相对于一维的条形码,二维码的信息存储量更大,功能也更加强大。
内容回顾【单位】
一个ASCII码= 1( ) = 8 ( )
一个GB2312= 2( )= 16 ( )
1GB= MB= KB= B= b

字节
字节

1024
10242
10243
10243×8
3.用软件查看字符的十六进制编码如图所示。以下说法正确的是(  )
A.“G20”是在全角状 态输入的
B.“杭州”两字在存储时占4B
C.“峰”字内码为1111011111 100101B
D.“J”的十六进制编码是50
B
多媒体编码
声音编码
声音数字化过程
将模拟声音数字化需要经过采样、量化、编码三个过程。
声音的频率
声音的频率一般以赫兹表示,记为Hz,指每秒周期性振动的次数。人耳可以感知到的声音,其频率范围在20-20000Hz。
分贝
分贝是用来表示声音强度的单位,记为dB。
声音类型
常见的声音文件类型有wave、mp3、wma等。
声音容量=采样频率(Hz)*量化位数(bit)*声道数*时间(s)
单位:位(bit)
声音容量/8 :单位:(Byte 字节)
声音容量=比特率(kbps)*时间(s)
单位:位(kb)
声音容量/8 :单位:KB
数字图像包括位图图像与矢量图形。
图形编码
矢量图是指用点、直线或者多边形等基于数学方程的几何图元表示的图像,Flash软件绘制的图形为矢量图。常见的矢量图格式有:wmf、swf。
位图又称栅格图像或点阵图,图像的采样就是把一张图像分解成一个一个大小相同的点,这些点称作像素,是组成位图的基本单位。画图、PhotoShop软件默认格式为位图。
常见位图图像文件格式:如bmp、jpeg、gif、png等。
位图
层次、颜色丰富,放大后会失真。
矢量图
线条、颜色简单,放大后清晰度不会发生变化。
1 0 1 0 1
1 0 1 0 0
1 1 0 1 1
1 0 1 0 1
0 1 0 1 0
3 3 3 3 3 3 3 3
3 2 2 2 2 2 2 3
3 2 1 1 1 1 2 3
3 2 1 0 0 1 2 3
3 2 1 0 0 1 2 3
3 2 1 1 1 1 2 3
3 2 2 2 2 2 2 3
3 3 3 3 3 3 3 3
11 11 11 11 11 11 11 11
11 10 10 10 10 10 10 11
11 10 01 01 01 01 10 11
11 10 01 00 00 01 10 11
11 10 01 00 00 01 10 11
11 10 01 01 01 01 10 11
11 10 10 10 10 10 10 11
11 11 11 11 11 11 11 11

彩色图像
位图色彩模式
色彩
模式
黑白
只有黑和白两种颜色(1位)
灰度
黑到白之间256级亮度(8位)
RGB
以红绿蓝为三原色构成其它颜色(三层颜色通道)十进制0~255
表示每层颜色值(24位)
RGB( , , )



图像容量=水平分辨率*垂直分辨率*位深度(bit)
单位:位(bit)
图像容量/8 :单位:(Byte 字节)
位图格式
色彩模式
单通道色彩位数
(8*3=24位)
缩放比例
静态图像连续播放就形成视频
视频编码
视频存储量=每帧图像大小×帧频(fps)×时间(s)
PAL制式每秒切换25幅画面:25帧每秒(25fps)
NTSC制式每秒切换30幅画面:30帧每秒(30fps)
常见的视频编码方式:MPEG-1、MPEG-2、MPEG-4;
文件格式有:avi、mpg、mov、flv等。
视频制式
多媒体数据进行压缩的目的是为了节省存储空间,一般针对声音、图像、视频的压缩都属于有损压缩。
rar、zip格式的文件都属于无损压缩格式。
wav、bmp文件属于未压缩格式。
多媒体数据压缩
计算压缩比的方法是:压缩前容量/压缩后容量
1024 * 700 * 2 * 8 / 8 / 1024=1400KB
录制一段采样频率为2kHz,量化位数为4位,双声道的10秒的音乐,需要多大的存储空间(KB)?
2000 * 4 * 2 * 10 / 8 / 1024 = 19.5 KB
一幅1024 × 700像素的图像,每一个像素占用2个字节的存储空间,为了记录这幅图像所需的KB?
1000 *500 * 8 / 8 * 25 * 10 / 1024 / 1024 = 119.2 MB
录制10秒钟长的视频的分辨率为1000×500,每个像素最多能表示256种颜色的PAL制式的彩色视频存储容量是多少(MB)?