第1章 数据与信息
浙教版(2019版) 信息技术(高中)
1.3 数据采集与编码
必修1 数据与计算
学习目标
1
2
3
了解数据采集。
理解信息的数字化(采样、量化)。
掌握数制。
编码(ASCII码,汉字编码,条形码,二维码,声音编码,图像编码,视频编码)。
4
1
2
重点难点
重点:数制及其转换。
难点:编码(ASCII码,汉字编码,条形码,二维码,声音编码,图像编码,视频编码)。
第一课时
课堂导入
计算机技术的应用,使得数据的处理方式发生了巨大的转变,数据的处理效率也得到了极大的提高。不同的采集方式使得所获取的数据形式多种多样,要用计算机处理这些数据,需要对采集到的数据进行一定的转换。
1.3.1 数据采集
数据的获取方法已逐渐以机器为主,传感器可随时获取来自自然信源的数据,网络爬虫可在较短时间内获取大量网络数据。
可以实时监测着大气中PM2.5的浓度变化。
2020年10月,图片拍摄于“智慧东昌”展览馆
地感线圈采集交通数据。
保护野生动物,GPS可堪大任。
智慧农业:传感器在现代农业中的应用
网络爬虫是一种按照一定的规则,自动地抓取网页上数据的程序或脚本。与人在浏览网页时的行为相似,网络爬虫也是通过网页中的超链接在网页间跳转,根据需求按特定的关键字获取某一方面的网页数据,然后对这些数据进行处理、存储等操作,并可用专门软件对这些数据进行分析。
网络爬虫
互联网上已经积聚了海量数据,人们可以随时从网上获取所需的各种数据用于日常生活,如订票,电子地图等。专业人员则运用技术,从互联网上采集大量数据,用于研究、分析、决策等,如通过采集上网用户的相关数据,分析网民行为,推送精准的个性化服务。
精准的个性化服务。
从互联网上采集数据
1.3.2 数字化:
模拟信号:以连续变化的物理量存在,如语音
数字信号:在取值上是离散的、不连续的信号。
模拟信号
数字信号
数字化
将模拟信号转换成数字信号一般需要经过采样、量化与编码。
图1.3.2 模拟信号的数字化过程
在时间轴上按照一定的时间间隔取一系列时刻,得到每个时刻对应的声波信号的振幅值。
在横轴上按一定的时间间隔,从信号中取一个瞬时值,这个过程称为采样。
1
采样
录音设备在1秒内对声音信号的采样次数称为采样频率,如果1秒内采样44100次,则采样频率是44100Hz,即44.1kHz。
常用的CD音质的采样频率就是44.1kHz。
采样频率
将第一步所得的振幅瞬时值往最接近的整数取整。
将信号波形的纵轴划分为若干区间,落到某一区间的采样点按四舍五入的规则取整选值,这个过程称为量化。
2
量化
问题与讨论
既然计算机只能处理数字信号,那么是不是意味着不再需要模拟信号了?请结合生活实例予以说明(如音频的录制与回放、答题纸的扫描与阅卷等)。
第二课时
1.3.3 数制
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}进位制
二进制
八进制
十进制
十六进制
标识
B
O
D
H
1、数的进制
2、二进制
二进制数的特点:
有两个基本数码:0,1。
采用逢二进一的进位规则。
例如,1101.01B=1x23+1x22+0x21+1x20+0x2-1+1x2-2.其中B表示二进制
23, 22, 21, 20, 2-1, 2-2是不同位置上的权值。
3. 十六进制
十六进制数的特点是:
①由十六个基本数码组成,即0, 1, 2, ···, 9, A, B, C, D, E, F.
②采用逢十六进一的进位规则。
例如,B574H=11x163+5x162+7x161+4x160。与二进制相类似,H表示十六进制,163,162, 161, 160是不同位置上的权值。
1.3.4 编码
1.字符编码
常见的字符编码有ASCII、Unicode及各种汉字编码。
(1)ASCII码
ASCII(American standard code for information interchange,美国信息交换标准代码)。基本的ASCII码由33个控制字符、10个阿拉伯数字、26个英文大写字母、26个英文小写字母与一些标点符号组成。
ASCII码值及对应的字符见附表。
(2)汉字编码
计算机中的汉字也是采用二进制进行编码的。1个汉字在计算机中用2个字节表示。如“中国China”,用二进制表示就是11010110 11010000 10111001 1111010;而英文字符“China”是ASCII字符,其中每个字母都用1个字节表示。
2、条形码
条形码(barcode) 是将宽度不等的多个黑条和白条,按照一定的编码规则排列,用以表达一组信息的图形标识符。
条形码可以标出物品的生产国、制造厂商、商品名称、生产日期、图书分类号、邮件起止地点、类别、日期等信息,因而在商品流通、图书管理、邮政管理、银行系统等领域广泛应用。
目前国际上有多种条形码编码方式,下图为我国普遍采用的EAN13条形码。
3、二维码
二维码(2-dimensional bar code) 是用某种特定的几何图形按一定规律在平面上(二维方向)分布的黑白相间的图形记录数据符号信息。
相对于一维的条形码,二维码的信息存储量更大,功能也更加强大。随着智能手机的普遍使用,手机已成为个人用户扫描二维码读取信息的常用工具。
声音数字化过程
将模拟声音数字化需要经过采样、量化、编码三个过程。
声音的频率
声音的频率一般以赫兹表示,记为Hz,指每秒周期性振动的次数。
人耳可以感知到的声音,其频率范围在20-20000Hz。
分贝
分贝是用来表示声音强度的单位,记为dB。
声音类型
常见的声音文件类型有wave、mp3、wma等。
4、声音编码
5、图像编码
数字图像包括矢量图形与位图图像。
矢量图形是指用点、直线或者多边形等基于数学方程的几何图元表示的图像。
位图图像又称栅格图像或点阵图,图像的采样就是把一张图像分解成一个一个大小
相同的点,这些点称作像素,是组成位图的基本单位。
常见图像文件格式:如bmp、jpeg、gif、png等。
图1.3.8 不同像素的图像
6、视频编码
视频数据由于数据量大,不便于存储与传输,往往需要对其进行压缩。视频的编码一般是指通过特定的压缩技术对视频进行压缩。常见的视频编码方式有MPEG1、MPEG2、MPEG4等。
小 结
1、数制:二进制、十六进制的特点和转换。
2、编码(ASCII码,汉字编码,条形码,二维码,声音
编码,图像编码,视频编码)。
https://www.21cnjy.com/help/help_extract.php