高中信息技术学考复习第1章数据与信息课件(共5课时)

文档属性

名称 高中信息技术学考复习第1章数据与信息课件(共5课时)
格式 zip
文件大小 3.1MB
资源类型 教案
版本资源 通用版
科目 信息技术(信息科技)
更新时间 2024-02-16 19:15:56

文档简介

(共16张PPT)
第1章
课时1 数据、信息与知识
信息技术
要点导引·定锚点
课标梳理·微知著
教材重点 课标要求 学业质量水平
数据 理解数据的定义,提取数据的特征 1-1
信息 理解信息的定义,信息的特征,知道数据与信息的关系,确定合适的信息获取方法 1-1
知识 掌握知识、了解智慧(注意两者的区别) 1-1
数据、信息与
知识的关系 能辨别数据与信息的区别;结合实例阐述数据、信息和知识之间的关系 1-1
教材研析·固基础
1
数据
1.数据自远古时期就有且无处不在。
2.数据是对客观事物的符号表示,如图形符号、数字、字母等。
3.在计算机科学中,数据是指所有能输入到计算机并被计算机程序处理的符号总称。其表现形式可以是文字、图形、图像、音频、视频等。
4.单纯的数据是没有意义的,数据和关于数据的解释是密不可分的。
典例1 下列有关数据的说法正确的是( )
A.数据是数字化时代产生的
B.数据产生后就不会发生变化
C.人类的自身行为也在产生数据
D.数字化时代数据的表现形式就是数字
C
解析 A.数据是远古时期就有的;B.大多数数据会随着时间推移而变化;D.数字化时代,数据的表现形式可以是文字、图形、图像、音频、视频等。
2
信息及其特征
1.信息自古就有。
2.香农对信息的定义:信息是用来消除随机不确定性的东西。
3.信息的特征
信息的特征 表现 举例
载体依附性 信息的表示、传播、储存必须依附于某种载体,载体就是承载信息的事物。信息可依附于不同的载体,不存在没有载体的信息 无线信号的传输也需要载体(例如电磁波)
时效性 信息往往反映的是事物某一特定时间内的状态,它会随着时间的推移而变化 高考试卷具有严格的时效性(解密前和解密后)
共享性 信息是可以共享的,同一种信息可以同时被不同的接受者获取。信息不会因为被别人获取而发生损耗 知识可以共享和传递而不会受到损耗
可加工处理性、真伪性 信息是可以加工处理的。信息具有真伪性 诈骗短信表明信息具有真伪性
价值性 信息的价值是相对的,对于不同的人群、不同的时间,其价值可能有所不同 同样一条关于物价涨跌的信息,对普通人和商家具有明显不同的意义
典例2 下列有关信息的说法正确的是( )
A.过时的信息不再具有价值
B.同一信息只能依附于相同的载体
C.在加工、处理信息的过程中,可能会产生虚假信息
D.信息不会因为共享而发生损耗,其价值是恒定不变的
解析 A.信息的价值往往会随着时间的流逝而衰减,但不意味着超出有效期后的信息不再具有任何价值,例如某台风过后,其相关信息的价值降低了,但是在后期对台风天气的研究中,这些数据还是具有一定的参考价值;B.同一信息可以依附于不同的载体;D.信息的价值是相对的,对于不同的人群、不同的时间,其价值可能有所不同。
C
典例3 下列有关信息与信息技术的说法,正确的是( )
A.5G技术的出现使信息可以脱离载体传播
B.计算机处理信息是通过执行程序完成的
C.智能处理得到的信息都是真实可信的
D.信息在当今社会时时处处都有,因而不再是人类的重要资源
解析 本题考查信息与信息技术的基本知识。选项A错误,信息不能脱离载体传播;选项B正确,计算机处理信息是通过执行程序完成的;选项C错误,错误的加工有可能产生错误的信息,故智能处理得到的信息不一定是真实可信的;选项D错误,信息是人类社会的重要资源。故选B。
B
典例4 为了提高信息的使用价值,需对相关数据进行统计分析,这主要说明 ( )
A.信息是可以加工和处理的
B.信息具有时效性
C.信息是可以传递和共享的
D.信息具有真伪性
解析 本题考查信息的特征。为了提高信息的使用价值,需对相关数据进行统计分析,这主要说明信息是可以加工和处理的。故选A。
A
3
知识
1.知识是人类在社会实践中所获得的认识和经验的总和,也是人类在实践中认识客观世界(包括人类自身)的成果,它包括对事实、信息的描述及在教育和实践中获得的技能。
2.知识是可以继承和传递的。
典例5 “某个冬夜,小明睡前发现阳台上的温度计读数为-2℃,他马上和家人一起把裸露在户外的水管用旧衣服包裹起来,并将阳台上的水龙头调整至滴水状态,用一个较大的桶接水。”结合上述事例,下列对于数据、信息和知识的描述错误的是( )
A.-2是没有意义的数据
B.-2℃是意义为“某个冬夜小明家阳台上的温度”的信息
C.小明看到温度计读数为-2℃,联想到冰冻,这是信息
D.小明和家人一起做了防水管冰冻措施,说明他们具备相关知识
解析 小明看到温度计读数为-2℃ ,联想到冰冻,这既是常识也是知识,不是信息。
C
4
数据、信息与知识的关系
1.数据经过储存、分析及解释后所产生的意义就是信息,数据是信息的载体,单纯的数字是没有意义的。
2.通过归纳、演绎、比较等手段对信息进行挖掘,将万千信息中有价值的部分沉淀下来,与已存在的人类知识体系相结合,形成知识。
☆智慧是一种更高层次的综合能力,主要表现为收集、加工、应用、传播知识的能力,以及对事物发展的前瞻性看法。它是在知识的基础上,通过认知的积累,而形成对事物的认识、远见,体现为一种卓越的判断力。一般认为,重大发现和重要的发明创造均属于人类智慧的体现。
3.数据、信息、知识、智慧的关系图
典例6 (2023浙江1月选考)下列关于数据和信息的说法,正确的是( )
A.数据的表现形式只能是文字和图像
B.同一信息对所有人而言其价值是相同的
C.计算机中保存的数据可以是未经数字化的
D.信息是数据经分析、解释后得到的
解析 数据的表现形式可以是文字、图形、图像、音频和视频等,故选项A错误;同一信息对不同的人而言其价值是不同的,故选项B错误;计算机中保存的数据必须是二进制的,即数字化的数据,故选项C错误;信息是数据经过储存、分析及解释后产生的意义,选项D正确。
D
典例7 (2023浙江6月选考)下列关于数据和信息的说法,正确的是( )
A.在数据处理过程中不会有新的信息产生
B.信息的保存和传播可以不依附于载体
C.信息的价值因人而异,但信息不会有虚假
D.计算机中的数据表现形式不同,但都以二进制方式存储
解析 选项A错误,信息是数据经过储存、分析及解释后产生的意义,所以数据处理的过程中会有新的信息产生;选项B错误,信息是不能独立存在的,必须依附于一定的载体,即载体依附性;选项C错误,信息有真伪性,存在虚假信息;选项D正确,现代的计算机内部,数据只能以二进制的方式进行存储和处理。故选D。
D(共28张PPT)
第1章
课时2 数据采集、数字化与进制转换
信息技术
课标梳理·微知著
教材重点 课标要求 学业质量水平
数据采集 了解数据采集的常见方法,能通过互联网采集所需数据 1-1
数字化 掌握模拟信号数字化的一般流程,理解采样与量化的概念 2-1
数制 掌握二进制、十进制、十六进制之间的转换方法 2-1
教材研析·固基础
1
数据采集
1.数据处理方式的转变
2.数据采集的主要方式
(1)传感器:随时获取来自自然信源的数据
(2)互联网:日常所需数据的主要来源
①网络爬虫(课本P14拓展链接)
②应用程序接口(API)
3.传感器
·类型:温度、湿度、声音、海拔、倾角、光敏、烟雾、距离……
·定义:能感受被测量并按照一定的规律转换成可用输出信号的器件或装置,通常由敏感元件和转换元件组成。
典例1 下列有关目前数据采集的说法正确的是( )
A.以机器采集为主
B.通过互联网实时获取自然信源的数据
C.采用观察、测量、实验和调查等人工方式采集
D.通过传感器采集的数据成为日常所需数据的主要来源
解析 B.可通过传感器而非互联网随时获取自然信源的数据;C.目前数据采集以机器采集为主;D.互联网成为日常所需数据的主要来源。
A
2
数字化
1.数字化
·定义:将模拟信号(自然界中的数字、文字、图像、声音等)转换成数字信号(计算机可以处理的二进制数据)的过程。
·重要性:信息社会的技术基础
·过程:采样 量化 编码
·主要设备:模数转换器(ADC)
2.采样定理
·定义:自然界中的各种模拟信号,通过采样定理都可以用0和1来表示。
·基本内容(香农):在一定条件下,用离散的序列可以完全代表一个连续函数。
·数字信号处理领域:将连续信号(模拟信号)转换成离散信号(数字信号)的理论依据。
3.采样
·定义:将信号从连续时间(空间)域上的模拟信号转换到离散时间(空间)域上的离散信号的过程,通过采样器实现。
·采样频率:每秒钟采样的次数(每秒的采样样本数)
·单位:赫兹Hz
CD的采样频率:44.1kHz 44100Hz
·结论:在相同的时间内,采样频率越高,采集到的信号样本数量越多 数字化后的数据存储容量越大,质量越好。
4.量化
·定义(数字信号处理领域)
√将信号的连续取值近似为有限个离散值的过程。
√将采样到的信号(模拟信号的波形)用数字表示出来。
·过程:先将整个幅度划分为有限个小幅度的集合,把落入某个范围内的样值归为一类,并赋予相同的量化值。
·辨析:量化级别&量化位数
√图乙将整个幅度划分为8个小幅度(0~7) 量化级别为8。
√图乙中每个采样点量化时取8个量化级别中的1个作为量化值 每个采样点的值量化后需要3位二进制存储 量化位数为3(原理见“信息传递
规则”)。
·结论:量化划分越细,每个采样点量化取值越精确且存储需要的位数越多 数字化后的数据存储容量越大,质量越好。
典例2 下列有关数字化的说法正确的是( )
A.采样频率越低,数字化后的数据质量越好
B.采样频率越低,数字化后的数据存储容量越大
C.量化划分越细,数字化后的数据质量越好
D.量化划分越细,数字化后的数据存储容量越小
解析 采样频率越高,数字化后的数据存储容量越大,质量越好;量化划分越细,数字化后的数据存储容量越大,质量越好。
C
典例3 (2023浙江6月选考)对某段声音进行数字化,量化值的范围是0~200,则量化位数最少是( )
A.7
B.8
C.16
D.200
解析 本题考查声音编码、量化位数、进制转换知识。量化指将信号的连续取值近似为有限个离散值的过程,量化值一般用二进制数表示,其二进制位数决定了量化的精度,也称作量化位数。题干中已知量化值的十进制表示范围是0~200,27=128,28=256,因此量化位数最少为8位。故选B。
B
3
数制及进制转换
1.数据在计算机内部都以二进制方式进行存储和处理。
2.数的进制
·一种记数方式,亦称进位计数法或位值计数法。
·可以使用有限种数字符号来表示所有的数值。
3.常见的数制
进位制 二进制 八进制 十进制 十六进制
标识 B O D H
4.计数规则
·二进制:2个数码:0,1,逢二进一,借一当二。
·十进制:10个数码:0~9,逢十进一,借一当十。
·十六进制:16个数码:0~9,A,B,C,D,E,F,逢十六进一,借一当十六。
5.基(基数):k进制的基数为k。
6.权(权值):整数部分最右边的数位的权值为k0,向左各位的权值依次乘k。
7.信息传递规则
·概念:n个二进制比特位(bit),可以表示2n个不同的信息单元。
·应用:用1个二进制位的0/1去模拟实际生活中有且只有两种不同稳定状态的事物。
·例:开关的开和关两种不同的稳定状态可以用1位二进制bit位去模拟它的状态,这个二进制位上1对应开,则0对应关。
典例4 某电子设备的电路板上有一个6位“跳板开关”,此开关每一位都只有“打开”和“闭合”两种状态。这个“跳板开关”最多能表示的状态数为 ( )
A.128
B.64
C.60
D.6
B
解析 6位跳板开关相当于6个二进制的bit位,根据信息传递规则,最多能表示的状态数为26=64。
8.进制转换
(1)十进制向n进制转换(除n取余)
·要点
①余数写在被除数后面
②一直除到被除数为0为止
③余数倒着取
·十进制 二进制:除2取余
√例题:(18)10=(10010)2
典例5 (29)10=(_____)2
11101
解析
故(29)10=(11101)2。
·十进制 十六进制:除16取余
√例题:(172)10=(AC)2
典例6 (181)10=(____)16
B5
解析
故(181)10=(B5)16。
(2)n进制向十进制转换(按权相加)
·要点
①从低位向高位标号,以0起始
②提取每位上的数(以十进制形式)×该位的权值
③累加
·二进制 十进制
√例题:(1101)2=(13)10
典例7 (11001)2=(____)10
25
典例8 (C2A)16=(_______)10
3114
(3)二进制和十六进制互换
·二进制 十六进制
√要点
①4位二进制 1位十六进制:从低位往高位每4位进行断位(若断位时不足4位,则高位补0)
②二进制
十进制
十六进制
√例题:(1001011011)2=(25B)16
典例9 10110101B=_______H
B5
·十六进制 二进制
√要点:每1位十六进制可以用4位二进制表示(若转换时不足4位,则高位补0)
√例题:(A4E)16=(101001001110)2
AH=10D=1010B
4H=4D=0100B
EH=14D=1110B
(4)进制转换总结
类型 要点 实例
其他进制
转十进制 二进制 按权相加 1011B=1×23+0×22+1×21+1×20
十六进制 按权相加 A1H=10×161+1×160
十进制转
其他进制 二进制 除2取余 11不断除2直到结果为0,余数逆序输出
权值凑数 11=8+2+1,其二进制为1011
十六进制 除16取余 17不断除16直到结果为0,余数逆序输出
二进制转
十六进制 4位对应1位 10111B=17H
十六进制转二进制 1位对应4位 17H=10111B
典例10 下列关于数制的说法,正确的是( )
A.二进制数1100101转换为十六进制是C5
B.二进制数1011中末位数码1对应权值是21
C.若二进制数末位为0,则该数对应的十六进制数末位不一定是0
D.若二进制数1011去掉末位数码1,则新数101是原数1011的1/2
解析 二进制数1100101转换为十六进制时,从最低位开始每4位一组,最高位需补0后才凑齐4位,即01100101,所以其十六进制值为65H;二进制数1011中末位数码1对应权值是20;二进制数末位只有连续4个0,其对应十六进制末位才为0;若二进制数1011去掉末位数码1,则新数101是原数1011除以2的整数部分。
C(共14张PPT)
第1章
课时3 编码(1)
信息技术
课标梳理·微知著
教材重点 课标要求 学业质量水平
编码 理解编码的概念与具体应用,掌握ASCII编码和汉字编码知识,掌握二进制容量单位换算关系 2-1
教材研析·固基础
1
编码和解码
1.编码:信息按照某种规则或格式,从一种形式转换为另一种形式的过程。
2.解码:编码的逆过程
2
数据的存储容量单位
1.表示信息和存储信息的单位
·b:比特(bit),表示1位二进制数码,是计算机中存储容量的最小单位。
·B:字节(Byte),计算机中存储容量的基本单位。
·1B=8bit
2.常用二进制数量级
1K=210=10241=1024
1M=220=10242=1024K
1G=230=10243=1024M
1T=240=10244=1024G
1P=250=10245=1024T
3
字符编码
1.常见编码:ASCII、Unicode及各种汉字编码
2.ASCII码(美国信息交换标准代码)
·基于拉丁字母
·单字节编码系统
·共128个编码(33控制字符、95个图形字符)
十进制 0~127
二进制 00000000~01111111
十六进制 00~7F
☆解题技巧:ASCII码的十六进制范围:00~7F,大于7FH(从80H开始)的都不是ASCII码字符。
3.常用的ASCII编码值(需要记忆)
字符 十进制ASCII码 十六进制ASCII码
空格 32 20
0 48 30
A 65 41
a 97 61
4.ASCII字符推算
·往后推算是+字符之间的差值
往前推算是-字符之间的差值
·大写字母 6个其他字符 小写字母
大写字母=小写字母-32D(或20H)
小写字母=大写字母+32D(或20H)
5.汉字编码
·汉字和ASCII字符一样,在计算机中以二进制形式存在,每个汉字存储时需要2个字节。
·分类
√输入码(又称外码):将汉字输入计算机的编码。输入码分为音码、形码、音形码、形音码。
√交换码:方便各种数字系统(不仅是计算机系统)之间的汉字信息的通信交换,常用交换码:GB2312-80。
√处理码(汉字机内码):计算机内部用于信息处理的汉字代码。
√字形码——对汉字字形的编码,用于汉字输出显示和打印。两种汉字字形表示方式:矢量方式和点阵方式。点阵容量计算公式:点的个数×每个点存储的位数(bit)。
典例1 汉字点阵码是一种用黑白两色点阵来表示汉字字形的编码。一个16×16点阵字模的存储容量为( )
A.1B
B.16B
C.32B
D.64B
解析 计算公式:点的个数×每个点存储的位数(bit)。已知黑白两色,根据信息传递规则,每个点存储需要1bit,1B=8bit,所以16×16×1/8=32B。
C
6.实验:字符内码(UltraEdit软件)
·半角状态(常态)
字符 字节 二进制bit 十六进制H
1个ASCII字符 1 8 2
1个汉字 2 16 4
·范例:如下图所示
典例2 小孙用UltraEdit软件观察“211人才网”这几个字,显示的十六进制内码如下图所示。
则汉字“人”的内码是( )
A.31 B.C8
C.C8 CB D.B2 C5
解析 图中前3个字节对应的十六进制代码32、31、31都在[00,7F]范围内,所以是ASCII码字符。“人”的汉字内码占2字节,相应的十六进制内码有4位,所以其内码为C8 CB。
C
·全角状态
每个字符存储2B 16bit 4H
典例3 UltraEdit软件显示的十六进制内码如下图所示。第2个“好”字的编码为( )
A.BA
B.A3 B1
C.C3 A3
D.BA C3
解析 汉字的半角和全角输入的内码一致。所以第2个“好”字和第1个“好”字内码一致,61、31为ASCII码字符“a”和“1”的十六进制内码,“好”的十六进制内码为后面的“BA C3”。
D
·繁体和简体的异同:形同码同、形异码异
典例4 UltraEdit软件显示的十六进制内码如下图所示。由图可知简体“国”和繁体“國”的内码________(选填:相同/不同)。
不同
解析 简体“国”和繁体“國”字形不同,所以内码也不相同。(共15张PPT)
第1章
课时4 编码(2)
信息技术
课标梳理·微知著
教材重点 课标要求 学业质量水平
编码 理解编码的概念与具体应用,能计算声音与图像的存储容量 2-1
教材研析·固基础
1
条形码
将宽度不等的多个黑条和白条,按照一定的编码规则排列,用以表达一组信息的图形标识符。
2
二维码
1.用某种特定的几何图形按一定规律在平面上(二维方向)分布的黑白相间的图形记录数据符号信息。
2.条形码和二维码中的信息可以由专用设备扫描获取,也可由智能手机扫描获取。
3.不随意扫描非官方的二维码或安装未经验证的应用。
3
容量计算
1.大数据量计算时,经常采用估算,估算时1024当成1000来算。
2.比特率(数据速率):音频/视频1秒的容量;单位是kbps(k为1000,bps是bit/s)。
3.声音编码
·声音采样是从时间域上对信号进行分割,再对采样点进行量化。
·声音数字化过程:采样 量化 编码
·采样频率越高和量化位数越多(量化精度越高),音质越好,存储容量越大。
·常见格式:Wave、MP3、WMA等。
·录音:声音信号
电流信号
数字信号
存储为数字化的声音文件。
放音:读取数字化的声音文件
数字信号
模拟信号
发声
·声音存储容量计算
(1)未经压缩的Wave格式音频文件的存储容量计算公式:存储容量=采样频率(Hz)×量化位数(bit)×声道数×时间(s)/8(单位为B)
(2)所有音频文件通用的计算公式:
存储容量=比特率(kbps)×时间(s)/8 (单位为1000B,可估算为KB)
典例1 录制一段时长10秒的立体声Wave格式音频,采样频率为32kHz,量化位数为8bit,该音频文件的存储容量为( )
A.62KB
B.312.5KB
C.625KB
D.5000KB
解析 存储容量=32000× 8×10×2/(8×1024)=625KB。
C
典例2 一个时长为8分钟、采样频率为32kHz、量化位数为16位、双声道未经压缩的Wave格式音频文件,其存储容量约为 ( )
A.1MB
B.29MB
C.59MB
D.469MB
解析 本题考查音频文件存储容量的计算。存储空间=采样频率×量化位数×声道数×时间/8(单位:B),因此该文件大小约为32000×16×2×8×60/(8×1024×1024)≈59(MB)。
C
4.图像编码
·图像:人对视觉感知的物质再现。
·分类
矢量图形:用点、直线或多边形等基于数学方程的几何图元表示。
位图图像(栅格图、点阵图):通过像素描述图像。
·位图数字化
采样:是从空间域上对信号进行分割,分解出来的点称为像素(像素排列越紧密,图像越清晰)。
量化:将每个像素的颜色量化为具体的数据。
·常见格式:BMP、JPEG、GIF、PNG等。
·图像存储容量计算
未经压缩的BMP格式图像文件的存储容量计算公式:存储容量=图像的像素个数×存储每像素需要的位数(颜色位深度)/8(单位为B)
☆要点
①像素个数: 1行的像素数×1列的像素数
②位数:由图像的颜色数决定
颜色数=2位数
根据信息传递规则:n个bit——可以表示2n个不同的信息单元
存储每像素需要n个bit 颜色数=2n
1bit 黑白图像- -2色- -21
4bit 16色- -24
8bit 256色- -28
8bit 256灰度级- -28
16位色 65536色- -216
RGB(8bit),每种颜色8bit,存储每个像素需要24位 224色
结论:图像颜色种类越丰富,存储每个像素需要的位数越多
典例3 一幅未经压缩的2048×1536像素、24位色BMP图像,要将其存储容量减少到约1.5MB,在不改变其他参数的前提下,可调整图像大小、颜色分别为( )
A.1024×768像素、16色
B.1024×768像素、16位色
C.512×384像素、256色
D.512×384像素、24位色
解析 本题考查图像容量计算的相关知识。未经压缩的BMP格式的图像容量计算公式为:分辨率×颜色位数/8(B),则该图像的容量=2048×1536×24/(8×1024×1024)=9(MB),要将其存储容量减少到约1.5MB,而图像大小、颜色分别为1024×768像素、16位色的图像的存储容量为1.5MB。
B
5.视频编码
·视频:由静态图像连续播放形成。
·制式(帧频):播放速度
①PAL:25fps(帧/秒)
②NTSC:30fps
·常见格式:AVI、MPEG、MOV等。
·常见视频压缩(视频编码)模式:MPEG-1、MPEG-2、MPEG-4等。
·容量计算
未经压缩的AVI格式的无声视频文件存储容量的计算
①公式1=1帧图像的存储容量×帧频×播放时间(单位:B)
②公式2=1帧图像的存储容量×总帧数(单位:B)
未经压缩的AVI格式的有声视频文件存储容量的计算方法为:无声视频容量+音频容量
所有视频文件通用的存储容量计算公式:存储容量=比特率(kbps)×时间(s)/8(单位:KB)
典例4 一个时长为10秒、320×240像素、24位真彩色、30帧/秒的未经压缩的AVI格式无声视频文件,其占用存储空间约为( )
A.6.59KB
B.65.9KB
C.65.9MB
D.65.9GB
解析 本题考查视频容量计算。320×240×24×10×30/(8×1024)=67500(KB)≈65.9(MB),因此本题答案
是C。
C(共14张PPT)
第1章
课时5 数据管理与安全、大数据
信息技术
课标梳理·微知著
教材重点 课标要求 学业质量水平
数据管理 能选择合适的方法管理数据,理解文件的基本属性 1-2
数据安全 了解数据保护的一般方法,提高数据安全意识 2-1
数据与大数据 了解大数据的概念,理解大数据的特征;了解大数据对人类思维方式的影响,能正确面对大数据 1-3
教材研析·固基础
1
数据管理
1.数据管理定义:利用计算机硬件和软件对数据进行有效收集、存储、处理和应用的过程,目的在于充分、有效地发挥数据的作用。
2.计算机数据管理的三个阶段:人工管理 文件管理 数据库管理。
3.Windows下的文件管理
·个人计算机中数据常以文件的形式存储
·计算机一般采用树形目录结构来管理文件,在Windows系统中,采用了更为形象的文件夹来管理文件。
·计算机中的文件根据编码规则,可分为多种文件格式。例如文本文件(.txt,.docx,.htm/.html,.pdf)、图像文件(.bmp,.jpg,.gif)、声音文件(.wav,.mp3)和视频文件(.avi,.mpg)。
典例1 下列选项中,全部属于文本文件的是( )
①a.jpg ②b.txt ③c.docx ④d.html ⑤e.mp3
A.①④⑤
B.①②③
C.③④⑤
D.②③④
解析 a.jpg是图像文件,e.mp3是音乐文件,其他均为文本文件。
D
4.使用数据库管理数据的意义
(1)解决数据冗余的问题。
(2)解决维护、更新数据时需要大量的人工干预的问题。
5.现代社会数据管理的主要方式:传统数据库技术。
·基础:基于结构化数据
·特点:数据独立性、数据可共享
6.依据数据的结构化程度,可以将其分为结构化数据、非结构化数据和半结构化数据。
2
数据安全
1.威胁数据安全的常见因素
(1)存储介质(如硬盘)的损坏
(2)操作的失误
(3)黑客的入侵
(4)计算机病毒
(5)遭受自然灾害
2.保护数据安全的方法
(1)保护存储数据的介质。对于政府部门或企业的数据,目前主要采取主动防护的手段,如磁盘阵列、数据备份、异地容灾。
(2)提高数据本身的安全:可通过数据加密、数据校验等方法提高数据的保密性和完整性。
3.数据加密:通过加密算法和加密秘钥将明文转变为密文。
4.数据校验:通常用一种指定的算法对原始数据计算出一个校验值,接收方按照同样的算法计算出一个校验值,如果两次计算得到的校验值相同,这说明数据是完整的。常见的数据校验方法:MD5、CRC、SHA-1等。
5.保障个人数据和财产安全的要点
(1)提高数据安全意识
(2)增强法律意识
(3)采取必要的安全防范措施
①定期杀毒
②不访问危险网址
③不打开危险邮件、链接
④不随意扫描来路不明的二维码
⑤定期升级系统、安装系统补丁
(4)及时备份重要数据
典例2 下列有关数据安全的说法错误的是( )
A.信息社会数据安全关乎国计民生
B.通过数据加密提高数据本身的安全
C.个人数据不需要像企业数据一样备份
D.操作失误是威胁数据安全的因素之一
解析 个人重要数据也需要备份。
C
典例3 下列有关数据安全的说法,正确的是( )
A.数据交互双方可以通过数据校验,保障数据的完整性
B.重要数据可以通过加密与数据校验提升安全性,不必备份
C.因用户操作失误导致的数据丢失,可通过磁介质恢复数据
D.强密码非常安全,因此可以在多个系统中使用统一的强密码
解析 重要数据在通过加密与数据校验提升安全性的同时,也必须进行备份;因用户操作失误导致的数据丢失不能通过磁介质恢复数据;在不同的系统中应该使用不同的密码以保障安全性。
A
3
大数据
1.大数据定义:大数据代表着信息量大、速度快、种类繁多的信息资产,需要特定的技术和分析方法将其转化为价值。
2.大数据之“大”
(1)规模、速度、种类的特征
(2)超出以往常用的数据采集、组织、管理和加工等软件处理能力,要求新型集成技术从多元、复杂和巨量规模的数据集里洞察规律。
3.大数据4V特征:数量(Volume)、速度(Velocity)、多样(Variety)、价值(Value)。
(1)数据体量大:收集和分析的数据量庞大 量级单位跃升至EB、ZB,且时刻增长中。
(2)速度快:
数据产生的速度快,
数据处理的速度快。
(3)数据类型多:来源多样(人、机器等) 数据多种形式共存 数据种类和格式不可能一致(结构化、半结构化、非结构化)。
(4)价值密度低:尽管大数据具有很高的价值,但与其海量的数据量相比,显得密度较低 提纯。
4.大数据思维
大数据是一场变革,改变的不仅是数据,还有人们的思维。
(1)大数据采用全样本分析,而不是抽样数据 带来更全面的认识,也能更清楚地发现抽样数据无法揭示的详尽信息。
(2)不再追求个别数据的精确性,允许数据混杂 数据量大到一定程度,个别数据的不准确就显得不那么重要。
(3)不一定强调事物之间的因果关系,而是更注重它们之间的相关性。
5.大数据对社会的影响
(1)成为重要生产因素,对经济社会发展发挥越来越重要的作用。
(2)渗透到社会各层面,不断提高工作效率和生活便利性。
(3)让决策更精准。
(4)带来新的就业需求。
(5)带来新的社会问题:信息泄露、数据安全、个人隐私、伦理道德等。
典例4 下列有关大数据的说法正确的是( )
A.大数据就是指数据很多
B.大数据带来新的就业需求
C.大数据采集的是非结构化数据
D.大数据思维强调事物之间的因果关系
解析 A.大数据不仅指数据量大,还应具有“速度快、数据类型多、价值密度低”等特点;C.大数据采集的数据类型多样,结构化、半结构化和非结构化数据都有;D.大数据思维不强调事物之间的因果关系,更注重它们之间的相关性。
B
典例5 (2022浙江7月学考)下列关于数据与大数据的说法,正确的是( )
A.数据是现代科学研究的重要资源
B.大数据的数据量庞大,价值密度高
C.计算机中的数据都以ASCII码存储
D.大数据的应用降低了用户隐私信息泄露的风险
解析 本题考查大数据的特征。大数据蕴含着巨大的价值,但因其数据量庞大,可能发挥价值的仅是其中非常小的部分,价值密度相对较低,故选项B错误;计算机中的数据都以二进制的形式存储,故选项C错误;大数据给生活带来便利的同时,也带来如信息泄露、数据安全,个人隐私甚至伦理道德等方面的社会问题,故选项D错误。
A
同课章节目录