粤教版(2019)必修1 第5章 数据处理与可视化表达 知识点梳理复习 (含练习答案)

文档属性

名称 粤教版(2019)必修1 第5章 数据处理与可视化表达 知识点梳理复习 (含练习答案)
格式 docx
文件大小 64.2KB
资源类型 教案
版本资源 粤教版(2019)
科目 信息技术(信息科技)
更新时间 2022-02-27 14:36:39

图片预览

文档简介

粤教版信息技术必修一《数据与计算》
第五章 数据处理与可视化表达
【知识结构体系】
【知识梳理】
一、认识大数据
(一)大数据的概念
大数据:无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
(二)大数据的特征
1.从互联网产生大数据的角度来看(具有“4V”特征):
大量(Volume),多样(Variety)
低价值密度(Value),高速(Velocity)。
2.从互联网思维的角度来看:
样本渐趋于总体,精确让位于模糊,相关性重于因果
3.从大数据存储与计算的角度来看:
分布式存储,分布式并行计算。
(二)大数据的影响
1.大数据使人们日常生活更为便捷:
方便支付、方便出行、方便购物与产品推荐、方便看病与诊病。
2.大数据对人们日常生活产生的负面影响:
个人信息泄露、信息伤害与诈骗。
二、数据的采集
(一)数据采集的方法与工具
1.系统日志采集法:
监视系统中发生的事情
检查错误发生的原因
寻找攻击时攻击者留下的痕迹
2.网络数据采集法:
网络爬虫:从初始网页的URL(统一资源定位器)获取对应的数据
网络公开API
Python网络数据采集程序使用扩展库时导入模块的方法:
import module
from module import name
3.其他数据采集法。
(二)数据的存储
1.本地存储:把数据存在本地内部
2.云存储:把数据放在第三方公共或者私有的“云端”存储
分布式文件存储
Nosql数据库存储
(二)数据的保护
1.数据安全保护技术:拷贝、备份、复制、镜像、持续备份,加密…
2.数据的隐私保护
(1)技术手段
数据收集时:精度处理
数据共享时:访问控制
数据发布时:人工干扰
数据分析时:匿名处理
(2)提高自身意识
(3)进行道德和法律约束
三、数据的分析
常见数据分析方法:特征探索,关联分析,聚类与分类,建立模型,模型评价
(一)特征探索
信息是经过加工处理的、具有意义的数据。
(二)关联分析
1.普遍性
2.传递性
3.共享性
4.依附性和可处理性
5.时效性
6.真伪性
7.价值相对性
(三)聚类分析
香农,美国数学家、信息论的创始人,被称为“信息论之父”。他认为信息是用来减少随机不确定性。
(四)数据分类
香农,美国数学家、信息论的创始人,被称为“信息论之父”。他认为信息是用来减少随机不确定性。
四、数据的可视化表达
(一)数据可视化表达的方法
信息是经过加工处理的、具有意义的数据。
(二)数据可视化表达的工具
1.普遍性
【典型例题】
1.下列关于数据的说法不正确的是( )
A.数据是对客观事实、概念等的一种表示
B.图形、图像﹑视频、音频、文本都是数据
C.在计算机科学中,数据的类型可分为数值型和非数值型符号
D.数据与信息不同,数据是日常所说的数值,而信息是指日常所见的现象
2.小智上网搜索信息技术发展史的相关资料,不仅找到了详细的文字介绍,还发现了许多照片与视频资料,这体现了数据具有的特征是( )
A.二进制 B.语义性 C.分散性 D.多样性与感知性
3.关于编码的描述,正确的是( )
A.视频编码不需要采样和量化的步骤
B.文字的编码是效率相对较低的编码方式,只有ASCII码一种
C.现代技术的信号处理中,数据基本上是通过编码将模拟信号转换为数字信号的
D.计算机中,文字和图像数据是经过编码进行存储和传输的,声音数据则不需要编码
4.一副未经压缩的1280×1024像素的BMP图像文件,其存储容量约为3.96MB,则该图像每个像素色彩编码的位数为( )
A.4 B.8 C.16 D.24
5.下列关于信息的特征的说法中,不正确的是( )
A.“飞鸽传书”体现了信息的传递性
B.“盲人摸象”体现了信息的价值相对性
C.天气预报,股市行情体现了信息的时效性
D.交通信号灯能同时被车辆和行人接收,体现了信息的可处理性
6.小王第一次到重庆,他手机上的地图软件没有更新导致他迷了路,这着重体现了信息的( )。
A.普遍性 B.真伪性 C.传递性 D.时效性
7.字母A的ASCII码值是65,则ASCII码值为99的字母是d。( )
8.香农是美国数学家、信息论的创始人。( )
9.二进制数(1011)2转换成十进制数是(13)10。( )
10.信息是经加工处理的、具有意义的数据。( )
11.二进制计算:(1011)2+(111)2=(10010)2是正确的。( )
12.香农认为信息是用来减少随机不确定性的东西。( )
13.在信息时代如何判断信息的真伪 谈谈你的方法或经验。
【解析】当看到有些言论或者信息有转发的冲动时,至少在心中确认如下三个问题:内容是不是可以被验证,信息是不是来自正规渠道,是否有两个以上的独立来源可以证实。经过自己的论证辨识后再评论,再转发、再批驳。
信息真伪的判别可以参照如下几个方面来进行:
①信息是否真实可靠;②信息来源是否具有权威性;③信息是否可用;④信息是否具有时效性;⑤信息包含哪种情感成分;⑥信息是否具有实用性。
【参考答案】
题号 1 2 3 4 5 6 7 8 9 10 11 12
答案 D D C C D D B A B A A A