5.2数据的采集-【新教材】粤教版(2019)高中信息技术必修一课练习(含答案)

文档属性

名称 5.2数据的采集-【新教材】粤教版(2019)高中信息技术必修一课练习(含答案)
格式 zip
文件大小 31.7KB
资源类型 教案
版本资源 粤教版(2019)
科目 信息技术(信息科技)
更新时间 2021-11-29 10:13:46

文档简介

5.2数据的采集练习题
选择题
1、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。
A:统计报表
B:网络爬虫
C:API接口
D:传感器
2、当前社会中,最为突出的大数据环境是(A )。
A:互联网
B:物联网
C:综合国力
D:自然资源
3、下列关于网络用户行为的说法中,错误的是( C)。
A:网络公司能够捕捉到用户在其网站上的所有行为
B:用户离散的交互痕迹能够为企业提升服务质量提供参考
C:数字轨迹用完即自动删除
D:用户的隐私安全很难得以规范保护
4、下列论据中,能够支撑“大数据无所不能”的观点的是( A)。
A:互联网金融打破了传统的观念和行为
B:大数据存在泡沫
C:大数据具有非常高的成本
D:个人隐私泄露与信息安全担忧
5、在网络爬虫的爬行策略中,应用最为基础的是(AB )。(多选题)
A:深度优先遍历策略
B:广度优先遍历策略
C:高度优先遍历策略
D:反向链接策略
E:大站优先策略
6、下列关于脏数据的说法中,正确的是( ABCDE)。(多选题)
A:格式不规范
B:编码不统一
C:意义不明确
D:与实际业务关系不大
E:数据不完整
7、云计算的优势体现在以下哪些方面?(多选题)
云计算服务更加安全可靠
B.云计算可以真正实现按需服务
C.云计算可以有效提高资源利用率
D.云计算可以大大降低成本和能耗
8、智慧城市的构建,不包含( C)。
A:数字城市
B:物联网
C:联网监控
D:云计算
9、支撑大数据业务的基础是( B)。
A:数据科学
B:数据应用
C:数据硬件
D:数据人才
10、下列关于数据重组的说法中,错误的是( A)。
A:数据重组是数据的重新生产和重新采集
B:数据重组能够使数据焕发新的光芒
C:数据重组实现的关键在于多源数据融合和数据集成
D:数据重组有利于实现新颖的数据模式创新
二、判断题
1、一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、
逻辑上的一体性、性能上的可扩展性等特点。(True )
2、云计算就是软件在云端无所不在、无限强大的计算,也叫网
络化计算或网格计算。(True)5.2 数据的采集
一、选择题
1、大数据时代,数据使用的关键是( )。
A、数据收集
B、数据存储
C、数据分析
D、数据再利用
2、智能健康手环的应用开发,体现了( )的数据采集技术的应用。
A、统计报表
B、网络爬虫
C、API接口
D、传感器
3、数据采集的基本方法包括( )、网络数据采集法和其他数据采集法。
A、数据库采集法 B、访问记录采集法
C、数据目录采集法 D、系统日志采集法
4、网络数据采集法,主要通过网络爬虫或网站公开API的方式获取,网络爬虫从网页的( )开始获取。
A、HTML B、WWW C、URL D、XML
5、下列( )不属于Python网络数据采集程序使用的扩展库。
A、System B、SciPy C、Pandas D、Matplotlib
6、在Python模块库中有大量模块可供使用,要想使用这些文件,就需要用( )语句把指定模块导入当前程序中。
A、move B、in C、import D、print
7、下列( )不是数据保护的有效方法。
A、剪切 B、复制 C、拷贝 D、镜像
8、下列( )数据安全保护技术可以进行远距离使用。
A、拷贝 B、备份 C、复制 D、镜像
9、下列( )不属于隐私保护的手段。
A、数据收集时进行数据精度处理
B、数据共享时进行访问控制
C、不使用任何智能化设备
D、数据发布时进行人工加扰
10、我们一般说的cookies是( )。
A、数据收集程序 B、数据应用程序
C、数据存储程序 D、数据处理程序
二、判断题
1、要完成数据的采集工作,首先需要明确数据需求选定项目主题。( )
2、网络数据采集法:在目标主机上安装一个小程序,将目标主机的文本、应用程序、数据库等日志信息有选择地定向推送来进行管理。( )
3、只要删除掉上网的浏览记录就可以避免信息泄露。( )
4、我们可以把数据放在第三方公共或公有的“云端”存储。( )
5、数据的存储的方式:采用分布式文件存储或NoSQL数据库存储。( )
试题答案
一、选择题
1 2 3 4 5 6 7 8 9 10
D D D C A C A C C C
解析:
1、大数据时代,数据使用的关键是数据再利用。
2、智能健康手环可以通过传感器采集人的血压、心跳、步数等数据采。
3、数据采集的基本方法包括系统日志采集法、网络数据采集法和其他数据采集法。
4、网络爬虫从网页的URL开始获取,采集类型支持图片、音频、视频等文件或附件的采集,附件与正文可以自动关联。
5、Python网络数据采集程序使用的扩展库主要有:NumPy、SciPy、Pandas、Matplotlib。
6、在Python模块库中有大量模块可供使用,要想使用这些文件,就需要用import语句把指定模块导入当前程序中,格式:import module。
7、数据保护的有效方法:拷贝、备份、复制、镜像、持续备份。
8、复制、持续备份远近皆可,拷贝、备份、镜像主要是进行近距离备份。
9、常用的隐私保护有数据收集时进行数据精度处理、数据共享时进行访问控制、数据发布时进行人工加扰、数据分析时进行数据匿名处理。
10、Cookies是指用户浏览网页时,网络服务器以文本格式存储在用户电脑硬盘上的少量数据。
二、判断题
1 2 3 4 5
√ × × × √
解析:
1、数据采集的基本步骤:明确数据需求选定项目主题;制订数据采集清单内容大纲;适当的方法和工具进行采集。
2、网络数据采集法:指通过网络爬虫或网站公开API(Application Programming Interface, 应用程序接口)等方式从网站上获取数据信息。
系统日志采集法:在目标主机上安装一个小程序,将目标主机的文本、应用程序、数据库等日志信息有选择地定向推送到日志服务器进行存储、监控和管理。
3、信息泄露的途径非常多,在上网访问的同时我们的信息已经被收集记录,所以通过清除访问记录,并不能避免信息泄露,正确的做法是不要将敏感信息在不安全的网络环境下传播发送。
4、我们可以把数据放在第三方公共或私有的“云端”存储,是私有的云存储,不是公有。
5、数据的存储的方式:采用分布式文件存储或NoSQL数据库存储。