数据处理和可视化表达
一、选择题
1.大数据改变的不仅是数据,还有人们的思维。针对于此,以下描述正确的是( )。
A.大数据要分析的是抽样数据 B.不接受数据的混杂性
C.强调对事物因果关系的探究 D.更加注重事物的相关性
2.数据可视化表达的工具有( )
A.Seaborn 与Bokeh B.Seaborn 与 Word C.Word与 Bokeh D.Excel与c++
3.下列选项中属于大数据的是( )
①气象卫星采集的数据 ②微信使用中产生的数据 ③地感线圈记录的车辆通行数据
④校门口保安手持测温仪测量入校师生的体温数据 ⑤学生网上高考报名数据
A.①②③ B.①②③④ C.①②③⑤ D.①②③④⑤
4.超市收银员通过条形码阅读器扫描商品的条形码,以获取相应商品的信息。此扫描过程属于( )
A.信息的采集 B.信息的编码 C.信息的发布 D.信息的表达
5.常见隐私保护的方法( )
A.数据收集时进行数据精度处理
B.数据共享时进行访问控制
C.数据发布时进行人工加扰
D.以上都是
6.在当前社会中,最为突出的大数据环境是( )
A.互联网 B.物联网 C.综合国力 D.自然资源
7.下列行为可能使用大数据的是( )。
①为了避免堵车,利用高德地图,查看道路拥堵情况 ②利用人脸识别打开门禁道闸,进入校园
③水银温度计上显示当前气温是30℃ ④全民K歌提示你打败了全国90%的人
⑤微信运动显示你今天走了10000步
A.①②③④ B.①②④⑤ C.②③④⑤ D.①②③④⑤
8.有关数据泄露的途径说法错误的是( )
A.通信工具
B.移动支付
C.发送邮件
D.以上都不会数据泄露。
二、简答题
9.结合现实生活中的体验,谈一下自己对大数据的感受。
10.结合现实生活中的体验,谈一下数据分析的意义。
三、操作题
11.情景二:大数据时代
在日常工作、生活和学习等活动中,人们的数字化活动都会产生数据,使用导航出行、拨打电话、发送微信、网上浏览查阅资料、线上购物…人类社会活动产生了海量的数据正确、高效地对这些数据进行采集、存储、处理,并发掘数据中的价值,将对人类社会生活带来更大的积极影响。
围绕以上情景,回答下题。
(1)在大数据时代,网络信息的采集是一项重要的工作,如果单纯靠人力进行网络信息采集,不仅低效繁琐,搜集的成本也会提高。此时,我们可以合法使用( )对网络数据进行自动采集。
A系统日志 B.网络爬虫 C.传感器 D.问卷调查
(2)大数据存储技术是大数据领域的另一个关键技术,人们利用( )代替集中式存储,这种存储方式能够支持多台处理器或多个计算机节点并行计算来提高解决问题的效率。
A分布式存储 B.本地存储 C.移动存储 D.磁带存储
(3)某国的一家大型连锁超市通过利用信息系统对大量的销售数据进行了特定的分发现一个“奥秘”,于是这家超市就把尿布和啤酒这两种看起来没有关联的商品摆放在一起销售,结果销售量大幅增加。原来,超市经营者从数据分析中发现,婴儿尿布通常是男人们下班时购买的,而他们在购买尿布时又会顺便购买自己爱喝的啤酒。这个案例中的超市信息系统应用了大数据分析中的哪种技术?( )
A.聚类分析 B.关联分析 C.分类分析 D.回归分析
(4)导航软件提供了“未来出行”功能,用户可以设定未来出行时间,软件利用大数据分析,预估未来行程所需时长,为用户合理规划出行时间提供参考。这一功能凸显了大数据分析的哪一个核心作用?( )
A.了解事物的现状 B.剖析事物的发展历程
C.预测事物的未来走向 D.数据价值化
(5)如图是一张火车票,上面有时间、目的地、身份证号码等数据,则下列说法错误的是( )
A.数据采集技术的迅速发展,数据的表现形式也越来越多样化,给人们的生活带来了巨大的改变
B.只有云计算、物联网、大数据等技术才能体现数据与生活
C.在人们的日常生活中数据无处不在
D.对于身份证号码等涉及个人隐私的数据要注意保护
四、判断题
12.大数据价值密度低,不会造成个人隐私的泄露。( )
13.疫情期间,国家有关部门可以通过大数据筛选、查找到和感染者有过密切接触的人,大数据一方面方便人们看病问诊,另一方面也存在个人信息泄露的风险。 ( )
14.数据采集的基本方法包括系统日志采集法、网络数据采集法和其他数据采集方法。( )
15.贝叶斯分类算法是统计学的一种分类方法,它是一类利用概率统计知识进行分类算法,利用朴素贝叶斯算法可以实现新闻敏感词的屏蔽功能。贝叶斯分类属于大数据分析技术中的数据分类技术。( )
16.大数据对我们的意义在于,我们有可能从如此庞大的数据中挖掘出有价值的数据,并运用于管理、农业、金融、医疗和教育等各个社会领域,为社会发展服务。 ( )
17.高德地图根据用户实时上报的交通信息,通过大数据平台整合各种信息,给出相应的路线。 ( )
五、填空题
18.数据分析报告是项目________的展示,也是数据分析结论的有效承载形式。在数据分析报告中,首先需要明确数据分析的________,阐述目前________及通过分析希望解决的问题;其次需要描述数据来源和数据分析的________、________和________;最后需要重点呈现数据分析的________、________和________。
19.1KB字节中,共有( )位数的存储单位。
20.平均分析就是运用________的方法,来反映总体在一定时间、地点条件下某一数量特征的________。
21.通过报告不仅是把数据分析的起因、过程、结果及建议完整的展现出来,更为决策者提供科学、严谨的决策依据。 ( )
22.大数据是以________大、________多、________快、________高为主要特征的数据集合,它正快速发展为对数量巨大、来源分散、格式多样的数据进行________、________和________,从中发现新知识,创造新价值、提升新能力的新一代信息技术和服务业态。
23.数据分析的常用方法有________、________等。
试卷第页,共页
参考答案:
1.D
2.A
3.A
4.A
5.D
6.A
7.B
8.D
9.无标准答案。
10.结合现实生活中的体验,数据分析的意义有:比如可以分析的自己的购物行为习惯,学习习惯,时间管理等。
11. B A B D B
12.错误
13.对
14.正确
15.正确
16.对
17.对
18. 研究结果 目的和背景 存在的问题 思路 方法 模型 过程 结论 建议
19.8192
20. 计算平均值 一般水平
21.对
22. 容量 类型 存取速度 应用价值 采集 存储 关联分析
23. 对比分析 平均分析
试卷第页,共页