3.3 数据分析与可视化
一、选择题
1.下列不是有关逻辑关系的分析是( )
A.散点图 B.词云 C.数据地图 D.雷达图
2.数据特征探索的主要任务是( )
A.对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。
B.分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。
C.是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。
D.是数据分析中最基本的方法。先基于样本数据构建分类器,然后进行预测。
3.数据分析的过程不包括( )
A.首先要根据分析的目标提出假设
B.然后选择恰当的分析方法进行分析
C.验证假设是否正确
D.根据分析直接得出相应的结论
4.数据分析的基本方法包括( )
A.特征探索、关联分析、聚类分析、数据分类
B.特征探索、聚类分析、数据分类
C.特征探索、数据分类
D.关联分析、聚类分析、数据分类
5.某男同学的体重80KG,身高170cm,请问,以下能用来判断该同学偏肥或偏瘦最有效的数据分析方法是( )。
A.聚类分析 B.关联分析 C.数据分类 D.以上都不行
6.数据可视化的呈现类型有( )
A.探索型 B.试探型 C.逻辑型 D.布尔型
7.数据分析的常见方法包括( )
A.对比分析、关联分析、平均分析 B.对比分析、平均分析、交叉分析
C.交叉分析、关联分析、平均分析 D.关联分析、对比分析、交叉分析
8.数据可视化表达的工具有( )
A.Seaborn 与Bokeh B.Seaborn 与 Word C.Word与 Bokeh D.Excel与c++
二、简答题
9.改革开放以来,中国经济发展取得令人瞩目的成就,但是中国各省发展差异大。如历年各省的国内生产总值(GDP)和人口数据,我们可以发现经济发展和人口数据的变化规律。请采集有关数据,并进行数据分析,通过数据分析发现数据中的一些规律。
10.结合现实生活中的体验,谈一下数据分析的意义。
三、判断题
11.数据是现实世界客观事物的符号记录,是信息的载体,不能用计算机进行加工。(_____)
12.数据分析的方法主要有对比分析、平均分析。对比分析是指将两个或两个以上的数据进行比较,分析它们的差异,来反映总体在一定时间、地点条件下某一数量特征的一般水平。 (____)
13.数据可视化的目的是为了帮助用户过滤、清洗掉无用的、错误的数据。(______)
14.平均分析和对比分析单个使用,更能清楚地反映要分析事物的不同情况特征。 (____)
15.数据可视化是指以图形、图像、地图、动画等生动、易于理解的方式展示数据和诠释数据之间的关系、趋势与规律等,以便更好地理解数据。( )
16.词云可以使得难以实现结构化的数据文本挖掘成为轻而易举的事情。( )
四、填空题
17.数据分析是指用恰当的________方法对收集来的数据进行________,从而得出有意义的结论的技术。
18.平均分析就是运用________的方法,来反映总体在一定时间、地点条件下某一数量特征的________。
19.对数据进行分析,首先要根据分析的目标________,然后选择恰当的________进行分析,________是否正确,继而得出相应的结论。
20.________是指将两个或两个以上的数据进行比较,分析它们的________,从而揭示这些数据所代表的事物发展变化________。对比分为________对比和________对比。横向对比指的是________的事物之间进行比较;纵向对比指的是和________事物的________进行比较。
21.数据分析的常用方法有________、________等。
22.通过报告不仅是把数据分析的起因、过程、结果及建议完整的展现出来,更为决策者提供科学、严谨的决策依据。 (____)
试卷第2页,共3页
参考答案
1.C
2.A
3.D
4.A
5.C
6.A
7.B
8.A
9.根据历年各省的国内生产总值(GDP)和人口数据,采用关联分析法推得随着时间的增长,经济和人口成正比增长,但经济增长较快,人口增长缓慢。
10.结合现实生活中的体验,数据分析的意义有:比如可以分析的自己的购物行为习惯,学习习惯,时间管理等。
11.×
12.错
13.错误
14.错
15.正确
16.错误
17.统计分析 计算、处理
18.计算平均值 一般水平
19.提出假设 分析方法 验证假设
20.对比分析 差异 情况和规律 横向 纵向 类似或者同类 相同 不同时期
21.对比分析 平均分析
22.对
答案第1页,共2页
答案第1页,共2页