第三章数据处理与应用测试卷
1、如图所示,某景区2020年某一周的入园游客数量图表,根据图表分析,下列结论错误的是()。
A.该图表是折线图
B.该图表是雷达图
C.周六的入园游客数量最多
D.为了分散一周游客入园数量,可以在周三举行门票打折活动
2、IF函数是电子表格软件中用来做条件判断的函数,单元格A2的值是90,如果在A3输入“=IF(A2>=90,"合格","不合格")”,确定后得到的结果是()。
A.合格
B.不合格
C.90
D.NULL
3、在用电子表格软件处理某地部分市场菜篮子价格数据,如图所示。
计算表中“平均值”列数据:选择I3单元格输入函数(公式),然后用自动填充功能完成其他单元格平均值的计算。则I3单元格中可使用的函数为( )
A. =SUM(C3,H3)/6
B. =(3.5+3+3+3+3+3)/6
C. =C3+D3+E3+F3+G3+H3/6
D. =AVERAGE(C3:H3)
4、某慈善总会接收抗击新型冠状病毒感染肺炎的捐赠物资,使用电子表格软件进行数据处理,若要统计“分类捐助总量”的数据,统计“N95口罩”的总量可修改F4单元格中的公式,并对G4:H4进行自动填充,统计出“84消毒液”和“医用防护服”的总量,则F4单元格中的公式应修改为()。
[提示:SUMIF函数用于对区域中满足条件的单元格求和。例如:=SUMIF(B3:B3126,F3,C3:C3126)表示求B3:B3126区域中所有“N95口罩”的总量]
A. =SUMIF($B3:$B3126, F3, $C3:$C3126)
B. =SUMIF(B$3:B$3126, F3, C$3:C$3126)
C. =SUMIF($B3:$B3126, F3, C$3:C$3126)
D. =SUMIF(B$3:BS3126, F3, $C3:$C3126)
5、学校体育教师对某班级进行三个项目的测试,部分同学体育成绩如下表:
图中数据存在的问题主要为( )。
A.数据缺失
B.数据重复
C.数据逻辑错误
D.数据格式不一致
6、学校体育老师分别在8月3日和8月4日对运动队队员进行体育测试,队员的体育成绩如下表:
图中数据存在的问题主要为( )。
A.数据缺失
B.数据重复
C.数据格式不一致
D.以上问题都存在
7、手机导航应用能够实时推荐最快路线,主要体现了大数据的()特征。
A.数据体量巨大
B.数据类型多
C.数据变化速度快
D.价值密度低
8、手机中的短视频应用,能够根据用户的浏览喜好,自动推荐相关视频,这主要体现了大数据的()特征。
A.数据体量巨大
B.数据类型多
C.数据变化速度快
D.价值密度低
9、相对于静态数据而言,实时变化的数据称为流数据,下列关于数据流的描述错误的是()。
A流数据在处理时已经采集完成
B道路实况导航属于流数据
C实时分析流数据可以得到更有价值的结果
D流数据可以采用流计算系统进行实时分析处理
10、2020年11月1日,正式开始第七次全国人口普查,普查信息除了普查员登记获取外,还可以通过手机小程序自主填报获取。后者的数据采集方式是()。
A.实验数据采集
B.传感器采集
C.网络爬虫
D.系统录入
11、小明想要查看云南省近三年的气温数据,下列哪种方式最合适()。
A百度搜索关键词
B图书馆查阅资料
C咨询地理老师
D访问“国家气象科学数据中心”网站查看
12、智能手环可以监测使用者的心率、记录运动步数等,那么智能手环的功能体现了()数据采集的应用。
A.统计报表
B.网络爬虫
C传感器
D实验数据采集
13、下列关于数据整理的说法错误的是()。
A数据整理的目的是对数据进行校验和标准化
B CSV文件将数据表格存储为纯文本
C采集的数据只能保存为csv文件
D整理数据可以通过编写程序实现
14、自新冠病毒感染肺炎疫情暴发以来,网络某大数据平台通过可视化数据图表实时更新全球疫情,如图是2020年某一天的全球确诊病例情况。在对数据进行分析时,该种分析属于()。
A.横向对比分析法
B.纵向对比分析法
C.平均分析法
D.结构分析法
15、matplotlib库中的pyplot子库主要用来绘制图表,其中用来绘制散点图的函数是()。
A.plot()
B.scatter()
C.title()
D.show()
16、学校篮球队想给队员做一个学期的训练数据分析,数据包括体能和技术中的8个小项,较为适合的数据图表呈现方式是()。
A.折线图
B.散点图
C.热力图
D.雷达图
17、2020年10月29日,党的十九届五中全会在北京闭幕,大会通过的公报文本的
词云图如下,下列说法正确的是( )。
A.对文本分词后可直接创建词云图,无须特征提取
B.词云图必须显示该数据集包含的全部词语
C.通过词云图显示,词语“发展”比“体系”的出现频率髙
D.最能表现文本特征的词有“建设”“国家”“实力”
二、非选择题
1.某学校高一年级一次月考结束后,老师用电子表格软件对数据进行处理,如图所示:
请回答以下问题:
(1)该数据表是按照_______科目进行_________排列。
(2)该数据表中第二位同学没有总分,如果要用公式计算此同学的总分,公式为“_______________”。
(3)已知该校高一年级共有200名学生都参加了考试,要对全年级学生按照总分进行排名(相同分数名次需相同),可用到Rank函数,则在H3单元格中应输入的Rank函数参数为___________。
2.高二年级的10位同学参加数学竞赛,成绩如下:
(1)在上表的G7单元格中,通过函数求出10位同学的平均分是80.9,则应在该单元格输入的函数是_________________。
(2)AVERAGE1F是指定条件求平均值函数,上表所示的G3单元格就是通过AVERAGEIF函数求出指导教师是“王老师”的所有学生的平均成绩。如果用该函数求出“刘老师”指导学生的平均分,则函数第二个参数应该填:_______________ 。
(3)如果要通过自动填充的方式得到G4和G5单元格的值,则G3单元格的函数式子应该改为:_______________________________。
3.高三年级的10位学生参加学校的物理竞赛,成绩如下:
(1)通过观察上表,获得一等奖的判断条件是:_________________
(2)物理老师通过电子表格软件的“IF函数”快速得到了学生的等级,那么“赵杰”同学所获得“等级”单元格的函数编辑栏内的函数应该是:_____________________________.
(3)物理老姉想把表中数据复制到新建数据表中进行编辑,但不想连同D列中的函数粘贴到新表,比较恰当的方式是:____________。(A.在新表中手动输入;B、选择性粘贴为数值;C、选择性粘贴为图片)
4.2017年,在建设高等院校“211工程”和“985工程”的基础上,国家推进“双一流”大学的建设,如图所示是西南三省211大学单:
(1)在电子表格软件中,我们一般通过COLJNTIF函数计算区域中满足给定条件的单元格的个数。在上表的单元格F3中,逋过“COLNTIF(C3:C9,E3)”函数得到云南省的211大学数量是1,COUNTIF函数中统计“云南省”211大学个数的数据区域是_______________。
(2)得到云南省的211大学数量后,张华通过自动填充的方式,得到四川省的211大学个数为4,结果与实际不符,应该将单元格F3的函数修改为___________________。
(3)如果要直观地表示各个省份211大学数量,可以应用哪种图表方式___________。
5.现有5名篮球队员在联赛中的比赛数据,如下图所示。
(1)上图右侧所示的图表类型是_____________;该图表呈现了周旋岷、成果汝两名队员的数据,则系列1和系列2分别是_________(A.周旋岷和成果汝;B.成果汝和周旋岷)。
(2)通过电子表格软件对数据进行分析,计算5名队员各项数据的平均值可以用到的函数是________________。
(3)如果把队员“高贤”的5项数据放在Python程序中的一个列表中,则代码为“GX=[6.8,1.9,2.1,1.9,0.4]”,那么GX[3]的值为____________。
6.高三5班毕业后,班长小明收集了同学们的信息后,做了一个班级通讯录。通讯录的内容包括:姓名、QQ、手机号、录取大学、大学所在城市5项内容。
(1)小明是通过网络问卷的方式收集同学们的信息,则这种数据采集方式属于________________ 。
(2)小明将网络问卷后台的数据导出后生成了一张CSV表格,他将数据整理后直接发在了微信朋友圈,他的这种做法对吗?请简要分析原因。
_______________________________________________________________。
7.词云图是目前常用的关键词可视化数据表达方式,下图是一个词云图示例。
(1)词云图通常使用文字的________和______来表示关键词出现的频次,示例词云图应该是对_________小说中人物出现频次进行分析后的结果。
(2)制作词云的方法很多,我们常用Python编程进行词云制作,则编写程序的指令顺序应该是___________(①分词;②导入文本;③保存词云图片;④特征提取,数据分析)。
8.在利用Python编程中,常常使用matplotlib库进行函数绘制,下图所示是通过8组数据绘制得到的曲线图像及部分代码。
(1)绘制函数图主要用到matplotlib库的子库是____________。
(2)上述Python程序的第9行应该填写的关键代码是_______________。
(3)通过观察这8组数据的曲线变化趋势,推测此图像函数是_____________。
9.某地图软件公司通过收集用户的定位数据,可以得到某一区域的人口流量大数据。如图所示是云南石林景区某两天的游客流量图。
(1)游客流量大数据可以根据使用手机地图软件的游客进行实时更新,这主要体现了大数据的_____________特征。
(2)上述图表我们称为_____________。
(3)采集到国庆节放假前后两天的数据,通过_________分析法直观呈现两天游客流量的情况。
10.利用Python编程进行数据处理的时候,常用到pandas库。如下图所示,通过调用pandas库进行成绩的整理。
1 import pandas as pd
2 grade=[[88,89,92],[78,96,91],[99,97,94]]
3 name=["张华","李明","王鹏"]
4 sub=["数学","英语","语文"]
5 df=pd.DataFrame(grade,name,sub)
(1)上述代码中的“name”变量的数据类型是_____________。
(2)在上述代码中添加“print(df.loc[”张华","数学"])”指令可以输出张华的数学成绩为88,如果添加代码“print(df.loc["李明","英语"])”,则得到的结果是____________。
(3)第一行程序的注释可以写为__________________。
答案
一、单选题
1 2 3 4 5 6 7 8 9 10
B A D A B C C C A D
11 12 13 14 15 16 17
D C C A B D C
二、非选择题
1、
空1答案:数学
空2答案:降序
空3答案:=D4 + E4 + F4 + G4 或 =sum(D4:G4))
空4答案:(C3,C$3:C$202)
2、
空1答案:=AVERAGE(C3:C12)
空2答案:F4
空3答案:=AVERAGEIF(D$3:D$12,F3,C$3:C$12)
3、
空1答案:成绩 >= 90分
空2答案:=IF(C8 >= 90,”一等奖”,”二等奖”)
空3答案:B
4、
空1答案:C3:C9
空2答案:COUNTIF(C$3:C$9,E3)
空3答案:柱形图
5、
空1答案:雷达图
空2答案:A
空3答案:average
空4答案:1.9
6、
空1答案:网络数据采集法
空2答案:包含个人信息的数据不应该直接公开发布,可选择邮箱或者私信发送
7、
空1答案:大小
空2答案:颜色
空3答案:三国演义
空4答案:②①④③
8、
空1答案:pyplot
空2答案:plt.plot(x,y)
空3答案:y = 1/x
9、
空1答案:变化速度快
空2答案:折线图
空3答案:对比
10、空1答案:列表 或 list
空2答案:96
空3答案:导入pandas库