北京·高一·同步练习
统计
一、选择题(共10小题,每小题4分,共40分,在每小题列出的四个选项中,选出符合题目要求的一项)
1. 对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是
A.46,45,56 B.46,45,53
C.47,45,56 D.45,47,53
2.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间内的一个数来表示,该数越接近表示满意度越高.现随机抽取位北京市民,他们的幸福感指数为3,4,5,5,6,7,7,8,9,10.则这组数据的分位数是( )
A.7 B. C.8 D.
3.在某次测量中得到的A样本数据如下:52,54,54,56,56,56,55,55,55,55.若B样本数据恰好是A样本数据都加6后所得数据,则A,B两样本的下列数字特征对应相同的是( )
A.众数 B.平均数
C.中位数 D.标准差
4.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
A.167 B.137 C.123 D.93
5.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体均值为3,中位数为4 B.乙地:总体均值为1,众数为0
C.丙地:中位数为2,众数为3 D.丁地:总体均值为1,中位数为1
6.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论错误的是( )
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
7.北京市普通高中学业水平等级考试成绩按等级赋分计人高考录取总成绩,它是按照原始成绩排名的百分比来计算成绩,具体等 级比例和对应的赋分值如下表:
等 A B C D E
比例 15% 40% 30% 14% 1%
级 A1 A2 A3 A4 A5 B1 B2 B3 B4 B5 C1 C2 C3 C4 C5 D1 D2 D3 D4 D5 E
比例 1% 2% 3% 4% 5% 7% 8% 9% 8% 8% 7% 6% 6% 6% 5% 4% 4% 3% 2% 1% 1%
分数 100 97 94 91 88 85 82 79 76 73 70 67 64 61 58 55 52 49 46 43 40
如果A考生某学科的原始成绩恰为所有选考该学科学生原始成绩的第80百分位数,则按等级赋分后,该考生此学科计人高考总分的分数为( )
A.80 B.82 C.85 D.88
8.惠州市某工厂 10 名工人某天生产同一类型零件,生产的件数分别是10、12、14 、14、15 、15 、16 、17 、17 、17,记这组数据的平均数为a,中位数为b,众数为c,则( )
A.a>b>c B.b>c>a C.c>a>b D.c>b>a
9.某校为了了解学生近视的情况,对四个非毕业年级各班的近视学生人数做了统计,每个年级都有7个班,如果某个年级的每个班的近视人数都不超过5人,则认定该年级为“学生视力保护达标年级”,这四个年级各班近视学生人数情况统计如下表:
初一年级 平均值为2,方差为2
初二年级 平均值为1,方差大于0
高一年级 中位数为3,众数为4
高二年级 平均值为3,中位数为4
从表中数据可知:一定是“学生视力保护达标年级”的是
A.初一年级 B.初二年级 C.高一年级 D.高二年级
10.容量为100的样本,其数据分布在,将样本数据分为4组:,得到频率分布直方图如图所示,则下列说法不正确的是
A.样本数据分布在的频率为0.32 B.样本数据分布在的频数为40
C.样本数据分布在的频数为40 D.估计总体数据大约有10%分布在
二、填空题(共5小题,每小题5分,共25分)
11.某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.
12.某校高一年级180名男生,150名女生,学校想了解高一学生对新课改的看法,用分层抽样的方式,从高一年级学生中抽取若干人进行访谈.已知在女生中抽取了30人,则在男生中抽取的人数为___________.
13.某学校开展了“国学”系列讲座活动,为了了解活动效果,用分层抽样的方法从高一年级所有学生中抽取10人进行国学素养测试,这10名同学的性别和测试成绩 (百分制) 的茎叶图如图所示.则男生成绩的75%分位数为______;已知高一年级中男生总数为80人,试估计高一年级学生总数为________ .
14.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为___
15.为了解本市居民的生活成本,甲、乙、丙三名同学利用假期分别对三个社区进行
了“家庭每月日常消费额”的调查.他们将调查所得到的数据分别绘制成频率分布直方图
(如图所示),记甲、乙、丙所调查数据的标准差分别为s1、s2、s3,则它们的大小关系
为 .(用“>”连接)
三、解答题(共6小题,共85分。解答应写出文字说明、演算步骤或证明过程)
16.北京是我国严重缺水的城市之一.为了倡导“节约用水,从我做起”,小明在他所在学校的2000名同学中,随机调查了40名同学家庭中一年的月均用水量(单位:吨),并将月均用水量分为6组:,,,,,加以统计,得到如图所示的频率分布直方图.
(1)给出图中实数a的值;
(2)根据样本数据,估计小明所在学校2000名同学家庭中,月均用水量低于8吨的约有多少户;
(3)在月均用水量大于或等于10吨的样本数据中,小明决定随机抽取2名同学家庭进行访谈,求这2名同学中恰有1人所在家庭的月均用水量属于组的概率.
17.某市准备引进优秀企业进行城市建设. 城市的甲地、乙地分别对5个企业(共10个企业)进行综合评估,得分情况如茎叶图所示.
(1)根据茎叶图,求乙地对企业评估得分的平均值和方差;
(2)规定得分在85分以上为优秀企业,若从甲、乙两地准备引进的优秀企业中各随机选取1个,求这两个企业得分的差的绝对值不超过5分的概率.(参考公式:样本数据x1,x2,…,xn的方差:,其中为样本平均数)
18.某社区组织了垃圾分类知识竞赛活动,从所有参赛选手中随机抽取20人,将他们的得分按照,,,,分组,绘成频率分布直方图(如图).
(1)求x的值;
(2)分别求出抽取的20人中得分落在组和内的人数;
(3)估计所有参赛选手得分的平均数、中位数.
19.某次数学考试后,抽取了20名同学的成绩作为样本绘制了频率分布直方图如下:
(1)求频率分布直方图中的值;
(2)求20位同学成绩的平均分;
(3)估计样本数据的第一四分位数和第80百分位数(保留三位有效数字).
20.为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.
(1)求乙离子残留百分比直方图中的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
21.某市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w应至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替,当时,估计该市居民该月的人均水费.
试卷第6页,共7页
参考答案
1.A
【详解】
由概念知中位数是中间两数的平均数,即众数是45,极差为68-12=56.所以选A.
点评:此题主要考察样本数据特征的概念,要正确地理解样本数据特征的概念以及正确地用来估计总体.
2.C
【分析】
先计算分位数的位置,再求出这个数即可.
【详解】
由题意,这10个人的幸福指数已经从小到大排列,
因为,
所以这10个人的分位数是从小到大排列后第8个人的幸福指数,即8.
故选:C
【点睛】
本题主要考查分位数的概念和计算,属于基础题.
3.D
【分析】
分别求出两样本的众数、平均数、中位数,结合标准差的意义,即可得结果.
【详解】
由题意可知样本的数据为58,60,60,62,62,62,61,61,61,61,
将样本中的数据由小到大依次排列为52,54,54,55,55,55,55,56,56,56,
将样本中的数据由小到大依次排列为58,60,60,61,61,61,61,62,62,62,
因此样本的众数为样本的众数为选项错误;
样本的平均数为样本的平均数为选项错误;
样本的中位数为样本的中位数为选项错误;
事实上,在样本的每个数据上加上6后形成样本,
样本的稳定性不变,因此两个样本的标准差相等,故选D.
【点睛】
样本数据的算术平均数,即.解答此类问题关键为概念清晰,类似概念有样本方差,标准差.其中是样本数据的第项,是样本容量,是平均数.将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
4.B
【详解】
试题分析:初中部女教师的人数为110×70%=77;高中部女教师的人数为150×40%=60,
∴该校女教师的人数为77+60=137,
考点:收集数据的方法
5.D
【分析】
利用平均数、中位数、众数的定义及计算公式,对四个选项逐一分析判断即可.
【详解】
解:对A:∵平均数和中位数不能限制某一天的病例超过7人,如0,0,0,0,4,4,4,4,6,8,
∴A不正确;
对B:∵平均数和众数不能限制某一天的病例超过7人,如0,0,0,0,0,0,0,0,0,10,
∴B不正确;
对C:∵中位数和众数不能限制某一天的病例超过7人,如0,0,0,0,2,2,3,3,3,8,
∴C不正确;
对D:假设过去10天新增疑似病例数据存在一个数据x,x≥8,而总体平均数为1,则过去10天新增疑似病例数据中至少有7个0,故中位数不可能为1,
所以假设不成立,故符合没有发生大规模群体感染的标志,
∴D正确;
故选:D.
6.A
【分析】
观察折线图,结合选项逐一判断即可
【详解】
对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;
对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;
对于选项C,观察折线图,各年的月接待游客量高峰期大致在7,8月份,故C正确;
对于D选项,观察折线图,各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳,故D正确.
故选:A
7.C
【分析】
由图知,B等,知 位于B1中,即可得解.
【详解】
由题知A考生某学科的原始成绩恰为所有选考该学科学生原始成绩的第80百分位数,
由图知, ,
所以B等
所以A考生为B1,对应的分数为85
故选:C
8.D
【分析】
根据平均数的求法,所有数据的和除以总个数即可,中位数求法是从大到小排列后,最中间一个或两数的平均数,众数是在一组数据中出现次数最多的即是众数,根据以上方法可以确定出众数与中位数.
【详解】
平均数,中位数,众数,则,
故选:D.
9.A
【分析】
根据平均值、方差、中位数以及众数的实际意义,即可得出结果.
【详解】
能反应“学生视力保护达标年级”的是平均值和方差;平均值反应数据的平均水平,方差反应数据的波动大小,方差越大,波动越大.
高一年级,知道中位数与众数,不能判断出是否达标,高二年级知道平均数与中位数,也不能判断是否达标;故排除CD;
初二年级,方差大于0,但不确定具体取值,因此初二年级也不能判断是否达标;
初一年级,平均数和方差均为2,满足题意,因为若有一个数据大于5,方差必然大于2.
故选A
【点睛】
本题主要考查平均数、方差、中位数、众数等,熟记其实际意义即可,属于基础题型.
10.D
【分析】
根据频率分布直方图对给出的四个选项逐一分析、判断后可得结果.
【详解】
对于A,由图可得样本数据分布在的频率为,所以A正确.
对于B,由图可得样本数据分布在的频数为,所以B正确.
对于C,由图可得样本数据分布在的频数为,所以C正确.
对于D,由图可估计总体数据分布在的比例为,故D不正确.
故选D.
【点睛】
本题考查频率分布直方图的应用,考查识图和用图解题的能力,解题时容易出现的错误是误认为图中小长方形的高为频率,求解时要注意这一点.
11.分层抽样.
【详解】
分析:由题可知满足分层抽样特点
详解:由于从不同龄段客户中抽取,故采用分层抽样
故答案为分层抽样.
点睛:本题主要考查简单随机抽样,属于基础题.
12.36
【分析】
根据给定条件求出分层抽样的抽样比即可计算男生中应抽取的人数.
【详解】
依题意,分层抽样的抽样比为:,则应抽取的高一男生人数为18036,
所以在男生中抽取的人数为36.
故答案为:36
13. 200
【分析】
根据75%分位数的求法,结合题中数据,即可得答案;根据分层抽样的定义,即可求得高一年级学生总数.
【详解】
将男生成绩从小到大排列可得:64、76、77、78,共4个数据,且,
所以男生成绩的75%分位数为;
设高一年级学生总数为n,
因为用分层抽样方法抽取10人中,男生有4人,且高一年级中男生总数为80人,
所以,解得,
故答案为:;200.
14.808
【分析】
由甲社区抽取人数和总人数计算可得抽样比,从而可根据抽取的人数计算得到驾驶员总人数.
【详解】
由题意可得抽样比为:
本题正确结果:
【点睛】
本题考查分层抽样中抽样比、总体数量的计算,属于基础题.
15.
【详解】
甲数据的平均值为
,同理,乙数据的平均值为,丙数据的平均值为,可见甲、乙、丙三者的平均值都处在频率分布直方图的最中间一列,此时,若越靠近中间列所占的频率越大,则相应的方差越小,明显丙的中间列及附近列所占的频率最大,其次是乙,甲中间列及附近列所占的频率最小,故.
16.(1);(2)1300;(3)
【分析】
(1)由频率分布直方图中的概率和为1,将所有长方形面积计算后相加即可;
(2)先计算样本中月均用水量低于8吨的频率,之后乘以总数,即可求得;
(3)分别计算从月均用水量不低于10吨的人中抽取2名的所有事件个数和满足题意的事件个数,再利用古典概型计算公式求解.
【详解】
(1)因为各组的频率之和为1,
所以月均用水量在区间的频率为,
所以,图中实数.
(2)由图可知, 样本数据中月均用水量低于8吨的频率为:,
所以小明所在学校2000名同学家庭中,月均用水量低于8吨的约有:
(户).
(3)设“这2名同学中恰有1人所在家庭的月均用水量属于组”为事件A,
由图可知,样本数据中月均用水量在的户数为.
记这四名同学家庭分别为;
月均用水量在的户数为.
记这两名同学家庭分别为;
则选取的同学家庭的所有可能结果为:
共15种,
事件A的可能结果为:
共8种,
所以.
【点睛】
本题考查频率分布直方图的性质(面积和为1)、用样本估计总体、古典概型,属综合基础题.
17.(Ⅰ)88,48.4.(Ⅱ)
【详解】
试题分析:(Ⅰ)直接利用茎叶图求解乙地对企业评估得分的平均值和方差即可.
(Ⅱ)甲区优秀企业得分为88,89,93,95共4个,乙区优秀企业得分为86,95,96共3个.列出从两个区各选一个优秀企业,所有基本事件,求出得分的绝对值的差不超过5分的个数.即可求解概率.
试题解析:(Ⅰ)乙地对企业评估得分的平均值是,
方差是.
(Ⅱ)从甲、乙两地准备引进的优秀企业中各随机选取1个,有,,,,,,,,,,,共组, 设“得分的差的绝对值不超过5分”为事件,则事件包含有,,,,,,,共组.
所以
所以得分的差的绝对值不超过5分的概率是
18.(1);(2);(3)
【分析】
(1)由频率分布直方图的性质能求出.
(2)由频率分布直方图的性质能求出得分落在内的人数和得分落在内的人数.
(3)由频率分布直方图的性质得能估计所有参赛选手得分的平均数、中位数和所有参赛选手得分的众数.
【详解】
(1)由频率分布直方图的性质得:
,
解得;
(2)由频率分布直方图能求出:
得分落在内的人数为:,
得分落在内的人数为:;
(3)估计所有参赛选手得分的平均数为:
设所有的参赛选手得分的中位数为,
则,解得,
则所有参赛选手得分的众数估计值为:.
【点睛】
熟练掌握频率分布直方图及平均数、中位数和众数的求法是解题关键.
19.(1);(2);(3)第一四分位数为70.0;第80分位数为.
【分析】
(1)根据频率分布直方图中的频率之和为1即可求解;
(2)根据频率分布直方图中平均数的计算公式即可求解;
(3)根据题意,结合百分位数的概念与计算公式,即可求解.
【详解】
(1)依图可得:,解得:.
(2)根据题意得,.
(3)由图可知,,,,,对应频率分别为:0.1,0.15,0.35,0.3,0.1,前两组频率之和恰为0.25,故第一四分位数为70.0.
前三组频率之和为0.6,前四组频率之和为0.9,所以第80分位数在第四组.
设第80分位数为,则,解得:.
20.(1) ,;(2) ,.
【分析】
(1)由及频率和为1可解得和的值;(2)根据公式求平均数.
【详解】
(1)由题得,解得,由,解得.
(2)由甲离子的直方图可得,甲离子残留百分比的平均值为,
乙离子残留百分比的平均值为
【点睛】
本题考查频率分布直方图和平均数,属于基础题.
21.(1)3;(2)10.5元
【分析】
(1)计算可求出用水量在立方米内的频率之和为,从而可知用水量小于或等于3立方米的频率为0.85,结合w为整数,可知w应至少定为3;
(2)由同组中的每个数据用该组区间的右端点值代替,且,可得该市居民该月的人均水费为,计算即可.
【详解】
(1)如题图所示,用水量在立方米内的频率的和为:.
∴用水量小于或等于3立方米的频率为0.85,又w为整数,
∴为使80%以上的居民在该月的用水价格为4元/立方米,w应至少定为3.
(2)当时,该市居民该月的人均水费估计为(元)
∴当时,该市居民该月的人均水费估计为10.5元.
北京·高一·