章末综合测评(四) 统计
(时间:120分钟 满分:150分)
一、选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.某工厂为了了解加工的一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是( )
A.总体 B.个体 C.样本 D.样本量
2.在实际生活中,有的问题适合普查,例如人口变化,有的问题适合抽样调查,例如产品质量.下列最适合抽样调查的是( )
A.高一·一班数学作业完成情况
B.了解一批牛奶的质量
C.某汽车4S店想知晓新客户对服务的评价
D.环保局调查管辖范围内湖泊的水质情况
3.某地每十万人中拥有的各类受教育程度的人口情况,绘制了如图所示的扇形统计图,则( )
A.每十万人中拥有高中(含中专)文化程度的人数最少
B.每十万人中拥有大专及以上文化程度的人数少于2万
C.每十万人中拥有小学文化程度的人数最多
D.每十万人中拥有初中和高中(含中专)文化程度的人数占比不到50%
4.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为a,众数为b,平均值为c,则( )
A.a=b=c B.a=b<c
C.a<b<c D.b<a<c
5.(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
则( )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
6.(2022·河北邯郸摸底考试)某高中2022年的高考考生人数是2021年高考考生人数的1.5倍.为了更好地对比该校考生的升学情况,统计了该校2021年和2022年高考分数达线情况,得到如图所示扇形统计图:
下列结论正确的是( )
A.该校2022年与2021年的本科达线人数比为6∶5
B.该校2022年与2021年的专科达线人数比为6∶7
C.2022年该校本科达线人数增加了80%
D.2022年该校不上线的人数有所减少
7.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数录错了,甲实得80分,却记了50分,乙实得70分,却记了100分,更正后平均分和方差分别是( )
A.70,75 B.70,50
C.75,1.04 D.65,2.35
8.(2022·山东泰安期末)某校组织歌咏比赛,已知5位评委按百分制分别给出某参赛班级的评分(评分为整数),则下列选项中,可以判断出评分中一定出现100分的是( )
A.平均数为97,中位数为95
B.中位数为95,众数为98
C.平均数为98,众数为98
D.中位数为96,极差为8
二、选择题(本大题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求,全部选对的得5分,部分选对的得2分,有选错的得0分)
9.(2021·新高考Ⅰ卷)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
10.(2022·重庆市两江育才中学月考)为落实党中央的“三农”政策,某市组织该市所有乡镇干部进行了一期“三农”政策专题培训,并在培训结束时进行了结业考试.如图是该次考试成绩随机抽样样本的频率分布直方图.则下列关于这次考试成绩的估计正确的是( )
A.众数为82.5
B.第80百分位数为91.7
C.平均数为88
D.没有一半以上干部的成绩在80~90分之间
11.下列命题是真命题的是( )
A.分层随机抽样调查后的样本中甲、乙、丙三种个体的比例为3∶1∶2,如果抽取的甲个体数为9,则样本容量为30
B.某一组样本数据为125,120,122,105,130,114,116,95,120,134,则样本数据落在区间[114.5,124.5]内的频率为0.4
C.甲、乙两队队员体重的平均数分别为60,68,人数之比为1∶3,则甲、乙两队全部队员体重的平均数为67
D.一组数6,5,4,3,3,3,2,2,2,1的85%分位数为5
12.某学校共有学生2 000人,其中高一800人,高二、高三各600人,学校对学生在暑假中每天的读书时间做了调查统计,全体学生每天的读书时间的平均数为=3小时,方差为s2=2.003,其中高一学生、高二学生每天读书时间的平均数分别为=2.6,=3.2,又已知三个年级学生每天读书时间的方差分别为===3,则高三学生每天读书时间的平均数可能是( )
A.3.2 B.3.3 C.2.7 D.4.5
三、填空题(本大题共4小题,每小题5分,共20分)
13.下列数据的70%分位数为________.
20,14,26,18,28,30,24,26,33,12,35,22.
14.我国高铁发展迅速,技术先进.经统计在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.
15.(2022·江西贵溪一中月考)某口罩生产商为了检验产品质量,从总体编号为001,002,003,…,499,500的500盒口罩中,利用随机数表(以下摘取了随机数表中第12行至第13行)选取10个样本进行抽检,选取方法是从随机数表第12行第5列的数字开始由左向右读取,则选出的第4个样本的编号为________.
16 00 11 66 14 90 84 45 11 65 73 88 05 90 52 27 41 14 86 22 98
12 22 08 07 52 74 95 80 35 69 68 32 50 61 28 47 39 75 34 58 62
16.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
四、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤)
17.(本小题满分10分)(2022·黑龙江哈尔滨四中月考)从甲、乙、丙三个厂家生产的同一种产品中抽取8件产品,对其使用寿命(单位:年)进行追踪调查,结果如下:
甲:5,5,6,6,8,8,8,10;
乙:4,5,6,7,8,9,12,13;
丙:3,3,4,7,9,10,11,12.
(1)三个厂家的广告中都称该产品的使用寿命是8年,请指出________(从“甲、乙、丙”三厂家中选择一个)厂家在广告中依据了统计数据中的哪个特征数?
(2)计算甲厂家抽取的8件产品的方差.
18.(本小题满分12分)随机抽取某4S店分公司20位员工今年的销售业绩,统计如下所示(单位:辆):
26 34 28 32 35 38 22 39 23 25
28 30 24 38 33 33 22 34 21 27
(1)若需要有10%的优秀员工,应将标准设定在多少?
(2)若要给至少80%的员工年度考评评级为通过,应将标准设定在多少?
19.(本小题满分12分)某公司为了了解近期内的用水情况,抽取了10天的用水量,如下表所示:
天数 1 1 1 2 2 1 2
用水量/吨 22 38 40 41 44 50 95
(1)在这10天中,该公司用水量的平均数是多少?
(2)在这10天中,该公司每天用水量的中位数是多少?
(3)你认为用平均数和中位数中的哪一个数来描述该公司每天的用水量更合适?
20.(本小题满分12分)随着老年人消费需求从“生存型”向“发展型”转变,消费层次不断提升,“银发经济”成为社会热门话题之一,被各企业持续关注.某企业为了解该地老年人消费能力情况,对该地年龄在[60,80)的老年人的年收入按年龄[60,70),[70,80)分成两组进行分层抽样调查,已知抽取了年龄在[60,70)的老年人500人,年龄在[70,80)的老年人300人.现作出年龄在[60,70)的老年人年收入的频率分布直方图(如图所示).
(1)根据频率分布直方图,估计该地年龄在[60,70)的老年人年收入的平均数及第95百分位数;
(2)已知年龄在[60,70)的老年人年收入的方差为3,年龄在[70,80)的老年人年收入的平均数和方差分别为3.75和1.4,试估计年龄在[60,80)的老年人年收入的方差.
21.(本小题满分12分) 某校高一年级学生全部参加了体育科目的达标测试,现从中随机抽取40名学生的测试成绩(单位:分),整理数据并按分数段[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]进行分组.已知测试分数均为整数,现用每组区间的中点值代替该组中的每个数据,得到体育成绩的折线图如图所示.
(1)若体育成绩大于或等于70分的学生为“体育良生”,已知该校高一年级有1 000名学生,试估计该校高一年级学生“体育良生”的人数;
(2)用样本估计总体的思想,试估计该校高一年级学生达标测试的平均分;
(3)假设甲、乙、丙三人的体育成绩分别为a,b,c,且a∈[70,80),b∈[80,90),c∈[90,100],当三人的体育成绩方差s2最小时,写出a,b,c的所有可能取值(不要求证明).
22.(本小题满分12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序 1 2 3 4 5 6 7 8
零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
抽取次序 9 10 11 12 13 14 15 16
零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.一天内抽检零件中,如果出现了尺寸在(-3s,+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(1)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(2)在(-3s,+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)
附:≈0.09.
章末综合测评(四) 统计
1.C [总体是这一批零件的长度,个体是每个零件的长度,样本是抽取的200个零件的长度,样本量是200.]
2.B [依据总体的特殊性,B项最适合抽样调查.]
3.B [对于A,每十万人中其他文化程度的人数最少,占比为10%,错误;
对于B,每十万人中拥有大专及以上文化程度的人数为10×15%=1.5万,正确;
对于C,每十万人中拥有初中文化程度的人数最多,占比为35%,错误;
对于D,每十万人中拥有初中和高中(含中专)文化程度的人数占比为50%,错误.故选B.]
4.D [由统计图知众数b=5.
将30名学生得分从小到大排列,第15个数是5,第16个数是6,所以中位数a==5.5.
又平均值c=≈5.97.所以b<a<c.]
5.B [讲座前中位数为>70%,所以A错误;
讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B正确;
讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错误;
讲座后问卷答题的正确率的极差为100%-80%=20%,
讲座前问卷答题的正确率的极差为95%-60%=35%>20%,所以D错误.故选B.]
6.C [不妨设2021年的高考人数为100,则2022年的高考人数为150.
2021年本科达线人数为50,2022年本科达线人数为90,得2022年与2021年的本科达线人数比为9∶5,本科达线人数增加了80%,故选项A错误,选项C正确;
2021年专科达线人数为35,2022年专科达线人数为45,所以2022年与2021年的专科达线人数比为9∶7,选项B错误; 2021年不上线人数为15,2022年不上线人数也是15,不上线的人数无变化,选项D错误.故选C.]
7.B [因甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为s2,则由题意可得s2=[(x1-70)2+(x2-70)2+…+(80-70)2+(70-70)2+…+(x48-70)2],而更正前有75=[(x1-70)2+(x2-70)2+…+(50-70)2+(100-70)2+…+(x48-70)2],化简整理得s2=50.]
8.A [对于A,设这5个数为a,b,95,c,d,其中a≤b≤95≤c≤d≤100,则a+b≤190,=97,所以a+b+c+d=390,
因为a+b≤190,所以c+d≥200,所以c=d=100,
所以平均数为97,中位数为95时,评分中一定出现100分,故A符合;
对于B,当这5个数分别为93,94,95,98,98时,
则中位数为95,众数为98,没有出现100分,故B不一定;
对于C,当这5个数分别为98,98,98,98,98时,
则平均数为98,众数为98,没有出现100分,故C不一定;
对于D,当这5个数分别为90,92,96,98,98时,
则中位数为96,极差为8,没有出现100分,故D不一定.故选A.]
9.CD [设样本数据x1,x2,…,xn的平均数、中位数、标准差、极差分别为,m,σ,t,依题意得,新样本数据y1,y2,…,yn的平均数、中位数、标准差、极差分别为+c,m+c,σ,t,因为c≠0,所以C,D正确,故选CD.]
10.AB [由图知:众数出现在[80,85)之间,故众数为82.5,故A正确;由图可得该次考试成绩在90分以下所占比例为5×(0.01+0.03+0.06+0.05)=0.75,在95分以下所占比例为5×(0.01+0.03+0.06+0.05+0.03)=0.9,因此,第80百分位数一定位于[90,95)内,所以第80百分位数为90+5×≈91.7,故B正确;由(0.01×72.5+0.03×77.5+0.06×82.5+0.05×87.5+0.03×92.5+0.02×97.5)×5=85.5,C错误;由(0.06+0.05)×5=0.55>0.5,有一半以上干部的成绩在80~90分之间,D错误.故选AB.]
11.BD [对于选项A:根据样本的抽样比等于各层的抽样比,样本容量为9÷=18,故选项A错误;
对于选项B:样本数据落在区间[114.5,124.5]内的有120,122,116,120共4个,所以样本数据落在区间[114.5,124.5]内的频率为=0.4,故选项B正确;
对于选项C:甲、乙两队的人数之比为1∶3,则甲队队员在所有队员中所占权重为=,乙队队员在所有队员中所占权重为=,则甲、乙两队全部队员体重的平均数为=×60+×68=66,故选项C错误;
对于选项D:将该组数据从小到大排列为:1,2,2,2,3,3,3,4,5,6,由10×85%=8.5,则该组数据的85%分位数是第9个数,该数为5,故选项D正确.]
12.BC [由题意可得2.003=[1+(2.6-3)2]+[2+(3.2-3)2]+[3+(-3)2],解得=3.3或2.7.]
13.28 [把所给的数据按照从小到大的顺序排列可得:
12,14,18,20,22,24,26,26,28,30,33,35,
因为有12个数据,所以12×70%=8.4,不是整数,所以数据的70%分位数为第9个数28.]
14.0.98 [==0.98,则经停该站高铁列车所有车次的平均正点率的估计值为0.98.]
15.222 [从随机数表第12行第5列的数字开始由左向右读取,依次可以得到:116,445,148,222,080,356,…,则选出的第4个样本的编号为222.]
16.0.030 3 [∵5个矩形面积之和为1,
即(0.005+0.010+0.020+a+0.035)×10=1,
∴a=0.030.
∵三组内学生数的频率分别为:0.3,0.2,0.1,
∴三组内学生的人数分别为30,20,10.
∴从身高在[140,150]内的学生选取的人数为18×=3.]
17.解:(1)选择甲厂家,因为甲厂家抽取的8件产品的众数是8,所以甲厂家的广告依据了统计数据中的众数;
选择乙厂家,因为乙厂家抽取的8件产品的平均数是8,所以乙厂家的广告依据了统计数据中的平均数;
选择丙厂家,因为丙厂家抽取的8件产品的中位数是8,所以丙厂家的广告依据了统计数据中的中位数.
(2)甲厂家抽取的8件产品的使用寿命为5,5,6,6,8,8,8,10,
其平均数为=×(5+5+6+6+8+8+8+10)=7,
方差为s2=×(22+22+12+12+12+12+12+32)=2.75.
18.解:(1)将20个样本数据从小到大进行排序如下所示(单位:辆):
21 22 22 23 24 25 26 27 28 28
30 32 33 33 34 34 35 38 38 39
由于20×90%=18是整数,所以临界值为有序样本中第18和19两个数的平均数,故为38.因此,可以规定如下:若需要有10%的优秀员工,应将标准设定在38辆.
(2)由于20×20%=4是整数,所以临界值为有序样本中第4和5两个数的平均数,故为23.5.因此,可以规定如下:若要给至少80%的员工年度考评评级为通过,应将标准设定23辆,或22辆,或21辆.
19.解:(1)=(22+38+40+2×41+2×44+50+2×95)=51(吨).
(2)中位数为=42.5(吨).
(3)平均数受数据中的极端值(2个95)影响较大,使用平均数在估计总体时可靠性降低,10天的用水量有8天都在平均值以下,故用中位数描述每天的用水量更合适.
20.解:(1)频率分布直方图中,该地年龄在[60,70)的老年人年收入的平均数约为:
0.04×2+0.08×3+0.18×4+0.26×5+0.20×6+0.15×7+0.05×8+0.04×9=5.35,
由频率分布直方图,年收入在8.5万元以下的老年人所占比例为1-0.04×1=0.96,
年收入在7.5万元以下的老年人所占比例为1-(0.05×1+0.04×1)=0.91,
因此,第95百分位数一定位于[7.5,8.5)内,由7.5+1×=8.3,
可以估计该地年龄在[60,70)的老年人年收入的第95百分位数为8.3.
(2)设年龄在[60,70)的老年人样本的平均数记为,方差记为;
年龄在[70,80)的老年人样本的平均数记为,方差记为;
年龄在[60,80)的老年人样本的平均数记为,方差记为s2.
由(1)得,由题意得,==1.4,
则==4.75.
由s2=×{500×+300×+()2]},可得s2=×{500×[3+(5.35-4.75)2]+300×[1.4+(3.75-4.75)2]}=3,
即估计该地年龄在[60,80)的老年人的年收入方差为3.
21.解:(1)由折线图得体育成绩大于或等于70分的学生有14+3+13=30(人),所以估计该校高一年级学生“体育良生”的人数为1 000×=750(人).
(2)用样本估计总体的思想,估计该校高一年级学生达标测试的平均分为=×(45×2+55×6+65×2+75×14+85×3+95×13)=77.25(分).
(3)因为甲、乙、丙三人的体育成绩分别为a,b,c,且a∈[70,80),b∈[80,90),c∈[90,100],其中a,b,c∈N,
所以当三人的体育成绩方差s2最小时,a,b,c的所有可能取值为79,84,90或79,85,90.
22.解:(1)由于≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在+3s)以外,因此需对当天的生产过程进行检查.
(2)剔除离群值,即第13个数据,剩下数据的平均数为(16× 9.97-9.22)=10.02,
这条生产线当天生产的零件尺寸的均值的估计值为10.02.
剔除第13个数据,剩下数据的样本方差为(1 591.134-9.222-15×10.022)≈0.008,
所以这条生产线当天生产的零件尺寸的标准差的估计值为≈0.09.