1106170010236200第五章统计与概率
5.1 统计
5.1.4 用样本估计总体
课后篇巩固提升
基础达标练
1.有一个容量为200的样本,样本数据分组为[50,70),[70,90),[90,110),[110,130),[130,150],其频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在区间[90,110)内的频数为( )
A.48 B.60 C.64 D.72
2.(多选题)(2020辽宁高一检测)某赛季甲、乙两名篮球运动员各6场比赛得分情况如下表:
场次
1
2
3
4
5
6
甲得分
31
16
24
34
18
9
乙得分
23
21
32
11
35
10
则下列说法正确的是( )
A.甲运动员得分的极差小于乙运动员得分的极差
B.甲运动员得分的中位数小于乙运动员得分的中位数
C.甲运动员得分的平均值大于乙运动员得分的平均值
D.甲运动员的成绩比乙运动员的成绩稳定
3.(2019济南高一检测)2018年2月20日,摩拜单车在济南推出“做文明骑士,周一摩拜单车免费骑”活动.为了解单车使用情况,记者随机抽取了五个投放区域,统计了半小时内被骑走的单车数量,绘制了如图所示的茎叶图,则该组数据的方差为( )
A.9 B.4 C.3 D.2
4.(2019全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为 .?
5.
如图所示,该茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,若乙的平均分是89,则污损的数字是 .?
6.为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午8:00~12:00间各自的车流量(单位:百辆),得如图所示的茎叶图,试求:
(1)甲、乙两个交通站的车流量的极差分别是多少?
(2)甲交通站的车流量在[10,40]间的频率是多少?
(3)甲、乙两个交通站哪个站更繁忙?并说明理由.
能力提升练
1.(2020济宁高一检测)2019年国庆黄金周影市火爆依旧,《我和我的祖国》《中国机长》《攀登者》票房不断刷新,为了解我校高一2 300名学生的观影情况,随机调查了100名在校学生,其中看过《我和我的祖国》或《中国机长》的学生共有80名,看过《中国机长》的学生共有60名,看过《中国机长》且看过《我和我的祖国》的学生共有50名,则该校高一年级看过《我和我的祖国》的学生人数的估计值为( )
A.1 150 B.1 380 C.1 610 D.1 860
2.第十一届全国少数民族传统体育运动会于2019年9月8日至16日在郑州举行.如右图所示的茎叶图是两位选手在运动会前期选拔赛中的比赛得分,则下列说法正确的是( )
A.甲的平均数大于乙的平均数
B.甲的中位数大于乙的中位数
C.甲的方差大于乙的方差
D.甲的极差小于乙的极差
3.(多选题)下表是某电器销售公司2019年度各类电器营业收入占比和净利润占比统计表:
空调类
冰箱类
小家电类
其他类
营业收
入占比
90.10%
4.98%
3.82%
1.10%
净利润占比
95.80%
-0.48%
3.82%
0.86%
则下列判断中正确的是( )
A.该公司2019年度冰箱类电器销售亏损
B.该公司2019年度小家电类电器营业收入和净利润相同
C.该公司2019年度净利润主要由空调类电器销售提供
D.剔除冰箱类电器销售数据后,该公司2019年度空调类电器销售净利润占比将会降低
4.空气质量指数(Air Quality Index,简称AQI)是定量描述空气质量状况的质量指数.空气质量按照AQI大小分为六级:0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.一环保人士记录去年某地某月10天的AQI的茎叶图如图.利用该样本估计该地本月空气质量优良(AQI≤100)的天数(按这个月总共30天计算)为 .?
5.对某市“创卫生城”活动中800名志愿者的年龄抽样调查,统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)年龄组[25,30)对应小矩形的高度为 ;?
(2)据此估计该市“创卫生城”活动中志愿者年龄在[25,35)内的人数为 .?
6.某校从高二年级学生中随机抽取60名学生,将期中考试的政治成绩(均为整数)分成六段:[40,50),[50,60),[60,70),…,[90,100]后得到如下频率分布直方图.
(1)根据频率分布直方图,分别求a,众数,中位数;
(2)估计该校高二年级学生期中考试政治成绩的平均数;
(3)用分层抽样的方法在各分数段的学生中抽取一个容量为20的样本,则在[70,90)分数段抽取的人数是多少?
素养培优练
为提倡节能减排,同时减轻居民负担,广州市积极推进“一户一表”工程.非一户一表用户电费采用“合表电价”收费标准:0.65元/度.“一户一表”用户电费采用阶梯电价收取,其11月到次年4月起执行非夏季标准如下:
第一档
第二档
第三档
每户每月用电量
(单位:度)
[0,200]
(200,400]
(400,+∞)
电价(单位:元/度)
0.61
0.66
0.91
例如:某用户11月用电410度,采用合表电价收费标准,应交电费410×0.65=266.5(元),若采用阶梯电价收费标准,应交电费200×0.61+(400-200)×0.66+(410-400)×0.91=263.1(元).
为调查阶梯电价是否能取到“减轻居民负担”的效果,随机调查了该市100户居民的11月用电量,工作人员已经将90户的月用电量填在下面的频率分布表中,最后10户的月用电量(单位:度)为88,268,370,140,440,420,520,320,230,380.
组别
月用电量
频数统计
频数
频率
①
[0,100]
②
(100,200]
③
(200,300]
④
(300,400]
⑤
(400,500]
⑥
(500,600]
合计
(1)完成频率分布表,并绘制频率分布直方图;
(2)根据已有信息,试估计全市住户11月的平均用电量(同一组数据用该区间的中点值作代表);
(3)设某用户11月用电量为x度(x∈N),按照合表电价收费标准应交y1元,按照阶梯电价收费标准应交y2元,请用x表示y1和y2,并求当y2≤y1时,x的最大值,同时根据频率分布直方图估计“阶梯电价”能否给不低于75%的用户带来实惠?
1106170010236200第五章统计与概率
5.1 统计
5.1.4 用样本估计总体
课后篇巩固提升
基础达标练
1.有一个容量为200的样本,样本数据分组为[50,70),[70,90),[90,110),[110,130),[130,150],其频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在区间[90,110)内的频数为( )
A.48 B.60 C.64 D.72
解析由(0.005 0+0.007 5+0.010 0+0.012 5+a)×20=1,解得a=0.015,所以数据落在区间[90,110)内的频率为0.015×20=0.3,所以数据落在区间[90,110)内的频数为200×0.3=60,故选B.
答案B
2.(多选题)(2020辽宁高一检测)某赛季甲、乙两名篮球运动员各6场比赛得分情况如下表:
场次
1
2
3
4
5
6
甲得分
31
16
24
34
18
9
乙得分
23
21
32
11
35
10
则下列说法正确的是( )
A.甲运动员得分的极差小于乙运动员得分的极差
B.甲运动员得分的中位数小于乙运动员得分的中位数
C.甲运动员得分的平均值大于乙运动员得分的平均值
D.甲运动员的成绩比乙运动员的成绩稳定
解析由题意甲的极差为34-9=25,中位数是21,均值为22,方差为s2=75.乙的极差为35-10=25,中位数是22,均值为22,方差为s乙2=8913.比较知BD都正确.
答案BD
3.(2019济南高一检测)2018年2月20日,摩拜单车在济南推出“做文明骑士,周一摩拜单车免费骑”活动.为了解单车使用情况,记者随机抽取了五个投放区域,统计了半小时内被骑走的单车数量,绘制了如图所示的茎叶图,则该组数据的方差为( )
A.9 B.4 C.3 D.2
解析由茎叶图得该组数据的平均数x=15×(87+89+90+91+93)=90.所以方差为15×[(87-90)2+(89—90)2+(90-90)2+(91-90)2+(93-90)2]=4.
答案B
4.(2019全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为 .?
解析由题意,得经停该高铁站的列车的正点数约为10×0.97+20×0.98+10×0.99=39.2,其中车次数为10+20+10=40,所以经停该站高铁列车所有车次的平均正点率的估计值为39.240=0.98.
答案0.98
5.
如图所示,该茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,若乙的平均分是89,则污损的数字是 .?
解析设污损的叶对应的成绩为x,由茎叶图可得,89×5=83+83+87+x+99,所以x=93.故污损的数字是3.
答案3
6.为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午8:00~12:00间各自的车流量(单位:百辆),得如图所示的茎叶图,试求:
(1)甲、乙两个交通站的车流量的极差分别是多少?
(2)甲交通站的车流量在[10,40]间的频率是多少?
(3)甲、乙两个交通站哪个站更繁忙?并说明理由.
解(1)甲交通站的车流量的极差为73-8=65,乙交通站的车流量的极差为71-5=66.
(2)甲交通站的车流量在[10,40]间的频率为414=27.
(3)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方,从数据的分布情况来看,甲交通站更繁忙.
能力提升练
1.(2020济宁高一检测)2019年国庆黄金周影市火爆依旧,《我和我的祖国》《中国机长》《攀登者》票房不断刷新,为了解我校高一2 300名学生的观影情况,随机调查了100名在校学生,其中看过《我和我的祖国》或《中国机长》的学生共有80名,看过《中国机长》的学生共有60名,看过《中国机长》且看过《我和我的祖国》的学生共有50名,则该校高一年级看过《我和我的祖国》的学生人数的估计值为( )
A.1 150 B.1 380 C.1 610 D.1 860
解析依题意,接受调查的100名学生中有70名看过《我和我的祖国》,故全校学生中约有2 300×0.7=1 610人看过《我和我的祖国》这部影片.
答案C
2.第十一届全国少数民族传统体育运动会于2019年9月8日至16日在郑州举行.如右图所示的茎叶图是两位选手在运动会前期选拔赛中的比赛得分,则下列说法正确的是( )
A.甲的平均数大于乙的平均数
B.甲的中位数大于乙的中位数
C.甲的方差大于乙的方差
D.甲的极差小于乙的极差
解析由于x甲=29,x乙=30,x甲s乙2,故C选项正确.甲的极差为59-11=48,乙的极差为51-12=39,48>39,故D选项错误.故选C.
答案C
3.(多选题)下表是某电器销售公司2019年度各类电器营业收入占比和净利润占比统计表:
空调类
冰箱类
小家电类
其他类
营业收
入占比
90.10%
4.98%
3.82%
1.10%
净利润占比
95.80%
-0.48%
3.82%
0.86%
则下列判断中正确的是( )
A.该公司2019年度冰箱类电器销售亏损
B.该公司2019年度小家电类电器营业收入和净利润相同
C.该公司2019年度净利润主要由空调类电器销售提供
D.剔除冰箱类电器销售数据后,该公司2019年度空调类电器销售净利润占比将会降低
解析根据表中数据知,该公司2019年度冰箱类电器销售净利润所占比为-0.48%,是亏损的,A正确;小家电类电器营业收入所占比和净利润所占比是相同的,但收入与净利润不一定相同,B错误;该公司2019年度净利润空调类电器销售所占比为95.80%,是主要利润来源,C正确;所以剔除冰箱类电器销售数据后,该公司2019年度空调类电器销售净利润占比将会降低,D正确.
答案ACD
4.空气质量指数(Air Quality Index,简称AQI)是定量描述空气质量状况的质量指数.空气质量按照AQI大小分为六级:0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.一环保人士记录去年某地某月10天的AQI的茎叶图如图.利用该样本估计该地本月空气质量优良(AQI≤100)的天数(按这个月总共30天计算)为 .?
解析根据茎叶图,可得该样本中空气质量优的天数为2,空气质量良的天数为4,
故该样本中空气质量优良的频率为610=35,估计该地本月空气质量优良的频率为35,
从而估计该地本月空气质量优良的天数为30×35=18.
答案18
5.对某市“创卫生城”活动中800名志愿者的年龄抽样调查,统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)年龄组[25,30)对应小矩形的高度为 ;?
(2)据此估计该市“创卫生城”活动中志愿者年龄在[25,35)内的人数为 .?
解析(1)设年龄组[25,30)对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.
(2)由(1)得志愿者年龄在[25,35)内的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)内的人数约为0.55×800=440.
答案(1)0.04 (2)440
6.某校从高二年级学生中随机抽取60名学生,将期中考试的政治成绩(均为整数)分成六段:[40,50),[50,60),[60,70),…,[90,100]后得到如下频率分布直方图.
(1)根据频率分布直方图,分别求a,众数,中位数;
(2)估计该校高二年级学生期中考试政治成绩的平均数;
(3)用分层抽样的方法在各分数段的学生中抽取一个容量为20的样本,则在[70,90)分数段抽取的人数是多少?
解(1)由题意可得,(0.01+0.015×2+a+0.025+0.005)×10=1,解得a=0.03.
根据频率分布直方图可知[70,80)分数段的频率最高,因此众数为75.
又由频率分布直方图可知[40,70)分数段的频率为0.1+0.15+0.15=0.4,因为[70,80)分数段的频率为0.3,
所以,中位数为70+13×10=2203.
(2)估计该校高二年级学生政治成绩的平均数为
(45×0.01+55×0.015+65×0.015+75×0.03+85×0.025+95×0.005)×10=71.
(3)因为总体共60名学生,样本容量为20,
因此抽样比为2060=13.
又在[70,90)分数段共有60×(0.3+0.25)=33(人),
因此,在[70,90)分数段抽取的人数是33×13=11.
素养培优练
为提倡节能减排,同时减轻居民负担,广州市积极推进“一户一表”工程.非一户一表用户电费采用“合表电价”收费标准:0.65元/度.“一户一表”用户电费采用阶梯电价收取,其11月到次年4月起执行非夏季标准如下:
第一档
第二档
第三档
每户每月用电量
(单位:度)
[0,200]
(200,400]
(400,+∞)
电价(单位:元/度)
0.61
0.66
0.91
例如:某用户11月用电410度,采用合表电价收费标准,应交电费410×0.65=266.5(元),若采用阶梯电价收费标准,应交电费200×0.61+(400-200)×0.66+(410-400)×0.91=263.1(元).
为调查阶梯电价是否能取到“减轻居民负担”的效果,随机调查了该市100户居民的11月用电量,工作人员已经将90户的月用电量填在下面的频率分布表中,最后10户的月用电量(单位:度)为88,268,370,140,440,420,520,320,230,380.
组别
月用电量
频数统计
频数
频率
①
[0,100]
②
(100,200]
③
(200,300]
④
(300,400]
⑤
(400,500]
⑥
(500,600]
合计
(1)完成频率分布表,并绘制频率分布直方图;
(2)根据已有信息,试估计全市住户11月的平均用电量(同一组数据用该区间的中点值作代表);
(3)设某用户11月用电量为x度(x∈N),按照合表电价收费标准应交y1元,按照阶梯电价收费标准应交y2元,请用x表示y1和y2,并求当y2≤y1时,x的最大值,同时根据频率分布直方图估计“阶梯电价”能否给不低于75%的用户带来实惠?
解(1)频率分布表如下:
组别
月用电量
频数统计
频数
频率
①
[0,100]
4
0.04
②
(100,200]
12
0.12
③
(200,300]
24
0.24
④
(300,400]
30
0.3
⑤
(400,500]
26
0.26
⑥
(500,600]
4
0.04
合计
100
1
频率分布直方图如图:
(2)该100户用户11月的平均用电量x=50×0.04+150×0.12+250×0.24+350×0.3+450×0.26+550×0.04=324(度),
所以估计全市住户11月的平均用电量为324度.
(3)y1=0.65x,
y2=0.61x,0≤x≤200,0.66(x-200)+122=0.66x-10,200400.
由y2≤y1得0.61x≤0.65x,0≤x≤200或200400,解得x≤1100.26≈423.1.因为x∈N,所以x的最大值为423.
根据频率分布直方图,x≤423时的频率为0.04+0.12+0.24+0.3+23×0.002 6=0.759 8>0.75,
故估计“阶梯电价”能给不低于75%的用户带来实惠.