十六 用样本估计总体
基础练习
一、选择题(每小题5分,共20分)
1.在抽查某批产品尺寸的过程中,样本尺寸数据的频率分布表如下,则b等于 ( )
分组 [100, 200] (200, 300] (300, 400] (400, 500] (500, 600] (600, 700]
频数 10 30 40 80 20 m
频率 0.05 0.15 0.2 0.4 a b
A.0.1 B.0.2 C.0.25 D.0.3
2.某省农科所经过5年对甲、乙两棉种的实验研究,将连续5年棉花产量(千克/亩)的统计数据用茎叶图表示,如图所示,则平均产量较高与产量较稳定的分别是( )
A.甲棉种;甲棉种 B.乙棉种;甲棉种
C.甲棉种;乙棉种 D.乙棉种;乙棉种
3.(多选题)在某次高中学科知识竞赛中,对4 000名考生的参赛成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],60分以下视为不及格,若同一组中数据用该组区间中间值作代表值,则下列说法中正确的是 ( )
A.成绩在[70,80)的考生人数最多
B.不及格的考生人数为1 000
C.考生竞赛成绩的平均分约为70.5分
D.考生竞赛成绩的中位数为75分
4.(多选题)若一组数据1,2,3,4,x的平均数与中位数相同,则实数x的值可能是 ( )
A.0 B.2.5 C.3 D.5
二、填空题(每小题5分,共10分)
5.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志是“连续10日,每天新增疑似病例不超过7人”.已知过去10日,A,B,C三地新增疑似病例数据信息如下:
A地:总体平均数为3,中位数为4;
B地:总体平均数为2,总体方差为3;
C地:总体平均数为1,总体方差大于0.
则A,B,C三地中,一定没有发生大规模群体感染的是 地.
【补偿训练】
已知一组数据x1,x2,…,x10的方差是2,且(x1-3)2+(x2-3)2+…+(x10-3)2=380,则这组数据的平均数= .
6.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现在用分层抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为 ;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为 小时.
三、解答题(每小题10分,共20分)
7.从甲、乙两班某项测试成绩中各随机抽取5名同学的成绩,得到如图所示的茎叶图.已知甲班成绩数据的中位数为13,乙班成绩数据的平均数为16.
(1)求x,y的值.
(2)试估计甲、乙两班在该项测试中整体水平的高低.(注:方差s2=[(x1-)2+(x2-)2+…+(xn-)2],其中为x1,x2,…,xn的平均数)
8.(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的 分组 [-0.20, 0) [0, 0.20) [0.20, 0.40) [0.40, 0.60) [0.60, 0.80)
企业数 2 24 53 14 7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例.
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:≈8.602.
提升练习
一、选择题(每小题5分,共10分)
1.我校高三8个学生参加数学竞赛的得分用茎叶图表示,其中茎为十位数,叶为个位数,则这组数据的平均数和方差分别是 ( )
8 8 5
9 1 5 4 2 0 3
A.91 9.5 B.91 9
C.92 8.5 D.92 8
2.(多选题)(2018·全国卷I改编)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:
则下面结论中正确的是 ( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
二、填空题(每小题5分,共10分)
3.某学校高二年级共有女生300人,现调查她们每天的课外运动时间,发现她们的课外运动时间介于30分钟到90分钟,如图是统计结果的频率分布直方图,则她们的平均运动时间大约是 分钟.
4.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为 .
三、解答题(共10分)
5.(2020·全国Ⅰ卷)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:
甲分厂产品等级的频数分布表
等级 A B C D
频数 40 20 20 20
乙分厂产品等级的频数分布表
等级 A B C D
频数 28 17 34 21
(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;
(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务 十六 用样本估计总体
基础练习
一、选择题(每小题5分,共20分)
1.在抽查某批产品尺寸的过程中,样本尺寸数据的频率分布表如下,则b等于 ( )
分组 [100, 200] (200, 300] (300, 400] (400, 500] (500, 600] (600, 700]
频数 10 30 40 80 20 m
频率 0.05 0.15 0.2 0.4 a b
A.0.1 B.0.2 C.0.25 D.0.3
解析:选A.样本容量n==200,
所以m=20.又=a,所以a=0.1.
则b=1-(0.05+0.15+0.2+0.4+0.1)=0.1.
2.某省农科所经过5年对甲、乙两棉种的实验研究,将连续5年棉花产量(千克/亩)的统计数据用茎叶图表示,如图所示,则平均产量较高与产量较稳定的分别是( )
A.甲棉种;甲棉种 B.乙棉种;甲棉种
C.甲棉种;乙棉种 D.乙棉种;乙棉种
解析:选C.根据茎叶图的数据知,甲棉种产量为68,69,70,71,72;乙棉种产量为68,68,69,69,71.
所以甲棉种产量的平均值=×(68+69+70+71+72)=70;乙棉种产量的平均值=×(68+68+69+69+71)=69.甲的方差=×[(68-70)2+(69-70)2+(70-70)2+(71-70)2+(72-70)2]=2,
乙的方差=×[(68-69)2+(68-69)2+(69-69)2+(69-69)2+(71-69)2]=1.2.
所以甲棉种平均产量较高,乙棉种产量较稳定.
3.(多选题)在某次高中学科知识竞赛中,对4 000名考生的参赛成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],60分以下视为不及格,若同一组中数据用该组区间中间值作代表值,则下列说法中正确的是 ( )
A.成绩在[70,80)的考生人数最多
B.不及格的考生人数为1 000
C.考生竞赛成绩的平均分约为70.5分
D.考生竞赛成绩的中位数为75分
解析:选ABC.由题干频率分布直方图可得,成绩在[70,80)的频率最高,因此考生人数最多,故A正确;
成绩在[40,60)的频率为0.01×10+0.015×10=0.25,因此,不及格的人数为4 000×0.25=1 000,故B正确;
考生竞赛成绩的平均分约为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5(分),故C正确;
因为成绩在[40,70)的频率为0.45,在[70,80)的频率为0.3,
所以中位数为70+10×≈71.67,故D错误.
4.(多选题)若一组数据1,2,3,4,x的平均数与中位数相同,则实数x的值可能是 ( )
A.0 B.2.5 C.3 D.5
解析:选ABD.(1)将这组数据按从小到大的顺序排列为1,2,3,4,x,
处于中间位置的数是3,所以中位数是3,平均数为(1+2+3+4+x)÷5,所以3=(1+2+3+4+x)÷5,解得x=5;符合排列顺序;
(2)将这组数据按从小到大的顺序排列后为1,2,3,x,4,中位数是3,此时平均数是(1+2+3+4+x)÷5=3,解得x=5,不符合排列顺序;
(3)将这组数据按从小到大的顺序排列后为1,x,2,3,4,中位数是2,平均数为(1+2+3+4+x)÷5=2,解得x=0,不符合排列顺序;
(4)将这组数据按从小到大的顺序排列后为x,1,2,3,4,中位数是2,平均数为(1+2+3+4+x)÷5=2,解得x=0,符合排列顺序;
(5)将这组数据按从小到大的顺序排列后为1,2,x,3,4,中位数为x,平均数为(1+2+3+4+x)÷5=x,解得x=2.5,符合排列顺序;所以x的值为0,2.5或5.
二、填空题(每小题5分,共10分)
5.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志是“连续10日,每天新增疑似病例不超过7人”.已知过去10日,A,B,C三地新增疑似病例数据信息如下:
A地:总体平均数为3,中位数为4;
B地:总体平均数为2,总体方差为3;
C地:总体平均数为1,总体方差大于0.
则A,B,C三地中,一定没有发生大规模群体感染的是 地.
解析:A地,平均数和中位数不能限制某一天的病例超过7人,故不是A地.B地,当总体平均数为2,根据方差公式s2=[(x1-2)2++…+]=3,假设存在某天新增疑似病例超过7人,设为8人,则s2=[++…+]≥(8-2)2=3.6,
s2=3不成立,故一定没有发生大规模群体感染的是B地.
C地,当总体方差大于0时,不知道总体方差的具体数值,
每天新增疑似病例可以超过7人,故不是C地.
答案:B
【补偿训练】
已知一组数据x1,x2,…,x10的方差是2,且(x1-3)2+(x2-3)2+…+(x10-3)2=380,则这组数据的平均数= .
解析:因为数据x1,x2,…,x10的方差为2,
所以[(x1-)2+(x2-)2+…+(x10-)2]=2,
即(x1-)2+(x2-)2+…+(x10-)2=20.
又因为(x1-3)2+(x2-3)2+…+(x10-3)2=380,
所以90-10+(2-6)×10=360,
所以-6-27=0,
解得=-3或=9.
答案:-3或9
6.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现在用分层抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为 ;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为 小时.
解析:由分层抽样可知,第一分厂应抽取100×50%=50(件).由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命为1 020×50%+980×20%+1 030×30%=1 015(小时).
答案:50 1 015
三、解答题(每小题10分,共20分)
7.从甲、乙两班某项测试成绩中各随机抽取5名同学的成绩,得到如图所示的茎叶图.已知甲班成绩数据的中位数为13,乙班成绩数据的平均数为16.
(1)求x,y的值.
(2)试估计甲、乙两班在该项测试中整体水平的高低.(注:方差s2=[(x1-)2+(x2-)2+…+(xn-)2],其中为x1,x2,…,xn的平均数)
解析:(1)由茎叶图知甲班成绩数据依次为9,12,10+x,20,26,所以中位数为10+x=13,得x=3;乙班成绩数据的平均数=(9+15+10+y+18+20)=16,得y=8.
(2)乙班整体水平较高.
理由:由题意及(1)得=×(9+12+13+20+26)=16,=×[(9-16)2+(12-16)2+(13-16)2+(20-16)2+(26-16)2]=38,=16,
=×[(9-16)2+(15-16)2+(18-16)2+(18-16)2+(20-16)2]==14.8.
因为>,所以乙班的整体水平较高.
8.(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的 分组 [-0.20, 0) [0, 0.20) [0.20, 0.40) [0.40, 0.60) [0.60, 0.80)
企业数 2 24 53 14 7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例.
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:≈8.602.
解析:(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.产值负增长的企业频率为=0.02.
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2)=(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,
s2=ni(yi-)2
=[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6,
所以s==0.02×≈0.17,
所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
提升练习
一、选择题(每小题5分,共10分)
1.我校高三8个学生参加数学竞赛的得分用茎叶图表示,其中茎为十位数,叶为个位数,则这组数据的平均数和方差分别是 ( )
8 8 5
9 1 5 4 2 0 3
A.91 9.5 B.91 9
C.92 8.5 D.92 8
解析:选A.由题意,根据茎叶图,平均数=×(2×80+6×90+8+5+1+5+4+2+0+3)=91,
方差s2=×[(88-91)2+(85-91)2+…+(93-91)2]=×76=9.5.
2.(多选题)(2018·全国卷I改编)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:
则下面结论中正确的是 ( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
解析:选BCD.设新农村建设前的收入为M,而新农村建设后的收入为2M,
则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A项不符合题意;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项符合题意;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,所以增加了一倍,所以C项符合题意;新农村建设后,养殖收入与第三产业收入的总和占经济收入为30%+28%=58%>50%,所以超过了经济收入的一半,所以D项符合题意.
二、填空题(每小题5分,共10分)
3.某学校高二年级共有女生300人,现调查她们每天的课外运动时间,发现她们的课外运动时间介于30分钟到90分钟,如图是统计结果的频率分布直方图,则她们的平均运动时间大约是 分钟.
解析:由题图得平均运动时间约为35×0.1+45×0.1+55×0.5+65×0.2+75×0.05+85×0.05=56.5(分钟).
答案:56.5
4.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为 .
解析:设样本数据x1,x2,…,x10的标准差为s,则s=8,可知数据2x1-1,2x2-1,…,2x10-1的标准差为2s=16.
答案:16
三、解答题(共10分)
5.(2020·全国Ⅰ卷)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:
甲分厂产品等级的频数分布表
等级 A B C D
频数 40 20 20 20
乙分厂产品等级的频数分布表
等级 A B C D
频数 28 17 34 21
(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;
(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务
解析:(1)由试加工产品等级的频数分布表知,
甲分厂加工出来的一件产品为A级品的概率的估计值为=0.4;
乙分厂加工出来的一件产品为A级品的概率的估计值为=0.28.
(2)由数据知甲分厂加工出来的100件产品利润的频数分布表为
利润 65 25 -5 -75
频数 40 20 20 20
因此甲分厂加工出来的100件产品的平均利润为=15.
由数据知乙分厂加工出来的100件产品利润的频数分布表为
利润 70 30 0 -70
频数 28 17 34 21
因此乙分厂加工出来的100件产品的平均利润为=10.
比较甲、乙两分厂加工的产品的平均利润,应选甲分厂承接加工业务.