4.2 分层随机抽样的均值与方差、百分位数
(教学方式:深化学习课—梯度进阶式教学)
[课时目标]
1.理解分层随机抽样的均值与方差公式的推导过程,会求分层随机抽样的均值与方差.
2.理解百分位数的统计含义,会求样本数据的p分位数.
(一)分层随机抽样的均值与方差
1.权重
一般地,将样本a1,a2,…,am和样本b1,b2,…,bn合并成一个新样本,则这个新样本的平均数为
1+2.
记w1=,w2=,则这个新样本的平均数为__________,其中w1,w2称为权重.
2.分层随机抽样的均值与方差
分层随机抽样的均值 设样本中不同层的平均数和相应权重分别为1,2,…,n和w1,w2,…,wn,则这个样本的平均数为________________________=wii
分层随机抽样的方差 设样本中不同层的平均数分别为1,2,…,n,方差分别为s,s,…,s,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=________________,其中为这个样本的平均数
(二)百分位数
1.总体的p分位数的概念
一般地,当总体是连续变量时,给定一个百分数p∈__________,总体的p分位数有这样的特点:总体数据中的任意一个数__________它的可能性是p.
2.四分位数
________________分位数是三个常用的百分位数.把总体数据按照__________排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是.因此这三个百分位数也称为总体的四分位数.
3.计算一组n个数据的p分位数的一般步骤
第一步,按照________排列原始数据;
第二步,计算i=______;
第三步,若i不是整数,大于i的最小整数为j,则p分位数为__________;若i是整数,则p分位数为第i项与第____________项数据的__________.
基础落实训练
1.(多选)下列表述正确的是( )
A.50%分位数就是总体的中位数
B.p百分位数可以有单位
C.一个总体的四分位数有4个
D.样本容量越大,第p百分位数估计总体就越准确
2.某单位共有员工100人,其中有年轻人20人,平均年薪为5万元,中年人有80人,平均年薪为8万元,则该单位员工的平均年薪为( )
A.5万元 B.8万元
C.6.5万元 D.7.4万元
3.利用分层随机抽样抽得A,B两组数据,其平均数分别是A=2.3,B=2.8,若这两组数据的平均数=2.4,则A组数据在两组数据中的权重wA=________.
4.数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的30%分位数是________.
题型(一) 分层随机抽样的均值与方差的计算
[例1] 某校从在校学生中,用分层随机抽样的方法抽取男生32人,女生18人.测得他们的身高后,计算得到男生身高的样本平均数为173.5 cm,方差为17 cm2;女生身高的样本平均数为163.83 cm,方差为30.03 cm2.求所有50个身高数据的样本方差.听课记录:
|思|维|建|模|
1.分层随机抽样的平均数的计算方法
(1)第i层的权重wi、第i层的个体数xi、样本容量n,三者满足wi=,已知其中2个可求另外1个.
(2)利用公式=w1 1+w22+…+wnn求分层随机抽样的平均数.
2.计算分层随机抽样的方差s2的步骤
(1)确定1,2,…,n,s,s,…,s ,w1,w2,…,wn;
(2)确定;
(3)应用公式 s2=wi[s+(i-)2]计算s2.
[针对训练]
1.(多选)某分层随机抽样中,有关数据如下:
样本量 均值 方差
第1层 45 4 2
第2层 35 8 1
第3层 10 6 3
则下列叙述正确的是(结果保留两位小数)( )
A.第1,2层所有数据的均值为5.75
B.第1,2层所有数据的方差为1.50
C.第1,2,3层所有数据的均值约为7.68
D.第1,2,3层所有数据的方差约为5.23
2.已知某省二、三、四线城市数量之比为1∶3∶6,2024年6月份调查得知该省所有城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.8万元/平方米,三、四线城市房价的方差分别为10,8,求二线城市的房价的方差.
题型(二) 百分位数的计算
[例2] 以下数据为参加数学竞赛决赛的15人的成绩:78,70,72,86,88,79,80,81,94,
84,56,98,83,90,91,则这15人成绩的80%分位数是( )
听课记录:
[例3] 已知30个数据的60%分位数是8.2,将这30个数据从小到大排列后第18个数据是7.8,则第19个数据是________.
听课记录:
|思|维|建|模|
计算一组数据的p分位数时,不要忽略对i是否为整数的讨论.若i不是整数,则p分位数是大于i的最小整数个数据;若i是整数,则p分位数为第i个与第(i+1)个数据的平均数.
[针对训练]
3.按从小到大顺序排列的一组数据:26,30,35,36,38,42,m,47,50,52,若这组数据的第65百分位数比第40百分位数多8,则m=( )
A.43 B.44
C.45 D.46
4.以下数据为某学校参加学科节数学竞赛决赛的10人的成绩:(单位:分)72,78,79,80,81,83,84,86,88,90.这10人成绩的第p百分位数是85,则p=( )
A.65 B.70
C.75 D.80
5.从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的第25,75,95百分位数;
(2)请你找出珍珠质量较小的前15%的珍珠质量;
(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.
题型(三) 百分位数的综合问题
[例4] 在某市的一次数学测试中,为了解学生的测试情况,从中随机抽取100名学生的测试成绩,被抽取成绩全部介于40分到100分之间(满分100分),将统计结果按如下方式分成六组:第一组[40,50),第二组[50,60),…,第六组[90,100],画出频率分布直方图如图所示.
(1)求第三组[60,70)的频率;
(2)估计该市学生这次测试成绩的平均值(同一组中的数据用该组区间的中点值为代表)和25%分位数.
听课记录:
|思|维|建|模|
频率分布直方图中p分位数的求解方法可以模仿中位数的求解思路:
(1)确定p分位数所在的区间[a,b).
(2)确定小于a和小于b的数据所占的百分比分别为fa,fb,则p分位数为a+×(b-a).
[针对训练]
6.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)求样本成绩的第75百分位数;
(3)已知落在[50,60)的平均成绩是54,方差是7,落在[60,70)的平均成绩为66,方差是4,求两组成绩的总平均数和总方差.
分层随机抽样的均值与方差、百分位数
?课前预知教材
(一)1.w11+w22
2.w11+w22+…+wnn
wi[s+(i-)2]
(二)1.(0,1) 小于或等于 2.25%,50%,75% 从小到大 3.从小到大 np
第j项数据 (i+1) 平均数
[基础落实训练]
1.ABD 2.D 3. 4.8.4
?课堂题点研究
[题型(一)]
[例1] 解:记男生样本为y1,y2,…,y32,平均数为男,方差为s;
记女生样本为z1,z2,…,z18,平均数为女,方差为s;
所有数据样本的平均数为总,方差为s.样本总量为50.
所有50个数据的平均数为总=男+女=×173.5+×163.83≈170.02(cm).
若总体划为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为m,1,s,n,2,s,总的样本平均数为,样本方差为s2,则s2=[s+(1-)2]+[s+(2-)2].
根据此公式得s=[17+(173.5-170.02)2]+[30.03+(163.83-170.02)2]≈43.24(cm2).
[针对训练]
1.选AD 第1,2层所有数据的均值为12=×4+×8=5.75,A正确;第1,2层所有数据的方差为s=×+×[1+(8-5.75)2]=5.5,B不正确;第1,2,3层所有数据的均值约为=×4+×8+×6≈5.78,C不正确;第1,2,3层所有数据的方差约为s2=×+×+×[3+(6-5.78)2]≈5.23,D正确.
2.解:设二线城市的房价的方差为s2,由题意可知20=[s2+(2.4-1.2)2]+[10+(1.8-1.2)2]+[8+(0.8-1.2)2],
解得s2=118.52,即二线城市的房价的方差为118.52.
[题型(二)]
[例2] 选B 把成绩按从小到大的顺序排列为56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,
因为15×80%=12,是整数,所以这15人成绩的80%分位数是=90.5.
[例3] 解析:由于30×60%=18,设第19个数据为x,则=8.2,解得x=8.6,即第19个数据是8.6.
答案:8.6
[针对训练]
3.选C 由10×40%=4,得第40百分位数是第4个数据和第5个数据的平均值,为=37.又由10×65%=6.5,得第65百分位数是第7个数据,为m,因为这组数据的第65百分位数比第40百分位数多8,可得m=37+8=45.
4.选B 因为10人成绩的第p百分位数是85,而85=,即第7位与第8位的平均值,所以85是这10人成绩的第70百分为数.
5.解:(1)将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,
则第25百分位数是=8.15,
第75百分位数是=8.75,
第95百分位数是第12个数据为9.9.
(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.
即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.
(3)由(1)可知样本数据的第25百分位数是8.15 g,第50百分位数为8.5 g,第95百分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.
[题型(三)]
[例4] 解:(1)由频率分布直方图知,第三组的频率为0.020×10=0.2.
(2)平均值=45×0.004×10+55×0.012×10+65×0.020×10+75×0.030×10+85×0.024×10+95×0.010×10=73.8,
因为(0.004+0.012)×10=0.16,(0.004+0.012+0.020)×10=0.36,所以25%分位数为60+×10=64.5.
[针对训练]
6.解:(1)因为每组小矩形的面积之和为1,
所以(0.005+0.010+0.020+a+0.025+0.010)×10=1,则a=0.030.
(2)成绩落在[40,80)内的频率为(0.005+0.010+0.020+0.030)×10=0.65,
落在[40,90)内的频率为(0.005+0.010+0.020+0.030+0.025)×10=0.9,
设第75百分位数为m,
由0.65+(m-80)×0.025=0.75,得m=84,故第75百分位数为84.
(3)由题图可知,成绩在[50,60)的市民人数为100×0.1=10,成绩在[60,70)的市民人数为100×0.2=20,
故这两组成绩的总平均数为=62,
由样本方差计算总体方差公式可得总方差为s2=×[7+(54-62)2]+×[4+(66-62)2]=37.
5 / 5(共68张PPT)
分层随机抽样的均值与方差、百分位数
(教学方式:深化学习课—梯度进阶式教学)
4.2
课时目标
1.理解分层随机抽样的均值与方差公式的推导过程,会求分层随机抽样的均值与方差.
2.理解百分位数的统计含义,会求样本数据的p分位数.
CONTENTS
目录
1
2
3
课前预知教材·自主落实基础
课堂题点研究·迁移应用融通
课时跟踪检测
课前预知教材·自主落实基础
(一)分层随机抽样的均值与方差
1.权重
一般地,将样本a1,a2,…,am和样本b1,b2,…,bn合并成一个新样本,则这个新样本的平均数为+.
记w1=,w2=,则这个新样本的平均数为__________,其中w1,w2称为权重.
w1+w2
2.分层随机抽样的均值与方差
w1+w2+…+wn
(二)百分位数
1.总体的p分位数的概念
一般地,当总体是连续变量时,给定一个百分数p∈_____,总体的p分位数有这样的特点:总体数据中的任意一个数___________它的可能性是p.
2.四分位数
_____________分位数是三个常用的百分位数.把总体数据按照_________排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是.因此这三个百分位数也称为总体的四分位数.
(0,1)
小于或等于
25%,50%,75%
从小到大
3.计算一组n个数据的p分位数的一般步骤
第一步,按照__________排列原始数据;
第二步,计算i=____;
第三步,若i不是整数,大于i的最小整数为j,则p分位数为___________;若i是整数,则p分位数为第i项与第______项数据的_______.
从小到大
np
第j项数据
(i+1)
平均数
基础落实训练
1.下列表述不正确的是( )
A.50%分位数就是总体的中位数
B.p百分位数可以有单位
C.一个总体的四分位数有4个
D.样本容量越大,第p百分位数估计总体就越准确
解析:一个总体的25%分位数,50%分位数,75%分位数是总体的四分位数,有3个,所以C错误.
√
2.某单位共有员工100人,其中有年轻人20人,平均年薪为5万元,中年人有80人,平均年薪为8万元,则该单位员工的平均年薪为 ( )
A.5万元 B.8万元
C.6.5万元 D.7.4万元
解析:由题意可知=×5+×8=7.4(万元).
√
3.利用分层随机抽样抽得A,B两组数据,其平均数分别是=2.3,=2.8,若这两组数据的平均数=2.4,则A组数据在两组数据中的权重wA= .
解析:由=wA+wB,可得2.4=wA×2.3+(1-wA)×2.8,解得wA=.
4.数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的30%分位数是 .
解析:因为8×30%=2.4,故30%分位数是第3个数据8.4.
8.4
课堂题点研究·迁移应用融通
题型(一) 分层随机抽样的均值与方差的计算
[例1] 某校从在校学生中,用分层随机抽样的方法抽取男生32人,女生18人.测得他们的身高后,计算得到男生身高的样本平均数为173.5 cm,方差为17 cm2;女生身高的样本平均数为163.83 cm,方差为30.03 cm2.求所有50个身高数据的样本方差.
解:记男生样本为y1,y2,…,y32,平均数为,方差为;
记女生样本为z1,z2,…,z18,平均数为,方差为;所有数据样本的平均数为,方差为.样本总量为50.
所有50个数据的平均数为=+=×173.5+×163.83≈170.02(cm).
若总体划为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为m,,,n,,,总的样本平均数为,样本方差为s2,则s2=·[+]+[+].
根据此公式得=[17+(173.5-170.02)2]+[30.03+(163.83-170.02)2]≈
43.24(cm2).
|思|维|建|模|
1.分层随机抽样的平均数的计算方法
(1)第i层的权重wi、第i层的个体数xi、样本容量n,三者满足wi=,已知其中2个可求另外1个.
(2)利用公式=w1 1+w2+…+wn求分层随机抽样的平均数.
2.计算分层随机抽样的方差s2的步骤
(1)确定,,…,,,,…, ,w1,w2,…,wn;
(2)确定;
(3)应用公式 s2= wi[+(-)2]计算s2.
针对训练
1.(多选)某分层随机抽样中,有关数据如下:
样本量 均值 方差
第1层 45 4 2
第2层 35 8 1
第3层 10 6 3
则下列叙述正确的是(结果保留两位小数) ( )
A.第1,2层所有数据的均值为5.75
B.第1,2层所有数据的方差为1.50
C.第1,2,3层所有数据的均值约为7.68
D.第1,2,3层所有数据的方差约为5.23
√
√
解析:第1,2层所有数据的均值为=×4+×8=5.75,A正确;第1,2层所有数据的方差为=×+×
=5.5,B不正确;第1,2,3层所有数据的均值约为=×4+×8+×6≈5.78,C不正确;第1,2,3层所有数据的方差约为s2=×+×+×≈5.23,D正确.
2.已知某省二、三、四线城市数量之比为1∶3∶6,2024年6月份调查得知该省所有城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.8万元/平方米,三、四线城市房价的方差分别为10,8,求二线城市的房价的方差.
解:设二线城市的房价的方差为s2,由题意可知
20=[s2+(2.4-1.2)2]+[10+(1.8-1.2)2]+[8+(0.8-1.2)2],
解得s2=118.52,即二线城市的房价的方差为118.52.
题型(二) 百分位数的计算
[例2] 以下数据为参加数学竞赛决赛的15人的成绩:78,70,72,86,88,
79,80,81,94,84,56,98,83,90,91,则这15人成绩的80%分位数是 ( )
A.90 B.90.5
C.91 D.91.5
√
解析:把成绩按从小到大的顺序排列为
56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,
因为15×80%=12,是整数,所以这15人成绩的80%分位数是=90.5.
[例3] 已知30个数据的60%分位数是8.2,将这30个数据从小到大排列后第18个数据是7.8,则第19个数据是 .
解析:由于30×60%=18,设第19个数据为x,则=8.2,解得x=8.6,即第19个数据是8.6.
8.6
|思|维|建|模|
计算一组数据的p分位数时,不要忽略对i是否为整数的讨论.若i不是整数,则p分位数是大于i的最小整数个数据;若i是整数,则p分位数为第i个与第(i+1)个数据的平均数.
针对训练
3.按从小到大顺序排列的一组数据:26,30,35,36,38,42,m,47,50,52,若这组数据的第65百分位数比第40百分位数多8,则m= ( )
A.43 B.44
C.45 D.46
解析:由10×40%=4,得第40百分位数是第4个数据和第5个数据的平均值,为=37.又由10×65%=6.5,得第65百分位数是第7个数据,为m,因为这组数据的第65百分位数比第40百分位数多8,可得m=37+8=45.
√
4.以下数据为某学校参加学科节数学竞赛决赛的10人的成绩:(单位:分)72,
78,79,80,81,83,84,86,88,90.这10人成绩的第p百分位数是85,则p= ( )
A.65 B.70
C.75 D.80
解析:因为10人成绩的第p百分位数是85,而85=,即第7位与第8位的平均值,所以85是这10人成绩的第70百分为数.
√
5.从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的第25,75,95百分位数;
解:将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,
则第25百分位数是=8.15,
第75百分位数是=8.75,
第95百分位数是第12个数据为9.9.
(2)请你找出珍珠质量较小的前15%的珍珠质量;
解:因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.
(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.
解:由(1)可知样本数据的第25百分位数是8.15 g,第50百分位数为8.5 g,第95百分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.
题型(三) 百分位数的综合问题
[例4] 在某市的一次数学测试中,为了解学生的测试情况,从中随机抽取100名学生的测试成绩,被抽取成绩全部介于40分到100分之间(满分100分),将统计结果按如下方式分成六组:第一组[40,50),第二组[50,60),…,第六组[90,100],画出频率分布直方图如图所示.
(1)求第三组[60,70)的频率;
解:由频率分布直方图知,第三组的频率为0.020×10=0.2.
(2)估计该市学生这次测试成绩的平均值(同一组中的数据用该组区间的中点值为代表)和25%分位数.
解:平均值=45×0.004×10+55×0.012×10+65×0.020×10+75×0.030×10+85×0.024×10+95×0.010×10=73.8,
因为(0.004+0.012)×10=0.16,(0.004+0.012+0.020)×10=0.36,
所以25%分位数为60+×10=64.5.
|思|维|建|模|
频率分布直方图中p分位数的求解方法可以模仿中位数的求解思路:
(1)确定p分位数所在的区间[a,b).
(2)确定小于a和小于b的数据所占的百分比分别为fa,fb,则p分位数为a+×(b-a).
针对训练
6.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
解:因为每组小矩形的面积之和为1,
所以(0.005+0.010+0.020+a+0.025+0.010)×10=1,则a=0.030.
(2)求样本成绩的第75百分位数;
解:成绩落在[40,80)内的频率为(0.005+0.010+0.020+0.030)×10=0.65,落在[40,90)内的频率为(0.005+0.010+0.020+0.030+0.025)×10=0.9,
设第75百分位数为m,由0.65+(m-80)×0.025=0.75,得m=84,故第75百分位数为84.
(3)已知落在[50,60)的平均成绩是54,方差是7,落在[60,70)的平均成绩为66,方差是4,求两组成绩的总平均数和总方差.
解:由题图可知,成绩在[50,60)的市民人数为100×0.1=10,成绩在[60,70)的市民人数为100×0.2=20,
故这两组成绩的总平均数为=62,
由样本方差计算总体方差公式可得总方差为s2=×[7+(54-62)2]+×
[4+(66-62)2]=37.
课时跟踪检测
1
3
4
5
6
7
8
9
10
11
12
13
14
15
2
A级——综合提能
1.下列一组数据的25%分位数是( )
2.1 3.0 3.4 3.2 3.8 4.0 4.2 4.4 5.3 5.6
A.3.2 B.3.0
C.4.4 D.3.4
解析:把该组数据按照由小到大排列,可得2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6.
由10×25%=2.5,不是整数,则第3个数据3.2是25%分位数.
√
1
5
6
7
8
9
10
11
12
13
14
15
2
3
4
2.有两种糖块,A种糖块18元/千克,B种糖块24元/千克,超市计划把A,B两种糖块按照1∶2的比例混合出售,则合理的价格应为 ( )
A.18元/千克 B.24元/千克
C.21元/千克 D.22元/千克
解析:=×18+×24=22元/千克.
√
1
5
6
7
8
9
10
11
12
13
14
15
3
4
2
3.已知100个数据的75%分位数是9.3,则下列说法正确的是 ( )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据按从小到大排列后,9.3是第75个数据
C.把这100个数据按从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据按从小到大排列后,9.3是第74个数据和第75个数据的平均数
√
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为75%分位数,是9.3.
1
5
6
7
8
9
10
11
12
13
3
4
2
4.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,
17,16,14,12,设该组数据的平均数为a,50%分位数为b,则有 ( )
A.a=13.7,b=15.5 B.a=14,b=15
C.a=12,b=15.5 D.a=14.7,b=15
√
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,
其平均数a=×(10+12+14+14+15+15+16+17+17+17)=14.7,50%分位数为b==15.
1
5
6
7
8
9
10
11
12
13
3
4
2
5.(多选)某学校高一年级在校人数为600人,其中男生320人,女生280人,为了解学生身高发展情况,按分层随机抽样的方法抽取80名男生身高为一个样本,其样本平均数为170.2 cm,方差为2.1;抽取70名女生身高为一个样本,其样本平均数为162.0 cm,方差为3.则 ( )
A.该校高一学生的平均身高约为166.4
B.该校高一学生的平均身高约为168.2
C.该校高一学生身高的方差约为2.5
D.该校高一学生身高的方差约为19.3
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:设样本中男、女生身高的平均数分别为,,由题意可知,=170.2,=162.0且M=320,N=280,所以样本平均数=+
=×170.2+×162.0≈166.4(cm),样本方差s2=×
[2.1+(170.2-166.4)2]+×[3+(162.0-166.4)2]≈19.3,故该校高一学生的平均身高约为166.4 cm,方差约为19.3.
1
5
6
7
8
9
10
11
12
13
3
4
2
6.已知甲、乙两组按从小到大顺序排列的数据:甲组:14,30,37,a,41,52,
53,55,58,80;乙组:17,22,32,b,45,47,51,59.若甲组数据的30%分位数和乙组数据的中位数相等,则a-b等于 .
解析:因为10×30%=3,甲组数据的30%分位数为第三个数和第四个数的平均数,乙组数据的中位数为第四个数和第五个数的平均数,根据题意可得=,解得a-b=8.
8
1
5
6
7
8
9
10
11
12
13
3
4
2
7.为了调查公司员工的健康状况,用分层随机抽样的方法抽取样本,已知所抽取的所有员工的平均体重为60 kg,标准差为60,男员工的平均体重为70 kg,标准差为50,女员工的平均体重为50 kg,标准差为60,若样本中有20名男员工,则女员工的人数为 .
解析:由题意可知s2=w男[+(-)2]+w女[+(-)2],即w男[502+(70-60)2]+(1-w男)[602+(50-60)2]=602,解得w男=,w女=,因为样本中有20名男员工,则样本中女员工的人数为200.
200
1
5
6
7
8
9
10
11
12
13
3
4
2
8.(8分)农科院在试验田中种植了两个小麦品种,亩数、亩均产量和标准差如下:
品种 甲 乙
亩数(单位:亩) 10 8
亩均产量(单位:kg) 540 576
标准差 3 2
1
5
6
7
8
9
10
11
12
13
3
4
2
求甲、乙两个品种的平均亩产量和方差.
解:甲、乙两个品种的平均亩产量为×540+×576=556 kg;
甲、乙两个品种的亩产量的方差是
s2=w甲[+(-)2]+w乙[+(-)2]
=[32+(540-556)2]+[22+(576-556)2]≈326.78.
即甲、乙两个品种的平均亩产量和方差分别是556 kg,326.78.
1
5
6
7
8
9
10
11
12
13
3
4
2
B级——重点培优
9.(多选)已知数据x1,x2,x3,…,xn的极差、平均数、众数、80%分位数分别是a1,b1,c1,d1,数据y1,y2,y3,…,yn的极差、平均数、众数、80%分位数分别是a2,b2,c2,d2,且满足yi=3xi-1(i=1,2,3,…,n),则( )
A.a2=3a1-1 B.b2=3b1-1
C.c2=3c1-1 D.d2=3d1-1
√
√
√
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:对于A,a2=3a1,故A错误;对于B,由题意可知,两组数据满足yi=3xi-1
(i=1,2,3,…,n),由平均数计算公式得×(y1+y2+…+yn)=×[(3x1-1)+(3x2-1)
+…+(3xn-1)]=3××(x1+x2+…+xn)-1,所以b2=3b1-1,故B正确;对于C,由众数知识得c2=3c1-1,故C正确;对于D,对于数据x1,x2,x3,…,xn,假设其80%分位数为d1,当0.8n=k是整数时,d1=,当0.8n不是整数时,设其整数部分为k,
1
5
6
7
8
9
10
11
12
13
3
4
2
则d1=xk+1,所以对于数据3x1-1,3x2-1,3x3-1,…,3xn-1,假设其80%分位数为d2,当0.8n=k是整数时,d2==3d1-1,当0.8n不是整数时,设其整数部分为k,则d2=3xk+1-1=3d1-1,所以d2=3d1-1,故D正确.
1
5
6
7
8
9
10
11
12
13
3
4
2
10.(多选)从某校男生中随机抽取100人测量他们的身高,发现他们的身高都在155~185 cm之间,将统计得到的原始数据进行分组,得到如图所示的频率分布直方图(每组均为左闭右开区间),则下列说法正确的是 ( )
1
5
6
7
8
9
10
11
12
13
3
4
2
A.已知该校一共有1 500名男生,该校身高在[165,170)内的男生人数约为450
B.该校男生身高的90%分位数约为178.3(结果精确到0.1)
C.将身高不低于170 cm的男生称为“高个子”,低于170 cm的男生称为“非高个子”.已知在原始数据中,高个子男生的身高的平均数为177,方差为10,100名男生的身高的平均数为168,方差为64,则非高个子男生的身高的方差为10
D.据此估计该校男生的平均身高一定是168.6
√
√
√
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:由频率分布直方图可知(0.024+0.036+x+0.044+0.024+0.012)×5=1,得x=0.06.
故估计该校1 500名男生中身高在[165,170)内的人数为1 500×0.06×5=450,故A正确;
前四组的频率之和为(0.024+0.036+0.06+0.044)×5=0.82<0.9,
前五组的频率之和为0.82+0.024×5=0.94>0.9,所以90%分位数位于区间[175,180)内,
1
5
6
7
8
9
10
11
12
13
3
4
2
故估计该校男生身高的90%分位数为175+×5≈178.3,故B正确;
由频率分布直方图可知,样本中高个子男生有40人,非高个子男生有60人.
将高个子男生的身高数据记为x1,x2,…,x40,其平均数记为,方差记为;将非高个子男生的身高数据记为y1,y2,…,y60,其平均数记为,方差记为;把全部样本数据的平均数记为,方差记为s2.
则=177,=10,=168,s2=64.
1
5
6
7
8
9
10
11
12
13
3
4
2
由已知可得=+,即168=177×0.4+0.6,得=162,
s2=[+(-)2]+[+(-)2].
所以64=0.4×(10+92)+0.6×(+62),解得=10,故C正确;
根据直方图可知据此估计该校男生的平均身高约为
(157.5×0.024+162.5×0.036+167.5×0.06+172.5×0.044+177.5×0.024+182.5×0.012)×5=168.6,故D错误.
1
5
6
7
8
9
10
11
12
13
3
4
2
11.某学校共有学生2 000人,其中高一800人,高二、高三各600人,学校对学生在暑假中每天的读书时间做了调查统计,全体学生每天的读书时间的平均数为=3,方差为s2=2.003,其中高一学生、高二学生每天读书时间的平均数分别为=2.6,=3.2,又已知三个年级学生每天读书时间的方差分别为=1,=2,=3,则高三学生每天读书时间的平均数= .
3.3或2.7
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:由s2=w1[+(-)2]+w2[+(-)2]+w3[+(-)2],可得2.003=[1+(2.6-3)2]+[2+(3.2-3)2]+[3+(-3)2],解得=3.3或2.7.
1
5
6
7
8
9
10
11
12
13
3
4
2
12.(13分)为了普及法律知识,达到“法在心中”的目的,某市法制办组织了一次普法知识竞赛,统计局调查队从甲、乙两单位中各随机抽取了5名职工的成绩,如下:
甲单位职工的成绩(分) 87 88 91 91 93
乙单位职工的成绩(分) 85 89 91 92 93
1
5
6
7
8
9
10
11
12
13
3
4
2
(1)根据表中的数据,分别求出样本中甲、乙两单位职工成绩的平均数和方差,并判断哪个单位职工对法律知识的掌握更为稳定;
解:甲单位5名职工成绩的平均数=×(87+88+91+91+93)=90(分),乙单位5名职工成绩的平均数=×(85+89+91+92+93)=90(分),甲单位5名职工成绩的方差=×[(87-90)2+(88-90)2+(91-90)2+(91-90)2+(93-90)2]=4.8,乙单位5名职工成绩的方差=×[(85-90)2+(89-90)2+(91-90)2+(92-90)2+(93-90)2]=8.∵<,∴甲单位职工对法律知识的掌握更为稳定.
1
5
6
7
8
9
10
11
12
13
3
4
2
(2)求被抽取的这10名职工成绩的平均数和方差.
解:∵甲单位职工的权重w甲=,乙单位职工的权重w乙=,=90分,=90分,=4.8,=8,
∴这10名职工成绩的平均数=×90+×90=90(分),这10名职工成绩的方差s2=w甲[+(-)2]+w乙[+(-)2]=×[4.8+(90-90)2]+×[8+(90-90)2]=6.4.
1
5
6
7
8
9
10
11
12
13
14
15
3
4
2
13.(16分)某小区为了提高小区内人员的读书兴趣,准备举办读书活动,并购买一定数量的书籍丰富小区图书站.由于不同年龄段的人看不同类型的书籍,为了合理配备资源,现对小区内看书人员进行年龄调查,随机抽取了40名读书者进行调查,将他们的年龄(单位:岁)分成6段:[20,30),[30,40),
[40,50),[50,60),[60,70),[70,80]后得到如图所示的频率分布直方图.
1
5
6
7
8
9
10
11
12
13
3
4
2
(1)求在这40名读书者中年龄分布在[40,70)的人数;
解:由频率分布直方图知,年龄在[40,70)的频率为(0.020+0.030+0.025)
×10=0.75,故这40名读书者中年龄分布在[40,70)的人数为40×0.75=30.
1
5
6
7
8
9
10
11
12
13
3
4
2
(2)求这40名读书者的年龄的50%分位数.
解:设这40名读书者年龄的50%分位数为x,
则0.005×10+0.010×10+0.020×10+0.030×(x-50)=0.5,
解得x=55,故这40名读书者年龄的50%分位数为55.课时跟踪检测(四十五) 分层随机抽样的均值与方差、百分位数
(满分90分,A级选填小题每题5分,B级选填小题每题6分)
A级——达标评价
1.下列一组数据的25%分位数是( )
2.1 3.0 3.4 3.2 3.8 4.0 4.2 4.4 5.3 5.6
A.3.2 B.3.0
C.4.4 D.3.4
2.有两种糖块,A种糖块18元/千克,B种糖块24元/千克,超市计划把A,B两种糖块按照1∶2的比例混合出售,则合理的价格应为( )
A.18元/千克 B.24元/千克
C.21元/千克 D.22元/千克
3.已知100个数据的75%分位数是9.3,则下列说法正确的是( )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据按从小到大排列后,9.3是第75个数据
C.把这100个数据按从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据按从小到大排列后,9.3是第74个数据和第75个数据的平均数
4.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,50%分位数为b,则有( )
A.a=13.7,b=15.5 B.a=14,b=15
C.a=12,b=15.5 D.a=14.7,b=15
5.(多选)某学校高一年级在校人数为600人,其中男生320人,女生280人,为了解学生身高发展情况,按分层随机抽样的方法抽取80名男生身高为一个样本,其样本平均数为170.2 cm,方差为2.1;抽取70名女生身高为一个样本,其样本平均数为162.0 cm,方差为3.则( )
A.该校高一学生的平均身高约为166.4
B.该校高一学生的平均身高约为168.2
C.该校高一学生身高的方差约为2.5
D.该校高一学生身高的方差约为19.3
6.已知甲、乙两组按从小到大顺序排列的数据:甲组:14,30,37,a,41,52,53,55,58,80;乙组:17,22,32,b,45,47,51,59.若甲组数据的30%分位数和乙组数据的中位数相等,则a-b等于______.
7.为了调查公司员工的健康状况,用分层随机抽样的方法抽取样本,已知所抽取的所有员工的平均体重为60 kg,标准差为60,男员工的平均体重为70 kg,标准差为50,女员工的平均体重为50 kg,标准差为60,若样本中有20名男员工,则女员工的人数为________.
8.(8分)农科院在试验田中种植了两个小麦品种,亩数、亩均产量和标准差如下:
品种 甲 乙
亩数(单位:亩) 10 8
亩均产量(单位:kg) 540 576
标准差 3 2
求甲、乙两个品种的平均亩产量和方差.
B级——重点培优
9.(多选)已知数据x1,x2,x3,…,xn的极差、平均数、众数、80%分位数分别是a1,b1,c1,d1,数据y1,y2,y3,…,yn的极差、平均数、众数、80%分位数分别是a2,b2,c2,d2,且满足yi=3xi-1(i=1,2,3,…,n),则( )
A.a2=3a1-1 B.b2=3b1-1
C.c2=3c1-1 D.d2=3d1-1
10.(多选)从某校男生中随机抽取100人测量他们的身高,发现他们的身高都在155~185 cm之间,将统计得到的原始数据进行分组,得到如图所示的频率分布直方图(每组均为左闭右开区间),则下列说法正确的是( )
A.已知该校一共有1 500名男生,该校身高在[165,170)内的男生人数约为450
B.该校男生身高的90%分位数约为178.3(结果精确到0.1)
C.将身高不低于170 cm的男生称为“高个子”,低于170 cm的男生称为“非高个子”.已知在原始数据中,高个子男生的身高的平均数为177,方差为10,100名男生的身高的平均数为168,方差为64,则非高个子男生的身高的方差为10
D.据此估计该校男生的平均身高一定是168.6
11.某学校共有学生2 000人,其中高一800人,高二、高三各600人,学校对学生在暑假中每天的读书时间做了调查统计,全体学生每天的读书时间的平均数为=3,方差为s2=2.003,其中高一学生、高二学生每天读书时间的平均数分别为1=2.6,2=3.2,又已知三个年级学生每天读书时间的方差分别为s=1,s=2,s=3,则高三学生每天读书时间的平均数3=________.
12.(13分)为了普及法律知识,达到“法在心中”的目的,某市法制办组织了一次普法知识竞赛,统计局调查队从甲、乙两单位中各随机抽取了5名职工的成绩,如下:
甲单位职工的成绩(分) 87 88 91 91 93
乙单位职工的成绩(分) 85 89 91 92 93
(1)根据表中的数据,分别求出样本中甲、乙两单位职工成绩的平均数和方差,并判断哪个单位职工对法律知识的掌握更为稳定;
(2)求被抽取的这10名职工成绩的平均数和方差.
13.(16分)某小区为了提高小区内人员的读书兴趣,准备举办读书活动,并购买一定数量的书籍丰富小区图书站.由于不同年龄段的人看不同类型的书籍,为了合理配备资源,现对小区内看书人员进行年龄调查,随机抽取了40名读书者进行调查,将他们的年龄(单位:岁)分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80]后得到如图所示的频率分布直方图.
(1)求在这40名读书者中年龄分布在[40,70)的人数;
(2)求这40名读书者的年龄的50%分位数.
课时跟踪检测(四十五)
1.选A 把该组数据按照由小到大排列,可得2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6.
由10×25%=2.5,不是整数,则第3个数据3.2是25%分位数.
2.选D =×18+×24=22元/千克.
3.选C 因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为75%分位数,是9.3.
4.选D 把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a=×(10+12+14+14+15+15+16+17+17+17)=14.7,50%分位数为b==15.
5.选AD 设样本中男、女生身高的平均数分别为,,由题意可知,=170.2,=162.0且M=320,N=280,所以样本平均数=+=×170.2+×162.0≈166.4(cm),样本方差s2=×[2.1+(170.2-166.4)2]+×[3+(162.0-166.4)2]≈19.3,故该校高一学生的平均身高约为166.4 cm,方差约为19.3.
6.解析:因为10×30%=3,甲组数据的30%分位数为第三个数和第四个数的平均数,乙组数据的中位数为第四个数和第五个数的平均数,根据题意可得=,解得a-b=8.
答案:8
7.解析:由题意可知s2=w男[s+(男-)2]+w女[s+(女-)2],即w男[502+(70-60)2]+(1-w男)[602+(50-60)2]=602,解得w男=,w女=,因为样本中有20名男员工,则样本中女员工的人数为200.
答案:200
8.解:甲、乙两个品种的平均亩产量为×540+×576=556 kg;
甲、乙两个品种的亩产量的方差是
s2=w甲[s+(甲-)2]+w乙[s+(乙-)2]=[32+(540-556)2]+[22+(576-556)2]≈326.78.
即甲、乙两个品种的平均亩产量和方差分别是556 kg,326.78.
9.选BCD 对于A,a2=3a1,故A错误;对于B,由题意可知,两组数据满足yi=3xi-1(i=1,2,3,…,n),由平均数计算公式得×(y1+y2+…+yn)=×[(3x1-1)+(3x2-1)+…+(3xn-1)]=3××(x1+x2+…+xn)-1,所以b2=3b1-1,故B正确;对于C,由众数知识得c2=3c1-1,故C正确;对于D,对于数据x1,x2,x3,…,xn,假设其80%分位数为d1,当0.8n=k是整数时,d1=,当0.8n不是整数时,设其整数部分为k,则d1=xk+1,所以对于数据3x1-1,3x2-1,3x3-1,…,3xn-1,假设其80%分位数为d2,当0.8n=k是整数时,d2==3d1-1,当0.8n不是整数时,设其整数部分为k,则d2=3xk+1-1=3d1-1,所以d2=3d1-1,故D正确.
10.选ABC 由频率分布直方图可知(0.024+0.036+x+0.044+0.024+0.012)×5=1,得x=0.06.
故估计该校1 500名男生中身高在[165,170)内的人数为1 500×0.06×5=450,故A正确;
前四组的频率之和为(0.024+0.036+0.06+0.044)×5=0.82<0.9,
前五组的频率之和为0.82+0.024×5=0.94>0.9,所以90%分位数位于区间[175,180)内,
故估计该校男生身高的90%分位数为175+×5≈178.3,故B正确;
由频率分布直方图可知,样本中高个子男生有40人,非高个子男生有60人.
将高个子男生的身高数据记为x1,x2,…,x40,其平均数记为,方差记为s;将非高个子男生的身高数据记为y1,y2,…,y60,其平均数记为,方差记为s;把全部样本数据的平均数记为,方差记为s2.
则=177,s=10,=168,s2=64.
由已知可得=+,即168=177×0.4+0.6,得=162,s2=[s+(-)2]+[s+(-)2].
所以64=0.4×(10+92)+0.6×(s+62),解得s=10,故C正确;
根据直方图可知据此估计该校男生的平均身高约为
(157.5×0.024+162.5×0.036+167.5×0.06+172.5×0.044+177.5×0.024+182.5×0.012)×5=168.6,故D错误.
11.解析:由s2=w1[s+(1-)2]+w2[s+(2-)2]+w3[s+(3-)2],可得2.003=[1+(2.6-3)2]+[2+(3.2-3)2]+[3+(3-3)2],解得3=3.3或2.7.
答案:3.3或2.7
12.解:(1)甲单位5名职工成绩的平均数甲=×(87+88+91+91+93)=90(分),乙单位5名职工成绩的平均数乙=×(85+89+91+92+93)=90(分),甲单位5名职工成绩的方差s=×[(87-90)2+(88-90)2+(91-90)2+(91-90)2+(93-90)2]=4.8,乙单位5名职工成绩的方差s=×[(85-90)2+(89-90)2+(91-90)2+(92-90)2+(93-90)2]=8.∵s<s,∴甲单位职工对法律知识的掌握更为稳定.
(2)∵甲单位职工的权重w甲=,乙单位职工的权重w乙=,甲=90分,乙=90分,s=4.8,s=8,
∴这10名职工成绩的平均数=×90+×90=90(分),这10名职工成绩的方差s2=w甲[s+(甲-)2]+w乙[s+(乙-)2]=×[4.8+(90-90)2]+×[8+(90-90)2]=6.4.
13.解:(1)由频率分布直方图知,年龄在[40,70)的频率为(0.020+0.030+0.025)×10=0.75,
故这40名读书者中年龄分布在[40,70)的人数为40×0.75=30.
(2)设这40名读书者年龄的50%分位数为x,则0.005×10+0.010×10+0.020×10+0.030×(x-50)=0.5,
解得x=55,故这40名读书者年龄的50%分位数为55.
1 / 3