14.4.2 用样本估计总体的离散程度参数
(教学方式:深化学习课——梯度进阶式教学)
[课时目标]
1.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差).
2.掌握求分层抽样总样本的平均数及方差的方法,理解离散程度参数的统计含义.
1.极差
我们把一组数据的 的差称为极差.
2.方差
(1)方差的定义
一般地,设一组样本数据x1,x2,…,xn,其平均数为,则称s2= 为这个样本的方差,简称样本方差.
(2)方差的计算
①s2=(xi-)2=[(x1-)2+(x2-)2+…+(xn-)2].
②一般地,若取值为x1,x2,…,xn的频率分别为p1,p2,…,pn,则其方差为p1(x1-)2+p2(x2-)2+…+pn(xn-)2.
③一般地,如果总体分为k层,第j层抽取的样本为xj1,xj2,…,,第j层的样本量为nj,样本平均数为,样本方差为,j=1,2,…,k.记nj=n,那么,所有数据的样本方差为= (xjt-)2=nj[+(-)2].
(3)方差的性质
设数据x1,x2,…,xn的平均数为 ,方差为s2,则
①s2= (-n);
②数据x1+a,x2+a,…,xn+a的方差也为s2;
③数据ax1,ax2,…,axn的方差为a2s2;
④数据ax1+b,ax2+b,…,axn+b的方差为a2s2.
3.标准差
方差的算术平方根s= 为样本的标准差,简称样本标准差.
基础落实训练
1.判断正误(正确的画“√”,错误的画“×”)
(1)若一组数据的值大小相等,没有波动变化,则标准差为0. ( )
(2)标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散. ( )
(3)在实际问题中要做出有效决策时,主要参照样本数据的平均数和标准差或方差. ( )
2.下列选项中,能反映一组数据的离散程度的是 ( )
A.平均数 B.中位数
C.方差 D.众数
3.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为 ( )
A.1 B.
C. D.2
4.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为 ( )
A.9.4,0.484 B.9.4,0.016
C.9.5,0.04 D.9.5,0.016
题型(一) 标准差、方差、极差的计算
[例1] 某班20位女同学平均分为甲、乙两组,她们的劳动技术课考试成绩如下(单位:分):
甲组:60,90,85,75,65,70,80,90,95,80;
乙组:85,95,75,70,85,80,85,65,90,85.
试分别计算两组数据的极差、方差和标准差.
听课记录:
|思|维|建|模|
计算标准差的5步骤
(1)求出样本数据的平均数.
(2)求出每个样本数据与样本平均数的差xi-(i=1,2,…,n).
(3)求出xi-(i=1,2,…,n)的平方值.
(4)求出上一步中n个平方值的平均数,即为样本方差.
(5)求出上一步中平均数的算术平方根,即为样本标准差.
[针对训练]
1.从甲、乙两种玉米苗中各抽取10株,分别测得它们的株高(单位:cm)如下:
甲:25,41,40,37,22,14,19,39,21,42;
乙:27,16,44,27,44,16,40,40,16,40.
求:(1)哪种玉米苗长得高
(2)哪种玉米苗长得齐
题型(二) 分层抽样的方差
[例2] 甲、乙两支田径队体检结果:甲队的体重的平均数为60 kg,方差为200,乙队体重的平均数为70 kg,方差为300.又已知甲、乙两队的队员人数之比为1∶4,那么甲、乙两队全部队员的平均体重和方差分别是什么
听课记录:
|思|维|建|模|
计算分层抽样的方差s2的步骤
(1)确定,,,;
(2)确定;
(3)应用公式s2=[+(-)2]+[+(-)2],计算s2.
[针对训练]
2.在了解全校学生每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5,方差为9;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为16.若将甲、乙两同学抽取的样本合在一起,组成一个容量为18的样本,求合在一起后的样本平均数与方差.(结果精确到0.1)
题型(三) 数据的数字特征的综合应用
[例3] 甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.
(1)分别求出两人得分的平均数与方差;
(2)根据图形和(1)中计算结果,对两人的训练成绩作出评价.
听课记录:
|思|维|建|模|
数据分析的要点
(1)要正确处理此类问题,要抓住问题中的关键词语,全方位地进行必要的计算、分析,而不能习惯性地仅从样本方差的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析.
(2)在进行数据分析时,不同的标准没有对和错的问题,也不存在唯一解的问题,而是根据需要来选择“好”的决策,至于决策的好坏,是根据提出的标准而定的.
[针对训练]
3.在一次科技知识竞赛中,某学校的两组学生的成绩如下表:
分数 50 60 70 80 90 100
人 数 甲组 2 5 10 13 14 6
乙组 4 4 16 2 12 12
请根据你所学过的统计知识,判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.
14.4.2 用样本估计总体的离散程度参数
课前预知教材
1.最大值与最小值 2.(1)(xi-)2 3.
[基础落实训练]
1.(1)√ (2)× (3)√ 2.C
3.选B ∵样本容量n=5,∴=(1+2+3+4+5)=3,
∴s=
=.
4.选D ==9.5,
s2=(0.12×4+0.22)=0.016.
课堂题点研究
[例1] 解:甲组:最高分为95分,最低分为60分,极差为95-60=35(分),
平均分为=×(60+90+85+75+65+70+80+90+95+80)=79(分),
方差为=×[(60-79)2+(90-79)2+(85-79)2+(75-79)2+(65-79)2+(70-79)2+(80-79)2+(90-79)2+(95-79)2+(80-79)2]=119,
标准差为s甲==≈10.91(分).
乙组:最高分为95分,最低分为65分,极差为95-65=30(分),
平均分为=×(85+95+75+70+85+80+85+65+90+85)=81.5(分),
方差为=×[(85-81.5)2+(95-81.5)2+(75-81.5)2+(70-81.5)2+(85-81.5)2+(80-81.5)2+(85-81.5)2+(65-81.5)2+(90-81.5)2+(85-81.5)2]=75.25,标准差为s乙==≈8.67(分).
[针对训练]
1.解:(1)=×(25+41+40+37+22+14+19+39+21+42)=30,
同理可计算得=31,
∴<,即乙种玉米苗长得高.
(2)=×[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+
(42-30)2]=104.2,
同理可计算得=128.8,
∵<,∴甲种玉米苗长得齐.
[例2] 解:由题意可知=60,甲队队员在所有队员中所占比例为=,=70,乙队队员在所有队员中所占比例为=,则甲、乙两队全部队员的平均体重为=×60+×70=68(kg).
甲、乙两队全部队员的体重的方差为
s2=[200+(60-68)2]+[300+(70-68)2]=296.
[针对训练]
2.解:设甲抽到的一组样本数据为x1,x2,…,x10,乙抽到的一组样本数据为y1,y2,…,y8.
由题意知,甲同学抽取的样本的平均数==5,乙同学抽取的样本的平均数==6;
甲同学抽取的样本的方差=[(x1-)2+(x2-)2+…+(x10-)2]=9,
乙同学抽取的样本的方差=[(y1-)2+(y2-)2+…+(y8-)2]=16.
合在一起后的样本平均数===≈5.4.合在一起后的样本方差s2={10[+(-)2]+8[+(-)2]}==≈12.4.综上,合在一起后的样本平均数约为5.4,方差约为12.4.
[例3] 解:(1)由题图可得,甲、乙两人五次测试的成绩分别为甲:10,13,12,14,16;
乙:13,14,12,12,14.
=(10+13+12+14+16)=13,
=(13+14+12+12+14)=13,
=×[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
=×[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
(2)>可知乙的成绩较稳定.
从题图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
[针对训练]
3.解:(1)甲组成绩的众数为90,乙组成绩的众数为70,从成绩的众数比较看,甲组成绩好些.
(2)=(50×2+60×5+70×10+80×13+90×14+100×6)
=×4 000=80,
=(50×4+60×4+70×16+80×2+90×12+100×12)
=×4 000=80.
=[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172,
=[4×(50-80)2+4×(60-80)2+16×(70-80)2+2×(80-80)2+12×(90-80)2+12×(100-80)2]=256.
∵=,<,∴甲组成绩较乙组成绩稳定,故甲组好些.
(3)甲、乙两组成绩的中位数、平均数都是80分.其中,甲组成绩在80分以上(包括80分)的有33人,乙组成绩在80分以上(包括80分)的有26人.从这一角度看,甲组的成绩较好.
(4)从成绩统计表看,甲组成绩大于等于90分的有20人,乙组成绩大于等于90分的有24人,所以乙组成绩集中在高分段的人数多.同时,乙组得满分的人数比甲组得满分的人数多6人.从这一角度看,乙组的成绩较好.(共57张PPT)
14.4.2
用样本估计总体的离散
程度参数
(教学方式:深化学习课——梯度进阶式教学)
课时目标
1.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差).
2.掌握求分层抽样总样本的平均数及方差的方法,理解离散程度参数的统计含义.
CONTENTS
目录
1
2
3
课前预知教材·自主落实基础
课堂题点研究·迁移应用融通
课时跟踪检测
课前预知教材·自主落实基础
1.极差
我们把一组数据的________________的差称为极差.
2.方差
(1)方差的定义
最大值与最小值
(2)方差的计算
(3)方差的性质
设数据x1,x2,…,xn的平均数为 ,方差为s2,则
②数据x1+a,x2+a,…,xn+a的方差也为s2;
③数据ax1,ax2,…,axn的方差为a2s2;
④数据ax1+b,ax2+b,…,axn+b的方差为a2s2.
3.标准差
方差的算术平方根s=_______________为样本的标准差,简称样本标准差.
基础落实训练
1.判断正误(正确的画“√”,错误的画“×”)
(1)若一组数据的值大小相等,没有波动变化,则标准差为0. ( )
(2)标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散. ( )
(3)在实际问题中要做出有效决策时,主要参照样本数据的平均数和标准差或方差. ( )
√
×
√
2.下列选项中,能反映一组数据的离散程度的是 ( )
A.平均数 B.中位数
C.方差 D.众数
√
3.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为 ( )
A.1 B.
C. D.2
解析:∵样本容量n=5,∴=(1+2+3+4+5)=3,
∴s=
=.
√
4.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,
9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为 ( )
A.9.4,0.484 B.9.4,0.016
C.9.5,0.04 D.9.5,0.016
解析:==9.5,
s2=(0.12×4+0.22)=0.016.
√
课堂题点研究·迁移应用融通
题型(一) 标准差、方差、极差的计算
[例1] 某班20位女同学平均分为甲、乙两组,她们的劳动技术课考试成绩如下(单位:分):
甲组:60,90,85,75,65,70,80,90,95,80;
乙组:85,95,75,70,85,80,85,65,90,85.
试分别计算两组数据的极差、方差和标准差.
解:甲组:最高分为95分,最低分为60分,极差为95-60=35(分),
平均分为=×(60+90+85+75+65+70+80+90+95+80)=79(分),
方差为=×[(60-79)2+(90-79)2+(85-79)2+(75-79)2+(65-79)2+(70-79)2+(80-79)2+
(90-79)2+(95-79)2+(80-79)2]=119,
标准差为s甲==≈10.91(分).
乙组:最高分为95分,最低分为65分,极差为95-65=30(分),
平均分为=×(85+95+75+70+85+80+85+65+90+85)=81.5(分),
方差为=×[(85-81.5)2+(95-81.5)2+(75-81.5)2+(70-81.5)2+(85-81.5)2+
(80-81.5)2+(85-81.5)2+(65-81.5)2+(90-81.5)2+(85-81.5)2]=75.25,
标准差为s乙==≈8.67(分).
|思|维|建|模|
计算标准差的5步骤
(1)求出样本数据的平均数.
(2)求出每个样本数据与样本平均数的差xi-(i=1,2,…,n).
(3)求出xi-(i=1,2,…,n)的平方值.
(4)求出上一步中n个平方值的平均数,即为样本方差.
(5)求出上一步中平均数的算术平方根,即为样本标准差.
针对训练
1.从甲、乙两种玉米苗中各抽取10株,分别测得它们的株高(单位:cm)如下:
甲:25,41,40,37,22,14,19,39,21,42;
乙:27,16,44,27,44,16,40,40,16,40.
求:(1)哪种玉米苗长得高
解:=×(25+41+40+37+22+14+19+39+21+42)=30,
同理可计算得=31,
∴<,即乙种玉米苗长得高.
(2)哪种玉米苗长得齐
解:=×[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+
(19-30)2+(39-30)2+(21-30)2+(42-30)2]=104.2,
同理可计算得=128.8,
∵<,∴甲种玉米苗长得齐.
题型(二) 分层抽样的方差
[例2] 甲、乙两支田径队体检结果:甲队的体重的平均数为60 kg,方差为200,乙队体重的平均数为70 kg,方差为300.又已知甲、乙两队的队员人数之比为1∶4,那么甲、乙两队全部队员的平均体重和方差分别是什么
解:由题意可知=60,甲队队员在所有队员中所占比例为=,=70,
乙队队员在所有队员中所占比例为=,
则甲、乙两队全部队员的平均体重为=×60+×70=68(kg).
甲、乙两队全部队员的体重的方差为
s2=[200+(60-68)2]+[300+(70-68)2]=296.
|思|维|建|模|
计算分层抽样的方差s2的步骤
(1)确定,,,;
(2)确定;
(3)应用公式s2=[+(-)2]+[+(-)2],计算s2.
针对训练
2.在了解全校学生每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5,方差为9;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为16.若将甲、乙两同学抽取的样本合在一起,组成一个容量为18的样本,求合在一起后的样本平均数与方差.(结果精确到0.1)
解:设甲抽到的一组样本数据为x1,x2,…,x10,乙抽到的一组样本数据为y1,y2,…,y8.
由题意知,甲同学抽取的样本的平均数==5,乙同学抽取的样本的平均数==6;
甲同学抽取的样本的方差=[(x1-)2+(x2-)2+…+(x10-)2]=9,
乙同学抽取的样本的方差=[(y1-)2+(y2-)2+…+(y8-)2]=16.
合在一起后的样本平均数
===≈5.4.
合在一起后的样本方差
s2={10[+(-)2]+8[+(-)2]}
=
=≈12.4.综上,合在一起后的样本平均数约为5.4,方差约为12.4.
题型(三) 数据的数字特征的综合应用
[例3] 甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.
(1)分别求出两人得分的平均数与方差;
解:由题图可得,甲、乙两人五次测试的成绩分别为
甲:10,13,12,14,16;
乙:13,14,12,12,14.
=(10+13+12+14+16)=13,
=(13+14+12+12+14)=13,
=×[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
=×[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
(2)根据图形和(1)中计算结果,对两人的训练成绩作出评价.
解:>可知乙的成绩较稳定.
从题图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
|思|维|建|模|
数据分析的要点
(1)要正确处理此类问题,要抓住问题中的关键词语,全方位地进行必要的计算、分析,而不能习惯性地仅从样本方差的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析.
(2)在进行数据分析时,不同的标准没有对和错的问题,也不存在唯一解的问题,而是根据需要来选择“好”的决策,至于决策的好坏,是根据提出的标准而定的.
针对训练
3.在一次科技知识竞赛中,某学校的两组学生的成绩如下表:
分数 50 60 70 80 90 100
人 数 甲组 2 5 10 13 14 6
乙组 4 4 16 2 12 12
请根据你所学过的统计知识,判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.
解:甲组成绩的众数为90,乙组成绩的众数为70,从成绩的众数比较看,甲组成绩好些.
解:(1)甲组成绩的众数为90,乙组成绩的众数为70,从成绩的众数比较看,甲组成绩好些.
(2)=(50×2+60×5+70×10+80×13+90×14+100×6)
=×4 000=80,
=(50×4+60×4+70×16+80×2+90×12+100×12)
=×4 000=80.
=[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×
(80-80)2+14×(90-80)2+6×(100-80)2]=172,
=[4×(50-80)2+4×(60-80)2+16×(70-80)2+2×
(80-80)2+12×(90-80)2+12×(100-80)2]=256.
∵=,<,∴甲组成绩较乙组成绩稳定,故甲组好些.
(3)甲、乙两组成绩的中位数、平均数都是80分.其中,甲组成绩在80分以上(包括80分)的有33人,乙组成绩在80分以上(包括80分)的有26人.从这一角度看,甲组的成绩较好.
(4)从成绩统计表看,甲组成绩大于等于90分的有20人,乙组成绩大于等于90分的有24人,所以乙组成绩集中在高分段的人数多.同时,乙组得满分的人数比甲组得满分的人数多6人.从这一角度看,乙组的成绩较好.
课时跟踪检测
1
3
4
5
6
7
8
9
10
11
12
13
14
2
A级——达标评价
1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
解析:标准差能反映一组数据的稳定程度.故选B.
√
1
5
6
7
8
9
10
11
12
13
14
2
3
4
2.某高三学生在连续五次月考中的数学成绩(单位:分)为90,90,93,94,
93,则该学生在这五次月考中数学成绩数据的平均数和方差分别为 ( )
A.92,2.8 B.92,2
C.93,2 D.93,2.8
解析:该学生在这五次月考中数学成绩数据的平均数为=×(90+90+93+94+93)=92,
方差为s2=×[(90-92)2+(90-92)2+(93-92)2+(94-92)2+(93-92)2]=2.8.故选A.
√
1
5
6
7
8
9
10
11
12
13
14
3
4
2
3.(多选)甲、乙两班举行电脑汉字录入比赛,参赛学生每分钟录入汉字的个数经统计计算后填入下表:
班级 参加人数 中位数 方差 平均数
甲 55 149 191 135
乙 55 151 110 135
某同学根据表中数据分析得出的结论正确的是 ( )
A.甲、乙两班学生成绩的平均数相同
B.甲班的成绩波动比乙班的成绩波动大
C.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150为优秀)
D.甲班成绩的众数小于乙班成绩的众数
√
√
√
1
5
6
7
8
9
10
11
12
13
14
3
4
2
解析:甲、乙两班学生成绩的平均数都是135,故两班成绩的平均数相同,所以A正确;
=191>110=,所以甲班成绩不如乙班稳定,即甲班的成绩波动较大,所以B正确;
甲、乙两班人数相同,但甲班的中位数为149,乙班的中位数为151,从而易知乙班每分钟输入汉字数不少于150个的人数要多于甲班,所以C正确;
由题表看不出两班学生成绩的众数,所以D错误.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
4.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是 ( )
A.57.2,3.6 B.57.2,56.4
C.62.8,63.6 D.62.8,3.6
解析:每一个数据都加上60,所得新数据的平均数增加60,而方差保持不变.
√
1
5
6
7
8
9
10
11
12
13
14
3
4
2
5.在高一期中考试中,甲、乙两个班的数学成绩统计如下表:
班级 人数 平均分数 方差
甲 20 2
乙 30 3
其中=,则两个班数学成绩的方差为( )
A.3 B.2
C.2.6 D.2.5
√
1
5
6
7
8
9
10
11
12
13
14
3
4
2
解析:由题意可知两个班的数学成绩平均数为==,则两个班数学成绩的方差为s2=×[2+(-)2]+×[3+(-)2]=×
2+×3=2.6.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
6.国家射击队要从甲、乙、丙、丁四名队员中选出一名选手去参加射击比赛,四人的平均成绩和方差如下表:
甲 乙 丙 丁
8.5 8.8 8.8 8
方差s2 3.5 3.5 2.1 8.7
则应派 参赛最为合适.
解析:由题表可知,丙的平均成绩较高,且发挥比较稳定,应派丙去参赛最合适.
丙
1
5
6
7
8
9
10
11
12
13
14
3
4
2
7.已知总体的各个个体的值由小到大依次为2,3,3,7,a,b,12,13.7,
18.3,21,且总体的中位数为10,若要使该总体的方差最小,则ab= .
解析:由题意得a+b=10×2=20,要使该总体的方差最小,方差化简后即满足(a-10)2+(b-10)2最小,故a=b=10,ab=100.
100
1
5
6
7
8
9
10
11
12
13
14
3
4
2
8.高三学生李丽在一年的五次数学模拟考试中的成绩(单位:分)为x,y,105,
109,110.已知该同学五次数学成绩数据的平均数为108,方差为35.2,则|x-y|的值为 .
解析:由题意得,(x+y+105+109+110)=108, ①
[(x-108)2+(y-108)2+9+1+4]=35.2, ②
由①②解得或
所以|x-y|=18.
18
1
5
6
7
8
9
10
11
12
13
14
3
4
2
9.(8分)某超市从一家食品有限公司购进一批茶叶,每罐茶叶的标准质量是125 g,为了解该批茶叶的质量情况,从中随机抽取20罐,称得各罐质量(单位:g)如下:
124.9,124.7,126.2,124.9,124.2,124.9,123.7,121.4,126.4,127.7,121.9,124.4,125.2,123.7,122.7,124.2,126.2,125.2,122.2,125.4.
求:20罐茶叶的平均质量和标准差s.(精确到0.01)
1
5
6
7
8
9
10
11
12
13
14
3
4
2
解:=×(124.9+124.7+126.2+124.9+…+125.2+122.2+125.4)=≈124.51,
标准差为s=
=≈1.55.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
10.(10分)某教育集团为了办好人民满意的教育,每年底都随机邀请8名学生家长代表对集团内甲、乙两所学校进行人民满意度的民主测评(满意度最高分120分,最低分0分,分数越高说明人民满意度越高,分数越低说明人民满意度越低).去年测评的结果(单位:分)如下
甲校:96,112,97,108,100,103,86,98;
乙校:108,101,94,105,96,93,97,106.
(1)分别计算甲、乙两所学校去年人民满意度测评数据的平均数、中位数;
1
5
6
7
8
9
10
11
12
13
14
3
4
2
解:甲学校人民满意度的平均数为=(96+112+97+108+100+103+86+98)=100,
甲校:86,96,97,98,100,103,108,112,
甲学校人民满意度的中位数为=99;
乙学校人民满意度的平均数为=(108+101+94+105+96+93+97+106)=100,
乙校:93,94,96,97,101,105,106,108,
乙学校人民满意度的中位数为=99.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
(2)分别计算甲、乙两所学校去年人民满意度测评数据的方差.
解:甲学校人民满意度的方差为=(42+122+32+82+02+32+142+22)=55.25,
乙学校人民满意度的方差为=(82+12+62+52+42+72+32+62)=29.5.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
B级——重点培优
11.(多选)某学校共有学生2 000人,其中高一800人,高二、高三各600人,学校对学生在暑假中每天的读书时间做了调查统计,全体学生每天的读书时间的平均数为= 3小时,方差为s2= 2.003,其中高一学生、高二学生每天读书时间的平均数分别为=2.6,=3.2,又已知三个年级学生每天读书时间的方差分别为=1,=2,=3,则高三学生每天读书时间的平均数可能是( )
A.3.2 B.3.3 C.2.7 D.4.5
√
√
1
5
6
7
8
9
10
11
12
13
14
3
4
2
解析:由题意可得2.003=[1+(3-2.6)2]+[2+(3-3.2)2]+[3+
(3-)2],解得=3.3或2.7.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
12.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为和,样本标准差分别为sA和sB,则( )
A.>,sA>sB B.<,sA>sB
C.>,sA√
1
5
6
7
8
9
10
11
12
13
14
3
4
2
解析:由题图知,A组的6个数分别为2.5,10,5,7.5,2.5,10;B组的6个数分别为15,10,12.5,10,12.5,10,所以=×(2.5+10+5+7.5+2.5+10)=,
=×(15+10+12.5+10+12.5+10)=.显然<.
sA=≈3.15,
sB=≈1.86,显然sA>sB.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
13.(多选)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则 ( )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
√
√
1
5
6
7
8
9
10
11
12
13
14
3
4
2
解析:取x1=1,x2=x3=x4=x5=2,x6=9,则x2,x3,x4,x5的平均数等于2,标准差为0,x1,x2,…,x6的平均数等于3,标准差为,故A、C均不正确;
根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x2,x3,x4,x5的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x1,x2,…,x6的中位数相等,故B正确;
根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D正确.
故选BD.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
14.(14分)我国是世界上严重缺水的国家之一,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100户居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
1
5
6
7
8
9
10
11
12
13
14
3
4
2
解:由频率分布直方图可知,月均用水量在[0,0.5)内的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),
[4,4.5]内的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.
由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=2a×0.5,解得a=0.30.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
(2)用每组区间的中点作为每组用水量的平均值,这9组居民每人的月均用水量前4组的方差都为0.3,后5组的方差都为0.4,求这100户居民月均用水量的方差.
解:由题意可知,这9组月均用水量的平均数依次是=0.25,=0.75,
=1.25,=1.75,=2.25,=2.75,=3.25,=3.75,=4.25,
这100户居民的月均用水量为=0.04×0.25+0.08×0.75+0.15×1.25+
0.21×1.75+0.25×2.25+0.15×2.75+0.06×3.25+0.04×3.75+0.02×
4.25=2.03,
1
5
6
7
8
9
10
11
12
13
14
3
4
2
则这100户居民月均用水量的方差为
s2=0.04×[0.3+(0.25-2.03)2]+0.08×[0.3+(0.75-2.03)2]+0.15×
[0.3+(1.25-2.03)2]+0.21×[0.3+(1.75-2.03)2]+0.25×[0.4+(2.25-2.03)2]+0.15×[0.4+(2.75-2.03)2]+0.06×[0.4+(3.25-2.03)2]+
0.04×[0.4+(3.75-2.03)2]+0.02×[0.4+(4.25-2.03)2]=1.113 6.课时跟踪检测(五十三) 用频率分布直方图估计总体分布
(满分60分,选填小题每题5分)
1.本学期王老师任教两个平行班高三A班、高三B班,两个班都是50个学生,如图反映的是两个班在本学期5次数学测试中的班级平均分对比,根据图表,不正确的结论是 ( )
A.A班的数学成绩平均水平好于B班
B.B班的数学成绩没有A班稳定
C.下次考试B班的数学平均分要高于A班
D.在第1次考试中,A,B两个班的总平均分为98
2.(多选)某汽车制造厂分别从A,B两类轮胎中各随机抽取了6个进行测试,下面列出了每一个轮胎可使用的最远路程(单位:103 km).
A类轮胎:94,96,99,99,105,107;
B类轮胎:95,95,98,99,104,109.
根据以上数据估计这两类轮胎的总体情况,下列说法正确的是 ( )
A.A类轮胎行驶的最远路程的众数大于B类轮胎行驶的最远路程的众数
B.A类轮胎行驶的最远路程的极差小于B类轮胎行驶的最远路程的极差
C.A类轮胎行驶的最远路程的平均数大于B类轮胎行驶的最远路程的平均数
D.A类轮胎的性能更加稳定
3.(多选)为响应自己城市倡导的低碳出行,小李上班可以选择公交车、自行车两种交通工具,他分别记录了100次坐公交车和骑车所用时间(单位:分钟),得到下列两个频率分布直方图,基于以上统计信息,则 ( )
A.骑车时间的中位数的估计值是22分钟
B.坐公交车时间的40%分位数的估计值是19分钟
C.坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值
D.坐公交车时间的方差的估计值小于骑车时间的方差的估计值
4.某公司10位员工的月工资(单位:元)为x1,x2,x3,…,x10,其平均数和方差分别为和s2,若下月起每位员工的月工资增加100元,则这10名员工下月工资的平均数和方差分别为 .
5.甲、乙两位同学5次考试的数学成绩(单位:分),统计结果如表:
学生 第一次 第二次 第三次 第四次 第五次
甲 77 81 83 80 79
乙 89 90 92 91 88
则成绩较为稳定的那位同学成绩的方差为 .
6.(8分)随着电子商务的发展,人们的购物习惯也在改变,几乎所有的需求都可以通过网络购物来解决,同时顾客的评价也成为电子商铺的“生命线”.某电商平台从其旗下的所有电商中随机抽取了100个电子商铺,对电商的顾客评价,包括商品符合度、物流服务、服务态度、快递包装等方面进行调查,并把调查结果转化为顾客的评价指数x,得到了如下的频数分布表:
评价 指数x [0,20) [20,40) [40,60) [60,80) [80,100]
频数 10 10 20 40 20
(1)画出这100个电子商铺顾客评价指数的频率分布直方图;
(2)求该电商平台旗下的所有电子商铺的顾客评价指数的平均数与标准差的估计值(同一组中的数据以该组区间的中点值为代表).(精确到0.1,≈12.04)
7.(12分)随着老年人消费需求从“生存型”向“发展型”转变.消费层次不断提升,“银发经济”成为社会热门话题之一,被各企业持续关注.某企业为了解该地老年人消费能力情况,对该地年龄在[60,80)的老年人的年收入按年龄[60,70),[70,80)分成两组进行分层抽样调查,已知抽取了年龄在[60,70)的老年人500人.年龄在[70,80)的老年人300人.现作出年龄在[60,70)的老年人年收入的频率分布直方图(如下图所示).
(1)根据频率分布直方图,估计该地年龄在[60,70)的老年人年收入的平均数及第95百分位数;
(2)已知年龄在[60,70)的老年人年收入的方差为3,年龄在[70,80)的老年人年收入的平均数和方差分别为3.75和1.4,试估计年龄在[60,80)的老年人年收入的方差.
8.(15分)已知某工厂一区生产车间与二区生产车间均生产某种型号的零件,这两个生产车间生产的该种型号的零件尺寸的频率分布直方图如图所示(每组区间均为左开右闭).
尺寸大于M的零件用于大型机器中,尺寸小于或等于M的零件用于小型机器中.
(1)若M=60,试分别估计该工厂一区生产车间生产的500个该种型号的零件和二区生产车间生产的500个该种型号的零件用于大型机器中的零件个数.
(2)若M∈(60,70],现有足够多的来自一区生产车间与二区生产车间的零件,分别用于大型机器、小型机器各5 000台的生产,每台机器仅使用一个该种型号的零件.
方案一:直接将一区生产车间生产的零件用于大型机器中,其中用了尺寸小于或等于M的零件的大型机器每台会使得工厂损失200元;直接将二区生产车间生产的零件用于小型机器中,其中用了尺寸大于M的零件的小型机器每台会使得工厂损失100元.
方案二:重新测量一区生产车间与二区生产车间生产的零件尺寸,并正确匹配型号,重新测量的总费用为35万元.
请写出采用方案一,工厂损失费用的估计值H(M)(单位:万元)的表达式,并从工厂损失的角度考虑,选择合理的方案.
课时跟踪检测(五十三)
1.选C A班的5次数学测试平均分分别为101,98,101,100,105,5次成绩的平均分1=(101+98+101+100+105)=101,5次成绩的方差s=[(101-101)2+(98-101)2+(101-101)2+(100-101)2+(105-101)2]=5.2.B班的5次数学测试平均分分别为95,100,96,105,100,5次成绩的平均分为2=(95+100+96+105+100)=99.2,5次成绩的方差s=[(95-99.2)2+(100-99.2)2+(96-99.2)2+(105-99.2)2+(100-99.2)2]=12.56,所以A班的数学平均水平好于B班,A正确;由于s2.选ABD A类轮胎行驶的最远路程的众数为99,B类轮胎行驶的最远路程的众数为95,A正确;A类轮胎行驶的最远路程的极差为107-94=13,B类轮胎行驶的最远路程的极差为109-95=14,B正确;A类轮胎行驶的最远路程的平均数为100+=100,B类轮胎行驶的最远路程的平均数为100+=100,C错误;A类轮胎行驶的最远路程的方差为[(94-100)2+(96-100)2+(99-100)2×2+(105-100)2+(107-100)2]=,B类轮胎行驶的最远路程的方差为[(95-100)2×2+(98-100)2+(99-100)2+(104-100)2+(109-100)2]=>,故A类轮胎的性能更加稳定,D正确.
3.选BC 设骑车时间的中位数为a,则0.10×2+0.20(a-20)=0.50,解得a=21.5,故骑车时间的中位数的估计值是21.5分钟,A错误;设坐公交车时间的40%分位数为b,则0.025×2+0.050×2+0.075×2+0.100×(b-18)=0.4,解得b=19,故坐公交车时间的40%分位数的估计值是19分钟,B正确;坐公交车时间的平均数为=13×0.025×2+15×0.050×2+17×0.075×2+19×0.100×2+21×0.100×2+23×0.075×2+25×0.050×2+27×0.025×2=20,骑车时间的平均数为=19×0.10×2+21×0.20×2+23×0.15×2+25×0.05×2=21.6,则<,故坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值,C正确;坐公交车时间的方差s=(13-20)2×0.025×2+(15-20)2×0.050×2+(17-20)2×0.075×2+(19-20)2×0.100×2+(21-20)2×0.100×2+(23-20)2×0.075×2+(25-20)2×0.050×2+(27-20)2×0.025×2=13,骑车时间的方差s=(19-21.6)2×0.10×2+(21-21.6)2×0.20×2+(23-21.6)2×0.15×2+(25-21.6)2×0.05×2=3.24,∵s>s,故坐公交车时间的方差的估计值大于骑车时间的方差的估计值,D错误.
4.解析:由题得=i,s2=(xi-)2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资分别为x1+100,x2+100,…,x10+100,平均数为′=(xi+100)=(i+100×10)=i+100=+100,方差为s′2=(xi+100)-(+100)]2=(xi-)2=s2.
答案:+100;s2
5.解析:由题表知,甲同学5次成绩极差为6,乙同学5次成绩的极差为4,甲同学5次成绩波动较大,乙同学的成绩较稳定,乙同学5次成绩的平均数=(89+90+92+91+88)=90,方差为s2=[(89-90)2+(90-90)2+(92-90)2+(91-90)2+(88-90)2]=2,
所以乙同学成绩的方差为2.
答案:2
6.解:(1)由题中数据可得,
评价 指数x [0,20) [20,40) [40,60) [60,80) [80,100]
频数 10 10 20 40 20
频率 0.1 0.1 0.2 0.4 0.2
频率/ 组距 0.005 0.005 0.01 0.02 0.01
所以频率分布直方图如下,
(2)由题中数据可得,=(10×10+30×10+50×20+70×40+90×20)=60,
方差为s2=[(10-60)2×10+(30-60)2×10+(50-60)2×20+(70-60)2×40+(90-60)2×20]=580.标准差s==2≈24.08.
7.解:(1)在频率分布直方图中,该地年龄在[60,70)的老年人年收入的平均数约为
0.04×2+0.08×3+0.18×4+0.26×5+0.20×6+0.15×7+0.05×8+0.04×9=5.35,
由频率分布直方图,年收入在8.5万元以下的老年人所占比例为1-0.04×1=0.96,
年收入在7.5万元以下的老年人所占比例为1-(0.05×1+0.04×1)=0.91,
所以第95百分位数一定位于[7.5,8.5)内.
由7.5+1×=8.3,
可以估计该地年龄在[60,70)的老年人年收入的第95百分位数为8.3.
(2)设年龄在[60,70)的老年人样本的平均数记为,方差记为s,
年龄在[70,80)的老年人样本的平均数记为,方差记为s,
年龄在[60,80)的老年人样本的平均数记为,方差记为s2.
由(1)得=5.35,由题意得,s=3,=3.75,s=1.4,则=×+×=4.75,
由s2=×{500×[s+(-)2]+300×[s+(-)2]}=×{500×[3+(5.35-4.75)2]+300×[1.4+(3.75-4.75)2]}=3,即估计该地年龄在[60,80)的老年人的年收入方差为3.
8.解:(1)一区生产车间生产的零件尺寸大于60的频率为(0.020+0.024+0.020+0.020)×10=0.84,则该工厂一区生产车间生产的500个该种型号的零件用于大型机器中的零件个数为500×0.84=420;二区生产车间生产的零件尺寸大于60的频率为(0.024+0.016)×10=0.4,则该工厂二区生产车间生产的500个该种型号的零件用于大型机器中的零件个数为500×0.40=200.
(2)一区生产车间生产的零件尺寸小于或等于M的频率为0.004×10+0.012×10+0.02×(M-60)=0.02M-1.04.
二区生产车间生产的零件尺寸大于M的频率为0.024×(70-M)+0.016×10=1.84-0.024M.故H(M)=(0.02M-1.04)×0.02×5 000+(1.84-0.024M)×0.01×5 000=0.8M-12.
因为M∈(60,70],所以H(M)∈(36,44].
又因为采用方案二重新测量的总费用为35万元,所以从工厂损失的角度考虑,应选择方案二.