(共52张PPT)
9.2.4 总体离散程度的估计
第九章 统计
9.2 用样本估计总体
整体感知
[学习目标] 1.理解方差、标准差的含义,会计算方差和标准差.
2.掌握求分层随机抽样总样本的平均数及方差的方法.
[讨论交流] 预习教材P211-P215的内容,思考以下问题:
问题1.在统计学中,刻画总体离散程度的量有哪些?
问题2.方差和标准差有什么区别和联系?其作用是什么?
问题3.如何计算分层随机抽样的方差?
[自我感知] 经过认真预习,结合你对本节课的理解和认识,请画出本节课的知识逻辑体系.
探究建构
探究1 方差、标准差
有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
探究问题1 计算甲、乙两人在本次射击中的平均数、中位数、众数,你能发现两名运动员的差异吗?
[提示] 有差异.两人成绩的频率分布条形图,如下:
直观上看,还是有差异的.甲成绩比较分散,乙成绩相对集中.即甲的成绩波动幅度较大,而乙的成绩比较稳定.可见,他们的射击成绩是存在差异的.
探究问题2 这两名运动员的水平真的没有差异吗?你能借助这两人成绩的频率分布条形图,来说明其水平的差异在哪里吗?
探究问题3 如何度量这两名运动员的水平差异呢?
[提示] 可以利用极差进行度量.如甲命中环数的极差=10-4=6,乙命中环数的极差=9-5=4.极差在一定程度上表明了样本数据的离散程度,但由于极差只使用了数据中最大、最小两个值的信息,所含的信息量很少.也就是说,极差度量出的差异误差较大.
探究问题4 你还能想出其他刻画数据离散程度的办法吗?
[提示] 如果射击的成绩很稳定,那么大多数的射击成绩离平均成绩不会太远;相反,如果射击的成绩波动幅度很大,那么大多数的射击成绩离平均成绩会比较远.因此,我们可以通过这两组射击成绩与它们的平均成绩的“平均距离”来度量成绩的波动幅度.
探究问题5 如何定义“平均距离”?
4.标准差的意义
标准差刻画了数据的 或 ,标准差越大,数据的离散程度越 ;标准差越小,数据的离散程度越 .
离散程度
波动幅度
大
小
【教用·微提醒】 对方差与标准差概念的理解
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
(2)标准差、方差的取值范围:[0,+∞).
标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.
(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.
[典例讲评] 1.(源自北师大版教材)为了解A,B两种轮胎的性能,某汽车制造厂分别从这两种轮胎中随机抽取了8个进行测试,下面列出了每一个轮胎行驶的最远里程(单位:103km):
轮胎A:96,112,97,108,100,103,86,98;
轮胎B:108,101,94,105,96,93,97,106.
(1)分别计算A,B两种轮胎行驶的最远里程的平均数和中位数;
(2)分别计算A,B两种轮胎行驶的最远里程的极差和标准差;
(3)根据以上数据,你认为哪种轮胎性能更加稳定?
(3)由于A和B的最远行驶里程的平均数相同,而B轮胎行驶的最远里程的极差和标准差较小,所以B轮胎性能更加稳定.
反思领悟 在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度.在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,离散程度越小,数据越集中,越稳定.
[学以致用] 1.某班20位女同学平均分为甲、乙两组,她们的劳动技术课考试成绩(单位:分)如下:
甲组:60,90,85,75,65,70,80,90,95,80;
乙组:85,95,75,70,85,80,85,65,90,85.
(1)试分别计算两组数据的极差、方差;
(2)哪一组的成绩较稳定?
√
0.9
[学以致用] 2.若x1,x2,…,xn的平均数是10,方差是100,则2x1-1,2x2-1,…,2xn-1的平均数和方差分别是( )
A.40,199 B.19,199
C.19,200 D.19,400
√
【链接·教材例题】
例6 在对树人中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62.你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差作出估计吗?
[典例讲评] 3.某校为了解该校高三年级学生的物理成绩,从某次高三年级物理测试中随机抽取12名男生和8名女生的测试试卷,记录其物理成绩(单位:分),得到如下数据:
12名男生的物理成绩分别为72,68,72,76,80,76,72,80,88,68,72,76;
8名女生的物理成绩分别为66,76,68,68,66,68,80,68.
[学以致用] 3.(多选)某分层随机抽样中,有关数据为:第一层样本量为45,平均数为4,方差为2;第二层样本量为35,平均数为8,方差为1;第三层样本量为10,平均数为6,方差为3.则下列叙述正确的是(结果保留两位小数)( )
A.第1,2层所有数据的均值为5.75
B.第1,2层所有数据的方差约为1.50
C.第1,2,3层所有数据的均值约为7.68
D.第1,2,3层所有数据的方差约为5.23
√
√
【教用·备选题】 甲、乙两支田径队体检结果为:甲队体重的平均数为60 kg,方差为200,乙队体重的平均数为70 kg,方差为300,又已知甲、乙两队的队员人数之比为1∶4,求甲、乙两队全部队员的平均体重和方差.
2
4
3
题号
1
应用迁移
1.下列数字特征不能反映样本数据的离散程度、波动情况的是( )
A.极差 B.平均数
C.方差 D.标准差
√
B [平均数是反映数据集中趋势的一项指标,不能反映样本数据的离散程度大小.]
2
3
题号
1
4
2.若一组数据a1,a2,a3的平均数为4,方差为3,那么数据a1+2,a2+2,a3+2的平均数和方差分别是( )
A.4,3 B.6,3 C.3,4 D.6,5
√
B [若一组数据a1,a2,a3的平均数为4,方差为3,那么数据a1+2,a2+2,a3+2的平均数和方差分别是6,3.故选B.]
2
3
题号
4
1
3.(多选)某学校共有学生1 400人,其中男生800人,女生600人,学校为了了解学生参加知识竞赛的考试成绩,采用分层随机抽样的方法从全校学生中抽取70人,其中男生的平均成绩为77分,方差为123,女生的平均成绩为70分,方差为130,则下列说法正确的是( )
A.从男生中抽取40人
B.抽取的70人的平均成绩为74分
C.抽取的70人成绩的方差为138
D.估计全体学生中每个男生的竞赛成绩均比每个女生的竞赛成绩多7分
√
√
√
2
3
题号
4
1
2
4
3
题号
1
4.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为________.
2
1.知识链:(1)方差、极差的计算与应用.
(2)分层随机抽样的方差.
2.方法链:数据统计、数据分析.
3.警示牌:注意不要混淆方差、标准差.
回顾本节知识,自主完成以下问题:
1.描述数据的离散程度的量有哪些?分别如何描述的?
[提示] 数据的离散程度可以通过极差、方差或标准差来描述.
(1)极差是数据的最大值与最小值的差.它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.
(2)方差反映了一组数据围绕平均数波动的大小.为了得到以样本数据的单位表示的波动幅度通常用标准差.在平均数相同的情况下,方差(或标准差)越大,离散程度越大,数据波动性越大,稳定性差;方差(或标准差)越小,数据越集中、越稳定.
2.如何计算一组数据的方差或标准差?
3.如何计算分层随机抽样的方差?9.2.4 总体离散程度的估计
[学习目标] 1.理解方差、标准差的含义,会计算方差和标准差.
2.掌握求分层随机抽样总样本的平均数及方差的方法.
[讨论交流] 预习教材P211-P215的内容,思考以下问题:
问题1.在统计学中,刻画总体离散程度的量有哪些?
问题2.方差和标准差有什么区别和联系?其作用是什么?
问题3.如何计算分层随机抽样的方差?
[自我感知] 经过认真预习,结合你对本节课的理解和认识,请画出本节课的知识逻辑体系.
探究1 方差、标准差
有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
探究问题1 计算甲、乙两人在本次射击中的平均数、中位数、众数,你能发现两名运动员的差异吗?
[提示] 因为=×(7+8+7+9+5+4+9+10+7+4)=7,=×(9+5+7+8+7+6+8+6+7+7)=7,且甲、乙两名运动员射击成绩的中位数、众数也都是7.从这三个数据来看,两名运动员没有差别.
探究问题2 这两名运动员的水平真的没有差异吗?你能借助这两人成绩的频率分布条形图,来说明其水平的差异在哪里吗?
[提示] 有差异.两人成绩的频率分布条形图,如下:
直观上看,还是有差异的.甲成绩比较分散,乙成绩相对集中.即甲的成绩波动幅度较大,而乙的成绩比较稳定.可见,他们的射击成绩是存在差异的.
探究问题3 如何度量这两名运动员的水平差异呢?
[提示] 可以利用极差进行度量.如甲命中环数的极差=10-4=6,乙命中环数的极差=9-5=4.极差在一定程度上表明了样本数据的离散程度,但由于极差只使用了数据中最大、最小两个值的信息,所含的信息量很少.也就是说,极差度量出的差异误差较大.
探究问题4 你还能想出其他刻画数据离散程度的办法吗?
[提示] 如果射击的成绩很稳定,那么大多数的射击成绩离平均成绩不会太远;相反,如果射击的成绩波动幅度很大,那么大多数的射击成绩离平均成绩会比较远.因此,我们可以通过这两组射击成绩与它们的平均成绩的“平均距离”来度量成绩的波动幅度.
探究问题5 如何定义“平均距离”?
[提示] 假设一组数据是x1,x2,…,xn,用表示这组数据的平均数.我们用每个数据与平均数的差的绝对值作为“距离”,即|xi-|(i=1,2,…,n)作为xi到的“距离”.
[新知生成]
1.一组数据x1,x2,…,xn的方差和标准差
数据x1,x2,…,xn的方差为
2.总体方差和标准差
(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称S2=
(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=
3.样本方差和标准差
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称
4.标准差的意义
标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
【教用·微提醒】 对方差与标准差概念的理解
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
(2)标准差、方差的取值范围:[0,+∞).
标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.
(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.
[典例讲评] 1.(源自北师大版教材)为了解A,B两种轮胎的性能,某汽车制造厂分别从这两种轮胎中随机抽取了8个进行测试,下面列出了每一个轮胎行驶的最远里程(单位:103km):
轮胎A:96,112,97,108,100,103,86,98;
轮胎B:108,101,94,105,96,93,97,106.
(1)分别计算A,B两种轮胎行驶的最远里程的平均数和中位数;
(2)分别计算A,B两种轮胎行驶的最远里程的极差和标准差;
(3)根据以上数据,你认为哪种轮胎性能更加稳定?
[解] (1)A轮胎行驶的最远里程的平均数为:=100,
中位数为:=99;
B轮胎行驶的最远里程的平均数为:=100,
中位数为:=99.
(2)A轮胎行驶的最远里程的极差为:112-86=26,
标准差为:s=
=≈7.4;
B轮胎行驶的最远里程的极差为:108-93=15,
标准差为:s=
=≈5.4.
(3)由于A和B的最远行驶里程的平均数相同,而B轮胎行驶的最远里程的极差和标准差较小,所以B轮胎性能更加稳定.
在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度.在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,离散程度越小,数据越集中,越稳定.
[学以致用] 1.某班20位女同学平均分为甲、乙两组,她们的劳动技术课考试成绩(单位:分)如下:
甲组:60,90,85,75,65,70,80,90,95,80;
乙组:85,95,75,70,85,80,85,65,90,85.
(1)试分别计算两组数据的极差、方差;
(2)哪一组的成绩较稳定?
[解] (1)甲组:最高分为95,最低分为60,极差为95-60=35,
平均数为=×(60+90+85+75+65+70+80+90+95+80)=79,
方差为=×[(60-79)2+(90-79)2+(85-79)2+(75-79)2+(65-79)2+(70-79)2+(80-79)2+(90-79)2+(95-79)2+(80-79)2]=119.
乙组:最高分为95,最低分为65,极差为95-65=30,
平均数为=×(85+95+75+70+85+80+85+65+90+85)=81.5,
方差为=×[(85-81.5)2+(95-81.5)2+(75-81.5)2+(70-81.5)2+(85-81.5)2+(80-81.5)2+(85-81.5)2+(65-81.5)2+(90-81.5)2+(85-81.5)2]=75.25.
(2)由于乙组的方差小于甲组的方差,因此乙组的成绩较稳定.
从(1)中得到的极差也可看出乙组的成绩比较稳定.
探究2 方差和标准差的性质与计算
[典例讲评] 2.(1)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为s2,则( )
A.=4,s2<2 B.=4,s2>2
C.>4,s2<2 D.>4,s2>2
(2)若40个数据的平方和是56,平均数是,则这组数据的方差是________,标准差是________.
(1)A (2)0.9 [(1)因为某7个数的平均数为4,所以这7个数的和为4×7=28,因为加入一个新数据4,所以==4.又因为这7个数的方差为2,且加入一个新数据4,所以这8个数的方差s2==<2.故选A.
(2)由方差公式
s2=,
得s2==.
由已知得n==56,=.
∴s2==0.9,s=.]
方差和标准差的计算技巧与性质
(1)方差的计算
①基本公式:s2=[(x1-)2+…+(xn-)2].
②简化计算公式: s2=-,即方差等于原数据平方的平均数减去平均数的平方.
(2)方差和标准差的性质
若把一组数据的每一个数变为原来的k倍并加上或减去常数a,则它的标准差变为原来的k倍,方差变为原来的k2倍,而与a的大小无关.
[学以致用] 2.若x1,x2,…,xn的平均数是10,方差是100,则2x1-1,2x2-1,…,2xn-1的平均数和方差分别是( )
A.40,199 B.19,199
C.19,200 D.19,400
D [由已知得=10,
则==2×10-1=19;
由已知得s2=[(x1-10)2+(x2-10)2+…+(xn-10)2]=100,
而2x1-1,2x2-1,…,2xn-1的方差为[(2x1-1-19)2+(2x2-1-19)2+…+(2xn-1-19)2]
=[(2x1-20)2+(2x2-20)2+…+(2xn-20)2]
=[(x1-10)2+(x2-10)2+…+(xn-10)2]
=4s2=400.
故选D.]
探究3 分层随机抽样的方差
[新知生成]
设样本容量为n,平均数为,其中两层的个体数量分别为n1,n2,两层的平均数分别为,方差分别为,则这个样本的方差为s2=+(-)2].
【链接·教材例题】
例6 在对树人中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62.你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差作出估计吗?
[解] 把男生样本记为x1,x2,…,x23,其平均数记为,方差记为;把女生样本记为y1,y2,…,y27,其平均数记为,方差记为s2.
根据方差的定义,总样本方差为
同理可得
因此,
=+()2]}.①
由=160.6,根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系,可得总样本平均数为
===165.2.
把已知的男生、女生样本平均数和方差的取值代入①,可得
s2={23×[12.59+(170.6-165.2)2]+27×[38.62+(160.6-165.2)2]}
=51.486 2.
我们可以计算出总样本的方差为51.486 2,并据此估计高一年级学生身高的总体方差为51.486 2.
[典例讲评] 3.某校为了解该校高三年级学生的物理成绩,从某次高三年级物理测试中随机抽取12名男生和8名女生的测试试卷,记录其物理成绩(单位:分),得到如下数据:
12名男生的物理成绩分别为72,68,72,76,80,76,72,80,88,68,72,76;
8名女生的物理成绩分别为66,76,68,68,66,68,80,68.
(1)求这12名男生物理成绩的平均分与方差;
(2)经计算得这8名女生物理成绩的平均分=70,方差=23,求这20名学生物理成绩的平均分与方差.
附:分层随机抽样的方差公式:
[解] (1)这12名男生物理成绩的平均分为
==75,
方差为=
=.
(2)这20名学生物理成绩的平均分为=+==73,
方差为s2=+()2]
==33.
设样本中不同层的平均数分别为,…,,方差分别为,相应的权重分别为w1,w2,…,wn,则这个样本的方差为
[学以致用] 3.(多选)某分层随机抽样中,有关数据为:第一层样本量为45,平均数为4,方差为2;第二层样本量为35,平均数为8,方差为1;第三层样本量为10,平均数为6,方差为3.则下列叙述正确的是(结果保留两位小数)( )
A.第1,2层所有数据的均值为5.75
B.第1,2层所有数据的方差约为1.50
C.第1,2,3层所有数据的均值约为7.68
D.第1,2,3层所有数据的方差约为5.23
AD [A选项,第1,2层所有数据的均值为×4+×8=5.75,A选项正确;
B选项,第1,2层所有数据的方差为:
[2+(5.75-4)2]+[1+(5.75-8)2]=5.5,
所以B选项错误;
C选项,第1,2,3层所有数据的均值为:
×4+×8+×6=≈5.78,
所以C选项错误;
D选项,第1,2,3层所有数据的方差为:
≈5.23,所以D选项正确.
故选AD.]
【教用·备选题】 甲、乙两支田径队体检结果为:甲队体重的平均数为60 kg,方差为200,乙队体重的平均数为70 kg,方差为300,又已知甲、乙两队的队员人数之比为1∶4,求甲、乙两队全部队员的平均体重和方差.
[解] 由题意可知=60,甲队队员在所有队员中所占权重为==70,乙队队员在所有队员中所占权重为=,
则甲、乙两队全部队员的平均体重为=×60+×70=68(kg),甲、乙两队全部队员的体重的方差为
s2=[200+(60-68)2]+[300+(70-68)2]=296.
1.下列数字特征不能反映样本数据的离散程度、波动情况的是( )
A.极差 B.平均数
C.方差 D.标准差
B [平均数是反映数据集中趋势的一项指标,不能反映样本数据的离散程度大小.]
2.若一组数据a1,a2,a3的平均数为4,方差为3,那么数据a1+2,a2+2,a3+2的平均数和方差分别是( )
A.4,3 B.6,3 C.3,4 D.6,5
B [若一组数据a1,a2,a3的平均数为4,方差为3,那么数据a1+2,a2+2,a3+2的平均数和方差分别是6,3.故选B.]
3.(多选)某学校共有学生1 400人,其中男生800人,女生600人,学校为了了解学生参加知识竞赛的考试成绩,采用分层随机抽样的方法从全校学生中抽取70人,其中男生的平均成绩为77分,方差为123,女生的平均成绩为70分,方差为130,则下列说法正确的是( )
A.从男生中抽取40人
B.抽取的70人的平均成绩为74分
C.抽取的70人成绩的方差为138
D.估计全体学生中每个男生的竞赛成绩均比每个女生的竞赛成绩多7分
ABC [对于A项,由分层随机抽样的概念和计算方法,可得男生抽取人数为70×=40,所以A正确;
对于B项,根据平均数的计算方法,70人的平均成绩为=(40×77+30×70)÷70=74,所以B正确;
对于C项,由分层随机抽样的方差的计算公式,
可得s2=[123+(77-74)2]+[130+(70-74)2]=138,所以C正确;
对于D项,由全校学生中抽取70人,其中男生的平均成绩为77分,女生的平均成绩为70分,
可得全体学生中男生的竞赛成绩平均分比女生竞赛成绩的平均分多7分,而不是全体学生中每个男生的竞赛成绩均比每个女生的竞赛成绩多7分,所以D错误.
故选ABC.]
4.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为________.
2 [由题意知(a+0+1+2+3)=1,解得a=-1.
∴样本方差为s2=[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.]
1.知识链:(1)方差、极差的计算与应用.
(2)分层随机抽样的方差.
2.方法链:数据统计、数据分析.
3.警示牌:注意不要混淆方差、标准差.
回顾本节知识,自主完成以下问题:
1.描述数据的离散程度的量有哪些?分别如何描述的?
[提示] 数据的离散程度可以通过极差、方差或标准差来描述.
(1)极差是数据的最大值与最小值的差.它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.
(2)方差反映了一组数据围绕平均数波动的大小.为了得到以样本数据的单位表示的波动幅度通常用标准差.在平均数相同的情况下,方差(或标准差)越大,离散程度越大,数据波动性越大,稳定性差;方差(或标准差)越小,数据越集中、越稳定.
2.如何计算一组数据的方差或标准差?
[提示] (1)公式法:s2=[(x1-)2+…+(xn-)2]=-;
(2)性质法:若x1,x2,…,xn的方差为s2,则mx1+a,mx2+a,…,mxn+a的方差为m2s2.
3.如何计算分层随机抽样的方差?
[提示] 计算分层随机抽样的方差s2的步骤
(1)分层随机抽样中两组数据x,y的抽样比例是;
(2)总体均值为=;
(3)总体方差s2=+()2].
课时分层作业(四十三) 总体离散程度的估计
一、选择题
1.下列对一组数据的分析,错误的是( )
A.数据极差越小,样本数据分布越集中、稳定
B.数据平均数越小,样本数据分布越集中、稳定
C.数据标准差越小,样本数据分布越集中、稳定
D.数据方差越小,样本数据分布越集中、稳定
B [标准差(方差)能反映样本数据分布的集中、稳定程度,且数据的标准差(方差)越小,样本数据分布越集中、稳定,故C,D正确;平均数只能反映数据的平均水平,不能反映数据的稳定程度,故B错误;极差也可以反映样本数据分布的集中和分散情况,故A正确.故选B.]
2.甲、乙、丙、丁四名射手在选拔赛中所得的平均环数及其方差s2如表所示,则选送决赛的最佳人选应是( )
射手 甲 乙 丙 丁
7 8 8 7
s2 6.3 6.3 7 8.7
A.甲 B.乙 C.丙 D.丁
B [∵=>=,且=,故应选择乙进入决赛.]
3.样本量为9的四组数据,它们的平均数都是5,条形图如图所示,则标准差最大的一组是( )
A.第一组 B.第二组
C.第三组 D.第四组
D [第一组中,样本数据都为5,数据没有波动,标准差为0;第二组中,样本数据为4,4,4,5,5,5,6,6,6,标准差为;第三组中,样本数据为3,3,4,4,5,6,6,7,7,标准差为;第四组中,样本数据为2,2,2,2,5,8,8,8,8,标准差为2,故标准差最大的一组是第四组.也可由样本数据的离散程度判断标准差的大小,从图中可以看出第四组中的数据波动最大.故选D.]
4.在高一期中考试中,甲、乙两个班的数学成绩统计如下表:
班级 人数 平均数 方差
甲 20 2
乙 30 3
其中=,则两个班数学成绩的方差为( )
A.3 B.2 C.2.6 D.2.5
C [由题意可知两个班的数学成绩的平均数为
==,则两个班数学成绩的方差为
s2=×[2+()2]+×[3+()2]=×2+×3=2.6.]
5.(多选)在一次歌手大赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,则( )
A.所剩数据的平均值是9.4分
B.所剩数据的平均值是9.5分
C.所剩数据的方差是0.016
D.所剩数据的方差是0.04
BC [所剩数据的平均值为==9.5(分),s2=×[(9.4-9.5)2×3+(9.6-9.5)2+(9.7-9.5)2]=×(0.12×4+0.22)=0.016.]
二、填空题
6.已知样本9,10,11,x,y的平均数是10,方差是4,则xy=________.
91 [由平均数是10,得x+y=20.①
由方差是4,得x2+y2=218.②
①2-②,得2xy=182,
∴xy=91.]
7.现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的标准差是________.
2 [由题意知==200,
所以s=
===2.]
8.为了调查公司员工的健康状况,用分层随机抽样的方法抽取样本,已知所抽取的所有员工的平均体重为60 kg,标准差为60;男员工的平均体重为70 kg,标准差为50;女员工的平均体重为50 kg,标准差为60.若样本中有20名男员工,则女员工的人数为________.
200 [设男、女员工的权重分别为ω男,ω女,
由题意可知s2=ω男+()2]+ω女+()2],即ω男[502+(70-60)2]+(1-ω男)·[602+(50-60)2]=602,解得ω男=,ω女=,
因为样本中有20名男员工,所以样本中女员工的人数为200.]
三、解答题
9.甲、乙两机床同时加工直径为100 cm的零件,为了检验质量,各从中抽取6件进行测量,分别记录数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及标准差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
[解] (1)=(99+100+98+100+100+103)=100(cm).
=(99+100+102+99+100+100)=100(cm).
=[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
∴s甲=.
=[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1,∴s乙=1.
(2)两台机床所加工零件的直径的平均数相同,
又s甲>s乙,所以乙机床加工零件的质量更稳定.
10.已知总体划分为3层,通过分层随机抽样,各层抽取的样本容量分别为n1,n2,n3,样本平均数分别为,样本方差分别为,若n1∶n2∶n3=1∶2∶3,则( )
A.∶∶=1∶2∶3
B.∶∶=1∶4∶9
C.总体平均数=+2+3
D.当==时,总体方差s2=
D [对于A,B项,由于样本量与样本平均数、样本方差之间并不是成某种比例关系,所以选项A,B错误;
对于C项,设n1=k,n2=2k,n3=3k,k∈N+,
则总体平均数=
==++,所以选项C错误;
对于D项,当=====,
所以总体方差s2=+()2]}==,所以选项D正确.故选D.]
11.(多选)已知一组数据x1,x2,…,xn(x1A.新数据的平均数一定比原数据的平均数大
B.新数据的中位数一定比原数据的中位数大
C.新数据的标准差一定比原数据的标准差大
D.新数据的极差一定比原数据的极差大
CD [对于A,设x1,x2,…,xn的平均数为,即x1+x2+…+xn=n,
则新数据y1,y2,…,yn的平均数为
+1,
故+1,
当≤-1时,2+1≤,故A错误,
对于B,设x1,x2,…,xn的中位数为m,由于y=2x+1单调递增,则新数据y1,y2,…,yn的中位数为2m+1,
当m≤-1时,2m+1≤m,故B错误;
对于C,设x1,x2,…,xn的标准差为s,
则新数据的标准差为2s,
由于s>0,故2s>s,故C正确;
对于D,设x1,x2,…,xn的极差为t,由于y=2x+1单调递增,故新数据极差为2t,由于t>0,故新数据的极差比原数据的大,故D正确.
故选CD.]
12.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”,根据过去10天甲、乙、丙、丁四地新增病例数据,一定符合该标志的是( )
A.甲地:总体均值为2,总体方差为3
B.乙地:总体均值为3,中位数为4
C.丙地:总体均值为1,总体方差大于0
D.丁地:众数为2,总体方差为3
A [对于A,假设至少有一天的疑似病例超过7人,
此时方差s2≥×(8-2)2=3.6>3,这与题设矛盾,所以假设不成立,故A正确;
对于B,平均数和中位数不能限制某一天的病例不超过7人,故B错误;
对于C,总体方差大于0,不知道总体方差的具体数值,因此不能确定数据波动的大小,故C错误;
对于D,众数为2,总体方差为3,如2,2,2,2,2,3,3,3,3,8,
平均数为×(2+2+2+2+2+3+3+3+3+8)=3,
方差s2=×[5×(2-3)2+4×(3-3)2+(8-3)2]=3,
满足题意,但是其中一天新增疑似病例8人,故D错误.]
13.为了解全校学生平均每年阅读多少本书,甲同学抽取了一个容量为20的样本,并算得样本的平均数为5,方差为1;乙同学抽取了一个容量为10的样本,并算得样本的平均数为4,方差为1.已知甲、乙两同学抽取的样本合在一起组成一个容量为30的样本,则合在一起后的样本方差为________.
[依题意,合在一起后的样本平均数为=,
故合在一起后的样本方差为=.]
14.为探究某药物对小鼠的生长抑制作用,将20只小鼠均分为两组:对照组(不加药物)和实验组(加药物).测得20只小鼠体重(单位:g)如下:
对照组:20.1 20.4 20.1 20.0 20.1 20.3
20.6 20.5 20.4 20.5
实验组:19.8 20.3 20.0 20.2 19.9 19.8
20.0 20.1 20.2 19.7
对照组和实验组的小鼠体重的样本平均数分别记为和,样本方差分别记为和.
(1)求;
(2)判断该药物对小鼠的生长是否有显著的抑制作用(若,则认为该药物对小鼠的生长有显著的抑制作用,否则不认为有显著的抑制作用).
[解] (1)==20.3,
==20,
==0.04,
==0.036.
(2)依题意,=0.3=
=2=,
所以该药物对小鼠的生长没有显著的抑制作用.
15.志愿者的服务工作是马拉松成功举办的重要保障,某市新时代文明实践中心承办了志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:第一组[45,55),第二组[55,65),第三组[65,75),第四组[75,85),第五组[85,95],绘制成如图所示的频率分布直方图.已知第一、二组的频率之和为0.3,第一组和第五组的频率相同.
(1)估计这100名候选者面试成绩的平均数和第25百分位数;
(2)现从以上各组中用分层随机抽样的方法选取20人,担任本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为62和40,第四组面试者的面试成绩的平均数和方差分别为80和70,据此估计这次第二组和第四组面试者所有人面试成绩的方差.
[解] (1)由题意可知:
解得
可知每组的频率依次为:0.05,0.25,0.45,0.2,0.05,
所以平均数等于50×0.05+60×0.25+70×0.45+80×0.2+90×0.05=69.5(分).
因为0.05+0.25=0.30>0.25,
设第25百分位数为x,
则x∈[55,65),
则0.05+(x-55)×0.025=0.25,
解得x=63,
所以第25百分位数为63.
(2)设第二组、第四组的平均数与方差分别为,且两组频率之比为=,
成绩在第二组、第四组的平均数==70,
成绩在第二组、第四组的方差
s2=
=[70+(80-70)2]=,
故估计这次第二组、第四组面试者所有人面试成绩的方差是.
21世纪教育网(www.21cnjy.com)