14.4.2 用样本估计总体的离散程度参数(课件 学案 练习)高中数学苏教版(2019)必修 第二册

文档属性

名称 14.4.2 用样本估计总体的离散程度参数(课件 学案 练习)高中数学苏教版(2019)必修 第二册
格式 zip
文件大小 8.8MB
资源类型 教案
版本资源 苏教版(2019)
科目 数学
更新时间 2025-09-16 07:06:08

文档简介

(共58张PPT)
14.4 用样本估计总体
14.4.2 用样本估计总体的
离散程度参数
探究点一 方差、标准差的计算
探究点二 方差、标准差的性质
探究点三 标准差、方差的应用
探究点四 分层抽样数据的方差计算
【学习目标】
1.结合具体实例,经历用样本估计总体的离散程度参数(标准差、方
差、极差)的过程,理解离散程度参数的统计含义.
2.经历分层抽样的样本平均数和方差的推导过程,会求具体问题的样
本平均数和样本方差,并能解释它们在实际问题中的意义.
知识点一 极差、方差、标准差
1.极差
我们把一组数据的最大值与最小值的____称为极差.

2.方差
设一组样本数据,, ,,其平均数为 ,则称
_ __________________为这个样本的方差,简称__________.
样本方差
3.标准差
方差的算术平方根_ _________________为样本的标准差,简称_____
_______.
样本标准差
4.离散型方差公式
一般地,若取值为,, ,的频率分别为,, , ,则其平均
数为_ __________,其方差为__________________.
5.极差、方差、标准差都是刻画数据离散程度的度量值,标准差刻画
了数据离平均数波动的幅度大小.
【诊断分析】
1.判断正误.(正确的打“√”,错误的打“×”)
(1)标准差、方差越小,数据的离散程度越小.( )

(2)若样本数据都相等,则 .( )

(3)标准差的大小不会超过极差.( )

(4)若样本数据都相等,则表明数据没有波动幅度,数据没有离散性,
标准差为0.( )

2.样本数据2,4,6,8,10的标准差为_____.
[解析] ,则标准差为
.
知识点二 分层抽样数据的方差
一般地,如果总体分为层,第层抽取的样本为,, ,,第
层的样本量为,样本平均数为,样本方差为,,2, , ,
记,那么,所有数据的样本方差为
____________________ _ ____________________.
探究点一 方差、标准差的计算
例1(1)下面的数据是某男运动员跳高的跳跃高度(单位: ),则
这组数据的方差和标准差分别为______和_____(精确到小数点后两
位).
16.39
4.05
[解析] 根据题意,平均数
,
方差 ,
标准差 .
(2)[2024·浙江温州期末] 已知样本数据,, , 的平均数为9,
方差为12,现这组样本数据增加一个数据 ,此时新样本数据的平
均数为10,则新样本数据的方差为_____.
19.8
[解析] 由题可知, ,
可得, ,且,解得 ,
所以新样本数据的方差为
.
变式(1)[2024·邯郸期末]有三组数据 ,5,5,6,6,6,7,7,
7;,4,5,5,6,7,7,8,8; ,3,3,3,6,9,9,9,9.
设它们的方差依次为,, ,则( )
A. B.
C. D.

[解析] 数据①5,5,5,6,6,6,7,7,7的平均数和方差分别为
, ;
数据②4,4,5,5,6,7,7,8,8的平均数和方差分别为


数据 ,3,3,3,6,9,9,9,9的平均数和方差分别为
,.
所以 .故选D.
(2)[2024·南京金陵中学期末] 已知数据3,7, ,6的平均数是4,
则这组数据的标准差为( )
A. B. C. D.
[解析] 由题意得,解得 ,
则这组数据的方差为,
所以这组数据的标准差为 .故选C.

[素养小结]
标准差、方差的意义
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、
方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度
越小.标准差的大小不会超过极差.
(2)标准差、方差的取值范围是 .标准差、方差为0时,样本
中的各数据相等,说明数据没有波动幅度,数据没有离散性.
探究点二 方差、标准差的性质
例2(1) 若,,, ,的标准差为2,那么 ,
, , 的标准差为( )
A.18 B.14 C.6 D.3
[解析] 设,,, ,的方差为, ,
, ,的方差为,
,,, ,的标准差为2,,
则 ,,, ,
的标准差为 .故选C.

(2)(多选题)[2024·福州期中] 已知样本数据,, 的平均数为
2,方差为1,则下列说法正确的是( )
A.数据, 的平均数为6
B.数据,, 的方差为9
C.数据,, ,2的方差为1
D.数据,, 的平均数为5


[解析] 对于A,数据,, 的平均数为,
故A错误;
对于B,数据,, 的方差为 ,故B正确;
对于C,因为 ,
,所以数据,, ,2的平均数为,所以数据,, ,
2的方差为 ,故C错误;
对于D,由, ,
得,可得 ,
所以数据,,的平均数为,故D正确.故选 .
变式(1) 已知数据,, ,的方差为,数据 ,
, ,的方差为,则 ( )
A.1 B.2 C. D.
[解析] 因为数据,, ,的方差为,所以数据 ,
, ,的方差为,所以,则 .故选C.

(2)(多选题)有两组样本数据:,, ,;,, , ,
其中 .则这两组样本数据的( )
A.平均数相同 B.中位数相同
C.方差相同 D.极差相同


[解析] 根据题意,对于数据,, , ,假设,设其平均数为,中位数为,方差为 ,极差为,
则, ,
,.
对于数据, ,,设其平均数为,中位数为,方差为 ,极差为,因为,所以 ,


方差 ,
故这两组样本数据的方差和极差相同,平均数和中位数不同.故选 .
[素养小结]
(1)一组数据中的每一个数都加上或减去同一个常数,所得的一组新
数据的方差不变,标准差也不变.
(2)若把一组数据中的每一个数都变为原来的 倍并加上或减去常
数,则所得的一组新数据的标准差变为原来的倍,方差变为原来的
倍,而与 的大小无关.
探究点三 标准差、方差的应用
例3 甲、乙两台机床同时加工直径为 的零件,为检验质量,从中
各抽取10个零件测量其直径,所得数据如下:
甲机床:99,100,98,100,100,103,97,103,98,102;
乙机床:99,100,102,99,100,100,99,101,99,101.
(1)分别计算两组数据的平均数,及方差, ;
解: ,
.
,
.
(2)分别计算两组数据中,位于 ,
之间的数据的个数以及所占的百分比;
解:由(1)知, .
对于甲组数据, ,
有7个数据在内,占 .
对于乙组数据, ,
有9个数据在内,占 .
(3)根据(1)的结果判断哪台机床加工零件的质量更稳定.
解:两台机床所加工零件的直径的平均值相同,
又 ,所以乙机床加工零件的质量更稳定.
变式 为了监控某种零件的一条生产线的生产过程,检验员每天从该
生产线上随机抽取16个零件,并测量其尺寸(单位: ),结果如下:
10.05 10.03 10.08 10.09 10.02 10.05 10.08 10.00
10.05 10.06 10.06 10.05 10.07 10.06 10.07 9.98
(1)计算该零件抽样尺寸的极差,样本平均数和样本标准差 ;
(参考数据:,计算结果精确到 )
解:该零件抽样尺寸的极差为 ,
样本平均数
,,
样本方差

所以样本标准差 .
(2)将样本平均数作为总体平均数 的估计值,样本标准差 作为
总体标准差 的估计值,根据生产经验,在一天的抽检零件中,如果
出现了数据落在 之外的零件,则认为这条生产线在这
一天的生产过程中可能出现了异常情况,机床应检修调整,试利用
估计值判断是否需对机床进行检修.
解:由(1)得, ,
所以, ,
故 ,
因为 ,所以需对机床进行检修.
[素养小结]
在实际问题中,仅靠平均数不能完全反应问题,还要研究方差,方
差描述了数据相对平均数的离散程度.在平均数相同的情况下,方差
越大,离散程度越大,数据波动性越强,稳定性越差;方差越小,
离散程度越小,数据波动性越弱,稳定性越好.
探究点四 分层抽样数据的方差计算
例4 甲、乙两支田径队队员的体检结果为:甲队队员体重(单位: )
的平均数为60,方差为200,乙队队员体重(单位: )的平均数为70,
方差为300.已知甲、乙两队的队员人数之比为 ,求甲、乙两队全部
队员体重的平均数和方差.
解:由题可知,甲队人数占所有队员人数的, ,
乙队人数占所有队员人数的 ,
则甲、乙两队全部队员体重的平均数 ,
甲、乙两队全部队员体重的方差
.
变式 [2024·江苏南通海安高级中学高一月考] 为获得某中学高一学
生的身高(单位: )信息,采用随机抽样方法抽取了样本量为50
的样本,其中男、女生的样本量均为25,计算得到男生样本的平均
数为176,标准差为10,女生样本的平均数为166,标准差为20,则
总样本的方差为_____.
275
[解析] 记男生样本为,, ,,平均数为,方差为 ,女生样本为
,, ,,平均数为,方差为,总样本的平均数为,方差为 ,
则,, ,


则 .
[素养小结]
计算分层抽样的方差 的步骤:
(1)确定,,, ;
(2)确定 ;
(3)应用公式 ,计算
.
拓展 2023年10月22日,汉江生态城2023襄阳
马拉松在湖北省襄阳市成功举行,志愿者的
服务工作是马拉松成功举办的重要保障,襄
阳市新时代文明实践中心承办了志愿者选拔
的面试工作.现随机抽取了100名候选者的面试
成绩,并分成五组:第一组,第二组,第三组 ,
第四组,第五组 ,绘制成如图所示的频率分布直方图.已
知第一、二组的频率之和为 ,第一组和第五组的频率相同.
(1)估计这100名候选者面试成绩的平均数;
解:由题意可知
解得
可知每组的频率依次为,,,, ,
所以这100名候选者面试成绩的平均数为
.
(2)现从以上各组中用分层抽样的方法选取
20人担任本市的宣传者,若本市宣传者中第
二组面试者的面试成绩的平均数和方差分别
为62和40,第四组面试者的面试成绩的平均
数和方差分别为80和70,据此估计这次第二
组和第四组面试者所有人面试成绩的方差.
解:因为第二组和第四组的频率之比为
,所以估计这次第二组和第四组面试
者所有人面试成绩的平均数

故估计这次第二组和第四组面试者所有人面试成绩的方差
.
1.标准差与方差的统计意义
(1)标准差、方差描述了一组数据围绕平均数波动程度的大小.标准
差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散
程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.
(2)标准差的单位与原数据的单位相同,方差的单位是原数据的单位的
平方,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样
本数据的离散程度上是一样的,但在解决实际问题时,一般采用标准差.
(3)标准差(方差)的取值范围为 .若样本数据都相等,表明
数据没有波动幅度,数据没有离散性,则标准差为0.反之,标准差为0的
样本,其中的数据都相等.
2.描述数据离散程度的另一个统计量——极差
(1)一组数据的最大值与最小值的差称为极差.
(2)极差反映了一组数据变化的最大幅度,它对一组数据中的极端值
非常敏感,一般情况下,极差大,则数据较分散,数据的波动性大;极差小,
则数据相对集中,数据的波动性小.极差的计算非常简单,但极差只考虑
了两个极端值,而没有考虑中间的数据,因此很多时候极差作为数据的
离散程度的统计量可靠性较差.
(3)极差的取值范围也是 .标准差的大小不会超过极差.
3.计算标准差的步骤如下:
(1)求样本数据的平均数 ;
(2)求 ;
(3)求 ;
(4)求 ;
(5)求, 即为标准差.
1.平均数、方差、标准差的计算及应用
例1(1) 已知样本数据,,,, ,
的平均数为16,方差为9,则另一组数据,,,,, ,12的方
差为( )
A. B. C. D.7

[解析] 设数据,,,,,的平均数为,方差为 ,由题意得
,,所以, ,
则,,,,,,12的平均数为,方差为 .故选C.
(2)若一个容量为8的样本的平均数为5,方差为2,现样本中又加
入一个新数据5,此时样本容量为9,平均数为,方差为 ,则
( )
A., B.,
C., D.,
[解析] 由题意知, .故选B.

2.分层抽样中样本平均数和方差的计算
例2 从甲队60人、乙队40人中,按照分层抽样的方法共抽取10人,
进行一轮答题.相关统计情况如下:甲队答对题数的平均数为1,方差
为1;乙队答对题数的平均数为 ,方差为0.25.则这10人答对题数
的方差为( )
A.0.8 B.0.675 C.0.74 D.0.76

[解析] 从甲队60人、 乙队40人中,按照分层抽样的方法共抽取10人,
则从甲队中抽取(人),从乙队中抽取 (人),
由题意知这10人答对题数的平均数为 ,
所以这10人答对题数的方差为
.故选D.
例3 [2024·福建厦门双十中学月考]
某高校为了提升学校餐厅的服务水平,
组织4000名师生对学校餐厅满意度进
行评分调查,按照分层抽样的方法,
抽取200名师生的评分作为样本,绘
制成如图所示的频率分布直方图.
(1)求图中 的值;
解:由频率分布直方图的性质,可得
,解得
.
(2)设在样本中,学生、教师的人
数分别为, ,记
所有学生的评分为,, , ,
其平均数为,方差为 ,所有教师
的评分为,, , ,其平均数
为,方差为,总样本的平均数为 ,
方差为,若, ,求
的最小值.
解:由,可得 ,
所以 ,
.
令,则 ,可得 ,
当且仅当 时,等号成立,
又因为 ,所以

则 ,
解得或 ,
因为且 ,
所以 ,即实数 的最小值为160.14.4.2  用样本估计总体的离散程度参数
1.B [解析] 由方差、标准差、极差的定义可知,方差、标准差、极差能度量样本离散程度,由中位数和平均数的定义可知,中位数和平均数能度量样本的集中趋势.故选B.
2.B [解析] 这个样本的平均数=×(1+2+3+4+5)=3,标准差s==
.故选B.
3.D [解析] 因为样本数据x1,x2,…,x10的方差为3,所以2x1-1,2x2-1,…,2x10-1的方差为22×3=12.故选D.
4.D [解析] ==160,==161,所以=×[(169-160)2+(162-160)2+(150-160)2+(160-160)2+(159-160)2]=37.2,=×[(180-
161)2+(160-161)2+(150-161)2+(150-161)2+(165-161)2]=124,所以<,<.故选D.
5.B [解析] 设总进球数的平均数为,方差为s2,男教师占教师总人数的ω1,进球的平均数为,方差为,女教师占教师总人数的ω2,进球的平均数为,方差为,则由=ω1+ω2,得13=14ω1+12ω2,又由ω1+ω2=1,解得ω1=ω2=.由s2=ω1[+(-)2]+ω2[+(-)2],得13=×[8+(14-13)2]+×[+(12-13)2],解得=16.故选B.
6.A [解析] 记原5个数据依次为x1,x2,x3,x4,x5,则新数据的平均数为=5,由原数据的方差为1,得(++++)-42=1,则++++=85,所以这组新数据的方差为(+++++102)-52=.故选A.
7.A [解析] 对于B,4月,5月,6月这三个月增速的平均数为=4.5,4月,5月,6月,7月这四个月增速的平均数为=4.3,故B错误;对于A,4月,5月,6月这三个月增速的方差为=0.74,4月,5月,6月,7月这四个月增速的方差为=0.675,故A正确;对于D,9月,10月,11月这三个月增速的平均数为=,10月,11月,12月这三个月增速的平均数为=6,故D错误;对于C,9月,10月,11月这三个月增速的方差为×=,10月,11月,12月这三个月增速的方差为=,故C错误.故选A.
8.AD [解析] 去掉一个最低评分和一个最高分后剩下评分的平均数有可能变小、不变或变大,故A中说法错误;剩下评分的极差一定会变小,故B中说法正确;剩下评分的波动性变小,则方差变小,故C中说法正确;剩下评分的中位数不变,故D中说法错误.故选AD.
9.ABD [解析] 对于A,==580,==580,所以=,故A正确;对于B,=×[(560-580)2+(580-580)2+(570-580)2+(590-580)2+(600-580)2]=200,=×[(550-
580)2+(600-580)2+(580-580)2+(580-580)2+(590-580)2]=280,所以<,故B正确;对于C,甲种水稻产量的极差为600-560=40,乙种水稻产量的极差为600-550=50,所以甲种水稻产量的极差小于乙种水稻产量的极差,故C错误;对于D,s2=2,所以(-s2,+s2)为(580-2,580+2),因为16<2<18,所以562<580-2<564,596<580+2<598,所以乙种水稻的产量有三年位于(-s2,+s2)之间,故D正确.故选ABD.
10.1 [解析] 这组数据的平均数为=4,所以这组数据的方差为
==3.6,得a2+a-2=0,解得a=-2(舍去)或a=1.
11.9.5 28.5 [解析] 根据题意得=×(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5,则s2=×[(2.5-9.5)2×4+(7.5-9.5)2×8+(12.5-9.5)2×5+(17.5-9.5)2×2+(22.5-9.5)2×1]=28.5.
12.16 [解析] 由题意,数据的中位数为16,可得=16,所以m+n=32,所以这6周的周慢走里程的平均数为=17.要使这6周的周慢走里程的标准差最小,需要(m-17)2+(n-17)2最小,又由(m-17)2+(n-17)2=(m-17)2+(32-m-17)2=2m2-64m+172+152,要使这6周的周慢走里程的标准差最小,则m=-=16.
13.解:(1)A系列的打分结果从小到大排列为76,79,81,84,86,86,88,92,93,95,
所以A系列综合打分的中位数为=86.
B系列的打分结果从小到大排列为75,80,80,83,85,87,90,92,93,95,
所以B系列综合打分的中位数为=86.
(2)A系列综合打分的平均数=
=86,
方差=×[(-10)2+(-7)2+(-5)2+(-2)2+02+02+22+62+72+92]=34.8.
B系列综合打分的平均数=
=86,
方差=×[(-11)2+(-6)2+(-6)2+(-3)2+(-1)2+12+42+62+72+92]=38.6.
因为A,B两个系列综合打分的中位数相等,平均数相等,方差满足<,所以推广A系列种植更合适.
14.解:(1)由题可知=×[200+(165-180)2]+×[210+(195-180)2]=430.14.4.2  用样本估计总体的离散程度参数
一、选择题
1.[2024·武汉期末] 下列统计量中,都能度量样本x1,x2,…,xn的集中趋势的是 (  )                 
A.样本x1,x2,…,xn的标准差与极差
B.样本x1,x2,…,xn的中位数与平均数
C.样本x1,x2,…,xn的极差与众数
D.样本x1,x2,…,xn的方差与平均数
2.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为 (  )
A.1 B.
C. D.2
3.[2024·江苏无锡一中期末] 若样本数据x1,x2,…,x10的方差为3,则2x1-1,2x2-1,…,2x10-1的方差为 (  )
A.3 B.5
C.6 D.12
4.[2024·江苏宿迁期末] 从两个班级各随机抽取5名学生测量身高(单位:cm),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生身高的平均数,及方差,的关系为 (  )
A.>,>
B.>,<
C.<,>
D.<,<
5.[2024·湖北武汉期末] 某次趣味运动会,设置了教师足球射门比赛:教师射门,学生守门.已知参与射门比赛的教师有60名,进球数的平均数和方差都是13,其中男教师进球数的平均数和方差分别是14和8,女教师进球数的平均数为12,则女教师进球数的方差为 (  )
A.15 B.16
C.17 D.18
6.[2024·大同一中期末] 已知由5个数据组成的一组数据的平均数为4,方差为1,现再加入一个数据10,组成一组新的数据,则这组新数据的方差为 (  )
A. B.
C. D.7
7.[2024·北京朝阳区期末] 近年来,我国国民经济运行总体稳定,延续回升向好态势.如图是我国某年4月到该年12月规模以上工业增加值同比增长速度(以下简称增速)统计图.
注:规模以上工业指年主营业务收入2000万元及以上的工业企业.
下列说法正确的是 (  )
A.4月,5月,6月这三个月增速的方差比4月,5月,6月,7月这四个月增速的方差大
B.4月,5月,6月这三个月增速的平均数比4月,5月,6月,7月这四个月增速的平均数小
C.连续三个月增速的方差最大的是9月,10月,11月这三个月
D.连续三个月增速的平均数最大的是9月,10月,11月这三个月
8.(多选题)[2024·江苏无锡天一中学高一期末] 在学校组织的《爱我中华》主题演讲比赛中,有10位评委对每位选手进行评分(评分互不相同),将选手的得分去掉一个最低评分和一个最高评分,则下列说法错误的是 (  )
A.剩下评分的平均数变大
B.剩下评分的极差变小
C.剩下评分的方差变小
D.剩下评分的中位数变大
9.(多选题)[2024·福建龙岩期末] 某农场种植的甲、乙两种水稻,在面积相等的两块稻田中连续5年的产量如下:
品种 第1年 第2年 第3年 第4年 第5年
甲/kg 560 580 570 590 600
乙/kg 550 600 580 580 590
若,分别表示甲、乙两种水稻产量的平均数,,分别表示甲、乙两种水稻产量的方差,则下列说法正确的是 (  )
A.=
B.<
C.甲种水稻产量的极差与乙种水稻产量的极差相等
D.乙种水稻的产量有三年位于(-s2,+s2)之间
二、填空题
10.已知a>0,一组数据4,2,3-a,4+a,7的方差为3.6,则a=    .
11.[2024·山东聊城二中月考] 某医院急救中心随机抽取20位病人等待急诊的时间记录如表:
等待时间/分 [0,5) [5,10) [10,15) [15,20) [20,25]
频数 4 8 5 2 1
用上述分组资料估计病人等待时间的平均数=    ,病人等待时间的方差s2=    .(同一组数据以该组区间的中点值为代表)
12.[2024·浙江宁波期中] 慢走是一种简单又优良的锻炼方式,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.小温按从小到大的顺序记录了近6周的周慢走里程(单位:公里):11,12,m,n,20,27,其中这6周的周慢走里程的中位数为16,若要使这6周的周慢走里程的标准差最小,则m=    .
三、解答题
13.某杨梅种植户从购买客户中随机抽取20位客户做质量随访调查,其中购买A系列(大棚种植)的有10位客户,购买B系列(自然种植)的有10位客户,从杨梅的大小、口感、水分、甜度进行综合打分(满分为100分),打分结果记录如下:
A系列(大棚种植):84,81,79,76,95,88,93,86,86,92
B系列(自然种植):92,95,80,75,83,87,90,80,85,93
(1)分别求出这两个系列综合打分的中位数.
(2)分别求出这两个系列综合打分的平均数与方差,通过上述数据结果进行分析,你认为推广哪种系列种植更合适
14.某社区工作人员采用分层抽样的方法分别在甲、乙两个小区各抽取了8户家庭,统计了每户家庭近7天用于垃圾分类的总时间(单位:分钟),其中甲小区的统计表如下:
住户序号 1 2 3 4 5 6 7 8
所需时间/分 200 220 200 180 200 a b 220
设xi,yi分别为甲、乙小区抽取的第i户家庭近7天用于垃圾分类的总时间(单位:分钟),,分别为甲、乙小区所抽取样本的的平均数,,分别为甲、
(1)若a≤b,求a和b的值.
(2)甲小区物业为提高垃圾分类效率,优先试行新措施,每天由部分物业员工协助垃圾分类工作,经统计,甲小区住户每户每天用于垃圾分类的时间减少了5分钟.利用样本估计总体,计算甲小区试行新措施之后,甲、乙两个小区的所有住户近7天用于垃圾分类的总时间的平均数和方差.
参考公式:若总体划为2层,通过分层抽样,各层抽取的样本容量、样本平均数和样本方差分别为m,,;n,,.总的样本平均数为,样本方差为s2,则s2=[+(-)2]+[+(-)2].14.4.2 用样本估计总体的离散程度参数
【课前预习】
知识点一
1.差
2.
3.
4.
诊断分析
1.(1)√ (2)√ (3)√ (4)√
2.2 [解析] =×(2+4+6+8+10)=6,则标准差为=2.
知识点二
【课中探究】
探究点一
例1 (1)16.39 4.05 (2)19.8 [解析] (1)根据题意,平均数=×(190.0+190.3+190.5+193.0+193.5+198.1+194.1+197.1+202.9)=190+×(0.3+0.5+3+3.5+8.1+4.1+7.1+12.9)≈194.39,方差s2=×[(190.0-)2+(190.3-)2+…+(202.9-)2]≈16.39,标准差s≈≈4.05.
(2)由题可知
变式 (1)D (2)C [解析] (1)数据①5,5,5,6,6,6,7,7,7的平均数和方差分别为==6,==;数据②4,4,5,5,6,7,7,8,8的平均数和方差分别为==6,==;数据③3,3,3,3,6,9,9,9,9的平均数和方差分别为==6,==8.所以<<.故选D.
(2)由题意得=4,解得a=0,则这组数据的方差为=,所以这组数据的方差为=.故选C.
探究点二
例2 (1)C (2)BD [解析] (1)设x1,x2,x3,…,x314的方差为D(X),3(x1+5),3(x2+5),…,3(x314+5)的方差为D(Y),∵x1,x2,x3,…,x314的标准差为2,∴D(X)=4,则D(Y)=32D(X)=9×4=36,∴3(x1+5),3(x2+5),…,3(x314+5)的标准差为=6.故选C.
(2)对于A,数据3x1-1,3x2-1,3x3-1的平均数为3×2-1=5,故A错误;对于B,数据3x1-1,3x2-1,3x3-1的方差为32×1=9,故B正确;对于C,因为x1+x2+x3=3×2=6,(x1-2)2+(x2-2)2+(x3-2)2=1×3=3,所以数据x1,x2,x3,2的平均数为=2,所以数据x1,x2,x3,2的方差为[(x1-2)2+(x2-2)2+(x3-2)2+(2-2)2]=,故C错误;对于D,由x1+x2+x3=6,(x1-2)2+(x2-2)2+(x3-2)2=3,得++-4(x1+x2+x3)+12=3,可得++=15,所以数据,,的平均数为=5,故D正确.故选BD.
变式 (1)C (2)CD [解析] (1)因为数据x1,x2,…,xn的方差为s2,所以数据ax1-1,ax2-1,…,axn-1的方差为a2s2,所以a2=4,则a=±2.故选C.
(2)根据题意,对于数据x1,x2,…,x2024,假设x1探究点三
例3 解:(1)=×(99+100+98+100+100+103+97+103+98+102)=100,
=×(99+100+102+99+100+100+99+101+99+101)=100.
=×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2+(97-100)2+(103-100)2+(98-100)2+(102-100)2]=4,=×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2+(99-100)2+(101-100)2+(99-100)2+(101-100)2]=1.
(2)由(1)知s甲=2,s乙=1.
对于甲组数据,[-s甲,+s甲]=[100-2,100+2]=[98,102],有7个数据在[98,102]内,占70%.
对于乙组数据,[-s乙,+s乙]=[100-1,100+1]=[99,101],有9个数据在[99,101]内,占90%.
(3)两台机床所加工零件的直径的平均值相同,
又>,所以乙机床加工零件的质量更稳定.
变式 解:(1)该零件抽样尺寸的极差为10.09-9.98=0.11,
样本平均数=10+×(0.05+0.03+0.08+0.09+0.02+0.05+0.08+0.00+0.05+0.06+0.06+0.05+0.07+0.06+0.07-0.02)=10.05,样本方差s2=×(02+0.022+0.032+0.042+0.032+02+0.032+0.052+02+0.012×2+02+0.022+0.012+
0.022+0.072)==,
所以样本标准差s=≈0.03.
(2)由(1)得μ≈10.05,ζ≈0.03,
所以μ-2ζ≈9.99,μ+2ζ≈10.11,
故[μ-2ζ,μ+2ζ]≈[9.99,10.11],
因为9.98<9.99,所以需对机床进行检修.
探究点四
例4 解:由题可知=60,甲队人数占所有队员人数的=,=70,乙队人数占所有队员人数的=,
则甲、乙两队全部队员体重的平均数=×60+×70=68,甲、乙两队全部队员体重的方差s2=×[200+(60-68)2]+×[300+(70-68)2]=296.
变式 275 [解析] 记男生样本为y1,y2,…,y25,平均数为,方差为,女生样本为z1,z2,…,z25,平均数为,方差为,总样本的平均数为,方差为s2,=×[25×125+10×(25×176-25×176)+25×425+10×(25×166-25×166)]=275.
拓展 解:(1)由题意可知解得
可知每组的频率依次为0.05,0.25,0.45,0.2,0.05,
所以这100名候选者面试成绩的平均数为50×0.05+60×0.25+70×0.45+80×0.2+90×0.05=69.5.
(2)因为第二组和第四组的频率之比为=,所以估计这次第二组和第四组面试者所有人面试成绩的平均数==70,
故估计这次第二组和第四组面试者所有人面试成绩的方差s2=×[40+(62-70)2]+×[70+(80-70)2]=.14.4.2 用样本估计总体的离散程度参数
【学习目标】
  1.结合具体实例,经历用样本估计总体的离散程度参数(标准差、方差、极差)的过程,理解离散程度参数的统计含义.
  2.经历分层抽样的样本平均数和方差的推导过程,会求具体问题的样本平均数和样本方差,并能解释它们在实际问题中的意义.
◆ 知识点一 极差、方差、标准差
1.极差
我们把一组数据的最大值与最小值的    称为极差.
2.方差
设一组样本数据x1,x2,…,xn,其平均数为,则称      为这个样本的方差,简称    .
3.标准差
方差的算术平方根      为样本的标准差,简称      .
4.离散型方差公式
一般地,若取值为x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均数为     ,其方差为      .
5.极差、方差、标准差都是刻画数据离散程度的度量值,标准差刻画了数据离平均数波动的幅度大小.
【诊断分析】 1.判断正误.(正确的打“√”,错误的打“×”)
(1)标准差、方差越小,数据的离散程度越小. (  )
(2)若样本数据都相等,则s=0. (  )
(3)标准差的大小不会超过极差. (  )
(4)若样本数据都相等,则表明数据没有波动幅度,数据没有离散性,标准差为0. (  )
2.样本数据2,4,6,8,10的标准差为    .
◆ 知识点二 分层抽样数据的方差
一般地,如果总体分为k层,第j层抽取的样本为xj1,xj2,…,,第j层的样本量为nj,样本平均数为,样本方差为,j=1,2,…,k,记那么,所有数据的样本方差为=       =        .
◆ 探究点一 方差、标准差的计算
例1 (1)下面的数据是某男运动员跳高的跳跃高度(单位:cm),则这组数据的方差和标准差分别为    和     (精确到小数点后两位).
190.0 190.3 190.5 193.0 193.5 198.1
194.1 197.1  202.9
(2)[2024·浙江温州期末] 已知样本数据x1,x2,…,x9的平均数为9,方差为12,现这组样本数据增加一个数据x10,此时新样本数据的平均数为10,则新样本数据的方差为    .
变式 (1)[2024·邯郸期末] 有三组数据①5,5,5,6,6,6,7,7,7;②4,4,5,5,6,7,7,8,8;③3,3,3,3,6,9,9,9,9.设它们的方差依次为,,,则 (  )                  
A.>> B.>>
C.<< D.<<
(2)[2024·南京金陵中学期末] 已知数据3,7,a,6的平均数是4,则这组数据的标准差为 (  )
A. B.
C. D.
[素养小结]
标准差、方差的意义
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.标准差的大小不会超过极差.
(2)标准差、方差的取值范围是[0,+∞).标准差、方差为0时,样本中的各数据相等,说明数据没有波动幅度,数据没有离散性.
◆ 探究点二 方差、标准差的性质
例2 (1)若x1,x2,x3,…,x314的标准差为2,那么3(x1+5),3(x2+5),…,3(x314+5)的标准差为(  )
A.18 B.14
C.6 D.3
(2)(多选题)[2024·福州期中] 已知样本数据x1,x2,x3的平均数为2,方差为1,则下列说法正确的是 (  )
A.数据3x1-1,3x2-1,3x3-1的平均数为6
B.数据3x1-1,3x2-1,3x3-1的方差为9
C.数据x1,x2,x3,2的方差为1
D.数据,,的平均数为5
变式 (1)已知数据x1,x2,…,xn的方差为s2,数据ax1-1,ax2-1,…,axn-1的方差为4s2,则a= (  )
A.1 B.2
C.±2 D.-2
(2)(多选题)有两组样本数据:x1,x2,…,x2024;y1,y2,…,y2024,其中yi=xi+2024(i=1,2,…,2024).则这两组样本数据的 (  )
A.平均数相同
B.中位数相同
C.方差相同
D.极差相同
[素养小结]
(1)一组数据中的每一个数都加上或减去同一个常数,所得的一组新数据的方差不变,标准差也不变.
(2)若把一组数据中的每一个数都变为原来的k倍并加上或减去常数a,则所得的一组新数据的标准差变为原来的k倍,方差变为原来的k2倍,而与a的大小无关.
◆ 探究点三 标准差、方差的应用
例3 甲、乙两台机床同时加工直径为100 cm的零件,为检验质量,从中各抽取10个零件测量其直径,所得数据如下:
甲机床:99,100,98,100,100,103,97,103,98,102;
乙机床:99,100,102,99,100,100,99,101,99,101.
(1)分别计算两组数据的平均数,及方差,;
(2)分别计算两组数据中,位于[-s甲,+s甲],[-s乙,+s乙]之间的数据的个数以及所占的百分比;
(3)根据(1)的结果判断哪台机床加工零件的质量更稳定.
变式 为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm),结果如下:
10.05 10.03 10.08 10.09 10.02 10.05 10.08 10.00
10.05 10.06 10.06 10.05 10.07 10.06 10.07 9.98
(1)计算该零件抽样尺寸的极差,样本平均数和样本标准差s;(参考数据:≈5.74,计算结果精确到0.01)
(2)将样本平均数作为总体平均数μ的估计值,样本标准差s作为总体标准差ζ的估计值,根据生产经验,在一天的抽检零件中,如果出现了数据落在[μ-2ζ,μ+2ζ]之外的零件,则认为这条生产线在这一天的生产过程中可能出现了异常情况,机床应检修调整,试利用估计值判断是否需对机床进行检修.
[素养小结]
在实际问题中,仅靠平均数不能完全反应问题,还要研究方差,方差描述了数据相对平均数的离散程度.在平均数相同的情况下,方差越大,离散程度越大,数据波动性越强,稳定性越差;方差越小,离散程度越小,数据波动性越弱,稳定性越好.
◆ 探究点四 分层抽样数据的方差计算
例4 甲、乙两支田径队队员的体检结果为:甲队队员体重(单位:kg)的平均数为60,方差为200,乙队队员体重(单位:kg)的平均数为70,方差为300.已知甲、乙两队的队员人数之比为1∶4,求甲、乙两队全部队员体重的平均数和方差.
变式 [2024·江苏南通海安高级中学高一月考] 为获得某中学高一学生的身高(单位:cm)信息,采用随机抽样方法抽取了样本量为50的样本,其中男、女生的样本量均为25,计算得到男生样本的平均数为176,标准差为10,女生样本的平均数为166,标准差为20,则总样本的方差为    .
[素养小结]
计算分层抽样的方差s2的步骤:
(1)确定,,,;
(2)确定;
(3)应用公式s2=[+(-)2]+[+(-)2],计算s2.
拓展 2023年10月22日,汉江生态城2023襄阳马拉松在湖北省襄阳市成功举行,志愿者的服务工作是马拉松成功举办的重要保障,襄阳市新时代文明实践中心承办了志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:第一组[45,55),第二组[55,65),第三组[65,75),第四组[75,85),第五组[85,95),绘制成如图所示的频率分布直方图.已知第一、二组的频率之和为0.3,第一组和第五组的频率相同.
(1)估计这100名候选者面试成绩的平均数;
(2)现从以上各组中用分层抽样的方法选取20人担任本市的宣传者,若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为62和40,第四组面试者的面试成绩的平均数和方差分别为80和70,据此估计这次第二组和第四组面试者所有人面试成绩的方差.