(共33张PPT)
第九章
9.2.4 总体离散程度的估计
人教A版(2019)
教学目标
学习目标 数学素养
1.理解样本数据的方差与标准差的意义和作用,会计算样本数据的方差与标准差. 1.数据分析素养和运算素养.
2.能从样本数据中计算出方差和标准差,并给出合理的解释. 2.数据分析素养和运算素养.
温故知新
1.平均数
对于一组数据x1,x2,…,xn,那么叫做它们的平均数.
2.中位数
一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间的两个数据的平均数(当数据个数是偶数时),称为这组数据的中位数.
3.众数
一组数据中出现次数最多的数据(即频率分布最大值对应的样本数据)成为这组数据的众数.
从频率分布直方图中估计中位数左右两边的直方图的面积相等.
从频率分布直方图中估计众数是最高的矩形的中点.
也可以从频率分布直方图中估计平均数,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中的横坐标之和.
知新引入
平均数、中位数和众数为我们提供了一组数据的集中趋势的信息,这是概括一组数据的特征的有效方法.但仅知道集中趋势的信息,很多时候还不能使我们做出有效的决策.下面的问题就是一个例子.
问题1 有两位射击运动员在一次射击测试中各射击10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你如何对两位运动员的射击情况作出评价 如果这是一次选拔性考核,你应当如何作出选择
通过简单的排序和计算,可以发现甲、乙两名运动员射击成绩的平均数、中位数、众数都是7. 从这个角度看,两名运动员之间没有差别.
知新探究
10 环数
频率
4
5
6
7
8
9
(甲)
10 环数
频率
4
5
6
7
8
9
(乙)
但由上图可以直观看出,甲的成绩比较分散,乙的成绩相对集中,即甲的成绩波动幅度比较大,而乙的成绩比较稳定.可见,他们的射击成绩是存在差异的.
那么,如何度量成绩的这种差异呢
知新探究
一种简单的度量数据离散程度的方法就是用极差.
根据甲、乙运动员的10次射击成绩,可以得到
甲命中环数的极差=10-4=6
乙命中环数的极差=9-5=4
极差在一定程度上刻画了数据的离散程度,但因为极差只使用了数据中最大、最小两个值的信息,对其他数据的取值情况没有涉及,所以极差所含的信息量很少.
可以发现甲的成绩波动范围比乙大.
知新探究
如何定义“平均距离”?
我们知道,如果射击的成绩很稳定,那么大多数的射击成绩离平均成绩不会太远;
相反,如果射击的成绩波动幅度很大,那么大多数的射击成绩离平均成绩会比较远.
因此,我们可以通过这两组射击成绩与它们的平均成绩的“平均距离”来度量成绩的波动幅度.
你还能相处其他刻画数据离散程度的办法吗?
知新探究
如何定义“平均距离”?
假设一组数据是x1, x2,…, xn,用 表示这组数据的平均数.我们用每个数据与平均数的差的绝对值作为“距离”,即
作为xi到的“距离”.可以得到这组数据x1, x2,…, xn到 的“平均距离”为
想一想,为什么用“平均距离”刻画离散程度,用“总距离”行吗?
为了避免式中含有绝对值,通常改用平方来代替,即
⑴
我们称⑴式为这组数据的方差(variance).
可以用计算器求一组数据的方差.需要注意的是,计算器可能按计算方差,此时需要乘进行调整.
知新探究
方差表示为
有时为了计算方差的方便,我们还把方差写成以下形式
由于方差的单位是原始数据的单位的平方,与原始数据不一致为了使二者单位一致,我们对方差开方,取它的算数平方根,即
我们称其为这组数据的标准差(standard deviotion).
标准差的取值范围是什么?标准差为0的一组数据有什么特点?
标准差s≥0;s=0表示这组数据中的每个数据到平均数的距离都是0,这组数据的每个数据是相等的.
知新探究
如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称
S2=
为总体方差,为总体标准差.
与总体均值类似,总体方差也可以写出加权的形式.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…, k),则总体方差为
知新探究
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称
s2=
为样本方差,s=为样本标准差.
标准差刻画了数据的数据的离散程度或波动幅度.标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小;显然,在刻画数据的分散程度上,方差和标准差是一样的,但在解决实际问题中,一般多采用标准差.
在实际问题中,总体平均数和总体标准差都是未知的.就像用样本平均数估计总体平均数一样,通常我们也用样本标准差去估计总体标准.在随机抽样中,样本标准差依赖于样本的选取,具有随机性.
知新探究
特征:
标准差和方差刻画了数据的离散程度或波动幅度.
标准差(或方差)越大,数据的离散程度越大,越不稳定;
标准差(或方差)越小,数据的离散程度越小,越稳定.
在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差
知新探究
问题1 有两位射击运动员在一次射击测试中各射击10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
=7,
.
由s甲>s乙可知,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.
我们可以根据标准差来判断两名运动员的成绩的离散程度,计算可得
如果要从这两名选手中选择一名参加比赛,要看一下他们的平均成绩在所有参赛选手中的位置.如果两人都排在前面,就选成绩稳定的乙选手,否则可以选甲.
知新探究
总体方差的计算
①能获得总体中所有个体的观测值:直接计算总体的方差
②获得总体中所有个体的观测值困难:
知新探究
【例1】在对树人中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62. 你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差作出估计吗?
解:
把男生样本记为x1,x2,…,x23,其平均数记为,方差记为;
把女生样本记为y1,y2,…,y27,其平均数记为,方差记为;
把总体数据样本的平均数记为,方差记为;
根据方差的定义,总体样本方差为
知新探究
由,根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系,可得总样本平均数为
.
==165.2
把已知的男生、女生样本平均数和方差的取值代入⑴式,可得
=51.4862.
所以总样本的方差为51.4862,并据此估计高一年级学生身高的总体方差为51.4862.
知新探究
人数 平均数 方差
男生 23 170.6 12.59
女生 27 160.6 38.62
总体 50
165.2
51.4862
比较总样本方差与男生组及女生组的方差,你能发现什么 你能解释在估计全校学生平均身高时,按性别分层随机抽样的理由吗
总样本方差既大于男生组的方差,也大于女生组的方差.
相同样本量的条件下,总样本方差越小,样本均值估计总体均值效果越好.
男、女生的均值相差越大,即两组差别越大,总样本方差比男、女生的方差均大得越多,分层随机抽样的效果越好.
知新探究
这样得到分层抽样总样本方差的计算方法
第一层样本记为x1,x2,…,xn,其平均数记为,方差记为;第二层样本记为y1,y2,…,y27,其平均数记为,方差记为;总体数据样本的平均数记为,方差记为,则
知新探究
样本标准差刻画了数据离平均数波动的幅度大小,平均数和标准差一起能反映数据取值的信息.
例如,根据9.2.1节中100户居民用户的月均用水量数据,可以计算出样本平均数=8.79,样本标准差s≈6.20.即
-s=2.59,+s=14.99.
-2s=-3.61,+2s=21.19.
如图所示,可以发现,这100个数据大部分落在区间[-s,+s]=[2.59,14.99]内,在区间[-2s,+2s]=[-3.61,21.19]外只有7个,也就是说,绝大部分数据落在[-2s,+2s]内.
知新探究
探究
⑴平均数为.
方差为
.
标准差为.
知新探究
探究
⑵平均数为.
方差为
.
标准差为.
知新探究
探究
⑶平均数为.
方差为
.
标准差为.
知新探究
知新探究
【例2】甲、乙两人参加某体育项目训练,近期
的五次测试成绩得分情况如图所示.
⑴分别求出两人得分的平均数与方差;
⑵根据图形和⑴中计算结果,对两人的训练成绩作出评价.
解:
由题图可得,甲、乙两人五次测试的成绩分别为
甲:10,13,12,14,16;
乙:13,14,12,12,14.
知新探究
解:
⑴=13.
=13.
⑵由可知,乙的成绩较稳定.
=4.
由折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动.可知甲的成绩在不断提高,而乙的成绩无明显提高.
=0.8.
初试身手
1.若样本1+x1,1+x2,…,1+xn的平均数是10,方差为2,则对于样本2+2x1,2+2x2,…,2+2xn,下列结论正确的是( )
A.平均数为20,方差为4 B.平均数为11,方差为4
C.平均数为21,方差为8 D.平均数为20,方差为8
解:
∵样本1+x1,1+x2,…,1+xn的平均数是10,方差为2,
D
∴样本x1,x2,…,xn的平均数是9,方差为2,
∴样本2+2x1,2+2x2,…,2+2xn平均数为2+2×9=20,方差为22×2=8.故选D.
初试身手
2.甲、乙两机床同时加工直径为100 cm的零件,为检验质量,从中抽取6件测量数据为(单位:cm):
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
⑴分别计算两组数据的平均数及方差;
⑵根据计算说明哪台机床加工零件的质量更稳定.
解:
⑴=100(cm).
=100(cm).
.
=2.
⑵由⑴知,比较它们的方差,因为,则乙机床加工零件的质量更稳定.
初试身手
3.某培训机构在假期招收了A,B两个数学补习班,A班10人,B班30人,经过一周的补习后进行了一次测试,在该测试中,A班的平均成绩为130分,方差为115,B班的平均成绩为110分,方差为215.求在这次测试中全体学生的平均成绩和方差.
解:
依题意可知.
全体学生成绩的方差
==265.
∴全体学生的平均成绩=115.
所以全体学生的平均成绩为115分,方差为265.
课堂小结
通过平均数和标准差两个统计量,可以得到大部分数据的取值范围[-2s,+2s]. 方差越大,则这个区间越大;方差越小,则这个区间也越小.
极差
一组数据中最大值与最小值的差.
方差
或
标准差
分层随机抽样总体样本方差的计算
作业布置
作业: P215 练习 第3,4题. P217 习题9.2 第8,10题
补充:
某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
⑴分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
⑵求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01,≈8.602)
y的分组 [-0.20,0) [0,0.20) [0.20,0.40) [0.40,0.60) [0.60,0.80)
企业数 2 24 53 14 7
尽情享受学习数学的快乐吧!
我们下节课再见!
谢谢
21世纪教育网(www.21cnjy.com)
中小学教育资源网站
兼职招聘:
https://www.21cnjy.com/recruitment/home/admin