9.2.4总体离散程度的估计 课件(共26张PPT)

文档属性

名称 9.2.4总体离散程度的估计 课件(共26张PPT)
格式 zip
文件大小 2.2MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2022-04-28 16:35:10

图片预览

文档简介

(共26张PPT)
9.2.4总体离散程度的估计

人教A版2019高中数学必修第二册
学习目标
1.通过实例,理解极差、方差、标准差等离散程度参数的统计含义
2.掌握用样本的离散程度参数估计总体的离散程度的方法,体会用样本估计总体的思想,发展数据分析素养
一、方差、极差和标准差的概念
问题1 有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你如何对两位运动员的射击情况作出评价 如果这是一次选拔性考核,你应当如何作出选择
甲、乙两名运动员射击成绩的平均数、中位数、众数都是7. 从这个角度看,两名运动员之间没有差别.所以仅知道两位运动员射击成绩的集中趋势(平均数、中位数和众数)是不够的,很多时候还不能使我们作出有效决策.
思考 两名运动员射击成绩的平均数、中位数、众数各为多少?
从频率分布条形图可以直观看出,甲的成绩比较分散,乙的成绩相对集中,即甲的成绩波动幅度比较大,而乙的成绩比较稳定.可见,他们的射击成绩是存在差异的.
一种简单的度量数据离散程度的方法就是用极差,极差是数据的最大值与最小值的差.
可以发现甲的成绩波动范围比乙的大.
根据甲、乙运动员的10次射击成绩,可以得到
甲命中环数的极差=10-4=6,
乙命中环数的极差=9-5=4.
极差在一定程度上刻画了数据的离散程度.极差越大,数据的离散程度越大;极差越小,数据的离散程度越小.但因为极差只使用了数据中最大、最小两个值的信息,对其他数据的取值情况没有涉及,所以极差所含的信息量很少.
问题2 那么,如何度量成绩的这种差异呢
问题3 你还能想出其他刻画数据离散程度的办法吗
我们知道,如果射击的成绩很稳定,那么大多数的射击成绩离平均成绩不会太远;相反,如果射击的成绩波动幅度很大,那么大多数的射击成绩离平均成绩会比较远.
因此,我们可以通过这两组射击成绩与它们的平均成绩的“平均距离”来度量成绩的波动幅度.
假设一组数据是x1, x2,…, xn,用 表示这组数据的平均数. 我们用每个数据与平均数的差的绝对值作为“距离”,即 作为xi到 的“距离”.
可以得到这组数据x1, x2,…, xn到 的 “ 平均距离”为 .
思考 如何定义“平均距离”
为了避免式中含有绝对值,通常改用平方来代替,即
方差
假设一组数据是x1, x2,…, xn,用 表示这组数据的平均数. 我们用每个数据与平均数的差的绝对值作为“距离”,即 作为xi到 的“距离”.
可以得到这组数据x1, x2,…, xn到 的 “ 平均距离”为 .
思考 如 何定义“平均距离”
我们可以用“平均距离”刻画数据的离散程度,“平均距离”越大,数据离散程度越大,“平均距离”越小,数据离散程度越小.
为了避免式中含有绝对值,通常改用平方来代替,即
方差
有时为了计算方便,我们还把方差写成以下形式 ,为什么?
方差刻画了数据的离散程度或波动幅度,方差越大,数据的离散程度越大;方差越小,数据的离散程度越小.
方差的单位是什么?
由于方差的单位是原始数据的单位的平方,与原始数据不一致. 为了使二者单位一致,我们对方差开平方,取它的算术平方根,即
标准差
标准差与方差一样,刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.但在解决实际问题中一般多采用标准差. 由于计算复杂,我们可以借助计算器或者计算机帮助计算.
如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为 ,则称 S2= 为总体方差,S= 为总体标准差 .
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为 ,则称 s2= 为样本方差,s= 为样本标准差 .
由s甲>s乙可知,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.
s甲=2,s乙≈1.095
如果要从这两名选手中选择一名参加比赛,要看一下他们的平均成绩在所有参赛选手中的位置.如果两人都排在前面,就选成绩稳定的乙选手,如果两人都排在后面,希望比赛时有突出表现的,就选成绩标准差大的甲.
问题1 有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
练习1 甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
解:(1)x 甲=(99+100+98+100+100+103)=100,x 乙= (99+100+102+99+100+100)=100.
s2甲 = [(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,s2乙 = [(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)两台机床所加工零件的直径的平均值相同,又s2甲>s2乙 ,所以乙机床加工零件的质量更稳定.
二、分层随机抽样样本方差的计算
在实际问题中,如果能获得总体中所有个体的观测值,可以用方差的公式直接计算总体的方差. 比如,要了解某中学学生身高的差别,可以直接从学校医务室获得所有学生的身高数据,计算其方差即可判断. 如果要了解某市所有中学学生身高的差别,获取所有学生的身高数据就比较困难,可以用简单随机抽样或分层随机抽样方法获取样本,得到样本中所有个体的身高数据,然后计算其方差,该方差是样本的方差,利用样本估计总体的思想,可以用样本方差估计总体方差.
例 在对树人中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62.你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差作出估计吗

因此,总样本的方差约为51.49,据此估计高一年级学生身高的总体方差约为51.49.
问题4 比较总样本方差与男生组及女生组的方差,你能发现什么?你能解释在估计全校学生平均身高时,按性别随机抽样的理由吗?
我们可以看到总样本方差既大于男生组方差也大于女生组方差.在相同样本量的条件下,总样本方差越小,样本均值估计总体均值效果越好. 男女生的均值相差较大,即两组差别越大,总样本方差比男、女生的方差均大得越多,分层随机抽样的效果越好.
样本标准差刻画了数据离平均数波动的幅度大小,平均数和标准差一起能反映数据取值的信息.例如,根据9.2.1节中100户居民用户的月均用水量数据,可以计算出样本平均数=8.79,样本标准差s6.20.-s2.59,+s=14.99,-2s=-3.61,+2s =21.19.如图,可以发现,这100个数据中大部分落在区间[-s,+s]=[2.59,14.99]内,在区间[-2s+2s]=[-3.61,21.19]外的只有7个.也就是说,绝大部分数据落在[-2s,+2s]内.
练习2 某学校有高中学生500 人,其中男生320 人,女生180人.有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的均值为173.5,方差为17,女生样本的均值为163.83,方差为30.03.
(1)根据以上信息,能够计算出总样本的均值和方差吗 为什么
(1)不能,因为没有给出男、女生的样本量,或者男、女生样本量的比例,
故无法计算出总样本的均值和方差;
(2)总样本的均值为:
总样本的方差为:+
练习2 某学校有高中学生500 人,其中男生320 人,女生180人.有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的均值为173.5,方差为17,女生样本的均值为163.83,方差为30.03.
(2)如果已知男、女样本量按比例分配,你能计算出总样本的均值和方差各为多少吗
练习2 某学校有高中学生500 人,其中男生320 人,女生180人.有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的均值为173.5,方差为17,女生样本的均值为163.83,方差为30.03.
(3)如果已知男、女的样本量都是25,你能计算出总样本的均值和方差各为多少吗 它们分别作为总体均值和方差的估计合适吗 为什么
(3)总样本的均值为:
总样本的方差为:+
它们分别作为总体均值和方差不合适,因为抽样中未按比例进行分层抽样,所以总体中每个个体被抽到的可能性不完全相同因而样本的代表性差,所以作为总体的估计不合适.
课堂小结
1.方差、极差和标准差的概念
2.分层随机抽样样本方差的计算