(共23张PPT)
9.2.4总体离散程度的估计
复习导入
求百分位数:
第1步:按从小到大排列原始数据.
第2步:计算.
第3步:
复习导入
由频率分布直方图估计总体的集中趋势——找众数、中位数、平均数
众数:最高矩形的中点
中位数:中位数左边的直方图面积和右边的直方图面积相等
平均数:每个小矩形底边中点的横坐标与小矩形的面积的乘积之和
注:频率分布直方图的性质
(1)小长方形的面积 (2)各小长方形的面积之和等于1.
(3)小长方形的高,所有小长方形的高的和为.
新知探究
问题1:有两名射击队员在一次射击测试中各射靶10次,每次命中的环数如下:
甲 4 4 5 7 7 7 8 9 9 10
乙 5 6 6 7 7 7 7 8 8 9
甲 7 8 7 9 5 4 9 10 7 4
乙 9 5 7 8 7 6 8 6 7 7
如果你是教练,你如何对两位运动员的射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?
追问1:两名运动员射击成绩的平均数、中位数、众数各为多少?
甲、乙两名运动员射击成绩的平均数、中位数、众数都是7.从这个角度看,两名运动员之间没有差别。
新知探究
追问2:借助甲乙两名运动员射击成绩的频率条形图,你能根据图形发现它们有什么差异吗?
借助条形图可以直观看出,甲的成绩比较分散,乙的成绩相对集中,即甲的成绩波动幅度比较大,而乙的成绩比较稳定.可见,他们的射击成绩是存在差异的.
新知探究
追问3:那么,如何度量成绩的这种差异呢
离散程度:极差
甲命中环数的极差,乙命中环数的极差
甲的成绩波动范围比乙的大
追问4:极差在分析估计时有何优缺点?
极差在一定程度上刻画了数据的离散程度.但因为极差只使用了数据中最大、最小两个值的信息,对其他数据的取值情况没有涉及,所以极差所含的信息量很少.
新知探究
思考:你还能想出其他刻画数据离散程度的办法吗?
若射击成绩很稳定,那么大多数的射击成绩离平均成绩不会太远;
若射击成绩波动幅度很大,那么大多数射击成绩离平均成绩会比较远.
因此,我们可以通过这两组射击成绩与它们平均成绩的“平均距离”来度量成绩的波动幅度.
追问1:如何对一组数据与平均值的平均距离进行量化呢?
甲 4 4 5 7 7 7 8 9 9 10
乙 5 6 6 7 7 7 7 8 8 9
新知探究
追问1:如何对一组数据与平均值的平均距离进行量化呢?
假设一组数据是,用表示这组数据的平均数.我们用每个数据与平均数的差的绝对值作为“距离”,即作为到的“距离”.
平均距离为
含有绝对值,运算不太方便,改用平方代替
方差:
方差
新知探究
追问1:如何对一组数据与平均值的平均距离进行量化呢?
甲 4 4 5 7 7 7 8 9 9 10
乙 5 6 6 7 7 7 7 8 8 9
新知探究
.
有时为了计算方差的方便,也用上述表达式计算方差。
新知探究
追问2:问题1中,方差的单位是什么?
由于方差的单位是原始数据的单位的平方,与原始数据不一致。为了使二者单位一致,我们对方差开方,取它的算数平方根,即
追问3:问题1中,标准差是?
∵ ,1.2
∴ ,≈1.095
新知探究
方差、标准差:
方差:给定一组数据,用表示这组数据的平均数,则:
标准差:方差的算术平方根,即
注:方差、标准差可用于刻画数据离散程度
新知探究
问题2:标准差的取值范围是什么?标准差为0的一组数据有什么特点?
标准差.表示这组数据中的每一个数据到平均数的距离都是0,即这组数据的每个数据是相等的.
追问:在实际问题中,如何求总体平均数和总体标准差,样本的标准差与方差和总体的标准差与方差有什么关系?
用样本标准差估计总体标准差
新知探究
总体方差、标准差:
如果总体中所有个体的变量值分别为,总体平均数为,则称:
为总体方差,为总体标准差 .
如果总体的个变量值中,不同的值共有个,不妨记为其中出现的频数为则总体方差为
加权形式
练习巩固
练习1:甲、乙两机床同时加工直径为100 cm的零件,为检验质量,从中随机抽取6件测量直径数据如下:
甲
乙
(1)分别计算两组数据的极差、平均数及方差;
(2)根据计算结果说明哪台机床加工零件的质量更稳定.
解:(1)甲的极差为,乙的极差为.
,
,
练习巩固
解:(1)
(2),所以乙机床加工零件的质量更稳定。
练习1:甲、乙两机床同时加工直径为100 cm的零件,为检验质量,从中随机抽取6件测量直径数据如下:
甲 乙
(1)分别计算两组数据的极差、平均数及方差;
(2)根据计算结果说明哪台机床加工零件的质量更稳定.
练习巩固
例6:在对树人中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生人,其平均数和方差分别为和,抽取了女生人,其平均数和方差分别为和.你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差做出估计吗?
解:把男生样本记为,,…,,其平均数记为,方差记为;
把女生样本记为,…,,其平均数记为,方差记为;
把总样本数据的平均数记为,方差记为.
练习巩固
解:根据方差的定义,总样本方差为
①
由,,
所以,总样本平均数为
把已知的男生、女生样本平均数和方差的取值代入①,可得
例6:,只知道抽取了男生人,其平均数和方差分别为和,抽取了女生人,其平均数和方差分别为和.
新知探究
例6:在对树人中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生人,其平均数和方差分别为和,抽取了女生人,其平均数和方差分别为和.你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差做出估计吗?
解:因此,总样本的平均数为165.2,方差约为51.49,据此估计高一年级全体学生的身高方差约为51.49。
样本标准差刻画了数据离平均数波动的幅度大小,平均数和标准差一起能反映数据取值的信息.例如,根据9.2.1节中100户居民用户的月均用水量数据,可以计算出样本平均数,样本标准差.
新知探究
问题3:一般地,如果知道两组数据各自的数据个数、平均数和方差,如何计算全部数据的方差呢?
设样本容量为,平均数为,其中两层的个体数量分别为,,
两层的平均数分别为,,方差分别为,,
则这个样本的方差为:
.
练习巩固
练习2:某高校新增设的“人工智能”专业,共招收了两个班,其中甲班30人,乙班40人,在2023年高考中,甲班学生的平均分为665分,方差为131,乙班学生的平均分为658分,方差为208.则该专业所有学生在2023年高考中的方差为___________.
【答案】:
变式2:已知某省二、三、四线城市数量之比为,年月份调查得知该省所有城市房产均价为万元/平方米,方差为,二、三、四线城市的房产均价分别为万元/平方米,万元/平方米,万元/平方米,三、四线城市房价的方差分别为,,则二线城市的房价的方差为_____.
【答案】:
新知探究
练习3:甲、乙两支田径队体检结果为:甲队的体重的平均数为,方差为,乙队体重的平均数为,方差为,又已知甲、乙两队的队员人数之比为,那么甲、乙两队全部队员的平均体重和方差分别是什么?
解:由题意可知甲队队员在所有队员中所占权重为,乙队队员在所有队员中所占权重为则
甲、乙两队全部队员的平均体重为,
甲乙两队全部队员的体重的方差为
小结
方差、标准差:
方差:给定一组数据,用表示这组数据的平均数,则:
标准差:方差的算术平方根,即
总体方差、标准差:
总体方差:,
总体标准差: