(共23张PPT)
第3章 数据分析初步
3.3离差平方和与方差(第2课时)
(浙教版)八年级
下
01
教学目标
02
新知导入
03
新知讲解
04
课堂练习
05
课堂小结
06
板书设计
01
教学目标
01
02
经历数据分类的活动,知道按照组内离差平方和最小的原则对数据进行分类的方法。
体会样本与总体的关系,能用样本方差估计总体方差,感悟通过样本特征估计总体特征的思想,形成数据观念,发展模型观念。
02
章节导入
在许多大型的文艺比赛中,统计评委的评分时,为什么要去掉一个最高分和一个最低分
三峡工程是具有水资源利用、发电、航运等综合效益的特大水利枢纽工程。
如果我们获得大坝下闸蓄水前后8个地点的水位海拔,可以用什么统计量来说明三峡工程对长江水位变化的影响?通过计算大坝下闸蓄水后水位海拔的方差,为长江出现“高峡出平湖”景象作出解释。
本章将学习刻画数据特征的平均数、中位数、众数、离差平方和与方差。在此基础上,我们还将学习四分位数和箱线图等。通过本章的学习,我们将对数据的作用有更多的认识,能够对统计的结果作出判断和预测。
02
新知导入
1.离差平方和:
样本中,各数据与平均数的差(又称离差)的平方和称为
离差平方和,记为 。
2.方差:
一般地,一组数据的各离差的平方的平均数叫作这组数据
的方差,记为 。
3.标准差:
03
新知讲解
合作学习
某校运动队有5名同学准备参加跳高比赛,他们的跳高最好成绩如下:
为了让队员能更有效地进行赛前训练,教练计划将5名同学按他们的跳高成绩的高低分成两组。怎样分组比较合理?
将5名队员的跳高成绩按从小到大排列:1.58,1.63,1.65,1.75,1.78。将这些数据表示在数轴上,如图3-4。显然,应把相对集中的数据分在一组,例如,分成{1.58,1.63,1.65},{1.75,1.78}两组。
03
新知讲解
合作学习
5名队员的跳高成绩分成2组,共有4种情况,设各组的离差平方和分别为
,,计算+。见表。
可以发现,将数据分成{1.58,1.63,1.65},{1.75,1.78}两组时,+最小。所以将队员分成{队员 1,队员 3,队员 4},{队员 2,队员 5}两组,组内同学的跳高水平最接近。
03
新知讲解
合作学习
组内离差平方和与组间离差平方和:
一般地,设有个数据,,, ,,它们的平均数为 ,离差平方和为。如果把这些数据分为两组,第1组有 个数据,平均数为,离差平方和为;第2组有个数据,平均数为 ,离差平方和为,其中。
通过计算可以得到以下等式
通常称 为组内离差平方和,它表达了两个组组内数据的离散程度;
称 为组间离差平方和,它表达了两个组之间的差异。#3.1.2
03
新知探究
归纳总结
数据分组原则:
合理的分组原则是使 最小,同时使最大。
由于总离差平方和 不变,所以只需考虑 最小,即组内离差平方和最小即可。
特别说明:在大数据分析中,数据分组是重要的方法之一。数据分组方法有许多种,其中使得“组内离差平方和最小”的方法最为常见。
03
新知讲解
例2
国家有关部门根据各地的人均耕地面积数据进行分类研究,制定切合各地实际的政策。带着这个问题,统计学兴趣小组的同学收集了我国10个地区的人均耕地面积数据,如表3-9。
如果将这 10个地区分成两组,尽可能使同组内各地区的人均耕地面积接近、不同组地区的人均耕地面积差异较大,应如何分组?
离差平方和的计算量比较大,我们可以借助计算机软件或者自己设计算法、编写程序来解决。
03
新知讲解
例2
解:将这 10 个地区的人均耕地面积从小到大排列,依次为 0.1,0.2,0.3,0.6,0.6,1.8,2.0,2.3,3.2,4.2。
将这些数据分成两组,有以下 9 种情况,
分别计算各种情况的组内离差平方和,
得到表3-10:
03
新知讲解
例2
计算结果表明,将数据分成{0.1,0.2,0.3,0.6,0.6}和{1.8,2.0,2.3,3.2,4.2}两组时,组内离差平方和最小,即组内人均耕地面积数据波动最小,两组之间数据差异最大。所以将上海、广东、福建、江苏、安徽分在一组,其余地区分在另一组比较合理。
04
课堂练习
基础题
1. 在分组时要求“组内离差平方和最小”,其目的是( B )
A. 使每组数据量相等
B. 使每组组内数据差异尽可能小,组间数据差异尽可能大
C. 减少计算复杂度
D. 保证组间的平均数相等
B
2.把5个数据-1,3,1,5,4分成{-1,1}和{3,4,5}两组,则这种分组情况的组内离差平方和为 4 .
4
04
课堂练习
基础题
3. 某小组8名学生的数学考试成绩(单位:分)分别为88,98,87,92,92,90,91,96,老师决定将这些成绩分为两组,以便更好地分析学生的成绩分布.若按照以下分组方式:第一组{87,88,90,91,92,92},第二组{96,98},求组内离差平方和.
解:第一组数据的平均数为(87+88+90+91+92+92)÷6=90,
第一组数据的离差平方和为(87-90)2+(88-90)2+…+(92-90)2=22,
第二组数据的平均数为(96+98)÷2=97,第二组数据的离差平方和为(96-97)2+(98-97)2=2,所以组内离差平方和为22+2=24
04
课堂练习
提升题
把数据2,8,10,4,12按大小顺序分成两组,能使“组内离差平方和达到最小”的是( B )
A. {2},{4,8,10,12} B. {2,4},{8,10,12}
C. {2,4,8},{10,12} D. {2,4,8,10},{12}
B
04
课堂练习
拓展题
按照“组内离差平方和达到最小”的方法,把如图所示的10个苹果按直径大小分成两组.
解:将10个数据按照从小到大排序为65,69,70,75,76,76,78,80,80,81,把10个数据分成两组,共有9种情况,分别计算各种情况的组内离差平方和,如下表(结果保留整数):
04
课堂练习
拓展题
组 序 分组情况 组内离差
平方和
第1组 第2组 1 65 69,70,75,76,76, 78,80,80,81 147
2 65,69 70,75,76,76, 78,80,80,81 98
3 65,69,70 75,76,76, 78,80,80,81 48
04
课堂练习
拓展题
4 65,69,70,75 76,76,78,80,80,81 74
5 65,69,70,75,76 76,78,80,80,81 98
6 65,69,70,75,76,76 78,80,80,81 108
7 65,69,70,75, 76,76,78 80,80,81 136
8 65,69,70,75, 76,76,78,80 80,81 182
04
课堂练习
拓展题
9 65,69,70,75,76, 76,78,80,80 81 218
计算结果表明,将数据分成{65,69,70}和{75,76,76,78,80,80,81}两组时,组内离差平方和最小
05
课堂小结
1.组内离差平方和与组间离差平方和:
一般地,设有个数据,,, ,,它们的平均数为 ,离差平方和为。如果把这些数据分为两组,第1组有 个数据,平均数为,离差平方和为;第2组有个数据,平均数为 ,离差平方和为,其中。
通过计算可以得到以下等式
通常称 为组内离差平方和,它表达了两个组组内数据的离散程度;
称 为组间离差平方和,它表达了两个组之间的差异。
2.数据分组原则:
合理的分组原则是使 最小,同时使最大。
由于总离差平方和 不变,所以只需考虑 最小,即组内离差平方和最小即可。#3.1.2
06
板书设计
3.3离差平方和与方差(第2课时)
1.组内离差平方和与组间离差平方和:
2.数据分组原则:
Thanks!
https://www.21cnjy.com/recruitment/home/fine