24.4 数据的分组
经历数据分类的活动,知道按照组内离差平方和最小的原则对数据进行分类的方法.
知识点 数据的分组
一般地,设有n个数据x1,x2,…,xn,其平均数记为,离差平方和为d2.如果把这组数据分为两组,前m(m<n)个数据为一组,后(n-m)个数据为一组,它们的平均数分别记为1和2,离差平方和分别为d和d,那么d2=(x1-)2+(x2-)2+…+(xn-)2=d+d+m(1-)2+(n-m)(2-)2.其中d+d称为 ,表示两个组内数据的 ;记d=m(1-)2+(n-m)(2-)2.d是m个第一组数据平均数、(n-m)个第二组数据平均数关于总体数据平均数的离差平方和,称为 ,表示两个组间的差异.
练习 (教材P184例题变式)6个城市某月的每日最高温度的平均数(简称平均高温)如下表所示.
城市 A B C D E F
平均高温/℃ 3 -2 -5 6 10 12
根据平均高温的组内离差平方和最小的原则,把这6个城市分为两组.
基础巩固
1.科研人员选出8株植物,在同等实验条件下,测量它们的光合作用速率(单位:μmol·m-2·s-1).统计结果为35,30,23,17,20,25,32,30,若按照“组内离差平方和达到最小”的方法分组,则需先将数据由________到________排序,再将这8株植物分成两组时,共可以分成________种情况.
能力达标
2.琪琪测量了10个苹果的直径,如图.
按照“组内离差平方和达到最小”的方法,把图中的10个苹果按直径大小分成两组.
挑战创新
3.某校根据义务教育阶段音乐、美术等学科的课程标准,在九年级随机抽取了若干位同学进行艺术测评与分析,下面是对九(1)班抽测到的10位同学的测评分值的数据分析过程.
【收集与整理】10位同学的测评分值分组统计如下:
分组方式 组别 测评分值
方式一(按平均分相同分组) Ⅰ组 80,85,85,90,100
Ⅱ组 80,85,90,90,95
方式二(按分数段分组) 甲组 80,80,85,85,85
乙组 90,90,90,95,100
【描述与分析】
10位同学测评分值的分布情况分组数据统计量分析表
分组方式 组别 中位数 众数 方差 组内离差平方和
方式一 Ⅰ组 m 85 46 360
Ⅱ组 90 90 26
方式二 甲组 85 85 6 110
乙组 90 n 16
10位同学测评分值的分布情况
根据以上信息,解答下面问题:
(1)扇形统计图中“100分”对应的圆心角的度数为________°;
(2)m=________,n=________;
【判断与决策】
(3)为深入推进小组学习,促进同学间的互帮互助、共同进步,请你根据以上信息,选择一种利于开展小组学习的分组方式,并说明你这样选择的理由.24.4 数据的分组
经历数据分类的活动,知道按照组内离差平方和最小的原则对数据进行分类的方法.
知识点 数据的分组
一般地,设有n个数据x1,x2,…,xn,其平均数记为,离差平方和为d2.如果把这组数据分为两组,前m(m<n)个数据为一组,后(n-m)个数据为一组,它们的平均数分别记为1和2,离差平方和分别为d和d,那么d2=(x1-)2+(x2-)2+…+(xn-)2=d+d+m(1-)2+(n-m)(2-)2.其中d+d称为组内离差平方和,表示两个组内数据的离散程度;记d=m(1-)2+(n-m)(2-)2.d是m个第一组数据平均数、(n-m)个第二组数据平均数关于总体数据平均数的离差平方和,称为组间离差平方和,表示两个组间的差异.
练习 (教材P184例题变式)6个城市某月的每日最高温度的平均数(简称平均高温)如下表所示.
城市 A B C D E F
平均高温/℃ 3 -2 -5 6 10 12
根据平均高温的组内离差平方和最小的原则,把这6个城市分为两组.
【解】将6个数据由小到大排序为-5,-2,3,6,10,12.
将它们分成两组共有5种情况,分别计算组内离差平方和(结果保留小数点后两位)如下:
分组 第一组离差平方和 第二组离差平方和 组内离差平方和
第1个间隔 0 124.8 124.8
第2个间隔 4.5 48.75 53.25
第3个间隔 32.67 18.67 51.34
第4个间隔 73 2 75
第5个间隔 145.2 0 145.2
计算结果表明,当按第3个间隔分组时,组内离差平方和最小,因此,按组内离差平方和最小的分法为{A,B,C}和{D,E,F}.
基础巩固
1.科研人员选出8株植物,在同等实验条件下,测量它们的光合作用速率(单位:μmol·m-2·s-1).统计结果为35,30,23,17,20,25,32,30,若按照“组内离差平方和达到最小”的方法分组,则需先将数据由________到________排序,再将这8株植物分成两组时,共可以分成________种情况.
【答案】小 大 7
能力达标
2.琪琪测量了10个苹果的直径,如图.
按照“组内离差平方和达到最小”的方法,把图中的10个苹果按直径大小分成两组.
【解】将10个数据由小到大排序为65,69,70,75,76,76,78,80,80,81.把10个数据分成两组,共有9种情况:第一组1个数据{65},第二组9个数据{69,…,81};第一组2个数据{65,69},第二组8个数据{70,…,81};…;第一组9个数据{65,…,80},第二组1个数据{81}.
以第2种分组情况为例,计算组内离差平方和.其中,第一组有2个数据{65,69},这2个数据的平均数是67,故第一组数据的组内离差平方和d1=(65-67)2+(69-67)2=8;第二组有8个数据{70,75,76,76,78,80,80,81},这8个数据的平均数是77,故第二组数据的组内离差平方和d2=(70-77)2+(75-77)2+…+(81-77)2=90,
因此第2种分组情况的组内离差平方和d=d1+d2=8+90=98.
同理计算其他8种分组情况的组内离差平方和,结果如下:
分组情况 组内离差平方和
第一组1个,第二组9个 146.889
第一组2个,第二组8个 98
第一组3个,第二组7个 48
第一组4个,第二组6个 74.25
第一组5个,第二组5个 98
第一组6个,第二组4个 107.583
第一组7个,第二组3个 136.095
第一组8个,第二组2个 182.375
第一组9个,第二组1个 218
计算结果表明,第3种情况的组内离差平方和最小.因此把10个苹果按直径大小分成的两组是{65,69,70},{75,76,76,78,80,80,81}.
挑战创新
3.某校根据义务教育阶段音乐、美术等学科的课程标准,在九年级随机抽取了若干位同学进行艺术测评与分析,下面是对九(1)班抽测到的10位同学的测评分值的数据分析过程.
【收集与整理】10位同学的测评分值分组统计如下:
分组方式 组别 测评分值
方式一(按平均分相同分组) Ⅰ组 80,85,85,90,100
Ⅱ组 80,85,90,90,95
方式二(按分数段分组) 甲组 80,80,85,85,85
乙组 90,90,90,95,100
【描述与分析】
10位同学测评分值的分布情况分组数据统计量分析表
分组方式 组别 中位数 众数 方差 组内离差平方和
方式一 Ⅰ组 m 85 46 360
Ⅱ组 90 90 26
方式二 甲组 85 85 6 110
乙组 90 n 16
10位同学测评分值的分布情况
根据以上信息,解答下面问题:
(1)扇形统计图中“100分”对应的圆心角的度数为________°;
(2)m=________,n=________;
【判断与决策】
(3)为深入推进小组学习,促进同学间的互帮互助、共同进步,请你根据以上信息,选择一种利于开展小组学习的分组方式,并说明你这样选择的理由.
【解】(1)36
(2)85 90
(3)方式二利于开展小组学习.
理由:由表知,方式二的组内离差平方和小于方式一,更利于开展小组学习,促进同学间的互帮互助、共同进步.