(共32张PPT)
沪科版数学8年级下册培优备课课件(精做课件)20.5数据分组第20章数据的初步分析授课教师:Home .班级:八年级(*)班.时间:.沪科版数学八年级下册20.5数据分组练习题班级:________姓名:________得分:________一、选择题(每题10分,共30分)1.下列关于数据分组的说法,正确的是()A.数据分组时,组距可以随意设定,无需考虑数据特点B.数据分组的核心是将杂乱的数据整理成有序的组,便于分析C.分组时,每组的范围可以重叠D.组数越多,分组结果越合理2.已知一组数据的最大值为98,最小值为36,若组距为10,则组数为()A. 6 B. 7 C. 8 D. 93.数据分组时,下列分组方式合理的是()A. 10~20,20~30,30~40(每组含最小值,不含最大值)B. 10~20,21~30,31~40(每组范围不连续)C. 10~25,25~35,35~45(组距不统一)D. 10以下,10~20,20以上(无明确组距)二、填空题(每题10分,共30分)1.数据分组的两个关键要素是________和________。2.若一组数据的最大值为85,最小值为23,组距为12,则应分为________组(结果取整数)。3.分组时,为了避免数据重复统计,通常采用“________”的原则(即每组含最小值,不含最大值)。三、解答题(40分)某班30名学生的数学测试成绩(单位:分)如下:58,65,72,80,91,63,75,82,93,59,68,76,85,90,60,70,78,88,81,66,73,83,79,69,71,86,77,84,62,74。(1)找出这组数据的最大值和最小值,计算极差;(2)若组距取10,确定分组范围并列出分组;(3)统计每组的频数,完成简单的频数分布表。参考答案:一、选择题:1.B 2.B 3.A二、填空题:1.组距,组数2. 6 3.含最低不含最高三、解:(1)最大值=93分,最小值=58分,极差=最大值-最小值=93-58=35(分);答:这组数据的最大值为93分,最小值为58分,极差为35分。(2)组距=10,组数=极差÷组距=35÷10=3.5,取整数为4组;分组范围(含最低不含最高):50~60,60~70,70~80,80~90,90~100;答:分组为50~60,60~70,70~80,80~90,90~100。(3)频数统计及频数分布表:50~60分:2人(58,59);60~70分:6人;70~80分:10人;80~90分:8人;90~100分:4人;频数分布表(略,合理即可);答:各组频数分别为2、6、10、8、4,频数分布表略。数据分组
问题1 我国 10 个省份某年人均地区生产总值(简称人均 GDP,单位:万元)的数据如下表所示:
如果把这 10 个省份依据人均 GDP 的多少分为两组,并保证人均 GDP 相差不多的省份在一个组,应该如何划分
省份代号 1 2 3 4 5 6 7 8 9 10
人均GDP/万元
15.68
6.24
10.11
7.18
16.42
12.13
7.37
10.07
8.85
7.16
1
对于这个问题,为了保证人均 GDP 相差不多的省份在一个组,应该如何划分,试着讨论一下
可以选择平均数接近一些的
可以用中位数分段来划分
可以从众数的角度来划分这些数据.
按照“组内离差平方和最小”的方法,就能保证人均 GDP 相差不多的省份在一个组.
那怎样能做到组内离差平方和最小呢
一般地,假设有 n 个数据 x1 , x2 , x3 , … , x1 , 若将其分成两组,其中前 m 个数据为一组 ( 称为第一组 ), 后 ( n-m ) 个数据为一组 ( 称为第二组 )
这 n 个数据的总体离差平方和 S2 可以表示为:
知识要点
称为组内离差平方和 , 表达了两个组内数据的离散程度;
称为组间离差平方和,表达了两组数据之间的差异.
数据的分组一般步骤:
1. 第一步是排序;
2. 第二步是确定组数和各组内数据的个数,我们只讨论分两组的情形,如果一共有 n 个数据,要把较小的 m 个数据分为一组,把剩下的 (n - m) 个数据分为另一组;
3. 我们通过“组内离差平方和最小” 的原则来确定 m 的大小.
因此,我们通过计算和比较组内离差平方和,就可以将这 10 个省份分成两组,并保证人均 GDP 相差不多的省份在一个组.
这样分组后,组内的差距可以达到最小,而组与组之间的差异可以达到最大.
用电子表格软件进行数据分组
(1) 在电子表格软件中输入省份代号和人均 GDP 的数据 , 并对数据按照人均 GDP 从小到大进行排序;
用电子表格软件计算
省份代号 1 2 3 4 5 6 7 8 9 10
人均GDP/万元
15.68
6.24
10.11
7.18
16.42
12.13
7.37
10.07
8.85
7.16
2
(2) 如图,将排序后的人均 GDP 的数据根据每组
个数进行分组,通过“公式”—“插入函数”—选择类别“统计”—“DEVSQ” 函数,分别计算每组的离差平方和;
输入各组对应的函数后得到数据:
(3) 利用“SUM”函数得到组内离差平方和,如下图所示
(4) 按组内离差平方和最小来进行选择,
故分组为:第一组
{ 省份 2 ,省份 10,省份 4 , 省份 7,省份9,省份8,省份3 }
第二组
{省份 6 , 省份1 , 省份5 }.
在社会经济统计研究中,数据分组的作用在于划分现象的类型、研究总体的结构与现象之间的依存关系。
返回
小
1.科研人员选出8株植物,在同等实验条件下,测量它们光合作用速率(单位:μmol·m-2·s-1).统计结果为35,30,23,17,20,25,32,30,若按照“组内离差平方和达到最小”法,则需先将数据由________到________排序,再将这8株植物分成两组时,共可以分成________种情况.
大
7
31.25
2.现有一组数据:12,15,18,20,22,25,将其分成两组{12,15}和{18,20,22,25},求这种分组情况的组内离差平方和为________.
返回
【点拨】第1组数据{12,15}的平均数为(12+15)÷2=13.5,则离差平方和为(12-13.5)2+(15-13.5)2=4.5.第2组数据{18,20,22,25}的平均数为(18+20+22+25)÷4=21.25,则离差平方和为(18-21.25)2+(20-21.25)2+(22-21.25)2+(25-21.25)2=26.75.所以这种分组情况的组内离差平方和为4.5+26.75=31.25.
3. 北京时间2025年4月24日,搭载神舟二十号载人飞船的长征二号F遥二十运载火箭在酒泉卫星发射中心点火发射,随后神舟二十号飞行乘组顺利进入中国空间站,展示了我国在航天领域的强大实力,谱写了航天强国建设的新篇章.某校为了培养学生对航天知识的学习兴趣,开展了航天知识答题竞赛活动,现从该校八年级全部学生的成绩中随机抽取6名学生的成绩:86,81,95,89,88,89.按照“组内离差平方和达到最小”的方法把这6名学生的成绩分成两组.
【解】将6个数据由小到大排列可得81,86,88,89,89,95,将它们分为两组共有5种情况,分别计算组内离差平方和如下表:
分组 第一组离 差平方和 第二组离 差平方和 组内离差
平方和
第一组1个,第二组5个 0 45.2 45.2
第一组2个,第二组4个 12.5 30.75 43.25
第一组3个,第二组3个 26 24 50
第一组4个,第二组2个 38 18 56
第一组5个,第二组1个 45.2 0 45.2
返回
观察最后一列组内离差平方和可以发现,当按第一组2个,第二组4个分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为{81,86}和{88,89,89,95}.
4. 小荣在班上做节水意识调查,收集了班上7名同学家里上个月的用水量如下表所示:
根据用水量的组内离差平方和最小原则,把这7名同学分为两组为_________________________.
{A,B,D,G}和{C,E,F}
A B C D E F G
用水量/m3 7 5 13 6 9 11 5
【点拨】将7个数据由小到大排列,为5,5,6,7,9,11,13,不同分组情况的组内离差平方和如下表:
分组 第一组离 差平方和 第二组离 差平方和 组内离差
平方和
第一组1个,第二组6个 0
第一组2个,第二组5个 0
第一组3个,第二组4个 20
分组 第一组离 差平方和 第二组离 差平方和 组内离差
平方和
第一组4个,第二组3个 8
第一组5个,第二组2个 2
第一组6个,第二组1个 0
返回
观察最后一列组内离差平方和可以发现,当按第一组4个,第二组2个分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为{A,B,D,G}和{C,E,F}.
5.为考察某品种小麦的长势,测量了6株麦苗的高度(单位:cm),数据如下:21,26,22,24,25,24.按照组内离差平方和最小的原则,把这6个数据分成三组.
【解】将6个数据由小到大排列,为21,22,24,24,25,26,不同分组情况的组内离差平方和如下表:
分组 第1组数据 第2组数据 第3组数据 组内离差平方和
第1种 21 22 24,24,25,26
第2种 21 22,24 24,25,26 4
第3种 21 22,24,24 25,26
分组 第1组数据 第2组数据 第3组数据 组内离差
平方和
第4种 21 22,24,24,25 26
第5种 21,22 24 24,25,26
第6种 21,22 24,24 25,26 1
分组 第1组数据 第2组数据 第3组数据 组内离差
平方和
第7种 21,22 24,24,25 26
第8种 21,22,24 24 25,26
第9种 21,22,24 24,25 26
第10种 21,22,24,24 25 26
返回
观察最后一列组内离差平方和可以发现,第6种情况组内离差平方和最小,故把6株麦苗的高度分成三组是{21,22},{24,24}和{25,26}.
数据分组
总体离差平方和
利用“组内离差平方和最小”的原则进行数据分组
组内离差平方和
组间离差平方和