4.3数据的分类 课件(共22张PPT)--2025-2026学年湘教版八年级数学下册(新教材)

文档属性

名称 4.3数据的分类 课件(共22张PPT)--2025-2026学年湘教版八年级数学下册(新教材)
格式 pptx
文件大小 11.0MB
资源类型 试卷
版本资源 湘教版
科目 数学
更新时间 2026-04-09 00:00:00

图片预览

文档简介

(共22张PPT)
湘教版(新教材)数学8年级下册培优备精做课件4.3数据的分类第4章数据的分析授课教师:Home .班级:八年级(---)班.时间:.#湘教版数学八年级下册4.3数据的分类练习题班级:________姓名:________得分:________时间:30分钟##一、基础选择题(每题3分,共15分)1.按数据的收集方法,数据可分为()A.平均数、中位数、众数B.原始数据、整理后的数据C.分类数据、顺序数据D.观测数据、实验数据2.下列属于**分类数据**的是()A.身高170cmB.考试成绩90分C.性别:男、女D.年龄15岁3.下列属于**顺序数据**的是()A.颜色:红、黄、蓝B.成绩等级:优、良、中、及格、不及格C.班级人数D.气温25℃4.下列属于**数值型数据**的是()A.水果种类B.血型C.一周内每天的气温D.衣服尺码(大、中、小)5.关于数据分类,下列说法错误的是()A.分类数据没有大小顺序B.顺序数据有先后、优劣之分C.数值型数据可以进行加减运算D.所有数据都只能用数字表示##二、填空题(每题3分,共15分)1.数据按计量层次可分为:________、________、________。2. ________数据只能区分类别,不能比较大小;________数据不仅能分类,还能排序。3.可以进行加减运算,有实际数值大小的数据称为________。4.按收集方法,数据可分为________数据和________数据。5.举例:-分类数据:________________-顺序数据:________________-数值型数据:________________##三、解答题(共70分)1.(10分)判断下列数据分别属于分类数据、顺序数据还是数值型数据:(1)班级同学的血型(2)学生的数学考试分数(3)产品质量等级:一等品、二等品、三等品(4)同学们喜欢的运动项目(5)每月的降水量2.(15分)指出下列数据属于观测数据还是实验数据:(1)记录一周内每天的最高气温(2)通过浇水实验观察植物生长高度(3)统计班级同学的身高(4)对比两种肥料对小麦产量的影响(5)调查同学们每天的睡眠时间3.(15分)某班同学对“最喜欢的学科”调查结果:语文、数学、英语、数学、语文、体育、数学、英语、体育、语文(1)这属于哪类数据?(2)整理出各类别的人数;(3)说出这类数据的特点。4.(15分)某商场对顾客满意度调查:非常满意、满意、一般、不满意(1)这属于哪类数据?(2)这类数据与分类数据有什么区别?(3)这类数据能计算平均数吗?为什么?5.(15分)收集你身边的3组数据,分别属于:(1)分类数据(2)顺序数据(3)数值型数据写出数据并说明理由。---###参考答案一、1.D 2.C 3.B 4.C 5.D二、1.分类数据、顺序数据、数值型数据2.分类,顺序3.数值型数据4.观测,实验5.略(合理即可)三、略(根据定义判断、说明即可)需要我给你整理一份**4.3数据分类超简记忆口诀**,方便复习吗?某田径队10名运动员跳远的最好成绩如下:
编号 ① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨ ⑩
成绩/m 5.85 6.13 6.11 6.01 5.91 6.19 5.81 5.84 6.22 5.98
教练组拟根据这组数据将队员分为两组进行分层训练,应当如何划分呢?
一种划分的方法是,使得每一组的数据比较稳定,即每一组数据的组内差异小,组间差异大.
1
数据分类
一般地,设一组数据为 x1,x2,…,xn,它的平均数为 ,离差平方和为 S2. 如果把这组数据分为两组,前 m 个数据为第一组,后 (n-m) 个数据为第二组,第一组的平均数记作 ,第二组的平均数记作 , 令
知识要点
其中 为组内离差平方和,反映承两个组内数据的离散程度,
为组间离差平方和,反映了两组数据之间的差异程度.
数学上已经证明
=+.
x1,x2,…,xm,xm+1,xm+2,…,xn
m个
(n-m)个
平均数
平均数
将上述 10 名运动员跳远的最好成绩的数据从小到大排列,得 5.81,5.84,5.85,5.91,5.98,6.01,6.11,6.13,6.19,6.22.
于是可以尝试把前 5 个数据作为第一组,后5个数据作为第二组,且将第一组数据的平均数记作 ,第二组数据的平均数记作 ,将这10个数据的平均数记作 .
观察上述数据,前 5 个数据相差不多,后 5 个数据也相差不多.
5.81,5.84,5.85,5.91,5.98,
6.01,6.11,6.13,6.19,6.22.
= (5.81 + 5.84 + 5.85 + 5.91 + 5.98) = 5.878,
= ( 6.01 + 6.11 + 6.13 + 6.19 + 6.22) = 6.132,
= ( 5.81 + 5.84 + 5.85 + 5.91 + 5.98 + 6.01 + 6.11
+ 6.13 + 6.19 + 6.22)
= 6.005.
= (5.81 - 5.878) + (5.84 - 5.878) + (5.85 - 5.878)
+(5.91 - 5.878) + (5.98 - 5.878) +(6.01 - 6.132)
+(6.11 - 6.132) +(6. 13 - 6.132) +(6.19 - 6.132)
+(6.22 - 6.132)
= 0.04476.
组间离差平方和 为
因此组间离差平方和 为
= 5×(5.878 - 6.005) + 5×(6.132 - 6.005)
= 0.16129.
S2 = (5.81 - 6.005) + (5.84 - 6.005) +(5.85 - 6.005)
+(5.91 - 6.005) +(5.98 - 6.005) +(6.01 - 6.005)
+(6.11 - 6.005) +(6.13 - 6.005) +(6.19 - 6.005)
+(6.22 - 6.005)
= 0.206 05.
于是

在大数据分析中,数据的分组是重要的方法之一.虽然可以有多种方法对数据进行分组,但是,使得“组内离差平方和最小”的方法是最传统的,也是 非常合理的.
思考:上述分组符合“组内离差平方和最小”的原则吗
按照组内离差平方和最小的原则,应保证跳远最好成绩相差不多的运动员在一个组.将从小到大排列后的 10 个数据依次分为两组,有下面 9 种情况:
对上面的分组,可以利用计算机设计算法、编写程序,然后依次计算组内 离差平方和(前面已经计算出第一组、第二组各5个数据的组内离差平方和), 得到下表(结果保留四位小数):
第一组 1 个数据,第二组 9 个数据;
第一组 2 个数据,第二组 8 个数据;
···;
第一组 9 个数据,第二组 1 个数据.
分组情况 组内离差平方和
第一组1个,第二组9个 0.163 8
第一组2个,第二组8个 0.125 1
第一组3个,第二组7个 0.079 8
第一组4个,第二组6个 0.051 0
第一组5个,第二组5个 0.044 8
第一组6个,第二组4个 0.040 7
第一组7个,第二组3个 0.074 8
第一组8个,第二组2个 0.106 1
第一组9个,第二组1个 0.154 7
计算结果表明,将排序后的前 6 个数据分为一组,后 4 个数据分为另一组, 可以使组内离差平方和最小. 即应将编号为 ①④⑤⑦⑧⑩的运动员分为一组, 其他运动员为另一组进行分层训练.通过数据也可以看到,这样的分组是合理的.
【归纳总结】
数据分组的步骤:
①数据排序:从小到大排列原始数据;
②确定切割点:在排序后数据的间隔处分组
[n 个数据有 (n-1) 个间隔];
③计算比较:对每个切割点计算组内离差平方和,选择组内离差平方和最小对应的分组.
例1 10 个城市某月的每日最高温度的平均数(简称平均高温)如表所示.
城市 北京 石家庄 呼和浩特 哈尔滨 上海 广州 海口 成都 贵阳 昆明
平均高温/℃ 3 3 -3 -11 10 21 22 12 9 17
根据平均高温的组内离差平方和最小的原则,把这10个城市分为两组.
解:将表中的数据按从小到大排列,可得
-11 -3 3 3 9 10 12 17 21 22
将它们分成两组共有 9 种情况,利用计算器或信息技术工具,分别计算组内离差平方和(结果保留小数点后一位),如表所示.
分组 第一组离差平方和 第二组离差平方和 组内离差平方和
第1个间隔 0 584.2 584.2
第2个间隔 32 380.9 412.9
第3个间隔 98.7 285.7 384.4
第4个间隔 132 158.8 290.8
第5个间隔 228.8 113.2 342
第6个间隔 308.8 62 370.8
第7个间隔 397.4 14 411.4
第8个间隔 562 0. 5 562.5
第9个间隔 789.6 0 789.6
观察最后一列组内离差平方和可以发现,
当第 4 个间隔分组时,组内离差平方和最小,
因此,按组内离差平方和最小的分法为
{北京,石家庄,呼和浩特,哈尔滨}
和{上海,广州,海口,成都,贵阳,昆明}.

返回
1.
科研人员选出8株植物,在同等实验条件下,测量它们光合作用速率(单位:μmol·m-2·s-1).统计结果为35,30,23,17,20,25,32,30,若按照“组内离差平方和达到最小”法,则需先将数据由________到________排序,再将这8株植物分成两组时,共可以分成________种情况.

7
2.
某校在九年级随机抽取了若干位同学进行艺术测评与分析,下面是对九(1)班抽取到的10位同学的测评分值的数据分析过程:
10位同学的测评分值分组统计如下:
分组方式一(按平均分相同分组):
Ⅰ:80,85,85,90,100 Ⅱ:80,85,90,90,95
方式二(按分数段分组):
甲:80,80,85,85,85 乙:90,90,90,95,100
10位同学的测评分值分组数据统计量分析表:
根据以上信息,解答下面问题:
(1)将上述表格补充完整;
分组方式 方式一 方式二 组别 Ⅰ Ⅱ 甲 乙
中位数 90 85 90
众数 85 90 85
方差 46 26 6 16
组内离差平方和 组间离差平方和 离差平方和 360
110
0
250
360
(2)为深入推进小组学习,促进同学间的互帮互助、共同进步,请你根据以上信息,选择一种利于开展小组学习的分组方式,并说明你这样选择的理由.
方式二利于开展小组学习.理由如下:由表知,方式二的组内离差平方和小于方式一,更利于开展小组学习,促进同学间的互帮互助、共同进步.(答案不唯一,合理即可)
返回
{64,69,71}
返回
3.
北京时间2025年4月24日,神舟二十号载人飞船成功发射,随后神舟二十号飞行乘组顺利进入中国空间站,展示了我国在航天领域的强大实力,谱写了航天强国建设的新篇章.某校为了培养学生对航天知识的学习兴趣,开展了航天知识答题竞赛活动,现从该校八年级随机抽取10名学生的成绩:64,69,71,86,88,89,89,95,95,95.按照“组内离差平方和达到最小”的方法把这10名学生按成绩高低分成两组,当分成的两组为____________和______________________________时,得到的组内离差平方和最小,此时组内离差平方和为________.
{86,88,89,89,95,95,95}
116
4.
在苹果收获的季节,某校综合实践小组同学前往某果园开展综合实践活动,其中一个项目需要在技术人员的指导下,测量每个苹果的直径,作为样本数据.一名同学对其中10个苹果的直径进行了测量,10个苹果的直径如图.请你按照“组内离差平方和达到最小”的方法,把图中的10个苹果按直径大小分成两组.
【解】将10个数据由小到大排序:
65,69,70,75,76,76,78,80,80,81.
把10个数据分成两组,共有9种情况:第一组1个数据{65},第二组9个数据{69,…,81};第一组2个数据{65,69},第二组8个数据{70,…,81};…;第一组9个数据{65,…,80},第二组1个数据{81}.计算9种分组情况的组内离差平方和分别为146.889,98,48,74.25,98,107.583,136.095,182.375,218.
计算结果表明,第3种情况的组内离差平方和最小.因此,把10个苹果按直径大小分成的两组是{65,69,70}和{75,76,76,78,80,80,81}.
返回
数据的分组
组内离差平方和
组间离差平方和
分组原则
同课章节目录