(共23张PPT)
第三章 数据分析初步
3.4.2 四分位数与箱线图(2)
01
教学目标
02
新知导入
03
新知讲解
04
课堂练习
05
课堂小结
06
作业布置
01
教学目标
01
02
1. 能准确说出箱线图各组成部分(最小值、m25、m50、m75、最大值、异常值)的名称和意义。
2..能从箱线图中读取关键统计量,并描述数据的分布特征(如集中趋势、离散程度)。
3.能通过多组箱线图进行对比分析,并结合平均数、方差等统计量,对数据进行综合评价。
02
新知导入
人们用下面的统计图来表示四分位数所刻画的一组数据的分布特点。
如图 3-5,水平的线从下至上依次表示最小值,m25 (下四分位数),m50 (中位数),m75 (上四分位数),最大值。图中的大长方形(即 “箱子”)的高度等于m75 与m25 的差,反映了中间 50% 数据的离散程度。“箱子” 越扁,说明中间的数据越集中;“箱子” 越高,说明中间的数据越分散。这样的统计图叫作箱线图(box-plot)。
新课探究
某校七年级男生一分钟跳绳测试成绩的箱线图(单位:次)
300
250
200
150
100
50
0
新课探究
例2
观察八年级五个班学生的视力情况箱线图(图 3-6),从图中你得到哪些信息?
八年级一班~五班学生的视力情况箱线图
新课探究
解:八年级五个班学生视力的上四分位数(m75 )都为5.0,说明这五个班学生视力在5.0以上的都占了25%;二班学生视力的中位数最小,即仅一半学生的视力在4.2之上;一班学生视力最大值和最小值的间距最大,说明这个班学生视力的差距较大,而五班学生视力的差距相对较小。
箱线图大多用于多组数据的比较。箱体越扁,中间的竖线(也就是常说的 “须”)越短,说明数据越集中。
新课探究
例3
科技创新是提高社会生产力和综合国力的战略支撑。根据创新评价体系,获得 A、B 两个团队12种同类科技产品的创新贡献率(单位:%)如下:
团队A:28.97,22.58,27.15,7.87,13.57,19.78,13.07,11.87,21.27,13.56,20.31,21.51
团队B:15.47,19.11,17.46,16.58,17.64,20.12,20.34,20.83,15.06,14.93,16.85,14.28。
请评价团队A和团队B的创新水平。
新课探究
分析:可以通过分析两个团队科技产品的创新贡献率的集中趋势和离散程度来评价两个团队的创新水平,还可以通过箱线图对两个团队的创新水平进行直观比较。
解:分别计算 A、B 两个团队同类科技产品创新贡献率的平均数和方差,如表 3-13。
表 3-13 A、B 两个团队同类科技产品创新贡献率的平均数和方差
团队 平均数 方差s2
A 18.46 38.16
B 17.39 4.73
新课探究
由平均数和方差可见,团队A与团队B同类科技产品创新贡献率的平均数相近,但团队A的方差较大。总体上看,团队B的产品创新贡献率比较稳定。
将两个团队的产品创新贡献率从小到大排列:
团队A:7.87,11.87,13.07,13.56,13.57,19.78,20.31,21.27,21.51,22.58,27.15,28.97
团队B:14.28,14.93,15.06,15.47,16.58,16.85,17.46,17.64,19.11,20.12,20.34,20.83
它们的四分位数及最小值和最大值见表 3-12,箱线图如图 3-7。
(注:箱线图可用相关软件绘制,有兴趣的同学试一试)
新课探究
表 3-14 A、B 两个团队同类科技产品创新贡献率的四分位数及最小、最大值
团队 最小值 m25 m50 m75 最大值
A 7.87 13.32 20.05 22.05 28.97
B 14.28 15.27 17.16 19.62 20.83
新课探究
由箱线图(图 3-7)可见,团队A的科技产品创新贡献率的中位数和最大值明显高于团队B,最小值明显比团队B低,说明团队 A 的科技产品创新贡献率波动较大,有些产品创新水平高,但有些产品创新水平低。团队B的科技产品创新贡献率比较稳定,所有产品都有一定的创新性。两个团队在创新贡献率方面虽有差异,但都能在科技创新方面作出贡献。
04
课堂练习
【知识技能类作业】必做题:
1.箱线图中的“须”通常延伸到的位置是( )
A.除异常值外的最小值和最大值
B.m25和m75
C.最大离差和最小离差
D.平均值加减标准差
A
04
课堂练习
【知识技能类作业】选做题:
2.由某设备的一组测试数据绘制成的箱线图如图所示,则这组数据的最大值是 ,最小值是 ,上四分位数m75是 ,中位数m50是 ,极差是 ,四分位距是 。
-52,-100,-63,-68,48,21
04
课堂练习
【综合拓展类作业】
3.如图是甲、乙两地在某一个月(30天)中日平均气温的箱线图。
(1)推测这个月的日平均气温波动较大的是 (填“甲地”或“乙地”)。
(2)请通过箱线图估计甲地该月气温在10~20 ℃范围内的天数。是否可以通过箱线图推断乙地该月气温在10~20 ℃范围内的天数一定比甲地多?
04
课堂练习
【综合拓展类作业】
解:(1)甲地
(2)能推断。理由如下:
由箱线图可得甲地该月气温在10~20℃范围内的天数占该月的50%,30×50%=15,故甲地该月气温在10~20℃范围内的天数为15。
由箱线图可得乙地该月气温在10~20℃范围内的天数占该月的百分比超过75%,即乙地该月气温在10~20℃范围内的天数不少于23天,故乙地该月气温在10~20℃范围内的天数一定比甲地多。
05
课堂小结
1.经历从四分位数到箱线图的建构过程,体会 “抽象概念可视化” 的统计思想。
2.通过小组合作解读箱线图,学习有条理地表达自己的数据分析结果。
3.在评价团队创新水平的活动中,掌握 “多角度、多维度”分析实际问题的方法。
06
作业布置
【知识技能类作业】必做题:
1.若箱线图的箱体很高,则最有可能的情况是( )
A.数据集中
B.数据分散
C.数据对称
D.数据有异常值
B
06
作业布置
【知识技能类作业】选做题:
返回
2.随着冬季运动的兴起,某校举办了一次“冬季运动会”知识竞赛,已知一班和二班人数相等,此次竞赛中两班成绩的箱线图如图所示(注:箱体中部的“×”表示平均值),则下列说法正确的是( )
A.一班成绩比二班成绩集中
B.一班成绩的上四分位数是100分
C.一班有同学的成绩超过140分
D.一班的平均分高于二班的平均分
B
06
作业布置
【综合拓展类作业】
3.甲、乙两组的某一项测试成绩(单位:分)如下:
甲:91,96,70,89,60,70,100,80,92,98;
乙:92,93,70,88,82,75,96,80,92,95。
(1)求甲组成绩的四分位数。
(2)根据四分位数可绘制如图的箱线图,观察图中乙组的箱线图,绘制甲组的箱线图。
(3)根据你对箱线图和四分位数的理解,
谈谈你对两组成绩的看法。
06
作业布置
【综合拓展类作业】
解:(1)将甲组的成绩从小到大排列为60,70,70,80,89,91,92,96,98,100,
∴m25=70,m50==90,m75=96。
(2)根据甲组的四分位数绘制箱线图如答图:
(3)根据箱线图和四分位数可知甲组成绩的中位数和乙组相同,甲组成绩分布比乙组分散。
Thanks!
https://www.21cnjy.com/recruitment/home/fine