(共25张PPT)
第2课时 箱线图
第六章 数据的分析
2.中位数与箱线图
情境导入
壹
目
录
课堂小结
肆
当堂达标
叁
新知初探
贰
情境导入
某班级数学考试成绩:
50, 60, 65, 70, 75, 80, 85, 90, 95······
问题引导:
提问1:如何描述这组数据的分布情况?
提问2:除了平均数和中位数,还有哪些统计量可以帮助我们分析数据?
叁
叁
肆
叁
壹
新知初探
贰
新知初探
探究一:四分位数
贰
在百分位数中,除了最小值与最大值外,我们尤为关注25%分位数、50%分位数、75%分位数,它们把一组数据分为个数相等的四部分,因此分别称为下四分位数、中位数和上四分位数,记为m25,m50,m75,统称四分位数。
那么,如何计算一组数据的四分位数呢
新知初探
贰
例 某市12月16—31日每日的最高气温(单位:℃)依次如下:
5, 3, 2, 2, 2, 2, 3, 3, 5, 5, - 2, - 2, - 5, - 1, - 1, - 1。求这组数据的四分位数m25, m50, m75。
解:将这16个数据由小到大排序:
-5 - 2 - 1 - 1 - 1 - 1 2 2-1 2 2 3 3 3 5 5 5
中位数即50%分位数,因此
新知初探
贰
前一半数据的中位数为整组数据的下四分位数,故
后一半数据的中位数为整组数据的上四分位数,故
新知初探
贰
1. 有一组数据:3, 5, 7, 9, 11, 13, 15,求这组数据的下四分位数(Q1)、中位数(Q2)和上四分位数(Q3)
随堂练习
2.在一次体育测试中,10 名学生的跳远成绩(单位:米)分别为:4.5, 4.8, 5.0, 5.2, 5.5, 5.8, 6.0, 6.2, 6.5, 6.8。请根据这些数据,确定成绩处于下四分位数以下的学生人数。
Q1=5
Q2=9
Q3=13
2人
新知初探
探究二:箱线图
贰
尝试思考
老师记录了全班40名学生1 min 跳绳的次数:
132 136 144 162 144 115 132 136 123 144
136 136 132 159 136 144 129 136 139 153
123 133 144 137 152 138 136 129 129 134
138 149 125 128 128 133 138 134 148
新知初探
贰
(1)求全班学生1min跳绳次数的最小值、下四分位数、中位数、上四分位数和最大值。
解:将40名学生1分钟跳绳的次数从小到大排列为:115,123,123,125,128,128,129,129,129,132,132,132,133,133,134,134,136,136,136,136,136,136,136,137,138,138,138,139,144,144,144,144,144,148,149,152,153,159,162
最小值为:115
最大值为:162
新知初探
贰
(2)老师绘制了如图6-7所示的统计图。你能读懂这个统计图吗 图中出现了5条横线,分别对应5个数据,它们是怎样的数据 你认为这个统计图是如何画出的
最大值
最小值
中位数
上四分位数
下四分位数
新知初探
贰
(3)根据图6-7,中间的“箱子”被136分成了两部分,其中“下半截箱子”比较短,这说明什么
“下半截箱子” 比较短,说明下四分位数与中位数之间的距离相对较小。即班级中有 25% 的数据集中在相对较小的范围内,且靠近中位数 136。这意味着跳绳次数在 132(下四分位数)到 136(中位数)之间的学生人数相对较少。
新知初探
贰
在全班学生1分钟跳绳次数的数据中,存在159、162等较大的极端值,这些较大的值会对平均数产生向上的拉动作用,而中位数不受这些极端值的影响。所以可以估计全班学生1分钟跳绳次数的平均数大于中位数。
(4)请你估计一下,全班学生1min跳绳次数的平均数和中位数哪个大
新知初探
贰
知识要点
图 6-7所示的这种统计图叫作箱线图。箱线图有时也画成如图 6-8所示的形式。
新知初探
贰
观察思考
为了反映全班学生1min跳绳次数的整体情况,小颖和小亮分别画出了图6-9 和图6-10。
问题:在图6-9的直方图中,数据的分布有什么特点 图6-10的箱线图是否也反映了数据的这种特征
新知初探
贰
知识要点
(1)图6-11是同一班级学生两次1min跳绳成绩的箱线图。该班学生第二次跳绳成绩有什么变化 你是如何得出结论的
新知初探
贰
1.第一次跳绳成绩的中位数是 136,第二次跳绳成绩的中位数是 153,中位数增大,说明第二次跳绳成绩的中间水平比第一次高。
2.第一次跳绳成绩的四分位距(上四分位数 144 减去下四分位数 132 )为 12;第二次跳绳成绩的四分位距(上四分位数 160 减去下四分位数 146 )为 14,且第二次跳绳成绩的最大值 181 与最小值 130 的差值也比第一次(最大值 162 与最小值 115 的差值 )大,说明第二次跳绳成绩的数据分布更分散。
2.从箱线图看,第二次跳绳成绩的上半部分(大于中位数部分)相对第一次更长,说明第二次跳绳成绩在高分段的人数比第一次多。
变 化 如 下
新知初探
贰
1.能直观展示数据分布特征:通过箱线图的箱子,可以直观地看出数据的集中趋势(中位数)、离散程度(四分位距和全距)以及数据的偏态性(箱子上下部分的长短)。
2.能识别异常值:箱线图能清晰地标记出异常值,超出须的范围的点即为异常值,便于分析数据中是否存在特殊情况。
3.数据信息简洁明了:相比于大量原始数据,箱线图用几个关键数值(最小值、下四分位数、中位数、上四分位数、最大值 )就能概括数据的主要特征,便于不同数据集之间的比较。
(2)你认为箱线图在表示数据方面有什么特点 与同伴进行交流。
当堂达标
叁
当堂达标
1.一组数据的箱线图中,若下半截箱子明显比上半截箱子短,说明该组数据( )
A. 大部分数据集中在较小值一端
B. 大部分数据集中在较大值一端
C. 数据分布均匀
D. 存在较多异常值
2.一组数据为 3, 5, 7, 9, 11, 13, 15,其下四分位数是 .
3.若一组数据的箱线图中箱子长度较短,说明数据的 较小。
离散程度
B
5
叁
叁
肆
叁
叁
当堂达标
叁
4.某公司员工的月薪数据绘制箱线图后,发现存在一些异常值,这些异常值是月薪特别高的几位高管。若去掉这些异常值,箱线图中的哪些特征值可能会发生变化,如何变化?
解:最大值会变小,因为去掉了月薪特别高的高管数据。
上四分位数可能会变小,因为去掉较大值后,排序会改变,使得上四分位数对应的数值变小。
中位数和下四分位数有可能不变,如果这些高管数据原本在中位数和下四分位数排序之外 ,则不受影响;也有可能改变,如果去掉这些数据后,原有的排序发生变化。
最小值不变,因为去掉的是较大值,对最小值无影响。
叁
叁
肆
叁
叁
课堂小结
肆
课堂小结
肆
肆
箱线图
四分位数
箱线图的定义
箱线图的应用
箱线图图的特征
叁
叁
肆
叁
肆
课后作业
基础题:1.课后习题 第 2,7,8题。
提高题:2.请学有余力的同学完成课后习题第9题
谢
谢