(共14张PPT)
华师版 八年级 数学(下)
第19章 数据的分析
19.3 借助箱线图描述数据的分布
1. 我们学过哪些统计图表?
条形图、折线图、扇形图
旧知回顾
2.描述一组数据的“集中趋势”可以用哪些统计量?
平均数、中位数
探究新知
知识模块一 频数分布表与直方图
思考:
问题1 某市去年4月30 天的空气质量指数(AQI)如下:
60,39,65,82,60,89,109,81,73,69 , 103,156,62,41,55,123,164,73,45,90,64,54,70,59,73,86,91,58,63,82.
怎样描述该市去年4月AQI的分布情况呢
观察表 (AQI频数分布表)和图 (频数分布直方图):
AQI(x) 25<x≤50 50<x≤75 75<x≤100 100<x≤125 125<x≤150 150<x≤175
频数 3 15 7 3 0 2
表 某市去年4月AQI的频数分布表
某市去年4月AQI的频数分布直方图
1.解读频数分布表
AQI(x) 25<x≤50 50<x≤75 75<x≤100 100<x≤125 125<x≤150 150<x≤175
频数 3 15 7 3 0 2
频数含义:每组对应的“天数”(如50结论:该市6月AQI分布“中间多、两头少”,约77%的天数AQI处于50~100(良).
区间划分:将AQI分为4组,分别为252.解读频数分布直方图
横轴:AQI区间;纵轴:频数(天数);
某市去年4月AQI的频数分布直方图
特征:直方图的“条形高度”对应频数,能直观看出数据的集中区间(50探究新知
知识模块二 四分位数与箱线图
1.四分位数的概念与计算
以30个AQI数据为例:
步骤1:将数据从小到大排列;
步骤2:找中位数(总体50%的位置):处在中间的两个数据72和74的平均数,即73;
步骤3:找下四分位数(总体25%的位置):左侧的15个数据的中位数,即61;
步骤4:找上四分位数(总体75%的位置):右侧的15个数据的中位数,即89.
2.箱线图的结构与解读
观察下表和图 (AQI箱线图):
箱线图包含5个关键值:最小值(33)、下四分位数(61)、中位数(73)、上四分位数(89)、最大值(115);
分布分析:
约50%的天数AQI处于61~89之间;
约25%的天数AQI低于61,约25%高于89;
箱体“上半部分(73~89)高度大于下半部分(61~73)”,说明上半部分数据波动略大.
思考:
要寻找以下信息,借助频数分布直方图还是箱线图?
1.该市去年6月AQI的最小值和最大值;
2.按AQI排序分段后,天数最多或最少的那一段;
3.该市去年6月AQI不超过75的天数;
4.该市去年6月空气质量最好的七八天里,AQI的变化范围.
小组结论:________适合找极值、分段天数;
_________________适合找区间天数、局部变化范围.
箱线图
频数分布直方图
课堂小结
1.能直观展示数据分布特征:通过箱线图的箱子,可以直观地看出数据的集中趋势(中位数)、离散程度(四分位距和全距)以及数据的偏态性(箱子上下部分的长短)。
2.能识别异常值:箱线图能清晰地标记出异常值,超出须的范围的点即为异常值,便于分析数据中是否存在特殊情况。
3.数据信息简洁明了:相比于大量原始数据,箱线图用几个关键数值(最小值、下四分位数、中位数、上四分位数、最大值 )就能概括数据的主要特征,便于不同数据集之间的比较。
箱线图在表示数据方面的特点
随堂检测
1.某公司员工的月薪数据绘制箱线图后,发现存在一些异常值,这些异常值是月薪特别高的几位高管。若去掉这些异常值,箱线图中的哪些特征值可能会发生变化,如何变化?
解:最大值会变小,因为去掉了月薪特别高的高管数据。
上四分位数可能会变小,因为去掉较大值后,排序会改变,使得上四分位数对应的数值变小。
中位数和下四分位数有可能不变,如果这些高管数据原本在中位数和下四分位数排序之外 ,则不受影响;也有可能改变,如果去掉这些数据后,原有的排序发生变化。
最小值不变,因为去掉的是较大值,对最小值无影响。
2.一组数据的箱线图中,若下半截箱子明显比上半截箱子短,说明该组数据( )
A. 大部分数据集中在较小值一端
B. 大部分数据集中在较大值一端
C. 数据分布均匀
D. 存在较多异常值
B