2020年北京空中课堂高一数学(人教A版2019)-总体集中趋势的估计 课件(95张PPT)+教案+学习任务单

文档属性

名称 2020年北京空中课堂高一数学(人教A版2019)-总体集中趋势的估计 课件(95张PPT)+教案+学习任务单
格式 zip
文件大小 8.6MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2020-06-20 15:50:23

文档简介



教学基本信息
课题
总体集中趋势的估计
学科
数学
学段:
高中
年级
高一
教材
书名:
普通高中教科书
数学必修第二册A版
出版社:人民教育出版社
出版日期:2019

8

教学目标及教学重点、难点
本节课研究了集中趋势参数——平均数、中位数、众数
?
用平均数作为一组数据的代表,比较可靠和稳定,它与这组数据中的每一个数都有关系,对这组数据所包含的信息的反映最为充分,因而其应用最为广泛,特别是在进行统计推断时有重要的作用;但平均数计算时比较烦琐,并且容易受到极端数据的影响。
?
中位数作为一组数据的代表,不受极端数据的影响,并且求法简便,是一个反映数据“集中趋势”的位置的代表值。
?
众数利用了出现次数最多的那个值得信息,但并未告诉我们它比别的值多的程度,能传递的数据的信息较少,对极端值也不敏感。
对数值型数据集中趋势的描述,可以用平均数、中位数;而对分类型数据集中趋势的描述,可以用众数。
结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.会求样本数据的平均数、中位数、众数并理解它们的意义和作用.理解集中趋势参数的统计含义.通过对平均数、中位数、众数的学习,强化“数学抽象”、“数学运算”的核心素养.
教学过程(表格描述)
教学环节
主要教学活动
设置意图
引入
引言:为了研究总体的分布情况,前面我们研究了如何通过样本的分布规律估计总体的分布规律,但有时候,我们可能不太关心总体的分布规律,而更关注总体取值在某一方面的特征.例如,对于某县今年小麦的收成情况,我们可能更关注该县今年小麦的总产量或者平均每公顷的产量,而不是产量的分布;对于一个国家国民的身高情况,我们可能更关注身高的平均数或中位数,而不是身高的分布;等等.
数学研究的目的是解决实际问题,从实际需要的量出发,探究所要研究的数学问题,抽象出数学概念.
新课
情景引入:
引例:
假设你到人才市场去找工作,有个企业老板说“我们企业员工的年平均收入是20万”,你该如何理解这句话?
分析:平均
数据的集中趋势平均数、中位数和众数
一、原始数据的集中趋势
【探究1】假设通过抽样调查,获得100户居民某年的月均用水量如下表(单位:t):
9.0
13.614.95.94.07.16.45.419.42.02.28.613.85.410.24.96.814.02.010.52.15.75.116.86.011.11.311.27.74.92.310.016.712.012.47.85.213.62.622.43.67.18.825.63.218.35.12.03.012.022.210.85.52.024.39.93.65.64.47.95.124.56.47.54.720.55.515.72.65.75.56.016.02.49.53.717.03.84.12.35.37.88.14.313.36.81.37.04.91.87.128.010.213.817.910.15.54.63.221.6
计算样本数据的平均数、中位数和众数,并据此估计全市居民用户月均用水量的平均数、中位数和众数.
(1)
平均数:一组数据是,则这组数据的平均值为.
问题1:在这个问题中,平均数是多少?
答:.
(2)中位数:一组数据按大小依次排列,处于中间位置的那个数(或中间两数的平均数),叫做这组数据的平均数.
问题2:居民用水的中位数是多少?
答:首先将数据按从小到大的顺序排列,因为100为偶数,所以存在最中间的两位数,第50位数是6.4,第51位数是6.8,所以中位数为.
(3)
众数:一组数据中出现次数最多的那个数据叫做众数.
问题3:居民用水的众数是多少?
答:根据刚才排序后的数据,很容易得到我们有两个中位数,他们都出现了4次,所以众数有两个分别为2.0和5.5.
问题4:由此估计总体居民的月均用水量是多少?
答:由样本的数据我们估计出全市居民用户月均用水量的平均数是8.79、中位数是6.6、众数是2.0和5.5.
二、分组数据的集中趋势
【探究2】将100户居民的月均用水量分成组距相同的9组.请问,如何从频率分布表和频率分布直方图中估计这组数据的平均数、中位数和众数?
(1)平均数:
频率分布表
分组频数频率[1.2,4.2)230.23[4.2,7.2)320.32[7.2,10.2)130.13[10.2,13.2)90.09[13.2,16.2)90.09[16.2,19.2)50.05[19.2,22.2)30.03[22.2,25.2)40.04[25.2,28.2]20.02合计1001.00
问题5:加权平均数的公式是什么?它是处理什么类型的数据的平均数?
答:,其中
问题6:对比刚才的平均数公式,我们已经没有了原始数据,以区间[1.2,
4.2)为例,我们用什么数值表示这组数据的大小最合理?
说明:通过分析,选择1.2估计整组数据,会使得数值偏小,选择4.2估计整组数据,会使得数值偏大,因此使用小组数据的中点(即区间端点的平均值)会更接近于大部分数据.
追问:我们还需要求小组数据的频数吗?
说明:通过公式发现对任一个小组,频数除以数据总个数即为频率.在求平均数时,只需频率乘以小组数据的中点即可.
分组数据的平均值等于每个小组的频率与小组数据的中点的乘积,再求和.
同理可得频率分布直方图中求平均数的方法为
频率分布直方图
因此
分组数据的平均值等于每个小组的频率与小组数据的中点的乘积,再求和.
对于频率直方图中数据的平均值等于每个小长方形的面积与小组数据的中点的乘积,再求和.
答:
注意:
频率分布表中数据的平均数为8.94
频率分布直方图中数据的平均数8.96
原始数据中数据的平均数为8.79,相差不大.
(2)中位数
问题7:中位数是最中间数据(中间两个数的平均值),我们没有原始数据了,怎么定义中位数呢?联想一下百分位数,我们是否可以根据百分位数定义中位数?
说明:
第50百分位数.

一组数据中至少有50%的数据小于或等于某个值,且至少有50%的数据大于或等于这个值,则这个值为该组数据的中位数)
频率分布表
分组频数频率[1.2,4.2)230.23[4.2,7.2)320.32[7.2,10.2)130.13[10.2,13.2)90.09[13.2,16.2)90.09[16.2,19.2)50.05[19.2,22.2)30.03[22.2,25.2)40.04[25.2,28.2]20.02合计1001.00
月均用水量在
4.2t
以下的居民用户所占比例为
23%,
月均用水量在
7.2t
以下的居民用户所占比例为23%+32%=55%,因此,中位数位于[4.2,7.2)内.
所以估计月均用水量样本数据的中位数约为
6.73.
频率分布直方图
注意:
频率分布表中数据的中位数为6.73
频率分布直方图中数据的中位数6.71
原始数据中数据的中位数为6.6
众数:
频率分布表
分组频数频率[1.2,4.2)230.23[4.2,7.2)320.32[7.2,10.2)130.13[10.2,13.2)90.09[13.2,16.2)90.09[16.2,19.2)50.05[19.2,22.2)30.03[22.2,25.2)40.04[25.2,28.2]20.02合计1001.00
问题8:众数为出现次数最多的数据,在分组数据中我们能也定义频数最大的那组数据中包含众数?
说明:
分组频数频率[1.2,4.2)230.23[4.2,7.2)320.32[7.2,
28.2]450.45合计1001.00
不能,因为原则上组距越宽包含的数据有可能越多,用宽组距的频数跟窄组距的频数比较,不能凸显众数的概念——即有可能出现的次数越大.所以为了规避组距对众数的影响,我们求单位组距内频数越多,也就是单位组距内频率越大,这组就包含数据的众数.
追问:从字面意思看,众即为多,也是密,与疏密程度有关的量是什么?
分析:反映了各组样本观测数据的疏密程度.
规定:最大组的区间的中点是众数.
是频率分布直方图中各矩形的高,众数为频率分布直方图中最高矩形底边中点的横坐标.
答:众数为t
注:
频率分布表中数据的众数为5.7
频率分布直方图中数据的众数5.7
原始数据中数据的众数为2.0和5.5
由样本的分组数据我们估计出全市居民用户月均用水量的平均数是8.96、中位数是6.71、众数是5.7.
小结:
引导学生思考平均代表三个统计量
从学生已知的知识出发,利用实际生活的实例回忆初中针对这部分知识的定义.
通过计算实际问题的集中趋势,回忆平均数、中位数和众数的计算方法.利用样本的值估计总体数据.
在实际问题中,回忆如何应用平均数、中位数、众数的计算方法
掌握了原始数据的集中趋势的方法后,探究分组数据的计算方法.
先以频率分布表中平均数的计算为例,引出分组数据平均数的计算方法.
对比分组数据没有原始数据的特点,假定数据是均匀分布,得到用小组数据的中点去估计小组内的所有数据的结论.
同时根据分组数据已知的是频率的特点,探究频率、频数和数据总个数的关系,利用小组数据的中点和频率求平均数的方法.
分组数据的估计值与原始数据的精确值差别不大.体会估计的有效性.
为没有了原始数据,就不存在最中间的数据,假定所有的数据都是均匀分布的,结合百分位数的定义,得出中位数就是第50百分位数.
通过理解频率直方图中小长方形的面积即为频率的特点,体会通过从数据小到大对应小长方形的面积和判断中位数所在的长方形,再根据成比例求出具体的中位数.
分组数据的估计值与原始数据的精确值差别不大.体会估计的有效性.
有原始数据的次数最多,与频数相结合,因为组距相等,得到频率组多,也就是
频率直方图中,小长方形最高的那组数据的中间值为众数.
引导
学生利用已学到的概念探究新问题
总结概念,深化集中方式的计算方法.
例题
例1:某校从参加高一年级期末考试的学生中抽出60名学生,将其成绩(单位:分,均为整数)分成七段后画出如图所示的频率分布直方图.估计这次成绩的平均数、中位数和众数.
答:平均数为
=68.5
中位数:
所以中位数在区间[70,80)上.设中位数为y,则
解得y≈71.7,所以估计中位数是71.7分.
众数为最高小长方形的横坐标的小组数据的中点,
所以众数为.
通过对例题的分析,巩固分组数据中平均数、中位数和众数的计算方法,进一步体会每个量的特征及意义,培养学生分析问题和解决问题的能力.
新课
三、平均数、中位数和众数分析
平均数中位数众数7.78.796.62.0和5.5779.4836.62.0和5.5
(1)整体特征
问题9:数据的集中趋势有三个量可以度量,它们分别有什么优缺点?
名称优点缺点平均数能反映出更多关于样本数据全体的信息任何一个数据的改变都会引起平均数的改变,数据越“极端”,对平均数的影响越大中位数①不受少数几个极端数据的影响;②容易得到,便于利用中间数据的信息对极端值不敏感众数①体现了样本数据的最大集中点;②容易得到;③不受极端值影响.①它只能表达样本数据中很少的一部分信息;②无法客观地反映总体特征
(2)平均数、中位数
单峰
右边“拖尾”,左边“拖尾”
左图:右边“拖尾”,平均数为68.5,中位数为71.7,平均数小于中位数.
右图:左边“拖尾”,平均数为8.96,中位数为6.71,平均数大于中位数.
问题10:左右拖尾对平均数和中位数有什么影响?
分析:单峰,
平均数和中位数大体上差不多.
右边“拖尾”,平均数大于中位数.
左边“拖尾”,平均数小于中位数.
(3)集中趋势的选择
问题11:100户居民的月均用水量的问题中,用分组数据估计出的值:平均数为8.96、中位数约为6.71、众数为5.7,我们选择哪一个数据度量集中趋势呢?
提示:根据平均数、中位数和众数的特点以及需求选择符合条件的统计量表示集中趋势.比如,水利部门考虑供水量则需要用平均数,极大值要考虑到,如果只选择众数或者中位数就会出现供水量不足的情况.如果考虑大部分居民的用水情况,则只需选择众数或者中位即可.
通过一个极端大的数据,体会极端数据对平均数、中位数和众数的影响。
通过对比探究题中的图形和例1中的图像得到左右拖尾对平均数和中位数的影响.培养学生分析问题、发现问题和解决问题的能力.
例题
例2:某学校要制定高一年级的校服,学生根据厂家提供的参考身高选择校服规格.据统计,高一年级女生需要的校服规格如下表所示.
校服规格155160165170175合计频数39641679026386
如果用一个量代表该校高一年级女生所需校服的规格,那么在中位数、平均数和众数中,哪个量比较合适?
分析:校服规格是分类型数据,不能求平均数.
选择众数165作为该校高一年级女生校服的规格比较合适.
注:
对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;
对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
校服规格155160165170175合计频数39641679026386
用上表的数据估计全国高一年级女生校服规格,合理吗?
答:由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.
例3:某公司的33名职工的月工资(单位:元)如下:
职务董事长副董事长董事总经理经理管理职员人数11215320工资300002000035003000250020001500
计算平均数、中位数、众数.试问哪个统计量更能反映这个公司员工的工资水平?(精确到1元)
答:平均数为
中位数为1500.
众数为1500.
哪个统计量更能反映这个公司员工的工资水平?
分析:在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映公司员工的工资水平.
回到引例
引例:
假设你到人才市场去找工作,有个企业老板说“我们企业员工的年平均收入是20万”,你该如何理解这句话?
分析:单纯从一个平均收入20万元,不能判断这家公司的工资是高还是低,还需要借助工资的分布情况等其他信息进一步判断.
通过实际问题,体会在度量数据的集中趋势时,平均数、中位数和众数的不同作用.
总结
对本节课内容做一个回顾,形成整体的认识.并回顾探究新问题的学习方法---类比法.
作业
1.已知某市2015年全年空气质量等级如下表所示.
空气质量等级(空气质量指数AQI)频数频率优(AQI≤50)8322.8%良(50估计该市2015全年空气质量指数的平均数、中位数和第80百分位数.
2.某校举行演讲比赛,10位评委对两位选手的评分如下:

7.5
7.5
7.8
7.8
8.0
8.0
8.2
8.3
8.4
9.9

7.5
7.8
7.8
7.8
8.0
8.0
8.3
8.3
8.5
8.5
选手的最终得分为去掉一个最低分和一个最高分之后,剩下8个评分的平均数.那么,这两个选手的最后得分是多少?若直接用10位评委评分的平均数作为选手的得分,两位选手的排名有变化吗?你认为哪种评分办法更好?为什么?
3.统计你们班所有同学的身高,选择恰当的组距作频率分布直方图.计算身高的平均数、中位数和众数,并判断用哪个参数更能反映班级同学的身高.由此估计你所在的学校全体高中学生身高的集中趋势.
巩固强化本节课学习的知识方法,进一步体会集中趋势的计算方式和选择上的特点。《总体集中趋势的估计》学习任务单
【学习目标】
本节课研究了集中趋势参数——平均数、中位数、众数
?
用平均数作为一组数据的代表,比较可靠和稳定,它与这组数据中的每一个数都有关系,对这组数据所包含的信息的反映最为充分,因而其应用最为广泛,特别是在进行统计推断时有重要的作用;但平均数计算时比较烦琐,并且容易受到极端数据的影响。
?
中位数作为一组数据的代表,不受极端数据的影响,并且求法简便,是一个反映数据“集中趋势”的位置的代表值。
?
众数利用了出现次数最多的那个值得信息,但并未告诉我们它比别的值多的程度,能传递的数据的信息较少,对极端值也不敏感。
对数值型数据集中趋势的描述,可以用平均数、中位数;而对分类型数据集中趋势的描述,可以用众数。
本节课通过类比原始数据的集中趋势的计算方法,推导得出分组数据的集中趋势的计算方法,理解它们的意义和作用,并能用样本估计总体的集中趋势。通过对比它们的特点,了解在实际问题中它们的选择对决策的影响。在教学过程中培养学生的“数学抽象”和“数学运算”的核心素养。本节课共选择三道例题,考察了分组数据中平均值、中位数和众数的计算方法,以及如何选择恰当的参数代表集中趋势。
【课上任务】
1.数据的集中趋势包含哪些参数?
2.给出一组数据,如何求其平均数、中位数和众数?
3.加权平均数的公式是什么?
4.用一个数估计区间内的所有数,选择哪一个数会使得误差最小?
5.频率分布直方图中,小矩形的面积代表什么?
6.分组数据中,中位数是第几百分位数?
7.哪个量反映了各组样本观测数据的疏密程度?
8.如何求分组数据的众数?
9.极端大和极端小的数据对平均数和中位数有什么影响?
10.
数值型数据和分类型数据一般用平均数、中位数和众数中的哪个量表示?
【学习疑问】(可选)
11.哪个环节没弄清楚?
12.有什么困惑?
13.您想向同伴提出什么问题?
14.您想向老师提出什么问题?
15.没看明白的文字,用自己的话怎么说?
16.本节课有几个环节,环节之间的联系和顺序?
17.同伴提出的问题,您怎么解决?
【课后作业】
19.作业1:教材第208页
练习1,3;
1.已知某市2015年全年空气质量等级如下表所示.
空气质量等级(空气质量指数AQI)
频数
频率
优(AQI≤50)
83
22.8%
良(50121
33.2%
轻度污染(10068
18.6%
中度污染(15049
13.4%
重度污染(20030
8.2%
严重污染(30014
3.8%
合计
365
100%
估计该市2015全年空气质量指数的平均数、中位数和第80百分位数。
2.某校举行演讲比赛,10位评委对两位选手的评分如下:

7.5
7.5
7.8
7.8
8.0
8.0
8.2
8.3
8.4
9.9

7.5
7.8
7.8
7.8
8.0
8.0
8.3
8.3
8.5
8.5
选手的最终得分为去掉一个最低分和一个最高分之后,剩下8个评分的平均数.那么,这两个选手的最后得分是多少?若直接用10位评委评分的平均数作为选手的得分,两位选手的排名有变化吗?你认为哪种评分办法更好?为什么?
20.作业2
3.统计你们班所有同学的身高,选择恰当的组距作频率分布直方图.计算身高的平均数、中位数和众数,并判断用哪个参数更能反映班级同学的身高.由此估计你所在的学校全体高中学生身高的集中趋势.
【课后作业参考答案】(给出作业1的答案及过程)
练习1:
分析:
平均数
中位数:AQI≤50,频率为22.8%
AQI≤100,频率和为22.8%+33.2%=56%
则中位数在区间(50,
100]内。
中位数为
第80百分位数:AQI≤150,频率和为22.8%+33.2%+18.6%=74.6%
AQI≤200,频率和为22.8%+33.2%+18.6%+13.4%=88%
则第80百分位数在区间(150,
200]内。
第80百分位数为
练习2:分析
去掉一个最低分和一个最高分之后,两个选手的平均分为:
甲的平均分为:
乙的平均分为:
则乙排名在前。
若直接用10位评委评分的平均数作为选手的得分,则
甲的平均分为:
乙的平均分为:
两位选手的排名有变化,变为甲排名在前。
第一种方式比较好,因为甲的得分中有一个极端大的数9.9,它使得平均数偏大。(共95张PPT)
高一年级
数学
总体集中趋势的估计
平均
数据的集中趋势
假设你到人才市场去找工作,有个企业老板说“我们企业员工的年平均收入是20万”,你该如何理解这句话?
众数
平均数
中位数
一、原始数据的集中趋势
探究1
假设通过抽样调查,获得100户居民某年的月均用水量如下表(单位:t):
9.0
13.6
14.9
5.9
4.0
7.1
6.4
5.4
19.4
2.0
2.2
8.6
13.8
5.4
10.2
4.9
6.8
14.0
2.0
10.5
2.1
5.7
5.1
16.8
6.0
11.1
1.3
11.2
7.7
4.9
2.3
10.0
16.7
12.0
12.4
7.8
5.2
13.6
2.6
22.4
3.6
7.1
8.8
25.6
3.2
18.3
5.1
2.0
3.0
12.0
计算样本数据的平均数、中位数和众数,并据此估计全市居民用户月均用水量的平均数、中位数和众数.
22.2
10.8
5.5
2.0
24.3
9.9
3.6
5.6
4.4
7.9
5.1
24.5
6.4
7.5
4.7
20.5
5.5
15.7
2.6
5.7
5.5
6.0
16.0
2.4
9.5
3.7
17.0
3.8
4.1
2.3
5.3
7.8
8.1
4.3
13.3
6.8
1.3
7.0
4.9
1.8
7.1
28.0
10.2
13.8
17.9
10.1
5.5
4.6
3.2
21.6
平均数
中位数
众数
集中趋势
1.3
1.3
1.8
2.0
2.0
2.0
2.0
2.1
2.2
2.3
2.3
2.4
2.6
2.6
3.0
3.2
3.2
3.6
3.6
3.7
3.8
4.0
4.1
4.3
4.4
4.6
4.7
4.9
4.9
4.9
5.1
5.1
5.1
5.2
5.3
5.4
5.4
5.5
5.5
5.5
5.5
5.6
5.7
5.7
5.9
6.0
6.0
6.4
6.4
6.4
6.8
7.0
7.1
7.1
7.1
7.5
7.7
7.8
7.8
7.9
平均数
中位数
众数
集中趋势
中位数是
1.3
1.3
1.8
2.0
2.0
2.0
2.0
2.1
2.2
2.3
2.3
2.4
2.6
2.6
3.0
3.2
3.2
3.6
3.6
3.7
3.8
4.0
4.1
4.3
4.4
4.6
4.7
4.9
4.9
4.9
5.1
5.1
5.1
5.2
5.3
5.4
5.4
5.5
5.5
5.5
5.5
5.6
5.7
5.7
5.9
6.0
6.0
6.4
6.4
6.4
6.8
7.0
7.1
7.1
7.1
7.5
7.7
7.8
7.8
7.9
8.1
8.6
8.8
9.0
9.5
9.9
10
10.1
10.2
10.2
10.5
10.8
11.1
11.2
12.0
12.0
12.4
13.3
13.6
13.6
13.8
13.8
14.0
14.9
15.7
16.0
16.7
16.8
17.0
17.9
18.3
19.4
20.5
21.6
22.2
22.4
24.3
24.5
25.6
28.0
平均数
中位数
众数
集中趋势
中位数是
众数是2.0和5.5
由样本的数据我们估计出全市居民用户月均用水量的平均数是8.79、中位数是6.6、众数是2.0和5.5.
二、分组数据的集中趋势
探究2
将100户居民的月均用水量分成组距相同的9组.请问,如何从频率分布表和频率分布直方图中估计这组数据的平均数、中位数和众数?
(1)
平均数:
分组
频数
频率
[1.2,
4.2)
23
0.23
[4.2,
7.2)
32
0.32
[7.2,
10.2)
13
0.13
[10.2,
13.2)
9
0.09
[13.2,
16.2)
9
0.09
[16.2,
19.2)
5
0.05
[19.2,
22.2)
3
0.03
[22.2,
25.2)
4
0.04
[25.2,
28.2]
2
0.02
合计
100
1.00
(1)
平均数:
分组
频数
频率
[1.2,
4.2)
23
0.23
[4.2,
7.2)
32
0.32
[7.2,
10.2)
13
0.13
[10.2,
13.2)
9
0.09
[13.2,
16.2)
9
0.09
[16.2,
19.2)
5
0.05
[19.2,
22.2)
3
0.03
[22.2,
25.2)
4
0.04
[25.2,
28.2]
2
0.02
合计
100
1.00
(1)
平均数:
无原始数据
分组
频数
频率
[1.2,
4.2)
23
0.23
[4.2,
7.2)
32
0.32
[7.2,
10.2)
13
0.13
[10.2,
13.2)
9
0.09
[13.2,
16.2)
9
0.09
[16.2,
19.2)
5
0.05
[19.2,
22.2)
3
0.03
[22.2,
25.2)
4
0.04
[25.2,
28.2]
2
0.02
合计
100
1.00
(1)
平均数:
是各小组数据的中点
分组
频数
频率
[1.2,
4.2)
23
0.23
[4.2,
7.2)
32
0.32
[7.2,
10.2)
13
0.13
[10.2,
13.2)
9
0.09
[13.2,
16.2)
9
0.09
[16.2,
19.2)
5
0.05
[19.2,
22.2)
3
0.03
[22.2,
25.2)
4
0.04
[25.2,
28.2]
2
0.02
合计
100
1.00
(1)
平均数:
小组中点
2.7
5.7
8.7
11.7
14.7
17.7
20.7
23.7
26.7
是各小组数据的中点
分组
频数
频率
[1.2,
4.2)
23
0.23
[4.2,
7.2)
32
0.32
[7.2,
10.2)
13
0.13
[10.2,
13.2)
9
0.09
[13.2,
16.2)
9
0.09
[16.2,
19.2)
5
0.05
[19.2,
22.2)
3
0.03
[22.2,
25.2)
4
0.04
[25.2,
28.2]
2
0.02
合计
100
1.00
(1)
平均数:
小组中点
2.7
5.7
8.7
11.7
14.7
17.7
20.7
23.7
26.7
分组
频数
频率
[1.2,
4.2)
23
0.23
[4.2,
7.2)
32
0.32
[7.2,
10.2)
13
0.13
[10.2,
13.2)
9
0.09
[13.2,
16.2)
9
0.09
[16.2,
19.2)
5
0.05
[19.2,
22.2)
3
0.03
[22.2,
25.2)
4
0.04
[25.2,
28.2]
2
0.02
合计
100
1.00
(1)
平均数:
小组中点
2.7
5.7
8.7
11.7
14.7
17.7
20.7
23.7
26.7
分组
频数
频率
[1.2,
4.2)
23
0.23
[4.2,
7.2)
32
0.32
[7.2,
10.2)
13
0.13
[10.2,
13.2)
9
0.09
[13.2,
16.2)
9
0.09
[16.2,
19.2)
5
0.05
[19.2,
22.2)
3
0.03
[22.2,
25.2)
4
0.04
[25.2,
28.2]
2
0.02
合计
100
1.00
(1)
平均数:
小组中点
2.7
5.7
8.7
11.7
14.7
17.7
20.7
23.7
26.7
分组
频数
频率
[1.2,
4.2)
23
0.23
[4.2,
7.2)
32
0.32
[7.2,
10.2)
13
0.13
[10.2,
13.2)
9
0.09
[13.2,
16.2)
9
0.09
[16.2,
19.2)
5
0.05
[19.2,
22.2)
3
0.03
[22.2,
25.2)
4
0.04
[25.2,
28.2]
2
0.02
合计
100
1.00
(1)
平均数:
小组中点
2.7
5.7
8.7
11.7
14.7
17.7
20.7
23.7
26.7
分组
频数
频率
[1.2,
4.2)
23
0.23
[4.2,
7.2)
32
0.32
[7.2,
10.2)
13
0.13
[10.2,
13.2)
9
0.09
[13.2,
16.2)
9
0.09
[16.2,
19.2)
5
0.05
[19.2,
22.2)
3
0.03
[22.2,
25.2)
4
0.04
[25.2,
28.2]
2
0.02
合计
100
1.00
(1)
平均数:
小组中点
2.7
5.7
8.7
11.7
14.7
17.7
20.7
23.7
26.7
分组
频数
频率
[1.2,
4.2)
23
0.23
[4.2,
7.2)
32
0.32
[7.2,
10.2)
13
0.13
[10.2,
13.2)
9
0.09
[13.2,
16.2)
9
0.09
[16.2,
19.2)
5
0.05
[19.2,
22.2)
3
0.03
[22.2,
25.2)
4
0.04
[25.2,
28.2]
2
0.02
合计
100
1.00
(1)
平均数:
小组中点
2.7
5.7
8.7
11.7
14.7
17.7
20.7
23.7
26.7
分组
频数
频率
[1.2,
4.2)
23
0.23
[4.2,
7.2)
32
0.32
[7.2,
10.2)
13
0.13
[10.2,
13.2)
9
0.09
[13.2,
16.2)
9
0.09
[16.2,
19.2)
5
0.05
[19.2,
22.2)
3
0.03
[22.2,
25.2)
4
0.04
[25.2,
28.2]
2
0.02
合计
100
1.00
(1)
平均数:
小组中点
2.7
5.7
8.7
11.7
14.7
17.7
20.7
23.7
26.7
分组
频数
频率
[1.2,
4.2)
23
0.23
[4.2,
7.2)
32
0.32
[7.2,
10.2)
13
0.13
[10.2,
13.2)
9
0.09
[13.2,
16.2)
9
0.09
[16.2,
19.2)
5
0.05
[19.2,
22.2)
3
0.03
[22.2,
25.2)
4
0.04
[25.2,
28.2]
2
0.02
合计
100
1.00
(1)
平均数:
频率
小组的中点
小组中点
2.7
5.7
8.7
11.7
14.7
17.7
20.7
23.7
26.7
分组
频数
频率
[1.2,
4.2)
23
0.23
[4.2,
7.2)
32
0.32
[7.2,
10.2)
13
0.13
[10.2,
13.2)
9
0.09
[13.2,
16.2)
9
0.09
[16.2,
19.2)
5
0.05
[19.2,
22.2)
3
0.03
[22.2,
25.2)
4
0.04
[25.2,
28.2]
2
0.02
合计
100
1.00
(1)
平均数:
频率
小组的中点
小组中点
2.7
5.7
8.7
11.7
14.7
17.7
20.7
23.7
26.7
分组
频数
频率
[1.2,
4.2)
23
0.23
[4.2,
7.2)
32
0.32
[7.2,
10.2)
13
0.13
[10.2,
13.2)
9
0.09
[13.2,
16.2)
9
0.09
[16.2,
19.2)
5
0.05
[19.2,
22.2)
3
0.03
[22.2,
25.2)
4
0.04
[25.2,
28.2]
2
0.02
合计
100
1.00
(1)
平均数:
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
(1)
平均数:
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
小矩形的面积
(1)
平均数:
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
小矩形的面积
小矩形底边中点的横坐标
(1)
平均数:
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
分组数据的平均数近似等于每个小组的频率与该组数据的中点的乘积,再求和.
频率分布直方图中数据的平均数近似等于每个小矩形的面积与小矩形底边中点的横坐标的
乘积,再求和.
(1)
平均数:
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
求频率分布直方图中数据的平均数.
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
0.077
频率分布表中数据的平均数为8.94
频率分布直方图中数据的平均数8.96
原始数据中数据的平均数为8.79
(2)
中位数:
即第50百分位数.
(2)
中位数:
分组
频数
频率
[1.2,4.2)
23
0.23
[4.2,7.2)
32
0.32
[7.2,10.2)
13
0.13
[10.2,13.2)
9
0.09
[13.2,16.2)
9
0.09
[16.2,19.2)
5
0.05
[19.2,22.2)
3
0.03
[22.2,25.2)
4
0.04
[25.2,28.2]
2
0.02
合计
100
1
(2)
中位数:
月均用水量在
4.2
t
以下的居民用户所占比例为
23%,
分组
频数
频率
[1.2,4.2)
23
0.23
[4.2,7.2)
32
0.32
[7.2,10.2)
13
0.13
[10.2,13.2)
9
0.09
[13.2,16.2)
9
0.09
[16.2,19.2)
5
0.05
[19.2,22.2)
3
0.03
[22.2,25.2)
4
0.04
[25.2,28.2]
2
0.02
合计
100
1
(2)
中位数:
月均用水量在
7.2
t
以下的居民用户所占比例为
23%+32%=55%,
月均用水量在
4.2
t
以下的居民用户所占比例为
23%,
分组
频数
频率
[1.2,4.2)
23
0.23
[4.2,7.2)
32
0.32
[7.2,10.2)
13
0.13
[10.2,13.2)
9
0.09
[13.2,16.2)
9
0.09
[16.2,19.2)
5
0.05
[19.2,22.2)
3
0.03
[22.2,25.2)
4
0.04
[25.2,28.2]
2
0.02
合计
100
1
(2)
中位数:
月均用水量在
7.2
t
以下的居民用户所占比例为
23%+32%=55%,
月均用水量在
4.2
t
以下的居民用户所占比例为
23%,
因此,中位数位于[4.2,7.2)内.
分组
频数
频率
[1.2,4.2)
23
0.23
[4.2,7.2)
32
0.32
[7.2,10.2)
13
0.13
[10.2,13.2)
9
0.09
[13.2,16.2)
9
0.09
[16.2,19.2)
5
0.05
[19.2,22.2)
3
0.03
[22.2,25.2)
4
0.04
[25.2,28.2]
2
0.02
合计
100
1
所以估计月均用水量样本数据的中位数约为
6.73.
1.2
4.2
7.2
10.2
13.2
16.2
19.2
22.2
25.2
28.2
23%
55%
68%
77%
86%
91%
94%
98%
100%
50%
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
(2)
中位数:
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
(2)
中位数:
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
(2)
中位数:
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
(2)
中位数:
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
(2)
中位数:
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
(2)
中位数:
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
(2)
中位数:
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
(2)
中位数:
中位数约为6.71
频率分布表中数据的中位数为6.73
频率分布直方图中数据的中位数6.71
原始数据中数据的中位数为6.6
(3)
众数:



分组
频数
频率
[1.2,4.2)
23
0.23
[4.2,7.2)
32
0.32
[7.2,10.2)
13
0.13
[10.2,13.2)
9
0.09
[13.2,16.2)
9
0.09
[16.2,19.2)
5
0.05
[19.2,22.2)
3
0.03
[22.2,25.2)
4
0.04
[25.2,28.2]
2
0.02
合计
100
1
分组
频数
频率
[1.2,4.2)
23
0.23
[4.2,7.2)
32
0.32
[7.2,28.2)
45
0.45
合计
100
1
分布直方图中最高矩形底边中点的横坐标.
(3)
众数:
是频率分布直方图中各矩形的高,众数为频率
反映了各组样本观测数据的疏密程度.
最大组的区间的中点是众数.
(3)
众数:
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
0.077
0.107
0.043
0.010
0.030
0.030
0.007
0.017
0.013
由样本的分组数据我们估计出全市居民用户月均用水量的平均数是8.96、中位数是6.71、众数是5.7.
平均数
中位数
众数
分组数据集中趋势
平均数
中位数
众数
分组数据集中趋势
频率分布直方图中数据的平均数近似等于每个矩形的面积与矩形底边中点的横坐标的乘积,再求和.
第50百分位数.
最高矩形底边中点的
横坐标.
例题巩固
例1
某校从参加高一年级期末考试的学生中抽出60名学生,将其成绩(单位:分,均为整数)分成七段后画出如图所示的频率分布直方图.试估计高一年级全部学生期末成绩的平均数、中位数和众数.
0.005
0.010
0.015
0.020
0.025
0.030
分数
30
40
50
60
70
80
90
100
0
频率/组距
答:设样本数据为y,平均数为
0.005
0.010
0.015
0.020
0.025
0.030
分数
30
40
50
60
70
80
90
100
0
频率/组距
答:设样本数据为y,平均数为
0.005
0.010
0.015
0.020
0.025
0.030
分数
30
40
50
60
70
80
90
100
0
频率/组距
答:设样本数据为y,平均数为
0.005
0.010
0.015
0.020
0.025
0.030
分数
30
40
50
60
70
80
90
100
0
频率/组距
答:设样本数据为y,平均数为
0.005
0.010
0.015
0.020
0.025
0.030
分数
30
40
50
60
70
80
90
100
0
频率/组距
答:设样本数据为y,平均数为
0.005
0.010
0.015
0.020
0.025
0.030
分数
30
40
50
60
70
80
90
100
0
频率/组距
0.005
0.010
0.015
0.020
0.025
0.030
分数
30
40
50
60
70
80
90
100
0
频率/组距
答:
所以中位数在区间[70,80)上.
设中位数为x,则
解得x≈71.7.
答:
所以成绩的众数为

众数为最高矩形底边中点的横坐标,
0.005
0.010
0.015
0.020
0.025
0.030
分数
30
40
50
60
70
80
90
100
0
频率/组距
据此估计可得,高一年级全体学生期末成绩的平均数为68.5,中位数为71.7,众数为75.
三、平均数、中位数和众数分析
平均数
中位数
众数
7.7
8.79
6.6
2.0
和5.5
77
9.483
6.6
2.0
和5.5
(1)特征
名称
优点
缺点
平均数
能反映出更多关于样本数据全体的信息.
任何一个数据的改变都会引起平均数的改变,数据越“极端”,对平均数的影响越大.
(1)特征
名称
优点
缺点
中位数
①不受少数几个极端数据的影响;②容易得到,便于利用中间数据的信息.
对极端值不敏感.
(1)特征
名称
优点
缺点
众数

体现了样本数据的最大集中点;②容易得到;③不受极端值影响.
①它只能表达样本数据中很少的一部分信息;②无法客观地反映总体特征;③对极端值不敏感.
右边“拖尾”
左边“拖尾”
(2)平均数、中位数
0.005
0.010
0.015
0.020
0.025
0.030
分数
30
40
50
60
70
80
90
100
0
频率/组距
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
单峰
中位数为6.71
中位数为71.7
(2)平均数、中位数
平均数为8.96
0.005
0.010
0.015
0.020
0.025
0.030
分数
30
40
50
60
70
80
90
100
0
频率/组距
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
右边“拖尾”,平均数大于中位数.
左边“拖尾”,平均数小于中位数.
对称,平均数和中位数大体上差不多.
单峰
(2)平均数、中位数
中位数约为6.71
(3)集中趋势的选择
平均数为8.96
19.2
22.2
25.2
28.2
0
频率/组距
月均用
水量/t
0.02
0.04
0.06
0.08
0.10
1.2
4.2
7.2
10.2
13.2
16.2
0.12
例2
校服规格
155
160
165
170
175
合计
频数
39
64
167
90
26
386
某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格.据统计,高一年级女生需要的校服规格如下表所示.
如果用一个量代表该校高一年级女生所需校服的规格,那么在平均数、中位数和众数中,哪个量比较合适?
分析:
校服规格是分类型数据,不能求平均数.
选择众数165作为该校高一年级女生校服的规格比较合适.
校服规格
155
160
165
170
175
合计
频数
39
64
167
90
26
386
例2
对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;
对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
用上表的数据估计全国高一年级女生校服规格,合理吗?
答:由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.
校服规格
155
160
165
170
175
合计
频数
39
64
167
90
26
386
例2
例3
某公司的33名职工的月工资(单位:元)如下:
职务
董事长
副董事长
董事
总经理
经理
管理
职员
人数
1
1
2
1
5
3
20
工资
30
000
20
000
3
500
3
000
2
500
2
000
1
500
计算月工资的平均数、中位数和众数.试问哪个参数更能反映这个公司员工的工资水平?(精确到1元)
职务
董事长
副董事长
董事
总经理
经理
管理
职员
人数
1
1
2
1
5
3
20
工资
30
000
20
000
3
500
3
000
2
500
2
000
1
500
答:平均数为
职务
董事长
副董事长
董事
总经理
经理
管理
职员
人数
1
1
2
1
5
3
20
工资
30
000
20
000
3
500
3
000
2
500
2
000
1
500
中位数为1500.
众数为1500.
哪个参数更能反映这个公司员工的工资水平?
答:平均数为3288.
答:在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映公司员工的工资水平.
平均
数据的集中趋势
假设你到人才市场去找工作,有个企业老板说“我们企业员工的年平均收入是20万”,你该如何理解这句话?
众数
平均数
中位数
四、课堂小结
平均数
中位数
众数
原始数据
分组数据
类比的方法
数据的集中趋势
根据所需要的数据的特点选择恰当的参数.
五、课后作业
1.已知某市2015年全年空气质量等级如下表所示.
估计该市2015全年空气质量指数的平均数、
中位数和第80百分位数.
空气质量等级(空气质量指数AQI)
频数
频率
优(AQI≤50)
83
22.80%
良(50<AQI≤100)
121
33.20%
轻度污染(100<AQI≤150)
68
18.60%
中度污染(150<AQI≤200)
49
13.40%
重度污染(200<AQI≤300)
30
8.20%
严重污染(300<AQI≤400)
14
3.80%
合计
365
100%
2.某校举行演讲比赛,10位评委对两位选手的评分如下:

7.5
7.5
7.8
7.8
8.0
8.0
8.2
8.3
8.4
9.9

7.5
7.8
7.8
7.8
8.0
8.0
8.3
8.3
8.5
8.5
选手的最终得分为去掉一个最低分和一个最高分之后,剩下8个评分的平均数.那么,这两个选手的最后得分是多少?若直接用10位评委评分的平均数作为选手的得分,两位选手的排名有变化吗?你认为哪种评分办法更好?为什么?
3.统计你们班所有同学的身高,选择恰当的组距作频率分布直方图.计算身高的平均数、中位数和众数,并判断用哪个参数更能反映班级同学的身高.由此估计你所在的学校全体高中学生身高的集中趋势.
同学们,再见!
同课章节目录