9.2.3 总体集中趋势的估计
[学习目标]
1.会求样本数据的众数、中位数、平均数.
2.理解用样本的数字特征、频率分布直方图估计总体的集中趋势.
一、众数、中位数、平均数
知识梳理
1.众数:一组数据中出现________最多的数.
2.中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在________位置的数(或中间两个数的____________)叫做这组数据的中位数.
3.平均数:如果有n个数x1,x2,…,xn,那么=______________叫做这n个数的平均数.
例1 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
成绩(单位:m) 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90
人数 2 3 2 3 4 1 1 1
分别求出这17名运动员的成绩的众数、中位数与平均数.
反思感悟 平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算中位数时,可先将这组数据按从小到大(或从大到小)的顺序排列,再根据相关数据的总数是奇数还是偶数而定;众数是看出现次数最多的数.
跟踪训练1 某工厂10名工人某天生产同一类型的零件,生产的件数分别是10,12,14,14,15,15,16,17,17,17.记这组数据的中位数为a,平均数为b,众数为c,则( )
A.a>b>c B.b>c>a
C.c>a>b D.c>b>a
二、总体集中趋势的估计
问题1 我们知道平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.从下面的三幅图中,你能发现平均数和中位数的大小存在什么关系吗?
问题2 什么样的问题可以用平均数描述?什么样的问题可以用中位数描述?什么样的问题可以用众数描述?
例2 某校举行演讲比赛,10位评委对两位选手的评分如下:
甲 7.5 7.5 7.8 7.8 8.0 8.0 8.2 8.3 8.4 9.9
乙 7.5 7.8 7.8 7.8 8.0 8.0 8.3 8.3 8.5 8.5
选手的最终得分为去掉一个最低分和一个最高分之后,剩下8个评分的平均数,那么,这两位选手的最后得分是多少?若直接用10位评委评分的平均数作为选手的得分,两位选手的排名有变化吗?你认为哪种评分办法更好?为什么?
反思感悟 众数、中位数、平均数的意义
(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大或较小时,可用中位数描述其集中趋势.
跟踪训练2 学校随机调查了部分学生一周平均每天的睡眠时间,统计结果如图,则在这组数据中,这些被调查学生睡眠时间的众数和中位数分别是( )
A.8,9 B.8,8.5
C.16,8.5 D.16,14
三、利用频率分布直方图估计总体的集中趋势
例3 某校从参加高一年级期末考试的学生中抽出60名,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后,画出如图所示的频率分布直方图.观察图中的信息,回答下列问题:
(1)估计这次考试的物理成绩的众数m与中位数n(结果保留一位小数);
(2)估计这次考试的物理成绩的及格率(60分及以上为及格)和平均分.
反思感悟 利用频率分布直方图求众数、中位数以及平均数的方法
(1)众数即为出现次数最多的数,所以它的频率最大,在最高的小矩形中.中位数即为从小到大中间的数(或中间两数的平均数).平均数约为每个小矩形底边中点的横坐标与小矩形面积的乘积之和.
(2)用频率分布直方图求得的众数、中位数不一定是样本中的具体数.
跟踪训练3 根据如图所示的频率分布直方图求出样本数据的众数、中位数和平均数.
1.知识清单:
(1)中位数、众数、平均数的计算.
(2)总体集中趋势的估计.
(3)频率分布直方图中的中位数、众数、平均数.
2.方法归纳:数据分析统计.
3.常见误区:求中位数时,需要先把一组数据按从小到大(或从大到小)的顺序排列,再找中间位置的数或中间两数的平均数.
1.在一次体育测试中,某班6名同学的成绩(单位:分)分别为66,83,87,83,77,96.关于这组数据,下列说法错误的是( )
A.众数是83 B.中位数是83
C.极差是30 D.平均数是83
2.(多选)下列关于平均数、中位数、众数的说法中错误的是( )
A.中位数可以准确地反映出总体的情况
B.平均数可以准确地反映出总体的情况
C.众数可以准确地反映出总体的情况
D.平均数、中位数、众数都有局限性,都不能准确地反映出总体的情况
3.已知一组数据0,2,x,4,5的众数是4,那么这组数据的平均数是________.
4.某班全体学生参加物理测试成绩的频率分布直方图如图所示,则估计该班物理测试的平均成绩是________分.
9.2.3 总体集中趋势的估计
知识梳理
1.次数
2.中间 平均数
3.(x1+x2+…+xn)
例1 解 在这17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上表中的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70.这组数据的平均数是=×(1.50×2+1.60×3+1.65×2+1.70×3+1.75×4+1.80×1+1.85×1+1.90×1)=≈1.69.
故这17名运动员的成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.
跟踪训练1 C
问题1 一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的(如图(1)),那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”(如图(2)),那么平均数大于中位数;如果直方图在左边“拖尾”(如图(3)),那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.
问题2 一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
例2 解 甲选手的最后得分为×(7.5+7.8+7.8+8.0+8.0+8.2+8.3+8.4)=8.
乙选手的最后得分为×(7.8+7.8+7.8+8.0+8.0+8.3+8.3+8.5)=8.062 5.
若直接用10位评委评分的平均数作为选手的得分,
则甲选手的得分为×(7.5+7.5+7.8+7.8+8.0+8.0+8.2+8.3+8.4+9.9)=8.14,
乙选手的得分为×(7.5+7.8+7.8+7.8+8.0+8.0+8.3+8.3+8.5+8.5)=8.05.
去掉最高分与最低分时,甲的得分低于乙的得分,即乙的排名靠前;若直接用10位评委评分的平均数作为得分,则甲的得分高于乙的得分,即甲的排名靠前.两种评分下,甲、乙两位选手的排名变化大,去掉一个最低分和一个最高分之后,剩下8个评分的平均数作为选手的最后得分更好,这是因为平均数对样本数据的极端值比较“敏感”.
跟踪训练2 A
例3 解 (1)众数是频率分布直方图中最高小矩形底边中点的横坐标,所以众数m=75.0.
前3个小矩形面积和为0.01×10+0.015×10+0.015×10=0.4<0.5,
前4个小矩形面积和为0.4+0.03×10=0.7>0.5,
所以中位数n=70+
≈73.3.
(2)依题意,60及60以上的分数在第三、四、五、六组,频率和为(0.015+0.03+0.025+0.005)×10=0.75,
所以估计这次考试的物理成绩的及格率是75%.
利用组中值估算抽样学生的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
所以估计这次考试的物理成绩的平均分是71分.
跟踪训练3 解 在[124.5,126.5)中的数据最多,取这个区间的中点值作为众数的估计值,得众数约为125.5.中位数左边和右边的直方图的面积相等,设中位数为x,则由图可知x∈[124.5,126.5),则(x-124.5)×0.2+2×0.075+2×0.05=0.5,解得x=125.75,即中位数约为125.75.使用组中值求平均数,则=121.5×0.1+123.5×0.15+125.5×0.4+127.5×0.2+129.5×0.15=125.8,即平均数约为125.8.
随堂演练
1.D 2.ABC 3.3 4.68