9.2.3 总体集中趋势的估计
[学习目标] 1.会求样本数据的众数、中位数、平均数.
2.理解用样本的数字特征、频率分布直方图估计总体的集中趋势.
[讨论交流] 预习教材P205-P209的内容,思考以下问题:
问题1.在统计学中,刻画总体集中趋势的量有哪些?
问题2.平均数、中位数、众数各有什么应用?有什么优、缺点?
问题3.平均数、中位数与频率分布直方图有什么关系?
[自我感知] 经过认真预习,结合你对本节课的理解和认识,请画出本节课的知识逻辑体系.
探究1 众数、中位数、平均数
探究问题1 以下是某校足球队男运动员的身高(单位:cm):
184 182 178 182 184 177 185 174 174 176 184
运动员身高的平均数、中位数、众数是什么?这些统计量刻画了数据的什么特点?
[提示] 运动员身高的平均数为180、中位数为182、众数是184;平均数、中位数、众数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.
[新知生成]
1.众数:一组数据中出现次数最多的数.
2.中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.
3.平均数:如果有n个数x1,x2,…,xn,那么=(x1+x2+…+xn)叫做这n个数的平均数.
【教用·微提醒】 (1)一组数据的平均数、中位数都是唯一的,众数不唯一,可以有一个,也可以有多个(如1,2,2,3,3,4,5,6这组数的众数是2和3),还可以没有(如1,2,3,4,5,6这组数就没有众数).
(2)众数一定是原数据中的数,平均数和中位数都不一定是原数据中的数.
[典例讲评] 1.(1)对于数据3,3,2,3,6,3,10,3,6,3,2,有下列说法:
①这组数据的众数是3;
②这组数据的众数与中位数的数值不相等;
③这组数据的中位数与平均数的数值相等;
④这组数据的平均数与众数的数值相等.
其中正确的个数是( )
A.1 B.2 C.3 D.4
(2)某学习小组共10人,在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数、众数、中位数分别为( )
A.85,85,85 B.87,85,86
C.87,85,85 D.87,85,90
(1)A (2)C [(1)在这11个数据中,数据3出现了6次,频率最高,故众数是3,①正确;将这11个数据按从小到大排列得2,2,3,3,3,3,3,3,6,6,10,最中间的数据是3,故中位数是3,②错误;这组数据的平均数==4,故③④错误.故选A.
(2)平均数为=87,众数为85,中位数为85.]
平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据相关数据的总数是奇数还是偶数而定;众数是出现次数最多的数.
[学以致用] 1.(1)已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有( )
A.a>b>c B.a>c>b
C.c>a>b D.c>b>a
(2)已知一组数据x1,x2,x3,x4,x5的平均数是2,那么另一组数据2x1-3,2x2-3,2x3-3,2x4-3,2x5-3的平均数为( )
A.1 B.2 C.3 D.4
(1)D (2)A [(1)由题意得a=(16+18+15+11+16+18+18+17+15+13)==15.7,中位数为16,众数为18,则b=16,c=18,
所以c>b>a.
(2)因为一组数据x1,x2,x3,x4,x5的平均数是2,所以另一组数据2x1-3,2x2-3,2x3-3,2x4-3,2x5-3的平均数为2×2-3=1.故选A.]
探究2 总体集中趋势的估计
探究问题2 平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.从下面的三幅图中,你能发现平均数和中位数的大小存在什么关系吗?
[提示] 一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的(如图①),那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”(如图②),那么平均数大于中位数;如果直方图在左边“拖尾”(如图③),那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.
【链接·教材例题】
例4 利用9.2.1节中100户居民用户的月均用水量的调查数据,计算样本数据的平均数和中位数,并据此估计全市居民用户月均用水量的平均数和中位数.
[解] 根据9.2.1节中100户居民用户月均用水量的数据,由样本平均数的定义,可得==8.79,
即100户居民的月均用水量的平均数为8.79 t.
将样本数据按从小到大排序,得第50个数和第51个数均为6.8,由中位数的定义,可得100户居民的月均用水量的中位数是6.8 t.
因为数据是抽自全市居民户的简单随机样本,所以我们可以据此估计全市居民用户的月均用水量约为8.79 t,其中位数约为6.8 t.
[典例讲评] 2.(源自湘教版教材)某创业公司全体职工某月的奖金如下:
奖金/元 18 000 12 000 8 000 6 000 4 000 2 500 2 000 1 500 1 200
人数 1 (总经理) 2 (副总经理) 3 4 10 20 22 12 6
(1)试求出该公司该月奖金数据的众数、中位数和平均数;
(2)你认为用平均数、中位数或众数中的哪一个更能反映该公司的月奖金水平?
(3)能用该公司的月奖金数据估计全国该类创业公司的月奖金水平吗?说说你的理由.
[解] (1)在上述80个数据中,2 000出现了22次,出现的次数最多,因此这组数据的众数是2 000.
把这80个数据按从小到大的顺序排列后,位于中间的数是2 000,2 500,因此这组数据的中位数是=2 250.
这组数据的平均数为
===3 115.
(2)由于大多数员工的月奖金达不到平均数3 115,显然用平均数作为该公司员工月奖金的代表值并不合适;众数2 000及中位数2 250在一定程度上代表了大多数人的月奖金水平,较能反映月奖金水平的实际情况.
(3)由于全国各地的月奖金差异性较大,因而不能用一个公司的数据估计全国该类公司的月奖金水平.
平均数、中位数、众数应用问题的两个关注点
(1)平均数与每一个数据都有关,可以反映更多的总体信息,但受极端值的影响大;中位数是样本数据所占频率的等分线,不受几个极端值的影响;众数只能体现数据的最大集中点,无法客观反映总体特征.
(2)当平均数大于中位数时,说明数据中存在许多较大的极端值.
[学以致用] 2.某公司为了了解一年内的用水情况,抽取了10天的用水量如表所示:
用水量/t 22 38 40 41 44 50 95
天数 1 1 1 2 2 1 2
(1)在这10天中,该公司用水量的平均数是多少?每天用水量的中位数是多少?
(2)你认为应该用平均数和中位数中的哪一个来描述该公司每天的用水量更合适?
[解] (1)在这10天中,该公司用水量的平均数是=×(22+38+40+2×41+2×44+50+2×95)=51(t).
每天用水量的中位数是=42.5(t).
(2)平均数受数据中的极端值(2个95)影响较大,使平均数在估计总体时可靠性降低,10天的用水量有8天都在平均值以下,故用中位数描述每天的用水量更合适.
【教用·备选题】 下表是五年级两个班各11名同学1分钟仰卧起坐的成绩(单位:次):
一班 19 33 26 29 28 33 34 35 33 33 30
二班 25 27 29 28 29 30 29 35 29 30 29
(1)这两组数据的平均数、中位数和众数各是多少?
(2)你认为哪个数表示两个班的成绩更合适?
[解] (1)一班平均数:(19+33+26+29+28+33+34+35+33+33+30)÷11=333÷11≈30.27(次),
一班数据从小到大排列为:19,26,28,29,30,33,33,33,33,34,35,
所以一班的中位数为33次,
33出现的次数最多,众数是33次;
二班平均数:(25+27+29+28+29+30+29+35+29+30+29)÷11=320÷11≈29.09(次),
二班数据从小到大排列为:25,27,28,29,29,29,29,29,30,30,35,
所以二班的中位数是29次,
29出现的次数最多,所以二班的众数是29次.
(2)运用平均数表示两个班的成绩更合适.
探究3 利用频率分布直方图估计总体的集中趋势
[典例讲评] 3.某城市100户居民的月平均用电量(单位:kW·h),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中x的值;
(2)求月平均用电量的平均数、众数和中位数.
[解] (1)依题意,
20×(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)=1,解得x=0.007 5.
(2)由题图可知,平均数为170×0.04+190×0.19+210×0.22+230×0.25+250×0.15+270×0.1+290×0.05=225.6,
最高矩形的数据组为[220,240),
所以众数为=230,
因为[160,220)的频率之和为
(0.002+0.009 5+0.011)×20=0.45<0.5,
[160,240)的频率之和为(0.002+0.009 5+0.011+0.012 5)×20=0.7>0.5,所以月平均用电量的中位数在[220,240),
设中位数为y,所以0.45+(y-220)×0.012 5=0.5,解得y=224,即中位数为224,
综上所述,平均数为225.6,众数为230,中位数为224.
用频率分布直方图估计众数、中位数、平均数
(1)众数:取最高小长方形底边中点的横坐标作为众数.
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.
(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
[学以致用] 3.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图.
求:(1)成绩的众数、中位数的估计值;
(2)平均成绩的估计值(同一组中的数据用该组区间的中点值作代表).
[解] (1)由题图可知众数的估计值为65分.
设中位数为x,∵第一个小矩形的面积为0.3,
则0.3+(x-60)×0.04=0.5,得x=65.
∴中位数的估计值为65分.
(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67(分),
∴平均成绩的估计值为67分.
【链接·教材例题】
例5 某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格.据统计,高一年级女生需要不同规格校服的频数如表9.2-5所示.
表9.2-5
校服规格 155 160 165 170 175 合计
频数 39 64 167 90 26 386
如果用一个量来代表该校高一年级女生所需校服的规格,那么在中位数、平均数和众数中,哪个量比较合适?试讨论用表9.2-5中的数据估计全国高一年级女生校服规格的合理性.
分析:虽然校服规格是用数字表示的,但它们事实上是几种不同的类别.对于这样的分类数据,用众数作为这组数据的代表比较合适.
[解] 为了更直观地观察数据的特征,我们用条形图来表示表中的数据(图9.2-9).可以发现,选择校服规格为“165”的女生的频数最高,所以用众数165作为该校高一年级女生校服的规格比较合适.
由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.
1.在一次射击训练中,一小组的成绩如下表:
环数 7 8 9
人数 2 3
已知该小组的平均成绩为8.1环,那么成绩为8环的人数是( )
A.5 B.6 C.4 D.7
A [设成绩为8环的人数是x,由平均数的定义,得7×2+8x+9×3=8.1(2+x+3),解得x=5.]
2.众数、平均数、中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在如图所示的分布形态中,平均数、众数和中位数的大小关系是(由小到大排列)( )
A.众数<中位数<平均数
B.平均数<众数<中位数
C.中位数<平均数<众数
D.众数<平均数<中位数
A [众数是最高矩形的底边中点横坐标,因此众数在第二列的中点处.
因为直方图第二、三列所占数据较多,且在右边“拖尾”,所以平均数大于中位数,因此有众数<中位数<平均数.故选A.]
3.已知一组数据按从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么数据的众数是________,平均数是________.
6 5 [因为-1,0,4,x,6,15的中位数是5,所以(4+x)=5,解得x=6,所以这组数据的众数是6,平均数是(-1+0+4+6+6+15)=5.]
4.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)这次测试数学成绩的众数为________;
(2)这次测试数学成绩的中位数为________;
(3)这次测试数学成绩的平均数为________.
(1)75 (2) (3)72 [(1)由题干图知众数为=75.
(2)设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x=.
(3)由题干图知这次测试数学成绩的平均数为:×0.005×10+×0.015×10+×0.02×10+×0.03×10+×0.025×10+×0.005×10=72.]
1.知识链:(1)中位数、众数、平均数的计算.
(2)总体集中趋势的估计.
(3)频率分布直方图中的中位数、众数、平均数.
2.方法链:数据分析、统计.
3.警示牌:求中位数时,需要先把一组数据按从小到大(或从大到小)的顺序排列,再找中间位置的数或中间两数的平均数.
回顾本节知识,自主完成以下问题:
1.在频率分布直方图中,如何确定众数、中位数和平均数?
[提示] 在频率分布直方图中,众数是最高小矩形底边的中点所对应的数据;中位数左边和右边的直方图的面积应该相等;平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
2.众数、中位数和平均数各有哪些优、缺点?
[提示]
名称 优点 缺点
平均数 与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感 任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数影响越大
中位数 不受少数几个极端数据(即排序靠前或靠后的数据)的影响 对极端值不敏感
众数 体现了样本数据的最大集中点 众数只能传递数据中的信息的很少一部分,对极端值不敏感
课时分层作业(四十二) 总体集中趋势的估计
一、选择题
1.下列关于平均数、中位数、众数的说法中,正确的是( )
A.中位数可以准确地反映出总体的情况
B.平均数可以准确地反映出总体的情况
C.众数可以准确地反映出总体的情况
D.平均数、中位数、众数都有局限性,都不能准确地反映出总体的情况
D [平均数、中位数、众数都是描述数据的集中趋势的“特征数”,平均数、中位数和众数从不同侧面反映了同一组数据的面貌,都受样本中数据的影响,都不能准确地反映出总体的情况.故可知A,B,C错误.故选D.]
2.某鞋店试销一种新款女鞋,销售情况如下表:
鞋号 34 35 36 37 38 39 40 41
日销 量/双 2 5 9 16 9 5 3 2
如果你是鞋店经理,那么下列统计量中对你来说最重要的是( )
A.平均数 B.众数
C.中位数 D.百分位数
B [鞋店经理最关心的是哪个鞋号的鞋销量最大,由表可知,鞋号为37的鞋销量最大,共销售了16双,所以这组数据最重要的是众数.]
3.某校高一(3)班的40位同学对班内一名准备参加学校绘画比赛的同学的绘画作品进行打分(满分100分,分数均在[80,96]内),并绘制出如图所示的频率分布直方图,则下列结论中正确的是( )
A.打分在[94,96]内的有2人
B.中位数在[86,88]内
C.众数是90
D.平均数大于90
B [对于A,根据频率分布直方图可知,打分在[94,96]的人数为0.012 5×2×40=1,故A错误;
对于B,前三组的频率之和为(0.037 5+0.062 5+0.075 0)×2=0.35<0.5,前四组的频率之和为(0.037 5+0.062 5+0.075 0+0.100 0)×2=0.55>0.5,故中位数在[86,88]内,故B正确;
对于C,众数为最高小长方形底边中点的横坐标,故众数是89,故C错误;
对于D,根据频率分布直方图得平均数为81×2×0.037 5+83×2×0.062 5+85×2×0.075+87×2×0.1+89×2×0.112 5+91×2×0.075+93×2×0.025+95×2×0.012 5=87.3<90,故D错误.故选B.]
4.(多选)某科技攻关青年团队共有10人,其年龄(单位:岁)分布如下表所示,则这10个人年龄的( )
年龄 45 40 36 32 29 28
人数 1 2 1 3 2 1
A.中位数是34
B.众数是32
C.第25百分位数是29
D.平均数为34.3
BCD [把10个人的年龄由小到大排列为28,29,29,32,32,32,36,40,40,45,这组数据的中位数为32,众数为32,A错误,B正确;
由25%×10=2.5,得这组数据的第25百分位数是第3个数,为29,C正确;这组数据的平均数==34.3,D正确.故选BCD.]
5.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为me,众数为m0,平均值为,则( )
A.m0> B.me<
C.meB [中位数me==5.5,众数为m0=5,
平均数为==,
所以m0故选B.]
二、填空题
6.某校女子篮球队7名运动员的身高(单位:cm)分别为180,181,171,172,x,174,175,已知记录的平均身高为175 cm,但记录中有一名运动员身高因记录不清,而用x代替,那么x的值为________.
172 [由条件可知
=175,解得x=172.]
7.《中国居民膳食指南(2022)》数据显示,6岁至17岁儿童青少年超重肥胖率高达19.0%.为了解某地中学生的体重情况,某机构从该地中学生中随机抽取100名学生,测量他们的体重(单位:千克),根据测量数据,按[40,45),[45,50),[50,55),[55,60),[60,65),[65,70]分成六组,得到的频率分布直方图如图所示.根据调查的数据,估计该地中学生体重的中位数是________.
53.75 [∵(0.01+0.03)×5=0.2<0.5,0.2+0.08×5=0.6>0.5,
∴该地中学生体重的中位数位于[50,55)内,
设中位数为m,则0.2+(m-50)×0.08=0.5,
解得m=53.75.]
8.从甲、乙、丙三个厂家生产的同一种产品中抽取8件产品,对其使用寿命(单位:年)进行追踪调查的结果如下:
甲:3,4,5,6,8,8,8,10;
乙:4,6,6,6,8,9,12,13;
丙:3,3,4,7,9,10,11,12.
三个厂家广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数.
甲:________;乙:________;丙:________.
众数 平均数 中位数 [甲厂数据的众数是8,乙厂数据的平均数是8,丙厂数据的中位数是8.]
三、解答题
9.(源自北师大版教材)某产品售后服务中心随机选取了20个工作日,分别记录了每个工作日接到的客户服务电话的数量(单位:次):
63 38 25 42 56 48 53 39 28 47
45 52 59 48 51 62 48 50 52 38
(1)分别计算以上数据的平均数、中位数和众数;
(2)根据以上结果,你能为该产品的售后服务中心提供什么建议?
[解] (1)由题意,该组数据的平均数为(63+38+25+42+56+48+53+39+28+47+45+52+59+48+51+62+48+50+52+38)=47.2,
这些数据从小到大排序为:25,28,38,38,39,42,45,47,48,48,48,50,51,52,52,53,56,59,62,63,
所以数据的中位数为=48,其中众数为48.
(2)该产品售后服务中心每天应准备接听48个客户的电话.
10.某组样本数据的频率分布直方图如图所示,设该组样本数据的众数、平均数、第一四分位数分别为x1,x2,x3,则x1,x2,x3的大小关系是(注:同一组中数据用该组区间中点值近似代替)( )
A.x3C.x1A [由频率分布直方图可知众数为=2.5,
即x1=2.5,平均数x2=0.2×1.5+0.24×2.5+0.2×3.5+0.16×4.5+0.12×5.5+0.04×6.5+0.04×7.5=3.54,
显然第一四分位数位于[2,3)之间,则0.2+(x3-2)×0.24=0.25,
解得x3≈2.208,
所以x3故选A.]
11.(多选)某学生5次考试的成绩(单位:分)分别为85,69,m,80,91,其中m>0.若该学生在这5次考试中成绩的中位数为80,则5次考试成绩的平均数可能为( )
A.76 B.80 C.81 D.85
ABC [一共有5个分数,从小到大排列,第3个是中位数,依题意可知,中位数是80,
比80大的有85,91两个数,所以0这5个分数的平均值为==65+,由于0<≤16,所以65<65+≤81,
所以ABC选项符合题意.故选ABC.]
12.(多选)党的二十大报告提出,要加快发展数字经济,促进数字经济与实体经济的深度融合,数字化构建社区服务新模式成为一种时尚.某社区为优化数字化社区服务,问卷调查调研数字化社区服务的满意度,满意度采用计分制(满分100分),统计满意度绘制成如下频率分布直方图,图中b=3a.则下列结论正确的是( )
A.a=0.01
B.满意度计分的众数为80分
C.满意度计分的75%分位数是85分
D.满意度计分的平均分是76.5
ACD [由频率分布直方图可知(a+0.015+0.035+b+a)×10=1,即b+2a=0.05,
又b=3a,所以a=0.01,所以选项A正确;
满意度计分的众数为75分,所以选项B错误;
前三组的频率之和为0.1+0.15+0.35=0.6<0.75,
前四组的频率之和为0.6+0.3=0.9>0.75,则75%分位数m∈[80,90),
故m=80+×10=85,满意度计分的75%分位数为85,所以选项C正确;
满意度计分的平均分为:=55×0.1+65×0.15+75×0.35+85×0.3+95×0.1=76.5(分),所以选项D正确.故选ACD.]
13.五名学生每人投篮15次,统计他们每人投中的次数,得到五个数据,若这五个数据的中位数是6,唯一的众数是7,则他们投中次数的总和最大是________.
29 [假设五个数据按照由小到大排列为a,b,c,d,e,
因为这五个数据的中位数是6,唯一的众数是7,
所以c=6,d=e=7,所以最大的三个数的和为6+7+7=20,
因为两个较小的数一定是小于6的非负整数,且不相等,最大为4和5,
所以这五个数的和一定大于20且小于等于29.]
14.某风景区对5个旅游景点的门票价格进行了调整,据统计,调价前后各景点的游客人数基本不变.有关数据如表所示:
景点 A B C D E
原价/元 10 10 15 20 25
现价/元 5 5 15 25 30
日平均人数/千人 1 1 2 3 2
(1)该风景区称调整前后这5个景点门票的平均收费不变,日平均总收入持平.问风景区是怎样计算的?
(2)另一方面,游客认为调整收费后风景区的日平均总收入相对于调价前,实际上增加了约9.4%,问游客是怎样计算的?
(3)你认为风景区和游客哪一个的说法较能反映整体实际?
[解] (1)风景区是这样计算的:
调整前的平均价格为=16(元),
调整后的平均价格为=16(元),
因为调整前后的平均价格不变,日平均人数不变,所以,日平均总收入持平.
(2)游客是这样计算的:
原日平均总收入为10×1+10×1+15×2+20×3+25×2=160(千元),
现日平均总收入为5×1+5×1+15×2+25×3+30×2=175(千元),
所以,调整收费后风景区的日平均总收入增加了×100≈9.4%.
(3)游客的说法较能反映整体实际.
15.随着移动互联网的发展,与餐饮美食相关的手机软件层出不穷.现从某市使用A和B两款订餐软件的商家中分别随机抽取100个商家,对他们的“平均送达时间”进行统计,得到频率分布直方图如下.
(1)试估计该市使用A款订餐软件的商家的“平均送达时间”的众数及平均数(同一组中的数据用该组区间的中点值代表);
(2)如果以“平均送达时间”的平均数作为决策依据,从A和B两款订餐软件中选择一款订餐,你会选择哪款?
[解] (1)依题意得,使用A款订餐软件的商家中“平均送达时间”的众数为55,平均数为15×0.06+25×0.34+35×0.12+45×0.04+55×0.4+65×0.04=40.
(2)使用B款订餐软件的商家中“平均送达时间”的平均数为15×0.04+25×0.2+35×0.56+45×0.14+55×0.04+65×0.02=35<40,所以选B款订餐软件.
21世纪教育网(www.21cnjy.com)(共44张PPT)
9.2.3 总体集中趋势的估计
第九章 统计
9.2 用样本估计总体
整体感知
[学习目标] 1.会求样本数据的众数、中位数、平均数.
2.理解用样本的数字特征、频率分布直方图估计总体的集中趋势.
[讨论交流] 预习教材P205-P209的内容,思考以下问题:
问题1.在统计学中,刻画总体集中趋势的量有哪些?
问题2.平均数、中位数、众数各有什么应用?有什么优、缺点?
问题3.平均数、中位数与频率分布直方图有什么关系?
[自我感知] 经过认真预习,结合你对本节课的理解和认识,请画出本节课的知识逻辑体系.
探究建构
探究1 众数、中位数、平均数
探究问题1 以下是某校足球队男运动员的身高(单位:cm):
184 182 178 182 184 177 185 174 174 176 184
运动员身高的平均数、中位数、众数是什么?这些统计量刻画了数据的什么特点?
[提示] 运动员身高的平均数为180、中位数为182、众数是184;平均数、中位数、众数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.
次数
中间
平均数
【教用·微提醒】 (1)一组数据的平均数、中位数都是唯一的,众数不唯一,可以有一个,也可以有多个(如1,2,2,3,3,4,5,6这组数的众数是2和3),还可以没有(如1,2,3,4,5,6这组数就没有众数).
(2)众数一定是原数据中的数,平均数和中位数都不一定是原数据中的数.
[典例讲评] 1.(1)对于数据3,3,2,3,6,3,10,3,6,3,2,有下列说法:
①这组数据的众数是3;
②这组数据的众数与中位数的数值不相等;
③这组数据的中位数与平均数的数值相等;
④这组数据的平均数与众数的数值相等.
其中正确的个数是( )
A.1 B.2 C.3 D.4
√
(2)某学习小组共10人,在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数、众数、中位数分别为( )
A.85,85,85 B.87,85,86
C.87,85,85 D.87,85,90
√
反思领悟 平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据相关数据的总数是奇数还是偶数而定;众数是出现次数最多的数.
[学以致用] 1.(1)已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有( )
A.a>b>c B.a>c>b
C.c>a>b D.c>b>a
(2)已知一组数据x1,x2,x3,x4,x5的平均数是2,那么另一组数据2x1-3,2x2-3,2x3-3,2x4-3,2x5-3的平均数为( )
A.1 B.2 C.3 D.4
√
√
探究2 总体集中趋势的估计
探究问题2 平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.从下面的三幅图中,你能发现平均数和中位数的大小存在什么关系吗?
[提示] 一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的(如图①),那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”(如图②),那么平均数大于中位数;如果直方图在左边“拖尾”(如图③),那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.
【链接·教材例题】
例4 利用9.2.1节中100户居民用户的月均用水量的调查数据,计算样本数据的平均数和中位数,并据此估计全市居民用户月均用水量的平均数和中位数.
[典例讲评] 2.(源自湘教版教材)某创业公司全体职工某月的奖金如下:
奖金/元 18 000 12 000 8 000 6 000 4 000 2 500 2 000 1 500 1 200
人数 1
(总经理) 2
(副总
经理) 3 4 10 20 22 12 6
(1)试求出该公司该月奖金数据的众数、中位数和平均数;
(2)你认为用平均数、中位数或众数中的哪一个更能反映该公司的月奖金水平?
(3)能用该公司的月奖金数据估计全国该类创业公司的月奖金水平吗?说说你的理由.
(2)由于大多数员工的月奖金达不到平均数3 115,显然用平均数作为该公司员工月奖金的代表值并不合适;众数2 000及中位数2 250在一定程度上代表了大多数人的月奖金水平,较能反映月奖金水平的实际情况.
(3)由于全国各地的月奖金差异性较大,因而不能用一个公司的数据估计全国该类公司的月奖金水平.
反思领悟 平均数、中位数、众数应用问题的两个关注点
(1)平均数与每一个数据都有关,可以反映更多的总体信息,但受极端值的影响大;中位数是样本数据所占频率的等分线,不受几个极端值的影响;众数只能体现数据的最大集中点,无法客观反映总体特征.
(2)当平均数大于中位数时,说明数据中存在许多较大的极端值.
[学以致用] 2.某公司为了了解一年内的用水情况,抽取了10天的用水量如表所示:
(1)在这10天中,该公司用水量的平均数是多少?每天用水量的中位数是多少?
(2)你认为应该用平均数和中位数中的哪一个来描述该公司每天的用水量更合适?
用水量/t 22 38 40 41 44 50 95
天数 1 1 1 2 2 1 2
【教用·备选题】 下表是五年级两个班各11名同学1分钟仰卧起坐的成绩(单位:次):
(1)这两组数据的平均数、中位数和众数各是多少?
(2)你认为哪个数表示两个班的成绩更合适?
一班 19 33 26 29 28 33 34 35 33 33 30
二班 25 27 29 28 29 30 29 35 29 30 29
[解] (1)一班平均数:(19+33+26+29+28+33+34+35+33+33+30)÷11=333÷11≈30.27(次),
一班数据从小到大排列为:19,26,28,29,30,33,33,33,33,34,35,
所以一班的中位数为33次,
33出现的次数最多,众数是33次;
二班平均数:(25+27+29+28+29+30+29+35+29+30+29)÷11=320÷11≈29.09(次),
二班数据从小到大排列为:25,27,28,29,29,29,29,29,30,30,35,
所以二班的中位数是29次,
29出现的次数最多,所以二班的众数是29次.
(2)运用平均数表示两个班的成绩更合适.
探究3 利用频率分布直方图估计总体的集中趋势
[典例讲评] 3.某城市100户居民的月平均用电量(单位:kW·h),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中x的值;
(2)求月平均用电量的平均数、
众数和中位数.
[160,240)的频率之和为(0.002+0.009 5+0.011+0.012 5)×20=0.7>0.5,所以月平均用电量的中位数在[220,240),
设中位数为y,所以0.45+(y-220)×0.012 5=0.5,解得y=224,即中位数为224,
综上所述,平均数为225.6,众数为230,中位数为224.
反思领悟 用频率分布直方图估计众数、中位数、平均数
(1)众数:取最高小长方形底边中点的横坐标作为众数.
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.
(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
[学以致用] 3.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图.
求:(1)成绩的众数、中位数的估计值;
(2)平均成绩的估计值(同一组中的数据
用该组区间的中点值作代表).
[解] (1)由题图可知众数的估计值为65分.
设中位数为x,∵第一个小矩形的面积为0.3,
则0.3+(x-60)×0.04=0.5,得x=65.
∴中位数的估计值为65分.
(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67(分),
∴平均成绩的估计值为67分.
【链接·教材例题】
例5 某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格.据统计,高一年级女生需要不同规格校服的频数如表9.2-5所示.
表9.2-5
校服规格 155 160 165 170 175 合计
频数 39 64 167 90 26 386
如果用一个量来代表该校高一年级女生所需校服的规格,那么在中位数、平均数和众数中,哪个量比较合适?试讨论用表9.2-5中的数据估计全国高一年级女生校服规格的合理性.
分析:虽然校服规格是用数字表示的,但它们事实上是几种不同的类别.对于这样的分类数据,用众数作为这组数据的代表比较合适.
[解] 为了更直观地观察数据的特征,我们用条形图来表示表中的数据(图9.2-9).可以发现,选择校服规格为“165”的女生的频数最高,所以用众数165作为该校高一年级女生校服的规格比较合适.
由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.
2
4
3
题号
1
应用迁移
1.在一次射击训练中,一小组的成绩如下表:
已知该小组的平均成绩为8.1环,那么成绩为8环的人数是( )
A.5 B.6 C.4 D.7
√
环数 7 8 9
人数 2 3
A [设成绩为8环的人数是x,由平均数的定义,得7×2+8x+9×3=8.1(2+x+3),解得x=5.]
2
3
题号
1
4
2.众数、平均数、中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在如图所示的分布形态中,平均数、众数和中位数的大小关系是(由小到大排列)( )
A.众数<中位数<平均数
B.平均数<众数<中位数
C.中位数<平均数<众数
D.众数<平均数<中位数
√
2
3
题号
1
4
A [众数是最高矩形的底边中点横坐标,因此众数在第二列的中点处.
因为直方图第二、三列所占数据较多,且在右边“拖尾”,所以平均数大于中位数,因此有众数<中位数<平均数.故选A.]
2
3
题号
4
1
3.已知一组数据按从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么数据的众数是________,平均数是________.
6
5
2
4
3
题号
1
4.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)这次测试数学成绩的众数为________;
(2)这次测试数学成绩的中位数为________;
(3)这次测试数学成绩的平均数为________.
75
72
2
4
3
题号
1
1.知识链:(1)中位数、众数、平均数的计算.
(2)总体集中趋势的估计.
(3)频率分布直方图中的中位数、众数、平均数.
2.方法链:数据分析、统计.
3.警示牌:求中位数时,需要先把一组数据按从小到大(或从大到小)的顺序排列,再找中间位置的数或中间两数的平均数.
回顾本节知识,自主完成以下问题:
1.在频率分布直方图中,如何确定众数、中位数和平均数?
[提示] 在频率分布直方图中,众数是最高小矩形底边的中点所对应的数据;中位数左边和右边的直方图的面积应该相等;平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
2.众数、中位数和平均数各有哪些优、缺点?
[提示]
名称 优点 缺点
平均数 与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感 任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数影响越大
名称 优点 缺点
中位数 不受少数几个极端数据(即排序靠前或靠后的数据)的影响 对极端值不敏感
众数 体现了样本数据的最大集中点 众数只能传递数据中的信息的很少一部分,对极端值不敏感