9.2.3 总体集中趋势的估计
1.A [解析] 众数是在一组数据中出现次数最多的数,所以一定会在原始数据中出现.
2.B [解析] 将这10位选手的得分从小到大排列为6,7,7,8,8,8,8,9,9,10,可知中位数为8,且8出现的次数最多,故众数为8.故选B.
3.D [解析] 由题意得=3,故x1+x2+x3+x4+x5=15,则===10.故选D.
4.C [解析] 若这100个数都是8,则这100个数据的中位数是8,故A错误;因为100为偶数,所以把这100个数据从小到大排列后,第50和第51个数据的平均数为中位数,故C正确,B,D错误.故选C.
5.A [解析] 众数是最高矩形的中点横坐标,因此众数在第二组的中点处.因为直方图在右边拖尾,所以平均数大于中位数,又中位数左边和右边的矩形面积之和相等,所以中位数在第二组右边,因此有众数<中位数<平均数.故选A.
6.D [解析] 由题意得(0.005+0.03+a+0.015)×10=1,解得a=0.05,因为0.05+0.3=0.35,0.05+0.3+0.5=0.85,0.35<0.75<0.85,所以样本数据的75%分位数x位于[80,90)内,则0.35+(x-80)×0.05=0.75,解得x=88.因为样本数据中位于[80,90)内的频率最大,所以众数y==85,故选D.
7.D [解析] 由4×(0.01+0.075+a+0.045+0.03+0.02+0.01)=1,可得a=0.06,所以S矩形ABCD=4×0.06=0.24,故A中说法正确;估计该市居民月均用水量的众数为=6(t),故B中说法正确;估计该市居民月均用水量不超过19 t的频率为4×(0.01+0.075+0.06+0.045)+×4×0.03=0.76+0.09=0.85,故C中说法正确;设这200户居民月均用水量的中位数为x1,因为第一个矩形的面积为0.04,第二个矩形的面积为0.3,第三个矩形的面积为0.24,所以中位数x1∈[8,12],由x1=8+×4=8+=,可估计这200户居民月均用水量的中位数为t,估计这200户居民月均用水量的平均数=4×0.01×2+4×0.075×6+4×0.06×10+4×0.045×14+4×0.03×18+4×0.02×22+4×0.01×26=11.76(t),因为<11<11.76,所以估计这200户居民月均用水量的中位数小于平均数,故D中说法不正确.故选D.
8.BCD [解析] 把这10个人的年龄从小到大排列为28,29,29,32,32,32,36,40,40,45,易知这组数据的中位数为32,众数为32,故A错误,B正确;由25%×10=2.5,得这组数据的第25百分位数是第3个数,为29,故C正确;这组数据的平均数==34.3,故D正确.故选BCD.
9.BD [解析] 对于A,因为分数在[60,70]内的频率为1-10×(0.005+0.020+0.030+0.025+0.010)=0.10,所以第三组的频数为100×0.10=10,故A错误;对于B,由图可估计样本的众数为75分,故B正确;对于C,因为10×(0.005+0.020+0.010)=0.35<0.5,10×(0.005+0.020+0.010+0.030)=0.65>0.5,所以中位数位于[70,80]内,设中位数为x,则0.35+0.03(x-70)=0.5,解得x=75,所以估计样本的中位数为75分,故C错误;对于D,估计样本的平均数为(45×0.005+55×0.020+65×0.010+75×0.030+85×0.025+95×0.010)×10=73(分),故D正确,故选BD.
10.67 [解析] 数据65,67,64,60,65,67,67,66,64,62中,出现次数最多的数据是67,即众数为67.
11.95 [解析] 设20名女生的平均成绩为,由题意得50×92=30×90+20×,解得=95(分).
12.105 [解析] 由题图,估计这批树木的底部周长的众数是=105(cm),中位数是+100=+100=(cm).
13.解:(1)若x为这组数据的一个众数,则x的可能取值为164,165,168,170,
即x的取值集合为{164,165,168,170}.
(2)因为样本数据的第90百分位数是173,且20×90%=18,
所以样本数据的第90百分位数为=173,
所以x=172.
(3)若x=174,则估计该校高一年级新生的平均身高为
×(152+155+158+164+164+165+165+165+166+167+168+168+169+170+170+170+171+174+174+175)=166.5(cm).
14.解:(1)==5,
s2=×[(1-5)2+(3-5)2+2×(4-5)2+(5-5)2+2×(6-5)2+3×(7-5)2]=3.6.
(2)①这600名果切消费者中年龄不低于35岁的人数为(0.015+0.005)×10×600=120.
②由0.020×10=0.2<0.5,(0.020+0.035)×10=0.55>0.5,可得15
所以估计这600名果切消费者年龄的中位数约为24岁.
估计这600名果切消费者年龄的平均数=10×0.020×10+20×0.035×10+30×0.025×10+40×0.015×10+50×0.005×10=25(岁).
15.(1)23.55 cm 23.5 cm 23.5 cm (2)尺寸为23.5 cm的鞋销量最好,厂家应多生产 [解析] (1)30双鞋尺寸的平均数=×(22×1+22.5×2+23×4+23.5×14+24×5+24.5×3+25×1)=23.55(cm).由于尺寸小于23.5 cm的销售量为1+2+4=7(双),尺寸大于23.5 cm的销售量为5+3+1=9(双),故将30个数据按从小到大的顺序排列,处于正中间位置的两个数据均为23.5,从而中位数为23.5 cm.因为数据23.5共出现14次,出现次数最多,所以众数也为23.5 cm.
(2)尺寸为23.5 cm的鞋销量最好,厂家应多生产.
16.解:(1)因为甲社区10人的积分中出现次数最多的数据为83,所以b=83.
由乙社区10人的积分等级扇形图可得,乙社区10人的积分在A组的人数为10×10%=1,在B组的人数为10×20%=2,因为乙社区10人的积分在C组中的积分为81,83,84,84,所以乙社区10人的积分从小到大排列后的第5和第6个数据分别为83,84,
所以a=×(83+84)=83.5.
因为乙社区10人的积分在D组的人数为10-1-2-4=3,所以D组人数所占的百分比为×100%=30%,所以m=30.
(2)乙社区在此次垃圾分类换积分活动中表现更好,理由如下:
因为虽然甲、乙两个社区积分的平均数相同,但是乙社区的中位数和众数均比甲社区高,所以乙社区在此次垃圾分类换积分活动中表现更好.
(3)在样本中,甲社区积分在80分及以上的人数所占的比例为=0.6,乙社区积分在80分及以上的人数所占的比例为=0.7,所以估计4月份甲、乙两个社区积分在80分及以上的人数为0.6×700+0.7×800=980.9.2.3 总体集中趋势的估计
一、选择题
1.下列数字特征一定会在原始数据中出现的是 ( )
A.众数 B.中位数
C.平均数 D.都不会
2.在某知识竞赛中,共设有10道题,每道题答对计1分,答错不计分,经统计,10位选手的得分情况如下表:
得分(X) 6 7 8 9 10
人数 1 2 4 2 1
则这10位选手得分的中位数和众数分别为 ( )
A.9,8 B.8,8
C.9,8.5 D.8.5,9
3.[2024·重庆西南大学附中高一月考] 样本中共有5个个体,其值分别为x1,x2,x3,x4,x5.若该样本的平均数为3,则3x1+1,3x2+1,3x3+1,3x4+1,3x5+1的平均数为 ( )
A.1 B.3 C.9 D.10
4.[2024·河南南阳六校高一期末] 已知100个数据的中位数是8,则下列说法正确的是 ( )
A.这100个数据中一定有且仅有50个数小于或等于8
B.把这100个数据从小到大排列后,8是第50个数据
C.把这100个数据从小到大排列后,8是第50和第51个数据的平均数
D.把这100个数据从小到大排列后,8是第50和第49个数据的平均数
5.众数、平均数、中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在如图所示的分布形态中,平均数、众数和中位数的大小关系是 ( )
A.众数<中位数<平均数
B.平均数<众数<中位数
C.中位数<平均数<众数
D.众数<平均数<中位数
6.某校组织学生参加航天知识竞赛,现从中随机抽取100名学生统计其成绩,得到的频率分布直方图如图所示,设样本数据的75%分位数为x,众数为y,则 ( )
A.x=88,y=90 B.x=83,y=90
C.x=83,y=85 D.x=88,y=85
7.[2024·江西上饶沙溪中学高一期末] 某市政府为了制定居民节约用水相关政策,抽样调查了该市200户居民月均用水量(单位:t),根据所得数据绘制成的频率分布直方图如图,则下列说法不正确的是 ( )
A.图中小矩形ABCD的面积为0.24
B.估计该市居民月均用水量的众数为6 t
C.估计该市有85%的居民月均用水量不超过19 t
D.估计这200户居民月均用水量的中位数大于平均数
8.(多选题)[2024·山东日照一中高一月考] 某科技攻关青年团队共有10人,其年龄(单位:岁)分布如下表所示,则这10个人年龄的 ( )
年龄 45 40 36 32 29 28
人数 1 2 1 3 2 1
A.中位数是34
B.众数是32
C.第25百分位数是29
D.平均数为34.3
9.(多选题)某城市在创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数,满分100分),从中随机抽取一个样本容量为100的样本,发现分数均在[40,100]内.现将这些分数分成6组并画出样本的频率分布直方图,但不小心污损了部分图形,如图所示,则下列说法正确的是 ( )
A.频率分布直方图中第三组的频数为15
B.估计样本的众数为75分
C.估计样本的中位数为74分
D.估计样本的平均数为73分
二、填空题
10.10名学生进行1分钟跳绳比赛,他们的成绩数据分别为65,67,64,60,65,67,67,66,64,62,则这组数据的众数为 .
11.[2024·广东深圳中学高一期末] 某班有50名同学,一次数学测试的平均成绩是92分,如果30名男生的平均成绩为90分,那么20名女生的平均成绩为 分.
12.对一批底部周长在[80,130](单位:cm)内的树木进行研究,从中随机抽出200株树木并测出其底部周长,得到的频率分布直方图如图所示.由此估计,这批树木的底部周长的众数是 cm,中位数是 cm.
三、解答题
13.从某校高一年级新生中随机抽取一个容量为20的身高样本,数据如下(单位:cm,数据间无大小顺序要求):152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,x,174,175.
(1)若x为这组数据的一个众数,求x的取值集合;
(2)若将样本数据按从小到大的顺序排列,第90百分位数是173,求x的值;
(3)若x=174,试估计该校高一年级新生的平均身高.
14.果切是一种新型水果售卖方式,商家通过对整果进行消洗、去皮、去核、冷藏等操作后,包装组合销售.
(1)统计得到10名果切消费者每周购买果切的次数依次为1,7,4,7,4,6,6,3,7,5,求这10个数据的平均数与方差s2.
(2)统计600名果切消费者的年龄,他们的年龄均在5岁到55岁之间,将所得数据按照[5,15),[15,25),[25,35),[35,45),[45,55]分组,得到的频率分布直方图如图.
①求这600名果切消费者中年龄不低于35岁的人数;
②估计这600名果切消费者年龄的中位数a及平均数(结果保留整数).
15.某工厂生产销售了30双皮鞋,其中各种尺寸的销售量如下表所示:
鞋的尺寸(cm) 22 22.5 23 23.5 24 24.5 25
销售量(双) 1 2 4 14 5 3 1
(1)这30双鞋尺寸的平均数为 ,中位数为 ,众数为 ;
(2)从实际出发,问题(1)中的众数对指导生产的意义是 .
16.[2024·重庆十八中高一月考] 2023年以来,某区把垃圾分类纳入积分,建立文明账户,市民以行动换积分,以积分转习惯.区政府为了了解4月份甲、乙两个社区居民换积分的情况,分别从甲、乙两个社区各抽取10人,记录下他们的积分(单位:分),并进行整理和分析(积分用x表示,共分为4组:A:x<70;B:70≤x<80,C:80≤x<90,D:90≤x≤100),下面给出了部分信息:
甲社区10人的积分:47,56,68,71,83,83,85,90,91,94;
乙社区10人的积分在C组中的积分为81,83,84,84.
乙社区10人的积分等级扇形图如图.
两组数据的平均数、中位数、众数如下表所示:
社区 平均数 中位数 众数
甲 76.8 83 b
乙 76.8 a 84
根据以上信息,解答下列问题.
(1)求a,b,m的值.
(2)根据以上数据,你认为哪个社区在此次垃圾分类换积分活动中表现更好 请说明理由(一条即可).
(3)若4月份甲社区有700人参与活动,乙社区有800人参与活动,用样本估计总体,估计4月份甲、乙两个社区积分在80分及以上的人数.9.2.3 总体集中趋势的估计
【课前预习】
知识点一
1.(1)出现次数最多 (2)中间 中间 (3)和
诊断分析
(1)√ (2)√ (3)× [解析] (3)众数可能有多个.
知识点二
3.众数
知识点三
(1)横坐标 面积 (2)相等 (3)最高
诊断分析
(1)× (2)× (3)√ (4)√ [解析] (1)样本的众数是频率分布直方图中最高小长方形底边的中点对应的数据.
(2)中位数和众数有可能不改变.
【课中探究】
探究点一
例1 解:在这17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70.这组数据的平均数=×(1.50×2+1.60×3+1.65×2+1.70×3+1.75×4+1.80×1+1.85×1+1.90×1)=≈1.69.
故这17名学生成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.
变式 (1)D (2)A [解析] (1)由题意得a=×(16+18+15+11+16+18+18+17+15+13)==15.7.将这组数据按从小到大的顺序排列为11,13,15,15,16,16,17,18,18,18,则中位数为16,众数为18,即b=16,c=18,∴c>b>a.
(2)∵5探究点二
例2 解:(1)这15人该月销售量的平均数为=320(件),
将这15人该月的销售量按照从小到大的顺序排列为120,120,150,150,150,210,210,210,210,210,250,250,250,510,1800,可得中位数为210件,众数为210件.
(2)我认为不合理,理由:由表格中的数据可知,大部分营销员达不到要求,故不合理.
可以将210件作为月销售定量,理由:
由表格中的数据可知,有一半以上的营销员达到要求,故可以将210件作为月销售定量.
变式 解:(1)一班成绩的平均数为(20+34+26+29+28+34+35+36+34+34+31)÷11=341÷11=31(次),
一班的数据按照从小到大的顺序排列为20,26,28,29,31,34,34,34,34,35,36,
所以一班成绩的中位数为34次,34出现的次数最多,所以一班成绩的众数是34次.
二班成绩的平均数为(26+28+30+28+30+31+30+36+30+31+30)÷11=330÷11=30(次),
二班的数据按照从小到大的顺序排列为26,28,28,30,30,30,30,30,31,31,36,
所以二班成绩的中位数是30次,30出现的次数最多,所以二班成绩的众数是30次.
(2)用平均数表示两个班的成绩更合适.
探究点三
例3 解:(1)由题知(0.01+0.012+0.02+0.03+a)×10=1,解得a=0.028,则在这次测试中数学成绩不低于120分的样本频率为(0.03+0.028+0.012)×10=0.7,所以估计这1000名学生在这次测试中数学成绩不低于120分的人数为1000×0.7=700.
(2)设样本数据的中位数为x,则(0.01+0.02)×10+0.03×(x-120)=0.5,解得x≈126.7,所以估计样本数据的中位数约为126.7分.
(3)估计这1000名学生的数学成绩的平均数为(0.01×105+0.02×115+0.03×125+0.028×135+0.012×145)×10=126.2(分).
变式 解:(1)由题意得
解得
(2)由频率分布直方图,估计全市高一年级学生的优秀率是(0.030+0.018+0.006)×10=0.54,
∴估计全市优秀学生的人数为0.54×200×90=9720.
(3)∵第一、二、三、四组的频率分别为0.04,0.08,0.34,0.30,∴前三组的频率之和为0.46,
∴估计全市高一年级学生一分钟跳绳次数的中位数为120+×10=120+≈121.3,
平均数为95×0.04+105×0.08+115×0.34+125×0.30+135×0.18+145×0.06=121.8.(共80张PPT)
9.2 用样本估计总体
9.2.3 总体集中趋势的估计
探究点一 平均数、中位数和众数的计算
探究点二 平均数、中位数、众数的应用
探究点三 根据频率分布直方图估计总体
的集中趋势
【学习目标】
1.结合具体实例,经历用样本估计总体的集中趋势参数(平均数、
中位数、众数)的过程,并理解集中趋势参数的统计含义.
2.结合具体实例,认识样本与总体的关系,逐步建立用样本估计总
体的思想,尝试运用统计语言描述总体的特征.
知识点一 众数、中位数和平均数
1.众数、中位数和平均数的定义
(1)众数:一组数据中______________的数.
(2)中位数:一组数据按大小顺序排列后,处于______位置的数.如
果数据的个数是偶数,则取______两个数据的平均数.
(3)平均数:一组数据的____除以数据个数所得到的数.
出现次数最多
中间
中间
和
2.众数、中位数和平均数的比较
名称 优点 缺点
平均数 与中位数比较,平均数反映 出样本数据中的更多信息, 对样本中的极端值更加敏感 任何一个数据的改变都会引
起平均数的改变,数据越“离
群”,对平均数的影响越大
名称 优点 缺点
中位数 不受少数几个极端数据 (即排序靠前或靠后的数 据)的影响 对极端值不敏感
众数 体现了样本数据的最大集中 点 众数只能传递数据中的信息
的很少一部分,对极端值不
敏感
续表
【诊断分析】 判断下列说法的正误.(正确的打“√”,错误的打“×”)
(1)众数是一组数据中出现次数最多的数.( )
√
(2)平均数不一定是原数据中的数.( )
√
(3)一个样本的众数、平均数和中位数都是唯一的.( )
[解析] 众数可能有多个.
知识点二 总体集中趋势的估计
1.平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据
分布的形态有关.
2.单峰频率分布直方图的平均数与中位数
形状 关系
对称 平均数与中位数差不多
右边“拖尾” 平均数大于中位数
左边“拖尾” 平均数小于中位数
平均数总是在“长尾巴”那边 3.对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,
可以用平均数、中位数;对分类型数据(如校服规格、性别、产品
质量等级等)集中趋势的描述,可以用______.
众数
知识点三 众数、中位数、平均数与频率
分布直方图
(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形
底边中点的________与小矩形的______的乘积之和近似代替.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的
面积应该______.
(3)众数:在频率分布直方图中,众数是______小矩形底边的中点
所对应的数据.
横坐标
面积
相等
最高
【诊断分析】 判断下列说法的正误.(正确的打“√”,错误的打“×”)
(1)样本的平均数是频率分布直方图中最高小长方形底边的中点对
应的数据.( )
×
[解析] 样本的众数是频率分布直方图中最高小长方形底边的中点对
应的数据.
(2)若改变一组数据中的一个数,则这组数据的平均数、中位数、
众数都会发生改变.( )
×
[解析] 中位数和众数有可能不改变.
(3)众数、中位数和平均数都是描述一组数据集中趋势的量.( )
√
(4)平均数的大小与一组数据里每一个数据均有关系,任何一个数
据的变化都会引起平均数的变化.( )
√
探究点一 平均数、中位数和众数的计算
例1 在一次中学生田径运动会上,参加男子跳高比赛的17名学生的
成绩如下表所示:
1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90
人数 2 3 2 3 4 1 1 1
分别求这17名学生成绩的众数、中位数与平均数(结果保留至小数
点后两位).
解:在这17个数据中, 出现了4次,出现的次数最多,即这组数
据的众数是1.75.
表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70.
这组数据的平均数 .
故这17名学生成绩的众数、中位数、平均数依次为, ,
.
变式(1) 已知10名工人生产同一零件,生产的件数分别是16,18,
15,11,16,18,18,17,15,13,设这组数据的平均数为 ,中位
数为,众数为 ,则有( )
A. B. C. D.
[解析] 由题意得 .
将这组数据按从小到大的顺序排列为11,13,15,15,16,16,17,18,18,18,则中位数为16,众数为18,即, ,
.
√
(2)已知一组数据5,2,,5,8,9,且 .若该组数据的
众数是中位数的 ,则该组数据的平均数为( )
A.6 B.6.5 C.7 D.7.5
[解析] , 将这组数据按从小到大的顺序排列为2,5,
5, ,8,9,则该组数据的众数是5,
又该组数据的众数是中位数的, 该组数据的中位数是6,
即,解得, 该组数据的平均数为 ,
故选A.
√
探究点二 平均数、中位数、众数的应用
例2 某公司销售部有营销员15人,销售部为了制定某种商品的月销
售定量,统计了这15人某月的销售量(单位:件),具体数据如下
表所示:
销售量 1800 510 250 210 150 120
人数 1 1 3 5 3 2
(1)求这15人该月销售量的平均数、中位数和众数.
解:这15人该月销售量的平均数为
(件),
将这15人该月的销售量按照从小到大的顺序排列为120,120,150,
150,150,210,210,210,210,210,250,250,250,510,1800,
可得中位数为210件,众数为210件.
(2)假设销售部负责人把每位营销员的月销售定量定为320件,你
认为是否合理?为什么?如不合理,请你制定一个较合理的月销售
定量,并说明理由.
解:我认为不合理,
理由:由表格中的数据可知,大部分营销员达不到要求,故不合理.
可以将210件作为月销售定量,
理由:由表格中的数据可知,有一半以上的营销员达到要求,故可
以将210件作为月销售定量.
变式 下表是某校高一年级两个班各11名同学1分钟仰卧起坐的成绩
(单位:次):
一班 20 34 26 29 28 34 35 36 34 34 31
二班 26 28 30 28 30 31 30 36 30 31 30
(1)这两组数据的平均数,中位数和众数各是多少?
解:一班成绩的平均数为
(次),
一班的数据按照从小到大的顺序排列为20,26,28,29,31,34,34,34,34,35,36,所以一班成绩的中位数为34次,
34出现的次数最多,所以一班成绩的众数是34次.
二班成绩的平均数为
(次),
二班的数据按照从小到大的顺序排列为26,28,28,30,30,30,30,30,31,31,36,所以二班成绩的中位数是30次,
30出现的次数最多,所以二班成绩的众数是30次.
(2)你认为用哪个数表示两个班的成绩更合适?
解:用平均数表示两个班的成绩更合适.
[素养小结]
平均数、中位数、众数应用问题的两个关注点
(1)平均数与每一个数据都有关,可以反映更多的总体信息,但受
极端值的影响较大;中位数是样本数据所占频率的等分线,不受几
个极端值的影响;众数只能体现数据的最大集中点,无法客观反映
总体特征.
(2)当平均数大于中位数时,说明数据中存在较大的极端值;反之,
说明数据中存在较小的极端值.
探究点三 根据频率分布直方图估计总体的集中趋势
例3 某中学高三年级有1000名学生参加学情调
研测试,用简单随机抽样的方法抽取了一个容
量为50的样本,得到数学成绩的频率分布直方
图如图所示.
(1)估计图中 的值,并估计这1000名学生在这
次测试中数学成绩不低于120分的人数;
解:由题知
,解得 ,
则在这次测试中数学成绩不低于120分的样本
频率为 ,所以估计这1000名学生在这次测试中数学成绩不低于120分的人数为 .
(2)估计样本数据的中位数(结果保留1位
小数);
解:设样本数据的中位数为 ,则
,
解得 ,所以估计样本数据的中位数
约为126.7分.
(3)估计这1000名学生的数学成绩的平均数.
解:估计这1000名学生的数学成绩的平均数为
(分).
变式 某市为了了解学生的体能情况,从全市所
有高一年级学生中按 的比例随机抽取200人
进行一分钟跳绳测试,将所得数据整理后,分
为6组画出频率分布直方图(如图所示),由于
操作失误,导致第一组和第二组的数据丢失,
但知道第二组的频率是第一组频率的2倍.
(1)求和 的值;
解:由题意得
解得
(2)若次数在120以上(含120)为优秀,
试估计全市高一年级学生的优秀率和全市优
秀学生的人数;
解:由频率分布直方图,估计全市高一年级
学生的优秀率是
,
估计全市优秀学生的人数为 .
(3)估计全市高一年级学生一分钟跳绳次数的中
位数和平均数.
解: 第一、二、三、四组的频率分别为,
,,, 前三组的频率之和为 ,
估计全市高一年级学生一分钟跳绳次数的中位数为
,
平均数为
.
[素养小结]
用频率分布表或频率分布直方图求数字特征:
(1)众数是最高的小长方形的底边的中点对应的数据.
(2)中位数左右两侧直方图的面积相等.
(3)平均数等于每个小长方形的面积乘小长方形底边中点的横坐标
的和.
(4)利用频率分布直方图求得的众数、中位数、平均数均为近似值,
往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和
平均数.
1.一组数据的平均数、中位数都是唯一的,众数不一定唯一,可以有
一个,也可以有多个,还可以没有.如果有两个数据出现的次数相
同,并且比其他数据出现的次数都多,那么这两个数据都是这组数
据的众数.众数一定是原数据中的数,平均数和中位数都不一定是
原数据中的数.
2.中位数仅与数据排列位置有关,某些数据的变动对中位数没有影响,
中位数可能在所给数据中(数据个数为奇数或数据个数为偶数且中
间两数相等),也可能不在所给的数据中(数据个数为偶数且中间
两数不相等).当一组数据的个别数据变动较大时,可以用中位数
描述其集中趋势.
3.众数考查各数据出现的频率,大小只与这组数据中的部分数据有关,
当一组数据中有多个数据多次重复出现时,众数往往更能反映问题.
4.实际问题中求得的平均数、众数和中位数应带上单位.
众数、中位数、平均数的实际意义
平均数是统计中最常用的数据代表值,比较可靠和稳定,因为它与每一
个数据都有关,反映出来的信息也最充分.平均数既可以描述一组数据
本身的整体平均情况,也可以用来作为不同组数据比较的一个标准,它
在生活中应用最广泛.
中位数作为一组数据的代表,可靠性比较差,因为它只利用了部分数据.
但当一组数据的个别数据偏大或偏小时,用中位数来描述该组数据的
集中趋势就比较合适.
众数作为一组数据的代表,可靠性也比较差,因为它也只利用了部分数
据.在一组数据中,如果个别数据有很大的变动,且某个数据出现的次数
最多,此时用该数据(即众数)表示这组数据的“集中趋势”就比较适合.
在实际中,经常用平均数、中位数或者众数进行一些判断.
例(1) (多选题)已知运动员甲特训的成绩分别为9,12,8,16,
16,18,20,16,12,13,则这组数据的( )
A.众数为12 B.平均数为14
C.中位数为14.5 D.第85百分位数为16
[解析] 将成绩从小到大排列为8,9,12,12,13,16,16,16,18,20.出现次数最
多的数为16,即众数为16,故A错误;
平均数为 ,
故B正确;
中位数为,故C正确;
因为 ,所以第85百分位数为第9个数据,即为18,
故D错误.故选 .
√
√
(2)(多选题)[2024· 安徽皖北六校高一期末] 为了加深师生对党
史的了解,激发广大师生知史爱党、知史爱国的热情,某校举办了
“学党史、育文化”暨“喜迎党的二十大”党史知识竞赛,并将1000名
师生的竞赛成绩(满分为100分,成绩取整数)整理成如图所示的频
率分布直方图,则下列说法正确的是( )
A. 的值为0.005
B.成绩低于60分的有25人
C.估计这1000名师生竞赛成绩的众数为75
D.估计这1000名师生竞赛成绩的第85百分
位数为86
√
√
√
[解析] 对于A,由
,解得 ,
故A正确;
对于B,成绩低于60分的有
(人),故B错误;
对于C,估计这1000名师生竞赛成绩的众数为75,故C正确;
对于D,设这1000名师生竞赛成绩的第85百分位数为 , 因为
成绩位于内的频率为,
成绩位于内的频率为,所以 ,
所以,解得 ,故D正
确.故选 .
练习册
一、选择题
1.下列数字特征一定会在原始数据中出现的是( )
A.众数 B.中位数 C.平均数 D.都不会
[解析] 众数是在一组数据中出现次数最多的数,所以一定会在原始数
据中出现.
√
2.在某知识竞赛中,共设有10道题,每道题答对计1分,答错不计分,
经统计,10位选手的得分情况如下表:
6 7 8 9 10
人数 1 2 4 2 1
则这10位选手得分的中位数和众数分别为( )
A.9,8 B.8,8 C.9, D. ,9
[解析] 将这10位选手的得分从小到大排列为6,7,7,8,8,8,8,
9,9,10,可知中位数为8,且8出现的次数最多,故众数为8.故选B.
√
3.[2024·重庆西南大学附中高一月考]样本中共有5个个体,其值分别
为,,,,.若该样本的平均数为3,则,, ,
, 的平均数为( )
A.1 B.3 C.9 D.10
[解析] 由题意得,故 ,则
.
故选D.
√
4.[2024·河南南阳六校高一期末]已知100个数据的中位数是8,则下
列说法正确的是( )
A.这100个数据中一定有且仅有50个数小于或等于8
B.把这100个数据从小到大排列后,8是第50个数据
C.把这100个数据从小到大排列后,8是第50和第51个数据的平均数
D.把这100个数据从小到大排列后,8是第50和第49个数据的平均数
[解析] 若这100个数都是8,则这100个数据的中位数是8,故A错误;
因为100为偶数,所以把这100个数据从小到大排列后,第50和第51
个数据的平均数为中位数,故C正确,B,D错误.故选C.
√
5.众数、平均数、中位数都描述了数据的集中趋势,它们的大小关系
和数据分布的形态有关.在如图所示的分布形态中,平均数、众数和
中位数的大小关系是( )
A.众数 中位数 平均数
B.平均数 众数 中位数
C.中位数 平均数 众数
D.众数 平均数 中位数
√
[解析] 众数是最高矩形的中点横坐标,因此众数在第二组的中点处.
因为直方图在右边拖尾,所以平均数大于中位数,又中位数左边和
右边的矩形面积之和相等,所以中位数在第二组右边,因此有众数
中位数 平均数.故选A.
6.某校组织学生参加航天知识竞赛,现从中随
机抽取100名学生统计其成绩,得到的频率分
布直方图如图所示,设样本数据的 分位
数为,众数为 ,则( )
A., B.,
C., D.,
√
[解析] 由题意得
,解得,
因为 ,
, ,
所以样本数据的分位数位于 内,
则 ,解得.
因为样本数据中位于 内的频率最大,所以众数 ,
故选D.
7.[2024·江西上饶沙溪中学高一期末]某市政
府为了制定居民节约用水相关政策,抽样调
查了该市200户居民月均用水量(单位: ),
根据所得数据绘制成的频率分布直方图如图,
则下列说法不正确的是( )
A.图中小矩形 的面积为0.24
B.估计该市居民月均用水量的众数为
C.估计该市有的居民月均用水量不超过
D.估计这200户居民月均用水量的中位数大于平均数
√
[解析] 由 ,可得 ,所以
,
故A中说法正确;
估计该市居民月均用水量的众数为
,故B中说法正确;
估计该市居民月均用水量不超过 的频率为 ,故C中说法正确;
设这200户居民月均用水量的中位数为 ,
因为第一个矩形的面积为,
第二个矩形的面积为 ,
第三个矩形的面积为 ,
所以中位数 ,
由 ,
可估计这200户居民月均用水量的中位数为,
估计这200户居民月均用水量的平均数
,
因为 ,所以估计这200户居民月均用水量的中位数小于平均数,故D中说法不正确.故选D.
8.(多选题)[2024·山东日照一中高一月考] 某科技攻关青年团队共
有10人,其年龄(单位:岁)分布如下表所示,则这10个人年龄的
( )
年龄 45 40 36 32 29 28
人数 1 2 1 3 2 1
A.中位数是34 B.众数是32
C.第25百分位数是29 D.平均数为34.3
√
√
√
[解析] 把这10个人的年龄从小到大排列为28,29,29,32,32,32,36,40,40,
45,易知这组数据的中位数为32,众数为32,故A错误,B正确;
由 ,得这组数据的第25百分位数是第3个数,为29,
故C正确;
这组数据的平均数 ,故D正确.
故选 .
9.(多选题)某城市在创建文明城市的活动中,为了解居民对“创建
文明城市”的满意程度,组织居民给活动打分(分数为整数,满分
100分),从中随机抽取一个样本容量为100的样本,发现分数均在
内.现将这些分数分成6组并画出样本的频率分布直方图,但
不小心污损了部分图形,如图所示,
则下列说法正确的是( )
A.频率分布直方图中第三组的频数为15
B.估计样本的众数为75分
C.估计样本的中位数为74分
D.估计样本的平均数为73分
√
√
[解析] 对于A,因为分数在 内
的频率为
,
所以第三组的频数为 ,
故A错误;
对于B,由图可估计样本的众数为75分,故B正确;
对于C,因为 , ,
所以中位数位于 内,设中位数为
,则 ,解得
,所以估计样本的中位数为75分,
故C错误;
对于D,估计样本的平均数为
(分),故D正确,故选 .
二、填空题
10.10名学生进行1分钟跳绳比赛,他们的成绩数据分别为65,67,64,
60,65,67,67,66,64,62,则这组数据的众数为____.
67
[解析] 数据65,67,64,60,65,67,67,66,64,62中,出现次
数最多的数据是67,即众数为67.
11.[2024·广东深圳中学高一期末] 某班有50名同学,一次数学测试的
平均成绩是92分,如果30名男生的平均成绩为90分,那么20名女生
的平均成绩为____分.
95
[解析] 设20名女生的平均成绩为 ,由题意得
,解得 (分).
12.对一批底部周长在(单位: )内
的树木进行研究,从中随机抽出200株树木并测
出其底部周长,得到的频率分布直方图如图所
示.由此估计,这批树木的底部周长的众数是
_____,中位数是____ .
105
[解析] 由题图,估计这批树木的底部周长的众数是 ,
中位数是 .
三、解答题
13.从某校高一年级新生中随机抽取一个容量为20的身高样本,数据
如下(单位:,数据间无大小顺序要求) ,155,158,164,
164,165,165,165,166,167,168,168,169,170,170,170,
171, ,174,175.
(1)若为这组数据的一个众数,求 的取值集合;
解:若为这组数据的一个众数,则 的可能取值为164,165,168,
170,即的取值集合为,165,168, .
(2)若将样本数据按从小到大的顺序排列,第90百分位数是173,
求 的值;
解:因为样本数据的第90百分位数是173,且 ,
所以样本数据的第90百分位数为 ,
所以 .
(3)若 ,试估计该校高一年级新生的平均身高.
解:若 ,则估计该校高一年级新生的平均身高为
.
14.果切是一种新型水果售卖方式,商家通过
对整果进行消洗、去皮、去核、冷藏等操作
后,包装组合销售.
(1)统计得到10名果切消费者每周购买果切
的次数依次为1,7,4,7,4,6,6,3,7,
5,求这10个数据的平均数与方差 .
解: ,
.
(2)统计600名果切消费者的年龄,他们的年龄均在
5岁到55岁之间,将所得数据按照 ,
, 分组,得到的频率分布直方
图如图.
①求这600名果切消费者中年龄不低于35岁的人数;
解:这600名果切消费者中年龄不低于35岁的人数为
.
②估计这600名果切消费者年龄的中位数 及
平均数 (结果保留整数).
解:由 ,
,可得
,
所以 ,
解得 ,
所以估计这600名果切消费者年龄的中位数约为24岁.
估计这600名果切消费者年龄的平均数
(岁).
15.某工厂生产销售了30双皮鞋,其中各种尺寸的销售量如下表所示:
22 22.5 23 23.5 24 24.5 25
销售量(双) 1 2 4 14 5 3 1
(1)这30双鞋尺寸的平均数为_________,中位数为________,众
数为________;
[解析] 30双鞋尺寸的平均数
.
由于尺寸小于 的销售量为(双),尺寸大于的销售量为 (双),故将30个数据按从小到大的顺序排列,处于正中间位置的两个数据均为,从而中位数为.
因为数据 共出现14次,出现次数最多,所以众数也为 .
(2)从实际出发,问题(1)中的众数对指导生产的意义是_______
__________________________________.
尺寸为的鞋销量最好,厂家应多生产
[解析] 尺寸为 的鞋销量最好,厂家应多生产.
16.[2024·重庆十八中高一月考] 2023年以来,某区把垃圾分类纳入
积分,建立文明账户,市民以行动换积分,以积分转习惯.区政府为
了了解4月份甲、乙两个社区居民换积分的情况,分别从甲、乙两个
社区各抽取10人,记录下他们的积分(单位:分),并进行整理和
分析(积分用表示,共分为4组:; ,
, ),下面给出了部分信息:
甲社区10人的积分:47,56,68,71,83,83,85,90,91,94;
乙社区10人的积分在 组中的积分为81,83,84,84.
乙社区10人的积分等级扇形图如图.
两组数据的平均数、中位数、众数如下表所示:
社区 平均数 中位数 众数
甲 76.8 83
乙 76.8 84
根据以上信息,解答下列问题.
(1)求,, 的值.
解:因为甲社区10人的积分中出现次数最多的数据为83,所以 .
由乙社区10人的积分等级扇形图可得,乙社区10人的积分在组的人数
为,在 组的人数为,
因为乙社区10人的积分在 组中的积分为81,83,84,84,所以乙社区
10人的积分从小到大排列后的第5和第6个数据分别为83,84,
所以 .
因为乙社区10人的积分在 组的人数为,所以 组人
数所占的百分比为,所以 .
(2)根据以上数据,你认为哪个社区在此次垃圾分类换积分活动中
表现更好?请说明理由(一条即可).
解:乙社区在此次垃圾分类换积分活动中表现更好,理由如下:
因为虽然甲、乙两个社区积分的平均数相同,但是乙社区的中位数和众
数均比甲社区高,所以乙社区在此次垃圾分类换积分活动中表现更好.
(3)若4月份甲社区有700人参与活动,乙社区有800人参与活动,用
样本估计总体,估计4月份甲、乙两个社区积分在80分及以上的人数.
解:在样本中,甲社区积分在80分及以上的人数所占的比例为 ,
乙社区积分在80分及以上的人数所占的比例为 ,所以估计4月份
甲、乙两个社区积分在80分及以上的人数为 .9.2.3 总体集中趋势的估计
【学习目标】
1.结合具体实例,经历用样本估计总体的集中趋势参数(平均数、中位数、众数)的过程,并理解集中趋势参数的统计含义.
2.结合具体实例,认识样本与总体的关系,逐步建立用样本估计总体的思想,尝试运用统计语言描述总体的特征.
◆ 知识点一 众数、中位数和平均数
1.众数、中位数和平均数的定义
(1)众数:一组数据中 的数.
(2)中位数:一组数据按大小顺序排列后,处于 位置的数.如果数据的个数是偶数,则取 两个数据的平均数.
(3)平均数:一组数据的 除以数据个数所得到的数.
2.众数、中位数和平均数的比较
名称 优点 缺点
平均数 与中位数比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感 任何一个数据的改变都会引起平均数的改变,数据越“离群”,对平均数的影响越大
中位数 不受少数几个极端数据(即排序靠前或靠后的数据)的影响 对极端值不敏感
众数 体现了样本数据的最大集中点 众数只能传递数据中的信息的很少一部分,对极端值不敏感
【诊断分析】 判断下列说法的正误.(正确的打“√”,错误的打“×”)
(1)众数是一组数据中出现次数最多的数. ( )
(2)平均数不一定是原数据中的数. ( )
(3)一个样本的众数、平均数和中位数都是唯一的.( )
◆ 知识点二 总体集中趋势的估计
1.平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.
2.单峰频率分布直方图的平均数与中位数
形状 关系
对称 平均数与中位数差不多
右边“拖尾” 平均数大于中位数
左边“拖尾” 平均数小于中位数
平均数总是在“长尾巴”那边
3.对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用 .
◆ 知识点三 众数、中位数、平均数与频率
分布直方图
(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的 与小矩形的 的乘积之和近似代替.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该 .
(3)众数:在频率分布直方图中,众数是 小矩形底边的中点所对应的数据.
【诊断分析】 判断下列说法的正误.(正确的打“√”,错误的打“×”)
(1)样本的平均数是频率分布直方图中最高小长方形底边的中点对应的数据. ( )
(2)若改变一组数据中的一个数,则这组数据的平均数、中位数、众数都会发生改变. ( )
(3)众数、中位数和平均数都是描述一组数据集中趋势的量. ( )
(4)平均数的大小与一组数据里每一个数据均有关系,任何一个数据的变化都会引起平均数的变化.( )
◆ 探究点一 平均数、中位数和众数的计算
例1 在一次中学生田径运动会上,参加男子跳高比赛的17名学生的成绩如下表所示:
成绩(单位:m) 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90
人数 2 3 2 3 4 1 1 1
分别求这17名学生成绩的众数、中位数与平均数(结果保留至小数点后两位).
变式 (1)已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设这组数据的平均数为a,中位数为b,众数为c,则有 ( )
A.a>b>c B.a>c>b
C.c>a>b D.c>b>a
(2)已知一组数据5,2,x,5,8,9,且5A.6 B.6.5
C.7 D.7.5
◆ 探究点二 平均数、中位数、众数的应用
例2 某公司销售部有营销员15人,销售部为了制定某种商品的月销售定量,统计了这15人某月的销售量(单位:件),具体数据如下表所示:
销售量 1800 510 250 210 150 120
人数 1 1 3 5 3 2
(1)求这15人该月销售量的平均数、中位数和众数.
(2)假设销售部负责人把每位营销员的月销售定量定为320件,你认为是否合理 为什么 如不合理,请你制定一个较合理的月销售定量,并说明理由.
变式 下表是某校高一年级两个班各11名同学1分钟仰卧起坐的成绩(单位:次):
一班 20 34 26 29 28 34 35 36 34 34 31
二班 26 28 30 28 30 31 30 36 30 31 30
(1)这两组数据的平均数,中位数和众数各是多少
(2)你认为用哪个数表示两个班的成绩更合适
[素养小结]
平均数、中位数、众数应用问题的两个关注点
(1)平均数与每一个数据都有关,可以反映更多的总体信息,但受极端值的影响较大;中位数是样本数据所占频率的等分线,不受几个极端值的影响;众数只能体现数据的最大集中点,无法客观反映总体特征.
(2)当平均数大于中位数时,说明数据中存在较大的极端值;反之,说明数据中存在较小的极端值.
◆ 探究点三 根据频率分布直方图估计总体的集中趋势
例3 某中学高三年级有1000名学生参加学情调研测试,用简单随机抽样的方法抽取了一个容量为50的样本,得到数学成绩的频率分布直方图如图所示.
(1)估计图中a的值,并估计这1000名学生在这次测试中数学成绩不低于120分的人数;
(2)估计样本数据的中位数(结果保留1位小数);
(3)估计这1000名学生的数学成绩的平均数.
变式 某市为了了解学生的体能情况,从全市所有高一年级学生中按90∶1的比例随机抽取200人进行一分钟跳绳测试,将所得数据整理后,分为6组画出频率分布直方图(如图所示),由于操作失误,导致第一组和第二组的数据丢失,但知道第二组的频率是第一组频率的2倍.
(1)求a和b的值;
(2)若次数在120以上(含120)为优秀,试估计全市高一年级学生的优秀率和全市优秀学生的人数;
(3)估计全市高一年级学生一分钟跳绳次数的中位数和平均数.
[素养小结]
用频率分布表或频率分布直方图求数字特征:
(1)众数是最高的小长方形的底边的中点对应的数据.
(2)中位数左右两侧直方图的面积相等.
(3)平均数等于每个小长方形的面积乘小长方形底边中点的横坐标的和.
(4)利用频率分布直方图求得的众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.