专题9.6 统计全章八大压轴题型归纳(拔尖篇)(举一反三)(含答案)2024-2025学年高一数学举一反三系列(人教A版2019必修第二册)

文档属性

名称 专题9.6 统计全章八大压轴题型归纳(拔尖篇)(举一反三)(含答案)2024-2025学年高一数学举一反三系列(人教A版2019必修第二册)
格式 zip
文件大小 3.2MB
资源类型 试卷
版本资源 人教A版(2019)
科目 数学
更新时间 2025-05-05 09:21:07

文档简介

专题 9.6 统计全章八大压轴题型归纳(拔尖篇)
【人教 A 版(2019)】
题型 1 简单随机抽样估计总体
1.(24-25 高三下·湖北·阶段练习)我国古代数学名著《数书九章》是南宋数学家秦九韶所著数学著作,书
中共列算题 81 问,分为 9 类,全书采用问题集的形式,并不按数学方法来分类.题文也不只谈数学,还涉
及自然现象和社会生活,成为了解当时社会政治和经济生活的重要参考文献.《数书九章》中有“米谷粒分”
一题,现有类似的题:粮仓开仓收粮,粮农送来米 1500 石,验得米夹谷,抽样取米一把,数得 304 粒夹谷
30 粒,则这批米内夹谷约为( )
A.148 石 B.149 石 C.150 石 D.151 石
【解题思路】抽样调查中简单随机抽样,对象被抽到的概率是相同的, 304 粒夹谷 30 粒,1500 石米夹谷
的比例是相同的,计算即可.
【解答过程】由题意可知这批米内夹谷约为1500 × 30304 ≈ 148(石).
故选:A.
2.(2024·河南·三模)中国农历的“二十四节气”是凝结着中华民族的智慧与传统文化的结晶,2022 年 2 月
4 日北京冬奥会开幕式,以二十四节气的方式开始倒计时,惊艳全球.某小学一年级随机抽查 100 名学生并
提问“二十四节气歌”,只能说出两句的有 32 人,能说出三句或三句以上的有 45 人,据此估计该校一年级的
400 名学生中对“二十四节气歌”只能说出一句或一句也说不出的人数约为( )
A.23 B.92 C.128 D.180
【解题思路】先计算 100 名学生中能说出一句或一句也说不出的人数,根据抽样比例计算即可
【解答过程】由题意,100 名学生中能说出一句或一句也说不出的人数为100 32 45 = 23人
故该校一年级的 400 400名学生中对“二十四节气歌”只能说出一句或一句也说不出的人数约为100 × 23 = 92人
故选:B.
3.(24-25 高一·全国·课后作业)为了解某中学生遵守《中华人民共和国交通安全法》的 情况,调查部门
在该校进行了如下的随机调查,向被调查者提出两个问题:
(1)你的学号是奇数吗?(2)在过路口时你是否闯过红灯?
要求被调查者背对着调查人员抛掷一枚硬币,如果出现正面,就回答第一个问题,否则就回答第二个问
题.被调查者不必告诉调查人员自己回答的是哪一个问题,只需回答“是”或“不是”,因为只有调查者本人知
道回答了哪一个问题,所以都如实地做了回答.结果被调查的 800 人(学号从 1 至 800)中有 240 人回答了
“是”.由此估计这 800 人中闯过红灯的人数?
【解题思路】在准备的两个问题中每一个问题被问到的概率相同,第一个问题可能被询问 400 次,在被询
问的 400 人中有 200 人学号是奇数,比 200 人多出来的人数就是 400 人中闯过红灯的人数,从而估计出 800
人中有过闯过红灯的人数.
【解答过程】解:要调查 800 名学生,在准备的两个问题中每一个问题被问到的概率相同,
∴第一个问题可能被询问 400 次,
∵在被询问的 400 人中有 200 人学号是奇数,而有 240 人回答了“是”,
∴估计有240 200 = 40个人闯过红灯,即在 400 人中有 40 个人闯过红灯,
∴根据概率的知识来估计这 800 人中有过闯过红灯的人数为 80.
4.(24-25 高一·全国·课后作业)近年来,我国高速铁路发展迅速,到 2016 年底为止,已经运营的高铁轨
道的总长度已达2.2 × 104km,位居世界第一.为了提高营运的效率,铁路部门在安排停靠站台时通过分班次、
间隔站点的方式进行,如京沪高铁 G125 班次 11∶10 从北京始发,开往上海虹桥(据 2017 年 10 月时刻
表),停靠站分别为天津南、德州东、济南西、滕州东、蚌埠南、南京南、镇江南、常州北、昆山南,而
08∶35 从北京始发的 G111 班次,停靠站分别为德州东、济南西、泰安、滁州、南京南、丹阳北、无锡东,
最后停靠终点站上海虹桥.试运用统计研究的方法完成下述任务:
(1)如何确定每天的总班次及具体班次的安排?
(2)在确定各个班次停靠站的数量时应考虑哪些因素?如何实施?
(3)在确定各个班次停靠站时应考虑哪些因素?如何实施?
【解题思路】(1)估算总人数除以载客量得到总班次,具体班次由站台人数分布确定.
(2)确定各个班次停靠站的数量时应考虑时间和人数,抽样调查人数的高峰期,得到方案.
(3)确定各个班次停靠站时应考虑时间和人数分布,抽样调查,估算总数,得到方案.
【解答过程】(1)运用抽样调查的方式,用样本估计总体,得到从北京到上海及沿途乘坐总人数,
除以每列火车的运载量,得到总班次;
具体班次的安排主要是由每个车站的乘坐人数决定,由于是间隔停靠,站台人数和多的站点多安排车次.
(2)在确定各个班次停靠站的数量时应考虑时间和人数,
有的站点人数会跟时间强烈相关,并不是平均分布的,需要在高峰时段多安排车辆;
实施的方式是统计各个站台各个时间段内的人数,估计总人数,绘制图像,制定方案.
(3)在确定各个班次停靠站时应考虑时间和人数分布,
采取抽样调查的方式,统计各个时间段的人数分布,为制定方案提供数据支持.
题型 2 分层抽样的计算
1.(23-24 高一下·江西景德镇·期中)在新冠肺炎疫情期间,大多数学生都在家进行网上上课,某校高一,
高二,高三共有学生 6000 名,为了了解同学们对某授课软件的意见,计划采用分层抽样的方法从这 6000
名学生中抽取一个容量 60 的样本,若从高一,高二,高三抽取的人数恰好是从小到大排列的连续偶数,则
该校高二年级的人数为( )
A.1000 B.1500 C.2000 D.3000
【解题思路】根据分层抽样的性质,结合样本容量进行求解即可.
【解答过程】因为从高一、高二、高三抽取的人数恰好是从小到大排列的连续偶数,
所以设高三抽取的人数为2 ,则高二抽取的人数为2 2,高一抽取的人数为2 4,
因为样本容量为 60,所以2 + 2 2 + 2 4 = 60 2 = 22,
设我校高二年级的人数为 ,

= 22 2根据分层抽样得:6000 60 = 2000,
故选:C.
2.(24-25 高一·全国·课后作业)某学校在校学生有 2000 人,为了增强学生的体质,学校举行了跑步和登
山比赛,每人都参加且只参加其中一项比赛,高一、高二、高三年级参加跑步的人数分别为 a,b,c,且
: : = 2:5:3 1,全校参加登山的人数占总人数的4.为了了解学生对本次比赛的满意程度,按分层抽样的方法
从中抽取一个容量为 200 的样本进行调查,则应从高三年级参加跑步的学生中抽取( )
A.15 人 B.30 人 C.40 人 D.45 人
2000 × 3【解题思路】由题知全校参加跑步的人数为 4 = 1500,再根据分层抽样的方法求解即可得答案.
3
【解答过程】解:由题意,可知全校参加跑步的人数为2000 × 4 = 1500,
所以 + + = 1500.因为 : : = 2:5:3,所以 = 1500 × 32+5+3 = 450.
因为按分层抽样的方法从中抽取一个容量为 200 的样本,
200
所以应从高三年级参加跑步的学生中抽取的人数为450 × 2000 = 45.
故选:D.
3.(24-25 高一下·全国·课后作业)某大型企业针对改善员工福利的 , , 三种方案进行了问卷调查,调
查结果如下:
支持 方案 支持 方案 支持 方案
35 岁以下的人数 200 400 800
35 岁及以上的人数 100 100 400
(1)从所有参与调查的人中,用分层随机抽样的方法抽取 人,已知从支持 方案的人中抽取了 6 人,求
的值.
(2)从支持 方案的人中,用分层随机抽样的方法抽取 5 人,这 5 人中年龄在 35 岁及以上的人数是多少?
年龄在 35 岁以下的人数是多少?
【解题思路】(1)根据分层抽样时,各层的抽样比相等,结合已知构造关于 n 的方程,解方程可得 n 值;
5
(2)根据抽样比500即可求出年龄在 35 岁以下,及年龄在 35 岁及以上的人数.
6
【解答过程】(1)由题意得100+200 = 200+400+800+100+100+400,解得 = 40.
(2)年龄在 35 5岁以下的人数为500 × 400 = 4,
35 5年龄在 岁及以上的人数为500 × 100 = 1.
4.(24-25 高一下·全国·课后作业)某市两所高级中学联合在暑假组织全体教师外出旅游,活动分为两条线
路:华东五市游和长白山之旅,且每位教师至多参加了其中的一条线路.在参加活动的教师中,高一教师占
42.5% 1,高二教师占 47.5%,高三教师占 10%.参加华东五市游的教师占参加活动总人数的4,且该组中,高
一教师占 50%,高二教师占 40%,高三教师占 10%.为了了解各条线路不同年级的教师对本次活动的满意程
度,现用分层随机抽样的方法从参加活动的全体教师中抽取一个容量为 200 的样本.试确定:
(1)参加长白山之旅的高一教师、高二教师、高三教师在该组分别所占的比例;
(2)参加长白山之旅的高一教师、高二教师、高三教师分别应抽取的人数.
【解题思路】(1)设参加华东五市游的人数为 x,参加长白山之旅的高一教师、高二教师、高三教师所占
的比例分别为 a,b,c,计算得到答案.
(2)根据分层抽样公式计算得到答案.
【解答过程】(1)设参加华东五市游的人数为 x,参加长白山之旅的高一教师、高二教师、高三教师所占
的比例分别为 a,b,c
40%+3
则有 4 = 47.5%
10%+3
, 4 = 10%,解得 = 50%, = 10%.
故 = 100% 50% 10% = 40%
参加长白山之旅的高一教师、高二教师、高三教师在该组所占的比例分别为 40%,50%,10%.
3
(2)参加长白山之旅的高一教师应抽取人数为200 × 4 × 40% = 60;
3
抽取的高二教师人数为200 × 4 × 50% = 75;
3
抽取的高三教师人数为200 × 4 × 10% = 15.
题型 3 频率分布直方图的相关计算问题
1.(24-25 高一下·广西崇左·阶段练习)某个高级中学组织物理 化学学科能力竞赛,全校 1000 名学生都参
加两科考试,考试后按学科分别评出一 二 三等奖和淘汰的这四个等级,现有某考场的两科考试数据统计
如下,其中物理科目成绩为二等奖的考生有 12 人.如果以这个考场考生的物理和化学成绩去估计全校考生的
物理和化学成绩分布,则以下说法正确的是( )
①该考场化学考试获得一等奖的有 4 人;
②全校物理考试获得二等奖的有 240 人;
③如果采用分层抽样从全校抽取 200 人,则化学考试被淘汰 78 人.
A.①②③ B.②③ C.①② D.①③
【解题思路】由物理二等奖的人数和频率可得该考场总共人数,乘以化学考试获得一等奖的频率可判断①;
计算出全校获得物理考试二等奖的频率和总人数相乘可判断②;采用分层抽样从全校抽取 200 人,乘以化
学考试被淘汰的人数的频率可判断③.
12
【解答过程】由于1 0.4 0.1 0.26 = 50,所以该考场总共有 50 人,所以化学考试获得一等奖的有
50 (1 0.16 0.38 0.38) = 4人,所以①正确;全校获得物理考试二等奖的有1000 × 0.24 = 240人,所以
②正确;如果采用分层抽样从全校抽取 200 人,则化学考试被淘汰的人数为200 × 0.38 = 76人,所以③错
误.
故选:C.
2.(24-25 高一上·全国·课后作业)某养猪场定购了一批仔猪,从中随机抽查了 100 头仔猪的体重(单位:
斤),经数据处理得到如图①的频率分布直方图,其中体重最轻的 14 头仔猪的体重的频数分布表如图②,
为了将这批仔猪分栏喂养,需计算频率分布直方图中的一些数据,其中 a+b 的值为( )
体重 22 24 26 27 28 29 31
频数 1 1 2 3 3 2 2
图②
A.0.144 B.0.152 C.0.76 D.0.076
【解题思路】根据图表的频数及频率分布直方图概率和为 1 列式求参即可.
+ = 12 1【解答过程】由题意得 100 × 5 = 0.024,且[2( + ) + + ] × 5 = 1 ,
所以2 × 0.024 + + = 0.2,所以 + = 0.152.
故选:B.
3.(24-25 高一下·吉林长春·阶段练习)某城市100户居民的月平均用电量(单位:度),以[160,180),
[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中 的值;
(2)在这100户居民中,月平均用电量不低于220度的有多少户?
(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户
居民,则月平均用电量在[220,240)的用户中应抽取多少户?
【解题思路】(1)利用频率分布表各小矩形面积和为 1,列式计算即得.
(2)根据频率分布直方图求出[220,240),[240,260),[260,280),[280,300]内的频率,再利用频率乘以样本容
量即得.
(3)利用(2)的信息,求出分层抽样的抽样比即可计算得解.
【解答过程】(1)由频率分布直方图,得
(0.002 + 0.0095 + 0.011 + 0.0125 + + 0.005 + 0.0025) × 20 = 1,解得 = 0.0075,
所以直方图中 x 的值是0.0075.
(2)月平均用电量为[220,240)的用户有0.0125 × 20 × 100 = 25户,
月平均用电量为[240,260)的用户有0.0075 × 20 × 100 = 15户,
月平均用电量为[260,280)的用户有0.005 × 20 × 100 = 10户,
月平均用电量为[280,300]的用户有0.0025 × 20 × 100 = 5户,
所以月平均用电量不低于220度的有25 + 15 + 10 + 5 = 55户.
11 1
(3)由(2)可知,抽取比例为25+15+10+5 = 5,
1
所以月平均用电量在[220,240)的用户中应抽取25 × 5 = 5户.
4.(23-24 高一下·河南·阶段练习)已知某工厂一区生产车间与二区生产车间均生产某种型号的零件,这两
个生产车间生产的该种型号的零件尺寸的频率分布直方图如图所示(每组区间均为左开右闭).
尺寸大于 的零件用于大型机器中,尺寸小于或等于 的零件用于小型机器中.
(1)若 = 60,试分别估计该工厂一区生产车间生产的 500 个该种型号的零件和二区生产车间生产的 500 个
该种型号的零件用于大型机器中的零件个数.
(2)若 ∈ (60,70],现有足够多的来自一区生产车间与二区生产车间的零件,分别用于大型机器 小型机器各
5000 台的生产,每台机器仅使用一个该种型号的零件.
方案一:直接将一区生产车间生产的零件用于大型机器中,其中用了尺寸小于或等于 的零件的大型机器每
台会使得工厂损失 200 元;直接将二区生产车间生产的零件用于小型机器中,其中用了尺寸大于 的零件的
小型机器每台会使得工厂损失 100 元.
方案二:重新测量一区生产车间与二区生产车间生产的零件尺寸,并正确匹配型号,重新测量的总费用为
35 万元.
请写出采用方案一,工厂损失费用的估计值 ( )(单位:万元)的表达式,并从工厂损失的角度考虑,选
择合理的方案.
【解题思路】(1)计算出两个生产车间生产的零件尺寸大于 60 的频率,进而求出两个生产车间生产的 500
个该种型号的零件用于大型机器中的零件数;
(2)计算出一区生产车间生产的零件尺寸小于或等于 的频率和二区生产车间生产的零件尺寸大于 的频
率,从而得到 ( ) = 0.8 12,结合 ∈ (60,70],求出 ( ) ∈ (36,44],与 35 比较后得到结论.
【解答过程】(1)一区生产车间生产的零件尺寸大于 60 的频率为(0.020 + 0.024 + 0.020 + 0.020)
× 10 = 0.84,
则该工厂一区生产车间生产的 500 个该种型号的零件用于大型机器中的零件个数为500 × 0.84 = 420;
二区生产车间生产的零件尺寸大于 60 的频率为(0.024 + 0.016) × 10 = 0.4,
则该工厂二区生产车间生产的 500 个该种型号的零件用于大型机器中的零件个数为500 × 0.40 = 200.
(2)一区生产车间生产的零件尺寸小于或等于 的频率为
0.004 × 10 + 0.012 × 10 + 0.02 × ( 60) = 0.02 1.04.
二区生产车间生产的零件尺寸大于 的频率为
0.024 × (70 ) +0.016 × 10 = 1.84 0.024 .
故 ( ) = (0.02 1.04) × 0.02 × 5000 + (1.84 0.024 ) × 0.01 × 5000 = 0.8 12.
因为 ∈ (60,70],所以 ( ) ∈ (36,44].
又因为采用方案二重新测量的总费用为 35 万元,
所以从工厂损失的角度考虑,应选择方案二.
题型 4 统计图的综合应用问题
1.(23-24 高一下·吉林通化·阶段练习)2024 年 3 月,树人中学组织三个年级的学生进行党史知识竞赛.经
统计,得到前 200 名学生分布的饼状图(如图)和前 200 名中高一学生排名分布的频率条形图(如图),
则下列命题错误的是( )
A.成绩在前 200 名的学生中,高一人数比高二人数多 30
B.成绩在第 1~50 名的学生中,高三最多有 32 人
C.高一学生成绩在第 101~150 名的人数一定比高三学生成绩在第 1~50 名的人数多
D.成绩在第 51~100 名的学生中,高二人数比高一人数多
【解题思路】由饼状图可计算出高一年级共 90 人,高二年级共 60 人,高三年级共 50 人,再由高一学生排
名分布的频率条形图可计算出各排名段中高一年级学生的人数,由此即可判断出答案.
【解答过程】由饼状图可知,成绩在前 200 名的学生中,高一人数比高二人数多200 × (45% 30%) = 30,
A 正确;
成绩在第1 50名的学生中,高一人数为200 × 45% × 0.2 = 18,因此高三最多有 32 人,B 正确;
由条形图知高一学生的成绩在第101 150名的人数为200 × 45% × 0.4 = 36,
而高三的学生成绩在第1 50名的人数最多为32人,
故高一学生的成绩在第101 150名的人数一定比高三的学生成绩在第1 50名的人数多,C 正确;
成绩在第51 100名的学生中,高一人数为200 × 45% × 0.3 = 27,
高二成绩在第51 100名的人数最多为23,
即成绩在第 51~100 名的学生中,高一的人数一定比高二的人数多,D 错误.
故选:D.
2.(2024·福建龙岩·一模)围绕民宿目的地进行吃住娱乐闭环消费已经成为疫情之后人们出游的新潮流.在
用户出行旅游决策中,某机构调查了某地区 1000 户偏爱酒店的用户与 1000 户偏爱民宿的用户住宿决策依
赖的出行旅游决策平台,得到如下统计图,则下列说法中不正确的是( )
A.偏爱民宿用户对小红书平台依赖度最高
B.在被调查的两种用户住宿决策中,小红书与携程旅行的占比总和相等
C.小红书在所有被调查用户住宿决策中的占比与携程旅行在所有被调查用户住宿决策中的占比不相等
D.在被调查的两种用户住宿决策中,同程旅行占比都比抖音的占比高
【解题思路】由酒店预订条形图和民宿预订扇形图逐一分析四个选项得答案.
【解答过程】解:由右图可知,偏爱民宿用户对小红书平台的选择占比为
1 (10% + 20% + 16% + 18% + 12%) = 24%,
则偏爱民宿用户对小红书平台依赖度最高,故 A 正确;
在被调查的酒店用户住宿决策中,小红书与携程旅行的占比总和为25% + 19% = 44%,
在被调查的民宿用户住宿决策中,小红书与携程旅行的占比总和为24% + 20% = 44%,
则在被调查的两种用户住宿决策中,小红书与携程旅行的占比总和相等,故 B 正确;
小红书在所有被调查用户住宿决策中的占比为19% + 24% = 43%,
携程旅行的占比为25% + 20% = 45%,携程旅行的占比略高于小红书占比,故 C 正确;
在被调查的两种用户住宿决策中,同程旅行占比分别为15%和12%,
抖音的占比分别为6%和18%,则酒店预订方面同程旅行占比高,民宿预订方面抖音的占比高,故 D 错误.
故选:D.
3.(24-25 高一下·山东聊城·阶段练习)共享单车入驻某城区 5 年以来,因其“绿色出行,低碳环保”的理念
而备受人们的喜爱,值此 5 周年之际,某机构为了了解共享单车使用者的年龄段、使用频率、满意度等三
个方面的信息,在全市范围内发放 10000 份调查问卷,回收到有效问卷 6300 份,现从中随机抽取 160 份,
分别对使用者的年龄段、26~35 岁使用者的使用频率、26~35 岁使用者的满意度进行汇总,得到如下三个
表格:
表(一)
使用者年龄段 25 岁以下 26 岁~35 岁 36 岁~45 岁 45 岁以上
人数 40 80 20 20
表(二)
使用频率 0~6 次/月 7~14 次/月 15~22 次/月 23~31 次/月
人数 10 20 40 10
表(三)
满意度 非常满意(10) 满意(9) 一般(8) 不满意(7)
人数 30 20 20 10
(1)依据上述表格完成下列三个统计图形:
  
 
(2)某城区现有常住人口 80 万,请用样本估计总体的思想,试估计年龄在 26 岁~35 岁之间,每月使用共享
单车在 7~14 次的人数.
【解题思路】(1)依据表格完成三个统计图形即可;
(2)由表(一)年龄在 26 岁~35 岁之间的人数占总抽取人数的比估算 80 万人口中年龄在 26 岁~35 岁之
间的人数即可;由表(二)年龄在 26 岁~35 岁之间每月使用共享单车在 7~14 次之间的人数占总抽取人数
的比来估算年龄在 26 岁~35 岁之间的 40 万人中每月使用共享单车在 7~14 次之间的人数可得答案.
【解答过程】(1)
(2 1)由表(一)可知年龄在 26 岁~35 岁之间的有 80 人,占总抽取人数的2,所以 80 万人口中年龄在 26
岁~35 1岁之间的约有80 × 2 = 40(万人).
由表(二)可知,年龄在 26 岁~35 岁之间每月使用共享单车在 7~14 次之间的有 20 人,占总抽取人数的
1
2,所以年龄在 26
1
岁~35 岁之间的 40 万人中,每月使用共享单车在 7~14 次之间的约有40 × 4 = 10(万
人).
4.(23-24 高一上·云南保山·开学考试)近几年购物的支付方式日益增多,某数学兴趣小组就此进行了抽样
调查.调查结果显示,支付方式有:A 微信、B 支付宝、C 现金、D 其他,该小组对某超市一天内购买者的
支付方式进行调查统计,得到如下两幅不完整的统计图.
请你根据统计图提供的信息,解答下列问题:
(1)本次一共调查了多少名购买者?
(2)请补全条形统计图;
在扇形统计图中 A 种支付方式所对应的圆心角为______度.
(3)若该超市这一周内有 1600 名购买者,请你估计使用 A 和 B 两种支付方式的购买者共有多少名?
【解题思路】(1)根据频率即可求解,
(2)根据频率之和即可求解,
(3)根据所占频率即可求解.
【解答过程】(1)56 ÷ 28% = 200,即本次一共调查了 200 名购买者;
(2)D 方式支付的有:200 × 20% = 40(人),
A 方式支付的有:200 56 44 40 = 60(人),
补全的条形统计图如图所示,
60
在扇形统计图中 A 种支付方式所对应的圆心角为:360° × 200 = 108°
3 1600 × 60+56( ) 200 = 928(名),
使用 A 和 B 两种支付方式的购买者共有 928 名.
题型 5 频率分布直方图中集中趋势参数的计算
1.(23-24 高一下·天津和平·期末)某市为了减少水资源浪费,计划对居民生活用水实施阶梯水价制度,为
确定一个比较合理的标准,从该市随机调查了 100 位居民,获得了他们某月的用水量数据,整理得到如下
频率分布直方图,则以下四个说法正确的个数为( )
①估计居民月均用水量低于 1.5m3的概率为 0.25;
②估计居民月均用水量的中位数约为 2.1m3
③该市有 40 万居民,估计全市居民中月均用水量不低于 3m3的人数为 6 万;
④根据这 100 位居民的用水量,采用样本量按比例分配的分层随机抽样的方法,抽取了容量为 20 人的样本,
则在用水量区间[1.5,2)中应抽取 3 人
A.1 个 B.2 个 C.3 个 D.4 个
【解题思路】由频率分布直方图求频率判断①,结合直方图中位数的求法计算中位数,即可判断②;用频
率估计总体即可判断③,结合分层抽样的概念即可判断④.
【解答过程】由频率分布直方图可知,
居民月均用水量低于的概率 = (0.2 + 0.3) × 0.5 = 0.25,故①正确,
三组的频率之和为(0.2 + 0.3 + 0.4) × 0.5 = 0.45 < 0.5,
而前四组频率之和为(0.2 + 0.3 + 0.4 + 0.5) × 0.5 = 0.7 > 0.5,
2 + 0.5 × 0.5 0.45故中位数位于[2,2.5),由 0.7 0.45 = 2.1,②正确
估计万居民中月均用水量不低于 3m3的人数为400000 × 0.1 × 3 × 0.5 = 60000,③正确
根据用水量对这 100 位居民进行分层,用分层抽样的方法抽取 20 人,则用水量在[1.5,2)中应抽取20 ×
(0.4 × 0.5) = 4人,④错误,
故选:C.
2.(2024·陕西西安·二模)某教育机构为调查中小学生每日完成作业的时间,收集了某位学生 100 天每天
完成作业的时间,并绘制了如图所示的频率分布直方图(每个区间均为左闭右开),根据此直方图得出了
下列结论,其中正确的是( )
A.估计该学生每日完成作业的时间在 2 小时至 2.5 小时的有 50 天
B.估计该学生每日完成作业时间超过 3 小时的概率为 0.3
C.估计该学生每日完成作业时间的平均数为 2.75 小时
D.估计该学生每日完成作业时间的中位数与平均数相等
【解题思路】直接根据直方图来计算判断每一个选项.
【解答过程】对于 A:估计该学生每日完成作业的时间在 2 小时至 2.5 小时的有100 × 0.5 × 0.5 = 25天,A
错误;
对于 B:估计该学生每日完成作业时间超过 3 小时的概率为(0.3 + 0.2 + 0.1 + 0.1) × 0.5 = 0.35,B 错误;
对于 C:
(1.25 × 0.1 + 1.75 × 0.3 + 2.25 × 0.5 + 2.75 × 0.4 + 3.25 × 0.3 + 3.75 × 0.2 + 4.25 × 0.1 + 4.75 × 0.1) × 0.5
= 2.75,C 正确;
对于 D:估计该学生每日完成作业时间的中位数为 ,
则(0.1 + 0.3 + 0.5) × 0.5 + 0.4 × ( 2.5) = 0.5,解得 = 2.625,D 错误.
故选:C.
3.(23-24 高一下·北京通州·期中)对某校高一学生参加志愿服务次数进行统计,随机抽取 名学生作为样
本,得到这 名学生参加志愿服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图.
频 频
分组
数 率
[10,15) 15 0.3
[15,20) 25
[20,25)
[25,30] 4 0.08
合计 1
(1)请补全表格,并求出图中 的值;
(2)若该校高一年级学生有 400 人,试估计该校高一年级学生参加志愿服务的次数在区间 10,20 上的人数;
(3)试估计该校高一年级学生参加志愿服务次数的中位数和平均数(每组次数用中间值代替).
【解题思路】(1)根据频率和为 1 补全表格,再利用频率分布直方图矩形面积和组距的关系即可求出 值;
(2)求出在[10,20)上的频率是0.8,再乘以总人数即可.
(3)首先分析出中位数在区间[15,20)上,再设中位数为 ,列方程,解出即可,再根据频率分布图中平均
数公式即可求出平均数.
25
【解答过程】(1) = 15 ÷ 0.3 = 50, = 50 = 0.5,
则 = 50 15 25 4 = 6 = 6, 50 = 0.12,表格如下:
分组 频数 频率
[10,15) 15 0.3
[15,20) 25 0.5
[20,25) 6 0.12
[25,30] 4 0.08
合计 50 1
故 = 0.5 ÷ 5 = 0.1.
(2)因为该校高一年级学生有400人,在[10,20)上的频率是0.8,
所以估计该校高一年级学生参加志愿服务的次数在此区间上的人数为400 × 0.8 = 320人.
(3)因为0.3 < 0.5且0.3 +0.5 > 0.5,
所以中位数在区间[15,20)上,
因为中位数及前面的数的频率之和为0.5,设样本中位数为 ,
则0.3 +0.1( 15) = 0.5,解得 =17,
估计该校高一年级学生参加志愿服务次数的中位数是17.
平均数 =12.5 × 0.3+17.5 × 0.5 + 22.5 × 0.12 + 27.5 × 0.08=17.4,
估计该校高一年级学生参加志愿服务次数的平均数是17.4.
4.(23-24 高一下·湖南长沙·期末) (身体质量指数)是目前国际上常用的衡量人体胖瘦程度以及是否
体重(单位:kg)
健康的一个标准,其计算公式是: = 2 : m2 .中国成人的 数值参考标准为: < 18.5为偏身高 单位
瘦;18.5 ≤ < 24为正常;24 ≤ < 28为偏胖; ≥ 28为肥胖.某公司为了解公司员工的身体肥胖
情况,研究人员从公司员工体检数据中,采用分层随机抽样的方法抽取了 60 名男员工,40 名女员工的身高
体重数据,通过计算男女员工的 值,整理得到如下的频率分布直方图.
(1)求频率分布直方图中 a 的值,并估计该公司员工为肥胖的百分比;
(2)估计该公司员工的 值的众数,中位数;
(3)已知样本中 60 名男员工 值的平均数为 1 = 22.4,根据频率分布直方图,估计样本中 40 名女员工
值的平均数 2.
【解题思路】(1)利用频率之和为 1 可计算 的值,再结合频率分布直方图即可得肥胖的百分比;
(2)利用频率分布直方图即可估计众数,中位数;
(3)先计算整体的平均数,然后由分层抽样平均数的公式即可得解.
【解答过程】(1)由题,2 × (0.01 + 0.02 + 0.03 + 0.06 + 0.07 + 0.08 + + 0.13) = 1,解得: = 0.1,
由频率分布直方图可得,该公司员工为肥胖的百分比为2 × (0.01 + 0.03) × 100% = 8%;
2 18+20( )由频率分布直方图可得,众数为 2 = 19,
因为2 × (0.08 + 0.13) = 0.42 < 0.5,2 × (0.08 + 0.13 + 0.1) = 0.62 > 0.5,
故中位数在[20,22),设为 ,则 = 20 + 0.5 0.422×0.1 × (22 20) = 20.8;
(3)设样本平均数为 ,
则由频率分布直方图可得;
= 2 × (17 × 0.08 + 19 × 0.13 + 21 × 0.1 + 23 × 0.06 + 25 × 0.07 + 27 × 0.02 + 29 × 0.01 + 31 × 0.03)

= 21.64
= 60 1+40 2又 100 ,
60×22.4+40 2
即 100 = 21.64,解得: 2 = 20.5.
题型 6 频率分布直方图中方差的计算
1.(2025·河南三门峡·模拟预测)甲,乙两组数据的频率分布直方图如图所示,两组数据采用相同的分组
方法,用 1和 2分别表示甲、乙的平均数, 21, 22分别表示甲、乙的方差,则( )
A. = , 2 < 2 B. = , 2 21 2 1 2 1 2 1 > 2
C. < , 2 = 2 D. > , 2 = 21 2 1 2 1 2 1 2
【解题思路】由频率分布直方图中平均数的计算方法、数据的集中程度即可判断作答.
【解答过程】因甲,乙两组数据采用相同的分组方法,则它们的分组各个中点值对应相同,
设第 1 组到 5 组的中点值依次为 1, 2, 3, 4, 5,
由两个频率分布直方图知,
它们都关于过最中间一个小矩形下底边的中点且垂直于横轴的直线对称,
即 1 + 5 = 2 + 4 = 2 3,
令甲组数据从第一组到第五组的频率依次为 1, 2, 3, 4, 5,且 1 = 5, 2 = 4,
乙组数据从第一组到第五组的频率依次为 ′1, ′2, ′3, ′4, ′5,且 ′1 = ′5, ′2 = ′4,
则 1 = 1 1 + 2 2 + 3 3 + 4 4 + 5 5 = 2 3 1 +2 3 2 + 3 3 = 3( 1 + 2 + 3 + 4 + 5) = 3,
同理 2 = 3,因此, 1 = 2,
由频率分布直方图知,乙组数据比甲组数据相对于平均数更集中,
甲组数据波动较乙的大,则有 2 21 > 2,
所以 = , 2 21 2 1 > 2.
故选:B.
2.(2024·北京通州·一模)2022 年北京冬季奥运会中国体育代表团共收获 9 金 4 银 2 铜,金牌数和奖牌数
均创历史新高.获得的 9 枚金牌中,5 枚来自雪上项目,4 枚来自冰上项目.某体育院校随机调查了 100 名
学生冬奥会期间观看雪上项目和冰上项目的时间长度(单位:小时),并按[0,10],(10,20],(20,30],
(30,40],(40,50]分组,分别得到频率分布直方图如下:
估计该体育院校学生观看雪上项目和冰上项目的时间长度的第 75 百分位数分别是 1和 2,方差分别是 21和
22,则( )
A. > , 2 2 2 21 2 1 > 2 B. 1 > 2, 1 < 2
C. 1 < 2 22, 1 > 2 D. 1 < , 2 < 22 1 2
【解题思路】分别计算出 1和 2,进行比较;由方差的意义比较 21和 22,即可得到答案.
【解答过程】由题意进行数据分析,可得:
0.020 × (10 0) +0.010 × (20 10) +0.030 × (30 20) +0.015 × ( 1 30) = 0.75,解得: 1 = 40;
0.010 × (10 0) +0.020 × (20 10) +0.030 × (30 20) +0.025 × ( 2 30) = 0.75,解得: 2 = 36;
所以 1 > 2.
比较两个频率分布直方图可以看出:雪上项目的数据更分散,冰上项目的数据更集中,由方差的意义可以
得到: 21 > 22.
故选:A.
3.(23-24 高一下·福建漳州·期末)漳州古城有着上千年的建城史,是国家级闽南文化生态保护区的重要组
成部分,并人选首批“中国历史文化街区”.五一假期来漳州古城旅游的人数创新高,单日客流峰值达 20 万人
次.为了解游客的旅游体验满意度,某研究性学习小组用问卷调查的方式随机调查了 100 名游客,该兴趣小
组将收集到的游客满意度分值数据(满分 100 分)分成六段:[40,50),[50,60),…,[90,100]得到如图所示的频
率分布直方图.
(1)求频率分布直方图中 的值,并估计 100 名游客满意度分值的众数和中位数(结果保留整数);
(2)已知满意度分值落在[70,80)的平均数 1 = 75,方差 21 = 9,在[80,90)的平均数为 2 = 85,方差 22 = 4,
试求满意度分值在[70,90)的平均数 和方差 2.
【解题思路】(1)根据频率分布直方图中各组频率之和为 1 即可求得 a 的值;结合众数和中位数的含义即
可求得它们的值;
(2)根据平均数以及方差的计算公式,即可求得答案.
【解答过程】(1)由频率分布直方图可得,(0.005 + 0.010 × 2 + 0.020 + + 0.025) × 10 = 1,解得
= 0.030,
由频率分布直方图可估计众数为 85,
满意度分值在[40,80)的频率为(0.005 + 0.010 × 2 + 0.020) × 10 = 0.45 < 0.5,
在[40,90)的频率为(0.005 + 0.010 × 2 + 0.002 + 0.030) × 10 = 0.75 > 0.5,
所以中位数落在区间[80,90)内,
所以中位数为80 + 10 × 0.5 0.45 = 2450.3 3 ≈ 82.
(2)由频率分布直方图得,满意度分值在[70,80)的频率为0.02 × 10 = 0.2,人数为 20;
在[80,90)的频率为0.03 × 10 = 0.3,人数为 30,
把满意度分值在[70,80)记为 1, 2, , 20,其平均数 1 = 75,方差 21 = 9,
在[80,90)内记为 1, 2, , 30,其平均数 2 = 85,方差 22 = 4,
20 +30 20×75+30×85
所以满意度分值在[70,90) 1 2的平均数 = 50 = 50 = 81,
1 20 30
根据方差的定义,满意度分值在[70,90)的方差为 2 = 50 ( )
2 + ( )2
=1 =1
20 30
1
= 50 ( 1 + 1 )
2 + ( 2 + 2 )2
=1 =1
20 20 20 20
由 ( 1) = 20 1 = 0,可得 2( 1)( 1 ) = 2( 1 ) ( 1) = 0,
=1 =1 =1 =1
30
同理可得 2( 2)( 2 ) = 0,
=1
1 20 20 30 30
因此, 2 = 50 (
2
1) + ( 1 )2 + ( 2)2 + ( 2 )2
=1 =1 =1 =1
20 30
= 50
2
1 + ( 2 2 21 ) + 50 2 + ( 2 )
= 20 3050 9 + (75 81)
2 + 50 4 + (85 81)
2 = 30.
4.(23-24 高一下·湖北·期末)某市根据居民的月用电量实行三档阶梯电价,为了深入了解该市第二档居民
用户的用电情况,该市统计局用比例分配的分层随机抽样方法,从该市所辖 , , 三个区域的第二档居民
用户中按 2:2:1 的比例分配抽取了 100 户后,统计其去年一年的月均用电量(单位:kW h),进行适当
分组后(每组为左闭右开的区间),频率分布直方图如下图所示.
(1)求 的值;
(2)若去年小明家的月均用电量为234kW h,小明估计自己家的月均用电量超出了该市第二档用户中 85%的
用户,请判断小明的估计是否正确?
(3)通过进一步计算抽样的样本数据,得到 A 区样本数据的均值为 213,方差为 24.2;B 区样本数据的均值
为 223,方差为 12.3;C 区样本数据的均值为 233,方差为 38.5,试估计该市去年第二档居民用户月均用电
量的方差.(需先推导总样本方差计算公式,再利用数据计算)
【解题思路】(1)利用频率和为 1 列式即可得解;
(2)求出 85%分位数后判断即可;
(3)利用方差公式推导总样本方差计算公式,从而得解.
【解答过程】(1)根据频率和为 1,可知( + 0.009 + 0.022 + 0.025 + 0.028) × 10 = 1,
可得 = 0.016.
(2)由题意,需要确定月均用电量的 85%分位数,
因为(0.028 + 0.022 + 0.025) × 10 = 0.75,
(0.028 + 0.022 + 0.025 + 0.016) × 10 = 0.91,
所以 85%分位数位于[230,240)内,
从而 85%分位数为230 + 10 × 0.85 0.750.91 0.75 = 236.25 > 234.
所以小明的估计不正确.
(3)由题意,A 区的样本数为100 × 0.4 = 40,样本记为 1, 2, , 40,平均数记为 ;
B 区的样本数100 × 0.4 = 40,样本记为 1, 2, , 40,平均数记为 ;
C 区样本数为100 × 0.2 = 20,样本记为 1, 2, , 20,平均数记为 .
记抽取的样本均值为 , = 0.4 × 213 + 0.4 × 223 + 0.2 × 233 = 221.
设该市第二档用户的月均用电量方差为 2,则根据方差定义,总体样本方差为
40 40 20
1 2 2 2
2 = 100 + +
=1 =1 =1
40 40 20
1 2 2 2
= 100 + + + + +
=1 =1 =1
40 40 40
因为 = 0,所以 2 = 2 = 0,
=1 =1 =1
40 40
同理 2 = 2 = 0,
=1 =1
20 20
2 = 2 = 0,
=1 =1
40 40 40 40
因此 2 = 1
2 2 1 2 2
100 + + 100 + =1 =1 =1 =1
1 20 2 20+ 2100 + , =1 =1
代入数据得
2 1 1 = 100 40 × 24.2 + 40 × (213 221)
2 + 100 40 × 12.3 + 40 × (223 221)
2
+ 1100 20 × 38.3 + 20 × (233 221)
2 = 78.26.
题型 7 其他统计图表中反映的集中趋势与离散程度
1.(2024·全国·模拟预测)如图为 2014—2022 年中国游戏用户规模(单位:百万人)及同比增长率、
2010—2022 年中国国产游戏获批版号数量(单位:个)的统计图,则下列结论正确的是( )
A.2014—2022 年中国游戏用户规模逐年增长
B.2014—2022 年中国游戏用户规模的同比增长率的中位数为3.1%
C.2010—2022 年中国国产游戏获批版号数量的极差为 223 个
D.2010—2022 年中国国产游戏获批版号数量的平均数超过 1600 个
【解题思路】根据条形统计图、折线统计图逐项分析样本的数字特征即可判断.
【解答过程】A 选项:2022 年中国游戏用户规模比 2021 年少,A 错误;
B 选项:2014—2022 年中国游戏用户规模的同比增长率从小到大依次为 0.3%,0.2%,
2.5%,3.1%,3.2%,3.7%,4.6%,5.9%,7.3%,中位数为3.2%,B 错误;
C 选项:2010—2022 年中国国产游戏获批版号数量的极差为9177 245 = 8932(个),C 错误;
D 选项:200 + 2 × 400 + 2 × 500 + 3 × 600 + 2 × 1300 + 2000 + 4000 + 9100
= 21500 > 13 × 1600 = 20800,D 正确.
故选:D.
2.(23-24 高一下·江苏徐州·期末)近年来,“直播带货”受到越来越多人的喜爱,目前已经成为推动消费的
一种流行营销形式.某直播平台有 800 个直播商家,对其进行调查统计,发现所售商品多为小吃、衣帽、生
鲜、玩具、饰品类等,各类直播商家所占比例如图①所示.为了更好地服务买卖双方,该直播平台打算用分
层抽样的方式抽取 60 个直播商家进行问询交流.
(1)应抽取小吃类、生鲜类商家各多少家?
(2)在问询了解直播商家的利润状况时,工作人员对抽取的 60 个商家的平均日利润进行了统计(单位:
元),所得频率直方图如图②所示.
(i)估计该直播平台商家平均日利润的中位数与平均数(求平均数时同一组中的数据用该组区间中点的数
值为代表);
(ii)若将平均日利润超过 470 元的商家称为“优质商家”,估计该直播平台“优质商家”的个数.
【解题思路】(1)根据分层抽样的定义计算即可;
(2)(i)根据中位数和平均数的定义计算即可;
(ii)根据样本中“优秀商家”的个数来估计总体中“优秀商家”的个数即可.
【解答过程】(1)根据分层抽样知:
应抽取小吃类60 × (1 30% 15% 10% 5% 5%) = 21家,生鲜类60 × 15% = 9家,
所以应抽取小吃类 21 家,生鲜类 9 家.
(2)(i)根据题意可得(0.002 × 3 + 2 + 0.006) × 50 = 1,解得 = 0.004,
设中位数为 x,因为(0.002 + 0.004) × 50 = 0.3,(0.002 + 0.004 + 0.006) × 50 = 0.6,
1300
所以( 400) × 0.006 + 0.3 = 0.5,解得 = 3 ,
1300
所以该直播平台商家平均日利润的中位数为 3 元.
平均数为(325 × 0.002 + 375 × 0.004 + 425 × 0.006 + 475 × 0.004 + 525 × 0.002 + 575 × 0.002)
× 50 = 440,
所以该直播平台商家平均日利润的平均数为 440 元.
500 470
(ii) × 0.004 + 0.002 + 0.002 × 50 × 800 = 256,
50
所以估计该直播平台“优秀商家”的个数为 256.
3.(23-24 高三上·黑龙江鸡西·期末)为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随
机选取了 10 个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出折线图:
(1)分别计算甲、乙两厂提供 10 个轮胎宽度的平均值;
(2)轮胎的宽度在[194,196]内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的 10 个轮胎中所有标
准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的
轮胎相对更好
【解题思路】(1)根据平均数的求法可直接求得结果;
(2)确定甲、乙两厂生产的轮胎中标准轮胎的宽度数据,由此可计算得到平均数和方差,对比数据即可得
到结论.
【解答过程】(1)记甲厂提供的10个轮胎宽度的平均值为 1,乙厂提供的10个轮胎宽度的平均值为 2,
= 195×2+194×2+196×2+193×2+197×2 = 195 = 195×4+194+196+193×2+192×21 10 (mm), 2 10 = 194(mm).
(2)甲厂10个轮胎宽度在[194,196]内的数据为195,194,196,194,196,195,
195+194+196+194+196+195
则平均数为 6 = 195,
1 2
所以方差 2 21 = 6 × 0 + ( 1)
2 + 12 + ( 1)2 + 12 + 02 = 3;
乙厂10个轮胎宽度在[194,196]内的数据为195,196,195,194,195,195,
195+196+195+194+195+195
则平均数为 6 = 195,
所以方差 22 =
1 1
6 × 0
2 + 12 + 02 + ( 1)2 + 02 + 02 = 3;
因为甲、乙两厂生产的标准轮胎宽度的平均值一样,但乙厂的方差更小,
所有乙厂的轮胎相对更好.
4.(23-24 高一下·宁夏·期末)某公司为了提高职工的健身意识,鼓励大家加入健步运动,要求 200 名职工
每天晚上 9:30 上传手机计步截图,对于步数超过 10000 的予以奖励.图 1 为甲乙两名职工在某一星期内
的运动步数统计图,图 2 为根据这星期内某一天全体职工的运动步数做出的频率分布直方图.
(1)请根据频率分布直方图,求 m 的值,并求出该天运动步数不少于 15000 步的人数;
(2)估计全体职工在该天运动步数的众数、平均数和中位数;
(3)如果当天甲的排名为第 130 名,乙的排名为第 40 名,试判断做出的是星期几的频率分布直方图.
【解题思路】(1)根据频率分布直方图中各组频率之和为 1,即可求得 m 的值;结合频率、频数之间的关
系即可求得该天运动步数不少于 15000 步的人数;
(2)根据频率分布直方图,依据众数、平均数和中位数的估计方法即可求得答案;
(3)计算甲乙排名的占比,结合频率分布直方图计算出甲乙两人的步数,与已知的甲乙两名职工在某一星
期内的运动步数统计图比较,即得答案.
【解答过程】(1)由图可知(0.02 + 0.03 + 0.04 + 0.06 + ) × 5 = 1,解得 = 0.05;
所以该天运动步数不少于 15000 的人数为(0.05 + 0.03) × 5 × 200 = 80(人);
2 10+15( )众数是 2 = 12.5(千步);
全体职工在该天的平均步数为:
2.5 × 0.1+7.5 × 0.2+12.5 × 0.3 + 17.5 × 0.25 + 22.5 × 0.15 = 13.25(千步)
由于前两组频率之和为0.1 + 0.2 = 0.3 < 0.5,前三组频率之和为0.1 + 0.2 + 0.3 > 0.5,
故设中位数为 x,则0.3 + ( 10) × 0.06 = 0.5, ∴ = 403 ,
40
即中位数是: 3 (千步)
(3)因为40 ÷ 200 = 0.2,130 ÷ 200 = 0.65,
假设甲的步数为 千步,乙的步数为 千步,
由频率分布直方图可得:
0.02 × 5 + 0.04 × 5 + ( 10) × 0.06 = 1 0.65,解得 =
65
6 (千步),
0.02 × 5 + 0.04 × 5 + 0.06 × 5 + ( 15) × 0.05 = 1 0.2,解得 = 19(千步),
所以可得出是星期二的频率分布直方图.
题型 8 统计综合
1.(23-24 高一下·广东梅州·期末)某中学新建了学校食堂,每天有近 2000 名学生在学校食堂用午餐,午
餐开放时间约 40 分钟,食堂制作了三类餐食,第一类是选餐,学生凭喜好在做好的大约 6 种菜和主食米饭
中任意选购;第二类是套餐,已按配套好菜色盛装好,可直接取餐;第三类是面食,如煮面、炒粉等,为
了更合理地设置窗口布局,增加学生的用餐满意度,学校学生会在用餐的学生中对就餐选择、各类餐食的
平均每份取餐时长以及可接受等待时间进行问卷调查,并得到以下的统计图表.
类别 选餐 套餐 面食
选择人数 50 30 20
平均每份取餐时长(单位:分钟) 2 0.5 1
已知饭堂的售饭窗口一共有 20 个,就餐高峰期时有 200 名学生在等待就餐.
(1)根据以上的调查统计,如果设置 12 个选餐窗口,4 个套餐窗口,4 个面食窗口,就餐高峰期时,假设大
家在排队时自动选择较短的队伍等待(即各类餐食的窗口前队伍长度各自相同),问:选择选餐的同学最
长等待时间是多少?这能否让 80%的同学感到满意(即在接受等待时长内取到餐)?
(2)根据以上的调查统计,从等待时长和公平的角度上考虑,如何设置各类售饭窗口数更优化,并给出你的
求解过程.
【解题思路】(1)求出就餐高峰期时选择选餐的总人数,确定平均每个窗口等待就餐的人数即可求得选择
选餐同学的最长等待时间;根据频率分布直方图可计算可接受等待时长在 15 分钟以上的同学占比,即可得
结论;
(2)假设设置 m 个选餐窗口,n 个套餐窗口,k 个面食窗口,表示出各队伍的同学最长等待时间,根据从
等待时长和公平的角度上考虑即为要求每个队伍的最长等待时间大致相同,从而列式求解.
50
【解答过程】(1)由题意得,就餐高峰期时选择选餐的总人数为200 × 50+30+20 = 100人;
这 100 100人平均分布在 12 个选餐窗口,平均每个窗口等待就餐的人数为 12 ≈ 9人,
所以选择选餐同学的最长等待时间为2 × 9 = 18分钟,
由可接受等待时长的频率分布直方图可知,分组为[5,10),[10,15),[15,20),[20,25)的频率分别为0.15,0.45,0.35
,0.05,
所以可接受等待时长在 15 分钟以上的同学占0.05 + 0.35 = 40% < 80%,
故设置 12 个选餐窗口,4 个套餐窗口,4 个面食窗口,不能让 80%的同学感到满意;
(2)假设设置 m 个选餐窗口,n 个套餐窗口,k 个面食窗口,则各队伍的同学最长等待时间如下:
类别 选餐 套餐 面食
高峰期就餐总人数 100 60 40
100 60 40
各队伍长度(人)

100 60 40
最长等待时间(分钟) 2 × 0.5 × 1 ×
依题意,从等待时长和公平的角度上考虑,则要求每个队伍的最长等待时间大致相同,
2 × 100即得 = 0.5 ×
60
= 1 ×
40
,即有 : : = 20:3:4,
而 + + = 20,故 ≈ 15, ≈ 2, ≈ 3,
因此建议设置选餐、套餐、面食三个类别的窗口数分别为15,2,3个.
2.(24-25 高二上·安徽六安·阶段练习)随机抽取 100 名学生,测得他们的身高(单位:cm),按照区间
[160,165),[165,170),[170,175),[175,180),[180,185]分组,得到样本身高的频率分布直方图如图所示.
(1)求频率分布直方图中 的值及身高在170cm及以上的学生人数;
(2)估计该校 100 名生学身高的 75%分位数.
(3)若一个总体划分为两层,通过按样本量比例分配分层随机抽样,各层抽取的样本量、样本平均数和样
本方差分别为: , , 2 21; , , 2.记总的样本平均数为 ,样本方差为 2,证明:

① = + + + ;
② 2 = 1 2
2
+ 1 + ( )
2 + 22 + .
【解题思路】(1)利用频率分布直方图中长方形面积之和为 1,易求出 ,进而利用频率分布直方图可求身
高在170 及以上的学生人数;
(2)可设该校 100 名生学身高的 75%分位数,再利用频率分布直方图计算即得;
(3)利用样本平均数,方差公式化简即证.
【解答过程】(1)由频率分布直方图可知5 × (0.01 + 0.07 + + 0.04 + 0.02 + 0.01) = 1,解得 = 0.06,
身高在170 及以上的学生人数100 × 5 × (0.06 + 0.04 + 0.02) = 60(人).
(2)[180,185]的人数占比为5 × 0.02 = 10%,
[175,180]的人数占比为5 × 0.04 = 20%,
所以该校 100 名生学身高的 75%分位数落在[175,180],
设该校 100 名生学身高的 75%分位数为 ,
则0.04(180 ) +0.1 = 25%,解得 = 176.25,
故该校 100 名生学身高的 75%分位数为176.25.
+
(3 1 1)由题得① = + = + + + ;②
2 = + ( )
2
+ ( )2 =
=1 =1 +

( + )2 + ( + )2
=1 =1
1 = + ( )
2 + 2 ( )( ) + ( )2 +
=1 =1

( )2 + 2 ( )( ) + ( )2
=1 =1

又 ( )( )= ( ) ( )= ( ) ( ) = 0
=1 =1

同理 ( )( )=0,
=1

∴ 2 = 1 2 + ( ) + ( )
2 + ( )2 + ( )2
=1 =1
1
= 2 2 + 1 + ( ) +n
2
2+ ( )2
= 1 +
2
1 + ( )2 + 22 + ( )2 .
3.(2025 高三·全国·专题练习)随着社会的进步、科技的发展,人民对自己生活的环境要求越来越高,尤
其是居住环境的环保和绿化受到每一位市民的关注,因此,2019年6月25日,生活垃圾分类制度入法,提倡
每位居民做好垃圾分类储存、分类投放,方便工作人员依分类搬运,提高垃圾的资源价值和经济价值,力
争物尽其用.某市环卫局在 、 两个小区分别随机抽取6户,进行生活垃圾分类调研工作,依据住户情况对
近期一周(7天)进行生活垃圾分类占用时间统计如下表:
住户编号 1 2 3 4 5 6
小区(分钟) 220 180 210 220 200 230
小区(分钟) 200 190 240 230 220 210
(1)分别计算 、 小区每周进行生活垃圾分类所用时间的平均值和方差;
(2)如果两个小区住户均按照1000户计算,小区的垃圾也要按照垃圾分类搬运,市环卫局与两个小区物业
及住户协商,初步实施下列方案:
① 小区方案:号召住户生活垃圾分类“从我做起”,为了利国利民,每200位住户至少需要一名工作人员进
行检查和纠错生活垃圾分类,每位工作人员月工资按照3000元(按照28天计算标准)计算,则每位住户每
月至少需要承担的生活垃圾分类费是多少?
② 小区方案:为了方便住户,住户只需要将垃圾堆放在垃圾点,物业让专职人员进行生活垃圾分类,一位
专职工作人员对生活垃圾分类的效果相当于4位普通居民对生活垃圾分类效果,每位专职工作人员(每天工
作8小时)月工资按照4000元(按照28天计算标准)计算,则每位住户每月至少需要承担的生活垃圾分类费
是多少?
③市环卫局与两个小区物业及住户协商分别试行一个月,根据实施情况,试分析哪个方案惠民力度大,值
得进行推广?
【解题思路】(1)利用表格中数值,代入平均值和方差计算即可;(2)①计算 小区一月至少需要5名工
作人员的费用和每位住户每月需要承担的费用即可;②由一位专职工人一天的工作时间按照8小时作为计算
标准,每月按照28天作为计算标准,一位专职工作人员对生活垃圾分类效果相当于4名普通居民对生活垃圾
分类的效果,计算出 小区一月需要专职工作人员数量即可;③根据以上的运算,分析可以得出结论.
1
【解答过程】(1) = 6(220 + 180 + 210 + 220 + 200 + 230) = 210(分钟),
=
1
6(200 + 190 + 240 + 230 + 220 + 210) = 215(分钟),
2 = 1[(220 210)2 + (180 210)2 6 + (210 210)
2 + (220 210)2 + (200 210)2 + (230 210)2] = 8003 ,
2 = 1[(200 215)2 6 + (190 215)
2 + (240 215)2 + (230 215)2 + (220 215)2 + (210 215)2] = 8753 ;
(2)①按照 方案, 小区一月至少需要5名工作人员进行检查和纠错生活垃圾分类,其费用是
5 × 3000 = 15000元,
15000
每位住户每月需要承担的生活垃圾分类费为 1000 = 15(元),
②由(1)知, 小区平均每位住户每周需要215分钟进行垃圾分类,一月需要215 × 4 = 860(分钟),
小区一月平均需要860 × 1000 = 860000分钟的时间用于生活垃圾分类,
∵一位专职工人一天的工作时间按照8小时作为计算标准,每月按照28天作为计算标准,
一位专职工作人员对生活垃圾分类效果相当于4名普通居民对生活垃圾分类的效果,
∴ 860000小区一月需要专职工作人员至少8×60×28×4 ≈ 16(名),
16×4000
则每位住户每月需要承担的生活垃圾分类费为 1000 = 64(元),
③根据上述计算可知,按照每位住户每月需要承担的生活垃圾分类费来说,
选择 方案惠民力度大,但需要住户平时做好生活垃圾分类事项;
如果对于高档小区的居民来说,可以选择 方案,这只是方便个别高收入住户,
综上,选择 方案推广,有利于国民热爱劳动及素质的提升.
4.(23-24 高一下·河南鹤壁·期末)某电视台有一档益智答题类综艺节目,每期节目从现场编号为 01~80
的 80 名观众中随机抽取 10 人答题.答题选手要从“科技”和“文艺”两类题目中选一类作答,一共回答 10 个问
题,答对 1 题得 1 分.
(1)若采用随机数表法抽取答题选手,按照以下随机数表,从下方带点的数字 2 开始向右读,每次读取两
位数,一行用完接下一行左端,求抽取的第 6 个观众的编号.
1622779439 4954435482 1737932378 8735209643 8426349164
·
8442175331 5724550688 7704744767 2176335025 8392120676
(2)若采用等距系统抽样法抽取答题选手,且抽取的最小编号为 06,求抽取的最大编号.
(3)某期节目的 10 名答题选手中 6 人选科技类题目,4 人选文艺类题目.其中选择科技类的 6 人得分的平
7 5 5均数为 ,方差为3;选择文艺类的 4 人得分的平均数为 8,方差为2.求这期节目的 10 名答题选手得分的平
均数和方差.
【解题思路】(1)根据随机数表依次读取数据即可,取 01~80 之间的数据;
(2)根据系统抽样,确定组矩,计算可得;
(3)根据平均数和方差得出数据的整体关系,整体代入求解 10 名选手的平均数和方差.
【解答过程】(1)根据题意读取的编号依次是:20,96(超界),43,84(超界),26,34,91(超界),64,84
(超界),42,17,
所以抽取的第 6 个观众的编号为 42;
(2)若采用系统抽样,组矩为 8,最小编号为 06,则最大编号为 6+9×8=78;
(3)记选择科技类的 6 人成绩分别为: 1, 2, , 6,
选择文艺类的 4 人成绩分别为: 1, 2, 3, 4,
由题: 1 + 2 + + 6 = 42,( 1 7)2 + ( 2 7)2 + + ( 7)2 = 6 ×
5
6 3 = 10,
+ + + = 32,( 8)2 + ( 8)2 + ( 8)2 21 2 3 4 1 2 3 + ( 4 8) = 4 ×
5
2 = 10,
1+ 2+ + 6+ 1+ 2+ 3+ 4 32+42
所以这 10 名选手的平均数为 10 = 10 = 7.4
1
方差为 210 × [( 1 7.4) + ( 2 7.4)
2 + + ( 6 7.4)2 + ( 7.4)21 + ( 2 7.4)2 + ( 3 7.4)2 + ( 4 7.4)2]
6 4
= 110 × [ (( 7) 0.4)
2 + (( 8) + 0.6)2 ]
=1 =1
6 6 4 4
1
= 10 × [ ( 7)
2 0.8 × ( 7) + 6 × 0.42 + ( 8)2 + 1.2 × ( 8) + 4 × 0.62]
=1 =1 =1 =1
1
= 10 × [10 0 + 0.96 + 10 + 0 + 1.44]
= 2.24.专题 9.6 统计全章八大压轴题型归纳(拔尖篇)
【人教 A 版(2019)】
题型 1 简单随机抽样估计总体
1.(24-25 高三下·湖北·阶段练习)我国古代数学名著《数书九章》是南宋数学家秦九韶所著数学著作,书
中共列算题 81 问,分为 9 类,全书采用问题集的形式,并不按数学方法来分类.题文也不只谈数学,还涉
及自然现象和社会生活,成为了解当时社会政治和经济生活的重要参考文献.《数书九章》中有“米谷粒分”
一题,现有类似的题:粮仓开仓收粮,粮农送来米 1500 石,验得米夹谷,抽样取米一把,数得 304 粒夹谷
30 粒,则这批米内夹谷约为( )
A.148 石 B.149 石 C.150 石 D.151 石
2.(2024·河南·三模)中国农历的“二十四节气”是凝结着中华民族的智慧与传统文化的结晶,2022 年 2 月
4 日北京冬奥会开幕式,以二十四节气的方式开始倒计时,惊艳全球.某小学一年级随机抽查 100 名学生并
提问“二十四节气歌”,只能说出两句的有 32 人,能说出三句或三句以上的有 45 人,据此估计该校一年级的
400 名学生中对“二十四节气歌”只能说出一句或一句也说不出的人数约为( )
A.23 B.92 C.128 D.180
3.(24-25 高一·全国·课后作业)为了解某中学生遵守《中华人民共和国交通安全法》的 情况,调查部门
在该校进行了如下的随机调查,向被调查者提出两个问题:
(1)你的学号是奇数吗?(2)在过路口时你是否闯过红灯?
要求被调查者背对着调查人员抛掷一枚硬币,如果出现正面,就回答第一个问题,否则就回答第二个问
题.被调查者不必告诉调查人员自己回答的是哪一个问题,只需回答“是”或“不是”,因为只有调查者本人知
道回答了哪一个问题,所以都如实地做了回答.结果被调查的 800 人(学号从 1 至 800)中有 240 人回答了
“是”.由此估计这 800 人中闯过红灯的人数?
4.(24-25 高一·全国·课后作业)近年来,我国高速铁路发展迅速,到 2016 年底为止,已经运营的高铁轨
道的总长度已达2.2 × 104km,位居世界第一.为了提高营运的效率,铁路部门在安排停靠站台时通过分班次、
间隔站点的方式进行,如京沪高铁 G125 班次 11∶10 从北京始发,开往上海虹桥(据 2017 年 10 月时刻
表),停靠站分别为天津南、德州东、济南西、滕州东、蚌埠南、南京南、镇江南、常州北、昆山南,而
08∶35 从北京始发的 G111 班次,停靠站分别为德州东、济南西、泰安、滁州、南京南、丹阳北、无锡东,
最后停靠终点站上海虹桥.试运用统计研究的方法完成下述任务:
(1)如何确定每天的总班次及具体班次的安排?
(2)在确定各个班次停靠站的数量时应考虑哪些因素?如何实施?
(3)在确定各个班次停靠站时应考虑哪些因素?如何实施?
题型 2 分层抽样的计算
1.(23-24 高一下·江西景德镇·期中)在新冠肺炎疫情期间,大多数学生都在家进行网上上课,某校高一,
高二,高三共有学生 6000 名,为了了解同学们对某授课软件的意见,计划采用分层抽样的方法从这 6000
名学生中抽取一个容量 60 的样本,若从高一,高二,高三抽取的人数恰好是从小到大排列的连续偶数,则
该校高二年级的人数为( )
A.1000 B.1500 C.2000 D.3000
2.(24-25 高一·全国·课后作业)某学校在校学生有 2000 人,为了增强学生的体质,学校举行了跑步和登
山比赛,每人都参加且只参加其中一项比赛,高一、高二、高三年级参加跑步的人数分别为 a,b,c,且
: : = 2:5:3 1,全校参加登山的人数占总人数的4.为了了解学生对本次比赛的满意程度,按分层抽样的方法
从中抽取一个容量为 200 的样本进行调查,则应从高三年级参加跑步的学生中抽取( )
A.15 人 B.30 人 C.40 人 D.45 人
3.(24-25 高一下·全国·课后作业)某大型企业针对改善员工福利的 , , 三种方案进行了问卷调查,调
查结果如下:
支持 方案 支持 方案 支持 方案
35 岁以下的人数 200 400 800
35 岁及以上的人数 100 100 400
(1)从所有参与调查的人中,用分层随机抽样的方法抽取 人,已知从支持 方案的人中抽取了 6 人,求
的值.
(2)从支持 方案的人中,用分层随机抽样的方法抽取 5 人,这 5 人中年龄在 35 岁及以上的人数是多少?
年龄在 35 岁以下的人数是多少?
4.(24-25 高一下·全国·课后作业)某市两所高级中学联合在暑假组织全体教师外出旅游,活动分为两条线
路:华东五市游和长白山之旅,且每位教师至多参加了其中的一条线路.在参加活动的教师中,高一教师占
42.5% 1,高二教师占 47.5%,高三教师占 10%.参加华东五市游的教师占参加活动总人数的4,且该组中,高
一教师占 50%,高二教师占 40%,高三教师占 10%.为了了解各条线路不同年级的教师对本次活动的满意程
度,现用分层随机抽样的方法从参加活动的全体教师中抽取一个容量为 200 的样本.试确定:
(1)参加长白山之旅的高一教师、高二教师、高三教师在该组分别所占的比例;
(2)参加长白山之旅的高一教师、高二教师、高三教师分别应抽取的人数.
题型 3 频率分布直方图的相关计算问题
1.(24-25 高一下·广西崇左·阶段练习)某个高级中学组织物理 化学学科能力竞赛,全校 1000 名学生都参
加两科考试,考试后按学科分别评出一 二 三等奖和淘汰的这四个等级,现有某考场的两科考试数据统计
如下,其中物理科目成绩为二等奖的考生有 12 人.如果以这个考场考生的物理和化学成绩去估计全校考生的
物理和化学成绩分布,则以下说法正确的是( )
①该考场化学考试获得一等奖的有 4 人;
②全校物理考试获得二等奖的有 240 人;
③如果采用分层抽样从全校抽取 200 人,则化学考试被淘汰 78 人.
A.①②③ B.②③ C.①② D.①③
2.(24-25 高一上·全国·课后作业)某养猪场定购了一批仔猪,从中随机抽查了 100 头仔猪的体重(单位:
斤),经数据处理得到如图①的频率分布直方图,其中体重最轻的 14 头仔猪的体重的频数分布表如图②,
为了将这批仔猪分栏喂养,需计算频率分布直方图中的一些数据,其中 a+b 的值为( )
体重 22 24 26 27 28 29 31
频数 1 1 2 3 3 2 2
图②
A.0.144 B.0.152 C.0.76 D.0.076
3.(24-25 高一下·吉林长春·阶段练习)某城市100户居民的月平均用电量(单位:度),以[160,180),
[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中 的值;
(2)在这100户居民中,月平均用电量不低于220度的有多少户?
(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户
居民,则月平均用电量在[220,240)的用户中应抽取多少户?
4.(23-24 高一下·河南·阶段练习)已知某工厂一区生产车间与二区生产车间均生产某种型号的零件,这两
个生产车间生产的该种型号的零件尺寸的频率分布直方图如图所示(每组区间均为左开右闭).
尺寸大于 的零件用于大型机器中,尺寸小于或等于 的零件用于小型机器中.
(1)若 = 60,试分别估计该工厂一区生产车间生产的 500 个该种型号的零件和二区生产车间生产的 500 个
该种型号的零件用于大型机器中的零件个数.
(2)若 ∈ (60,70],现有足够多的来自一区生产车间与二区生产车间的零件,分别用于大型机器 小型机器各
5000 台的生产,每台机器仅使用一个该种型号的零件.
方案一:直接将一区生产车间生产的零件用于大型机器中,其中用了尺寸小于或等于 的零件的大型机器每
台会使得工厂损失 200 元;直接将二区生产车间生产的零件用于小型机器中,其中用了尺寸大于 的零件的
小型机器每台会使得工厂损失 100 元.
方案二:重新测量一区生产车间与二区生产车间生产的零件尺寸,并正确匹配型号,重新测量的总费用为
35 万元.
请写出采用方案一,工厂损失费用的估计值 ( )(单位:万元)的表达式,并从工厂损失的角度考虑,选
择合理的方案.
题型 4 统计图的综合应用问题
1.(23-24 高一下·吉林通化·阶段练习)2024 年 3 月,树人中学组织三个年级的学生进行党史知识竞赛.经
统计,得到前 200 名学生分布的饼状图(如图)和前 200 名中高一学生排名分布的频率条形图(如图),
则下列命题错误的是( )
A.成绩在前 200 名的学生中,高一人数比高二人数多 30
B.成绩在第 1~50 名的学生中,高三最多有 32 人
C.高一学生成绩在第 101~150 名的人数一定比高三学生成绩在第 1~50 名的人数多
D.成绩在第 51~100 名的学生中,高二人数比高一人数多
2.(2024·福建龙岩·一模)围绕民宿目的地进行吃住娱乐闭环消费已经成为疫情之后人们出游的新潮流.在
用户出行旅游决策中,某机构调查了某地区 1000 户偏爱酒店的用户与 1000 户偏爱民宿的用户住宿决策依
赖的出行旅游决策平台,得到如下统计图,则下列说法中不正确的是( )
A.偏爱民宿用户对小红书平台依赖度最高
B.在被调查的两种用户住宿决策中,小红书与携程旅行的占比总和相等
C.小红书在所有被调查用户住宿决策中的占比与携程旅行在所有被调查用户住宿决策中的占比不相等
D.在被调查的两种用户住宿决策中,同程旅行占比都比抖音的占比高
3.(24-25 高一下·山东聊城·阶段练习)共享单车入驻某城区 5 年以来,因其“绿色出行,低碳环保”的理念
而备受人们的喜爱,值此 5 周年之际,某机构为了了解共享单车使用者的年龄段、使用频率、满意度等三
个方面的信息,在全市范围内发放 10000 份调查问卷,回收到有效问卷 6300 份,现从中随机抽取 160 份,
分别对使用者的年龄段、26~35 岁使用者的使用频率、26~35 岁使用者的满意度进行汇总,得到如下三个
表格:
表(一)
使用者年龄段 25 岁以下 26 岁~35 岁 36 岁~45 岁 45 岁以上
人数 40 80 20 20
表(二)
使用频率 0~6 次/月 7~14 次/月 15~22 次/月 23~31 次/月
人数 10 20 40 10
表(三)
满意度 非常满意(10) 满意(9) 一般(8) 不满意(7)
人数 30 20 20 10
(1)依据上述表格完成下列三个统计图形:
  
 
(2)某城区现有常住人口 80 万,请用样本估计总体的思想,试估计年龄在 26 岁~35 岁之间,每月使用共享
单车在 7~14 次的人数.
4.(23-24 高一上·云南保山·开学考试)近几年购物的支付方式日益增多,某数学兴趣小组就此进行了抽样
调查.调查结果显示,支付方式有:A 微信、B 支付宝、C 现金、D 其他,该小组对某超市一天内购买者的
支付方式进行调查统计,得到如下两幅不完整的统计图.
请你根据统计图提供的信息,解答下列问题:
(1)本次一共调查了多少名购买者?
(2)请补全条形统计图;
在扇形统计图中 A 种支付方式所对应的圆心角为______度.
(3)若该超市这一周内有 1600 名购买者,请你估计使用 A 和 B 两种支付方式的购买者共有多少名?
题型 5 频率分布直方图中集中趋势参数的计算
1.(23-24 高一下·天津和平·期末)某市为了减少水资源浪费,计划对居民生活用水实施阶梯水价制度,为
确定一个比较合理的标准,从该市随机调查了 100 位居民,获得了他们某月的用水量数据,整理得到如下
频率分布直方图,则以下四个说法正确的个数为( )
①估计居民月均用水量低于 1.5m3的概率为 0.25;
②估计居民月均用水量的中位数约为 2.1m3
③该市有 40 万居民,估计全市居民中月均用水量不低于 3m3的人数为 6 万;
④根据这 100 位居民的用水量,采用样本量按比例分配的分层随机抽样的方法,抽取了容量为 20 人的样本,
则在用水量区间[1.5,2)中应抽取 3 人
A.1 个 B.2 个 C.3 个 D.4 个
2.(2024·陕西西安·二模)某教育机构为调查中小学生每日完成作业的时间,收集了某位学生 100 天每天
完成作业的时间,并绘制了如图所示的频率分布直方图(每个区间均为左闭右开),根据此直方图得出了
下列结论,其中正确的是( )
A.估计该学生每日完成作业的时间在 2 小时至 2.5 小时的有 50 天
B.估计该学生每日完成作业时间超过 3 小时的概率为 0.3
C.估计该学生每日完成作业时间的平均数为 2.75 小时
D.估计该学生每日完成作业时间的中位数与平均数相等
3.(23-24 高一下·北京通州·期中)对某校高一学生参加志愿服务次数进行统计,随机抽取 名学生作为样
本,得到这 名学生参加志愿服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图.
频 频
分组
数 率
[10,15) 15 0.3
[15,20) 25
[20,25)
[25,30] 4 0.08
合计 1
(1)请补全表格,并求出图中 的值;
(2)若该校高一年级学生有 400 人,试估计该校高一年级学生参加志愿服务的次数在区间 10,20 上的人数;
(3)试估计该校高一年级学生参加志愿服务次数的中位数和平均数(每组次数用中间值代替).
4.(23-24 高一下·湖南长沙·期末) (身体质量指数)是目前国际上常用的衡量人体胖瘦程度以及是否
体重(单位:kg)
健康的一个标准,其计算公式是: = 2 : m2 .中国成人的 数值参考标准为: < 18.5为偏身高 单位
瘦;18.5 ≤ < 24为正常;24 ≤ < 28为偏胖; ≥ 28为肥胖.某公司为了解公司员工的身体肥胖
情况,研究人员从公司员工体检数据中,采用分层随机抽样的方法抽取了 60 名男员工,40 名女员工的身高
体重数据,通过计算男女员工的 值,整理得到如下的频率分布直方图.
(1)求频率分布直方图中 a 的值,并估计该公司员工为肥胖的百分比;
(2)估计该公司员工的 值的众数,中位数;
(3)已知样本中 60 名男员工 值的平均数为 1 = 22.4,根据频率分布直方图,估计样本中 40 名女员工
值的平均数 2.
题型 6 频率分布直方图中方差的计算
1.(2025·河南三门峡·模拟预测)甲,乙两组数据的频率分布直方图如图所示,两组数据采用相同的分组
方法,用 1和 2分别表示甲、乙的平均数, 21, 22分别表示甲、乙的方差,则( )
A. 1 = 2 2 2 22, 1 < 2 B. 1 = 2, 1 > 2
C. 1 < 2, 21 = 2 22 D. 1 > 2, 1 = 22
2.(2024·北京通州·一模)2022 年北京冬季奥运会中国体育代表团共收获 9 金 4 银 2 铜,金牌数和奖牌数
均创历史新高.获得的 9 枚金牌中,5 枚来自雪上项目,4 枚来自冰上项目.某体育院校随机调查了 100 名
学生冬奥会期间观看雪上项目和冰上项目的时间长度(单位:小时),并按[0,10],(10,20],(20,30],
(30,40],(40,50]分组,分别得到频率分布直方图如下:
估计该体育院校学生观看雪上项目和冰上项目的时间长度的第 75 百分位数分别是 1和 ,方差分别是 22 1和
22,则( )
A. 1 > 2, 2 > 21 2 B. 1 > 2, 21 < 22
C. 2 2 2 21 < 2, 1 > 2 D. 1 < 2, 1 < 2
3.(23-24 高一下·福建漳州·期末)漳州古城有着上千年的建城史,是国家级闽南文化生态保护区的重要组
成部分,并人选首批“中国历史文化街区”.五一假期来漳州古城旅游的人数创新高,单日客流峰值达 20 万人
次.为了解游客的旅游体验满意度,某研究性学习小组用问卷调查的方式随机调查了 100 名游客,该兴趣小
组将收集到的游客满意度分值数据(满分 100 分)分成六段:[40,50),[50,60),…,[90,100]得到如图所示的频
率分布直方图.
(1)求频率分布直方图中 的值,并估计 100 名游客满意度分值的众数和中位数(结果保留整数);
(2)已知满意度分值落在[70,80)的平均数 1 = 75,方差 21 = 9,在[80,90)的平均数为 22 = 85,方差 2 = 4,
试求满意度分值在[70,90)的平均数 和方差 2.
4.(23-24 高一下·湖北·期末)某市根据居民的月用电量实行三档阶梯电价,为了深入了解该市第二档居民
用户的用电情况,该市统计局用比例分配的分层随机抽样方法,从该市所辖 , , 三个区域的第二档居民
用户中按 2:2:1 的比例分配抽取了 100 户后,统计其去年一年的月均用电量(单位:kW h),进行适当
分组后(每组为左闭右开的区间),频率分布直方图如下图所示.
(1)求 的值;
(2)若去年小明家的月均用电量为234kW h,小明估计自己家的月均用电量超出了该市第二档用户中 85%的
用户,请判断小明的估计是否正确?
(3)通过进一步计算抽样的样本数据,得到 A 区样本数据的均值为 213,方差为 24.2;B 区样本数据的均值
为 223,方差为 12.3;C 区样本数据的均值为 233,方差为 38.5,试估计该市去年第二档居民用户月均用电
量的方差.(需先推导总样本方差计算公式,再利用数据计算)
题型 7 其他统计图表中反映的集中趋势与离散程度
1.(2024·全国·模拟预测)如图为 2014—2022 年中国游戏用户规模(单位:百万人)及同比增长率、
2010—2022 年中国国产游戏获批版号数量(单位:个)的统计图,则下列结论正确的是( )
A.2014—2022 年中国游戏用户规模逐年增长
B.2014—2022 年中国游戏用户规模的同比增长率的中位数为3.1%
C.2010—2022 年中国国产游戏获批版号数量的极差为 223 个
D.2010—2022 年中国国产游戏获批版号数量的平均数超过 1600 个
2.(23-24 高一下·江苏徐州·期末)近年来,“直播带货”受到越来越多人的喜爱,目前已经成为推动消费的
一种流行营销形式.某直播平台有 800 个直播商家,对其进行调查统计,发现所售商品多为小吃、衣帽、生
鲜、玩具、饰品类等,各类直播商家所占比例如图①所示.为了更好地服务买卖双方,该直播平台打算用分
层抽样的方式抽取 60 个直播商家进行问询交流.
(1)应抽取小吃类、生鲜类商家各多少家?
(2)在问询了解直播商家的利润状况时,工作人员对抽取的 60 个商家的平均日利润进行了统计(单位:
元),所得频率直方图如图②所示.
(i)估计该直播平台商家平均日利润的中位数与平均数(求平均数时同一组中的数据用该组区间中点的数
值为代表);
(ii)若将平均日利润超过 470 元的商家称为“优质商家”,估计该直播平台“优质商家”的个数.
3.(23-24 高三上·黑龙江鸡西·期末)为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随
机选取了 10 个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出折线图:
(1)分别计算甲、乙两厂提供 10 个轮胎宽度的平均值;
(2)轮胎的宽度在[194,196]内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的 10 个轮胎中所有标
准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的
轮胎相对更好
4.(23-24 高一下·宁夏·期末)某公司为了提高职工的健身意识,鼓励大家加入健步运动,要求 200 名职工
每天晚上 9:30 上传手机计步截图,对于步数超过 10000 的予以奖励.图 1 为甲乙两名职工在某一星期内
的运动步数统计图,图 2 为根据这星期内某一天全体职工的运动步数做出的频率分布直方图.
(1)请根据频率分布直方图,求 m 的值,并求出该天运动步数不少于 15000 步的人数;
(2)估计全体职工在该天运动步数的众数、平均数和中位数;
(3)如果当天甲的排名为第 130 名,乙的排名为第 40 名,试判断做出的是星期几的频率分布直方图.
题型 8 统计综合
1.(23-24 高一下·广东梅州·期末)某中学新建了学校食堂,每天有近 2000 名学生在学校食堂用午餐,午
餐开放时间约 40 分钟,食堂制作了三类餐食,第一类是选餐,学生凭喜好在做好的大约 6 种菜和主食米饭
中任意选购;第二类是套餐,已按配套好菜色盛装好,可直接取餐;第三类是面食,如煮面、炒粉等,为
了更合理地设置窗口布局,增加学生的用餐满意度,学校学生会在用餐的学生中对就餐选择、各类餐食的
平均每份取餐时长以及可接受等待时间进行问卷调查,并得到以下的统计图表.
类别 选餐 套餐 面食
选择人数 50 30 20
平均每份取餐时长(单位:分钟) 2 0.5 1
已知饭堂的售饭窗口一共有 20 个,就餐高峰期时有 200 名学生在等待就餐.
(1)根据以上的调查统计,如果设置 12 个选餐窗口,4 个套餐窗口,4 个面食窗口,就餐高峰期时,假设大
家在排队时自动选择较短的队伍等待(即各类餐食的窗口前队伍长度各自相同),问:选择选餐的同学最
长等待时间是多少?这能否让 80%的同学感到满意(即在接受等待时长内取到餐)?
(2)根据以上的调查统计,从等待时长和公平的角度上考虑,如何设置各类售饭窗口数更优化,并给出你的
求解过程.
2.(24-25 高二上·安徽六安·阶段练习)随机抽取 100 名学生,测得他们的身高(单位:cm),按照区间
[160,165),[165,170),[170,175),[175,180),[180,185]分组,得到样本身高的频率分布直方图如图所示.
(1)求频率分布直方图中 的值及身高在170cm及以上的学生人数;
(2)估计该校 100 名生学身高的 75%分位数.
(3)若一个总体划分为两层,通过按样本量比例分配分层随机抽样,各层抽取的样本量、样本平均数和样
本方差分别为: , , 21; , , 22.记总的样本平均数为 ,样本方差为 2,证明:

① = + + + ;
② 2 = 1 2
2
+ 1 + ( )
2 + 22 + .
3.(2025 高三·全国·专题练习)随着社会的进步、科技的发展,人民对自己生活的环境要求越来越高,尤
其是居住环境的环保和绿化受到每一位市民的关注,因此,2019年6月25日,生活垃圾分类制度入法,提倡
每位居民做好垃圾分类储存、分类投放,方便工作人员依分类搬运,提高垃圾的资源价值和经济价值,力
争物尽其用.某市环卫局在 、 两个小区分别随机抽取6户,进行生活垃圾分类调研工作,依据住户情况对
近期一周(7天)进行生活垃圾分类占用时间统计如下表:
住户编号 1 2 3 4 5 6
小区(分钟) 220 180 210 220 200 230
小区(分钟) 200 190 240 230 220 210
(1)分别计算 、 小区每周进行生活垃圾分类所用时间的平均值和方差;
(2)如果两个小区住户均按照1000户计算,小区的垃圾也要按照垃圾分类搬运,市环卫局与两个小区物业
及住户协商,初步实施下列方案:
① 小区方案:号召住户生活垃圾分类“从我做起”,为了利国利民,每200位住户至少需要一名工作人员进
行检查和纠错生活垃圾分类,每位工作人员月工资按照3000元(按照28天计算标准)计算,则每位住户每
月至少需要承担的生活垃圾分类费是多少?
② 小区方案:为了方便住户,住户只需要将垃圾堆放在垃圾点,物业让专职人员进行生活垃圾分类,一位
专职工作人员对生活垃圾分类的效果相当于4位普通居民对生活垃圾分类效果,每位专职工作人员(每天工
作8小时)月工资按照4000元(按照28天计算标准)计算,则每位住户每月至少需要承担的生活垃圾分类费
是多少?
③市环卫局与两个小区物业及住户协商分别试行一个月,根据实施情况,试分析哪个方案惠民力度大,值
得进行推广?
4.(23-24 高一下·河南鹤壁·期末)某电视台有一档益智答题类综艺节目,每期节目从现场编号为 01~80
的 80 名观众中随机抽取 10 人答题.答题选手要从“科技”和“文艺”两类题目中选一类作答,一共回答 10 个问
题,答对 1 题得 1 分.
(1)若采用随机数表法抽取答题选手,按照以下随机数表,从下方带点的数字 2 开始向右读,每次读取两
位数,一行用完接下一行左端,求抽取的第 6 个观众的编号.
1622779439 4954435482 1737932378 8735209643 8426349164
·
8442175331 5724550688 7704744767 2176335025 8392120676
(2)若采用等距系统抽样法抽取答题选手,且抽取的最小编号为 06,求抽取的最大编号.
(3)某期节目的 10 名答题选手中 6 人选科技类题目,4 人选文艺类题目.其中选择科技类的 6 人得分的平
5 5
均数为 7,方差为3;选择文艺类的 4 人得分的平均数为 8,方差为2.求这期节目的 10 名答题选手得分的平
均数和方差.