2023-2024学年高一数学9.2用样本估计总体 (原卷版+解析版)(人教A版2019必修第二册)

文档属性

名称 2023-2024学年高一数学9.2用样本估计总体 (原卷版+解析版)(人教A版2019必修第二册)
格式 zip
文件大小 2.4MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2024-04-16 15:45:17

文档简介

2023-2024学年高一数学9.2用样本估计总体(人教A版2019必修第二册)
·模块一 总体取值规律的估计
·模块二 总体百分位数的估计
·模块三 总体集中趋势与总体离散程度的估计
·模块四 课后作业
1.频率分布直方图
(1)频率分布表与频率分布直方图的意义
为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初
中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
有时,我们更关心各个小组的数据在样本容量中所占比例的大小,所以选择频率分布表和频率分布直方图来整理和表示数据.
(2)频率分布表与频率分布直方图的制作步骤
与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
第一步,求极差
极差为一组数据中最大值与最小值的差.
第二步,决定组距与组数
第三步,将数据分组
通常对组内数据取左闭右开区间,最后一组数据取闭区间.
第四步,列频率分布表
计算各小组的频率,作出频率分布表.
第五步,画频率分布直方图
画图时,以横轴表示分组,纵轴(小长方形的高度)表示.
2.其他几类常用统计图——条形图、折线图、扇形图
条形图 折线图 扇形图
特 点 一般地,条形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,条形图 用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化. 用整个圆表示总体,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
中每一长方形都是等宽的.
作用及选用情景 能清楚地表示每个项目的具体数量,便于相互比较大小. 能清楚地看出数量增减变化的情况及各部分数量的多少.常用来表示随时间变化的数据,当然,也可以用在其他合适的情形中. 可以形象地表示出各部分数据在全部数据中所占的比例情况.
图例
【考点1 绘制、补全频率分布直方图】
【例1.1】(23-24高一下·山西晋中·阶段练习)某制造商为运动会生产一批直径为40mm的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm,保留两位小数)如下:
40.02 40.00 39.98 40.00 39.99
40.00 39.98 40.01 39.98 39.99
40.00 39.99 39.95 40.01 40.02
39.98 40.00 39.99 40.00 39.96
(1)完成下面的频率分布表,并画出频率分布直方图;
分组 频数 频率
合计

(2)假定乒乓球的直径误差不超过0.02mm为合格品,若这批乒乓球的总数为10000只,试根据抽样检查结果估计这批产品的合格只数.
【解题思路】(1)根据所给的频数和样本容量,用频数除以样本容量做出每一组数据对应的频率,填入表中,画出对应的频率分步直方图和频率分布折线图.
(2)计算抽样产品在的个数,计算合格率,即可求出这批产品的合格只数.
【解答过程】(1)频率分布表如下:
分组 频数 频率
2 0.10 5
4 0.20 10
10 0.50 25
4 0.20 10
合计 20 1.00 50
频率分布直方图、频率分布折线图如图所示.

(2)因为抽样的20只产品中在范围内的有18只,所以合格率为.
所以根据抽样检查结果,可以估计这批产品的合格只数为9000.
【例1.2】(22-23高一下·河北衡水·期末)杭州市某高中从学生中招收志愿者参加迎亚运专题活动,现已有高一540人、高二360人,高三180人报名参加志愿活动.根据活动安排,拟采用分层抽样的方法,从已报名的志愿者中抽取120名.对抽出的120名同学某天参加运动的时间进行了统计,运动时间均在39.5至99.5分钟之间,其频率分布直方图如下:

(1)需从高一、高二、高三报名的学生中各抽取多少人;
(2)请补全频率分布直方图.
【解题思路】(1)根据分层抽样的定义按比例求解即可;
(2)由各组的频率和为1求出第三组的频率,从而可求出第三组的小矩形的高度,进而可补全频率分布直方图.
【解答过程】(1)报名的学生共有1080人,抽取的比例为,
所以高一抽取人,高二抽取人,高三抽取人;
(2)第三组的频率为,
故第三组的小矩形的高度为,补全频率分布直方图得

【变式1.1】(22-23高一下·天津河东·期末)《天津日报》2022年11月24日报道,我市扎实推进实施深入打好污染防治攻坚战“1+3+8”行动方案,生态环境质量持续稳定向好,特别是大气环境质量改善成效显著.记者从市生态环境局获悉,1至10月份,全市PM2.5平均浓度为34微克/立方米,同比改善8.1%,优良天数222天,同比增加3天,重污染天2天,同比减少4天,为10年来最好水平.小明所在的数学兴趣小组根据2022年8月天津市空气质量指数(AQI趋势图)进行数据统计,分析空气质量指数在不同范围内的天数占一个月天数的比例,步骤为“求极差”“决定组距与组数”“数据分组”“列频率分布表”“画频率分布直方图”,请完成上述步骤,绘制频率分布直方图(横轴为空气质量指数,纵轴保留两位有效数字).


【解题思路】先求极差,分组,然后列出频率分布表,根据频率直方图的作图方法直接作图即可.
【解答过程】由图中数据知,空气质量指数的最大值为64,最小值为23,它们的差是64-23=41,即极差为41,
根据极差确定组距为7,组数为6,
频率分布表如下:
空气质量指数 频数 频率
5
4
10
3
6
3
由频率分布表,可得频率分布直方图,如下:
【变式1.2】(22-23高二上·广东揭阳·期中)为了让学生了解环保知识,增强环保意识,某中学举行了一次环保知识竞赛,共有900名学生参加了这次竞赛.为了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请根据尚未完成的频率分布表和频数分布直方图,解答下列问题.
分组 频数 频率
4 0.08
0.16
0.20
16
合计 50 1.00
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频数分布直方图;
(3)若成绩在75.5~85.5分的学生获得二等奖,问获得二等奖的学生约为多少人?
【解题思路】(1)根据表中的数据和频率的求解公式求解即可.
(2)由(1)中表格中的数据完成频数分布直方图.
(3)根据频率分布表可求出成绩在75.5~80.5分的学生频率为0.10,成绩在80.5~85.5分的学生频率为0.16,从而可得成绩在75.5~85.5分的学生频率为0.26,进而可求得获得二等奖的人数.
【解答过程】(1)补全频率分布表如下:
分组 频数 频率
4 0.08
8 0.16
10 0.20
16 0.32
12 0.24
合计 50 1.00
(2)频数分布直方图如下图所示:
(3)成绩在75.5~80.5分的学生占70.5~80.5分的学生的,
因为成绩在70.5~80.5分的学生频率为0.20,
所以成绩在75.5~80.5分的学生频率为0.10.
成绩在80.5~85.5分的学生占80.5~90.5分的学生的.
因为成绩在80.5~90.5分的学生频率为0.32,
所以成绩在80.5~85.5分的学生频率为0.16,
所以成绩在75.5~85.5分的学生频率为0.26.
∵有900名学生参加了这次竞赛,
∴该校获得二等奖的学生有:0.26×900=234,
∴该校获得二等奖的学生有234人.
【考点2 频率分布直方图的相关计算】
【例2.1】(23-24高三上·安徽亳州·期末)如图所示为某企业员工年龄(岁)的频率分布直方图,从左到右依次为第一组 第二组、……、第五组,若第五组的员工有80人,则第二组的员工人数为( )
A.140 B.240 C.280 D.320
【解题思路】根据频率分布直方图的性质,求得的值,进一步计算即可 .
【解答过程】由已知得,
所以,因为第五组的员工人数为80,
所以第二组的员工人数为.
故选:C.
【例2.2】(2023高三·全国·专题练习)某市为了解全市环境治理情况,对本市的200家中小型企业的污染情况进行了摸排,并把污染情况各类指标的得分综合折算成准分(最高为100分),统计并制成如图所示的直方图,则这次摸排中标准分不低于75分的企业数为( )
A.30 B.60 C.70 D.130
【解题思路】
根据频率分布直方图可得频率,即可求解个数.
【解答过程】
解:根据频率分布直方图,标准分不低于75分的企业的频率为:

∴标准分不低于75分的企业数为(家).
故选:A.
【变式2.1】(23-24高三上·天津南开·期末)某研究机构为了解某地年轻人的阅读情况,通过随机抽样调查了100位年轻人,对这些人每天的阅读时间(单位:分钟)进行统计,得到样本的频率分布直方图如图所示,则的值为( )
A.0.02 B.0.2 C.0.04 D.0.4
【解题思路】根据题意结合频率和为1列式求解.
【解答过程】由频率分布直方图可知:每组频率依次为,
则,解得.
故选:A.
【变式2.2】(2023·四川自贡·二模)某乡镇为推动乡村经济发展,优化产业结构,逐步打造高品质的农业生产,在某试验区种植了某农作物.为了解该品种农作物长势,在实验区随机选取了100株该农作物苗,经测量,其高度(单位:cm)均在区间内,按照,,,,分成5组,制成如图所示的频率分布直方图,记高度不低于16cm的为“优质苗”.则所选取的农作物样本苗中,“优质苗”株数为( )
A.20 B.40 C.60 D.88
【解题思路】根据频率分布直方图计算出“优质苗”的占比,再乘以100可得结果
【解答过程】由频率分布直方图可知,“优质苗”的占比为,
因此,所选取的农作物样本苗中,“优质苗”株数为.
故选:C.
【考点3 统计图的综合应用问题】
【例3.1】(2024·甘肃·一模)小李一周的总开支分布如图(1)所示,其中一周的食品开支如图(2)所示,则以下判断错误的是( )

A.小李这一周用于肉蛋奶的支出高于用于娱乐的支出
B.小李这一周用于食品中其他类的支出在总支出中是最少的
C.小李这一周用于主食的支出比用于通信的支出高
D.小李这一周用于主食和蔬菜的总支出比日常支出高
【解题思路】条形图各支出占食品支出的比例乘以即是条形图各支出占总支出的比例,由此关系即可逐一判断每一个选项.
【解答过程】对于A,肉蛋奶的支出占食品开支的,
从而小李这一周用于肉蛋奶的支出占比(总开支是单位1)与用于娱乐的支出占比(总开支是单位1)大小关系为,故A描述正确,不符合题意;
对于B,小李这一周用于食品中其他类的支出在总支出中占比为,
对比其他类型的支出占比可知,B描述正确,不符合题意;
对于C,小李这一周用于主食的支出占比(总开支是单位1)与通信的支出占比(总开支是单位1)的大小关系为,
,故C描述正确,不符合题意;
对于D,小李这一周用于主食和蔬菜的总支出占比(总开支是单位1)与日常支出占比(总开支是单位1)的大小关系为,
,故D描述错误,符合题意.
故选:D.
【例3.2】(23-24高三下·内蒙古锡林郭勒盟·开学考试)为了积极推进国家乡村振兴战略,某示范村不断自主创新,拓宽村民增收渠道,近年来取得了显著成效.据悉该村2023年经济总收入是2022年的2倍,为了更好地了解该村经济收入变化情况,统计了该村两年的经济收入构成比例,得到如图所示的条形图和饼图.则以下说法错误的是( )
A.2023年“种植收入”和2022年“种植收入”一样多
B.2023 年“养殖收入”与“第三产业收入”之和比2022年的全年总收入还多
C.2023年“外出务工收入”是2022年“外出务工收入”的
D.2023年“其他收入”比2022年“其他收入”的2倍还多
【解题思路】设2022年总收入为m,则2023年总收入为,A选项,分别计算出2022年和2023年种植收入,得到A正确;B选项,计算出,B正确;C选项,分别计算出2022年和2023年外出务工收入,得到C错误;D选项,分别计算出2022年和2023年其他收入,得到D正确.
【解答过程】设2022年总收入为m,则2023年总收入为,
对于A,2022年种植收入为,2023年种植收入为,A正确;
对于B,2023年养殖收入和第三产业收入之和为,B正确;
对于C,2022年外出务工收入为,2023年外出务工收入为,
是2022年外出务工收入的,C不正确;
对于D,2022年其他收入为,2023年其他收入为,
由于,故2023年其他收入比2022年其他收入的2倍还多,D正确.
故选:C.
【变式3.1】(2023·河南·二模)某银行为客户定制了A,B,C,D,E共5个理财产品,并对5个理财产品的持有客户进行抽样调查,得出如下的统计图:

用该样本估计总体,以下四个说法错误的是( )
A.44~56周岁人群理财人数最多
B.18~30周岁人群理财总费用最少
C.B理财产品更受理财人青睐
D.年龄越大的年龄段的人均理财费用越高
【解题思路】A.由扇形图判断;B.设总人数为a,按照扇形图得到各段人数,再由折线图求解判断;C.利用条形图判断;D.利用折线图判断.
【解答过程】A.44~56周岁人群理财人数所占比例是37%,是最多的,故正确;
B.设总人数为a,
则18~30周岁人群的人均理财费用约为,
31~43周岁人群的人均理财费用约为,
44~56周岁人群的人均理财费用约为,
57周岁人群的人均理财费用约为,
所以57周岁及以上人群的人均理财费用最少,故错误;
C.由条形图可知:B理财产品更受理财人青睐,故正确;
D.由折线图知:年龄越大的年龄段的人均理财费用越高,故正确,
故选:B.
【变式3.2】(2023·河南平顶山·模拟预测)年月某市星级酒店经营数据统计分析如下图(“同比”指与去年同期相比):
下列说法错误的是( )
A.整体来看,年月该市星级酒店平均房价相对上一年有所提高
B.年月该市星级酒店平均房价的平均数超过元
C.年月这个月中,该市星级酒店在月份的平均房价创下个月来的最高纪录
D.年月该市星级酒店平均房价约为元
【解题思路】
根据折线统计图和条形统计图逐项判断可得出合适的选项.
【解答过程】对于A选项,由图可知,仅有月同比增速为,其余个月同比增速均为正数,故A正确;
对于B选项,由图可知个数据的平均数为
,故B正确;
对于C选项,由图可知这个月的数据中,第个月的最大,故C正确;
对于D选项,由,得年月该市星级酒店平均房价大于元,故D错误.
故选:D.
1.总体百分位数的估计
(1)概念
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个
值,且至少有(100-p)%的数据大于或等于这个值.
(2)求解步骤
可以通过下面的步骤计算一组n个数据的第p百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p
百分位数为第i项与第(i+1)项数据的平均数.
【考点4 百分位数的求解】
【例4.1】(23-24高三下·贵州·阶段练习)某同学一学期七次模拟考试数学成绩(满分150分)依次为88,98,112,106,122,118,110,则这名同学七次数学成绩的分位数为(  )
A.110 B.112 C.115 D.118
【解题思路】将某同学一学期七次模拟考试数学成绩从低到高排列,根据百分位数的概念,即可求得答案.
【解答过程】将某同学一学期七次模拟考试数学成绩从低到高排列依次为88,98,106,110,112,118,122,
由于,故这名同学七次数学成绩的分位数为第6个数,即118,
故选:D.
【例4.2】(2024·福建厦门·二模)已知样本的平均数等于分位数,则满足条件的实数的个数是( )
A.0 B.1 C.2 D.3
【解题思路】确定样本的分位数为样本数据从小到大排序后的第4个数,分类讨论x的取值范围,结合样本平均数列出方程,即可求得答案.
【解答过程】因为,故样本的分位数为样本数据从小到大排序后的第4个数,
由题意得,
当时,,则,满足题意;
当时,,则,与矛盾;
当时,,则,满足题意;
故满足条件的实数的个数是2,
故选:C.
【变式4.1】(2023·河南·模拟预测)为更好地满足民众个性化、多元化、便利化的消费需求,丰富购物体验和休闲业态,某市积极打造夜间经济.为不断创优夜间经济发展环境、推动消费升级,有关部门对某热门夜市开展“服务满意度调查”,随机选取了100 名顾客进行问卷调查,对夜市服务进行评分(满分100 分),根据评分情况绘制了如图所示的频率分布直方图,估计这组数据的第55 百分位数为( )

A.65 B.72 C.72.5 D.75
【解题思路】根据频率分布直方图先估算出第数所在区间为,然后即可求出.
【解答过程】由题中频率分布直方图知区间,,三个区间频率为,
所以第数所在区间为,且设为,则,解得,故D正确.
故选:D.
【变式4.2】(23-24高二上·四川成都·阶段练习)一组数据按从小到大排列为,若该组数据的第60百分位数是众数的倍,则这组数据的平均数是( )
A.4 B.5 C.6 D.7
【解题思路】按百分位数和平均数的定义计算即可.
【解答过程】由题意该组数据共7个数,,
故第60百分位数为从小到大第5个数 ,又众数为4,
故 ,
故该组数据的平均数为,
故选:B.
1.总体集中趋势的估计
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度
刻画了一组数据的集中趋势.具体概念回顾如下:
名称 概念
平 均 数 如果有n个数x1,x2,…,xn,那么(x1+x2+…+xn)就是这组数据的平均数,用表示,即=(x1+x2+…+xn).
中 位 数 将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
众 数 一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称为这组数据的众数.
2.总体离散程度的估计
(1)方差和标准差
假设一组数据是,,,,用表示这组数据的平均数,则我们称为这组数据的
方差.有时为了计算方差的方便,我们还把方差写成的形式.
我们对方差开平方,取它的算数平方根,称为这组数据的标准差.
(2)总体(样本)方差和总体标准差
①一般式:如果总体中所有个体的变量值分别为,,,,总体平均数为,则总体方差=
.
②加权式:如果总体的N个变量值中,不同的值共有k(kN)个,不妨记为,,,,其中出
现的频数为(i=1,2,,k),则总体方差为=.
总体标准差:S=.
(3)标准差与方差的统计意义
①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.
③标准差(方差)的取值范围为[0,+).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则
标准差为0.反之,标准差为0的样本,其中的数据都相等.
3.频率分布直方图中的统计参数
(1)频率分布直方图中的“众数”
根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数.一般用
中点近似代替.
(2)频率分布直方图中的“中位数”
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.
因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
(3)频率分布直方图中的“平均数”
平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分
布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
【考点5 众数、中位数、平均数的求解及应用】
【例5.1】(23-24高二上·浙江杭州·期中)某校素质运动会上,个男生的引体向上个数依次为,设这组数据的平均数为,中位数为,众数为,则( )
A. B. C. D.
【解题思路】
根据平均数、中位数和众数的定义分别求得即可.
【解答过程】该组数据的平均数;
将引体向上的个数按照从小到大顺序排列为:,
则中位数;
该组数据的众数;.
故选:A.
【例5.2】(23-24高二下·湖南长沙·开学考试)某中学高二1班共有50名同学,其中男生30名,女生20名,采用按比例分层随机抽样方法,从全班学生中抽取20人测量其身高(单位:).已知在抽取的样本中,男生的平均身高为,女生的平均身高为,由此估计该班全体学生的平均身高约为( )
A. B. C. D.
【解题思路】
根据分层抽样、平均数等知识求得正确答案.
【解答过程】
因为抽样比例为,则样本中男生有人,女生有人,
所以样本的平均身高为,
由此估计该班全体学生的平均身高约为.
故选:D.
【变式5.1】(23-24高一上·河南南阳·期末)已知个数据的中位数是,则下列说法正确的是( )
A.这个数据中一定有且仅有个数小于或等于
B.把这个数据从小到大排列后,是第个数据
C.把这个数据从小到大排列后,是第个和第51个数据的平均数
D.把这个数据从小到大排列后,是第个和第个数据的平均数
【解题思路】根据中位数的概念逐项判断即可.
【解答过程】若这个数都是8,则有个数据的中位数是8,故A错误;
因为为偶数,所以第个和第个数据的平均数为中位数,
故C正确,B,D不正确.
故选:C.
【变式5.2】(23-24高一下·全国·课后作业)若某同学连续次考试的名次(次考试均没有出现并列名次的情况)不低于第名,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续次考试名次的数据,推断一定是尖子生的是( )
A.甲同学:平均数为,方差小于
B.乙同学:平均数为,众数为
C.丙同学:中位数为,众数为
D.丁同学:众数为,方差大于
【解题思路】根据定义,结合各组的情况,举出特例排除错误选项;对正确选项,计算即可做出判断.
【解答过程】对于甲同学,平均数为,方差小于,设甲同学三次考试的名次分别为、、,
若、、中至少有一个大于等于,则方差为,与已知条件矛盾,
所以,、、均不大于,满足题意;
对于乙同学,平均数为,众数为,则三次考试的成绩的名次为、、,
即必有一次考试为第名,不满足题意;
对于丙同学,中位数为,众数为,可举反例:、、,不满足题意;
对于丁同学,众数为,方差大于,可举特例:、、,则平均数为,
方差为,不满足条件.
故选:A.
【考点6 方差、标准差的求解及应用】
【例6.1】(23-24高二上·四川成都·期中)为庆祝中国共产主义青年团成立100周年,某校甲、乙两个班共70人(甲班40人,乙班30人)参加了共产主义青年团知识竞赛,甲班的平均成绩为77分,方差为123,乙班的平均成绩为70分,方差为130,则甲、乙两班全部同学的成绩的方差为( )
A.74 B.129 C.136 D.138
【解题思路】
直接由总样本方差公式计算求解即可.
【解答过程】设甲班平均成绩为,方差为,乙班平均成绩为,方差为,
总体平均成绩为,方差为,
由题知,
则由总样本方差公式,
可得甲,乙两班全部同学的成绩的方差为.
故选:D.
【例6.2】(22-23高一·全国·单元测试)设有n个样本,,…,,其标准差是,另有n个样本,,…,,且,其标准差为,则下列关系中正确的是( )
A. B.
C. D.
【解题思路】根据标准差的计算公式分别表示,由此判断两者关系.
【解答过程】设样本,,…,的平均数为,样本,,…,的平均数为,则




所以,故,
故选:B.
【变式6.1】(2024·全国·模拟预测)已知总体划分为3层,通过分层随机抽样,各层抽取的样本容量分别为,,,样本平均数分别为,,,样本方差分别为,,,若,则( )
A.
B.
C.总体样本平均数
D.当时,总体方差
【解题思路】根据样本平均数以及方差的定义,即可判断A、B项;计算可判断C;根据分层抽样,总体方差的求解,计算即可得出D.
【解答过程】对于A、B项,由于样本容量与样本平均数、样本方差之间并不是成某种比例关系,所以选项A,B错误;
对于C项,设,
则总体样本平均数 ,所以选项C错误;
对于D项,当时,总体样本平均数,
所以总体方差 ,所以选项D正确.
故选:D.
【变式6.2】(2023·山西太原·一模)现有甲 乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为3,方差为5,乙组数据满足如下条件时,若将这两组数据混合成一组,则关于新的一组数据说法错误的是( )
A.若乙组数据的平均数为3,则新的一组数据平均数为3
B.若乙组数据的方差为5,则新的一组数据方差为5
C.若乙组数据的平均数为3,方差为5,则新的一组数据方差为5
D.若乙组数据的平均数为5,方差为3,则新的一组数据方差为5
【解题思路】根据分层样本的平均数公式和方差公式分别计算两组数据的总体的平均数或方差即可判断.
【解答过程】设甲组数据的平均数为,方差为,
乙组数据的平均数为,方差为,
混合后的新数据的平均数为,方差为,
则,,
对于A,新的一组数据平均数,A正确;
对于B,由于不能确定乙组数据的平均数,故由公式可知无法确定新的一组数据方差,B错误;
对于C,因为乙组数据的平均数为3,方差为5,即,,
所以,
所以,C正确;
对于D,因为乙组数据的平均数为5,方差为3,即,,
所以,
所以,D正确;
故选:B.
【考点7 频率分布直方图中集中趋势参数的计算】
【例7.1】(2024·全国·模拟预测)中央广播电视总台《2024年春节联欢晚会》以“龙行龘龘,欣欣家国”为主题,创新“思想艺术技术”融合传播,与全球华人相约除夕,共享一台精彩纷呈、情真意切、热气腾腾的文化盛宴.2023年12月2日,中央广播电视总台发布了甲辰龙年春晚的主标识——龘.为了解大家对这一标识的看法,某网站进行了一次网络调研,并将参与调查的网友对这一标识的打分情况(分数在50分到100分之间)绘制成频率分布直方图如下:

(1)求网友打分的平均值(同一组中的数据用该组区间的中点值代替)、中位数(保留一位小数);
(2)设网友打分的平均值为,若按打分是否在区间内进行分层抽样,抽取10人进行深度调研,打分在区间内的至少抽取8人,试估计的最小值(保留两位小数).
【解题思路】(1)根据频率分布直方图求平均数、中位数得求法依次计算即可求解;
(2)由(1)知,根据打分在区间内的频率不低于0.8分类讨论确定,进而求解.
【解答过程】(1)网友打分的平均值为

分数在的频率,
分数在的频率,
设中位数为,则,
,得,
即中位数约为73.3.
(2)由(1)可知.
要使抽取的10人的打分在内的人数不低于8人,
则打分在区间内的频率不低于0.8.
若,则 ,
频率;
若,则 ,
频率.
当最小时,,
且,
解得,即的最小值约为13.95.
【例7.2】(2024·内蒙古呼和浩特·一模)为了解甲、乙两种农药在某种绿植表面的残留程度,进行如下试验:将100株同种绿植随机分成两组,每组50株,其中组绿植喷甲农药,组绿植喷乙农药,每株绿植所喷的农药体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在绿植表面的百分比,根据试验数据分别得到如图直方图:
记为事件:“乙农药残留在表面的百分比不低于5.5”,根据直方图得到的估计值为0.70.
(1)求乙农药残留百分比直方图中的值;
(2)估计甲农药残留百分比的平均数(同一组中的数据用该组区间的中点值为代表);
(3)估计乙农药残留百分比的中位数.(保留2位小数)
【解题思路】(1)由的估计值为0.70,可得,求得值,再由整体频率为即可求得;
(2)根据平均数的定义,取组区间的中点值进行计算即可得解;
(3)中位数在使得直方图面积为处取得,经计算即可得解.
【解答过程】(1)为事件:“乙农药残留在表面的百分比不低于5.5”,
根据直方图得到的估计值为0.70.
则由频率分布直方图得:,解得,
所以乙农药残留在表面的百分比直方图中.
(2)估计甲农药残留百分比的平均数为:

(3)设乙农药残留百分比的中位数为,则
,解得,
所以估计乙农药残留百分比的中位数约为.
【变式7.1】(23-24高一上·安徽蚌埠·期末)自2022年动工至今,我市的“靓淮河”工程已初具规模.该工程以“一川清 两滩靓 三脉通 十景红”为总体布局,以生态修复与保护为核心理念,最终将促进城市防洪 交通 航运 生态 观光 商业等多种业态协同融合发展.为调查我市居民对“靓淮河”工程的满意程度,随机抽取了200位市民,现拟统计参与调查的市民年龄层次,将这200人按年龄(岁)分为5组,依次为,并得到频率分布直方图如下.

(1)求实数的值;
(2)估计这200人年龄的样本平均数(同一组数据用该区间的中点值作代表);
(3)估计这200人年龄的中位数(精确到小数点后1位).
【解题思路】(1)根据频率之和为1,可求的值;
(2)根据频率分布直方图,可直接估算平均数;
(3)直接求频率在的数据就可估计中位数.
【解答过程】(1)由题意:,解得.
(2)由题意:,
估计这200人年龄的样本平均数为41.5岁.
(3)由图可知,年龄在的频率为0.25,在的频率为0.35,

估计这200人年龄的样本中位数为42.1岁.
【变式7.2】(23-24高一上·河南·期末)某调研小组调查了某市1000名外卖骑手平均每天完成的任务量(简称“单量”),得到如下的频数分布表:
单量/单
人数 100 120 130 180 220 150 60 30 10
(1)补全该市1000名外卖骑手每天单量的频率分布直方图;
(2)根据图表数据,试求样本数据的中位数(精确到0.1);
(3)根据外卖骑手的每天单量,参考某平台的类别将外卖骑手分成三类,调查获知不同类别的外卖骑手开展工作所投入的装备成本不尽相同,如下表:
日单量/单
类別 普通骑手 精英骑手 王牌骑手
装备价格/元 2500 4000 4800
根据以上数据,估计该市外卖骑手购买装备的平均成本.
【解题思路】(1)计算出第二组和第四组的频率,得出对应小矩形的高,在图中标出即可;
(2)根据已知,分别求出样本数据分布在以及之间的频率,得出中位数,进而列出方程,求解即可得出答案;
(3)根据已知得出不同类别骑手的人数,计算平均数即可得出答案.
【解答过程】(1)由第二组的频数得频率为,从而第二组矩形的高为,
由第四组的频数得频率为,从而第二组矩形的高为,
补全该市1000名外卖骑手周单量的频率分布直方图,如下:
(2)由已知可得,样本数据分布在之间的频率为;
样本数据分布在之间的频率为.
设样本数据的中位数为,则,
且有,
解得,即样本数据的中位数约为29.2.
(3)依题意可知,被调查的1000人中,普通骑手共有(人),
精英骑手共有(人),王牌骑手共有(人),
所以,这1000名外卖骑手购买装备的平均成本为(元),
所以估计该市外卖骑手购买装备的平均成本为3750元.
【考点8 其他统计图表中反映的集中趋势与离散程度】
【例8.1】(22-23高一下·吉林长春·期末)近年来,“直播带货”受到越来越多人的喜爱.目前已经成为推动消费的一种流行的营销形式.对某直播平台的直播商家进行调查统计,发现所售商品多为小吃、衣帽、生鲜、玩具、饰品类等,各类直播商家所占比例如图①所示.

(1)该直播平台为了更好地服务买卖双方,打算随机抽取80个直播商家进行问询交流.如果按照比例分配分层抽样的方式抽取,则应抽取小吃类、玩具类商家各多少家?
(2)在问询了解直播商家的利润状况时,工作人员对抽取的80个商家的平均日利润进行了统计(单位:元),所得频率分布直方图如图②所示.请根据频率分布直方图,求出图中a的值,并估计该直播平台商家日利润的平均数(求平均数时同一组中的数据用该组区间的中点值作代表).
【解题思路】(1)根据题意,直接计算,即可得到结果;
(2)根据题意,先由频率之和求得,再根据平均数的计算公式即可得到结果.
【解答过程】(1)由题意可得,,,
所以应抽取小吃类家,玩具类家.
(2)由题意可得,,解得,
平均数为 ,所以该直播平台商家日利润的平均数为.
【例8.2】(23-24高二上·四川成都·期末)为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机选取了 10个轮胎,将每个轮胎的宽度(单位:mm) 记录下来并绘制出折线图:
(1)分别计算甲、 乙两厂提供10个轮胎宽度的平均值;
(2)轮胎的宽度在[193,195]内,则称这个轮胎是标准轮胎,试比较甲、 乙两厂分别提供的 10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好.
【解题思路】(1)由折线图提供的数据,利用平均数公式代入计算即可;
(2)分别找出甲乙两厂的所有标准轮胎宽度的数据,再分别求出平均值与方差,即可判断.
【解答过程】(1)由题:甲厂轮胎宽度的平均值为:

乙厂轮胎宽度的平均值为:

所以甲、 乙两厂提供10个轮胎宽度的平均值分别为195,194.
(2)由题,甲厂提供的 10个轮胎中所有标准轮胎宽度为:
,其平均数为:,
其方差为:;
乙厂提供的 10个轮胎中所有标准轮胎宽度为:
,其平均数为:,
其方差为:;
从平均数上来看:乙厂提供的 10个轮胎中所有标准轮胎宽度高于甲厂提供的 10个轮胎中所有标准轮胎宽度,但乙厂提供的 10个轮胎中所有标准轮胎宽度方差较大,不够稳定.
【变式8.1】(23-24高一上·重庆江北·阶段练习)2023年以来,某区把垃圾分类纳入积分,建立文明账户,市民以行动换积分,以积分转习惯.区政府为了了解4月份甲、乙两个社区居民垃圾换积分的情况,分别从甲、乙两个社区各抽取10人,记录下他们的积分(单位:分),并进行整理和分析(积分用x表示,共分为4组:;,,),下面给出了部分信息:
甲社区10人的积分:47,56,68,71,83,83,85,90,91,94;
乙社区10人的积分在C组中的积分分数为:81,83,84,84;
两组数据的平均数,中位数,众数如下表所示:
社区 平均数 中位数 众数
甲 76.8 83 b
乙 76.8 a 84
乙社区积分等级扇形图

根据以上信息,解答下列问题:
(1)填空:______,______,______;
(2)根据以上数据,你认为哪个社区在此次垃圾分类换积分活动中表现更好,请说明理由(一条即可);
(3)若4月份甲社区有700人参与活动,乙社区有800人参与活动,请估计4月份甲、乙两个社区积分在80分以上(包括80分)的一共有多少人?
【解题思路】(1)找出甲社区中出现次数最多的数据,即可求得的值,根据乙社区的扇形统计图,计算出两组的人数,再结合C组的人数可求出的值,利用组的数除以10可求出的值,
(2)从中位数和众数的解度进行分析即可,
(3)分别利用总数乘以甲乙两个社区积分在80分以上所占的百分比,将积相加即可.
【解答过程】(1)因为甲社区中出现次数最多的数据为83,所以,
由乙社区的扇形统计图可得乙社区组人数为,组人数为人,
因为乙社区10人的积分在C组中的积分分数为:81,83,84,84,
所以乙社区的积分从小到大排列,第5个和第6个数据分别为83,84,
所以,
因为乙社区组人数为人,
所以组人数所占的百分比为,
所以,
(2)乙社区在此次垃圾分类换积分活动中表现更好,理由如下:
因为甲乙两个社区积分的平均数相同,但是乙社区的中位数和众数均比甲社区高,
所以乙社区在此次垃圾分类换积分活动中表现更好,
(3)因为甲社区积分在80分以上(包括80分)的人数所占的比例为,乙社区积分在80分以上(包括80分)的人数所占的比例为,
所以4月份甲、乙两个社区积分在80分以上(包括80分)的一共有
人.
【变式8.2】(22-23高一下·广东东莞·期末)树人中学男女学生比例约为,某数学兴趣社团为了解该校学生课外体育锻炼情况(锻炼时间长短(单位:小时),采用样本量比例分配的分层抽样,抽取男生人,女生人进行调查.记男生样本为,,,,样本平均数、方差分别为、;女生样本为,,,,样本平均数、方差分别为、;总样本平均数、方差分别为、.

(1)证明:;
(2)该兴趣社团通过分析给出以下两个统计图,假设两个统计图中每个组内的数据均匀分布,根据两图信息分别估计男生样本、女生样本的平均数;
(3)已知男生样本方差,女生样本方差,请结合(2)问的结果计算总样本方差的估计值.
【解题思路】(1)利用平均数和方差计算公式结合完全平方运算化简即可证明;
(2)利用平均数计算公式分别计算即可;
(3)先求出总样本平均数,根据方差公式结合(1)中结论化简求解即可.
【解答过程】(1)

因为,,
所以,则;
(2)因为每个组内的数据均匀分布,所以以各组的区间中点值代表该组的各个值,
由频率分布直方图估计男生样本课外体育锻炼时间的平均数为

由扇形图估计女生样本课外体育锻炼时间的平均数为

(3)因为采用按比例分配的分层随机抽样,所以,
估计树人中学学生课外运动时间的平均数为,
.
1.(2023·天津河西·三模)学校组织班级知识竞赛,某班的12名学生的成绩(单位:分)分别是:58、67、73、74、76、82、82、87、90、92、93、98,则这12名学生成绩的第三四分位数是( )
A.88分 B.89分 C.90分 D.91分
【解题思路】根据一组数据百分位数的定义计算第三四分位数,即75%百分位数.
【解答过程】12名学生成绩由小到大排列为58、67、73、74、76、82、82、87、90、92、93、98,
, 这12名学生成绩的第三四分位数是,
故选:D.
2.(22-23高一上·北京怀柔·期末)某直播间从参与购物的人群中随机选出 200 人,并将这200人按年龄分组,得到的频率分布直方图如图所示,则在这200人中年龄在的人数及直方图中值是( )
A., B.,
C., D.,
【解题思路】求出频率直方图中年龄在的频率,根据频率即可求出人数,根据频率分布直方图中,小矩形面积和为1,列出等式解出即可.
【解答过程】解:由图知,年龄在的小矩形的面积为:
,
即年龄在的频率为,
所以年龄在的人数,
由频率分布直方图的小矩形面积和为1可得:
,
解得:.
故选:C.
3.(2024·陕西西安·模拟预测)一组数据为,下列说法正确的个数是( )
①这些数据的众数是6
②这些数据的中位数是
③这些数据的平均数是7
④这些数据的标准差是
A.1 B.2 C.3 D.4
【解题思路】将原数据组由小到大排列,根据众数、中位数、平均数、标准差的定义逐一计算即可.
【解答过程】依题意,原数据组由小到大排列为:,
所以这组数据的众数是6或8,故①错误;
中位数是6,故②错误;
平均数为.故③错误;
方差为,
标准差为.故④正确.
故选:A.
4.(2024·贵州·三模)在某学校的期中考试中,高一 高二 高三年级的参考人数分别为.现用分层抽样的方法从三个年级中抽取样本,经计算得高一 高二 高三年级数学成绩的样本平均数分别为,则全校学生数学成绩的总样本平均数为( )
A.92 B.91 C.90 D.89
【解题思路】利用分层抽样的特点及平均数公式即可求解.
【解答过程】由题意,总样本平均数为.
故选:C.
5.(2023·天津北辰·三模)少年强则国强,少年智则国智.党和政府一直重视青少年的健康成长,出台了一系列政策和行动计划,提高学生身体素质.为了加强对学生的营养健康监测,某校在3000名学生中,抽
查了100名学生的体重数据情况.根据所得数据绘制样本的频率分布直方图如图所示,则下列结论正确的是( )
A.样本的众数为65 B.样本的第80百分位数为72.5
C.样本的平均值为67.5 D.该校学生中低于的学生大约为1000人
【解题思路】根据众数,百分位数,平均数的定义判断A,B,C,再求低于的学生的频率,由此估计总体中体重低于的学生的人数,判断D.
【解答过程】由频率分布直方图可得众数为,A错误;
平均数为,C错误;
因为体重位于的频率分别为,
因为,
所以第80百分位数位于区间内,设第80百分位数为,
则,
所以,即样本的第80百分位数为72.5,B正确;
样本中低于的学生的频率为,
所以该校学生中低于的学生大约为,D错误;
故选:B.
6.(2024·全国·模拟预测)空气质量指数是反映空气质量状况的指数,其对应关系如下表:
指数值
空气质量 优 良 轻度污染 中度污染 重度污染 严重污染
为监测某化工厂排放废气对周边空气质量指数的影响,某科学兴趣小组在校内测得10月1日—20日指数的数据并绘成折线图如下:
下列叙述正确的是( )
A.这天中指数值的中位数略大于
B.这天中的空气质量为优的天数占
C.10月4日到10月11日,空气质量越来越好
D.总体来说,10月中旬的空气质量比上旬的空气质量好
【解题思路】通过表格可知,数值越大,说明空气污染越严重,质量不好,数值越小空气质量越好.体现在图标上就是点的位置越高空气污染越严重,点的位置越低空气质量越好.可以通过将点计数来确定中位数的大概位置,以及空气质量为优的天数.
【解答过程】由折线图知以上有个,以下有个,中位数是两边两个数的均值,观察比的数离远点,
因此两者均值大于但小于150,A错;
空气质量为优的有天,占,B正确;
10月4日到10月11日,空气质量越来越差,C错;
10月上旬的空气质量指数值在以下的多,
中旬的空气质量指数值在以上的多,
上旬的空气质量比中旬的空气质量好,D错.
故选:B.
7.(2023·陕西商洛·模拟预测)自1950年以来,每年于4月7日庆祝世界卫生日,旨在引起世界各国人民对卫生 健康工作的关注,提高人们对卫生领域的素质和认识,强调健康对于劳动创造和幸福生活的重要性.为了让大家了解更多的健康知识,某中学组织三个年级的学生进行日常卫生知识竞赛,经统计,得到前200名学生分布的饼状图(如图1)和前200名学生中高一学生排名分布的频率条形图(如图2),则下列说法
错误的是( )

A.成绩在前200名的学生中,高一人数比高二人数多30
B.成绩在第1~50名的学生中,高三最多有32人
C.高一学生成绩在第101~150名的人数一定比高三学生成绩在第1~50名的人数多
D.成绩在第51~100名的学生中,高二人数比高一人数多
【解题思路】由饼状图可计算出高一年级共90人,高二年级共60人,高三年级共50人,再由高一学生排名分布的频率条形图可计算出各排名段中高一年级学生的人数,由此即可判断出答案.
【解答过程】由饼状图可知,成绩在前200名的学生中,高一人数比高二人数多,A正确;
成绩在第名的学生中,高一人数为,因此高三最多有32人,B正确;
由条形图知高一学生的成绩在第名的人数为,
而高三的学生成绩在第名的人数最多为人,
故高一学生的成绩在第名的人数一定比高三的学生成绩在第名的人数多,C正确;
成绩在第名的学生中,高一人数为,高二成绩在第名的人数最多为,
即成绩在第51~100名的学生中,高一的人数一定比高二的人数多,错误.
故选:D.
8.(2024·全国·模拟预测)已知图1为2014-2022年中国游戏用户规模(单位:百万人)及其同比增长率的统计图,图2为2010-2022年中国国产游戏获批版号数量(单位:个)的统计图,则下列结论正确的是( )
A.2014-2022年中国游戏用户规模逐年增长
B.2014-2022年中国游戏用户规模同比增长率的中位数为
C.2010-2022年中国国产游戏获批版号数量的极差是223
D.2010-2022年中国国产游戏获批版号数量的平均数超过1500
【解题思路】根据条形统计图、折线统计图逐项分析样本的数字特征即可判断.
【解答过程】A选项:2022年中国游戏用户规模比2021年减少,A错误;
B选项:2014-2022年中国游戏用户规模同比增长率从小到大依次为
,中位数为,B错误;
C选项:2010-2022年中国国产游戏获批版号数量的极差为,C错误;
D选项:2010-2022年中国国产游戏获批版号数量的平均数为
,D正确.
故选:D.
9.(23-24高二上·浙江舟山·期末)已知数据的平均数为,标准差为,中位数为,极差为.由这组数据得到新数据,其中,则下列命题中错误的是( )
A.新数据的平均数是 B.新数据的标准差是
C.新数据的中位数是 D.新数据的极差是
【解题思路】
对于AB,由平均数,标准差的计算公式直接验算即可;对于CD,直接由中位数,极差的定义验证即可.
【解答过程】对于A,因为,所以,故A正确;
对于B,因为,所以,故B错误;
对于CD,不妨设,所以,而,所以,故C正确;
因为,所以,故D正确.
故选:B.
10.(23-24高三·云南昆明·阶段练习)根据气象学上的标准,连续5天的日平均气温低于即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:
①平均数;
②平均数且极差小于或等于3;
③平均数且标准差;
④众数等于5且极差小于或等于4.
则4组样本中一定符合入冬指标的共有( )
A.1组 B.2组 C.3组 D.4组
【解题思路】举反例否定①;反证法证明②符合要求;举反例否定③;直接法证明④符合要求.
【解答过程】①举反例:,,,,,其平均数.但不符合入冬指标;
②假设有数据大于或等于10,由极差小于或等于3可知,
则此组数据中的最小值为,此时数据的平均数必然大于7,
与矛盾,故假设错误.则此组数据全部小于10. 符合入冬指标;
③举反例:1,1,1,1,11,平均数,且标准差.但不符合入冬指标;
④在众数等于5且极差小于等于4时,则最大数不超过9.符合入冬指标.
故选:B.
11.(22-23高二下·陕西榆林·期中)小刘从事陕北红枣批发多年,有很多客户,小刘把去年采购陕北红枣的数量x(单位:箱)在的客户称为“大客户”,并把他们去年采购的数量制成下表:
采购数
客户数 20 20 10 40 10
已知去年“大客户”们采购的陕北红枣数量占小刘去年总销售量的.
(1)根据表中的数据完善频率分布直方图,并估计采购数在150箱以下(含150箱)的“大客户”数;
(2)估算小刘去年总的销售量(同一组中的数据用该组区间的中点值为代表).
【解题思路】(1)根据已知条件补全频率分布直方图,并由此进行估计;
(2)先求得“大客户”采购总数,由此估计总销售量.
【解答过程】(1)作出频率分布直方图如图所示.
根据上图,可知采购量在150箱以下(含150箱)的“大客户”人数估计是
(人).
(2)去年“大客户”所采购的陕北红枣总数大约为(箱),
所以小刘去年总的销售量为(箱).
12.(23-24高一下·辽宁朝阳·开学考试)对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名学生,得到这M名学生参加社区服务的次数,根据此数据作出如下频率分布表和频率分布直方图.
分组 频数 频率
10 0.20
24 n
m p
2 0.04
合计 M 1
(1)求出表中M,p及图中a的值;
(2)若该校有高三学生300人,试估计该校高三学生参加社区服务的次数在区间内的人数;
(3)估计该校高三学生参加社区服务次数的众数、中位数及平均数.(保留一位小数)
【解题思路】(1)借助频数、频率与总数之间的关系计算即可得;
(2)以所得频率估计概率计算即可得;
(3)借助众数、中位数及平均数的定义计算即可得.
【解答过程】(1)由分组对应的频数是10,频率是0.20,知,所以,
所以,解得,所以,;
(2)估计该校高三学生参加社区服务的次数在区间内的人数为;
(3)估计该校高三学生参加社区服务次数的众数是.
因为,所以估计该校高三学生参加社区服务次数的中位数x满足:

解得,所以该校高三学生参加社区服务次数的中位数约为18.1,
由,
所以估计该校高三学生参加社区服务次数的平均数是18.3.
13.(23-24高二上·黑龙江哈尔滨·期中)某大学共有“机器人”兴趣团队1000个,大一、大二、大三、大四分别有100个、200个、300个、400个.为挑选优秀团队,现用按比例分配的分层随机抽样的方法,从以上团队中抽取20个.
(1)应从大三团队中抽取多少个团队?
(2)将20个团队分为甲、乙两组,每组10个团队,进行理论和实践操作考试(共150分),甲、乙两组的成绩如下:
甲:125,141,140,137,122,114,119,139,121,142
乙:127,116,144,127,144,116,140,140,116,140
从甲、乙两组中选一组强化训练,备战机器人大赛.分别计算两组成绩的平均数和方差,并分析应选择哪一组参赛,理由是什么?
【解题思路】
(1)由按比例分配的分层随机抽样的方法中,每层样本量与层的大小成比例可得;
(2)分别计算各组平均数与方差,分析数据选择即可.
【解答过程】(1)由题意知,大三团队个数占总团队个数的,
则应从大三中抽取 (个)团队.
(2)甲组成绩的平均数,
乙组成绩的平均数,
甲组数据的方差


乙组数据的方差

选甲组理由:甲、乙两组平均数相差不大,但,由此可以估计甲组比乙组成绩稳定;
选乙组理由:,在比赛中,估计获胜的可能性大.
14.(23-24高一上·江西九江·期末)某中学400名学生参加全市高中数学竞赛,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:,并整理得到如下频率分布直方图:
(1)由频率分布直方图求样本中分位数;
(2)已知样本中男生与女生的比例是 ,男生样本的均值为70,方差为10,女生样本的均值为80,方差为14,请计算样本的方差.
【解题思路】(1)根据频率,确定分位数,在区间上,设其为,然后按比例计算可得;
(2)先求出总样本的均值,再根据方差公式计算.
【解答过程】(1)根据频率分布直方图知分位数,在区间上,设其为,
则,解得,
所以样本中分位数是:.
(2)总样本的均值为,
设男生个体依次为,女生个体依次为,
则,,


总体样本方差为,其中
同理,
所以总样本的方差为,
故总样本的方差为.
15.(22-23高一下·宁夏·期末)某公司为了提高职工的健身意识,鼓励大家加入健步运动,要求200名职工每天晚上9:30上传手机计步截图,对于步数超过10000的予以奖励.图1为甲乙两名职工在某一星期内的运动步数统计图,图2为根据这星期内某一天全体职工的运动步数做出的频率分布直方图.

(1)请根据频率分布直方图,求m的值,并求出该天运动步数不少于15000步的人数;
(2)估计全体职工在该天运动步数的众数、平均数和中位数;
(3)如果当天甲的排名为第130名,乙的排名为第40名,试判断做出的是星期几的频率分布直方图.
【解题思路】(1)根据频率分布直方图中各组频率之和为1,即可求得m的值;结合频率、频数之间的关系即可求得该天运动步数不少于15000步的人数;
(2)根据频率分布直方图,依据众数、平均数和中位数的估计方法即可求得答案;
(3)计算甲乙排名的占比,结合频率分布直方图计算出甲乙两人的步数,与已知的甲乙两名职工在某一星期内的运动步数统计图比较,即得答案.
【解答过程】(1)由图可知,解得;
所以该天运动步数不少于15000的人数为(人);
(2)众数是(千步);
全体职工在该天的平均步数为:
(千步)
由于前两组频率之和为,前三组频率之和为,
故设中位数为x,则,
即中位数是:(千步)
(3)因为,,
假设甲的步数为千步,乙的步数为千步,
由频率分布直方图可得:
,解得(千步),
,解得(千步),
所以可得出是星期二的频率分布直方图.2023-2024学年高一数学9.2用样本估计总体(人教A版2019必修第二册)
·模块一 总体取值规律的估计
·模块二 总体百分位数的估计
·模块三 总体集中趋势与总体离散程度的估计
·模块四 课后作业
1.频率分布直方图
(1)频率分布表与频率分布直方图的意义
为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初
中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
有时,我们更关心各个小组的数据在样本容量中所占比例的大小,所以选择频率分布表和频率分布直方图来整理和表示数据.
(2)频率分布表与频率分布直方图的制作步骤
与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
第一步,求极差
极差为一组数据中最大值与最小值的差.
第二步,决定组距与组数
第三步,将数据分组
通常对组内数据取左闭右开区间,最后一组数据取闭区间.
第四步,列频率分布表
计算各小组的频率,作出频率分布表.
第五步,画频率分布直方图
画图时,以横轴表示分组,纵轴(小长方形的高度)表示.
2.其他几类常用统计图——条形图、折线图、扇形图
条形图 折线图 扇形图
特 点 一般地,条形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,条形图 用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化. 用整个圆表示总体,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
中每一长方形都是等宽的.
作用及选用情景 能清楚地表示每个项目的具体数量,便于相互比较大小. 能清楚地看出数量增减变化的情况及各部分数量的多少.常用来表示随时间变化的数据,当然,也可以用在其他合适的情形中. 可以形象地表示出各部分数据在全部数据中所占的比例情况.
图例
【考点1 绘制、补全频率分布直方图】
【例1.1】(23-24高一下·山西晋中·阶段练习)某制造商为运动会生产一批直径为40mm的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm,保留两位小数)如下:
40.02 40.00 39.98 40.00 39.99
40.00 39.98 40.01 39.98 39.99
40.00 39.99 39.95 40.01 40.02
39.98 40.00 39.99 40.00 39.96
(1)完成下面的频率分布表,并画出频率分布直方图;
分组 频数 频率
合计

(2)假定乒乓球的直径误差不超过0.02mm为合格品,若这批乒乓球的总数为10000只,试根据抽样检查结果估计这批产品的合格只数.
【例1.2】(22-23高一下·河北衡水·期末)杭州市某高中从学生中招收志愿者参加迎亚运专题活动,现已有高一540人、高二360人,高三180人报名参加志愿活动.根据活动安排,拟采用分层抽样的方法,从已报名的志愿者中抽取120名.对抽出的120名同学某天参加运动的时间进行了统计,运动时间均在39.5至99.5分钟之间,其频率分布直方图如下:

(1)需从高一、高二、高三报名的学生中各抽取多少人;
(2)请补全频率分布直方图.
【变式1.1】(22-23高一下·天津河东·期末)《天津日报》2022年11月24日报道,我市扎实推进实施深
入打好污染防治攻坚战“1+3+8”行动方案,生态环境质量持续稳定向好,特别是大气环境质量改善成效显著.记者从市生态环境局获悉,1至10月份,全市PM2.5平均浓度为34微克/立方米,同比改善8.1%,优良天数222天,同比增加3天,重污染天2天,同比减少4天,为10年来最好水平.小明所在的数学兴趣小组根据2022年8月天津市空气质量指数(AQI趋势图)进行数据统计,分析空气质量指数在不同范围内的天数占一个月天数的比例,步骤为“求极差”“决定组距与组数”“数据分组”“列频率分布表”“画频率分布直方图”,请完成上述步骤,绘制频率分布直方图(横轴为空气质量指数,纵轴保留两位有效数字).


【变式1.2】(22-23高二上·广东揭阳·期中)为了让学生了解环保知识,增强环保意识,某中学举行了一次环保知识竞赛,共有900名学生参加了这次竞赛.为了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请根据尚未完成的频率分布表和频数分布直方图,解答下列问题.
分组 频数 频率
4 0.08
0.16
0.20
16
合计 50 1.00
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频数分布直方图;
(3)若成绩在75.5~85.5分的学生获得二等奖,问获得二等奖的学生约为多少人?
【考点2 频率分布直方图的相关计算】
【例2.1】(23-24高三上·安徽亳州·期末)如图所示为某企业员工年龄(岁)的频率分布直方图,从左到右依次为第一组 第二组、……、第五组,若第五组的员工有80人,则第二组的员工人数为( )
A.140 B.240 C.280 D.320
【例2.2】(2023高三·全国·专题练习)某市为了解全市环境治理情况,对本市的200家中小型企业的污染情况进行了摸排,并把污染情况各类指标的得分综合折算成准分(最高为100分),统计并制成如图所示的直方图,则这次摸排中标准分不低于75分的企业数为( )
A.30 B.60 C.70 D.130
【变式2.1】(23-24高三上·天津南开·期末)某研究机构为了解某地年轻人的阅读情况,通过随机抽样调查了100位年轻人,对这些人每天的阅读时间(单位:分钟)进行统计,得到样本的频率分布直方图如图所示,则的值为( )
A.0.02 B.0.2 C.0.04 D.0.4
【变式2.2】(2023·四川自贡·二模)某乡镇为推动乡村经济发展,优化产业结构,逐步打造高品质的农业生产,在某试验区种植了某农作物.为了解该品种农作物长势,在实验区随机选取了100株该农作物苗,经测量,其高度(单位:cm)均在区间内,按照,,,,分成5
组,制成如图所示的频率分布直方图,记高度不低于16cm的为“优质苗”.则所选取的农作物样本苗中,“优质苗”株数为( )
A.20 B.40 C.60 D.88
【考点3 统计图的综合应用问题】
【例3.1】(2024·甘肃·一模)小李一周的总开支分布如图(1)所示,其中一周的食品开支如图(2)所示,则以下判断错误的是( )

A.小李这一周用于肉蛋奶的支出高于用于娱乐的支出
B.小李这一周用于食品中其他类的支出在总支出中是最少的
C.小李这一周用于主食的支出比用于通信的支出高
D.小李这一周用于主食和蔬菜的总支出比日常支出高
【例3.2】(23-24高三下·内蒙古锡林郭勒盟·开学考试)为了积极推进国家乡村振兴战略,某示范村不断自主创新,拓宽村民增收渠道,近年来取得了显著成效.据悉该村2023年经济总收入是2022年的2倍,为了更好地了解该村经济收入变化情况,统计了该村两年的经济收入构成比例,得到如图所示的条形图和饼图.则以下说法错误的是( )
A.2023年“种植收入”和2022年“种植收入”一样多
B.2023 年“养殖收入”与“第三产业收入”之和比2022年的全年总收入还多
C.2023年“外出务工收入”是2022年“外出务工收入”的
D.2023年“其他收入”比2022年“其他收入”的2倍还多
【变式3.1】(2023·河南·二模)某银行为客户定制了A,B,C,D,E共5个理财产品,并对5个理财产品的持有客户进行抽样调查,得出如下的统计图:

用该样本估计总体,以下四个说法错误的是( )
A.44~56周岁人群理财人数最多
B.18~30周岁人群理财总费用最少
C.B理财产品更受理财人青睐
D.年龄越大的年龄段的人均理财费用越高
【变式3.2】(2023·河南平顶山·模拟预测)年月某市星级酒店经营数据统计分析如下图(“同比”指与去年同期相比):
下列说法错误的是( )
A.整体来看,年月该市星级酒店平均房价相对上一年有所提高
B.年月该市星级酒店平均房价的平均数超过元
C.年月这个月中,该市星级酒店在月份的平均房价创下个月来的最高纪录
D.年月该市星级酒店平均房价约为元
1.总体百分位数的估计
(1)概念
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个
值,且至少有(100-p)%的数据大于或等于这个值.
(2)求解步骤
可以通过下面的步骤计算一组n个数据的第p百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p
百分位数为第i项与第(i+1)项数据的平均数.
【考点4 百分位数的求解】
【例4.1】(23-24高三下·贵州·阶段练习)某同学一学期七次模拟考试数学成绩(满分150分)依次为88,98,112,106,122,118,110,则这名同学七次数学成绩的分位数为(  )
A.110 B.112 C.115 D.118
【例4.2】(2024·福建厦门·二模)已知样本的平均数等于分位数,则满足条件的实数的个数是( )
A.0 B.1 C.2 D.3
【变式4.1】(2023·河南·模拟预测)为更好地满足民众个性化、多元化、便利化的消费需求,丰富购物体验和休闲业态,某市积极打造夜间经济.为不断创优夜间经济发展环境、推动消费升级,有关部门对某热门夜市开展“服务满意度调查”,随机选取了100 名顾客进行问卷调查,对夜市服务进行评分(满分100 分),根据评分情况绘制了如图所示的频率分布直方图,估计这组数据的第55 百分位数为( )

A.65 B.72 C.72.5 D.75
【变式4.2】(23-24高二上·四川成都·阶段练习)一组数据按从小到大排列为,若该组数据的第60百分位数是众数的倍,则这组数据的平均数是( )
A.4 B.5 C.6 D.7
1.总体集中趋势的估计
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度
刻画了一组数据的集中趋势.具体概念回顾如下:
名称 概念
平 均 数 如果有n个数x1,x2,…,xn,那么(x1+x2+…+xn)就是这组数据的平均数,用表示,即=(x1+x2+…+xn).
中 位 数 将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
众 数 一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称为这组数据的众数.
2.总体离散程度的估计
(1)方差和标准差
假设一组数据是,,,,用表示这组数据的平均数,则我们称为这组数据的
方差.有时为了计算方差的方便,我们还把方差写成的形式.
我们对方差开平方,取它的算数平方根,称为这组数据的标准差.
(2)总体(样本)方差和总体标准差
①一般式:如果总体中所有个体的变量值分别为,,,,总体平均数为,则总体方差=
.
②加权式:如果总体的N个变量值中,不同的值共有k(kN)个,不妨记为,,,,其中出
现的频数为(i=1,2,,k),则总体方差为=.
总体标准差:S=.
(3)标准差与方差的统计意义
①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.
③标准差(方差)的取值范围为[0,+).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则
标准差为0.反之,标准差为0的样本,其中的数据都相等.
3.频率分布直方图中的统计参数
(1)频率分布直方图中的“众数”
根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数.一般用
中点近似代替.
(2)频率分布直方图中的“中位数”
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.
因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
(3)频率分布直方图中的“平均数”
平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分
布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
【考点5 众数、中位数、平均数的求解及应用】
【例5.1】(23-24高二上·浙江杭州·期中)某校素质运动会上,个男生的引体向上个数依次为,设这组数据的平均数为,中位数为,众数为,则( )
A. B. C. D.
【例5.2】(23-24高二下·湖南长沙·开学考试)某中学高二1班共有50名同学,其中男生30名,女生20名,采用按比例分层随机抽样方法,从全班学生中抽取20人测量其身高(单位:).已知在抽取的样本中,男生的平均身高为,女生的平均身高为,由此估计该班全体学生的平均身高约为( )
A. B. C. D.
【变式5.1】(23-24高一上·河南南阳·期末)已知个数据的中位数是,则下列说法正确的是( )
A.这个数据中一定有且仅有个数小于或等于
B.把这个数据从小到大排列后,是第个数据
C.把这个数据从小到大排列后,是第个和第51个数据的平均数
D.把这个数据从小到大排列后,是第个和第个数据的平均数
【变式5.2】(23-24高一下·全国·课后作业)若某同学连续次考试的名次(次考试均没有出现并列名次的情况)不低于第名,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续次考试名次的数据,推断一定是尖子生的是( )
A.甲同学:平均数为,方差小于
B.乙同学:平均数为,众数为
C.丙同学:中位数为,众数为
D.丁同学:众数为,方差大于
【考点6 方差、标准差的求解及应用】
【例6.1】(23-24高二上·四川成都·期中)为庆祝中国共产主义青年团成立100周年,某校甲、乙两个班共70人(甲班40人,乙班30人)参加了共产主义青年团知识竞赛,甲班的平均成绩为77分,方差为123,乙班的平均成绩为70分,方差为130,则甲、乙两班全部同学的成绩的方差为( )
A.74 B.129 C.136 D.138
【例6.2】(22-23高一·全国·单元测试)设有n个样本,,…,,其标准差是,另有n个样本,,…,,且,其标准差为,则下列关系中正确的是( )
A. B.
C. D.
【变式6.1】(2024·全国·模拟预测)已知总体划分为3层,通过分层随机抽样,各层抽取的样本容量分别为,,,样本平均数分别为,,,样本方差分别为,,,若,则( )
A.
B.
C.总体样本平均数
D.当时,总体方差
【变式6.2】(2023·山西太原·一模)现有甲 乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为3,方差为5,乙组数据满足如下条件时,若将这两组数据混合成一组,则关于新的一组数据说法错误的是( )
A.若乙组数据的平均数为3,则新的一组数据平均数为3
B.若乙组数据的方差为5,则新的一组数据方差为5
C.若乙组数据的平均数为3,方差为5,则新的一组数据方差为5
D.若乙组数据的平均数为5,方差为3,则新的一组数据方差为5
【考点7 频率分布直方图中集中趋势参数的计算】
【例7.1】(2024·全国·模拟预测)中央广播电视总台《2024年春节联欢晚会》以“龙行龘龘,欣欣家国”为主题,创新“思想艺术技术”融合传播,与全球华人相约除夕,共享一台精彩纷呈、情真意切、热气腾腾的文化盛宴.2023年12月2日,中央广播电视总台发布了甲辰龙年春晚的主标识——龘.为了解大家对这一标识的看法,某网站进行了一次网络调研,并将参与调查的网友对这一标识的打分情况(分数在50分到100分之间)绘制成频率分布直方图如下:

(1)求网友打分的平均值(同一组中的数据用该组区间的中点值代替)、中位数(保留一位小数);
(2)设网友打分的平均值为,若按打分是否在区间内进行分层抽样,抽取10人进行深度调研,打分在区间内的至少抽取8人,试估计的最小值(保留两位小数).
【例7.2】(2024·内蒙古呼和浩特·一模)为了解甲、乙两种农药在某种绿植表面的残留程度,进行如下试验:将100株同种绿植随机分成两组,每组50株,其中组绿植喷甲农药,组绿植喷乙农药,每株绿植所喷的农药体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在绿植表面的百分比,根据试验数据分别得到如图直方图:
记为事件:“乙农药残留在表面的百分比不低于5.5”,根据直方图得到的估计值为0.70.
(1)求乙农药残留百分比直方图中的值;
(2)估计甲农药残留百分比的平均数(同一组中的数据用该组区间的中点值为代表);
(3)估计乙农药残留百分比的中位数.(保留2位小数)
【变式7.1】(23-24高一上·安徽蚌埠·期末)自2022年动工至今,我市的“靓淮河”工程已初具规模.该工程以“一川清 两滩靓 三脉通 十景红”为总体布局,以生态修复与保护为核心理念,最终将促进城市防洪 交通 航运 生态 观光 商业等多种业态协同融合发展.为调查我市居民对“靓淮河”工程的满意程度,随机抽取了200位市民,现拟统计参与调查的市民年龄层次,将这200人按年龄(岁)分为5组,依次为,并得到频率分布直方图如下.

(1)求实数的值;
(2)估计这200人年龄的样本平均数(同一组数据用该区间的中点值作代表);
(3)估计这200人年龄的中位数(精确到小数点后1位).
【变式7.2】(23-24高一上·河南·期末)某调研小组调查了某市1000名外卖骑手平均每天完成的任务量(简称“单量”),得到如下的频数分布表:
单量/单
人数 100 120 130 180 220 150 60 30 10
(1)补全该市1000名外卖骑手每天单量的频率分布直方图;
(2)根据图表数据,试求样本数据的中位数(精确到0.1);
(3)根据外卖骑手的每天单量,参考某平台的类别将外卖骑手分成三类,调查获知不同类别的外卖骑手开展工作所投入的装备成本不尽相同,如下表:
日单量/单
类別 普通骑手 精英骑手 王牌骑手
装备价格/元 2500 4000 4800
根据以上数据,估计该市外卖骑手购买装备的平均成本.
【考点8 其他统计图表中反映的集中趋势与离散程度】
【例8.1】(22-23高一下·吉林长春·期末)近年来,“直播带货”受到越来越多人的喜爱.目前已经成为推动消费的一种流行的营销形式.对某直播平台的直播商家进行调查统计,发现所售商品多为小吃、衣帽、生鲜、玩具、饰品类等,各类直播商家所占比例如图①所示.

(1)该直播平台为了更好地服务买卖双方,打算随机抽取80个直播商家进行问询交流.如果按照比例分配分层抽样的方式抽取,则应抽取小吃类、玩具类商家各多少家?
(2)在问询了解直播商家的利润状况时,工作人员对抽取的80个商家的平均日利润进行了统计(单位:元),所得频率分布直方图如图②所示.请根据频率分布直方图,求出图中a的值,并估计该直播平台商家日利润的平均数(求平均数时同一组中的数据用该组区间的中点值作代表).
【例8.2】(23-24高二上·四川成都·期末)为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两
厂随机选取了 10个轮胎,将每个轮胎的宽度(单位:mm) 记录下来并绘制出折线图:
(1)分别计算甲、 乙两厂提供10个轮胎宽度的平均值;
(2)轮胎的宽度在[193,195]内,则称这个轮胎是标准轮胎,试比较甲、 乙两厂分别提供的 10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好.
【变式8.1】(23-24高一上·重庆江北·阶段练习)2023年以来,某区把垃圾分类纳入积分,建立文明账户,市民以行动换积分,以积分转习惯.区政府为了了解4月份甲、乙两个社区居民垃圾换积分的情况,分别从甲、乙两个社区各抽取10人,记录下他们的积分(单位:分),并进行整理和分析(积分用x表示,共分为4组:;,,),下面给出了部分信息:
甲社区10人的积分:47,56,68,71,83,83,85,90,91,94;
乙社区10人的积分在C组中的积分分数为:81,83,84,84;
两组数据的平均数,中位数,众数如下表所示:
社区 平均数 中位数 众数
甲 76.8 83 b
乙 76.8 a 84
乙社区积分等级扇形图

根据以上信息,解答下列问题:
(1)填空:______,______,______;
(2)根据以上数据,你认为哪个社区在此次垃圾分类换积分活动中表现更好,请说明理由(一条即可);
(3)若4月份甲社区有700人参与活动,乙社区有800人参与活动,请估计4月份甲、乙两个社区积分在80分以上(包括80分)的一共有多少人?
【变式8.2】(22-23高一下·广东东莞·期末)树人中学男女学生比例约为,某数学兴趣社团为了解该校学生课外体育锻炼情况(锻炼时间长短(单位:小时),采用样本量比例分配的分层抽样,抽取男生人,女生人进行调查.记男生样本为,,,,样本平均数、方差分别为、;女生样本为,,,,样本平均数、方差分别为、;总样本平均数、方差分别为、.

(1)证明:;
(2)该兴趣社团通过分析给出以下两个统计图,假设两个统计图中每个组内的数据均匀分布,根据两图信息分别估计男生样本、女生样本的平均数;
(3)已知男生样本方差,女生样本方差,请结合(2)问的结果计算总样本方差的估计值.
1.(2023·天津河西·三模)学校组织班级知识竞赛,某班的12名学生的成绩(单位:分)分别是:58、67、73、74、76、82、82、87、90、92、93、98,则这12名学生成绩的第三四分位数是( )
A.88分 B.89分 C.90分 D.91分
2.(22-23高一上·北京怀柔·期末)某直播间从参与购物的人群中随机选出 200 人,并将这200人按年龄分组,得到的频率分布直方图如图所示,则在这200人中年龄在的人数及直方图中值是( )
A., B.,
C., D.,
3.(2024·陕西西安·模拟预测)一组数据为,下列说法正确的个数是( )
①这些数据的众数是6
②这些数据的中位数是
③这些数据的平均数是7
④这些数据的标准差是
A.1 B.2 C.3 D.4
4.(2024·贵州·三模)在某学校的期中考试中,高一 高二 高三年级的参考人数分别为.现用分层抽样的方法从三个年级中抽取样本,经计算得高一 高二 高三年级数学成绩的样本平均数分别为,则全校学生数学成绩的总样本平均数为( )
A.92 B.91 C.90 D.89
5.(2023·天津北辰·三模)少年强则国强,少年智则国智.党和政府一直重视青少年的健康成长,出台了
一系列政策和行动计划,提高学生身体素质.为了加强对学生的营养健康监测,某校在3000名学生中,抽查了100名学生的体重数据情况.根据所得数据绘制样本的频率分布直方图如图所示,则下列结论正确的是( )
A.样本的众数为65 B.样本的第80百分位数为72.5
C.样本的平均值为67.5 D.该校学生中低于的学生大约为1000人
6.(2024·全国·模拟预测)空气质量指数是反映空气质量状况的指数,其对应关系如下表:
指数值
空气质量 优 良 轻度污染 中度污染 重度污染 严重污染
为监测某化工厂排放废气对周边空气质量指数的影响,某科学兴趣小组在校内测得10月1日—20日指数的数据并绘成折线图如下:
下列叙述正确的是( )
A.这天中指数值的中位数略大于
B.这天中的空气质量为优的天数占
C.10月4日到10月11日,空气质量越来越好
D.总体来说,10月中旬的空气质量比上旬的空气质量好
7.(2023·陕西商洛·模拟预测)自1950年以来,每年于4月7日庆祝世界卫生日,旨在引起世界各国人民
对卫生 健康工作的关注,提高人们对卫生领域的素质和认识,强调健康对于劳动创造和幸福生活的重要性.为了让大家了解更多的健康知识,某中学组织三个年级的学生进行日常卫生知识竞赛,经统计,得到前200名学生分布的饼状图(如图1)和前200名学生中高一学生排名分布的频率条形图(如图2),则下列说法错误的是( )

A.成绩在前200名的学生中,高一人数比高二人数多30
B.成绩在第1~50名的学生中,高三最多有32人
C.高一学生成绩在第101~150名的人数一定比高三学生成绩在第1~50名的人数多
D.成绩在第51~100名的学生中,高二人数比高一人数多
8.(2024·全国·模拟预测)已知图1为2014-2022年中国游戏用户规模(单位:百万人)及其同比增长率的统计图,图2为2010-2022年中国国产游戏获批版号数量(单位:个)的统计图,则下列结论正确的是( )
A.2014-2022年中国游戏用户规模逐年增长
B.2014-2022年中国游戏用户规模同比增长率的中位数为
C.2010-2022年中国国产游戏获批版号数量的极差是223
D.2010-2022年中国国产游戏获批版号数量的平均数超过1500
9.(23-24高二上·浙江舟山·期末)已知数据的平均数为,标准差为,中位数为,极差为
.由这组数据得到新数据,其中,则下列命题中错误的是( )
A.新数据的平均数是 B.新数据的标准差是
C.新数据的中位数是 D.新数据的极差是
10.(23-24高三·云南昆明·阶段练习)根据气象学上的标准,连续5天的日平均气温低于即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:
①平均数;
②平均数且极差小于或等于3;
③平均数且标准差;
④众数等于5且极差小于或等于4.
则4组样本中一定符合入冬指标的共有( )
A.1组 B.2组 C.3组 D.4组
11.(22-23高二下·陕西榆林·期中)小刘从事陕北红枣批发多年,有很多客户,小刘把去年采购陕北红枣的数量x(单位:箱)在的客户称为“大客户”,并把他们去年采购的数量制成下表:
采购数
客户数 20 20 10 40 10
已知去年“大客户”们采购的陕北红枣数量占小刘去年总销售量的.
(1)根据表中的数据完善频率分布直方图,并估计采购数在150箱以下(含150箱)的“大客户”数;
(2)估算小刘去年总的销售量(同一组中的数据用该组区间的中点值为代表).
12.(23-24高一下·辽宁朝阳·开学考试)对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名学生,得到这M名学生参加社区服务的次数,根据此数据作出如下频率分布表和频率分布直方图.
分组 频数 频率
10 0.20
24 n
m p
2 0.04
合计 M 1
(1)求出表中M,p及图中a的值;
(2)若该校有高三学生300人,试估计该校高三学生参加社区服务的次数在区间内的人数;
(3)估计该校高三学生参加社区服务次数的众数、中位数及平均数.(保留一位小数)
13.(23-24高二上·黑龙江哈尔滨·期中)某大学共有“机器人”兴趣团队1000个,大一、大二、大三、大四分别有100个、200个、300个、400个.为挑选优秀团队,现用按比例分配的分层随机抽样的方法,从以上团队中抽取20个.
(1)应从大三团队中抽取多少个团队?
(2)将20个团队分为甲、乙两组,每组10个团队,进行理论和实践操作考试(共150分),甲、乙两组的成绩如下:
甲:125,141,140,137,122,114,119,139,121,142
乙:127,116,144,127,144,116,140,140,116,140
从甲、乙两组中选一组强化训练,备战机器人大赛.分别计算两组成绩的平均数和方差,并分析应选择哪一组参赛,理由是什么?
14.(23-24高一上·江西九江·期末)某中学400名学生参加全市高中数学竞赛,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:,并整理得到如下频率分布直方图:
(1)由频率分布直方图求样本中分位数;
(2)已知样本中男生与女生的比例是 ,男生样本的均值为70,方差为10,女生样本的均值为80,方差为14,请计算样本的方差.
15.(22-23高一下·宁夏·期末)某公司为了提高职工的健身意识,鼓励大家加入健步运动,要求200名职工每天晚上9:30上传手机计步截图,对于步数超过10000的予以奖励.图1为甲乙两名职工在某一星期内的运动步数统计图,图2为根据这星期内某一天全体职工的运动步数做出的频率分布直方图.

(1)请根据频率分布直方图,求m的值,并求出该天运动步数不少于15000步的人数;
(2)估计全体职工在该天运动步数的众数、平均数和中位数;
(3)如果当天甲的排名为第130名,乙的排名为第40名,试判断做出的是星期几的频率分布直方图.