2025年高考数学复习核心考点(新高考专用)专题9.2用样本估计总体【六大题型】(学生版+教师版)

文档属性

名称 2025年高考数学复习核心考点(新高考专用)专题9.2用样本估计总体【六大题型】(学生版+教师版)
格式 zip
文件大小 4.4MB
资源类型 试卷
版本资源 通用版
科目 数学
更新时间 2025-02-25 12:30:00

文档简介

专题9.2 用样本估计总体【六大题型】
【新高考专用】
【题型1 百分位数的求解】 3
【题型2 样本的数字特征的估计】 4
【题型3 总体集中趋势的估计】 6
【题型4 总体离散程度的估计】 9
【题型5 分层方差问题】 13
【题型6 其他统计图表中反映的集中趋势与离散程度】 15
1、用样本估计总体
考点要求 真题统计 考情分析
(1)会用统计图表对总体进行估计,会求n个数据的第p百分位数 (2)能用数字特征估计总体集中趋势和总体离散程度 2022年全国甲卷(文数):第2题,5分 2023年新高考I卷:第9题,5分 2023年全国乙卷(文数、理数):第17题,10分 从近几年的高考情况来看,高考对用样本估计总体的考查比较稳定,多以选择题、填空题的形式出现,考查百分位数、平均数、中位数、众数、方差等知识,难度不大;在解答题中出现时,一般会与其他知识结合考查,综合性强,需要灵活求解.
【知识点1 用样本估计总体】
1.总体百分位数的估计
(1)概念
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个
值,且至少有(100-p)%的数据大于或等于这个值.
(2)求解步骤
可以通过下面的步骤计算一组n个数据的第p百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p
百分位数为第i项与第(i+1)项数据的平均数.
2.频率分布直方图的数字特征
(1)众数:众数一般用频率分布表中频率最高的一组的组中值来表示,即在样本数据的频率分布直方图
中,最高小长方形的底边中点的横坐标;
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;
(3)平均数:平均数在频率分布表中等于组中值与对应频率之积的和.
3.总体集中趋势的估计
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度
刻画了一组数据的集中趋势.具体概念回顾如下:
名称 概念
平 均 数 如果有n个数x1,x2,…,xn,那么(x1+x2+…+xn)就是这组数据的平均数,用表示,即=(x1+x2+…+xn).
中 位 数 将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
众 数 一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称为这组数据的众数.
4.总体离散程度的估计
(1)方差和标准差
假设一组数据是,,,,用表示这组数据的平均数,则我们称为这组数据的
方差.有时为了计算方差的方便,我们还把方差写成的形式.
我们对方差开平方,取它的算数平方根,称为这组数据的标准差.
(2)总体(样本)方差和总体标准差
①一般式:如果总体中所有个体的变量值分别为,,,,总体平均数为,则总体方差=
.
②加权式:如果总体的N个变量值中,不同的值共有k(kN)个,不妨记为,,,,其中出
现的频数为(i=1,2,,k),则总体方差为=.
总体标准差:S=.
(3)标准差与方差的统计意义
①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.
③标准差(方差)的取值范围为[0,+).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则
标准差为0.反之,标准差为0的样本,其中的数据都相等.
5.频率分布直方图中的统计参数
(1)频率分布直方图中的“众数”
根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数.一般用
中点近似代替.
(2)频率分布直方图中的“中位数”
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.
因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
(3)频率分布直方图中的“平均数”
平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分
布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
【方法技巧与总结】
1.若x1,x2,…,xn的平均数为,那么的平均数为.
2.数据x1,x2,…,xn与数据的方差相等,即数据经过平移后方差不变.
3.若x1,x2,…,xn的方差为s2,那么的方差为a2s2.
【题型1 百分位数的求解】
【例1】(2024·安徽六安·模拟预测)样本数据16,20,24,21,22,18,14,28的分位数为( )
A.16 B.17 C.23 D.24
【解题思路】根据已知条件,结合百分位数的定义,即可求解.
【解答过程】解:样本数据由小到大排列为,共8个数据,
,所以分位数为.
故选:C.
【变式1-1】(2024·河南郑州·模拟预测)已知某学校参加学科节数学竞赛决赛的8人的成绩(单位:分)为:72,78,80,81,83,86,88,90,则这组数据的第75百分位数是( )
A.86 B.87 C.88 D.90
【解题思路】根据样本数据百分位数的定义求解即可.
【解答过程】将数据从小到大排序得,
因为,
所以第75百分位数是.
故选:B.
【变式1-2】(2024·黑龙江大庆·三模)小明希望自己的高考数学成绩能超过120分,为了激励自己,他记录了近8次数学考试成绩,并绘制成折线统计图,如图,这8次成绩的第80百分位数是( )
A.100 B.105 C.110 D.120
【解题思路】根据百分位数定义求解即可.
【解答过程】因为,由图可知8次成绩由小到大排序,
第7个位置的数是110,所以这8次成绩的第80百分位数是110.
故选:C.
【变式1-3】(2024·福建泉州·一模)海上丝绸之路的起点城市一泉州,有着丰厚的文化底蕴,作为国家级非遗的蟳埔女簪花围习俗,是福建博大精深的海洋文化“百花园”中的一朵香花.某机构随机调查了18位“簪花围”体验者对这一活动的满意度评分情况,得到如下数据:a,60,70,70,71,73,74,74,75,76,77,79,80,83,85,87,93,100.若a恰好是这组数据的下四分位数,则a的值不可能为( )
A.71 B.72 C.73 D.74
【解题思路】首先可得这组数据的下四分位数为从小到大排列的第个数,即可得到的取值范围,即可判断.
【解答过程】因为,所以这组数据的下四分位数为从小到大排列的第个数,
依题意可得,所以不可能为.
故选:D.
【题型2 样本的数字特征的估计】
【例2】(2024·浙江绍兴·三模)已知实数,若,且这四个数的中位数是3,则这四个数的平均数是( )
A. B.3 C. D.4
【解题思路】借助中位数与平均数定义结合题目所给条件计算即可得.
【解答过程】由题意可得,即,
则.
故选:D.
【变式2-1】(2024·全国·模拟预测)一组数据12,12,13,14,15,16,17的中位数是( )
A.14 B.15 C.16 D.17
【解题思路】由中位数的定义求解.
【解答过程】一组数据从小到大排列为:,
它的中位数为:14,
故选:A.
【变式2-2】(2024·江苏·模拟预测)已知甲、乙两支篮球队各6名队员某场比赛的得分数据(单位:分)从小到大排列如下:甲队:;乙队:.这两组数据的中位数相等,且平均值也相等,则的值为( )
A.3 B.4 C.5 D.6
【解题思路】利用中位数与平均数的求法计算即可.
【解答过程】由得分数据知:甲乙两队的中位数为;
甲乙两队的总得分相等,
为,
所以.
故选:A.
【变式2-3】(2024·重庆·模拟预测)2023年10月4日,在杭州亚运会跳水男子10米台决赛中,中国选手杨昊夺得金牌.中国跳水队包揽杭州亚运会跳水项目全部10枚金牌.跳水比赛的评分规则如下,7位裁判同时给分,去掉两个最高分,去掉两个最低分,剩下的3个分数求和再乘以难度系数,就是该选手本轮的得分,下表就是杨昊比赛中的第一轮得分表,则( )
1号 裁判 2号 裁判 3号 裁判 4号 裁判 5号 裁判 6号 裁判 7号 裁判 难度 系数 本轮 得分
a 9.5 9.0 10.0 9.5 10.0 10.0 3.2 92.80
A.这7个数据的众数只能是10.0
B.这7个数据的中位数只能是9.0
C.a可能是10.0
D.a可能是9.5
【解题思路】根据评分规则,结合众数、中位数的定义进行求解即可.
【解答过程】当时,由题意可知:,符合题意,此时众数为10或(此时),中位数为9.5,因此选项AB不正确,D正确;
当时,由题意可知:,舍去,因此选项C不正确,
故选:D.
【题型3 总体集中趋势的估计】
【例3】(2024·四川宜宾·模拟预测)为了加深师生对党史的了解,激发广大师生知史爱党 知史爱国的热情,某校举办了“学党史 育新人”的党史知识竞赛,并将1000名师生的竞赛成绩(满分100分,成绩取整数)整理成如图所示的频率分布直方图,则下列说法错误的是( )
A.的值为0.005
B.估计这组数据的众数为75分
C.估计成绩低于60分的有250人
D.估计这组数据的中位数为分
【解题思路】对A,根据频率和为1求解即可;对B,根据频率分布直方图的众数判断即可;对C,计算成绩低于60分的频率,进而可得人数;对D,根据成绩低于中位数的频率为0.5计算即可.
【解答过程】对A,由题意,,解得,故A正确;
对B,由直方图可得估计这组数据的众数为分,故B正确;
对C,由直方图可得成绩低于60分的频率为,故估计成绩低于60分的有人,故C正确;
对D,由A可得区间的频率分别为,
因为,,故中位数位于内.
设中位数为,则,解得,故D错误.
故选:D.
【变式3-1】(2024·陕西西安·二模)某教育机构为调查中小学生每日完成作业的时间,收集了某位学生100天每天完成作业的时间,并绘制了如图所示的频率分布直方图(每个区间均为左闭右开),根据此直方图得出了下列结论,其中正确的是( )
A.估计该学生每日完成作业的时间在2小时至2.5小时的有50天
B.估计该学生每日完成作业时间超过3小时的概率为0.3
C.估计该学生每日完成作业时间的平均数为2.75小时
D.估计该学生每日完成作业时间的中位数与平均数相等
【解题思路】直接根据直方图来计算判断每一个选项.
【解答过程】对于A:估计该学生每日完成作业的时间在2小时至2.5小时的有天,A错误;
对于B:估计该学生每日完成作业时间超过3小时的概率为,B错误;
对于C: ,C正确;
对于D:估计该学生每日完成作业时间的中位数为,
则,解得,D错误.
故选:C.
【变式3-2】(2024·四川德阳·二模)某中学为了解大数据提供的个性化作业质量情况,随机访问名学生,并对这名学生的个性化作业进行评分(满分:100分),根据得分将他们的成绩分成,,六组,制成如图所示的频率分布直方图,其中成绩在的学生人数为30人.
(1)求的值;
(2)估计这名学生成绩的平均数(同一组数据用该组数据的中点值代替)和中位数.
【解题思路】(1)根据题意,由频率分布直方图的性质,代入计算,即可得到结果;
(2)根据题意,结合平均数与中位数的计算公式代入计算,即可得到结果.
【解答过程】(1)由题意可得,,

解得.
(2)平均数为.
因为,
所以中位数在之间,设中位数为,
则,解得.
【变式3-3】(2024·内蒙古呼和浩特·一模)为了解甲、乙两种农药在某种绿植表面的残留程度,进行如下试验:将100株同种绿植随机分成两组,每组50株,其中组绿植喷甲农药,组绿植喷乙农药,每株绿植所喷的农药体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在绿植表面的百分比,根据试验数据分别得到如图直方图:
记为事件:“乙农药残留在表面的百分比不低于5.5”,根据直方图得到的估计值为0.70.
(1)求乙农药残留百分比直方图中的值;
(2)估计甲农药残留百分比的平均数(同一组中的数据用该组区间的中点值为代表);
(3)估计乙农药残留百分比的中位数.(保留2位小数)
【解题思路】(1)由的估计值为0.70,可得,求得值,再由整体频率为即可求得;
(2)根据平均数的定义,取组区间的中点值进行计算即可得解;
(3)中位数在使得直方图面积为处取得,经计算即可得解.
【解答过程】(1)为事件:“乙农药残留在表面的百分比不低于5.5”,
根据直方图得到的估计值为0.70.
则由频率分布直方图得:,解得,
所以乙农药残留在表面的百分比直方图中.
(2)估计甲农药残留百分比的平均数为:

(3)设乙农药残留百分比的中位数为,则
,解得,
所以估计乙农药残留百分比的中位数约为.
【题型4 总体离散程度的估计】
【例4】(2024·陕西商洛·模拟预测)设一组样本数据的平均值是1,且的平均值是3,则数据的方差是( )
A.1 B.2 C.3 D.4
【解题思路】根据已知条件结合方差公式直接求解即可.
【解答过程】由题意得,
所以数据的方差
.
故选:B.
【变式4-1】(2024·陕西榆林·三模)在一次数学模考中,从甲 乙两个班各自抽出10个人的成绩,甲班的十个人成绩分别为,乙班的十个人成绩分别为.假设这两组数据中位数相同 方差也相同,则把这20个数据合并后( )
A.中位数一定不变,方差可能变大
B.中位数可能改变,方差可能变大
C.中位数一定不变,方差可能变小
D.中位数可能改变,方差可能变小
【解题思路】不妨设,表达出两组数据的中位数,根据中位数相同得到或,则合并后的数据中位数是或者,中位数不变,再设第一组数据的方差为,平均数为,第二组数据的方差为,平均数为,根据公式得到合并后平均数为,方差为,,得到结论.
【解答过程】不妨设,
则的中位数为,的中位数为,
因为,所以或,
则合并后的数据中位数是或者,所以中位数不变.
设第一组数据的方差为,平均数为,第二组数据的方差为,平均数为,
合并后总数为20,平均数为,方差为,
如果均值相同则方差不变,如果均值不同则方差变大.
故选:A.
【变式4-2】(2024·宁夏银川·一模)滨海盐碱地是我国盐碱地的主要类型之一,如何利用更有效的方法改造这些宝贵的土地资源,成为摆在我们面前的世界级难题.对盐碱的治理方法,研究人员在长期的实践中获得了两种成本差异不大,且能降低滨海盐碱地30-60cm土壤层可溶性盐含量的技术,为了对比两种技术治理盐碱的效果,科研人员在同一区域采集了12个土壤样本,平均分成两组,测得组土壤可溶性盐含量数据样本平均数,方差,B组土壤可溶性盐含量数据样本平均数,方差.用技术1对组土壤进行可溶性盐改良试验,用技术2对组土壤进行可溶性盐改良试验,分别获得改良后土壤可溶性盐含量数据如下:
组 0.66 0.68 0.69 0.71 0.72 0.74
组 0.46 0.48 0.49 0.49 0.51 0.51
改良后组、组土壤可溶性盐含量数据样本平均数分别为和,样本方差分别记为和
(1)求;
(2)应用技术1与技术2土壤可溶性盐改良试验后,土壤可溶性盐含量是否有显著降低?(若,则认为技术能显著降低土壤可溶性盐含量,否则不认为有显著降低).
【解题思路】(1)借助平均数与方差公式计算即可得;
(2)计算出、、与即可得.
【解答过程】(1), ,
, .
(2)当时,,,


应用技术1后,土壤可溶性盐含量没有显著降低,
当时,,,


应用技术2后,土壤可溶性盐含量显著降低.
【变式4-3】(2024·陕西西安·一模)近年来“天宫课堂”受到广大中小学生欢迎,激发了同学们对科学知识的探索欲望和对我国航天事业成就的自豪.为领悟航天精神,感受中国梦想,某校组织了一次“寻梦天宫”航天知识竞赛(满分100分),各年级学生踊跃参加.校团委为了比较高一、高二学生这次竞赛的成绩,从两个年级的答卷中各随机选取了50份,将成绩进行统计得到以下频数分布表:
成绩
高一学生人数 15 5 15 15
高二学生人数 10 10 20 10
试利用样本估计总体的思想,解决下列问题:
(1)从平均数与方差的角度分析哪个年级学生这次竞赛成绩更好(同一组中的数据用该组区间的中点值为代表)?
(2)校后勤部决定对参与这次竞赛的学生给予一定的奖励,奖励方案有以下两种:
方案一:记学生得分为,当时,奖励该学生10元食堂代金券;当时,奖励该学生25元食堂代金券;当时,奖励该学生35元食堂代金券;
方案二:得分低于样本中位数的每位学生奖励10元食堂代金券;得分不低于中位数的每位学生奖励30元食堂代金券.
若高一年级组长希望本年级学生获得多于高二年级的奖励,则他应该选择哪种方案?
【解题思路】(1)分别运用数据的平均数和方差公式计算,得出平均数相同,高一年级成绩的方差低于高二年级,故得结论;
(2)分别按照方案一和方案二计算两个年级获得奖励额,进行比较后确定方案二.
【解答过程】(1)设高一年级学生竞赛成绩的平均数为,方差为.高二年级学生竞赛成绩的平均数为,方差为.
则,

因 ,故高一年级学生这次竞赛成绩比较稳定集中,成绩更好;
(2)按照方案一,高一年级学生获得奖励为:元,
而高二年级学生获得奖励为:元,
即按照方案一,高一年级获得奖励少于高二;
按照方案二,依题意,所抽取的100名参加竞赛学生的成绩中位数为,
则样本中,高一年级学生成绩低于中位数的人数约为人,则高一年级获得奖励为:元;
高二年级学生成绩低于中位数的人数约为人,则高二年级获得奖励为:元.
因,即按照方案二,高一年级获得奖励多于高二.
故若高一年级组长希望本年级学生获得多于高二年级的奖励,则他应该选择方案二.
【题型5 分层方差问题】
【例5】(2024·云南·模拟预测)某学校高三年级男生共有个,女生共有个,为调查该年级学生的年龄情况,通过分层抽样,得到男生和女生样本数据的平均数和方差分别为和,已知,则该校高三年级全体学生年龄的方差为( )
A. B.
C. D.
【解题思路】结合分层随机抽样的方差公式可得答案
【解答过程】学校高三年级男生共有个,所占比例为,女生个,所占比例为,
故该校高三年级全体学生的年龄方差为:,
当时,,,
故选:C.
【变式5-1】(2024·浙江·三模)在对某校高三学生体质健康状况某个项目的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生80人,女生120人,其方差分别为15,10,由此估计样本的方差不可能为( )
A.11 B.13 C.15 D.17
【解题思路】根据题意,设男生体质健康状况的平均数为,女生的平均数为,总体的平均数为,方差为,结合方差的公式,分析选项,即可求解.
【解答过程】设男生体质健康状况的平均数为,女生的平均数为,总体的平均数为,方差为,
则,

结合选项,可得A项不符合.
故选:A.
【变式5-2】(2024·辽宁葫芦岛·二模)某地为了了解学生的睡眠时间,根据初中和高中学生的人数比例采用分层抽样,抽取了40名初中生和20名高中生,调查发现初中生每天的平均睡眠时间为8小时,方差为2,高中生每天的平均睡眠时间为7小时,方差为1.根据调查数据,估计该地区中学生睡眠时间的总体方差约为( )
A. B. C. D.
【解题思路】根据给定条件,求出该地区中学生每天睡眠时间的平均数,再利用分层抽样方差的计算方法求得结果.
【解答过程】该地区中学生每天睡眠时间的平均数为:(小时),
该地区中学生每天睡眠时间的方差为:.
故选:D.
【变式5-3】(2024·全国·模拟预测)已知总体划分为3层,通过分层随机抽样,各层抽取的样本容量分别为,,,样本平均数分别为,,,样本方差分别为,,,若,则( )
A.
B.
C.总体样本平均数
D.当时,总体方差
【解题思路】根据样本平均数以及方差的定义,即可判断A、B项;计算可判断C;根据分层抽样,总体方差的求解,计算即可得出D.
【解答过程】对于A、B项,由于样本容量与样本平均数、样本方差之间并不是成某种比例关系,所以选项A,B错误;
对于C项,设,
则总体样本平均数 ,所以选项C错误;
对于D项,当时,总体样本平均数,
所以总体方差 ,所以选项D正确.
故选:D.
【题型6 其他统计图表中反映的集中趋势与离散程度】
【例6】(23-24高一下·河南信阳·期中)树人中学男女学生比例约为,某数学兴趣社团为了解该校学生课外体育锻炼情况(锻炼时间长短(单位:小时)),采用样本量比例分配的分层抽样,抽取男生人,女生人进行调查.记男生样本为,样本平均数、方差分别为;女生样本为,样本平均数、方差分别为;总样本平均数、方差分别为.
(1)该兴趣社团通过分析给出以上两个统计图,假设两个统计图中每个组内的数据均匀分布,根据两图信息分别估计男生样本、女生样本的平均数;
(2)已知男生样本方差,女生样本方差,请结合(2)问的结果计算总样本方差的估计值.
【解题思路】(1)利用各组区间中点值代表该组的各个值,由频率分布直方图、扇形统计图估计平均数的方法可求得结果;
(2)根据分层抽样计算平均数和方差的方法直接求解即可.
【解答过程】(1)每个组内的数据均匀分布,以各组的区间中点值代表该组的各个值;
由频率分布直方图估计男生样本课外体育锻炼时间的平均数 ;
由扇形图估计女生样本课外体育锻炼时间的平均数 .
(2)采用按比例分配的分层随机抽样,;
估计树人中学学生课外运动时间的平均数,
.
【变式6-1】(23-24高三上·黑龙江鸡西·期末)为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机选取了10个轮胎,将每个轮胎的宽度(单位:)记录下来并绘制出折线图:
(1)分别计算甲、乙两厂提供10个轮胎宽度的平均值;
(2)轮胎的宽度在内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好
【解题思路】(1)根据平均数的求法可直接求得结果;
(2)确定甲、乙两厂生产的轮胎中标准轮胎的宽度数据,由此可计算得到平均数和方差,对比数据即可得到结论.
【解答过程】(1)记甲厂提供的个轮胎宽度的平均值为,乙厂提供的个轮胎宽度的平均值为,
,.
(2)甲厂个轮胎宽度在内的数据为,
则平均数为,
所以方差;
乙厂个轮胎宽度在内的数据为,
则平均数为,
所以方差;
因为甲、乙两厂生产的标准轮胎宽度的平均值一样,但乙厂的方差更小,
所有乙厂的轮胎相对更好.
【变式6-2】(23-24高一下·湖北武汉·期末)近年来,“直播带货”受到越来越多人的喜爱,目前已经成为推动消费的一种流行的营销形式.某直播平台1200个直播商家,对其进行调查统计,发现所售商品多为小吃、衣帽、生鲜、玩具、饰品类等,各类直播商家所占比例如图所示.

(1)该直播平台为了更好地服务买卖双方,打算随机抽取60个直播商家进行问询交流.如果按照比例分层抽样的方式抽取,则应抽取小吃类、生鲜类商家各多少家?
(2)在问询了解直播商家的利润状况时,工作人员对(1)中抽取的60个商家的平均日利润进行了统计(单位:元),所得频率分布直方图如右图所示,请根据频率分布直方图计算下面的问题:
①估计该直播平台商家平均日利润的中位数与平均数(结果保留一位小数,求平均数时同一组中的数据用该组区间的中点值作代表);
②若将平均日利润超过430元的商家评为“优秀商家”,估计该直播平台“优秀商家”的个数.
【解题思路】(1)根据分层抽样的定义计算即可;
(2)①根据中位数和平均数的定义计算即可;
②根据样本中“优秀商家”的个数来估计总体中“优秀商家”的个数即可.
【解答过程】(1),,
所以应抽取小吃类家,生鲜类家;
(2)①根据题意可得,解得,
设中位数为,因为,,
所以,解得,
平均数为:

所以该直播平台商家平均日利润的中位数为342.9,平均数为352.5.
②,
所以估计该直播平台“优秀商家”的个数为.
【变式6-3】(2024·河南信阳·三模)信阳市旅游部门为了促进信阳生态特色城镇和新农村建设,将甲、乙,丙三家民宿的相关资料放到某网络平台上进行推广宣传.该平台邀请部分曾在这三家民宿体验过的游客参与调查,得到了这三家民宿的“综合满意度”评分,评分越高表明游客体验越好,现从这三家民宿“综合满意度”的评分中各随机抽取10个评分数据,并对所得数据进行整理、描述和分析,下面给出了部分信息.
a.甲、乙两家民宿“综合满意度”评分的折线图:
b.丙家民宿“综合满意度”评分:
2.6,4.7,4.5,5.0,4.5,4.8,4.5,3.8,4.5,3.1
c.甲、乙、丙三家民宿“综合满意度”评分的平均数、中位数:
甲 乙 丙
平均数 4.5 4.2
中位数 4.5 4.7
根据以上信息,回答下列问题:
(1)表中的值是______,的值是______;
(2)设甲、乙、丙三家民宿“综合满意度”评分的方差分别为、、,试比较其大小.
(3)根据“综合满意度”的评分情况,该平台打算将甲、乙、丙三家民宿中的一家置顶推荐,你认为该平台会将这三家民宿中的哪家置顶推荐?说明理由(至少从两个方面说明).
【解题思路】(1)利用平均数和中位数的定义计算出和;
(2)根据折线统计图和丙的数据,分析出数据波动的情况,从而比较出方差得大小;
(3)从平均数,中位数,方差等方面分析得到结论,答案不唯一.
【解答过程】(1)甲家民宿“综合满意度”评分:3.2,4.2,5.0,4.5,5.0,4.8,4.5,4.3,5.0,4.5,
∴,
丙家民宿“综合满意度”评分:2.6,4.7,4.5,5.0,4.5,4.8,4.5,3.8,4.5,3.1,
从小到大排列为:2.6,3.1,3.8,4.5,4.5,4.5,4.5,4.7,4.8,5.
∴中位数,
(2)根据折线统计图可知,
乙的评分数据在4分与5分之间波动,甲的数据在3.2分和5分之间波动,
根据丙的数据可以在2.6至5分之间波动,
∴;
(3)推荐乙,理由:乙的方差最小,数据稳定,平均分比丙高,
答案不唯一,合理即可.
一、单选题
1.(2024·江西·一模)从1984年第23届洛杉矶夏季奥运会到2024年第33届巴黎夏季奥运会,我国获得的夏季奥运会金牌数依次为15、5、16、16、28、32、51、38、26、38、40,这11个数据的分位数是( )
A.16 B.30 C.32 D.51
【解题思路】将数据按照从小到大的顺序排列,根据百分位数的计算方法即可求解.
【解答过程】把11个数据按照从小到大排列得5、15、16、16、26、28、32、38、38、40、51,
因为,这11个数据按照从小到大排列第7个是32.
故选:C.
2.(23-24高二下·云南丽江·阶段练习)已知甲组数据:1,3,5,7,9,11,乙组数据:2,4,8,16,根据不同组别,用分层抽样的方法随机抽取一个容量为5的样本,则该样本的平均数不可能是( )
A.5 B.7 C.9 D.11
【解题思路】先根据分层抽样算出甲乙两组数据抽到的数据个数,列出表格,在结合平均数公式计算得出答案;
【解答过程】根据分层抽样可知甲组数据抽取3个数据,乙组数据抽取2个数据,具体情况如下表:
甲组抽样 乙组抽样 平均数
3,5,7 2,8 5
5,7,11 4,8 7
5,7,9 8,16 9
平均数为11时,需5个样本数字之和为55,而样本之和最大值为.
故选:D.
3.(2024·湖北黄冈·模拟预测)为了解高中学生每天的体育活动时间,某市教育部门随机抽取高中学生进行调查,把每天进行体育活动的时间按照时长(单位:分钟)分成组:,,,,,.然后对统计数据整理得到如图所示的频率分布直方图,则可估计这名学生每天体育活动时间的第百分位数为( )
A. B. C. D.
【解题思路】根据第百分位数的概念,知道它在第二组里.运用概率之和为,构造方程,解出即可.
【解答过程】第百分位数设为,而,则所求百分位数在第二组,
则可列方程解得.
故选:A.
4.(2024·黑龙江哈尔滨·三模)如图所示,下列频率分布直方图显示了三种不同的形态.图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态,根据所给图作出以下判断,正确的是( )
A.图(1)的平均数=中位数>众数 B.图(2)的众数<中位数<平均数
C.图(2)的平均数<众数<中位数 D.图(3)的中位数<平均数<众数
【解题思路】根据平均数,中位数,众数的概念结合图形分析判断.
【解答过程】图(1)的分布直方图是对称的,所以平均数=中位数=众数,故A错误;
图(2)频率直方图可得,单峰不对称且“右拖尾”,最高峰偏左,众数最小,
平均数易受极端值的影响,与中位数相比,平均数总是在“拖尾”那边,平均数大于中位数,故B正确,C错误;
同理图(3)“左拖尾”,众数最大,平均数小于中位数,故D错误.
故选:B.
5.(2024·黑龙江哈尔滨·模拟预测)已知有4个数据的平均值为5,方差为4,现加入数据6和10,则这6个数据的新方差为( )
A. B. C.6 D.10
【解题思路】设原来的 4 个数依次为 , , , , 再利用平均数和方差的计算公式结合整体法即可.
【解答过程】设原来的4个数依次为,,,,
原来4个数据的平均值为5,方差为4,




现加入数据6和10,则这6个数据的平均数为

则这6个数据的方差为:
.
故选:C.
6.(2024·广东惠州·模拟预测)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分如图所示,假设得分值的中位数为,众数为,平均值为,则(  )

A. B.
C. D.
【解题思路】根据题意求中位数、众数和平均数,对比即可得结果.
【解答过程】30个数中第15个数是5,第16个数是6,所以中位数,
由题意可知:众数,
平均值=.
所以.
故选:D.
7.(2024·江西·二模)从甲队60人、乙队40人中,按照分层抽样的方法从两队共抽取10人,进行一轮答题.相关统计情况如下:甲队答对题目的平均数为1,方差为1;乙队答对题目的平均数为1.5,方差为0.4,则这10人答对题目的方差为( )
A.0.8 B.0.675 C.0.74 D.0.82
【解题思路】根据分层抽样的均值与方差公式计算即可.
【解答过程】根据题意,按照分层抽样的方法从甲队中抽取人,
从乙队中抽取人,
这人答对题目的平均数为,
所以这人答对题目的方差为.
故选:D.
8.(2024·山东·二模)甲乙两名歌手参加选拔赛,5位评委评分情况如下:甲:;乙:,记甲、乙两人的平均得分分别为,则下列判断正确的是( )
A.,甲比乙成绩稳定 B.,乙比甲成绩稳定
C.,甲比乙成绩稳定 D.,乙比甲成绩稳定
【解题思路】由平均数和方差公式求出,,,即可得出答案.
【解答过程】;


所以,乙比甲成绩稳定.
故选:B.
二、多选题
9.(2024·河北保定·三模)若一组数据14,17,11,9,12,15,,8,10,7的第65百分位数为12,则的值可能为( )
A.8 B.10 C.13 D.14
【解题思路】根据题意先将数据排序,再结合百分位数的定义分析求解.
【解答过程】将这组数据除去后,按从小到大的顺序排序:7,8,9,10,11,12,14,15,17.
因为,所以.
故选:AB.
10.(2024·广东茂名·一模)中秋节起源于上古时代,普及于汉代,定型于唐代,如今逐渐演化为赏月、颂月等活动,以月之圆兆人之团圆,为寄托思念故乡,思念亲人之情,祈盼丰收、幸福,成为丰富多彩、弥足珍贵的文化遗产.某校举行与中秋节相关的“中国传统文化”知识竞赛,随机抽查了100人的成绩整理后得到如图所示的频率分布直方图,则下列结论正确的是( )
A.样本的众数为75
B.样本的分位数为75
C.样本的平均值为68.5
D.该校学生中得分低于60分的约占
【解题思路】由图求得的值,再根据频率分布直方图的性质逐项判断即可.
【解答过程】依题意,,解得,
选项A,最高小矩形的中点横坐标为75,众数是75,故A正确.
选项B,设样本的分位数为,又,
,解得,故B错误.
选项C,平均数为,故C正确.
选项D,样本中得分低于60分的占,
该校学生中得分低于60分的约占,故D错误.
故选:AC.
11.(2024·重庆九龙坡·三模)已知样本数据的平均数为2,方差为1,则下列说法正确的是( )
A.数据,的平均数为6
B.数据,的方差为9
C.数据的方差为1
D.数据的平均数为5
【解题思路】对于AB:根据平均数、方差的性质分析求解;对于CD:根据平均数、方差公式运算求解.
【解答过程】因为样本数据的平均数为2,方差为1,
对于选项A:所以数据,的平均数为,故A错误;
对于选项B:数据,的方差为,故B正确;
对于选项C:因为,,
则数据的平均数为,
所以方差为,故C错误;
对于选项D:由,,
得,可得,
所以数据的平均数为,故D正确;
故选:BD.
三、填空题
12.(2024·安徽·模拟预测)一组数据按从小到大的顺序排列为2,4,m,12,16,17,若该组数据的中位数是极差的,则该组数据的第40百分位数是 6 .
【解题思路】先依据题意列等量关系式求出m,再依据百分位数的定义以及求解步骤直接求解即可得解.
【解答过程】由题该组数据的极差为,中位数为,
所以,又,
所以该组数据的第40百分位数是该组数据的第三位数为6.
故答案为:6.
13.(2024·安徽·模拟预测)某小学对四年级的某个班进行数学测试,男生的平均分和方差分别为91和11,女生的平均分和方差分别为86和8,已知该班男生有30人,女生有20人,则该班本次数学测试的总体方差为 .
【解题思路】先求出总体的平均数,在利用计算得解.
【解答过程】设全体同学数学成绩的平均分为,方差为,
记,,,,,,
依题意有,

.
故答案为:.
14.(2024·广西·二模)设实数x,,满足1,3,4,x,y,的平均数与50%分位数相等,则数据x,y,的方差为 .
【解题思路】利用平均数与分位数相等,得,代入数据中得方差.
【解答过程】根据题意,数据的平均数为,
数据的分位数为,
∴ ,即,代入数据,
即为,此组数据的平均数为,
∴ 数据的方差为.
故答案:.
四、解答题
15.(2024·全国·模拟预测)中央广播电视总台《2024年春节联欢晚会》以“龙行龘龘,欣欣家国”为主题,创新“思想艺术技术”融合传播,与全球华人相约除夕,共享一台精彩纷呈、情真意切、热气腾腾的文化盛宴.2023年12月2日,中央广播电视总台发布了甲辰龙年春晚的主标识——龘.为了解大家对这一标识的看法,某网站进行了一次网络调研,并将参与调查的网友对这一标识的打分情况(分数在50分到100分之间)绘制成频率分布直方图如下:

(1)求网友打分的平均值(同一组中的数据用该组区间的中点值代替)、中位数(保留一位小数);
(2)设网友打分的平均值为,若按打分是否在区间内进行分层抽样,抽取10人进行深度调研,打分在区间内的至少抽取8人,试估计的最小值(保留两位小数).
【解题思路】(1)根据频率分布直方图求平均数、中位数得求法依次计算即可求解;
(2)由(1)知,根据打分在区间内的频率不低于0.8分类讨论确定,进而求解.
【解答过程】(1)网友打分的平均值为

分数在的频率,
分数在的频率,
设中位数为,则,
,得,
即中位数约为73.3.
(2)由(1)可知.
要使抽取的10人的打分在内的人数不低于8人,
则打分在区间内的频率不低于0.8.
若,则 ,
频率;
若,则 ,
频率.
当最小时,,
且,
解得,即的最小值约为13.95.
16.(2024·贵州毕节·二模)某地区工会利用“健步行APP”开展健步走活动.为了解会员的健步走情况,工会在某天从系统中抽取了100名会员,统计了当天他们的步数(千步为单位),并将样本数据分为,,,…,,九组,整理得到如图所示的频率分布直方图.
(1)根据频率分布直方图,估计样本数据的70%分位数;
(2)据统计,在样本数据,,的会员中体检为“健康”的比例分别为,,,以频率作为概率,估计在该地区工会会员中任取一人,体检为“健康”的概率.
【解题思路】(1)根据频率分布直方图和总体百分位数的定义直接求解即可.
(2)设任取的会员数据在,,中分别为事件,,,先求出对应概率,即可求解体检为“健康”的概率.
【解答过程】(1)解:(1)由于在的样本数据比例为:
∴样本数据的70%分位数在内∴估计为:.
(2)(2)设任取的会员数据在,,中分别为事件,,,
∴,,
设事件在该地区工会会员中任取一人体检为“健康”
.
17.(2024·陕西榆林·模拟预测)近年来“天宫课堂”受到广大中小学生欢迎,激发了同学们对科学知识的探索欲望和对我国航天事业成就的自豪.为领悟航天精神,感受中国梦想,某校组织了一次“寻梦天宫”航天知识竞赛(满分分),各年级学生踊跃参加.校团委为了比较高一、高二学生这次竞赛的成绩,从两个年级的答卷中各随机选取了份,将成绩进行统计得到以下频数分布表:
成绩
高一学生人数
高二学生人数
试利用样本估计总体的思想,解决下列问题:
(1)从平均数与方差的角度分析哪个年级学生这次竞赛成绩更好(同一组中的数据用该组区间的中点值为代表)?
(2)校后勤部决定对参与这次竞赛的学生给予一定的奖励,奖励方案有以下两种:
方案一:记学生得分为,当时,奖励该学生元食堂代金券;当时,奖励该学生元食堂代金券;当时,奖励该学生元食堂代金券;
方案二:得分低于样本中位数的每位学生奖励元食堂代金券;得分不低于中位数的每位学生奖励元食堂代金券.
若高一年级组长希望本年级学生获得更多的奖励,则他应该选择哪种方案?
【解题思路】(1)根据频数分布表估计平均数和方差的方法分别计算出样本的平均数和方差,进而得到结论;
(2)计算出每个方案中本年级学生所获奖励金额的平均数,从而确定结论.
【解答过程】(1)样本中,高一学生竞赛平均成绩为:,
方差;
样本中,高二学生竞赛平均成绩为:,
方差.
,,
样本中平均成绩一样,但高二学生的成绩更稳定.
利用样本估计总体的思想可以认为,高二学生这次竞赛成绩更好.
(2)设选择方案一时一位学生获得的奖金为元,
则的可能取值为,其对应的频率分别为,
获得奖励的平均数:(元);
设选择方案二时一位学生获得的奖励为元,则获得奖金的平均数:
(元).
,从统计角度看,高一年级组长应该选择方案一.
18.(2024·全国·模拟预测)我国中学生的近视率一直是社会关注的焦点.某市疾控中心为调查该市高中生的视力状况,从某高中3000名学生中随机抽取了100名学生用五分记录法统计了其裸眼视力,得到如图1所示的频率分布直方图:
为改善学生的视力状况,该校积极落实学生近视防控工作,建立视力监测制度,几年后,再次抽取100名学生,用五分记录法统计其裸眼视力,得到如下频数分布表:
裸眼视力
人数 5 20 60 15
(1)若裸眼视力位于为轻度近视,用样本估计总体,用频率估计概率,估计近视防控工作开展前全校患轻度近视的学生人数;
(2)在图2中作出近视防控工作开展后100名学生裸眼视力的频率分布直方图;
(3)估计近视防控工作开展后该校学生裸眼视力比开展前学生裸眼视力的平均值提高了多少(同一组中的数据用该组区间的中点值为代表).
【解题思路】(1)利用频率分布直方图先得出裸眼视力在的频率,再估计总体即可;
(2)计算各区间的频率,直接作图即可;
(3)分别求近视防控工作开展前后学生裸眼视力的平均值,计算即可.
【解答过程】(1)由频率分布直方图,得学生裸眼视力在的频率为,
所以估计近视防控工作开展前全校患轻度近视的学生人数为.
(2)近视防控工作开展后学生裸眼视力在的频率为,在的频率为,在的频率为,在的频率为,
故近视防控工作开展后100名学生裸眼视力的频率分布直方图如下.
(3)记近视防控工作开展前该校学生裸眼视力的平均值为,

记近视防控工作开展后该校学生裸眼视力的平均值为,
则,
因为,
故近视防控工作开展后该校学生裸眼视力比开展前学生裸眼视力的平均值提高了0.29.
19.(2024·陕西安康·模拟预测)首届中国航协航空大会的一个鲜明的特色是在各个展区中设置了多项互动体验活动,吸引了很多的中小学生,其中模拟飞行体验区是让这些中小学生戴上VR眼镜模拟从起飞到降落,大大激发了他们的兴趣爱好.现从某个有互动体验的展区中随机抽取60名中小学生,统计他们的参观时间(从进入该展区到离开该展区的时长,单位:分钟,时间取整数),将时间分成六组,并绘制成如图所示的频率分布直方图.
(1)由频率分布直方图,估计样本的平均数和方差;(每组数据以区间的中点值为代表)
(2)为对比展区是否有体验区对中小学生的吸引程度,某工作人员给出了一份该展区中没有体验区的参观时间的随机数据,经计算得到该组数据参观时长平均值为65分钟,方差为,试判断有体验区的参观时长均值比没有体验区的参观时长均值是否有显著提高?(如果,则认为有显著提高,否则不认为有显著提高)
(3)利用(2)中的结果,你认为展区是否应该设置互动体验展区?请说明理由.
【解题思路】(1)根据频率分布直方图平均数和方差公式计算;
(2)应用公式计算判断即可;
(3)根据结果判断是否设置互动体验展区即可.
【解答过程】(1)由题得,
所以样本的方差为
(2)由题得,
所以,
所以有体验区的参观时长均值比没有体验区的参观时长均值有显著提高.
(3)从(2)中可知展区应该设置互动体验展区,这样可以吸引更多的参观者进行观看与体验,使他们能更多地了解产品,并能更大程度地激发中小学生的兴趣爱好.
21世纪教育网(www.21cnjy.com)专题9.2 用样本估计总体【六大题型】
【新高考专用】
【题型1 百分位数的求解】 3
【题型2 样本的数字特征的估计】 4
【题型3 总体集中趋势的估计】 5
【题型4 总体离散程度的估计】 7
【题型5 分层方差问题】 8
【题型6 其他统计图表中反映的集中趋势与离散程度】 9
1、用样本估计总体
考点要求 真题统计 考情分析
(1)会用统计图表对总体进行估计,会求n个数据的第p百分位数 (2)能用数字特征估计总体集中趋势和总体离散程度 2022年全国甲卷(文数):第2题,5分 2023年新高考I卷:第9题,5分 2023年全国乙卷(文数、理数):第17题,10分 从近几年的高考情况来看,高考对用样本估计总体的考查比较稳定,多以选择题、填空题的形式出现,考查百分位数、平均数、中位数、众数、方差等知识,难度不大;在解答题中出现时,一般会与其他知识结合考查,综合性强,需要灵活求解.
【知识点1 用样本估计总体】
1.总体百分位数的估计
(1)概念
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个
值,且至少有(100-p)%的数据大于或等于这个值.
(2)求解步骤
可以通过下面的步骤计算一组n个数据的第p百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p
百分位数为第i项与第(i+1)项数据的平均数.
2.频率分布直方图的数字特征
(1)众数:众数一般用频率分布表中频率最高的一组的组中值来表示,即在样本数据的频率分布直方图
中,最高小长方形的底边中点的横坐标;
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;
(3)平均数:平均数在频率分布表中等于组中值与对应频率之积的和.
3.总体集中趋势的估计
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度
刻画了一组数据的集中趋势.具体概念回顾如下:
名称 概念
平 均 数 如果有n个数x1,x2,…,xn,那么(x1+x2+…+xn)就是这组数据的平均数,用表示,即=(x1+x2+…+xn).
中 位 数 将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
众 数 一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称为这组数据的众数.
4.总体离散程度的估计
(1)方差和标准差
假设一组数据是,,,,用表示这组数据的平均数,则我们称为这组数据的
方差.有时为了计算方差的方便,我们还把方差写成的形式.
我们对方差开平方,取它的算数平方根,称为这组数据的标准差.
(2)总体(样本)方差和总体标准差
①一般式:如果总体中所有个体的变量值分别为,,,,总体平均数为,则总体方差=
.
②加权式:如果总体的N个变量值中,不同的值共有k(kN)个,不妨记为,,,,其中出
现的频数为(i=1,2,,k),则总体方差为=.
总体标准差:S=.
(3)标准差与方差的统计意义
①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.
③标准差(方差)的取值范围为[0,+).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则
标准差为0.反之,标准差为0的样本,其中的数据都相等.
5.频率分布直方图中的统计参数
(1)频率分布直方图中的“众数”
根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数.一般用
中点近似代替.
(2)频率分布直方图中的“中位数”
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.
因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
(3)频率分布直方图中的“平均数”
平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分
布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
【方法技巧与总结】
1.若x1,x2,…,xn的平均数为,那么的平均数为.
2.数据x1,x2,…,xn与数据的方差相等,即数据经过平移后方差不变.
3.若x1,x2,…,xn的方差为s2,那么的方差为a2s2.
【题型1 百分位数的求解】
【例1】(2024·安徽六安·模拟预测)样本数据16,20,24,21,22,18,14,28的分位数为( )
A.16 B.17 C.23 D.24
【变式1-1】(2024·河南郑州·模拟预测)已知某学校参加学科节数学竞赛决赛的8人的成绩(单位:分)为:72,78,80,81,83,86,88,90,则这组数据的第75百分位数是( )
A.86 B.87 C.88 D.90
【变式1-2】(2024·黑龙江大庆·三模)小明希望自己的高考数学成绩能超过120分,为了激励自己,他记录了近8次数学考试成绩,并绘制成折线统计图,如图,这8次成绩的第80百分位数是( )
A.100 B.105 C.110 D.120
【变式1-3】(2024·福建泉州·一模)海上丝绸之路的起点城市一泉州,有着丰厚的文化底蕴,作为国家级非遗的蟳埔女簪花围习俗,是福建博大精深的海洋文化“百花园”中的一朵香花.某机构随机调查了18位“簪花围”体验者对这一活动的满意度评分情况,得到如下数据:a,60,70,70,71,73,74,74,75,76,77,79,80,83,85,87,93,100.若a恰好是这组数据的下四分位数,则a的值不可能为( )
A.71 B.72 C.73 D.74
【题型2 样本的数字特征的估计】
【例2】(2024·浙江绍兴·三模)已知实数,若,且这四个数的中位数是3,则这四个数的平均数是( )
A. B.3 C. D.4
【变式2-1】(2024·全国·模拟预测)一组数据12,12,13,14,15,16,17的中位数是( )
A.14 B.15 C.16 D.17
【变式2-2】(2024·江苏·模拟预测)已知甲、乙两支篮球队各6名队员某场比赛的得分数据(单位:分)从小到大排列如下:甲队:;乙队:.这两组数据的中位数相等,且平均值也相等,则的值为( )
A.3 B.4 C.5 D.6
【变式2-3】(2024·重庆·模拟预测)2023年10月4日,在杭州亚运会跳水男子10米台决赛中,中国选手杨昊夺得金牌.中国跳水队包揽杭州亚运会跳水项目全部10枚金牌.跳水比赛的评分规则如下,7位裁判同时给分,去掉两个最高分,去掉两个最低分,剩下的3个分数求和再乘以难度系数,就是该选手本轮的得分,下表就是杨昊比赛中的第一轮得分表,则( )
1号 裁判 2号 裁判 3号 裁判 4号 裁判 5号 裁判 6号 裁判 7号 裁判 难度 系数 本轮 得分
a 9.5 9.0 10.0 9.5 10.0 10.0 3.2 92.80
A.这7个数据的众数只能是10.0
B.这7个数据的中位数只能是9.0
C.a可能是10.0
D.a可能是9.5
【题型3 总体集中趋势的估计】
【例3】(2024·四川宜宾·模拟预测)为了加深师生对党史的了解,激发广大师生知史爱党 知史爱国的热情,某校举办了“学党史 育新人”的党史知识竞赛,并将1000名师生的竞赛成绩(满分100分,成绩取整数)整理成如图所示的频率分布直方图,则下列说法错误的是( )
A.的值为0.005
B.估计这组数据的众数为75分
C.估计成绩低于60分的有250人
D.估计这组数据的中位数为分
【变式3-1】(2024·陕西西安·二模)某教育机构为调查中小学生每日完成作业的时间,收集了某位学生100天每天完成作业的时间,并绘制了如图所示的频率分布直方图(每个区间均为左闭右开),根据此直方图得出了下列结论,其中正确的是( )
A.估计该学生每日完成作业的时间在2小时至2.5小时的有50天
B.估计该学生每日完成作业时间超过3小时的概率为0.3
C.估计该学生每日完成作业时间的平均数为2.75小时
D.估计该学生每日完成作业时间的中位数与平均数相等
【变式3-2】(2024·四川德阳·二模)某中学为了解大数据提供的个性化作业质量情况,随机访问名学生,并对这名学生的个性化作业进行评分(满分:100分),根据得分将他们的成绩分成,,六组,制成如图所示的频率分布直方图,其中成绩在的学生人数为30人.
(1)求的值;
(2)估计这名学生成绩的平均数(同一组数据用该组数据的中点值代替)和中位数.
【变式3-3】(2024·内蒙古呼和浩特·一模)为了解甲、乙两种农药在某种绿植表面的残留程度,进行如下试验:将100株同种绿植随机分成两组,每组50株,其中组绿植喷甲农药,组绿植喷乙农药,每株绿植所喷的农药体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在绿植表面的百分比,根据试验数据分别得到如图直方图:
记为事件:“乙农药残留在表面的百分比不低于5.5”,根据直方图得到的估计值为0.70.
(1)求乙农药残留百分比直方图中的值;
(2)估计甲农药残留百分比的平均数(同一组中的数据用该组区间的中点值为代表);
(3)估计乙农药残留百分比的中位数.(保留2位小数)
【题型4 总体离散程度的估计】
【例4】(2024·陕西商洛·模拟预测)设一组样本数据的平均值是1,且的平均值是3,则数据的方差是( )
A.1 B.2 C.3 D.4
【变式4-1】(2024·陕西榆林·三模)在一次数学模考中,从甲 乙两个班各自抽出10个人的成绩,甲班的十个人成绩分别为,乙班的十个人成绩分别为.假设这两组数据中位数相同 方差也相同,则把这20个数据合并后( )
A.中位数一定不变,方差可能变大
B.中位数可能改变,方差可能变大
C.中位数一定不变,方差可能变小
D.中位数可能改变,方差可能变小
【变式4-2】(2024·宁夏银川·一模)滨海盐碱地是我国盐碱地的主要类型之一,如何利用更有效的方法改造这些宝贵的土地资源,成为摆在我们面前的世界级难题.对盐碱的治理方法,研究人员在长期的实践中获得了两种成本差异不大,且能降低滨海盐碱地30-60cm土壤层可溶性盐含量的技术,为了对比两种技术治理盐碱的效果,科研人员在同一区域采集了12个土壤样本,平均分成两组,测得组土壤可溶性盐含量数据样本平均数,方差,B组土壤可溶性盐含量数据样本平均数,方差.用技术1对组土壤进行可溶性盐改良试验,用技术2对组土壤进行可溶性盐改良试验,分别获得改良后土壤可溶性盐含量数据如下:
组 0.66 0.68 0.69 0.71 0.72 0.74
组 0.46 0.48 0.49 0.49 0.51 0.51
改良后组、组土壤可溶性盐含量数据样本平均数分别为和,样本方差分别记为和
(1)求;
(2)应用技术1与技术2土壤可溶性盐改良试验后,土壤可溶性盐含量是否有显著降低?(若,则认为技术能显著降低土壤可溶性盐含量,否则不认为有显著降低).
【变式4-3】(2024·陕西西安·一模)近年来“天宫课堂”受到广大中小学生欢迎,激发了同学们对科学知识的探索欲望和对我国航天事业成就的自豪.为领悟航天精神,感受中国梦想,某校组织了一次“寻梦天宫”航天知识竞赛(满分100分),各年级学生踊跃参加.校团委为了比较高一、高二学生这次竞赛的成绩,从两个年级的答卷中各随机选取了50份,将成绩进行统计得到以下频数分布表:
成绩
高一学生人数 15 5 15 15
高二学生人数 10 10 20 10
试利用样本估计总体的思想,解决下列问题:
(1)从平均数与方差的角度分析哪个年级学生这次竞赛成绩更好(同一组中的数据用该组区间的中点值为代表)?
(2)校后勤部决定对参与这次竞赛的学生给予一定的奖励,奖励方案有以下两种:
方案一:记学生得分为,当时,奖励该学生10元食堂代金券;当时,奖励该学生25元食堂代金券;当时,奖励该学生35元食堂代金券;
方案二:得分低于样本中位数的每位学生奖励10元食堂代金券;得分不低于中位数的每位学生奖励30元食堂代金券.
若高一年级组长希望本年级学生获得多于高二年级的奖励,则他应该选择哪种方案?
【题型5 分层方差问题】
【例5】(2024·云南·模拟预测)某学校高三年级男生共有个,女生共有个,为调查该年级学生的年龄情况,通过分层抽样,得到男生和女生样本数据的平均数和方差分别为和,已知,则该校高三年级全体学生年龄的方差为( )
A. B.
C. D.
【变式5-1】(2024·浙江·三模)在对某校高三学生体质健康状况某个项目的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生80人,女生120人,其方差分别为15,10,由此估计样本的方差不可能为( )
A.11 B.13 C.15 D.17
【变式5-2】(2024·辽宁葫芦岛·二模)某地为了了解学生的睡眠时间,根据初中和高中学生的人数比例采用分层抽样,抽取了40名初中生和20名高中生,调查发现初中生每天的平均睡眠时间为8小时,方差为2,高中生每天的平均睡眠时间为7小时,方差为1.根据调查数据,估计该地区中学生睡眠时间的总体方差约为( )
A. B. C. D.
【变式5-3】(2024·全国·模拟预测)已知总体划分为3层,通过分层随机抽样,各层抽取的样本容量分别为,,,样本平均数分别为,,,样本方差分别为,,,若,则( )
A.
B.
C.总体样本平均数
D.当时,总体方差
【题型6 其他统计图表中反映的集中趋势与离散程度】
【例6】(23-24高一下·河南信阳·期中)树人中学男女学生比例约为,某数学兴趣社团为了解该校学生课外体育锻炼情况(锻炼时间长短(单位:小时)),采用样本量比例分配的分层抽样,抽取男生人,女生人进行调查.记男生样本为,样本平均数、方差分别为;女生样本为,样本平均数、方差分别为;总样本平均数、方差分别为.
(1)该兴趣社团通过分析给出以上两个统计图,假设两个统计图中每个组内的数据均匀分布,根据两图信息分别估计男生样本、女生样本的平均数;
(2)已知男生样本方差,女生样本方差,请结合(2)问的结果计算总样本方差的估计值.
【变式6-1】(23-24高三上·黑龙江鸡西·期末)为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机选取了10个轮胎,将每个轮胎的宽度(单位:)记录下来并绘制出折线图:
(1)分别计算甲、乙两厂提供10个轮胎宽度的平均值;
(2)轮胎的宽度在内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好
【变式6-2】(23-24高一下·湖北武汉·期末)近年来,“直播带货”受到越来越多人的喜爱,目前已经成为推动消费的一种流行的营销形式.某直播平台1200个直播商家,对其进行调查统计,发现所售商品多为小吃、衣帽、生鲜、玩具、饰品类等,各类直播商家所占比例如图所示.

(1)该直播平台为了更好地服务买卖双方,打算随机抽取60个直播商家进行问询交流.如果按照比例分层抽样的方式抽取,则应抽取小吃类、生鲜类商家各多少家?
(2)在问询了解直播商家的利润状况时,工作人员对(1)中抽取的60个商家的平均日利润进行了统计(单位:元),所得频率分布直方图如右图所示,请根据频率分布直方图计算下面的问题:
①估计该直播平台商家平均日利润的中位数与平均数(结果保留一位小数,求平均数时同一组中的数据用该组区间的中点值作代表);
②若将平均日利润超过430元的商家评为“优秀商家”,估计该直播平台“优秀商家”的个数.
【变式6-3】(2024·河南信阳·三模)信阳市旅游部门为了促进信阳生态特色城镇和新农村建设,将甲、乙,丙三家民宿的相关资料放到某网络平台上进行推广宣传.该平台邀请部分曾在这三家民宿体验过的游客参与调查,得到了这三家民宿的“综合满意度”评分,评分越高表明游客体验越好,现从这三家民宿“综合满意度”的评分中各随机抽取10个评分数据,并对所得数据进行整理、描述和分析,下面给出了部分信息.
a.甲、乙两家民宿“综合满意度”评分的折线图:
b.丙家民宿“综合满意度”评分:
2.6,4.7,4.5,5.0,4.5,4.8,4.5,3.8,4.5,3.1
c.甲、乙、丙三家民宿“综合满意度”评分的平均数、中位数:
甲 乙 丙
平均数 4.5 4.2
中位数 4.5 4.7
根据以上信息,回答下列问题:
(1)表中的值是______,的值是______;
(2)设甲、乙、丙三家民宿“综合满意度”评分的方差分别为、、,试比较其大小.
(3)根据“综合满意度”的评分情况,该平台打算将甲、乙、丙三家民宿中的一家置顶推荐,你认为该平台会将这三家民宿中的哪家置顶推荐?说明理由(至少从两个方面说明).
一、单选题
1.(2024·江西·一模)从1984年第23届洛杉矶夏季奥运会到2024年第33届巴黎夏季奥运会,我国获得的夏季奥运会金牌数依次为15、5、16、16、28、32、51、38、26、38、40,这11个数据的分位数是( )
A.16 B.30 C.32 D.51
2.(23-24高二下·云南丽江·阶段练习)已知甲组数据:1,3,5,7,9,11,乙组数据:2,4,8,16,根据不同组别,用分层抽样的方法随机抽取一个容量为5的样本,则该样本的平均数不可能是( )
A.5 B.7 C.9 D.11
3.(2024·湖北黄冈·模拟预测)为了解高中学生每天的体育活动时间,某市教育部门随机抽取高中学生进行调查,把每天进行体育活动的时间按照时长(单位:分钟)分成组:,,,,,.然后对统计数据整理得到如图所示的频率分布直方图,则可估计这名学生每天体育活动时间的第百分位数为( )
A. B. C. D.
4.(2024·黑龙江哈尔滨·三模)如图所示,下列频率分布直方图显示了三种不同的形态.图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态,根据所给图作出以下判断,正确的是( )
A.图(1)的平均数=中位数>众数 B.图(2)的众数<中位数<平均数
C.图(2)的平均数<众数<中位数 D.图(3)的中位数<平均数<众数
5.(2024·黑龙江哈尔滨·模拟预测)已知有4个数据的平均值为5,方差为4,现加入数据6和10,则这6个数据的新方差为( )
A. B. C.6 D.10
6.(2024·广东惠州·模拟预测)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分如图所示,假设得分值的中位数为,众数为,平均值为,则(  )

A. B.
C. D.
7.(2024·江西·二模)从甲队60人、乙队40人中,按照分层抽样的方法从两队共抽取10人,进行一轮答题.相关统计情况如下:甲队答对题目的平均数为1,方差为1;乙队答对题目的平均数为1.5,方差为0.4,则这10人答对题目的方差为( )
A.0.8 B.0.675 C.0.74 D.0.82
8.(2024·山东·二模)甲乙两名歌手参加选拔赛,5位评委评分情况如下:甲:;乙:,记甲、乙两人的平均得分分别为,则下列判断正确的是( )
A.,甲比乙成绩稳定 B.,乙比甲成绩稳定
C.,甲比乙成绩稳定 D.,乙比甲成绩稳定
二、多选题
9.(2024·河北保定·三模)若一组数据14,17,11,9,12,15,,8,10,7的第65百分位数为12,则的值可能为( )
A.8 B.10 C.13 D.14
10.(2024·广东茂名·一模)中秋节起源于上古时代,普及于汉代,定型于唐代,如今逐渐演化为赏月、颂月等活动,以月之圆兆人之团圆,为寄托思念故乡,思念亲人之情,祈盼丰收、幸福,成为丰富多彩、弥足珍贵的文化遗产.某校举行与中秋节相关的“中国传统文化”知识竞赛,随机抽查了100人的成绩整理后得到如图所示的频率分布直方图,则下列结论正确的是( )
A.样本的众数为75
B.样本的分位数为75
C.样本的平均值为68.5
D.该校学生中得分低于60分的约占
11.(2024·重庆九龙坡·三模)已知样本数据的平均数为2,方差为1,则下列说法正确的是( )
A.数据,的平均数为6
B.数据,的方差为9
C.数据的方差为1
D.数据的平均数为5
三、填空题
12.(2024·安徽·模拟预测)一组数据按从小到大的顺序排列为2,4,m,12,16,17,若该组数据的中位数是极差的,则该组数据的第40百分位数是 .
13.(2024·安徽·模拟预测)某小学对四年级的某个班进行数学测试,男生的平均分和方差分别为91和11,女生的平均分和方差分别为86和8,已知该班男生有30人,女生有20人,则该班本次数学测试的总体方差为 .
14.(2024·广西·二模)设实数x,,满足1,3,4,x,y,的平均数与50%分位数相等,则数据x,y,的方差为 .
四、解答题
15.(2024·全国·模拟预测)中央广播电视总台《2024年春节联欢晚会》以“龙行龘龘,欣欣家国”为主题,创新“思想艺术技术”融合传播,与全球华人相约除夕,共享一台精彩纷呈、情真意切、热气腾腾的文化盛宴.2023年12月2日,中央广播电视总台发布了甲辰龙年春晚的主标识——龘.为了解大家对这一标识的看法,某网站进行了一次网络调研,并将参与调查的网友对这一标识的打分情况(分数在50分到100分之间)绘制成频率分布直方图如下:

(1)求网友打分的平均值(同一组中的数据用该组区间的中点值代替)、中位数(保留一位小数);
(2)设网友打分的平均值为,若按打分是否在区间内进行分层抽样,抽取10人进行深度调研,打分在区间内的至少抽取8人,试估计的最小值(保留两位小数).
16.(2024·贵州毕节·二模)某地区工会利用“健步行APP”开展健步走活动.为了解会员的健步走情况,工会在某天从系统中抽取了100名会员,统计了当天他们的步数(千步为单位),并将样本数据分为,,,…,,九组,整理得到如图所示的频率分布直方图.
(1)根据频率分布直方图,估计样本数据的70%分位数;
(2)据统计,在样本数据,,的会员中体检为“健康”的比例分别为,,,以频率作为概率,估计在该地区工会会员中任取一人,体检为“健康”的概率.
17.(2024·陕西榆林·模拟预测)近年来“天宫课堂”受到广大中小学生欢迎,激发了同学们对科学知识的探索欲望和对我国航天事业成就的自豪.为领悟航天精神,感受中国梦想,某校组织了一次“寻梦天宫”航天知识竞赛(满分分),各年级学生踊跃参加.校团委为了比较高一、高二学生这次竞赛的成绩,从两个年级的答卷中各随机选取了份,将成绩进行统计得到以下频数分布表:
成绩
高一学生人数
高二学生人数
试利用样本估计总体的思想,解决下列问题:
(1)从平均数与方差的角度分析哪个年级学生这次竞赛成绩更好(同一组中的数据用该组区间的中点值为代表)?
(2)校后勤部决定对参与这次竞赛的学生给予一定的奖励,奖励方案有以下两种:
方案一:记学生得分为,当时,奖励该学生元食堂代金券;当时,奖励该学生元食堂代金券;当时,奖励该学生元食堂代金券;
方案二:得分低于样本中位数的每位学生奖励元食堂代金券;得分不低于中位数的每位学生奖励元食堂代金券.
若高一年级组长希望本年级学生获得更多的奖励,则他应该选择哪种方案?
18.(2024·全国·模拟预测)我国中学生的近视率一直是社会关注的焦点.某市疾控中心为调查该市高中生的视力状况,从某高中3000名学生中随机抽取了100名学生用五分记录法统计了其裸眼视力,得到如图1所示的频率分布直方图:
为改善学生的视力状况,该校积极落实学生近视防控工作,建立视力监测制度,几年后,再次抽取100名学生,用五分记录法统计其裸眼视力,得到如下频数分布表:
裸眼视力
人数 5 20 60 15
(1)若裸眼视力位于为轻度近视,用样本估计总体,用频率估计概率,估计近视防控工作开展前全校患轻度近视的学生人数;
(2)在图2中作出近视防控工作开展后100名学生裸眼视力的频率分布直方图;
(3)估计近视防控工作开展后该校学生裸眼视力比开展前学生裸眼视力的平均值提高了多少(同一组中的数据用该组区间的中点值为代表).
19.(2024·陕西安康·模拟预测)首届中国航协航空大会的一个鲜明的特色是在各个展区中设置了多项互动体验活动,吸引了很多的中小学生,其中模拟飞行体验区是让这些中小学生戴上VR眼镜模拟从起飞到降落,大大激发了他们的兴趣爱好.现从某个有互动体验的展区中随机抽取60名中小学生,统计他们的参观时间(从进入该展区到离开该展区的时长,单位:分钟,时间取整数),将时间分成六组,并绘制成如图所示的频率分布直方图.
(1)由频率分布直方图,估计样本的平均数和方差;(每组数据以区间的中点值为代表)
(2)为对比展区是否有体验区对中小学生的吸引程度,某工作人员给出了一份该展区中没有体验区的参观时间的随机数据,经计算得到该组数据参观时长平均值为65分钟,方差为,试判断有体验区的参观时长均值比没有体验区的参观时长均值是否有显著提高?(如果,则认为有显著提高,否则不认为有显著提高)
(3)利用(2)中的结果,你认为展区是否应该设置互动体验展区?请说明理由.
21世纪教育网(www.21cnjy.com)
同课章节目录