9.2.2 总体百分位数的估计(课件+学案+练习)高中数学人教A版(2019)必修第二册

文档属性

名称 9.2.2 总体百分位数的估计(课件+学案+练习)高中数学人教A版(2019)必修第二册
格式 zip
文件大小 10.5MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2025-09-10 22:41:19

文档简介

9.2.2 总体百分位数的估计
一、选择题
1.已知一组数据为1,2,4,5,6,7,8,8,9,9,则第40百分位数是 (  )                 
A.4 B.4.5
C.5 D.5.5
2.[2024·辽宁大连十二中高一月考] 以下数据为参加数学竞赛的15人的成绩(单位:分):56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,则这15人成绩的70%分位数是 (  )
A.86 B.87
C.88 D.89
3.[2024·河北武邑中学高一期末] 样本中共有5个个体,其值分别为a,0,1,2,3.若该样本的中位数为1,则a的取值范围为 (  )
A.0C.14.某校高三年级一共有1200名同学参加数学测验,已知所有学生成绩(单位:分)的第80百分位数是103,则数学成绩不小于103分的人数至少为 (  )
A.220 B.240
C.250 D.300
5.高二年级进行消防知识竞赛,统计所有参赛同学的成绩,已知他们的成绩(单位:分)都在[50,100]内,其频率分布直方图如图所示,则估计所有参赛同学成绩的第75百分位数为 (  )
A.65 B.75 C.85 D.95
6.某市2023年全年空气质量指数(AQI)的分布如下表:
AQI [0, 50) [50, 100) [100, 150) [150, 200) [200, 300) [300, 400]
频率 22.8% 33.2% 18.6% 13.4% 8.2% 3.8%
据此估计该市2023年全年AQI的第80百分位数约为(结果保留到整数) (  )
A.170 B.150 C.160 D.165
7.国家统计局发布的2018年至2022年我国城乡居民社会养老保险基金的收入和支出数据如图所示,则下列说法错误的是 (  )
A.2018年至2022年我国城乡居民社会养老保险基金收入逐年增加
B.2018年至2022年我国城乡居民社会养老保险基金支出逐年增加
C.2018年至2022年我国城乡居民社会养老保险基金收入数据的50%分位数为4852.9
D.2018年至2022年我国城乡居民社会养老保险基金收入数据的40%分位数为4107.0
8.(多选题)[2024·江西赣州重点中学高一月考] 某地一年之内12个月的月降水量(单位:mm)分别为46,51,48,53,56,53,56,64,58,56,66,71,则下列说法正确的是 (  )
A.该地区月降水量的20%分位数为51
B.该地区月降水量的50%分位数为53
C.该地区月降水量的75%分位数为61
D.该地区月降水量的80%分位数为64
9.(多选题)中央广播电视总台《2024年春节联欢晩会》以温暖人心的精品节目、亮点满满的技术创新、美轮美奂的舞美效果为全球华人送上了一道红红火火的文化大餐.某机构随机调查了18位观众对2024年春晩节目的满意度评分情况,得到如下数据:a,60,70,70,72,73,74,74,75,76,77,79,80,83,85,87,93,100.若a恰好是这组数据的上四分位数,则a的值可能为 (  )
A.83 B.84 C.85 D.87
二、填空题
10.下表是足球世界杯连续八届的进球总数:
年份 1994 1998 2002 2006 2010 2014 2018 2022
进球总数 141 171 161 147 145 171 169 172
则进球总数的第40百分位数是    .
11.已知实数x,y满足4≤x12.[2024·宁波镇海中学高一期中] 为贯彻落实党的二十大关于深化全民阅读活动的重要部署,进一步推动青少年学生阅读深入开展,促进全面提升育人水平,教育部决定开展全国青少年学生读书行动.某校实施了全国青少年学生读书行动实施方案,现从该校的2400名学生中发放调查问卷,随机调查100名学生一周的课外阅读时间(单位:分钟),将统计数据按照[0,20),[20,40),[40,60),[60,80),[80,100),[100,120),[120,140]分组后绘制成如图所示的频率分布直方图.
若每周课外阅读时间不低于1小时视为达标,则估计该校达标的学生人数为    ,估计该校学生每周课外阅读时间的第75百分位数约为    (结果保留1位小数).
三、解答题
13.如图为30位学生参加语文竞赛的成绩(单位:分),并由小到大排列.
(1)求第一四分位数;
(2)求第95百分位数.
14.[2024·重庆一中高一月考] 随机抽取100名男学生,测得他们的身高(单位: cm),按照区间[160,165),[165,170),[170,175),[175,180),[180,185]分组,得到频率分布直方图如图所示.
(1)求这100名男学生中身高在170 cm及以上的学生人数;
(2)估计这100名男学生身高的75%分位数.
15.(多选题)2018年至2022年全国快递业务量及其年增长速度如图所示,则 (  )
A.2018年至2022年全国快递业务量逐年增长
B.2018年至2022年全国快递业务量的年增长速度的40%分位数为28.25%
C.2018年至2022年全国快递业务量的年增长速度的45%分位数为26.6%
D.2017年全国快递业务量小于400亿件
16.随着智能手机的普及,手机计步软件迅速流行起来,这类软件能自动记载每日健步走的步数,从而为科学健身提供一定的帮助.某企业为了解员工每日健步走的情况,从该企业正常上班的员工中随机抽取300名,统计他们每日健步走的步数(均不低于2千步,不超过18千步),按步数分组,得到频率分布直方图如图所示.
(1)求a的值.
(2)该企业为了鼓励员工每日进行健步走,决定对步数多的员工进行奖励,为了鼓励员工,企业准备对步数大于或等于第60百分位数的员工进行奖励,请根据频率分布直方图设定好奖励的标准(即步数达到多少则可以获得奖励,结果保留整数).
(3)该企业的某部门共有5名成员在随机抽取的300人中,且这5名成员的步数均属于前40%,能否说明该部门的所有员工都属于前40% 9.2.2 总体百分位数的估计
【学习目标】
  1.结合具体实例,理解百分位数的含义,并用样本百分位数估计总体百分位数,提高学生对统计意义的理解程度.
  2.在样本估计总体的过程中,逐步形成统计思维,提高学生数据分析能力和数据表达能力,逐步树立用数据分析问题、解释生活现象的意识.
◆ 知识点 百分位数
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤
第1步,按    排列原始数据.
第2步,计算i=    .
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第    项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的    .
3.四分位数
      ,      ,      这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
其中第25百分位数也称为      或     等,第75百分位数也称为第三四分位数或     等.
【诊断分析】 1.判断下列说法的正误.(正确的打“√”,错误的打“×”)
(1)若一组样本数据各不相等,则其第75百分位数大于第25百分位数. (  )
(2)若一组样本数据的第10百分位数是23,则在这组数据中有10%的数据大于23. (  )
(3)若一组样本数据的第24百分位数是24,则在这组数据中至少有76%的数据大于或等于24. (  )
(4)在1~100这100个整数中,上四分位数是75.5.(  )
(5)中位数相当于是第50百分位数. (  )
2.某组数据的第p百分位数在此组数据中一定存在吗 为什么
◆ 探究点一 百分位数的概念
例1 下列关于百分位数的说法中,正确的是 (  )
A.百分位数一定是数据中的某一项
B.恰好有k%的数据比第k百分位数小
C.样本的第k百分位数一定是总体的第k百分位数
D.一组数据中不同的百分位数可能相等
变式 15%分位数的含义是 (  )
A.总体中任何一个数小于它的可能性是15%
B.总体中任何一个数小于或等于它的可能性是15%
C.总体中任何一个数大于它的可能性是15%
D.总体中任何一个数大于或等于它的可能性是15%
[素养小结]
百分位数是用于衡量数据的位置的量度,但它所衡量的不一定是中心位置.百分位数提供了有关数据如何在最小值与最大值之间分布的信息.
◆ 探究点二 由样本数据求百分位数
例2 (1)从某果树上随机摘下11个水果,其直径(单位:cm)为12,13,14,14,16,20,20,21,22,23,25,则这组数据的第60百分位数为    .
(2)求下列数据的四分位数.
13,15,12,27,22,24,28,30,31,18,19,20.
变式 (1)某地区某年的月降水量如下表:
月份 1 2 3 4 5 6 7 8 9 10 11 12
月降水量(单位:mm) 58 48 53 46 56 56 51 71 56 53 64 66
根据表中数据,可知该地区该年月降水量的80%分位数是    .
(2)5名学生期中考试的数学成绩(单位:分)分别为98,120,105,110,m,若这5名学生成绩的第60百分位数为111,则m=    .
[素养小结]
设一组数按照从小到大的顺序排列后为x1,x2,…,xn,要求这组数的第p百分位数,先计算i=n×p%的值,如果i不是整数,设i0为大于i的最小整数,那么取为第p百分位数;如果i是整数,那么取为第p百分位数.
◆ 探究点三 由频数(频率)分布表求百分位数
例3 某企业成立的党史学习教育督查组为调研本单位的党史学习情况,采用比例分配的分层随机抽样方法从该企业抽取一个容量为100的样本,经过数据搜集与处理,得到如下频数分布表:
周学习党史时间(单位:分钟) [0,30) [30,60) [60,90) [90,120) [120,150]
高层管理人员 0 0 1 0 2
中层管理人员 1 0 2 2 4
普通员工 9 12 45 20 2
(1)已知该企业的中、高层管理人员共有120人,求该企业普通员工的人数;
(2)为激励先进、鞭策后进,督查组拟公布该企业全体人员的周学习党史时间的平均数P(同一组中的数据用该组区间的中点值作为代表)、第25百分位数M及第75百分位数N,试求P,M,N的估计值(精确到0.1).
变式 (1)从某地区抽取100户居民进行月用电量调查,发现月用电量都在50~350 kW·h之间.将数据分组后得到如下所示的频率分布表,据此估计此地区月用电量的第80百分位数为 (  )
分组 [50, 100) [100, 150) [150, 200) [200, 250) [250, 300) [250, 300] 合计
频率 0.12 0.18 0.30 0.25 0.10 0.05 1
A.230 B.235 C.240 D.245
(2)[2024·昆明部分学校高一期中] 某面包店记录了最近一周A,B两种口味的面包的销售情况,如表所示:
A口味
星期 一 二 三 四 五 六 日
销量(个) 16 12 14 10 18 19 13
B口味
星期 一 二 三 四 五 六 日
销量(个) 13 18 10 20 12 9 14
①试比较最近一周A,B两种口味面包的日销量的第60百分位数的大小.
②该面包店店主将在下一周每天都制作n个A口味的面包,假设下一周A口味面包的日销量和被记录的这一周的日销量保持一致,每个面包当天售出可获利6元,当天未售出将损失5元,从n=14,15,16中,你认为应该选择哪一个 请说明理由.
◆ 探究点四 由频率分布直方图求百分位数
例4 我国是一个严重缺水的国家,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市实行居民生活用水定额管理,即确定一个居民用水量标准m吨,使得86%的居民生活用水不超过这个标准.在本市居民中随机抽取了100户家庭,统计其某年的月均用水量(单位:吨),通过数据分析得到如图所示的频率分布直方图.
(1)求a的值,并估计m的值;
(2)如果我们称m为这组数据的86%分位数,那么估计这组数据的50%分位数.
变式1 根据例2中的频率分布直方图,估计月均用水量的15%分位数.
变式2 [2024·上海黄浦区高一期末] 某营养学研究人员用随机抽样的方法获得了某高校100名女大学生平均每日摄取的热量(单位:千大卡,1千大卡=1000千卡),这组数据的频率分布直方图如图所示.
(1)健康的成年女性每天需要摄取1.80~1.90千大卡(不含1.90千大卡)的热量,试估计该校有百分之多少的女大学生摄取的热量在此范围之内;
(2)已知[1.9,2.0)内的数据为1.9,1.9,1.91,1.91,1.91,1.93,1.94,1.94,1.95,1.95,1.96,1.96, 1.97, 1.98,1.99,若1.91是这100个样本数据的第k百分位数,求正整数k的值.
[素养小结]
根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算,其次估计百分位数在哪一组,再利用方程的思想方法,设出百分位数,解方程可得.9.2.2 总体百分位数的估计
【课前预习】
知识点
2.从小到大 n×p% j 平均数
3.第25百分位数 第50百分位数 第75百分位数 第一四分位数 下四分位数 上四分位数
诊断分析
1.(1)√ (2)× (3)√ (4)√ (5)√ [解析] (2)这组数据中应至少有10%的数据小于或等于23.
2.解:不一定.因为按照计算第p百分位数的步骤,第2步计算i=n×p%,若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数,若第i项与第(i+1)项数据不相等,则第p百分位数在此组数据中就不存在.
【课中探究】
探究点一
例1 D [解析] 对于A,百分位数可能是数据中的某一项,也可能是某两个数据的平均数,故A错误;对于B,不一定恰好有k%的数据比第k百分位数小,故B错误;对于C,样本的第k百分位数和总体的第k百分位数不一定是同一个数据,故C错误;对于D,根据百分位数的定义,可知一组数据中不同的百分位数可能相等,故D正确.故选D.
变式 B [解析] 根据百分位数的定义可知应选B.
探究点二
例2 (1)20 [解析] 因为11×60%=6.6,所以第60百分位数为将这组数据按从小到大的顺序排列后的第7个数,故这组数据的第60百分位数为20.
(2)解:把这12个数据按从小到大的顺序排列,可得12,13,15,18,19,20,22,24,27,28,30,31.因为12×25%=3,12×50%=6,12×75%=9,所以这组数据的第25百分位数为=16.5,第50百分位数为=21,第75百分位数为=27.5.
变式 (1)64 (2)112  [解析] (1)将表中数据按照从小到大的顺序排列,得46,48,51,53,53,56,56,56,58,64,66,71,因为12×80%=9.6,所以80%分位数是第10个数据,即为64.
(2)由5×60%=3,可知第60百分位数即为将这组数据按从小到大的顺序排列后的第3个数据和第4个数据的平均数,所以=111,解得m=112.
探究点三
例3 解:(1)设该企业普通员工的人数为n,因为样本中普通员工有88人,高层管理人员和中层管理人员共有12人,
所以=,解得n=880,
所以该企业普通员工的人数为880.
(2)根据样本数据可得频数分布表如下:
周学习党史时间 (单位:分钟) [0,30) [30,60) [60,90) [90,120) [120,150]
企业人员 10 12 48 22 8
所以估计周学习党史时间的样本数据的平均数为×(15×10+45×12+75×48+105×22+135×8)=×7680=76.8(分钟).
因为10+12<25<10+12+48,所以周学习党史时间的样本数据的第25百分位数在区间[60,90)内,
由60+30×≈61.9,可以估计周学习党史时间的样本数据的第25百分位数约为61.9.
因为10+12+48<75<10+12+48+22,所以周学习党史时间的样本数据的第75百分位数在区间[90,120)内,
由90+30×≈96.8,可以估计周学习党史时间的样本数据的第75百分位数约为96.8,
用样本估计总体,可知P的估计值为76.8,M的估计值约为61.9,N的估计值约为96.8.
变式 (1)C [解析] 估计此地区月用电量的第80百分位数为200+50×=240,故选C.
(2)解:①最近一周A口味面包的日销量按照从小到大的顺序排列为10,12,13,14,16,18,19.
因为7×60%=4.2,所以A口味面包的日销量的第60百分位数为16.
最近一周B口味面包的日销量按照从小到大的顺序排列为9,10,12,13,14,18,20,因为7×60%=4.2,
所以B口味面包的日销量的第60百分位数为14.
故最近一周A口味面包的日销量的第60百分位数大于B口味面包的日销量的第60百分位数.
②当n=14时,下一周A口味的面包可获利(14+12+14+10+14+14+13)×6-[(14-12)+(14-10)+(14-13)]×5=511(元);
当n=15时,下一周A口味的面包可获利(15+12+14+10+15+15+13)×6-[(15-12)+(15-14)+(15-10)+(15-13)]×5=509(元);
当n=16时,下一周A口味的面包可获利(16+12+14+10+16+16+13)×6-[(16-12)+(16-14)+(16-10)+(16-13)]×5=507(元).
因为511>509>507,所以应该选择n=14.
探究点四
例4 解:(1)由频率分布直方图得(0.16+0.30+0.40+0.50+0.30+0.16+a+a+a)×0.5=1,解得a=0.06.
由频率分布直方图得月均用水量在[0,3)内的频率为1-(0.16+0.06+0.06)×0.5=0.86.
∵计划在本市实行居民生活用水定额管理,即确定一个居民用水量标准m吨,使得86%的居民生活用水不超过这个标准,∴估计m=3.
(2)由频率分布直方图知,月均用水量在[0,2)内的频率为(0.06+0.16+0.30+0.40)×0.5=0.46,在[2,2.5)内的频率为0.50×0.5=0.25,
∴估计这组数据的50%分位数是2+×0.5=2.08.
变式1 解:由例2的频率分布直方图知,月均用水量在[0,1)内的频率为(0.06+0.16)×0.5=0.11,在[1,1.5)内的频率为0.3×0.5=0.15,∴估计月均用水量的15%分位数为1+×0.5≈1.133.
变式2 解:(1)由题意得0.1×(0.6+1.1+1.1+1.8+a+1.5+0.8+0.6+0.4)=1,
解得a=2.1,故估计该校有2.1×0.1×100%=21%的女大学生摄取的热量在此范围之内.
(2)在区间[1.4,1.9)内有100×0.1×(0.6+1.1+1.1+1.8+2.1)=67(个)数据,所以1.91是这100个样本数据的第70,71,72个数据,则第70,71个数据的平均数,和第71,72个数据的平均数均为1.91,同时,第69,70个数据的平均数,和第72,73个数据的平均数都不是1.91,所以当1.91是这100个样本数据的第k百分位数时,必有k=70或k=71,故k的值为70或71.(共85张PPT)
9.2 用样本估计总体
9.2.2 总体百分位数的估计
探究点一 百分位数的概念
探究点二 由样本数据求百分位数
探究点三 由频数(频率)分布表求百分
位数
探究点四 由频率分布直方图求百分位数
【学习目标】
1.结合具体实例,理解百分位数的含义,并用样本百分位数估计总
体百分位数,提高学生对统计意义的理解程度.
2.在样本估计总体的过程中,逐步形成统计思维,提高学生数据分析
能力和数据表达能力,逐步树立用数据分析问题、解释生活现象的意识.
知识点 百分位数
1.第 百分位数的定义
一般地,一组数据的第 百分位数是这样一个值,它使得这组数据中
至少有的数据小于或等于这个值,且至少有 的数据大
于或等于这个值.
2.计算一组个数据的第 百分位数的步骤
第1步,按__________排列原始数据.
第2步,计算 ________.
第3步,若不是整数,而大于的比邻整数为,则第 百分位数为第
__项数据;若是整数,则第百分位数为第项与第 项数据的
________.
从小到大
平均数
3.四分位数
______________,______________,______________这三个分位数
把一组由小到大排列后的数据分成四等份,因此称为四分位数.
其中第25百分位数也称为______________或____________等,第75
百分位数也称为第三四分位数或____________等.
第25百分位数
第50百分位数
第75百分位数
第一四分位数
下四分位数
上四分位数
【诊断分析】
1.判断下列说法的正误.(正确的打“√”,错误的打“×”)
(1)若一组样本数据各不相等,则其第75百分位数大于第25百分位
数.( )

(2)若一组样本数据的第10百分位数是23,则在这组数据中有
的数据大于23.( )
×
[解析] 这组数据中应至少有 的数据小于或等于23.
(3)若一组样本数据的第24百分位数是24,则在这组数据中至少有
的数据大于或等于24.( )

(4)在 这100个整数中,上四分位数是75.5.( )

(5)中位数相当于是第50百分位数.( )

2.某组数据的第 百分位数在此组数据中一定存在吗?为什么?
解:不一定.
因为按照计算第 百分位数的步骤,第2步计算,若是整数,
则第百分位数为第项与第 项数据的平均数,若第项与第
项数据不相等,则第 百分位数在此组数据中就不存在.
探究点一 百分位数的概念
例1 下列关于百分位数的说法中,正确的是( )
A.百分位数一定是数据中的某一项
B.恰好有的数据比第 百分位数小
C.样本的第百分位数一定是总体的第 百分位数
D.一组数据中不同的百分位数可能相等

[解析] 对于A,百分位数可能是数据中的某一项,也可能是某两个
数据的平均数,故A错误;
对于B,不一定恰好有的数据比第 百分位数小,故B错误;
对于C,样本的第百分位数和总体的第 百分位数不一定是同一个
数据,故C错误;
对于D,根据百分位数的定义,可知一组数据中不同的百分位数可能
相等,故D正确.故选D.
变式 分位数的含义是( )
A.总体中任何一个数小于它的可能性是
B.总体中任何一个数小于或等于它的可能性是
C.总体中任何一个数大于它的可能性是
D.总体中任何一个数大于或等于它的可能性是
[解析] 根据百分位数的定义可知应选B.

[素养小结]
百分位数是用于衡量数据的位置的量度,但它所衡量的不一定是中心
位置.百分位数提供了有关数据如何在最小值与最大值之间分布的信息.
探究点二 由样本数据求百分位数
例2(1) 从某果树上随机摘下11个水果,其直径(单位: )为12,
13,14,14,16,20,20,21,22,23,25,则这组数据的第60百分位数为
____.
20
[解析] 因为 ,所以第60百分位数为将这组数据按从
小到大的顺序排列后的第7个数,故这组数据的第60百分位数为20.
(2)求下列数据的四分位数.
13,15,12,27,22,24,28,30,31,18,19,20.
解:把这12个数据按从小到大的顺序排列,可得12,13,15,18,19,20,22,
24,27,28,30,31.
因为,, ,所以这组数据的
第25百分位数为 ,第50百分位数为,第75百
分位数为 .
变式(1) 某地区某年的月降水量如下表:
月份 1 2 3 4 5 6 7 8 9 10 11 12
58 48 53 46 56 56 51 71 56 53 64 66
根据表中数据,可知该地区该年月降水量的 分位数是____.
64
[解析] 将表中数据按照从小到大的顺序排列,得46,48,51,53,5
3,56,56,56,58,64,66,71,因为,所以
分位数是第10个数据,即为64.
(2)5名学生期中考试的数学成绩(单位:分)分别为98,120,105,11
0,,若这5名学生成绩的第60百分位数为111,则 ______.
[解析] 由 ,可知第60百分位数即为将这组数据按从小到
大的顺序排列后的第3个数据和第4个数据的平均数,所以
,解得 .
[素养小结]
设一组数按照从小到大的顺序排列后为,, , ,要求这组
数的第百分位数,先计算的值,如果不是整数,设 为
大于的最小整数,那么取为第百分位数;如果 是整数,那么取
为第 百分位数.
探究点三 由频数(频率)分布表求百分位数
例3 某企业成立的党史学习教育督查组为调研本单位的党史学习情
况,采用比例分配的分层随机抽样方法从该企业抽取一个容量为100
的样本,经过数据搜集与处理,得到如下频数分布表:
周学习党史时间 (单位:分钟)
高层管理人员 0 0 1 0 2
中层管理人员 1 0 2 2 4
普通员工 9 12 45 20 2
(1)已知该企业的中、高层管理人员共有120人,求该企业普通员
工的人数;
解:设该企业普通员工的人数为 ,因为样本中普通员工有88人,高
层管理人员和中层管理人员共有12人,
所以,解得 ,
所以该企业普通员工的人数为880.
(2)为激励先进、鞭策后进,督查组拟公布该企业全体人员的周学
习党史时间的平均数 (同一组中的数据用该组区间的中点值作为代
表)、第25百分位数及第75百分位数,试求,, 的估计值
(精确到 ).
解:根据样本数据可得频数分布表如下:
周学习党史时间 (单位:分钟)
企业人员 10 12 48 22 8
所以估计周学习党史时间的样本数据的平均数为
(分钟).
因为 ,所以周学习党史时间的样本数
据的第25百分位数在区间 内,
由 ,可以估计周学习党史时间的样本数据的
第25百分位数约为61.9.
因为 ,所以周学习党史时间
的样本数据的第75百分位数在区间 内,
由 ,可以估计周学习党史时间的样本数据的
第75百分位数约为 ,
用样本估计总体,可知的估计值为,的估计值约为,
的估计值约为96.8.
变式(1) 从某地区抽取100户居民进行月用电量调查,发现月用电
量都在 之间.将数据分组后得到如下所示的频率分
布表,据此估计此地区月用电量的第80百分位数为( )
分组 合

频率 0.12 0.18 0.30 0.25 0.10 0.05 1
A.230 B.235 C.240 D.245
[解析] 估计此地区月用电量的第80百分位数为
,故选C.

(2)[2024·昆明部分学校高一期中] 某面包店记录了最近一周,
两种口味的面包的销售情况,如表所示:
星期 一 二 三 四 五 六 日
销量(个) 16 12 14 10 18 19 13
星期 一 二 三 四 五 六 日
销量(个) 13 18 10 20 12 9 14
①试比较最近一周, 两种口味面包的日销量的第60百分位数的大小.
解:最近一周 口味面包的日销量按照从小到大的顺序排列为10,12,
13,14,16,18,19.
因为,所以 口味面包的日销量的第60百分位数为16.
最近一周 口味面包的日销量按照从小到大的顺序排列为9,10,12,
13,14,18,20,
因为 ,所以 口味面包的日销量的第60百分位数为14.
故最近一周口味面包的日销量的第60百分位数大于 口味面包的日
销量的第60百分位数.
②该面包店店主将在下一周每天都制作个 口味的面包,假设下一
周 口味面包的日销量和被记录的这一周的日销量保持一致,每个面
包当天售出可获利6元,当天未售出将损失5元,从 ,15,16
中,你认为应该选择哪一个 请说明理由.
解:当时,下一周 口味的面包可获利
(元);
当时,下一周 口味的面包可获利
(元);
当时,下一周 口味的面包可获利
(元).
因为,所以应该选择 .
探究点四 由频率分布直方图求百分位数
例4 我国是一个严重缺水的国家,城
市缺水问题较为突出.某市政府为了
节约生活用水,计划在本市实行居民
生活用水定额管理,即确定一个居民
用水量标准吨,使得 的居民生
活用水不超过这个标准.在本市居民中随机抽取了100户家庭,统计其
某年的月均用水量(单位:吨),通过数据分析得到如图所示的频率分
布直方图.
(1)求的值,并估计 的值;
解:由频率分布直方图得

解得 .
由频率分布直方图得月均用水量在
内的频率为 .
计划在本市实行居民生活用水定额管理,即确定一个居民用水量标准 吨,使得 的居民生活用水不超过这个标准,
估计 .
解:由频率分布直方图知,
月均用水量在 内的频率为

在 内的频率为 ,
估计这组数据的分位数是 .
(2)如果我们称为这组数据的 分位
数,那么估计这组数据的 分位数.
变式1 根据例2中的频率分布直方图,估计月均用水量的 分位数.
解:由例2的频率分布直方图知,月均用水量在 内的频率为
,在内的频率为,
估计月均用水量的分位数为 .
变式2 [2024·上海黄浦区高一期末] 某营养学研究人员用随机抽样
的方法获得了某高校100名女大学生平均每日摄取的热量(单位:千
大卡,1千大卡 千卡),这组数据的频率分布直方图如图所示.
(1)健康的成年女性每天需要摄取
千大卡(不含1.90千大卡)
的热量,试估计该校有百分之多少的
女大学生摄取的热量在此范围之内;
解:由题意得
,解得,
故估计该校有 的女大学生摄取的热量在此范
围之内.
(2)已知内的数据为 ,
,,,,, ,
,,,, ,
,, ,若1.91是这100个
样本数据的第百分位数,求正整数
的值.
解:在区间 内有
(个)数据,
所以1.91是这100个样本数据
的第70,71,72个数据,则第70,71
个数据的平均数,和第71,72个数据的平均数均为 ,
同时,第69,70个数据的平均数,和第72,73个数据的平均数都不是 ,所以当1.91是这100个样本数据的第 百分位数时,必有或,故 的值为70或71.
[素养小结]
根据频率分布直方图计算样本数据的百分位数,首先要理解频率分
布直方图中各组数据频率的计算,其次估计百分位数在哪一组,再
利用方程的思想方法,设出百分位数,解方程可得.
1.百分位数是统计学术语,如果一组数据按从小到大排序,并计算相
应的累计百分位,则某一百分位所对应数据的值就称为这一百分位
的百分位数.可以表示为:一组 个观测值按数值大小排列,处于
位置的值被称为第 百分位数.
2.分位数是用于衡量数据的位置的度量,但它所衡量的不一定是中心
位置.百分位数提供了有关数据项如何在最小值与最大值之间分布
的信息.对于无大量重复的数据,第 百分位数将它分为两部分,大
约有的数据项的值比第百分位数小,而大约有 的数
据项的值比第 百分位数大.
任意一组数据与统计图表中百分位数的计算
1.计算个数据的第 百分位数要注意两点:一是将数据按从小到大重
新排序;二是计算出为整数时,则第百分位数为第项与第 项数
据的平均数,而不是第 项数据.
2.利用频率分布直方图求百分位数
百分位数对应左侧小矩形的面积之和.首先确定所求百分位数在哪
个区间,然后从左到右计算左侧所有的小矩形的面积和,百分位数
所在区间需按照对应比例计算面积.
例1 [2024·唐山五校联考] 某中学从高一年级抽取了30名男生,测量
其体重(单位: ),所得结果如下:
62 60 59 59 59 58 58 57 57 57
56 56 56 56 56 56 55 55 55 54
54 54 53 53 52 52 51 50 49 48
(1)求这30名男生体重的分位数和 分位数;
解:将所给数据按照从小到大的顺序排列为
48,49,50,51,52,52,53,53,54,54,54,55,55,55,56,
56,56,56,56,56,57,57,57,58,58,59,59,59,60,62.
因为 ,
所以这30名男生体重的 分位数为第8个数据,即为53,因为

所以这30名男生体重的 分位数为第23个数据,即为57.
(2)估计本校高一年级男生体重的第80百分位数.
解:因为 ,所以估计本校高一年级男生体重的第80百
分位数为 .
例2 [2024·河南南阳高一期末] 我市
某高中对该校高一年级学生某次数学
考试的成绩(单位:分)进行分析,
随机抽取100名学生,将成绩按照
, ,
, 分成6组,制成
了如图所示的频率分布直方图.
(1)求 的值,并估计该校高一年级学生该次数学考试的平均成绩;
解:由

解得 ,
所以成绩在 内的频率为

在 内的频率为 ,
在 内的频率为,在 内的频率为 ,
在 内的频率为

在 的频率为

故估计该校高一年级学生该次数
学考试的平均成绩为
(分).
(2)估计该校高一年级学生该次数学考试成绩的 分位数.
解:由(1)知样本数据中数学考试成绩低于110分的频率为
,低于130分的频率为 ,
所以 分位数一定位于内,
则样本数据的 分位数为 ,
故估计该校高一年级学生该次数学考试成绩的 分位数为115.
练习册
一、选择题
1.已知一组数据为1,2,4,5,6,7,8,8,9,9,则第40百分位数
是( )
A.4 B.4.5 C.5 D.5.5
[解析] 因为数据共有10个, ,所以第40百分位数是
.故选D.

2.[2024·辽宁大连十二中高一月考]以下数据为参加数学竞赛的15人
的成绩(单位:分) ,70,72,78,79,80,81,83,84,86,
88,90,91,94,98,则这15人成绩的 分位数是( )
A.86 B.87 C.88 D.89
[解析] 因为,所以这15人成绩的 分位数是第11
个数,为88.故选C.

3.[2024·河北武邑中学高一期末]样本中共有5个个体,其值分别为 ,
0,1,2,3.若该样本的中位数为1,则 的取值范围为( )
A. B. C. D.
[解析] 因为样本 ,0,1,2,3的中位数为1,所以1排在第三位,
所以 .故选B.

4.某校高三年级一共有1200名同学参加数学测验,已知所有学生成绩
(单位:分)的第80百分位数是103,则数学成绩不小于103分的人
数至少为( )
A.220 B.240 C.250 D.300
[解析] 因为 ,所以成绩小于103分的学生最多有9
60人,所以成绩大于或等于103分的学生至少有
(人).故选B.

5.高二年级进行消防知识竞赛,统计所有参赛
同学的成绩,已知他们的成绩(单位:分)
都在 内,其频率分布直方图如图所示,
则估计所有参赛同学成绩的第75百分位数为
( )
A.65 B.75 C.85 D.95

[解析] 因为
,所以,
所以参赛成绩位于 内的频率为

参赛成绩位于 内的频率为

则所有参赛同学成绩的第75百分位数位于内,
设其为 ,则,解得 ,所以估计所有参赛同学
成绩的第75百分位数为85.故选C.
6.某市2023年全年空气质量指数 的分布如下表:
频率
据此估计该市2023年全年 的第80百分位数约为(结果保留到整数)
( )
A.170 B.150 C.160 D.165

[解析] 由表可知位于 内的频率为
,位于 内的频
率为 ,所以第80百
分位数在内,
由 ,估计该市2023年全年 的第80百分
位数约为170.故选A.
7.国家统计局发布的2018年至2022年我国城乡居民社会养老保险基金
的收入和支出数据如图所示,则下列说法错误的是( )
A.2018年至2022年我国城乡居民社会养老保险基金收入逐年增加
B.2018年至2022年我国城乡居民社会养老保险基金支出逐年增加
C.2018年至2022年我国城乡居民社会养老保险基金收入数据的
分位数为4852.9
D.2018年至2022年我国城乡居民社会养老保险基金收入数据的
分位数为4107.0

[解析] 由条形图可知,2018年至2022年我国城乡居民社会养老保险
基金收入逐年增加,故A中说法正确;
2018年至2022年我国城乡居民社会养老保险基金支出逐年增加,故B
中说法正确;
因为 ,所以2018年至2022年我国城乡居民社会养老保
险基金收入数据的分位数为 ,故C中说法正确;
因为 ,所以2018年至2022年我国城乡居民社会养老保险
基金收入数据的分位数为 ,故D中说法
错误. 故选D.
8.(多选题)[2024·江西赣州重点中学高一月考] 某地一年之内12个
月的月降水量单位: 分别为46,51,48,53,56,53,56,64,
58,56,66,71,则下列说法正确的是( )
A.该地区月降水量的 分位数为51
B.该地区月降水量的 分位数为53
C.该地区月降水量的 分位数为61
D.该地区月降水量的 分位数为64



[解析] 12个月的月降水量单位: 从小到大排列为46,48,51,
53,53,56,56,56,58,64,66,71,由 ,得该
地区月降水量的分位数为51,A正确;
由 ,得该地区月降水量的分位数为,
B错误;
由 ,得该地区月降水量的分位数为 ,C正确;
由,得该地区月降水量的 分位数为64,D正确.故
选 .
9.(多选题)中央广播电视总台《2024年春节联欢晩会》以温暖人心
的精品节目、亮点满满的技术创新、美轮美奂的舞美效果为全球华
人送上了一道红红火火的文化大餐.某机构随机调查了18位观众对
2024年春晩节目的满意度评分情况,得到如下数据: ,60,70,70,72,7
3,74,74,75,76,77,79,80,83,85,87,93,100.若 恰好是这组数据的上四分
位数,则 的值可能为( )
A.83 B.84 C.85 D.87



[解析] 上四分位数即为第75百分位数, ,则将这18
个数据按照从小到大的顺序排列后,第14个数据即为上四分位数,
所以 应是将这18个数据按照从小到大的顺序排列后的第14个数,显
然不是最小的数.
而除去 后,按照从小到大的顺序排列后得到的第13个数为83,第14
个数为85,所以.故选 .
二、填空题
10.下表是足球世界杯连续八届的进球总数:
年份 1994 1998 2002 2006 2010 2014 2018 2022
进球总数 141 171 161 147 145 171 169 172
则进球总数的第40百分位数是_____.
161
[解析] 将连续八届的进球总数从小到大排列为141,145,147,161,
169,171,171,172,因为 ,所以进球总数的第40百
分位数是第4个数据161.
11.已知实数,满足,且1,3,4,,, 的平均数
与分位数相等,则 ____ .
[解析] 根据题意,数据1,3,4,,, 的平均数为
,分位数为,所以 ,整理
得,故 .
12.[2024·宁波镇海中学高一期中] 为贯
彻落实党的二十大关于深化全民阅读活
动的重要部署,进一步推动青少年学生
阅读深入开展,促进全面提升育人水平,
教育部决定开展全国青少年学生读书行动.某校实施了全国青少年学生
读书行动实施方案,现从该校的2400名学生中发放调查问卷,随机调查
100名学生一周的课外阅读时间(单位:分钟),将统计数据按照
,,, 分组
后绘制成如图所示的频率分布直方图.
若每周课外阅读时间不低于1小时视为达标,则估计该校达标的学生
人数为______,估计该校学生每周课外阅读时间的第75百分位数约
为_____(结果保留1位小数).
1440
86.7
[解析] 由题意知,这100名学生中
每周课外阅读时间不低于1小时的
频率为

所以估计该校学生每周课外阅读时间不低于1小时的人数为
,即估计该校达标的学生人数为1440.
因为前4组的频率之和为
,第5组的频率为,
所以第75百分位数位于 内,
所以估计该校学生每周课外阅读时间的第75百分位数为
.
三、解答题
13.如图为30位学生参加语文竞赛的成绩
(单位:分),并由小到大排列.
(1)求第一四分位数;
解:, 位学生参加
语文竞赛的成绩的第一四分位数是从小
到大排序后的第8个数,为65.
(2)求第95百分位数.
解:, 位学生参
加语文竞赛的成绩的第95百分位数是从
小到大排序后的第29个数,为99.
14.[2024·重庆一中高一月考] 随机抽取100名
男学生,测得他们的身高单位: ,按
照区间 ,
, 分组,得到
频率分布直方图如图所示.
(1)求这100名男学生中身高在
及以上的学生人数;
解:由频率分布直方图可知
,解得 ,
故这100名男学生中身高在
及以上的学生人数为
.
(2)估计这100名男学生身高的
分位数.
解:这100名男学生中,身高位于
内的频率为 ,身高位于
内的频率为 ,
所以这100名男学生身高的分位数
位于内.
设这100名男学生身高的 分位数为,
则,解得 ,
故估计这100名男学生身高的 分位数为176.25.
15.(多选题)2018年至2022年全国快递业务量及其年增长速度如图
所示,则( )
A.2018年至2022年全国快递业务量逐年增长
B.2018年至2022年全国快递业务量的年增长速度的 分位数为
C.2018年至2022年全国快递业务量的年增长速度的 分位数为
D.2017年全国快递业务量小于400亿件


[解析] 对于A,2018年至2022年全国快
递业务量逐年增长,故A正确;
对于B,,所以分位
数为 ,故B错误;
对于C,,所以分
位数为 ,故C正确;
对于D,2017年全国快递业务量为
(亿件),大于400亿件,故D错误.故选 .
16.随着智能手机的普及,手机计步软
件迅速流行起来,这类软件能自动记
载每日健步走的步数,从而为科学健
身提供一定的帮助.某企业为了解员工
每日健步走的情况,从该企业正常上
班的员工中随机抽取300名,统计他
们每日健步走的步数(均不低于2千步,不超过18千步),按步数分组,
得到频率分布直方图如图所示.
(1)求 的值.
解:
, .
(2)该企业为了鼓励员工每日进行健步走,决定
对步数多的员工进行奖励,为了鼓励员工,企业
准备对步数大于或等于第60百分位数的员工进行
奖励,请根据频率分布直方图设定好奖励的标准
解:设第60百分位数为 ,则

解得, 步数达到10千步者可以获得奖励.
(即步数达到多少则可以获得奖励,结果保留整数).
(3)该企业的某部门共有5名成员在
随机抽取的300人中,且这5名成员的
步数均属于前 ,能否说明该部门
的所有员工都属于前 ?
解:作为统计的量只能对结果进行估
计,不能给出肯定的判断,故该部门
的所有员工都属于前 是可能的,但并不是一定的.9.2.2 总体百分位数的估计
1.D [解析] 因为数据共有10个,10×40%=4,所以第40百分位数是=5.5.故选D.
2.C [解析] 因为15×70%=10.5,所以这15人成绩的70%分位数是第11个数,为88.故选C.
3.B [解析] 因为样本a,0,1,2,3的中位数为1,所以1排在第三位,所以a≤1.故选B.
4.B [解析] 因为1200×80%=960,所以成绩小于103分的学生最多有960人,所以成绩大于或等于103分的学生至少有1200-960=240(人).故选B.
5.C [解析] 因为(0.2a+0.3a+0.7a+0.6a+0.2a)×10=1,所以a=0.05,所以参赛成绩位于[50,80)内的频率为10×(0.01+0.015+0.035)=0.6,参赛成绩位于[50,90)内的频率为10×(0.01+0.015+0.035+0.03)=0.9,则所有参赛同学成绩的第75百分位数位于[80,90)内,设其为80+y,则0.03y=0.15,解得y=5,所以估计所有参赛同学成绩的第75百分位数为85.故选C.
6.A [解析] 由表可知AQI位于[0,150)内的频率为22.8%+33.2%+18.6%=74.6%<80%,AQI位于[0,200)内的频率为22.8%+33.2%+18.6%+13.4%=88%>80%,所以第80百分位数在[150,200)内,由150+×50≈170,估计该市2023年全年AQI的第80百分位数约为170.故选A.
7.D [解析] 由条形图可知,2018年至2022年我国城乡居民社会养老保险基金收入逐年增加,故A中说法正确;2018年至2022年我国城乡居民社会养老保险基金支出逐年增加,故B中说法正确;因为5×50%=2.5,所以2018年至2022年我国城乡居民社会养老保险基金收入数据的50%分位数为4852.9,故C中说法正确;因为5×40%=2,所以2018年至2022年我国城乡居民社会养老保险基金收入数据的40%分位数为=4479.95,故D中说法错误.故选D.
8.ACD [解析] 12个月的月降水量(单位:mm)从小到大排列为46,48,51,53,53,56,56,56,58,64,66,71,由12×20%=2.4,得该地区月降水量的20%分位数为51,A正确;由12×50%=6,得该地区月降水量的50%分位数为=56,B错误;由12×75%=9,得该地区月降水量的75%分位数为=61,C正确;由12×80%=9.6,得该地区月降水量的80%分位数为64,D正确.故选ACD.
9.ABC [解析] 上四分位数即为第75百分位数,18×75%=13.5,则将这18个数据按照从小到大的顺序排列后,第14个数据即为上四分位数,所以a应是将这18个数据按照从小到大的顺序排列后的第14个数,显然a不是最小的数.而除去a后,按照从小到大的顺序排列后得到的第13个数为83,第14个数为85,所以83≤a≤85.故选ABC.
10.161 [解析] 将连续八届的进球总数从小到大排列为141,145,147,161,169,171,171,172,因为8×40%=3.2,所以进球总数的第40百分位数是第4个数据161.
11.-1 [解析] 根据题意,数据1,3,4,x,y,y+2的平均数为,50%分位数为,所以=,整理得y=x+1,故x-y=-1.
12.1440 86.7 [解析] 由题意知,这100名学生中每周课外阅读时间不低于1小时的频率为(0.015 0+0.007 5+0.005 0+0.002 5)×20=0.6,所以估计该校学生每周课外阅读时间不低于1小时的人数为0.6×2400=1440,即估计该校达标的学生人数为1440.因为前4组的频率之和为(0.002 5+0.005 0+0.012 5+0.015 0)×20=0.7,第5组的频率为0.007 5×20=0.15,所以第75百分位数位于[80,100)内,所以估计该校学生每周课外阅读时间的第75百分位数为80+×20≈86.7.
13.解:(1)∵30×25%=7.5,∴30位学生参加语文竞赛的成绩的第一四分位数是从小到大排序后的第8个数,为65.
(2)∵30×95%=28.5,∴30位学生参加语文竞赛的成绩的第95百分位数是从小到大排序后的第29个数,为99.
14.解:(1)由频率分布直方图可知5×(0.01+0.07+x+0.04+0.02)=1,解得x=0.06,
故这100名男学生中身高在170 cm及以上的学生人数为100×5×(0.06+0.04+0.02)=60.
(2)这100名男学生中,身高位于[180,185]内的频率为5×0.02=0.1,身高位于[175,180)内的频率为5×0.04=0.2,所以这100名男学生身高的75%分位数位于[175,180)内.设这100名男学生身高的75%分位数为x,则0.04×(180-x)+0.1=0.25,解得x=176.25,故估计这100名男学生身高的75%分位数为176.25.
15.AC [解析] 对于A,2018年至2022年全国快递业务量逐年增长,故A正确;对于B,5×40%=2,所以40%分位数为=25.95%,故B错误;对于C,5×45%=2.25,所以45%分位数为26.6%,故C正确;对于D,2017年全国快递业务量为507.1÷(1+26.6%)≈400.6(亿件),大于400亿件,故D错误.故选AC.
16.解:(1)∵2×(0.005+0.005+0.04+0.29+a+0.03+0.015+0.005)=1,∴a=0.11.
(2)设第60百分位数为m,则0.005×2+0.005×2+0.04×2+(m-8)×0.29=0.6,解得m≈9.72≈10,∴步数达到10千步者可以获得奖励.
(3)作为统计的量只能对结果进行估计,不能给出肯定的判断,故该部门的所有员工都属于前40%是可能的,但并不是一定的.