首页
高中语文
高中数学
高中英语
高中物理
高中化学
高中历史
高中道德与法治(政治)
高中地理
高中生物
高中音乐
高中美术
高中体育
高中信息技术
高中通用技术
资源详情
高中数学
人教A版(2019)
必修 第二册
第九章 统计
9.2 用样本估计总体
9.2.2 总体百分位数的估计
9.2.2 总体百分位数的估计(课件+学案+练习)高中数学人教A版(2019)必修第二册
文档属性
名称
9.2.2 总体百分位数的估计(课件+学案+练习)高中数学人教A版(2019)必修第二册
格式
zip
文件大小
10.5MB
资源类型
教案
版本资源
人教A版(2019)
科目
数学
更新时间
2025-09-10 22:41:19
点击下载
文档简介
9.2.2 总体百分位数的估计
一、选择题
1.已知一组数据为1,2,4,5,6,7,8,8,9,9,则第40百分位数是 ( )
A.4 B.4.5
C.5 D.5.5
2.[2024·辽宁大连十二中高一月考] 以下数据为参加数学竞赛的15人的成绩(单位:分):56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,则这15人成绩的70%分位数是 ( )
A.86 B.87
C.88 D.89
3.[2024·河北武邑中学高一期末] 样本中共有5个个体,其值分别为a,0,1,2,3.若该样本的中位数为1,则a的取值范围为 ( )
A.0
C.1
4.某校高三年级一共有1200名同学参加数学测验,已知所有学生成绩(单位:分)的第80百分位数是103,则数学成绩不小于103分的人数至少为 ( )
A.220 B.240
C.250 D.300
5.高二年级进行消防知识竞赛,统计所有参赛同学的成绩,已知他们的成绩(单位:分)都在[50,100]内,其频率分布直方图如图所示,则估计所有参赛同学成绩的第75百分位数为 ( )
A.65 B.75 C.85 D.95
6.某市2023年全年空气质量指数(AQI)的分布如下表:
AQI [0, 50) [50, 100) [100, 150) [150, 200) [200, 300) [300, 400]
频率 22.8% 33.2% 18.6% 13.4% 8.2% 3.8%
据此估计该市2023年全年AQI的第80百分位数约为(结果保留到整数) ( )
A.170 B.150 C.160 D.165
7.国家统计局发布的2018年至2022年我国城乡居民社会养老保险基金的收入和支出数据如图所示,则下列说法错误的是 ( )
A.2018年至2022年我国城乡居民社会养老保险基金收入逐年增加
B.2018年至2022年我国城乡居民社会养老保险基金支出逐年增加
C.2018年至2022年我国城乡居民社会养老保险基金收入数据的50%分位数为4852.9
D.2018年至2022年我国城乡居民社会养老保险基金收入数据的40%分位数为4107.0
8.(多选题)[2024·江西赣州重点中学高一月考] 某地一年之内12个月的月降水量(单位:mm)分别为46,51,48,53,56,53,56,64,58,56,66,71,则下列说法正确的是 ( )
A.该地区月降水量的20%分位数为51
B.该地区月降水量的50%分位数为53
C.该地区月降水量的75%分位数为61
D.该地区月降水量的80%分位数为64
9.(多选题)中央广播电视总台《2024年春节联欢晩会》以温暖人心的精品节目、亮点满满的技术创新、美轮美奂的舞美效果为全球华人送上了一道红红火火的文化大餐.某机构随机调查了18位观众对2024年春晩节目的满意度评分情况,得到如下数据:a,60,70,70,72,73,74,74,75,76,77,79,80,83,85,87,93,100.若a恰好是这组数据的上四分位数,则a的值可能为 ( )
A.83 B.84 C.85 D.87
二、填空题
10.下表是足球世界杯连续八届的进球总数:
年份 1994 1998 2002 2006 2010 2014 2018 2022
进球总数 141 171 161 147 145 171 169 172
则进球总数的第40百分位数是 .
11.已知实数x,y满足4≤x
12.[2024·宁波镇海中学高一期中] 为贯彻落实党的二十大关于深化全民阅读活动的重要部署,进一步推动青少年学生阅读深入开展,促进全面提升育人水平,教育部决定开展全国青少年学生读书行动.某校实施了全国青少年学生读书行动实施方案,现从该校的2400名学生中发放调查问卷,随机调查100名学生一周的课外阅读时间(单位:分钟),将统计数据按照[0,20),[20,40),[40,60),[60,80),[80,100),[100,120),[120,140]分组后绘制成如图所示的频率分布直方图.
若每周课外阅读时间不低于1小时视为达标,则估计该校达标的学生人数为 ,估计该校学生每周课外阅读时间的第75百分位数约为 (结果保留1位小数).
三、解答题
13.如图为30位学生参加语文竞赛的成绩(单位:分),并由小到大排列.
(1)求第一四分位数;
(2)求第95百分位数.
14.[2024·重庆一中高一月考] 随机抽取100名男学生,测得他们的身高(单位: cm),按照区间[160,165),[165,170),[170,175),[175,180),[180,185]分组,得到频率分布直方图如图所示.
(1)求这100名男学生中身高在170 cm及以上的学生人数;
(2)估计这100名男学生身高的75%分位数.
15.(多选题)2018年至2022年全国快递业务量及其年增长速度如图所示,则 ( )
A.2018年至2022年全国快递业务量逐年增长
B.2018年至2022年全国快递业务量的年增长速度的40%分位数为28.25%
C.2018年至2022年全国快递业务量的年增长速度的45%分位数为26.6%
D.2017年全国快递业务量小于400亿件
16.随着智能手机的普及,手机计步软件迅速流行起来,这类软件能自动记载每日健步走的步数,从而为科学健身提供一定的帮助.某企业为了解员工每日健步走的情况,从该企业正常上班的员工中随机抽取300名,统计他们每日健步走的步数(均不低于2千步,不超过18千步),按步数分组,得到频率分布直方图如图所示.
(1)求a的值.
(2)该企业为了鼓励员工每日进行健步走,决定对步数多的员工进行奖励,为了鼓励员工,企业准备对步数大于或等于第60百分位数的员工进行奖励,请根据频率分布直方图设定好奖励的标准(即步数达到多少则可以获得奖励,结果保留整数).
(3)该企业的某部门共有5名成员在随机抽取的300人中,且这5名成员的步数均属于前40%,能否说明该部门的所有员工都属于前40% 9.2.2 总体百分位数的估计
【学习目标】
1.结合具体实例,理解百分位数的含义,并用样本百分位数估计总体百分位数,提高学生对统计意义的理解程度.
2.在样本估计总体的过程中,逐步形成统计思维,提高学生数据分析能力和数据表达能力,逐步树立用数据分析问题、解释生活现象的意识.
◆ 知识点 百分位数
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤
第1步,按 排列原始数据.
第2步,计算i= .
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第 项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的 .
3.四分位数
, , 这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
其中第25百分位数也称为 或 等,第75百分位数也称为第三四分位数或 等.
【诊断分析】 1.判断下列说法的正误.(正确的打“√”,错误的打“×”)
(1)若一组样本数据各不相等,则其第75百分位数大于第25百分位数. ( )
(2)若一组样本数据的第10百分位数是23,则在这组数据中有10%的数据大于23. ( )
(3)若一组样本数据的第24百分位数是24,则在这组数据中至少有76%的数据大于或等于24. ( )
(4)在1~100这100个整数中,上四分位数是75.5.( )
(5)中位数相当于是第50百分位数. ( )
2.某组数据的第p百分位数在此组数据中一定存在吗 为什么
◆ 探究点一 百分位数的概念
例1 下列关于百分位数的说法中,正确的是 ( )
A.百分位数一定是数据中的某一项
B.恰好有k%的数据比第k百分位数小
C.样本的第k百分位数一定是总体的第k百分位数
D.一组数据中不同的百分位数可能相等
变式 15%分位数的含义是 ( )
A.总体中任何一个数小于它的可能性是15%
B.总体中任何一个数小于或等于它的可能性是15%
C.总体中任何一个数大于它的可能性是15%
D.总体中任何一个数大于或等于它的可能性是15%
[素养小结]
百分位数是用于衡量数据的位置的量度,但它所衡量的不一定是中心位置.百分位数提供了有关数据如何在最小值与最大值之间分布的信息.
◆ 探究点二 由样本数据求百分位数
例2 (1)从某果树上随机摘下11个水果,其直径(单位:cm)为12,13,14,14,16,20,20,21,22,23,25,则这组数据的第60百分位数为 .
(2)求下列数据的四分位数.
13,15,12,27,22,24,28,30,31,18,19,20.
变式 (1)某地区某年的月降水量如下表:
月份 1 2 3 4 5 6 7 8 9 10 11 12
月降水量(单位:mm) 58 48 53 46 56 56 51 71 56 53 64 66
根据表中数据,可知该地区该年月降水量的80%分位数是 .
(2)5名学生期中考试的数学成绩(单位:分)分别为98,120,105,110,m,若这5名学生成绩的第60百分位数为111,则m= .
[素养小结]
设一组数按照从小到大的顺序排列后为x1,x2,…,xn,要求这组数的第p百分位数,先计算i=n×p%的值,如果i不是整数,设i0为大于i的最小整数,那么取为第p百分位数;如果i是整数,那么取为第p百分位数.
◆ 探究点三 由频数(频率)分布表求百分位数
例3 某企业成立的党史学习教育督查组为调研本单位的党史学习情况,采用比例分配的分层随机抽样方法从该企业抽取一个容量为100的样本,经过数据搜集与处理,得到如下频数分布表:
周学习党史时间(单位:分钟) [0,30) [30,60) [60,90) [90,120) [120,150]
高层管理人员 0 0 1 0 2
中层管理人员 1 0 2 2 4
普通员工 9 12 45 20 2
(1)已知该企业的中、高层管理人员共有120人,求该企业普通员工的人数;
(2)为激励先进、鞭策后进,督查组拟公布该企业全体人员的周学习党史时间的平均数P(同一组中的数据用该组区间的中点值作为代表)、第25百分位数M及第75百分位数N,试求P,M,N的估计值(精确到0.1).
变式 (1)从某地区抽取100户居民进行月用电量调查,发现月用电量都在50~350 kW·h之间.将数据分组后得到如下所示的频率分布表,据此估计此地区月用电量的第80百分位数为 ( )
分组 [50, 100) [100, 150) [150, 200) [200, 250) [250, 300) [250, 300] 合计
频率 0.12 0.18 0.30 0.25 0.10 0.05 1
A.230 B.235 C.240 D.245
(2)[2024·昆明部分学校高一期中] 某面包店记录了最近一周A,B两种口味的面包的销售情况,如表所示:
A口味
星期 一 二 三 四 五 六 日
销量(个) 16 12 14 10 18 19 13
B口味
星期 一 二 三 四 五 六 日
销量(个) 13 18 10 20 12 9 14
①试比较最近一周A,B两种口味面包的日销量的第60百分位数的大小.
②该面包店店主将在下一周每天都制作n个A口味的面包,假设下一周A口味面包的日销量和被记录的这一周的日销量保持一致,每个面包当天售出可获利6元,当天未售出将损失5元,从n=14,15,16中,你认为应该选择哪一个 请说明理由.
◆ 探究点四 由频率分布直方图求百分位数
例4 我国是一个严重缺水的国家,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市实行居民生活用水定额管理,即确定一个居民用水量标准m吨,使得86%的居民生活用水不超过这个标准.在本市居民中随机抽取了100户家庭,统计其某年的月均用水量(单位:吨),通过数据分析得到如图所示的频率分布直方图.
(1)求a的值,并估计m的值;
(2)如果我们称m为这组数据的86%分位数,那么估计这组数据的50%分位数.
变式1 根据例2中的频率分布直方图,估计月均用水量的15%分位数.
变式2 [2024·上海黄浦区高一期末] 某营养学研究人员用随机抽样的方法获得了某高校100名女大学生平均每日摄取的热量(单位:千大卡,1千大卡=1000千卡),这组数据的频率分布直方图如图所示.
(1)健康的成年女性每天需要摄取1.80~1.90千大卡(不含1.90千大卡)的热量,试估计该校有百分之多少的女大学生摄取的热量在此范围之内;
(2)已知[1.9,2.0)内的数据为1.9,1.9,1.91,1.91,1.91,1.93,1.94,1.94,1.95,1.95,1.96,1.96, 1.97, 1.98,1.99,若1.91是这100个样本数据的第k百分位数,求正整数k的值.
[素养小结]
根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算,其次估计百分位数在哪一组,再利用方程的思想方法,设出百分位数,解方程可得.9.2.2 总体百分位数的估计
【课前预习】
知识点
2.从小到大 n×p% j 平均数
3.第25百分位数 第50百分位数 第75百分位数 第一四分位数 下四分位数 上四分位数
诊断分析
1.(1)√ (2)× (3)√ (4)√ (5)√ [解析] (2)这组数据中应至少有10%的数据小于或等于23.
2.解:不一定.因为按照计算第p百分位数的步骤,第2步计算i=n×p%,若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数,若第i项与第(i+1)项数据不相等,则第p百分位数在此组数据中就不存在.
【课中探究】
探究点一
例1 D [解析] 对于A,百分位数可能是数据中的某一项,也可能是某两个数据的平均数,故A错误;对于B,不一定恰好有k%的数据比第k百分位数小,故B错误;对于C,样本的第k百分位数和总体的第k百分位数不一定是同一个数据,故C错误;对于D,根据百分位数的定义,可知一组数据中不同的百分位数可能相等,故D正确.故选D.
变式 B [解析] 根据百分位数的定义可知应选B.
探究点二
例2 (1)20 [解析] 因为11×60%=6.6,所以第60百分位数为将这组数据按从小到大的顺序排列后的第7个数,故这组数据的第60百分位数为20.
(2)解:把这12个数据按从小到大的顺序排列,可得12,13,15,18,19,20,22,24,27,28,30,31.因为12×25%=3,12×50%=6,12×75%=9,所以这组数据的第25百分位数为=16.5,第50百分位数为=21,第75百分位数为=27.5.
变式 (1)64 (2)112 [解析] (1)将表中数据按照从小到大的顺序排列,得46,48,51,53,53,56,56,56,58,64,66,71,因为12×80%=9.6,所以80%分位数是第10个数据,即为64.
(2)由5×60%=3,可知第60百分位数即为将这组数据按从小到大的顺序排列后的第3个数据和第4个数据的平均数,所以=111,解得m=112.
探究点三
例3 解:(1)设该企业普通员工的人数为n,因为样本中普通员工有88人,高层管理人员和中层管理人员共有12人,
所以=,解得n=880,
所以该企业普通员工的人数为880.
(2)根据样本数据可得频数分布表如下:
周学习党史时间 (单位:分钟) [0,30) [30,60) [60,90) [90,120) [120,150]
企业人员 10 12 48 22 8
所以估计周学习党史时间的样本数据的平均数为×(15×10+45×12+75×48+105×22+135×8)=×7680=76.8(分钟).
因为10+12<25<10+12+48,所以周学习党史时间的样本数据的第25百分位数在区间[60,90)内,
由60+30×≈61.9,可以估计周学习党史时间的样本数据的第25百分位数约为61.9.
因为10+12+48<75<10+12+48+22,所以周学习党史时间的样本数据的第75百分位数在区间[90,120)内,
由90+30×≈96.8,可以估计周学习党史时间的样本数据的第75百分位数约为96.8,
用样本估计总体,可知P的估计值为76.8,M的估计值约为61.9,N的估计值约为96.8.
变式 (1)C [解析] 估计此地区月用电量的第80百分位数为200+50×=240,故选C.
(2)解:①最近一周A口味面包的日销量按照从小到大的顺序排列为10,12,13,14,16,18,19.
因为7×60%=4.2,所以A口味面包的日销量的第60百分位数为16.
最近一周B口味面包的日销量按照从小到大的顺序排列为9,10,12,13,14,18,20,因为7×60%=4.2,
所以B口味面包的日销量的第60百分位数为14.
故最近一周A口味面包的日销量的第60百分位数大于B口味面包的日销量的第60百分位数.
②当n=14时,下一周A口味的面包可获利(14+12+14+10+14+14+13)×6-[(14-12)+(14-10)+(14-13)]×5=511(元);
当n=15时,下一周A口味的面包可获利(15+12+14+10+15+15+13)×6-[(15-12)+(15-14)+(15-10)+(15-13)]×5=509(元);
当n=16时,下一周A口味的面包可获利(16+12+14+10+16+16+13)×6-[(16-12)+(16-14)+(16-10)+(16-13)]×5=507(元).
因为511>509>507,所以应该选择n=14.
探究点四
例4 解:(1)由频率分布直方图得(0.16+0.30+0.40+0.50+0.30+0.16+a+a+a)×0.5=1,解得a=0.06.
由频率分布直方图得月均用水量在[0,3)内的频率为1-(0.16+0.06+0.06)×0.5=0.86.
∵计划在本市实行居民生活用水定额管理,即确定一个居民用水量标准m吨,使得86%的居民生活用水不超过这个标准,∴估计m=3.
(2)由频率分布直方图知,月均用水量在[0,2)内的频率为(0.06+0.16+0.30+0.40)×0.5=0.46,在[2,2.5)内的频率为0.50×0.5=0.25,
∴估计这组数据的50%分位数是2+×0.5=2.08.
变式1 解:由例2的频率分布直方图知,月均用水量在[0,1)内的频率为(0.06+0.16)×0.5=0.11,在[1,1.5)内的频率为0.3×0.5=0.15,∴估计月均用水量的15%分位数为1+×0.5≈1.133.
变式2 解:(1)由题意得0.1×(0.6+1.1+1.1+1.8+a+1.5+0.8+0.6+0.4)=1,
解得a=2.1,故估计该校有2.1×0.1×100%=21%的女大学生摄取的热量在此范围之内.
(2)在区间[1.4,1.9)内有100×0.1×(0.6+1.1+1.1+1.8+2.1)=67(个)数据,所以1.91是这100个样本数据的第70,71,72个数据,则第70,71个数据的平均数,和第71,72个数据的平均数均为1.91,同时,第69,70个数据的平均数,和第72,73个数据的平均数都不是1.91,所以当1.91是这100个样本数据的第k百分位数时,必有k=70或k=71,故k的值为70或71.(共85张PPT)
9.2 用样本估计总体
9.2.2 总体百分位数的估计
探究点一 百分位数的概念
探究点二 由样本数据求百分位数
探究点三 由频数(频率)分布表求百分
位数
探究点四 由频率分布直方图求百分位数
【学习目标】
1.结合具体实例,理解百分位数的含义,并用样本百分位数估计总
体百分位数,提高学生对统计意义的理解程度.
2.在样本估计总体的过程中,逐步形成统计思维,提高学生数据分析
能力和数据表达能力,逐步树立用数据分析问题、解释生活现象的意识.
知识点 百分位数
1.第 百分位数的定义
一般地,一组数据的第 百分位数是这样一个值,它使得这组数据中
至少有的数据小于或等于这个值,且至少有 的数据大
于或等于这个值.
2.计算一组个数据的第 百分位数的步骤
第1步,按__________排列原始数据.
第2步,计算 ________.
第3步,若不是整数,而大于的比邻整数为,则第 百分位数为第
__项数据;若是整数,则第百分位数为第项与第 项数据的
________.
从小到大
平均数
3.四分位数
______________,______________,______________这三个分位数
把一组由小到大排列后的数据分成四等份,因此称为四分位数.
其中第25百分位数也称为______________或____________等,第75
百分位数也称为第三四分位数或____________等.
第25百分位数
第50百分位数
第75百分位数
第一四分位数
下四分位数
上四分位数
【诊断分析】
1.判断下列说法的正误.(正确的打“√”,错误的打“×”)
(1)若一组样本数据各不相等,则其第75百分位数大于第25百分位
数.( )
√
(2)若一组样本数据的第10百分位数是23,则在这组数据中有
的数据大于23.( )
×
[解析] 这组数据中应至少有 的数据小于或等于23.
(3)若一组样本数据的第24百分位数是24,则在这组数据中至少有
的数据大于或等于24.( )
√
(4)在 这100个整数中,上四分位数是75.5.( )
√
(5)中位数相当于是第50百分位数.( )
√
2.某组数据的第 百分位数在此组数据中一定存在吗?为什么?
解:不一定.
因为按照计算第 百分位数的步骤,第2步计算,若是整数,
则第百分位数为第项与第 项数据的平均数,若第项与第
项数据不相等,则第 百分位数在此组数据中就不存在.
探究点一 百分位数的概念
例1 下列关于百分位数的说法中,正确的是( )
A.百分位数一定是数据中的某一项
B.恰好有的数据比第 百分位数小
C.样本的第百分位数一定是总体的第 百分位数
D.一组数据中不同的百分位数可能相等
√
[解析] 对于A,百分位数可能是数据中的某一项,也可能是某两个
数据的平均数,故A错误;
对于B,不一定恰好有的数据比第 百分位数小,故B错误;
对于C,样本的第百分位数和总体的第 百分位数不一定是同一个
数据,故C错误;
对于D,根据百分位数的定义,可知一组数据中不同的百分位数可能
相等,故D正确.故选D.
变式 分位数的含义是( )
A.总体中任何一个数小于它的可能性是
B.总体中任何一个数小于或等于它的可能性是
C.总体中任何一个数大于它的可能性是
D.总体中任何一个数大于或等于它的可能性是
[解析] 根据百分位数的定义可知应选B.
√
[素养小结]
百分位数是用于衡量数据的位置的量度,但它所衡量的不一定是中心
位置.百分位数提供了有关数据如何在最小值与最大值之间分布的信息.
探究点二 由样本数据求百分位数
例2(1) 从某果树上随机摘下11个水果,其直径(单位: )为12,
13,14,14,16,20,20,21,22,23,25,则这组数据的第60百分位数为
____.
20
[解析] 因为 ,所以第60百分位数为将这组数据按从
小到大的顺序排列后的第7个数,故这组数据的第60百分位数为20.
(2)求下列数据的四分位数.
13,15,12,27,22,24,28,30,31,18,19,20.
解:把这12个数据按从小到大的顺序排列,可得12,13,15,18,19,20,22,
24,27,28,30,31.
因为,, ,所以这组数据的
第25百分位数为 ,第50百分位数为,第75百
分位数为 .
变式(1) 某地区某年的月降水量如下表:
月份 1 2 3 4 5 6 7 8 9 10 11 12
58 48 53 46 56 56 51 71 56 53 64 66
根据表中数据,可知该地区该年月降水量的 分位数是____.
64
[解析] 将表中数据按照从小到大的顺序排列,得46,48,51,53,5
3,56,56,56,58,64,66,71,因为,所以
分位数是第10个数据,即为64.
(2)5名学生期中考试的数学成绩(单位:分)分别为98,120,105,11
0,,若这5名学生成绩的第60百分位数为111,则 ______.
[解析] 由 ,可知第60百分位数即为将这组数据按从小到
大的顺序排列后的第3个数据和第4个数据的平均数,所以
,解得 .
[素养小结]
设一组数按照从小到大的顺序排列后为,, , ,要求这组
数的第百分位数,先计算的值,如果不是整数,设 为
大于的最小整数,那么取为第百分位数;如果 是整数,那么取
为第 百分位数.
探究点三 由频数(频率)分布表求百分位数
例3 某企业成立的党史学习教育督查组为调研本单位的党史学习情
况,采用比例分配的分层随机抽样方法从该企业抽取一个容量为100
的样本,经过数据搜集与处理,得到如下频数分布表:
周学习党史时间 (单位:分钟)
高层管理人员 0 0 1 0 2
中层管理人员 1 0 2 2 4
普通员工 9 12 45 20 2
(1)已知该企业的中、高层管理人员共有120人,求该企业普通员
工的人数;
解:设该企业普通员工的人数为 ,因为样本中普通员工有88人,高
层管理人员和中层管理人员共有12人,
所以,解得 ,
所以该企业普通员工的人数为880.
(2)为激励先进、鞭策后进,督查组拟公布该企业全体人员的周学
习党史时间的平均数 (同一组中的数据用该组区间的中点值作为代
表)、第25百分位数及第75百分位数,试求,, 的估计值
(精确到 ).
解:根据样本数据可得频数分布表如下:
周学习党史时间 (单位:分钟)
企业人员 10 12 48 22 8
所以估计周学习党史时间的样本数据的平均数为
(分钟).
因为 ,所以周学习党史时间的样本数
据的第25百分位数在区间 内,
由 ,可以估计周学习党史时间的样本数据的
第25百分位数约为61.9.
因为 ,所以周学习党史时间
的样本数据的第75百分位数在区间 内,
由 ,可以估计周学习党史时间的样本数据的
第75百分位数约为 ,
用样本估计总体,可知的估计值为,的估计值约为,
的估计值约为96.8.
变式(1) 从某地区抽取100户居民进行月用电量调查,发现月用电
量都在 之间.将数据分组后得到如下所示的频率分
布表,据此估计此地区月用电量的第80百分位数为( )
分组 合
计
频率 0.12 0.18 0.30 0.25 0.10 0.05 1
A.230 B.235 C.240 D.245
[解析] 估计此地区月用电量的第80百分位数为
,故选C.
√
(2)[2024·昆明部分学校高一期中] 某面包店记录了最近一周,
两种口味的面包的销售情况,如表所示:
星期 一 二 三 四 五 六 日
销量(个) 16 12 14 10 18 19 13
星期 一 二 三 四 五 六 日
销量(个) 13 18 10 20 12 9 14
①试比较最近一周, 两种口味面包的日销量的第60百分位数的大小.
解:最近一周 口味面包的日销量按照从小到大的顺序排列为10,12,
13,14,16,18,19.
因为,所以 口味面包的日销量的第60百分位数为16.
最近一周 口味面包的日销量按照从小到大的顺序排列为9,10,12,
13,14,18,20,
因为 ,所以 口味面包的日销量的第60百分位数为14.
故最近一周口味面包的日销量的第60百分位数大于 口味面包的日
销量的第60百分位数.
②该面包店店主将在下一周每天都制作个 口味的面包,假设下一
周 口味面包的日销量和被记录的这一周的日销量保持一致,每个面
包当天售出可获利6元,当天未售出将损失5元,从 ,15,16
中,你认为应该选择哪一个 请说明理由.
解:当时,下一周 口味的面包可获利
(元);
当时,下一周 口味的面包可获利
(元);
当时,下一周 口味的面包可获利
(元).
因为,所以应该选择 .
探究点四 由频率分布直方图求百分位数
例4 我国是一个严重缺水的国家,城
市缺水问题较为突出.某市政府为了
节约生活用水,计划在本市实行居民
生活用水定额管理,即确定一个居民
用水量标准吨,使得 的居民生
活用水不超过这个标准.在本市居民中随机抽取了100户家庭,统计其
某年的月均用水量(单位:吨),通过数据分析得到如图所示的频率分
布直方图.
(1)求的值,并估计 的值;
解:由频率分布直方图得
,
解得 .
由频率分布直方图得月均用水量在
内的频率为 .
计划在本市实行居民生活用水定额管理,即确定一个居民用水量标准 吨,使得 的居民生活用水不超过这个标准,
估计 .
解:由频率分布直方图知,
月均用水量在 内的频率为
,
在 内的频率为 ,
估计这组数据的分位数是 .
(2)如果我们称为这组数据的 分位
数,那么估计这组数据的 分位数.
变式1 根据例2中的频率分布直方图,估计月均用水量的 分位数.
解:由例2的频率分布直方图知,月均用水量在 内的频率为
,在内的频率为,
估计月均用水量的分位数为 .
变式2 [2024·上海黄浦区高一期末] 某营养学研究人员用随机抽样
的方法获得了某高校100名女大学生平均每日摄取的热量(单位:千
大卡,1千大卡 千卡),这组数据的频率分布直方图如图所示.
(1)健康的成年女性每天需要摄取
千大卡(不含1.90千大卡)
的热量,试估计该校有百分之多少的
女大学生摄取的热量在此范围之内;
解:由题意得
,解得,
故估计该校有 的女大学生摄取的热量在此范
围之内.
(2)已知内的数据为 ,
,,,,, ,
,,,, ,
,, ,若1.91是这100个
样本数据的第百分位数,求正整数
的值.
解:在区间 内有
(个)数据,
所以1.91是这100个样本数据
的第70,71,72个数据,则第70,71
个数据的平均数,和第71,72个数据的平均数均为 ,
同时,第69,70个数据的平均数,和第72,73个数据的平均数都不是 ,所以当1.91是这100个样本数据的第 百分位数时,必有或,故 的值为70或71.
[素养小结]
根据频率分布直方图计算样本数据的百分位数,首先要理解频率分
布直方图中各组数据频率的计算,其次估计百分位数在哪一组,再
利用方程的思想方法,设出百分位数,解方程可得.
1.百分位数是统计学术语,如果一组数据按从小到大排序,并计算相
应的累计百分位,则某一百分位所对应数据的值就称为这一百分位
的百分位数.可以表示为:一组 个观测值按数值大小排列,处于
位置的值被称为第 百分位数.
2.分位数是用于衡量数据的位置的度量,但它所衡量的不一定是中心
位置.百分位数提供了有关数据项如何在最小值与最大值之间分布
的信息.对于无大量重复的数据,第 百分位数将它分为两部分,大
约有的数据项的值比第百分位数小,而大约有 的数
据项的值比第 百分位数大.
任意一组数据与统计图表中百分位数的计算
1.计算个数据的第 百分位数要注意两点:一是将数据按从小到大重
新排序;二是计算出为整数时,则第百分位数为第项与第 项数
据的平均数,而不是第 项数据.
2.利用频率分布直方图求百分位数
百分位数对应左侧小矩形的面积之和.首先确定所求百分位数在哪
个区间,然后从左到右计算左侧所有的小矩形的面积和,百分位数
所在区间需按照对应比例计算面积.
例1 [2024·唐山五校联考] 某中学从高一年级抽取了30名男生,测量
其体重(单位: ),所得结果如下:
62 60 59 59 59 58 58 57 57 57
56 56 56 56 56 56 55 55 55 54
54 54 53 53 52 52 51 50 49 48
(1)求这30名男生体重的分位数和 分位数;
解:将所给数据按照从小到大的顺序排列为
48,49,50,51,52,52,53,53,54,54,54,55,55,55,56,
56,56,56,56,56,57,57,57,58,58,59,59,59,60,62.
因为 ,
所以这30名男生体重的 分位数为第8个数据,即为53,因为
,
所以这30名男生体重的 分位数为第23个数据,即为57.
(2)估计本校高一年级男生体重的第80百分位数.
解:因为 ,所以估计本校高一年级男生体重的第80百
分位数为 .
例2 [2024·河南南阳高一期末] 我市
某高中对该校高一年级学生某次数学
考试的成绩(单位:分)进行分析,
随机抽取100名学生,将成绩按照
, ,
, 分成6组,制成
了如图所示的频率分布直方图.
(1)求 的值,并估计该校高一年级学生该次数学考试的平均成绩;
解:由
,
解得 ,
所以成绩在 内的频率为
,
在 内的频率为 ,
在 内的频率为,在 内的频率为 ,
在 内的频率为
,
在 的频率为
,
故估计该校高一年级学生该次数
学考试的平均成绩为
(分).
(2)估计该校高一年级学生该次数学考试成绩的 分位数.
解:由(1)知样本数据中数学考试成绩低于110分的频率为
,低于130分的频率为 ,
所以 分位数一定位于内,
则样本数据的 分位数为 ,
故估计该校高一年级学生该次数学考试成绩的 分位数为115.
练习册
一、选择题
1.已知一组数据为1,2,4,5,6,7,8,8,9,9,则第40百分位数
是( )
A.4 B.4.5 C.5 D.5.5
[解析] 因为数据共有10个, ,所以第40百分位数是
.故选D.
√
2.[2024·辽宁大连十二中高一月考]以下数据为参加数学竞赛的15人
的成绩(单位:分) ,70,72,78,79,80,81,83,84,86,
88,90,91,94,98,则这15人成绩的 分位数是( )
A.86 B.87 C.88 D.89
[解析] 因为,所以这15人成绩的 分位数是第11
个数,为88.故选C.
√
3.[2024·河北武邑中学高一期末]样本中共有5个个体,其值分别为 ,
0,1,2,3.若该样本的中位数为1,则 的取值范围为( )
A. B. C. D.
[解析] 因为样本 ,0,1,2,3的中位数为1,所以1排在第三位,
所以 .故选B.
√
4.某校高三年级一共有1200名同学参加数学测验,已知所有学生成绩
(单位:分)的第80百分位数是103,则数学成绩不小于103分的人
数至少为( )
A.220 B.240 C.250 D.300
[解析] 因为 ,所以成绩小于103分的学生最多有9
60人,所以成绩大于或等于103分的学生至少有
(人).故选B.
√
5.高二年级进行消防知识竞赛,统计所有参赛
同学的成绩,已知他们的成绩(单位:分)
都在 内,其频率分布直方图如图所示,
则估计所有参赛同学成绩的第75百分位数为
( )
A.65 B.75 C.85 D.95
√
[解析] 因为
,所以,
所以参赛成绩位于 内的频率为
,
参赛成绩位于 内的频率为
,
则所有参赛同学成绩的第75百分位数位于内,
设其为 ,则,解得 ,所以估计所有参赛同学
成绩的第75百分位数为85.故选C.
6.某市2023年全年空气质量指数 的分布如下表:
频率
据此估计该市2023年全年 的第80百分位数约为(结果保留到整数)
( )
A.170 B.150 C.160 D.165
√
[解析] 由表可知位于 内的频率为
,位于 内的频
率为 ,所以第80百
分位数在内,
由 ,估计该市2023年全年 的第80百分
位数约为170.故选A.
7.国家统计局发布的2018年至2022年我国城乡居民社会养老保险基金
的收入和支出数据如图所示,则下列说法错误的是( )
A.2018年至2022年我国城乡居民社会养老保险基金收入逐年增加
B.2018年至2022年我国城乡居民社会养老保险基金支出逐年增加
C.2018年至2022年我国城乡居民社会养老保险基金收入数据的
分位数为4852.9
D.2018年至2022年我国城乡居民社会养老保险基金收入数据的
分位数为4107.0
√
[解析] 由条形图可知,2018年至2022年我国城乡居民社会养老保险
基金收入逐年增加,故A中说法正确;
2018年至2022年我国城乡居民社会养老保险基金支出逐年增加,故B
中说法正确;
因为 ,所以2018年至2022年我国城乡居民社会养老保
险基金收入数据的分位数为 ,故C中说法正确;
因为 ,所以2018年至2022年我国城乡居民社会养老保险
基金收入数据的分位数为 ,故D中说法
错误. 故选D.
8.(多选题)[2024·江西赣州重点中学高一月考] 某地一年之内12个
月的月降水量单位: 分别为46,51,48,53,56,53,56,64,
58,56,66,71,则下列说法正确的是( )
A.该地区月降水量的 分位数为51
B.该地区月降水量的 分位数为53
C.该地区月降水量的 分位数为61
D.该地区月降水量的 分位数为64
√
√
√
[解析] 12个月的月降水量单位: 从小到大排列为46,48,51,
53,53,56,56,56,58,64,66,71,由 ,得该
地区月降水量的分位数为51,A正确;
由 ,得该地区月降水量的分位数为,
B错误;
由 ,得该地区月降水量的分位数为 ,C正确;
由,得该地区月降水量的 分位数为64,D正确.故
选 .
9.(多选题)中央广播电视总台《2024年春节联欢晩会》以温暖人心
的精品节目、亮点满满的技术创新、美轮美奂的舞美效果为全球华
人送上了一道红红火火的文化大餐.某机构随机调查了18位观众对
2024年春晩节目的满意度评分情况,得到如下数据: ,60,70,70,72,7
3,74,74,75,76,77,79,80,83,85,87,93,100.若 恰好是这组数据的上四分
位数,则 的值可能为( )
A.83 B.84 C.85 D.87
√
√
√
[解析] 上四分位数即为第75百分位数, ,则将这18
个数据按照从小到大的顺序排列后,第14个数据即为上四分位数,
所以 应是将这18个数据按照从小到大的顺序排列后的第14个数,显
然不是最小的数.
而除去 后,按照从小到大的顺序排列后得到的第13个数为83,第14
个数为85,所以.故选 .
二、填空题
10.下表是足球世界杯连续八届的进球总数:
年份 1994 1998 2002 2006 2010 2014 2018 2022
进球总数 141 171 161 147 145 171 169 172
则进球总数的第40百分位数是_____.
161
[解析] 将连续八届的进球总数从小到大排列为141,145,147,161,
169,171,171,172,因为 ,所以进球总数的第40百
分位数是第4个数据161.
11.已知实数,满足,且1,3,4,,, 的平均数
与分位数相等,则 ____ .
[解析] 根据题意,数据1,3,4,,, 的平均数为
,分位数为,所以 ,整理
得,故 .
12.[2024·宁波镇海中学高一期中] 为贯
彻落实党的二十大关于深化全民阅读活
动的重要部署,进一步推动青少年学生
阅读深入开展,促进全面提升育人水平,
教育部决定开展全国青少年学生读书行动.某校实施了全国青少年学生
读书行动实施方案,现从该校的2400名学生中发放调查问卷,随机调查
100名学生一周的课外阅读时间(单位:分钟),将统计数据按照
,,, 分组
后绘制成如图所示的频率分布直方图.
若每周课外阅读时间不低于1小时视为达标,则估计该校达标的学生
人数为______,估计该校学生每周课外阅读时间的第75百分位数约
为_____(结果保留1位小数).
1440
86.7
[解析] 由题意知,这100名学生中
每周课外阅读时间不低于1小时的
频率为
,
所以估计该校学生每周课外阅读时间不低于1小时的人数为
,即估计该校达标的学生人数为1440.
因为前4组的频率之和为
,第5组的频率为,
所以第75百分位数位于 内,
所以估计该校学生每周课外阅读时间的第75百分位数为
.
三、解答题
13.如图为30位学生参加语文竞赛的成绩
(单位:分),并由小到大排列.
(1)求第一四分位数;
解:, 位学生参加
语文竞赛的成绩的第一四分位数是从小
到大排序后的第8个数,为65.
(2)求第95百分位数.
解:, 位学生参
加语文竞赛的成绩的第95百分位数是从
小到大排序后的第29个数,为99.
14.[2024·重庆一中高一月考] 随机抽取100名
男学生,测得他们的身高单位: ,按
照区间 ,
, 分组,得到
频率分布直方图如图所示.
(1)求这100名男学生中身高在
及以上的学生人数;
解:由频率分布直方图可知
,解得 ,
故这100名男学生中身高在
及以上的学生人数为
.
(2)估计这100名男学生身高的
分位数.
解:这100名男学生中,身高位于
内的频率为 ,身高位于
内的频率为 ,
所以这100名男学生身高的分位数
位于内.
设这100名男学生身高的 分位数为,
则,解得 ,
故估计这100名男学生身高的 分位数为176.25.
15.(多选题)2018年至2022年全国快递业务量及其年增长速度如图
所示,则( )
A.2018年至2022年全国快递业务量逐年增长
B.2018年至2022年全国快递业务量的年增长速度的 分位数为
C.2018年至2022年全国快递业务量的年增长速度的 分位数为
D.2017年全国快递业务量小于400亿件
√
√
[解析] 对于A,2018年至2022年全国快
递业务量逐年增长,故A正确;
对于B,,所以分位
数为 ,故B错误;
对于C,,所以分
位数为 ,故C正确;
对于D,2017年全国快递业务量为
(亿件),大于400亿件,故D错误.故选 .
16.随着智能手机的普及,手机计步软
件迅速流行起来,这类软件能自动记
载每日健步走的步数,从而为科学健
身提供一定的帮助.某企业为了解员工
每日健步走的情况,从该企业正常上
班的员工中随机抽取300名,统计他
们每日健步走的步数(均不低于2千步,不超过18千步),按步数分组,
得到频率分布直方图如图所示.
(1)求 的值.
解:
, .
(2)该企业为了鼓励员工每日进行健步走,决定
对步数多的员工进行奖励,为了鼓励员工,企业
准备对步数大于或等于第60百分位数的员工进行
奖励,请根据频率分布直方图设定好奖励的标准
解:设第60百分位数为 ,则
,
解得, 步数达到10千步者可以获得奖励.
(即步数达到多少则可以获得奖励,结果保留整数).
(3)该企业的某部门共有5名成员在
随机抽取的300人中,且这5名成员的
步数均属于前 ,能否说明该部门
的所有员工都属于前 ?
解:作为统计的量只能对结果进行估
计,不能给出肯定的判断,故该部门
的所有员工都属于前 是可能的,但并不是一定的.9.2.2 总体百分位数的估计
1.D [解析] 因为数据共有10个,10×40%=4,所以第40百分位数是=5.5.故选D.
2.C [解析] 因为15×70%=10.5,所以这15人成绩的70%分位数是第11个数,为88.故选C.
3.B [解析] 因为样本a,0,1,2,3的中位数为1,所以1排在第三位,所以a≤1.故选B.
4.B [解析] 因为1200×80%=960,所以成绩小于103分的学生最多有960人,所以成绩大于或等于103分的学生至少有1200-960=240(人).故选B.
5.C [解析] 因为(0.2a+0.3a+0.7a+0.6a+0.2a)×10=1,所以a=0.05,所以参赛成绩位于[50,80)内的频率为10×(0.01+0.015+0.035)=0.6,参赛成绩位于[50,90)内的频率为10×(0.01+0.015+0.035+0.03)=0.9,则所有参赛同学成绩的第75百分位数位于[80,90)内,设其为80+y,则0.03y=0.15,解得y=5,所以估计所有参赛同学成绩的第75百分位数为85.故选C.
6.A [解析] 由表可知AQI位于[0,150)内的频率为22.8%+33.2%+18.6%=74.6%<80%,AQI位于[0,200)内的频率为22.8%+33.2%+18.6%+13.4%=88%>80%,所以第80百分位数在[150,200)内,由150+×50≈170,估计该市2023年全年AQI的第80百分位数约为170.故选A.
7.D [解析] 由条形图可知,2018年至2022年我国城乡居民社会养老保险基金收入逐年增加,故A中说法正确;2018年至2022年我国城乡居民社会养老保险基金支出逐年增加,故B中说法正确;因为5×50%=2.5,所以2018年至2022年我国城乡居民社会养老保险基金收入数据的50%分位数为4852.9,故C中说法正确;因为5×40%=2,所以2018年至2022年我国城乡居民社会养老保险基金收入数据的40%分位数为=4479.95,故D中说法错误.故选D.
8.ACD [解析] 12个月的月降水量(单位:mm)从小到大排列为46,48,51,53,53,56,56,56,58,64,66,71,由12×20%=2.4,得该地区月降水量的20%分位数为51,A正确;由12×50%=6,得该地区月降水量的50%分位数为=56,B错误;由12×75%=9,得该地区月降水量的75%分位数为=61,C正确;由12×80%=9.6,得该地区月降水量的80%分位数为64,D正确.故选ACD.
9.ABC [解析] 上四分位数即为第75百分位数,18×75%=13.5,则将这18个数据按照从小到大的顺序排列后,第14个数据即为上四分位数,所以a应是将这18个数据按照从小到大的顺序排列后的第14个数,显然a不是最小的数.而除去a后,按照从小到大的顺序排列后得到的第13个数为83,第14个数为85,所以83≤a≤85.故选ABC.
10.161 [解析] 将连续八届的进球总数从小到大排列为141,145,147,161,169,171,171,172,因为8×40%=3.2,所以进球总数的第40百分位数是第4个数据161.
11.-1 [解析] 根据题意,数据1,3,4,x,y,y+2的平均数为,50%分位数为,所以=,整理得y=x+1,故x-y=-1.
12.1440 86.7 [解析] 由题意知,这100名学生中每周课外阅读时间不低于1小时的频率为(0.015 0+0.007 5+0.005 0+0.002 5)×20=0.6,所以估计该校学生每周课外阅读时间不低于1小时的人数为0.6×2400=1440,即估计该校达标的学生人数为1440.因为前4组的频率之和为(0.002 5+0.005 0+0.012 5+0.015 0)×20=0.7,第5组的频率为0.007 5×20=0.15,所以第75百分位数位于[80,100)内,所以估计该校学生每周课外阅读时间的第75百分位数为80+×20≈86.7.
13.解:(1)∵30×25%=7.5,∴30位学生参加语文竞赛的成绩的第一四分位数是从小到大排序后的第8个数,为65.
(2)∵30×95%=28.5,∴30位学生参加语文竞赛的成绩的第95百分位数是从小到大排序后的第29个数,为99.
14.解:(1)由频率分布直方图可知5×(0.01+0.07+x+0.04+0.02)=1,解得x=0.06,
故这100名男学生中身高在170 cm及以上的学生人数为100×5×(0.06+0.04+0.02)=60.
(2)这100名男学生中,身高位于[180,185]内的频率为5×0.02=0.1,身高位于[175,180)内的频率为5×0.04=0.2,所以这100名男学生身高的75%分位数位于[175,180)内.设这100名男学生身高的75%分位数为x,则0.04×(180-x)+0.1=0.25,解得x=176.25,故估计这100名男学生身高的75%分位数为176.25.
15.AC [解析] 对于A,2018年至2022年全国快递业务量逐年增长,故A正确;对于B,5×40%=2,所以40%分位数为=25.95%,故B错误;对于C,5×45%=2.25,所以45%分位数为26.6%,故C正确;对于D,2017年全国快递业务量为507.1÷(1+26.6%)≈400.6(亿件),大于400亿件,故D错误.故选AC.
16.解:(1)∵2×(0.005+0.005+0.04+0.29+a+0.03+0.015+0.005)=1,∴a=0.11.
(2)设第60百分位数为m,则0.005×2+0.005×2+0.04×2+(m-8)×0.29=0.6,解得m≈9.72≈10,∴步数达到10千步者可以获得奖励.
(3)作为统计的量只能对结果进行估计,不能给出肯定的判断,故该部门的所有员工都属于前40%是可能的,但并不是一定的.
点击下载
同课章节目录
第六章 平面向量及其应用
6.1 平面向量的概念
6.2 平面向量的运算
6.3 平面向量基本定理及坐标表示
6.4 平面向量的应用
第七章 复数
7.1 复数的概念
7.2 复数的四则运算
7.3 * 复数的三角表示
第八章 立体几何初步
8.1 基本立体图形
8.2 立体图形的直观图
8.3 简单几何体的表面积与体积
8.4 空间点、直线、平面之间的位置关系
8.5 空间直线、平面的平行
8.6 空间直线、平面的垂直
第九章 统计
9.1 随机抽样
9.2 用样本估计总体
9.3 统计分析案例 公司员工
第十章 概率
10.1 随机事件与概率
10.2 事件的相互独立性
10.3 频率与概率
点击下载
VIP下载