14.4.3 用频率分布直方图估计总体分布+14.4.4 百分位数(课件 学案 练习)高中数学苏教版(2019)必修 第二册

文档属性

名称 14.4.3 用频率分布直方图估计总体分布+14.4.4 百分位数(课件 学案 练习)高中数学苏教版(2019)必修 第二册
格式 zip
文件大小 3.6MB
资源类型 教案
版本资源 苏教版(2019)
科目 数学
更新时间 2025-08-07 07:29:52

文档简介

(共69张PPT)
14.4.3 
用频率分布直方图估计总体分布
14.4.4 百分位数
新课程标准解读 核心素养
1.结合实例,能用样本估计总体的取值规律 数据分析
2.结合实例,理解百分位数的统计含义,能用样本估
计百分位数 数学运算
目录
基础知识·重落实
01
典型例题·精研析
02
知能演练·扣课标
03
基础知识·重落实
01
课前预习 必备知识梳理
某大学专业课程考试结果揭晓,根据规定,0.8%的同学需要补考.
【问题】 如何确定需要补考的分数线?
知识点 百分位数
1. 定义:一般地,一组数据的k百分位数是这样一个值pk,它使得这
组数据中至少有 的数据小于或等于pk,且至少有
的数据大于或等于pk.
k百分位数也称为第k百分位数或k%分位数.
如果将样本数据 ,那么k百分位数pk所处
位置如图所示.
k% 
(100
-k)% 
从小到大排列成一行 
2. 计算一组n个数据的k百分位数的步骤
通常,我们按如下方法计算有n个数据的大样本的k百分位数:
第1步 将所有数值按从小到大的顺序排列;
第2步 计算 ;
第3步 如果结果为整数,那么k百分位数位于第 位和下
一位数之间,通常取这两个位置上数值的平均数为k百分位数;
第4步 如果n· 不是整数,那么将其 (即其整数
部分加上1),在该位置上的数值即为k百分位数.
n·  
n·  
向上取整 
3. 四分位数
25,50,75这三个百分位数把一组由小到大排列后的数据分成四等
份,因此称为四分位数,其中,中位数即为50百分位数,25百分位
数也称为下四分位数,75百分位数也称为上四分位数.
【想一想】
1. 某组数据的k百分位数在此组数据中一定存在吗?为什么?
提示:不一定.因为按照计算k百分位数的步骤,第2步计算所得的
n· 如果是整数,则k百分位数为第n· 位和下一位数值的平均
数,若第n· 位和下一位数值不相等,则k百分位数在此组数据
中就不存在.
2. 班级人数为50的班主任老师说“90%的同学能够考取本科院校”,
这里的“90%”是百分位数吗?
提示:不是.是指能够考取本科院校的同学占同学总数的百分比.
1. (多选)下列表述不正确的是(  )
A. 第p百分位数可以有单位
B. 一个总体的四分位数有4个
C. 样本容量越大,第p百分位数估计总体就越准确
D. 对于考试成绩的统计,若小明的成绩处在第95百分位数上,则小
明得了95分


解析:  易知A、C正确;一个总体的四分位数有3个,故B错
误;第95百分位数是指把数据从小到大排序,至少有95%的数据小
于或等于这个值,至少有5%的数据大于或等于这个值,故D错误.
故选B、D.
2. 已知100个数据的75%分位数是9.3,则下列说法正确的是(  )
A. 这100个数据中一定有75个数小于或等于9.3
B. 把这100个数据从小到大排列后,9.3是第75个数据
C. 把这100个数据从小到大排列后,9.3是第75个数据和第76个数据
的平均数
D. 把这100个数据从小到大排列后,9.3是第74个数据和第75个数据
的平均数
解析:  因为100×75%=75为整数,所以第75个数据和第76个数
据的平均数为75%分位数,是9.3,故C正确.故选C.

3. (2024·南通期中)某学生8次素养测试的成绩统计如下:72,76,
78,82,86,88,92,98,则该组数据的第80百分位数为 .
解析:因为8× =6.4,所以该组数据的第80百分位数为第七个
数92.
92 
典型例题·精研析
02
课堂互动 关键能力提升
题型一  用频率分布直方图估计总体分布
【例1】 某校组织了航天知识竞赛,根据该校男、女生人数比例,使用分层抽样的方法随机调查了200名学生,统计他们的成绩(单位:分),样本数据按照[40,50),[50,60),…,[90,100]进行分组,得到如图所示的频率分布直方图.
(1)求a的值并估计该校学生成绩的平均数(每组数据以该组区间的
中点值为代表)和中位数;
解: 由10×(0.001+0.002+0.017+0.04+a+
0.018)=1,得a=0.022.
平均数为10×(45×0.001+55×0.002+65×0.017+
75×0.04+85×0.022+95×0.018)=78.4(分).
设这200名学生成绩的中位数为m,
由频率分布直方图可知m∈[70,80),
且(0.001+0.002+0.017)×10+0.04×(m-70)=0.5,
解得m=77.5(分).
估计该校学生成绩的平均数和中位数分别为78.4分,77.5分.
(2)已知样本中有 的男生的成绩小于80分,成绩不小于80分的男、
女生人数相等,则估计该校男生与女生的人数之比.
解: 由频率分布直方图可知样本中成绩不小于80分的人数为(0.022+0.018)×10×200=80.
由题意知这80人中有40人是男生,
又因为成绩小于80分的男生占样本中男生人数的 ,
故这40名男生占样本中所有男生人数的 ,
因此样本中男生人数为120,女生人数为80,
因此样本是采用分层抽样的方法得到的,
故估计该校男生与女生的人数之比为120∶80=3∶2.
通性通法
解决与频率分布直方图有关问题的关系式
(1) ×组距=频率;
(2) =频率,此关系式的变形为 =样本容量,样本容
量×频率=频数.
【跟踪训练】
 某地区的经济林共有树木8万棵,为了解经济林的生长情况,随机测量其中20棵树木的底部周长,树木的底部周长数据(单位:cm)统计如下表:
分组 频数 频率 频率/组距
[180,200) 1 0.05 0.002 5
[200,220) 1 0.05 0.002 5
[220,240) 2 0.10 0.005 0
[240,260) 3 0.15 0.007 5
[260,280) 4 0.20 0.010 0
[280,300) 6 0.30 0.015 0
[300,320) 2 0.10 0.005 0
[320,340] 1 0.05 0.002 5
合计 20 1 0.050 0
(1)绘制频率分布直方图;
解: 频率分布直方图如图所示.
(2)估计这8万棵树木中底部周长不低于280 cm的有多少棵;
解: 由题意得8×(0.30+0.10+0.05)=3.6(万棵),
所以估计8万棵树木中底部周长不低于280 cm有3.6万棵.
(3)假设同一组中的数据用该组区间的中点值代替,估计这8万棵树
木底部周长的平均周长是多少?
解: 由频率直方图得 =190×0.05+210×0.05+
230×0.10+250×0.15+270×0.20+290×0.30+310×0.10+
330×0.05=269(cm).
故估计这8万棵树木底部周长的平均周长是269 cm.
题型二 百分位数的计算
【例2】 (链接教科书第261页例11)从某珍珠加工公司生产的产品
中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)求这组数据的下四分位数和上四分位数;
解: 下四分位数为25百分位数,上四分位数为75百
分位数,
将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,
8.9,9.0,9.9,
因为共有12个数据,所以12× =3,
又这组数据的第3和第4位数分别是8.0和8.3,
所以这组数据的下四分位数是 =8.15;
又12× =9,这组数据的第9和第10位数分别是8.6和8.9,
所以这组数据的上四分位数是 =8.75.
(2)求这组数据的95百分位数;
解: 因为共有12个数据,所以12× =11.4,
将11.4向上取整得整数12,由(1)得,从小到大排序后的数据的
第12位数是9.9.
所以95百分位数是第12个数据为9.9.
(3)若用25、75、95百分位数把公司生产的珍珠划分为次品、合
格品、优等品和特优品,依照这个样本的数据,给出该公司
珍珠等级的划分标准.
解: 由(1)可知样本数据的25百分位数是8.15,75百分位数
为8.75,95百分位数是9.9,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.75 g的珍珠为合格品,质量大于8.75 g且小于等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.
通性通法
计算一组n个数据的k百分位数的步骤
(1)排序:将所有数值按照从小到大的顺序排列;
(2)计算i:计算i=n×k%;
(3)定数:若i不是整数,大于i的最小整数为j,则k百分位数为第
j项数据;若i是整数,则k百分位数为第i项与第(i+1)项数
据的平均数.
【跟踪训练】
1. 如图所示是根据某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,由图可知这10天最低气温的80百分位数是(  )
A. -2 B. 0
C. 1 D. 2

解析:  由折线图可知,这10天的最低气温按照从小到大的顺序
排列为:-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个
数据,所以10×80%=8,是整数,则这10天最低气温的80百分位
数是 =2.
2. 数据3.2,3.4,3.8,4.2,4.3,4.5,x,6.6的65百分位数是
4.5,则实数x的取值范围是(  )
A. [4.5,+∞) B. [4.5,6.6)
C. (4.5,+∞) D. [4.5,6.6]
解析:  因为8× =5.2,所以这组数据的65百分位数是第6项
数据4.5,则x≥4.5,故选A.

题型三 百分位数的综合应用
【例3】 某市为了鼓励市民节约用
电,实行“阶梯式”电价,将该市
每户居民的月用电量划分为三档,
月用电量不超过200千瓦时的部
分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按
0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千
瓦时)的函数解析式;
解: 当0≤x≤200时,y=0.5x;
当200<x≤400时,y=0.5×200+0.8×(x-200)=0.8x-
60;
当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x
-140.
所以y与x之间的函数解析式为
y=
(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居
民每户的用电量,统计分析后得到如图所示的频率分布直方图.
若这100户居民中,今年1月份用电费用不超过260元的占80%,
求a,b的值;
解: 由(1)可知,当y=260时,x=400,即用电量不超
过400千瓦时的占80%,
结合频率分布直方图可知

解得a=0.001 5,b=0.002 0.
(3)根据(2)中求得的数据计算用电量的75百分位数.
解: 设75百分位数为m,
因为用电量低于300千瓦时的频率为(0.001+0.002+0.003)
×100=0.6,
用电量不超过400千瓦时的频率为0.8,
所以75百分位数m在[300,400)内,
所以0.6+(m-300)×0.002=0.75,
解得m=375千瓦时,即用电量的75百分位数为375千瓦时.
【母题探究】
 (变设问)根据(2)中求得的数据计算用电量的15百分位数.
解:设15百分位数为n,因为用电量低于100千瓦时的频率为
0.001×100=0.1,用电量不超过200千瓦时的频率为0.3,
所以15百分位数n在[100,200)内,
所以0.1+(n-100)×0.002=0.15,
解得n=125千瓦时,即用电量的15百分位数为125千瓦时.
通性通法
  频率分布直方图中p百分位数的求解方法
(1)确定p百分位数所在的区间[a,b);
(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则p
百分位数为a+ ×(b-a).
【跟踪训练】
 从某校随机抽取100名学生,获取了他们一周课外阅读时间(单
位:小时)的数据,整理得到数据分组及频率分布表如下:
排号 分组 频数 频率
1 [0,2) 6 0.06
2 [2,4) 8 0.08
3 [4,6) 17 b
4 [6,8) 22 0.22
5 [8,10) 25 0.25
排号 分组 频数 频率
6 [10,12) 12 0.12
7 [12,14) a 0.06
8 [14,16) 2 0.02
9 [16,18] 2 0.02
合计 100 1
(1)求频率分布表中a,b的值;
解: a=0.06×100=6,b= =0.17.
(2)计算这组数据的50%分位数,并估计是否有50%的学生的阅读时
间达到7.68小时.
解: 阅读时间小于6小时的所占比例是0.06+0.08+0.17
=0.31,
阅读时间小于8小时的所占比例是0.06+0.08+0.17+0.22=
0.53,
所以50%分位数在[6,8)内,
所以50%分位数约为6+2× ≈7.73.
因为7.73>7.68,
所以估计有50%的学生的阅读时间达到7.68小时.
1. 有统计部门记录了某城市轨道交通1号线中的10个车站在某个时间
点上车的人数,统计数据如下:70,60,60,50,60,40,40,
30,30,10.则这组数据的60百分位数是(  )
A. 50 B. 55
C. 60 D. 40
解析:  将数据从小到大排序为10,30,30,40,40,50,60,
60,60,70.因为数据个数为10,且10× =6,所以这组数据的
60百分位数为 =55.故选B.

2. (多选)某厂10名工人在一小时内生产零件的个数分别是15,17,
14,10,15,17,17,16,14,12,设该组数据的平均数为a,50
百分位数为b,则有(  )
A. a=14.7 B. a=14
C. b=15.5 D. b=15


解析:  把该组数据按从小到大的顺序排列为10,12,14,
14,15,15,16,17,17,17,其平均数a= ×(10+12+14+
14+15+15+16+17+17+17)=14.7,50百分位数为b=
=15.故选A、D.
3. 为了了解某学校学生的身体发育情况,抽查了该校100名高中男生
的体重情况,根据所得数据画出样本的频率分布直方图如图所示.
根据此图,估计该校2 000名高中男生中体重不小于70.5 kg的人数
为 .
360 
解析:由题中频率分布直方图,得这100名高中男生体重不小于
70.5 kg的频率是(0.04+0.035+0.015)×2=0.18,所以估计该
校2 000名高中男生
中体重不小于70.5 kg的频率是0.18,则估计该校2 000名高中男生
中体重不小于70.5 kg的人数为2 000×0.18=360.
4. 求下列数据的四分位数.
13,15,12,27,22,24,28,30,31,18,19,20.
解:把12个数据按从小到大的顺序排列可得:12,13,15,18,
19,20,22,24,27,28,30,31,
计算12× =3,12× =6,12× =9,
所以数据的25百分位数为 =16.5,
50百分位数为 =21,
75百分位数为 =27.5.
知能演练·扣课标
03
课后巩固 核心素养落地
1. 已知有8个样本数据分别为4,7,8,11,13,15,20,22,则估计
该组数据的第75百分位数为(  )
A. 9 B. 12
C. 17.5 D. 21
解析:  8×0.75=6,故该组数据的第75百分位数为第6个数和
第7个数的平均数 =17.5.故选C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14

2. 高一年级共有1 000名学生参加物理测试,若所有学生成绩(单
位:分)的第80百分位数是75,则物理成绩大于或等于75分的学生
数至少有(  )
A. 200 B. 220
C. 240 D. 260
解析:  由1 000× =800,所以小于75分的学生最多有800
人,所以大于或等于75分的学生至少有200人.故选A.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
3. 某班学生体检中检查视力的结果如下表,从表中可以看出,全班视
力数据的30%分位数是(  )
视力 0.6及 以下 0.7 0.8 0.9 1.0 1.0及
以上
占全班人数 的百分比 2% 5% 3% 20% 65% 5%
A. 0.9 B. 1.0
解析:  从表中看出,视力为0.9及以下的人数占的百分比为2%
+5%+3%+20%=30%,所以全班视力数据的30%分位数为0.9.
故选A.
C. 0.7 D. 0.6及以下

1
2
3
4
5
6
7
8
9
10
11
12
13
14
4. 某商场在五一促销活动中,对5月1日9时至14时的销售额进行统
计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万
元,则11时到12时的销售额为(  )
A. 6万元 B. 8万元
C. 10万元 D. 12万元

解析:  因为9时至10时的销售额为2.5万元,又9时至10时的频率为0.1,11时至12时的频率为0.4,故11时至12时的销售额为 ×0.4=10(万元).故选C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
5. 某学习小组共有20人,在一次数学测试中,得100分的有2人,得95
分的有4人,得90分的有5人,得85分的有3人,得80分的有5人,得
75分的有1人,则这个学习小组成员该次数学测试成绩的第70百分
位数是(  )
A. 82.5 B. 85
C. 90 D. 92.5

解析:  根据题意,20× =14,这个学习小组成员该次数学
测试成绩的第14项为90,第15项为95,故第70百分位数为 =
92.5.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
6. (多选)(2024·苏州质检)某校高一(1)班某次测试数学成绩累
积频数分布折线图如图所示,则下列说法正确的是(  )
A. 没有人的成绩在30~40分这组内
B. 第50百分位数位于60~70分这组内
C. 第25百分位数位于40~50分这组内
D. 第75百分位数位于70~80分这组内



1
2
3
4
5
6
7
8
9
10
11
12
13
14
解析:  由题图知没有人的成绩在30~40分这组内,故A正
确;由40× =20,取第20、21项数据的平均数,所以第50百分
位数位于60~70分这组内,故B正确;由40× =10,取第10、
11项数据的平均数,所以第25百分位数位于40~50分这组内,故C
正确;由40× =30,取第30、31项数据的平均数,所以第75百
分位数位于60~70分这组内,故D不正确.故选A、B、C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
7. 按从小到大顺序排列的9个数据:10,16,25,33,39,43,m,
65,70,若这组数据的下四分位数与上四分位数的和是73,则m
= .
解析:对于按从小到大顺序排列的9个数据:10,16,25,33,
39,43,m,65,70,因为9× =2.25,所以下四分位数为25.
因为9× =6.75,所以上四分位数为m,所以25+m=73,解得
m=48.
48 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
8. 在共有100名学生参加的某项测试中,小张的成绩排名是第75名,
小李的成绩是75百分位数,则他们两人中成绩较好的是 .
解析:因为小李的成绩是75百分位数,所以约有75名学生的成绩比
小李低,即小李的排名大约为第25名,因为小张的成绩排名是第75
名,所以小李成绩较好.
小李 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
9. 某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之
间,将测试结果分成5组:[13,14),[14,15),[15,16),
[16,17),[17,18],得到如图所示的频率分布直方图,如果从
左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的第70
百分位数约为 秒.
16.5 
解析:设成绩的第70百分位数为x,因为 =0.55, =0.85,所以x∈[16,17),所以0.55+(x-16)
× =0.70,解得x=16.5.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
10. (2024·盐城月考)某大学艺术专业400名学生参加某次测评,根
据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名
学生,记录他们的分数,将数据分成7组:[20,30),[30,
40),…,[80,90],并整理得到如图所示的频率分布直方图:
(1)估计总体400名学生中分数小于70的人数;
解: 根据频率分布直方
图可知,样本中分数不小于
70的频率为(0.02+0.04)
×10=0.6,所以样本中分数
小于70的频率为1-0.6=0.4.所以总体400名学生中分数小于70的人数约为400×0.4=160.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在
区间[40,50)内的人数;
解: 根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5.所以总体中分数在区间[40,50)内的人数估计为400× =20.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(3)根据该大学规定,把15%的学生划定为不及格,利用(2)
中的数据,确定本次测试的及格分数线.
解: 由(2)可知,分数小于50的频率为 =0.1,分数小于60的频率为0.1+0.1=0.2,所以分数的第15百分位数在[50,60)内,由50+10× =55,则本次考试的及格分数线为55分.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
11. 某地区想实行阶梯电价,经调查发现,该地区居民用电量信息
如下:
分位数 50% 分位数 70% 分位数 80% 分位数 90%
分位数
用电量/ (kW·h) 160 176 215 230
如果要求约70%的居民用电在第一阶梯内,约20%的居民用电在
第二阶梯内,可确定第二阶梯电价的用电量范围为(  )
A. (160,176] B. (176,215]
C. (176,230] D. (230,+∞)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
解析:  ∵约70%的居民用电在第一阶梯内,约20%的居民用电
在第二阶梯内,∴由表中数据可得,第二阶梯电价的用电量范围
为(176,230].故选C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
12. (多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条
形统计图如图所示,则(  )
A. 甲的成绩的平均数小于乙的成绩的平均数
B. 甲的成绩的平均数等于乙的成绩的平均数
C. 甲的成绩的第80百分位数等于乙的成绩的第80百分位数
D. 甲的成绩的极差等于乙的成绩的极差



1
2
3
4
5
6
7
8
9
10
11
12
13
14
解析: 由题图可得, = =6, = =
6,A项错误,B项正确;甲的成绩的第80百分位数是 =7.5,
乙的成绩的第80百分位数是 =7.5,所以二者相等,C项正
确;甲的成绩的极差为4,乙的成绩的极差也为4,D项正确.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
13. 小明班上有15名女生,其身高(单位:cm)的第25百分位数为
155,后来转走了一位身高为165 cm的女生,则班上女生身高的第
25百分位数 .(填“变大”“变小”或“不变”)
解析:当班上有15名女生时,由15× =3.75,可知女生身高的
第25百分位数是第4项数据,当转走1人,剩下14名女生时,由
14× =3.5,可知女生身高的第25百分位数是第4项数据,易知转走女生的身高数据不在前4项,所以班上女生身高的第25百分位数不变.
不变 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
14. 某市政府为了减少水资源的浪费,计划通过阶梯式水价制度鼓励
居民节约用水,即确定一户居民月均用水量标准x(单位:t),
用水量不超过x的部分按平价收费,超出x的部分按议价收费.现
通过简单随机抽样获得了100户居民用户的月均用水量数据(单
位:t),并将数据按照[0,4),[4,8),…,[16,20]分成5
组,制成了如图所示的频率分布直方图.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(1)设该市共有20万居民用户,试估计全市居民用户月均用水量
不高于12 t的用户数;
解: 由频率分布直方图可得(a+0.06+0.11+a+
0.02)×4=1,解得a=0.03.
居民用户月均用水量不超过12 t的频率为(0.03+0.06+
0.11)×4=0.80,
所以估计全市20万居民用户中月均用水量不高于12 t的用户
数为20×0.80=16(万).
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(2)若该市政府希望使85%的居民用户月均用水量不超过标准x
t,试估计x的值(精确到0.01);
解: 由频率分布直方图知,居民用户月均用水量不超
过12 t 的频率为0.80.
月均用水量不超过16 t的频率为0.92.则85%的居民用户月均
用水量不超过的标准x∈[12,16),故0.80+0.03(x-
12)=0.85,解得x≈13.67,即x的值为13.67.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(3)假设该市最终确定三级阶梯价制如下:
级差 水量基数x(单位:t) 水费价格(元/t)
第一阶梯 x≤14 1.4
第二阶梯 14<x≤20 2.1
第三阶梯 x>20 2.8
小明家上个月需支付水费共28元,试求小明家上个月的用水量.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
解: 因为19.6=14×1.4<28<14×1.4+(20-14)
×2.1=32.2.所以小明家上个月的用水量达到第二阶梯收
费,未达到第三阶梯收费.
设小明家上个月的用水量为m t,由28=14×1.4+(m-
14)×2.1,得m=18,所以小明家上个月的用水量为18 t.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
谢 谢 观 看!14.4.3 用频率分布直方图估计总体分布
14.4.4 百分位数
1.已知有8个样本数据分别为4,7,8,11,13,15,20,22,则估计该组数据的第75百分位数为(  )
A.9    B.12   C.17.5  D.21
2.高一年级共有1 000名学生参加物理测试,若所有学生成绩(单位:分)的第80百分位数是75,则物理成绩大于或等于75分的学生数至少有(  )
A.200 B.220
C.240 D.260
3.某班学生体检中检查视力的结果如下表,从表中可以看出,全班视力数据的30%分位数是(  )
视力 0.6及以下 0.7 0.8 0.9 1.0 1.0及以上
占全班人数 的百分比 2% 5% 3% 20% 65% 5%
A.0.9 B.1.0
C.0.7 D.0.6及以下
4.某商场在五一促销活动中,对5月1日9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为(  )
A.6万元 B.8万元
C.10万元 D.12万元
5.某学习小组共有20人,在一次数学测试中,得100分的有2人,得95分的有4人,得90分的有5人,得85分的有3人,得80分的有5人,得75分的有1人,则这个学习小组成员该次数学测试成绩的第70百分位数是(  )
A.82.5 B.85
C.90 D.92.5
6.(多选)(2024·苏州质检)某校高一(1)班某次测试数学成绩累积频数分布折线图如图所示,则下列说法正确的是(  )
A.没有人的成绩在30~40分这组内
B.第50百分位数位于60~70分这组内
C.第25百分位数位于40~50分这组内
D.第75百分位数位于70~80分这组内
7.按从小到大顺序排列的9个数据:10,16,25,33,39,43,m,65,70,若这组数据的下四分位数与上四分位数的和是73,则m=    .
8.在共有100名学生参加的某项测试中,小张的成绩排名是第75名,小李的成绩是75百分位数,则他们两人中成绩较好的是    .
9.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图,如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的第70百分位数约为    秒.
10.(2024·盐城月考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图所示的频率分布直方图:
(1)估计总体400名学生中分数小于70的人数;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)根据该大学规定,把15%的学生划定为不及格,利用(2)中的数据,确定本次测试的及格分数线.
11.某地区想实行阶梯电价,经调查发现,该地区居民用电量信息如下:
分位数 50% 分位数 70% 分位数 80% 分位数 90% 分位数
用电量/ (kW·h) 160 176 215 230
如果要求约70%的居民用电在第一阶梯内,约20%的居民用电在第二阶梯内,可确定第二阶梯电价的用电量范围为(  )
A.(160,176] B.(176,215]
C.(176,230] D.(230,+∞)
12.(多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则(  )
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的平均数等于乙的成绩的平均数
C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数
D.甲的成绩的极差等于乙的成绩的极差
13.小明班上有15名女生,其身高(单位:cm)的第25百分位数为155,后来转走了一位身高为165 cm的女生,则班上女生身高的第25百分位数    .(填“变大”“变小”或“不变”)
14.某市政府为了减少水资源的浪费,计划通过阶梯式水价制度鼓励居民节约用水,即确定一户居民月均用水量标准x(单位:t),用水量不超过x的部分按平价收费,超出x的部分按议价收费.现通过简单随机抽样获得了100户居民用户的月均用水量数据(单位:t),并将数据按照[0,4),[4,8),…,[16,20]分成5组,制成了如图所示的频率分布直方图.
(1)设该市共有20万居民用户,试估计全市居民用户月均用水量不高于12 t的用户数;
(2)若该市政府希望使85%的居民用户月均用水量不超过标准x t,试估计x的值(精确到0.01);
(3)假设该市最终确定三级阶梯价制如下:
级差 水量基数x(单位:t) 水费价格(元/t)
第一阶梯 x≤14 1.4
第二阶梯 14<x≤20 2.1
第三阶梯 x>20 2.8
小明家上个月需支付水费共28元,试求小明家上个月的用水量.
14.4.3 用频率分布直方图估计总体分布14.4.4 百分位数
1.C 8×0.75=6,故该组数据的第75百分位数为第6个数和第7个数的平均数=17.5.故选C.
2.A 由1 000×=800,所以小于75分的学生最多有800人,所以大于或等于75分的学生至少有200人.故选A.
3.A 从表中看出,视力为0.9及以下的人数占的百分比为2%+5%+3%+20%=30%,所以全班视力数据的30%分位数为0.9.故选A.
4.C 因为9时至10时的销售额为2.5万元,又9时至10时的频率为0.1,11时至12时的频率为0.4,故11时至12时的销售额为×0.4=10(万元).故选C.
5.D 根据题意,20×=14,这个学习小组成员该次数学测试成绩的第14项为90,第15项为95,故第70百分位数为=92.5.
6.ABC 由题图知没有人的成绩在30~40分这组内,故A正确;由40×=20,取第20、21项数据的平均数,所以第50百分位数位于60~70分这组内,故B正确;由40×=10,取第10、11项数据的平均数,所以第25百分位数位于40~50分这组内,故C正确;由40×=30,取第30、31项数据的平均数,所以第75百分位数位于60~70分这组内,故D不正确.故选A、B、C.
7.48 解析:对于按从小到大顺序排列的9个数据:10,16,25,33,39,43,m,65,70,因为9×=2.25,所以下四分位数为25.因为9×=6.75,所以上四分位数为m,所以25+m=73,解得 m=48.
8.小李 解析:因为小李的成绩是75百分位数,所以约有75名学生的成绩比小李低,即小李的排名大约为第25名,因为小张的成绩排名是第75名,所以小李成绩较好.
9.16.5 解析:设成绩的第70百分位数为x,因为=0.55,=0.85,所以x∈[16,17),所以0.55+(x-16)×=0.70,解得x=16.5.
10.解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.
所以总体400名学生中分数小于70的人数约为400×0.4=160.
(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,
分数在区间[40,50)内的人数为100-100×0.9-5=5.
所以总体中分数在区间[40,50)内的人数估计为400×=20.
(3)由(2)可知,分数小于50的频率为=0.1,分数小于60的频率为0.1+0.1=0.2,所以分数的第15百分位数在[50,60)内,由50+10×=55,则本次考试的及格分数线为55分.
11.C ∵约70%的居民用电在第一阶梯内,约20%的居民用电在第二阶梯内,∴由表中数据可得,第二阶梯电价的用电量范围为(176,230].故选C.
12.BCD 由题图可得,==6,==6,A项错误,B项正确;甲的成绩的第80百分位数是=7.5,乙的成绩的第80百分位数是=7.5,所以二者相等,C项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D项正确.
13.不变 解析:当班上有15名女生时,由15×=3.75,可知女生身高的第25百分位数是第4项数据,当转走1人,剩下14名女生时,由14×=3.5,可知女生身高的第25百分位数是第4项数据,易知转走女生的身高数据不在前4项,所以班上女生身高的第25百分位数不变.
14.解:(1)由频率分布直方图可得(a+0.06+0.11+a+0.02)×4=1,解得a=0.03.
居民用户月均用水量不超过12 t的频率为(0.03+0.06+0.11)×4=0.80,
所以估计全市20万居民用户中月均用水量不高于12 t的用户数为20×0.80=16(万).
(2)由频率分布直方图知,居民用户月均用水量不超过12 t 的频率为0.80.
月均用水量不超过16 t的频率为0.92.则85%的居民用户月均用水量不超过的标准x∈[12,16),故0.80+0.03(x-12)=0.85,解得x≈13.67,即x的值为13.67.
(3)因为19.6=14×1.4<28<14×1.4+(20-14)×2.1=32.2.所以小明家上个月的用水量达到第二阶梯收费,未达到第三阶梯收费.
设小明家上个月的用水量为m t,由28=14×1.4+(m-14)×2.1,得m=18,所以小明家上个月的用水量为18 t.
3 / 314.4.3 用频率分布直方图估计总体分布
14.4.4 百分位数
新课程标准解读 核心素养
1.结合实例,能用样本估计总体的取值规律 数据分析
2.结合实例,理解百分位数的统计含义,能用样本估计百分位数 数学运算
  某大学专业课程考试结果揭晓,根据规定,0.8%的同学需要补考.
【问题】 如何确定需要补考的分数线?
                                            
                                            
知识点 百分位数
1.定义:一般地,一组数据的k百分位数是这样一个值pk,它使得这组数据中至少有    的数据小于或等于pk,且至少有      的数据大于或等于pk.
k百分位数也称为第k百分位数或k%分位数.
如果将样本数据        ,那么k百分位数pk所处位置如图所示.
2.计算一组n个数据的k百分位数的步骤
通常,我们按如下方法计算有n个数据的大样本的k百分位数:
第1步 将所有数值按从小到大的顺序排列;
第2步 计算    ;
第3步 如果结果为整数,那么k百分位数位于第    位和下一位数之间,通常取这两个位置上数值的平均数为k百分位数;
第4步 如果n·不是整数,那么将其      (即其整数部分加上1),在该位置上的数值即为k百分位数.
3.四分位数
25,50,75这三个百分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中,中位数即为50百分位数,25百分位数也称为下四分位数,75百分位数也称为上四分位数.
【想一想】
1.某组数据的k百分位数在此组数据中一定存在吗?为什么?
2.班级人数为50的班主任老师说“90%的同学能够考取本科院校”,这里的“90%”是百分位数吗?
1.(多选)下列表述不正确的是(  )
A.第p百分位数可以有单位
B.一个总体的四分位数有4个
C.样本容量越大,第p百分位数估计总体就越准确
D.对于考试成绩的统计,若小明的成绩处在第95百分位数上,则小明得了95分
2.已知100个数据的75%分位数是9.3,则下列说法正确的是(  )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第74个数据和第75个数据的平均数
3.(2024·南通期中)某学生8次素养测试的成绩统计如下:72,76,78,82,86,88,92,98,则该组数据的第80百分位数为    .
题型一  用频率分布直方图估计总体分布
【例1】 某校组织了航天知识竞赛,根据该校男、女生人数比例,使用分层抽样的方法随机调查了200名学生,统计他们的成绩(单位:分),样本数据按照[40,50),[50,60),…,[90,100]进行分组,得到如图所示的频率分布直方图.
(1)求a的值并估计该校学生成绩的平均数(每组数据以该组区间的中点值为代表)和中位数;
(2)已知样本中有的男生的成绩小于80分,成绩不小于80分的男、女生人数相等,则估计该校男生与女生的人数之比.
通性通法
解决与频率分布直方图有关问题的关系式
(1)×组距=频率;
(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数.
【跟踪训练】
 某地区的经济林共有树木8万棵,为了解经济林的生长情况,随机测量其中20棵树木的底部周长,树木的底部周长数据(单位:cm)统计如下表:
分组 频数 频率 频率/组距
[180,200) 1 0.05 0.002 5
[200,220) 1 0.05 0.002 5
[220,240) 2 0.10 0.005 0
[240,260) 3 0.15 0.007 5
[260,280) 4 0.20 0.010 0
[280,300) 6 0.30 0.015 0
[300,320) 2 0.10 0.005 0
[320,340] 1 0.05 0.002 5
合计 20 1 0.050 0
(1)绘制频率分布直方图;
(2)估计这8万棵树木中底部周长不低于280 cm的有多少棵;
(3)假设同一组中的数据用该组区间的中点值代替,估计这8万棵树木底部周长的平均周长是多少?
题型二 百分位数的计算
【例2】 (链接教科书第261页例11)从某珍珠加工公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)求这组数据的下四分位数和上四分位数;
(2)求这组数据的95百分位数;
(3)若用25、75、95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.
通性通法
计算一组n个数据的k百分位数的步骤
(1)排序:将所有数值按照从小到大的顺序排列;
(2)计算i:计算i=n×k%;
(3)定数:若i不是整数,大于i的最小整数为j,则k百分位数为第j项数据;若i是整数,则k百分位数为第i项与第(i+1)项数据的平均数.
【跟踪训练】
1.如图所示是根据某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,由图可知这10天最低气温的80百分位数是(  )
A.-2         B.0
C.1 D.2
2.数据3.2,3.4,3.8,4.2,4.3,4.5,x,6.6的65百分位数是4.5,则实数x的取值范围是(  )
A.[4.5,+∞) B.[4.5,6.6)
C.(4.5,+∞) D.[4.5,6.6]
题型三 百分位数的综合应用
【例3】 某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式;
(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b的值;
(3)根据(2)中求得的数据计算用电量的75百分位数.
【母题探究】
 (变设问)根据(2)中求得的数据计算用电量的15百分位数.
通性通法
  频率分布直方图中p百分位数的求解方法
(1)确定p百分位数所在的区间[a,b);
(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则p百分位数为a+×(b-a).
【跟踪训练】
 从某校随机抽取100名学生,获取了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频率分布表如下:
排号 分组 频数 频率
1 [0,2) 6 0.06
2 [2,4) 8 0.08
3 [4,6) 17 b
4 [6,8) 22 0.22
5 [8,10) 25 0.25
6 [10,12) 12 0.12
7 [12,14) a 0.06
8 [14,16) 2 0.02
9 [16,18] 2 0.02
合计 100 1
(1)求频率分布表中a,b的值;
(2)计算这组数据的50%分位数,并估计是否有50%的学生的阅读时间达到7.68小时.
1.有统计部门记录了某城市轨道交通1号线中的10个车站在某个时间点上车的人数,统计数据如下:70,60,60,50,60,40,40,30,30,10.则这组数据的60百分位数是(  )
A.50 B.55
C.60 D.40
2.(多选)某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,50百分位数为b,则有(  )
A.a=14.7 B.a=14
C.b=15.5 D.b=15
3.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示.根据此图,估计该校2 000名高中男生中体重不小于70.5 kg的人数为    .
4.求下列数据的四分位数.
13,15,12,27,22,24,28,30,31,18,19,20.
14.4.3 用频率分布直方图估计总体分布
14.4.4 百分位数
【基础知识·重落实】
知识点
1.k% (100-k)% 从小到大排列成一行 2.n· n· 向上取整
想一想
1.提示:不一定.因为按照计算k百分位数的步骤,第2步计算所得的n·如果是整数,则k百分位数为第n·位和下一位数值的平均数,若第n·位和下一位数值不相等,则k百分位数在此组数据中就不存在.
2.提示:不是.是指能够考取本科院校的同学占同学总数的百分比.
自我诊断
1.BD 易知A、C正确;一个总体的四分位数有3个,故B错误;第95百分位数是指把数据从小到大排序,至少有95%的数据小于或等于这个值,至少有5%的数据大于或等于这个值,故D错误.故选B、D.
2.C 因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为75%分位数,是9.3,故C正确.故选C.
3.92 解析:因为8×=6.4,所以该组数据的第80百分位数为第七个数92.
【典型例题·精研析】
【例1】 解:(1)由10×(0.001+0.002+0.017+0.04+a+0.018)=1,
得a=0.022.
平均数为10×(45×0.001+55×0.002+65×0.017+75×0.04+85×0.022+95×0.018)=78.4(分).
设这200名学生成绩的中位数为m,
由频率分布直方图可知m∈[70,80),
且(0.001+0.002+0.017)×10+0.04×(m-70)=0.5,
解得m=77.5(分).
估计该校学生成绩的平均数和中位数分别为78.4分,77.5分.
(2)由频率分布直方图可知样本中成绩不小于80分的人数为(0.022+0.018)×10×200=80.
由题意知这80人中有40人是男生,
又因为成绩小于80分的男生占样本中男生人数的,
故这40名男生占样本中所有男生人数的,
因此样本中男生人数为120,女生人数为80,
因此样本是采用分层抽样的方法得到的,
故估计该校男生与女生的人数之比为120∶80=3∶2.
跟踪训练
 解:(1)频率分布直方图如图所示.
(2)由题意得8×(0.30+0.10+0.05)=3.6(万棵),
所以估计8万棵树木中底部周长不低于280 cm有3.6万棵.
(3)由频率直方图得=190×0.05+210×0.05+230×0.10+250×0.15+270×0.20+290×0.30+310×0.10+330×0.05=269(cm).
故估计这8万棵树木底部周长的平均周长是269 cm.
【例2】 解:(1)下四分位数为25百分位数,上四分位数为75百分位数,
将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,所以12×=3,
又这组数据的第3和第4位数分别是8.0和8.3,
所以这组数据的下四分位数是=8.15;
又12×=9,这组数据的第9和第10位数分别是8.6和8.9,
所以这组数据的上四分位数是=8.75.
(2)因为共有12个数据,所以12×=11.4,
将11.4向上取整得整数12,由(1)得,从小到大排序后的数据的第12位数是9.9.
所以95百分位数是第12个数据为9.9.
(3)由(1)可知样本数据的25百分位数是8.15,75百分位数为8.75,95百分位数是9.9,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.75 g的珍珠为合格品,质量大于8.75 g且小于等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.
跟踪训练
1.D 由折线图可知,这10天的最低气温按照从小到大的顺序排列为:-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个数据,所以10×80%=8,是整数,则这10天最低气温的80百分位数是=2.
2.A 因为8×=5.2,所以这组数据的65百分位数是第6项数据4.5,则x≥4.5,故选A.
【例3】 解:(1)当0≤x≤200时,y=0.5x;
当200<x≤400时,y=0.5×200+0.8×(x-200)=0.8x-60;
当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140.
所以y与x之间的函数解析式为
y=
(2)由(1)可知,当y=260时,x=400,即用电量不超过400千瓦时的占80%,
结合频率分布直方图可知
解得a=0.001 5,b=0.002 0.
(3)设75百分位数为m,
因为用电量低于300千瓦时的频率为(0.001+0.002+0.003)×100=0.6,
用电量不超过400千瓦时的频率为0.8,
所以75百分位数m在[300,400)内,
所以0.6+(m-300)×0.002=0.75,
解得m=375千瓦时,即用电量的75百分位数为375千瓦时.
母题探究
 解:设15百分位数为n,因为用电量低于100千瓦时的频率为0.001×100=0.1,用电量不超过200千瓦时的频率为0.3,
所以15百分位数n在[100,200)内,
所以0.1+(n-100)×0.002=0.15,
解得n=125千瓦时,即用电量的15百分位数为125千瓦时.
跟踪训练
 解:(1)a=0.06×100=6,b==0.17.
(2)阅读时间小于6小时的所占比例是0.06+0.08+0.17=0.31,
阅读时间小于8小时的所占比例是0.06+0.08+0.17+0.22=0.53,
所以50%分位数在[6,8)内,
所以50%分位数约为6+2×≈7.73.
因为7.73>7.68,
所以估计有50%的学生的阅读时间达到7.68小时.
随堂检测
1.B 将数据从小到大排序为10,30,30,40,40,50,60,60,60,70.因为数据个数为10,且10×=6,所以这组数据的60百分位数为=55.故选B.
2.AD 把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a=×(10+12+14+14+15+15+16+17+17+17)=14.7,50百分位数为b==15.故选A、D.
3.360 解析:由题中频率分布直方图,得这100名高中男生体重不小于70.5 kg的频率是(0.04+0.035+0.015)×2=0.18,所以估计该校2 000名高中男生中体重不小于70.5 kg的频率是0.18,则估计该校2 000名高中男生中体重不小于70.5 kg的人数为2 000×0.18=360.
4.解:把12个数据按从小到大的顺序排列可得:12,13,15,18,19,20,22,24,27,28,30,31,
计算12×=3,12×=6,12×=9,
所以数据的25百分位数为=16.5,
50百分位数为=21,
75百分位数为=27.5.
4 / 5