9.2.2 总体百分位数的估计
—— (教学方式:深化学习课—梯度进阶式教学)
[课时目标]
1.结合实例,能用样本估计百分位数,理解百分位数的统计含义.
2.在学习和应用百分位数的过程中,要把实际问题转化为数学问题,并进行计算.
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有________的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤
第1步,按____________排列原始数据.
第2步,计算i=__________.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第________项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的__________.
3.四分位数
第25百分位数,第50百分位数,第75百分位数这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
|微|点|助|解|
(1)四分位数把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
(2)百分位数的特点
①一组数据的第p百分位数可能在这组数据中,也可能不在.
②一组数据的某些百分位数可能是同一个数.
1.判断正误(正确的画“√”,错误的画“×”)
(1)若一组样本数据各不相等,则其75%分位数大于25%分位数.( )
(2)若一组样本数据的10%分位数是23,则在这组数据中有10%的数据大于23.( )
(3)若一组样本数据的24%分位数是24,则在这组数据中至少有76%的数据大于或等于24.( )
2.下列关于一组数据的第50百分位数的说法正确的是( )
A.第50百分位数就是中位数
B.总体数据中的任意一个数小于它的可能性一定是50%
C.它一定是这组数据中的一个数据
D.它适用于总体是连续型的数据
3.数据12,14,15,17,19,23,27,30的第70百分位数是( )
A.14 B.17
C.19 D.23
题型(一) 对百分位数含义的理解
[例1] (多选)下列表述不正确的是( )
A.第p百分位数可以有单位
B.一个总体的四分位数有4个
C.样本容量越大,第p百分位数估计总体就越准确
D.对于考试成绩的统计,若小明的成绩处在第95百分位数上,则小明得了95分
听课记录:
|思|维|建|模|
分位数是用于衡量数据的位置的度量,但它所衡量的不一定是中心位置.百分位数提供了有关数据项如何在最小值与最大值之间分布的信息.
[针对训练]
1.已知100个数据的75%分位数是9.3,则下列说法正确的是( )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第74个数据和第75个数据的平均数
题型(二) 百分位数的计算
[例2] (1)按从小到大顺序排列的两组数据:甲组:30,31,37,m,42,60;乙组:28,n,33,44,48,70,若这两组数据的第30百分位数,第50百分位数都分别对应相等,则m+n=( )
A.60 B.65
C.70 D.71
(2)某学习小组(共18位同学)在一次数学周测中的成绩(单位:分)如下:
a 87 101 109 112 115 116 118 119
119 121 122 126 127 129 130 135 142
若正整数a是这组数据的上四分位数,则a的一个可能取值为________.
听课记录:
|思|维|建|模|
计算一组n个数据的第p百分位数的一般步骤
(1)排列:按照从小到大排列原始数据;
(2)计算i:计算i=n×p%;
(3)定数:若i不是整数,大于i的最小整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
[针对训练]
2.从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的第25,75,95百分位数;
(2)请你找出珍珠质量较小的前15%的珍珠质量;
(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.
题型(三) 百分位数的综合应用
[例3] 某校对100名高一学生的某次数学测试成绩进行统计,分成[50,60),[60,70),[70,80),[80,90),[90,100]五组,得到如图所示频率分布直方图.
(1)求图中a的值;
(2)估计该校学生数学成绩的第75百分位数.
听课记录:
|思|维|建|模|
由频率分布直方图求百分位数的方法
(1)要注意频率分布直方图中小矩形的面积,就是数据落在该组的频率.
(2)一般采用方程的思想,设出第p百分位数,根据其意义列出方程并求解即可.
[针对训练]
3.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下这60株树木的底部周长的第50百分位数和第75百分位数吗?
9.2.2 总体百分位数的估计
课前预知教材
1.p% 2.从小到大 n×p% j 平均数
[基础落实训练]
1.(1)√ (2)× (3)√
2.A 3.选D 因为8×70%=5.6,故第70百分位数是第六项数据23.
?课堂题点研究
[题型(一)]
[例1] 选BD 一个总体的第25百分位数,第50百分位数,第75百分位数是总体的四分位数,有3个,所以B错误.第95百分位数是指把数据从小到大排序,至少有95%的数据小于或等于这个值,至少有5%的数据大于或等于这个值,D错误.
[针对训练]
1.选C 因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为75%分位数,是9.3,故C正确.
[题型(二)]
[例2] 解析:(1)由30%×6=1.8,则甲组数据的第30百分位数为31,乙组数据的第30百分位数为n,即n=31,第50百分位数即中位数,则乙组数据的第50百分位数为,甲组数据的第50百分位数为,于是=,解得m=40,所以m+n=71.故选D.
(2)将所给的数据除a外按从小到大的顺序排列为87,101,109,112,115,116,118,119,119,121,122,126,127,129,130,135,142,因为18×75%=13.5,所以这组数据的上四分位数为从小到大排列后的第14个数据,所以127≤a≤129,又因为a为正整数,所以a可能为127,128,129(写出其中一个即可).
答案:(1)D (2)127(或128,129,写出其中一个即可)
[针对训练]
2.解:(1)将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,
则第25百分位数是=8.15,
第75百分位数是=8.75,
第95百分位数是第12个数据为9.9.
(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.
即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.
(3)由(1)可知样本数据的第25百分位数是8.15 g,第50百分位数为8.5 g,第95百分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.
[题型(三)]
[例3] 解:(1)由频率分布直方图得,a+0.02+0.025+0.035+a=0.1,解得a=0.01.
(2)成绩在80分以下的频率为(0.01+0.02+0.035)×10=0.65<0.75,
成绩在90分以下的频率为(0.01+0.02+0.035+0.025)×10=0.9>0.75,
所以第75百分位数落在[80,90)内.
所以第75百分位数为
80+×10=84(分).
[针对训练]
3.解:由题意知分别落在各区间上的频数
在[80,90)上为60×0.015×10=9,
在[90,100)上为60×0.025×10=15,
在[100,110)上为60×0.030×10=18,
在[110,120)上为60×0.020×10=12,
在[120,130]上为60×0.010×10=6.
从以上数据可知第50百分位数一定落在区间[100,110)上,
有100+10×≈103.3;
第75百分位数一定落在区间[110,120)上,
有110+10×=112.5.
综上可知,第50百分位数和第75百分位数分别估计为103.3 cm,112.5 cm.(共58张PPT)
9.2.2
总体百分位数的估计
(教学方式:深化学习课——梯度进阶式教学)
课时目标
1.结合实例,能用样本估计百分位数,理解百分位数的统计含义.
2.在学习和应用百分位数的过程中,要把实际问题转化为数学问题,并进行计算.
CONTENTS
目录
1
2
3
课前预知教材·自主落实基础
课堂题点研究·迁移应用融通
课时跟踪检测
课前预知教材·自主落实基础
01
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有______的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
p%
2.计算一组n个数据的第p百分位数的步骤
第1步,按__________排列原始数据.
第2步,计算i=________.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第___项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的_______.
从小到大
n×p%
j
平均数
3.四分位数
第25百分位数,第50百分位数,第75百分位数这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
|微|点|助|解|
(1)四分位数把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
(2)百分位数的特点
①一组数据的第p百分位数可能在这组数据中,也可能不在.
②一组数据的某些百分位数可能是同一个数.
基础落实训练
1.判断正误(正确的画“√”,错误的画“×”)
(1)若一组样本数据各不相等,则其75%分位数大于25%分位数. ( )
(2)若一组样本数据的10%分位数是23,则在这组数据中有10%的数据大于23. ( )
(3)若一组样本数据的24%分位数是24,则在这组数据中至少有76%的数据大于或等于24. ( )
√
×
√
2.下列关于一组数据的第50百分位数的说法正确的是 ( )
A.第50百分位数就是中位数
B.总体数据中的任意一个数小于它的可能性一定是50%
C.它一定是这组数据中的一个数据
D.它适用于总体是连续型的数据
√
3.数据12,14,15,17,19,23,27,30的第70百分位数是 ( )
A.14 B.17
C.19 D.23
解析:因为8×70%=5.6,故第70百分位数是第六项数据23.
√
课堂题点研究·迁移应用融通
02
题型(一) 对百分位数含义的理解
[例1] (多选)下列表述不正确的是( )
A.第p百分位数可以有单位
B.一个总体的四分位数有4个
C.样本容量越大,第p百分位数估计总体就越准确
D.对于考试成绩的统计,若小明的成绩处在第95百分位数上,则小明得了95分
√
√
解析:一个总体的第25百分位数,第50百分位数,第75百分位数是总体的四分位数,有3个,所以B错误.第95百分位数是指把数据从小到大排序,至少有95%的数据小于或等于这个值,至少有5%的数据大于或等于这个值,D错误.
|思|维|建|模|
分位数是用于衡量数据的位置的度量,但它所衡量的不一定是中心位置.百分位数提供了有关数据项如何在最小值与最大值之间分布的信息.
1.已知100个数据的75%分位数是9.3,则下列说法正确的是 ( )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第74个数据和第75个数据的平均数
√
针对训练
解析:因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为75%分位数,是9.3,故C正确.
题型(二) 百分位数的计算
[例2] (1)按从小到大顺序排列的两组数据:甲组:30,31,37,m,42,60;乙组:28,n,33,44,48,70,若这两组数据的第30百分位数,第50百分位数都分别对应相等,则m+n=( )
A.60 B.65
C.70 D.71
√
解析:由30%×6=1.8,则甲组数据的第30百分位数为31,乙组数据的第30百分位数为n,即n=31,第50百分位数即中位数,则乙组数据的第50百分位数为,甲组数据的第50百分位数为,于是=,解得m=40,所以m+n=71.故选D.
(2)某学习小组(共18位同学)在一次数学周测中的成绩(单位:分)如下:
a 87 101 109 112 115 116 118 119 119
121 122 126 127 129 130 135 142
若正整数a是这组数据的上四分位数,则a的一个可能取值为___________
______________________.
127(或128,
129,写出其中一个即可)
解析:将所给的数据除a外按从小到大的顺序排列为87,101,109,112,115,
116,118,119,119,121,122,126,127,129,130,135,142,因为18×75%=13.5,所以这组数据的上四分位数为从小到大排列后的第14个数据,所以127≤a≤
129,又因为a为正整数,所以a可能为127,128,129(写出其中一个即可).
|思|维|建|模|
计算一组n个数据的第p百分位数的一般步骤
(1)排列:按照从小到大排列原始数据;
(2)计算i:计算i=n×p%;
(3)定数:若i不是整数,大于i的最小整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数。
2.从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的第25,75,95百分位数;
解:将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
针对训练
因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,
则第25百分位数是=8.15,
第75百分位数是=8.75,
第95百分位数是第12个数据为9.9.
(2)请你找出珍珠质量较小的前15%的珍珠质量;
解:因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.
即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.
(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.
解:由(1)可知样本数据的第25百分位数是8.15 g,第50百分位数为8.5 g,第95百分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.
题型(三) 百分位数的综合应用
[例3] 某校对100名高一学生的某次数学测试成绩进行统计,分成[50,60),
[60,70),[70,80),[80,90),[90,100]五组,得到如图所示频率分布直方图.
(1)求图中a的值;
解:由频率分布直方图得,a+0.02+0.025+0.035+a=0.1,解得a=0.01.
(2)估计该校学生数学成绩的第75百分位数.
解:成绩在80分以下的频率为(0.01+0.02+0.035)×10=0.65<0.75,
成绩在90分以下的频率为(0.01+0.02+0.035+0.025)×10=0.9>0.75,
所以第75百分位数落在[80,90)内.
所以第75百分位数为80+×10=84(分).
|思|维|建|模|
由频率分布直方图求百分位数的方法
(1)要注意频率分布直方图中小矩形的面积,就是数据落在该组的频率.
(2)一般采用方程的思想,设出第p百分位数,根据其意义列出方程并求解即可.
3.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下这60株树木的底部周长的第50百分位数和第75百分位数吗
针对训练
解:由题意知分别落在各区间上的频数
在[80,90)上为60×0.015×10=9,
在[90,100)上为60×0.025×10=15,
在[100,110)上为60×0.030×10=18,
在[110,120)上为60×0.020×10=12,
在[120,130]上为60×0.010×10=6.
从以上数据可知第50百分位数一定落在区间[100,110)上,
有100+10×≈103.3;
第75百分位数一定落在区间[110,120)上,
有110+10×=112.5.
综上可知,第50百分位数和第75百分位数分别估计为103.3 cm,112.5 cm.
课时跟踪检测
03
1
3
4
5
6
7
8
9
10
11
12
2
A级——达标评价
1.下列一组数据的第25百分位数是( )
2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6
A.3.2 B.3.0
C.4.4 D.2.5
解析:把这组数据按照由小到大排列,可得2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,
5.3,5.6,由i=10×25%=2.5,不是整数,则第3个数据3.2是第25百分位数.
√
1
5
6
7
8
9
10
11
12
2
3
4
2.某校高三年级一共有1 200名同学参加数学测验,已知所有学生成绩的第80百分位数是103分,则数学成绩不小于103分的人数至少为 ( )
A.220 B.240
C.250 D.300
解析:由1 200×80%=960人,所以小于103分的学生最多有960人,所以大于或等于103分的学生有1 200-960=240人.
√
1
5
6
7
8
9
10
11
12
3
4
2
3.2024年某学科能力测试共有12万考生参加,成绩采用15级分,测试成绩分布图如图,试估计成绩高于11级分的人数为 ( )
A.8 000 B.10 000
C.20 000 D.60 000
√
1
5
6
7
8
9
10
11
12
3
4
2
解析:从题图中可以看出,12级分的有2.5%左右,13级分的有3%左右,14级分的有1%左右,15级分的有1.5%左右,∴高于11级分的有8%左右,其人数约为12万的8%,即120 000×0.08=9 600人.选项B最接近.
1
5
6
7
8
9
10
11
12
3
4
2
4.以下数据为参加数学竞赛决赛的15人的成绩(单位:分):78,70,72,86,88,
79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是 ( )
A.90 B.90.5
C.91 D.91.5
解析:把成绩按从小到大的顺序排列为56,70,72,78,79,80,81,83,84,86,
88,90,91,94,98,因为15×80%=12,所以这15人成绩的第80百分位数是=90.5.
√
1
5
6
7
8
9
10
11
12
3
4
2
5.一组数据为6,47,49,15,42,41,7,39,43,40,36,且这组数据的一个四分位数是15,则它是 ( )
A.15%分位数 B.25%分位数
C.50%分位数 D.75%分位数
解析:将数据由小到大排列为6,7,15,36,39,40,41,42,43,47,49,一共11项.由11×25%=2.75,故25%分位数是15.
√
1
5
6
7
8
9
10
11
12
3
4
2
6.(多选)在秋季运动会的跳远比赛中,张明是选手中跳得最远的,李华是选手中跳得最近的,总共有20名选手,则下列描述正确的有 ( )
A.张明跳远成绩的百分位数约为100
B.张明跳远成绩的百分位数约为20
C.李华跳远成绩的百分位数约为0
D.李华跳远成绩的百分位数约为6
√
√
1
5
6
7
8
9
10
11
12
3
4
2
解析:由百分位数的定义知,一组数据从小到大排序,第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个数,至少有(100-p)%的数据大于或等于这个值.跳远成绩从小到大排序,因为张明是选手中跳得最远的,即至少有100%的数据小于或等于张明的成绩,至少有0%的数据大于或等于这个值,所以张明跳远成绩的百分位数约为100,故A正确,B不正确;跳远成绩从小到大排序,因为李华是选手中跳得最近的,即有至少0%的数据小于或等于李华的成绩,至少有100%的数据大于或等于这个值,所以李华跳远成绩的百分位数约为0,故C正确,D不正确.故选A、C.
1
5
6
7
8
9
10
11
12
3
4
2
7.已知甲、乙两组数据(已按从小到大的顺序排列):
甲组:27,28,39,40,m,50;
乙组:24,n,34,43,48,52.
若这两组数据的第30百分位数、第80百分位数分别相等,则等于 .
解析:因为30%×6=1.8,80%×6=4.8,所以第30百分位数为n=28,第80百分位数为m=48,所以==.
1
5
6
7
8
9
10
11
12
3
4
2
8.(12分)某省教育厅为了了解2024年高考考生的实际答卷情况,随机抽取了100名考生的数学成绩(单位:分),将数据分成了11组,制成了如下的频率分布表:
分组 频数 频率
[80,85) 1 0.01
[85,90) 2 0.02
[90,95) 4 0.04
[95,100) 14 0.14
[100,105) 24 0.24
1
5
6
7
8
9
10
11
12
3
4
2
[105,110) 15 0.15
[110,115) 12 0.12
[115,120) 9 0.09
[120,125) 11 0.11
[125,130) 6 0.06
[130,135] 2 0.02
合计 100 1
续表
1
5
6
7
8
9
10
11
12
3
4
2
(1)估计样本中考生数学成绩的第60百分位数和第80百分位数;
解:从频率分布表,得前六组的频率之和为0.01+0.02+0.04+0.14+0.24+0.15=0.60,
前七组的频率之和为0.60+0.12=0.72,前八组的频率之和为0.72+0.09=0.81,前九组的频率之和为0.81+0.11=0.92,所以样本中的考生数学成绩的第60百分位数为110分.
样本数据的第80百分位数一定在[115,120)内,因为115+5×≈119,
所以估计样本中的考生数学成绩的第80百分位数为119分.
1
5
6
7
8
9
10
11
12
3
4
2
(2)估计2024年高考考生的数学成绩的第90百分位数.(结果保留整数)
解:由前八组的频率之和为0.81,前九组的频率之和为0.92,所以第90百分位数一定在[120,125)内.
因为120+5×≈124,
所以估计2024年高考考生的数学成绩的第90百分位数为124分.
1
5
6
7
8
9
10
11
12
3
4
2
B级——重点培优
9.《中国居民膳食指南(2022)》数据显示,6岁至17岁儿童青少年超重肥胖率高达19.0%.为了解某地中学生的体重情况,某机构从该地中学生中随机抽取100名学生,测量他们的体重(单位:千克),根据测量数据,按[40,45),[45,50),[50,55),[55,60),[60,65),[65,70]分成六组,得到的频率分布直方图如图所示.根据调查的数据,估计该地中学生体重的第75百分位数是( )
1
5
6
7
8
9
10
11
12
3
4
2
A.55 B.57.25
C.58.75 D.60
√
1
5
6
7
8
9
10
11
12
3
4
2
解析:因为(0.01+0.03+0.08)×5=0.6<0.75,0.6+0.04×5=0.8>0.75,所以该地中学生体重的第75百分位数在[55,60)内.设第75百分位数为m,则(m-55)×0.04+0.6=0.75,解得m=58.75.
1
5
6
7
8
9
10
11
12
3
4
2
10.(多选)为了养成良好的运动习惯,某人记录了自己一周内每天的运动时长(单位:分钟),分别为53,57,45,61,79,49,x,若这组数据的第80百分位数与第60百分位数的差为3,则x的值可能为 ( )
A.58 B.59
C.62 D.64
√
√
1
5
6
7
8
9
10
11
12
3
4
2
解析:将已知的6个数从小到大排序为45,49,53,57,61,79,若x≤57,则这组数据的第80百分位数与第60百分位数分别为61和57,它们的差为4,不符合条件.若x≥79,则这组数据的第80百分位数与第60百分位数分别为79和61,它们的差为18,不符合条件,若571
5
6
7
8
9
10
11
12
3
4
2
11.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图,如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70%分位数约为 秒.
16.5
1
5
6
7
8
9
10
11
12
3
4
2
解析:设成绩的70%分位数为x,因为=0.55,=0.85,所以x∈[16,17),所以0.55+(x-16)×=0.70,解得x=16.5.
1
5
6
7
8
9
10
11
12
3
4
2
12.(15分)某种产品的质量以其质量指标值m衡量,并按照质量指标值m划分等级如表:
质量指标值m m<85 85≤m<105 m≥105
等级 三等品 二等品 一等品
1
5
6
7
8
9
10
11
12
3
4
2
现在从某企业生产的这种产品中随机抽取了200件作为样本,检验其质量指标值m,得到的频率分布直方图如图所示(每组只含最小值,不含最大值).
1
5
6
7
8
9
10
11
12
3
4
2
(1)求第75百分位数(精确到0.1);
解:由题意可得,(0.002 5×2+0.009 0+0.010 0+0.020 0+0.026 0+x)×10=1,解得x=0.030,所以[65,105)的频率为0.625,[105,115)的频率为0.26.则第75百分位数在[105,115)内,所以第75百分位数为105+10×
≈109.8.
1
5
6
7
8
9
10
11
12
3
4
2
(2)在样本中,按照产品等级用比例分配的分层随机抽样的方法抽取8件产品,则这8件产品中,一等品的件数是多少.
解:由频率分布直方图以及等级划分规则可知,样本中三等品、二等品、一等品的频率分别为
(0.002 5+0.010 0)×10=0.125,
(0.020 0+0.030 0)×10=0.5,
(0.026 0+0.009 0+0.002 5)×10=0.375,
1
5
6
7
8
9
10
11
12
3
4
2
所以在样本中,三等品、二等品、一等品的件数分别为25,100,75.
所以按照产品等级用比例分配的分层随机抽样的方法抽取8件产品,则应抽取的一等品的件数为3件.课时跟踪检测(四十五) 总体百分位数的估计
(满分80分,A级选填小题每题5分,B级选填小题每题6分)
A级——达标评价
1.下列一组数据的第25百分位数是( )
2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6
A.3.2 B.3.0
C.4.4 D.2.5
2.某校高三年级一共有1 200名同学参加数学测验,已知所有学生成绩的第80百分位数是103分,则数学成绩不小于103分的人数至少为( )
A.220 B.240
C.250 D.300
3.2024年某学科能力测试共有12万考生参加,成绩采用15级分,测试成绩分布图如图,试估计成绩高于11级分的人数为( )
A.8 000 B.10 000
C.20 000 D.60 000
4.以下数据为参加数学竞赛决赛的15人的成绩(单位:分):78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是( )
A.90 B.90.5
C.91 D.91.5
5.一组数据为6,47,49,15,42,41,7,39,43,40,36,且这组数据的一个四分位数是15,则它是( )
A.15%分位数 B.25%分位数
C.50%分位数 D.75%分位数
6.(多选)在秋季运动会的跳远比赛中,张明是选手中跳得最远的,李华是选手中跳得最近的,总共有20名选手,则下列描述正确的有( )
A.张明跳远成绩的百分位数约为100
B.张明跳远成绩的百分位数约为20
C.李华跳远成绩的百分位数约为0
D.李华跳远成绩的百分位数约为6
7.已知甲、乙两组数据(已按从小到大的顺序排列):
甲组:27,28,39,40,m,50;
乙组:24,n,34,43,48,52.
若这两组数据的第30百分位数、第80百分位数分别相等,则等于________.
8.(12分)某省教育厅为了了解2024年高考考生的实际答卷情况,随机抽取了100名考生的数学成绩(单位:分),将数据分成了11组,制成了如下的频率分布表:
分组 频数 频率
[80,85) 1 0.01
[85,90) 2 0.02
[90,95) 4 0.04
[95,100) 14 0.14
[100,105) 24 0.24
[105,110) 15 0.15
[110,115) 12 0.12
[115,120) 9 0.09
[120,125) 11 0.11
[125,130) 6 0.06
[130,135] 2 0.02
合计 100 1
(1)估计样本中考生数学成绩的第60百分位数和第80百分位数;
(2)估计2024年高考考生的数学成绩的第90百分位数.(结果保留整数)
B级——重点培优
9.《中国居民膳食指南(2022)》数据显示,6岁至17岁儿童青少年超重肥胖率高达19.0%.为了解某地中学生的体重情况,某机构从该地中学生中随机抽取100名学生,测量他们的体重(单位:千克),根据测量数据,按[40,45),[45,50),[50,55),[55,60),[60,65),[65,70]分成六组,得到的频率分布直方图如图所示.根据调查的数据,估计该地中学生体重的第75百分位数是( )
A.55 B.57.25
C.58.75 D.60
10.(多选)为了养成良好的运动习惯,某人记录了自己一周内每天的运动时长(单位:分钟),分别为53,57,45,61,79,49,x,若这组数据的第80百分位数与第60百分位数的差为3,则x的值可能为( )
A.58 B.59
C.62 D.64
11.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图,如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70%分位数约为________秒.
12.(15分)某种产品的质量以其质量指标值m衡量,并按照质量指标值m划分等级如表:
质量指标值m m<85 85≤m<105 m≥105
等级 三等品 二等品 一等品
现在从某企业生产的这种产品中随机抽取了200件作为样本,检验其质量指标值m,得到的频率分布直方图如图所示(每组只含最小值,不含最大值).
(1)求第75百分位数(精确到0.1);
(2)在样本中,按照产品等级用比例分配的分层随机抽样的方法抽取8件产品,则这8件产品中,一等品的件数是多少.
课时跟踪检测(四十五)
1.选A 把这组数据按照由小到大排列,可得2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由i=10×25%=2.5,不是整数,则第3个数据3.2是第25百分位数.
2.选B 由1 200×80%=960人,所以小于103分的学生最多有960人,所以大于或等于103分的学生有1 200-960=240人.
3.选B 从题图中可以看出,12级分的有2.5%左右,13级分的有3%左右,14级分的有1%左右,15级分的有1.5%左右,∴高于11级分的有8%左右,其人数约为12万的8%,即120 000×0.08=9 600人.选项B最接近.
4.选B 把成绩按从小到大的顺序排列为56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的第80百分位数是=90.5.
5.选B 将数据由小到大排列为6,7,15,36,39,40,41,42,43,47,49,一共11项.由11×25%=2.75,故25%分位数是15.
6.选AC 由百分位数的定义知,一组数据从小到大排序,第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个数,至少有(100-p)%的数据大于或等于这个值.跳远成绩从小到大排序,因为张明是选手中跳得最远的,即至少有100%的数据小于或等于张明的成绩,至少有0%的数据大于或等于这个值,所以张明跳远成绩的百分位数约为100,故A正确,B不正确;跳远成绩从小到大排序,因为李华是选手中跳得最近的,即有至少0%的数据小于或等于李华的成绩,至少有100%的数据大于或等于这个值,所以李华跳远成绩的百分位数约为0,故C正确,D不正确.故选A、C.
7.解析:因为30%×6=1.8,80%×6=4.8,所以第30百分位数为n=28,第80百分位数为m=48,所以==.
答案:
8.解:(1)从频率分布表,得前六组的频率之和为0.01+0.02+0.04+0.14+0.24+0.15=0.60,
前七组的频率之和为0.60+0.12=0.72,前八组的频率之和为0.72+0.09=0.81,前九组的频率之和为0.81+0.11=0.92,所以样本中的考生数学成绩的第60百分位数为110分.
样本数据的第80百分位数一定在[115,120)内,因为115+5×≈119,
所以估计样本中的考生数学成绩的第80百分位数为119分.
(2)由前八组的频率之和为0.81,前九组的频率之和为0.92,所以第90百分位数一定在[120,125)内.
因为120+5×≈124,
所以估计2024年高考考生的数学成绩的第90百分位数为124分.
9.选C 因为(0.01+0.03+0.08)×5=0.6<0.75,0.6+0.04×5=0.8>0.75,所以该地中学生体重的第75百分位数在[55,60)内.设第75百分位数为m,则(m-55)×0.04+0.6=0.75,解得m=58.75.
10.选AD 将已知的6个数从小到大排序为45,49,53,57,61,79,若x≤57,则这组数据的第80百分位数与第60百分位数分别为61和57,它们的差为4,不符合条件.若x≥79,则这组数据的第80百分位数与第60百分位数分别为79和61,它们的差为18,不符合条件,若5711.解析:设成绩的70%分位数为x,因为=0.55,=0.85,所以x∈[16,17),所以0.55+(x-16)×=0.70,解得x=16.5.
答案:16.5
12.解:(1)由题意可得,(0.002 5×2+0.009 0+0.010 0+0.020 0+0.026 0+x)×10=1,解得x=0.030,所以[65,105)的频率为0.625,[105,115)的频率为0.26.则第75百分位数在[105,115)内,所以第75百分位数为105+10×≈109.8.
(2)由频率分布直方图以及等级划分规则可知,样本中三等品、二等品、一等品的频率分别为
(0.002 5+0.010 0)×10=0.125,
(0.020 0+0.030 0)×10=0.5,
(0.026 0+0.009 0+0.002 5)×10=0.375,
所以在样本中,三等品、二等品、一等品的件数分别为25,100,75.
所以按照产品等级用比例分配的分层随机抽样的方法抽取8件产品,则应抽取的一等品的件数为3件.