中小学教育资源及组卷应用平台
9.2.2 总体百分位数的估计
学习指导 核心素养
结合实例,能用样本估计百分位数,理解百分位数的统计含义. 1.数学抽象:理解百分位数的概念. 2.数学运算、数据分析:会用样本常用百分位数估计总体百分位数.
知识点 百分位数的定义
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3.四分位数
第25百分位数,第50百分位数,第75百分位数这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的第25,75,95百分位数;
(2)请你找出珍珠质量较小的前15%的珍珠质量.
求百分位数时,一定要将数据按照从小到大的顺序排列.
1.对某自行车赛手在相同条件下进行了12次测试,测得其最大速度(单位:m/s)的数据如下:
27,38,30,36,35,31,33,29,38,34,28,36.
则他的最大速度的第一四分位数是( )
A.27.5 B.28.5
C.29.5 D.30.5
2.以下数据为参加数学竞赛决赛的15人的成绩:
78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是( )
A.90 B.90.5
C.91 D.91.5
考点 百分位数的综合应用
下图是将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,求该班的模拟考试成绩的80%分位数.(结果保留两位小数)
频率分布直方图中第p百分位数的计算
(1)确定百分位数所在的区间[a,b).
(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+×(b-a).
1.如图所示是一样本的频率分布直方图,样本数据共分3组,分别为[5,10),[10,15),[15,20].估计样本数据的第60百分位数是( )
A.14 B.15
C.16 D.17
2.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频率分布表如下:
排号 分组 频数 频率
1 [0,2) 6 0.06
2 [2,4) 8 0.08
3 [4,6) 17 b
4 [6,8) 22 0.22
5 [8,10) 25 0.25
排号 分组 频数 频率
6 [10,12) 12 0.12
7 [12,14) a 0.06
8 [14,16) 2 0.02
9 [16,18] 2 0.02
合计 100 1
(1)求频率分布表中a,b的值;
(2)计算50%分位数,并估计是否有50%的学生的阅读时间达到7.68.
1.下列表述不正确的是( )
A.50%分位数就是总体的中位数
B.第p百分位数可以有单位
C.一个总体的四分位数有4个
D.样本容量越大,第p百分位数估计总体就越准确
2.某校高一年级18个班参加艺术节合唱比赛,通过简单随机抽样,获得了10个班的比赛得分如下:91,89,90,92,94,87,93,96,91,85,则这组数据的70%分位数为( )
A.91 B.92
C.92.5 D.93
3.一组数据为6,47,49,15,42,41,7,39,43,40,36,则这组数据的一个四分位数是15,则它是( )
A.15%分位数 B.25%分位数
C.50%分位数 D.75%分位数
4.为了调查某厂工人生产某种产品的能力,随机抽查了40位工人某天生产该产品的数量得到频率分布直方图如图所示.
估计样本数据的50%分位数为________.
[A 基础达标]
1.(多选)已知100个数据的第75百分位数是9.3,则下列说法正确的是( )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数
2.已知有8个样本数据分别为4,7,8,11,13,15,20,22,则估计该组数据的总体的第三四分位数为( )
A.9 B.12
C.17.5 D.21
3.已知甲、乙两组数据(已按从小到大的顺序排列):甲组:27,28,39,40,m,50;乙组:24,n,34,43,48,52.若这两组数据的30百分位数、80百分位数分别相等,则等于( )
A. B.
C. D.
4.将10个数据按照从小到大的顺序进行排列,第四个数据被墨水污染,2,4,5,,10,14,15,39,41,50,已知第40百分位数是8.5,则第四个数据是( )
A.5 B.7.5
C.8 D.7
5.数据3.2,3.4,3.8,4.2,4.3,4.5,x,6.6的第65百分位数是4.5,则实数x的取值范围是( )
A.[4.5,+∞) B.[4.5,6.6)
C.(4.5,+∞) D.(4.5,6.6]
6.数据12,14,15,17,19,23,27,30的第70百分位数是________.
7.某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的第________百分位数.
8.已知一组数据按从小到大的顺序排列:11,12,15,x,17,y,22,26,经过计算,该组数据的50%分位数是16,75%分位数是20,则x=________,y=________.
9.求下列数据的四分位数.
13,15,12,27,22,24,28,30,31,18,19,20.
[B 能力提升]
10.(多选)某校高二(13)班某次测试数学成绩累积频数分布折线图如图所示,则下列说法正确的是( )
A.没有人的成绩在30~40分这组内
B.第50百分位数位于60~70分这组内
C.第25百分位数位于40~50分这组内
D.第75百分位数位于70~80分这组内
11.已知30个数据的第60百分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是________.
12.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图,如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70百分位数为________秒.
13.某网络营销部门随机抽查了某市200名网友在2021年11月11日的网购金额,所得数据如下表:
网购金额(单位:千元) 人数 频率
[0,1) 16 0.08
[1,2) 24 0.12
[2,3) x p
[3,4) y q
[4,5) 16 0.08
[5,6] 14 0.07
合计 200 1.00
已知网购金额低于3千元与不低于3千元的人数比恰为3∶2.
(1)试确定x,y,p,q的值,并补全频率分布直方图(如图);
(2)估计网购金额的25%分位数(结果保留3位有效数字).
[C 拓展冲刺]
14.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)[25,30)年龄组对应小矩形的高度为________;
(2)由频率分布直方图估计志愿者年龄的85%分位数为________岁.(结果保留整数)
15.某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄分成5组:第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有5人.
(1)求x;
(2)求抽取的x人的年龄的50%分位数(结果保留整数);
(3)以下是参赛的10人的成绩:
90,96,97,95,92,92,98,88,96,99.
求这10人成绩的20%分位数和平均数.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)(共60张PPT)
9.2 用样本估计总体
9.2.2 总体百分位数的估计
第九章 统 计
学习指导 核心素养
结合实例,能用样本估计百分位数,理解百分位数的统计含义. 1.数学抽象:理解百分位数的概念.
2.数学运算、数据分析:会用样本常用百分位数估计总体百分位数.
01
必备知识 落实
知识点 百分位数的定义
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有_____的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
p%
2.计算一组n个数据的第p百分位数的步骤
第1步,按__________排列原始数据.
第2步,计算i=________.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的________.
从小到大
n×p%
平均数
3.四分位数
第25百分位数,第50百分位数,第75百分位数这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的第25,75,95百分位数;
(2)请你找出珍珠质量较小的前15%的珍珠质量.
【解】 因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.
即产品质量较小的前15%的产品有2个,它们的质量分别为7.8 g,7.9 g.
求百分位数时,一定要将数据按照从小到大的顺序排列.
1.对某自行车赛手在相同条件下进行了12次测试,测得其最大速度(单位:m/s)的数据如下:
27,38,30,36,35,31,33,29,38,34,28,36.
则他的最大速度的第一四分位数是( )
A.27.5 B.28.5
C.29.5 D.30.5
√
2.以下数据为参加数学竞赛决赛的15人的成绩:
78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是( )
A.90 B.90.5
C.91 D.91.5
√
02
关键能力 提升
考点 百分位数的综合应用
下图是将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,求该班的模拟考试成绩的80%分位数.(结果保留两位小数)
1.如图所示是一样本的频率分布直方图,样本数据共分3组,分别为[5,10),[10,15),[15,20].估计样本数据的第60百分位数是( )
A.14 B.15
C.16 D.17
√
2.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频率分布表如下:
排号 分组 频数 频率
1 [0,2) 6 0.06
2 [2,4) 8 0.08
3 [4,6) 17 b
4 [6,8) 22 0.22
5 [8,10) 25 0.25
排号 分组 频数 频率
6 [10,12) 12 0.12
7 [12,14) a 0.06
8 [14,16) 2 0.02
9 [16,18] 2 0.02
合计 100 1
(1)求频率分布表中a,b的值;
(2)计算50%分位数,并估计是否有50%的学生的阅读时间达到7.68.
03
课堂巩固 自测
1.下列表述不正确的是( )
A.50%分位数就是总体的中位数
B.第p百分位数可以有单位
C.一个总体的四分位数有4个
D.样本容量越大,第p百分位数估计总体就越准确
解析:一个总体的25%分位数,50%分位数,75%分位数是总体的四分位数,有3个,所以C错误.
√
2.某校高一年级18个班参加艺术节合唱比赛,通过简单随机抽样,获得了10个班的比赛得分如下:91,89,90,92,94,87,93,96,91,85,则这组数据的70%分位数为( )
A.91 B.92
C.92.5 D.93
√
3.一组数据为6,47,49,15,42,41,7,39,43,40,36,则这组数据的一个四分位数是15,则它是( )
A.15%分位数 B.25%分位数
C.50%分位数 D.75%分位数
解析:将数据由小到大排列为6,7,15,36,39,40,41,42,43,47,49,共11项.由11×25%=2.75,故25%分位数是15.
√
4.为了调查某厂工人生产某种产品的能力,随机抽查了40位工人某天生产该产品的数量得到频率分布直方图如图所示.
估计样本数据的50%分位数为________.
答案:62.5
04
课后达标 检测
[A 基础达标]
1.(多选)已知100个数据的第75百分位数是9.3,则下列说法正确的是( )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数
√
√
解析:易知,选项A正确;
因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,C正确.故选AC.
2.已知有8个样本数据分别为4,7,8,11,13,15,20,22,则估计该组数据的总体的第三四分位数为( )
A.9 B.12
C.17.5 D.21
√
√
4.将10个数据按照从小到大的顺序进行排列,第四个数据被墨水污染,2,4,5, ,10,14,15,39,41,50,已知第40百分位数是8.5,则第四个数据是( )
A.5 B.7.5
C.8 D.7
√
5.数据3.2,3.4,3.8,4.2,4.3,4.5,x,6.6的第65百分位数是4.5,则实数x的取值范围是( )
A.[4.5,+∞) B.[4.5,6.6)
C.(4.5,+∞) D.(4.5,6.6]
解析:因为8×65%=5.2,所以这组数据的第65百分位数是第6项数据4.5,则x≥4.5,故选A.
√
6.数据12,14,15,17,19,23,27,30的第70百分位数是________.
解析:因为8×70%=5.6,故第70百分位数是第六项数据23.
答案:23
7.某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的第________百分位数.
解析:因为[20,40),[40,60)的频率之和为(0.005+0.01)×20=0.3,
所以60分为成绩的第30百分位数.
答案:30
8.已知一组数据按从小到大的顺序排列:11,12,15,x,17,y,22,26,经过计算,该组数据的50%分位数是16,75%分位数是20,则x=________,y=________.
解析:因为50%×8=4,故50%分位数是(x+17)÷2=16,解得x=15.因为75%×8=6,故75%分位数是(y+22)÷2=20,解得y=18.
答案:15 18
9.求下列数据的四分位数.
13,15,12,27,22,24,28,30,31,18,19,20.
[B 能力提升]
10.(多选)某校高二(13)班某次测试数学成绩累积频数分布折线图如图所示,则下列说法正确的是( )
A.没有人的成绩在30~40分这组内
B.第50百分位数位于60~70分这组内
C.第25百分位数位于40~50分这组内
D.第75百分位数位于70~80分这组内
√
√
√
解析:由题图知没有人的成绩在30~40分这组内,
故A正确;
由40×50%=20,取第20,21项数据的平均数,所以第50百分位数位于60~70分这组内,故B正确;
由40×25%=10,取第10,11项数据的平均数,所以第25百分位数位于40~50分这组内,故C正确;
由40×75%=30,取第30,31项数据的平均数,所以第75百分位数位于60~70分这组内,故D不正确.故选ABC.
11.已知30个数据的第60百分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是________.
答案:8.6
12.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图,如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70百分位数为________秒.
答案:16.5
13.某网络营销部门随机抽查了某市200名网友在2021年11月11日的网购金额,所得数据如下表:
网购金额(单位:千元) 人数 频率
[0,1) 16 0.08
[1,2) 24 0.12
[2,3) x p
[3,4) y q
[4,5) 16 0.08
[5,6] 14 0.07
合计 200 1.00
已知网购金额低于3千元与不低于3千元的人数比恰为3∶2.
(1)试确定x,y,p,q的值,并补全频率分布直方图(如图);
(2)估计网购金额的25%分位数(结果保留3位有效数字).
[C 拓展冲刺]
14.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)[25,30)年龄组对应小矩形的高度为________;
解析:设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.
答案:0.04
(2)由频率分布直方图估计志愿者年龄的85%分位数为
________岁.(结果保留整数)
答案:39
15.某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄分成5组:第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有5人.
(1)求x;
(2)求抽取的x人的年龄的50%分位数(结果保留整数);
(3)以下是参赛的10人的成绩:
90,96,97,95,92,92,98,88,96,99.
求这10人成绩的20%分位数和平均数.中小学教育资源及组卷应用平台
9.2.2 总体百分位数的估计
学习指导 核心素养
结合实例,能用样本估计百分位数,理解百分位数的统计含义. 1.数学抽象:理解百分位数的概念. 2.数学运算、数据分析:会用样本常用百分位数估计总体百分位数.
知识点 百分位数的定义
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3.四分位数
第25百分位数,第50百分位数,第75百分位数这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的第25,75,95百分位数;
(2)请你找出珍珠质量较小的前15%的珍珠质量.
【解】 (1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,
则第25百分位数是=8.15,
第75百分位数是=8.75,
第95百分位数是第12个数据为9.9.
(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.
即产品质量较小的前15%的产品有2个,它们的质量分别为7.8 g,7.9 g.
求百分位数时,一定要将数据按照从小到大的顺序排列.
1.对某自行车赛手在相同条件下进行了12次测试,测得其最大速度(单位:m/s)的数据如下:
27,38,30,36,35,31,33,29,38,34,28,36.
则他的最大速度的第一四分位数是( )
A.27.5 B.28.5
C.29.5 D.30.5
解析:选C.把数据从小到大排序,得
27,28,29,30,31,33,34,35,36,36,38,38.
第一四分位数即第25百分位数,
由12×25%=3,可知第一四分位数为第3项与第4项数据的平均数,即×(29+30)=29.5.
2.以下数据为参加数学竞赛决赛的15人的成绩:
78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是( )
A.90 B.90.5
C.91 D.91.5
解析:选B.把成绩按从小到大的顺序排列为:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的第80百分位数是=90.5.
考点 百分位数的综合应用
下图是将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,求该班的模拟考试成绩的80%分位数.(结果保留两位小数)
【解】 由题图可知,分数在120分以下的学生所占的比例为(0.01+0.015+0.015+0.03)×10×100%=70%,
分数在130分以下的学生所占的比例为(0.01+0.015+0.015+0.03+0.022 5)×10×100%=92.5%,
因此,80%分位数一定位于[120,130)内.
由120+×10≈124.44.
故该班的模拟考试成绩的80%分位数约为124.44.
频率分布直方图中第p百分位数的计算
(1)确定百分位数所在的区间[a,b).
(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+×(b-a).
1.如图所示是一样本的频率分布直方图,样本数据共分3组,分别为[5,10),[10,15),[15,20].估计样本数据的第60百分位数是( )
A.14 B.15
C.16 D.17
解析:选A.第1组[5,10)的频率为0.04×5=0.20;第2组[10,15)的频率为0.10×5=0.50;所以第60百分位数是10+5×=14.
2.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频率分布表如下:
排号 分组 频数 频率
1 [0,2) 6 0.06
2 [2,4) 8 0.08
3 [4,6) 17 b
4 [6,8) 22 0.22
5 [8,10) 25 0.25
排号 分组 频数 频率
6 [10,12) 12 0.12
7 [12,14) a 0.06
8 [14,16) 2 0.02
9 [16,18] 2 0.02
合计 100 1
(1)求频率分布表中a,b的值;
(2)计算50%分位数,并估计是否有50%的学生的阅读时间达到7.68.
解:(1)a=0.06×100=6,b==0.17.
(2)阅读时间小于6小时的所占比例是0.06+0.08+0.17=0.31,
阅读时间小于8小时的所占比例是0.06+0.08+0.17+0.22=0.53,
所以50%分位数在[6,8)内,
所以50%分位数约为6+2×≈7.73.
因为7.73>7.68,
所以估计有50%的学生的阅读时间达到7.68.
1.下列表述不正确的是( )
A.50%分位数就是总体的中位数
B.第p百分位数可以有单位
C.一个总体的四分位数有4个
D.样本容量越大,第p百分位数估计总体就越准确
解析:选C.一个总体的25%分位数,50%分位数,75%分位数是总体的四分位数,有3个,所以C错误.
2.某校高一年级18个班参加艺术节合唱比赛,通过简单随机抽样,获得了10个班的比赛得分如下:91,89,90,92,94,87,93,96,91,85,则这组数据的70%分位数为( )
A.91 B.92
C.92.5 D.93
解析:选C.比赛得分从小到大为85,87,89,90,91,91,92,93,94,96,而10×70%=7,所以70%分位数为=92.5.故选C.
3.一组数据为6,47,49,15,42,41,7,39,43,40,36,则这组数据的一个四分位数是15,则它是( )
A.15%分位数 B.25%分位数
C.50%分位数 D.75%分位数
解析:选B.将数据由小到大排列为6,7,15,36,39,40,41,42,43,47,49,共11项.由11×25%=2.75,故25%分位数是15.
4.为了调查某厂工人生产某种产品的能力,随机抽查了40位工人某天生产该产品的数量得到频率分布直方图如图所示.
估计样本数据的50%分位数为________.
解析:依题意,产品数量在[45,55)的频率为0.020×10=0.2,前两组频率和为(0.020+0.040)×10=0.6,所以50%分位数应位于[55,65)内,由55+10×=62.5.所以估计样本数据的50%分位数为62.5.
答案:62.5
[A 基础达标]
1.(多选)已知100个数据的第75百分位数是9.3,则下列说法正确的是( )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数
解析:选AC.易知,选项A正确;因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,C正确.故选AC.
2.已知有8个样本数据分别为4,7,8,11,13,15,20,22,则估计该组数据的总体的第三四分位数为( )
A.9 B.12
C.17.5 D.21
解析:选C.8×75%=6,故该组数据的总体的第三四分位数为第6个数和第7个数的平均数=17.5.故选C.
3.已知甲、乙两组数据(已按从小到大的顺序排列):甲组:27,28,39,40,m,50;乙组:24,n,34,43,48,52.若这两组数据的30百分位数、80百分位数分别相等,则等于( )
A. B.
C. D.
解析:选A.因为30%×6=1.8,大于1.8的比邻整数为2,所以30百分位数为n=28,80%×6=4.8,大于4.8的比邻整数为5,所以80百分位数为m=48,所以==.故选A.
4.将10个数据按照从小到大的顺序进行排列,第四个数据被墨水污染,2,4,5,,10,14,15,39,41,50,已知第40百分位数是8.5,则第四个数据是( )
A.5 B.7.5
C.8 D.7
解析:选D.设第四个数据为x,因为一共有10个数据,10×40%=4为整数,根据百分位数的定义可得=8.5,解得x=7.故选D.
5.数据3.2,3.4,3.8,4.2,4.3,4.5,x,6.6的第65百分位数是4.5,则实数x的取值范围是( )
A.[4.5,+∞) B.[4.5,6.6)
C.(4.5,+∞) D.(4.5,6.6]
解析:选A.因为8×65%=5.2,所以这组数据的第65百分位数是第6项数据4.5,则x≥4.5,故选A.
6.数据12,14,15,17,19,23,27,30的第70百分位数是________.
解析:因为8×70%=5.6,故第70百分位数是第六项数据23.
答案:23
7.某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的第________百分位数.
解析:因为[20,40),[40,60)的频率之和为(0.005+0.01)×20=0.3,
所以60分为成绩的第30百分位数.
答案:30
8.已知一组数据按从小到大的顺序排列:11,12,15,x,17,y,22,26,经过计算,该组数据的50%分位数是16,75%分位数是20,则x=________,y=________.
解析:因为50%×8=4,故50%分位数是(x+17)÷2=16,解得x=15.因为75%×8=6,故75%分位数是(y+22)÷2=20,解得y=18.
答案:15 18
9.求下列数据的四分位数.
13,15,12,27,22,24,28,30,31,18,19,20.
解:把12个数据按从小到大的顺序排列可得
12,13,15,18,19,20,22,24,27,28,30,31,
计算12×25%=3,12×50%=6,12×75%=9,
所以数据的第25百分位数为=16.5,
第50百分位数为=21,
第75百分位数为=27.5.
[B 能力提升]
10.(多选)某校高二(13)班某次测试数学成绩累积频数分布折线图如图所示,则下列说法正确的是( )
A.没有人的成绩在30~40分这组内
B.第50百分位数位于60~70分这组内
C.第25百分位数位于40~50分这组内
D.第75百分位数位于70~80分这组内
解析:选ABC.由题图知没有人的成绩在30~40分这组内,故A正确;
由40×50%=20,取第20,21项数据的平均数,所以第50百分位数位于60~70分这组内,故B正确;
由40×25%=10,取第10,11项数据的平均数,所以第25百分位数位于40~50分这组内,故C正确;
由40×75%=30,取第30,31项数据的平均数,所以第75百分位数位于60~70分这组内,故D不正确.故选ABC.
11.已知30个数据的第60百分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是________.
解析:由于30×60%=18,设第19个数据为x,则=8.2,解得x=8.6,即第19个数据是8.6.
答案:8.6
12.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图,如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70百分位数为________秒.
解析:设成绩的70百分位数为x,
因为=0.55,=0.85,
所以x∈[16,17),
所以0.55+(x-16)×=0.70,
解得x=16.5.
答案:16.5
13.某网络营销部门随机抽查了某市200名网友在2021年11月11日的网购金额,所得数据如下表:
网购金额(单位:千元) 人数 频率
[0,1) 16 0.08
[1,2) 24 0.12
[2,3) x p
[3,4) y q
[4,5) 16 0.08
[5,6] 14 0.07
合计 200 1.00
已知网购金额低于3千元与不低于3千元的人数比恰为3∶2.
(1)试确定x,y,p,q的值,并补全频率分布直方图(如图);
(2)估计网购金额的25%分位数(结果保留3位有效数字).
解:(1)根据题意有
解得
所以p=0.4,q=0.25.
补全频率分布直方图如图所示.
(2)由(1)可知,网购金额低于2千元的频率为0.08+0.12=0.2,
网购金额低于3千元的频率为0.2+0.4=0.6,
所以网购金额的25%分位数在[2,3)内,
则网购金额的25%分位数估计为2+×1=2.125≈2.13(千元).
[C 拓展冲刺]
14.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)[25,30)年龄组对应小矩形的高度为________;
(2)由频率分布直方图估计志愿者年龄的85%分位数为________岁.(结果保留整数)
解析:(1)设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.
(2)由图可知,年龄小于35岁的频率为(0.01+0.04+0.07)×5=0.6,年龄小于40岁的频率为(0.01+0.04+0.07+0.06)×5=0.9,所以志愿者年龄的85%分位数在[35,40)内,因此志愿者年龄的85%分位数为35+×5≈39(岁).
答案:(1)0.04 (2)39
15.某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄分成5组:第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有5人.
(1)求x;
(2)求抽取的x人的年龄的50%分位数(结果保留整数);
(3)以下是参赛的10人的成绩:
90,96,97,95,92,92,98,88,96,99.
求这10人成绩的20%分位数和平均数.
解:(1)第一组频率为0.01×5=0.05,
所以x==100.
(2)由题图可知年龄低于30岁所占比例为(0.07+0.01)×5×100%=40%,年龄低于35岁所占比例为(0.01+0.07+0.06)×5×100%=70%,所以抽取的x人的年龄的50%分位数在[30,35)内,由30+5×=≈32,所以抽取的x人的年龄的50%分位数为32.
(3)把参赛的10人的成绩按从小到大的顺序排列:88,90,92,92,95,96,96,97,98,99,
则10×20%=2,所以这10人成绩的20%分位数为=91,
这10人成绩的平均数为×(88+90+92+92+95+96+96+97+98+99)=94.3.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)