(共27张PPT)
9.2.2
总体百分位数的估计
学习目标
XUE XI MU BIAO
1.正确理解第p百分位数的概念,掌握求n个数据的第p百分位数的方法.
2.能通频率分布直方图熟练求解第p百分位数.
50%可以报名
50%不能报名
10%可以报名
90%不能报名
百分位数
1
百分位数的定义
一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
百分位数的定义
直观来说,一组数的第p位百分位数指的是讲这组数按照从小到大的顺序排列后,处于p%位置的数.
给出一组数据:
20,50,80,25,30,100,40,55,60,90
问:第60百分位数
i=10×60%=6
排序:20,25,30,40,50,55,60,80,90,100
第i项: 1 2 3 4 5 6 7 8 9 10
项数
第60百分位数:57.5
(排在60%那个位置的数据)
给出一组数据:
20,50,80,25,30,100,40,55,60,90
问:第34百分位数
i=10×34%=3.4
排序:20,25,30,40,50,55,60,80,90,100
第i项: 1 2 3 4 5 6 7 8 9 10
项数
第34百分位数:40
(排在34%那个位置的数据)
1
百分位数的定义
百分位数的计算步骤
计算一组n个数据的第p百分位数的步骤:
第1步,按__________排列原始数据.
第2步,计算i=________.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第____项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的________.
从小到大
n×p%
j
平均数
给出一组数据:20,10,20,40,50,60,70,80
问:第15百分位数
i=8×15%=1.2
排序:10,20,20,40,50,60,70,80
第i项: 1 2 3 4 5 6 7 8
项数
第15百分位数:20
给出一组数据:30,10,20,40,50,60,70,80
问:第25百分位数
排序:10,20,30,40,50,60,70,80
第i项: 1 2 3 4 5 6 7 8
项数
第25百分位数:25
i=8×25%=2
给出一组数据:30,10,20,40,50,60,70,80
第50百分位数:
i=8×50%=4
65
第75百分位数:
i=8×75%=6
45
排序:10,20,30,40,50,60,70,80
第i项: 1 2 3 4 5 6 7 8
1
百分位数的定义
四分位数的定义
四分位数:25%、50%、75%这三个分位数把一组数据从小到大分成四等份,因此称为四分位数.
四分位数
25%
第一四分位数
下四分位数
50%
75%
中位数
第三四分位数
上四分位数
例1 下列表述不正确的是
A.50%分位数就是总体的中位数
B.第p百分位数可以有单位
C.一个总体的四分位数有4个
D.样本容量越大,第p百分位数估计总体就越准确
√
解析 一个总体的25%分位数,50%分位数,75%分位数是总体的四分位数,有3个,所以C错误.
跟踪训练1 15%分位数的含义是
A.总体中任何一个数小于它的可能性是15%
B.总体中任何一个数小于或等于它的可能性是15%
C.总体中任何一个数大于它的可能性是15%
D.总体中任何一个数大于或等于它的可能性是15%
√
解析 根据第p百分位数的定义可知B正确.
例2 从某公司生产的产品中,任意抽取12件,得到它们的质量(单位:kg)如下:
7.9, 9.0, 8.9, 8.6, 8.4, 8.5, 8.5, 8.5, 9.9, 7.8, 8.3, 8.0,
分别求出这组数据的25%,75%,95%分位数.
将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,
所以12×25%=3,
12×75%=9,
12×95%=11.4,
95%分位数是第12个数据9.9.
3.一组数据为6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36,则这组数据的一个四分位数是15,则它是
A.15%分位数 B.25%分位数
C.50%分位数 D.75%分位数
√
《分层训练》205页第3题
将数据由小到大排列为 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49,共11项.由11×25%=2.75,故25%分位数是15.
0.05
0.35
0.30
0.20
0.10
①确定在哪一组
(计算每组的频率)
第四组
②计算具体位置
0.05+0.35+0.3+(x-35)0.04=0.8
x
0.1
x-35
x=37.5
问:第80百分位数
2
由频率分布直方图求百分位数
0.05
0.35
0.30
0.20
0.10
①确定在哪一组
(计算每组的频率)
第三组
②计算具体位置
0.05+0.35+(x-30)×0.06=0.5
x
0.1
x-30
问:第50百分位数
2
由频率分布直方图求百分位数
例4
《分层训练》205页第3题
5.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,估计棉花纤维的长度的样本数据的80%分位数是
A.29 mm B.29.5 mm
C.30 mm D.30.5 mm
样本容量
0.2
《分层训练》205页第3题
..............估计棉花纤维的长度的样本数据的80%分位数是
A.29 mm B.29.5 mm C.30 mm D.30.5 mm
0.05
0.05
0.2
0.3
0.25
0.1
0.05
①确定在哪一组
(计算每组的频率)
第五组
②计算具体位置
x
x-25
(x-25)×0.05=0.2
√
《分层训练》205页第7题
7.某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的第_____百分位数.
30
(0.005+0.01)×20=0.3
《分层训练》205页第7题
8.如图是某市2021年4月1日至4月7日每天最高、最低气温的折线统计图,这7天的日最高气温的第10百分位数为______,日最低气温的第80百分位数为______.
24 ℃
16 ℃
练习:某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频率分布表如右:
(1)求频率分布表中a,b的值;
排号 分组 频数 频率
1 [0,2) 6 0.06
2 [2,4) 8 0.08
3 [4,6) 17 b
4 [6,8) 22 0.22
5 [8,10) 25 0.25
6 [10,12) 12 0.12
7 [12,14) a 0.06
8 [14,16) 2 0.02
9 [16,18] 2 0.02
合计 100 1
跟踪训练3
(2)计算50%分位数,并估计是否有50%的学生的阅读时间达到7.68.
排号 分组 频数 频率
1 [0,2) 6 0.06
2 [2,4) 8 0.08
3 [4,6) 17 0.17
4 [6,8) 22 0.22
5 [8,10) 25 0.25
6 [10,12) 12 0.12
7 [12,14) 6 0.06
8 [14,16) 2 0.02
9 [16,18] 2 0.02
合计 100 1
解 0.06+0.08+0.17=0.31,
0.06+0.08+0.17+0.22=0.53,
所以50%分位数在[6,8)内,
√
设50%分位数为x
(x-6)×0.11=0.19
x ≈ 7.73
因为7.73>7.68,
所以估计有50%的学生的阅读时间达到7.68.
1.第p百分位数的定义?
2.四分位数?
3.由原始数据如何确定第p百分位数?
4.由频率分布表如何确定第p百分位数?
5.由频率分布直方图如何第p百分位数?
课堂小结