(共18张PPT)
9.2.2总体百分位数的 估计
1.求极差(即一组数据中最大值 与最小值的差)
, 28-1.3=26.7说明样本数 据的变化范围大小是26.7
2.决定组距与组数
取组距为3cm,那么组数=极 差÷组距=26.7÷3=8.9因此 可以将数据分成9组,即组距 为3,组数为9
3.将数据分组
横轴表示:组距,
纵轴表示:频率/组距
小长方形的面积
=组距*频率/组距=频率
各小长方形的面积总和等于1
分组 频数
频率
(1.2,4.2) 23
0.23
(4.2,7.2) 32
0.32
(7.2,10.2) 13
0.13
[10.2,13.2] 9
0.09
(13.2,16.2) 9
0.09
(16.2,19.2) 5
0.05
(19.2,22.2) 3
0.03
(22.2,25.2) 4
0.04
[25.2,28.2] 2
0.02
合计 100
1.00
5.画频率分布直方图
频率/组距
4.列频率分布表
复习回顾
引 入 :参照课本P192 页的数据,如果该市政府希望使80% 的居民用 户生活用水费支出不受影响,根据这100户居民用户的月均用水量数据 你能给市政府提出确定居民用户月均用水量标准的建议吗
分 析 :根据市政府的要求确定居民用户月均用水量标准,就是要寻 找一个数a 使全市用户月均用水量不超过a的80%,大于a的占20% .
解:(1)把100个样本数据从小到大排序
1.31.32.02.0 13.3 13.613.8 13.8 28.0
(2)得到第80和第81个数据分别是13.6和13.8
(3)我们取这两个数的平均数 13.6+13.8 =13.7
2
我们称13.7为这组数据的第80百分位数或80%分位数
百分位数定义:
一般地, 一组数据的第 p 百分位数是这样一个值
它使得这组数据中至少有 p% 的数据小于或等于这 个值,且至少有(100-p)%的数据大于或等于这个值.
备注:
求百分位数时, 一定要将数据按照从小到大的顺 序排列.
[做一做]
1. 判断正误(正确的打“√ ”,错误的打“×”)
(1)若一组样本数据的10%分位数是23,则在这组数据中有
10%的数据大于23. ( )
(2)若一组样本数据的24%分位数是24,则在这组数据中至
少有76%的数据大于或等于24.
答案:(1)× (2) √
( )
求百分位数的步骤
第1步:按从小到大排列原始数据.
第2步:计算i=n×p%.
第3步:若i不是整数,而大于i的比邻整数为j, 则第p百分
位数为第j项数据;若i是整数,则第p百分位数是第i项与 第(i+1) 项数据的平均数.
例如:样本量n=100, 则由80%×100=80,知50%分位数即是
从小到大排列的第80个与第81个数的平均数,如果n=101,
则由80%×101=80.8,得80%分位数即是第81个数
例 1一个容量为20的样本,其数据按从小到大的顺序
排列为:1,2,2,2,5,6,6,7,8,8,9,10,13,13,14,14,17, 17,18,18,则该组数据的第75百分位数为_14
第86百分位数为 17 .
解:∵20×75%=15,
∴第75百分位数为
∴第86百分位数为第18个数据17.
∵20×86%=17.2,
四分位数
常用的分位数有第25百分位数,第50百分位数
(中位数),第75百分位数.这三个分位数把一组由小
到大排列后的数据分成四等份,因此称为四分位数.
其中第25百分位数也称为第一四分位数或下四分位数,
第75 百分位数也称为第三四分位数或上四分位数.
像第1百分位数,第5百分位数,第95百分位数,
第99百分位数也常用
三、巩固新知
例2 .根据9.1.2节问题3中27名女生的样本数据,估
计树人中学高一年级女生的第25,50,75百分位数.
163.0 164.0 161.0 157.0 162.0165.0 158.0 155.0 164.0 162.5
154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0155.0 148.0
172.0 162.5 158.0 155.5 157.0163.0 172.0
解:把27名女生的样本数据按从小到大排序,可得
148.0 149.0 154.0 154.0 155.0 155.0 ( 155. 5) 157.0 157.0
158.0 158.0 159.0 161.0 162.0 162.5 162.5 163.0
163.0 164.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0
由25%×27=6.75,50%×27=13.5,75%×27=20.25, 知样本数据的第25,50,75百分位数为第7,14,21项数据, 分别为155.5,161,164.据此估计树人中学高一年级女 生的第25,50,7 5百分位数分别为155.5,161,164.
分组 频数
频率
(1.2,4.2) 23
0.23
(4.2,7.2) 32
0.32
(7.2,10.2) 13
0.13
(10.2,13.2) 9
0.09
[13.2,16.2] 9
0.09
(16.2,19.2) 5
0.05
(19.2,22.2) 3
0.03
(22.2,25.2) 4
0.04
[25.2,28.2] 2
0.02
合计 100
1.00
例3、根据下表估计月均用水量的样本数
据的80%和95%分位数.
解 :由频率分布表可知,月均用水量在13.2t以下的 居民用户所占比例为
23%+32%+13%+9%=77%,
在16.2t以下的居民用户所占比例为
77%+9%=86%.
因此,80%分位数一定位于[13.2,16.2]内,由
可以估计月均用水量的样本数据的95%分位数约为22.95.
可以估计月均用水量的样本数据的80%分位数约为14.2
0.80-0.77
=14.2,
0.09
同理,由 22.2+3x
13.2+3×
0.95-0.94
=22.95,
0.04
例3、根据下图估计月均用水量的样本数
据的80%和95%分位数.
01.2 4.27.210.213.216.219.222.225.228.2
月均用水量/t
频率/组距
0.12
0.107
0.1
0.080 .077
0.06
0.04
0.02
0.043
0.0300.030
0.0170.010 0.013 0.007
先算各组的频率, 解题步骤如上
练:如图是将高三某班60名学生参加某次数学模拟
考试所得的成绩(成绩均为整数)整理后画出的频率 分布直方图,则此班的模拟考试成绩的80%分位数 是_ (结果保留两位小数)
解:: 由频率分布直方图可知,分数在120分以下的学生所占的
比例为(0.01+0.015+0.015+0.03)×10×100%=70%,
分数在130分以下的学生所占的比例为(0.01+0.015+0.015
+0.03+0.0225)×10×100%=92.5%,
因此,80%分位数一定位于[120,130]内.
故此班的模拟考试成绩的80%分位数约为1 24.44.
训练2
某经销商从外地一水殖厂购进一批小龙虾,并随机抽取40只进
行统计,按重量分类统计结果如图:
(1)估计这批小龙虾重量的第10百分位数与第90百分位数;
(2)该经销商将这批小龙虾分成三个等级,如表:
等级 三等品 二等品
一等品
重量/克 (5,25) (25,45)
2[ 45,55]
试估计这批小龙虾划为几等品比较合理
解:(1)因为40×10%=4,所以第10百分位数为第4项与第5
项的平均数,在[5,15]范围内约 .因为40×90%=
36,所以第90百分位数为第36项与第37项的平均数,在[35,55]
范围内,约 所以估计这批小龙虾重量的第10
百分位数为10,第90百分位数为45.
(2)由(1)知,这批小龙虾重量集中在[10,45]范围内,所以划为二
等品比较合理.
课堂小结:
1、具体数据求百分位数的步骤
第1步:按从小到大排列原始数据.
第2步:计算i=n×p%.
第3步:若i不是整数,而大于i的比邻整数为j, 则第p百分
位数为第j项数据;若i是整数,则第p百分位数是第i项与 第(i+1) 项数据的平均数.
例如:样本量n=100, 则由80%×100=80,知50%分位数即是
从小到大排列的第80个与第81个数的平均数,如果n=101,
则由80%×101=80.8,得80%分位数即是第81个数
课堂小结:
2、频率分布直方图百分位数的步骤
确定百分位数所在的区间(a,b).
确定小于a 和小于b 的数据所占的百分比分别为fa%,fb%,
则第p 百分位数为