第九章 统计
9.2.2总体百分数的估计
一、教学目标
1.通过学习和应用百分位数,重点培养数据分析素养、数学运算和数学建模素养.
2.掌握求一组数据的百分位的基本步骤:
3.通过对总体百分数的估计的学习,培养学生数学抽象、数学运算、数学建模等数学素养。
二、教学重难点
1.理解百分位数的概念及其简单应用
2.求样本数据的第p百分位数.
三、教学过程:
(1)创设情景
阅读课本,完成下列填空。
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有________的数据小于或等于这个值,且至少有_________的数据大于或等于这个值.
新知探究
问题1:计算一组n个数据的第p百分位数有哪些具体步骤?
学生回答,教师点拨并(提出本节课所学内容)
新知建构
第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
计算第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i =n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第项与第(i+1)项数据的平均数.
(4)数学运用
例1.现有甲、乙两组数据如下表所示.
序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
甲组 1 2 2 2 2 3 3 3 5 5 6 6 8 8 9 10 10 12 13 13
乙组 0 0 0 0 1 1 2 3 4 5 6 6 7 7 10 14 14 14 14 15
试求甲、乙两组数的25%分位数与75%分位数.
【解析】因为数据个数为20,而且20×25%=5,20×75%=15.
因此,甲组数的25%分位数为==2.5;
甲组数的75%分位数为==9.5.
乙组数的25%分位数为==1,乙组的75%分位数为==12.
变式训练1:某所学校在一个学期的开支分布的饼图如图1所示,在该学期的水、电、交通开支(单位:万元)如图2所示,则该学期的水电费开支占总开支的百分比为( )
A. B. C. D.
【答案】B
【解析】由图知,水、电支出占水、电、交通支出的比例为,
由图知,水、电、交通支出占学校一个学期总开支的比例为,
因此,该学期的水电费开支占总开支的百分比为,故选:B。
变式训练2:从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的第25,75,95百分位数.
(2)请你找出珍珠质量较小的前15%的珍珠质量.
(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.
【解析】(1)将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,
则第25百分位数是=8.15,
第75百分位数是=8.75,
第95百分位数是第12个数据为9.9.
(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.
即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.
(3)由(1)可知样本数据的第25百分位数是8.15 g,第50百分位数为8.5 g, 第95百分位数是9.9,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于等于9.9的珍珠为优等品,质量大于9.9 g的珍珠为特优品.
例2.有1个容量为100的样本,数据的分组及各组的频数如下:
[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5],8.
(1)列出样本的频率分布表(含累计频率).
(2)画出频率分布直方图.
(3)根据频率分布表的累计频率估计样本的90%分位数.
【解析】(1)样本的频率分布表如下:
分组 频数 频率 累计频率
[12.5,15.5) 6 0.06 0.06
[15.5,18.5) 16 0.16 0.22
[18.5,21.5) 18 0.18 0.40
[21.5,24.5) 22 0.22 0.62
[24.5,27.5) 20 0.20 0.82
[27.5,30.5) 10 0.10 0.92
[30.5,33.5] 8 0.08 1.00
合计 100 1.00
(2)频率分布直方图如图所示.
(3)由频率分布表的累计频率知,小于30.5的数据所占的比例为92%,所以90%分位数一定在区间[27.5,30.5)内,由27.5+3×=29.9,可以估计样本的90%分位数为29.9.
变式训练:已知一组数据:125,121,123,125,127,129,125,128,130,129,126,124,125,127,126.则这组数据的第25百分位数和第80百分位数分别是( )
A.125 128 B.124 128
C.125 129 D.125 128.5
【答案】D
【解析】把这15个数据按从小到大排序,可得121,123,124,125,125,125,125,126,126,127,127,128,129,129,130,由25%×15=3.75,80%×15=12,可知数据的第25百分位数为第4项数据为125,第80百分位数为第12项与第13项数据的平均数,即×(128+129)=128.5.
例3:某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式.
(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b的值.
(3)根据(2)中求得的数据a=0.001 5,b=0.002 0.计算用电量的75%分位数.
【解析】(1)当0≤x≤200时,y=0.5x;
当200当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140.
所以y与x之间的函数解析式为y=
(2)由(1)可知,当y=260时,x=400,即用电量不超过400千瓦时的占80%,
用电量不超过400千瓦时的占80%,
所以75%分位数为m在[300,400)内,
所以0.6+(m-300)×0.002=0.75,
解得m=375千瓦时,
即用电量的75%分位数为375千瓦时.
(3)设75%分位数为m,因为用电量低于30千瓦时的所占比例为(0.001+0.002+0.003)×100=60%,
变式训练:山东省教育厅为了了解和掌握2019年高考考生的实际答卷情况,随机地取出了100名考生的数学成绩(单位:分),将数据分成了11组,制成了如图所示的频率分布表:
分组 频数 频率
[80,85) 1 0.01
[85,90) 2 0.02
[90,95) 4 0.04
[95,100) 14 0.14
[100,105) 24 0.24
[105,110) 15 0.15
[110,115) 12 0.12
[115,120) 9 0.09
[120,125) 11 0.11
[125,130) 6 0.06
[130,135] 2 0.02
合计 100 1
(1)求样本数据的第60,80百分位数.
(2)估计2019年高考考生的数学成绩的90%分位数.
【答案】(1)第60百分位数为110,第80百分位数约为119.4.
(2)数学成绩的90%分位数为124.1.
【解析】从频率分布表得,前六组的频率之和为0.01+0.02+0.04+0.14+0.24+0.15=0.60,
前七组的频率之和为0.60+0.12=0.72,
前八组的频率之和为0.72+0.09=0.81,
前九组的频率之和为0.81+0.11=0.92.
(1)由前六组的频率之和为0.60,得样本数据的第60百分位数为110,样本数据的第80百分位数一定在第八组[115,120)内,由115+5×=119.4,估计样本数据的第80百分位数约为119.4.
(2)由前八组的频率之和为0.81,前九组的频率之和为0.92,知90%分位数一定在第九组[120,125)内,由120+5×=124.1,估计2019年高考考生的数学成绩的90%分位数为124.1.
四、小结:
第p百分位数的定义:
计算第p百分位数的步骤:
五、作业:习题9.2.2