9.2.2 总体百分位数的估计
[学习目标] 1.结合实例,能用样本估计百分位数.
2.理解百分位数的统计含义.
[讨论交流] 预习教材P202-P204的内容,思考以下问题:
问题1.如何求n个数据的第p百分位数?
问题2.如何求频率分布直方图中的第p百分位数?
[自我感知] 经过认真预习,结合你对本节课的理解和认识,请画出本节课的知识逻辑体系.
探究1 百分位数的定义
探究问题1 某市政府为了减少水资源的浪费,计划对居民生活用水实施阶梯水价制度,即确定一户居民月用水量标准a.用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望80%的家庭能享受平价,如何确定a
[提示] 如图,根据市政府的要求确定居民用户月均用水量标准,就是要寻找一个数a,使全市居民用户月均用水量中不超过a的占80%,大于a的占20%.我们通过样本数据对a的值进行估计.
探究问题2 根据本书第286页(9.2.1节)探究问题3中100户居民用户的月均用水量数据,如何找到满足上述条件的数a?你能给市政府提出确定居民用户月均用水量标准的建议吗?
[提示] (1)将100个样本数据按从小到大排序:
(2)找到第80个和第81个数据分别为13.6和13.8;
(3)取两个数的平均数=13.7,并称此数为这组数据的第80百分位数,或80%分位数.
(4)根据样本数据的第80百分位数,我们可以估计总体数据的第80百分位数为13.7左右.所以建议市政府把月均用水量的标准定为14 t.
探究问题3 根据上述过程,思考何为第80百分位数?如何去定义一组数据的第p百分位数?
[提示]
[新知生成]
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3.四分位数
(1)中位数相当于是第50百分位数.除了中位数外,常用的分位数还有第25百分位数,第75百分位数.
(2)第25,50,75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
(3)第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
【教用·微提醒】 求百分位数时,一定要将数据按照从小到大的顺序排列.
【链接·教材例题】
例2 根据9.1.2节问题3中女生的样本数据,估计树人中学高一年级女生的第25,50,75百分位数.
[解] 把27名女生的样本数据按从小到大排序,可得
148.0 149.0 154.0 154.0 155.0 155.0 155.5 157.0 157.0
158.0 158.0 159.0 161.0 161.0 162.0 162.5 162.5 163.0
163.0 164.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0
由25%×27=6.75,50%×27=13.5,75%×27=20.25,可知样本数据的第25,50,75百分位数为第7,14,21项数据,分别为155.5,161,164.据此可以估计树人中学高一年级女生的第25,50,75百分位数分别约为155.5,161和164.
[典例讲评] 1.(1)以下数据为某学校参加学科节数学竞赛决赛的10人的成绩:(单位:分)
72,78,79,80,81,83,84,86,88,90.
这10人成绩的第p百分位数是85,则p=( )
A.65 B.70 C.75 D.80
(2)(多选)某地一年之内12个月的月降水量分别为:46,51,48,53,56,53,56,64,58,56,66,71,则下列说法正确的是( )
A.该地区的月降水量20%分位数为51
B.该地区的月降水量50%分位数为53
C.该地区的月降水量75%分位数为61
D.该地区的月降水量80%分位数为64
(1)B (2)ACD [(1)因为10人成绩的第p百分位数是85,
而85=,即第7位与第8位的平均值,
所以85是这10人成绩的第70百分位数.故选B.
(2)12个月的月降水量数据从小到大排列为:46,48,51,53,53,56,56,56,58,64,66,71,
由12×20%=2.4,该地区的月降水量20%分位数为51,A正确;
由12×50%=6,该地区的月降水量50%分位数为=56,B错误;
由12×75%=9,该地区的月降水量75%分位数为=61,C正确;
由12×80%=9.6,该地区的月降水量80%分位数为64,D正确.故选ACD.]
求百分位数的注意事项
(1)求百分位数时,一定要将数据按照从小到大的顺序排列.
(2)计算i=n×p%后要弄清i是整数还是非整数.
[学以致用] 1.某中学从高一年级中抽取了30名男生,测量其体重,数据如下(单位:千克):
62 60 59 59 59 58 58 57 57
57 56 56 56 56 56 56 55 55
55 54 54 54 53 53 52 52 51
50 49 48
(1)求这30名男生体重的25%,75%分位数;
(2)估计本校高一男生体重的第80百分位数.
[解] (1)将上述数据按从小到大排序,可得
48 49 50 51 52 52 53 53 54 54
54 55 55 55 56 56 56 56 56 56
57 57 57 58 58 59 59 59 60 62
由25%×30=7.5,75%×30=22.5,可知它们的25%,75%分位数是第8,23项数据,分别为53,57.
(2)由80%×30=24,可知第80百分位数为第24项与第25项数据的平均数,即=58.
据此可以估计本校高一男生体重的第80百分位数约为58.
探究2 由频率分布直方图估计百分位数
【链接·教材例题】
例3 根据表9.2-1或图9.2-1,估计月均用水量的样本数据的80%和95%分位数.
分析:在某些情况下,我们只能获得整理好的统计表或统计图,与原始数据相比,它们损失了一些信息.例如由表9.2-1,我们知道在[16.2,19.2)内有5个数据,但不知道这5个数据具体是多少.此时,我们通常把它们看成均匀地分布在此区间上.
[解] 由表9.2-1可知,月均用水量在13.2 t以下的居民用户所占比例为
23%+32%+13%+9%=77%.
在16.2 t以下的居民用户所占的比例为
77%+9%=86%.
因此,80%分位数一定位于[13.2,16.2)内.由
13.2+3×=14.2,
可以估计月均用水量的样本数据的80%分位数约为14.2.
类似地,由
22.2+3×=22.95,
可以估计月均用水量的样本数据的95%分位数约为22.95.
[典例讲评] 2.(1)某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的第________百分位数.
(2)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,试估计60株树木的底部周长的第50百分位数和第75百分位数.
(1)30 [因为[20,40),[40,60)的频率为(0.005+0.01)×20=0.3,所以60分为成绩的第30百分位数.]
(2)[解] 由题图求分别落在各区间上的频数.
在[80,90)上为60×0.015×10=9,
在[90,100)上为60×0.025×10=15,
在[100,110)上为60×0.030×10=18,
在[110,120)上为60×0.020×10=12,
在[120,130]上为60×0.010×10=6.
从以上数据可知第50百分位数一定落在区间[100,110)上,由100+10×≈103.3;
第75百分位数一定落在区间[110,120)上,
由110+10×=112.5.
综上可知,第50百分位数和第75百分位数分别为103.3 cm,112.5 cm.
由频率分布直方图估计百分位数的方法
(1)确定百分位数所在的区间[a,b).
(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为.
[学以致用] 2.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频率分布表如下:
排号 分组 频数 频率
1 [0,2) 6 0.06
2 [2,4) 8 0.08
3 [4,6) 17 b
4 [6,8) 22 0.22
5 [8,10) 25 0.25
6 [10,12) 12 0.12
7 [12,14) a 0.06
8 [14,16) 2 0.02
9 [16,18] 2 0.02
合计 100 1
(1)求频率分布表中a,b的值;
(2)计算50%分位数,并估计是否有50%的学生的阅读时间达到7.68小时.
[解] (1)a=0.06×100=6,b==0.17.
(2)阅读时间小于6小时的学生所占比例是0.06+0.08+0.17=0.31,
阅读时间小于8小时的学生所占比例是0.06+0.08+0.17+0.22=0.53,
所以50%分位数在[6,8)内,
所以50%分位数约为6+2×≈7.73.
因为7.73>7.68,
所以估计有50%的学生的阅读时间达到7.68小时.
【教用·备选题】 某市举行“中学生诗词大赛”,某校有1 000名学生参加了比赛,从中抽取100名学生,统计他们的成绩(单位:分),并进行适当的分组(每组为左闭右开的区间),得到的频率分布直方图如图所示,则估计该校学生成绩的80%分位数为________.
122 [根据频率分布直方图可知,成绩在130分以下的学生所占比例为1-0.005 0×20=0.9,成绩在110分以下的学生所占比例为1-(0.012 5+0.005 0)×20=0.65,因此80%分位数一定位于[110,130)内,由110+20×=122,故可估计该校学生成绩的80%分位数为122.]
1.已知100个数据的75%分位数是9.3,则下列说法正确的是( )
A.这100个数据中最多有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数
C [因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为75%分位数,是9.3,则C正确,其他选项均不正确.故选C.]
2.下列一组数据的下四分位数是( )
2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6
A.3.2 B.3.0 C.4.4 D.2.5
A [把该组数据按照由小到大排列,可得
2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,
下四分位数即第25百分位数,由10×25%=2.5,不是整数,则第3个数据3.2是下四分位数.]
3.某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5~40之间.估计垫球数的样本数据的第75百分位数是( )
A.17.5 B.18.75 C.27 D.28
D [垫球数在区间[5,25)内的人数占总数的(0.01+0.01+0.04+0.06)×5×100%=60%;
垫球数在区间[5,30)内的人数占总数的(0.01+0.01+0.04+0.06+0.05)×5×100%=85%,
∴第75百分位数位于区间[25,30)内,且25+5×=25+3=28,
∴估计垫球数的样本数据的第75百分位数是28.
故选D.]
4.下列说法正确的是________(填序号).
①50%分位数就是中位数.
②若一组样本数据各不相等,则其75%分位数大于25%分位数.
③若一组样本数据的10%分位数是23,则在这组数据中有10%的数据大于23.
④若一组样本数据的24%分位数是24,则在这组数据中至少有76%的数据大于或等于24.
①②④ [由百分位数的概念可知①②④正确,③错误.若一组样本数据的10%分位数是23,则在这组数据中至少有10%的数据小于或等于23.]
1.知识链:(1)百分位数的定义.
(2)由样本数据求百分位数.
(3)由频数(频率)分布表及频率分布直方图求百分位数.
2.方法链:数据分析、数形结合.
3.警示牌:求第p百分位数时,注意应先将数据按从小到大排列.
回顾本节知识,自主完成以下问题:
1.百分位数告诉我们什么信息?
[提示] 对于无大量重复的数据,第p百分位数将它分为两个部分,大约有p%的数据项的值比第p百分位数小,而大约有(100-p)%的数据项的值比第p百分位数大.
2.计算第p百分位数时应注意什么?
[提示] 对于数据型的第p百分位数计算时应注意以下两点:
(1)求百分位数时,一定要将数据按照从小到大的顺序排列;
(2)计算i=n×p%后要弄清i是整数还是非整数.
对于由频率分布直方图求百分位数时应注意频率分布直方图中小矩形的面积,就是数据确定在哪个区间.
课时分层作业(四十一) 总体百分位数的估计
一、选择题
1.数据6.0,7.4,8.0,8.4,8.6,8.7,9.0,9.1的第50百分位数为( )
A.8.4 B.8.5 C.8.6 D.8.7
B [依题意,一组数据的第50百分位数即为该组数据的中位数,
所以数据6.0,7.4,8.0,8.4,8.6,8.7,9.0,9.1的第50百分位数为=8.5.故选B.]
2.为贯彻国家体育总局提出的“阳光体育”运动要求,某校举行了全校大课间跑操比赛.现从该校随机抽取20个班级的比赛成绩,得到以下统计表,由统计表可得这20个比赛成绩的第80百分位数是( )
成绩 6 7 8 9 10
班级数 5 3 4 4 4
A.8.5 B.9 C.9.5 D.10
C [由20×80%=16,得出第80百分位数是第16和第17个成绩的平均数,
由表中数据可知第16个成绩为9,第17个成绩为10,
所以第80百分位数为=9.5,故选C.]
3.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]之间,其频率分布直方图如图所示.估计棉花纤维的长度的样本数据的90%分位数是( )
A.32.5 mm B.33 mm
C.33.5 mm D.34 mm
A [棉花纤维的长度在30 mm以下的比例为
(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在35 mm以下的比例为85%+10%=95%,因此,90%分位数一定位于[30,35)内,由30+5×=32.5,
可以估计棉花纤维的长度的样本数据的90%分位数是32.5 mm.]
4.某城市抽样了100户居民月均用水量(单位:t),并作出频率分布表如下,
分组 频数 频率
6 0.060
18 0.180
44 0.440
16 0.160
11 0.110
5 0.050
则第80百分位数为( )
A.2.625 B.2.750
C.2.875 D.3.125
C [∵0.06+0.18+0.44=0.68,0.06+0.18+0.44+0.16=0.84,
∴第80百分位数位于,则第80百分位数为2.5+×0.5=2.875.故选C.]
5.(多选)一组数据为6,47,49,15,42,41,7,39,43,40,36,这组数据的一个四分位数是15,则它是( )
A.第一四分位数 B.下四分位数
C.第三四分位数 D.上四分位数
AB [将数据由小到大排列为 6,7,15,36,39,40,41,42,43,47,49,共11项.由11×25%=2.75,故15是第一四分位数或下四分位数.]
二、填空题
6.已知30个数据的第60百分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是________.
8.6 [由于30×60%=18,设第19个数据为x,则=8.2,解得x=8.6,即第19个数据是8.6.]
7.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70%分位数约为________秒.
16.5 [设成绩的70%分位数为x,因为=0.55,=0.85,
所以x∈ [16,17),所以0.55+(x-16)×=0.70,解得x=16.5秒.]
8.数据1,2,7,3,4,5,3,6的p分位数是5,则p的取值范围是________.
[数据从小到大排序为:1,2,3,3,4,5,6,7,
5在第6位,所以5<8p<6,p∈.]
三、解答题
9.新时期党史学习教育,是党中央立足党的百年历史新起点、统筹中华民族伟大复兴战略全局和世界百年未有之大变局,为动员全党全国满怀信心投身全面建设社会主义现代化国家而作出的重大决策.某企业成立的党史学习教育督查组为调研本单位的党史学习情况,采用分层随机抽样方法从该企业人员中抽取一个容量为100的样本,经数据搜集与处理,得到如下频数分布表:
周学习党史时间/min [0,30) [30,60) [60,90) [90,120) [120,150]
高管人员 0 0 1 0 2
中层管理人员 1 0 2 2 4
普通员工 9 12 45 20 2
(1)已知该企业的中、高层管理人员共有120人,求该企业普通员工的人数;
(2)为激励先进、鞭策后进,督查组拟公布企业全体人员的周学习党史时间的第一四分位数(即第25百分位数)M及上四分位数(即第75百分位数)N,试求M,N的估计值(精确到0.1).
[解] (1)设该企业普通员工的数量为n人,由样本容量为100,样本中普通员工88人,
∴样本中高管人员和中层管理人员共有12人,则=,解得n=880,
∴该企业普通员工的数量为880人.
(2)根据题意可得样本中各区间的频数分布表如下:
周学习党史时间 [0,30) [30,60) [60,90) [90,120) [120,150]
企业人员 10 12 48 22 8
∵10+12<25<10+12+48,
∴第25百分位数在区间中,则第25百分位数为M=60+30×≈61.9(分钟).
∵10+12+48<75<10+12+48+22,
∴第75百分位数在区间中,则第75百分位数为N=90+30×≈96.8(分钟),
用样本估计总体,企业全体人员的周学习党史时间的第一四分位数(即第25百分位数)M≈61.9分钟,
上四分位数(即第75百分位数)N≈96.8分钟.
10.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,第50百分位数为b,则有( )
A.a=13.7,b=15.5 B.a=14, b=15
C.a=12,b=15.5 D.a=14.7,b=15
D [把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a=×(10+12+14+14+15+15+16+17+17+17)=14.7,第50百分位数为b==15.]
11.数据3.2,3.4,3.8,4.2,4.3,4.5,x,6.6的第65百分位数是4.5,则实数x的取值范围是( )
A.[4.5,+∞) B.[4.5,6.6)
C.(4.5,+∞) D.(4.5,6.6]
A [因为8×65%=5.2,所以这组数据的第65百分位数是按从小到大排列后的第6项数据4.5,则x≥4.5.]
12.(多选)从某公司生产的产品中任意抽取12件,得到它们的质量(单位:kg)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0,则这组数据的四分位数可能是( )
A.8.75 B.8.15 C.9.9 D.8.5
ABD [将这12个数据按从小到大排序得:7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
由12×25%=3,可知这组数据的第25百分位数为=8.15,
由12×50%=6,可知这组数据的第50百分位数为=8.5,
由12×75%=9,可知这组数据的第75百分位数为=8.75,所以这组数据的四分位数可能是ABD.]
13.某校高一年级抽样的30名女生的身高(单位:cm)数据从小到大排序如下:
148 149 154 154 155 155 155 157
157 158 158 159 160 161 161 162
162 162 162 163 163 163 164 164
165 165 170 171 172 172
经计算,原来这组数据的第80百分位数为164.5.现将其去掉最后一个数据172,则剩余数据的第80百分位数________.(选填“变大”“变小”或“不变”)
变小 [原来30个数据的第80百分位数为164.5,
去掉最后一个数据172,还有29个数据,
因为29×80%=23.2,
所以剩余数据的第80百分位数为第24个数据,即为164,因为164<164.5,
所以剩余数据的第80百分位数变小.]
14.从某保险公司的推销员中随机抽取50名,统计这些推销员某月的月销售额(单位:千元),由统计结果得如下频数分布表:
月销售 额分组 [12.25, 14.75) [14.75, 17.25) [17.25, 19.75) [19.75, 22.25) [22.25, 24.75]
频数 4 10 24 8 4
(1)作出这些数据的频率分布直方图;
(2)根据以上抽样调查数据,公司将推销员的月销售指标确定为17.875千元,试判断是否有60%的推销员能够完成该销售指标.
[解] (1)根据题意作出频率分布表:
月销售 额分组 [12.25, 14.75) [14.75, 17.25) [17.25, 19.75) [19.75, 22.25) [22.25, 24.75]
频数 4 10 24 8 4
频率 0.08 0.20 0.48 0.16 0.08
作出频率分布直方图如图所示.
(2)由(1)得,月销售额小于17.875千元的频率为0.08+0.2+×0.48=0.4,所以有60%的推销员能够完成该销售指标.
15.某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式;
(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b的值.
(3)根据(2)中求得的数据计算用电量的75%分位数.
[解] (1)当0≤x≤200时,y=0.5x;
当200当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140.
所以y与x之间的函数解析式为
y=
(2)由(1)可知,当y=260时,x=400,即用电量不超过400千瓦时的占80%,
结合频率分布直方图可知
解得a=0.001 5,b=0.002 0.
(3)设75%分位数为m,
因为用电量低于300千瓦时的所占比例为(0.001+0.002+0.003)×100=60%,
用电量不超过400千瓦时的占80%,
所以75%分位数在[300,400)内,
所以0.6+(m-300)×0.002=0.75,
解得m=375千瓦时,
即用电量的75%分位数为375千瓦时.
21世纪教育网(www.21cnjy.com)(共40张PPT)
9.2.2 总体百分位数的估计
第九章 统计
9.2 用样本估计总体
整体感知
[学习目标] 1.结合实例,能用样本估计百分位数.
2.理解百分位数的统计含义.
[讨论交流] 预习教材P202-P204的内容,思考以下问题:
问题1.如何求n个数据的第p百分位数?
问题2.如何求频率分布直方图中的第p百分位数?
[自我感知] 经过认真预习,结合你对本节课的理解和认识,请画出本节课的知识逻辑体系.
探究建构
探究1 百分位数的定义
探究问题1 某市政府为了减少水资源的浪费,计划对居民生活用水实施阶梯水价制度,即确定一户居民月用水量标准a.用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望80%的家庭能享受平价,如何确定a
[提示] 如图,根据市政府的要求确定居民用户月均用水量标准,就是要寻找一个数a,使全市居民用户月均用水量中不超过a的占80%,大于a的占20%.我们通过样本数据对a的值进行估计.
探究问题2 根据本书第286页(9.2.1节)探究问题3中100户居民用户的月均用水量数据,如何找到满足上述条件的数a?你能给市政府提出确定居民用户月均用水量标准的建议吗?
[提示] (1)将100个样本数据按从小到大排序:
探究问题3 根据上述过程,思考何为第80百分位数?如何去定义一组数据的第p百分位数?
[提示]
[新知生成]
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
p%
2.计算一组n个数据的第p百分位数的步骤
第1步,按_________排列原始数据.
第2步,计算i=_______.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第
___项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的_______.
从小到大
n×p%
j
平均数
3.四分位数
(1)中位数相当于是第 百分位数.除了中位数外,常用的分位数还有第25百分位数,第75百分位数.
(2)第 , , 百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
(3)第25百分位数也称为第 四分位数或 四分位数等,第75百分位数也称为第 四分位数或 四分位数等.
50
25
50
75
一
下
三
上
【教用·微提醒】 求百分位数时,一定要将数据按照从小到大的顺序排列.
【链接·教材例题】
例2 根据9.1.2节问题3中女生的样本数据,估计树人中学高一年级女生的第25,50,75百分位数.
[解] 把27名女生的样本数据按从小到大排序,可得
148.0 149.0 154.0 154.0 155.0 155.0 155.5 157.0 157.0
158.0 158.0 159.0 161.0 161.0 162.0 162.5 162.5 163.0
163.0 164.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0
由25%×27=6.75,50%×27=13.5,75%×27=20.25,可知样本数据的第25,50,75百分位数为第7,14,21项数据,分别为155.5,161,164.据此可以估计树人中学高一年级女生的第25,50,75百分位数分别约为155.5,161和164.
[典例讲评] 1.(1)以下数据为某学校参加学科节数学竞赛决赛的10人的成绩:(单位:分)
72,78,79,80,81,83,84,86,88,90.
这10人成绩的第p百分位数是85,则p=( )
A.65 B.70 C.75 D.80
(2)(多选)某地一年之内12个月的月降水量分别为:46,51,48,53,56,53,56,64,58,56,66,71,则下列说法正确的是( )
A.该地区的月降水量20%分位数为51
B.该地区的月降水量50%分位数为53
C.该地区的月降水量75%分位数为61
D.该地区的月降水量80%分位数为64
√
√
√
√
反思领悟 求百分位数的注意事项
(1)求百分位数时,一定要将数据按照从小到大的顺序排列.
(2)计算i=n×p%后要弄清i是整数还是非整数.
[学以致用] 1.某中学从高一年级中抽取了30名男生,测量其体重,数据如下(单位:千克):
62 60 59 59 59 58 58 57 57
57 56 56 56 56 56 56 55 55
55 54 54 54 53 53 52 52 51
50 49 48
(1)求这30名男生体重的25%,75%分位数;
(2)估计本校高一男生体重的第80百分位数.
探究2 由频率分布直方图估计百分位数
【链接·教材例题】
例3 根据表9.2-1或图9.2-1,估计月均用水量的样本数据的80%和95%分位数.
分析:在某些情况下,我们只能获得整理好的统计表或统计图,与原始数据相比,它们损失了一些信息.例如由表9.2-1,我们知道在[16.2,19.2)内有5个数据,但不知道这5个数据具体是多少.此时,我们通常把它们看成均匀地分布在此区间上.
[典例讲评] 2.(1)某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的第________百分位数.
30
(2)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,试估计60株树木的底部周长的第50百分位数和第75百分位数.
(1)30 [因为[20,40),[40,60)的频率为(0.005+0.01)×20=0.3,所以60分为成绩的第30百分位数.]
(2)[解] 由题图求分别落在各区间上的频数.
在[80,90)上为60×0.015×10=9,
在[90,100)上为60×0.025×10=15,
在[100,110)上为60×0.030×10=18,
在[110,120)上为60×0.020×10=12,
在[120,130]上为60×0.010×10=6.
[学以致用] 2.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频率分布表如下:
排号 分组 频数 频率
1 [0,2) 6 0.06
2 [2,4) 8 0.08
3 [4,6) 17 b
4 [6,8) 22 0.22
5 [8,10) 25 0.25
6 [10,12) 12 0.12
7 [12,14) a 0.06
8 [14,16) 2 0.02
9 [16,18] 2 0.02
合计 100 1
(1)求频率分布表中a,b的值;
(2)计算50%分位数,并估计是否有50%的学生的阅读时间达到7.68小时.
【教用·备选题】 某市举行“中学生诗词大赛”,某校有1 000名学生参加了比赛,从中抽取100名学生,统计他们的成绩(单位:分),并进行适当的分组(每组为左闭右开的区间),得到的频率分布直方图如图所示,则估计该校学生成绩的80%分位数为________.
122
2
4
3
题号
1
应用迁移
1.已知100个数据的75%分位数是9.3,则下列说法正确的是( )
A.这100个数据中最多有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数
√
2
4
3
题号
1
C [因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为75%分位数,是9.3,则C正确,其他选项均不正确.故选C.]
2
3
题号
1
4
2.下列一组数据的下四分位数是( )
2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6
A.3.2 B.3.0 C.4.4 D.2.5
√
A [把该组数据按照由小到大排列,可得
2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,
下四分位数即第25百分位数,由10×25%=2.5,不是整数,则第3个数据3.2是下四分位数.]
2
3
题号
4
1
3.某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5~40之间.估计垫球数的样本数据的第75百分位数是( )
A.17.5
B.18.75
C.27
D.28
√
2
3
题号
4
1
2
4
3
题号
1
4.下列说法正确的是________(填序号).
①50%分位数就是中位数.
②若一组样本数据各不相等,则其75%分位数大于25%分位数.
③若一组样本数据的10%分位数是23,则在这组数据中有10%的数据大于23.
④若一组样本数据的24%分位数是24,则在这组数据中至少有76%的数据大于或等于24.
①②④
2
4
3
题号
1
①②④ [由百分位数的概念可知①②④正确,③错误.若一组样本数据的10%分位数是23,则在这组数据中至少有10%的数据小于或等于23.]
1.知识链:(1)百分位数的定义.
(2)由样本数据求百分位数.
(3)由频数(频率)分布表及频率分布直方图求百分位数.
2.方法链:数据分析、数形结合.
3.警示牌:求第p百分位数时,注意应先将数据按从小到大排列.
回顾本节知识,自主完成以下问题:
1.百分位数告诉我们什么信息?
[提示] 对于无大量重复的数据,第p百分位数将它分为两个部分,大约有p%的数据项的值比第p百分位数小,而大约有(100-p)%的数据项的值比第p百分位数大.
2.计算第p百分位数时应注意什么?
[提示] 对于数据型的第p百分位数计算时应注意以下两点:
(1)求百分位数时,一定要将数据按照从小到大的顺序排列;
(2)计算i=n×p%后要弄清i是整数还是非整数.
对于由频率分布直方图求百分位数时应注意频率分布直方图中小矩形的面积,就是数据确定在哪个区间.