第6章 统计§6.4.3用样本估计总体数字特征-百分位数 课件(共22张PPT)

文档属性

名称 第6章 统计§6.4.3用样本估计总体数字特征-百分位数 课件(共22张PPT)
格式 pptx
文件大小 2.0MB
资源类型 试卷
版本资源 北师大版(2019)
科目 数学
更新时间 2025-12-31 20:57:50

图片预览

文档简介

(共22张PPT)
北师大版(2019)高中数学必修第一册
第6章 统计
现在你以母校而自豪,
将来母校因你更光荣!
§6.4.3用样本估计总体数字特征-百分位数
学习目标
1 结合实例,能用样本估计百分位数,培养数学抽象的核心素养.
2 理解百分位数的统计含义,培养数据分析的核心素养.
3 通过学习和应用百分位数,重点培养数据分析素养、数学运算和数学建模素养
1.重点:结合实例,能用样本估计百分位数
2.难点:理解百分位数的统计含义.
中位数 一组数的平均数与这组数中的每一个数都有关,特别地,平均数容易受到最值的影响,因此有时平均数并不能很好地表示这组数的中心位置.而中位数就是这组数的中心位置。
①当数据个数为奇数时,中位数是按从小到大(或从大到小)的顺序依次排列的中间那个数.
②当数据个数为偶数时,中位数为按从小到大(或从大到小)的顺序依次排列的最中间的两个数的平均数.
注意:一组数据的中位数只有一个.
中位数、百分位数
定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
可以通过下面的步骤计算一组n个数据的第p百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
第p百分位数的定义
问题延伸与思考
月平均用水量/t
0.12
0.1
0.08
0.06
0.04
0.02
0
1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
0.077
频率/组距
100户居民用户月均用水量的频率分布的特点:
大部分居民用户的月均用水量集中在一个较低值区域,尤其在区间[1.2,7.2)最为集中;
少数居民用户的月均用水量偏多;
随着月均用水量的增加,居民用户数呈现降低趋势.
该市全体居民用户月均用水量也会有类似的分布,即大部分居民用户均用水量集中在较低值区域.
思想:用样本的频率分布估计总体的频率分布
推测
为政府决策
确定一个居民用户月用水量的标准a
问题决策
问题 如果该市政府希望使80%的居民用户生活用水费支出不受影响,根据100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?
即:寻求一个数a,使全市居民用户月均用水量中不超过a的占80%,大于a的占20%.
①把100个样本数据从小到大排序
第i个 1 2 3 4 5 ... 80 81 ... 97 98 99 100
数据 1.3 1.3 1.8 2.0 2.0 ... 13.6 13.8 ... 24.3 24.5 25.6 28.0
②得到第80和第81个数据分别是13.6和13.8
区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.
③取这两数的平均数
称此数为这组数据的第80百分位数或80%分位数
估计
建议市政府把月均用水量标准定为14t
总体数据的第80百分位数约为13.7
80%
20%
a
第p百分位数的定义
一组数据的第 p百分位数:能使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值的数.
计算一组n个数据的第p百分位数的步骤:
第1步:按从小到大排列原始数据;
第2步:计算i=n×p%;
第3步:①若i不是整数,则第p百分位数为第j项数据( j为大于i的比邻整数);
②若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
在实际应用中,常用的分位数还有第25百分位数,第50百分位数(中位数),第75百分位数.
这3个分位数把一组由小到大排列的数据分成四等份,故称为四分位数.
其中,第25百分位数称为第一四分位数或下四分位数等,
第75百分位数也称为第三四分位数或上四分位数等.
第1百分位数
第5百分位数
第95百分位数
第99百分位数
p%
(100-p)%
a
25%
50%
75%
求一组数据的第p百分位数
1.由样本数据计算第p百分位数
2.由样本数据的频率分布直方图计算第p百分位数
第1步:按从小到大排列原始数据;
第2步:计算i=n×p%;
第3步:①若i不是整数,而大于i的比邻整数为 j,则第p百分位数为第j项数据;
②若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
第1步:计算各组数据的频率(即计算各小长方形的面积);
第2步:确定小于a和小于b的数据所占的百分比分别为fa%,fb%,且fa%则第p百分位数在区间[a,b)内;
第3步:利用面积比=宽之比,则第p百分位数为a + ·(b a).
不是.是指能够考取本科院校的同学占同学总数的百分比.
有70%的同学数学测试成绩在小于或等于85分.
例2(1)班级人数为50的班主任老师说“90%的同学能够考取本科院校”,
这里的“90%”是百分位数吗?
(2)“这次数学测试成绩的第70百分位数是85分”这句话是什么意思?
思考1:第p百分位数有什么特点?
总体数据中的任意一个数小于或等于它的可能性是p.
例3.知100个数据的第75百分位数是9.3,则下列说法正确的是(  )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.这100个数从小到大排列后,9.3是第75个数和第76个数的平均数
D.这100个数从小到大排列后,9.3是第75个数和第74个数的平均数
解析:因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,选C.
C
例4.从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的第25,50,95百分位数;
解 (1)将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,所以12×25%=3,12×50%=6,12×95%=11.4,
例5.根据下表或下图,估计月均用水量的样本数据的80%和95%分位数.
统计表或统计图,与原始数据相比,它们损失了一些信息,例如由上表中可以知道在[16.2,19.2)内有5个数据,但不知道这5个数据具体是多少.此时,我们通常把它们看成均匀地分布在此区间上.
月平均用水量/t
0.12
0.1
0.08
0.06
0.04
0.02
0
1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
0.077
频率/组距
根据表或图估计月均用水量的样本数据的
80%和95%分位数.
解:∵ 80%分位数一定位于[13.2,16.2)内.
可估计月均用水量的样本数据的80%分位数约为14.2;
∵95%分位数一定位于[22.2,25.2)内.
可估计月均用水量的样本数据的95%分位数约为22.95.
假定样本数据在区间内是均匀分布的.
在频率分布直方图中,
第p百分位数左侧的长方形面积和为p %
面积比=宽之比
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等
这个结果与根据原始数据求得的中位数6.6相差不大.
由于0.077×3=0.231,(0.077+0.107)×3=0.552.
因此中位数落在区间[4.2,7.2)内.
设中位数为x,由0.077×3+0.107×(x-4.2)=0.5得到x≈6.71.
因此,中位数约为6.71,如图所示.
第p百分位数的计算
例6.某车间12名工人一天生产某产品(单位:kg)的数量分别为13.8,13,13.5,15.7,13.6,14.8,14,14.6,15,15.2,15.8,15.4,则所给数据的第75百分位数分别是 .
解:将12个数据按从小到大排序:
13,13.5,13.6,13.8,14,14.6,14.8,15,15.2,15.4,15.7,15.8.
由12×75%=9可知,
按从小到大排列原始数据
所给数据的第75分位数为第9个和第10个数据的平均数
计算i=n×p%
若i不是整数,而大于i的比邻整数为 j,则第p百分位数为第j项数据
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
15.3
例7.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;
(2)由频率分布直方图估计志愿者年龄的95%分位数为________岁.
解:(1)设[25,30)年龄组对应小矩形的高度为h,
由(0.01+h+0.07+0.06+0.02)×5=1,解得h=0.04.
(2)由题图可知年龄小于40岁的频率为1-0.02×5=0.9,
且所有志愿者的年龄都小于45岁,
∴志愿者年龄的95%分位数在[40,45)内,
∴志愿者年龄的95%分位数为
0.04
42.5
例8.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)[25,30)年龄组对应小矩形的高度为________;
(2)由频率分布直方图估计志愿者年龄的85%分位数为___岁.
0.04
39
解析 (1)设[25,30)年龄组对应小矩形的高度为h,
则5×(0.01+h+0.07+0.06+0.02)=1,
解得h=0.04.
(2)由图可知,年龄小于35岁的频率为
(0.01+0.04+0.07)×5=0.6,
年龄小于40岁的频率为(0.01+0.04+0.07+0.06)×5=0.9,
所以志愿者年龄的85%分位数在[35,40)内,
例9.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下60株树木的第50百分位数和第75百分位数吗
解:由题意知分别落在各区间上的频数为
在[80,90)上有60×0.15=9,
在[90,100)上有60×0.25=15,
在[100,110)上有60×0.3=18,
在[110,120)上有60×0.2=12,
在[120,130]上有60×0.1=6.
从以上数据可知第50百分位数一定落在区间[100,110)上,
综上可知,第50百分位数和第75百分位数分别估计为103.3 cm,112.5 cm.
例10.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1:3:7:6:3,那么成绩的70%分位数约为 ___秒.
解:设成绩的70%分位数为x,
成绩小于等于16秒的频率为
成绩小于等于17秒的频率为
∴成绩的70%分位数在区间[16,17)内,
∴成绩的70%分位数为
16.5
D
例11.某学习兴趣小组学生的一次测验成绩如下:
130,135,126,123,145,145,150,131,143,144.
这个兴趣小组学生的测验成绩的第75百分位数是(  )
A.131 B.143 C.150 D.145
解析共10个数据,且75%×10=7.5,∴这个兴趣小组的测验成绩的第75百分位数为第8个数据.将这10个测验成绩按从小到大排列为123,126,130,131,135,143,144,145,145,150,∴所求的成绩的第75百分位数为145.
(2)由(1)可知,当y=260时,x=400,即用电量不超过400千瓦时的占80%,
用电量不超过400千瓦时的占80%,所以75%分位数为m在[300,400)内,所以0.6+(m-300)×0.002=0.75,解得m=375千瓦时,即用电量的75%分位数为375千瓦时.
(3)设75%分位数为m,因为用电量低于30千瓦时的所占比例为(0.001+0.002+0.003)×100=60%,
下课
再见
感谢各位同学配合!
本课结束