(共21张PPT)
第9章 统 计
9.2.2 总体百分位数的估计
9.2.3 总体集中趋势的估计
·问题1:根据9.2.1节中100户居民用户的月均用水量数据,如果该市政府希望使80%的居民用户生活用水费支出不受影响,该如何确定居民用户月均用水量标准?
分析:找到一个数x,使全市居民用户中月均用水量不超过x的占80%,超过x的占20%。怎么确定x
通过简单随机抽样,获得了100户居民用户的月均用水量数据(单位:t)
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3
5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8
7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
解:(1)把100个样本数据从小到大排序
1.3 2.0 2.0 ……13.3 13.6 13.8 13.8……28.0
(2)得到第80个和第81个数据分别是13.6和13.8.我们可以发现,区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.
(3)取这两个数的平均数
称13.7为这组数据的第80百分位数或80%分位数
第p百分位数
1
第p百分位数
1
第p百分位数的概念
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或者等于这个值,且至少有(100-p)%的数据大于或者等于这个值.
通过下面的步骤计算一组n个数据的第p百分位数
计算
按从小到大排列原始数据
若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数
判断正误(概念理解)
1.若一组样本数据的10%分位数是23,则在这组数据中有10%的数据大于23.( )
2.若一组样本数据的24%分位数是24,则在这组数据中至少有76%的数据大于或等于24.( )
×
√
第p百分位数
1
第p百分位数
1
不是.是指能够考取本科院校的同学占同学总数的百分比.
有70%的同学数学测试成绩在小于或等于85分.
(1) 班级人数为50的班主任老师说“90%的同学能够考取本科院校”,这里的“90%”是百分位数吗?
(2)“这次数学测试成绩的第70百分位数是85分”这句话是什么意思?
思考1:
第p百分位数
1
四分位数
在实际应用中,除了中位数外,常用的分位数还有第25百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
另外,像第1百分位数,第5百分位数,第95百分位数和第99百分位数在统计中也经常被应用.
特别的,中位数就是第50百分位数.
已知一组数据为7,10,14,8,7,12,11,10,8,10,13,10,8,11,8,9,12,9,13,20,那么这组数据的第25百分位数是 ( A )
A.8 B.9 C.10 D.11
已知一组数据为20,30,40,50,50,60,70,80,其平均数、第60百分位数和众数的大小关系是 ( D )
A.平均数>第60百分位数>众数
B.平均数<第60百分位数<众数
C.第60百分位数<众数<平均数
D.平均数=第60百分位数=众数
2.数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的第30百分位数__.
1.下列关于一组数据的第50百分位数的说法正确的是( )
A.第50百分位数就是中位数
B.总体数据中的任意一个数小于它的可能性一定是50%
C.它一定是这组数据中的一个数据
D.它适用于总体是离散型的数据
当堂检测
3.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70%分位数约为________秒.
4.某网络营销部门随机抽查了某市200名网友在2019年11月11日的网购金额,所得数据如右表:
已知网购金额不超过3千元与超过3千元的人数比恰为3∶2.
(1)试确定x,y,p,q的值,并补全频率分布直方图(如图).
总体集中趋势的估计
2
总体集中趋势的估计
2
平均数
数据的平均数为
特征
平均数对数据有“取齐”的作用,代表该组数据的平均水平,任何一个数据的改变,都会引起平均数的变化,这是众数和中位数都不具有的性质,所以与众数中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息. 但平均数受数据中极端值的影响较大,使平均数在估计总体时的可靠性降低.
一组数据的和与这组数据个数的商.如:
定义
数据的平均数为
总体集中趋势的估计
2
平均数
加权平均数与频率平均数
一般地,如果在n个数中, 出现的频数为, 出现的频数为,…, 出现的频数为(其中),那么
加权平均数
叫做这个数的频数平均数,也称为加权平均数.
频率平均数
一般地,若数据的频率分别,则这个n个数的频率平均数的计算公式为
总体集中趋势的估计
2
众数
一组数据中出现次数最多的数据(即频率分布最大值对应的样本数据)成为这组数据的众数.
定义
特征
一组数据的众数可能不止一个,也可能没有,反映了该组数据的集中趋势
1,2,3,4,5,6,7,8,9 ,10 没有众数
1,2,3,4,4,5,5,6,7 众数有两个,分别是4和5
1,2,3,4,5,5,6,7,8 众数是5
总体集中趋势的估计
2
中位数
一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间的两个数据的平均数(当数据个数是偶数时),称为这组数据的中位数.
定义
特征
一组数据的中位数是唯一的反映了该组数据的集中趋势,在频率分布直方图中中位数左边和右边的直方图的面积相等
总体集中趋势的估计
2
对三种数字特征的深层理解
众数不唯一,可以有一个可以有多个,还可以没有.如果有两个数据出现的次数相同,并且比其它数据出现的次数都多,那么这两个数据都是这组数据的众数
一组数据的平均数中位数都是唯一的
众数一定是原数据中的数,平均数和中位数都不一定是原数据中的数
实际问题中,求平均数要比求中位数和众数难,而求得的平均数、中位数和众数都应带上单位
总体集中趋势的估计
2
三种数字特征的优缺点
名称
优点
缺点
众数
中位数
平均数
①体现了样本数据的最大集中点
②容易得到
①只能表达样本数据中较少的信息
②无法客观地反映总体特征
①不受少数几个极端数据,即排序
靠前或靠后的几个数据的影响
②容易得到,便于利用其中的信息
对极端值不敏感
能反映出更多关于样本数据全体的信息
任何一个数据的改变都会引起平均数的改变,数据越“离群”,对平均数的影响越大
6.思考辨析 判断正误
1.中位数是一组数据中间的数.( )
2.众数是一组数据中出现次数最多的数.( )
3.平均数反映了一组数据的平均水平,任何一个样本数据的改变都会引起平均数的变化.( )
4.一组数据中,有一半的数据不大于中位数,而另一半则不小于中位数,中位数反映了一组数据的中心的情况.中位数不受极端值的影响.( )
×
√
√
√
练习巩固
THANKS
“
”