9.2 用样本估计总体
20210608
1. 总体百分位数的估计
一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
计算一组n个数据的第p百分位数的步骤
第一步:按从小到大排列原始数据;
第二步:计算i=n×p%;
第三步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
复习回顾
平均数、中位数和众数为我们提供了一组数据的集中趋势的信息,这是概括一组数据的特征的有效方法,但仅知道集中趋势的信息,很多时候还不能使我们做出有效决策,下面的问题就是一个例子.
2. 总体集中趋势的估计
复习回顾
众数:最高矩形的中点
中位数:中位数左边的直方图面积和右边的直方图面积相等
平均数:每个小矩形底边中点的横坐标与小矩形的面积的乘积之和
引例 有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你如何对两位运动员的射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?
甲、乙两名运动员射击成绩的平均数、中位数、众数都是7. 从这个角度看,两名运动员之间没有差别.
思考:两名运动员射击成绩的平均数、中位数、众数各为多少?
新课导入
借助条形图可以直观看出,甲的成绩比较分散,乙的成绩相对集中,即甲的成绩波动幅度比较大,而乙的成绩比较稳定.可见,他们的射击成绩是存在差异的.
10 环数
频率
4
5
6
7
8
9
(甲)
10 环数
频率
4
5
6
7
8
9
(乙)
那么,如何度量成绩的这种差异呢?
一种简单的度量数据离散程度的方法就是用极差.
可以发现甲的成绩波动范围比乙的大.
根据甲、乙运动员的10次射击成绩,可以得到
甲命中环数的极差=10-4=6,
乙命中环数的极差=9-5=4.
极差在一定程度上刻画了数据的离散程度.但因为极差只使用了数据中最大、最小两个值的信息,对其他数据的取值情况没有涉及,所以极差所含的信息量很少.
思考:你还能想出其他刻画数据离散程度的办法吗?
若射击的成绩很稳定,那么大多数的射击成绩离平均成绩不会太远;
相反,若射击的成绩波动幅度很大,那么大多数的射击成绩离平均成绩会比较远.
因此,可以通过这两组射击成绩与它们的平均成绩的“平均距离”来度量成绩的波动幅度.
思考:你还能想出其他刻画数据离散程度的办法吗?
思考:如何定义“平均距离”?
假设一组数据是x1, x2,…, xn,用 表示这组数据的平均数. 我们用每个数据与平均数的差的绝对值作为“距离”,即 作为xi到 的“距离”.
可以得到这组数据x1, x2,…, xn到 的“平均距离”为 .
思考:如何定义“平均距离”?
思考:为什么用“平均距离”刻画离散程度,用“总距离"行吗?
为了避免式中含有绝对值,通常改用平方来代替,即
方差
一组数据是x1,x2,…,xn,用 表示这组数据的平均数,这组数据的方差为____________=____________,标准差为_______________.
知识梳理
(1)方差、标准差的定义
新课讲授
思考:标准差的取值范围是什么?标准差为0的一组数据有什么特点?
知识梳理
(2)总体方差、总体标准差的定义
如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为 ,则称 S2=_______________为总体方差,S=________为总体标准差 .
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,
Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…, k),则总体方差为
知识梳理
(3)样本方差、样本标准差的定义
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为 ,则称 s2=_______________为样本方差,s=________为样本标准差 .
(4)特征:
标准差和方差刻画了数据的______程度或波动幅度.
标准差(或方差)越大,数据的离散程度越____,越不稳定;
标准差(或方差)越小,数据的离散程度越____,越稳定.
在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用_______.
离散
大
小
标准差
由s甲>s乙可知,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.
s甲=2,s乙≈1.095
如果要从这两名选手中选择一名参加比赛,要看一下他们的平均成绩在所有参赛选手中的位置.如果两人都排在前面,就选成绩稳定的乙选手,否则可以选甲.
引例 有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
练习1 不经过计算,你能给下列各组数的方差排序吗?
(1)5,5,5,5,5,5,5,5,5;
(2)4,4,4,5,5,5,6,6,6;
(3)3,3,4,4,5,6,6,7,7;
(4)2,2,2,2,5,8,8,8,8.
练习2 对划艇运动员甲、乙在相同的条件下进行了6次测试,测得他们每次的最大速度(m/s)如下:
甲:27,38,30,37,35,31
乙:33,29,38,34,28,36
根据以上数据,试判断他们谁的成绩比较稳定.
课堂小结
(1)一组数据是x1,x2,…,xn,用 表示这组数据的平均数,这组数据的方差为____________=____________,标准差为_______________.
(2)如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为 ,则称 S2=_______________为总体方差,S=________为总体标准差 .
(3)如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为 ,则称 s2=_______________为样本方差,s=________为样本标准差 .