1.5.2 估计总体的数字特征
学案
1.能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.
2.会用样本的基本数字特征估计总体的基本数字特征;初步体会数字特征的随机性.
1.样本均值和样本标准差
假设通过随机抽样得到的样本为x1,x2,…,xn,则
样本平均数为=__________________,
样本标准差为
s=________________________.
2.估计总体的数字特征
利用随机抽样得到样本,从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正的分布、平均数和标准差,而只是总体的一个________,但这个估计是合理的,特别是当样本容量________时,它们确实反映了总体的信息.
【做一做】甲、乙两人学习成绩的茎叶图如图所示.
(1)分别求出这两名同学学习成绩的平均数和标准差;
(2)比较这两名同学的成绩,谈谈你的看法.
方差和标准差有什么区别?
剖析:方差和标准差的计算公式是:
一般地,设样本为x1,x2,…,xn,样本的平均数为,则
样本方差s2=.
样本标准差s=.
由计算公式来看样本方差是样本标准差的平方,即样本标准差是样本方差的平方根,这是它们的最本质区别,它们表达的意义和作用完全相同.但是由于标准差的单位与原始数据测量单位相同,在统计中,通常用标准差来刻画数据的离散程度.
题型一
利用方差分析数据
【例题1】甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2):
品种
第一年
第二年
第三年
第四年
第五年
甲
9.8
9.9
10.1
10
10.2
乙
9.4
10.3
10.8
9.7
9.8
根据这组数据判断应该选择哪一种小麦进行推广.
分析:从平均数和方差两个角度去考虑.
反思:平均数和方差是样本的两个重要的数字特征,方差越大,表明数据越分散,相反地,方差越小,数据越集中稳定;平均数越大,表明数据的平均水平越高;平均数越小,表明数据的平均水平越低.
题型二
用样本的数字特征估计总体的数字特征
【例题2】甲、乙两台机床同时加工直径为100
mm的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm):
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算上述两组数据的平均数和方差;
(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求.
分析:利用平均数与方差公式分别进行计算,并作出判断.
反思:平均数描述了数据的平均水平,定量地反映了数据的集中趋势所处的水平.方差描述了一组数据围绕平均数波动的大小.
1在统计中,样本的标准差可以近似地反映总体的( ).
A.平均状态
B.分布规律
C.波动大小
D.最大值和最小值
2用分层抽样抽取了容量为10的样本,其平均数为5.1,方差为0.
2,则总体的平均数与方差分别估计是( ).
A.5.1,0.2
B.0.2,0.2
C.5.1,2
D.都不能估计
3已知一组数据按从小到大的顺序排列为-3,0,5,x,9,16,且这组数据的中位数为7,那么这组数据的众数为( ).
A.0
B.9
C.16
D.9.5
4已知一个样本为1,3,2,5,x,它的平均数是3,则这个样本的标准差是________.
5下面是某校学生日睡眠时间的抽样频率分布表(单位:h):
日睡眠时间/h
人数
频率
[6,6.5)[6.5,7)[7,7.5)[7.5,8)[8,8.5)[8.5,9)
517333762
0.050.170.330.370.060.02
合计
100
1
试估计该校学生的日平均睡眠时间.
答案:
基础知识·梳理
1.
2.估计 很大
【做一做】分析:首先由茎叶图读出数据,计算平均数,注意用简便方法,然后求出标准差,最后依据结果比较,可以借助于计算器.
解:(1)甲≈87,s甲≈12.7;乙≈93,s乙≈11.2.
(2)由于甲<乙,s甲>s乙,
所以甲的学习成绩没有乙的学习成绩好,也没有乙的学习成绩稳定.
典型例题·领悟
【例题1】解:甲种冬小麦的平均单位面积产量
甲==10,
乙种冬小麦的平均单位面积产量
乙==10,
则甲、乙两种冬小麦平均单位面积产量相同.
甲种冬小麦平均单位面积产量的方差为
s甲2=×[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]=0.02,
乙种冬小麦平均单位面积产量的方差为
s乙2=×[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244,
则s甲2=0.02<s乙2=0.244,
所以甲种小麦的平均单位面积产量比较稳定.
因此选择甲种小麦进行推广.
【例题2】解:(1)甲==100,
乙==100,
s甲2=[(99-100)2+(100-100)2×3+(98-100)2+(103-100)2]=,
s乙2=[(99-100)2×2+(100-100)2×3+(102-100)2]=1.
(2)因为s甲2>s乙2,说明甲机床加工的这种零件波动比较大,因此乙机床加工的这种零件更符合要求.
随堂练习·巩固
1.C 2.A
3.B 由中位数定义得,=7,∴x=9.∴众数为9,故选B.
4. =3,从而x=4,∴标准差为.
5.分析:利用这个样本来估计该校学生的日平均睡眠时间.要确定这100名学生的日平均睡眠时间,就必须计算总睡眠时间,由于每组中的个体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示.
解法一:总睡眠时间约为
6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h).
故平均睡眠时间约为=7.39(h).
解法二:求组中值与对应频率之积的和:
6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h).
故该校学生的日平均睡眠时间约为7.39
h.