(共27张PPT)
第九章 统计
9.2用样本估计总体
1.如何计算一组数据的第P百分位数?
复习回顾
2.如何计算一组数据的平均数、中位数、众数?
原始数据
直方图
该如何理解这句话?
“我们企业员工的年平均收入是20万元”
你想好了吗?
9.2.4 总体离散程度的估计
有两位射击运动员在一次射击测试中各射靶10次,
每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
探究
问题1 如何评价?
(提示:可以用平均值,中位数,众数进行数据分析)
平均数、
中位数、
众数都是7
如何选择?
10 环数
频率
4
5
6
7
8
9
(甲)
10 环数
频率
4
5
6
7
8
9
(乙)
结论2:甲的成绩比较分散,乙的成绩相对集中
平均数、中位数、众数都是7
结论1:
问题2 还有什么数字特征能度量甲/乙的差异?
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
极差
甲的成绩波动范围比乙的大
甲的极差=10-4=6
乙的极差=9-5=4
极差在一定程度上刻画了数据的离散程度.
问题3 你还能想出其他刻画数据离散程度的办法吗?
成绩很稳定
离平均成绩不会太远
波动幅度很大
离平均成绩会比较远
通过这两组射击成绩与它们的平均成绩的
“平均距离”来度量成绩的波动幅度。
问题4 什么叫做平均成绩的“平均距离”?
用 表示这组数据的平均数
为 到 的距离
平均距离
方差
方差、标准差
特征:
标准差和方差刻画了数据的离散程度或波动幅度.
标准差(或方差)越大,数据的离散程度越大,越不稳定;
标准差(或方差)越小,数据的离散程度越小,越稳定.
在刻画数据的分散程度上,方差和标准差是一样的.但在解决
实际问题中,一般多采用标准差
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你应当如何对这次射击作出评价
解析:我们可以根据标准差来判断两名运动员的成绩的离散程度,
计算可得s甲=2,s乙≈1.095.
即s甲>s乙,
由此可知,甲的成绩离散程度大,乙的成绩离散程度小。
由此可以估计,乙比甲的成绩稳定。
因此,如果要从这两名选手中选择一名参赛,要看一下他们的平均成绩在所有参赛选手中的位置。
如果两人都排在前面,就选成绩稳定的乙选手,否则选甲。
练习1 甲、乙两机床同时加工直径为100 cm的零件,为检验质量,从中抽取6件测量数据为(单位:cm):
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1) 分别计算两组数据的平均数及方差;
(2) 根据计算说明哪台机床加工零件的质量更稳定.
探究
总结:平均数、方差性质
练习2
问题4 在对树人中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62.你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高作出估计吗?
根据方差的定义,总样本方差为
因此,
把已知男生、女生样本平均数和方差的取值代入①,可得
故总样本的方差为51.486 2,据此估计高一年级全体学生身高的总体方差为51.486 2.
小结
(1)我们利用哪些数据特征刻画数据的离散程度?
(2)极差/方差/标准差的定义是什么?特征是什么?
(3)如何计算方差和标准差?
练习3 甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.
(1)分别求出两人得分的平均数与方差;
(2)根据图形和(1)中计算结果,对两人的训练成绩作出评价.
解 由题图可得,甲、乙两人五次测试的成绩分别为
甲:10,13,12,14,16;
乙:13,14,12,12,14.
(2)根据图形和(1)中计算结果,对两人的训练成绩作出评价.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
变式样本数均为9的四组数据,它们的平均数都是5,条形图如图所示,则标准差最大的一组是( )
A.第一组 B.第二组 C.第三组 D.第四组
跟踪训练3 甲、乙、丙三名学生在一项集训中的40次测试分数都在[50,100]内,将他们的测试分数分别绘制成频率分布直方图,如图所示,记甲、乙、丙的分数标准差分别为s1,s2,s3,则它们的大小关系为
A.s1>s2>s3 B.s1>s3>s2
C.s3>s1>s2 D.s3>s2>s1
√
解析 比较三个频率分布直方图知,甲为“双峰”直方图,两端数据最多,最分散,方差最大;乙为“单峰”直方图,数据最集中,方差最小;丙为“单峰”直方图,但数据分布相对均匀,方差介于甲、乙之间.综上可知s1>s3>s2.