1.5 用样本估计总体
教学目标
1、知识与技能
会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程形成初步评价的意识。
2、过程与方法
会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题。
3、情感态度价值观
通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。
教学重点:利用样本估计总体的数字特征。
教学难点: 样本标准差的计算。
课题引入
上节课,我们介绍了利用样本的频率分布可以估计总体的分布。当然,我们也可以利用样本的数据特征估计总体的数字特征。
(二)探求新知
有甲、乙两种钢筋,现从中各抽取一个样本(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125。
甲
110
120
130
125
120
125
135
125
135
125
乙
115
100
125
130
115
125
125
145
125
145
请你运用所学的统计学的知识,说明哪种钢筋的质量较好?
画出数据的条形统计图可以发现,甲样本的抗拉强度比较集中,乙样本的抗拉强度相对分散,说明乙样本没有甲样本的抗拉强度稳定。从而,我们认为乙钢筋没有甲钢筋的抗拉强度稳定。
如果两组数据的集中程度差异不大时,从统计图中就不易得出结论。那么,我们可以计算样本的方差(标准差)来估计总体的方差。
(三)知识应用
例1、在1996年美国亚特兰大奥运会上,中国香港风帆选手李丽珊,以惊人的耐力和斗志,勇夺金牌,为香港体育史揭开了“突破零”的一页。在风帆比赛中,成绩以低分为优胜。比赛共11场,并以最佳的9场成绩计算最终的名次。前7场比赛结束后,排名前5位的选手积分如表所示:
排名
运动员
比赛场次
总分
1
2
3
4
5
6
7
8
9
10
11
1
李丽珊(中国香港)
3
2
2
2
4
2
7
22
2
简度(新西兰)
2
3
6
1
10
5
5
32
3
贺根(挪威)
7
8
4
4
3
1
8
35
4
威尔逊(英国)
5
5
14
5
5
6
4
44
5
李科(中国)
4
13
5
9
2
7
6
46
根据上面的比赛结果,我们如何比较各选手之间的成绩及稳定情况呢?如果此时让你预测谁将获得最后的胜利,你会怎么看?
解析:我们可以分别计算5位选手前7场比赛积分的平均数和标准差,分别作为度量各选手比赛的成绩及稳定情况的依据,结果如下表所示:
排名
运动员
平均积分()
积分标准差(s)
1
李丽珊(中国香港)
3.14
1.73
2
简度(新西兰)
4.57
2.77
3
贺根(挪威)
5.00
2.51
4
威尔逊(英国)
6.29
3.19
5
李科(中国)
6.57
3.33
从表中看出:李丽珊的平均积分及积分标准差都比其他选手的小,也就是说,在前7场的比赛过程中,她的成绩最为优异,而且表现也最为稳定。尽管此时还有4场没有进行,但这里我们可以假定每位运动员在各自的11场比赛中发挥的水平大致相同,因而可以把前7场比赛的成绩看作是总体的一个样本,并由此估计每位运动员最后的比赛成绩。从已经结束的7场比赛的积分来看,李丽珊的成绩最为优异,而且表现最为稳定,因此我们有足够的理由相信她在后面的4场比赛中会继续保持优异而稳定的成绩,获得最后的冠军。
当然,事实也进一步验证了我们的预测,李丽珊正是凭着自己优异而稳定的表现,称为香港首位奥运金牌得主。
例2、某地用随机抽样的方法检查了630名50岁~60岁的女性血清甘油三脂含量(mg/dl),频率分布表如下表所示,分别用频数和频率计算血清甘油三脂含量的平均值.
分组
频数
频率
[10,40)
27
0.043
[40,70)
169
0.268
[70,100)
167
0.265
[100,130)
94
0.149
[130,160)
81
0.129
[160,190)
42
0.067
[190,220)
28
0.044
[220,250)
14
0.022
[250,280)
4
0.006
[280,310)
3
0.005
[310,340)
1
0.002
合计
630
1
例3、某中学举行电脑知识竞赛,现将高一参赛学生的成绩整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分布是0.30、0.40、0.15、0.10、0.05.
求:
(1)成绩的众数、中位数;
(2)平均成绩
(四)课堂练习
1、(2011年福建19题改编)某产品按行业生产标准分成8个等级,等级系数X依次为1,2,……,8,其中X≥5为标准A,X≥3为标准B,已知甲厂执行标准A生产该产品,产品的零售价为6元/件;乙厂执行标准B生产该产品,产品的零售价为4元/件,假定甲、乙两厂的产品都符合相应的执行标准。
已知甲厂产品的等级系数X1的频率分布表如下所示:
(等级)
5
6
7
8
P(频率)
0.4
0.3
0.2
0.1
(1)为分析乙厂产品的等级系数X2,从该厂生产的产品中随机抽取30件,
相应的等级系数组成一个样本,数据如下:
3 5 3 3 8 5 5 6 3 4
6 3 4 7 5 3 4 8 5 3
8 3 4 3 4 4 7 5 6 7
用这个样本的频率分布估计总体分布,求等级系数X2的平均数。
(2)在(1)的条件下,若以“性价比”为判断标准,则哪个工厂的产品更具可购买性?说明理由。
注:①产品的“性价比”=;
②“性价比”大的产品更具可购买性。
解析:(1)由已知得,样本的频率分布表如下:
3
4
5
6
7
8
0.3
0.2
0.2
0.1
0.1
0.1
用这个样本的频率分布估计总体分布,可得等级系数X2的平均数为4.8。
(2)乙厂的产品更具可购买性,理由如下:
因为甲厂产品的等级系数的平均数等于6,价格为6元/件,所以其性价比为
因为乙厂产品的等级系数的平均数等于4.8,价格为4元/件,所以其性价比为据此,乙厂的产品更具可购买性。
2、为了解甲、乙两人工作半年来每天加工的零件数,现在随机抽取了两人10天中每天加工的零件数,用茎叶图表示如下:
则估计甲、乙两人日加工零件的平均数分别为多少?
3、在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:
甲(1)
27
38
30
37
35
31
乙(2)
33
29
38
34
28
36
谁更适合参加比赛?
解:,所以乙的成绩比甲稳定,应选乙参加比赛更合适。
4、为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差.
天 数
151~180
181~210
211~240
241~270
271~300
301~330
331~360
361~390
灯泡数
1
11
18
20
25
16
7
2
解:各组中值分别为165,195,225,285,315,345,375,由此算得平均数约为
165×1%+195×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268 (天)。
这些组中值的方差为
1/100×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2128.60 (天2)。故所求的标准差约(天)
所以,估计这种日光灯的平均使用寿命约为268天,标准差约为46天。
5、课本第39页 练习
(五)课堂小结
1、用样本数字特征估计(平均数和方差)总体的数字特征。
2、样本容量越大,样本代表性越强,总体估计的结果也就越精确。
(六)分层作业
1、课本第40页 习题1—5 3
2、课本第69—70页 复习参考题一 A组7
3、课本71页 复习参考题一 B组2
4、研究性学习——统计活动:结婚年龄的变化