2.2 用样本估计总体 课件(人教A版必修3)(4份打包)

文档属性

名称 2.2 用样本估计总体 课件(人教A版必修3)(4份打包)
格式 zip
文件大小 356.9KB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2016-09-20 13:27:49

文档简介

课件25张PPT。用样本的频率分布估计总体分布
(一)(1)统计的核心问题: 如何根据样本的情况对总体的情况作出推断复习引入: 简单随机抽样 系统抽样 分层抽样(3)通过抽样方法收集数据的目的是什么?从中寻找所包含的信息,用样本去估计总体(2)随机抽样的几种常用方法 : 知识探究(一):频率分布表 我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢 ?探究:你认为,为了了较为合理地确定出这个标准,需要做哪些工作?
我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢 ?探究:①采用抽样调查的方式获得样本数据
②分析样本数据来估计全市居民用水量的分布情况下表给出100位居民的月均用水量表
分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式讨论:如何分析数据?根据这些数据你能得出用水量其他信息吗?为此我们要对这些数据进行整理与分析〈一〉频率分布的概念:
频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布 〈二〉画频率分布直方图其一般步骤为
(1)计算一组数据中最大值与最小值的差,即求极差
(2)决定组距与组数
(3)将数据分组
(4)列频率分布表
(5)画频率分布直方图第一步: 求极差: (数据组中最大值与最小值的差距) 最大值= 4.3 最小值= 0.2
所以极差= 4.3-0.2 = 4.1第二步: 决定组距与组数: (强调取整) 当样本容量不超过100时, 按照数据的多少, 常分成5~12组.
为方便组距的选择应力求”取整”.
本题如果组距为0.5(t). 则 第三步: 将数据分组:( 给出组的界限) 所以将数据分成9组较合适. [0, 0.5), [0.5, 1), [1, 1.5),……[4, 4.5) 共9组. 第四步: 列频率分布表. 第四步: 列频率分布表. 组距=0.5 0.040.080.080.160.30.150.440.220.250.512.000.020.040.040.080.10.30.150.05想一想知识探究(二):频率分布直方图 第五步: 画出频率分布直方图. 频率/组距 月均用水量/t (组距=0.5)
小长方形的面积=?
小长方形的面积总和=?
月均用水量最多的在哪个区间?请大家阅读第68页,直方图有哪些优点和缺点?注:小长方形的面积=组距×频率/组距=频率
各长方形的面积总和等于1。频率分布直方图的特征:
从频率分布直方图可以清楚的看出数据分布的总体趋势。
从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。 对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多. 当样本容量不超过100时,按照数据的多少,常分成5~12组.(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性等.居民月均用水量的一些数据特点思考:
1.频率分布表与频率分布直方图的区别?频率分布表列出的是在各个不同区间内取值的频率。
频率分布直方图是用小长方形面积的大小来表示在各个区间内取值的频率。2.如果当地政府希望使85%以上的居民每月的用水量不
超出标准,根据频率分布表2-2和频率分布直方图2.2-1,
你能对制定月用水量标准提出建议吗 ?
与分组数(或组距)及坐标系的单位长度有关.3.将组距确定为1,作出教材P66页 居民月均用水量的频率分布直方图 4.谈谈两种组距下,你对图的印象?同一个样本数据,绘制出来的分布图是唯一的吗?
(同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断 ) 理论迁移 例 某地区为了了解知识分子的年龄结构,
随机抽样50名,其年龄分别如下:
42,38,29,36,41,43,54,43,34,44,
40,59,39,42,44,50,37,44,45,29,
48,45,53,48,37,28,46,50,37,44,
42,39,51,52,62,47,59,46,45,67,
53,49,65,47,54,63,57,43,46,58.
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)估计年龄在32~52岁的知识分子所占的比例约是多少.(1)极差为67-28=39,取组距为5,分为8组. 分 组 频数 频率
[27,32) 3 0.06
[32,37) 3 0.06
[37,42) 9 0.18
[42,47) 16 0.32
[47,52) 7 0.14
[52,57) 5 0.10
[57,62) 4 0.08
[62,67】 3 0.06
合 计 50 1.00样本频率分布表:(2)样本频率分布直方图:(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32~52岁的知识分子约占70%.练 习:1.有一个容量为50的样本数据的分组的频数如下:[12.5, 15.5) 3[15.5, 18.5) 8[18.5, 21.5) 9[21.5, 24.5) 11[24.5, 27.5) 10[27.5, 30.5) 5[30.5, 33.5) 4(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在[15.5, 24.5)的百分比是多少? 解:组距为3 分组 频数 频率 频率/ 组距[12.5, 15.5) 3[15.5, 18.5) 8[18.5, 21.5) 9[21.5, 24.5) 11[24.5, 27.5) 10[27.5, 30.5) 5[30.5, 33.5) 40.06
0.16
0.18
0.22
0.20
0.10
0.080.020
0.053
0.060
0.073
0.067
0.033
0.027频率分布直方图如下:0.0100.0200.0300.0400.05012.515.50.0600.070练习:2 .投掷一枚均匀骰子44次的记录是:现对这些数据进行整理,试画出频数分布直方图. 第一步:写出样本可能出现的一切数值,即:
1,2,3,4,5,6 共6个数.(数据分组)第二步:列出频率分布表:组距=1第三步: 画频率分布直方图小结:
画频率分布直方图的步骤:
第一步: 求极差: (数据组中最大值与最小值的差距)
第二步: 决定组距与组数: (强调取整)

第三步: 将数据分组 ( 给出组的界限)
第四步: 列频率分布表. (包括分组、频数、频率、频率/组距)
第五步: 画频率分布直方图(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率/组距.) 组距:指每个小组的两个端点的距离,组距
组数:将数据分组,当数据在100个以内时,
按数据多少常分5-12组。
注意(2)纵坐标为:作业:P71第一题 习题2.2:2课件18张PPT。用样本的频率分布估计总体分布
(二)回忆:绘制频率分布直方图有哪几个步骤呢? (一)频率分布折线图:
画好频率分布图后,我们把频率分布直方图中各小长
方形上端连接起来,得到的图形.画出频率分布折线图. 频率/组距 月均用水量/t (取组距中点, 并连线 ) 在样本频率分布直方图中,当样本容量增加,作图时所分的组数增加,组距减少,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息. 总体密度曲线:1.对于任何一个总体,它的密度曲线是不是一定存在?它的密度曲线是否可以被非常准确地画出来?思考2.图中阴影部分的面积表示什么?2.总体在范围(a,b)内取值的百分比 1.实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确 思考:当总体中的个体数比较少或样
本数据不密集时,是否存在总体密度曲线?为什么? 不存在,因为组距不能任意缩小. (二)茎叶图 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图 例: 甲乙两人比赛得分记录如下:
甲:13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39
乙:49, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 39
用茎叶图表示两人成绩,说明哪一个成绩好.甲 乙0
1
2
3
4
5
2, 5
5, 4
1, 6, 1, 6, 7, 9
4, 9
0 8
4, 6, 3
3, 6, 8
3, 8, 9
1 叶 茎 叶(二). 茎叶图 (一种被用来表示数据的图) 画茎叶图的步骤:1.将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎为十
位上的数字,叶为个位上的数字;
2.将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)
侧;
3.将各个数据的叶按大小次序
写在其茎右(左)侧.(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。茎叶图的特征:思考:对任意一组样本数据,是否都适合用茎叶图表示?为什么? 不适合样本容量很大或茎、叶不分明的样本数据. 频数 茎 叶
2 10 7, 8
11 11 2, 7, 6, 3, 6, 8, 6, 7, 2, 2,0
13 12 6, 8, 4, 2, 7, 8, 6, 1, 0, 4, 3, 2, 0
4 13 4, 2, 3, 0下表一组数据是某车间30名工人加工零件的个数, 设计一个
茎叶图表示这组数据,并说明这一车间的生产情况.练习:   练习: 右面是甲、
乙两名运动员
某赛季一些场
次得分的茎叶
图,据图可知 ( )AA.甲运动员的成绩好于乙运动员
B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异
D.甲运动员的最低得分为0分2 .2002-2003赛季 ,一球员在 NBA 某些场次的比赛所得篮板球数分别为:16 , 6 , 3 , 5 , 12 , 8 , 13 , 6 , 10 , 3 , 19 , 14 , 9 , 7 , 10 , 10 , 9 , 11 , 6 , 11 , 12 , 14 , 8 , 6 , 10 , 5 , 10 , 11 , 13 , 9 , 10 , 10 , 7 , 6 , 11 , 12 , 17 , 4 , 12 , 8 , 10 , 12 , 9 , 15 , 15 , 12 , 13 , 18 , 8 , 16 , 请制作这些数据的茎叶图 .3 3 4 5 5 6 6 6 6 6 7 7 8 8 8 8 9 9 9 90 0 0 0 0 0 0 0 1 1 1 1 2 2 2 2 2 2 3 3 3 4 4 5 5 6 6 7 8 93.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图:甲乙( 1 ) 甲乙两名队员的最高得分各是多少?( 2 ) 哪名运动员的成绩好一些?( 1 ) 甲运动员的最高得分为51分 ,乙运动员的最高分为52分;( 2 ) 甲运动员的成绩好于乙运动员 .小结:
1.不易知一个总体的分布情况时,往往从总体中抽取一个样本,用样本的频率分布去估计总体的频率分布,样本容量越大,估计就越精确.
2. 目前有:频率分布表、直方图、茎叶图.
3.当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。
布置作业:习题2.2 第1题课件27张PPT。 众数、中位数、平均数2.2.2 用样本的数字特征估计总体的数字特征一 、复习众数、中位数、平均数的概念 2、中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. 1、众数:在一组数据中,出现次数最多的数据叫做这组数据的众数. 众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛. 3、平均数: 一般地,如果n个数 ,那
么, 叫做这n个数的平均数。1、求下列各组数据的众数(1)、1 ,2,3,3,3,5,5,8,8,8,9,9众数是:3和8(2)、1 ,2,3,3,3,5,5,8,8,9,9众数是:32、求下列各组数据的中位数(1)、1 ,2,3,3,3,4,6,8,8,8,9,9(2)1 ,2,3,3,3,4,8,8,8,9,9中位数是:5中位数是:4 3、在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:分别求这些运动员成绩的众数,中位数与平均数 。 解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.
  上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70; 答:17名运动员成绩的众数、中位数、平均数依次是1.75(米)、1.70(米)、1.69(米)。 这组数据的平均数是二 、 众数、中位数、平均数与频率分布直方图的关系 例如,在上一节抽样调查的100位居民的月均用水量的数据中,我们得知这一组样本数据的 ,并画出过这组数据的频率分布直方图.众数 =2.3(t)
中位数=2.0(t)
平均数=2.0(t)现在,观察这组数据的频率分布直方图,能否得出这组数据的众数、中位数和平均数?众数、中位数和平均数0.52.521.5143.534.5频率
组距思考:小长方形面积、对应这个组的频率、这个组占的比例的关系。0.52.521.5143.534.5频率
组距2.25 归纳总结得:
因为在频率分布直方图中,各小长方形的面积表示相应各组的频率,也显示出样本数据落在各小组的比例的大小,所以从图中可以看到,在区间[2,2.5)的小长方形的面积最大,即这组的频率是最大的,也就是说月均用水量在区间[2,2.5)内的居民最多,即众数就是在区间[2,2.5)内。
众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。0.52.521.5143.534.5频率
组距0.040.080.150.220.250.140.060.040.02提示:中位数左边的数据个数与右边的数据个数是相等的。0.52.521.5143.534.5频率
组距0.040.080.150.220.250.140.060.040.02前四个小矩形的面积和=0.49后四个小矩形的面积和=0.262.02 归纳总结得:
在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。在这个频率分布直方图中,左边的直方图的面积代表50个单位,右边的直方图也是代表50个单位,它们的分界线与x轴交点的横坐标就是中位数。
中位数在样本数据的频率分布直方图中,就是把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标。思考讨论以下问题:
1、2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中原因吗?答:2.02这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.0.52.521.5143.534.5频率
组距0.040.080.150.220.250.140.060.040.02提示:在频率分布直方图中,各个组的平均数如何找?
0.52.521.5143.534.5频率
组距0.040.080.150.220.250.140.060.040.02.........0.751.752.252.753.253.754.251.250.5提示:与小长方形面积的比例有关吗?0.52.521.5143.534.5频率
组距0.040.080.150.220.250.140.060.040.022.02.........0.751.752.252.753.253.754.251.250.5 总结归纳得:
平均数是频率分布直方图的“重心”,是直方图的平衡点。 先找出每个小长方形的“重心”,即每小组的平均数,再按比例算出直方图的平均数。
平均数在样本数据的频率分布直方图中,等于频率分布图中每个小长方形面积乘以小矩形底边中点的横坐标之和。 平均数是频率分布直方图的“重心”.
是直方图的平衡点. n 个样本数据的平均数由公式:X=给出.下图显示了居民月均用水量的平均数: x=1.973频率分布直方图如下:思考讨论以下问题:
2、样本中位数不受少数极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点。你能举例说明吗?答:优点:对极端数据不敏感的方法能够有效地预防错误数据的影响。
对极端值不敏感有利的例子:例如当样本数据质量比较差,即存在一些错误数据(如数据录入错误、测量错误等)时,用抗极端数据强的中位数表示数据的中心值更准确。 缺点:(1)出现错误的数据也不知道;(2)对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作。这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感。这里更好的方法是同时用平均工资和中位数作为参考指标,选择平均工资较高且中位数较大的公司就业.三 、三种数字特征的优缺点 1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征。 2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。 3、平均数与每一个样本的数据有关,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。 思考讨论以下问题:
3、“用数据说话”,这是我们经常听到的一句话。但是,数据有时也会被利用,从而产生误导。例如,一个企业中,绝大多数人是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入过到几十万元。这时年收入的平均数比中位数大得多。尽管这时的中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数来回答有关工资待遇的指问。
你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?答:
我认为这句话是这样解释的:这个企业的老板以员工平均工资收入水平去描述他们单位的收入情况。我觉得这是不合理的,因为这些员工当中,少数经理层次的收入与大多数一般员工收入的差别比较大,所以平均数不能反映该单位员工的收入水平。这个老板的话有误导与蒙骗行为。 四、 众数、中位数、平均数的简单应用例:某工厂人员及工资构成如下:(1)指出这个问题中周工资的众数、中位数、平均数(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么? 分析:众数为200,中位数为220,平均数为300。
因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。课后练习
假设你是一名交通部门的工作人员,你打算向市长报告国家对本市26个公路项目投资的平均资金数额,其中一条新公路的建设投资为2000万元人民币,另外25个项目的投资是20~100万元。中位数是25万元,平均数是100万元,众数是20万元。你会选择哪一种数据特征来表示国家对每一个项目投资的平均金额?你选择这种数字特征的缺点是什么?答:
这里应该采用平均数来表示每一个国家项目的平均金额,因为这能反映所有项目的信息。但平均数会受到极端数据2000万元的影响,所以大多数项目投资金额都和平均数相差比较大。课件30张PPT。2.2.2 用样本的数字特征估计总体的数字特征(二) 方差、标准差二、用样本的标准差估计总体的标准差 数据的离散程度可以用极差、方差或标准差来描述。 为了表示样本数据的波动幅度,通常要求出样本方差或者它的算术平方根(标准差). 来衡量这组数据的波动大小,并把它叫做这组数据的方差,一组数据方差越大,则这组数据波动越大。 那么我们用它们的平均数,即(2)标准差:我们把数据的方差的算术平方根叫做这组数据的标准差,它也是一个用来衡量一组数据的波动大小的重要的量。计算标准差的算法: S2 算出每个样本数据与样本平均数的差
(i=1,2,……,n);S3 算出 (i=1,2,…,n);S4 算出 (i=1,2,…,n)这n个数的平均数,即为样本方差s2;S5 算出方差的算术平方根,即为样本标准差s。例1. 计算数据5,7,7,8,10,11的标准差.例题分析S5 .所以这组数据的标准差是2.例2. 从某灯泡厂生产的一批灯泡中随机地抽取10只进行寿命测试,得数据如下(单位:h):
1458,1395,1562,1614,1351,1490,1478,1382,1536,1496
使用函数型计算器或计算机的Excel软件求样本的平均数x和样本的标准差。例题分析解:按键继续按下表按键SHIFTSHIFTxσn==x解3:打开Excel工作表,在一列输入数据,如将10个数据输入A1到A10单元格中.
(1)利用求和∑计算它们的和;
(2)用函数AVERAGE(A1:A10)求它们的平均数;
(3)用函数VARPA(A1:A10)求它们的方差;
(4)用开方函数Sqrt(方差)计算它们的标准差.例题分析例3.计算数据89,93,88,91,94,90,88,87的方差和标准差。(标准差结果精确到0.1) 解: . 所以这组数据的方差为5.5,标准差为2.3 .例4. 从甲、乙两名学生中选拔一人成绩射击比赛,对他们的射击水平进行测试,两人在相同的条件下各射击10次,命中环数如下﹕
甲﹕7,8,6,8,6,5,8,10,7,4;
乙﹕9,5,7,8,7,6,8,6,7,7.
(1)计算甲、乙两人射击命中环数的平均数和标准差;
(2)比较两人的成绩,然后决定选择哪一人参赛. 例题分析(2)由(1)知,甲、乙两人平均成绩相等,但s乙说明他们的异同点.
(1) 5,5,5,5,5,5,5,5,5;
(2) 4,4,4,5,5,5,6,6,6;(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.
(4)方差的运算性质:练习:(3)若k1,k2,…, k8的方差为3,则2(k1-3),
2(k2-3), …, 2(k8-3)的方差为________43212AB(7)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为________9.5,0.016五、回顾小结:1.用样本的数字特征估计总体的数字特征分两类:
用样本平均数估计总体平均数。
用样本方差、标准差估计总体方差、标准差。样本容量越大,估计就越精确。
2.方差、标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.拓展1.甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2(公顷)),试根据这组数据估计哪一种水稻品种的产量比较稳定。解:甲品种的样本平均数为10,样本方差为 [(9.8-10)2 +(9.9-10)2+(10.1-10)2+ (10-10)2+(10.2-10)2]÷5=0.02.乙品种的样本平均数也为10,样本方差为 [(9.4-10)2+(10.3-10)2+(10.8-10)2+ (9.7-10)2+(9.8-10)2]÷5=0.24.
因为0.24>0.02,
所以,由这组数据可以认为甲种水稻的产量比较稳定。 拓展2 甲、乙两人同时生产内径为25.40mm的一种零件,为了对两人的生产质量进行评比,从他们生产的零件中各随机抽取20件,量得其内径尺寸如下(单位:mm):甲 :
25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39乙:
25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48 从生产零件内径的尺寸看,谁生产的零件质量较高? 甲生产的零件内径更接近内径标准,且稳定程度较高,故甲生产的零件质量较高. 说明:1.生产质量可以从总体的平均数与标准差两个角度来衡量,但甲、乙两个总体的平均数与标准差都是不知道的,我们就用样本的平均数与标准差估计总体的平均数与标准差.
2.问题中25.40mm是内径的标准值,而不是总体的平均数.拓展3.为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换。已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差。解:各组中值分别为165,195,225,285,315,345,375,由此算得平均数约为165×1%+195×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天)这些组中值的方差为 [1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16× (315-268)2+7×(345-268)2+2×(375-268)2] ÷100=2128.60(天2).故所求的标准差约 (天)答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天.