(共27张PPT)
§28.2 用样本估计总体
1.通过样本抽样,绘制频数分布直方图,计算样本平均数和标准差,使学生认识到只有样本容量足够大,才能比较准确地反映总体的特性,这样的样本才可靠,体会只有可靠的样本才能去估计总体.
2.通过实例,使学生体会用样本估计总体的思想,能够根据统计结果作出合理的判断和推测,能与同学进行交流,用清晰的语言表达自己的观点.
我们知道在选取样本时应注意的问题,其一是所选取的样本必须具有代表性,其二是所选取的样本的容量应该足够大,这样的样本才能反映总体的特性,所选取的样本才比较可靠.
随机抽样调查是了解总体情况的一种重要的数学方法,抽样是它的一个关键,上节课介绍了简单的随机抽样方法,即用抽签的方法来选取样本,这使每个个体都有相等的机会被选入样本.
判断下面这些抽样调查选取样本的方法是否合适,若不合适,请说明理由.
(1)为调查江苏省的环境污染情况,调查了长江以南的南京市、常州市、苏州市、镇江市、无锡市的环境污染情况.
(2)从100名学生中,随机抽取2名学生,测量他们的身高来估算这100名学生的平均身高.
(3)从一批灯泡中随机抽取50个进行试验,估算这批灯泡的使用寿命.
(4)为了解中央电视台第一套节目的收视率,对所有上因特网的家庭进行在线调查.
解:(1)不合适.因为调查对象在总体中必须有代表性,现在所调查的这些地方的环境污染情况仅仅代表了江苏省长江以南地区的,并不能代表整个江苏省的.
(2)不合适.因为抽样调查时所抽取的样本要足够大,现在只抽取了2名学生的身高,不能用来估算100名学生的平均身高.
(3)合适.
(4)不合适.虽然调查的家庭很多,但仅仅增加调查的数量不一定能够提高调查质量,本题中所调查的仅代表上因特网的家庭,不能代表不上因特网的家庭,因此这样的抽样调查不具有代表性.
让我们仍以300名学生的考试成绩为例,考察一下抽样调查的结果是否可靠. 老师选取的一个样本是:
随机数
(学号) 111 254 167 94 276
成绩 80 86 66 91 67
它的频数分布直方图、平均成绩和标准差分别如下:
另外,同学们也分别选取了一些样本,它们同样也包含五个个体,如下表:
同样,也可以作出这两个样本的频数分布直方图、计算它们的平均成绩和标准差,如下图所示:
随机数
(学号) 132 245 5 98 89
成绩 78 73 76 69 75
随机数
(学号) 90 167 86 275 54
成绩 72 86 83 82 82
样本平均成绩为81分,
标准差为4.7分
样本平均成绩为74.2分,
标准差为3.8分
1.从以上三张图比较来看,它们之间存在明显的差异,样本的平均数和标准差与总体的平均数与标准差也相差甚远,显然这样选择的样本不能反映总体的特性,是不可靠的.
2.选择恰当的样本个体数目
样本平均成绩为75.7分,
标准差为10.2分
样本平均成绩为77.1分,
标准差为10.7分
【规律方法】当样本中个体太少时,样本的平均数、标准差往往差距较大,如果选取适当的样本的个体数,各个样本的平均数、标准差与总体的平均数、标准差就相当接近了.
1.北京在这30天的空气污染指数及质量级别,如下表所示:
【例题】
2.体会用样本估计总体的合理性
经比较可以发现,虽然从样本获得的数据与总
体的不完全一致,但这样的误差还是可以接受
的,是一个较好的估计.
随着样本容量(样本中包含的个体的个数)的增加,由样本得出的平均数往往会更接近总体的平均数,数学家已经证明随机抽样方法是科学而可靠的. 对于估计总体特性这类问题,数学上的一般做法是给出具有一定可靠程度的一个估计值的范围 .
3.加权平均数的求法
问题1:在计算20个男同学平均身高时,小华先将所有数据按由小到大的顺序排列,如下表所示:
然后,他这样计算这20个学生的平均身高:
小华这样计算平均数可以吗?
可以
问题2:假设你们年级共有四个班级,各班的男同学人数和平均身高如表所示.
小强这样计算全年级男同学的平均身高:
小强这样计算平均数可以吗?
(cm)
不可以
为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹的杀伤半径,并列表如下:
【跟踪训练】
(1)在这个问题中,总体、个体、样本和样本容量各是什么?
(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数.
解:(1)总体是要检查的这批手榴弹的杀伤半径的全体;个体是每一颗手榴弹的杀伤半径;样本是所抽取的20颗手榴弹的杀伤半径;样本容量是20.
(2)在20个数据中,10出现了6次,次数最多,所以众数是10米.
20个数据从小到大排列,第10个和第11个数据是最中间的两个数,分别为9米和10米,所以中位数是9.5米.样本平均数是9.4米.
1.(南通·中考) 某纺织厂从10万件同类产品中随机抽取了100件进行质检,发现其中有5件不合格,那么估计该厂这10万件产品中合格品约为( )
A.9.5万件 B.9万件
C.9500件 D.5000件
【答案】A
2. 2013年因干旱影响,某市鼓励居民节约用水,为了解居民用水情况,在某小区随机抽查了20户家庭的月用水量,结果如下表:
则关于这20户家庭的月用水量,下列说法错误的是( )
A.中位数是6吨 B.平均数是5.8吨
C.众数是6吨 D.极差是4吨
【答案】D
月用水量(吨) 4 5 6 8 9
户数 4 5 7 3 1
3.(嘉兴·中考)李大伯有一片果林,共有80棵果树.某日,李大伯开始采摘今年第一批成熟的果子,他随机选取2棵果树共摘得10个果子,质量分别为(单
位:㎏):0.28,0.26,0.24,0.23,0.25,0.24,0.26,0.26,0.25,0.23.以此估算,李大伯收获的这批果子的单个质量和总质量分别约为( )
A.0.25㎏,200㎏ B.2.5㎏,100㎏
C.0.25㎏,100㎏ D.2.5㎏,200㎏
【答案】C
1.一般来说,用样本估计总体时,样本容量越大,样本对总体的估计也就越精确,相应地,搜集、整理、计算数据的工作量也就越大,因此,在实际工作中,样本容量既要考虑问题本身的需要,又要考虑实现的可能性和所付出的代价的大小.
2.随机抽样是经过数学家证明了的可靠的方法,它对于估计总体特征是很有帮助的.
虽然言语的波浪永远在我们上面喧哗,而我们的内心深处却永远是沉默的.
——纪伯伦