课件21张PPT。28.2 用样本估计总体 (第2课时)华东师大版九年级(下册) 在上节课中,我们知道在选取样本时应注意的问题,其一是所选取的样本必须具有代表性,其二是所选取的样本的容量应该足够大,这样的样本才能反映总体的特性,所选取的样本才比较可靠. 复习上节课的内容一、 随机抽样调查是了解总体情况的一种重要的数学方法,抽样是它的一个关键,上节课介绍了简单的随机抽样方法,即用抽签的方法来选取样本,这使每个个体都有相等的机会被选入样本. 让我们仍以上一节300名学生的考试成绩为例,考察一下抽样调查的结果是否与总体的情况一致。 首先对总体情况进行分析,根据已知数据,按照10分的距离将成绩分段,统计每个分数段学生出现的频数,填入表30.2.1表30.2.1 300名学生考试成绩频数分布表这就是频数分布表根据上表绘制直方图,如图30.2.1300名学生成绩频数分布直方图总体的平均成绩为78.1,标准差为10.8分 从图表中可以清楚地看出79.5分到89.5分这个分数段的学生数最多,90分以上的同学较少,不及格的学生数最少。 这就是频率分布直方图 活动1中,我们用简单的随机抽样方法,已经得到了第一个样本,这5个随机数如下表: 图30.2.2是这个样本的频数分布直方图、平均成绩和标准差。重复上述步骤,再取第二和第三个样本。它的频数分布直方图、平均
成绩和标准差分别如下:样本平均成绩为78分,标准差为10.1分 图30.2.2另外,同学们也分别选取了一些样本,
它们同样也包含五个个体,如下表:同样,也可以作出这两个样本的频数分布直方图、计算它们的平均成绩和标准差,如下图所示: 样本平均成绩为80.8分,
标准差为6.5分样本平均成绩为
74.2分,
标准差为3.8分 5名学生成绩频数分布直方图第二样本第三样本5名学生成绩频数分布直方图图30.2.3 从以上三张图比较来看,它们之间存在
明显的差异,平均数和标准差与总体的平均
数与标准差也相去甚远,显然这样选择的样
本不能反映总体的特性,是不可靠的。样本平均成绩为79.7分,标准差为9.4分 让我们再用大一些的样本试一试,这次每个样本含有10个个体。图30.2.410名学生成绩频数分布直方图第二样本样本平均成绩为83.3分,标准差为11.5分 图30.2.4 我们继续用随机抽样方法,得到第一个样本,重复上述步骤,再取第二个样本。图30.2.4是根据小明取到的样本数据得到的频数分布直方图。 再选取一些含有10名学生的样本,我们发现此时不同样本的平均成绩和标准差似乎比较接近总体的平均成绩78.1分和标准差10.8分。看来用大一些的样本来估计总体会比较可靠一点,让我们再用更大一些的样本试一试,这次每个样本含有40个个体。图30.2.5是根据小明取到的两个样本数据得到的频数分布直方图。样本平均成绩为75.5分,标准差为10.2分 图30.2.540名学生成绩频数分布直方图第二样本样本平均成绩为77.1分,标准差为10.7分 图30.2.5 再选取一些含有40名学生的样本,我们发现此时不同样本的平均成绩和标准差与总体的平均成绩和标准差的差距更小了!(相当接近总体的平均成绩78.1)你们从自己的抽样过程中是否也得出了同样的结果?选择恰当的样本个体数目样本平均成绩为
75.7分,
标准差为10.2分 样本平均成绩为
77.1分,
标准差为10.7分火星岩石样本 当样本中个体太少时,样本的平均数、标准差往往差距较大,如果选取适当的样本的个体数,各个样本的平均数、标准差与总体的标准差相当接近。 三、课堂练习 请同学们在300名学生的成绩中用随机抽样的方法选取两个含有20个个体的样本,并计算出它们的平均数与标准差,绘制频数分布直方图,并与总体的平均数、标准差比较。 小结
一般来说,用样本估计总体时,样本容量越大,样本对总体的估计也就越精确,相应地,搜集、整理、计算数据的工作量也就越大,因此,在实际工作中,样本容量既要考虑问题本身的需要,又要考虑实现的可能性和所付出的代价的大小。课时作业设计
吸烟危害健康,这是不争的事实,请同学们做一调查,以估计你所在地区吸烟的人数。在做调查时,选取样本要注意有代表性,应注意各种人群不可遗漏,样本容量必须足够大,同时做好数据的搜集、整理工作。再见课件18张PPT。28.2用样本估计总体 (第3课时)华东师大版九年级(下册)一、课前准备问题:2002年北京的空气质量情况如何?请用简单随机抽样方法选取该年的30天,记录并统计这30天北京的空气污染指数,求出这30天的平均空气污染指数,据此估计北京2002年全年的平均空气污染指数和空气质量状况。请同学们查询中国环境保护网,网址是http://www.zhb.gov.cn。二、新课
1.北京在这30天的空气污染指数及质量级别,如下表所示:用样本估
计总体 这30个空气污染指数的平均数为107,据此估计该城市2002年的平均空气污染指数为107,空气质量状况属于轻微污染。 讨论:同学们之间互相交流,算一算自己选取的样本的污染指数为多少?根据样本的空气污染指数的平均数,估计这个城市的空气质量。2、体会用样本估计总体的合理性经比较可以
发现,虽然
从样本获得
的数据与总
体的不完全
一致,但这
样的误差还
是可以接受
的,是一个
较好的估计。 显然,由于各位同学所抽取的样本的不同,样
本的污染指数不同。但是,正如我们前面已经看到
的,随着样本容量(样本中包含的个体的个数)的
增加,由样本得出的平均数往往会更接近总体的平
均数,数学家已经证明随机抽样方法是科学而可靠
的. 对于估计总体特性这类问题,数学上的一般做
法是给出具有一定可靠程度的一个估计值的范围 .
将来同学们会学习到有关的数学知识。 练习:同学们根据自己所抽取的样本绘制统计图,并和2002年全年的相应数据的统计图进行比较,想一想用你所抽取的样本估计总体是否合理?活动2 人们常说“吸烟有害”,这一般是指吸烟有害于人类的健康,那么,香烟对其他动植物的生长是否也不得呢?上海市闵行中学的师生们做过一个“香烟浸出液浓度对于种子萌芽的影响”的实验,他们选用常见的绿豆及赤豆各50粒作为种子的代表,观察在三种不同浓度的香烟浸出液中它们每天出芽的数目,获得的实验数据如表30.2.3所示:香烟浸出 据此,你们估计香烟浸出液对绿豆及赤豆的出芽率有怎样的影响?如果再重复这个实验,实验数据是否可能与他们获得的不一致?(浓度越大,出芽越慢,出芽率越低。) 为了一般地研究“香烟浸出液浓度对于种子萌芽的影响”,是否需要选取一些其他的种子做类似的实验?(可能不一致,因为还应考虑影响种子发芽的其他因素,温度等。) 如果有兴趣,请动手做一做,再与同学们一起讨论各自获得的数据和结论。(对此问题,你们可以课后查阅有关生物资料,并亲自动手实验获得更为感性的认识。)(香烟浸出液1: 2支香烟浸于200ml水;
香烟浸出液2: 3支香烟浸于200ml水;
香烟浸出液3: 4支香烟浸于200ml水)表30.2.3活动3思考:
一个年级有几百个学生,可是计算器一次只能计算几十个数据,怎么办? 假设你们学校在千里这外还有一个友好姐妹学校,那个学校的9年级学生想知道你们学校9年级男、女生的平均身高和体重。请提出若干个了解你们年级男、女学生平均身高和体重情况的方案,并按照解决问题的不同方法,分成几个组,分别尝试一下你们的办法。比一比,评一评,看哪种方法好。(如节省时间、结果误差小等等)(1.用计算机求平均数;
2.先统计各个数据出现的频数再作计算;
3.先算出每个班的平均数再计算年级的平均数。)3、加权平均数的求法问题1:在计算20个男同学平均身高时,
小华先将所有数据按由小到大的顺序
排列,如下表所示:然后,他这样计算这20个学生的平均身高:小华这样计算平均数可以吗?为什么?问题2:假设你们年级共有四个班级,
各班的男同学人数和平均身高如表所示.小强这样计算全年级男同学的平均身高:小强这样计算平均数可以吗?为什么? (小强的计算方法是错误的,因为他没有考虑到各班男生人数是不一样的,应该照小华的方法计算。)例3.某地区为筹备召开中学生运动会,指定要从某校初二年级9个班中抽取48名女生组成花束队,要求队员的身高一致,现随机抽取10名初二某班女生体检表(各班女生人数均超过20人),身高如下(单位:厘米):165 162 158 157 162 162 154 160 167 155
(1) 求这10名学生的平均身高;
(2) 问该校能否按要求组成花束队,试说明理由. (2) 由于样本的众数为162厘米,从而可估计一个班级至少有6名女同学的身高为162厘米.从而可估计全校身高为162厘米的女生数为:6×9=54>48。所以该校能按要求组成花束队。 (1)、公交508路总站设在一居民小区附近,为了了解高峰时段从总站乘车出行的人数,随机抽查了10个班次的乘车人数,结果如下:20 23 26 25 29 28 30 25 21 23
(1)计算这10个班次乘车人数的平均数;
(2)如果在高峰时段从总站共发车60个班次,根据上面的计算结果,估计在高峰时段从总站乘车出行的乘客共有多少人?练习1:(2).某饮食店认真统计了一周中各种点心的销售情况,统计结果如下表所示,你认为这样的统计结果对该店的管理人员有用吗?请说明你的理由.
一周中各种点心销售情况统计表 在一个班的40学生中,14岁的有5人,15岁的有30人,16岁的有4人,17岁的有1人,求这个班级学生的平均年龄。练习3: 专家提醒,目前我国儿童青少年的健康存在着五个必须重视的问题:营养不良和肥胖、近视、龋齿、贫血以及心理卫生.你认为这是用普查还是抽样调查得到的结果?设计一份调查卷和一个抽样调查方案,了解我们学校学生是否普遍存在这五个健康问题,是否严重?练习4:我当设计师四、作业 课时作业设计
一、某班一次语文测验的成绩如下:得100分的7人,90分的14人,80分的17人,70分的8人,60分的2人,50分的2人,计算这次测验全班的平均成绩。
二、由于学习的紧张的电视、电脑的影响,中学生的视力问题越来越严重。请同学们分成几个组,对中学生的视力情况做一调查,以此来估计你所在地区的中学生的视力情况。几组这间进行比赛,看看哪一组所选取的样本更接近于总体的特性。再见课件16张PPT。华东师大版九年级(下册)在选取样本时应注意哪些问题?1.所选取的样本必须具有代表性.2.所选取的样本的容量应该足够大.复习回顾 这样所选取的样本才能反映总体的特性,才比较合适. 本节课我们将探索怎样的抽样调查是可靠的?3.样本要避免遗漏某一个群体. 妈妈为了知道饼熟了没有,从刚出锅的饼上切下一小块尝尝,如果这一小块熟了,那么可以估计整张饼熟了。 环境检测中心为了了解一个城市的空气质量情况,会在这个城市中分散地选择几个点,从各地采集数据。 农科站要了解农田中某种病虫害的灾情,会随意地选定几块地,仔细地检查虫卵数,然后估计一公顷农田大约平均有多少虫卵,会不会发生病虫害。 以上几个例子都不适宜做普查,而需要做抽样调查。我们知道,样本最好有代表性,没有偏向,这样的抽样调查可以较好地反映总体的情况。那么如何进行抽样才比较科学呢?请再举出一些需要抽样调查的例子。1.简单的随机抽样 要使样本具有代表性,不偏向总体中的某些个体,有一个对每个个体都公平的办法,那就是用抽签的办法决定哪些个体进入样本。统计学家们称这种理想的抽样方法为简单随机抽样(simple random sampling). 具体来说,先将每个个体编号,然后将写有这些编号的纸条或者乒乓球全部放入一个盒子,搅拌均匀,再用抽签的办法,抽出一个编号,那个编号的个体就被选入样本。当然,为了节省时间,也可以像以前做过的那样,让计算器来产生随机数,现实中,我们一般不会对同一个人调查两次,所以,如果计算器产生的随机数有重复,那么就只算一次。判断下面这些抽样调查选取样本的方法是否
合适,若不合适,请说明理由.
(1)为调查江苏省的环境污染情况,调查了长
江以南的南京市、常州市、苏州市、镇江市、无锡市的环境污染情况.解:
(1)不合适.因为调查对象在总体中必须有代表性,现在所调查的这些地方的环境污染情况仅仅代表了长江以南地区,并不能代表整个江苏省的环境污染情况.(2)从100名学生中,随机抽取2名学生,测量
他们的身高来估算这100名学生的平均身高.
(3)从一批灯泡中随机抽取50个进行试验,
估算这批灯泡的使用寿命.(2)不合适.因为抽样调查时所抽取的样本要足够大,现在只抽取了2名学生的身高,不能用来估算100名学生的平均身高.
(3)合适.解: (4)不合适.虽然调查的家庭很多,但仅
仅增加调查的数量不一定能够提高调查质量,
本题中所调查的仅代表上英特网的家庭,不
能代表不上英特网的家庭,因此这样的抽样
调查不具有普遍代表性. (4)为了解观众对中央电视台第一套节目的收
视率,对所有上英特网的家庭进行在线调查.解: 用简单的随机抽样方法选取三个样本,每个样本含有5个个体,这里已经完成了第一个样本的选取,请继续完成第二个和第三个样本的选取。第一个样本活动1第二个样本第三个样本 从以上的抽样过程可以看到,抽样之前,我们不能预测到哪些个体会被抽中,像这样不能够事先预测结果的特性叫做随机性(randomness). 你明白刚才的方法为什么是一种随机抽样了吗?练习1:
将观众的所有选票(统一印制)集
中在一个大箱子中,搅匀后由主持人
从中随机地取出5张选票。这样的选取
过程是否是简单的随机抽样?说明理由。答:是。因为每张参加抽奖的选票都
有相等的机会被抽中。 不是简单随机抽样,由于被抽取样本的总体的个数是无限的而不是有限的. 练习2: 下列抽取样本的方式是否属于简单随机抽样?说明道理.(1)无限多个个体中抽取100个个体作样本.解:(2)盒子里共有80个零件,从中选出8个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里. 不是简单随机抽样,由于它是放回抽样.解:课堂小结 通过实验操作,你对抽样调查可靠性有什么体会?如何随机抽取样本?再见