第28章 样本与总体
28.1抽样调查的意义
第1课时 人口普查与抽样调查
教学目标:1.了解普查和抽样调查的区别及应用
2.了解总体、个体、样本、样本容量的含义
3.了解选取有代表性的样本对总体估计的作用
4.掌握抽样调查选取样本的方法
教学重点:总体、个体、样本、样本容
教学难点:抽样调查选取样本的方法
教学过程:
一、创设情境,导入新课
利用课本中提出的三个问题导入新课,这是一个比较实际的问题同学们很容易理解,也容易展开讨论
(营造开放的讨论场面,引导学生讨论并发现问题)
二、合作交流,探求新知
第一个问题同学们很容易回答,并且很快把表中的内容填好。
第二个问题稍难一些,因为抽的家庭太多了,不过利用2000年第五次人口普查的知识,我们是可以回答的。
第三个问题最难回答,为什么呢?因为全国人口普查的工作量极其大,我国今后每十年进行一次全国人口普查,每五年进行一次全国1﹪人口的抽样调查。即只是研究约1280万人口,然后对这部分人进行调查。从而得出一个估计的答案。
三、总结归纳
我们把要考察的对象的全体叫做全体,把组成总体的每一个部分个体叫做个体。从总体中取出的一部分个体叫做这个总体的一个样本。一个样本包含的个体的数量叫做这个样本的容量。
例如人口普查中,当考察我国人口年龄构成时,总体就是所有具有中华人民共和国国籍并在中华人民共和国境内常住的人口年龄,个体就是符合这一条件的每一个公民的年龄,符合这一条件的所有北京市的公民的年龄就是一个个体。
普查是通过总体的方式来收集数据的,抽样调查是通过调查样本的方式来收集数据的。
四、典型例题讲解
例1 为了了解新课程标准实施后某九年级400名学生应用数学意识和创新意识能力的提高情况,进行一次测验,从中抽取了50名学生的成绩,在这个问题中:
(1)采用了哪种调查方式? (2)总体、个体、样本、样本容量是什么?
分析:调查方式有普查和抽样调查,本题中抽取了50名学生的成绩,因此采用了抽样调查的方式。
例2 为了了解2000台空调的使用寿命,从中抽取了20台做连续的运转实验,在这个问题中,总体、个体、样本、样本容量各指什么?
解:所要了解的2000台空调的使用寿命的全体是总体。
每台空调的使用寿命是个体。抽取的20台空调的使用寿命是总体的一个样本。样本容量是20
五、 学以致用,体验成功
自己独立完成课本92页练习题
六、 课堂小结
总体、个体、样本、样本容量
七、作业:
教学反思:
第2课时 从部分看整体
教学目标:1.了解从部分看总体的意义和方法,学会合理的选择样本
2.经历由部分看总体的学习全过程,体会选取代表性的样本对正确估计总体的重要性。
3.培养学生交流协作精神及言语表达能力,体会部分看整作用
教学重点:利用从部分看整体的知识,解决数学实际问题。
教学难点:能够正确的判断选择的样本是否合理
教学过程:
一、导入新课
这里有一个大布袋,里面装着许多的乒乓球。如果无法把所有的乒乓球都倒出来数,那么你们还有其他的办法估计布袋中共有多少个乒乓球吗?
学生在小组内展开了讨论…… 可是方法有限,很难……
二 、 新课讲解
这个时候教师介入了,引导大家解决问题,让学生看课本93页。
解决的方法,取出10个球,在每个球上做个记号,以示它们已经被取出过。将这10个球全部放回袋子中,在将布袋中的球搅匀,然后第二次从布袋中取出一部分球,例如15个,检查这15个球中有几个是曾经被取出过的,假如说检查发现当中有2个是做过标记的,那么根据以下的近似关系:布袋中有标记的球的数目/布袋中球的数目
≈第二次取出的球的中有标记的球的数目/第二次取出的球的数目
就可以估计出布袋中球的数目≈15×10÷2=75
受了这个题目的启发,同学们可以做下面这个题,
例1 为了估计池塘里鱼的数目,我们可以采用如下的方法:第一次捕捞一网鱼,一共捕捞20条鱼,把他们全部做上标记,第二次捕捞了三网,一共捕捞了54条鱼,其中有三条鱼身上有标记,问这个鱼塘中一共有多少条鱼?
分析:按照上面我们总结的结论方法,很容易求出池塘中有360条鱼。
例1 要了解喜欢足球的学生人数占全年级总人数的百分比,在足球场上向28名同学做调查,这样的一个样本可不可以考察总体?
解决这个问题时我们要注意以下几点:
①选取的样本不能太小; ②防止太大的“盲目性”; ③样本要具有代表性;
答:这样的样本太小、太特殊,不具有代表性
三.课堂知识练习
1.判断下面抽样调查选取的样本是否合适
①检查某啤酒厂即将出厂的啤酒质量情况,先随机抽取若干箱,再在抽取的每箱中,随机抽取1-2瓶检查。
②通过网上问卷调查方式,了解百姓对央视春节晚会的评价。
③调查某市中小学生学习知识负担的状况,在该市每所中小学选取一名学生,进行问卷调查。
④教育部为了调查中小学乱收费情况,调出了某市所有的中小学生。
2.拓展创新题
某住宅小区6月份随机抽取调查了该小区6天的用水量(单位:吨),结果分别是28、34、32、37、28、31,那么估计该小区6月份(28天)的总的用水量是多少吨?
3.探究性问题
一不透明的塑料袋里放入了一些小球,小红从中摸了两次结果发现都是红球,因此小红说这个袋中都是红球,而小明从中摸了两次后,摸到了一红一白两球,因此,小明说这个袋中红球和白球各占50%,你认为他们的话对吗?为什么?
四.课堂小结
五.课后作业:
教学反思:
第3课时 这样选择样本合适吗
教学目标: 使学生知道在抽样调查时,所选取的样本必须具有代表性,并能掌握科学的抽样方法,即具有代表性,样本容量必须足够大避免遗漏某一群体,使得所抽取的样本比较合理,能比较准确地反映总体的特征。
重点:判断所选取的样本是否具有代表性,是否能够反映总体的特征。
难点:判断所选取的样本是否具有代表性,是否能够反映总体的特征。
教学过程:
一、用例子说明如何进行抽样比较合理
例1、老师布置给每个小组一个任务,用抽样调查的方法估计全班同学的平均身高.坐在教室最后面的小胖为了争速度,立即就近向他周围的三个同学作调查,计算出他们四个人的平均身高后就举手向老师示意已经完成任务了.
分析 因为小胖他们四个坐在教室最后面,所以他们的身高平均数就会大于整个班级的身高平均数,这样的样本就不具有代表性了.
现实生活中,用简单的随机抽样方法选中的样本可能不愿意参加或者没空配合你作调查,所以,在不太影响样本代表性的前提下,人们也经常采取调查周围人的抽样方法.但是,要注意这些调查对象在总体中是否有代表性.
例2 甲同学说:“6, 6, 6…啊!真的是6!你只要一直想某个数,就会掷出那个数.”
乙同学说:“不对,我发现我越是想要某个数就越得不到这个数,倒是不想它反而会掷出那个数.”
分析 这两位同学的说法都不正确.因为几次经验说明不了什么问题。
在这里请同学掷骰子,来验证上述两位同学的说法不正确。
例3 小强的自行车失窃了,他想知道所在地区每个家庭平均发生过几次自行车失窃事件.为此,他
和同学们一起,调查了全校每个同学所在家庭发生过几次自行车失窃事件.
分析 这样抽样调查是不合适的.虽然他们调查的人数很多,但是因为排除了所在地区那些没有中学
生的家庭,所以他们的调查结果不能推广到所在地区的所有家庭。
想一想:小强和他的同学们的调查反映哪些家庭失窃自行车的情况?
这个例子告诉我们,开展调查之前,要仔细检查总体中的每个个体是否都有可能成为调查对象。
例4、1936年,美国《文学文摘》杂志:根据1000万电话和从该杂志订户所收回的意见,断言兰登将以370:161的优势在总统竞选中击败罗斯福,但结果是,罗斯福当选了,《文学文摘》大丢面子,原因何在呢?
原来,1936年能装电话和订阅《文学文摘》杂志的人,在经济上相对富裕,而引入不太高的的大多数选民选择了罗斯福。《文学文摘》的教训表明,抽样调查时,既要关注样本的大小,又要关注样本的代表性。
二、练习
判断下面这几个抽样调查选取样本的方法是否合适,并说明理由:
1、一食品厂为了解其产品质量情况,在其生产流水线上每隔100包选取一包检查其质量;
2、一手表厂欲了解6-11岁少年儿童戴手表的比例,周末来到一家业余艺术学校调查200名在那里学习的学生.
3、为调查全校学生对购买正版书籍、唱片和软件的支持率,用简单随机抽样法在全校所有的班级中抽取8个班级,调查这8个班级所有学生对购买正版书籍、唱片和软件的支持率;
4、为调查一个省的环境污染情况,调查省会城市的环境污染情况
三、小结
通过本节课的学习,同学们应明白在做抽样调查时,所选取的样本应具有代表性,应避免遗漏某一群体,同时样本的容易要足够大,这样样本才能反映总体的特性,才能反映事物的本来面目。
四、课后作业:
教学反思:
§28.2.1简单的随机抽样
教学目标:使学生了解简单的随机抽样的操作过程,理解简单的随机抽样的含义,能用随机抽样的方法从总体中抽取样本。
重点:用简单的随机抽样的方法从总体中抽取样本。
教学过程:
一、用例子说明有些调查不适宜做普查,只适宜做抽样调查
例1:妈妈为了知道饼熟了没有,从刚出锅的饼上切下一小块尝尝,如果这一小块熟了,那么可以估计整张饼熟了。
例2:环境检测中心为了了解一个城市的空气质量情况,会在这个城市中分散地选择几个点,从各地采集数据。
例3:农科站要了解农田中某种病虫害的灾情,会随意地选定几块地,仔细地检查虫卵数,然后估计一公顷农田大约平均有多少虫卵,会不会发生病虫害。
例4:某部队要想知道一批炮弹的杀伤半径,会随意地从中选取一些炮弹进行发射实验,以考察这一批炮弹的杀伤半径。
以上的例子都不适宜做普查,而适宜做抽样调查。
二、如何从总体中选取样本
1、什么是简单的随机抽样
上面的例子不适宜做普查,而需要做抽样调查,那么应该如何选取样本,使它具有代表性,而能较好地反映总体的情况呢?
要想使样本具有代表性,不偏向总体中的某些个性,有一个对每个个体都公平的方法,决定哪些个体进入样本,这种思想的抽样方法我们把它称为简单的随机抽样
2、用简单的随机抽样方法来选取一些样本。
假设总体是某年级280名学生的数学考试成绩,我们已经按照学号顺序排列如下:
97 92 89 86 93 73 74 72 60 98 70 90 89 90 91 80 69 92 70 64 92 83 89 93 72 77 79 75 80 93 93 72 87 76 86 82 85 82 87 86 81 88 74 87 92 88 75 92 89 82 88 86 85 76 79 92 89 84 93 75 93 84 87 90 88 90 80 89 72 78 73 79 85 78 77 91 92 82 77 86 90 78 86 90 83 73 75 67 76 55 70 76 77 91 70 84 87 62 91 67 88 78 82 77 87 75 84 70 80 66 80 87 60 78 76 89 81 88 73 75 95 68 80 70 78 71 80 65 82 83 62 72 80 70 83 68 74 67 67 80 90 70 82 85 96 70 73 86 87 81 70 69 76 68 70 68 71 79 71 87 60 64 62 81 69 63 66 63 64 53 61 41 58 60 84 62 63 76 82 76 61 72 66 80 90 93 87 60 82 85 77 84 78 65 62 75 64 70 68 66 99 81 65 98 87 100 64 68 82 73 66 72 96 78 74 52 92 83 85 60 67 94 88 86 89 93 99 100 79 85 68 60 74 70 78 65 68 68 79 77 90 55 80 77 67 65 87 81 67 75 57 75 90 86 66 83 68 84 68 85 74 98 89 67 79 77 69 89 68 55 58 63 77 78 69 67 80 82 83 98 94 96 80 79 68 70 57 74 96 70 78 80 87 85 93 80 88 67 70 93。
用简单抽样的方法选取三个样本,每个样本含有5个个体,老师示范完成了第一个样本的选取,请同学们继续完成第二和第三个样本的选取。
第一个样本:
随机数(学号)
111
254
167
94
276
成绩
80
86
66
91
67
第二个样本:
随机数(学号)
成绩
第三个样本:
随机数(学号)
成绩
课堂活动:用简单的随机抽样方法从280名学生的数学成绩的总体中选取两个样本,每个样本含有20个个体。
第一个样本:
随机数(学号)
成绩
第二个样本:
随机数(学号)
成绩
同学们从刚才的活动中可以体会到,抽样之前,同学们不能预测到哪些个体会被抽中,像这样不能够预先预测结果的特性叫做随机性。所以统计学家把这种抽样的方法叫做随机抽样。
三、小结
本节课我们学习了什么是随机抽样,如何从总体中随机选取一些样本,通过对这些样本的研究,可以反映总体中的特性。
四、课后作业:
教学反思:
§28.2.2抽样调查可靠吗
教学目标: 通过样本抽样,绘频数颁布直方图,计算样本平均数和标准差使学生认识到只有样本容易足够大,才能比较准确地反映总体的特性,这样的样本才可靠,体会只有可靠的样本,才能用样本去估计总体。
重点:通过随机抽样选取样本,绘制频数分布直方图、计算平均数和标准差并与总体的频数分布直方图、平均数和标准差进行比较,得出结论。
难点:通过随机抽样选取样本,绘制频数分布直方图、计算平均数和标准差并与总体的频数分布直方图、平均数和标准差进行比较,得出结论。
教学过程:
一、复习上节课的内容
在上节课中,我们知道在选取样本时应注意的问题,其一是所选取的样本必须具有代表性,其二是所选取的样本的容量应该足够大,这样的样本才能反映总体的特性,所选取的样本才比较可靠。
二、新课
1、用例子说明样本中的个体数太少,不能真实反映的特性。
让我们仍以上一节280名学生的考试成绩为例,考察一下抽样调查的结果是否可靠。上一节中,老师选取的一个样本是:
随机数(学号)
111
254
167
94
276
成绩
80
86
66
91
67
它的频数分布直方图、平均成绩和标准差分别如下:
另外,同学们也分别选取了一些样本,它们同样也包含五个个体,如下表:
随机数(学号)
132
245
5
98
89
成绩
78
73
76
69
75
随机数(学号)
90
167
86
275
54
成绩
72
86
83
82
82
同样,也可以作出这两个样本的频数分布直方图、计算它们的平均成绩和校准差,如下图所示:
样本平均成绩为74.2分,标准差为3.8分 样本平均成绩为80.8分,标准差为6.5分
从以上三张图比较来看,它们之间存在明显的差异,平均数和标准差与总体的平均数与标准差也相去甚远,显然这样选择的样本不能反映总体的特性,是不可靠的。以下是总体的频数分布直方图、平均成绩和标准差,请同学们把三个样本的频数分布直方图、平均成绩和标准差与它进行比较,更能反映这样选取样本是不可靠的。
2、选择恰当的样本个体数目
下面是某位同学用随机抽样的方法选取两个含有40个个体的样本,并计算了它们的平均数与标准差,绘制了频数分布直方图,具体如下:
样本平均成绩为75.7分,标准差为10.2分 样本平均成绩为77.1分,标准差为10.7分
从以上我们可以看出,当样本中个体太少时,样本的平均数、标准差往往差距较大,如果选取适当的样本的个体数,各个样本的平均数、标准差与总体的标准差相当接近。)
三、课堂练习
请同学们在280名学生的成绩中用随机抽样的方法选取两个含有20个个体的样本,并计算出它们的平均数与标准差,绘制频数分布直方图,并与总体的平均数、标准差比较。
四、小结
一般来说,用样本估计总体时,样本容量越大,样本对总体的估计也就越精确,相应地,搜集、整理、计算数据的工作量也就越大,因此,在实际工作中,样本容量既要考虑问题本身的需要,又要考虑实现的可能性和所付出的代价的大小。
五、课后作业:
教学反思:
§28.2.3用样本估计总体
教学目标: 通过实例,使学生体会用样本估计总体的思想,能够根据统计结果作出合理的判断和推测,能与同学进行交流,用清晰的语言表达自己的观点。
重点:根据有关问题查找资料或调查,用随机抽样的方法选取样本,能用样本的平均数和方差,从而对总体有个体有个合理的估计和推测。
难点:根据有关问题查找资料或调查,用随机抽样的方法选取样本,能用样本的平均数和方差,从而对总体有个体有个合理的估计和推测。
教学过程:
一、课前准备
问题:2002年北京的空气质量情况如何?请用简单随机抽样方法选取该年的28天,记录并统计这28天北京的空气污染指数,求出这28天的平均空气污染指数,据此估计北京2002年全年的平均空气污染指数和空气质量状况。请同学们查询中国环境保护网
二、新课
师生用随机抽样的方法选定如下表中的28天,通过上网得知北京在这28天的空气污染指数及质量级别,如下表所示:
这28个空气污染指数的平均数为107,据此估计该城市2002年的平均空气污染指数为107,空气质量状况属于轻微污染。
讨论:同学们之间互相交流,算一算自己选取的样本的污染指数为多少?根据样本的空气污染指数的平均数,估计这个城市的空气质量。
2、体会用样本估计总体的合理性
下面是老师抽取的样本的空气质量级别、所占天数及比例的统计图和该城市2002年全年的相应数据的统计图,同学们可以通过比较两张统计图,体会用样本估计总体的合理性。
经比较可以发现,虽然从样本获得的数据与总体的不完全一致,但这样的误差还是可以接受的,是一个较好的估计。
练习:同学们根据自己所抽取的样本绘制统计图,并和2002年全年的相应数据的统计图进行比较,想一想用你所抽取的样本估计总体是否合理?
显然,由于各位同学所抽取的样本的不同,样本的污染指数不同。但是,正如我们前面已经看到的,随着样本容量(样本中包含的个体的个数)的增加,由样本得出的平均数往往会更接近总体的平均数,数学家已经证明随机抽样方法是科学而可靠的. 对于估计总体特性这类问题,数学上的一般做法是给出具有一定可靠程度的一个估计值的范围,将来同学们会学习到有关的数学知识。
3、加权平均数的求法
问题1:在计算20个男同学平均身高时,小华先将所有数据按由小到大的顺序排列,如下表所示:
然后,他这样计算这20个学生的平均身高:
小华这样计算平均数可以吗?为什么?
问题2:假设你们年级共有四个班级,各班的男同学人数和平均身高如表25.2.4所示.
表25.2.4
小强这样计算全年级男同学的平均身高:
小强这样计算平均数可以吗?为什么?
练习:在一个班的40学生中,14岁的有5人,15岁的有28人,16岁的有4人,17岁的有1人,求这个班级学生的平均年龄。
三、小结
用样本估计总体时,样本容量越大,样本对总体的估计也就越精确。相应地,搜集、整理、计算数据的工作量也就越大,随机抽样是经过数学证明了的可靠的方法,它对于估计总体特征是很有帮助的。
四、作业:
教学反思:
28.3 借助调查作决策
教学目标:了解媒体是获取信息的一个重要渠道,学会从媒体上获取数据信息,包括上网、看电视、读报、听广播等,并通过对这些数据的分析进行决策.学会对来自媒体的数据信息进行合理的分析,发表自己的观点.通过对来自媒体的数据的分析与交流,在分析信息、提高分析辩别能力的同时,增强合作学习的意识与能力.
教学重难点:.综合运用所学统计知识读取媒体信息,并进行适当的分析
能够对信息中数据的来源及处理数据的方法以及由此得到的结果进行合理的质疑.从统计(数学)的角度对媒体信息进行质疑,并能有条理地阐述自己的观点.
第一课时
教学过程:
一、引入
获取信息的一个重要渠道,通过媒体可以便捷地获取丰富、实时的信息
举例:如果明天我们要郊游,可以留意报纸、广播、电视中的天气预报或者上网查询,要是天气预报说“明天降雨概率为90%”,那我们可能都会带上雨具.
请同学再举几个通过媒体获取数据进行决策的例子
1.借助调查作决策
问题1 2001年“五·一”前夕,小明一家准备购买一台彩电.是买国产的还是进口的?是考虑价格便宜还是追求功能全面?最后决定在甲、乙、丙三个国产品牌中选择一个最畅销的品牌.小明上网查得截至2001年第一季度的最新数据,如表28.1.1所示.
如果你是小明,会怎样取舍呢?
分析 把这三个品牌彩电自1999年以来截至2001年第一季度的总销量和平均月销售量用图形表示.
图1 1999年以来彩电销售总量比较
图2 1999年以来彩电历年月平均销量比较
思 考
(1)以2001年第一季度三个品牌销量的4倍分别作为2001年它们全年的估计销量,这样比较年销售量合适吗?
(2)为了进一步了解这三个品牌的销售情况,小明与他的爸爸特地在一家电器商场观察了一个小时,在这一小时中,他们发现甲与丙各卖出了两台,而乙一台也没有卖出.为什么他们在商场观察的结果与小明在媒体上查到的数据不成比例?这是否意味着网上公布的数据不可靠?为什么?
解:(1)不合适,因为不同季节对不同产品的需求不一定一样,同一品牌在不同季节的销售量也不一定相同,第一季度是销售的淡季,因次它不具有代表性,不能用它的4倍作为全年的估计销量,可以每个季度取一个月或一个月中随机抽取几天来比较年销售量.
(2)小明和他爸只在一个商店里统计了一个小时的销售情况,因此他选择的样本既没有随机性也没有代表性,样本的容量有太小,而媒体上公布的数据是作了大量的调查得出的结果,因此网上的数据依然可靠.
练 习:爸爸妈妈计划在周末带小明去旅游.首先,希望天气适宜;其次,游览的地方最好离居住地近一些.下图是小明在报纸上查询到的周末部分旅游区天气预报.
此外,小明还通过上网查询列车时刻表,获得了各旅游区与自己居住地
之间的里程如下(单位:m).
大连2 255,青岛1 359,泰山890,洛阳1 122,黄山674,杭州201,武夷山631,厦门1 395,桂林1 645,湛江2 280.
(1)请你帮小明分析一下,哪个旅游景点是最佳选择?
(2)如果你要在本周末旅行,那么基于路程和天气两方面的原因,你将怎样查询数据做出决策呢?把你的决策过程和同学们进行交流.
答:
(1)天气适宜的有湛江、青岛、泰山、洛阳、黄山、桂林、五夷山,在这些天气适宜的旅游区中,五夷山离居住地最近、所以五夷山是最佳选择。
(2)可以先查询天气、及各景点的路程,以天气适宜且路程近者为目标。
媒体中的数据很多,只要我们留心,会从其中获得许多有用的信息.但出现在媒体中的信息不一定都是可靠的,我们在获取信息的同时,需要进行全面的分析.
第二课时
2. 容易误导决策的统计图
例2 一则广告说:据调查,使用本厂牙膏可以使蛀牙率减少20%,并以图28.1.3示意其调查得到的数据.你怎样看待这则广告?
分 析
第一,我们注意到图中的柱形图的纵轴是从28%开始的,它容易留给我们一个错误的印象:使用该厂牙膏会使蛀牙率减少一半.
第二,我们不知道调查对象是否有可比性,如果使用该厂牙膏的人群是幼儿园小朋友,而使用非该厂牙膏的人群却是成年人,那么所得的结论就不可信了.
第三,我们也不知道样本容量有多大,如果只调查了10个人,那么所得的结论可能就不太可靠了.
从这个很小的例子可以看出,数据虽然给我们带来了有利于决策的各种信息,但有些时候也可能误导我们.所以,比较规范的统计报告应该说明调查的细节,如调查了多少人,是怎样选取调查对象的,等等.
问题3见教材
练习
以下是一些来自媒体的信息,谈谈你读了之后有什么想法.
(1)??报纸刊载:高校毕业生平均年收入为5万元.(数据来源于对某高校校友的一次问卷调查)
(2)?某房产广告称:本地区居民年收入6万元.(事实上该地区居住了许多普通工人家庭,只有几户富翁家庭)
(3)某杂志刊载消息解释其价格上涨原因:10年来,原材料上涨10%,印刷费增加10%,推销广告费上升10%.这样一来,成本增加28%,零售价格怎能不上涨?
五、小结
在本节学期中,我们主要学习了在对某件事情作决策前,如何借助媒体,查询数据,媒体是获取信息的一个重要渠道,既要从中获得尽可能多的有用信息,还要保持理智的心态,要对数据的来源、收集数据的方法、数据的呈现方式和由此得出的结论进行合理的辨析。
课后作业:
教学反思: