用样本估计总体
第2课时
(
教学目标
)
1.通过具体实例,学生体会样本与总体的关系,体验用样本的分布估计总体的分布.提升学生的直观想象素养.
2.通过具体实例,探究“大数据”的应用,提升学生的数学运算素养.
(
教学重难点
)
教学重点:样本的分布估计总体的分布和“大数据”的简单应用.
教学难点:用样本“估计总体”,突出“用局部估计总体”的思想.
(
课前准备
)
PPT课件.
(
教学过程
)
一、整体概览
问题1:阅读课本,回答下列问题:
(1)本课时将要研究哪类问题?
(2)本课时要研究的问题在数学中的地位是怎样的?
师生活动:学生带着问题阅读课本,老师指导学生概括总结本课时的内容.
预设的答案:(1)本节课要学的内容是用样本估计总体的第二课时,主要研究用样本的分部估计总体的分部。(2)本节课之前统计的内容,可以归结为描述统计学的范畴,主要讨论的是怎样收集、整理和分析。本课时的内容可以归结为推断统计学的范畴,主要讨论的是如何根据样本数据得到总体的信息,从而为相关的决策提供指导。本小节的重点是帮助学生理解用样本的分布估计总体的分布,体会统计思想与确定性思维的差异。
设计意图:通过本节课内容的预习,让学生明晰下一阶段的学习目标,初步搭建学习内容的框架.
引语:前面一节课,我们体会了可以用样本的数字特征估计总体的数字特征,那么,总体的分布是否也可以用样本的分布来近似刻画呢?(板书:用样本估计总体第二课时)
二、探索新知
问题2:通过对某中学1257名高一学生期中考试的数学成绩(具体数据参见课本85-87页)进行整理,可以得到如下数据,并由此可作出频率分布直方图和折线图,如图所示.
分组 频数 频率
[40,50) 7 0.01
[50,60) 65 0.05
[60,70) 276 0.22
[70,80) 480 0.38
[80,90) 330 0.26
[90,100) 99 0.08
师生活动:在附录的数据中抽取容量是100的样本,整理类似的表格,并制作频率分布直方图.学生分成2组,选用随机抽样的方法分别抽取容量是100的样本,分别记为样本A,样本B ,分别得到如下的频数、频率对应表,它们的频率分布直方图,借助信息技术完成相应任务.
预设的答案:如果从上述问题中提到的数据中,抽取两个容量为100的样本(分别记为样本A,样本B),则可以得到如下频数、频率对应表,对应的频率分布直方图如下。
分组 总体 样本A 样本B
频数 频率 频数 频率 频数 频率
[40,50) 7 0.01 0 0 0 0
[50,60) 65 0.05 5 0.05 8 0.08
[60,70) 276 0.22 23 0.23 21 0.21
[70,80) 480 0.38 37 0.37 43 0.43
[80,90) 330 0.26 27 0.27 19 0.19
[90,100) 99 0.08 8 0.08 9 0.09
追问:总体的分布是否也可以用样本的分布来近似刻画呢?
预设的答案:如果样本的容量恰当,抽样方法又合理,在容许一定误差存在的前提下,可以用样本的分布估计总体的分布.分布的估计一般也有误差,如果总体在每一组的频率记为,一般来说,
不等于零,同样,大数定律可以保证,当样本的容量越来越大时,上式很小的可能性将越来越大.
设计意图:这个活动意在让学生体会和感受统计的思想方法,学生经历和体验了数据收集、数据处理等过程,真正理解统计的思想方法.
三、初步应用
例 我国是世界上严重缺水的国家之一,某市为了制定合理的节水方案,对家庭用水情况进行了调查,通过抽样,获得了某年100个家庭的月均用水量(单位:t),将数据按照[0,1),[1,2),[2,3),[3,4),[4,5)分成了5组,制成了如图所示频率分布直方图.
(1)求图中的值;
(2)设该市有10万个家庭,估计全市月均用水量不低于3t的家庭数;
(3)假设同组的每个数据都用该组区间的中点值代替,估计全市家庭月均用水量的平均数.
师生活动:学生自己根据所学知识尝试解答,教师给出答案。
预设的答案:
(1)因为频率分布直方图所有举行的面积之和为1,所以
(0.12+0.22+0.36++0.12)1=1
解得
(2) 抽取的样本中,月均用水量不低于3t的家庭所占比例为
因此估计全市月均用水量不低于3t的家庭所占比例也为,所求家庭数为.
(3)因为
,
估计全市家庭月均用水量的平均数为2.46.
设计意图:本例完整地描述出了用样本的分布估计总体的分布的过程;首先收集数据,然后用合适的形式显示样本数据,最后抽取其中的信息对总体进行预测.第(3)问要求按照区间中点的值来进行计算,理论上讲,也可以用区间左端点或者右端点的值来进行计算,但一般不这样做.
练习:在一段时间内有2000辆车通过高速公路上的某处,现随机抽取其中的200辆进行车速统计,统计结果如右面的频率分布直方图所示.
(1)求直方图中x的值;
(2)若该处高速公路规定正常行驶速度为90km/h~120km/h,试估计2000辆车中,在这段时间内以正常速度通过该处的汽车约有多少辆.
师生活动:学生做练习,教师根据学生练习情况给予反馈.
预设的答案:(1)x=0.02 (2)2000×(0.030+0.035+0.020)=1700(辆)
2、教师讲解
“大数据”简介
学生自行完成课本83页“大数据”阅读,对“大数据”价值的认识,有利于学生对未来职业的选择、个人发展规划的制定,激发学生学习的兴趣和动力.
四、归纳小结,布置作业
问题3:体会样本与总体的关系,体验用样本的分布估计总体的分布.
师生活动:学生尝试总结,老师适当补充.
预设的答案:用样本估计总体,21世纪的世界是海量数据存在并高速增长的世界,数据的重要性非同一般.这一大节特别梳理清楚数据、总体、样本这三者这间的关系,画频率分布直观图也好,计算样本平均数、样本标准差也好,……,都不是就是论事的讨论样本数据,而同时要体现“估计总体”,从而突出“用局部估计总体”的思想.
五、目标检测设计
1.为了解中学300名男生的身高情况,随机抽取若干名男生进行身高测量,将所得数据整理后,画出频数分布直方图(如图).估计该校男生的身高在169.5 cm~174.5 cm之间的人数有( )
A.12 B.48
C.72 D.96
设计意图:考查学生用样本分布估计总体的分布.
2.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
设计意图:考查学生利用样本分布估计总体分布总。
参考答案:
1.【答案】C
【解析】根据图形,身高在169.5 cm~174.5 cm之间的人数的百分比为:×100%=24%,
∴该校男生的身高在169.5 cm~174.5 cm之间的人数有300×24%=72(人).
故选C.
2.【解析】解:(1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为=0.08.
又因为第二小组的频率=,
所以样本容量===150.
(2)由频率分布直方图可估计,该校高一年级学生的达标率为:
×100%=88%.用样本估计总体
第1课时
(
教学目标
)
1.通过具体实例,学生体会样本与总体的关系,体验用样本的数字特征估计总体的数字特征的可行性与必要性;提升学生的直观想象素养.
2.通过具体实例,探究分层抽样如何通过各层样本数字特征估计总体数字特征,加深对数字特征的理解;提升学生的数学运算素养.
(
教学重难点
)
教学重点:会列频率分布表,画频率分布直方图,并用样本数字特征估计总体的数字特征。
教学难点:能通过样本数字特征估计总体的数字特征.
(
课前准备
)
PPT课件.
(
教学过程
)
一、整体概览
问题1:阅读课本,回答下列问题:
(1)本课时将要研究哪类问题?
(2)本课时要研究的问题在数学中的地位是怎样的?
师生活动:学生带着问题阅读课本,老师指导学生概括总结本课时的内容.
预设的答案:(1)本节课要学的内容是用样本估计总体的第一课时,主要研究用样本的数字特征估计总体的数字特征。(2)本节课之前统计的内容,可以归结为描述统计学的范畴,主要讨论的是怎样收集、整理和分析。本课时的内容可以归结为推断统计学的范畴,主要讨论的是如何根据样本数据得到总体的信息,从而为相关的决策提供指导。本小节的重点是帮助学生理解用样本的数字特征估计总体的数字特征,体会统计思想与确定性思维的差异。
设计意图:通过本节课内容的预习,让学生明晰下一阶段的学习目标,初步搭建学习内容的框架.
二、探索新知
问题1:(1)质检部门想知道市场上节能灯的平均使用寿命,应该怎样解决?
(2)小红同学想估计高一年级学生身高的平均数和方差,你建议她如何完成?
师生活动:成立调查小组,利用业余时间进行市场调查。教师辅助完成。
预设的答案:
(1)调查一部分市场上节能灯的平均使用寿命,用样本的数字特征估计总体的数字特征;
(2)在高一年级用简单随机抽样的办法,抽取样本,算出样本的平均数和方差,估计总体的平均数和方差.
设计意图:选用学生常见的案例作为知识学习的引入,增强学生学习的兴趣。
引语:以上问题的解决就是本节课我们要研究的课题.(板书:用样本估计总体第一课时)
形成定义
问题2:以下是某高校高一年级98位学生得身高(单位:cm):
161 168 166 168 152 152 163 164 170 167 143 166 153 165
168 167 163 157 160 159 153 169 172 175 165 161 158 172
147 164 171 149 158 155 169 150 173 170 162 157 152 180
178 158 162 164 172 165 165 155 163 178 159 168 161 151
168 168 165 158 162 165 163 166 174 163 163 175 165 160
161 177 163 170 155 156 161 169 167 151 156 158 165 179
161 176 162 168 153 169 155 165 163 166 172 160 173 164
已知这组数的总体平均数为163.5,总体方差为56.3.
用简单随机抽样的方法从总体中抽取容量为10的样本3次,分别计算样本平均数与样本方差,并于总体对应的值进行比较
师生活动:学生分成3个小组,每个小组抽取容量为10的样本3次,然后用计算器计算样本平均数与样本方差,并算出相应的误差,最后将结果汇总到一起.老师组织执行
预设的答案:一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征。特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大。如果用简单随机抽样抽得的序号分别为90,35,63,68,66,9,30,56,50,49,则对应的样本为
169,169,163,175,163,170,164,151,155,165,
请你使用计算器,算出样本均值,样本方差,观察它们与总体对应的值的差别.
结果:样本均值为164.4,样本方差为45.84,发现它们与总体对应的值差别不大.
问题3:你能简单总结一下上述过程吗,在操作的过程中需要注意哪些问题.
预设的答案:如果样本的容量恰当,抽样方法又合理,在容许一定误差存在的前提下,可以用样本的数字特征估计总体的数字特征,这样能节省人力物力等.
设计意图:这个活动给学生提供了一个真正的体验估计的机会,为了更直观的让学生认识到估可能产生误差,活动环节中,请学生把误差计算出来,并将所有结果的误差用图形表示出来,以帮助学生理解.
下面我们讨论一种稍复杂一点的情况:假设样本是用分层抽样的方法得到的,而且知道每一层的数字特征,该怎样估计总体的数字特征呢?
问题4:在考察某中学的学生的平均身高时,如果采用分层抽样的方法,得到了男生身高的平均数为170,方差为16;女生身高的平均数为165,方差为25.
1.如果没有其它信息,怎样估计总体的平均数与方差?
2.如果知道抽取的样本中,男生有20人,女生有15人,怎么估计总体的平均数与方差?
师生活动:学生分成3个小组,讨论如下的解决方案,哪一个比较好,为什么?老师组织执行。
1、选择男生或者女生的平均数与方差作为总体对应值的估计;
2、取每一层样本数字特征的算术平均值作为总体的估计;
3、把各层的数据集中在一起重新计算;
4、考虑整个样本数字特征与每一层的数字特征之间的关系计算.
预设的答案:1、没有充分利用已有的数据,不够好;
2、不太理想,因为对于分层抽样来说,每一层所抽取的个体数目一般不相等;
3、没有突出分层抽样的特点;
4、以分两层抽样的情况为例.假设第一层有个数,分别为,平均数为,方差为;第二层有个数,分别为,平均数为,方差为.则
, ,
如果记样本均值为,样本方差为,则可以算出
依照上述公式可以算出,前面尝试与发现中的总体的平均数可以估计为167.86,总体的方差可以估计位25.98.
设计意图:这个活动继续第一个活动,同样给学生提供了一个真正的体验估计的机会,为了更直观的让学生认识到估可能产生误差,活动环节中,请学生把误差计算出来,并将所有结果的误差用图形表示出来,以帮助学生理解.
三、初步应用
例1 为了快速了解某学校学生体重(单位:kg)的大致情况,随机抽取了10名学生称重,得到的数据整理成茎叶图如图所示,估计这个学校学生体重的平均数和方差.
师生活动:学生自己根据所学知识尝试解答,教师给出答案。
预设的答案:将样本中的每一个数都减去50,可得
-5,-1,-3,-1,-4,-4,1,8,9,10
这组数的平均数为,
方差为
因此估计这个学校学生体重的平均数为51,方差为30.4.
设计意图:本例完整地描述出了用样本的数字特征估计总体的数字特征的过程;首先收集数据,然后用合适的形式显示样本数据,最后抽取其中的信息对总体进行预测.计算的过程中注意提醒学生其中计算方法的选择,如果计算平均数的话,因为每个数字都比较大,计算时可能容易出现错误.
四、归纳小结,布置作业
问题5:1.本节用样本的哪个数字特征估计总体的数字特征?
2.分层抽样如何通过各层样本数字特征估计总体数字特征的?
师生活动:学生尝试总结,老师适当补充.
预设的答案:1.样本的均值和方差;2.假设第一层有个数,分别为,平均数为,方差为;第二层有个数,分别为,平均数为,方差为.则
, ,
如果记样本均值为,样本方差为,则可以算出
设计意图:通过梳理本节课的内容,能让学生更加明确用样本的数字特征估计总体的数字特征。
五、目标检测设计
1.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60 m;从南方抽取了200个男孩,平均身高为1.50 m.由此可推断我国13岁男孩的平均身高为( )
A.1.57 m B.1.56 m C.1.55 m D.1.54 m
设计意图:考查学生用样本的数字特征估计总体的数字特征.
2.某创业公司共有36名职工,为了了解该公司职工的年龄构成情况,随机采访了9位代表,得到的数据分别为36、36、37、37、40、43、43、44、44,若用样本估计总体,年龄在(-s,+s)内的人数占公司人数的百分比是(其中是平均数,s为标准差,结果精确到1%)( )
A.14% B.25% C.56% D.67%
设计意图:考查学生用样本的方差与标准差估计总体的方差与标准差.
3.某高校进行自主招生,先从报名者筛选出400人参加考试,再按笔试成绩择优选出100人参加面试.现随机抽取24名笔试者的成绩,如下表所示:
分数段 [60,65) [65,70) [70,75) [75,80) [80,85) [85,90)
人数 2 3 4 5 9 1
据此估计参加面试的分数线大约是( )
A.75 B.80 C.85 D.90
设计意图:考查学生利用样本平均数值估计总体平均数.
参考答案:
1.解:∵从北方抽取了300个男孩,平均身高1.60 m;
从南方抽取了200个男孩,平均身高为1.50 m.
∴这500个13岁男孩的平均身高是=1.56
∴由此可推断我国13岁男孩的平均身高为1.56 m.
故选:B.
2.依题意,=×(36+36+37+37+40+43+43+44+44)=40,
s==,
所以年龄在(-s,+s)内的人数即在(,)的人数有5人,
故年龄在(-s,+s)内的人数占公司人数的百分比为:×100%≈56%,
故选:C.
3.解:∵=(62.5×2+67.5×3+72.5×4+77.5×5+82.5×9+87.5×1)≈76.5,
∴估计参加面试的分数线大约是80.
故选:B.