课程基本信息
课题
由样本估计总数及其模拟
教科书
书名:普通高中教科书
数学必修第二册出版社:人民教育出版社
出版日期:2019
年8月
教学目标
教学目标:通过数学探究活动,让学生经历数据收集、数据整理、数据分析以及统计推断的完整过程.教学重点:三种利用编号样本估计总数的方法.教学难点:比较哪种估计方法产生的误差较小.
教学过程
时间
教学环节
主要师生活动
1分钟
提出研究问题
教师介绍本次数学探究活动的研究背景.并提出本次活动的研究问题.日常生活中,为了方便管理,人们经常会对人或物进行编号有时需要进行连续编号(即编号为001,002,003,……).知道连续编号的最大值就能方便知道总数是多少.在很多情况下,得到最大的编号并不容易,但可以得到一些编号的样本.此时,能不能根据编号样本的信息,利用有关统计的知识,估计出人和物的总数呢?
4分钟
收集数据整理数据
某小组的同学为了调查小黄车的总量,收集了一些小黄车的编号.
每辆小黄车都有唯一的二维码和编号与之对应(如图所示),假设编号的前四位是分类编号,后六位是连续编号,小黄车的停放位置是随机的.
他们收集的样本数据,按照后六位从小到大的顺序排列如下:8641154586
8650202964
8641216344
86412230438641228556
8653289157
8653295913
86503148178650399914
8650402206
8650405355
86504077018650413222
8641423105
8641425647
86414335228650545469
8650585197
8650695935
86506996008650735402
8641776103
8651798187
86517989718651810807
8651813331
8641815866
86518235858651828537
8651838735
8651841183
86518437098651846927
8651848451
8651848586利用已有的样本数据,如何估计小黄车的总量呢?甲同学提出:可以用样本数据的最大值来估计小黄车的总量,因为样本数据的最大值小于等于小黄车的总量.乙同学认为,样本数据中恰好取到连续编号的最大值的概率很小,而样本的均值与总体的均值相差不大,所以可以利用样本均值约等于总体均值,去估计小黄车的总量.教师提问:有没有其它的估计方法?哪种方法的估计结果更接近于真实值?
10分钟
数据分析
教师讲解二战期间的真实案例,并带领学生对比三种模拟方法.第二次世界大战期间,德军生产的坦克是连续编号的,盟军从战场上缴获了一些德军坦克,因此获得了一些坦克编号,盟军希望能根据这些样本数据估计出德军所生产的坦克数量.后来统计学家圆满地解决了这一问题.随着战争的进行盟军缴获了一些坦克,截止到1942年6月,盟军缴获的所有坦克的编号为:
2,113,73,160,204,65,286
统计学家的估计方法:将
2,113,73,160,204,65,286
看成在序列0,1,2
,n中随机取的数,则可以认为,这些取得的数是“均匀”分布在序列中的.考虑到一共取了7个数,因此每两个数之间的平均距离是,样本之间的平均距离是,,德军生产的坦克数量为n=327辆.按照甲同学提出的最大值估计:德军生产的坦克数量为286辆.按照乙同学提出的平均值估计:德军生产的坦克数量为257辆.通过用样本均值去估计总体均值的方法,估计出来的坦克共有257辆,但缴获的坦克中已经有编号286了,显然将坦克的总量估计为257是不合理的.此时,我们可以将坦克数量估计为286辆.1940年6月,根据材料显示,当时盟军缴获的坦克的编号分别为:2,1131941年6月,盟军缴获的所有坦克的编号为:2,113,73,160,204按照上述三种方法给出的坦克数量估计值汇总如下:年份最大值估计平均数估计统计学家的估计真实值情报数据1940年6月11311416912210001941年6月20422024427115501942年6月2862863273421550从上述表格中,我们可以明显地看到,不管是两位同学提出的最大值估计法,平均值估计法还是统计学家进行的估计,最终得到的结果都比情报数据更接近真实数据.从中我们可以统计方法的威力.
4分钟
计算机模拟
教师带领学生进行计算机模拟,计算三种估计方法的误差.现在我们已经知道了事实上德军生产的坦克总量,那么我们就可以利用计算机模拟的方法,得到较多的样本数据,进而比较三种估计方法的误差大小.以1940年6月为例,德军实际生产的坦克是122辆.在Excel中设定总数122,然后用随机数函RANDBETWEEN产生一些编号样本,为了对比三种估计方法,哪种方法的估计结果更接近122,可以多模拟产生几组样本数据.按照前面提到的三种估计方法,通过每组样本数据得到的估计如下表所示:最大值估计112116102平均数估计139121105“均匀分布”118122107真实值122122122整体来看,将样本数据看成在序列0,1,2
,n中随机取的数.进而认为,这些取得的数是“均匀”分布在序列中的.这种估计方法产生的误差较小.
1分钟
统计推断
让我们回到小黄车的实际案例中,通过前面的分析,相信同学们对最初提出的两个问题都有了答案,请同学们课后按照所给的《由样本编号估计总数活动记录表》做进一步的整理和完善.
1分钟
布置作业
请与其它同学分工合作,寻找生活中有连续编号的实例,获取适当容量的编号样本,结合本节课所学知识,给出总数的一个估计.