2021_2022学年高中数学第一章统计案例教案(2份打包)新人教A版选修1_2

文档属性

名称 2021_2022学年高中数学第一章统计案例教案(2份打包)新人教A版选修1_2
格式 zip
文件大小 451.5KB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2021-07-26 21:26:33

文档简介

第一章
统计案例
1.1回归分析的基本思想及其初步应用(一)
第一课时
教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.
指数和残差分析.
教学难点:解释残差变量的含义,了解偏差平方和分解的思想.
教学过程:
一、复习准备:
1.
提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?
2.
复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系.
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据作散点图求回归直线方程利用方程进行预报.[]
二、讲授新课:
1.
教学例题:

例1
从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:
编 号
 1
 2
 3[]
 4
 5[]
 6
 7
 8
身高/cm
165
165
157
170
175
165
155
170
体重/kg
48
57
50
54
64
61
43
59
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重.
(分析思路教师演示学生整理)
[]
[]
 第一步:作散点图
第二步:求回归方程
第三步:代值计算[]

提问:身高为172cm的女大学生的体重一定是60.316kg吗?
不一定,但一般可以认为她的体重在60.316kg左右.

解释线性回归模型与一次函数的不同[]
事实上,观察上述散点图,我们可以发现女大学生的体重和身高之间的关系并不能用一次函数来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系).
在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同.
这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果(即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型,其中残差变量中包含体重不能由身高的线性函数解释的所有部分.
当残差变量恒等于0时,线性回归模型就变成一次函数模型.
因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.
2.
相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.
3.
小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.
1.1回归分析的基本思想及其初步应用(二)
第二课时
教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.
教学重点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.
教学难点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.
教学过程:[]
一、复习准备:
1.由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响.
2.为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.
二、讲授新课:
1.教学总偏差平方和、残差平方和、回归平方和:
(1)总偏差平方和:所有单个样本值与样本均值差的平方和,即.
残差平方和:回归值与样本值差的平方和,即.
回归平方和:相应回归值与样本均值差的平方和,即.
(2)学习要领:①注意、、的区别;②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和,即;③当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;④对于多个不同的模型,我们还可以引入相关指数来刻画回归的效果,它表示解释变量对预报变量变化的贡献率.
的值越大,说明残差平方和越小,也就是说模型拟合的效果越好.[][]
2.
教学例题:
例2
关于与有如下数据:
  
  2
  4
  5
  6
  8
  
  30
  40
  60
  50[]
  70[]
为了对、两个变量进行统计分析,现有以下两种线性模型:
,,试比较哪一个模型拟合的效果更好.
分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论.
(答案:

,84.5%>82%,所以甲选用的模型拟合效果较好.)
3.
小结:分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏.
1.1回归分析的基本思想及其初步应用(三)
第三课时
教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.
教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法.
教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较.
教学过程:
一、复习准备:
1.
给出例3:一只红铃虫的产卵数和温度有关,现收集了7组观测数据列于下表中,试建立与之间的回归方程.[]
温度
 21
 23
 25
 27[]
 29[]
 32
 35
产卵数个
 7
 11
 21[]
 24
 66
 115
 325
(学生描述步骤,教师演示)
2.
讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系.
二、讲授新课:
1.
探究非线性回归方程的确定:

如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模.

根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y=的周围(其中是待定的参数),故可用指数函数模型来拟合这两个变量.

在上式两边取对数,得,再令,则,而与间的关系如下:
X
 21[]
 23
 25
 27
 29
 32
 35
z
1.946
2.398
3.045
3.178
4.190
4.745
5.784
观察与的散点图,可以发现变换后样本点分布在一条直线的附近,因此可以用线性回归方程来拟合.

利用计算器算得,与间的线性回归方程为,因此红铃虫的产卵数对温度的非线性回归方程为.

利用回归方程探究非线性回归问题,可按“作散点图建模确定方程”这三个步骤进行.
其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题.
2.
小结:用回归方程探究非线性回归问题的方法、步骤.
三、巩固练习:
为了研究某种细菌随时间x变化,繁殖的个数,收集数据如下:
天数x/天
1
2
3
4
5
6
繁殖个数y/个[]
6
12
25
49
95[]
190
(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图;
(2)试求出预报变量对解释变量的回归方程.(答案:所求非线性回归方程为.)
1.1回归分析的基本思想及其初步应用(四)
第四课时
教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.[]
教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法,了解可用残差分析的方法,比较两种模型的拟合效果.
教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较.
教学过程:
一、复习准备:
1.
提问:在例3中,观察散点图,我们选择用指数函数模型来拟合红铃虫的产卵数和温度间的关系,还可用其它函数模型来拟合吗?
441
529
625
729
841
1024
1225
7
11
21[]
24[]
66
115
325
2.
讨论:能用二次函数模型来拟合上述两个变量间的关系吗?(令,则,此时与间的关系如下:
观察与的散点图,可以发现样本点并不分布在一条直线的周围,因此不宜用线性回归方程来拟合它,即不宜用二次曲线来拟合与之间的关系.
)小结:也就是说,我们可以通过观察变换后的散点图来判断能否用此种模型来拟合.
事实上,除了观察散点图以外,我们也可先求出函数模型,然后利用残差分析的方法来比较模型的好坏.
二、讲授新课:
1.
教学残差分析:

残差:样本值与回归值的差叫残差,即.

残差分析:通过残差来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析.

残差图:以残差为横坐标,以样本编号,或身高数据,或体重估计值等为横坐标,作出的图形称为残差图.
观察残差图,如果残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,模型拟合精度越高,回归方程的预报精度越高.
2.
例3中的残差分析:
计算两种模型下的残差
一般情况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反),故通过比较两个模型的残差的平方和的大小来判断模型的拟合效果.
残差平方和越小的模型,拟合的效果越好.
  由于两种模型下的残差平方和分别为1450.673和15448.
432,故选用指数函数模型的拟合效果远远优于选用二次函数模型.
(当然,还可用相关指数刻画回归效果)
3.
小结:残差分析的步骤、作用
三、巩固练习:练习:教材P13 第1题[]
PAGE
-
7
-§1.2独立性检验的基本思想及其应用
【学情分析】:
在实际的问题中,经常会面临需要推断的问题,比如研制一种新药,需要推断此药是否有效?有人怀疑吸烟的人更容易患肺癌,那么吸烟是否与患肺癌有关呢?等等。在对类似的问题作出推断时,我们不能仅凭主观意愿作出结论,需要通过试验来收集数据,并依据独立性检验的原理作出合理的分析推断.在本节的学习中,通过案例分析,使学生学会用假设检验的思想方法解决对于两个分类变量是否有关系的判断问题,并理解统计思维与确定性思维的差异。
【教学目标】:
(1)知识与技能:
理解分类变量的含义;会根据收集的数据列出2×2列联表,并会阅读三维柱形图和二维条形图,并粗略判断两个分类变量是否有关系;理解假设检验思想,会利用独立性检验精确判断两个分类变量是否有关系;
(2)过程与方法:
利用学生身边熟悉的问题引入分类变量是否相关的问题;运用统计学解决问题的一般思路引导学生;让学生经历假设检验思想的形成及运用过程,领会分析、总结的方法;
(3)情感态度与价值观:
通过提供适当的情境资料,吸引学生的注意力,激发学生的学习兴趣;在合作讨论中学会交流与合作,启迪思维,提高创新能力;通过实际问题的解决和从不同角度对问题的解决,可提高学生应用数学能力。
【教学重点】:
理解独立性检验的基本思想及实施步骤。
【教学难点】:.
(1)了解独立性检验的基本思想;
(2)了解随机变量的含义,太大认为两个分类变量是有关系的。
【课前准备】:
课件
【教学过程设计】:
教学环节
教学活动
设计意图
一、问题引入
介绍分类变量的概念:变量的不同”值”表示个体所属的不同类别,如性别变量男女,是否吸烟,宗教信仰,国籍等.2.
在日常生活中,我们关心两个分类变量之间是否有关系,如:吸烟是否与患肺癌有关?引例.为调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965那么吸烟是否对患肺癌有影响?
为探索新知识做准备.
二、探究新知
教师引导:统计学中一般采取什么方式手段研究分析解决问题?
如何运用统计学的方法进行分析判断?学生探究:1.利用频率分布表判断;不患肺癌患肺癌总计不吸烟
99.46%
0.54%1吸烟97.72%2.28%1由患肺癌在吸烟者与不吸烟者中的频率差异可粗略估计吸烟对患肺癌有影响;利用统计图直观判断(1)
通过三维柱形图判断两个分类变量是否有关系:由图中能清晰看出各个频数的相对大小,
由患肺癌在吸烟者与不吸烟者中的相对频数差异可粗略估计吸烟对患肺癌有影响;(2)
通过二维条形图判断两个分类变量是否有关系:作出患肺癌在吸烟者与不吸烟者中的的频率条形图由图中可看出,吸烟者中患肺癌的比例高于不吸烟者中患肺癌的比例,
可估计吸烟对患肺癌有影响.教师引导:上面通过分析数据和图形,得到的直观印象是吸烟和患肺癌有关,那么事实是否如此呢?并且能够以多大的把握认为”吸烟与患肺癌有关”?能否用统计学观点进一步考察这个问题.师生共同探究:为研究的一般性,在列联表中用字母代替数字不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d师:若假设吸烟与患肺癌两个变量没有关系,则应得到什么结论?生:在吸烟者中患肺癌的比例约等于不吸烟者中患肺癌的比例,即a/a+b≈c/c+d
a(c+d)

c(a+b)
ad
-bc

0师:若计算ad
–bc的结果,由此可以初步得出什么结论?生:︱ad
–bc︱越小,说明吸烟与患肺癌之间关系越弱;
︱ad
–bc︱越大,说明吸烟与患肺癌之间关系越强.师:为使不同的样本容量的数据有统一的评判标准,可构造一个随机变量
其中
为样本容量若假设成立,应该很小;若很大,说明假设不成立,即两变量有关系.
利用上述公式,可计算出问题中的的观测值为同学们肯定会提出同一问题:那么这个值是不是很大?怎样才算很大?在假设成立的情况下,统计学家估算出如下的概率:现在的观测值56.632远大于6.635,即假设成立的概率为0.01,是小概率事件,也就是假设不合理的程度约为99%,,因此可以下结论:有99%的把握认为“吸烟与患肺癌有关系”。这就是两个分类变量独立性检验的基本思想,可以表述为:当
很大时,就认为两个变量有关系;否则就认为没有充分的证据显示两个变量有关系。师:类比反证法的原理,你能否总结出独立性检验的基本步骤?生:(1)假设两个分类变量与无关系;(2)计算出的观测值;(3)把k的值与临界值比较确定与有关的程度或无关。
鼓励学生自己寻找研究问题的一般统计学的方法
通过图表的方法,使学生巩固统计学中一般研究问题的基本思路。利用独立事件同时发生的概率公式启发学生做出假设采用类比的方法,便于学生理解假设检验的思想
三、形成方法
方法总结:要推断“X与Y有关系”成立的可能性的方法:1、通过三维柱形图和二维条形图粗略判断两个分类变量是否有关系,
(1)
︱ad
-bc︱
(2)
a/a+b≈c/c+d
2、利用独立性检验精确判断两个分类变量是否有关系(1)假设无关
(2)求k值
(3)下结论
培养学生归纳的能力
四、练习巩固
1、在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上两个柱形高度的乘积相差越大,两个变量有关系的可能性就(
A
)A.越大
B.越小
C.无关系
D.无法确定2、对于2×2列联表,在二维条形图中,两个比例的值相差越大,则“与有关系”的可能性
越大
。3、为了调查高中生的数学成绩和物理成绩的关系,在某校随机抽取部分学生做调查,得到下列两份图表根据以上图表,列出相应的列联表,根据图形回答,数学成绩好坏与物理成绩好坏
关系。解:列联表如下:物理好物理差合计数学好80120200数学差7030100合计150150300根据图形,可知数学成绩好坏与物理成绩好坏

关系。
巩固知识,培养技能.
五、小结
判断两个分类变量是否有关的方法1、通过三维柱形图和二维条形图粗略判断两个分类变量是否有关系,
(1)
︱ad
-bc︱
(2)
a/a+b≈c/c+d
2、利用独立性检验精确判断两个分类变量是否有关系(1)假设无关
(2)求k值
(3)下结论
反思归纳
六、作业
P21
习题1.2
1
,
21为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:患病未患病总计服用药104555未服用药203050总计3075105请问有多大把握认为药物有效?2、通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表:女男总计读营养说明162844不读营养说明20828总计363672请问性别和读营养说明之间在多大程度上有关系?
同步练习与测试:
(基础题)
1、根据下表计算:
不看电视
看电视

37
85

35
143
计算随机变量的观测值k=

解:把表格补充完整
不看电视
看电视
总计

37
85
122

35
143
178
总计
72
228
300
4.51
2、独立性检验常作的图形是


答案
:三维柱形图
,二维条形图
3、两个临界值为3.841与6.635。当时,认为事件A与B是
(填“有关的”或“无关的”);当时,有99%的把握说事件A与B是
(填“有关的”或“无关的”)。
答案:无关的
,有关的
4、用统计量进行独立性检验时使用的表称为
,要求表中的四个数据大于

答案:列联表
,5
(中等题)
5、设A为一随机事件,则下列式子中不正确的是()
A.
B.
C.
D.
答案:选C
6、统计假设成立时,有以下判断:
其中真命题个数是(

A.1
B.2
C.3
D.4
答案:选C
7、设事件A与B相互独立,则(1)和B相互独立;(2)和A相互独立;(3)和相互独立,其中真命题是(

A.(1)(2)
B.(1)(3)
C.(2)(3)
D.(1)(2)(3)
答案:选D
患肺癌
比例
不患肺癌
比例
不吸烟
吸烟
PAGE
-
1
-