统计案例

文档属性

名称 统计案例
格式 rar
文件大小 609.2KB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2010-07-22 16:44:00

文档简介

§3.1 回归分析的基本思想及其应用(1)
湖南省郴州市桂阳县第三中学 吴付兵
教学目标
(1)通过实例引入线性回归模型,感受产生随机误差的原因;
(2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法;
(3)能求出简单实际问题的线性回归方程.
教学重点,难点
线性回归模型的建立和线性回归系数的最佳估计值的探求方法.
教学过程
引言:我们知道函数关系是一种确定性关系,而相关关系是一种非确定性关系。回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。在《数学3》中,我们对两个具有线性相关关系的变量利用回归分析的方法进行了研究,其解题步骤是:画散点图,求回归直线方程,并用回归直线方程进行预报。
二.探究一
对于一组具有线性相关关系的数据,我们知道其回归方程的截据和斜率的最小二乘估计公式为
其中,
你能推倒出这两个计算公式吗?-------教材-P80-81
《必修3》知道,截距和斜率分别是使
取最小值时,的值,
如何求的最小值?------见教材P80-81
三、问题情境
1.情景: 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示。
编号
1
2
3
4
5
6
7
8
身高/cm
165
165
157
170
175
165
155
170
体重/kg
48
57
50
54
64
61
43
59
求根据女大学生的身高预报体重的回归方程,并预报一名身高为172cm的女大学生的体重。
根据《数学(必修)》中的有关内容,解决这个问题的方法是:
先作散点图,如下图所示:
从散点图中可以看出,样本点呈条状分布,身高与体重有着较好的线性关系.因此可以用回归直线来刻画它们之间的关系.根据线性回归的系数公式,
得:
可以得到线性回归方程为,期中是回归直线的斜率的估计值,说明身高每增加1个单位时,体重就增加个单位,这表明身高与体重具有正的线性相关关系。因此,身高为172cm的女大学生,由回归方程可以预报其体重为
2.问题1:试用<必修3>所学的相关系数R分析身高与体重的相关强度。
问题2:身高为172cm的女大学生,其体重一定是吗?
四、学生活动
思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映与之间的关系,的值不能由完全确定,它们之间是统计相关关系,的实际值与估计值之间存在着误差.
探究二、身高为172cm的女大学生的体重一定是吗?如果不是,其原因是什么?
五、建构数学
实际上,身高为172cm的女大学生不一定是,但一般可以认为她的体重在左右。上图样本点与回归直线的位置也说明了这一点。
1、线性回归模型的定义:
我们将用于估计值的线性函数作为确定性函数;的实际值与估计值之间的误差记为,称之为随机误差(random error);它的均值,方差线性回归模型的完整表达式为:
说明:
(1)产生随机误差的主要原因有:
①、所用的确定性函数不恰当引起的误差;
②、忽略了某些因素的影响;本例中如:饮食习惯,是否喜欢运动,遗传等
③、存在观测误差.
(2)对于线性回归模型,我们应该考虑下面两个问题:
①、模型是否合理(这个问题在下一节课解决);
②、在模型合理的情况下,如何估计,?
2、残差分析
随机误差:
随机误差的估计值:,则为相应点()的残差
可以通过残差发现原始数据中的可疑数据,判断所建立模型的拟合效果,下表是列出女大学生身高与体重的原始数据及相应的残差数据。
六.数学运用
1、在两个变量的回归分析中,作散点图的目的是什么?
2、在回归分析中,分析残差能够帮助我们解决哪些问题?
3、如果散点图中所有的样本点都落在一条斜率为非0实数的直线上,请回答下列问题:
(1)解析变量和预报变量的关系是什么?
(2)R2是多少?
七.回顾小结:
1. 线性回归模型与确定性函数相比,它表示与之间是统计相关关系(非确定性关系)其中的随机误差提供了选择模型的准则以及在模型合理的情况下探求最佳估计值,的工具;
2. 线性回归方程中,的意义是:以为基数,每增加1个单位,相应地平均增加个单位;
3.求线性回归方程的基本步骤.
六.课外作业:第1题.
课件30张PPT。湖南省郴州市桂阳县第三中学
吴付兵数学选修2-3[人教版]思维启动3.1 回归分析的基本
思想及其应用(第一课时)产生随机误差的主要原因有:
①、忽略了某些因素的影响;
②、存在观测误差.
③、所用的确定性函数不恰当引起的误差;产生随机误差项e的原因是什么?课堂练习1、在两个变量的回归分析中,作散点图的目的是什么?
2、在回归分析中,分析残差能够帮助我们解决哪些问题?
3、如果散点图中所有的样本点都落在一条斜率为非0实数的直线上,请回答下列问题:
(1)解析变量和预报变量的关系是什么?
(2)R2是多少?课堂小结1. 线性回归模型 与确定性函数
相比,它表示y与x之间是统计相关关系(非确定性关系)其中的随机误差提供了选择模型的准则以及在模型合理的情况下探求最佳估计值 , 的工具;
2.建立回归模型的基本步骤.