课件20张PPT。3.1回归分析的基本思想及其初步应用
(第1课时)身高y与脚印长度x的回归方程:问题1:生活中常见两个变量的关系有哪些呢?常见两个变量的关系相关关系
(非确定性关系)函数关系
(确定性关系)线性相关非线性相关正相关负相关问题2:研究线性相关的两个变量的基本步骤是什么?画散点图
求回归直线方程
用回归直线方程进行预报问题3:求线性回归直线的基本方法是 ___________最小二乘法例1从某大学中随机选取8名女大学生,其身高和体重数据如下表求根据女大学生的身高预报体重的回归方程,并预报一名身高为172cm的女大学生的体重.解:取身高为自变量x,真实体重为因变量y , 作散点图根据公式可得回归方程为所以,对于身高172cm的女大学生,由回归方程可以得到预报其体重样本点散布在回归直线附近用y=bx+a+e表示身高和体重的关系探究:身高为172cm的女大学生的体重一定是60.316㎏?如果不是,其原因是什么?a和b为模型的未知参数
e是y与随机误差线性回归模型X为解释变量,y为预报变量思考:产生随机误差e的原因是什么?(1)一个人的体重值除了受身高的影响外,还受_______________________因素的影响。(2)线性模型只是近似模型饮食、运动、度量、遗传等探究:在线性回归模型中,e为用bx+a的预报真实值y的随机误差,它是一个不可观测的量,那么应该怎样研究随机误差?估计值为称为相应于点 的残差女大学生身高体重原始数据和相应的残差数据表2.残差图可以通过残差发现原始数据中的可疑数据,判断所建立模型的拟合程度.(研究残差的意义)作图时以纵坐标为残差,横坐标为样本的编号、身高数据、体重的估计值等.通过残差表或残差图判断模型的拟合效果是直观判断,如何精确判断模型的拟合效果?引入相关指数R2来精确刻画模型拟合效果残差平方和越小,R2越大,说明模型拟合效果越好。例1中, 说明“女大学生的身高解释了64%的体重变化”或“女大学生体重差异有64%是由身高引起的”。残差平方和总偏差平方和用身高预报体重时,需要注意下列问题:1.回归方程只适用于我们所研究的样本总体;2.回归方程一般都有时间性;3.回归方程的适用范围受样本的取值范围影响;4.回归方程的预报值是近似值,是预报变量的可能取值的平均值。思考:用 来预报我们的身高时产生误差较大的原因是什么?1.判一判(正确的打“√”,错误的打“×”)
(1)残差平方和越小,线性回归方程的拟合效果越好. ( )
(2)在画两个变量的散点图时,预报变量在x轴上,解释变量在y轴上. ( )
(3)R2越接近于1,线性回归方程的拟合效果越好. ( )√×√例2.已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:(1)求y对x的回归直线方程;
(2)计算R2,并说明回归模型拟合效果的好坏.
(2)请试着作出对应的残差图(1)选变量
确定研究对象,明确解释变量、预报变量。(2)画散点图
画出散点图,观察它们之间的关系(3)选模型
由经验确定回归方程的类型(4)求参数
按一定规则(如最小二乘法)估计回归方程中的参数.(5)分析与预测
得出结果后分析残差图是否有异常.若存在异常,
则检查数据是否有误,或模型是否合适等.建立回归模型的基本步骤:回归分析基本思想及其初步应用基本思想实际应用回归分析相关性方法分析回归优劣分析残差表、残差图残差平方和课堂小结相关指数