一元线性回归模型
学习目标 1.结合实例,了解两个变量之间的相关关系的含义. 2.结合具体实例,了解一元线性回归模型的概念及最小二乘法原理,掌握回归直线方程的求法.
学习活动
目标一:结合实例,了解两个变量之间的相关关系的含义. 任务1:结合实例,抽象出相互影响、相互依赖的两个变量之间的两类关系,并能区分和判断. 根据下列变量关系之间的特点,将它们分为两类: ①圆的面积S与半径r之间的关系; ②16岁学生的体重w与身高h之间的关系; ③商品销售量Q与销售价格P之间的关系; ④匀速运动的物体,其运动的路程S与时间t之间的关系. 问题: 1.上述实例中,两个变量之间是否存在明确的函数关系?若不存在,那么这两个变量之间存在怎样的关系? 2.若将上述变量之间的关系按一定的标准分为两类,如何分类 【概念讲解】 相关关系 练一练 (多选)下列关系中,属于相关关系的是( ) A.正方形的边长与面积之间的关系 B.农作物的产量与施肥量之间的关系 C.出租车费与行驶的里程 D.降雪量与交通事故的发生率之间的关系 任务2:由具体实例,了解两个变量之间的相关关系的含义. 已知某班级学生数学成绩与物理成绩的对应表如下: 问题: 1.对数据进行整理,如在保持成绩配对的方式不变的前提下,将数据按照数学成绩从小到大的顺序排列,如下表所示 由此你能得出什么结论? 2.若以数学成绩为横坐标,物理成绩为纵坐标,在平面直角坐标系中将每一对数据表示出来,如图所示: 观察图像,你能得出什么结论? 【概念讲解】 线性相关关系: 正相关: 负相关: 练一练 对某高三学生在连续9次数学测试中的成绩(单位:分)进行统计得到如图散点图.下面关于这位同学的数学成绩的分析中,正确的共有( )个 ①该同学的数学成绩总的趋势是在逐步提高 ②该同学在这连续九次测验中的最高分与最低分的差超过40分 ③该同学的数学成绩与考试次号具有线性相关性,且为正相关. A.0 B.1 C.2 D.3
目标二:结合具体实例,了解一元线性回归模型的概念及最小二乘法原理,掌握回归直线方程的求法. 任务:会用最小二乘原理求回归直线方程. 某地区从某一年开始进行了环境污染整治,得到了如下数据 (1)作出这些成对数据的散点图,判断污染指数y与x是否线性相关?如果是,判断是正相关还是负相关. (2)你能找出近似描述y与x之间关系的一次函数表达式吗?说说你的方法. (3)类似的直线有很多条,你所求得的是“最好”的直线吗?判断一条直线是否“最好”的标准是什么? 【概念讲解】 回归直线方程: 问题:(1)上述情境中,数据y与x的回归直线方程为多少? (2)根据所得到的关系式,该地区第8年的污染物指数估计是多少? 【归纳总结】 求回归直线方程的一般步骤:
学习总结
任务:根据下列关键词,构建知识导图. “相关关系”“回归直线方程”
2一元线性回归模型
学习目标 1.结合实例,了解两个变量之间的相关关系的含义. 2.结合具体实例,了解一元线性回归模型的概念及最小二乘法原理,掌握回归直线方程的求法.
学习活动
目标一:结合实例,了解两个变量之间的相关关系的含义. 任务1:结合实例,抽象出相互影响、相互依赖的两个变量之间的两类关系,并能区分和判断. 根据下列变量关系之间的特点,将它们分为两类: ①圆的面积S与半径r之间的关系; ②16岁学生的体重w与身高h之间的关系; ③商品销售量Q与销售价格P之间的关系; ④匀速运动的物体,其运动的路程S与时间t之间的关系. 问题: 1.上述实例中,两个变量之间是否存在明确的函数关系?若不存在,那么这两个变量之间存在怎样的关系? 参考答案: ①S=πr2; ②一般情况下,已知一名16岁学生的身高h,不能确定其体重w,但身高越高的人体重可能越重,不过同样身高的人体重往往存在差异; ③商品的销售价格P越低,买这种商品的人可能会越多,从而会导致销售量Q增长,但同样的销售价格可能会有不同的销售量; ④S=vt; 2.若将上述变量之间的关系按一定的标准分为两类,如何分类 参考答案: 实例①④中,当一个变量确定后,另一个变量就确定了; 实例②③中,两个变量之间确实有一定关系,但没有达到可以互相决定的程度,它们之间的关系带有一定的随机性. 因此可以将上述变量之间的关系分为两类: (1)具有确定性:如①④是明确的函数关系. (2)有一定关系,但不能互相确定: 如②③不具有明确的函数关系. 【概念讲解】 相关关系 两个变量之间有一定的关系,但没有达到可以互相决定的程度,它们之间的关系具有一定的随机性,统计学上称为相关关系. 练一练 (多选)下列关系中,属于相关关系的是( ) A.正方形的边长与面积之间的关系 B.农作物的产量与施肥量之间的关系 C.出租车费与行驶的里程 D.降雪量与交通事故的发生率之间的关系 参考答案: A中,正方形的边长与面积之间的关系是函数关系;B中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;C为确定的函数关系;D中,降雪量与交通事故的发生率之间具有相关关系. 故选BD. 任务2:由具体实例,了解两个变量之间的相关关系的含义. 已知某班级学生数学成绩与物理成绩的对应表如下: 问题: 1.对数据进行整理,如在保持成绩配对的方式不变的前提下,将数据按照数学成绩从小到大的顺序排列,如下表所示 由此你能得出什么结论? 参考答案: 结论:数学成绩增加时,物理成绩大致也增加. 2.若以数学成绩为横坐标,物理成绩为纵坐标,在平面直角坐标系中将每一对数据表示出来,如图所示: 观察图像,你能得出什么结论? 参考答案: 由图可得:数学成绩增加时,物理成绩大致也增加. 该班级学生数学成绩与物理成绩构成的点分布在直线上或直线的两侧,且都在直线附近. 因此数学成绩与物理成绩之间有相关关系的,可以近似用一次函数来描述它们之间的关系. 【概念讲解】 线性相关关系 一般地,如果收集到了变量x和变量y的n对数据(简称为成对数据),如下表所示. 序号i123…n变量xx1x2x3…xn变量yy1y2y3…yn
则在平面直角坐标系xOy中描出点(xi,yi),i=1,2,3,…,n,就可以得到这n对数据的散点图. 如果由变量的成对数据、散点图或直观经验可知,变量x与变量y之间的关系可以近似地用一次函数来刻画,则称x与y线性相关. 此时,如果一个变量增大,另一个变量大体上也增大,则称这两个变量正相关;如果一个变量增大,另一个变量大体上减少,则称这两个变量负相关. 练一练 对某高三学生在连续9次数学测试中的成绩(单位:分)进行统计得到如图散点图.下面关于这位同学的数学成绩的分析中,正确的共有( )个 ①该同学的数学成绩总的趋势是在逐步提高 ②该同学在这连续九次测验中的最高分与最低分的差超过40分 ③该同学的数学成绩与考试次号具有线性相关性,且为正相关. A.0 B.1 C.2 D.3 参考答案 根据散点图,得: ①散点图从左向右是上升的,所以该同学的数学成绩总的趋势是在逐步提高,正确; ②该同学在这连续九次测试中的最高分大于130分,最低分小于90分,极差超过40分,正确; ③该同学的数学成绩与考试次号具有比较明显的线性相关性,且为正相关,正确; 综上,正确的命题是①②③,共3个. 故选:.
目标二:结合具体实例,了解一元线性回归模型的概念及最小二乘法原理,掌握回归直线方程的求法. 任务:会用最小二乘原理求回归直线方程. 某地区从某一年开始进行了环境污染整治,得到了如下数据 (1)作出这些成对数据的散点图,判断污染指数y与x是否线性相关?如果是,判断是正相关还是负相关. 参考答案: 随时间x的增加,污染指数y大致是减少的,因此y与x线性相关,而且是负相关. (2)你能找出近似描述y与x之间关系的一次函数表达式吗?说说你的方法. 参考答案: 做一条直线使得成对数据构成的点分布在直线的附近.例如通过点(1,6)和(7,3)的直线就满足条件如图所示.由此得出所要的函数关系式 y=-0.5x+6.5. (3)类似的直线有很多条,你所求得的是“最好”的直线吗?判断一条直线是否“最好”的标准是什么? 参考答案: 由所求得的函数表达式可以算出x=1,2,3,…,7的值,也可以得到已知数据的实际值(也称为观测值)与预测值之间的误差(一般称为残差),可制作下表: 第x年1234567污染指数y6.15.24.54.73.83.43.1预测值误差
也可以用下图来表示,橙色的点就是预测值对应的点,误差的绝对值就是蓝色的点与相应的橙色的点之间的距离. 统计学意义上“最好”的直线,指的是所有误差平方和最小的直线 【概念讲解】 回归直线方程 一般地,已知变量x与y的n对成对数据(xi,yi),i=1,2,3,…,n.任意给定一个一次函数y=bx+a,对每一个已知的xi,由直线方程可以得到一个估计值 如果一次函数能使残差平方和即 取最小值,则称为y关于x的回归直线方程(对应的直线称为回归直线).因为是使得平方和最小,所以其中涉及的方法称为最小二乘法. 可以证明,给定两个变量y与x的一组数据之后,回归直线方程总是存在的,而且 其中称为回归系数.它实际上也就是回归直线方程的斜率. 问题:(1)上述情境中,数据y与x的回归直线方程为多少? (2)根据所得到的关系式,该地区第8年的污染物指数估计是多少? 参考答案: (1)由表中所给数据得,可得下表: 从而可知 , 因此 所求的y关于x的线性回归直线方程为 (2)由题意,将x=8代入回归方程 ,可得 y=-0.475×8+6.3=2.5. 所以预测第8年的污染指数2.5. 【归纳总结】 求回归直线方程的一般步骤: (1)画出散点图.从直观上分析数据间是否存在线性相关关系. (2)计算等相关数据. (3)代入公式求出中参数的值. (4)写出回归方程并对实际问题作出估计.
学习总结
任务:根据下列关键词,构建知识导图. “相关关系”“回归直线方程”
2