高中数学必修三知识讲解,巩固练习(复习补习,期末复习资料):13【提高】线性回归方程

文档属性

名称 高中数学必修三知识讲解,巩固练习(复习补习,期末复习资料):13【提高】线性回归方程
格式 zip
文件大小 481.5KB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2019-07-18 11:00:48

图片预览

文档简介

变量的相关性
【学习目标】
1.明确两个变量具有相关关系的意义;
2.知道回归分析的意义;
3.知道回归直线、回归直线方程、线性回归分析的意义;
4.掌握对两个变量进行线性回归的方法和步骤,并能借助科学计算器确定实际问题中两个变量间的回归直线方程;
【要点梳理】
要点一、变量之间的相关关系
变量与变量之间存在着两种关系:一种是函数关系,另一种是相关关系。
1.函数关系
函数关系是一种确定性关系,如y=kx+b,变量取的每一个值,都有唯一确定的值和它相对应。
2.相关关系
变量间确定存在关系,但又不具备函数关系所要求的确定性
相关关系分为两种:
正相关和负相关
要点诠释:
对相关关系的理解应当注意以下几点:
(1)相关关系与函数关系不同.因为函数关系是一种非常确定的关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.而函数关系可以看成是两个非随机变量之间的关系.因此,不能把相关关系等同于函数关系.
(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系.然而,学会新词并不能使脚变大,而是涉及到第三个因素——年龄.当儿童长大一些,他们的阅读能力会提高而且由于长大脚也变大.
(3)函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化.例如正方形面积S与其边长x间虽然是一种确定性关系,但在每次测量边长时,由于测量误差等原因,其数值大小又表现出一种随机性.而对于具有线性关系的两个变量来说,当求得其回归直线后,我们又可以用一种确定性的关系对这两个变量间的关系进行估计.
3.散点图
将收集到的两个变量的统计数据分别作为横、纵坐标,在直角坐标系中描点,这样的图叫做散点图。通过散点图可初步判断两个变量之间是否具有相关关系,她反映了各数据的密切程度。
要点二、正相关、负相关
(1)正相关:在统计数据中的两个变量,一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关。如:家庭年收入越高,年饮食支出越高。反映在散点图上它们散布在从左下角到右上角的区域,按表中所列数据制作散点图如图
A
0
5
10
15
20
25
30
35
B
541.67
602.66
670.09
704.99
806.71
908.59
975.42
1034.75
/
(2)负相关:如果两个变量中,一个变量的值由小到大变化时,另一个变量的值由大到小变化,那么这种相关称为负相关。在散点图中,对应数据的位置为从左上角到右下角的区域。按表中所列数据制作的散点图如图。
C
5
8
16
18
28
30
35
D
64
56
50
42
37
32
21
/
(3)无相关关系:如果关于两个变量统计数据的散点图如下图所示,那么这两个变量之间不具有相关关系。例如,学生的身高与学生的学习成绩没有相关关系。
/
要点诠释:
利用散点图可以大致判断两个变量之间有无相关关系。
要点三、线性回归方程
1.回归直线方程
(1)回归直线:观察散点图的特征,发现各个大致分布在通过散点图中心的一条直线附近。如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线。求出的回归直线方程简称回归方程。
2.回归直线方程的求法
设与个观测点()最接近的直线方程为,其中a、b是待定系数.
则 .于是得到各个偏差
.
显见,偏差的符号有正有负,若将它们相加会造成相互抵消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故采用n个偏差的平方和.
表示n个点与相应直线在整体上的接近程度.
记.
上述式子展开后,是一个关于a、b的二次多项式,应用配方法,可求出使Q为最小值时的a、b的值.即
, ,
相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析 /
上述求回归直线的方法是使得样本数据的点到回归直线的距离的平方和最小的方法,叫做最小二乘法。
要点诠释:
1.对回归直线方程只要求会运用它进行具体计算a、b,求出回归直线方程即可.不要求掌握回归直线方程的推导过程.
2.求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实标意义.否则,求出的回归直线方程毫无意义.因此,对一组数据作线性回归分析时,应先看其散点图是否成线性.
3.求回归直线方程,关键在于正确地求出系数a、b,由于求a、b的计算量较大,计算时仔细谨慎、分层进行,避免因计算产生失误.
4.回归直线方程在现实生活与生产中有广泛的应用.应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并对情况进行估测、补充.因此,学过回归直线方程以后,应增强学生应用回归直线方程解决相关实际问题的意识.
【典型例题】
类型一:变量间的相关关系与函数关系
例1.下列两个变量之间的关系中,不是函数关系的是( )
A.角度和它的余弦值 B.正方形的边长和面积
C.正n边形的边数和其内角度数之和 D.人的年龄和身高
【答案】D
【解析】 函数关系是一种确定的关系。而相关关系是非确定性关系。选项A、B、C都是函数关系,可以写出它们的函数表达式:,,,选项D不是函数关系,在相同年龄的人群中,仍可以有不同身高的人,故选D.
【总结升华】 本题考查非数据型两个变量的相关性判断.要根据两个变量之间是否具有确定性关系及因素关系进行判断.
举一反三:
【变式1】下列图形中具有相关关系的两个变量是( )
/
【答案】 C
【解析】A、B中显然任给一个x都有唯一确定的y值和它对应,是函数关系;C中从散点图可看出所有点看上去都在某条直线附近波动,具有相关关系,因此变量间是不相关的。
【变式2】下列关系是相关关系的是________(填序号).
①人的年龄与他拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系;⑤学生与其学号之间的关系.
【答案】①③④
例2.某小卖部为了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶杯数与当天气温的对比表。
气温x/℃
26
18
13
10
4
-1
杯数y
20
24
34
39
50
64
请画出散点图,并判断它们是否有相关关系。
【解析】 散点图如下图:
/
从图中发现气温与杯数之间具有相关关系,当气温的值由小到大变化时杯数值由大变小,所以气温和杯数成负相关。
【总结升华】画出散点图可帮助分析变量间是否具有相关关系,但不是唯一的判断途径。
举一反三:
【变式1】下表是某地的年降雨量与年平均气温,判断两者是相关关系吗?求回归直线方程有意义吗?
年平均气温(℃)
12.51
12.74
12.74
13.69
13.33
12.84
13.05
年降雨量(mm)
748
542
507
813
574
701
432
【解析】 以x轴为年平均气温,y轴为年降雨量,可得相应的散点图如下图所示。
/
因为图中各点并不在一条直线的附近,所以两者不具有相关关系,求回归直线方程是没有意义的。
【总结升华】用回归直线进行拟合两变量关系的一般步骤为:
①作出散点图,判断各点是否散布在一条直线附近。
②如果各点散布在一条直线附近,那么可用公式求出线性回归方程;如果各点不在一条直线附近,那么求出的回归直线方程没有意义。
类型二:回归直线方程的求解
例3.(2017秋 甘肃凉州区月考)某工厂对某产品的产量与成本的资料分析后有如下数据:
产量x(千件)
2
3
5
6
成本y(元)
7
8
9
12
(1)画出散点图;
(2)求成本y与产量x之间的线性回归方程;
(3)当成本为15万元时,试估计产量为多少件?(保留两位小数)
(,)
【思路点拨】(1)在坐标系中描出相应的点,即可得到所要的三点图
(2)求线性回归直线方程要先求出均值,再由公式求a、b的值,写出回归直线方程;
(3)令y=15,求出x即可.
【解析】
(1)散点图如图
(2),,b=1.10
∴回归方程为y=1.10x+4.60;
(3)y=15时,y=1.10x+4.60=15,
∴x≈9.45
举一反三:
【变式1】 某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程/中的/为9.4,据此模型预报广告费用为6万元时销售额为
A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元
【答案】选B
【解析】
,回归方程为,
当时,=65.5,故选B.
【变式2】 观察两相关变量得如下数据:
x
-1
-2
-3
-4
-5
5
3
4
2
1
y
-9
-7
-5
-3
-1
1
5
3
7
9
求两变量间的回归方程.
【答案】
【解析】列表:
i
1
2
3
4
5
6
7
8
9
10
xi
-1
-2
-3
-4
-5
5
3
4
2
1
yi
-9
-7
-5
-3
-1
1
5
3
7
9
xiyi
9
14
15
12
5
5
15
12
14
9
计算得:,。
,。
∴。

∴所求回归直线方程为。
类型三:利用回归直线对总体进行估计
例4.给出了随机抽取的10位男性的收缩血压.
年龄x(岁)
收缩压y(毫米汞柱)
年龄x(岁)
收缩压y(毫米汞柱)
37
110
50
146
35
117
49
148
41
125
54
150
43
130
60
154
42
138
65
160
(1)画出散点图;
(2)求出收缩压与年龄之间的回归直线;
(3)利用所求回归直线分别预测20岁、45岁的人的收缩压是多少?
(4)就(3)所得预测结果,比较其预测的精确性。
【解析】(1)散点图为:
(2)收缩压与年龄之间的回归直线
序号
x
y
x2
xy
1
37
110
1369
4070
2
35
117
1225
4095
3
41
125
1681
5125
4
43
130
1849
5590
5
42
138
1764
5796
6
50
146
2500
7300
7
49
148
2401
7252
8
54
150
2916
8100
9
60
154
3600
9240
10
65
160
4225
10400
求和
476
1378
23530
66968
列表:
所以y对x的回归直线方程为:
(3)根据所求的回归直线方程可以预测20岁的收缩压为
45岁的收缩压为:毫米汞柱
(4)预测20岁的结果时,20是外推的,所以不是很精确;而45是内插值,所以精确性比20的预测结果要好。
【总结升华】只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.

举一反三:
【变式1】(2018春 成都龙泉驿区期中)已知x,y的一组数据如下表
x
2
3
4
5
6
y
3
4
6
8
9
则由表中的数据算得的线性回归方程可能是( )
A.y=2x+2 B.y=2x-1 C. D.
【答案】D
【解析】由题意,,,
代入线性回归方程,可得D满足.
故选:D
【变式2】下表是某地搜集到的新房屋的销售价格y,(单位:万元)和房屋的面积x(单位:m。)的数据:
x
115
110
80
135
105
y
44.8
41.6
38.4
49.2
42
(1)画出散点图;
(2)求回归方程;
(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格.
【解析】据已知样本数据得到回归直线方程后,即得到两个变量之间相关关系的一个规律,因此可将给定的x值代入回归直线方程预测y值.
(1)散点图如下图所示.
/
(2)由散点图可以看出,这些点大致分布在一条直线的附近,可求回归方程.由表中的数据,用计算器计算得,,,.
则,
.故所求回归方程为.
(3)根据上面求得的回归方程,当房屋面积为1500时,销售价格的估计值为0.196×150+21.836=51.236(万元).
【巩固练习】
1.下列所给出的两个变量之间存在相关关系的是( ).
A.学生的座号与数学成绩
B.学生的学号与身高
C.曲线上的点与该点的坐标之间的关系
D.学生的身高与体重
2.下列各图中所示两个变量具有相关关系的是( ).
/
A.①② B.①③ C.②④ D.②③
3.一位母亲记录了她儿子3岁到9岁的身高,建立了儿子身高 (单位:cm)与年龄的回归方程为,用这个方程预测儿子10岁时的身高,则下面的叙述正确的是( ).
A.她儿子10岁时的身高一定是145.83 cm
B.她儿子10岁时的身高在145.83 cm以上
C.她儿子10岁时的身高在145.83 cm左右
D.她儿子10岁时的身高在145.83 cm以下
4.对变量x,y,有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( ).
/
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
5.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),表示变量Y与X之间的线性相关系数,表示变量V与U之间的线性相关系数,则(  )
A./ B./ C./ D./
6.(2018秋 黑龙江齐齐哈尔期中)废品率x%和每吨生铁成本y(元)之间的回归直线方程为,这表明( )
A.y与x的相关系数为2
B.y与x的关系是函数关系
C.废品率每增加1%,生铁成本每吨大约增加2元
D.废品率每增加1%,生铁成本大约增加258元
7.已知x与y之间的一组数据:
x
0
1
2
3
y
1
3
5
7
则y与x的线性回归方程为必过( )
A.(2,2)点 B.(1.5,0)点 C.(1,2)点 D.(1.5,4)点
8.为了考察两个变量x和y之间的线性关系,甲、乙两位同学各自独立做了10次和15次试验,并且利用线性回归方法求得回归直线分别为1、2,已知两人得到的试验数据中,变量x和y的数据的平均值都相等,且分别都是s、t,那么下列说法正确的是( ).
A.直线1和2一定有公共点(s,t)
B.直线1和2相交,但交点不一定是(s,t)
C.必有直线1∥2
D.1和2必定重合
9.经实验得(x,y)的四个值,即(1,2),(2,3),(3,4),(4,5).y与x之间的回归直线方程是______.
10.回归分析是处理变量之间的________关系的一种统计方法.两个变量之间具有线性相关关系时,称相应的回归分析为________.
11.(2018 北京)高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级的排名情况如图所示,甲、乙、丙为该班三位学生.
/
从这次考试成绩看,
①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是________;
②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是________.
12.某农场粮食产量的统计结果如图所示,从图中我们可以看到前年的粮食总产量与之间的关系。则从目前的统计结果来看,前 年的年平均粮食产量最高。
13.假设学生在七年级和八年级数学成绩是线性相关的,若10个学生七年级(x)和八年级(y)数学分数如下:
x
74
71
72
68
76
73
67
70
65
74
y
76
75
71
70
76
79
65
77
62
72
试求七年级和八年级数学分数间的回归直线方程.
14.(2018秋 广东越秀区月考)某种产品的广告费支出x与销售额y(单位:万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
60
50
70
(Ⅰ)画出散点图;
(Ⅱ)求回归直线方程;(参考数据:,,)
(Ⅲ)试预测广告费支出为10万元时,销售额多大?
【答案与解析】
1.【答案】D
【解析】 A与B中的两个变量之间没有任何关系;C中的两个变量之间具有函数关系.故选D.
2.【答案】D
【解析】具有相关关系的两个变量的数据所对应的图形是散点图,②③能反映两个变量的变化规律,它们之间是相关关系.故选D.
3.【答案】C
【解析】利用回归方程进行预测,只能说身高在某一预测值附近.由回归方程预测儿子10岁时的身高(cm).故选C.
4.【答案】C
【解析】由这两个散点图可以判断,变量x与y负相关,u与v正相关.故选C.
5.【答案】C
【解析】画散点图,由散点图可知X与Y正相关,则相关系数U与V是负相关,相关系数,故选C.
6.【答案】C
【解析】由废品率x%和每吨生铁成本y(元)之间的回归直线方程为,
的x增加1时,,
可知废品率每增加1%,生铁成本每吨大约增加2元.
故选:C.
7.【答案】D
【解析】本题考查的是回归直线方程经过样本的中心(点,,在本题中,样本中心为(1.5,4),所以直线过(1.5,4)点.
8.【答案】A
【解析】 线性回归直线方程为,而,即,.∴(s,t)在回归直线上.∴直线1和2一定有公共点(s,t).
9.【答案】
【解析】 四个点的坐标适合方程x+1=y,所以回归直线方程.
10.【答案】相关 线性回归分析
【解析】了解回归分析是怎么回事,它的作用是什么.就可求解.
11.【答案】乙;数学.
【解析】由高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级的排名情况的散点图可知
①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 乙;
②观察散点图,作出对角线y=x,发现丙的坐标横坐标大于纵坐标,说明数学成绩的名次小于总成绩名次,所以在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是数学;
故答案为:乙;数学.
12.【答案】3
13.【答案】
【解析】因为,,,,
所以,.
所以回归直线方程是.
14.【答案】(Ⅰ)如图;(Ⅱ);(Ⅲ)82.5万元
【解析】(Ⅰ)根据表中所列数据可得散点图如下:
/
(Ⅱ)∵,.
,,
∴,
=50-6.5×5=17.5,
因此,所求回归直线方程为:;
(Ⅲ)由上面求得的回归直线方程,当广告费支出为10万元时,
(万元)
即这种产品的销售收入大约为82.5万元.