苏教版数学必修3(课件53+教案+练习)2.4 线性回归方程

文档属性

名称 苏教版数学必修3(课件53+教案+练习)2.4 线性回归方程
格式 zip
文件大小 2.9MB
资源类型 教案
版本资源 苏教版
科目 数学
更新时间 2019-09-29 15:51:19

文档简介

2.4 线性回归方程
学 习 目 标
核 心 素 养
1.了解两个变量之间的相关关系并与函数关系比较.
2.会作散点图,并利用散点图判断两个变量之间是否具有线性相关关系.
3.能根据给出的线性回归方程系数公式建立线性回归方程,并能由回归方程对总体进行预测、估计.(重点、难点)
通过对已有数量的分析、运算培养学生数据分析、数学运算的核心素养.
1.变量之间的两类常见关系
在实际问题中,变量之间的常见关系有如下两类:一类是确定性函数关系,变量之间的关系可以用函数表示.另一类是相关关系,变量之间有一定的联系,但不能完全用函数表示.
2.相关关系的分类
相关关系分线性相关和非线性相关两种.
3.线性回归方程系数公式
能用直线方程=bx+a近似表示的相关关系叫做线性相关关系,该方程叫线性回归方程.给出一组数据(x1,y1),(x2,y2),…,
(xn,yn),线性回归方程中的系数a,b满足
上式还可以表示为
1.有下列关系:
①人的年龄与其拥有的财富之间的关系;
②曲线上点与该点的坐标之间的关系;
③苹果的产量与气候之间的关系;
④森林中的同一树木,其横截面直径与高度之间的关系;
⑤学生与其学号之间的关系.
其中具有相关关系的是________.
①③④ [②⑤为确定关系不是相关关系.]
2.下面四个散点图中点的分布状态,直观上判断两个变量之间具有线性相关关系的是________.
③ [散点图①中的点无规律的分布,范围很广,表明两个变量之间的相关程度很小;②中所有的点都在同一条直线上,是函数关系;③中点的分布在一条带状区域上,即点分布在一条直线的附近,是线性相关关系;④中的点也分布在一条带状区域内,但不是线性的,而是一条曲线附近,所以不是线性相关关系,故填③.]
3.工人工资y(元)依劳动生产率x(千元)变化的线性回归方程为=50+80x,下列判断正确的是________.
①劳动生产率为1 000元时,工资为130元;
②劳动生产率提高1 000元时,工资提高80元;
③劳动生产率提高1 000元时,工资提高130元;
④当月工资为250元时,劳动生产率为2 000元.
② [回归直线斜率为80,所以x每增加1,增加80,即劳动生产率提高1 000元时,工资提高80元.]
4.下表是广告费用与销售额之间的一组数据:
广告费用(千元)
1
4
6
10
14
销售额(千元)
19
44
40
52
53
销售额y(千元)与广告费用x(千元)之间有线性相关关系,回归方程为=2.3x+a(a为常数),现要使销售额达到6万元,估计广告费用约为________千元.
15 [=7,=41.6,
则a=-2.3=41.6-2.3×7=25.5.
当y=6万元=60千元时,
60=2.3x+25.5,解得x=15(千元).]
变量间相关关系的判断
【例1】 在下列两个变量的关系中,具有相关关系的是________.
①正方形边长与面积之间的关系;②作文水平与课外阅读量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故发生率之间的关系.
②④ [两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系.]
1.函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
2.准确理解变量间的相关关系是解答本题的关键.要准确区分两个变量间的相关关系和函数关系,事实上,现实生活中相关关系是处处存在的,从某种意义上讲,函数关系可以看作一种理想的关系模型,而相关关系是一种普遍的关系.两者区别的关键点是“确定性”还是“不确定性”.
1.下列两个变量中具有相关关系的是________(填写相应的序号).
①正方体的棱长和体积;②单产为常数时,土地面积和总产量;③日照时间与水稻的亩产量.
③ [正方体的棱长x和体积V存在着函数关系V=x3;单产为常数a公斤/亩,土地面积x(亩)和总产量y(公斤)之间也存在着函数关系y=ax.日照时间长,则水稻的亩产量高,这只是相关关系,应选③.]
2.下列命题:
①任何两个变量都具有相关关系;
②圆的周长与该圆的半径具有相关关系;
③某商品的需求量与该商品的价格是一种非确定性关系;
④根据散点图求得的回归直线方程可能是没有意义的;
⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.
其中正确的命题为________.
③④⑤ [两个变量不一定是相关关系,也可能是确定性关系,故①错误;圆的周长与该圆的半径具有函数关系,故②错误;③④⑤都正确.]
散点图的画法及应用
【例2】 现有5个同学的数学和物理成绩如下表:
  学生
学科  
A
B
C
D
E
数学
80
75
70
65
60
物理
70
66
68
64
62
利用散点图判断它们是否具有线性相关关系?如果有线性相关关系,是正相关还是负相关?
思路点拨:本题涉及两个变量(数学成绩与物理成绩),以x轴表示数学成绩、y轴表示物理成绩,可得相应的散点图,再观察散点图得出结论.
[解] 把数学成绩作为横坐标,把相应的物理成绩作为纵坐标,在平面直角坐标系中描点(xi,yi)(i=1,2,…,5).从图中可以直观地看出数学成绩和物理成绩具有线性相关关系,且当数学成绩减小时,物理成绩也由大变小,即它们正相关.
1.判断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果图上发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
如果变量的对应点分布没有规律,我们就可以认为这两个变量不具有相关关系.
2.正相关、负相关
线性相关关系又分为正相关和负相关.
正相关是指两个变量具有相同的变化趋势,即从整体上来看,一个变量会随另一个变量变大而变大.从散点图上看,因变量随自变量的增大而增大,图中的点分布在左下角到右上角的区域.
负相关是指两个变量具有相反的变化趋势,即从整体上来看,一个变量会随另一个变量变大而变小.从散点图上看,因变量随自变量的增大而减小,图中的点分布在左上角到右下角的区域.
提醒:画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.
3.如图是两个变量统计数据的散点图,判断两个变量之间是否具有相关关系?
思路点拨:观察图中点的分布情况作出判断.从散点图上看,点的分布散乱无规律,故不具有相关关系.
[解] 不具有相关关系,因为散点散乱地分布在坐标平面内,不呈线形.
4.有个男孩的年龄与身高的统计数据如下:
年龄(岁)
1
2
3
4
5
6
身高(cm)
78
87
98
108
115
120
画出散点图,并判断它们是否有相关关系?如果有相关关系,是正相关还是负相关?
思路点拨:描点(1,78),(2,87),(3,98),(4,108),(5,115),(6,120).观察点的分布,作出判断.
[解] 作出散点图如图:
由图可见,具有线性相关关系,且是正相关.
线性回归方程的求法及应用
【例3】 某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据.
广告支出x/万元
1
2
3
4
销售收入y/万元
12
28
42
56
(1)画出表中数据的散点图;
(2)求出y对x的回归直线方程=bx+a,并解释b的意义;
(3)若广告费为9万元,则销售收入约为多少万元?
思路点拨:→→
→→→→
[解] (1)散点图如图.
(2)观察散点图可知各点大致分布在一条直线附近,列出下列表格,以便计算回归系数a,B.
序号
x
y
x2
y2
xy
1
1
12
1
144
12
2
2
28
4
784
56
3
3
42
9
1 764
126
4
4
56
16
3 136
224

10
138
30
5 828
418
于是=,=,=30,=5 828,iyi=418,
代入公式得,b===,
a=-b=-×=-2.
故y对x的回归直线方程为=x-2,其中回归系数b=,它的意义是:广告支出每增加1万元,销售收入y平均增加万元.
(3)当x=9万元时,=×9-2=129.4(万元),
即若广告费为9万元,则销售收入约为129.4万元.
1.求样本数据的线性回归方程,可按下列步骤进行:
第一步,计算平均数,;
第二步,求和iyi,;
第三步,计算b==,a=-b;
第四步,写出线性回归方程=bx+A.
2.对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.
提醒:(1)对一组数据进行线性回归分析时,应先画出其散点图,判断变量之间是否线性相关,再由系数a,b的计算公式,计算出a,b,由于计算量较大,在计算时应借助计算器,仔细计算,以防出现错误.
(2)为了方便,常制表对应算出xiyi,x,以便于求和.
(3)研究变量间的相关关系,求得回归直线方程能帮助我们发现事物发展的一些规律,估计、预测某些数据,为我们的判断和决策提供依据.
5.如图是我国2012年至2018年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1-7分别对应年份2012-2018.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2018年我国生活垃圾无害化处理量.
参考数据: yi=9.32, tiyi=40.17,=0.55,≈2.646.
参考公式:相关系数r=,回归方程=a+bt中斜率和截距的最小二乘估计公式分别为b=,a=-b .
思路点拨:(1)
(2)→
[解] (1)由折线图中的数据和附注中的参考数据得
=4, (ti-)2=28,=0.55,
(ti-)(yi-)=tiyi-yi=40.17-4×9.32=2.89,
∴r≈≈0.99.
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当大,从而可以用线性回归模型拟合y与t的关系.
(2)由=≈1.331及(1)得
b==≈0.103.
a=-b ≈1.331-0.103×4≈0.92.
所以y关于t的回归方程为=0.92+0.10t.
将2016年对应的t=9代入回归方程得=0.92+0.10×9=1.82.
所以预测2020年我国生活垃圾无害化处理量约为1.82亿吨.
1.本节课的重点是会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系,能根据给出的线性回归方程系数公式建立线性回归方程.难点是了解相关关系、线性相关、回归直线的概念.
2.本节课要掌握以下几类问题
(1)准确区分相关关系与函数关系.
(2)会利用散点图判断两个变量间的相关关系.
(3)掌握用线性回归方程估计总体的一般步骤.
1.在如图所示的四个散点图中,两个变量具有相关性的是(  )
A.①②  B.①④
C.②③ D.②④
D [由图可知①中变量间是一次函数关系,不是相关关系;②中的所有点在一条直线附近波动,是线性相关的;③中的点杂乱无章,没有什么关系;④中的所有点在某条曲线附近波动,是非线性相关的.故两个变量具有相关性的是②④.]
2.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得线性回归方程,分别得到以下四个结论:
①y与x负相关且=2.347x-6.423;
②y与x负相关且=-3.476x+5.648;
③y与x正相关且=5.437x+8.493;
④y与x正相关且=-4.326x-4.578.
其中一定不正确的结论的序号有(  )
A.①③ B.①④
C.②③ D.②④
B [由正、负相关性的定义知①④一定不正确.]
3.某工厂生产某种产品的产量x(吨)与相应的生产能耗y(吨标准煤)有如下几组样本数据:
x
3
4
5
6
y
2.5
3
4
4.5
据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得其回归直线的斜率为0.7,则这组样本数据的线性回归方程是________.
=0.7x+0.35 [∵==4.5,==3.5,
∴a=-b=3.5-0.7×4.5=0.35.
∴线性回归方程为=0.7x+0.35.]
4.2019年元旦前夕,某市统计局统计了该市2018年10户家庭的年收入和年饮食支出的统计资料如下表:
年收入x(万元)
2
4
4
6
6
6
7
7
8
10
年饮食支出y(万元)
0.9
1.4
1.6
2.0
2.1
1.9
1.8
2.1
2.2
2.3
(1)如果已知y与x是线性相关的,求线性回归方程;
(2)若某家庭年收入为9万元,预测其年饮食支出.
(参考数据:iyi=117.7,=406)
思路点拨:按照求线性回归方程的一般步骤,求出线性回归方程,再根据回归方程作出预测.
[解] (1)依题意可计算得:=6,=1.83,2=36,
 =10.98,又∵iyi=117.7,=406,
∴b=≈0.17,a=-b=0.81,
∴=0.17x+0.81.
∴所求的线性回归方程为=0.17x+0.81.
(2)当x=9时,=0.17×9+0.81=2.34(万元),
可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元.
课件53张PPT。第2章 统计2.4 线性回归方程 确定性函数相关线性 非线性 线性回归方程 变量间相关关系的判断 散点图的画法及应用 线性回归方程的求法及应用 点击右图进入…Thank you for watching !课时分层作业(八) 线性回归方程
(建议用时:60分钟)
[基础达标练]
一、选择题
1.下列两个变量之间的关系是相关关系的有(  )
①长方体的体积和长方体的棱长;②正n边形的边数和其内角和;③父亲的身高与儿子的身高;④光照时间和果树亩产量.
A.①②    B.①③   
C.②③    D.③④
D [①②是函数关系;关于③,一般来说父亲的身高高,儿子也不矮,两者之间具有相关关系;对于④,一般来说,光照时间越长,果树亩产量也越高,两者之间具有相关关系.]
2.图中各图反映了两个变量的某种关系,其中可以看作具有线性相关关系的有(  )
A.①②     B.①④
C.②③     D.②④
B [图①④中的点的分布基本上集中在一个带状区域内,反映了两个变量之间存在相关关系,即当一个变量变化时,另一个变量的值虽然不能完全确定,但大体上总是落在带状区域内,我们可以寻找一条合适的直线来近似表示两个变量之间的关系,因此这两个变量具有线性相关关系.图②中的点的分布基本上集中在由某条曲线两侧的带状区域内,表示两个变量有相关关系,但不是线性相关关系.图③表示两个变量之间有确定的关系,即函数关系.]
3.如图,有4组(x,y)数据,去掉一点后,剩下的3组数据的线性相关程度最大.则去掉的点是(  )
A.P1 B.P2
C.P3 D.P4
C [去掉P3点后, 其余点大致在一条直线附近.]
4.已知x,y的取值如下表所示:
x
0
1
3
4
y
2.2
4.3
4.8
6.7
从散点图分析,y与x线性相关,且=0.95x+a,则a=(  )
A.2 B.2.6
C.3 D.4.5
B [回归直线必过样本中心点(,),且=2,=4.5,则4.5=0.95×2+a,a=2.6.]
5.某地区调查了2岁~9岁的儿童的身高,由此建立的身高y(单位:cm)与年龄x(单位:岁)的线性回归方程为=8.25x+60.13,则下列叙述中正确的是
(  )
A.该地区一个10岁儿童的身高为142.63 cm
B.该地区2岁~9岁的儿童每年身高约增加8.25 cm
C.该地区9岁儿童的平均身高是134.38 cm
D.利用这个模型可以准确地预算该地区每个儿童(2岁~9岁)的身高
B [根据回归分析的意义知该地区一个10岁儿童的身高只能估计为142.63 cm;该地区9岁儿童的平均身高不一定是134.38 cm,且利用这个模型只能近似地预算该地区每个2岁~9岁儿童的身高.所以只有B正确.]
二、填空题
6.已知三点(3,10),(7,20),(11,24)的横坐标x与纵坐标y具有线性关系,则其线性回归方程是________.
=x+ [根据线性回归方程系数公式计算.]
7.已知一个回归直线方程为=2.5-3x,则当变量x平均增加1个单位时,变量y的变化情况是________.
平均减少3个单位 [由回归直线方程知斜率k=-3,所以当x平均增加1个单位时,y平均减少3个单位.]
8.已知回归直线斜率的估计值为3,样本点的中心为(4,5),则回归直线方程为________.
=3x-7 [由题意知回归直线方程为=3x+a,将(4,5)代入方程得5=3×4+a,解得a=-7,故回归直线方程为=3x-7.]
三、解答题
9.下表是某地年降水量与年平均气温的统计数据:
年平均气
温/℃
12.51
12.84
12.84
13.69
13.33
12.74
13.05
年降水量/mm
748
542
507
813
574
701
432
(1)判断两变量是否有相关关系;
(2)求回归直线方程有意义吗?
[解] (1)以x轴为年平均气温、y轴为年降水量,可得相应的散点图如图.
因为图中各点并不在一条直线的附近,所以两者不具有线性相关关系.
(2)由(1)知,两变量没有线性相关关系.故没有必要用回归直线进行拟合,即使用公式求出回归直线方程也是没有意义的.
10.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:
摄氏温度/℃
-5
0
4
7
12
15
19
23
27
31
36
热饮杯数
156
150
132
128
130
116
104
89
93
76
54
(1)画出散点图;
(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;
(3)求回归方程;
(4)如果某天的气温是2℃,预测这天卖出的热饮杯数.
[解] (1)散点图如图所示:
(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.
(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式求出线性回归方程的系数.利用计算器容易求得线性回归方程=-2.352x+147.767.
(4)当x=2时,=143.063.因此,某天的气温为2℃时,这天大约可以卖出143杯热饮.
[能力提升练]
1.下表提供了某厂节能降耗技术改造后,在生产A产品过程中记录的产量x(单位:吨)与相应的生产能耗y(单位:103 kJ)几组对应的数据:
x
3
4
5
6
y
2.5
t
4
4.5
根据上表提供的数据,求出y关于x的线性回归方程=0.7+0.35,那么表中t的值为(  )
A.2.8 B.3
C.3.2 D.3.5
B [由=0.7+0.35,得
=0.7×+0.35,
故=3.5,即t=3.]
2.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y对总成绩x的回归直线方程为=6+0.4x.由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差的分数为(  )
A.50 B.40
C.30 D.20
D [令两人的总成绩分别为x1,x2.
则对应的数学成绩估计为1=6+0.4x1,
2=6+0.4x2,所以
|1-2|=|0.4(x1-x2)|=0.4×50=20.]
3.在对两个变量x,y进行线性回归分析时,有下列步骤:
①对所求出的回归直线方程作出解释;
②收集数据(xi,yi),i=1,2,…,n;
③求线性回归方程;
④求相关系数;
⑤根据所搜集的数据绘制散点图.
如果根据可行性要求能够得出变量x,y具有线性相关的结论,则正确的操作顺序是________.
②⑤④③① [按照做回归分析的步骤可知顺序应为②⑤④③①.]
4.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm.
185 [根据题中所提供的信息,可知父亲与儿子的对应数据可列表如下:
父亲的身高(x)
173
170
176
儿子的身高(y)
170
176
182
=173,=176,∴b===1,a=-b=176-173=3,
∴线性回归方程为=x+3,从而可预测他孙子的身高为182+3=185(cm).]
5.某厂的生产原料耗费x(单位:万元)与销售额y(单位:万元)之间具有线性相关关系,有如下的对应关系:
x
2
4
6
8
y
30
40
50
70
(1)求x与y之间的回归直线方程;
(2)若实际销售额不少于50万元,则原料耗费应该不少于多少?
思路点拨:利用公式求回归系数,然后得回归直线方程并据此作出相应的预测.
[解] (1)=5,=47.5,=120,=9 900,iyi=1 080,由公式得回归系数为b=6.5,a=-b=47.5-6.5×5=15,故回归直线方程为=6.5x+15.
(2)由回归直线方程得当≥50时,即6.5x+15≥50,x≥≈5.38.故原料耗费应不少于5.38万元.