教
案
教学基本信息
课题
回归分析一
学科
数学
学段:高中
年级
高二
教材
书名:普通高中课程标准实验教科书数学选修1-1(B版)
出版社:人民教育出版社出版日期:2007
年
1
月
教学目标及教学重点、难点
一、教学目标:
1.
结合实例,理解线性相关系数的概念,了解相关系数的性质.
2.
结合实例,归纳并掌握回归分析的步骤,发展逻辑推理素养.
3.
在具体实例中,运用线性回归分析解决的简单预测问题,提升数学转化能力,发展逻辑推理素养和数学运算素养.
二、教学重点:
相关系数的性质
三、教学重点:
回归分析体现的统计思想
教学过程
教学
环节
主要教学活动
设置意图
复习引入
复习回顾
在必修模块3中,我们学习了关于抽样调查、样本估计总体、线性回归等基本知识。在此基础上,我们将通过对典型案例的探讨,进一步学习回归分析相关知识。
什么是相关关系?
两个变量之间常见的关系有两类:一类是确定性的函数关系例如:正方形的边长a和面积S的关系
另一类是非确定性的相关关系,变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的
例如:人的身高并不能确定体重,但一般说来,“身高者体也重”
2、函数与相关关系的区别是什么?
函数关系是一种确定性关系,相关关系是一种非确定性的关系,在现实生活中,相关关系是大量存在的,从某种意义上看,函数关系是一种理想的关系模型,相关关系是一种更为一般的情况,因此,研究相关关系,可使我们处理更为广泛的数学应用问题
3、如何直观理解两个变量间具有线性相关关系?
案例:我国1949年--1999年的人口数据资料,数据如下:
年份19491954195919641969197419791984198919941999人口数/百万5426036727058079099751035110711771246
观察表中数据,人口有随年份的增加而增加的趋势.
为了更直观地看出它们是否具有相关关系,我们以年份的取值,做横坐标,人口的相应取值作为纵坐标,在直角坐标系中描点,如图所示,这样的图形叫散点图
从散点图中可以直观的看出年份与人口具有相关关系.并且样本点散布在从左下角到右上角的区域.这种相关关系称为正相关.
案例:某地区从某一年开始,进行了环境污染整治,得到如下数据:
第x年1234567污染指数y6.15.24.54.73.83.43.1
观察表中数据,y有随x的增加而减少的趋势.
从散点图中可以直观的看出x与y具有相关关系.并且样本点散布在从左上角到右下角的区域.这种相关关系称为负相关.
如果散点图中,样本点的分布具有这样的特征,从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫回归直线。
数学文化
“回归”一词的由来,回归作为统计学的一个术语,最早这个词是由英国著名统计学家高尔顿提出的. 有兴趣的同学可以看一下教材第96页,有比较详细的介绍.
现在人们把由一个变量的变化去推测另一个变量的变化的方法称为回归方法.在统计学中,回归分析是一种统计方法,它是通过分析判断来确定相关变量之间的内在关系的,也就是寻找相关关系中的非确定性关系的某种确定性.
回归直线方程的一般形式是什么?
在必修三的学习中,我们应用最小二乘法的思想方法,得到了回归直线的方程
设样本点为(x1,y1),(x2,y2),???,
(xn,yn),
由最小二乘法求得的线性回归方程为
其中
,称为样本点的中心.
5、在必修三中,对于两个具有线性相关关系的变量,利用回归分析的方法进行了研究,其具体步骤是什么?
画散点图,求回归直线方程,根据回归直线方程进行预测
结合学生的知识经验梳理问题.
新课讲解
探究一
回归直线方程
案例:我国1949年--1999年的人口数据资料,试根据表中数据估计我国2004年的人口数.
年份19491954195919641969197419791984198919941999人口数/百万5426036727058079099751035110711771246
为了简化数据,先将年份减去1949,并将所得值用x表示,对应的人口数用y表示,得到下面的数据表:
年份05101520253035404550人口数/百万5426036727058079099751035110711771246
解:1、画散点图
样本点呈直线趋势,x、y之间有近似的线性相关关系.因此可以用回归直线方程来反映它们之间的关系.
求回归直线方程
所以y对x的回归直线方程为
3、根据回归直线方程进行预测
当
时,
回顾本题的解答过程,我们通过画散点图判断两个变量具有近似的线性相关关系.从而求出回归直线方程,进行了预测.那么我们的预测是否合理?
我们是通过画散点图直观判断出两个变量具有线性相关关系,这有两点需要思考
从散点图上可以看出,这三幅图,样本点成条状分布,大致分布在一条直线附近,具有近似的线性相关关系,但集中程度明显不同.反映出的是两变量线性相关关系的强弱不同.我们需要更严谨的方法来衡量两变量线性相关关系的强弱.
这两幅图,散点图的特征并不那么明显,能否用线性回归模型?如果不考虑散点图,对于任意给定的样本数据,由公式都可求出相应的回归直线方程.但它能不能反映出这组数据的变化规律?
由此可见,从散点图上观察,只是一种粗略的估计,因此,我们需要一种新的方法来刻画线性相关关系的强弱,这样我们进行的线性回归分析才有意义。
怎样刻画线性相关关系的强弱?
我们引入了相关系数的概念,通过计算两个变量间的相关系数,来判断它们之间线性相关程度的大小.
探究二
相关系数
1、我们引入了相关系数的概念,通过计算两个变量间的相关系数,来判断它们之间线性相关程度的大小.
相关系数公式
相关系数r的性质:
(1)|r|
.
(2)
r为正时,表明变量正相关;
r为负时,表明变量负相关.
(3)
|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.
2、我们知道了相关系数r的大小可以比较精确的反映出相关关系的强弱,那么相关系数r的绝对值与1接近到什么程度才能表明利用线性回归模型具有实际意义呢?这需要进行相关性检验,对此,统计学中有明确的检验方法,基本步骤如下:
相关性检验
(1)作统计假设:x与y不具有线性相关关系.
(2)根据小概率0.05与n-2在附表(教材第97页)中查出r的一个临界值
.
(3)根据样本相关系数计算公式算出r的值.
(4)作统计推断:
如果,表明有95%把握认为x与y之间具有线性相关关系.
如果,我们没有理由拒绝原来的假设,这时寻找回归直线方程是毫无意义的.
3、对比独立性检验的一般步骤:
相同点:一、作统计假设:x与y不具有线性相关关系;
两个分类变量没有关系.
根据公式计算统计量.
三、比对临界值,作统计推断.
不同点:查找临界值的方法
对比两种检验的研究对象:
相同点:研究两个变量的相关关系.
不同点:定量变量:回归分析
分类变量:独立性检验
4、知识实践
我国1949年--1999年的人口数据资料,根据表中数据估计我国2004年的人口数.所以2004年我国人口总数估计为13.23亿.
问题
那么我们的预测是否合理?
对x与y作相关性检验:
(1)作统计假设
:
x与y不具有线性相关关系.
(2)已知n=11,
根据小概率0.05与n-2=9,在附表中查出.根据样本相关系数计算公式算出r的值
(4)作统计判断
因为
,即
.
从而有95%的把握认为x与y之间具有线性相关关系,求得的回归直线方程有意义.
因此2004年我国人口总数估计为13.23亿是合理的.
探究小结
对于两个具有相关关系的变量,该如何进行线性回归分析?
(1)画散点图大致判断两个变量间的相关性.
(2)对两个变量进行相关性检验,如果,表明有95%把握认为x与y之间具有线性相关关系.如果
,我们没有理由拒绝原来的假设.这时寻找回归直线方程是毫无意义的.
(3)在有意义的情况下求回归直线方程并根据回归直线方程进行预测.
从学生的生活经验中提出问题.
反思解题过程,发现问题,引发新的思考
为了解决问题,引出相关系数的概念.
巩固应用
例
为了了解某地母亲身高x与女儿身高y的相关关系,随机测得10对母女的身高如下表所示:
母亲身高x/cm159160160163159154159158159157女儿身高y/cm158159160161161155162157162156
你能否预测当母亲身高为161cm时,女儿的身高为多少?
解:对x与y作相关性检验:
(1)作统计假设
:
x与y不具有线性相关关系.
(2)已知n=10
根据小概率0.05与n-2=8,在附表中查出.根据样本相关系数计算公式算出r的值
(可以利用电子表格软件中的统计公式来计算)
(4)作统计判断
因为
,即
.
从而有95%的把握认为x与y之间具有线性相关关系,求得的回归直线方程有意义.
求回归直线方程
应用公式计算得:
所以y对x的回归直线方程是
当
时,
这就是说当母亲身高为161cm时,女儿的身高也接近161cm.
加深回归分析的思辨,进一步理解相关性检验
拓展提升
同学观察一种幼苗的生长情况,从观察之日起,第x天的高度为ycm记录数据如下:
第x天14916253649高度y/cm0479111213
利用刚才所学知识,判断能否用一次函数描述y与x的关系?
解:对x与y作相关性检验:
(1)作统计假设
:
x与y不具有线性相关关系.
(2)已知n=7
根据小概率0.05与n-2=5,在附表中查出.根据样本相关系数计算公式算出r的值
(可以利用电子表格软件中的统计公式来计算)
(4)作统计判断
因为
,即
.
从而有95%的把握认为x与y之间具有线性相关关系,求得的回归直线方程有意义.
所以,可以用一次函数描述y与x的关系.
思考
除了用一次函数描述y与x的关系外,还可以用其他函数吗?具体该如何操作?
动手实践
作散点图、计算回归系数和相关系数的步骤都比较多,过程繁琐,大家可以尝试利用软件来完成,比如电子表格Excel、动态数学软件GeoGebra等.
通过例题研究,进一步提升对回归分析的认识
课堂
小结
如何对具有相关关系的两个变量进行线性回归分析?
可以先从散点图观察大致趋势,再通过求相关系数并和临界值作比较,可以判断出两个变量是否线性相关关系,求得的回归直线方程是否有实际意义.借助散点图可以大致判定两个变量的相关性,用相关系数公式可以准确判定两个变量间的相关程度
2、对两个变量的相关关系认识过程
经历了从感性认识上升到理性分析的过程.
概括本节课的主要知识与思想方法.
布置
作业
1、某农场对单位面积化肥用量x(kg)和水稻相应产量y(kg)的关系做了统计,得到数据如下:
x15202530354045y330345365405445450455
(1)进行相关性检验;
(2)如果x与y之间具有线性相关关系,求出回归直线方程,并预测当单位面积化肥用量为32kg时,水稻的产量大约是多少?(精确到0.01kg)
2、我们知道,刑警如果能在案发现场提取到罪犯的脚印,那将获得一条重要的破案线索,其原因之一是人类的脚掌长度和身高存在着相关关系,可以根据一个人的脚掌长度来预测他的身高,同学们亲自体验回归分析的思想方法,提高自己的实践能力.
数学建模的题目:
收集一些周围人们的脚掌长度及其身高,作为两个变量,画散点图、进行相关性检验,如果这两个变量之间具有线性相关关系,就求出回归直线方程、作一次预测并分析预测结果.
注意:1、如果脚掌长度不方便可以改量脚印的长度;
2、数据尽量取得分散一些.(共67张PPT)
回归分析(1)
高二年级
数学
复习回顾
两个变量之间常见的关系有两类:
一类是确定性的函数关系.
例如:正方形的边长a和面积S的关系.
1、什么是相关关系?
复习回顾
例如:人的身高并不能确定体重,但一般说来,
“身高者体也重”.
另一类是非确定性的相关关系,变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的.
1、什么是相关关系?
函数关系是一种确定性关系,相关关系是一种非确定性关系.
在现实生活中,相关关系是大量存在的,从某种意义上看,函数关系是一种理想的关系模型,相关关系是一种更为一般的情况.
复习回顾
2、函数关系与相关关系的区别是什么?
因此,研究相关关系,可使我们处理更为广泛的数学应用问题.
观察表中数据,人口有随年份的增加而增加的趋势.
我国1949年--1999年的人口数据资料,数据如下:
年份
1949
1954
1959
1964
1969
1974
1979
1984
1989
1994
1999
人口数/百万
542
603
672
705
807
909
975
1035
1107
1177
1246
复习回顾
3、如何直观理解两个变量间具有线性相关关系?
从散点图中可以直观的看出年份与人口数具有相关关系.
这种相关关系称为正相关.
并且样本点散布在从左下角到右上角的区域.
观察表中数据,y有随x的增加而减少的趋势.
第x年
1
2
3
4
5
6
7
污染指数y
6.1
5.2
4.5
4.7
3.8
3.4
3.1
某地区从某一年开始,进行了环境污染整治,得到如下数据:
从散点图中可以直观的看出
x与y具有相关关系.
这种相关关系称为负相关.
并且样本点散布在从左上角
到右下角的区域.
这条直线叫做回归直线.
如果散点图中,样本点的分布具有这样的特征,从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,
“回归”一词的由来
数学文化
回归作为统计学的一个
术语,最早这个词是由英国
著名统计学家高尔顿提出的.
有兴趣的同学可以看一
下教材,有比较详细的介绍.
现在人们把由一个变量的变化去推测
另一个变量的变化的方法称为回归方法.
在统计学中,回归分析是一种统计方
法,它是通过分析判断来确定相关变量之
间的内在关系的,也就是寻找相关关系中
的非确定性关系的某种确定性.
4、回归直线方程的一般形式是什么?
复习回顾
设样本点为(x1,y1),(x2,y2),???,
(xn,yn),
由最小二乘法求得的线性回归方程为
4、回归直线方程的一般形式是什么?
复习回顾
设样本点为(x1,y1),(x2,y2),???,
(xn,yn),
由最小二乘法求得的线性回归方程为
4、回归直线方程的一般形式是什么?
复习回顾
设样本点为(x1,y1),(x2,y2),???,
(xn,yn),
由最小二乘法求得的线性回归方程为
4、回归直线方程的一般形式是什么?
复习回顾
设样本点为(x1,y1),(x2,y2),???,
(xn,yn),
由最小二乘法求得的线性回归方程为
4、回归直线方程的一般形式是什么?
复习回顾
其中
,称为样本点的中心.
设样本点为(x1,y1),(x2,y2),???,
(xn,yn),
由最小二乘法求得的线性回归方程为
5、在必修三中,对于两个具有线性相关关系的变量,利用回归分析的方法进行了研究,其具体步骤是什么?
复习回顾
步骤为:
求回归直线方程
根据回归直线方程进行预测
画散点图
探究一
回归直线方程
这是我国1949年--1999年的人口数据资料,试根据表中数据估计我国2004年的人口数.
年份
1949
1954
1959
1964
1969
1974
1979
1984
1989
1994
1999
人口数/百万
542
603
672
705
807
909
975
1035
1107
1177
1246
探究一
回归直线方程
为了简化数据,先将年份减去1949,并将所得值用x表示,对应的人口数用y表示,得到下面的数据表:
x
0
5
10
15
20
25
30
35
40
45
50
y
542
603
672
705
807
909
975
1035
1107
1177
1246
样本点呈直线趋势,x、y之间有近似的线性相关关系.
①画散点图
因此可以用回归直线方程来反映它们之间的关系.
②求回归直线方程
i
xi
yi
xi2
xiyi
1
0
542
2
5
603
3
10
672
4
15
705
5
20
807
6
25
909
7
30
975
8
35
1035
9
40
1107
10
45
1177
11
50
1246
合计
②求回归直线方程
i
xi
yi
xi2
xiyi
1
0
542
0
2
5
603
25
3
10
672
100
4
15
705
225
5
20
807
400
6
25
909
625
7
30
975
900
8
35
1035
1225
9
40
1107
1600
10
45
1177
2025
11
50
1246
2500
合计
②求回归直线方程
i
xi
yi
xi2
xiyi
1
0
542
0
0
2
5
603
25
3015
3
10
672
100
6720
4
15
705
225
10575
5
20
807
400
16140
6
25
909
625
22725
7
30
975
900
29250
8
35
1035
1225
36225
9
40
1107
1600
44280
10
45
1177
2025
52965
11
50
1246
2500
62300
合计
②求回归直线方程
i
xi
yi
xi2
xiyi
1
0
542
0
0
2
5
603
25
3015
3
10
672
100
6720
4
15
705
225
10575
5
20
807
400
16140
6
25
909
625
22725
7
30
975
900
29250
8
35
1035
1225
36225
9
40
1107
1600
44280
10
45
1177
2025
52965
11
50
1246
2500
62300
合计
275
9778
9625
284195
②求回归直线方程
所以y对x的回归直线方程为
③根据回归直线方程进行预测
所以2004年我国人口总数估计为13.23亿.
当
时,
.
回顾本题的解答过程,我们通过画散点图判断两个变量具有近似的线性相关关系.
探究一
回归直线方程
那么我们的预测是否合理?
从而求出回归直线方程,进行了预测.
思考1
样本点成条状分布,大致分布在一条直线附近,具有近似的线性相关关系,但集中程度明显不同.
反映出的是两变量线性相关关系的强弱不同.
思考2
散点图的特征并不那么明显,能否用线性回归模型?
如果不考虑散点图,对于任意给定的样本数据,由公式都可求出相应的回归直线方程.
但它能不能反映出这组数据的变化规律?
怎样刻画线性相关关系的强弱?
探究二
相关系数
我们引入了相关系数的概念,通过计算两个变量间的相关系数,来判断它们之间线性相关程度的大小.
相关系数r
设样本点为(x1,y1),(x2,y2),???,
(xn,yn),
相关系数r
设样本点为(x1,y1),(x2,y2),???,
(xn,yn),
相关系数r
设样本点为(x1,y1),(x2,y2),???,
(xn,yn),
数学
43
51
56
58
61
63
65
66
68
69
70
71
73
74
74
75
物理
42
50
53
65
62
55
83
77
62
59
46
76
79
69
75
59
由公式计算出相关系数r=0.73.
数学
75
76
77
78
78
79
79
80
82
82
83
84
88
89
92
98
物理
68
87
58
79
79
66
91
68
91
91
93
98
87
86
88
82
样本班每位学生数学成绩与物理成绩的对应表.
数学
43
51
56
58
61
63
65
66
68
69
70
71
73
74
74
75
英语
81
76
67
78
65
73
71
74
76
62
64
77
80
81
68
72
由公式计算出相关系数r=0.21.
数学
75
76
77
78
78
79
79
80
82
82
83
84
88
89
92
98
英语
85
69
71
70
76
62
89
69
76
84
94
84
79
81
85
68
样本班每位学生数学成绩与英语成绩的对应表.
相关系数r较大,线性相关程度较强;
r=0.73
r=0.21
相关系数r较小,线性相关程度较弱.
相关系数r为正,两个变量正相关;
r=0.73
r=0.21
相关系数r为负,会是什么情况?
r=-0.10
r=-0.60
r=-0.95
相关系数|r|越接近1,线性相关程度越强;
相关系数|r|越接近0,线性相关程度越弱.
相关系数r为负,两个变量负相关;
相关系数r的性质:
(3)
|r|越接近1,线性相关程度越强;
|r|越接近0,线性相关程度越弱.
探究二
相关系数
(2)
r为正时,表明变量正相关;
r为负时,表明变量负相关.
(1)|r|
.
(1)作统计假设:x与y不具有线性相关关系.
(2)根据小概率0.05与n-2,查相关性检验的临界值表,可得r的临界值
.
(3)根据样本相关系数计算公式算出r的值.
相关性检验
(4)作统计推断:
如果
,表明有95%把握认为x与y之间具有线性相关关系.
如果
,我们没有理由拒绝原来的假设,这时寻找回归直线方程
是毫无意义的.
一、作统计假设:x与y不具有线性相关关系;
两个分类变量没有关系.
相同点:
二、根据公式计算统计量.
三、比对临界值,作统计推断.
对比独立性检验的一般步骤:
对比独立性检验的一般步骤:
查找临界值的方法
不同点:
相关性检验:
独立性检验:
临界值3.841与6.635.
根据小概率0.05与n-2查表得r的临界值
.
回归分析
独立性检验
不同点:
数值变量:
分类变量:
变量
相同点:
研究两个变量的相关关系.
对比两种检验的研究对象:
这是我国1949年--1999年的人口数据资料,试根据表中数据估计我国2004年的人口数.
年份
1949
1954
1959
1964
1969
1974
1979
1984
1989
1994
1999
人口数/百万
542
603
672
705
807
909
975
1035
1107
1177
1246
知识实践
根据回归直线方程进行预测
所以2004年我国人口总数估计为13.23亿.
当
时,
.
问题
那么我们的预测是否合理?
对x与y作相关性检验:
(1)作统计假设
:
x与y不具有线性相关关系.
(2)已知n=11,
根据小概率0.05与n-2=9,
n-2
小概率
0.05
0.01
1
0.997
1.000
2
0.950
0.990
3
0.878
0.959
4
0.811
0.917
5
0.754
0.874
6
0.707
0.834
7
0.666
0.798
8
0.632
0.765
9
0.602
0.735
10
0.576
0.708
在附表中查出
.
(3)由相关系数公式计算r
i
xi
yi
xi2
yi2
xiyi
1
0
542
2
5
603
3
10
672
4
15
705
5
20
807
6
25
909
7
30
975
8
35
1035
9
40
1107
10
45
1177
11
50
1246
合计
(3)由相关系数公式计算r
i
xi
yi
xi2
yi2
xiyi
1
0
542
0
2
5
603
25
3
10
672
100
4
15
705
225
5
20
807
400
6
25
909
625
7
30
975
900
8
35
1035
1225
9
40
1107
1600
10
45
1177
2025
11
50
1246
2500
合计
(3)由相关系数公式计算r
i
xi
yi
xi2
yi2
xiyi
1
0
542
0
293764
2
5
603
25
363609
3
10
672
100
451584
4
15
705
225
497025
5
20
807
400
651249
6
25
909
625
826281
7
30
975
900
950625
8
35
1035
1225
1071225
9
40
1107
1600
1225449
10
45
1177
2025
1385329
11
50
1246
2500
1552516
合计
(3)由相关系数公式计算r
i
xi
yi
xi2
yi2
xiyi
1
0
542
0
293764
0
2
5
603
25
363609
3015
3
10
672
100
451584
6720
4
15
705
225
497025
10575
5
20
807
400
651249
16140
6
25
909
625
826281
22725
7
30
975
900
950625
29250
8
35
1035
1225
1071225
36225
9
40
1107
1600
1225449
44280
10
45
1177
2025
1385329
52965
11
50
1246
2500
1552516
62300
合计
(3)由相关系数公式计算r
i
xi
yi
xi2
yi2
xiyi
1
0
542
0
293764
0
2
5
603
25
363609
3015
3
10
672
100
451584
6720
4
15
705
225
497025
10575
5
20
807
400
651249
16140
6
25
909
625
826281
22725
7
30
975
900
950625
29250
8
35
1035
1225
1071225
36225
9
40
1107
1600
1225449
44280
10
45
1177
2025
1385329
52965
11
50
1246
2500
1552516
62300
合计
275
9778
9625
9268656
284195
(4)作统计判断
因为
,即
.
从而有95%的把握认为x与y之间具有线性相关关系,求得的回归直线方程有意义.
因此2004年我国人口总数估计为13.23亿是合理的.
对于两个具有相关关系的变量,该如何进行线性回归分析?
探究小结
(1)画散点图大致判断两个变量间的相关性.
(3)在有意义的情况下求回归直线方程并根据回归直线方程进行预测.
(2)对两个变量进行相关性检验,如果
,表明有95%把握认为x与y之间具有线性相关关系.如果
,我们没有理由拒绝原来的假设.这时寻找回归直线方程是毫无意义的.
典型例题
例
为了了解某地母亲身高x与女儿身高y的相关关系,随机测得10对母女的身高如下表所示:
你能否预测当母亲身高为161cm时,女儿的身高为多少?
母亲身高x/cm
159
160
160
163
159
154
159
158
159
157
女儿身高y/cm
158
159
160
161
161
155
162
157
162
156
(1)作统计假设
:
x与y不具有线性相关关系.
(2)已知n=10,
根据小概率0.05与n-2=8,
在附表中查出
.
解:先对x与y作相关性检验:
n-2
小概率
0.05
0.01
1
0.997
1.000
2
0.950
0.990
3
0.878
0.959
4
0.811
0.917
5
0.754
0.874
6
0.707
0.834
7
0.666
0.798
8
0.632
0.765
9
0.602
0.735
10
0.576
0.708
从而有95%的把握认为x与y之间具有线性相关关系,
去求回归直线方程有意义.
(4)作统计判断
因为
,即
.
(3)由相关系数公式计算得:
(可以利用电子表格软件中的统计公式来计算)
(5)求回归直线方程
所以y对x的回归直线方程是
应用公式计算得:
当x=161时,
这就是说当母亲身高为161cm时,女儿的身高也接近161cm.
拓展提升
同学观察一种幼苗的生长情况,从观察之日起,第x天的高度为ycm,记录数据如下:
利用刚才所学知识,判断能否用一次函数描述y与x的关系?
第x天
1
4
9
16
25
36
49
高度y/cm
0
4
7
9
11
12
13
(1)作统计假设
:
x与y不具有线性相关关系.
(2)已知n=7,
根据小概率0.05与n-2=5,
在附表中查出
.
解:先对x与y作相关性检验:
n-2
小概率
0.05
0.01
1
0.997
1.000
2
0.950
0.990
3
0.878
0.959
4
0.811
0.917
5
0.754
0.874
6
0.707
0.834
7
0.666
0.798
8
0.632
0.765
9
0.602
0.735
10
0.576
0.708
所以,可以用一次函数描述y与x的关系.
(3)由相关系数公式计算得
因为
,即
.
(4)作统计判断
从而有95%的把握认为x与y之间具有线性相关关系,
去求回归直线方程有意义.
观察散点图
思考
除了用一次函数描述y与x的关系外,还可以用其他函数吗?具体该如何操作?
动手实践
作散点图、计算回归系数和相关系数的步骤都比较多,过程繁琐,大家可以尝试利用软件来完成,比如电子表格Excel
、动态数学软件GeoGebra等.
课堂小结
可以先从散点图观察大致趋势,再通过求相关系数并和临界值作比较,可以判断出两个变量是否具有线性相关关系,求得的回归直线方程是否有实际意义.
一、
如何对具有相关关系的两个变量进行线性回归分析?
收集数据
回归分析
经验规律
课堂小结
二、对两个变量的相关关系认识过程
经历了从感性认识上升到理性分析的过程.
课后作业
某农场对单位面积化肥用量x(kg)和水稻相应产量y(kg)的关系做了统计,得到数据如下:
(1)进行相关性检验;
(2)如果x与y之间具有线性相关关系,求出回归直线方程,并预测当单位面积化肥用量为32kg时,水稻的产量大约是多少?(精确到0.01kg)
x
15
20
25
30
35
40
45
y
330
345
365
405
445
450
455
我们知道,刑警如果能在案发现场提取到罪犯的脚印,那将获得一条重要的破案线索,其原因之一是人类的脚掌长度和身高存在着相关关系,可以根据一个人的脚掌长度来预测他的身高,同学们亲自体验回归分析的思想方法,提高自己的实践能力.
课后作业
数学建模的题目:
收集一些周围人们的脚掌长度及其身高,作为两个变量,画散点图、进行相关性检验,如果这两个变量之间具有线性相关关系,就求出回归直线方程、作一次预测并分析预测结果.
注意:1、如果脚掌长度不方便可以改量脚印的长度;
2、数据尽量取得分散一些.
课后作业