9.1.1-2变量的相关性、线性回归方程-2021-2022学年高二数学同步备课系列(苏教版2019选择性必修第二册)

文档属性

名称 9.1.1-2变量的相关性、线性回归方程-2021-2022学年高二数学同步备课系列(苏教版2019选择性必修第二册)
格式 zip
文件大小 1.3MB
资源类型 教案
版本资源 苏教版(2019)
科目 数学
更新时间 2022-03-11 11:46:31

文档简介

(共22张PPT)
9.1.2线性回归方程
学习目标
1.通过对典型案例的探究线性回归方程;
2.会用线性回归方程进行实际预测;
3.进一步了解线性回归分析的基本思想和方法.
情景创设
情景1:某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:
气温/0C 26 18 13 10 4 -1
杯数 20 24 34 38 50 64
如果某天的气温是-50C,你能根据这些数据预测这天小卖部卖出热茶的杯数吗
情景创设
年龄
脂肪
0
20
25
30
35
40
45
50
55
60
65
5
10
15
20
25
30
35
40
你能预测37岁时的脂肪含量吗
情景2:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:
年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
53 54 56 57 58 60 61
29.6 30.2 31.4 30.8 33.5 35.2 34.6
前一课时, 我们画出了人体脂肪含量与年龄的散点图. 同学们又画出了习题中的散点图, 这些散点图中的样本点从整体上看, 大致在一条直线附近, 我们就称这两个变量之间具有线性相关关系, 这条直线叫做回归直线.
怎样得到这条回归直线的方程呢
数学探究
方案1、在图中选两点作直线,使直线两侧的点的个数基本相同。
年龄
脂肪
0
20
25
30
35
40
45
50
55
60
65
5
10
15
20
25
30
35
40
数学探究
方案2、如果多取几对点,确定多条直线,再求出这些直线的斜率和截距的平均值作为回归直线的斜率和截距。而得回归方程。
年龄
脂肪
0
20
25
30
35
40
45
50
55
60
65
5
10
15
20
25
30
35
40
数学探究
方案3、先画出一条直线,测量出各点与它的距离,再移动直线,到达一个使距离的和最小时,测出它的斜率和截距,得回归方程。
年龄
脂肪
0
20
25
30
35
40
45
50
55
60
65
5
10
15
20
25
30
35
40
数学探究
方案4(待定系数法)回归直线的方程是一次函数, 即设为 y = bx+a 的形式, 关键是求出斜率 b和截距 a.
年龄
脂肪
0
20
25
30
35
40
45
50
55
60
65
5
10
15
20
25
30
35
40
(x1, y1)
(x2, y2)
(xi, yi)
所有点到直线的距离的和最小时,此时的斜率b和截距a,得回归方程。
表示各点到回归线
若所有纵距离之和最小,
则从整体上看, 各点与直线的距离最小.
的纵距离,
=|y1-bx1-a|+|y2-bx2-a|+…+|yn-bxn-a|
由于绝对值不易计算, 就改用平方, 即
= (y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2
数学建构
经过推导可得:
即要使 Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2最小, a, b 应取什么值
求出 a, b 的值, 就得到回归方程
这种使样本数据各点到回归直线的距离的平方和最小来得到回归直线的方法叫做最小二乘法.
数学应用
如某人37岁, 将 x = 37 代入回归方程
≈20.90,

即这个人的体内脂肪含量约为20.90%左右.
你能预测37岁时的脂肪含量吗
例1:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:
年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
53 54 56 57 58 60 61
29.6 30.2 31.4 30.8 33.5 35.2 34.6
数学应用
练、为了对公式的理解, 我们求下面两个变量的线性回归方程, 并估计当数学为98分成绩时, 物理可能是多少分的成绩.
数学 87 95 62 78 70 65
物理 82 89 64 75 68 66
斜率
≈0.56,
截距
=74-0.56 74.5
=32.28.
∴回归方程为:
解:
当 x=98 时,
≈87
当数学为98分成绩时, 估计物理可能是87分的成绩.
数学应用
数学应用
课堂小结
1、求回归直线方程的步骤
第一步:列表;
第四步:写出回归直线方程.
2、回归方程的应用
预测
课堂达标
1.三点(3,10),(7,20),(11,24)的线性回归方程是 ( )
D
课堂达标
2.以下四个散点图中,两个变量的关系适合用线性回归模型刻画的是(  )
A.①② B.①③ C.②③ D.③④
答案:B
课堂达标
3.(多选)有关线性回归的说法,正确的是(  )
A.相关关系的两个变量不是因果关系
B.散点图能直接反映数据的相关程度
C.回归直线最能代表线性相关的两个变量之间的关系
D.任意一组数据都有回归方程
答案:ABC
课堂达标
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
答案:D
课堂达标
5.对具有线性相关关系的变量x和Y,测得一组数据如下表:
若已求得它们的回归直线方程的斜率为6.5,则这条回归直线方程为    .
x 2 4 5 6 8
Y 30 40 60 50 70
情景引入
谢 谢 观 看
课后探究
第x天 1 4 9 16 25 36 49
高度y/cm 0 4 7 7 11 12 13
课后探究
课后探究
非线性回归模型的分析步骤:
1.绘制散点图
2.观察散点图,选取适合的函数模型,通过换元法转化成线性回归模型并转化数据
3.求换元后的回归直线方程
4.建立非线性回归模型(共17张PPT)
9.1.1变量的相关性
学习目标
1.能通过收集现实问题中两个有关联的变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;
2.线性相关的强弱数量化;
3.通过对典型案例了解线性回归分析的基本思想和方法;
情景创设
问题 1. (1) 两个变量 x, y 满足 y = 2x, x、y 之间是否相互影响, 它们存在一个什么样的关系
(2) 数学成绩的好坏与物理成绩的好坏是否相互有影响, 它们之间存在一个什么样的关系
(1) 和 (2) 的两个问题有什么相同和不同
(1) x 一变化, y 就随之而变化, 且是随 x 的 2 倍变化.同样, y 一变化, x 也就随着
变化, 且值确定.
(2)数学成绩不好, 物理成绩就可能好不起来;
数学成绩好, 物理成绩就可能会好.
数学成绩的好坏对物理成绩有影响. 但影响有多大?
这不像问题(1)那么确定, 还与其他因素有关, 对有些人影响较大, 而对另一些
人可能影响不十分大.
数学建构
这两个关系又有它的不同.
(1) 中的两个变量的关系非常确定, 而(2)中的两个变量间的关系不确定, 存在不同的情况, 即不确定因素.
(1) 中的两个变量互相影响, 一个变量的变化会引起另一个变量确定性的变化.
(2) 中也有这样的一个关系, 两个变量之间相互存在着一定的影响作用.
问题 1. (1) 两个变量 x, y 满足 y = 2x, x、y 之间是否相互影响, 它们存在一个什么样的关系
(2) 数学成绩的好坏与物理成绩的好坏是否相互有影响, 它们之间存在一个什么样的关系
(1) 和 (2) 的两个问题有什么相同和不同
数学建构
两个变量相互间有一定影响, 我们就说这两个变量之间存在着一定的相关关系.
两个变量之间, 除了像函数这样有确定的关系外,在现实生活中, 存在着许多不确定的相关关系的问题.你能举一些例子吗
(1) 商品销售收入与广告支出经费之间的关系.
(2) 粮食产量与施肥量的关系.
(3) 开发一项产品的投入与产出的关系.
(4) 个人的教育投资与收入的关系.
要分析这些关系的大小、强弱, 一是凭经验粗略估计; 二是发挥统计知识的作用, 用一些有说服力的数据来确定变量之间的相关关系.
如:
(5)人体内的脂肪含量与年龄之间的关系.
数学探究
问题2: 人体的脂肪含量与年龄存在相关关系, 那么这两个变量间是怎样的一个相关关系呢 这个相关关系可以用数或式的形式表示吗
下面是对不同年龄进行抽样调查得到的一组数据,我们由这组数据讨论脂肪含量与年龄的相关关系.
年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
人体的脂肪百分比和年龄调查数据表:
年龄 53 54 56 57 58 60 61
脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
数学探究
年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
年龄 53 54 56 57 58 60 61
脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
借助坐标系, 作出这些数据的散点图:
年龄
脂肪
0
20
25
30
35
40
45
50
55
60
65
5
10
15
20
25
30
35
40
此散点图有两特点:
(2) 从左到右在升高, 左低右高.
(1) 在某一条直线附近.
线性相关
正相关
负相关:如果散点图是从左到右下降, 即左高右低, 则称为两变量成.
数学应用
正相关
(2)吸烟有害健康
负相关
(3)高原含氧量与海拔高度
负相关
(4)学习的努力程度与学习成绩
正相关
练1:判断下列各题属于哪种相关关系?
(1)某工厂一月份总成本与该月总产量
数学应用
数学建构
散点图说明
3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.
1)如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.
2)如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.
散点图:用来判断两个变量是否具有相关关系.
数学探究
问题3. 两个变量线性相关性的强弱由什么可以看出 强弱程度由什么数据能刻划出来
数学探究
数学探究
x
0
y
数学探究
x
0
y
数学探究
x
0
y
数学探究
x
0
y
数学建构
在统计中, 常用相关系数 r 来衡量两个变量之间线性相关的强弱, r 的公式为
当 r >0时, 表明变量 x 和 y 正相关; 当 r <0时, 表明两变量之间负相关.
当|r|>0.5 时, 认为相关很强; |r|<0.30时, 认为几乎没有相关性;
当|r|越接近于1, 相关性越强; 越接近于 0, 相关性越弱.
情景引入
谢 谢 观 看