北师大版(2019)高中数学 选择性必修第一册 7.1 一元线性回归(课件+学案)(共80张PPT)

文档属性

名称 北师大版(2019)高中数学 选择性必修第一册 7.1 一元线性回归(课件+学案)(共80张PPT)
格式 zip
文件大小 3.8MB
资源类型 教案
版本资源 北师大版(2019)
科目 数学
更新时间 2021-07-17 20:26:01

文档简介

(共80张PPT)
§1 一元线性回归
第七章 统计案例
1.能结合实例,根据散点图,判断两个变量是否具有相关关系.
2.了解最小二乘法原理,会求线性回归方程,并能根据线性回
归方程进行预测.
学习目标
导语
恩格尔系数(Engel’s
Coefficient)是根据恩格尔定律得出的比例数,指居民家庭中食物支出占消费总支出的比重,是衡量生活水平高低的一个指标.其计算公式:恩格尔系数=食物支出金额÷总支出金额.
一个家庭收入越少,家庭收入中或者家庭总支出中用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中或者家庭支出中用来购买食物的支出所占比例将会下降.
恩格尔系数是预测生活水平高低的一个模型,那么当两个变量线性相关时,我们如何对成对样本数据建立一个模型进行预测?
随堂演练
课时对点练
一、直线拟合
二、一元线性回归方程
三、回归分析在实际问题中的应用
内容索引
一、直线拟合
问题 在一次对人体脂肪含量百分比和年龄的关系的研究中,研究人员获得了一组样本数据:
年龄
23
27
39
41
45
49
50
脂肪
9.5
17.8
21.2
25.9
27.5
26.3
28.2
年龄
53
54
56
57
58
60
61
脂肪
29.6
30.2
31.4
30.8
33.5
35.2
34.6
其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.根据上述数据,你能推断出人体的脂肪含量与年龄之间存在怎样的关系吗?
提示 画出散点图,散点图中的点散布在从左下角到右上角的区域,大致在一条直线附近,推断这两个变量之间存在线性关系.
知识梳理
1.上述问题中,各年龄与对应的脂肪含量构成一对数据(xi,yi),称为_________.这些点构成的图称为
.
2.如果变量之间存在着某种关系,这些点会有一个大致趋势,这种趋势通常可以用一条光滑的曲线来近似地描述,这样近似描述的过程称为__________.
3.若在两个变量X和Y的散点图中,所有点看上去都在一条直线附近波动,此时就可以用一条直线来近似地描述这两个量之间的关系,称之为_____
_____.
成对数据
散点图
曲线拟合
直线
拟合
注意点:(1)判断两个变量X和Y之间是否具有线性关系,常用的简便方法就是绘制散点图.
(2)散点图中包含的数据越多,效果就越好.
例1 某种木材体积与树木的树龄之间有如下的对应关系:
(1)请作出这些数据的散点图;
树龄
2
3
4
5
6
7
8
体积
30
34
40
60
55
62
70
解 以x轴表示树木的树龄,y轴表示树木的体积,可得相应的散点图如图所示:
(2)你能由散点图发现木材体积与树木的树龄近似成什么关系吗?
解 由散点图发现木材体积随着树龄的增加而呈增加的趋势,且散点落在一条直线附近,所以木材的体积与树龄成线性关系.
延伸探究 
1.若近似成线性相关关系,请画出一条直线来近似地表示这种线性相关关系.
解 近似拟合直线如图所示.
2.若该种木材每单位体积的价值是80元,作出木材的价值与树龄之间关系的散点图.
解 木材的价值与树龄之间的关系如表所示:
以x轴表示树木的树龄,y轴表示树木的价值,可得相应的散点图如图所示.
树龄
2
3
4
5
6
7
8
体积
30
34
40
60
55
62
70
价值
2
400
2
720
3
200
4
800
4
400
4
960
5
600
反思感悟 (1)绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
(2)准确理解回归分析的基本思想、基本方法,掌握回归分析的一些关键性词语,是解决这类问题的基础.
跟踪训练1 在下列所示的四个图中,图中的两个变量具有线性关系的是

解析 B选项中的点大致分布在一条直线附近.
二、一元线性回归方程
知识梳理
1.直线方程___________称作Y关于X的
,相应的直线称作Y关于X的

是这个
.
线性回归方程
回归直线
线性回归方程的系数
例2 某种产品的广告费支出X(单位:百万元)与销售额Y(单位:百万元)之间有如下对应数据:
X
2
4
5
6
8
Y
30
40
60
50
70
(1)画出散点图;
解 散点图如图所示.
样本点分布在一条直线附近,Y与X具有线性相关关系.
(2)求Y关于X的线性回归方程.
i
1
2
3
4
5
xi
2
4
5
6
8
yi
30
40
60
50
70
xiyi
60
160
300
300
560
4
16
25
36
64
解 列出下表,并用科学计算器进行有关计算.
于是所求的线性回归方程是Y=6.5X+17.5.
反思感悟 求线性回归方程的一般步骤
①收集成对数据,设为(xi,yi)(i=1,2,…,n)(数据一般由题目给出);
②作出散点图,确定x,y具有线性关系;
跟踪训练2 在一段时间内,某网店一种商品的销售价格X(单位:元)和日销售量Y(单位:件)之间的一组数据如下表:
求出Y关于X的线性回归方程.
价格X/元
22
20
18
16
14
日销售量Y/件
37
41
43
50
56
解 作出散点图(图略),
观察散点图可知这些点散布在一条直线的附近,
故可知x与y线性相关.
所以线性回归方程为Y=-2.35X+87.7.
三、回归分析在实际问题中的应用
例3 某地区2013年至2019年农村居民家庭人均纯收入Y(单位:千元)的数据如下表:
(1)求Y关于T的线性回归方程;
年份
2013
2014
2015
2016
2017
2018
2019
年份代号T
1
2
3
4
5
6
7
人均纯收入Y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
解 由所给数据计算得
=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,
所求线性回归方程为Y=0.5T+2.3.
(2)利用(1)中的线性回归方程,分析2013年至2019年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2022年农村居民家庭人均纯收入.
解 由(1)知,
=0.5>0,故2013年至2019年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.
将2022年的年份代号代入(1)中的线性回归方程,得0.5×10+2.3=7.3,
故预测该地区2022年农村居民家庭人均纯收入为7.3千元.
反思感悟 (1)解决问题时应首先对X,Y进行相关性检验,如果两个变量之间本身不具有相关关系或者它们之间的相关关系不显著,即使求出线性回归方程进行估计和预测的量也是不可信的.
跟踪训练3 随着西部大开发的深入,西南地区的大学越来越受到广大考生的青睐,下表是西南地区某大学近五年的录取平均分高于省一本线分值对比表:
(1)根据上表数据可知,Y与T之间存在线性关系,求Y关于T的线性回归方程;
年份
2015
2016
2017
2018
2019
年份代码T
1
2
3
4
5
录取平均分高于省一本线分值Y
28
34
41
47
50
=(-2)×(-12)+(-1)×(-6)+0×1+1×7+2×10=57,
=(-2)2+(-1)2+02+12+22=10,
故所求线性回归方程为Y=5.7T+22.9.
(2)假设2022年该省一本线为520分,利用(1)中求出的线性回归方程预测2022年该大学录取平均分.
解 由(1)预测该大学2022年的录取平均分为
520+5.7×8+22.9=588.5.
1.知识清单:
(1)散点图、直线拟合.
(2)一元线性回归方程及应用.
2.方法归纳:数形结合、公式法.
3.常见误区:用最小二乘法求
时,两公式易混淆.
课堂小结
随堂演练
1.(多选)如图四个散点图中,适合用直线拟合其中两个变量的是
1
2
3
4

解析 由图易知AC两个图中样本点在一条直线附近,因此适合用直线拟合两个变量.

2.下表是X和Y之间的一组数据,则Y关于X的回归直线必过点
A.(2,3)
B.(1.5,4)
C.(2.5,4)
D.(2.5,5)
1
2
3
4

X
1
2
3
4
Y
1
3
5
7
1
2
3
4
3.已知具有线性关系的两个变量X,Y之间的一组数据如下,且线性回归方程是Y=0.95X+
,则当X=6时,Y的预测值为
A.8.4
B.8.3 
C.8.2
D.8.1
X
0
1
2
3
4
Y
2.2
4.3
4.5
4.8
6.7

1
2
3
4
∴线性回归方程是Y=0.95X+2.6,
当X=6时,Y的预测值为0.95×6+2.6=8.3.
4.设有一个线性回归方程为Y=2-1.5X,则变量X每增加一个单位时,Y平均减少______个单位.
1
2
3
4
1.5
课时对点练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1.已知变量X,Y之间具有线性关系,其散点图如图所示,则其线性回归方程可能为
A.Y=1.5X+2
B.Y=-1.5X+2
C.Y=1.5X-2
D.Y=-1.5X-2

基础巩固
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
2.已知线性回归方程为
且样本点的中心为(1,2),则
线性回归方程为
A.Y=X+3
B.Y=-2X+3
C.Y=-X+3
D.Y=X-3

解析 回归直线一定过样本点的中心.
3.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得Y=0.577X-0.448(X为人的年龄,Y为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是
A.年龄为37岁的人体内脂肪含量一定为20.90
B.年龄为37岁的人体内脂肪含量约为21.01
C.年龄为37岁的人群中的体内脂肪含量平均为20.90
D.年龄为37岁的人群中的大部分人的体内脂肪含量约为31.5

解析 当X=37时,Y=0.577×37-0.448=20.901≈20.90,由此估计,年龄为37岁的人群中的体内脂肪含量平均为20.90.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
4.已知X与Y之间的一组数据:
已求得关于Y与X的线性回归方程为Y=2.2X+0.7,则m的值为
A.1
B.0.85
C.0.7
D.0.5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

X
0
1
2
3
Y
m
3
5.5
7
将其代入Y=2.2X+0.7,
可得m=0.5,故选D.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
5.已知表中Y与X之间的线性回归方程是
A.-0.5
B.-0.6 
C.-0.7
D.-0.8
X
1
2
3
4
Y
4.5
4
3
2.5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
6.(多选)已知在最小二乘法原理下,具有相关关系的变量X,Y之间的线性回归方程为Y=-0.7X+10.3,且变量X,Y之间的相关数据如下表所示,则下列说法错误的是
A.变量X,Y之间呈现正相关关系
B.可以预测,当X=20时,Y=3.7
C.可求得表中m=4.7
D.由表格数据知,该回归直线必过点(9,4)



X
6
8
10
12
Y
6
m
3
2
解析 由X与Y的线性回归方程可知,
回归系数为-0.7,且-0.7<0,
∴变量X,Y之间呈现负相关关系,故A错误;
当X=20时,Y=-0.7×20+10.3=-3.7,故B错误;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解得m=5,故C错误;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
∴回归直线必过点(9,4),故D正确.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
7.某工厂对某产品的产量与成本的资料分析后有如下数据:
由表中数据得到的线性回归方程
,则预测当产量为9千件时,成本约为______万元.
产量X(千件)
2
3
5
6
成本Y(万元)
7
8
9
12
14.5
∴当产量为9千件时,成本约为1.1×9+4.6=14.5.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
8.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩Y对总成绩X的线性回归方程为Y=6+0.4X.由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差________分.
20
解析 令两人的总成绩分别为x1,x2,
则对应的数学成绩估计为y1=6+0.4x1,y2=6+0.4x2,
所以|y1-y2|=|0.4(x1-x2)|=0.4×50=20.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
9.某单位为了了解用电量Y(度)与气温X(℃)之间的关系,随机统计了某4天的用电量与当天气温如下表:
(1)求用电量Y与气温X的线性回归方程;
气温X(℃)
14
12
8
6
用电量Y(度)
22
26
34
38
所以线性回归方程为Y=-2X+50.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
(2)由(1)的方程预测气温为5
℃时,用电量的度数.
解 由(1)中的线性回归方程预测当气温是5
℃时,用电量是-2×5+50=40(度).
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
10.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,
故所求线性回归方程为Y=0.3X-0.4.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
(2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
解 由(1)中得到的线性回归方程,知若该居民区某家庭月收入为7千元时,可以预测家庭的月储蓄约为0.3×7-0.4=1.7(千元).
11.在2020年5月1日,某市物价部门对本市的5家商场某商品的一天销售量及其价格进行了调查,5家商场的售价X(元)和销售量Y(件)之间的一组数据如表所示:
由散点图可知,销售量
Y与价格X之间有较好的
线性相关关系,其线性回归方程是
A.-24
B.35.6 
C.40.5
D.40
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

价格X(元)
9
9.5
10
10.5
11
销售量Y(件)
11
10
8
6
5
综合运用
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
12.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量Y(单位:万盒)的数据如表所示:
若x,y线性相关,线性回归方程为Y=0.7X+
,估计该制药厂6月份生产甲胶囊产量约为
A.8.0万盒
B.8.1万盒
C.8.9万盒
D.8.6万盒

X(月份)
1
2
3
4
5
Y(万盒)
5
5
6
6
8
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解析 回归直线一定过样本点的中心.
即线性回归方程为Y=0.7X+3.9.
所以6月份产量约为0.7×6+3.9=8.1(万盒),故选B.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
13.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了8次试验,收集数据如下表:
设线性回归方程为
在直线x-45y-20=0的_____方.
零件个数
10
20
30
40
50
60
70
80
加工时间
62
68
75
81
89
95
102
108
右下
解析 由题意可得,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
14.某国产芯片车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),用最小二乘法求得线性回归方程为Y=0.62X+46.4.现发现表中有一个数据模糊不清,则该数据的值为________.
零件数x(个)
10
20
30
40
50
加工时间y(min)
52
?
65
70
78
60
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
设这个模糊不清的数为a,则有
解得a=60.
故选D.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
15.已知成对数据(x1,y1),(x2,y2),(x3,y3),…,(x7,y7),用最小二乘法得到其线性回归方程为Y=-2X+4,若数据x1,x2,x3,…,x7的平均
数为1,则
等于
A.2
B.11
C.12
D.14

拓广探究
(1)求Z关于T的线性回归方程;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
16.某地随着经济的发展,居民收入逐年增长,该地一银行连续五年年底的储蓄存款情况如下表所示.
为了计算方便,工作人员将上表的数据进行了处理,令T=X-2
014,Z=Y-5,得到下表.
T
1
2
3
4
5
Z
0
1
2
3
5
年份X
2015
2016
2017
2018
2019
储蓄存款额Y/千亿元
5
6
7
8
10
所以Z关于T的线性回归方程为Z=1.2T-1.4.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解 Z=1.2T-1.4,
代入T=X-2
014,Z=Y-5,
得Y-5=1.2(X-2
014)-1.4,
即Y=1.2X-2
413.2.
故Y关于X的线性回归方程为Y=1.2X-2
413.2.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
(2)通过(1)中的方程,求出Y关于X的线性回归方程;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解 由(1)中的线性回归方程,预测到2022年年底,该地此银行储蓄存款额可达到1.2×2
022-2
413.2=13.2(千亿元).
(3)用所求线性回归方程预测到2022年年底,该地此银行储蓄存款额可达到多少?
同课章节目录