北师大版高中数学选择性必修第一册第七章统计案例1.1直线拟合1.2一元线性回归方程课件+学案+练习+答案

文档属性

名称 北师大版高中数学选择性必修第一册第七章统计案例1.1直线拟合1.2一元线性回归方程课件+学案+练习+答案
格式 zip
文件大小 7.7MB
资源类型 试卷
版本资源 北师大版(2019)
科目 数学
更新时间 2025-07-07 10:49:48

文档简介

§1 一元线性回归
1.1 直线拟合
1.2 一元线性回归方程
学习任务 核心素养
1.通过实例掌握回归分析的基本思想方法.(难点) 2.会利用最小二乘法求线性回归方程,并能用线性回归方程进行预报.(重点) 通过线性回归方程的应用,培养数学建模与数据分析素养.
圆的周长l与半径r是什么关系?父亲的身高与儿子的身高之间有何关系?这两个问题有什么不同?
1.变量之间的相关关系
(1)变量之间有一定的联系,但不能完全用函数来表达.如人的体重y与身高x.一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系.相关关系是非确定性关系,因变量的取值具有一定的随机性.
(2)在考虑两个变量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将成对数据(xi,yi)所对应的点描出来,这些点构成的图称为散点图.
(3)在两个变量X和Y的散点图中,若所有点看上去都在一条光滑的曲线附近波动,此时就可以用这条曲线近似地描述这两种变量之间的关系,该过程称为曲线拟合;若所有点看上去都在一条直线附近波动,此时就可以用这条直线近似地描述这两种变量之间的关系,该过程称之为直线拟合.
2.最小二乘法
如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用来刻画这些点与直线Y=a+bX的接近程度,使得上式达到最小值的直线Y=a+bX就是要求的直线,这种方法称为最小二乘法.
3.线性回归方程
假设成对数据为(x1,y1),(x2,y2),…,(xn,yn),其线性回归方程为Y=+X,则
=,=-.
在线性回归方程Y=+X中,当一次项系数为正数时,其散点图有什么特征?
[提示] 在散点图上自左向右看这些点呈上升趋势.
1.思考辨析(正确的画“√”,错误的画“×”)
(1)正方体的体积V与其边长a是函数关系. (  )
(2)西瓜藤的长短与西瓜的产量不是函数关系. (  )
(3)散点图可以粗略地判断两个变量是否具有线性相关关系. (  )
(4)在求线性回归方程之前,应先判断这两个变量是否具有线性相关关系. (  )
[答案] (1)√ (2)√ (3)√ (4)√
2.根据下表中的数据,得到的线性回归方程为Y=X+9,则=(  )
X 4 5 6 7 8
Y 5 4 3 2 1
A.2   B.1
C.0   D.-1
D [由题意可得=×(4+5+6+7+8)=6,=×(5+4+3+2+1)=3,∵线性回归方程为Y=X+9且过点(6,3),∴3=6+9,解得=-1.]
3.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到如下数据:
天数X/天 3 4 5 6 7
繁殖个数Y/万个 2.5 3 4 4.5 c
若已知线性回归方程为Y=0.85X-0.25,则表中c的值为________.
6 [==,代入线性回归方程,得=0.85×5-0.25,所以c=6.]
类型1 散点图及其应用
【例1】 5个学生的数学和物理成绩如下表:
学生 A B C D E
数学 80 75 70 65 60
物理 70 66 68 64 62
画出散点图,并判断它们是否有相关关系.
[思路点拨] 可以以数学成绩为自变量,考查因变量物理成绩的变化趋势.
[解] 以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图.
由散点图可见,两者之间具有相关关系.
 判断变量之间有无相关关系,一种常用的方法是绘制散点图,散点图是分析研究两个变量相关关系的重要手段.从散点图中,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量是线性相关的,否则不是线性相关.
[跟进训练]
1.李老师为了了解学生的计算能力,对某同学进行了10次试验,收集数据如下:
题数X/道 5 10 15 20 25 30 35 40 45 50
做题时间Y/分钟 9 19 26 37 48 52 61 73 81 89
画出散点图,并判断它们是否有线性相关关系.
[解] 散点图如图,由散点图可以看出,两者之间具有线性相关关系.
类型2 求线性回归方程
【例2】 某研究机构对高三学生的记忆力X和判断力Y进行统计分析,得下表数据:
X 6 8 10 12
Y 2 3 5 6
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出Y关于X的线性回归方程Y=X+.
[解] (1)散点图如图.
(2)因为==9,
==4,
xiyi=6×2+8×3+10×5+12×6=158,
=62+82+102+122=344,
所以===4-0.7×9=-2.3,
故线性回归方程为Y=0.7X-2.3.
 求线性回归方程的步骤
[跟进训练]
2.某个服装店经营某种服装,在某周内纯获利Y(单位:元)与该周每天销售这种服装件数X之间的一组数据如下表:
X 3 4 5 6 7 8 9
Y 66 69 73 81 89 90 91
(1)求样本点的中心;
(2)画出散点图;
(3)求纯获利Y与每天销售件数X之间的线性回归方程.
[解] (1)≈79.86,样本点的中心为(6,79.86).
(2)散点图如图.
(3)因为xiyi=3 487=280,
所以==≈4.75.
=≈79.86-4.75×6=51.36,
所以Y=4.75X+51.36.
类型3 线性回归分析的应用
【例3】 某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价X(X取整数)(单位:元)与日销售量Y(单位:台)之间有如下关系:
X 35 40 45 50
Y 56 41 28 11
(1)画出散点图,并判断Y与X是否具有线性相关关系;
(2)求日销售量Y对销售单价X的线性回归方程;(取整数)
(3)设经营此商品的日销售利润为P元,根据(2)写出P关于X的函数关系式,并预测当销售单价X为多少元时,才能获得最大日销售利润.
[解] (1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.
(2)因为=×(35+40+45+50)=42.5,=×(56+41+28+11)=34.
xiyi=35×56+40×41+45×28+50×11=5 410.
=352+402+452+502=7 350.
所以≈-3.
==34-(-3)×42.5=161.5.
所以线性回归方程为Y=161.5-3X.
(3)依题意,有P=(161.5-3X)(X-30)=-3X2+251.5X-4 845=-3+-4 845.
所以当X=≈42时,P有最大值,约为426元.
即预测当销售单价为42元时,能获得最大日销售利润.
 对两个变量进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数,的计算公式,算出,.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误.
[跟进训练]
3.在一段时间内,某种商品的价格X(单位:万元)和需求量Y(单位:t)之间的一组数据如下表所示:
价格X 1.4 1.6 1.8 2 2.2
需求量Y 12 10 7 5 3
(1)画出散点图;
(2)求出Y对X的线性回归方程;
(3)如价格定为1.9万元,预测需求量大约是多少.
[解] (1)散点图如图所示.
(2)采用列表的方法计算与回归系数.
序号 xi yi xiyi
1 1.4 12 1.96 16.8
2 1.6 10 2.56 16
3 1.8 7 3.24 12.6
4 2 5 4 10
5 2.2 3 4.84 6.6
∑ 9 37 16.6 62
×9=1.8×37=7.4,
=-11.5,
=7.4+11.5×1.8=28.1.
所以Y对X的线性回归方程为Y=28.1-11.5X.
(3)当X=1.9时,Y=28.1-11.5×1.9=6.25,所以价格定为1.9万元时,需求量大约是6.25 t.
1.对具有线性相关关系的两个变量建立的线性回归方程Y=+X中,线性回归方程系数(  )
A.可以小于0   B.只能大于0
C.可能等于0   D.只能小于0
A [可能大于0,也可能小于0,但当=0时,X,Y不具有线性相关关系.]
2.有下列说法:
①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;
②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;
③通过线性回归方程Y=X+可以估计观测变量的取值和变化趋势;
④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.
其中正确命题的个数是(  )
A.1   B.2
C.3   D.4
C [①②③正确.]
3.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是(  )
A.=0.4x+2.3
B.=2x-2.4
C.=-2x+9.5
D.=-0.3x+4.4
A [因为变量x和y正相关,则回归直线的斜率为正,故可以排除选项C和D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A和B中的直线方程进行检验,可以排除B.]
4.某研究机构对儿童记忆能力X和识图能力Y进行统计分析,得到如表数据:
记忆能力X 4 6 8 10
识图能力Y 3 5 6 8
由表中数据,求得线性回归方程为Y=0.8X+,当某儿童的记忆能力为12时,预测他的识图能力为________.
9.5 [因为==5.5,所以5.5=0.8×7+,所以=-0.1.
当X=12时,Y=0.8×12-0.1=9.6-0.1=9.5.]
5.已知一个线性回归方程为Y=1.5X+45,X∈{1,7,5,13,19},求.
[解] 由已知可知:==9.
又∵回归直线过点(),
∴=1.5×9+45=58.5.
1.判断变量之间有无相关关系,简便可行的方法就是绘制散点图.根据散点图,可看出两个变量是否具有相关关系,是否线性相关.
2.求线性回归方程时应注意的问题
(1)应首先进行相关性检验.如果两个变量之间不具有线性相关关系,或者说它们之间的线性相关关系不显著,即使求出线性回归方程也是毫无意义的,用其估计和预测的值也是不可信的.
(2)用公式计算,的值时,要先算出,然后才能算出.
3.利用线性回归方程,我们可以进行估计和预测.若线性回归方程为Y=X+,则X=x0处的估计值为y0=x0+.
课时分层作业(四十六) 一元线性回归
一、选择题
1.下表是X和Y之间的一组数据,则Y关于X的回归直线必过点(  )
X 1 2 3 4
Y 1 3 5 7
A.(2,3)   B.(1.5,4)
C.(2.5,4)   D.(2.5,5)
C [线性回归方程必过样本点的中心(),即(2.5,4),故选C.]
2.已知变量X和Y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是(  )
A.Y=0.4X+2.3   B.Y=2X-2.4
C.Y=-2X+95   D.Y=-0.3X+4.4
A [因为变量X和Y正相关,则回归直线的斜率为正,故可以排除选项C和D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A和B中的直线方程进行检验,可以排除B,故选A.]
3.已知线性回归方程Y=4.4X+0.5.则可估计x与y的增长速度之比约为(  )
A.    B.    C.    D.2
A [x每增长1个单位,y增长4.4个单位,故增长的速度之比约为=,
事实上所求的比值为线性回归方程斜率的倒数.]
4.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到线性回归方程Y=X+,那么下列说法中不正确的是(  )
A.直线Y=X+必经过点()
B.直线Y=X+至少经过点(x1,y1)(x2,y2),…,(xn,yn)中的一个点
C.直线Y=X+的斜率为
D.直线Y=X+的纵截距为-
B [线性回归直线可以不经过样本数据中的任何一个点.∴B错误;由=代入线性回归方程得),故A正确;由,计算公式可知,CD正确.]
5.一位母亲记录了儿子3岁~9岁的身高,由此建立的身高Y(单位:cm)与年龄X(单位:岁)的回归模型为Y=7.19X+73.93.用这个模型预测这个孩子10岁时的身高,则下列叙述正确的是(  )
A.身高一定是145.83 cm
B.身高在145.83 cm以上
C.身高在145.83 cm以下
D.身高在145.83 cm左右
D [X=10时,Y=7.19×10+73.93=145.83,但这是预测值,而不是精确值,所以只能选D.]
二、填空题
6.从某大学随机选取8名女大学生,其身高X(单位:cm)和体重Y(单位:kg)的线性回归方程为Y=0.849X-85.712,则身高172 cm的女大学生,由线性回归方程可以预测其体重约为________.
60.316 kg [将X=172代入线性回归方程,有Y=0.849×172-85.712=60.316(kg).]
7.双十一是指由电子商务为代表的,在全中国范围内兴起的大型购物促销狂欢节.已知某一家具旗舰店近年来双十一的成交额如下表:
年份 2019 2020 2021 2022 2023
年份代号T 1 2 3 4 5
成交额Y/万元 50 60 70 80 100
若Y关于T的线性回归方程为Y=12T+,则根据线性回归方程预测该店2025年双十一的成交额是______万元.
120 [由表格中数据得,==3,
==72,
于是得线性回归方程Y=12T+经过样本点的中心(3,72),
即有72=12×3+,解得=36,
从而得线性回归方程为Y=12T+36,
当T=7时,Y=12×7+36=120,
所以预测该店2025年双十一的成交额是120万元.]
8.“一盔一带”安全守护行动在全国各地展开,某地交警部门加强执法管理期间,对某路口不带头盔的骑行者进行了统计,得到如下数据(其中Y表示第X天不戴头盔的人数):
X 1 2 4 8
Y 117 51 34 7
若Y关于X的线性回归方程为Y=+,则=________.
-4 [根据表格数据,令t=,
则==,
==,
∵样本点的中心()在线性回归方程上,
∴+120×=,可得=-4.]
三、解答题
9.某公司的生产部门调研发现,该公司第二、三季度的月用电量Y与月份X线性相关,且数据统计如下:
月份 4 5 6 7 8 9
月用电量/(千瓦时/月) 6 16 27 55 46 56
但核对电费报表时发现一组数据统计有误.
(1)请指出哪组数据有误,并说明理由;
(2)在排除有误数据后,求月用电量与月份之间的线性回归方程Y=X+,并预测统计有误那个月份的用电量.(结果精确到0.1)
[解] (1)作散点图如图所示.因为用电量与月份之间线性相关,所以散点图的样本点分布在回归直线附近比较窄的带状区域内,而点(7,55)离其他点所在区域较远,故(7,55)这组数据有误.
(2)排除(7,55)这一组有误数据后,计算得=30.2.
因为=≈9.98,
=≈-33.67,
所以线性回归方程为Y=9.98X-33.67,
当X=7时,Y≈36.2,
即7月份的用电量大约为36.2千瓦时.
10.根据如下样本数据
X 3 4 5 6 7 8
Y 4.0 2.5 -0.5 0.5 -2.0 -3.0
得到的线性回归方程为Y=X+,则(  )
A.>0,>0   B.>0,<0
C.<0,>0   D.<0,<0
B [由表中数据画出散点图,如图,
由散点图可知<0,>0.]
11.为了研究某种病毒在特定环境下随时间变化的繁殖情况,得到了一些数据,绘制成散点图,发现用模型y=cekx拟合比较合适.令z=ln y,得到z=1.3x+,经计算发现x,z满足下表,则k=________,c=________.
天数x(天) 2 3 4 5 6
z 1.5 4.5 5.5 6.5 7
1.3 e-0.2 [由表知,=×(2+3+4+5+6)=4,=×(1.5+4.5+5.5+6.5+7)=5,
由z=1.3x+恒过点(),
知5=1.3×4+,
解得=-0.2,
∴z=1.3x-0.2,
即ln y=1.3x-0.2,
∴y=e1.3x-0.2=e-0.2·e1.3x,
∴k=1.3,c=e-0.2.]
12.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日每天的昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:
日期 12月1日 12月2日 12月3日 12月4日 12月5日
温差X(℃) 10 11 13 12 8
发芽数Y(颗) 23 25 30 26 16
该农科所确定的研究方案是:先从这5组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.
(1)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出Y关于X的线性回归方程Y=X+;
(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?
[解] (1)由数据求得,=27.
由公式求得,=,==-3.
所以Y关于X的线性回归方程为Y=X-3.
(2)当X=10时,Y=×10-3=22,|22-23|<2;
当X=8时,Y=×8-3=17,|17-16|<2.
所以该研究所得到的线性回归方程是可靠的.
21世纪教育网(www.21cnjy.com)课时分层作业(四十六) 一元线性回归
说明:选择题每题5分,填空题每题5分,本试卷共80分
一、选择题
1.下表是X和Y之间的一组数据,则Y关于X的回归直线必过点(  )
X 1 2 3 4
Y 1 3 5 7
A.(2,3)   B.(1.5,4)
C.(2.5,4)   D.(2.5,5)
2.已知变量X和Y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是(  )
A.Y=0.4X+2.3   B.Y=2X-2.4
C.Y=-2X+95   D.Y=-0.3X+4.4
3.已知线性回归方程Y=4.4X+0.5.则可估计x与y的增长速度之比约为(  )
A.    B.    C.    D.2
4.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到线性回归方程Y=X+,那么下列说法中不正确的是(  )
A.直线Y=X+必经过点()
B.直线Y=X+至少经过点(x1,y1)(x2,y2),…,(xn,yn)中的一个点
C.直线Y=X+的斜率为
D.直线Y=X+的纵截距为-
5.一位母亲记录了儿子3岁~9岁的身高,由此建立的身高Y(单位:cm)与年龄X(单位:岁)的回归模型为Y=7.19X+73.93.用这个模型预测这个孩子10岁时的身高,则下列叙述正确的是(  )
A.身高一定是145.83 cm
B.身高在145.83 cm以上
C.身高在145.83 cm以下
D.身高在145.83 cm左右
二、填空题
6.从某大学随机选取8名女大学生,其身高X(单位:cm)和体重Y(单位:kg)的线性回归方程为Y=0.849X-85.712,则身高172 cm的女大学生,由线性回归方程可以预测其体重约为________.
7.双十一是指由电子商务为代表的,在全中国范围内兴起的大型购物促销狂欢节.已知某一家具旗舰店近年来双十一的成交额如下表:
年份 2019 2020 2021 2022 2023
年份代号T 1 2 3 4 5
成交额Y/万元 50 60 70 80 100
若Y关于T的线性回归方程为Y=12T+,则根据线性回归方程预测该店2025年双十一的成交额是______万元.
8.“一盔一带”安全守护行动在全国各地展开,某地交警部门加强执法管理期间,对某路口不带头盔的骑行者进行了统计,得到如下数据(其中Y表示第X天不戴头盔的人数):
X 1 2 4 8
Y 117 51 34 7
若Y关于X的线性回归方程为Y=+,则=________.
三、解答题
9.某公司的生产部门调研发现,该公司第二、三季度的月用电量Y与月份X线性相关,且数据统计如下:
月份 4 5 6 7 8 9
月用电量/(千瓦时/月) 6 16 27 55 46 56
但核对电费报表时发现一组数据统计有误.
(1)请指出哪组数据有误,并说明理由;
(2)在排除有误数据后,求月用电量与月份之间的线性回归方程Y=X+,并预测统计有误那个月份的用电量.(结果精确到0.1)
10.根据如下样本数据
X 3 4 5 6 7 8
Y 4.0 2.5 -0.5 0.5 -2.0 -3.0
得到的线性回归方程为Y=X+,则(  )
A.>0,>0   B.>0,<0
C.<0,>0   D.<0,<0
11.为了研究某种病毒在特定环境下随时间变化的繁殖情况,得到了一些数据,绘制成散点图,发现用模型y=cekx拟合比较合适.令z=ln y,得到z=1.3x+,经计算发现x,z满足下表,则k=________,c=________.
天数x(天) 2 3 4 5 6
z 1.5 4.5 5.5 6.5 7
12.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日每天的昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:
日期 12月1日 12月2日 12月3日 12月4日 12月5日
温差X(℃) 10 11 13 12 8
发芽数Y(颗) 23 25 30 26 16
该农科所确定的研究方案是:先从这5组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.
(1)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出Y关于X的线性回归方程Y=X+;
(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?
21世纪教育网(www.21cnjy.com)课时分层作业(四十六)
1.C [线性回归方程必过样本点的中心(),
即(2.5,4),故选C.]
2.A [因为变量X和Y正相关,则回归直线的斜率为正,故可以排除选项C和D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A和B中的直线方程进行检验,可以排除B,故选A.]
3.A [x每增长1个单位,y增长4.4个单位,故增长的速度之比约为,
事实上所求的比值为线性回归方程斜率的倒数.]
4.B [线性回归直线可以不经过样本数据中的任何一个点.∴B错误;由=代入线性回归方程得),故A正确;由计算公式可知,CD正确.]
5.D [X=10时,Y=7.19×10+73.93=145.83,但这是预测值,而不是精确值,所以只能选D.]
6.60.316 kg [将X=172代入线性回归方程,有Y=0.849×172-85.712=60.316(kg).]
7.120 [由表格中数据得,==3,
==72,
于是得线性回归方程Y=12T+经过样本点的中心(3,72),
即有72=12×3+,解得=36,
从而得线性回归方程为Y=12T+36,
当T=7时,Y=12×7+36=120,
所以预测该店2025年双十一的成交额是120万元.]
8.-4 [根据表格数据,令t=,
则==,
==,
∵样本点的中心()在线性回归方程上,
∴+120×=,可得=-4.]
9.解:(1)作散点图如图所示.因为用电量与月份之间线性相关,所以散点图的样本点分布在回归直线附近比较窄的带状区域内,而点(7,55)离其他点所在区域较远,故(7,55)这组数据有误.
(2)排除(7,55)这一组有误数据后,计算得=30.2.
因为=≈9.98,
=≈-33.67,
所以线性回归方程为Y=9.98X-33.67,
当X=7时,Y≈36.2,
即7月份的用电量大约为36.2千瓦时.
10.B [由表中数据画出散点图,如图,
由散点图可知<0,>0.]
11.1.3 e-0.2 [由表知,=×(2+3+4+5+6)=4,=×(1.5+4.5+5.5+6.5+7)=5,
由z=1.3x+恒过点(),
知5=1.3×4+,
解得=-0.2,
∴z=1.3x-0.2,
即ln y=1.3x-0.2,
∴y=e1.3x-0.2=e-0.2·e1.3x,
∴k=1.3,c=e-0.2.]
12.解:(1)由数据求得,=27.
由公式求得,===-3.
所以Y关于X的线性回归方程为Y=X-3.
(2)当X=10时,Y=×10-3=22,|22-23|<2;
当X=8时,Y=×8-3=17,|17-16|<2.
所以该研究所得到的线性回归方程是可靠的.
21世纪教育网(www.21cnjy.com)(共61张PPT)
第七章 统计案例
§1 一元线性回归
1.1 直线拟合
1.2 一元线性回归方程
学习任务 核心素养
1.通过实例掌握回归分析的基本思想方法.(难点)
2.会利用最小二乘法求线性回归方程,并能用线性回归方程进行预报.(重点) 通过线性回归方程的应用,培养数学建模与数据分析素养.
圆的周长l与半径r是什么关系?父亲的身高与儿子的身高之间有何关系?这两个问题有什么不同?
必备知识·情境导学探新知
1.变量之间的相关关系
(1)变量之间有一定的联系,但不能完全用函数来表达.如人的体重y与身高x.一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系.相关关系是______性关系,因变量的取值具有一定的随机性.
非确定
(2)在考虑两个变量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将________(xi,yi)所对应的点描出来,这些点构成的图称为______.
(3)在两个变量X和Y的散点图中,若所有点看上去都在一条光滑的曲线附近波动,此时就可以用这条曲线近似地描述这两种变量之间的关系,该过程称为________;若所有点看上去都在一条直线附近波动,此时就可以用这条直线近似地描述这两种变量之间的关系,该过程称之为________.
成对数据
散点图
曲线拟合
直线拟合
[提示] 在散点图上自左向右看这些点呈上升趋势.

1.思考辨析(正确的画“√”,错误的画“×”)
(1)正方体的体积V与其边长a是函数关系. (  )
(2)西瓜藤的长短与西瓜的产量不是函数关系. (  )
(3)散点图可以粗略地判断两个变量是否具有线性相关关系. (  )
(4)在求线性回归方程之前,应先判断这两个变量是否具有线性相关关系. (  )




A.2   B.1
C.0   D.-1
X 4 5 6 7 8
Y 5 4 3 2 1
3.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到如下数据:
若已知线性回归方程为Y=0.85X-0.25,则表中c的值为________.
天数X/天 3 4 5 6 7
繁殖个数Y/万个 2.5 3 4 4.5 c
6 
关键能力·合作探究释疑难
类型1 散点图及其应用
【例1】 5个学生的数学和物理成绩如下表:
画出散点图,并判断它们是否有相关关系.
学生 A B C D E
数学 80 75 70 65 60
物理 70 66 68 64 62
[思路点拨] 可以以数学成绩为自变量,考查因变量物理成绩的变化趋势.
[解] 以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图.



由散点图可见,两者之间具有相关关系.
反思领悟 判断变量之间有无相关关系,一种常用的方法是绘制散点图,散点图是分析研究两个变量相关关系的重要手段.从散点图中,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量是线性相关的,否则不是线性相关.
[跟进训练]
1.李老师为了了解学生的计算能力,对某同学进行了10次试验,收集数据如下:
画出散点图,并判断它们是否有线性相关关系.
题数X/道 5 10 15 20 25 30 35 40 45 50
做题时间Y/分钟 9 19 26 37 48 52 61 73 81 89
[解] 散点图如图,由散点图可以看出,两者之间具有线性相关关系.
类型2 求线性回归方程
【例2】 某研究机构对高三学生的记忆力X和判断力Y进行统计分析,得下表数据:
X 6 8 10 12
Y 2 3 5 6
反思领悟 求线性回归方程的步骤
[跟进训练]
2.某个服装店经营某种服装,在某周内纯获利Y(单位:元)与该周每天销售这种服装件数X之间的一组数据如下表:
(1)求样本点的中心;
(2)画出散点图;
(3)求纯获利Y与每天销售件数X之间的线性回归方程.
X 3 4 5 6 7 8 9
Y 66 69 73 81 89 90 91
类型3 线性回归分析的应用
【例3】 某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价X(X取整数)(单位:元)与日销售量Y(单位:台)之间有如下关系:
X 35 40 45 50
Y 56 41 28 11
[解] (1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.
[跟进训练]
3.在一段时间内,某种商品的价格X(单位:万元)和需求量Y(单位:t)之间的一组数据如下表所示:
(1)画出散点图;
(2)求出Y对X的线性回归方程;
(3)如价格定为1.9万元,预测需求量大约是多少.
价格X 1.4 1.6 1.8 2 2.2
需求量Y 12 10 7 5 3
[解] (1)散点图如图所示.
序号 xi yi xi yi
1 1.4 12 1.96 16.8
2 1.6 10 2.56 16
3 1.8 7 3.24 12.6
4 2 5 4 10
5 2.2 3 4.84 6.6
∑ 9 37 16.6 62
学习效果·课堂评估夯基础


C [①②③正确.]

A [因为变量x和y正相关,则回归直线的斜率为正,故可以排除选项C和D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A和B中的直线方程进行检验,可以排除B.]
4.某研究机构对儿童记忆能力X和识图能力Y进行统计分析,得到如表数据:
记忆能力X 4 6 8 10
识图能力Y 3 5 6 8
9.5 
章末综合测评(一) 动量守恒定律
题号
1
3
5
2
4
6
8
7
9
10
11
12

课时分层作业(四十六) 一元线性回归
一、选择题
1.下表是X和Y之间的一组数据,则Y关于X的回归直线必过点(  )
A.(2,3) B.(1.5,4)  C.(2.5,4) D.(2.5,5)
X 1 2 3 4
Y 1 3 5 7
题号
2
1
3
4
5
6
8
7
9
10
11
12

A [因为变量X和Y正相关,则回归直线的斜率为正,故可以排除选项C和D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A和B中的直线方程进行检验,可以排除B,故选A.]
题号
2
1
3
4
5
6
8
7
9
10
11
12

题号
2
1
3
4
5
6
8
7
9
10
11
12

题号
2
1
3
4
5
6
8
7
9
10
11
12
题号
2
1
3
4
5
6
8
7
9
10
11
12
5.一位母亲记录了儿子3岁~9岁的身高,由此建立的身高Y(单位:cm)与年龄X(单位:岁)的回归模型为Y=7.19X+73.93.用这个模型预测这个孩子10岁时的身高,则下列叙述正确的是(  )
A.身高一定是145.83 cm
B.身高在145.83 cm以上
C.身高在145.83 cm以下
D.身高在145.83 cm左右

D [X=10时,Y=7.19×10+73.93=145.83,但这是预测值,而不是精确值,所以只能选D.]
题号
2
1
3
4
5
6
8
7
9
10
11
12
二、填空题
6.从某大学随机选取8名女大学生,其身高X(单位:cm)和体重Y(单位:kg)的线性回归方程为Y=0.849X-85.712,则身高172 cm的女大学生,由线性回归方程可以预测其体重约为___________.
60.316 kg [将X=172代入线性回归方程,有Y=0.849×172-85.712=60.316(kg).]
60.316 kg 
题号
2
1
3
4
5
6
8
7
9
10
11
12
7.双十一是指由电子商务为代表的,在全中国范围内兴起的大型购物促销狂欢节.已知某一家具旗舰店近年来双十一的成交额如下表:
120 
年份 2019 2020 2021 2022 2023
年份代号T 1 2 3 4 5
成交额Y/万元 50 60 70 80 100
题号
2
1
3
4
5
6
8
7
9
10
11
12
题号
2
1
3
4
5
6
8
7
9
10
11
12
8.“一盔一带”安全守护行动在全国各地展开,某地交警部门加强执法管理期间,对某路口不带头盔的骑行者进行了统计,得到如下数据(其中Y表示第X天不戴头盔的人数):
X 1 2 4 8
Y 117 51 34 7
-4 
题号
2
1
3
4
5
6
8
7
9
10
11
12
题号
2
1
3
4
5
6
8
7
9
10
11
12
三、解答题
9.某公司的生产部门调研发现,该公司第二、三季度的月用电量Y与月份X线性相关,且数据统计如下:
月份 4 5 6 7 8 9
月用电量/(千瓦时/月) 6 16 27 55 46 56
题号
2
1
3
4
5
6
8
7
9
10
11
12
[解] (1)作散点图如图所示.因为用电量与月份之间线性相关,所以散点图的样本点分布在回归直线附近比较窄的带状区域内,而点(7,55)离其他点所在区域较远,故(7,55)这组数据有误.
题号
2
1
3
4
5
6
8
7
9
10
11
12
题号
2
1
3
4
5
6
8
7
9
10
11
12

10.根据如下样本数据
X 3 4 5 6 7 8
Y 4.0 2.5 -0.5 0.5 -2.0 -3.0
题号
2
1
3
4
5
6
8
7
9
10
11
12
题号
2
1
3
4
5
6
8
7
9
10
11
12
天数x(天) 2 3 4 5 6
z 1.5 4.5 5.5 6.5 7
1.3 
 e-0.2 
题号
2
1
3
4
5
6
8
7
9
10
11
12
题号
2
1
3
4
5
6
8
7
9
10
11
12
12.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日每天的昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:
日期 12月1日 12月2日 12月3日 12月4日 12月5日
温差X(℃) 10 11 13 12 8
发芽数Y(颗) 23 25 30 26 16
题号
2
1
3
4
5
6
8
7
9
10
11
12
题号
2
1
3
4
5
6
8
7
9
10
11
12§1 一元线性回归
1.1 直线拟合
1.2 一元线性回归方程
学习任务 核心素养
1.通过实例掌握回归分析的基本思想方法.(难点) 2.会利用最小二乘法求线性回归方程,并能用线性回归方程进行预报.(重点) 通过线性回归方程的应用,培养数学建模与数据分析素养.
圆的周长l与半径r是什么关系?父亲的身高与儿子的身高之间有何关系?这两个问题有什么不同?
1.变量之间的相关关系
(1)变量之间有一定的联系,但不能完全用函数来表达.如人的体重y与身高x.一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系.相关关系是______性关系,因变量的取值具有一定的随机性.
(2)在考虑两个变量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将________(xi,yi)所对应的点描出来,这些点构成的图称为______.
(3)在两个变量X和Y的散点图中,若所有点看上去都在一条光滑的曲线附近波动,此时就可以用这条曲线近似地描述这两种变量之间的关系,该过程称为________;若所有点看上去都在一条直线附近波动,此时就可以用这条直线近似地描述这两种变量之间的关系,该过程称之为________.
2.最小二乘法
如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用来刻画这些点与直线Y=a+bX的接近程度,使得上式达到最小值的直线Y=a+bX就是要求的直线,这种方法称为最小二乘法.
3.线性回归方程
假设成对数据为(x1,y1),(x2,y2),…,(xn,yn),其线性回归方程为Y=+X,则
=,=-.
在线性回归方程Y=+X中,当一次项系数为正数时,其散点图有什么特征?
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
1.思考辨析(正确的画“√”,错误的画“×”)
(1)正方体的体积V与其边长a是函数关系. (  )
(2)西瓜藤的长短与西瓜的产量不是函数关系. (  )
(3)散点图可以粗略地判断两个变量是否具有线性相关关系. (  )
(4)在求线性回归方程之前,应先判断这两个变量是否具有线性相关关系. (  )
2.根据下表中的数据,得到的线性回归方程为Y=X+9,则=(  )
X 4 5 6 7 8
Y 5 4 3 2 1
A.2   B.1
C.0   D.-1
3.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到如下数据:
天数X/天 3 4 5 6 7
繁殖个数Y/万个 2.5 3 4 4.5 c
若已知线性回归方程为Y=0.85X-0.25,则表中c的值为________.
(对应学生用书第210页)
类型1 散点图及其应用
【例1】 5个学生的数学和物理成绩如下表:
学生 A B C D E
数学 80 75 70 65 60
物理 70 66 68 64 62
画出散点图,并判断它们是否有相关关系.
[思路点拨] 可以以数学成绩为自变量,考查因变量物理成绩的变化趋势.
[尝试解答] ________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
 判断变量之间有无相关关系,一种常用的方法是绘制散点图,散点图是分析研究两个变量相关关系的重要手段.从散点图中,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量是线性相关的,否则不是线性相关.
[跟进训练]
1.李老师为了了解学生的计算能力,对某同学进行了10次试验,收集数据如下:
题数X/道 5 10 15 20 25 30 35 40 45 50
做题时间Y/分钟 9 19 26 37 48 52 61 73 81 89
画出散点图,并判断它们是否有线性相关关系.
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
类型2 求线性回归方程
【例2】 某研究机构对高三学生的记忆力X和判断力Y进行统计分析,得下表数据:
X 6 8 10 12
Y 2 3 5 6
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出Y关于X的线性回归方程Y=X+.
[尝试解答] ________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
 求线性回归方程的步骤
[跟进训练]
2.某个服装店经营某种服装,在某周内纯获利Y(单位:元)与该周每天销售这种服装件数X之间的一组数据如下表:
X 3 4 5 6 7 8 9
Y 66 69 73 81 89 90 91
(1)求样本点的中心;
(2)画出散点图;
(3)求纯获利Y与每天销售件数X之间的线性回归方程.
[尝试解答] ________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
类型3 线性回归分析的应用
【例3】 某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价X(X取整数)(单位:元)与日销售量Y(单位:台)之间有如下关系:
X 35 40 45 50
Y 56 41 28 11
(1)画出散点图,并判断Y与X是否具有线性相关关系;
(2)求日销售量Y对销售单价X的线性回归方程;(取整数)
(3)设经营此商品的日销售利润为P元,根据(2)写出P关于X的函数关系式,并预测当销售单价X为多少元时,才能获得最大日销售利润.
[尝试解答] ________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
 对两个变量进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数,的计算公式,算出,.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误.
[跟进训练]
3.在一段时间内,某种商品的价格X(单位:万元)和需求量Y(单位:t)之间的一组数据如下表所示:
价格X 1.4 1.6 1.8 2 2.2
需求量Y 12 10 7 5 3
(1)画出散点图;
(2)求出Y对X的线性回归方程;
(3)如价格定为1.9万元,预测需求量大约是多少.
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
1.对具有线性相关关系的两个变量建立的线性回归方程Y=+X中,线性回归方程系数(  )
A.可以小于0   B.只能大于0
C.可能等于0   D.只能小于0
2.有下列说法:
①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;
②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;
③通过线性回归方程Y=X+可以估计观测变量的取值和变化趋势;
④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.
其中正确命题的个数是(  )
A.1   B.2
C.3   D.4
3.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是(  )
A.=0.4x+2.3
B.=2x-2.4
C.=-2x+9.5
D.=-0.3x+4.4
4.某研究机构对儿童记忆能力X和识图能力Y进行统计分析,得到如表数据:
记忆能力X 4 6 8 10
识图能力Y 3 5 6 8
由表中数据,求得线性回归方程为Y=0.8X+,当某儿童的记忆能力为12时,预测他的识图能力为________.
5.已知一个线性回归方程为Y=1.5X+45,X∈{1,7,5,13,19},求.
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
1.判断变量之间有无相关关系,简便可行的方法就是绘制散点图.根据散点图,可看出两个变量是否具有相关关系,是否线性相关.
2.求线性回归方程时应注意的问题
(1)应首先进行相关性检验.如果两个变量之间不具有线性相关关系,或者说它们之间的线性相关关系不显著,即使求出线性回归方程也是毫无意义的,用其估计和预测的值也是不可信的.
(2)用公式计算,的值时,要先算出,然后才能算出.
3.利用线性回归方程,我们可以进行估计和预测.若线性回归方程为Y=X+,则X=x0处的估计值为y0=x0+.
21世纪教育网(www.21cnjy.com)
同课章节目录