4.3.1 第1课时 相关关系与回归直线方程(课件 学案 练习)高中数学人教B版(2019)选择性必修 第二册

文档属性

名称 4.3.1 第1课时 相关关系与回归直线方程(课件 学案 练习)高中数学人教B版(2019)选择性必修 第二册
格式 zip
文件大小 8.1MB
资源类型 教案
版本资源 人教B版(2019)
科目 数学
更新时间 2025-09-18 06:44:34

文档简介

(共47张PPT)
4.3 统计模型
4.3.1 一元线性回归模型
第1课时 相关关系与回归直线方程
探究点一 相关关系的判断
探究点二 求回归直线方程及回归分析
探究点三 回归直线方程的性质及应用
◆课前预习
◆课中探究
◆课堂评价
◆备课素材
【学习目标】
1.了解变量间的相关关系;
2.会画散点图,并利用散点图判断两个变量之间是否具有相关关系;
3.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意
义,了解最小二乘法原理;
4.会求回归直线方程,掌握回归直线方程的性质.
知识点一 相关关系
1.两个变量的关系
分类 函数关系 相关关系
特征 两变量的关系______ 两变量的关系具有__________
确定
不确定性
2.散点图:一般地,如果收集到了变量和变量的 对数据(简称为成对数据),
如下表所示.
1 2 3 …


则在平面直角坐标系中描出点,,2,3, ,,就可以得到这 对数
据的散点图.
3.线性相关:如果由变量的成对数据、散点图或直观经验可知,变量与变量 之
间的关系可以近似地用一次函数来刻画,则称与 线性相关.
4.正相关与负相关
(1)如果一个变量增大,另一个变量大体上也增大,则称这两个变量________.
(2)如果一个变量增大,另一个变量大体上减少,则称这两个变量________.
正相关
负相关
【诊断分析】
判断正误.(请在括号中打“√”或“×”)
(1)函数关系是一种确定关系,而相关关系是一种不确定关系.( )

(2)散点图可以直观地分析出两个变量是否具有相关性.( )

(3)若变量, 满足函数关系,则这两个变量线性相关.( )
×
知识点二 回归直线方程及其性质
1.回归直线方程及最小二乘法
一般地,已知变量与的对成对数据,,2,3, , .任意给定一个一
次函数,对每一个已知的 ,由直线方程可以得到一个估计值
,如果一次函数 能使残差平方和即
取得最小值,则
称为________的回归直线方程(对应的直线称为回归直线).
因为是使得平方和______,所以其中涉及的方法称为最小二乘法.
关于
最小
2.回归直线方程的系数的计算公式
回归直线方程
注意:指的是,,, ,的平均数,即 ;
类似地,是,,, ,的平均数,即 .
3.回归直线方程的性质
(1)回归直线一定过点______.
(2)一次函数的单调性是由 的符号决定的,函数递增的充要条件
是,这说明:与正相关的充要条件是;与 负相关的充要条件是_____
__.
(3)回归系数的实际意义:当增大一个单位时,增大 个单位.
【诊断分析】
判断正误.(请在括号中打“√”或“×”)
(1)回归直线一定过点 .( )

(2)选取一组数据的部分点得到的回归直线方程与由整组数据得到的回归直线
方程一定相同.( )
×
(3)根据回归直线方程得到的结论一定是可靠的.( )
×
(4)回归直线方程对应的直线 至少经过其样本数据点中的一个点. ( )
×
探究点一 相关关系的判断
例1 下面是施肥量与水稻产量的一组观测数据(单位:千克/亩).
施肥量 15 20 25 30 35 40 45
水稻产量 320 330 360 410 460 470 480
(1)将上述数据制成散点图.
解:散点图如图所示.
(2)你能从散点图中发现施肥量与水稻产量近似成什么关系吗?水稻产量会一
直随施肥量的增加而增长吗?
解:从图中发现样本点大致分布在一条直线附近,因此施肥量和水稻产量近似
成线性相关关系.施肥量由小到大时,水稻产量由小到大,但水稻产量不会一直
随施肥量的增加而增长.
变式 如图所示的四个图各反映了两个变量的某种关系,其中具有较强线性相
关关系的是( )
B
A.①③ B.①④ C.②③ D.①②
[解析] 两个变量的散点图中,若样本点呈带状分布,则两个变量具有线性相
关关系, 四个图中可以看作具有较强线性相关关系的是①④.故选B.
[素养小结]
两个变量是否具有相关关系的两种判断方法:
(1)根据实际经验:借助积累的经验进行分析判断.
(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地
进行判断.如果发现样本点的分布从整体上看大致在一条直线附近,那么这两个
变量就是线性相关的,注意不要受个别样本点的位置的影响.
探究点二 求回归直线方程及回归分析
例2 某种产品的广告支出(单位:万元)与销售额 (单位:万元)之间有
如下对应关系:
2 4 5 6 8
30 40 60 50 70
(1)假定与之间具有线性相关关系,求关于 的回归直线方程;
解:由题意可知, ,





关于的回归直线方程为 .
(2)预测当广告支出为10万元时的销售额.
参考公式:在中,, .
解:由(1)知,当时, ,
预测当广告支出为10万元时的销售额为82.5万元.
变式 [2023·四川成都石室中学高二期末] 某医科大学实习小组为研究当地昼
夜温差与感冒人数之间的关系,分别到当地气象部门和某医院抄录了1月至3月
每月5日、20日的昼夜温差情况与次日因感冒而就诊的人数,得到如下资料.
日期 1月5日 1月20日 2月5日 2月20日 3月5日 3月20日
10 11 13 12 8 6
22 25 29 26 16 12
该小组确定的研究方案是:先从这6组数据中随机选取4组数据求回归直线方程,
再用剩余的2组数据进行检验.
(1)求剩余的2组数据都是20日的概率.
解:记6组数据的编号依次为1,2,3,4,5,6,从这6组中随机选取4组数据,
剩余的2组数据的样本空间,,,,, ,
,,,,,,,, ,共包含15个样
本点,其中剩余的2组数据都是20日包含的样本点有3个.
根据古典概型概率计算公式得,剩余的2组数据都是20日的概率 .
(2)若选取的是1月20日、2月5日、2月20日、3月5日这4组数据.
①请根据这4组数据,求出关于 的回归直线方程;
解: 由所选数据,得, ,
所以 ,

所以关于的线性回归方程为 .
②若某日的昼夜温差为 ,请预测次日因感冒而就诊的人数.(结果保留整数)
参考公式:在中,, .
解: 当时,,故若某日的昼夜温差为 ,预
测次日因感冒而就诊的人数约为14.
[素养小结]
求回归直线方程的一般步骤:
(1)依据样本数据画出散点图,确定两个变量之间具有线性相关关系;
(2)计算出,,, 的值;
(3)计算回归系数,然后根据计算 ;
(4)写出回归直线方程 .
拓展 某测试团队为了研究饮酒对驾车安全的影响,随机选取100名驾驶员先
后在无酒状态、酒后状态下进行停车距离测试.试验数据分别见表1和表2,其中
表1为无酒状态下的测试结果.
表1
频数 24 40 30 4 2
表2
10 30 50 70 90
30 50 60 70 90
(1)根据最小二乘法,由表2的数据计算关于 的回归直线方程.
解:依题意可知,, ,
,
,
所以 ,
所以 ,
所以关于的回归直线方程为 .
(2)若驾驶员酒后驾车的平均停车距离 大于无酒状态下停车距离的平均数的3
倍,则认定驾驶员是“醉驾”.请根据(1)中的回归直线方程,预测当某驾驶员平
均每毫升血液酒精含量为85毫克时,是否可以认定他为“醉驾”?
解:无酒状态下停车距离的平均数
.
当时, ,
所以预测当某驾驶员平均每毫升血液酒精含量为85毫克时,可以认定他为“醉驾”.
探究点三 回归直线方程的性质及应用
例3 (多选题)某位同学10次考试的物理成绩与数学成绩 如下表所示.
76 82 72 87 93 78 89 66 81 76
80 87 75 100 79 93 68 85 77
已知,若与线性相关,且关于的回归直线方程为 ,
则下列说法正确的是( )
ABD
A.
B.与 正相关
C.与 负相关
D.若该同学数学成绩每提高5分,则物理成绩估计能提高5.5分
[解析] 由关于的回归直线方程为,可知与 正相关,故B正确,
C错误;
若该同学数学成绩每提高5分,则物理成绩估计能提高5.5分,故D正确;
因为,,所以,解得 ,故A正确.故
选 .
变式(1) 设某大学的女生身高(单位:与体重(单位: 之间具有
线性相关关系,根据一组样本数据,用最小二乘法建立的回归直线方程为
,则下列说法中不正确的是( )
C
A.与 正相关
B.回归直线经过点
C.该大学某女生的体重为,则其身高一定为
D.该大学某女生的体重每增加,其身高估计增加
[解析] 由,可知与正相关,故A中说法正确;
回归直线经过点 ,故B中说法正确;
若该大学某女生的体重为,则其身高约为 ,不是一定为,
故C中说法不正确;
该大学某女生的体重每增加 ,其身高估计增加 ,故D中说法正确.故选C.
(2)[2023·成都七中高二月考]某饮料专卖店一天卖出奶茶的杯数 与当天的平
均气温(单位:的一组数据如下表,由表中数据计算得到关于 的回归直线
方程为,则据此模型预测当某天的平均气温为 时卖出奶茶的杯
数为( )
5 10 15 20 25
26 20 16 14 14
C
A.4 B.5 C.6 D.7
[解析] 由题可知 ,
,由,可得 ,所以
.当时, .故选C.
[素养小结]
(1)相关关系的正、负相关类同于函数的增、减性,与其斜率有关,必要时可
画出散点图以增强直观性.
(2)由回归直线方程得出的函数值不一定是准确值,只是个估计值.
1.下列说法错误的是( )
B
A.正方体的体积与棱长之间的关系是函数关系
B.人的身高与视力之间具有相关关系
C.汽车的重量和汽车每消耗1升汽油所行驶的平均路程具有负相关关系
D.数学成绩与体育成绩之间不具有相关关系
[解析] 正方体的体积与棱长之间的关系是函数关系,故A中说法正确;
人的身高与视力之间不具有相关关系,故B中说法错误;
汽车的重量和汽车每消耗1升汽油所行驶的平均路程具有负相关关系,故C中说法正确;
数学成绩与体育成绩之间不具有相关关系,故D中说法正确.故选B.
2.如图所示的4个散点图中,不适合用线性回归模型拟合其中两个变量的是 ( )
A
A. B. C. D.
[解析] 根据题意,适合用线性回归模型拟合其中两个变量的散点图中的点必须
分布比较集中,且大体接近某一条直线,分析选项可得A选项的散点图中的点
杂乱无章,最不符合条件.故选A.
3.[2024·云南大理高二期末]由数据,, ,可得 关于
的回归直线方程为,若,则 ( )
A
A.48 B.52 C.56 D.80
[解析] 因为,所以,所以 ,所以
.故选A.
4.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下表所示.
174 176 176 176 178
175 175 176 177 177
则关于 的回归直线方程为( )
C
A. B. C. D.
[解析] 设关于的回归直线方程为 ,由已知得
,
,则
,,所以 关
于的回归直线方程为 .故选C.
5.某市物价部门对5家商场某商品一天的销售量及其售价进行调查,5家商场该
商品的售价(单位:元)和销售量 (单位:件)之间的一组数据如下表所示.
用最小二乘法得关于的回归直线方程为 ,则下列说法中错误的是
( )
9 9.5 10 10.5 11
11 10 8 6 5
D
A.
B.售价每增加1元,销售量 大约减少3.2件
C.当时, 的估计值为12.8
D.销售量与售价 正相关
[解析] 对于A, ,
,关于的回归直线方程为 ,
,解得,故A中说法正确;
对于B,, 售价 每增加1元,销售量大约减少3.2件,故B中说法正确;
对于C,当时, 的估计值为,故C中说法正确;
对于D,, 销售量 与售价 负相关,故D中说法错误.故选D.
1.在现实生活中,相关关系是大量存在的.从某种意义上讲,像函数这种具有确
定性的关系是一种理想的关系模型.
2.确定性关系和非确定性关系有着密切的联系,在一定的情况下可以互相转化,
例如,圆的周长与半径 之间虽然具有确定性关系,但在借助于工具测量的情
况下,每次测量周长或者半径 时,由于测量误差等原因,其数值大小又表现
出一种随机性.对于具有线性相关关系的两个变量来说,求得回归直线方程后,
可以用一种确定性的关系对两个变量之间的关系进行统计推断或预测估计.
3.在统计学中,利用最小二乘法可以简便地求得未知的数据,并使得这些求得
的数据与实际数据之间误差的平方和最小.
4.回归直线方程中回归系数 的简单计算方法的依据是:所有数据点同时上下、
左右平移,所得回归直线的斜率不发生变化.因此可利用平移变化后的数据计算
回归系数,从而减少计算量.但要注意在计算 时,用原始数据的平均数比较简单.
1.相关关系和函数关系的异同点
(1)相同点:两者均是指两个变量的关系.
(2)不同点:函数关系是一种确定的关系,而相关关系是一种非确定的关系.
2.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点
图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关
还是负相关.
3.回归直线必过点 .利用回归方程,我们可以进行估计和预测,若回归直线
方程为,则在处的估计值为 .
4.回归直线方程的应用
(1)正确理解计算, 的公式和准确的计算是求回归直线方程的关键.
(2)回归直线必过点 .
(3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之
间是否具有相关关系,若具有线性相关关系,则可通过回归直线方程来估计和预测.
例 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 (吨)
与相应的生产能耗 (吨标准煤)的几组对应数据.
3 4 5 6
2.5 3 4 4.5
(1)请画出上表数据的散点图;
解:根据所给数据,可得散点图如图.
(2)请根据上表数据,用最小二乘法求出关于的回归直线方程 ;
解:根据所给数据,计算得 ,
, ,

所以, .
因此,所求的回归直线方程为 .
(3)已知该厂技术改造前生产100吨甲产品的生产能耗为90吨标准煤,试根据
(2)中求出的回归直线方程,估计技术改造后生产100吨甲产品的生产能耗比
技术改造前降低多少吨标准煤.
解:当时,,因为 ,所以
估计技术改造后生产100吨甲产品的生产能耗比技术改造前降低19.65吨标准煤.4.3 统计模型
4.3.1 一元线性回归模型
第1课时 相关关系与回归直线方程
【课前预习】
知识点一
1.确定 不确定性 4.(1)正相关 (2)负相关
诊断分析
(1)√ (2)√ (3)×
知识点二
1.y关于x 最小 2.x+ 3.(1)(,) (2)<0
诊断分析
(1)√ (2)× (3)× (4)×
【课中探究】
探究点一
例1 解:(1)散点图如图所示.
(2)从图中发现样本点大致分布在一条直线附近,因此施肥量和水稻产量近似成线性相关关系.施肥量由小到大时,水稻产量由小到大,但水稻产量不会一直随施肥量的增加而增长.
变式 B [解析] ∵两个变量的散点图中,若样本点呈带状分布,则两个变量具有线性相关关系,∴四个图中可以看作具有较强线性相关关系的是①④.故选B.
探究点二
例2 解:(1)由题意可知,=×(2+4+5+6+8)=5,
=×(30+40+60+50+70)=50,
xiyi=2×30+4×40+5×60+6×50+8×70=1380,
=4+16+25+36+64=145,
∴===6.5,
∴=-=50-6.5×5=17.5,
∴y关于x的回归直线方程为=6.5x+17.5.
(2)由(1)知,当x=10时,=6.5×10+17.5=82.5,
∴预测当广告支出为10万元时的销售额为82.5万元.
变式 解:(1)记6组数据的编号依次为1,2,3,4,5,6,从这6组中随机选取4组数据,剩余的2组数据的样本空间Ω={(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)},共包含15个样本点,其中剩余的2组数据都是20日包含的样本点有3个.
根据古典概型概率计算公式得,剩余的2组数据都是20日的概率P==.
(2)①由所选数据,得==11,==24,
所以==,=-=24-×11=-,
所以y关于x的线性回归方程为=x-.
②当x=7时,=×7-=≈14,故若某日的昼夜温差为7 ℃,预测次日因感冒而就诊的人数约为14.
拓展 解:(1)依题意可知,=50,=60,xiyi=10×30+30×50+50×60+70×70+90×90=17 800,
=102+302+502+702+902=16 500,
所以===,所以=-=60-×50=25,
所以y关于x的回归直线方程为=x+25.
(2)无酒状态下停车距离的平均数=15×+25×+35×+45×+55×=27.
当x=85时,=×85+25=>27×3=81,
所以预测当某驾驶员平均每毫升血液酒精含量为85毫克时,可以认定他为“醉驾”.
探究点三
例3 ABD [解析] 由y关于x的回归直线方程为=1.1x-5,可知y与x正相关,故B正确,C错误;若该同学数学成绩每提高5分,则物理成绩估计能提高5.5分,故D正确;因为=80,=,所以=1.1×80-5,解得a=86,故A正确.故选ABD.
变式 (1)C (2)C [解析] (1)由1.18>0,可知y与x正相关,故A中说法正确;回归直线经过点(,),故B中说法正确;若该大学某女生的体重为50 kg,则其身高约为160 cm,不是一定为160 cm,故C中说法不正确;该大学某女生的体重每增加1 kg,其身高估计增加1.18 cm,故D中说法正确.故选C.
(2)由题可知=×(5+10+15+20+25)=15,=×(26+20+16+14+14)=18,由18=15+27,可得=-,所以=-x+27.当x=35时,=-×35+27=6.故选C.
【课堂评价】
1.B [解析] 正方体的体积与棱长之间的关系是函数关系,故A中说法正确;人的身高与视力之间不具有相关关系,故B中说法错误;汽车的重量和汽车每消耗1升汽油所行驶的平均路程具有负相关关系,故C中说法正确;数学成绩与体育成绩之间不具有相关关系,故D中说法正确.故选B.
2.A [解析] 根据题意,适合用线性回归模型拟合其中两个变量的散点图中的点必须分布比较集中,且大体接近某一条直线,分析选项可得A选项的散点图中的点杂乱无章,最不符合条件.故选A.
3.A [解析] 因为xi=12,所以==2,所以=2×3+2=8,所以yi=6×8=48.故选A.
4.C [解析] 设y关于x的回归直线方程为=x+,由已知得=×(174+176+176+176+178)=176,=×(175+175+176+177+177)=176,则==,=-=176-×176=88,所以y关于x的回归直线方程为=x+88.故选C.
5.D [解析] 对于A,=×(9+9.5+10+10.5+11)=10,=×(11+10+8+6+5)=8,∵y关于x的回归直线方程为=-3.2x+,∴8=-32+,解得=40,故A中说法正确;对于B,∵=-3.2,∴售价x每增加1元,销售量y大约减少3.2件,故B中说法正确;对于C,当x=8.5时,y的估计值为-3.2×8.5+40=12.8,故C中说法正确;对于D,∵=-3.2<0,∴销售量y与售价x负相关,故D中说法错误.故选D.4.3 统计模型
4.3.1 一元线性回归模型
第1课时 相关关系与回归直线方程
【学习目标】
1.了解变量间的相关关系;
2.会画散点图,并利用散点图判断两个变量之间是否具有相关关系;
3.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘法原理;
4.会求回归直线方程,掌握回归直线方程的性质.
◆ 知识点一 相关关系
1.两个变量的关系
分类 函数关系 相关关系
特征 两变量的关系    两变量的关系具有   
2.散点图:一般地,如果收集到了变量x和变量y的n对数据(简称为成对数据),如下表所示.
序号i 1 2 3 … n
变量x x1 x2 x3 … xn
变量y y1 y2 y3 … yn
则在平面直角坐标系xOy中描出点(xi,yi),i=1,2,3,…,n,就可以得到这n对数据的散点图.
3.线性相关:如果由变量的成对数据、散点图或直观经验可知,变量x与变量y之间的关系可以近似地用一次函数来刻画,则称x与y线性相关.
4.正相关与负相关
(1)如果一个变量增大,另一个变量大体上也增大,则称这两个变量     .
(2)如果一个变量增大,另一个变量大体上减少,则称这两个变量     .
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)函数关系是一种确定关系,而相关关系是一种不确定关系. (  )
(2)散点图可以直观地分析出两个变量是否具有相关性. (  )
(3)若变量x,y满足函数关系,则这两个变量线性相关. (  )
◆ 知识点二 回归直线方程及其性质
1.回归直线方程及最小二乘法
一般地,已知变量x与y的n对成对数据(xi,yi),i=1,2,3,…,n.任意给定一个一次函数y=bx+a,对每一个已知的xi,由直线方程可以得到一个估计值=bxi+a,如果一次函数=x+能使残差平方和即(y1-)2+(y2-)2+…+(yn-)2=(yi-)2取得最小值,则=x+称为     的回归直线方程(对应的直线称为回归直线).
因为是使得平方和    ,所以其中涉及的方法称为最小二乘法.
2.回归直线方程的系数的计算公式
回归直线方程 回归系数的计算公式 的计算公式
=    == =-
注意:指的是x1,x2,x3,…,xn的平均数,即=(x1+x2+…+xn)=xi;类似地,是y1,y2,y3,…,yn的平均数,即=yi.
3.回归直线方程的性质
(1)回归直线一定过点    .
(2)一次函数=x+的单调性是由的符号决定的,函数递增的充要条件是>0,这说明:y与x正相关的充要条件是>0;y与x负相关的充要条件是    .
(3)回归系数的实际意义:当x增大一个单位时,增大个单位.
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)回归直线一定过点(,). (  )
(2)选取一组数据的部分点得到的回归直线方程与由整组数据得到的回归直线方程一定相同. (  )
(3)根据回归直线方程得到的结论一定是可靠的. (  )
(4)回归直线方程对应的直线=x+至少经过其样本数据点中的一个点. (  )
◆ 探究点一 相关关系的判断
例1 下面是施肥量与水稻产量的一组观测数据(单位:千克/亩).
施肥量 15 20 25 30 35 40 45
水稻产量 320 330 360 410 460 470 480
(1)将上述数据制成散点图.
(2)你能从散点图中发现施肥量与水稻产量近似成什么关系吗 水稻产量会一直随施肥量的增加而增长吗
变式 如图所示的四个图各反映了两个变量的某种关系,其中具有较强线性相关关系的是 (  )
A.①③ B.①④ C.②③ D.①②
[素养小结]
两个变量是否具有相关关系的两种判断方法:
(1)根据实际经验:借助积累的经验进行分析判断.
(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.如果发现样本点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别样本点的位置的影响.
◆ 探究点二 求回归直线方程及回归分析
例2 某种产品的广告支出x(单位:万元)与销售额y(单位:万元)之间有如下对应关系:
x 2 4 5 6 8
y 30 40 60 50 70
(1)假定y与x之间具有线性相关关系,求y关于x的回归直线方程;
(2)预测当广告支出为10万元时的销售额.
参考公式:在=x+中,=,=-.
变式 [2023·四川成都石室中学高二期末] 某医科大学实习小组为研究当地昼夜温差与感冒人数之间的关系,分别到当地气象部门和某医院抄录了1月至3月每月5日、20日的昼夜温差情况与次日因感冒而就诊的人数,得到如下资料.
日期 1月 5日 1月 20日 2月 5日 2月 20日 3月 5日 3月 20日
昼夜温差 x(℃) 10 11 13 12 8 6
就诊人数 y(个) 22 25 29 26 16 12
该小组确定的研究方案是:先从这6组数据中随机选取4组数据求回归直线方程,再用剩余的2组数据进行检验.
(1)求剩余的2组数据都是20日的概率.
(2)若选取的是1月20日、2月5日、2月20日、3月5日这4组数据.
①请根据这4组数据,求出y关于x的回归直线方程;
②若某日的昼夜温差为7 ℃,请预测次日因感冒而就诊的人数.(结果保留整数)
参考公式:在=x+中,==,=-.
[素养小结]
求回归直线方程的一般步骤:
(1)依据样本数据画出散点图,确定两个变量之间具有线性相关关系;
(2)计算出,,,xiyi的值;
(3)计算回归系数,然后根据=- 计算;
(4)写出回归直线方程=x+.
拓展 某测试团队为了研究饮酒对驾车安全的影响,随机选取100名驾驶员先后在无酒状态、酒后状态下进行停车距离测试.试验数据分别见表1和表2,其中表1为无酒状态下的测试结果.
表1
停车距离 d(米) [10, 20) [20, 30) [30, 40) [40, 50) [50, 60]
频数 24 40 30 4 2
表2
平均每毫升血液 酒精含量x(毫克) 10 30 50 70 90
平均停车距离y(米) 30 50 60 70 90
(1)根据最小二乘法,由表2的数据计算y关于x的回归直线方程.
(2)若驾驶员酒后驾车的平均停车距离y大于无酒状态下停车距离的平均数的3倍,则认定驾驶员是“醉驾”.请根据(1)中的回归直线方程,预测当某驾驶员平均每毫升血液酒精含量为85毫克时,是否可以认定他为“醉驾”
◆ 探究点三 回归直线方程的性质及应用
例3 (多选题)某位同学10次考试的物理成绩y与数学成绩x如下表所示.
数学成绩x 76 82 72 87 93 78 89 66 81 76
物理成绩y 80 87 75 a 100 79 93 68 85 77
已知xi=800,若y与x线性相关,且y关于x的回归直线方程为=1.1x-5,则下列说法正确的是 (  )
A.a=86
B.y与x正相关
C.y与x负相关
D.若该同学数学成绩每提高5分,则物理成绩估计能提高5.5分
变式 (1)设某大学的女生身高y(单位:cm)与体重x(单位:kg)之间具有线性相关关系,根据一组样本数据,用最小二乘法建立的回归直线方程为=1.18x+101,则下列说法中不正确的是 (  )
A.y与x正相关
B.回归直线经过点(,)
C.该大学某女生的体重为50 kg,则其身高一定为160 cm
D.该大学某女生的体重每增加1 kg,其身高估计增加1.18 cm
(2)[2023·成都七中高二月考] 某饮料专卖店一天卖出奶茶的杯数y与当天的平均气温x(单位:℃)的一组数据如下表,由表中数据计算得到y关于x的回归直线方程为=x+27,则据此模型预测当某天的平均气温为35 ℃时卖出奶茶的杯数为 (  )
气温x/℃ 5 10 15 20 25
杯数y 26 20 16 14 14
A.4 B.5
C.6 D.7
[素养小结]
(1)相关关系的正、负相关类同于函数的增、减性,与其斜率有关,必要时可画出散点图以增强直观性.
(2)由回归直线方程得出的函数值不一定是准确值,只是个估计值.
1.下列说法错误的是 (  )
A.正方体的体积与棱长之间的关系是函数关系
B.人的身高与视力之间具有相关关系
C.汽车的重量和汽车每消耗1升汽油所行驶的平均路程具有负相关关系
D.数学成绩与体育成绩之间不具有相关关系
2.如图所示的4个散点图中,不适合用线性回归模型拟合其中两个变量的是 (  )
A B C D
3.[2024·云南大理高二期末] 由数据(x1,y1),(x2,y2),…,(x6,y6)可得y关于x的回归直线方程为=3x+2,若xi=12,则yi= (  )
A.48 B.52
C.56 D.80
4.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下表所示.
父亲身高x/cm 174 176 176 176 178
儿子身高y/cm 175 175 176 177 177
则y关于x的回归直线方程为 (  )
A.=x-1 B.=x+1
C.=x+88 D.=176
5.某市物价部门对5家商场某商品一天的销售量及其售价进行调查,5家商场该商品的售价x(单位:元)和销售量y(单位:件)之间的一组数据如下表所示.用最小二乘法得y关于x的回归直线方程为=-3.2x+,则下列说法中错误的是 (  )
售价x(元) 9 9.5 10 10.5 11
销售量y(件) 11 10 8 6 5
A.=40
B.售价x每增加1元,销售量y大约减少3.2件
C.当x=8.5时,y的估计值为12.8
D.销售量y与售价x正相关4.3 统计模型
4.3.1 一元线性回归模型
第1课时 相关关系与回归直线方程
1.C [解析] 因为回归直线方程为=-1.5x+2,回归直线的斜率为-1.5,所以变量x增加1个单位时,平均减少1.5个单位.故选C.
2.B [解析] 设y关于x的回归直线方程为=x+,则由题图知<0,>0,故B满足题意.故选B.
3.D [解析] 变量x与y是相关关系,不是函数关系,所以A不正确;变量x与y负相关,所以B不正确;当x=4时,y的预测值为-2,所以C不正确;若x增加1个单位,则y约减少1个单位,所以D正确.故选D.
4.D [解析] 由题知==3,==6,将其代入=0.7x+中,得=6-0.7×3=3.9,故y关于x的回归直线方程为=0.7x+3.9,当x=7时,=0.7×7+3.9=8.8.故选D.
5.C [解析] 由题得==4,==6,经验证可知,=x+1,=2x-1,=x-,=x+1这四条直线中过点(4,6)的只有=x-.故选C.
6.B [解析] 由已知数据可知y随着x的增大而减小,则变量x和y负相关,所以<0.因为=×(3+4+5+6+7)=5,=×(3.5+2.4+1.1-0.2-1.3)=1.1,所以1.1=5+,则=1.1-5>0.故选B.
7.D [解析] ∵当x=10时,=23,∴23=20+,解得=3,即=2x+3.∵==,==,∴=2×+3,∴2m-n=-7.故选D.
8.ABC [解析] 由表格数据得==5,==9,所以回归直线必过点(5,9),故C正确,D错误;===1.4,则9=1.4×5+,解得=2,故A,B正确.故选ABC.
9.ABC [解析] 由题知,==3.5,则=0.7×3.5+1.05=3.5,又==,所以=3.5,解得m=4,故A正确;回归直线必过点(3.5,3.5),故B正确;由回归直线方程为=0.7x+1.05知x与y正相关,故C正确;当x=10时,=0.7×10+1.05=8.05,故D错误.故选ABC.
10.57 [解析] 由题知,==4,==37,所以37=5×4+,解得=17,所以预测当广告费用为8万元时,销售额为5×8+17=57(万元).
11. [解析] 由题意知,=xi=2,=yi=-,所以=-+2×2=.
12.6 [解析] ∵=2,∴=1.5×2+1=4.由题意知去掉两组数据(2.2,2.9)和(1.8,5.1)后,和没变,设重新求得的回归直线方程为=x+,将(2,4)代入,解得=2,则=x+2,∴当x=4时,=4+2=6.
13.解:(1)由题知==4,==40,(xi-)(yi-)=(2-4)×(25-40)+(3-4)×(30-40)+(4-4)×(40-40)+(5-4)×(45-40)+(6-4)×(60-40)=85,
(xi-)2=(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2=10,所以===8.5,=-=40-8.5×4=6.所以回归直线方程为=8.5x+6.
(2)当y=80时,80=8.5x+6,解得x≈9.
所以需要的垃圾分类志愿者人数为9.
14.解:(1)因为=×(9+9.5+10+10.5+11)=10,=×(11+10+8+6+5)=8,所以==-3.2,所以=8-(-3.2)×10=40,
所以y关于x的回归直线方程为=-3.2x+40.
(2)当x=8时,=-3.2×8+40=14.4,
则|-y|=|14.4-15|=0.6<0.65,
所以可以认为所得到的回归直线方程是理想的.
15.A [解析] 身高的平均数为=≈176,因为点(167,90)的横坐标167小于平均值176,纵坐标90相对过大,所以去掉(167,90)后回归直线的纵截距变小而斜率变大,故<,>.故选A.
16.解:(1)由题知=xi=×32=4,=yi=×132=16.5,则=-3=16.5-3×4=4.5.
(2)证明:样本点(2,11),(6,22)分别记为(x9,y9),(x10,y10),则这10个样本点横坐标的平均数'=xi=(x9+x10+xi)=×(2+6+32)=4,纵坐标的平均数'=yi=(y9+y10+yi)=×(11+22+132)=16.5,
所以回归直线=x+经过点(4,16.5).4.3 统计模型
4.3.1 一元线性回归模型
第1课时 相关关系与回归直线方程
一、选择题
1.若回归直线方程为=2-1.5x,则变量x 增加1个单位时 (  )
A.平均增加1.5个单位
B.平均增加2个单位
C.平均减少1.5个单位
D.平均减少2个单位
2.为了解某商品的销售量y(件)与销售价格x(元/件)的关系,统计了(x,y)的10组数据,并画成散点图如图,则y关于x的回归直线方程可能是 (  )
A.=-10x-198 B.=-10x+198
C.=10x+198 D.=10x-198
3.[2023·广西百色高二期末] 具有线性相关关系的变量x,y的回归方程为=2-x,则下列选项正确的是 (  )
A.变量x与y是函数关系
B.变量x与y正相关
C.当x=4时,y的预测值为2
D.若x增加1个单位,则y约减少1个单位
4.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊的产量(单位:万盒)的数据如下表所示:
月份x 1 2 3 4 5
产量y(万盒) 5 5 6 6 8
通过上面五组数据得到y关于x的回归直线方程为=0.7x+,预测该制药厂今年7月份甲胶囊的产量为 (  )
A.7.3万盒 B.7.8万盒
C.8.3万盒 D.8.8万盒
5.已知x,y之间的一组数据如下表所示.
x 2 3 4 5 6
y 3 4 6 8 9
则y关于x的回归直线方程的是 (  )
A.=x+1 B.=2x-1
C.=x- D.=x+1
6.已知两个变量x和y之间具有线性相关关系,经调查得到如下样本数据.
x 3 4 5 6 7
y 3.5 2.4 1.1 -0.2 -1.3
根据表格中的数据求得回归直线方程为=x+,则下列说法中正确的是 (  )
A.>0,>0 B.>0,<0
C.<0,>0 D.<0,<0
7.由表中三个样本点通过最小二乘法计算得到y关于x的回归直线方程为=2x+,且当x=10时,=23,则2m-n= (  )
x 12 m 13
y 27 25 n
A.6 B.-6 C.7 D.-7
8.(多选题)某公司为了增加某商品的销售利润,调查了该商品投入的广告费用x(万元)与销售利润y(万元)的统计数据,如下表所示,由表中数据得y关于x的回归直线方程为=x+,则下列结论正确的是 (  )
广告费用x/万元 3 4 6 7
销售利润y/万元 6 8 10 12
A.>0
B.>0
C.回归直线必过点(5,9)
D.回归直线必过点(3,6)
9.(多选题)已知y关于x的回归直线方程为=0.7x+1.05,且变量x,y之间的一组相关数据如下表所示,则下列说法正确的是 (  )
x 2 3 4 5
y 2.5 3 m 4.5
A.m=4
B.回归直线必过点(3.5,3.5)
C.x与y正相关
D.当x=10时,y的估计值为9.05
二、填空题
10.[2023·成都双流中学高二月考] 某商品的广告费用x(万元)与销售额y(万元)的统计数据如下表:
广告费用x(万元) 2 3 5 6
销售额y(万元) 28 31 41 48
根据表中数据可得回归直线方程为=5x+,则预测当广告费用为8万元时,销售额为    万元.
11.某同学收集了具有线性相关关系的两个变量x,y的一组样本数据(xi,yi)(i=1,2,…,10),经计算得到回归直线方程为=-2x+,且xi=20,yi=-25,则=    .
12.已知由一组样本数据确定的回归直线方程为=1.5x+1,且=2,发现有两组数据(2.2,2.9)与(1.8,5.1)的误差较大,去掉这两组数据后,重新求得的回归直线的斜率为1,那么当x=4时,y的估计值为    .
三、解答题
13.[2023·四川广安二中高二月考] 为加强社区居民的垃圾分类意识,推动社区垃圾正确投放,某社区在健身广场举办了“垃圾分类,从我做起”生活垃圾分类大型宣传活动,号召社区居民用实际行动为建设绿色家园贡献一份力量,为此需征集一部分垃圾分类志愿者.某垃圾站的日垃圾分拣量y(千克)与垃圾分类志愿者人数x(人)的数据统计如下:
志愿者人数x(人) 2 3 4 5 6
日垃圾分拣量y(千克) 25 30 40 45 60
通过观察散点图,发现日垃圾分拣量y(千克)与垃圾分类志愿者人数x(人)具有线性相关关系.
(1)求y关于x的回归直线方程;
(2)预测日垃圾分拣量为80千克时,需要的垃圾分类志愿者人数.
参考公式:=,=-.
14.[2024·辽宁盘锦辽东湾高中高二月考] 某科技公司研发了一项新产品A,销售小组进行市场调研,对公司1月份至6月份产品A的销售量及销售单价进行统计,销售单价x(千元)和销售量y(千件)之间的一组数据如下表所示.
月份i 1 2 3 4 5 6
销售单价xi 9 9.5 10 10.5 11 8
销售量yi 11 10 8 6 5 15
(1)试根据1至5月份的数据,建立y关于x的回归直线方程;
(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过0.65,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想
参考公式:在=x+中,=,=-.
参考数据:xiyi=392,=502.5.
15.某校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7名男生,测量了他们的身高和体重统计得到下表.
身高x (单位:cm) 167 173 175 177 178 180 181
体重y (单位:kg) 90 54 59 64 67 72 76
由表格制作如图所示的散点图:
由最小二乘法计算得到回归直线l1的方程为=x+;经过残差分析,点(167,90)对应残差过大,把它去掉后,再用剩下的6组数据计算得到回归直线l2的方程为=x+.则下列选项正确的是 (  )
A.<,>
B.<,<
C.>,<
D.>,>
16.[2023·江苏常州高二期末] 已知两个变量y与x线性相关,某研究小组为得到其具体的线性关系进行了10次试验,得到10个样本点,研究小组去掉了明显偏差较大的2个样本点,剩余的8个样本点(xi,yi)(i=1,2,3,…,8)满足xi=32,yi=132,根据这8个样本点求得的线性回归方程为=3x+.后为稳妥起见,研究小组又增加了2次试验,得到2个偏差较小的样本点(2,11),(6,22),根据这10个样本点重新求得线性回归方程为=x+.
(1)求的值;
(2)证明:回归直线=x+经过点(4,16.5).