4.3.1 第二课时 相关系数与非线性回归(课件 学案 练习)高中数学人教B版(2019)选择性必修 第二册

文档属性

名称 4.3.1 第二课时 相关系数与非线性回归(课件 学案 练习)高中数学人教B版(2019)选择性必修 第二册
格式 zip
文件大小 3.4MB
资源类型 教案
版本资源 人教B版(2019)
科目 数学
更新时间 2025-08-06 18:46:07

文档简介

第二课时 相关系数与非线性回归
1.如果两个变量之间的线性相关程度很高,则其相关系数r的绝对值应接近于(   )
A.0.5   B.2   C.0   D.1
2.两个变量的散点图如图,可考虑用如下函数进行拟合比较合理的是(   )
A.y=a·xb
B.y=a+bln x
C.y=a·ebx
D.y=a·
3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为(  )
A.-1 B.0 C. D.1
4.(2023·天津高考7题)调查某种群花萼长度和花瓣长度,所得数据如图所示.其中相关系数r=0.824 5,下列说法正确的是(  )
A.花瓣长度和花萼长度没有相关性
B.花瓣长度和花萼长度呈负相关
C.花瓣长度和花萼长度呈正相关
D.若从样本中抽取一部分,则这部分的相关系数一定是0.824 5
5.对于线性相关系数r,叙述正确的是(   )
A.r∈(-∞,+∞),且r越大,相关程度越大
B.r∈(-∞,+∞),且|r|越大,相关程度越大
C.r∈[-1,1],且r越大,相关程度越大
D.r∈[-1,1],且|r|越大,相关程度越大
6.若对甲、乙、丙3组不同的数据作线性相关性检验,得到这3组数据的线性相关系数依次为0.83,0.72,-0.90,则线性相关程度最强的一组是    .(填甲、乙、丙中的一个)
7.已知数据点(xi,yi)(i=1,2,3,…,n)在一条直线上,则相关系数r=    .
8.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y=3的图象附近,令u=ln y,则可通过转换得到的线性回归方程为    .
9.某公司为了预测下月产品销售情况,找出了近7个月的产品销售量y(单位:万件)的统计表:
月份代码t 1 2 3 4 5 6 7
销售量y(万件) y1 y2 y3 y4 y5 y6 y7
但其中数据污损不清,经查证yi=9.32,tiyi=40.17,=0.55.
(1)请用相关系数说明销售量y与月份代码t有很强的线性相关关系;
(2)求y关于t的回归方程(系数精确到0.01);
(3)公司经营期间的广告宣传费xi=(单位:万元)(i=1,2,…,7),每件产品的销售价为10元,预测第8个月的毛利润能否突破15万元,请说明理由.(毛利润等于销售金额减去广告宣传费)
参考公式及数据:≈1.414,≈2.646,相关系数r=,当|r|>0.75时,认为两个变量有很强的线性相关关系,回归方程=t+中斜率和截距的最小二乘估计公式分别为=,=-.
10.(多选)某同学将收集到的六组数据制作成散点图如图所示,并得到其回归直线的方程为l1:=0.68x+,计算其相关系数为r1.经过分析确定点F为“离群点”,把它去掉后,再利用剩下的5组数据计算得到回归直线的方程为l2:=x+0.68,相关系数为r2,以下结论中,正确的是(   )
A.r1>0,r2>0 B.r1>r2
C.=0.12 D.0<<0.68
11.以模型y=cekx去拟合一组数据时,为了求出回归方程,设=ln y,其变换后得到线性回归方程=0.3x+4,则c=    .
12.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据进行初步处理,得到如图所示的散点图及一些统计量的值.
(xi-)2 (wi-)2
46.6 563 6.8 289.8 1.6
(xi-)·(yi-) (wi-)·(yi-)
1.469 108.8
表中wi=,=wi.
(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:
①年宣传费x=49时,年销售量及年利润的预报值是多少?
②年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线=+u的斜率和截距的最小二乘估计分别为=,=-.
第二课时 相关系数与非线性回归
1.D 相关系数|r|越接近于1,相关程度越高.故选D.
2.B 由散点图可知,此曲线类似对数函数型曲线,因此可用函数y=a+bln x模型进行拟合.故选B.
3.D 所有样本点均在同一条斜率为正数的直线上,则样本相关系数最大,为1,故选D.
4.C 由题图可知数据分布在一条直线附近,且呈正相关.故选C.
5.D 相关系数r是来衡量两个变量之间的线性相关程度的,线性相关系数是一个绝对值小于等于1的量,并且它的绝对值越大就说明相关程度越大.故选D.
6.丙 解析:两个变量y与x的回归模型中,它们的相关系数|r|越接近于1,这个模型的两个变量线性相关程度就越强,在甲、乙、丙中,所给的数值中-0.90的绝对值最接近1,所以丙的线性相关程度最强.
7.±1 解析:由题易知,相关系数r=±1.
8.=1+ln 3+2x 解析:由y=3e2x+1,得ln y=ln(3e2x+1),
即ln y=ln 3+2x+1.
令u=ln y,则线性回归方程为=1+ln 3+2x.
9.解:(1)由题中的数据可得=4,(ti-)2=28,=0.55,(ti-)(yi-)=tiyi-yi=40.17-4×9.32=2.89,
所以r=≈0.99>0.75,
所以销售量y与月份代码t有很强的线性相关关系.
(2)由=≈1.331及(1)得==≈0.103,=-≈1.331-0.103×4≈0.92,
所以y关于t的回归方程为=0.10t+0.92.
(3)当t=8时,代入回归方程得=0.10×8+0.92=1.72(万件),
故第8个月的毛利润为z=10×1.72-≈17.2-2×1.414=14.372,
因为14.372<15,预测第8个月的毛利润不能突破15万元.
10.ACD 由图可知两变量呈现正相关,故r1>0,r2>0,去掉“离群点”F后,两变量的线性相关性更强,故r1<r2,故A正确,B错误;又回归直线l1:=0.68x+必经过样本中心点(3.5,2.5),所以=2.5-0.68×3.5=0.12,故C正确;回归直线l2:=x+0.68必经过样本中心点(3,2),所以2=×3+0.68,所以=0.44,也可直接根据图象判断0<<0.68(比较两直线的倾斜程度),故D正确,故选A、C、D.
11.e4 解析:∵y=cekx,∴两边取对数,
可得ln y=ln(cekx)=ln c+ln ekx=ln c+kx,
令z=ln y,可得z=ln c+kx,
∵z=0.3x+4,∴ln c=4,∴c=e4.
12.解:(1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.
(2)令w=,建立y关于w的经验回归方程y=c+dw.
由于===68,
=-=563-68×6.8=100.6,
所以y关于w的经验回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68.
(3)①由(2)知,当x=49时,年销售量y的预报值
=100.6+68=576.6,
年利润z的预报值=0.2×576.6-49=66.32.
②根据(2)的结果知,年利润z的预报值
=0.2(100.6+68)-x=-x+13.6+20.12.
所以当==6.8,即x=46.24时, 取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.
3 / 3第二课时 相关系数与非线性回归
新课程标准解读 核心素养
1.了解两个变量间的线性相关系数r,并能利用公式求相关系数r 数据处理
2.能利用相关系数r判断两个变量线性相关程度的大小,从而判断回归直线方程拟合的效果 数学运算
3.掌握非线性回归转化为线性回归的方法,会求非线性回归方程,并作出预测 逻辑推理
  据数据统计,2020~2024年截止到10月底的数据显示,聚丙烯期货价格及现货价格二者相关系数为88.70%,其中2020年二者相关系数高达90.86%,2021年降至83.97%,2022年截止到10月底二者相关系数为65.23%.
【问题】  你知道什么是相关系数吗,它有什么作用呢?
                       
                       
                       
知识点一 相关系数
1.定义:统计学里一般用
r=
= 来衡量y与x的线性相关性强弱,这里的r称为线性相关系数(简称为相关系数).
2.性质
(1)|r|≤    ,且y与x正相关的充要条件是     ,y与x负相关的充要条件是     ;
(2)|r|越   ,说明两个变量之间的线性相关性越   ,也就是得出的回归直线方程越没有价值,即方程越不能反映真实的情况;|r|越   ,说明两个变量之间的线性相关性越   ,也就是得出的回归直线方程越有价值;
(3)|r|=1的充要条件是成对数据构成的点都在      上.
知识点二 非线性回归方程
 如果具有相关关系的两个变量x,y不是      关系,那么称为非线性相关关系,所得到的方程称为非线性回归方程.
【想一想】
如何猜测非线性回归方程的类型?
1.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r如下表:
甲 乙 丙 丁
r 0.82 0.78 0.69 0.85
则哪位同学的试验结果体现A,B两变量有更强的线性相关性(  )
A.甲       B.乙
C.丙 D.丁
2.在一项调查中有两个变量x和y,下图是由这两个变量近8年来的取值数据得到的散点图,那么适宜作为y关于x的回归方程的函数类型是(  )
A.y=a+bx B.y=c+d
C.y=m+nx2 D.y=p+qcx(q>0)
3.在一次试验中,测得(x,y)的四组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的相关系数为    .
题型一 相关系数的性质
【例1】 (1)在一组数据为(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若这组样本数据的相关系数为-1,则所有的样本点(xi,yi)(i=1,2,…,n)满足的方程可以是(  )
A.y=-x+1      B.y=x-1
C.y=x+1 D.y=-x2
(2)设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线方程的回归系数为,回归截距是,那么必有(  )
A.与r的符号相同
B.与r的符号相同
C.与r的符号相反
D.与r的符号相反
尝试解答                       
                       
通性通法
线性相关强弱的判断方法
(1)散点图(越接近直线,相关性越强);
(2)相关系数(绝对值越大,相关性越强).
【跟踪训练】
如图是具有相关关系的两个变量的一组数据的散点图和回归直线,若去掉一个点使得余下的5个点所对应的数据的相关系数最大,则应当去掉的点是(  )
A.D   B.E   C.F   D.A
题型二 相关系数的计算及应用
【例2】 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.
甲醛 浓度x 18 20 22 24 26 28 30
缩醛 化度y 26.86 28.35 28.75 28.87 29.75 30.00 30.36
求样本相关系数r并判断它们的相关程度.
尝试解答                       
                       
通性通法
  当相关系数|r|越接近1时,两个变量的相关关系越强,当相关系数|r|越接近0时,两个变量的相关关系越弱.
【跟踪训练】
柴静《穹顶之下》的播出,让大家对雾霾天气的危害有了更近一步的认识,对于雾霾天气的研究也渐渐活跃起来,某镇团委对春节期间该镇燃放烟花爆竹的天数x与雾霾天数y进行统计分析,得出下表数据:
x 11 15 17 20 22
y 4 5 6 7 8
(1)据统计表明,x与y之间具有线性相关关系,请用相关系数r加以说明;(若|r|>0.75,则可认为y与x有较强的线性相关关系,r精确到0.01)
(2)试用最小二乘法求出y关于x的线性回归方程(系数用分数表示),并预测当x=25时,y的值;(精确到个位)
(3)若在春节所在的那个月内,雾霾的天数y落在区间(y-2s,y+2s)的右侧(其中s为标准差),则认为雾霾将对该镇人们的生产、生活造成较大的影响,镇政府将根据该结果出台限制节假日燃放烟花爆竹的条例,否则将暂不采取相应措施.现已知2024年2月该镇雾霾天数为9,问:该镇是否需要出台限制节假日燃放烟花爆竹的条例,试说明理由.
附:参考数据:xiyi=537,=1 519, ≈27.2,s=≈1.4.
参考公式:回归方程=x+中斜率和截距的最小二乘估计公式分别为:=,=-,相关系数r=.
题型三 非线性回归方程
【例3】 近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引了越来越多的人开始使用扫码支付.某公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,Y(单位:十人次)表示每天使用扫码支付的人次,统计数据如表所示:
x 1 2 3 4 5 6 7
y 6 11 21 34 66 101 196
根据以上数据,绘制了如图所示的散点图.
(1)根据散点图判断,在推广期内,y=a+bx与y=c·dx哪一个适合作为扫码支付的人次y关于活动推出的天数x的回归方程(给出判断结果即可,不必说明理由);
(2)根据(1)的判断结果及表中的数据,求y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.
参考数据:
xivi 100.54
62.14 1.54 50.12 3.47
其中vi=lg yi,=vi.
参考公式:=,=-.
尝试解答                       
                       
通性通法
非线性回归问题的求解步骤
【跟踪训练】
以下是近几年我国新能源汽车的年销售量数据及其散点图:
年份 2019 2020 2021 2022 2023
年份代码x 1 2 3 4 5
新能源汽车年销量y(万辆) 1.5 5.9 17.7 32.9 55.6
(1)请根据散点图判断,y=ax+b与y=cx2+d中哪一个更适宜作为年销售量y关于年份代码x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测2027年我国新能源汽车的销售量(精确到0.1).
附:=,=-.
参考数据:
(wi-)2 (xi-)(yi-) (wi-)(yi-)
22.72 374 135.2 851.2
其中wi=
1.两个变量之间的线性相关程度越低,其线性相关系数的数值(  )
A.越接近于-1
B.越接近于0
C.越接近于1
D.越小
2.如图所示,给出了样本容量均为7的A,B两组样本数据的散点图,已知A组样本数据的相关系数为r1,B组数据的相关系数为r2,则(  )
A.r1=r2 B.r1<r2
C.r1>r2 D.无法判定
3.若回归直线方程中的回归系数=0,则相关系数r=    .
第二课时 相关系数与非线性回归
【基础知识·重落实】
知识点一
2.(1)1 r>0 r<0 (2)小 弱 大 强 (3)回归直线
知识点二
线性相关
想一想
提示:可以通过作出散点图,结合已学的函数模型进行猜测.
自我诊断
1.D 由相关系数的意义可知,相关系数r的绝对值越接近1,相关性越强,结合题意,可知丁的线性相关性更强,故选D.
2.B 散点图呈曲线,排除A选项,且增长速度变慢,排除选项C、D,故选B.
3.-1 解析:法一 =1.5,=1,=22,=56,xiyi=-20,
相关系数r==-1.
法二 观察四个点,发现其在一条单调递减的直线上,故y与x的相关系数为-1.
【典型例题·精研析】
【例1】  (1)A (2)A 解析:(1)∵这组样本数据的相关系数为-1,∴这一组数据(x1,y1),(x2,y2),…(xn,yn)线性相关,排除D,又相关系数为-1,∴样本数据为负相关,排除B、C(B、C为正相关),故选A.
(2)∵相关系数r为正,表示正相关,回归直线上升,r为负,表示负相关,回归直线下降,∴与r的符号相同,故选A.
跟踪训练
B 因为相关系数的绝对值越大,越接近1,则说明两个变量的相关性越强.因为点E到直线的距离最远,所以去掉点E,余下的5个点所对应的数据的相关系数最大.
【例2】 解:列表如下
i xi yi xiyi
1 18 26.86 324 721.459 6 483.48
2 20 28.35 400 803.722 5 567
3 22 28.75 484 826.562 5 632.5
4 24 28.87 576 833.476 9 692.88
5 26 29.75 676 885.062 5 773.5
6 28 30.00 784 900 840
7 30 30.36 900 921.729 6 910.80
168 202.94 4 144 5 892.013 6 4 900.16
==24,=,
r=
=≈0.96.
由此可知,甲醛浓度与缩醛化度之间有很强的正线性相关关系.
跟踪训练
解:(1)由题意,计算=×(11+15+17+20+22)=17,=×(4+5+6+7+8)=6,
所以相关系数r=≈
≈0.99>0.75,
所以可以认为y与x有较强的线性相关关系.
(2)由(1)及已知得,===,=-=6-×17=-,
所以y关于x的线性回归方程为=x-,
当x=25时,=×25-≈9.
(3)由题意知s=≈1.4,所以(-2s,+2s)=(3.2,8.8),且9>8.8,所以该镇需要出台限制节假日燃放烟花爆竹的条例.
【例3】 解:(1)根据散点图判断,y=c·dx适合作为扫码支付的人次y关于活动推出的天数x的回归方程.
(2)对y=c·dx两边同时取常用对数得:lg y=lg(c·dx)=lg c+xlg d,∴v=lg c+xlg d.
令m=lg c,t=lg d.
∵=4,=1.54,=140,
∴====0.25,
把(4,1.54)代入=+,得=0.54,
∴=0.54+0.25x,
∴y关于x的回归方程为=100.54+0.25x=3.47×100.25x.
把x=8代入上式得,=3.47×102=347,
∴活动推出第8天使用扫码支付的人次约为347.
跟踪训练
解:(1)根据散点图,y=cx2+d更适宜作为年销量y关于年份代码x的回归方程类型.
(2)依题意,=11,==≈2.28,
=-=22.72-2.28×11=-2.36,
=2.28w-2.36=2.28x2-2.36,
令x=9,=182.32,
故预测2027年我国新能源汽车的销量为182.3万辆.
随堂检测
1.B 由相关系数的含义可得:两个变量之间的线性相关程度越低,其线性相关系数的数值越接近于0.故选B.
2.C 根据A,B两组样本数据的散点图知,A组样本数据几乎在一条直线上,且成正相关,∴相关系数为r1应最接近1,B组数据分散在一条直线附近,也成正相关,∴相关系数为r2,满足r2<r1,即r1>r2,故选C.
3.0 解析:相关系数r=与=的分子相同,故r=0.
6 / 6(共74张PPT)
第二课时
相关系数与非线性回归
新课程标准解读 核心素养
1.了解两个变量间的线性相关系数 r ,并能利
用公式求相关系数 r 数据处理
2.能利用相关系数 r 判断两个变量线性相关程
度的大小,从而判断回归直线方程拟合的效果 数学运算
3.掌握非线性回归转化为线性回归的方法,会
求非线性回归方程,并作出预测 逻辑推理
目录
基础知识·重落实
01
典型例题·精研析
02
知能演练·扣课标
03
基础知识·重落实
01
课前预习 必备知识梳理
  据数据统计,2020~2024年截止到10月底的数据显示,聚丙烯期
货价格及现货价格二者相关系数为88.70%,其中2020年二者相关系
数高达90.86%,2021年降至83.97%,2022年截止到10月底二者相关
系数为65.23%.
【问题】  你知道什么是相关系数吗,它有什么作用呢?
                                            
                                           
 
知识点一 相关系数
1. 定义:统计学里一般用 r =
= 来衡量 y 与 x 的线性相关性强弱,这里的 r
称为线性相关系数(简称为相关系数).
2. 性质
(1)| r |≤ ,且 y 与 x 正相关的充要条件是 , y
与 x 负相关的充要条件是 ;
(2)| r |越 ,说明两个变量之间的线性相关性
越 ,也就是得出的回归直线方程越没有价值,即方程
越不能反映真实的情况;| r |越 ,说明两个变量之
间的线性相关性越 ,也就是得出的回归直线方程越有
价值;
(3)| r |=1的充要条件是成对数据构成的点都在
上.
1 
r >0 
r <0 
小 
弱 
大 
强 
回归直
线 上.
知识点二 非线性回归方程
 如果具有相关关系的两个变量 x , y 不是 关系,那么
称为非线性相关关系,所得到的方程称为非线性回归方程.
线性相关 
【想一想】
如何猜测非线性回归方程的类型?
提示:可以通过作出散点图,结合已学的函数模型进行猜测.
1. 甲、乙、丙、丁四位同学各自对 A , B 两变量的线性相关性做试
验,并用回归分析方法分别求得相关系数 r 如下表:
甲 乙 丙 丁
r 0.82 0.78 0.69 0.85
则哪位同学的试验结果体现 A , B 两变量有更强的线性相关性(  )
A. 甲 B. 乙
C. 丙 D. 丁
解析:  由相关系数的意义可知,相关系数 r 的绝对值越接近1,
相关性越强,结合题意,可知丁的线性相关性更强,故选D.
2. 在一项调查中有两个变量 x 和 y ,下图是由这两个变量近8年来的取
值数据得到的散点图,那么适宜作为 y 关于 x 的回归方程的函数类
型是(   )
A. y = a + bx B. y = c + d
C. y = m + nx2 D. y = p + qcx ( q >0)
解析:  散点图呈曲线,排除A选项,且增长速度变慢,排除选
项C、D,故选B.
3. 在一次试验中,测得( x , y )的四组值分别为(1,2),(2,
0),(4,-4),(-1,6),则 y 与 x 的相关系数为
.
解析:法一  =1.5, =1, =22, =56, xiyi =
-20,相关系数 r = =-1.

1
法二 观察四个点,发现其在一条单调递减的直线上,故 y 与 x 的相
关系数为-1.
典型例题·精研析
02
课堂互动 关键能力提升
题型一 相关系数的性质
【例1】 (1)在一组数据为( x1, y1),( x2, y2),…,( xn ,
yn )( n ≥2, x1, x2,…, xn 不全相等)的散点图中,若这组样本数
据的相关系数为-1,则所有的样本点( xi , yi )( i =1,2,…,
n )满足的方程可以是(  )
A. y =- x +1 B. y = x -1
C. y = x +1 D. y =- x2
解析: ∵这组样本数据的相关系数为-1,∴这一组数据
( x1, y1),( x2, y2),…( xn , yn )线性相关,排除D,又
相关系数为-1,∴样本数据为负相关,排除B、C(B、C为正
相关),故选A.
(2)设两个变量 x 和 y 之间具有线性相关关系,它们的相关系数是
r , y 关于 x 的回归直线方程的回归系数为 ,回归截距是 ,那
么必有(   )
A. 与 r 的符号相同 B. 与 r 的符号相同
C. 与 r 的符号相反 D. 与 r 的符号相反
解析: ∵相关系数 r 为正,表示正相关,回归直线上升, r 为负,
表示负相关,回归直线下降,∴ 与 r 的符号相同,故选A.
通性通法
线性相关强弱的判断方法
(1)散点图(越接近直线,相关性越强);
(2)相关系数(绝对值越大,相关性越强).
【跟踪训练】
如图是具有相关关系的两个变量的一组数据的散点图和回归直线,若
去掉一个点使得余下的5个点所对应的数据的相关系数最大,则应当
去掉的点是(   )
A. D B. E
C. F D. A
解析:  因为相关系数的绝对值越大,越接近1,则说明两个变量的
相关性越强.因为点 E 到直线的距离最远,所以去掉点 E ,余下的5个
点所对应的数据的相关系数最大.
题型二 相关系数的计算及应用
【例2】 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化
度” y 来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是
影响缩醛化度的重要因素,在生产中常用甲醛浓度 x (克/升)去
控制这一指标,为此必须找出它们之间的关系,现安排一批实
验,获得如下数据.
甲醛 浓度 x 18 20 22 24 26 28 30
缩醛 化度 y 26.86 28.35 28.75 28.87 29.75 30.00 30.36
求样本相关系数 r 并判断它们的相关程度.
解:列表如下
i xi yi xiyi
1 18 26.86 324 721.459 6 483.48
2 20 28.35 400 803.722 5 567
3 22 28.75 484 826.562 5 632.5
4 24 28.87 576 833.476 9 692.88
5 26 29.75 676 885.062 5 773.5
6 28 30.00 784 900 840
7 30 30.36 900 921.729 6 910.80
168 202.94 4 144 5 892.013 6 4 900.16
= =24, = , r =
= ≈0.96.
由此可知,甲醛浓度与缩醛化度之间有很强的正线性相关关系.
通性通法
  当相关系数| r |越接近1时,两个变量的相关关系越强,当相关
系数| r |越接近0时,两个变量的相关关系越弱.
【跟踪训练】
柴静《穹顶之下》的播出,让大家对雾霾天气的危害有了更近一
步的认识,对于雾霾天气的研究也渐渐活跃起来,某镇团委对春
节期间该镇燃放烟花爆竹的天数 x 与雾霾天数 y 进行统计分析,得
出下表数据:
x 11 15 17 20 22
y 4 5 6 7 8
(1)据统计表明, x 与 y 之间具有线性相关关系,请用相关系数 r 加
以说明;(若| r |>0.75,则可认为 y 与 x 有较强的线性相关
关系, r 精确到0.01)
解: 由题意,计算 = ×(11+15+17+20+22)=17, =
×(4+5+6+7+8)=6,
所以相关系数 r =
≈ ≈0.99>0.75,
所以可以认为 y 与 x 有较强的线性相关关系.
解:由(1)及已知得, = = = , = -
=6- ×17=- ,
所以 y 关于 x 的线性回归方程为 = x - ,
当 x =25时, = ×25- ≈9.
(2)试用最小二乘法求出 y 关于 x 的线性回归方程(系数用分数表
示),并预测当 x =25时, y 的值;(精确到个位)
(3)若在春节所在的那个月内,雾霾的天数 y 落在区间( y -2 s , y
+2 s )的右侧(其中 s 为标准差),则认为雾霾将对该镇人们的
生产、生活造成较大的影响,镇政府将根据该结果出台限制节
假日燃放烟花爆竹的条例,否则将暂不采取相应措施.现已知
2024年2月该镇雾霾天数为9,问:该镇是否需要出台限制节假
日燃放烟花爆竹的条例,试说明理由.
解:由题意知 s = ≈1.4,所以( -2 s , +2 s )
=(3.2,8.8),且9>8.8,所以该镇需要出台限制节假日燃放烟花
爆竹的条例.
附:参考数据: xiyi =537, =1 519,
≈27.2, s = ≈1.4.
参考公式:回归方程 = x + 中斜率和截距的最小二乘估计公式分
别为: = , = - ,相关系数 r =
.
题型三 非线性回归方程
【例3】 近期,某公交公司分别推出支付宝和微信扫码支付乘车
活动,活动设置了一段时间的推广期,由于推广期内优惠力度较
大,吸引了越来越多的人开始使用扫码支付.某公交车队统计了活
动刚推出一周内每一天使用扫码支付的人次,用 x 表示活动推出的
天数, Y (单位:十人次)表示每天使用扫码支付的人次,统计
数据如表所示:
x 1 2 3 4 5 6 7
y 6 11 21 34 66 101 196
根据以上数据,绘制了如图所示的散点图.
(1)根据散点图判断,在推广期内, y = a + bx 与 y = c · dx 哪一个适
合作为扫码支付的人次 y 关于活动推出的天数 x 的回归方程(给
出判断结果即可,不必说明理由);
解: 根据散点图判断, y = c · dx 适合
作为扫码支付的人次 y 关于活动推出的天数
x 的回归方程.
(2)根据(1)的判断结果及表中的数据,求 y 关于 x 的回归方程,
并预测活动推出第8天使用扫码支付的人次.
参考数据:
xivi 100.54
62.14 1.54 50.12 3.47
其中 vi =lg yi , = vi .
参考公式: = , = - .
解: 对 y = c · dx 两边同时取常用对数
得:lg y =lg( c · dx )=lg c + x lg d ,∴ v =
lg c + x lg d .
令 m =lg c , t =lg d .
∵ =4, =1.54, =140,
∴ = = = =0.25,
把(4,1.54)代入 = + ,得 =0.54,
∴ =0.54+0.25 x ,
∴ y 关于 x 的回归方程为 =100.54+0.25 x =3.47×100.25 x .
把 x =8代入上式得, =3.47×102=347,
∴活动推出第8天使用扫码支付的人次约为347.
通性通法
非线性回归问题的求解步骤
【跟踪训练】
以下是近几年我国新能源汽车的年销售量数据及其散点图:
年份 2019 2020 2021 2022 2023
年份代码 x 1 2 3 4 5
新能源汽车年销量 y (万
辆) 1.5 5.9 17.7 32.9 55.6
(1)请根据散点图判断, y = ax + b 与 y = cx2+ d 中哪一个更适宜作
为年销售量 y 关于年份代码 x 的回归方程类型?(给出判断即
可,不必说明理由)
解: 根据散点图, y = cx2
+ d 更适宜作为年销量 y 关于年
份代码 x 的回归方程类型.
(2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方程,
并预测2027年我国新能源汽车的销售量(精确到0.1).
附: = , = - .
参考数据:
( wi -
)2 ( xi - )( yi -
) ( wi - )( yi -

22.72 374 135.2 851.2
其中 wi =
解: 依题意, =11,
= =
≈2.28,
= - =22.72-2.28×11=-2.36,
=2.28 w -2.36=2.28 x2-2.36,
令 x =9, =182.32,故预测2027年我国新能源汽车的销量为182.3
万辆.
1. 两个变量之间的线性相关程度越低,其线性相关系数的数值
(   )
A. 越接近于-1 B. 越接近于0
C. 越接近于1 D. 越小
解析:  由相关系数的含义可得:两个变量之间的线性相关程度
越低,其线性相关系数的数值越接近于0.故选B.
2. 如图所示,给出了样本容量均为7的 A , B 两组样本数据的散点
图,已知 A 组样本数据的相关系数为 r1, B 组数据的相关系数为
r2,则(   )
A. r1= r2 B. r1< r2
C. r1> r2 D. 无法判定
解析:  根据 A , B 两组样本数据的散点图知, A 组样本数据几
乎在一条直线上,且成正相关,∴相关系数为 r1应最接近1, B 组
数据分散在一条直线附近,也成正相关,∴相关系数为 r2,满足 r2
< r1,即 r1> r2,故选C.
3. 若回归直线方程中的回归系数 =0,则相关系数 r =     .
0
解析:相关系数 r = 与 =
的分子相同,故 r =0.
知能演练·扣课标
03
课后巩固 核心素养落地
1. 如果两个变量之间的线性相关程度很高,则其相关系数 r 的绝对值
应接近于(   )
A. 0.5 B. 2
C. 0 D. 1
解析:  相关系数| r |越接近于1,相关程度越高.故选D.
1
2
3
4
5
6
7
8
9
10
11
12
2. 两个变量的散点图如图,可考虑用如下函数进行拟合比较合理的是
(   )
A. y = a · xb B. y = a + b ln x
C. y = a ·e bx D. y = a ·
解析:  由散点图可知,此曲线类似对数函数型曲线,因此可用
函数 y = a + b ln x 模型进行拟合.故选B.
1
2
3
4
5
6
7
8
9
10
11
12
3. 在一组样本数据( x1, y1),( x2, y2),…,( xn , yn )( n
≥2, x1, x2,…, xn 不全相等)的散点图中,若所有样本点
( xi , yi )( i =1,2,…, n )都在直线 y = x +1上,则这组样
本数据的样本相关系数为(  )
A. -1 B. 0
C. D. 1
解析:  所有样本点均在同一条斜率为正数的直线上,则样本相
关系数最大,为1,故选D.
1
2
3
4
5
6
7
8
9
10
11
12
4. (2023·天津高考7题)调查某种群花萼长度和花瓣长度,所得数据
如图所示.其中相关系数 r =0.824 5,下列说法正确的是(  )
A. 花瓣长度和花萼长度没有相关性
B. 花瓣长度和花萼长度呈负相关
C. 花瓣长度和花萼长度呈正相关
D. 若从样本中抽取一部分,则这部分的相关系数一定是0.824 5
1
2
3
4
5
6
7
8
9
10
11
12
解析:  由题图可知数据分布在一条直线附近,且呈正相关.故
选C.
1
2
3
4
5
6
7
8
9
10
11
12
5. 对于线性相关系数 r ,叙述正确的是(   )
A. r ∈(-∞,+∞),且 r 越大,相关程度越大
B. r ∈(-∞,+∞),且| r |越大,相关程度越大
C. r ∈[-1,1],且 r 越大,相关程度越大
D. r ∈[-1,1],且| r |越大,相关程度越大
解析:  相关系数 r 是来衡量两个变量之间的线性相关程度的,
线性相关系数是一个绝对值小于等于1的量,并且它的绝对值越大
就说明相关程度越大.故选D.
1
2
3
4
5
6
7
8
9
10
11
12
6. 若对甲、乙、丙3组不同的数据作线性相关性检验,得到这3组数据
的线性相关系数依次为0.83,0.72,-0.90,则线性相关程度最强
的一组是 .(填甲、乙、丙中的一个)
解析:两个变量 y 与 x 的回归模型中,它们的相关系数| r |越接近
于1,这个模型的两个变量线性相关程度就越强,在甲、乙、丙
中,所给的数值中-0.90的绝对值最接近1,所以丙的线性相关程
度最强.

1
2
3
4
5
6
7
8
9
10
11
12
7. 已知数据点( xi , yi )( i =1,2,3,…, n )在一条直线上,则
相关系数 r = .
解析:由题易知,相关系数 r =±1.
±1
1
2
3
4
5
6
7
8
9
10
11
12
8. 已知具有相关关系的两个随机变量的一组观测数据的散点图分布在
函数 y =3 的图象附近,令 u =ln y ,则可通过转换得到的线性
回归方程为 .
解析:由 y =3e2 x+1,得ln y =ln(3e2 x+1),
即ln y =ln 3+2 x +1.
令 u =ln y ,则线性回归方程为 =1+ln 3+2 x .
=1+ln 3+2 x
1
2
3
4
5
6
7
8
9
10
11
12
9. 某公司为了预测下月产品销售情况,找出了近7个月的产品销售量
y (单位:万件)的统计表:
月份代码 t 1 2 3 4 5 6 7
销售量 y
(万件) y1 y2 y3 y4 y5 y6 y7
但其中数据污损不清,经查证 yi =9.32, tiyi =40.17,
=0.55.
1
2
3
4
5
6
7
8
9
10
11
12
参考公式及数据: ≈1.414, ≈2.646,相关系数 r =
,当| r |>0.75时,认为两个变量有很强
的线性相关关系,回归方程 = t + 中斜率和截距的最小二乘估计
公式分别为 = , = - .
1
2
3
4
5
6
7
8
9
10
11
12
解: 由题中的数据可得 =4, ( ti - )2=28,
=0.55,
( ti - )( yi - )= tiyi - yi =40.17-4×9.32=2.89,
所以 r = ≈0.99>0.75,
所以销售量 y 与月份代码 t 有很强的线性相关关系.
(1)请用相关系数说明销售量 y 与月份代码 t 有很强的线性相
关关系;
1
2
3
4
5
6
7
8
9
10
11
12
解:由 = ≈1.331及(1)得 = = ≈0.103,
= - ≈1.331-0.103×4≈0.92,
所以 y 关于 t 的回归方程为 =0.10 t +0.92.
(2)求 y 关于 t 的回归方程(系数精确到0.01);
1
2
3
4
5
6
7
8
9
10
11
12
(3)公司经营期间的广告宣传费 xi = (单位:万元)( i =1,
2,…,7),每件产品的销售价为10元,预测第8个月的毛利
润能否突破15万元,请说明理由.(毛利润等于销售金额减去
广告宣传费)
解:当 t =8时,代入回归方程得 =0.10×8+0.92=1.72(万
件),
故第8个月的毛利润为 z =10×1.72- ≈17.2-2×1.414=14.372,
因为14.372<15,预测第8个月的毛利润不能突破15万元.
1
2
3
4
5
6
7
8
9
10
11
12
10. (多选)某同学将收集到的六组数据制作成散点图如图所示,并
得到其回归直线的方程为 l1: =0.68 x + ,计算其相关系数为
r1.经过分析确定点 F 为“离群点”,把它去掉后,再利用剩下的
5组数据计算得到回归直线的方程为 l2: = x +0.68,相关系数
为 r2,以下结论中,正确的是(   )
A. r1>0, r2>0 B. r1> r2
C. =0.12 D. 0< <0.68
1
2
3
4
5
6
7
8
9
10
11
12
解析:  由图可知两变量呈现正相关,故 r1>0, r2>0,去
掉“离群点” F 后,两变量的线性相关性更强,故 r1< r2,故A正
确,B错误;又回归直线 l1: =0.68 x + 必经过样本中心点
(3.5,2.5),所以 =2.5-0.68×3.5=0.12,故C正确;回归
直线 l2: = x +0.68必经过样本中心点(3,2),所以2=
×3+0.68,所以 =0.44,也可直接根据图象判断0< <0.68
(比较两直线的倾斜程度),故D正确,故选A、C、D.
1
2
3
4
5
6
7
8
9
10
11
12
11. 以模型 y = c e kx 去拟合一组数据时,为了求出回归方程,设 =ln
y ,其变换后得到线性回归方程 =0.3 x +4,则 c = .
解析:∵ y = c e kx ,∴两边取对数,
可得ln y =ln( c e kx )=ln c +ln e kx =ln c + kx ,
令 z =ln y ,可得 z =ln c + kx ,
∵ z =0.3 x +4,∴ln c =4,∴ c =e4.
e4
1
2
3
4
5
6
7
8
9
10
11
12
12. 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传
费 x (单位:千元)对年销售量 y (单位:t)和年利润 z (单
位:千元)的影响.对近8年的年宣传费 xi 和年销售量 yi ( i =
1,2,…,8)数据进行初步处理,得到如图所示的散点图及
一些统计量的值.
1
2
3
4
5
6
7
8
9
10
11
12
( xi -
)2 ( wi -
)2 ( xi -
)·( yi -
) ( wi -
)·
( yi - )
46
.6 563 6.8 289.8 1.6 1.469 108.8
表中 wi = , = wi .
1
2
3
4
5
6
7
8
9
10
11
12
(1)根据散点图判断, y = a + bx 与 y = c + d 哪一个适宜作为
年销售量 y 关于年宣传费 x 的回归方程类型?(给出判断即
可,不必说明理由)
解: 由散点图可以判断, y = c + d 适宜作为年销售
量 y 关于年宣传费 x 的回归方程类型.
1
2
3
4
5
6
7
8
9
10
11
12
(2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归
方程;
解: 令 w = ,建立 y 关于 w 的经验回归方程 y = c + dw .
由于 = = =68,
= - =563-68×6.8=100.6,
所以 y 关于 w 的经验回归方程为 =100.6+68 w ,因此 y 关
于 x 的回归方程为 =100.6+68 .
1
2
3
4
5
6
7
8
9
10
11
12
(3)已知这种产品的年利润 z 与 x , y 的关系为 z =0.2 y - x .根
据(2)的结果回答下列问题:
①年宣传费 x =49时,年销售量及年利润的预报值是多少?
②年宣传费 x 为何值时,年利润的预报值最大?
附:对于一组数据( u1, v1),( u2, v2),…,( un ,
vn ),其回归直线 = + u 的斜率和截距的最小二乘估计
分别为 = , = - .
1
2
3
4
5
6
7
8
9
10
11
12
解: ①由(2)知,当 x =49时,年销售量 y 的预报值
=100.6+68 =576.6,
年利润 z 的预报值 =0.2×576.6-49=66.32.
②根据(2)的结果知,年利润 z 的预报值
=0.2(100.6+68 )- x =- x +13.6 +20.12.
所以当 = =6.8,即 x =46.24时, 取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.
1
2
3
4
5
6
7
8
9
10
11
12
谢 谢 观 看!