(共48张PPT)
4.3 4.3.1 第2课时
相关系数、非线性回归
学习目标
1.了解线性相关系数r的求解公式,并会初步应用. 2.了解非线性相关与线性相关的转化. 3.会用回归分析解决一些简单的实际问题.
新知学习 探究
PART
01
第一部分
思考 如图所示,是某池塘中的浮萍蔓延的面积y(单位:m2)与时间t(单位:月)的关系图象,请问面积y(单位:m2)与时间t(单位:月)之间的关系是线性相关关系吗?如果不是,那是什么关系?
提示:不是线性相关关系,是非线性相关关系.
相关系数
r >0
r <0
弱
强
A.r2<r4<0<r3<r1
B.r4<r2<0<r1<r3
C.r4<r2<0<r3<r1
D.r2<r4<0<r1<r3
【解析】 r1,r3都是正相关,所以r1>0,r3>0,并且r1线性相关性较强,所以r1>r3;r2,r4都是负相关,所以r2<0,r4<0,且r2线性相关性较强,所以|r2|>|r4|,所以r2<r4,所以r2<r4<0<r3<r1.故选A.
√
关于相关系数r的两点说明
(1)样本的相关系数r可以定量地反映出变量间的相关程度,明确给出有无必要建立两变量间的回归直线方程.
(2)|r|很小只是说明两个变量之间的线性相关程度弱,但不一定不相关.
[跟踪训练1] (多选)(2024·内蒙古呼和浩特期末)对两个变量的相关系数r,下列说法正确的是( )
A.|r|越大,线性相关性越强
B.|r|越小,线性相关性越强
C.|r|趋近于0时,没有线性相关关系
D.|r|越接近1时,线性相关性越强
解析:对于A,|r|越大,线性相关性越强,A正确;
对于B,|r|越小,线性相关性越弱,B错误;
对于C,|r|趋近于0时,说明线性相关性弱,但不一定不相关,C错误;
对于D,|r|越接近1时,线性相关性越强,D正确.
√
√
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
【解】 分层抽样:先根据植物覆盖面积的大小对200个地块进行分层,接着在各层中按每层在200个地块中所占比例进行分层抽样.
理由如下:由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关关系.由于各地块间植物覆盖面积的差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.(理由说明合理即可)
相关关系强弱的定量分析与定性分析
(1)定量分析:相关系数r的范围为-1≤r≤1,r为正时,成对数据正相关;r为负时,成对数据负相关;|r|越接近1,成对数据的线性相关性越强;|r|越接近于0,成对数据的线性相关性越弱;当|r|=1时,所有数据点都在一条直线上.
(2)定性分析:相关关系的强弱体现在散点图中就是样本点在某条直线附近越集中,两变量的线性相关关系越强;样本点在某条直线附近越分散,两变量的线性相关关系越弱.
[跟踪训练2] 为了监控某种零件的一条生产线的生产过程,检验员每隔
30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序 1 2 3 4 5 6 7 8
零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
抽取次序 9 10 11 12 13 14 15 16
零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
非线性回归方程
√
【解析】 根据x=0.50,y=-0.99,代入计算,可以排除A选项;
根据x=2.01,y=0.98,代入计算,可以排除B,C选项;
将各数据代入检验,函数y=log2x最接近,可知满足题意.故选D.
解析:由y=menx得z=ln y=ln (menx)=ln m+nx=0.3x-ln 2,所以m=0.5,n=0.3.故选D.
√
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
非线性回归问题一般不给出经验公式,这时,应先画出已知数据的散点图,把它与所学过的各种函数图象作比较,挑选一种跟这些散点图拟合得最好的函数,采用变量代换法,把问题化为线性回归问题,使问题得以解决.
[跟踪训练4] 某企业为确定下一年投入某种产品的研发费用,需了解年研发费用x(单位:千万元)对年销售量y(单位:千万件)的影响,统计了近10年投入的年研发费用xi与年销售量yi(i=1,2,…,10)的数据,得到散点图如图所示.
(1)利用散点图判断y=a+bx和y=c·xd(其中c,d均为大于0的常数)哪一个更适合作为年销售量y和年研发费用x的回归方程类型(只要给出判断即可,不必说明理由);
解:由题中散点图可知,选择回归方程类型y=c·xd(其中c,d均为大于0的常数)更合适.
课堂巩固 自测
PART
02
第二部分
1.(多选)下列关于相关系数r的说法中正确的是( )
A.相关系数r越大两个变量间线性相关性越强
B.相关系数r的取值范围为[-1,1]
C.相关系数r>0时两个变量正相关,r<0时两个变量负相关
D.相关系数r=1时,样本点在同一直线上
√
√
√
解析:对于相关系数r,有以下结论:①当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.②r的绝对值越接近于1,表明两个变量之间的线性相关性越强;r的绝对值越接近于0,表明两个变量之间的线性相关性越弱.对于A,当r<0时此结论不成立,所以A不正确;对于B,C,D,由相关系数的性质可得均正确,故选BCD.
2.(教材P115练习AT5改编)下面各图中,散点图与相关系数r不符合的是( )
√
解析:对于A,散点图上所有点都在一条斜率小于0的直线上,所以相关系数r=-1,A正确;
对于B,散点图上所有点都在一条斜率大于0的直线上,所以相关系数r=1,B错误;
对于C,散点图上所有点从左到右是向下的带状分布,所以相关系数-1<r<0,C正确;
对于D,散点图中,x,y之间的相关关系非常不明显,所以相关系数r=0,D正确.故选B.
解析:画出散点图(图略)可以得到这些样本点在某一条直线上或在该直线附近,故最可能是线性函数模型.故选A.
√
√
5.由两个变量x与y的多组数据绘出的散点图可看出,样本点分布在一条曲线y=x2的附近.若要将其线性化,则只需要设_______________________即可.
解析:设t=x2,则y=t为回归直线方程.
t=x2(字母t不唯一)
1.已学习:(1)相关系数及其性质.(2)牢记三个模型:①幂函数回归模型;②指数函数回归模型;③对数函数回归模型.
2.须贯通:掌握1个方法:对非线性回归问题的处理方法.要先对变量作适当变换,再利用线性回归模型来建模.
3.应注意:利用线性回归模型来建模后要注意回代得到非线性回归方程.