第一课时 相关关系与回归直线方程
1.已知变量x,y之间具有线性相关关系,其散点图如图所示,则其回归方程可能为( )
A.=1.5x+2
B.=-1.5x+2
C.=1.5x-2
D.=-1.5x-2
2.某校地理学科兴趣小组在某座山测得海拔高度、气压和沸点的六组数据绘制成散点图如图所示,则下列说法错误的是( )
A.沸点与海拔高度呈正相关
B.沸点与气压呈正相关
C.沸点与海拔高度呈负相关
D.沸点与海拔高度、沸点与气压的相关性都很强
3.对有线性相关关系的两个变量建立的回归直线方程=+x中,回归系数( )
A.不能小于0 B.不能大于0
C.不能等于0 D.只能小于0
4.一位母亲记录了儿子3~9岁的身高数据(数据略),由此建立的身高(单位:cm)与年龄(单位:岁)的回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )
A.身高一定是145.83 cm
B.身高在145.83 cm以上
C.身高在145.83 cm左右
D.身高在145.83 cm以下
5.(多选)某公司过去五个月的广告费支出x(单位:万元)与销售额y(单位:万元)之间有下列对应数据:
x 2 4 5 6 8
y ▲ 40 60 50 70
工作人员不慎将表格中y的第一个数据丢失.已知y对x呈线性相关关系,且回归方程为=6.5x+17.5,则下列说法正确的是( )
A.销售额y与广告费支出x正相关
B.丢失的数据(表中▲处)为30
C.该公司广告费支出每增加1万元,销售额一定增加6.5万元
D.若该公司下月广告费支出为8万元,则销售额约为75万元
6.设有一个回归方程为=2-1.5x,则变量x每增加1个单位时,y平均减少 个单位.
7.若施化肥量x(千克/亩)与水稻产量y(千克/亩)的回归方程为=5x+250,当施化肥量为80千克/亩时,预计水稻产量为亩产 千克左右.
8.下列五个命题,正确命题的序号为 .
①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.
9.某个男孩的年龄与身高的统计数据如下表所示.
年龄x(岁) 1 2 3 4 5 6
身高y(cm) 78 87 98 108 115 120
(1)画出散点图;
(2)判断y与x是否具有线性相关关系.
10.根据如下样本数据得到的回归方程为=x+,则( )
x 3 4 5 6 7 8
y 4.0 2.5 -0.5 0.5 -2.0 -3.0
A.>0,>0 B.>0,<0
C.<0,>0 D.<0,<0
11.(多选)对某中学的女生体重y(单位:kg)与身高x(单位:cm)进行线性回归分析,根据样本数据(xi,yi)(i=1,2,3,…,12),计算得到相关系数r=0.996 2,用最小二乘法近似得到回归直线方程为=0.85x-85.71,则以下结论正确的是( )
A.x与y正相关
B.x与y具有较强的线性相关性,得到的回归直线方程有价值
C.若该中学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该中学某女生身高为160 cm,则可断定其体重为50.29 kg
12.通过市场调查,得到某产品的资金投入x(万元)与获得的利润y(万元)的数据,如下表所示.
资金投入x 2 3 4 5 6
利润y 2 3 5 6 9
(1)请根据上表提供的数据,用最小二乘法求出y关于x的回归方程=x+;
(2)现投入资金10万元,估计获得的利润为多少万元?
13.某品牌服装专卖店为了解保暖衬衣的销售量y(件)与平均气温x(℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表.
时间 二月 上旬 二月 中旬 二月 下旬 三月 上旬
平均气温x(℃) 3 8 12 17
销售量y(件) 55 m 33 24
由表中数据算出线性回归方程=x+中的=-2,样本中心点为(10,38).
(1)表中数据m= ;
(2)气象部门预测三月中旬的平均气温约为22 ℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为 件.
14.一台机器由于使用的时间较长,它按不同的转速生产出来的某机械零件有一些会有缺陷,每小时生产有缺陷的零件的多少随机器的转速而变化,下表为抽样试验结果:
转速x(转/秒) 16 14 12 8
每小时生产有缺陷的零件数y(件) 11 9 8 5
(1)画出散点图;
(2)如果y与x有线性相关关系,求回归直线方程;
(3)若实际生产中,允许每小时生产的产品中有缺陷的零件最多为10个,则机器的运转速度应控制在什么范围内?
第一课时 相关关系与回归直线方程
1.B 结合散点图可知,变量x,y之间是负相关,且纵截距大于0,故选B.
2.A 由题图左图知气压随海拔高度的增加而减小,由右图知沸点随气压的升高而升高,所以沸点与气压呈正相关,沸点与海拔高度呈负相关,由于两个散点图中的点都成线性分布,所以沸点与海拔高度、沸点与气压的相关性都很强,故B、C、D正确,A错误.
3.C 当=0时,这时不具有线性相关关系,但能大于0,也能小于0.
4.C 将x=10代入回归方程=7.19x+73.93,可以预测孩子10岁时的身高为=7.19×10+73.93=145.83,故选C.
5.AB 由回归直线方程为=6.5x+17.5,可知=6.5,则销售额y与广告费支出x正相关,所以A正确;设丢失的数据为m,由表中的数据可得=5,=,把点代入回归方程,可得=6.5×5+17.5,解得m=30,所以B正确;该公司广告费支出每增加1万元,销售额不一定增加6.5万元,所以C不正确;若该公司下月广告费支出为8万元,则销售额约为=6.5×8+17.5=69.5(万元),所以D不正确.故选A、B.
6.1.5 解析:因为=2-1.5x,所以变量x每增加1个单位时,y平均减少1.5个单位.
7.650 解析:当x=80时,=5×80+250=400+250=650.
8.③④⑤ 解析:变量的相关关系是变量之间的一种近似关系,并不是所有的变量都有相关关系,而有些变量之间是确定的函数关系.例如,②中圆的周长与该圆的半径就是一种确定的函数关系;另外,线性回归直线是描述这种关系的有效方法;如果两个变量对应的数据点与所求出的直线偏离较大,那么,这条回归直线的方程就是毫无意义的.综上可得命题①②不对,命题③④⑤正确.
9.解:(1)以x轴为年龄,y轴为身高,可得散点图如图所示.
(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.
10.B 画出散点图,观察图象可知回归直线=x+的斜率<0,当x=0时,=>0.故选B.
11.ABC 由于线性回归方程中x的系数为0.85>0,因此y与x具有正的线性相关关系,A正确;根据相关系数r=0.996 2接近1,则x与y有较强的线性相关性,得到的回归直线方程有价值,B正确;由线性回归方程中系数的意义可得,x每增加1 cm,其体重约增加0.85 kg,C正确;当某女生的身高为160 cm时,其体重估计值是50.29 kg,而不是具体值,D错误.故选A、B、C.
12.解: (1)==4,==5,
=
==1.7.
∴=- =-1.8,∴=1.7x-1.8.
(2)当x=10时,=1.7×10-1.8=15.2,
即估计获得的利润为15.2万元.
13.(1)40 (2)14 解析:(1)因为样本中心点为(10,38),所以=38.由=38,解得m=40.
(2)由=-得=+2=38+2×10=58,故=-2x+58,
当x=22时,=-2×22+58=14,
故三月中旬的销售量约为14件.
14.解:(1)画出散点图,如图所示:
(2)由题意得=12.5,=8.25,xiyi=438,=660,
∴==≈0.728 6,=-=8.25-0.728 6×12.5=-0.857 5.故回归直线方程为=0.728 6x-0.857 5.
(3)令0.728 6x-0.857 5≤10,得x≤≈14.9,故机器的转速应控制在14.9转/秒以下.
1 / 3第一课时 相关关系与回归直线方程
新课程标准解读 核心素养
1.了解变量间的相关关系 数学抽象
2.会根据散点图判断数据是否具有相关关系 逻辑推理
3.了解最小二乘法的思想,会求回归直线方程,掌握回归方程的性质 数学运算
恩格尔系数(Engel’s Coefficient)是根据恩格尔定律得出的比例数,指居民家庭中食物支出占消费总支出的比重,是表示生活水平高低的一个指标.其计算公式:恩格尔系数=食物支出金额÷总支出金额.
一个家庭收入越少,家庭收入中或者家庭总支出中用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中或者家庭总支出中用来购买食物的支出所占比例将会下降.
【问题】 恩格尔系数是预测生活水平高低的一个模型,那么当两个变量线性相关时,我们如何对成对样本数据建立一个模型进行预测?
知识点一 相关关系
如果两个变量之间确实有一定的关系,但没有达到可以 的程度,它们之间的关系带有一定的 ,像这样两个变量之间的关系,统计学上都称为相关关系.
提醒 函数关系中两个变量之间是一种确定关系,因而函数关系不是相关关系.
知识点二 线性相关
1.散点图:一般地,如果收集到了变量x和变量y的n对数据(简称为成对数据),如下表所示.
序号i 1 2 3 … n
变量x x1 x2 x3 … xn
变量y y1 y2 y3 … yn
则在平面直角坐标系xOy中描出点(xi,yi),i=1,2,3,…,n,就可以得到这n对数据的散点图.
2.线性相关:如果由变量的成对数据、散点图或直观经验可知,变量x与变量y之间的关系可以近似地用 函数来刻画,则称x与y线性相关.
3.正相关和负相关:若x与y线性相关,如果一个变量增大,另一个变量大体上也 ,则称这两个变量正相关;如果一个变量增大,另一个变量大体上 ,则称这两个变量负相关.
提醒 根据散点图可以判断两个变量有没有相关关系.若相关,则确定正(负)相关.
下列两个变量具有正相关关系的是( )
A.正方形的面积与边长
B.吸烟与健康
C.数学成绩与物理成绩
D.汽车的重量与汽车每消耗1 L汽油所行驶的平均路程
知识点三 回归直线方程
1.一般地,已知变量x与y的n对成对数据(xi,yi),i=1,2,3,…,n.任意给定一个一次函数y=bx+a,对每一个已知的xi,由直线方程可以得到一个估计值=bxi+a,如果一次函数=x+能使残差平方和即(y1-)2+(y2-)2+…+(yn-)2=(yi-)2取得 ,则=x+称为y关于x的回归直线方程(对应的直线称为回归直线).因为是使得平方和最小,所以其中涉及的方法称为最小二乘法.
2.给定两个变量y与x的一组数据后,回归直线方程=x+总是存在,而且= ,= .
其中称为回归系数,=xi,=yi.(,)称为样本点的中心,回归直线过样本点的中心.
知识点四 回归直线方程=x+的性质
1.回归直线一定过点(,).
2.一次函数=x+的单调性当然是由的符号决定的,y与x正相关的充要条件是 ;y与x负相关的充要条件是 .
3.当x增大一个单位时,增大个单位.
1.判断正误.(正确的画“√”,错误的画“×”)
(1)相关关系是两个变量之间的一种确定的关系.( )
(2)回归直线方程一定过样本中心点.( )
(3)选取一组数据的部分点得到的回归方程与由整组数据得到的回归方程一定相同.( )
(4)根据回归直线方程得到的结论一定是可靠的.( )
2.已知x与y之间的一组数据.
x 0 1 2 3
y 1 3 5 7
若y与x线性相关,则y与x的回归直线=x+必过点( )
A.(2,2) B.(1.5,0)
C.(1,2) D.(1.5,4)
3.已知回归直线的斜率的估计值是1.23,且过定点(4,5),则线性回归方程是 .
题型一 变量间相关关系的判断
【例1】 (1)下列关系中,属于相关关系的是 .(填序号)
①圆的半径与面积之间的关系;
②农作物的产量与施肥量之间的关系;
③出租车费与行驶的里程;
④降雪量与交通事故的发生率之间的关系.
(2)某种产品的广告费支出x与销售额y之间有如下对应数据(单位:百万元).
x 2 4 5 6 8
y 30 40 60 50 70
①画出散点图;
②从散点图中判断销售金额与广告费支出成什么样的关系?
尝试解答
通性通法
两个变量是否相关的两种判断方法
(1)根据实际经验:借助积累的经验进行分析判断;
(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
【跟踪训练】
在下列所示的四个图中,每个图的两个变量具有相关关系的图是( )
A.(1)(2) B.(1)(3)
C.(2)(4) D.(2)(3)
题型二 求回归直线方程
【例2】 在“新零售”模式的背景下,某大型零售公司为推广线下分店,计划在S市的A区开设分店.为了确定在该区开设分店的个数,该公司对该市已开设分店的其他区的数据作了初步处理后得到下列表格,记x表示在各区开设分店的个数,y表示这x个分店的年收入之和.
x/个 2 3 4 5 6
y/百万元 2.5 3 4 4.5 6
(1)该公司经过初步判断,可用线性回归模型来拟合y与x的关系,求y关于x的线性回归方程=x+;
(2)假设该公司在A区获得的总年利润z(单位:百万元)与x,y之间的关系为z=y-0.05x2-1.4,请结合(1)中的线性回归方程,估算该公司应在A区开设多少个分店,才能使A区平均每个分店的年利润最大.
参考公式:=x+, ==,=-.
尝试解答
通性通法
求回归直线方程的一般步骤
(1)作出散点图,根据散点的分布判断两个变量是否具有线性相关关系;
(2)求回归系数,,设回归直线方程为=x+,其中(xi,yi)是样本数据,=xi,=yi为样本平均数,(,)称为样本中心点;
(3)写出回归直线方程=x+,并用回归直线方程进行预测.特别注意,当x取x0时,由回归直线方程可得y0的值,从而可进行相应的预测,但预测值未必是真实值.
【跟踪训练】
某公司为了促进某产品的销售,随机调查了该产品的月销售单价x(单位:元/件)及相应月销售量y(单位:万件),对近5个月的月销售单价xi和月销售量yi(i=1,2,3,4,5)的数据进行了统计,得到如下数表:
月销售单价xi(元/件) 8 8.5 9 9.5 10
月销售量yi(万件) 11 10 8 6 5
(1)建立y关于x的回归直线方程;
(2)该公司年底开展促销活动,当月销售单价为7元/件时,其月销售量达到14.8万件,若由回归直线方程得到的预测数据与此次促销活动的实际数据之差的绝对值不超过0.5万件,则认为所得到的回归直线方程是理想的,试问(1)中得到的回归直线方程是否理想?
(3)根据(1)的结果,若该产品成本是5元/件,月销售单价x为何值时,公司月利润的预报值最大?
(注:利润=销售收入-成本).
参考公式:=,=-.
参考数据:xiyi=352,=407.5.
题型三 回归直线方程的性质及应用
【例3】 (多选)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
尝试解答
通性通法
1.相关关系的正、负相关类同于函数的增、减性,与其斜率有关,必要时可画散点图以增强直观性.
2.由回归方程得出的函数值不一定是准确值,只是个估计值.
【跟踪训练】
某单位为了了解用电量y度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表.
气温(℃) 18 13 10 -1
用电量(度) 24 34 38 64
由表中数据得线性回归方程=x+中=-2,预测当气温为-4 ℃时,用电量的度数约为 度.
1.以下四个散点图中,两个变量的关系适合用线性回归模型刻画的是( )
A.①② B.①③ C.②③ D.③④
2.由变量x与y相对应的一组数据(1,y1),(5,y2),(7,y3),(13,y4),(19,y5)得到的线性回归方程为=2x+45,则 =( )
A.135 B.90 C.67 D.63
3.工人工资y(元)与劳动生产率x(千元)的相关关系的回归方程为=50+80x,下列判断正确的是( )
A.劳动生产率为1 000元时,工人工资为130元
B.劳动生产率提高1 000元时,工人工资平均提高80元
C.劳动生产率提高1 000元时,工人工资平均提高130元
D.当月工资为250元时,劳动生产率为2 000元
4.某地区近10年居民的年收入x与年支出y之间的关系大致符合=0.8x+0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是 亿元.
5.由某种设备的使用年限xi(年)与所支出的维修费yi(万元)的数据资料算得如下结果,=90,xiyi=112,xi=20,yi=25.
(1)求所支出的维修费y对使用年限x的线性回归方程=x+;
(2)①判断变量x与y之间是正相关还是负相关;
②当使用年限为8年时,试估计支出的维修费是多少?
第一课时 相关关系与回归直线方程
【基础知识·重落实】
知识点一
互相决定 随机性
知识点二
2.一次 3.增大 减少
自我诊断
C 正方形的面积与边长是函数关系,A错误;吸烟与健康具有负相关关系,B错误;汽车越重,每消耗1 L 汽油所行驶的平均路程越短,所以汽车的重量与汽车每消耗1 L汽油所行驶的平均路程具有负相关关系,D错误;数学成绩越好,物理成绩也会越好,所以数学成绩与物理成绩具有正相关关系,C正确.
知识点三
1.最小值 2.= -
知识点四
2.>0 <0
自我诊断
1.(1)× (2)√ (3)× (4)×
2.D ∵==1.5,==4,
∴回归直线必过点(1.5,4).故选D.
3.=1.23x+0.08 解析:设回归直线方程为=x+,
∵回归直线的斜率的估计值为1.23,
即=1.23,又回归直线过定点(4,5),
∴=5-1.23×4=0.08,
∴=1.23x+0.08.
【典型例题·精研析】
【例1】 (1)②④ 解析:在①中,圆的半径与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③为确定的函数关系;在④中,降雪量与交通事故的发生率之间具有相关关系.
(2)解:①以x对应的数据为横坐标,以y对应的数据为纵坐标,所作的散点图如图所示.
②从图中可以发现广告费支出与销售金额之间具有相关关系,并且当广告费支出由小变大时,销售金额也大多由小变大,图中的数据大致分布在某条直线的附近,即x与y成正相关关系.
跟踪训练
D 图(1)的两个变量具有函数关系;图(2)(3)的两个变量具有相关关系;图(4)的两个变量之间既不是函数关系,也不是相关关系.
【例2】 解:(1)法一 由表中数据得=4,=4,(xi-)2=10,(xi-)(yi-)=8.5,
∴===0.85,
=-=4-4×0.85=0.6,
故y关于x的线性回归方程为=0.85x+0.6.
法二 由表中数据得=4,=4,xiyi=88.5,=90.
∴===0.85,
=-=4-4×0.85=0.6,
故y关于x的线性回归方程为=0.85x+0.6.
(2)由题意,可知总年利润z的估计值与x之间的关系为=-0.05x2+0.85x-0.8.
设A区平均每个分店的年利润为t,则t=,
故t的估计值与x之间的关系为=-0.05x-+0.85=-0.01+0.85,
则当x=4时,取得最大值,故该公司应在A区开设4个分店,才能使A区平均每个分店的年利润最大.
跟踪训练
解:(1)因为=×(8+8.5+9+9.5+10)=9,=×(11+10+8+6+5)=8,
所以===-3.2,
则=-=8-(-3.2)×9=36.8,
于是y关于x的回归直线方程为=-3.2x+36.8.
(2)当x=7时,=-3.2×7+36.8=14.4,因为14.8-14.4=0.4<0.5,所以可以认为所得到的回归直线方程是理想的.
(3)令销售利润为M,则M=(x-5)(-3.2x+36.8)(5<x<11.5),整理得M=-3.2x2+52.8x-184,
所以x=8.25时,M取最大值.
所以该产品月销售单价为8.25元/件时公司月利润的预报值最大.
【例3】 ABC 对于A,0.85>0,∴y与x具有正的线性相关关系,故正确;
对于B,显然正确;
对于C,∵回归方程为=0.85x-85.71,∴该大学某女生身高增加1 cm,则其体重约增加0.85 kg,故正确;
对于D,当x=170时,=0.85×170-85.71=58.79,体重的估计值为58.79 kg,故D错误,A、B、C均正确.
跟踪训练
68 解析:=10,=40,回归方程过点(,),
∴40=-2×10+.
∴=60.∴=-2x+60.
令x=-4,∴=(-2)×(-4)+60=68.
随堂检测
1.B ①③中的点分布在一条直线附近,适合线性回归模型.②④均不适合,故选B.
2.D ∵=×(1+5+7+13+19)=9,代入=2+45,可得=2×9+45=63,故选D.
3.B 法一 ∵回归直线的斜率为80,∴x每增加1,y平均增加80,即劳动生产率提高1 000元时,工人工资平均提高80元.故选B.
法二 ∵工人月工资(元)依劳动生产率(千元)变化的回归方程为=50+80x,∴当自变量由x变化为x+1时,y的变化量是50+80(x+1)-50-80x=80,即当劳动生产率平均提高1千元时,工资平均提高80元.只有B选项说清楚是平均增长,C增加的工资数不对,A和D对线性回归方程理解错误,故选B.
4.12.1 解析:将x=15代入=0.8x+0.1,得=0.8×15+0.1=12.1.
5.解:(1)∵xi=20,yi=25,∴=xi=4,=yi=5,
∴===1.2,
=-=5-1.2×4=0.2.
∴线性回归方程为=1.2x+0.2.
(2)①由(1)知=1.2>0,∴变量x与y之间是正相关.
②由(1)知,当x=8时,=1.2×8+0.2=9.8,即使用年限为8年时,支出的维修费约是9.8万元.
2 / 5(共78张PPT)
第一课时
相关关系与回归直线方程
新课程标准解读 核心素养
1.了解变量间的相关关系 数学抽象
2.会根据散点图判断数据是否具有相关关系 逻辑推理
3.了解最小二乘法的思想,会求回归直线方程,掌握
回归方程的性质 数学运算
目录
基础知识·重落实
01
典型例题·精研析
02
知能演练·扣课标
03
基础知识·重落实
01
课前预习 必备知识梳理
恩格尔系数(Engel’s Coefficient)是根据恩格尔定律得出的比
例数,指居民家庭中食物支出占消费总支出的比重,是表示生活水平
高低的一个指标.其计算公式:恩格尔系数=食物支出金额÷总支出
金额.
一个家庭收入越少,家庭收入中或者家庭
总支出中用来购买食物的支出所占的比例就越
大,随着家庭收入的增加,家庭收入中或者家
庭总支出中用来购买食物的支出所占比例将会下降.
【问题】 恩格尔系数是预测生活水平高低的一个模型,那么当两个
变量线性相关时,我们如何对成对样本数据建立一个模型进行预测?
知识点一 相关关系
如果两个变量之间确实有一定的关系,但没有达到可以
的程度,它们之间的关系带有一定的 ,像这样两个变
量之间的关系,统计学上都称为相关关系.
提醒 函数关系中两个变量之间是一种确定关系,因而函数关系不是
相关关系.
互相决
定
随机性
知识点二 线性相关
1. 散点图:一般地,如果收集到了变量 x 和变量 y 的 n 对数据(简称
为成对数据),如下表所示.
序号 i 1 2 3 … n
变量 x x1 x2 x3 … xn
变量 y y1 y2 y3 … yn
则在平面直角坐标系 xOy 中描出点( xi , yi ), i =1,2,3,…,
n ,就可以得到这 n 对数据的散点图.
2. 线性相关:如果由变量的成对数据、散点图或直观经验可知,变量
x 与变量 y 之间的关系可以近似地用 函数来刻画,则称 x 与
y 线性相关.
3. 正相关和负相关:若 x 与 y 线性相关,如果一个变量增大,另一个
变量大体上也 ,则称这两个变量正相关;如果一个变量增
大,另一个变量大体上 ,则称这两个变量负相关.
提醒 根据散点图可以判断两个变量有没有相关关系.若相关,则
确定正(负)相关.
一次
增大
减少
下列两个变量具有正相关关系的是( )
A. 正方形的面积与边长
B. 吸烟与健康
C. 数学成绩与物理成绩
D. 汽车的重量与汽车每消耗1 L汽油所行驶的平均路程
解析: 正方形的面积与边长是函数关系,A错误;吸烟与健康具
有负相关关系,B错误;汽车越重,每消耗1 L 汽油所行驶的平均路程
越短,所以汽车的重量与汽车每消耗1 L汽油所行驶的平均路程具有
负相关关系,D错误;数学成绩越好,物理成绩也会越好,所以数学
成绩与物理成绩具有正相关关系,C正确.
知识点三 回归直线方程
1. 一般地,已知变量 x 与 y 的 n 对成对数据( xi , yi ), i =1,2,
3,…, n .任意给定一个一次函数 y = bx + a ,对每一个已知的
xi ,由直线方程可以得到一个估计值 = bxi + a ,如果一次函数
= x + 能使残差平方和即( y1- )2+( y2- )2+…+( yn
- )2= ( yi - )2取得 ,则 = x + 称为 y 关
于 x 的回归直线方程(对应的直线称为回归直线).因为是使得平
方和最小,所以其中涉及的方法称为最小二乘法.
最小值
2. 给定两个变量 y 与 x 的一组数据后,回归直线方程 = x + 总是
存在,而且
= ,
= .
其中 称为回归系数, = xi , = yi .( , )称为样
本点的中心,回归直线过样本点的中心.
=
-
知识点四 回归直线方程 = x + 的性质
1. 回归直线一定过点( , ).
2. 一次函数 = x + 的单调性当然是由 的符号决定的, y 与 x 正相
关的充要条件是 ; y 与 x 负相关的充要条件是 .
3. 当 x 增大一个单位时, 增大 个单位.
>0
<0
1. 判断正误.(正确的画“√”,错误的画“×”)
(1)相关关系是两个变量之间的一种确定的关系. ( × )
(2)回归直线方程一定过样本中心点. ( √ )
(3)选取一组数据的部分点得到的回归方程与由整组数据得到的
回归方程一定相同.( × )
(4)根据回归直线方程得到的结论一定是可靠的. ( × )
×
√
×
×
2. 已知 x 与 y 之间的一组数据.
x 0 1 2 3
y 1 3 5 7
若 y 与 x 线性相关,则 y 与 x 的回归直线 = x + 必过点( )
A. (2,2) B. (1.5,0)
C. (1,2) D. (1.5,4)
解析: ∵ = =1.5, = =4,
∴回归直线必过点(1.5,4).故选D.
3. 已知回归直线的斜率的估计值是1.23,且过定点(4,5),则线性
回归方程是 .
解析:设回归直线方程为 = x + ,
∵回归直线的斜率的估计值为1.23,
即 =1.23,又回归直线过定点(4,5),
∴ =5-1.23×4=0.08,
∴ =1.23 x +0.08.
=1.23 x +0.08
典型例题·精研析
02
课堂互动 关键能力提升
题型一 变量间相关关系的判断
【例1】 (1)下列关系中,属于相关关系的是 .(填序
号)
①圆的半径与面积之间的关系;
②农作物的产量与施肥量之间的关系;
③出租车费与行驶的里程;
④降雪量与交通事故的发生率之间的关系.
②④
解析:在①中,圆的半径与面积之间的关系是函数关系;在②
中,农作物的产量与施肥量之间不具有严格的函数关系,但具
有相关关系;③为确定的函数关系;在④中,降雪量与交通事
故的发生率之间具有相关关系.
(2)某种产品的广告费支出 x 与销售额 y 之间有如下对应数据(单
位:百万元).
x 2 4 5 6 8
y 30 40 60 50 70
①画出散点图;
②从散点图中判断销售金额与广告费支出成什么样的关系?
解:①以 x 对应的数据为横
坐标,以 y 对应的数据为纵坐标,
所作的散点图如图所示.
②从图中可以发现广告费支出与销
售金额之间具有相关关系,并且当广告费支出由小变大时,销售金额也大多由小变大,图中的数据大致分布在某条直线的附近,即 x 与 y 成正相关关系.
通性通法
两个变量是否相关的两种判断方法
(1)根据实际经验:借助积累的经验进行分析判断;
(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规
律,直观地进行判断.如果发现点的分布从整体上看大致在一条
直线附近,那么这两个变量就是线性相关的,注意不要受个别
点的位置的影响.
【跟踪训练】
在下列所示的四个图中,每个图的两个变量具有相关关系的图是
( )
A. (1)(2) B. (1)(3)
C. (2)(4) D. (2)(3)
解析: 图(1)的两个变量具有函数关系;图(2)(3)的两个变
量具有相关关系;图(4)的两个变量之间既不是函数关系,也不是
相关关系.
题型二 求回归直线方程
【例2】 在“新零售”模式的背景下,某大型零售公司为推广线
下分店,计划在S市的A区开设分店.为了确定在该区开设分店的个
数,该公司对该市已开设分店的其他区的数据作了初步处理后得
到下列表格,记 x 表示在各区开设分店的个数, y 表示这 x 个分店
的年收入之和.
x/个 2 3 4 5 6
y/百万元 2.5 3 4 4.5 6
(1)该公司经过初步判断,可用线性回归模型来拟合 y 与 x 的关系,
求 y 关于 x 的线性回归方程 = x + ;
解: 法一 由表中数据得 =4, =4,
( xi - )2=10,
( xi - )( yi - )=8.5,
∴ = = =0.85,
= - =4-4×0.85=0.6,
故 y 关于 x 的线性回归方程为 =0.85 x +0.6.
法二 由表中数据得 =4, =4,
xiyi =88.5, =90.
∴ = = =0.85,
= - =4-4×0.85=0.6,
故 y 关于 x 的线性回归方程为 =0.85 x +0.6.
(2)假设该公司在A区获得的总年利润 z (单位:百万元)与 x , y 之
间的关系为 z = y -0.05 x2-1.4,请结合(1)中的线性回归方
程,估算该公司应在A区开设多少个分店,才能使A区平均每个
分店的年利润最大.
参考公式: = x + , = = ,
= - .
解:由题意,可知总年利润 z 的估计值 与 x 之间的关系为 =-0.05
x2+0.85 x -0.8.
设A区平均每个分店的年利润为 t ,则 t = ,
故 t 的估计值 与 x 之间的关系为 =-0.05 x - +0.85=-0.01
+0.85,
则当 x =4时, 取得最大值,故该公司应在A区开设4个分店,才能使
A区平均每个分店的年利润最大.
通性通法
求回归直线方程的一般步骤
(1)作出散点图,根据散点的分布判断两个变量是否具有线性相关
关系;
(2)求回归系数 , ,设回归直线方程为 = x + ,其中( xi ,
yi )是样本数据, = xi , = yi 为样本平均数,
( , )称为样本中心点;
(3)写出回归直线方程 = x + ,并用回归直线方程进行预测.特
别注意,当 x 取 x0时,由回归直线方程可得 y0的值,从而可进行
相应的预测,但预测值未必是真实值.
【跟踪训练】
某公司为了促进某产品的销售,随机调查了该产品的月销售单价 x
(单位:元/件)及相应月销售量 y (单位:万件),对近5个月的月
销售单价 xi 和月销售量 yi ( i =1,2,3,4,5)的数据进行了统计,
得到如下数表:
月销售单价 xi (元/件) 8 8.5 9 9.5 10
月销售量 yi (万件) 11 10 8 6 5
(1)建立 y 关于 x 的回归直线方程;
解: 因为 = ×(8+8.5+9+9.5+10)=9, = ×
(11+10+8+6+5)=8,
所以 = = =-3.2,则 = - =8-
(-3.2)×9=36.8,
于是 y 关于 x 的回归直线方程为 =-3.2 x +36.8.
(2)该公司年底开展促销活动,当月销售单价为7元/件时,其月销售
量达到14.8万件,若由回归直线方程得到的预测数据与此次促
销活动的实际数据之差的绝对值不超过0.5万件,则认为所得到
的回归直线方程是理想的,试问(1)中得到的回归直线方程是
否理想?
解:(2)当 x =7时, =-3.2×7+36.8=14.4,因为
14.8-14.4=0.4<0.5,所以可以认为所得到的回归直线方
程是理想的.
(3)根据(1)的结果,若该产品成本是5元/件,月销售单价 x 为何
值时,公司月利润的预报值最大?
(注:利润=销售收入-成本).
参考公式: = , = - .
参考数据: xiyi =352, =407.5.
解: 令销售利润为 M ,则 M =( x -5)(-3.2 x +
36.8)(5< x <11.5),整理得 M =-3.2 x2+52.8 x -184,
所以 x =8.25时, M 取最大值.
所以该产品月销售单价为8.25元/件时公司月利润的预报值最大.
题型三 回归直线方程的性质及应用
【例3】 (多选)设某大学的女生体重 y (单位:kg)与身高 x (单
位:cm)具有线性相关关系,根据一组样本数据( xi , yi )( i =1,
2,…, n ),用最小二乘法建立的回归方程为 =0.85 x -85.71,则
下列结论中正确的是( )
A. y 与 x 具有正的线性相关关系
B. 回归直线过样本点中心( , )
C. 若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D. 若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
解析: 对于A,0.85>0,∴ y 与 x 具有正的线性相关关系,故
正确;
对于B,显然正确;
对于C,∵回归方程为 =0.85 x -85.71,∴该大学某女生身高增加1
cm,则其体重约增加0.85 kg,故正确;
对于D,当 x =170时, =0.85×170-85.71=58.79,体重的估计值
为58.79 kg,故D错误,A、B、C均正确.
通性通法
1. 相关关系的正、负相关类同于函数的增、减性,与其斜率有关,必
要时可画散点图以增强直观性.
2. 由回归方程得出的函数值不一定是准确值,只是个估计值.
【跟踪训练】
某单位为了了解用电量 y 度与气温 x ℃之间的关系,随机统计了某4
天的用电量与当天气温,并制作了对照表.
气温(℃) 18 13 10 -1
用电量(度) 24 34 38 64
由表中数据得线性回归方程 = x + 中 =-2,预测当气温为-4
℃时,用电量的度数约为 度.
68
解析: =10, =40,回归方程过点( , ),
∴40=-2×10+ .
∴ =60.∴ =-2 x +60.
令 x =-4,∴ =(-2)×(-4)+60=68.
1. 以下四个散点图中,两个变量的关系适合用线性回归模型刻画的是
( )
A. ①② B. ①③
C. ②③ D. ③④
解析: ①③中的点分布在一条直线附近,适合线性回归模型.
②④均不适合,故选B.
2. 由变量 x 与 y 相对应的一组数据(1, y1),(5, y2),(7,
y3),(13, y4),(19, y5)得到的线性回归方程为 =2 x +
45,则 =( )
A. 135 B. 90
C. 67 D. 63
解析: ∵ = ×(1+5+7+13+19)=9,代入 =2 +
45,可得 =2×9+45=63,故选D.
3. 工人工资 y (元)与劳动生产率 x (千元)的相关关系的回归方程
为 =50+80 x ,下列判断正确的是( )
A. 劳动生产率为1 000元时,工人工资为130元
B. 劳动生产率提高1 000元时,工人工资平均提高80元
C. 劳动生产率提高1 000元时,工人工资平均提高130元
D. 当月工资为250元时,劳动生产率为2 000元
解析: 法一 ∵回归直线的斜率为80,∴ x 每增加1, y 平
均增加80,即劳动生产率提高1 000元时,工人工资平均提高80
元.故选B.
法二 ∵工人月工资(元)依劳动生产率(千元)变化的回归方程为
=50+80 x ,∴当自变量由 x 变化为 x +1时, y 的变化量是50+80
( x +1)-50-80 x =80,即当劳动生产率平均提高1千元时,工资
平均提高80元.只有B选项说清楚是平均增长,C增加的工资数不对,
A和D对线性回归方程理解错误,故选B.
4. 某地区近10年居民的年收入 x 与年支出 y 之间的关系大致符合 =
0.8 x +0.1(单位:亿元),预计今年该地区居民收入为15亿元,
则今年支出估计是 亿元.
解析:将 x =15代入 =0.8 x +0.1,得 =0.8×15+0.1=12.1.
12.1
5. 由某种设备的使用年限 xi (年)与所支出的维修费 yi (万元)的数
据资料算得如下结果, =90, xiyi =112, xi =20,
yi =25.
(1)求所支出的维修费 y 对使用年限 x 的线性回归方程 = x +
;
解: ∵ xi =20, yi =25,∴ = xi =4, =
yi =5,∴ = = =1.2,
= - =5-1.2×4=0.2.
∴线性回归方程为 =1.2 x +0.2.
(2)①判断变量 x 与 y 之间是正相关还是负相关;
②当使用年限为8年时,试估计支出的维修费是多少?
解: ①由(1)知 =1.2>0,∴变量 x 与 y 之间是
正相关.
②由(1)知,当 x =8时, =1.2×8+0.2=9.8,即使
用年限为8年时,支出的维修费约是9.8万元.
知能演练·扣课标
03
课后巩固 核心素养落地
1. 已知变量 x , y 之间具有线性相关关系,其散点图如图所示,则其
回归方程可能为( )
A. =1.5 x +2
B. =-1.5 x +2
C. =1.5 x -2
D. =-1.5 x -2
解析:B 结合散点图可知,变量 x , y 之间是负相关,且纵截距
大于0,故选B.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
2. 某校地理学科兴趣小组在某座山测得海拔高度、气压和沸点的六组
数据绘制成散点图如图所示,则下列说法错误的是( )
A. 沸点与海拔高度呈正相关
B. 沸点与气压呈正相关
C. 沸点与海拔高度呈负相关
D. 沸点与海拔高度、沸点与气压的相关性都很强
1
2
3
4
5
6
7
8
9
10
11
12
13
14
解析: 由题图左图知气压随海拔高度的增加而减小,由右
图知沸点随气压的升高而升高,所以沸点与气压呈正相关,沸
点与海拔高度呈负相关,由于两个散点图中的点都成线性分
布,所以沸点与海拔高度、沸点与气压的相关性都很强,故
B、C、D正确,A错误.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
3. 对有线性相关关系的两个变量建立的回归直线方程 = + x 中,
回归系数 ( )
A. 不能小于0 B. 不能大于0
C. 不能等于0 D. 只能小于0
解析: 当 =0时,这时不具有线性相关关系,但 能大于0,
也能小于0.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
4. 一位母亲记录了儿子3~9岁的身高数据(数据略),由此建立的身
高(单位:cm)与年龄(单位:岁)的回归模型为 =7.19 x +
73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是
( )
A. 身高一定是145.83 cm
B. 身高在145.83 cm以上
C. 身高在145.83 cm左右
D. 身高在145.83 cm以下
1
2
3
4
5
6
7
8
9
10
11
12
13
14
解析: 将 x =10代入回归方程 =7.19 x +73.93,可以预测孩
子10岁时的身高为 =7.19×10+73.93=145.83,故选C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
5. (多选)某公司过去五个月的广告费支出 x (单位:万元)与销售
额 y (单位:万元)之间有下列对应数据:
x 2 4 5 6 8
y ▲ 40 60 50 70
工作人员不慎将表格中 y 的第一个数据丢失.已知 y 对 x 呈线性相关
关系,且回归方程为 =6.5 x +17.5,则下列说法正确的是( )
A. 销售额 y 与广告费支出 x 正相关
B. 丢失的数据(表中▲处)为30
C. 该公司广告费支出每增加1万元,销售额一定增加6.5万元
D. 若该公司下月广告费支出为8万元,则销售额约为75万元
1
2
3
4
5
6
7
8
9
10
11
12
13
14
解析: 由回归直线方程为 =6.5 x +17.5,可知 =6.5,则
销售额 y 与广告费支出 x 正相关,所以A正确;设丢失的数据为
m ,由表中的数据可得 =5, = ,把点 代入
回归方程,可得 =6.5×5+17.5,解得 m =30,所以B正
确;该公司广告费支出每增加1万元,销售额不一定增加6.5万元,
所以C不正确;若该公司下月广告费支出为8万元,则销售额约为
=6.5×8+17.5=69.5(万元),所以D不正确.故选A、B.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
6. 设有一个回归方程为 =2-1.5 x ,则变量 x 每增加1个单位时, y
平均减少 个单位.
解析:因为 =2-1.5 x ,所以变量 x 每增加1个单位时, y 平均减
少1.5个单位.
1.5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
7. 若施化肥量 x (千克/亩)与水稻产量 y (千克/亩)的回归方程为
=5 x +250,当施化肥量为80千克/亩时,预计水稻产量为亩
产 千克左右.
解析:当 x =80时, =5×80+250=400+250=650.
650
1
2
3
4
5
6
7
8
9
10
11
12
13
14
①任何两个变量都具有相关关系;
②圆的周长与该圆的半径具有相关关系;
③某商品的需求量与该商品的价格是一种非确定性关系;
④根据散点图求得的回归直线方程可能是没有意义的;
⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化
为确定性问题进行研究.
8. 下列五个命题,正确命题的序号为 .
③④⑤
1
2
3
4
5
6
7
8
9
10
11
12
13
14
解析:变量的相关关系是变量之间的一种近似关系,并不是所有的
变量都有相关关系,而有些变量之间是确定的函数关系.例如,②
中圆的周长与该圆的半径就是一种确定的函数关系;另外,线性回
归直线是描述这种关系的有效方法;如果两个变量对应的数据点与
所求出的直线偏离较大,那么,这条回归直线的方程就是毫无意义
的.综上可得命题①②不对,命题③④⑤正确.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
9. 某个男孩的年龄与身高的统计数据如下表所示.
年龄 x (岁) 1 2 3 4 5 6
身高 y (cm) 78 87 98 108 115 120
(1)画出散点图;
解: 以 x 轴为年龄, y 轴为身高,
可得散点图如图所示.
(2)判断 y 与 x 是否具有线性相关关系.
解: 由图知,所有数据点接近一条直线排列,因此,认
为 y 与 x 具有线性相关关系.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
10. 根据如下样本数据得到的回归方程为 = x + ,则( )
x 3 4 5 6 7 8
y 4.0 2.5 -0.5 0.5 -2.0 -3.0
A. >0, >0 B. >0, <0
C. <0, >0 D. <0, <0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
解析: 画出散点图,观察图象可知回归直线 = x + 的斜率
<0,当 x =0时, = >0.故选B.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
11. (多选)对某中学的女生体重 y (单位:kg)与身高 x (单位:
cm)进行线性回归分析,根据样本数据( xi , yi )( i =1,2,
3,…,12),计算得到相关系数 r =0.996 2,用最小二乘法近似
得到回归直线方程为 =0.85 x -85.71,则以下结论正确的是
( )
A. x 与 y 正相关
B. x 与 y 具有较强的线性相关性,得到的回归直线方程有价值
C. 若该中学某女生身高增加1 cm,则其体重约增加0.85 kg
D. 若该中学某女生身高为160 cm,则可断定其体重为50.29 kg
1
2
3
4
5
6
7
8
9
10
11
12
13
14
解析: 由于线性回归方程中 x 的系数为0.85>0,因此 y 与 x
具有正的线性相关关系,A正确;根据相关系数 r =0.996 2接近
1,则 x 与 y 有较强的线性相关性,得到的回归直线方程有价值,
B正确;由线性回归方程中系数的意义可得, x 每增加1 cm,其体
重约增加0.85 kg,C正确;当某女生的身高为160 cm时,其体重
估计值是50.29 kg,而不是具体值,D错误.故选A、B、C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
12. 通过市场调查,得到某产品的资金投入 x (万元)与获得的利润 y
(万元)的数据,如下表所示.
资金投入 x 2 3 4 5 6
利润 y 2 3 5 6 9
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(1)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的回归
方程 = x + ;
解: = =4, = =5,
= = =1.7.
∴ = - =-1.8,∴ =1.7 x -1.8.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(2)现投入资金10万元,估计获得的利润为多少万元?
解: 当 x =10时, =1.7×10-1.8=15.2,
即估计获得的利润为15.2万元.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
13. 某品牌服装专卖店为了解保暖衬衣的销售量 y (件)与平均气温 x
(℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气
温,其数据如表.
时间 二月上旬 二月中旬 二月下旬 三月上旬
平均气 温 x (℃) 3 8 12 17
销售量 y (件) 55 m 33 24
1
2
3
4
5
6
7
8
9
10
11
12
13
14
由表中数据算出线性回归方程 = x + 中的 =-2,样本中心
点为(10,38).
(1)表中数据 m = ;
解析: 因为样本中心点为(10,38),所以 =38.由
=38,解得 m =40.
40
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(2)气象部门预测三月中旬的平均气温约为22 ℃,据此估计,
该品牌的保暖衬衣在三月中旬的销售量约为 件.
解析: 由 = - 得 = +2 =38+2×10=58,
故 =-2 x +58,当 x =22时, =-2×22+58=14,
故三月中旬的销售量约为14件.
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
14. 一台机器由于使用的时间较长,它按不同的转速生产出来的某机
械零件有一些会有缺陷,每小时生产有缺陷的零件的多少随机器
的转速而变化,下表为抽样试验结果:
转速 x (转/秒) 16 14 12 8
每小时生产有缺陷
的零件数 y (件) 11 9 8 5
(1)画出散点图;
解: 画出散点图,如图
所示:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(2)如果 y 与 x 有线性相关关系,求回归直线方程;
解: 由题意得 =12.5, =8.25, xiyi =438,
=660,
∴ = = ≈0.728 6, = - =
8.25-0.728 6×12.5=-0.857 5.故回归直线方程为 =
0.728 6 x -0.857 5.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(3)若实际生产中,允许每小时生产的产品中有缺陷的零件最多
为10个,则机器的运转速度应控制在什么范围内?
解: 令0.728 6 x -0.857 5≤10,得 x ≤ ≈14.9,
故机器的转速应控制在14.9转/秒以下.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
谢 谢 观 看!