相关关系与回归直线方程
一、选择题
1.已知变量x,y之间具有线性相关关系,其散点图如图所示,则其回归方程可能为( )
A.=1.5x+2
B.=-1.5x+2
C.=1.5x-2
D.=-1.5x-2
2.某校地理学兴趣小组在某座山测得海拔高度、气压和沸点的六组数据绘制成散点图如图所示,则下列说法错误的是( )
A.沸点与海拔高度呈正相关
B.沸点与气压呈正相关
C.沸点与海拔高度呈负相关
D.沸点与海拔高度、沸点与气压的相关性都很强
3.已知x,y之间的一组数据如下表:
x 2 3 4 5 6
y 3 4 6 8 9
对于表中数据,根据最小二乘法的思想得拟合程度最好的直线是( )
A.y=x+1 B.y=2x-1
C.y=x- D.y=x
4.一位母亲记录了儿子3~9岁的身高,数据(略),由此建立的身高与年龄的回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )
A.身高一定是145.83 cm
B.身高在145.83 cm以上
C.身高在145.83 cm左右
D.身高在145.83 cm以下
5.已知x与y之间的一组数据.
x 0 1 2 3
y m 3 5.5 7
已求得关于y与x的线性回归方程为=2.2x+0.7,则m的值为( )
A.1 B.0.85 C.0.7 D.0.5
二、填空题
6.设有一个回归方程为=2-1.5x,则变量x每增加1个单位时,y平均减少________个单位.
7.若施化肥量x(千克/亩)与水稻产量y(千克/亩)的回归方程为=5x+250,当施化肥量为80千克/亩时,预计水稻产量为亩产________千克左右.
8.已知由一组样本数据确定的回归方程为=1.5x+1,且=2,发现有两组数据(2.4,2.8)与(1.6,5.2)误差较大.去掉这两组数据后,重新求得回归直线的斜率为1,那么当x=4时,的估计值为________.
三、解答题
9.某个服装店经营某种服装,在某周内每天获得的纯利润y(元)与该周每天销售这种服装数量x(件)之间的一组数据关系如下表:
x 3 4 5 6 7 8 9
y 66 69 73 81 89 90 91
已知:x=280,y=45 309,xiyi=3 487.
参考公式:回归方程是=x+,
其中=,=-.
(1)求,;
(2)画出散点图;
(3)求每天的纯利润y与每天销售数量x之间的线性回归方程.
10. 通过市场调查,得到某产品的资金投入x(万元)与获得的利润y(万元)的数据,如下表所示.
资金投入x 2 3 4 5 6
利润y 2 3 5 6 9
(1)请根据上表提供的数据,用最小二乘法求出y关于x的回归方程=x+;
(2)现投入资金10万元,估计获得的利润为多少万元?
素养达标
1.已知x与y之间的几组数据如下表.
x 1 2 3 4 5 6
y 0 2 1 3 3 4
假设根据上表数据所得线性回归方程为=x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( )
A.>b′,>a′ B.>b′,<a′
C.<b′,>a′ D.<b′,<a′
2.(多选题)某公司过去五个月的广告费支出x(单位:万元)与销售额y(单位:万元)之间有下列对应数据:
x 2 4 5 6 8
y ▲ 40 60 50 70
工作人员不慎将表格中y的第一个数据丢失.已知y对x呈线性相关关系,且回归方程为=6.5x+17.5,则下列说法正确的有( )
A.销售额y与广告费支出x正相关
B.丢失的数据(表中▲处)为30
C.该公司广告费支出每增加1万元,销售额一定增加6.5万元
D.若该公司下月广告费支出为8万元,则销售额约为75万元
3.新型冠状病毒席卷全球,形势严峻,各国医务人员急需新冠肺炎COVID?19诊治的科学方案和有效经验.中国抗疫取得阶段性成效,复旦大学附属中山医院的呼吸科主任宋元林教授团队与上海市第一批援鄂医疗队和武汉市金银潭医院合作,得到一项对新冠肺炎的研究成果,此项研究首次揭示COVID?19患者发生急性呼吸窘迫综合征(ARDS)和从ARDS进展至死亡的危险因素,并首次提出已发生ARDS的COVID?19患者使用甲强龙可能获益的观点.为了了解甲强龙的指标数据y与质量分数p(单位:%)之间的关系,随机统计了相关数据,并制作了下表.
质量分数p 6 10 14 18 22
指标数据y 62 m 44 28 14
由表中数据求得回归直线方程为=-3p+82.2,则m=________.
4.某品牌服装专卖店为了解保暖衬衣的销售量y(件)与平均气温x(℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表.
时间 二月上旬 二月中旬 二月下旬 三月上旬
旬平均气温x(℃) 3 8 12 17
旬销售量y(件) 55 m 33 24
由表中数据算出线性回归方程=x+中的=-2,样本中心点为(10,38).
(1)表中数据m=________;
(2)气象部门预测三月中旬的平均气温约为22℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为________件.
5.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据.
单价x(元) 8 8.2 8.4 8.6 8.8 9
销量y(件) 90 84 83 80 75 68
(1)求回归直线方程=x+,其中=-20;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
一、选择题
1.已知变量x,y之间具有线性相关关系,其散点图如图所示,则其回归方程可能为( )
A.=1.5x+2
B.=-1.5x+2
C.=1.5x-2
D.=-1.5x-2
B [结合散点图可知,变量x,y之间是负相关,且纵截距大于0,故选B.]
2.某校地理学兴趣小组在某座山测得海拔高度、气压和沸点的六组数据绘制成散点图如图所示,则下列说法错误的是( )
A.沸点与海拔高度呈正相关
B.沸点与气压呈正相关
C.沸点与海拔高度呈负相关
D.沸点与海拔高度、沸点与气压的相关性都很强
A [由题图左图知气压随海拔高度的增加而减小,由右图知沸点随气压的升高而升高,所以沸点与气压呈正相关,沸点与海拔高度呈负相关,由于两个散点图中的点都成线性分布,所以沸点与海拔高度、沸点与气压的相关性都很强,故B,C,D正确,A错误.]
3.已知x,y之间的一组数据如下表:
x 2 3 4 5 6
y 3 4 6 8 9
对于表中数据,根据最小二乘法的思想得拟合程度最好的直线是( )
A.y=x+1 B.y=2x-1
C.y=x- D.y=x
C [由表格中数据可知==4,==6,xiyi=136,x=90,通过计算可知回归直线方程为y=x-,故选C.]
4.一位母亲记录了儿子3~9岁的身高,数据(略),由此建立的身高与年龄的回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )
A.身高一定是145.83 cm
B.身高在145.83 cm以上
C.身高在145.83 cm左右
D.身高在145.83 cm以下
C [将x的值代入回归方程=7.19x+73.93,可以预测孩子10岁时的身高为=7.19×10+73.93=145.83,故选C.]
5.已知x与y之间的一组数据.
x 0 1 2 3
y m 3 5.5 7
已求得关于y与x的线性回归方程为=2.2x+0.7,则m的值为( )
A.1 B.0.85 C.0.7 D.0.5
D [==1.5,=,将其代入=2.2x+0.7,可得m=0.5,故选D.]
二、填空题
6.设有一个回归方程为=2-1.5x,则变量x每增加1个单位时,y平均减少________个单位.
1.5 [因为=2-1.5x,所以变量x每增加1个单位时,y平均减少1.5个单位.]
7.若施化肥量x(千克/亩)与水稻产量y(千克/亩)的回归方程为=5x+250,当施化肥量为80千克/亩时,预计水稻产量为亩产________千克左右.
650 [当x=80时,=400+250=650.]
8.已知由一组样本数据确定的回归方程为=1.5x+1,且=2,发现有两组数据(2.4,2.8)与(1.6,5.2)误差较大.去掉这两组数据后,重新求得回归直线的斜率为1,那么当x=4时,的估计值为________.
6 [∵由一组样本数据确定的回归方程为=1.5x+1,且=2,∴=1.5×2+1=4,∴样本点的中心为(2,4).
去掉(2.4,2.8)与(1.6,5.2),剩余数据的样本点的中心为(2,4).
∵重新求得的回归直线的斜率为1,
∴回归方程可设为=x+,
将(2,4)的坐标代入,得=2,
∴回归直线的方程为=x+2.
将x=4代入回归方程,得的估计值为6.]
三、解答题
9.某个服装店经营某种服装,在某周内每天获得的纯利润y(元)与该周每天销售这种服装数量x(件)之间的一组数据关系如下表:
x 3 4 5 6 7 8 9
y 66 69 73 81 89 90 91
已知:x=280,y=45 309,xiyi=3 487.
参考公式:回归方程是=x+,
其中=,=-.
(1)求,;
(2)画出散点图;
(3)求每天的纯利润y与每天销售数量x之间的线性回归方程.
[解] (1)==6,
==.
(2)散点图如图所示.
(3)由散点图知,y与x具有线性相关关系,设线性回归方程为=x+,
∵x=280,xiyi=3 487,=6,=,
∴==4.75,=-6×4.75≈51.36,
∴线性回归方程为=4.75x+51.36.
10. 通过市场调查,得到某产品的资金投入x(万元)与获得的利润y(万元)的数据,如下表所示.
资金投入x 2 3 4 5 6
利润y 2 3 5 6 9
(1)请根据上表提供的数据,用最小二乘法求出y关于x的回归方程=x+;
(2)现投入资金10万元,估计获得的利润为多少万元?
[解] (1)==4,
==5,
=
==1.7.
∴=- =-1.8,∴=1.7x-1.8.
(2)当x=10万元时,=15.2万元,
即估计获得的利润为15.2万元.
素养达标
1.已知x与y之间的几组数据如下表.
x 1 2 3 4 5 6
y 0 2 1 3 3 4
假设根据上表数据所得线性回归方程为=x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( )
A.>b′,>a′ B.>b′,<a′
C.<b′,>a′ D.<b′,<a′
C [由(1,0),(2,2)求b′,a′.
b′==2,a′=0-2×1=-2.
求,时,xiyi=0+4+3+12+15+24=58,
=,=,x=1+4+9+16+25+36=91,
∴=)=, =-×=-=-,∴<b′,>a′.]
2.(多选题)某公司过去五个月的广告费支出x(单位:万元)与销售额y(单位:万元)之间有下列对应数据:
x 2 4 5 6 8
y ▲ 40 60 50 70
工作人员不慎将表格中y的第一个数据丢失.已知y对x呈线性相关关系,且回归方程为=6.5x+17.5,则下列说法正确的有( )
A.销售额y与广告费支出x正相关
B.丢失的数据(表中▲处)为30
C.该公司广告费支出每增加1万元,销售额一定增加6.5万元
D.若该公司下月广告费支出为8万元,则销售额约为75万元
AB [由回归方程=6.5x+17.5,可知=6.5,则销售额y与广告费支出x正相关,所以A正确;设丢失的数据为m,由表中的数据可得=5,=,把点代入回归方程,可得=6.5×5+17.5,解得m=30,所以B正确;该公司广告费支出每增加1万元,销售额不一定增加6.5万元,所以C不正确;若该公司下月广告费支出为8万元,则销售额约为y=6.5×8+17.5=69.5(万元),所以D不正确.故选AB.]
3.新型冠状病毒席卷全球,形势严峻,各国医务人员急需新冠肺炎COVID?19诊治的科学方案和有效经验.中国抗疫取得阶段性成效,复旦大学附属中山医院的呼吸科主任宋元林教授团队与上海市第一批援鄂医疗队和武汉市金银潭医院合作,得到一项对新冠肺炎的研究成果,此项研究首次揭示COVID?19患者发生急性呼吸窘迫综合征(ARDS)和从ARDS进展至死亡的危险因素,并首次提出已发生ARDS的COVID?19患者使用甲强龙可能获益的观点.为了了解甲强龙的指标数据y与质量分数p(单位:%)之间的关系,随机统计了相关数据,并制作了下表.
质量分数p 6 10 14 18 22
指标数据y 62 m 44 28 14
由表中数据求得回归直线方程为=-3p+82.2,则m=________.
53 [由题意可得,==14,
==,
因为回归直线过点(,),所以=-3×14+82.2,解得m=53.]
4.某品牌服装专卖店为了解保暖衬衣的销售量y(件)与平均气温x(℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表.
时间 二月上旬 二月中旬 二月下旬 三月上旬
旬平均气温x(℃) 3 8 12 17
旬销售量y(件) 55 m 33 24
由表中数据算出线性回归方程=x+中的=-2,样本中心点为(10,38).
(1)表中数据m=________;
(2)气象部门预测三月中旬的平均气温约为22℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为________件.
(1)40 (2)14 [(1)由=38,得m=40.
(2)由=-得=58,故=-2x+58,
当x=22时,=14,
故三月中旬的销售量约为14件.]
5.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据.
单价x(元) 8 8.2 8.4 8.6 8.8 9
销量y(件) 90 84 83 80 75 68
(1)求回归直线方程=x+,其中=-20;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
[解] (1)由于==8.5,
==80.
所以=-=80+20×8.5=250,
从而回归直线方程为=-20x+250.
(2)设工厂获得的利润为L元,依题意得
L=x(-20x+250)-4(-20x+250)=-20x2+330x-1 000=-20(x-8.25)2+361.25.
当且仅当x=8.25时,L取得最大值,
故当单价定为8.25元时,工厂可获得最大利润.