2.3
变量间的相关关系
同步练习
[学业水平训练]
1.有五组变量:
①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;
②平均日学习时间和平均学习成绩;
③某人每日吸烟量和其身体健康情况;
④立方体的棱长和体积;
⑤汽车的重量和行驶100千米的耗油量.
其中两个变量成正相关的是( )
A.①③
B.②④
C.②⑤
D.④⑤
解析:选C.①是负相关;②是正相关;③是负相关;④是函数关系,不是相关关系;⑤是正相关.
2.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
A.-1
B.0
C.
D.1
解析:选D.因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1.
3.对有线性相关关系的两个变量建立的回归直线方程=+x中,回归系数( )
A.不能小于0
B.不能大于0
C.不能等于0
D.只能小于0
解析:选C.当=0时,r=0,这时不具有线性相关关系,但能大于0,也能小于0.
4.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:( )
①
y与x负相关且=2.347x-6.
423;②
y与x负相关且=-3.476x+5.648;③
y与x正相关且=5.437x+8.493;④
y与x正相关且=-4.326x-4.578.
其中一定不正确的结论的序号是( )
A.①②
B.②③
C.③④
D.①④
解析:选D.由正负相关性的定义知①④一定不正确.
5.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1
cm,则其体重约增加0.85
kg
D.若该大学某女生身高为170
cm,则可断定其体重必为58.79
kg
解析:选D.当x=170时,=0.85×170-85.71=58.79,体重的估计值为58.79
kg,故D不正确.
6.已知一个回归直线方程为=1.5x+45,x∈{1,7,5,13,19},则y=________.
解析:因为x=(1+7+5+13+19)=9,
且回归直线过样本中心点(x,y),
所以y=1.5×9+45=58.5.
答案:58.5
7.某单位为了制定节能的目标,先调查了用电量y(单位:度)与气温x(单位:℃)之间的关系,随机抽取了4天的用电量与当地气温,并制作了对照表:
x
18
13
10
-1
y
24
34
38
64
由表中数据,得回归方程=-2x+,当气温为-5
℃时,预测用电量为________度.
解析:由表中数据计算可得=10,=40,
∵回归方程一定过样本点的中心(,),
∴代入回归方程,得=60,
∴=-2x+60.
当x=-5时,代入回归方程,得=70.
答案:70
8.对某台机器购置后的运营年限x(x=1,2,3,…)与当年利润y的统计分析知具备线性相关关系,线性回归方程为=10.47-1.3x,估计该台机器使用________年最合算.
解析:只要预计利润不为负数,使用该机器就算合算,即≥0,所以10.47-1.3x≥0,解得x≤8.05,所以该台机器使用8年最合算.
答案:8
9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单位x(元)
8
8.2
8.4
8.6
8.8
9
销量y(件)
90
84
83
80
75
68
(1)求回归直线方程=x+,其中=-20,=-;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
解:(1)由于=(8+8.2+8.4+8.6+8.8+9)=8.5,
=(90+84+83+80+75+68)=80.
所以=-=80+20×8.5=250,从而回归直线方程为=-20x+250.
(2)设工厂获得的利润为L元,依题意得
L=x(-20x+250)-4(-20x+250)
=-20x2+330x-1
000
=-20(x-)2+361.25.
当且仅当x=8.25时,L取得最大值.
故当单价定为8.25元时,工厂可获得最大利润.
10.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i=80,i=20,iyi=184,=720.,
(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;
(2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.,附:线性回归方程y=bx+a中,b=,a=-b,,其中,,为样本平均值,线性回归方程也可写为=x=.
解:(1)由题意知n=10,x-,,n,=i==8,
y-,=i==2,
又lxx==n2=720-10×82=80,
lxy=iyi-n=184-10×8×2=24,
由此得b===0.3,a=y-,-bx-,=2-0.3×8=-0.4,
故所求线性回归方程为y=0.3x-0.4.
(2)由于变量y的值随x值的增加而增加(b=0.3>0),故x与y之间是正相关.
(3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元).
[高考水平训练]
1.回归直线方程的系数,是最小二乘法估计中使函数Q(,)取得最小函数值时所满足的条件,其中Q(,)的表达式是( )
A.
(yi--xi)2
B.
|yi--xi|2
C.
(yi--xi)2
D.|yi--xi|2
解析:选A.用最小二乘法确定两变量之间的线性回归方程的思想,即求a,b使n个样本点(xi,yi)(i=1,2,…,n)与直线y=a+bx的“距离”的平方和最小,即使得Q
(,)=(y1--x1)2+(y2--x2)2+……(yn--xn)
=
(yi--xi)2达到最小,故选A.
2.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54.9.
零件数x(个)
10
20
30
40
50
加工时间y(min)
62
75
81
89
现发现表中有一个数据看不清,请你推断该数据的值为________.
解析:由已知可计算求出=30,而回归直线方程必过点(,),则=0.67×30+54.9=75,设模糊数字为a,则=75,
计算得a=68.
答案:68
3.近年来,我国高等教育事业有了迅速发展,为了解某省从2000年到2014年18岁到24岁的青年人每年考入大学的人数,我们把农村、县镇和城市分别标记为一组、二组、三组分开统计.为了便于计算,把2000年编号为0,2001年编号为1,…,2014年编号为15,如果把年份从0到15作为自变量进行回归分析,可得三个回归方程:农村:=0.42x+1.80;县镇:=2.32x+6.72;城市:=2.84x+9.50(y的单位是万).则下列说法中正确的是________.(把你认为正确说法的序号填上)
①三个组的两个变量都是正相关关系;②对于县镇组而言,每年考入大学的人数约是上一年的2.32倍;③在这一阶段,城市组的大学入学人数增长最快;④0.42表示农村青年考入大学的人数以每年约4
200人递增.
解析:①由于三个组的线性回归方程中x的系数均为正数,故三个组的两个变量都是正相关关系,故①正确;②中县镇组的线性回归直线方程=2.32x+6.72的意义是县镇考入大学的人数每年大约比上一年增加23
200人,故②不正确,由此可推知④正确;由于三个组的线性回归方程中,城市所对应的方程的x的系数最大,表示城市入学人数增加得最快,故③正确.
答案:①③④
4.2013年11月29日,据国家统计局公布:今年全国粮食总产量为60
193.5万吨,比去年增长2.1%,实现10年连续增产.
某地最近十年粮食需求量逐年上升,下表是部分统计数据:
年份
2009
2010
2011
2012
2013
需求量(万吨)
236
246
257
276
286
(1)利用所给数据求年需求量y与年份x之间的回归直线方程=x+;
(2)利用(1)中所求出的直线方程预测该地2014年的粮食需求量.
解:(1)由所给数据看出,年需求量y与年份x之间是近似直线上升,下面来求回归直线方程,先将数据预处理如下:
年份-2
011
-2
-1
0
1
2
需求量-257
-21
-11
0
19
29
由预处理后的数据,容易算得
=0,=3.2,
=
==13.
=-=3.2.
由上述计算结果,知所求回归直线方程为
-257=(x-2
011)+=13(x-2
011)+3.2,
即=13(x-2
011)+260.2.
(2)利用所求得的直线方程,可预测2014年的粮食需求量为13×(2
014-2
011)+260.2=13×3+260.2
=299.7≈300(万吨).