[A 基础达标]
1.如图所示是具有相关关系的两个变量的一组数据的散点图,去掉哪个点后,两个变量的相关关系更明显( )
A.D B.E
C.F D.A
解析:选C.A、B、C、D、E五点分布在一条直线附近且贴近该直线,而F点离得远,故去掉点F.
2.(2019·江西省上饶市期末统考)某车间为了规定工时定额,需要确定加工零件所花费用的时间,为此进行了5次实验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程为=7.8x+40.2.
零件数x(个)
1
2
3
4
5
加工时间y(min)
50
67
71
79
表中有一个数据模糊不清,请你推断出该数据的值为( )
A.55 B.55.8
C.59 D.51
解析:选D.设表中模糊的数据为m.由表中的数据可得==3,==,
又由回归直线的方程为=7.8x+40.2,所以=7.8×3+40.2,解得m=51.即表中模糊的数据为51.故选D.
3.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( )
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
解析:选C.因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=y+,>0,则z=y+=-0.1x++,故x与z负相关.
4.已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归方程为=x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( )
A.>b′,>a′ B.>b′,<a′
C.<b′,>a′ D.<b′,<a′
解析:选C.由两组数据(1,0)和(2,2)可求得直线方程为y=2x-2,从而b′=2,a′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得===,=-=-×=-,所以<b′,>a′.
5.(2019·广西钦州市期末考试)若回归直线=x+的斜率估值为1.23,样本中心点为(4,5),当x=2时,估计y的值为____________.
解析:因为回归直线=x+的斜率估值为1.23,所以=1.23,=1.23x+.
因为样本中心点为(4,5),所以5=1.23×4+,=0.08,=1.23x+0.08,
代入x=2,y=1.23×2+0.08=2.54.
答案:2.54
6.(2019·湖北省宜昌市葛洲坝中学期末考试)某公司借助手机微信平台推广自己的产品,对今年前5个月的微信推广费用x与利润额y(单位:百万元)进行了初步统计,得到下列表格中的数据:
x
2
4
5
6
8
y
30
40
60
p
70
经计算,月微信推广费用x与月利润额y满足线性回归方程=6.5x+17.5,则p的值为____________.
解析:由题中数据可得==5,==.
由线性回归方程=6.5x+17.5经过样本中心(,),
有=6.5×5+17.5,解得p=50.
答案:50
7.对某台机器购置后的运营年限x(x=1,2,3,…)与当年利润y的统计分析知具备线性相关关系,线性回归方程为=10.47-1.3x,估计该台机器使用________年最合算.
解析:只要预计利润不为负数,使用该机器就算合算,即≥0,所以10.47-1.3x≥0,解得x≤8.05,所以该台机器使用8年最合算.
答案:8
8.(2019·湖南省张家界市期末联考)为了解某地区某种农产品的年产量x(单位:吨)对价格y(单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如表:
x
1
2
3
4
5
y
8
6
5
4
2
已知x和y具有线性相关关系.
(1)求,;
(2)求y关于x的线性回归方程=x+;
(3)若年产量为4.5吨,试预测该农产品的价格.
解:(1)计算可得==3,==5.
(2)===-1.4,
因为线性回归直线过(,),则=-=5-(-1.4×3)=9.2,
故y关于x的线性回归方程是=-1.4x+9.2.
(3)当x=4.5时,=-1.4×4.5+9.2=2.9(千元/吨).
9.(2019·河北省石家庄市期末考试)在一段时间内,分5次测得某种商品的价格x(万元)和需求量y(吨)之间的一组数据为
价格x
1.4
1.6
1.8
2
2.2
需求量y
12
10
7
5
3
(1)根据上表数据,求出回归直线方程=x+;
(2)试根据(1)中求出的回归方程预估当价格为1.9万元时,需求量大约是多少吨?
(参考公式:==,
=-)
解:(1)因为=×9=1.8,=×37=7.4,
xiyi=62,x=16.6,
所以 ===-11.5,
=-=7.4+11.5×1.8=28.1,
故y对x的线性回归方程为=28.1-11.5x.
(2)y=28.1-11.5×1.9=6.25(吨).
所以如果价格为1.9万元,则需求量大约是6.25吨.
[B 能力提升]
10.对两个变量的四组数据进行统计,获得以下散点图,关于两个变量相关系数的比较,正确的是( )
A.r2<r4<0<r3<r1
B.r4<r2<0<r1<r3
C.r4<r2<0<r3<r1
D.r2<r4<0<r1<r3
解析:选A.由相关系数的定义以及散点图的含义,可知r2<r4<0<r3<r1.
11.2018年,我国政府加强了对高耗能企业的监管,采取多种方式促进企业向节能型企业转变,某工厂经过技术改造后,降低了能源消耗,经统计该厂某种产品的产量x(吨)与相应的生产能耗y(吨汽油)有如下几组样本数据
x
3
4
5
6
y
2.5
3
4
4.5
根据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得回归直线的斜率为0.7,已知该工厂在2018年能耗计划中汽油不超过8.75吨,则该工厂2018年的计划产量最大约为____________吨.
解析:==4.5,==3.5,故样本点的中心为A(4.5,3.5),由题意,设回归直线方程是=0.7x+,代入A点坐标得3.5=0.7×4.5+,求得=0.35,故回归直线方程为=0.7x+0.35.由题意得=0.7x+0.35≤8.75,解得x≤12.所以该工厂2018年的计划产量最大约为12吨.
答案:12
12.(2019·湖北省宜昌县域高中协同发展共同体期末考试)为研究冬季昼夜温差大小对某反季节大豆新品种发芽率的影响,某校课外兴趣小组记录了5组昼夜温差与100颗种子发芽数,得到如下资料:
组号
1
2
3
4
5
温差x(℃)
10
11
13
12
8
发芽数y(颗)
23
25
30
26
16
经分析,这组数据具有较强的线性相关关系,因此该小组确定的研究方案是:先从这五组数据中选取3组数据求出线性回归方程,再用没选取的2组数据进行检验.
(1)若选取的是第2,3,4组的数据,求出y关于x的线性回归方程=x+;
(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?
(参考公式:==,=-)
解:(1)由题意:==12,==27,
=
=
=
=,
=-=27-×12=-3,
故回归直线方程为=x-3.
(2)当x=10时,y=×10-3=22,|22-23|=1<2,
当x=8时,y=×8-3=17,|17-16|=1<2,
所以(1)中所得的回归直线方程是可靠的.
13.(选做题)(2019·黑龙江省牡丹江市第一高级中学期末考试)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
表中wi=,=i.
(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x、y的关系为z=0.2y-x.根据(2)的结果回答下列问题:
(ⅰ)年宣传费x=49时,年销售量及年利润的预报值是多少?
(ⅱ)年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归线v=α+βu的斜率和截距的最小二乘估计分别为
解:(1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.
(2)令w=,先建立y关于w的线性回归方程.
由于d==68,=-=563-68×6.8=100.6,
所以y关于w的线性回归方程为=100.6+68w,
因此y关于x的回归方程为=100.6+68.
(3)(ⅰ)由(2)知, 当x=49时,年销售量y的预报值=100.6+68=576.6,
年利润z的预报值=576.6×0.2-49=66.32.
(ⅱ)根据(2)的结果知,年利润z的预报值=0.2(100.6+68)-x=-x+13.6+20.12.
所以当==6.8,即x=46.24时,取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.
课件39张PPT。第二章 统计第二章 统计左下角右上角左上角右下角一条直线线性相关回归直线距离的平方和斜率相关关系的判断线性回归方程的求法线性回归方程的应用本部分内容讲解结束按ESC键退出全屏播放