1.8
最小二乘估计
同步测试
一、选择题(每小题3分,共18分)
1.废品率x%和每吨生铁成本y(元)之间的线性回归方程为y=256+3x,表明
( )
A.废品率每增加1%,生铁成本增加259元
B.废品率每增加1%,生铁成本增加3元
C.废品率每增加1%,生铁成本每吨增加3元
D.废品率不变,生铁成本为256元
【解析】选C.回归方程中,相关系数为3,相关系数表示函数值的变化率,本题中表示废品率每增加1%,生铁成本每吨增加3元.
2.(2014·长春高一检测)若用水量x(kg)与某种产品的产量y(kg)的线性回归方程是y=2x+1250,则用水量为50kg时,预计该种产品的产量是 ( )
A.1350kg
B.大于1350kg
C.小于1350kg
D.以上都不对
【解析】选A.将x=50代入线性回归方程得y的估计值为1350.
3.已知一组观测值具有线性相关关系,若对于y=bx+a,求得b=0.51,=61.75,
=38.14,则线性回归方程为 ( )
A.y=0.51x+6.65
B.y=6.65x+0.51
C.y=0.51x+42.30
D.y=42.30x+0.51
【解析】选A.a=-b=38.14-0.51×61.75≈6.65.
则线性回归方程为y=0.51x+6.65.
4.已知线性回归方程y=0.5x-0.801,则当x=25时,y的估计值是 ( )
A.13.301
B.12.5
C.11.699
D.0.801
【解析】选C.将x=25代入y=0.5x-0.801即可求得.
5.(2014·天津高一检测)如图是具有相关关系的两个变量的一组数据的散点图和回归直线,去掉哪个点后,剩下的5个点数据的相关系数最大 ( )
A.D
B.E
C.F
D.A
【解析】选C.F点距回归直线最远,所以去掉F点后剩下的相关系数最大.
6.(2014·南昌高一检测)两个相关变量的统计数据如表:两变量的线性回归方程为 ( )
x
10
15
20
25
30
y
1
003
1
005
1
010
1
011
1
014
A.y=0.56x+997.4
B.y=0.63x-231.2
C.y=50.2x+501.4
D.y=60.4x+400.7
【解析】选A.由表中数据得:=20,
=1008.6,
其他数据如表:
i
xi
yi
xiyi
1
10
1
003
100
10
030
2
15
1
005
225
15
075
3
20
1
010
400
20
200
4
25
1
011
625
25
275
5
30
1
014
900
30
420
合计
100
5
043
2
250
101
000
进而可求得:
b==0.56,
a=-b=997.4,
所以线性回归方程是y=0.56x+997.4.
二、填空题(每小题4分,共12分)
7.(2014·威海高一检测)已知一个线性回归方程为y=1.5x+45,x∈{1,
7,5,13,19},则=__________.
【解析】因为=(1+7+5+13+19)=9,
且=1.5+45,
所以=1.5×9+45=58.5.
答案:58.5
8.以下关于线性回归的判断,正确的有__________个.
①若散点图中所有点都在一条直线附近,则这条直线为回归直线;
②散点图中的绝大多数点都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点;
③已知线性回归方程为y=0.50x-0.81,则x=25时,y的估计值为11.69;
④线性回归方程的意义是它反映了样本整体的变化趋势.
【解析】能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数a,b得到的直线y=a+bx才是回归直线,所以①不对;②正确;将x=25代入y=0.50x-0.81,解得y=11.69,所以③正确;④正确.
答案:3
9.(2013·西安高一检测)在研究硝酸钠的可溶性程度时,对不同的温度观测它在水中的溶解度,得观测结果如下:
温度(x)
0
10
20
50
70
溶解度(y)
66.7
76
85
112.3
128
则由此得到的回归直线的斜率是________.
【解析】列表求得=30,=93.6,
其他数据如表:
i
xi
yi
xiyi
1
0
66.7
0
0
2
10
76
100
760
3
20
85
400
1
700
4
50
112.3
2
500
5
615
5
70
128
4
900
8
960
合计
150
468
7
900
17
035
所以回归直线的斜率:
b=≈0.8809.
答案:0.8809
三、解答题(每小题10分,共20分)
10.(2014·上海高一检测)某地10户家庭的年收入和年饮食支出的统计资料如下
年收入x(万元)
2
4
4
6
6
6
7
7
8
10
年饮食支出y(万元)
0.9
1.4
1.6
2.0
2.1
1.9
1.8
2.1
2.2
2.3
(1)根据表中数据,确定家庭的年收入和年饮食支出的相关关系.
(2)如果某家庭年收入为9万元,预测其年饮食支出.
【解题指南】画出散点图,判断其线性相关性,求出线性回归方程.
【解析】(1)由题意知,年收入x为解释变量,年饮食支出y为预报变量,作散点图如图所示.
从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.
列表求得=6,=1.83,
i
xi
yi
xiyi
1
2
0.9
4
1.8
2
4
1.4
16
5.6
3
4
1.6
16
6.4
4
6
2.0
36
12
5
6
2.1
36
12.6
6
6
1.9
36
11.4
7
7
1.8
49
12.6
8
7
2.1
49
14.7
9
8
2.2
64
17.6
10
10
2.3
100
23
合计
60
18.3
406
117.7
进而可求得b=≈0.172,
a=-b≈1.83-0.172×6=0.798.
从而得到线性回归方程为y=0.172x+0.798.
(2)某家庭年收入为9万元时,其年饮食支出约为
y=0.172×9+0.798=2.346(万元).
11.某县教研室要分析学生初中升学的数学成绩对高一年级数学成绩有什么影响,在高一年级学生中随机抽选5名学生分析他们入学的数学成绩和高一年级期末数学考试成绩(如表):
学生编号
1
2
3
4
5
入学成绩x
63
67
75
88
85
高一期末成绩y
65
77
80
82
92
(1)已知x与y之间具有线性相关关系,求出线性回归方程.
(2)若某学生入学的数学成绩是80分,试估测他高一期末数学考试成绩.
【解题指南】(1)根据所给的数据利用最小二乘法,求出线性回归方程的系数和a的值,写出线性回归方程,注意运算过程中不要出错.
(2)将x=80代入所求出的线性回归方程中,得y的值,即这个学生的高一期末数学考试成绩预测值.
【解析】(1)设所求的线性回归方程为y=bx+a,
==75.6,
==79.2.
由最小二乘法可以写出b=
=≈0.742.
a≈23.105.
因此所求的线性回归方程为y=0.742x+23.105.
(2)将x=80代入所求出的线性回归方程中,得y≈82分,即这个学生的高一期末数学考试成绩预测值为82分.
一、选择题(每小题4分,共16分)
1.样本数据点(3,10),(7,20),(11,24)对应的线性回归方程为 ( )
A.y=1.75x-5.75
B.y=1.75x+5.75
C.y=-1.75x+5.75
D.y=-1.75x-5.75
【解析】选B.方法一:设线性回归方程为y=bx+a,
则b=
=
=1.75,
a=-b=18-1.75×7=5.75.
故y=1.75x+5.75,故选B.
方法二:用代入法检验可排除A,C,D.
2.(2014·宝鸡高一检测)下表是某旅游区游客数量与平均气温的对比表:
平均气温(℃)
-1
4
10
13
18
26
数量(百个)
20
24
34
38
50
64
若已知游客数量与平均气温是线性相关的,则线性回归方程为 ( )
A.y=1.98x+22.13
B.y=1.78x+20.13
C.y=1.68x+18.73
D.y=1.51x+15.73
【解析】选C.列表求得=,=,
i
xi
yi
xiyi
1
-1
20
1
-20
2
4
24
16
96
3
10
34
100
340
4
13
38
169
494
5
18
50
324
900
6
26
64
676
1
664
合计
70
230
1
286
3
474
进而求得:b=≈1.68,
a=-b≈18.73,即所求的线性回归方程为
y=1.68x+18.73.
3.(2014·海口高一检测)下表是某同学记录的某地方在3月1日~3月12日的体检中的发烧人数,并给出了散点图.
日期
3.1
3.2
3.3
3.4
3.5
3.6
人数
100
109
115
118
121
131
日期
3.7
3.8
3.9
3.10
3.11
3.12
人数
141
152
158
175
186
203
下列说法:
①根据此散点图,可以判断日期与发烧人数具有线性相关关系.
②根据此散点图,可以判断日期与发烧人数具有一次函数关系.
其中正确的是 ( )
A.②
B.①
C.①②
D.都不正确
【解析】选B.由散点图可以判断日期与发烧人数具有正相关关系,但不是函数关系,更不是一次函数关系,因为所有点不在一条直线上,而是在一条直线附近.
4.某考察团对全国十大城市职工人均工资x与居民人均消费y进行统计调查,y与x具有相关关系,回归方程y=0.66x+1.562(单位:千元),若某城市居民消费水平为7.675千元,估计该城市消费额占人均工资收入的百分比为 ( )
A.66%
B.72.3%
C.67.3%
D.83%
【解析】选D.因为y与x具有线性相关关系,满足回归方程y=0.66x+1.562,该城市居民人均消费水平为y=7.675,所以可以估计该市的职工人均工资水平为x≈9.262,所以可以估计该城市人均消费额占人均工资收入的百分比为×100%≈83%.
二、填空题(每小题5分,共10分)
5.(2014·芜湖高一检测)已知x,y之间的一组数据如表:
x
2
3
4
5
6
y
3
4
6
8
9
对于表中数据,现给出如下拟合直线:①y=x+1;②y=2x-1;③y=x-;④y=x,则根据最小二乘法的思想,其中拟合程度最好的直线是____________(填序号).
【解析】由题意知=4,=6,所以b==,所以a=-b=-,所以y=x-,所以选③.
答案:③
6.现有一个由身高预测体重的线性回归方程,体重预测值=4(磅/英寸)×身高-130磅,其中体重与身高分别以磅和英寸为单位,如果换算为标准单位(1英寸≈2.5cm,1磅≈0.45kg),则线性回归方程应该是________.
【解析】单位换算如下:
4磅/英寸=4×0.45
kg/2.5
cm=0.72
kg/cm,
130磅=130×0.45kg=58.5
kg.
所以回归方程应该是:体重预测值=0.72(kg/cm)×身高-58.5kg.
答案:体重预测值=0.72(kg/cm)×身高-58.5kg
【误区警示】本题容易因单位换算而致错,注意转化.
三、解答题(每小题12分,共24分)
7.(2014·大连高一检测)下面是世界上10名男网球选手的身高(x)与体重(y)的情况.
姓名
身高(x)/cm
体重(y)/kg
Carlos
Moya
190
82
Richard
Fromberg
196
88
Marcelo
Rios
175
63
Pat
Rafter
185
79
Jason
Stoltenberg
186
80
Andre
Agassi
180
75
Todd
Martin
198
96
Karol
Kucera
188
75
Mark
Philippoussis
194
92
Greg
Rusedski
193
86
(1)将上表中的数据制成散点图.
(2)你能从散点图中发现身高与体重近似成什么关系吗
(3)若近似成线性关系,请画出一条直线来近似地表示这种线性关系.
(4)若某名男网球运动员的身高是172cm,请预测他的体重.
【解析】(1)散点图如图:
(2)由图可见,图中的数据点大致分布在一条直线附近,当身高数据由小到大变化时,体重数据也由小变大,因此身高与体重近似成线性相关关系.
(3)直线如图所示.
(4)根据所画直线可预测当身高是172cm时,其体重约为61kg.
【误区警示】第(3)问中的直线不是唯一的,当然不同的近似直线将直接影响第(4)问的预测结果.
8.已知x,y之间的一组数据如表:
y
1
2
3
4
5
x
1
3
6
7
8
根据表中数据,甲、乙两同学给出的拟合直线分别为
y=x+与y=x+1,
试利用最小二乘法判断哪条直线拟合程度更好.
【解题指南】最小二乘法是使[yi-(a+bxi)]2(i=1,2,3,…,n)的和最小.
所以只需使y的实际值与代入直线方程求得的y值的差的平方和最小即可.
【解析】用y=x+1作为拟合直线时,所得y值与y的实际值的差的平方和为S1=+(2-2)2+(3-3)2++=,用y=x+作为拟合直线时,所得y值与y的实际值的差的平方和为S2=(1-1)2+(2-2)2++(4-4)2+=,
因为S2