能力拓展提升
一、选择题
11.对于回归分析,下列说法错误的是( )
A.在回归分析中,变量间的关系是非确定性关系,因此因变量不能由自变量唯一确定
B.线性相关系数可以是正的或负的
C.回归分析中,如果r=±1,说明x与y之间完全线性相关
D.样本相关系数r∈(-1,1)
[答案] D
[解析] ∵相关系数|r|≤1,∴D错.
12.某产品的广告费用x与销售额y的统计数据如下表
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
[答案] B
[解析] 此题必须明确回归直线方程过定点(,).
易求得=3.5,=42,则将(3.5,42)代入=x+中得:42=9.4×3.5+,即=9.1,则=9.4x+9.1,所以当广告费用为6万元时销售额为9.4×6+9.1=65.5万元.
13.甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
m
106
115
124
103
则哪位同学的试验结果体现A、B两变量有更强的线性相关性( )
A.甲 B.乙
C.丙 D.丁
[答案] D
[解析] r越接近1,相关性越强,残差平方和m越小,相关性越强,故选D.
14.某学校开展研究性学习活动,某同学获得一组实验数据如下表:
x
1.99
3
4
5.1
6.12
y
1.5
4.04
7.5
12
18.01
对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是( )
A.y=2x-2 B.y=()x
C.y=log2x D.y=(x2-1)
[答案] D
[解析] 可以代入检验,当x取相应的值时,所求y与已知y相差平方和最小的便是拟合程度最高的.
二、填空题
15.已知两个变量x和y之间有线性相关性,5次试验的观测数据如下表:
x
100
120
140
160
180
y
45
54
62
75
92
那么变量y关于x的回归方程是________.
[答案] =0.575x-14.9
[解析] 根据公式计算可得=0.575,=-14.9,所以回归直线方程是=0.575x-14.9.
16.已知x,y的取值如下表:
x
0
1
3
4
y
2.2
4.3
4.8
6.7
若x,y具有线性相关关系,且回归方程为=0.95x+a,则a的值为________.
[答案] 2.6
[解析] 由已知得=2,=4.5,而回归方程过点(,),则4.5=0.95×2+a,
∴a=2.6.
三、解答题
17.某5名学生的数学成绩和化学成绩如下表:
数学成绩x
88
76
73
66
63
化学成绩y
78
65
71
64
61
(1)画出散点图;
(2)如果x、y呈线性相关关系,求y对x的线性回归方程.
[解析] (1)散点图如图:
(2)=73.2,=67.8,=27 174,=23 167,
iyi=25 054,
∴=≈0.625,
=-=22.05,
所求回归方程为,sup6(︿))=22.05+0.625x.
18.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:
房屋面积(m2)
115
110
80
135
105
销售价格(万元)
24.8
21.6
18.4
29.2
22
(1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线;
(3)据(2)的结果估计当房屋面积为150m2时的销售价格.
[解析] (1)数据对应的散点图如下图所示:
(2)=xi=109,lxx= (xi-)2=1 570,
=23.2,lxy= (xi-)(yi-)=308.
设所求回归直线方程为=x+,
则==≈0.196 2,=-=1.816 6.
故所求回归直线方程为=0.196 2x+1.816 6.
(3)据(2),当x=150m2时,销售价格的估计值为
=0.196 2×150+1.816 6=31.246 6(万元).
能力拓展提升
一、选择题
9.下列说法:
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
②设有一条直线的回归方程为=3-5x,变量x增加一个单位时,y平均增加5个单位;
③线性回归直线=x+必过点(,);
④在一个2×2列联表中,由计算得K2=13.079,则有99%的把握确认这两个变量间有关系.其中错误的个数是( )
A.0 B.1
C.2 D.3
本题可以参考独立性检验临界值表:
P(χ2≥k0)
0.50
0.40
0.25
0.15
0.10
k0
0.455
0.708
1.323
2.072
2.706
P(χ2≥k0)
0.05
0.025
0.010
0.005
0.001
k0
3.841
5.024
6.635
7.879
10.828
[答案] B
[解析] 一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x的系数具备直线斜率的功能,对于回归方程=3-5x,当x增加一个单位时,y平均减少5个单位,②错误;由线性回归方程的定义知,线性回归直线=x+必过点(,),③正确;因为K2=13.079>10.828,故有99%的把握确认这两个变量有关系,④正确,故选B.
10.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由K2=算得,K2=≈7.8.
附表:
P(k2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
参照附表,得到的正确结论是( )
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
[答案] A
[解析] 根据独立性检验的定义,由k2≈7.8>6.635可知,有99%以上把握认为“爱好该项运动与性别有关”.
11.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:
认为作业多
认为作业不多
总数
喜欢玩电脑游戏
18
9
27
不喜欢玩电脑游戏
8
15
23
总数
26
24
50
则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为( )
A.99% B.95%
C.90% D.无充分依据
[答案] B
[解析] 由表中数据得k=
≈5.059>3.841.
所以约有95%的把握认为两变量之间有关系.
二、填空题
12.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
专业
性别
非统计专业
统计专业
男
13
10
女
7
20
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到
K2=≈4.844,
因为K2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.
[答案] 5%
[解析] ∵k>3.841,所以有95%的把握认为主修统计专业与性别有关,出错的可能性为5%.
三、解答题
13.为了研究性格与血型的关系,抽取80名被试者,他们的血型与性格汇总如下,试判断性格与血型是否相关.
血型
性格
O型或A型
B型或AB型
总计
A型
18
16
34
B型
17
29
46
总计
35
45
80
[解析] 由列联表中的数据得到:
K2=≈2.030≤2.706.
认为没有充分的证据显示“血型与性格有关系”.
14.打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据,试问:每一晚都打鼾与患心脏病有关吗?
患心脏病
未患心脏病
合计
每一晚都打鼾
30
224
254
不打鼾
24
1 355
1 379
合计
54
1 579
1 633
[解析] 假设每一晚都打鼾与患心脏病无关系,则有a=30,b=224,c=24,d=1 355,a+b=254,c+d= 1 379,a+c=54,b+d=1 579,n=1 633.
∴K2=
==68.033.
∵68.033>10.828.
∴有99%的把握说每一晚都打鼾与患心脏病有关.