基础巩固强化
一、选择题
1.下列变量之间的关系不是相关关系的是( )
A.已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4ac
B.光照时间和果树亩产量
C.降雪量和交通事故发生
D.每亩用肥料量和粮食亩产量
[答案] A
2.(2010·湖南文,3)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )
A.=-10x+200 B.=10x+200
C.=-10x-200 D.=10x-200
[答案] A
[解析] 本题主要考查变量的相关性.
由负相关的定义排除B,D,由x=1时,y>0排除C.
3.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取了8对观察值,计算得i=52,i=228,=478,iyi=1 849,则y与x的回归方程是( )
A.=11.47+2.62x
B.=-11.47+2.62x
C.=2.62+11.47x
D.=11.47-2.62x
[答案] A
4.对变量x、y有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量u、v有观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
[答案] C
[解析] 观察图象易知选项C正确.
5.已知某车间加工零件的个数x与所花费时间y(h)之间的线性回归方程为=0.01x+0.5,则加工600个零件大约需要__________h.( )
A.6.5 B.5.5
C.3.5 D.0.5
[答案] A
[解析] 将x=600代入回归方程即得A.
6.关于随机误差产生的原因分析正确的是( )
(1)用线性回归模型来近似真实模型所引起的误差;
(2)忽略某些因素的影响所产生的误差;
(3)对样本数据观测时产生的误差;
(4)计算错误所产生的误差.
A.(1)(2)(4) B.(1)(3)
C.(2)(4) D.(1)(2)(3)
[答案] D
[解析] 理解线性回归模型y=bx+a+e中随机误差e的含义是解决此问题的关键,随机误差可能由于观测工具及技术产生,也可能因忽略某些因素产生,也可以是回归模型产生,但不是计算错误.
二、填空题
7.回归分析是处理变量之间________关系的一种数量统计方法.
[答案] 相关
[解析] 回归分析是处理变量之间相关关系的一种数量统计方法.
8.已知回归直线方程为=0.50x-0.81,则x=25时,y的估计值为________.
[答案] 11.69
[解析] y的估计值为0.50×25-0.81=11.69.
9.在线性回归模型中,R2表示________对预报变量变化的贡献率,R2越________,表示回归模型的拟合效果越好.
[答案] 解释变量 接近1
三、解答题
10.某工厂的产品产量与单位成本的资料如下表所示,请进行线性回归分析.
月份
产量x(千件)
单位成本y(元/件)
x2
xy
1
2
73
4
146
2
3
72
9
216
3
4
71
16
284
4
3
73
9
219
5
4
69
16
276
6
5
68
25
340
合计
21
426
79
1 484
[解析] 设回归直线方程为=x+,
=,==71,=79,iyi=1 481,
∴==≈-1.818 2,
=71-(-1.818 2)×≈77.36.
回归直线方程为=77.36-1.818 2x.
由回归系数为-1.818 2知,产量每增加1 000件,单位成本下降约1.82元.
基础巩固强化
一、选择题
1.在2×2列联表中,两个比值________相差越大,两个分类变量之间的关系越强( )
A.与 B.与
C.与 D.与
[答案] A
[解析] 与相差越大,说明ad与bc相差越大,两个分类变量之间的关系越强.
2.独立性检验中,不需要精确计算就可以粗略地判断两个分类变量是否有关的是( )
A.散点图 B.等高条形图
C.假设检验的思想 D.以上都不对
[答案] B
[解析] 等高条形图可以粗略地判断两个分类变量是否有关,但无法精确地给出结论的可靠程度,故选B.
3.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
以下各组数据中,对于同一样本能说明X与Y有关系的可能性最大的一组为( )
A.a=5,b=4,c=3,d=2
B.a=5,b=3,c=4,d=2
C.a=2,b=3,c=4,d=5
D.a=2,b=3,c=5,d=4
[答案] D
[解析] 比较|-|.
选项A中,|-|=;
选项B中,|-|=;
选项C中,|-|=;
选项D中,|-|=.故选D.
4.某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,有______的把握认为糖尿病患者与遗传有关系.( )
A.99.9% B.99.5%
C.99% D.97.5%
[答案] D
[解析] 可以先作出如下列联表(单位:人):
糖尿病患者与遗传列联表
糖尿病发病
糖尿病不发病
总计
阳性家族史
16
93
109
阴性家族史
17
240
257
总计
33
333
366
根据列联表中的数据,得到K2的观测值为
k=≈6.067>5.024.
故我们有97.5%的把握认为糖尿病患者与遗传有关系.
5.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
①若K2的观测值满足K2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误
A.① B.①③
C.③ D.②
[答案] C
[解析] ①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A,B,③正确.排除D,选C.
二、填空题
6.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以下的人,调查结果如下表:
患慢性气管炎
未患慢性气管炎
合计
吸烟
43
162
205
不吸烟
13
121
134
合计
56
283
339
根据列表数据,求得K2的观测值k=________.
[答案] 7.469
7.调查者通过随机询问72名男女中学生喜欢文科还是理科,得到如下列联表(单位:名)
性别与喜欢文科还是理科列联表
喜欢文科
喜欢理科
总计
男生
8
28
36
女生
20
16
36
总计
28
44
72
中学生的性别和喜欢文科还是理科________关系.(填“有”或“没有”)
[答案] 有
[解析] 通过计算K2的观测值k=≈8.42>7.879.故我们有99.5%的把握认为中学生的性别和喜欢文科还是理科有关系.
三、解答题
8.某地区有关部门调查该地区的一种传染病与饮用不干净水的关系,得到如下列联表(单位:人):
传染病与饮用不干净水列联表
得病
不得病
总计
干净水
52
466
518
不干净水
94
218
312
总计
146
684
830
根据数据作出统计分析推断.
[解析] 由已知列联表中数据计算得K2的观测值为k=≈54.21,
因为54.21>10.828,所以我们有99.9%的把握认为该地区的这种传染病与饮用不干净水是有关的.
[点评] 对数据作统计分析推断实质上是让我们来判断得这种传染病是否与饮用不干净的水有关系,即根据数据求K2的观测值,再利用其与临界值的大小关系来判断.