第三章 统计案例(B)
(时间∶120分钟 满分∶150分)
一、选择题(本大题共12小题,每小题5分,共60分)
1.对于回归分析,下列说法错误的是( )
A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定
B.线性相关系数可以是正的,也可以是负的
C.回归分析中,如果r2=1,说明x与y之间完全相关
D.样本相关系数r∈(-1,1)
2.下列属于相关关系的是( )
A.利息与利率
B.居民收入与储蓄存款
C.电视机产量与苹果产量
D.某种商品的销售额与销售价格
3.某校高三年级学生学习数学的时间(x)与考试成绩(y)之间建立线性回归直线方程y=+x,经计算方程为=20-0.8x,该方程参数计算( )
A.值是明显不对的
B.值是明显不对的
C.值和都是不对的
D.值和值都是正确的
4.经过对χ2的统计量的研究,得到了若干个临界值,当χ2≤3.841时,我们认为事件A与B( )
A.在犯错误的概率不超过0.05的前提下有关系
B.在犯错误的概率不超过0.01的前提下有关系
C.没有充分理由认为A与B有关系
D.不能确定
5.对于分类变量X与Y的随机变量χ2,下列说法正确的是( )
A.χ2越大,推断“X与Y有关系”,犯错误的概率越大
B.χ2越小,推断“X与Y有关系”,犯错误的概率越大
C.χ2越接近于0,推断“X与Y无关”,犯错误的概率越大
D.χ2越大,推断“X与Y无关”,犯错误的概率越小
6.对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是( )
A.模型Ⅰ的相关系数r为0.98
B.模型Ⅱ的相关系数r为0.80
C.模型Ⅲ的相关系数r为0.50
D.模型Ⅳ的相关系数r为0.25
7.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到的回归直线方程为=x+,那么下面说法不正确的是( )
A.直线=x+必经过点(,)
B.直线=x+至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点
C.直线=x+的斜率为
D.直线=x+和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差[yi-(xi+)]2是该坐标平面上所有直线与这些点偏差中最小的
8.下列是x与y之间的一组数据
x
0
1
2
3
y
1
3
5
7
则y关于x的回归直线方程=x+对应的直线必过点( )
A.(,4) B.(,2)
C.(2,2) D.(1,2)
9.为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校学生中随机抽取了50名学生,得到如下列联表:
喜欢数学
不喜欢数学
合计
男
13
10
23
女
7
20
27
合计
20
30
50
根据表中数据,得到χ2=≈4.844>3.841,你认为性别与是否喜欢数学课程之间有关系,这种判断犯错误的概率不超过( )
A.0 B.0.05 C.0.01 D.1
10.下列说法中正确的是( )
①独立性检验的基本思想是带有概率性质的反证法;②独立性检验就是选取一个假设H0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H0的推断;③独立性检验一定能给出明确的结论.
A.①② B.①③
C.②③ D.①②③
11.下列说法中正确的有( )
①若r>0,则x增大时,y也相应增大;②若r<0,则x增大时,y也相应增大;③若r=1,或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.
A.①② B.②③
C.①③ D.①②③
12.利用独立性检验来考察两个分类变量X和Y是否有关系时,通过查阅下表来确定“X与Y有关系”的可信程度.
P(χ2≥x0)
0.50
0.40
0.25
0.15
0.10
x0
0.455
0.708
1.323
2.072
2.706
P(χ2≥x0)
0.05
0.025
0.010
0.005
0.001
x0
3.841
5.024
6.635
7.879
10.828
如果χ2≥5.024,那么就有把握认为“X与Y有关系”的百分比为( )
A.25% B.75%
C.2.5% D.97.5%
二、填空题(本大题共4小题,每小题5分,共20分)
13.对具有线性相关关系的变量x和y,由测得的一组数据已求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为______________.
14.若两个分类变量X与Y的列联表为:
y1
y2
总计
x1
10
15
25
x2
40
16
56
总计
50
31
81
则“X与Y之间有关系”这个结论出错的可能性为________.
15.如果散点图中所有样本点都在一条直线上,解释变量和预报变量的关系是__________,残差平方和是__________.
16.下列说法:
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
②回归方程=x+必过点(,);
③曲线上的点与该点的坐标之间具有相关关系;
④在一个2×2列联表中,由计算得χ2=13.079,则其两个变量间有关系的可能性是90%.
其中错误的是________.
三、解答题(本大题共6小题,共70分)
17.(10分)在一段时间内,某种商品的价格x(元)和需求量y(件)之间的一组数据为:
价格x
14
16
18
20
22
需求量y
12
10
7
5
3
x与y具有线性相关关系,求出y对x的回归直线方程.
18.(12分)某聋哑研究机构,对聋与哑是否有关系进行抽样调查,在耳聋的657人中有416人哑,而在另外不聋的680人中有249人哑,你能运用这组数据,得到相应结论吗?请运用独立性检验进行判断.
19.(12分)现对x、y有如下观测数据:
x
18
25
30
39
41
42
49
52
y
3
5
6
7
8
8
9
10
试求y对x的回归直线方程.
20.(12分)研究某特殊药物有无副作用(比如恶心),给50个患者服用此药,给另外50个患者服用安慰剂,记录每类样本中出现恶心的数目如下表,试问此药物有无副作用.
有恶心
无恶心
合计
给药A
15
35
50
给安慰剂
5
45
50
合计
20
80
100
21.(12分)在研究水果辐照保鲜效果问题时,经统计得到如下数据:
未腐烂
发生腐烂
合计
未辐照
251
249
500
已辐照
203
297
500
合计
454
546
1000
问:辐照保鲜措施对水果保鲜是否有效?
22.(12分)某地区10名健康儿童头发和血液中的硒含量(1000ppm)如下表所示:
血硒
74
66
88
69
91
73
66
96
58
73
发硒
13
10
13
11
16
9
7
14
5
10
(1)画出散点图;
(2)求回归直线方程;
(3)若某名健康儿童的血硒含量为94(1000ppm),预测他的发硒含量.
第三章 统计案例(B)
答案
1.D [相关系数r的范围是[-1,1].]
2.B
3.B
4.C
5.B
6.A [根据相关系数的定义和计算公式可知,|r|≤1,且|r|越接近于1,相关程度越大,拟合效果越好;|r|越接近于0,相关程度越小,拟合效果越弱,所以A正确.]
7.B [回归直线不一定过某个样本点,一定过样本点的中心(,).]
8.A [(,4)为样本点的中心,一定在回归直线上.]
9.B
10.A
11.C
12.D [5.024对应0.025是“X与Y有关系”不合理的程度,因此两个分类变量有关系的可信程度约为97.5%.]
13.=-10+6.5x
解析 由题意知=2,=3,=6.5,所以=-=3-6.5×2=-10,
即回归直线的方程为=-10+6.5x.
14.1%
解析 由列联表数据,
可求得χ2=≈7.227>6.635.
所以“X与Y之间有关系”出错的可能性仅为1%.
15.线性函数关系 0
16.③④
解析 ①正确.由回归方程的定义及最小二乘法思想,知②正确.③④不正确.
17.解 =×(14+16+18+20+22)=18,
=×(12+10+7+5+3)=7.4,
x=142+162+182+202+222=1660,
y=122+102+72+52+32=327,
xiyi=14×12+16×10+18×7+20×5+22×3=620,
所以====-1.15,
所以=-=7.4+1.15×18=28.1,
所以回归直线方程为=-1.15x+28.1.
18.解 能.根据题目所给数据得到如下列联表:
哑
不哑
总计
聋
416
241
657
不聋
249
431
680
总计
665
672
1337
根据列联表中数据得到
χ2=
≈95.291>6.635.
因此有99%的把握认为聋与哑有关系.
19.解 可求得:=37,=7,
x=11920,
xiyi=2257.
设回归直线方程为=+x,
则==
=≈0.19,
=-=7-0.19×37=-0.03.
∴回归直线方程为=0.19x-0.03.
20.解 由题意,问题可以归纳为独立检验.假设H0:服用该药物(A)与恶心(B)独立.为了检验假设H0,首先计算统计量χ2=≈6.25>3.841.即不能认为药物无恶心作用,也可以说,有95%的把握说该药物与副作用(恶心)有关.
21.解 根据题中数据,利用公式,得χ2=≈9.295,
因为9.295>6.635,因此有99%的把握认为辐照保鲜措施对水果保鲜有效.
22.解 (1)散点图如下图所示:
(2)根据回归方程的截距和斜率的最小二乘估计公式分别求得:
==≈0.236,
=-x=10.8-0.236×75.4≈-6.99.
故所求回归直线方程为=0.236x-6.99.
(3)当x=94时,=0.236×94-6.99≈15.2.
因此,当地儿童的血硒含量为94(1000ppm)时,该儿童的发硒含量约为15.2(1000ppm).