第三章统计案例
测试题
(时间:120分钟
满分:150分)
学号:______
班级:______
姓名:______
得分:______
一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一个是符合题目要求的)
1.
已知回归直线斜率的估计值为1.23,样本点的中心为(4,5),则回归直线的方程为(
)
A.y
=1.23x+4
B.y=1.23x+5
C.y=1.23x+0.08
D.y=0.08x+1.23
2.
为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
父亲身高x(cm)
174
176
176
176
178
儿子身高y(cm)
175
175
176
177
177
则y对x的线性回归方程为(
)
A.y=x-1
B.y=x+1
C.y=176
D.y=x+88
3.
给出下列结论:(1)两个变量之间的关系一定是确定的关系;(2)相关关系就是函数关系;(3)回归分析是对具有函数关系的两个变量进行统计分析的一种常用方法;(4)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
以上结论中,正确的有几个?
(
)
A.1
B.2
C.3
D.4
4.下列说法正确的有(
)
①回归方程适用于一切样本和总体;
②回归方程一般都有时间性;
③样本取值的范围会影响回归方程的适用范围;
④曲线上的点与该点的坐标之间具有相关关系;
⑤将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变.
A.①②③
B.②③④
C.
②③⑤
D.①③⑤
5.
下列四个图各反映两个变量的某种关系,其中可以看作具有较强线性相关关系的是(
)
A.①③
B.①④
C.②③
D.①②④
6.
某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
3
4
5
6
销售额y(万元)
25
30
40
45
根据上表可得回归方程y=bx+a中的b为7,据此模型,若广告费用为10万元,则预计销售额等于(
)
A.42.0万元
B.57.0万元
C.66.5万元
D.73.5万元
7.两个变量与的随机变量X2,下列说法正确的是(
)
A.X2越大,“与有关系”的可信程度越小
B.X2越小,“与有关系”的可信程度越小
C.X2越接近于0,“与无关”程度越小
D.X2越大,“与无关”程度越大
8.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是(
)
A.若统计量X2=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病
B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病
C.若从统计量中求出有95%
的把握认为吸烟与患肺病有关系,是指有5%
的可能性使得推判出现错误
D.以上三种说法都不正确
9.下表是对与喜欢足球与否的统计列联表依据表中的数据,得到(
)
B.
C.
D.
y1
y2
x1
5
15
x2
40
10
10.若两个变量与的列联表为
则与之间有关系的可能性为
( )
A.0.1%
B.99%
C.97.5%
D.0.25%
11.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:
冷漠
不冷漠
总计
多看电视
68
42
110
少看电视
20
38
58
总计
88
80
168
则大约有多大的把握认为多看电视与人变冷漠有关系
(A )
A.99%
B.97.5%
C.95%
D.90%
12.两个分类变量X与Y,值域分别为和,其样本频数分别是a=10,b=21,c+d=35.
若X与Y有关系的可信程度为
,则c=(
)
A.4
B.5
C.6
D.7
二、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中的横线上)
13.
调查某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加____________万元.
14.下面是一个列联表,请填上表中空缺:
15.
已知数组(x1,y1),(x2,y2),…,(x10,y10)满足线性回归方程=bx+a,则“(x0,y0)满足线性回归方程=bx+a”是“x0=,y0=”的
条件.(填“充分不必要,必要不充分,充要”中的一个)
16、对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:
又发作过心脏病
未发作过心脏病
合计
心脏搭桥手术
39
157
196
血管清障手术
29
167
196
合计
68
324
392
试根据上述数据计算=_____,比较这两种手术对病人又发作心脏病的影响有没有差别_____.
三、解答题(本大题共6小题,共70分.解答题应写出文字说明,证明过程或演算步骤)
17.(10分)下面是水稻产量与施肥量的一组观测数据:
施化肥量
15
20
25
30
35
40
45
水稻产量
320
330
360
410
460
470
480
⑴将上表中的数据绘制成散点图;
⑵你能从散点图中发现施化肥量与水稻产量近似成什么关系?水稻产量会一直随施化肥量的增加而增长吗?
18.(12分)
下表是降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对应数据,根据表中提供的数据,若求得y关于x的线性回归方程为y=0.7x+0.35,试求表中m的值.
x
3
4
5
6
y
2.5
m
4
4.5
19.(12分)某种产品的广告费用支出x(万元)与销售额y(万元)
x
2
4
5
6
8
y
30
40
60
50
70
之间有如下的对应数据:
(1)画出散点图;
(2)求回归直线方程;
(3)据此估计广告费用为9万元时,销售收入y的值.
20.
(12分)下表是某个工厂在2013年1-5月份用水量(单位:百吨)的一组数据:
月份x
1
2
3
4
5
用水量y
4.5
4
3
2.5
2
⑴从这5个月中任取2个月,求所取2个月的用水量之和不小于7(百吨)的概率;
⑵根据前4个月的数据,用最小二乘法求y关于x的回归直线方程=bx+a,并用所得的回归直线方程计算5月份的用水量的实际值与估计值之差的绝对值.
21.(12分)对某校小学生进行心理障碍测试得到如下的列联表:
焦虑
说谎
懒惰
总计
女生
5
10
15
30
男生
20
10
50
80
总计
25
20
65
110
试说明在这三种心理障碍中哪一种与性别关系最大?
22.(12分)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,根据已知条件完成下面的列联表,并据此资料你是否认为“体育迷”与性别有关?
参考答案
一、选择题
1.C
2.D
3.
A
4.C
5.
B
6
.
D
7.B
8.
C
9.D
10
.B
11.
A
12.
B
提示:
1.
回归直线必过样本中心,将样本点的中心(4,5)代入验证知=1.23x+0.08符合,故选C.
2.
=,==176,验证知选D.
3.
只有(4)正确,故选A.
6.
由表中数据可知==4.5,==35,故a=-b·=35-7×4.5=3.5,故y=7x+3.5,广告费用为10万元时,预报销售额为7×10+3.5=73.5万元.
7.独立性检验中,X2越大,则两个变量的相关程度越大,X2越小,两个变量的相关程度越小.
9.由.
10.由,所以与之间有关系的可能性为.
11.由题意得,所以有的把握性可断定多看电视与人变冷漠有关系.
二、填空题
13.
0.254
14.52,54,100
15.
必要不充分
16.1.78,不能作出这两种手术对病人又发作心脏病的影响有差别的结论
提示:
14.由题意得.
15.
线性回归方程=bx+a必过点(,),但满足线性回归方程的点不一定是样本数据的平均数(,),因此“(x0,y0)满足线性回归方程=bx+a”是“x0=,y0=”的必要不充分条件.
16.由题意得,所以不能作出这两种手术对病人又发作心脏病的影响有差别的结论.
三、解答题
17.解:⑴散点图如图1所示.
图1
⑵从图中可以发现施肥量与水稻具有相关关系,当施肥量由小到大时,水稻产量由小到大发生变化,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥用量的增加而增长.
18.解:由题意可知,直线y=0.7x+0.35过点(,),又=4.5,代入方程得=3.5,故m=3.
19.解:(1)作出散点图如图2所示.
(2),
,
已知=145,
=1380.
由公式,可求得,,
因此回归直线方程为y=6.5x+17.5;
(3)x=9时,预报y的值为y=9×6.5+17.5=76万元.
20.
解:⑴从这5个月中任取2个月,包含的基本事件有以下10个:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5),
其中所取2个月的用水量之和不小于7(百吨)的基本事件有以下4个:(1,2),(1,3),(1,4),(2,3),
故所求概率P==.
⑵由表中数据计算可得=2.5,=3.5,
所以b==-0.7,a=-b=3.5+0.7×2.5=5.25,
因此回归直线方程为y=-0.7x+5.25.
5月份的用水量的实际值为2(百吨),估计值y1=-0.7×5+5.25=1.75,
所以5月份的用水量的实际值与估计值之差的绝对值为|2-1.75|=0.25.
21.解:对于上述三种心理障碍分别构造三个随机变量、、,
由表中数据可得;
;
.
所以有的把握认为说谎与性别有关,没有充分数据显示焦虑和懒惰与性别有关,故说谎与性别的关系最大.
22.解:频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而列联表如下:
非体育迷
体育迷
合计
男
30
15
45
女
45
10
55
合计
75
25
100
将列联表中的数据代入公式计算得
,
因为,所以没有理由认为“体育迷”与性别有关.
图
1
x
y
O
2
4
6
8
30
50
40
60
70
80
x
y
O
2
4
6
8
30
50
40
60
70
80
图2