章末检测(三) 统计案例
时间:120分钟 满分:150分
第Ⅰ卷(选择题,共60分)
一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下列两个变量之间的关系不是函数关系的是( )
A.角度和它的余弦值
B.正方形的边长和面积
C.正n边形的边数和内角和
D.人的年龄和身高
解析:函数关系就是一种变量之间的确定性的关系.A、B、C三项都是函数关系,甚至可以写出它们的函数表达式,分别为f(θ)=cos θ,g(a)=a2,h(n)=nπ-2π.D项不是函数关系,对于年龄确定的人群,仍可以有不同的身高.
答案:D
2.对两个变量进行独立性检验的主要作用是( )
A.判断模型的拟合效果
B.对两个变量进行相关分析
C.给出两个变量有关系的可靠程度
D.估计预报变量的平均值
解析:独立性检验的目的就是明确两个变量有关系的可靠程度.
答案:C
3.设有一个线性回归方程为y=2-1.5x,则变量x每增加一个单位时( )
A.y平均增加1.5个单位
B.y平均增加2个单位
C.y平均减少1.5个单位
D.y平均减少2个单位
解析:y1-y2=2-1.5(x+1)-2+1.5x=-1.5.
答案:C
4.若线性回归方程中的回归系数b=0,则相关系数为( )
A.r=1 B.r=-1
C.r=0 D.无法确定
解析:当b=0时,即=0?iyi-n =0,
∴r==0.
答案:C
5.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )
A.y=-10x+200 B.y=10x+200
C.y=-10x-200 D.y=10x-200
解析:由于销售量y与销售价格x成负相关,故排除B、D.又当x=10时,A中y=100,而C中y=-300,C不符合题意,故选A.
答案:A
6.利用独立性检验来考察两个变量A和B是否有关系时,通过查阅下表来确定断言“A与B有关系”的可信程度.如果χ2>5.024,那么就有把握认为“A与B有关系”的百分比为( )
P(χ2≥k0)
0.50
0.40
0.25
0.15
0.10
k0
0.455
0.708
1.323
2.072
2.706
P(χ2≥k0)
0.05
0.025
0.010
0.005
0.001
k0
3.841
5.024
6.635
7.879
10.828
A.25% B.75%
C.2.5% D.97.5%
解析:由表可知χ2>5.024,所以有97.5%的把握认为“A与B有关系”.
答案:D
7.两个变量A,B的2×2列联表如下所示:
B
A
B1
B2
A1
39
157
A2
29
167
计算χ2的值约为( )
A.1.78 B.2.79
C.3.04 D.5.36
解析:χ2=
≈1.78.
答案:A
8.两个相关变量满足如下关系:
x
10
15
20
25
30
y
1 003
1 005
1 010
1 011
1 014
则两变量的线性回归方程为( )
A.y=0.56x+997.4 B.y=0.63x-231.2
C.y=50.2x+501.4 D.y=60.4x+400.7
解析:利用公式b=≈0.56,
a=-b≈997.4,
∴线性回归方程为y=0.56x+997.4.
答案:A
9.某学校开展研究性学习活动,某同学获得一组实验数据如下表:
x
1.99
3
4
5.1
6.12
y
1.5
4.04
7.5
12
18.01
对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是( )
A.y=2x-2 B.y=x
C.y=log2x D.y=(x2-1)
解析:对于A:y=2x-2为直线,不符合要求;
对于B:y=x单调递减,不符合要求;
对于C:增长缓慢,也不符合要求;
将表中数据代入D中,基本符合要求.
答案:D
10.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )
A.r2<r1<0 B.0<r2<r1
C.r2<0<r1 D.r2=r1
解析:由线性相关系数公式知
r= .
∵==11.72,==3,
Xi=Ui(i=1,2,…,5),Yi=V6-i(i=1,2,…,5),
∴
= .
令(Xi-)(Yi-)=A,则
A=(10-)(1-)+(11.3-)(2-)+(11.8-)(3-)+(12.5-)(4-)+(13-)(5-),
令(Ui-)(Vi-)=B,则
B=(10-)(5-)+(11.3-)(4-)+(11.8-)(3-)+(12.5-)(2-)+(13-)(1-),
∴A>0,B<0,∴r1>0,r2<0.
答案:C
11.对变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是( )
A.由样本数据得到的回归直线y=bx+a必过样本中心(,)
B.样本相关系数绝对值越接近于1,两变量线性相关性越强
C.样本相关系数越接近于0,两变量线性相关性越强
D.若变量y与x之间的相关系数为r=-0.936 2,则变量y与x之间具有线性相关关系
解析:回归方程必过样本中心(,),A正确;由回归分析知识知B正确,C错误;由|r|=0.936 2,说明y和x之间具有很强的线性相关关系,D正确.故选C.
答案:C
12.对于两个分类变量Ⅰ和Ⅱ,其2×2列联表中,已知a=10,b=21,c+d=35,若Ⅰ和Ⅱ有关系的可信度为90%,则c等于( )
A.3 B.4
C.5 D.7
解析:χ2=
=,
当c=3时,χ2=≈5.831>3.841,可信度为95%;
当c=4时,χ2=≈4.268>3.841,可信度为95%;
当c=5时,χ2=≈3.024>2.706,可信度为90%;
当c=7时,χ2=≈1.292<2.706,可信度小于90%.故选C.
答案:C
第Ⅱ卷(非选择题,共90分)
二、填空题(本大题共4小题,每小题4分,共16分,把答案填在题中横线上)
13.已知回归直线方程为y=0.50x-0.81,则x=25时,y的估计值为________.
解析:y=0.50×25-0.81=11.69.
答案:11.69
14.图书馆想知道每天使用图书馆的人数x(百人)与借出的书的本数y(百本)之间的关系,已知上个月图书馆共开放25天,且得到下列数据:i=200,i=300,=1 660,iyi=2 436,若y与x线性相关,则y对x的线性回归方程为________________.
解析:==8,==12,所以 =96.
所以b====0.6.
所以a=-b=12-0.6×8=7.2.
所以y=7.2+0.6x.
答案:y=7.2+0.6x
15.在对某小学的学生进行吃零食的调查中,得到如下表数据:
吃零食
不吃零食
总计
男学生
24
31
55
女学生
8
26
34
总计
32
57
89
根据上述数据分析,我们得出的χ2=________.
解析:独立性检验χ2=≈3.689.
答案:3.689
16.有两个变量x和y,它们的值域分别为{x1,x2}和{y1,y2},其样本列联表如下:
y1
y2
总计
x1
132
18
150
x2
114
36
150
总计
246
54
300
则变量x和y有关系的可信度为________.
解析:由公式得χ2=≈7.317,因为7.317>6.635,所以有99%的把握认为变量x与y有关系.
答案:99%
三、解答题(本大题共6小题,共74分,解答时应写出必要的文字说明、证明过程或演算步骤)
17.(12分)某省七年的国民生产总值及社会商品零售总额如下表所示:
年份
2000
2001
2002
2003
2004
2005
2006
国民生产
总值(亿元)
396.26
442.04
517.77
625.10
700.83
792.54
858.47
社会商品零
售总额(亿元)
205.82
227.95
268.66
337.52
366.00
375.11
413.18
已知国民生产总值与社会商品零售总额之间存在线性关系,请建立线性回归方程.
解析:设国民生产总值为x,社会商品零售总额为y,线性回归方程为y=bx+a.
计算得=619.001,=313.463.
则根据公式可得
b==0.446,
a=-b=37.389.
所以所求线性回归方程为y=0.446x+37.389.
18.(12分)打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据:
患心脏病
未患心脏病
总计
每一晚都打鼾
30
224
254
不打鼾
24
1 355
1 379
总计
54
1 579
1 633
根据列联表的独立性检验,能否在犯错误的概率不超过0.001的前提下认为每一晚都打鼾与患心脏病有关系?
解析:由列联表中的数据,
得χ2=≈68.033>10.828.
因此,在犯错误的概率不超过0.001的前提下,可以认为每一晚都打鼾与患心脏病有关系.
19.(12分)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)
表1:注射药物A后皮肤疱疹面积的频数分布表
疱疹面积
[60,65)
[65,70)
[70,75)
[75,80)
频数
30
40
20
10
表2:注射药物B后皮肤疱疹面积的频数分布表
疱疹面积
[60,65)
[65,70)
[70,75)
[75,80)
[80,85)
频数
10
25
20
30
15
完成下面2×2列联表,能否在犯错误概率不超过0.01的前提下,认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”?
表3
疱疹面积小于70 mm2
疱疹面积不小于70 mm2
总计
注射药物A
a=
b=
注射药物B
c=
d=
总计
n=
解析:列出2×2列联表
疱疹面积小于70 mm2
疱疹面积不小于70 mm2
总计
注射药物A
a=70
b=30
100
注射药物B
c=35
d=65
100
总计
105
95
n=200
χ2=≈24.56,由于χ2>6.635,所以有99 %的把握认为两者有关系,或者说在犯错误概率不超过0.01的前提下,认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.
20.(12分)某企业的某种产品产量与单位成本数据如下表:
产量x(千件)
2
3
4
3
4
5
单位成本
y(元/件)
73
72
71
73
69
68
(1)试确定回归直线及相关系数r;
(2)指出产量每增加1千件时,单位成本下降多少;
(3)产量为6千件时,单位成本是多少?单位成本为70元时,产量应为多少?
解析:(1)i=21,i=426,=79,=30 268,
iyi=1 481,=3.5,=71,
b===
≈-1.818,
a=-b=71+1.818×3.5=77.363,
∴回归方程为y=77.363-1.818x.
r=
=
==-≈-0.91.
(2)产量每增加1千件时单位成本下降1.818元.
(3)当x=6千件时,y=66.455元;
当y=70元时,x≈4.05千件.
21.(12分)甲乙两个班级进行数学考试,按照“大于等于85分为优秀,85分以下为非优秀”统计成绩后,得到如下的列联表:
优秀
非优秀
总计
甲班
10
乙班
30
总计
105
已知在全部105人中随机抽取1人为优秀的概率为.
(1)请完成上面的列联表;
(2)根据列联表的数据,若按95%的可靠性要求,能否认为“成绩与班级有关系”?
(其中χ2=,n=a+b+c+d)
P(χ2≥k0)
0.10
0.05
0.025
0.010
0.05
k0
2.706
3.841
5.024
6.635
7.879
解析:(1)由题意可知,优秀的总人数为105×=30,
所以可得列联表为:
优秀
非优秀
总计
甲班
10
45
55
乙班
20
30
50
总计
30
75
105
(2)根据列联表中的数据,得到
χ2=≈6.109>3.841.
因此有95%的把握认为“成绩与班级有关系”.
22.(14分)某地区不同身高的未成年男性的体重平均值如下表所示:
身高x(cm)
60
70
80
90
100
110
体重y(kg)
6.13
7.90
9.99
12.15
15.02
17.50
身高x(cm)
120
130
140
150
160
170
体重y(kg)
20.92
26.86
31.11
38.85
47.25
55.05
试建立体重y与身高x之间的回归方程.
解:根据已知表中的数据画出散点图,如图所示.
由图可看出,样本点分布在某条指数曲线y=c1ec2x的周围,于是可令z=ln y,那么有
x
60
70
80
90
100
110
z
1.81
2.07
2.30
2.50
2.71
2.86
x
120
130
140
150
160
170
z
3.04
3.29
3.44
3.66
3.86
4.01
作出上表中数据的散点图,如图所示:
由表中数据可得z与x之间的线性回归方程为z=0.693+0.020x,
即y与x之间的回归方程为y=e0.693+0.020x.
课件10张PPT。