第一章综合素质检测
时间120分钟,满分150分。
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.在下列各量之间存在相关关系的是( )
①正方体的体积与棱长间的关系;
②一块农田的水稻产量与施肥量之间的关系;
③人的身高与年龄;
④某户家庭用电量与电价间的关系.
A.①③ B.③④
C.①② D.②③
[答案] D
2.工人月工资(元)依劳动生产率(千元)变化的回归直线方程y=60+90x,下列判断正确的是( )
A.劳动生产率为1 000元时,工资为150元
B.劳动生产率为1 000元时,工资提高150元
C.劳动生产率提高1 000元时,工资平均提高90元
D.劳动生产率为1 000元时,工资为90元
[答案] C
3.如下图所示,4个散点图中,不适合用线性回归模型拟合其中两个变量的是( )
[答案] A
[解析] 题图A中的点不成线性排列,故两个变量不适合线性回归模型.故选A.
4.在建立两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合得最好的模型为( )
A.模型1的相关指数R2为0.75
B.模型2的相关指数R2为0.90
C.模型3的相关指数R2为0.25
D.模型4的相关指数R2为0.55
[答案] B
[解析] 相关指数R2的值越大,意味着残差平方和越小,也就是说模型的拟合效果越好,故选B.
5.身高与体重的关系可以用________来分析.( )
A.残差分析 B.回归分析
C.等高条形图 D.独立性检验
[答案] B
[解析] 身高与体重问题具有线性相关关系,故可用回归分析来分析.
6.预报变量的值与下列的哪些因素有关( )
A.受解释变量的影响,与随机误差无关
B.受随机误差的影响,与解释变量无关
C.与总偏差平方和有关,与残差无关
D.与解释变量和随机误差的总效应有关
[答案] D
[解析] 预报变量既受解释变量的影响,又受随机误差的影响.
7.下列说法正确的有( )
①最小二乘法指的是把各个离差加起来作为总离差,并使之达到最小值的方法;
②最小二乘法是指把各离差的平方和作为总离差,并使之达到最小值的方法;
③线性回归就是由样本点去寻找一条直线,贴近这些样本点的数学方法;
④因为由任何一组观测值都可以求得一个回归直线方程,所以没有必要进行相关性检验.
A.1个 B.2个
C.3个 D.4个
[答案] B
[解析] 最小二乘法是指把各离差的平方和作为总离差,并使之达到最小值的方法,(2)是正确的;线性回归就是由样本点去寻找一条直线,贴近这些样本点的数学方法,这是线性回归的本质,(3)也是正确的.
8.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为=0.66x+1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均收入的百分比约为( )
A.83% B.72%
C.67% D.66%
[答案] A
[解析] 当=7.675时,x=≈9.262,所以≈0.829,故选A.
9.冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中含杂质的关系,调查结果如下表所示:
杂质高
杂质低
旧设备
37
121
新设备
22
202
根据以上数据,则( )
A.含杂质的高低与设备改造有关
B.含杂质的高低与设备改造无关
C.设备是否改造决定含杂质的高低
D.以上答案都不对
[答案] A
[解析] 旧设备中杂质高的频率为≈0.234 2,新设备中杂质高的频率为≈0.098 2,显然两者差距较大,故认为两个分类变量有关系.
10.下面是调查某地区男女中学生是否喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从下图可以看出( )
A.性别与是否喜欢理科无关
B.女生中喜欢理科的比为80%
C.男生比女生喜欢理科的可能性大些
D.男生中喜欢理科的比为60%
[答案] C
[解析] 从图中可以看出,男生喜欢理科的比例为60%,而女生比例为仅为20%,这两个比例差别较大,说明性别与是否喜欢理科是有关系的,男生比女生喜欢理科的可能性更大一些.
11.已知两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35,若“X与Y有关系”的可信程度为90%,则c等于( )
A.4 B.5
C.6 D.7
[答案] B
[解析] 由a=10,b=21,c+d=35可得n=66,d=35-c,a+b=31,a+c=10+c,b+d=56-c,ad=10(35-c),bc=21c.∵“X与Y”有关系的可信度为90%,则随机变量K2的观测值k>2.706,得
>2.706,将选项代入检验,得c=5符合题意.
12.以下关于线性回归的判断,正确的个数是( )
①若散点图中所有点都在一条直线附近,则这条直线为回归直线;
②散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点;
③已知直线方程为=0.50x-0.81,则x=25时,y的估计值为11.69;
④回归直线方程的意义是它反映了样本整体的变化趋势.
A.0 B.1
C.2 D.3
[答案] D
[解析] 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数,得到的直线=bx+才是回归直线,
∴①不对;②正确;
将x=25代入=0.50x-0.81,得=11.69,
∴③正确;④正确,故选D.
二、填空题(本大题共4个小题,每小题4分,共16分,将正确答案填在题中横线上)
13.某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:
年份
2005
2006
2007
2008
2009
收入x
11.5
12.1
13
13.3
15
支出Y
6.8
8.8
9.8
10
12
根据统计资料,居民家庭平均收入的中位数是________,家庭年平均收入与年平均支出有________线性相关关系.(填“正”或“负”)
[答案] 12.6 正
[解析] 找中位数时,将样本数据按大小顺序排列后奇数个时中间一个是中位数,而偶数个时须取中间两数的平均数,由统计资料可以看出,年平均收入增多时,年平均支出也增多,因此两者正相关.
14.在2013年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:
价格x
9
9.5
10
10.5
11
销售量y
11
10
8
6
5
通过分析,发现销售量y对商品的价格x具有线性相关关系,则销售量y对商品的价格x的回归直线方程为________.
[答案] =-3.2x+40
[解析] iyi=392,=10,=8,(xi-)2=2.5,代入公式,得=-3.2,所以,=-=40,故回归直线方程为=-3.2x+40.
15.某小卖部为了了解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:
气温(℃)
18
13
10
-1
杯数
24
34
38
64
由表中数据算得线性回归方程=bx+a中的b≈-2,预测当气温为-5℃时,热茶销售量为________杯.(已知回归系数b=,a=-b)
[答案] 70
[解析] 根据表格中的数据可求得=×(18+13+10-1)=10,=×(24+34+38+64)=40.
∴a=-b=40-(-2)×10=60,∴=-2x+60,当x=-5时,=-2×(-5)+60=70.
16.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:
文艺节目
新闻节目
总计
20至40岁
40
18
58
大于40岁
15
27
42
总计
55
45
100
由表中数据直观分析,收看新闻节目的观众与年龄________.(填“有关”或“无关”)
[答案] 有关
[解析] 因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即=,=,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄有关.
三、解答题(本大题共6个小题,共74分,解答应写出文字说明、证明过程或演算步骤)
17.(本题满分12分)考察黄烟经过培养液处理与是否跟发生青花病的关系.调查了457株黄烟,得到下表中数据,请根据数据作统计分析.
培养液处理
未处理
合计
青花病
25
210
235
无青花病
80
142
222
合计
105
352
457
附:K2=
[解析] 根据公式
K2=≈41.61,
由于41.61>10.828,
说明有99.9%的把握认为黄烟经过培养液处理与是否跟发生青花病是有关系的.
18.(本题满分12分)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在(29.94,30.06)的零件为优质品.从两个分厂生产的零件中抽出500件,量其内径尺寸的结果如下表:
甲厂
分组
[29.86,
29.90)
[29.90,
29.94)
[29.94,
29.98)
[29.98,
30.02)
[30.02,
30.06)
[30.06,
30.10)
[30.10,
30.14)
频数
12
63
86
182
92
61
4
乙厂
分组
[29.86,
29.90)
[29.90,
29.94)
[29.94,
29.98)
[29.98,
30.02)
[30.02,
30.06)
[30.06,
30.10)
[30.10,
30.14)
频数
29
71
85
159
76
62
18
(1)试分别估计两个分厂生产的零件的优质品率;
(2)由于以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.
甲厂
乙厂
合计
优质品
非优质品
合计
附:k2=,
[解析] (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为=72%;
乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为=64%.
(2)
甲厂
乙厂
合计
优质品
360
320
680
非优质品
140
180
320
合计
500
500
1 000
K2=≈7.35>6.635,
所以有99%的把握认为“两个分厂生产的零件的质量有差异”.
19.(本题满分12分)在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为
价格x
14
16
18
20
22
需求量y
12
10
7
5
3
求出y对x的回归直线方程,并说明拟合效果的好坏.
[解析] =(14+16+18+20+22)=18,
=×(12+10+7+5+3)=7.4,
x=142+162+182+202+222=1660,
y=122+102+72+52+32=327,
xiyi=14×12+16×10+18×7+20×5+22×3=620,
==-1.15.
∴=7.4+1.15×18=28.1.
∴回归直线方程为=-1.15x+28.1.
列出残差表为:
yi-i
0
0.3
-0.4
-0.1
0.2
yi-
4.6
2.6
-0.4
-2.4
-4.4
∴ (yi-i)2=0.3,(yi-)2=53.2,
∴R2=0.994.因而拟合效果较好!
20.(本题满分12分)某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从该部门内随机抽选了10个企业为样本,有如下资料:
产量x(千件)
生产费用(千元)
40
150
42
140
48
160
55
170
65
150
79
162
88
185
100
165
120
190
140
185
(1)计算x与y的相关系数;
(2)对这两个变量之间是否线性相关进行检验;
(3)设回归方程为=x+,求回归系数.
[解析] 根据数据可得:
=77.7,=165.7, x=70903,y=277119,
xiyi=132938,所以r=0.808,
即x与y之间的相关系数r≈0.808;
(2)因为r>0.75,所以可认为x与y之间具有线性相关关系;
(3)=0.398,=134.8.
21.(本题满分12分)对不同的麦堆测得如下表6组数据:
堆号
1
2
3
4
5
6
重量y(斤)
2 813
2 705
11 103
2 590
2 131
5 181
跨度x(m)
3.25
3.20
5.07
3.14
2.90
4.02
已知y与x具有线性相关关系,求出重量与跨度的回归方程.
[解析] xi=21.58,yi=26523,
x=80.9374,
y=176598625.
xiyi=109230.58.
≈-10562.7.
所求回归方程为=4165.85x-10562.7.
22.(本题满分14分)电视传媒公司为了解某地区观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.
(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?
非体育迷
体育迷
合计
男
女
合计
(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.
附:K2=
[解析] (1)由频率分布直方图可知,在抽取的100人中,“体育迷”为25人,从而完成2×2列联表如下:
非体育迷
体育迷
合计
男
30
15
45
女
45
10
55
合计
75
25
100
将2×2列联表中的数据代入公式计算,得
K2==
=≈3.030.
因为3.030<3.841,所以我们没有理由认为“体育迷”与性别有关.
(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的集合为
Ω={(a1,a2),(a1,a3),(a2,a3),(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)}
其中ai表示男性,i=1,2,3,bj表示女性,j=1,2.
Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.
用A表示“任选2人中,至少有1人是女性”这一事件,则A={(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)},
事件A由7个基本事件组成,因而P(A)=.
[点评] 本题考查了频率分布直方图,独立性检验,古典概型,解决这类题目的关键是对题意准确理解.
1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由K2=算得,K2=≈7.8.
附表:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
参照附表,得到的正确结论是( )
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
[答案] A
[解析] 根据独立性检验的定义,由K2≈7.8>6.635可知,有99%以上把握认为“爱好该项运动与性别有关”.
2.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
[答案] 0.254
[解析] 由回归直线方程为=0.254x+0.321知收入每增加1万元,饮食支出平均增加0.254万元.
3.对某校小学生进行心理障碍测试,得到如下列联表(单位:名):
性别与心理障碍列联表
焦虑
说谎
懒惰
总计
女生
5
10
15
30
男生
20
10
50
80
总计
25
20
65
110
试说明三种心理障碍分别与性别的关系如何.(我们规定:如果随机变量K2的观测值k<2.706,就认为没有充分的证据显示“两个分类变量有关系”)
[解析] 对三种心理障碍焦虑、说谎、懒惰分别构造三个随机变量K,K,K,由题中数据可得:
K的观测值k1=≈0.862 7<2.70 6,
K的观测值为k2=
≈6.366>5.024,
K的观测值为k3=
≈1.410<2.706.
所以样本数据没有充分的证据显示焦虑与性别有关,有97.5%的把握认为说谎与性别有关,样本数据没有充分的证据显示懒惰与性别有关.
4.为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x、物理成绩y进行分析.下面是该生7次考试的成绩:
数学
88
83
117
92
108
100
112
物理
94
91
108
96
104
101
106
(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明;
(2)已知该生的物理成绩y与数学成绩x是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理性建议.
[解析] (1)=100+=100;
=100+=100;
∴s==142,s=,
从而s>s,∴物理成绩更稳定.
(2)由于x与y之间具有线性相关关系,根据回归系数公式得到
==≈0.5,
=-=100-0.5×100=50,
∴回归直线方程为=0.5x+50.
当y=115时,x=130,即该生物理成绩达到115分时,他的数学成绩大约为130分.建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.