技能演练
基 础 强 化
1.一项研究要确定是否能够根据施肥量预测作物的产量,这里的解释变量是( )
A.作物的产量
B.施肥量
C.试验者
D.降雨量或其他解释产量的变量
解析 作物的产量为预报变量,故施肥量为解释变量.
答案 B
2.下列说法正确的有( )
①回归方程适用于一切样本和总体;
②回归方程一般都有时间性;
③样本取值的范围会影响回归方程的适用范围;
④回归方程得到的预报值是预报变量的精确值.
A.①② B.①③
C.②③ D.③④
解析 ①回归方程只适用于我们研究的样本和总体.②我们所建立的回归方程一般都有时间性.③样本取值的范围会影响回归方程的适用范围.④回归方程得到的预报值是预报变量的可能取值的平均值,并非准确值,故②③正确.
答案 C
3.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为=7.19x+73.93,用这个模型预测这孩子10岁时的身高,则正确的叙述是( )
A.身高一定是145.83 cm
B.身高在145.83 cm以上
C.身高在145.83 cm以下
D.身高在145.83 cm左右
答案 D
4.对两个变量y与x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是( )
A.由样本数据得到的回归方程=bx+a必过样本中心(,)
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好
D.若变量y与x之间的相关系数为r=-0.9362,则变量y和x之间具有线性相关关系
答案 C
5.已知回归直线方程中斜率的估计值为1.23,样本点的中心(4,5),则回归直线方程为( )
A.=1.23x+0.08
B.=0.08x+1.23
C.=1.23x+4
D.=1.23x+5
解析 回归直线方程过样本点的中心,把点(4,5)代入A项成立.
答案 A
6.若一个样本的总偏差平方和为80,残差平方和为60,则相关指数R2为( )
A. B.
C. D.
解析 回归平方和=总偏差平方和-残差平方和=80-60=20,故R2==.
答案 D
7.若施化肥量x与水稻产量y的回归直线方程为=5x+250,当施化肥量为80kg时,预报水稻产量为___________________.
解析 当x=80 kg时,=5×80+250=650 kg.
答案 650 kg
8.在两个变量的回归分析中,作散点图的目的是①__________,②__________.
答案 判断两个变量是否线性相关;判断两个变量更近似于什么函数关系
能 力 提 升
9.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )
A.83% B.72%
C.67% D.66%
解析 将y=7.675代入回归方程,可计算得x≈9.26,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.
答案 A
10.某调查者从调查中获知某公司近年来科研费用支出(xi)万元与公司所获得利润(yi)万元的统计资料如下表:
序号
科研费用支出xi
利润yi
xiyi
x
1
5
31
155
25
2
11
40
440
121
3
4
30
120
16
4
5
34
170
25
5
3
25
75
9
6
2
20
40
4
合计
30
180
1000
200
则利润(yi)对科研费用支出(xi)的线性回归方程为( )
A.=2x+20 B.=20x+2
C.=-20x+40 D.=2x+40
解析 方法1:把表中数据代入公式求解得线性回归方程为=2x+20.
方法2:求得样本中心点=5,=30,代入A知成立.
答案 A
11.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:
零件的个数x(个)
2
3
4
5
加工的时间y(小时)
2.5
3
4
4.5
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y关于x的线性回归方程=x+,并在坐标系中画出回归直线;
(3)试预测加工10个零件需要多少时间?
(注:=,=- )
解 (1)散点图如图所示.
(2)由表中数据得iyi=52.5,=3.5,=3.5,
=54,
∴=0.7.
∴=1.05.
∴=0.7x+1.05.
回归直线如图中所示.
(3)将x=10代入回归直线方程,得y=0.7×10+1.05=8.05(小时),
∴预测加工10个零件需要8.05小时.
品 味 高 考
12.对变量x,y有观测值(xi,yi)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
解析 夹在带状区域内的点,总体呈上升趋势的属于正相关;反之,总体呈下降趋势的属于负相关.由图易知选C.
答案 C
技能演练
基 础 强 化
1.下列关于K2的说法正确的是( )
A.K2在任何相互独立问题中都可以用来检验有关还是无关
B.K2的值越大,两个事件的相关性越大
C.K2是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合
D.K2的观测值的计算公式为
K2=
解析 A中K2的使用范围是四个数据中每个数据都必须大于5,故A错;B中过于确定,不正确;C正确;D中公式有错.
答案 C
2.下面是一个2×2列联表
y1
y2
合计
x1
a
21
73
x2
2
25
27
合计
b
46
100
则表中a、b处的值分别为( )
A.94、96 B.52、50
C.52、54 D.54、52
解析 由a+21=73,得a=52,
由b+46=100,得b=54.
答案 C
3.观察下列各图,其中两个分类变量x,y之间关系最强的是( )
解析 在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强,故选D.
答案 D
4.考察棉花种子经过处理跟生病之间的关系得到如下表数据:
种子处理
种子未处理
合计
生病
32
101
133
不生病
61
213
274
合计
93
314
407
根据以上数据,则( )
A.种子经过处理跟是否生病有关
B.种子经过处理跟是否生病无关
C.种子是否经过处理决定是否生病
D.以上都是错误的
解析 方法1:计算K2=
≈1.678.
∴K2<2.706,故可判断种子经过处理与是否生病无关,应选B.
方法2:=≈0.2406,=≈0.2226.
∵与相差较小,
∴可以认为种子经过处理跟是否生病无关.
答案 B
5.分类变量x和y的列联表如下,则( )
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
A.ad-bc越小,说明x与y的关系越弱
B.ad-bc越大,说明x与y的关系越弱
C.(ad-bc)2越大,说明x与y的关系越强
D.(ad-bc)2越小,说明x与y的关系越强
解析 由K2=知,(ad-bc)2越大,K2值越大,说明x与y的关系越强.
答案 C
6.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:
认为作业多
认为作业不多
总数
喜欢玩电脑游戏
18
9
27
不喜欢玩电脑游戏
8
15
23
总数
26
24
50
则认为喜欢玩电脑游戏与认为作业多少有关系的把握大约为( )
A.99% B.95%
C.90% D.无充分依据
解析 由表中数据计算
K2=≈5.059,
而K2=5.059>3.841,所以约有95%的把握认为两变量之间有关.
答案 B
7.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
专业
性别
非统计专业
统计专业
男
13
10
女
7
20
为了判断主修统计专业是否与性别有关系,根据表中数据得到,
k=≈4.844,因为k>3.841,所以确定主修统计专业与性别有关系,那么这种判断出错的可能性为__________.
解析 ∵k=4.844>3.841,∴有95%的把握可以确定主修统计专业与性别有关,那么这种判断出错的可能性为5%.
答案 5%
8.某大学在研究性别与职称(分正教授,副教授)之间是否有关系,你认为应该收集的数据是__________.
答案 男正教授人数,男副教授人数,女正教授人数,女副教授人数
能 力 提 升
9.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定断言“X和Y有关系”的可信度.如果k>5.024,那么就有把握认为“X和Y有关系”的百分比为__________.
P(K2>k)
0.50
0.40
0.25
0.15
0.10
k
0.455
0.708
1.323
2.072
2.706
P(K2>k)
0.05
0.025
0.01
0.005
0.001
k
3.841
5.024
6.635
7.879
10.83
解析 由表中数据可知,当k>5.024时,出错的可能性占0.025,故有把握认为“X和Y有关系”的百分比为97.5%.
答案 97.5%
10.调查某班学生,按性别和籍贯分类得调查表如下:
天津
非天津
合计
男
12
28
40
女
6
19
25
合计
18
47
65
性别对籍贯的影响中,可信度小于__________.
解析 k=≈0.277
∵0.277<0.455,∴查表可知小于0.50.
答案 50%
11.在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动,你能否判断性别与休闲方式是否有关系?
解 首先建立列联表如下
休闲方式为看电视
休闲方式为运动
合计
女性
43
27
70
男性
21
33
54
合计
64
60
124
∵a=43,b=27,a+b=70,c=21,d=33,c+d=54,
a+b+c+d=124,a+c=64,b+d=60,
∴k=
=≈6.201>5.024,
即有97.5%的把握认为休闲方式与性别有关.
品 味 高 考
12.(2010·新课标)为了调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
性别
是否需要志愿者
男
女
需要
40
30
不需要
160
270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关;
(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由?
附:
K2=
解 (1)调查的500位老年人中,有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为=14%.
(2)K2=≈9.967.
由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.
(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据可以看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异.因此,在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,并采用分层抽样方法比采用简单随机抽样方法更好.