黑龙江省绥化市第九中学2013届高二文科数学《回归分析的基本思想及其初步应用》训练AB卷

文档属性

名称 黑龙江省绥化市第九中学2013届高二文科数学《回归分析的基本思想及其初步应用》训练AB卷
格式 zip
文件大小 169.5KB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2012-02-19 21:38:26

图片预览

文档简介

黑龙江省绥化第九中学2013届高二文科数学《回归分析的基本思想及其初步应用》训练AB卷
命题人:卢军
一选择题:
1.下面两个变量间的关系不是函数关系的是( D )
A. 正方体的棱长与体积
B.角的度数与它的正弦值
C.单产为常数时,土地面积与粮食总产量
D.日照时间与水稻的亩产量
2.相关系数度量 (A )
A.两个变量之间线性相关关系的强度
B.散点图是否显示有意义的模型
C.两个变量之间是否存在因果关系
D.两个变量之间是否存在关系
3. 下列说法正确的是( D )
A.任何两个变量都具有相关关系;      
B.球的体积与该球的半径具有相关关系;
C.农作物的产量与施化肥量之间是一种确定性关系;
D.一个学生的数学成绩与物理成绩之间是一种非确定性的关系。
4. 由一组样本数据,得到回归直线方程,那么下面说法不正确的是( B )
A.直线必经过;
B.直线至少经过中的一个点;
C.直线的斜率为;
D.直线的纵截距为
5. .在一次试验中,测得的四组值分别是,则与之间的回归直线方程为( A )
A.  B.  C.  D.
工人月工资(元)依劳动生产率(千元)变化的回归直线方程为,下列判断正确的是( C )
(A)劳动生产率为1000元时,工资为50元 (B)劳动生产率提高1000元时,工资提高150元
(C)劳动生产率提高1000元时,工资提高90元 (D)劳动生产率为1000元时,工资为90元
6.变量、的散点图如图所示,那么、之间的样本相关关系系数的最接近的值为 ( D )
A.1 B.-0.5   C.0 D.0.5
7. 有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适.②相关指数R2来刻画回归的效果, R2值越大,说明模型的拟合效果越好.③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.其中正确命题的个数是 ( D )
A.0 B.1 C.2 D.3
8. 下列说法中正确的有:
①若r>0,则x增大时,y也相应增大;
②若r<0,则x增大时,y也相应增大;
③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个点均在一条直线上 ( C )
A.①② B.②③ C.①③ D.①②③
9. 甲、乙、丙、丁四位同学各自对A、B两变量的线性 相关性作试验,并用回归分析方法分别求得相关系
数r与残差平方和m如下表:
甲 乙 丙 丁
r 0.82 0.78 0.69 0.85
m 115 106 124 103
则哪位同学的试验结果体现A、B两变量更强的线性相关性? (D )
A.甲 B.乙 C.丙 D.丁
10. .已知x、y之间的数据如表所示,则回归直线过点 ( D)
x 1.08 1.12 1.19 1.28
y 2.25 2.37 2.40 2.55
A.(0,0) B.( ,0) C.(0, ) D.( ,
11. 在对两个变量x、y进行线性回归分析时一般有下列步骤:
①对所求出的回归方程作出解释;②收集数据;③求线性回归方程;
④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可靠性要求能够判定变量x、y具有线性相关性,则在下列操作顺序中正确的是( D )
A.①②⑤③④ B.③②④⑤① C.②④③①⑤ D.②⑤④③①
12. 为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
父亲身高x(cm) 174 176 176 176 178
儿子身高y(cm) 175 175 176 177 177
则y对x的线性回归方程为C
A.y = x-1 B.y = x+1 C.y = 88+ D.y = 176
13. 某产品的广告费用x与销售额y的统计数据如下表
广告费用(万元) 4 2 3 5
销售额(万元) 49 26 39 54
根据上表可得回归方程中的为9.4,据此模型预报广告费用为6万元时销售额为B
(A)63.6万元 (B)65.5万元 (C)67.7万元 (D)72.0万元
14. 设,…,是变量和的个样本点,直线是由这些样本点通过最小二乘法得到的线性回归方程(如图),以下结论中正确的是 ( D )
(A)和的相关系数为直线的斜率
(B)和的相关系数在0到1之间
(C)当为偶数时,分布在两侧的样本点的个数一定相同
(D)直线过点
二、填空题:
15. 对于一组数据的两个函数模型,其残差平方和分别为153.4 和200,若从中选取一个拟合程度较好的函数模型,应选残差平方和为______的那个153.4
16. 若有一组数据的总偏差平方和为120,相关指数为0.6,则回归平方和为______72
17. 若一组观测值(x1,y1)(x2,y2)…(xn,yn)之间满足yi=bxi+a+ei (i=1、2. …n)若ei恒为0,则R2为 1
18. 在研究身高和体重的关系时,求得相关指数_______,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”所以身高对体重的效应比随机误差的效应大得多。0.64
19. (2012年石家庄市高中毕业班教学质量检测 (一) 文科数学14小题)
经调查某地若干户家庭的年收入 (万元)和年饮食支出(万元)具有线性相关关系,并得到关于的线性回归直线方程:=0.245+0.321,由回归直线方程可知,家庭年收入每增加l万元,年饮食支出平均增加 万元.0.245
20.
15. 某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:
日 期 12月1日 12月2日 12月3日 12月4日 12月5日
温差(°C) 10 11 13 12 8
发芽数(颗) 23 25 30 26 16
该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.
(1)求选取的2组数据恰好是不相邻2天数据的概率;
(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程;
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠
解:(1)设抽到不相邻两组数据为事件,因为从5组数据中选取2组数据共有10种情况,每种情况都是等可能出现的,其中抽到相邻两组数据的情况有4种,
所以 .
答:略.
(2)由数据,求得.
由公式,求得,.
所以y关于x的线性回归方程为.
(3)当x=10时,,|22-23|<2;
同样,当x=8时,,|17-16|<2.
所以,该研究所得到的线性回归方程是可靠的.
16.已知z,y之间的一组数据如下表:
x 1 3 6 7 8
y 1 2 3 4 5
(1)从x ,y中各取一个数,求x+y≥10的概率;
(2)对于表中数据,甲、乙两同学给出的拟合直线分别为与,试利用“最小平方法(也称最小二乘法)”判断哪条直线拟合程度更好.
解:(1)从x,y各取一个数组成数对(x ,y),共有25对,
其中满足的有,共9对…5分
故所求概率为,所以使的概率为.
(2)用作为拟合直线时,所得值与的实际值的差的平方和为

用作为拟合直线时,所得值与的实际值的差的平方和为

,故用直线拟合程度更好.
17.在某种产品表面进行腐蚀性试验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:
时间t(s) 5 10 15 20 30 40 50 60 70 90 120
深度y(μm) 6 10 10 13 16 17 19 23 25 29 46
(1)画出散点图;
(2)求腐蚀深度y对腐蚀时间t的回归直线方程.
解:(1)散点图为
(2)经计算可得
b=≈0.3,
a=-b=19.45-0.3×46.36≈5.542.
故所求的线性回归方程为=0.3t+5.542.
18.已知某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜年平均产量yt之间的关系有如下数据:
年份 1985 1986 1987 1988 1989 1990 1991 1992
x(kg) 70 74 80 78 85 92 90 95
y(t) 5.1 6.0 6.8 7.8 9.0 10.2 10.0 12.0
年份 1993 1994 1995 1996 1997 1998 1999
x(kg) 92 108 115 123 130 138 145
y(t) 11.5 11.0 11.8 12.2 12.5 12.8 13.0
(1)求x与y之间的相关系数,并检验是否线性相关;
(2)若线性相关,求蔬菜产量y与使用氮肥量之间的回归直线方程,并估计每单位面积施肥150kg时,每单位面积蔬菜的年平均产量。
分析:(1)使用样本相关系数计算公式来完成;(2)查表得出显著性水平0.05与自由度15-2相应的相关系数临界比较,若则线性相关,否则不线性相关。
解:(1)列出下表,并用科学计算器进行有关计算:]
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
70 74 80 78 85 92 90 95 92 108 115 123 130 138 145
5.1 6.0 6.8 7.8 9.0 10.2 10.0 12.0 11.5 11.0 11.8 12.2 12.5 12.8 13.0
357 444 544 608.4 765 938.4 900 1140 1058 1188 1357 1500.6 1625 1766.4 1885
,,
,,。故蔬菜产量与放用氮肥量的相关系数

由于n=15,故自由度15-2=13。由相关系数检验的临界值表查出与显著水平0.05及自由度13相关系数临界值,则,从而说明蔬菜产量与氮肥量之间存在着线性相关关系。
(2)设所求的回归直线方程为,则,

∴回归直线方程为。
19.假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:
x 2 3 4 5 6
y 2.2 3.8 5.5 6.5 7.0
若由资料可知y对x呈线性相关关系。试求:
(1)线性回归方程;
(2)估计使用年限为10年时,维修费用是多少?
分析:本题为了降低难度,告诉了y与x间呈线性相关关系,目的是训练公式的使用。
解:(1)列表如下:
i 1 2 3 4 5
2 3 4 5 6
2.2 3.8 5.5 6.5 7.0
4.4 11.4 22.0 32.5 42.0
4 9 16 25 36
,,
于是,

∴线性回归方程为:。
(2)当x=10时,(万元)
即估计使用10年时维修费用是12.38万元。
20.19世纪未,德国统计学家恩格尔根据统计资料,对消费结构变化得出一个规律:一个家庭收入越少,家庭收入中(或总支出中)用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中(或总支出中)用来购买食物的支出会下降。推而广之,一个国家越穷,每个国民的平均收入中(或平均支出中)用于购买食物的支出所占的比例就越大,随着国家的富裕,这个比例呈下降趋势。恩格尔系数是根据恩格尔定律得出的比例系数,是表示生活水平高低的一个指标,其计算公式为:。
在我国,判定生活发展阶段的标准是:贫困>60%,温饱,小康,富裕<40%.根据国家统计局统计显示,随着中国经济的不断增长,城镇居民家庭的恩格尔系数不断下降,居民消费已从温饱型向享受型、发展型转变。如下表所示:
恩格尔系数(%) 57.5 54.2 53.8 50.0 48.8 44.7 39.4 37.7 37.1
年 份 1978 1990 1992 1994 1996 1998 2000 2002 2003
求:(1)根据年份预报恩格尔系数的回归方程;
(2)预报2007年的恩格尔系数;
(3)求相关指数;
(4)作出残差图。
解:(1)散点图如下图所示:
并由最小二乘法求得线性回归方程为:
(2)由线性回归方程可知,2007年的恩格尔系数为:
(3)
(4)列出编与残差图表如下:
编 号 1 2 3 4 5 6 7 8 9
年 份 1978 1990 1992 1994 1996 1998 2000 2002 2003
恩格尔系数(%) 57.5 54.2 53.8 50.0 48.8 44.7 39.4 37.7 37.1
残 差 -4.6 2.9 4.3 2.3 2.9 0.6 -2.9 -2.8 -2.5
由上表可得残差图如下图所示:
21.为了研究某种细菌随时间x变化,繁殖的个数,收集数据如下:
天数x/天 1 2 3 4 5 6
繁殖个数y/个 6 12 25 49 95 190
用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图
描述解释变量与预报变量之间的关系,计算残差、相关指数R2.
解:(1)散点图如下图:
(2)由散点图看出样本点分布在一条指数函数y=的周围,于是令Z=lny,则
x 1 2 3 4 5 6
Z 1.79 2.48 3.22 3.89 4.55 5.25
由计数器算得 则有
(3)
6.06 12.09 24.09 48.04 95.77 190.9
y 6 12 25 49 95 190
==3.1643 ==25553.3
R2=1-=0.9999.
即解释变量天数对预报变量繁殖细菌得个数解释了99.99%.
22.10名同学在高一和高二的数学如下表;
x 74 71 68 76 73 67 70 65 74 72
y 76 75 70 76 79 65 77 62 72 71
其中x为高一数学成绩,y为高二数学成绩.
(1)判断y与x是否具有相关关系;
(2)如果y与x是相关关系,求回归直线方程.
解:(1)由已知表格中的数据,利用计算器进行计算得
,,,,,,.
=
≈0.780297
由于,由0.780297>0.75知,有很大的把握认为与之间具有线性相关关系.
(2) 与具有线性相关关系,设回归直线方程,则
关于的回归直线方程为.
23..关于与有以下数据:
2 4 5 6 8
30 40 60 50 70
有如下两个线性模型:(1);(2),试比较哪一个拟合效果比较好?
解:由(1)得与的关系如下表:
-0.5 -3.5 -10 -6.5 0.5
-20 -10 10 0 20
所以
所以
由(2)得与的关系如下表:
-1 -5 8 -9 -3
-20 -10 10 0 20
所以
所以
由于,知,所以方程(1)的拟合效果比较好!
24.某班主任对全班50名学生进行了作业量多少的调查,喜欢玩电脑游戏的同学认为作业多的有18人,认为作业不多的有9人,不喜欢玩电脑游戏的同学认为作业多的有8人,认为作业不多的有15人,则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约是多少?
1、解:
认为作业多 认为作业不多 总数
喜欢玩电脑游戏 18 9 27
不喜欢玩电脑游戏 8 15 23
总数 26 24 50
K2=, P(K2>5.024)=0.025,
有97.5%的把握认为喜欢玩电脑游戏与认为作业多有关系。
1.在画两个变量的散点图时,下面哪个叙述是正确的( B )
(A)预报变量在轴上,解释变量在轴上
(B)解释变量在轴上,预报变量在轴上
(C)可以选择两个变量中任意一个变量在轴上
(D)可以选择两个变量中任意一个变量在轴上
2. 一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93
用这个模型预测这个孩子10岁时的身高,则正确的叙述是( D )
A.身高一定是145.83cm;
B.身高在145.83cm以上;
C.身高在145.83cm以下;
D.身高在145.83cm左右.
3. 两个变量与的回归模型中,分别选择了4个不同模型,它们的相关指数如下 ,其中拟合效果最好的模型是( A )
A.模型1的相关指数为0.98
B.模型2的相关指数为0.80
C.模型3的相关指数为0.50
D.模型4的相关指数为0.25
4. 在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( C )
A.总偏差平方和 B.残差平方和
C.回归平方和 D.相关指数R2
5. 下列说法正确的有(B )
①回归方程适用于一切样本和总体。 ②回归方程一般都有时间性。③样本取值的范围会影响回归方程的适用范围。④回归方程得到的预报值是预报变量的精确值。
A. ①② B. ②③ C. ③④ D. ①③
6. 设有一个回归方程为y=2-2.5x,则变量x增加一个单位时( C )
A.y平均增加2.5个单位 B.y平均增加2个单位
C.y平均减少2.5个单位 D.y平均减少2个单位
7.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是( C )
A.=1.23x+4 B. =1.23x+5
C. =1.23x+0.08 D. =0.08x+1.23
8. 已知x与y之间的一组数据:
x 0 1 2 3
y 1 3 5 7
则y与x的线性回归方程为y=bx+a必过( D )
A.(2,2)点 B.(1.5,0)点
C.(1,2)点 D.(1.5,4)点
9.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵截距是a,那么必有( A )
A. b与r的符号相同 B. a与r的符号相同
C. b与r的相反 D. a与r的符号相反
10. 为研究变量和的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程和,两人计算知相同,也相同,下列正确的是( C )
A. 与重合 B. 与一定平行
C. 与相交于点
D. 无法判断和是否相交
11. 有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系;(2)曲线上的点与该点的坐标之间的关系;(3)苹果的产量与气候之间的关系;(4)森林中的同一种树木,其断面直径与高度之间的关系;(5)学生与他(她)的学号之间的关系,其中有相关关系的是 (1)(3)(4)
12. 许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比()和收入低于官方规定的贫困线的人数占本州人数的百分比()的数据,建立的回归直线方程如下,斜率的估计等于0.8说明 ,成年人受过9年或更少教育的百分比()和收入低于官方的贫困线的人数占本州人数的百分比()之间的相关系数 (填充“大于0”或“小于0”) 一个地区受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右 ;大于0
13. 为了研究某种细菌随时间x变化,繁殖的个数,收集数据如下:
天数x/天 1 2 3 4 5 6
繁殖个数y/个 6 12 25 49 95 190
用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图
描述解释变量与预报变量之间的关系
计算残差、相关指数R2.
解:(1
(2)由散点图看出样本点分布在一条指数函数y=的周围,于是令Z=lny,则
x 1 2 3 4 5 6
Z 1.79 2.48 3.22 3.89 4.55 5.25
由计数器算得 则有
(3)
6.06 12.09 24.09 48.04 95.77 190.9
y 6 12 25 49 95 190
==3.1643 ==25553.3 R2=1-=0.9999
即解释变量天数对预报变量繁殖细菌得个数解释了99.99%.
0
50
100
150
200
0
5
10
1