登陆21世纪教育 助您教考全无忧
3.1回归分析的基本思想及其初步应用同步检测
一、选择题
1. 某商品销售量y(件)与销售价格x (元/件)负相关,则其回归方程可能是( )
A.=-10x+200 B. =10x+200 C. =-10x-200 D. =10x-20
答案:A
解析:解答:本题考查回归方程.由题意知B、D为正相关,C不符合实际意义.选A
分析:本题主要考查了相关系数,解决问题的关键是根据相关系数的性质进行分析即可.
2. 有下列说法:
①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;
②用相关指数来刻画回归效果,的值越大,说明模型的拟合效果越好;
③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小,拟合效果越好.
其中正确命题的个数是( )
A.0 B.1 C.2 D.3
答案:D
解析:解答:由回归分析的基本思想知①②③均正确
分析:本题主要考查了回归分析,解决问题的关键是根据回归分析的原理分析即可
3. 有下列说法:
①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归方程,可以估计和观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确命题的个数是( )
A.1 B.2 C.3 D.4
答案:C
解析:解答:①反映的正是最小二乘法思想,故正确.②反映的是散点图的作用,也正确.③解释的是回归方程的作用,故也正确.④是不正确的,在求回归方程之前必须进行相关性检验,以体现两变量的关系.
分析:本题主要考查了回归分析,解决问题的关键是回归分析的过程;(1)随机抽取样本,确定数据,形成样本点;(2)由样本点形成散点图,判断是否具有线性相关关系;(3)由最小二乘法确定线性回归方程;(4)由回归方程观察变量的取值及变化趋势
4. 下表是一位母亲给儿子作的成长记录:
年龄/周岁 3 4 5 6 7 8 9
身高/cm 94.8 104.2 108.7 117.8 124.3 130.8 139.1
根据以上样本数据,她建立了身高(cm)与年龄x(周岁)的线性回归方程为,给出下列结论:
①y与x具有正的线性相关关系;
②回归直线过样本的中心点(42,117.1);
③儿子10岁时的身高是cm;
④儿子年龄增加1周岁,身高约增加cm.
其中,正确结论的个数是
A.1 B.2 C. 3 D. 4
答案:B
解析:
解答线性回归方程为=7.19 +73.93,
①7.19>0,即y随x的增大而增大,y与x具有正的线性相关关系,①正确;
②回归直线过样本的中心点为(6,117.1),②错误;
③当x=10时,=145.83,此为估计值,所以儿子10岁时的身高的估计值是145.83cm而不一定是实际值,③错误;
④回归方程的斜率为7.19,则儿子年龄增加1周岁,身高约增加7.19cm,④正确,
故应选:B
分析:本题主要考查了回归分析的初步应用,解决问题的关键是根据回归分析的原理分析判断即可.
5. 甲、乙、丙、丁4位同学各自对A、B两变量做回归分析,分别得到散点图与残差平方和 ,如下表所示:
上述的试验结果中,拟合效果最好的同学是( )
A.甲 B.乙 C.丙 D.丁
答案:D
解析:解答:本题考查残差的变化.根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R2表达式中 为确定的数,则残差平方和越小,R2越大),由回归分析建立的线性回归模型的拟合效果就越好,由题表知丁的拟合效果最好.故选D.
分析:本题主要考查了回归分析的初步应用,解决问题的关键是根据回归分析的初步应用的原理分析即可
6. 关于回归分析,下列说法错误的是( )
A.回归分析是研究两个具有相关关系的变量的方法
B.线性相关系数可以是正的或负的
C.回归模型中一定存在随机误差
D.散点图能明确反映变量间的关系
答案:D
解析:解答:用散点图反映两个变量间的关系时,存在误差,故D错误
分析:本题主要考查了回归分析,解决问题的关键是根据回归分析的性质分析即可
7. 在回归分析中,相关指数R2的值越大,说明残差平方和( )
A.越大 B.越小 C.可能大也可能小 D.以上均错
答案:B
解析:解答:∵,∴当R2越大时,越小,即残差平方和越小.
分析:本题主要考查了回归分析,解决问题的关键是根据回归分析的概念分析即可
式
8. 下列四个结论,其中正确的个数为( ).
①已,则
②过原点作曲线的切线,则切线方程为 (其中e为自然对数的底数);
③已知随机变 ,则
④已知n为正偶数,用数学归纳法证明等式时,若假设 时,命题为真,则还需利用归纳假设再证明时等式成立,即可证明等式对一切正偶数n都成立.
⑤在回归分析中,常用来刻画回归效果,在线性回归模型中,表示解释变量对于预报变量变化的贡献率越接近1,表示回归的效果越好.( )
A.2 B.3 C.4 D.5
答案:B
解析:解答:本题主要考查二项式定理、导数法求曲线的切线、正态分布、数学归纳法、回归分析的基本思想及其初步应用的综合分析问题、解决问题的能力.
令x=1,得 x=0,, ,①错;
设切点坐标为(a,b),则曲线的切线的斜率为k=y|x=a=ea,则切线方程为y-b=ea(x—a),b=ea,切线过原点,则a=1,b=e, 则切线方程为y =ex, ②正确;
由可知正态曲线的对称轴为x=3,则, ③正确;因为n为正偶数,所以 时是错误的,应当则④错误;
根据相关系数的性质可知,⑤正确.
分析:本题主要考查了回归分析的初步应用,解决问题的关键是根据回归分析的原理分析计算即可
9. 下列说法不正确的是( )
A.回归分析中,相关指数R2的值越大,说明残差平方和越小
B.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)满足yi=bxi+a+ei(i=1,2,…,n),若ei恒为0,则R2=1
C.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法
D.画残差图时,纵坐标为残差,横坐标一定是编号
答案:D
解析:解答:残差图中横坐标可以是样本编号,也可以是身高数据,还可以是体重估计值等,故选D.
分析:本题主要考查了回归分析,解决问题的关键是根据回归分析的原理分析计算即可
10. 以下可用来分析身高与体重间关系的是( )
A.残差图 B.回归分析 C.等高条形图 D.独立性检验
答案:B
解析:解答:本题考查变量间的关系.因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决.选B.
分析:本题主要考查了回归分析,解决问题的关键是根据所给变量结合回归分析的原理分析即可
11. 散点图在回归分析过程中的作用是( )
A.查找个体个数 B.比较个体数据大小关系
C.探究个体分类 D.粗略判断变量是否线性相关
答案:D
解析:解答:本题考查散点图.由散点图可以粗略地判断两个变量是否线性相关.选D
分析:本题主要考查了相关系数,解决问题的关键是理解相关系数的性质
12. 对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是( )
A.
B.
C.
D.
答案:A
解析:解答:用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高.
分析:本题主要考查了可线性化的回归分析,解决问题的关键是根据所给变量之间是关系结合回归分析判断即可
13. .在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )
A.平均数与方差 B.回归分析 C.独立性检验 D.概率
答案:C
解析:解答:判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.
分析:本题主要考查了实际推断原理和假设检验,解决问题的关键是根据实际问题选取恰当的分析方法即可
14. 甲、乙两校体育达标抽样测试,两校体育达标情况抽检,其数据见下表:
达标人数 未达标人数 合计
甲校 48 62 110
乙校 52 38 90
合计 100 100 200
若要考察体育达标情况与学校是否有关系最适宜的统计方法是( )
A.回归分析 B.独立性检验 C.相关系数 D.平均值
答案:B
解析:解答:本题考查独立性检验.由独立性检验的作用知:选B
分析:本题主要考查了实际推断原理和假设检验的应用,解决问题的关键是根据实际推断原理和假设检验的应用进行分析
二、填空题
15. 在对两个变量进行回归分析时,甲、乙分别给出两个不同的回归方程,并对回归方程进行检验.对这两个回归方程进行检验时,与实际数据(个数)对比结果如下:
与实际相符数据个数 与实际不符合数据个数 合计
甲回归方程 32 8 40
乙回归方程 40 20 60
合计 72 28 100
则从表中数据分析,_______回归方程更好(即与实际数据更贴近).
答案:甲
解析:解答:可以根据表中数据分析,两个回归方程对数据预测的正确率进行判断,甲回归方程的数据准确率为,而乙回归方程的数据准确率为.显然甲的准确率高些,因此甲回归方程好些.
分析:本题主要考查了回归分析的初步应用,解决问题的关键是根据回归分析的原理计算即可
16. 甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性进行分析,并用回归分析的方法分别求得相关指数与残差平方和如下表:
甲 乙 丙 丁
0.67 0.61 0.48 0.72
106 115 124 103
则能体现A,B两个变量有更强的线性相关性的为______________.
答案:丁
解析:解答:丁同学所求得的相关指数最大,残差平方和最小.此时A,B两变量线性相关性更强.
分析:本题主要考查了可线性化的回归分析,解决问题的关键是根据所给图表结合可线性化的回归分析的原理分析即可
17. 甲、乙、丙、丁4位同学各自对A,B两变量做回归分析,分别得到散点图与残差平方和,如下表:
甲 乙 丙 丁
散点图
残差平方和 115 106 124 103
则________同学的试验结果体现拟合A,B两变量关系的模型拟合精度最高.
答案:丁
解析:解答:本题考查散点图.从散点图上来看,丁同学的散点图中的点更加近似在一条直线附近;从残差平方和来看,丁同学的最小,说明拟合精度最高.
分析:本题主要考查了回归分析的初步应用,解决问题的关键是根据所给变量之间的关系分析即可
18. 下列说法中正确的有 .
①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法
答案:①②④
解析:解答:本题考查函数关系、相关关系及回归分析的概念.根据函数关系及相关关系的定义,①函数关系是一种确定性关系,②相关关系是一种非确定性关系,①②均正确;由回归分析的定义及应用可知,④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.故答案为①②④
分析:本题主要考查了回归分析,解决问题的关键是根据回归分析的原理分析即可
19. 某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:
专业\性别 非统计专业 统计专业
男 13 10
女 7 20
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到,因为k≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为____.
答案:5%
解析:解答:因为P(K2≥3.841)≈0.05,所以在犯错误的概率不超过0.05的前提下认为判定主修统计专业与性别有关系,即这种判断出错的可能性为5%.
分析:本题主要考查了实际推断原理和假设检验的应用,解决问题的关键是根据实际推断原理和假设检验的的原理分析计算即可
三、解答题
20. 某工厂的产品产量与单位成本的资料如表所示,请进行线性回归分析.
答案:解:设回归直线方程为 ,
, , , ,
所以 ≈-1.818 2,
≈77.36.
回归直线方程为 .
由回归系数为-1.818 2知,产量每增加1 000件,单位成本下降约1.818 2元.产量每增加1 000件,单位成本下降约1.818 2元.
解析:分析:本题主要考查了回归分析的初步应用,解决问题的关键是根据所给实际问题结合回归分析的初步应用的原理计算即可
21. 某省2013年的阅卷现场有一位质检老师随机抽取5名学生的总成绩和数学成绩(单位:分)如下表所示:
学生 A B C D E
总成绩(x) 482 383 421 364 362
数学成绩(y) 78 65 71 64 61
(1)作出散点图;
答案:解:散点图如图所示:
(2)对x与y作回归分析;
答案:解: , , ,
, .
∴ .
因此可以认为y与x有很强的线性相关关系.
(3)求数学成绩y对总成绩x的回归直线方程;
答案:解:回归系数 ,
.
∴回归方程为 .
(4)如果一个学生的总成绩为500分,试预测这个学生的数学成绩.
答案:解:当x=500时,.即当一个学生的总成绩为500分时,他的数学成绩约为81分.
解析:分析:本题主要考查了回归分析的初步应用,解决问题的关键是根据所给事件问题结合回归分析的原理分析计算即可
22. 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及下面一些统计量的值.
46.6 563 6.8 289.8 1.6 1469 108.8
表中 , .
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最下二乘估计分别为 , .
(1)根据散点图判断,y=a+bx与 哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
答案:解:由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
答案:解:令w=,先建立y关于w的线性回归方程.由于
=68
所以y关于w的线性回归方程为=100.6+68w,
因此y关于x的回归方程为=100.6+68.
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:
①年宣传费x=49时,年销售量及年利润的预报值时多少?
②年宣传费x为何值时,年利润的预报值最大?
答案:解:①由(2)知,当x=49时,年销售量y的预报值
=100.6+68=576.6,
年利润z的预报值=576.6×0.2-49=66.32.
②根据(2)的结果知,年利润z的预报值=0.2(100.6+68)-x=-x+13.6+20.12.
所以当=6.8,即x=46.24时,取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.
解析:分析:本题主要考查了回归分析的初步应用,解决问题的关键是(1)由散点图中的散点的走向,可判断为y=c+d较适合; (2)由题中所给的数据,经计算可求得y关于w的线性回归方程; (3)①把代入方程可求解;②由题意可得看作关于的二次函数,易求年利润的预报值最大.
23. 混凝土的抗压强度X较易测定,其抗剪切强度Y不易测定.工程中希望找出规律由X估算出Y,以便应用.现测得一批对应数据如下:
X 141 152 168 182 195 204 22.3 254 277
Y 23.1 25.3 27.9 29.8 31.1 31.8 32.5 34.8 35.2
其中X——抗压强度,Y——抗剪切强度.试求出Y关于X的回归方程.
(提示:考虑Y=bX+a及Y=AXb两种函数模型)
答案:解:由上述数据,作其散点图如图,可知X与Y具有相关关系.
若建立线性回归模型,设其回归直线方程为,则由上述数据可得 ,.所以其回归直线方程为 .并且相关系数为r=0.9532>0.75.故X与Y之间具有显著的线性相关关系. 观察散点图发现散点图形后来呈平缓趋势,能否用函数Y=AXb的模型来模拟呢?对Y=AXb两边取自然对数得lnY=blnX+lnA,作变换y=lnY,x=lnX,a=lnA,则上述数据对应的表格如下:
X Y x y x2 y2 xy
141 23.1 4.94876 3.13983262 24.49022 9.858549 15.53828
152 25.3 5.023881 3.2308044 25.23938 10.4381 16.23118
168 27.9 5.123964 3.32862669 26.25501 11.07976 17.05576
182 29.8 5.204007 3.39450839 27.08169 11.52269 17.66504
195 31.1 5.273 3.43720782 27.80452 11.8144 18.1244
204 31.8 5.31812 3.45946629 28.2824 11.96791 18.39786
223 32.5 5.407172 3.48124009 29.2375 12.11903 18.82366
254 34.8 5.537334 3.54961739 30.66207 12.59978 19.65542
277 35.2 5.624018 3.56104608 31.62957 12.68105 20.02739
∴ ,, , , .
∵ , .∴.此时相关系数r′=0.9646>0.75,故y与x之间存在显著线性相关关系.由及y=lnY,x=lnX
得 .
计算两个模型中的相关指数可得 , .可知模型二拟合效果较好.故X与Y之间的关系为 .
解析:分析:本题主要考查了回归分析的初步应用;实际推断原理和假设检验的应用,解决问题的关键是根据回归分析及实际推断原理和假设检验的方法进行计算分析即可解决问题
24. 某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:
积极参加班级工作 不太主动参加班级工作 合计
学习积极性高 18 7 25
学习积极性一般 6 19 25
合计 24 26 50
参考公式及数据:
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?
答案:解:积极参加班级工作的学生有24人,总人数为50人.概率为 =;不太主动参加班级工作且学习积极性一般的学生有19人,概率为 .
(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?并说明理由?
答案:解:由表中数据可得K2= = ≈11.5>10.828,
∴有99.9%的把握说学习积极性与对待班级工作的态度有关系.
解析:分析:本题主要考查了回归分析的初步应用、实际推断原理和假设检验的应用,解决问题的关键是(1)利用古典概型概率公式求解; (2)利用公式易求K2的值,然后对照表格数据可得事件的可信度.
25. 假设关于某设备的使用年限x和支出的维修费用y(万元),有如下表的统计资料:
使用年限x 2 3 4 5 6
维修费用y 2.2 3.8 5.5 6.5 7.0
若由资料知y对x呈线性相关关系,试求:
(1)线性回归方程.
答案:解:将已知条件制成下表:
i 1 2 3 4 5 合计
2 3 4 5 6 20
2.2 3.8 5.5 6.5 7.0 25
4.4 11.4 22.0 32.5 42.0 112.3
4 9 16 25 36 90
于是有 ,
,
回归直线方程是 .
(2)估计使用年限为10年时,维修费用是多少.
答案:解:当x=10时,y=1.23×10+0.08=12.38(万元),即估计使用10年时维修费用是12.38万元.
(3)计算总偏差平方和、残差平方和及回归平方和.
答案:解:总偏差平方和: ,残差平方和 ,
回归平方和:15.78-0.651=15.129.
(4)求并说明模型的拟合效果.
答案:解:
模型的拟合效果较好,使用年限解释了95.87%的维修费用支出
解析:分析:本题主要考查了回归分析的初步应用;实际推断原理和假设检验的应用,解决问题的关键是根据回归分析的初步应用的原理及实际推断分析计算即可解决问题.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网 www.21cnjy.com 第 14 页 (共 14 页) 版权所有@21世纪教育网