【高考调研】2015高中数学(人教A版)选修2-3:3-1 回归分析的基本思想及其初步应用(配套课件+课时检测+课后巩固试题,3份)

文档属性

名称 【高考调研】2015高中数学(人教A版)选修2-3:3-1 回归分析的基本思想及其初步应用(配套课件+课时检测+课后巩固试题,3份)
格式 zip
文件大小 3.2MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2015-03-11 09:51:46

文档简介


1.下列变量是相关关系的是(  )
A.人的身高与视力
B.圆心角的大小与其所对的圆弧长
C.直线上某点的横坐标与纵坐标
D.人的年龄与身高
答案 D
解析 A不是相关关系;B、C是函数关系;D人的年龄与身高存在相关关系,因为身高不仅受年龄的影响,还受遗传、饮食、环境等因素的影响.
2.对于线性相关系数r,叙述正确的是(  )
A.|r|∈(0,+∞),|r|越大,相关程度越大,反之,相关程度越小
B.r∈(-∞,+∞),r越大,相关程度越大,反之,相关程度越小
C.|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小
D.以上说法都不对
答案 C
3.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到的线性回归方程为=x+,那么下面说法不正确的是(  )
A.直线=x+必经过点(,)
B.直线=x+至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点
C.直线=x+的斜率为
D.直线=x+和各点(x1,y1),(x2,y2),…,(xn,yn)的残差平方和(yi-i)2是该坐标平面上所有直线与这些点残差平方和中最小的
答案 B
4.已知x与y之间的一组数据如下,则y与x的线性回归方程为=x+必过点________.
x
0
1
2
3
y
1
3
5
7
答案 (,4)
解析 回归方程必过样本点的中心(,),
又==,==4,即过点(,4).
5.甲、乙、丙、丁四位同学各自对A、B两变量做回归分析,分别得到散点图与残差平方和(yi-i)2如下表:




散点图
残差
平方和
115
106
124
103
哪位同学的试验结果体现拟合A、B两变量关系的模型拟合精度高?
A.甲           B.乙
C.丙 D.丁
答案 D
解析 根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R2表达式中(yi-)2为确定的数,则残差平方和越小,R2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些,故选D.
课件61张PPT。第三章 统计案例课后巩固课时作业(二十五)
1.下列两个变量之间的关系是相关关系的是(  )
A.正方体的棱长和体积
B.角的弧度数和它的正弦值
C.速度一定时的路程和时间
D.日照时间与水稻的亩产量
答案 D
解析 因为相关关系就是两个变量之间的一种非确定性关系,故可由两个变量之间的关系确定答案.A,B,C均确定性关系,即函数关系,而D中日照时间与亩产量的关系是不确定的.故选D.
2.若回归直线方程中的回归系数=0,则相关系数(  )
A.r=1        B.r=-1
C.r=0 D.无法确定
答案 C
解析 注意两个系数之间的联系.=,
r=,两个式子的分子是一致的,当=0时,r一定为0.故选C.
3.在两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的相关指数R2如下,其中拟合效果最好的模型是(  )
A.模型1的相关指数R2为0.98
B.模型2的相关指数R2为0.80
C.模型3的相关指数R2为0.50
D.模型4的相关指数R2为0.25
答案 A
解析 相关指数R2的取值范围为[0,1],若R2=1,即残差平方和为0,此时预测值与观测值相等.y与x是函数关系,也就是说在相关关系中R2越接近于1,说明随机误差的效应越小,y与x相关程度越大,模型的拟合效果越好.R2=0,说明模型中x与y根本无关.故选A.
4.若变量y与x之间的相关系数r=-0.936 2,则变量y与x之间(  )
A.不具有线性相关关系
B.具有线性相关关系
C.它们的线性关系还要进一步确定
D.不确定
答案 B
5.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得=0.577x-0.448(x为人的年龄,y为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是(  )
A.年龄为37岁的人体内脂肪含量都为20.90%
B.年龄为37岁的人体内脂肪含量为21.01%
C.年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%
D.年龄为37岁的大部分的人体内脂肪含量为31.5%
答案 C
解析 当x=37时,=0.577×37-0.448=20.901≈20.90,由此估计:年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%.
6.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断(  )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
答案 C
7.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线方程是________.
答案 =1.23x+0.08
解析 由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得-5=1.23(x-4),
即=1.23x+0.08.
8.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=bxi+a+ei(i=1,2,…,n),且ei恒为0,则R2为________.
答案 1
解析 由ei恒为0知yi=i,即yi-i=0.
故R2=1-=1-0=1.
9.(2010·广东)某市居民2005~2009年家庭平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:
年份
2005
2006
2007
2008
2009
收入x
11.5
12.1
13
13.3
15
支出Y
6.8
8.8
9.8
10
12
根据统计资料,居民家庭年平均收入的中位数是________,家庭年平均收入与年平均支出有________线性相关关系.
答案 13 较强的
解析 由表中所给的数据知所求的中位数为13,画出x与Y的散点图知它们有较强的线性相关关系.
10.已知两个变量x与y之间有线性相关性,5次试验的观测数据如下:
x
100
120
140
160
180
y
45
54
62
75
92
那么变量y关于x的回归方程是________.
答案 =0.575x-14.9
解析 由线性回归的参数公式可求得=0.575,=-14.9,所以回归方程为=0.575x-14.9.
11.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨标准煤)与相应的生产能耗y(吨标准煤)的几组对照数据.
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
解析 (1)散点图如下图所示.
(2)==4.5,
==3.5,
iyi=3×2.5+4×3+5×4+6×4.5=66.5,
=32+42+52+62=86.
∴=
==0.7,
=-=3.5-0.7×4.5=0.35.
∴=0.7x+0.35.
(3)现在生产100吨甲产品用煤
y=0.7×100+0.35=70.35,
∴降低90-70.35=19.65(吨标准煤).
?重点班选做题
12.一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表为抽样试验结果:
转速x(转/秒)
16
14
12
8
每小时生产有缺点的零件数y(件)
11
9
8
5
(1)对变量y与x进行相关性检验;
(2)如果y与x有线性相关关系,求线性回归方程;
(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,则机器的运转速度应控制在什么范围内?
解析 (1)=12.5,=8.25.
iyi=438,4 =412.5,=660,=291,
所以r=

=≈≈0.995.
因为r>0.75,所以y与x有线性相关关系.
(2)=0.728 6x-0.857 1.
(3)要使≤10,即0.728 6x-0.857 1≤10,
所以x≤14.901 3.
所以机器的转速应控制在14.901 3转/秒以下.
1.甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:




r
0.82
0.78
0.69
0.85
m
106
115
124
103
则试验结果体现A、B两变量更强的线性相关性的是同学(  )
A.甲 B.乙
C.丙 D.丁
答案 D
解析 由表可知,丁同学的相关系数r最大且残差平方和m最小,故丁同学的试验结果体现A、B两变量更强的线性相关性.
2.若某函数型相对一组数据的残差平方和为89,其相关指数为0.95,则总偏差平方和为________,回归平方和为________.
答案 1 780 1 691
解析 R2=1-,0.95=1-,
∴总偏差平方和为1 780.
回归平方和=总偏差平方和-残差平方和=1 780-89=1 691.
3.对于x与y有如下观测数据:
x
18
25
30
39
41
42
49
52
y
3
5
6
7
8
8
9
10
(1)作出散点图;
(2)对x与y作回归分析;
(3)求出y与x的回归直线方程;
(4)根据回归直线方程,预测y=20时x的值.
答案 (1)作出散点图,如图
(2)作相关性检验.
=×(18+25+30+39+41+42+49+52)==37,
=×(3+5+6+7+8+8+9+10)=7,
=182+252+302+392+412+422+492+522=11 920,
=32+52+62+72+82+82+92+102=428,
iyi=18×3+25×5+30×6+39×7+41×8+42×8+49×9+52×10=2 257,
iyi-8 =2 257-8×37×7=185,
-82=11 920-8×372=968,
-82=428-8×72=36,
∴r==≈0.991.
由于r=0.991>0.75,因此,认为两个变量有很强的相关关系.
(3)回归系数==≈0.191,
=-=7-0.191×37=-0.067,
所以y对x的回归直线方程为=0.191x-0.067.
(4)当y=20时,有20=0.191x-0.067,得x≈105.因此在y的值为20时,x的值约为105.
4.以下是收集到的房屋的销售价格y与房屋的大小x的有关数据.
x(m2)
115
110
80
135
105
y(万元)
24.8
21.6
18.4
29.2
22
若y与x呈线性相关关系,求回归直线方程.
解析 作出散点图.
由图可知房屋的销售价格与房屋的大小线性相关.
=(24.8+21.6+18.4+29.2+22)=23.2,
=(115+110+80+135+105)=109,
=1152+1102+802+1352+1052=60 975,
iyi=24.8×115+21.6×110+18.4×80+29.2×135+105×22=12 952.
===≈0.196 2.
=-=23.2-0.196 2×109=1.814 2,
所以y对x的回归直线方程为=0.196 2x+1.814 2.
5.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得数据如下:
零件数x(个)
10
20
30
40
50
60
70
80
90
100
加工时间y(分)
62
68
75
81
89
95
102
108
115
122
(1)计算总偏差平方和,残差及残差平方和;
(2)求出相关指数R2;
(3)进行残差分析.
解析 (1)列出残差表(=0.668x+54.960,=91.7)
i
62
68
75
81
89
95
102
108
115
122
61.6
68.3
75.0
81.7
88.4
95.0
101.7
108.4
115.1
121.8
yi-
-29.7
-23.7
-16.7
-10.7
-2.7
3.3
10.3
16.3
23.3
30.3
yi-i
0.4
-0.3
0
-0.7
0.6
0
0.3
-0.4
-0.1
0.2
所以(yi-)2=(-29.7)2+(-23.7)2+…+30.32=3 688.1.
(yi-i)2=0.42+(-0.3)2+…+0.22=1.4.
即总偏差平方和为3 688.1,残差平方和为1.4,残差值如表中第四行的值.
(2)R2=1-≈1-0.000 38=0.999 62,相关指数R2非常接近于1,回归直线模型拟合效果较好.
(3)作出残差图甲
图甲:横坐标为零件个数,纵坐标为残差.
(4)残差分析:由散点图乙和r的值(知识点二的例题,r=0.999 8)可以说明x与y有很强的相关性,由R2的值可以看出回归直线模型的拟合效果很好.由残差图可以观察到,第4个样本点和第5个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的失误,如果有则需要纠正数据,重新利用线性回归模型拟合数据;由残差图中的残差点比较均匀地落在水平的带状区域中(在两条直线y=-0.65和y=0.67之间),也说明选用的线性回归模型较为合适,带状区域的宽度仅为1.32,比较狭窄,说明模型拟合精度较高!