新课标高中数学人教A版选修1-2 1.1 回归分析的基本思想及其初步应用(课件3份+作业)

文档属性

名称 新课标高中数学人教A版选修1-2 1.1 回归分析的基本思想及其初步应用(课件3份+作业)
格式 zip
文件大小 16.0MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2020-03-24 10:00:58

文档简介


基础要求
1.在画两个变量的散点图时,下面叙述正确的是(  )
A.预报变量在x轴上,解释变量在y轴上
B.解释变量在x轴上,预报变量在y轴上
C.可以选择两个变量中任意一个变量在x轴上
D.可以选择两个变量中任意一个变量在y轴上
答案:B
2.在对两个变量x,y进行线性回归分析时有下列步骤:
①对所求出的回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.
如果根据可靠性要求能够作出变量x,y具有线性相关结论,则在下列操作顺序中正确的是(  )
A.①②⑤③④      B.③②④⑤①
C.②④③①⑤ D.②⑤④③①
解析:根据线性回归分析的思想可得.
答案:D
3.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图2),以下结论中正确的是(  )
图2
A.x和y的相关系数为直线l的斜率
B.x和y的相关系数在0到1之间
C.当n为偶数时,分布在l两侧的样本点的个数一定相同
D.直线l过点(,)
解析:解法1:由于线性回归方程可设为y=a+bx,而系数a的计算公式为a=-b,故应选D.
解法2:依据最小二乘法的有关概念:样本点的中心,相关系数,线性回归方程的意义等进行判断,如下表格,故应选D.
选项
具体分析
结论
A
相关系数用来衡量两个变量之间的相关程度,直线的斜率表示直线的倾斜程度;它们的计算公式也不相同
不正确
B
相关系数的值有正有负,还可以是0;当相关系数在0到1之间时,两个变量为正相关,在-1到0之间时,两个变量负相关
不正确
C
l两侧的样本点的个数分布与n的奇偶性无关,也不一定是平均分布
不正确
D
回归直线l一定过样本点中心(,);由回归直线方程的计算公式 =- x可知直线l必过点(,)
正确
答案:D
4.观测两相关变量得如下数据
x
-1
-2
-3
-4
-5
5
4
3
2
1
y
-1.1
-1.9
-2.9
-4.1
-5
5
4.1
2.9
1.9
1.1
则两变量x,y间的回归直线必过点________.
解析:回归直线必过点(,),而=0,=0.
答案:(0,0)
5.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程: =0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加____________万元.
解析:对于已给出的回归直线方程,对其回归系数的意义和回归方程实际应用价值应重点掌握.
∵家庭年收入增加1万元,即Δx=x2-x1=1万元
则年饮食支出Δy= 2- 1=0.254x2+0.321-0.254x1-0.321=0.254Δx=0.254万元
答案:0.254
能力要求
1.某地2009年第二季度月平均气温x(℃)与某户用水量y(吨)如下表,根据表中数据,用最小二乘法求得用水量y关于月平均气温x的线性回归方程是(  )
月份
4
5
6
月平均气温
20
25
30
月用水量
15
20
28
A. =5x-11.5 B. =6.5x-11.5
C. =1.2x-11.5 D. =1.3x-11.5
解析:∵=25,=21,而选项A、B、C中的直线不过点(25,21),排除A、B、C,选D.
答案:D
2.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则(  )
A.r2C.r2<0解析:对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关;对于变量V与U而言,V随U的增大而减小,故V与U负相关,由上可知r1>0,r2<0,∴r2<0答案:C
3.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:
时间x
1
2
3
4
5
命中率y
0.4
0.5
0.6
0.6
0.4
小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________.
解析:由题意可得
=3,=0.5.
 =- =0.5-0.01×3=0.47.
y= x+ =0.01×6+0.47=0.53.
答案:0.5,0.53
4.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图:
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y= x+ ;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
解:(1)如图3
(2)由对照数据,计算得:=86
==4.5,
==3.5,
 =- =3.5-0.7×4.5=0.35.
因此,所求的线性回归方程为y=0.7x+0.35.
(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:
90-(0.7×100+0.35)=19.65(吨标准煤).

基础要求
1.下列说法正确的是(  )
①在残差图中,残差点的带状区域的宽度越宽,说明模型拟合精度越高,回归方程的预报精度越高。
②在残差图中,残差点的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。
③在线性回归模型中,R2越接近于1,拟合效果越差。
④在线性回归模型中,R2越接近于1,拟合效果越好。
A. ①③          B. ②④
C. ①④ D. ②③
解析:在残差图中,带状区域宽度越窄,拟合精度越高,②正确;在线性回归模型中,R2越接近于1,拟合效果越好,④正确.
答案:B
2.甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:




r
0.82
0.78
0.69
0.85
m
106
115
124
103
则试验结果体现A、B两变量有更强线性相关性的同学是(  )
A.甲 B.乙
C.丙 D.丁
解析:r越大,相关关系越强,m越小,拟合效果越好,选D.
答案:D
3.由回归方程的系数 =,样本相关系数r=和相关指数R2==r2.判断:① 与r同号;②若样本点都在回归直线上,则r=1;③当R2>0.6时,可认为两个变量有很强相关关系,其中正确的是 (  )
A.① B.①②
C.①③ D.②③
解析: 与r的公式中,分母都是正数,分子相同,
所以 与r同号,①正确;当样本点都在回归直线上,
 -=yi-.
∴R2=1,∴r=±1,②错误;
当r∈(0.75,1]∪[-1,0.75)时,认为两个变量有很强相关关系,此时R2∈(0.56,1].
∴③正确.选C.
答案:C
4.若有一组数据的总偏差平方和为100,相关指数为0.7,则其残差平方和为________,回归平方和为________.
解析:∵相关指数R2=1-,
回归平方和为100-30=70.
答案:30 70
能力要求
1.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且 =2.347x-6.423;
②y与x负相关且 =-3.476x+5.648;
③y与x正相关且 =5.437x+8.493;
④y与x正相关且 =-4.326x-4.578.
其中一定不正确的结论的序号是(  )
A.①② B.②③
C.③④ D.①④
解析:由正相关、负相关的性质知:在①中,斜率为2.347>0,不可能负相关;④中,斜率为-4.326<0,不可能正相关,故①④一定不正确.故选D.
答案:D
2.已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程为 = x+ .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是(  )
A. >b′, >a′ B. >b′, C. a′ D. 解析:解法1:由条件画出散点图,可大致的画出两条直线(如图3),由两条直线的相对位置关系可判断 a′.故选C.
解法2:由条件提供的数据及公式知
b′==2,a′=1-2×=-2,
 ==, =-×=-,
∴ >a′, 答案:C
3.某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,他们分别记录了3月1日至3月5日的每天昼夜温差与实验室每天每100颗种子浸泡后的发芽数,得到如下资料:
日期
3月1日
3月2日
3月3日
3月4日
3月5日
温差x(℃)
10
11
13
12
8
发芽数y(颗)
23
25
30
26
16
 (1)从3月1日至3月5日中任选2天,记发芽的种子数分别为m,n,求事件“”的概率.
(2)甲,乙两位同学都发现种子的发芽率与昼夜温差近似成线性关系,给出的拟合直线分别为y=2.2x与y=2.5x-3,试利用“最小平方法(也称最小二乘法)的思想”,判断哪条直线拟合程度更好.
解:(1)事件“”的概率为.
(2)将甲,乙所作拟合直线分别计算y的值得到下表:
x
10
11
13
12
8
y
23
25
30
26
16
y=2.2x
22
24.2
28.6
26.4
17.6
y=2.5x-3
22
24.5
29.5
27
17
用y=2.2x作为拟合直线时,所得到的y值与y的实际值的差的平方和为s1=(22-23)2+(24.2-25)2+(28.6-30)2+(26.4-26)2+(17.6-16)2=6.32.
用y=2.5x-3作为拟合直线时,所得到的y值与y的实际值的差的平方和为s2=(22-23)2+(24.5-25)2+(29.5-30)2+(27-26)2+(17-16)2=3.5.
由于s1>s2,故用直线y=2.5x-3的拟合效果好.

基础要求
1.在回归分析中,残差图中纵坐标为(  )
A.残差        B.样本编号
C.x D.en
答案:A
2.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是(  )
A.由样本数据得到的回归方程 =bx+a必过样本中心(,)
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好
D.若变量y和x之间的相关系数为r=-0.9362,则变量y和x之间具有线性相关关系
解析:易知A、B正确.由于|r|=|-0.936 2|非常接近于1,所以y与x之间具有线性相关关系,D正确.用R2刻画回归效果,R2越接近于1,模拟效果越好,C不正确.
答案:C
能力要求
1.如果两个变量x,y的散点图如图3所示,现有回归模型:①y=ax+b;②y=a1lg(b1x);③y=+b2;④y=a3eb3x;⑤y=a4x2+b4,符合散点图特点的模型是(  )
图3
A.①③ B.②④
C.②③ D.④⑤
解析:由散点图知,x,y不是线性相关,排除①;又模型④是指数函数型,不符合散点图特点,排除A、B、D,选C.
答案:C
2.如果x,y符合回归模型y=mln(nx),要转化为线性回归模型y=mz+a,应令z=________,a=________.
解析:∵y=mln(nx)=m(lnn+lnx)=mlnx+mlnn
∴z=lnx,a=mlnn
答案:lnx mlnn
3.假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下表的统计资料.
使用年限x
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知y对x呈线性相关关系,试求:
(1)线性回归方程 = x+ 的回归系数 、 ;
(2)估计使用年限为10年时,维修费用是多少?
解:(1)由已知条件制成下表:
于是有 ===1.23,
 =- =5-1.23×4=0.08.
(2)回归直线方程是 =1.23x+0.08,当x=10时,
y=1.23×10+0.08=12.38(万元).
即估计使用10年时维修费用是12.38万元.