高中数学人教A版选修1-2 1.1 回归分析的基本思想及其初步应用(48张PPT课件+练习)

文档属性

名称 高中数学人教A版选修1-2 1.1 回归分析的基本思想及其初步应用(48张PPT课件+练习)
格式 zip
文件大小 2.3MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2020-03-16 19:33:36

文档简介

1-1
[课后提升案·素养达成]
一、选择题(每小题5分,共30分)
1.有关回归方程的叙述正确的是
A.回归方程只适用于所研究的样本
B.回归方程都有时间性
C.样本的取值范围会影响回归方程的适用范围
D.回归方程是反映总体的唯一的回归模型
解析 回归方程是由样本求出,利用它来研究整体的,它不一定都有时间性,也不是唯一的回归模型,但是样本的取值范围是回归方程的适用范围.
答案 C
2.某车间加工零件的数量x与加工时间y的统计数据如表:
零件数x(个)
10
20
30
加工时间y(分钟)
21
30
39
现已求得上表数据的线性回归方程=x+中的值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为
A.84分钟        B.94分钟
C.102分钟 D.112分钟
解析 由表中数据得:=20,=30,又值为0.9,故=30-0.9×20=12,所以=0.9x+12.将x=100代入线性回归方程,得=0.9×100+12=102(分钟).所以预测加工100个零件需要102分钟.
答案 C
3.下列三个说法:
①残差平方和越小的模型,拟合的效果越好;
②用R2来刻画回归的效果时,R2的值越小,说明模型拟合的效果越好;
③直线=x+和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差yi-(xi+)]2是该坐标平面上所有直线中与这些点的偏差最小的直线.
其中正确的个数为
A.1个    B.2个    C.3个    D.4个
解析 由R2的定义可知:R2越接近于1,表明两个随机变量线性相关性越强,所以②不正确,其余说法正确.
答案 B
4.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据测算的线性回归方程可能是
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
解析 由正相关可知斜率为正,故可排除C,D两项,又因为=0.4x+2.3经过点(3,3.5),故A项正确.
答案 A
5.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为
A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元
解析 由题意得
==10,==8,
所以=8-0.76×10=0.4,
所以=0.76x+0.4,把x=15代入得到=11.8.
答案 B
6.已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程为=x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x+a′,则以下结论正确的是
A.>b′,>a′ B.>b′,<a′
C.<b′,>a′ D.<b′,<a′
解析 过(1,0)和(2,2)的直线方程为y=2x-2,
画出六点的散点图,回归直线的大概位置如图所示,
显然b′>,>a′.
答案 C
二、填空题(每小题5分,共15分)
7.某校高二(8)班学生每周用于数学学习的时间x(单位:小时)与数学成绩y(单位:分)构成如下数据(15,79),(23,97),(16,64),(24,92),(12,58),求得的回归直线方程为=2.5x+,则某同学每周学习20小时,估计数学成绩约为________分.
解析 =×(15+23+16+24+12)=18,
=×(79+97+64+92+58)=78,
把(,)代入=2.5x+,可求得=33,
把x=20代入=2.5x+33得=2.5×20+33=83.
答案 83
8.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析 由题意知其回归系数为0.254,故家庭年收入每增加1万元,年饮食支出平均增加0.254万元.
答案 0.254
9.改革开放以来,我国高等教育事业迅速发展,为调查某省从1990年到2000年农村18到24岁的青年人每年考入大学的百分比,把1990年到2000年的年号依次编号为0,1,…,10作为自变量x,把每年考入大学的百分比作为因变量y,进行回归分析,得线性回归方程=1.80+0.42x.
①每年升入大学的百分比为1.80;②升入大学的18岁到24岁的人数按大约每年0.42%的速率递增;③1990年升入大学的百分比约为1.80%,2000年升入大学的百分比约为6%;④从1990年到2000年升入大学的人数成等距离增加.
上面对数据解释正确的是________.
解析 1990年升入大学的百分比为=1.80+0.42×0=1.80,
即1.80%,2000年升入大学的百分比为
=1.80+0.42×10=6.0,即6.0%,∴①错③对.
对于②,自变量x每增加1个单位,则增加0.42%,
∴②对.④表示考入大学的百分比,∴④错.
答案 ②③
三、解答题(本大题共3小题,共35分)
10.(10分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗Y(吨)标准煤的几组对照数据
x
3
4
5
6
Y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程=x+;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数据:3×2.5+4×3+5×4+6×4.5=66.5)
解析 (1)由题设所给数据,可得散点图如图.
(2)由数据,计算得:=86,
==4.5,==3.5.
又已知iyi=66.5,所以由最小二乘法确定的回归方程的系数为:===0.7,=-=3.5-0.7×4.5=0.35,
因此,所求的回归直线方程为=0.7x+0.35.
(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为90-(0.7×100+0.35)=19.65(吨标准煤).
11.(12分)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2010
2011
2012
2013
2014
时间代号t
1
2
3
4
5
储蓄存款y(千亿元)
5
6
7
8
10
(1)求y关于t的回归方程=t+.
(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.
解析 (1)列表计算如下:
i
ti
yi
t
tiyi
1
1
5
1
5
2
2
6
4
12
3
3
7
9
21
4
4
8
16
32
5
5
10
25
50

15
36
55
120
这里n=5,=i==3,=i==7.2.
=120-5×3×7.2=12,
从而===1.2,=-=7.2-1.2×3=3.6,故所求回归方程为=1.2t+3.6.
(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为=1.2×6+3.6=10.8(千亿元).
12.(13分)假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:
使用年限x
2
3
4
5
6
维修费用y(万元)
2.2
3.8
5.5
6.5
7.0
若由资料知,y对x呈线性相关关系.试求:
(1)线性回归方程=x+的回归系数、;
(2)求残差平方和;
(3)求相关指数R2;
(4)估计使用年限为10年时,维修费用是多少?
解析 y对x呈线性相关关系,转化为一元线性相关的方法,根据公式分别计算.
(1)由已知数据制成下表.
i
1
2
3
4
5
合计
xi
2
3
4
5
6
20
yi
2.2
3.8
5.5
6.5
7.0
25
xiyi
4.4
11.4
22.0
32.5
42.0
112.3
x
4
9
16
25
36
90
于是有==1.23,
=-b=5-1.23×4=0.08,∴=1.23x+0.08.
(2)由公式1=1.23×2+0.08=2.54,
2=1.23×3+0.08=3.77,
3=1.23×4+0.08=5,
4=1.23×5+0.08=6.23,
5=1.23×6+0.08=7.46,
∴1=2.2-2.54=-0.34,
2=3.8-3.77=0.03,
3=5.5-5=0.5,
4=6.5-6.23=0.27,
5=7.0-7.46=-0.46.
∴残差平方和为
(-0.34)2+0.032+0.52+0.272+(-0.46)2=0.651.
(3)R2=1-≈0.958 7.
(4)回归直线方程为=1.23x+0.08,当x=10时,=1.23×10+0.08=12.38(万元),
即估计使用10年时维修费用是12.38万元.
答案 (1)a=0.08,b=1.23 (2)0.651 (3)0.958 7 (4)12.38万元
课件48张PPT。第一章 统计案例§1.1 回归分析的基本思想及其初步应用
[课标解读]
1.了解随机误差、残差、残差分析的概念.(难点)
2.会用残差分析判断线性回归模型的拟合效果.(难点)
3.掌握建立回归模型的步骤.(重点、易混点)
4.通过对典型案例的探究,了解回归分析的基本思想方法和初步应用.(重点、难点)
1.回归分析
回归分析是对具有________的两个变量进行统计分析的一种常用方法,回归分析的基本步骤是_______,________,并用回归方程进行预报.
基础知识整合相关关系画出两个变量的散点图求回归方程样本点的中心随机误差解释预报3.刻画回归效果的方式
残差样本编号身高数据体重估计值越窄越小解释 预报?知识点一 回归分析的相关概念
【探究1】 相关关系与函数关系的区别与联系.
提示 (1)两者之间的区别
①相关关系是一种非确定性关系,如人的身高与年龄.而函数关系中的两个变量是一种确定性关系.
②函数关系是一种因果关系,而相关关系不一定是因果关系.
核心要点探究(2)两者之间的联系
相关关系与函数关系有着密切的联系,在一定条件下可以相互转化.例如正方形的面积S与其边长x之间虽然是一种确定性关系,但在每次测量时,由于测量误差等原因,其数值大小又表现出一种随机性,而对于具有相关关系的两个变量来说,当求得其回归直线方程后,我们又可以用一种确定的关系对这两个变量间的关系进行估计.
【探究2】 线性回归模型是函数关系吗?
提示 y=bx+a+e与函数关系不同.在回归模型中,y的值由x和随机误差e共同确定,即x只能解释部分y的变化.因此有时把x称为解释变量,把y称为预报变量.?知识点二 回归分析
【探究1】 回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为什么?
提示 不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动等.
【探究3】 相关指数R2的作用是什么?
提示 利用相关指数R2可以刻画数据拟合效果的好坏.在线性回归模型中,R2的值越接近1,说明残差平方和越小,即说明模型的拟合效果越好.【归纳提高】
对回归分析的三点说明
(1)回归分析的前提是两个变量之间具有相关关系.
(2)对两个变量之间数量变化进行一般关系的测定,确定一个相应的数学表达式,即线性回归方程,达到由一个已知量推测或控制另一个变量的值的目标,是统计的一个重要方法.
(3)线性回归方程是根据样本数据得到的一个确定性的函数关系,是用来对未知变量进行预测的,为了预测的效果更好,减小误差,应在求回归方程时尽量多地选取样本,选择代表性较强的样本,使得预测值尽量地接近真实值.
题型一 回归分析的有关概念例1【答案】 C方法规律
回归分析的过程
(1)随机抽取样本,确定数据,形成样本点;
(2)由样本点形成散点图,判断是否具有线性相关关系;
(3)由最小二乘法确定线性回归方程;
(4)由回归方程观察变量的取值及变化趋势.
1.关于变量y与x之间的回归直线方程叙述正确的是
A.表示y与x之间的一种确定性关系
B.表示y与x之间的相关关系
C.表示y与x之间的最真实的关系
D.表示y与x之间真实关系的一种效果最好的拟合
解析 回归直线方程能最大可能地反映y与x之间的真实关系,故选项D正确.
答案 D◎变式训练题型二 线性回归方程及回归分析例2(2)如图所示的是四个残差图,其中回归模型的拟合效果最好的是
(3)PM2.5是指大气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物).为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某一时间段车流量与PM2.5的数据如表:
①根据上表数据,请在下列坐标系中画出散点图.(2)选项A和B中的残差图都是水平带状分布并且选项B的残差图散点分布集中,在更狭窄的范围内,所以B中回归模型的拟合效果最好.
(3)①散点图如图所示.
【答案】 (1)C (2)B (3)见自主解答方法技巧
(1)求线性回归方程的三个关键点(2)解决线性回归问题的思路
首先通过散点图来分析两变量间是否线性相关,然后利用求回归方程的公式求解回归方程,最后借助回归方程对实际问题进行分析.2.(2018·全国卷Ⅱ)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.◎变式训练解法二 从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
题型三 非线性回归分析例2(2)下表为收集到的一组数据:
①作出x与y的散点图,并猜测x与y之间的关系;
②建立x与y的关系,预报回归模型并计算残差;
③利用所得模型,预报x=40时y的值.
【解析】 (1)由散点图知,此曲线类似对数函数型曲线,可用B项函数进行拟合.
(2)①作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y= 的周围,其中c1、c2为待定的参数.
②对两边取对数把指数关系变为线性关系,令z=ln y,则有变换后的样本点应分布在直线z=bx+a,a=ln c1,b=c2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:
规律总结
非线性回归方程的求法
(1)作散点图:根据原始数据(x,y)作出散点图.
(2)选择函数模型:根据散点图选择恰当的拟合函数.
(3)变换:作恰当的变换,将其转化成线性函数,求线性回归方程.
(4)还原:在(3)的基础上通过相应变换,即可得非线性回归方程.
3.在一次抽样调查中,测得样本的5个样本点的数值如下表:
试写出y与x之间的回归方程.
◎变式训练解析 根据表中的数据作图,其散点图如图所示.
根据散点图可以看出y与t近似地呈线性相关关系,列表如下:◎典题示例易错误区1 对回归直线的性质认识不清典例【答案】 C根据如下样本数据
◎典题试解答案 B本讲结束
请按ESC键返回课后提升案·素养达成