高中数学人教A版选修2-3 3.1 回归分析的基本思想及其初步应用(47张PPT课件+练习)

文档属性

名称 高中数学人教A版选修2-3 3.1 回归分析的基本思想及其初步应用(47张PPT课件+练习)
格式 zip
文件大小 2.2MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2020-03-16 18:25:15

文档简介

3-1
[综合训练·能力提升]
一、选择题(每小题5分,共30分)
1.对于相关系数r叙述正确的是
A.|r|∈(0,+∞),|r|越大,相关程度越大,反之相关程度越小
B.r∈(-∞,+∞),r越大相关程度越大,反之相关程度越小
C.|r|≤1且|r|越接近于1,相关程度越大,|r|越接近于0,相关程度越小
D.以上说法都不对
解析 由相关系数的性质可知|r|≤1,且|r|越接近于1,相关程度越大,|r|越接近于0,相关程度越小.
答案 C
2.若某地财政收入x与支出y满足回归方程=bx+a+ei(单位:亿元)(i=1,2,…),其中=0.8,=2,|ei|<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过
A.10亿元  B.9亿元  C.10.5亿元 D.9.5亿元
解析 =0.8×10+2+ei=10+ei,∵|ei|<0.5,∴<10.5.
答案 C
3.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如下表:




R2
0.98
0.78
0.50
0.85
哪位同学建立的回归模型拟合效果最好?
A.甲 B.乙 C.丙 D.丁
解析 相关指数R2越大,表示回归模型的拟合效果越好.
答案 A
4.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为
A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元
解析 先求,再利用回归直线方程预测.
由题意知,==10,
==8,
∴=8-0.76×10=0.4,
∴当x=15时,=0.76×15+0.4=11.8(万元).
答案 B
5.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
解析 回归方程中x的系数为0.85>0,因此y与x具有正的线性相关关系,A正确;由回归方程系数的意义可知回归直线过样本点的中心(,),B正确;依据回归方程中的含义可知,x每变化1个单位,相应变化约0.85个单位,C正确;用回归方程对总体进行估计不能得到肯定的结论,故D错误.
答案 D
6.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
解析 样本点的中心是(3.5,42),
则=-=42-9.4×3.5=9.1,
所以回归直线方程是=9.4x+9.1,
把x=6代入得=65.5.
答案 B
二、填空题(每小题5分,共15分)
7.已知关于某设备的使用年限x(年)与所支出的维修费用y(万元),有如下统计资料:
使用年限x
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若y对x呈线性相关关系,则线性回归方程=+x表示的直线一定过定点________.
解析 线性回归方程=+x一定过(,).
答案 (4,5)
8.若一个样本的总偏差平方和为80,残差平方和为60,则相关指数R2为________.
解析 回归平方和=总偏差平方和-残差平方和=80-60=20,故R2==0.25或R2=1-=0.25.
答案 0.25
9.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本(单位:元)的资料进行线性回归分析,结果如下:
则销量每增加1 000箱,单位成本下降________元.
解析 由题意知,=≈-1.818 2,=71-(-1.818 2)×≈77.36,=-1.818 2x+77.36,销量每增加1千箱,则单位成本下降1.818 2元.
答案 1.818 2
三、解答题(本大题共3小题,共35分)
10.(10分)某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:
推销员编号
1
2
3
4
5
工作年限x/年
3
5
6
7
9
年推销金额y/万元
2
3
3
4
5
(1)求年推销金额y关于工作年限x的线性回归方程;
(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.
解析 (1)设所求的线性回归方程为=x+,
所以年推销金额y关于工作年限x的线性回归方程为
=0.5x+0.4.
(2)当x=11时,=0.5x+0.4=0.5×11+0.4=5.9(万元).
所以可以估计第6名推销员的年推销金额为5.9万元.
答案 (1)=0.5x+0.4 (2)5.9万元
11.(12分)(2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.
(1)分别利用这两个模型;求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
解析 (1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=-30.4+13.5×19=226.1(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5 t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
12.(13分)已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:
x
14
16
18
20
22
y
12
10
7
5
3
求y对x的回归直线方程,并说明回归模型拟合效果的好坏.
解析 =×(14+16+18+20+22)=18,
=×(12+10+7+5+3)=7.4,
=7.4+1.15×18=28.1,
所以所求回归直线方程是=-1.15x+28.1.
列出残差表
yi-i
0
0.3
-0.4
-0.1
0.2
yi-
4.6
2.6
-0.4
-2.4
-4.4
答案 =-1.15x+28.1 回归模型的拟合效果很好
课件47张PPT。第三章 统计案例§3.1 回归分析的基本思想及初步应用
[课标解读]
1.了解随机误差、残差、残差图的概念.
2.会通过分析残差判断线性回归模型的拟合效果.(难点)
3.掌握建立回归模型的步骤.(重点)
4.通过对典型案例的探究,了解回归分析的基本思想和初步应用.基础知识整合随机变量随机误差解释预报(2)残差图:利用图形来分析残差特性,作图时纵坐标为_____,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.
(3)R2= _____________,R2越接近于1,表示回归效果越好.
残差知识点 线性回归模型
探究1:结合线性回归模型y=bx+a+e,回答下面几个问题,了解与回归模型相关的概念.
(1)现实生活中的两个变量有哪些关系?线性回归模型是用来刻画哪类变量间的模型?
提示 现实生活中的两个变量关系主要有确定性关系与非确定性关系,线性回归模型是用来刻画非确定性关系的模型.
核心要点探究(2)回归分析中,利用线性回归方程求出的函数值是否一定为真实值?
提示 不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值.例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食、是否喜欢运动等.
(3)线性回归方程能否用散点图中的某两点来确定?
探究2:完成下列问题,总结回归分析的几种方法.
(1)有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义,用残差能否判断建立的回归模型是否合理?
提示 残差能对x,y的线性相关性进行检验.残差可以发现原始数据中的可疑数据,如果残差点比较均匀地落在水平的带状区域中说明选用的模型较为合适.
(2)残差分析只是从直观上对模型的模拟效果进行判断,哪些量能从数据角度对模型的模拟效果进行精确预报?题型一 求线性回归方程例1【答案】 (1)A (2)见自主解答●规律总结
求线性回归方程的三个步骤
(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系.
(2)求回归系数:若存在线性相关关系,则求回归系数.
(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明.
1.某种产品的广告费用支出x与销售额y(单位:百万元)之间有如下的对应数据:
(1)画出散点图;
(2)求线性回归方程;
(3)试预测广告费用支出为10百万元时,销售额多大?
◎变式训练解析 (1)散点图如图所示:
(2)列出下表,并用科学计算器进行有关计算:答案 见解析  (1)在判断两个变量y与x是否相关时,选择了4个不同的模型,它们的R2分别为:
模型1的R2为0.98,
模型2的R2为0.80,
模型3的R2为0.50,
模型4的R2为0.25.
其中拟合效果最好的模型是
A.模型1  B.模型2  C.模型3 D.模型4
题型二 线性回归分析例2(2)为研究质量x(单位:g)对弹簧长度y(单位:cm)的影响,对不同重量的6个物体进行测量,数据如表所示:
①作出散点图并求回归直线方程.
②求出R2.
③进行残差分析.
【自主解答】 (1)R2能够刻画出用回归模型拟合数据的效果,R2的值越接近于1,说明回归模型拟合数据的效果越好,故选A.
(2)①散点图如图.
●规律总结
1.分析回归模型的拟合效果的方法及注意点
(1)残差分析:当资料点较少时,也可以利用残差表进行残差分析,注意计算数据要认真细心,残差分析要全面.
(2)R2:用R2来比较模型的拟合效果,R2越大,模型的拟合效果越好,并不是R2越小拟合效果越好.
2.建立回归模型的基本步骤
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).
(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程).
(4)按一定规则(如最小二乘法)估计回归方程中的参数.
(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大或残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等.◎变式训练答案 (1)的拟合效果好于
(2)的拟合效果. 在一次抽样调查中测得样本的5个样本点,数值如下表:
试建立y与x之间的回归方程.
题型三 非线性回归分析例3【自主解答】 作出变量y与x之间的散点图,如图所示.
作出y与t的散点图,如图所示:
●规律总结
非线性回归分析的步骤
非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:
3.某电容器充电后,电压达到100 V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式U=Aebt(b<0)表示,现测得时间t(s)时的电压U(V)如下表:
试求:电压U对时间t的回归方程.(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)
◎变式训练试求:电压U对时间t的回归方程.(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)
◎典题示例易错误区(十一) 对回归直线的性质认识不清典例【答案】 C[易错防范]
1.误认为回归直线不一定过样本中心点,导致无法判断二者的关系,错选D.
2.牢固掌握基础知识,如本例中要真正理解回归直线经过样本的中心点,避免错误的发生.
已知x与y之间的一组数据:
?
◎典题试解答案 D本讲结束
请按ESC键返回综合训练·能力提升