人教A版数学选修1-2 1.1 回归分析的基本思想及其初步应用(课件70张PPT+练习)

文档属性

名称 人教A版数学选修1-2 1.1 回归分析的基本思想及其初步应用(课件70张PPT+练习)
格式 zip
文件大小 5.9MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2019-11-15 15:21:32

文档简介

第一章 1.1 
A级 基础巩固
一、选择题
1.对变量x、y有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量u、v有观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断( C )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
[解析] 图①中的数据y随x的增大而减小,因此变量x与y负相关;图②中的数据随着u的增大,v也增大,因此变量u与v正相关,故选C.
2.某公司为确定明年投入某产品的广告支出,对近5年的广告支出m(单位:百万元)与销售额y(单位:百万元)进行了初步统计,得到下列表格中的数据:
y
30
40
p
50
70
m
2
4
5
6
8
经测算,年广告支出m与年销售额y满足线性回归方程=6.5m+17.5,则p的值为( D )
A.45   B.50
C.55   D.60
[解析] ==5,
∴=6.5×5+17.5=50,
∴=50,解得p=60.
故选D.
3.已知x和y之间的一组数据
x
0
1
2
3
y
1
3
5
7
则y与x的线性回归方程=x+必过点( D )
A.(2,2)   B.(,0)
C.(1,2)   D.(,4)
[解析] ∵=(0+1+2+3)=,=(1+3+5+7)=4,∴回归方程=x+必过点(,4).
4.关于随机误差产生的原因分析正确的是( D )
(1)用线性回归模型来近似真实模型所引起的误差;
(2)忽略某些因素的影响所产生的误差;
(3)对样本数据观测时产生的误差;
(4)计算错误所产生的误差.
A.(1)(2)(4)   B.(1)(3)
C.(2)(4)   D.(1)(2)(3)
[解析] 理解线性回归模型y=bx+a+e中随机误差e的含义是解决此问题的关键,随机误差可能由于观测工具及技术产生,也可能因忽略某些因素产生,也可以是回归模型产生,但不是计算错误.
5.一位母亲记录了儿子3~9岁的身高,数据(略),由此建立的身高与年龄的回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( C )
A.身高一定是145.83 cm   B.身高在145.83 cm以上
C.身高在145.83 cm左右   D.身高在145.83 cm以下
[解析] 将x的值代入回归方程=7.19x+73.93时,得到的值是年龄为x时,身高的估计值,故选C.
6.已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程为=x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( C )
A.>b′,>a′   B.>b′,C.a′   D.[解析] 本题考查线性回归方程,考查运算能力.
由公式=求得=,代入(,)求得=-,而由两点确定的方程为y=2x-2,∴a′.
二、填空题
7.在一组样本数据(x1,y1)、(x2,y2)、…、(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为__1__.
[解析] 因为所有的样本点都落在一条直线上,所以相关系数|r|=1,又由回归方程为y=x+1,说明x与y正相关,即r>0,所以r=1.
8.(2019·山东枣庄三中高二月考)某公司未来对一种新产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
4
5
6
7
8
9
销量y(件)
90
84
83
80
75
68
由表中数据,求得线性回归方程为=-4x+,当产品销量为76件时,产品定价大致为__7.5__元.
[解析] ==6.5,
==80.
∵线性回归直线=-4x+过点(6.5,80),∴80=-4×6.5+,
∴=106,∴=-4x+106.
当=76时,76=-4x+106,
∴x=7.5.
∴当产品销量为76件时,产品定价大致为7.5元.
三、解答题
9.某电脑公司有6名产品推销员,其工作年限与年推销金额的数据如下表:
推销员编号
1
2
3
4
5
工作年限x/年
3
5
6
7
9
推销金额y/万元
2
3
3
4
5
(1)以工作年限为自变量,推销金额为因变量y,作出散点图;
(2)求年推销金额y关于工作年限x的线性回归方程;
(3)若第6名推销员的工作年限为11年,试估计他的年推销金额.
[解析] (1)依题意,画出散点图如图所示.
(2)从散点图可以看出,这些点大致在一条直线附近,设所求的线性回归方程为=x+.
则===0.5,=- =0.4,
∴年推销金额y关于工作年限x的线性回归方程为=0.5x+0.4.
(3)由(2)可知,当x=11时,
=0.5x+0.4=0.5×11+0.4=5.9(万元).
∴可以估计第6名推销员的年销售金额为5.9万元.
B级 素养提升
一、选择题
1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为( B )
A.11.4万元   B.11.8万元
C.12.0万元   D.12.2万元
[解析] ==10,
==8,
=-=8-0.76×10=0.4,
所以当x=15时,=x+=11.8.
2.某学校开展研究性学习活动,某同学获得一组实验数据如下表:
x
1.99
3
4
5.1
6.12
y
1.5
4.04
7.5
12
18.01
对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是( D )
A.y=2x-2   B.y=()x
C.y=log2x   D.y=(x2-1)
[解析] 可以代入检验,当x取相应的值时,所求y与已知y相差平方和最小的便是拟合程度最高的.
二、填空题
3.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加__0.254__万元.
[解析] 由题意知其回归系数为0.254,故家庭年收入每增加1万元,年饮食支出平均增加0.254万元.
4.某市居民2014~2018年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表:
年份
2014
2015
2016
2017
2018
收入x
11.5
12.1
13
13.5
15
支出Y
6.8
8.8
9.8
10
12
根据统计资料,居民家庭年平均收入的中位数是__13__,家庭年平均收入与年平均支出有__正__线性相关关系.
[解析] 把2014~2018年家庭年平均收入按从小到大顺序排列为11.5,12.1,13,13.5,15,因此中位数为13(万元),由统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.
三、解答题
5.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2010
2011
2012
2013
2014
时间代号t
1
2
3
4
5
储蓄存款y(千亿元)
5
6
7
8
10
(1)求y关于t的回归方程=t+;
(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.
附:回归方程=t+中,
=,=- .
[解析] (1)
序号
t
y
t2
ty
1
1
5
1
5
2
2
6
4
12
3
3
7
9
21
4
4
8
16
32
5
5
10
25
50
15
36
55
120
由上表,=3,==7.2,=55,iyi=120.
∴==1.2.
=-=7.2-1.2×3=3.6.
∴所求回归直线方程=1.2t+3.6.
(2)当t=6时,代入=1.2×6+3.6=10.8(千亿元).
∴预测该地区2015年的人民币储蓄存款为10.8千亿元.
6.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:
房屋面积(m2)
115
110
80
135
105
销售价格(万元)
24.8
21.6
18.4
29.2
22
(1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线;
(3)据(2)的结果估计当房屋面积为150 m2时的销售价格.
[解析] (1)数据对应的散点图如下图所示:
(2)=xi=109,lxx= (xi-)2=1 570,
=23.2,lxy= (xi-)(yi-)=308.
设所求回归直线方程为=x+,
则==≈0.196 2,=-=1.816 6.
故所求回归直线方程为=0.196 2x+1.816 6.
(3)据(2),当x=150 m2时,销售价格的估计值为
=0.196 2×150+1.816 6=31.246 6(万元).
故估计当房屋面积为150 m2时的销售价格为31.2万元.
7.(2018·全国卷Ⅱ理,18)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
[解析] (1)利用模型①,可得该地区2018年的环境基础设施投资额的预测值为=-30.4+13.5×19=226.1(亿元).
利用模型②,可得该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
课件70张PPT。第一章统计案例哲学知识告诉我们事物之间是有联系的、联系是普遍的,任何事物都是运动的、任何两个事物之间都存在着普遍联系.具体到现实问题中,我们会发现有些问题是从变化的角度来分析是存在两个都在变化的量,关系非常密切,一个现象发生一定量的变化,另一个现象一般也会发生相应的变化,但又不能用函数概念去定义,也无法用函数的模型来代换.如商场销售收入每增加一万元时,因所卖商品不同,销售利润一般会增加不同的数值;施肥量增加一斤,一般地产量也会增加,但数值有时不固定.5月31日是世界无烟日.有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手.这些疾病与吸烟有关的结论是怎样得出的呢?若从数学角度分析,这里的疾病和吸烟就是彼此相关的两个变量.
如何用数学的方法来刻画这种变量之间的关系呢?本章要学习的统计案例就是通过对一对变量使用线性回归的方法来研究变量之间的对应关系.通过本章的学习,我们将知道如何研究变量之间的相关关系,如何模拟变量之间的函数关系,如何检验两个变量之间的独立性.1.1 回归分析的基本思想及其初步应用自主预习学案
人们常说“名师出高徒”.的确,我们看到很多优秀的老师,他们的学生也非常优秀.但是,名师一定出高徒吗?我们也看到,有些名师的弟子并不高明,甚至比较平庸.
由此可见,名师和高徒之间不是确定性的关系,也不可否认它们之间有着密切的关系,或者说它们之间是密切相关的,但相关性怎样呢?1.回归分析
(1)概念:回归分析是对具有相关关系的两个变量进行统计分析一种常用方法.
(2)步骤:画__________→求____________→用回归方程进行________.散点图 回归方程 预报 样本中心点 随机误差 解释 预报 3.刻画回归效果的方式残差 样本编号 身高数据 体重估计值 越窄 越小 解释 预报 1.下列结论正确的是(  )
①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
A.①②   B.①②③
C.①②④   D.①②③④
[解析] 函数关系和相关关系的区别是前者是确定性关系,后者是非确定性关系,故①②正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,故③错误,④正确.故选C.C  A  3.下图是根据变量x、y的观测数据(xi,yi)(i=1,2,…,10)得到的散点图,由这些散点图可以判断变量x、y具有相关关系的图是(  )
A.①②  
B.①④
C.②③  
D.③④
[解析] 根据散点图中点的分布情况,可判断③④中的变量x,y具有相关的关系.D  4.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线方程是__________________________.互动探究学案命题方向1 ?概念的理解和判断典例 1 C  [思路分析] 由题目可获取以下信息:①线性回归分析;②散点图;③相关性检验等的相关概念及意义.
解答本题可先逐一核对相关概念及其性质,然后再逐一作出判断,最后得出结论.『规律方法』 解答概念辨析题,应紧扣线性回归分析中每个概念的定义进行,要准确把握概念的内涵.〔跟踪练习1〕 
下面变量关系是相关关系的是(   )
①学生的学习态度与学习成绩之间的关系;
②教师的执教水平与学生的学习成绩之间的关系;
③学生的身高与学生的学习成绩之间的关系;
④家庭的经济条件与学生的学习成绩之间的关系.
A.①② B.①③
C.②③ D.②④
[解析] ①②是相关关系,③④是非相关关系.A   某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:
(1)画出散点图;
(2)求y关于x的回归方程.命题方向2 ?线性回归模型典例 2 [解析] (1)散点图如图所示.(2)列出下表,并用科学计算器进行有关计算.A  命题方向3 ?线性回归分析典例 3 [解析] (1)作出该运动员训练次数(x)与成绩(y)的散点图,如图所示.由散点图可知,它们之间具有相关关系.(3)残差分析:下面的表格列出了运动员训练次数和成绩的原始数据以及相应的残差数据.『规律方法』 1.解答本类题目应先通过散点图来分析两个变量间的关系是否线性相关,再利用求回归方程的公式求解回归方程,并利用残差图或R2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.
(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报精度越高[解析] (1)由x、y的数据得散点图如图.(2)作出残差图如图,横坐标为零件数的数据,纵坐标为残差.(3)由题中数据可得样本相关系数r的值为0.999 8,再结合散点图可以说明x与y有很强的线性相关关系.由R2的值可以看出回归效果很好,也说明用线性回归模型拟合数据效果很好.
由残差图也可以观察到,第4个样本点和第5个样本点的残差比较大,需要确认在采集在这两个样本点的过程中是否有人为的错误.准确理解概念和参数的含义 典例 4
[辨析] 明确R2的大小与拟合效果的关系
用相关指数R2来比较模型的拟合效果,R2越大,模型的拟合效果越好,并不是R2越小模型的拟合效果越好.D  当回归方程不是形如y=bx+a(a、b∈R)时,称之为非线性回归方程 ,非线性回归方程也可以线性化,依据样本点的分布态式选择合适的曲线方程来拟合数据,其具体步骤如下:
(1)作散点图确定曲线模型
因为曲线所对应的函数种类繁多,这就要求我们充分想象,大胆猜测拟合函数类型,估计使用哪个函数拟合.可线性化的回归分析 (3)分析模型的拟合效果
对于同一问题可以有几种不同的拟合模型,对于给定的样本点(x1,y1),(x2,y2),…,(xn,yn),可以通过以下几种方式确定选用哪种模型更合适.
①可以根据转换后的对应数据作散点图来确定线性回归的拟合情况,判断使用哪一种曲线模型较为合适.
②可以通过原始数据及y和x之间的非线性回归方程列出残差对比分析表,一般通过残差平方和比较两种模型的拟合效果,其中残差平方和较小的拟合效果较好.
③还可以用R2来比较模型的拟合效果,R2越大(越接近1),拟合效果越好. 在一化学反应过程中,某化学物质的反应速率y(g/min)与一种催化剂的量x(g)有关,现收集了如下表所示的8组数据,试建立y与x之间的回归方程.
[解析] 根据收集的数据作散点图如图.典例 5 『规律方法』 解决非线性回归问题的具体做法是:(1)若问题中已给出经验公式,可以将解释变量进行变换(换元),将变量的非线性关系转化为线性关系,将问题转化为线性回归分析问题解决.(2)若问题中没有给出经验公式,需要画出已知数据的散点图,通过与各种函数(指数函数、对数函数、幂函数等)的图象作比较,选择与这些散点拟合最好的函数,然后采用适当的变量变换,将问题转化为线性回归问题解决.[解析] 相关指数R2越大,表示回归模型的效果越好.A  C  3.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立的做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是(  )
A.l1和l2有交点(s,t)
B.l1与l2相交,但交点不一定是(s,t)
C.l1与l2必定平行
D.l1与l2必定重合
[解析] 由题意知(s,t)是甲、乙两位同学所做试验的样本点的中心,而线性回归直线恒过样本点的中心,故选A.A  6.5 [解析] (1)散点图如图所示:课时作业学案