北师大版数学选修1-2 §1.1 回归分析54张PPT+67张PPT

文档属性

名称 北师大版数学选修1-2 §1.1 回归分析54张PPT+67张PPT
格式 zip
文件大小 12.8MB
资源类型 教案
版本资源 北师大版
科目 数学
更新时间 2019-11-23 11:58:56

文档简介

第一章 §1 第1课时
A级 基础巩固
一、选择题
1.对变量x、y有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量u、v有观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断( C )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
[解析] 图1中的数据y随x的增大而减小,因此变量x与y负相关;图2中的数据随着u的增大,v也增大,因此变量u与v正相关,故选C.
2.已知x和y之间的一组数据
x
0
1
2
3
y
1
3
5
7
则y与x的线性回归方程=x+必过点( D )
A.(2,2)       B.(,0)
C.(1,2) D.(,4)
[解析] ∵=(0+1+2+3)=,=(1+3+5+7)=4,∴回归方程=x+必过点(,4).
3.关于回归分析,下列说法错误的是( D )
A.回归分析是研究两个具有相关关系的变量的方法
B.散点图中,解释变量在x轴,预报变量在y轴
C.回归模型中一定存在随机误差
D.散点图能准确反应变量间的关系
[解析] 用散点图反映两个变量间的关系,存在误差,故选D.
4.在回归分析中,相关指数R2的值越大,说明残差平方和( B )
A.越大 B.越小
C.可能大也可能小 D.以上均错
[解析] 当R2越大时,残差平方和越小.
5.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是( A )
A.l1和l2有交点(s,t)
B.l1与l2相关,但交点不一定是(s,t)
C.l1与l2必定平行
D.l1与l2必定重合
[解析] 由题意知(s,t)是甲、乙两位同学所做试验的样本点的中心,而线性回归直线恒过样本点的中心,故选A.
6.关于随机误差产生的原因分析正确的是( D )
(1)用线性回归模型来近似真实模型所引起的误差;
(2)忽略某些因素的影响所产生的误差;
(3)对样本数据观测时产生的误差;
(4)计算错误所产生的误差.
A.(1)(2)(4) B.(1)(3)
C.(2)(4) D.(1)(2)(3)
[解析] 理解线性回归模型y=bx+a+e中随机误差e的含义是解决此问题的关键,随机误差可能由于观测工具及技术产生,也可能因忽略某些因素产生,也可以是回归模型产生,但不是计算错误.
二、填空题
7.回归分析是处理变量之间__相关__关系的一种数量统计方法.
[解析] 回归分析是处理变量之间相关关系的一种数量统计方法.
8.(2019·山东枣庄三中高二月考)某公司未来对一种新产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
4
5
6
7
8
9
销量y(件)
90
84
83
80
75
68
由表中数据,求得线性回归方程为=-4x+,当产品销量为76件时,产品定价大致为__7.5__元.
[解析] ==6.5,
==80.
∵线性回归直线=-4x+过点(6.5,80),∴80=-4×6.5+,
∴=106,∴=-4x+106.
当=76时,76=-4x+106,
∴x=7.5.
∴当产品销量为76件时,产品定价大致为7.5元.
三、解答题
9.某电脑公司有6名产品推销员,其工作年限与年推销金额的数据如下表:
推销员编号
1
2
3
4
5
工作年限x/年
3
5
6
7
9
推销金额y/万元
2
3
3
4
5
(1)以工作年限为自变量,推销金额为因变量y,作出散点图;
(2)求年推销金额y关于工作年限x的线性回归方程;
(3)若第6名推销员的工作年限为11年,试估计他的年推销金额.
[解析] (1)依题意,画出散点图如图所示,
(2)从散点图可以看出,这些点大致在一条直线附近,设所求的线性回归方程为=x+.
则===0.5,=- =0.4,
∴年推销金额y关于工作年限x的线性回归方程为=0.5x+0.4.
(3)由(2)可知,当x=11时,
=0.5x+0.4=0.5×11+0.4=5.9(万元).
∴可以估计第6名推销员的年销售金额为5.9万元.
B级 素养提升
一、选择题
1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为( B )
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
[解析] ==10,
==8,
=-=8-0.76×10=0.4,
所以当x=15时,=x+=11.8.
2.某产品的广告费用x与销售额y的统计数据如下表
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( B )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
[解析] 此题必须明确回归直线方程过定点(,).
易求得=3.5,=42,则将(3.5,42)代入=x+中得:42=9.4×3.5+,即=9.1,则=9.4x+9.1,所以当广告费用为6万元时销售额为9.4×6+9.1=65.5万元.
3.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( D )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
[解析] 本题考查线性回归方程.
D项中身高为170 cm时,体重“约为”58.79,而不是“确定”,回归方程只能作出“估计”,而非确定“线性”关系.
4.假设学生在初一和初二的数学成绩是线性相关的,若10个学生初一和初二的数学期末考试分数如下(分别为x,y):
x
74
71
72
68
76
73
67
70
65
74
y
76
75
71
70
76
79
65
77
62
72
则初一和初二数学考试分数间的回归直线方程为( D )
A.y=1.218 2x+14.192 B.y=1.218 2+14.192x
C.y=1.218 2-14.192x   D.y=1.218 2x-14.192
[解析] 由表中数据可得=71,=72.3,因为回归直线一定经过点(,),经验证只有D满足条件.
二、填空题
5.已知两个变量x和y之间有线性相关性,5次试验的观测数据如下表:
x
100
120
140
160
180
y
45
54
62
75
92
那么变量y关于x的回归方程是__=0.575x-14.9 .
[解析] 根据公式计算可得=0.575,=-14.9,所以回归直线方程是=0.575x-14.9.
6.某市居民2014—2018年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表:
年份
2014
2015
2016
2017
2018
收入x
11.5
12.1
13
13.5
15
支出Y
6.8
8.8
9.8
10
12
根据统计资料,居民家庭年平均收入的中位数是__13__,家庭年平均收入与年平均支出有__正__线性相关关系.
[解析] 把2014—2018年家庭年平均收入按从小到大顺序排列为11.5,12.1,13,13.3,15,因此中位数为13(万元),由统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.
三、解答题
7.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率Y之间的关系:
时间x
1
2
3
4
5
命中率Y
0.4
0.5
0.6
0.6
0.4
求:(1)小李这5天的平均投篮命中率;
(2)用线性回归分析的方法,预测小李每月6号打篮球6小时的投篮命中率.
[解析] (1)取x1=1,x2=2,x3=3,x4=4,x5=5;
y1=0.4,y2=0.5,y3=0.6,y4=0.6,y5=0.4.
这5天的平均投篮命中率为
===0.5,
(2)∵===3,
∴==0.01,
∴=0.5-0.01×3=0.47,
从而得回归直线方程为=0.01x+0.47,
令x=6得=0.53.
预测小李每月6号打篮球6小时的投篮命中率为0.53.
8.(2018·全国卷Ⅱ理,18)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值.
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
[解析] (1)利用模型①,可得该地区2018年的环境基础设施投资额的预测值为=-30.4+13.5×19=226.1(亿元).
利用模型②,可得该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
课件67张PPT。第一章统计案例●情景导学
哲学知识告诉我们事物之间是有联系的、联系是普遍的,任何事物都是运动的、任何两个事物之间都存在着普遍联系.具体到现实问题中,我们会发现有些问题是从变化的角度来分析是存在两个都在变化的量,关系非常密切,一个现象发生一定量的变化,另一个现象一般也会发生相应的变化,但又不能用函数概念去定义,也无法用函数的模型来代言.如商场销售收入每增加一万元时,因所卖商品不同,销售利润一般会增加不同的数值;施肥量增加一斤,一般地产量也会增加,但值有时不固定.5月31日是世界无烟日.有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手.这些疾病与吸烟有关的结论是怎样得出的呢?若从数学角度区分,这里的疾病和吸烟就是彼此相关的两个变量.如何用数学的方法来刻画这种变量之间的相关关系呢?如何用数学方法说明两个变量是相互独立的?这就是本章所要研究的问题.
●学法探究
本章内容是统计案例中常见方法中的两种:回归分析和独立性的检验.通过对典型案例的学习,理解问题和方法的实质,进一步体会统计方法在解决实际问题中的基本思想.在学习过程中多与社会实践相结合,亲自动手实践,加深对知识的认识.学习时应注意以下几点:
1.注意用最小二乘法建立变量之间线性回归方程的方法的学习,理解用散点图判断变量之间近似成线性相关关系及用线性相关系数刻画变量之间线性相关程度.
2.非线性回归方程可转化为线性回归方程来解决,转化时要熟悉几种常见的函数拟合模型,理解非线性方程与线性方程变量间的关系.
3.牢记χ2统计量的计算公式,理解独立性检验的思想,对实际问题作出统计推断.§1 回归分析第1课时 回归分析 相关系数自主预习学案
1.变量之间的相关关系
(1)变量之间有一定的联系,但不能完全用函数来表达.如人的体重y与身高x.一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系.相关关系是非确定性关系,因变量的取值具有一定的__________.
(2)在考虑两个变量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常把这种图叫作变量之间的__________.随机性 散点图 相关关系 线性回归分析 3.线性相关系数
(1)线性相关系数
假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(xn,yn),则变量间线性相关系数r的计算公式如下:
r=______________________________=______________________________.(2)r的绝对值对相关性的影响:
|r|值越大,误差Q越小,变量之间线性相关程度越高;|r|值越小,误差Q越大,变量之间线性相关程度越低;当r=0时,两个变量线性不相关.
(3)r的正负对相关性的影响:
r>0时,b>0,两个变量的值总体上呈现同时增减的趋势,此时称两个变量正相关;
r<0时,b<0,当一个变量增加时,另一个变量有减少的趋势,此时称两个变量负相关.1.关于散点图要注意以下方面:
散点图可以说明变量间有无线性相关关系,相关的方向,但不能精确地说明两个变量之间关系的密切程度,因此需要计算相关系数来描述两个变量之间关系的密切程度.
2.相关关系与函数关系
(1)两者之间的不同点
①相关关系是一种非确定性关系.即相关关系是非随机变量与随机变量之间的关系.如人的身高与年龄;商品的销售额与广告费等都是相关关系,而函数关系中的两个变量是一种确定性关系.如正方形的面积S与边长x之间的关系S=x2就是函数关系,即对于边长x的每一个确定的值,都有面积S的唯一确定的值与之对应.②函数关系是一种因果关系,而相关关系不一定是因果关系.如有人发现,对于在校儿童,身高与阅读能力有很强的相关关系,然而学会新词并不能使儿童马上长高,而是涉及第三个因素——年龄,当儿童长大一些,他们的阅读能力会提高,而由于长大身高也会高一些.
(2)两者之间的联系
相关关系与函数关系有着密切的联系,在一定条件下可以相互转化.例如正方形的面积S与其边长x之间虽然是一种确定性关系,但在每次测量时,由于测量误差等原因,其数值大小又表现出一种随机性,而对于具有线性关系的两个变量来说,当求得其回归直线方程后,我们又可以用一种确定的关系对这两个变量间的关系进行估计.3.求回归系数a、b的具体步骤和方法
(1)列表,将所给的数据x、y列成相应的表格,如下表所示:1.下列结论正确的是(  )
①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
A.①②         B.①②③
C.①②④ D.①②③④
[解析] 函数关系和相关关系的区别是前者是确定性关系,后者是非确定性关系,故①②正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,故③错误,④正确.故选C.CC A 4.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是(  )
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
[解析] 因为y=-0.1x+1,-0.1<0,所以x与y负相关.又y与z正相关,故可设z=ay+b(a>0),所以z=-0.1ax+a+b,-0.1a<0.所以x与z负相关.故选C.C5.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线方程是__________________.6.已知某种商品的价格x(元)与需求量y(件)之间的关系如以下一组数据:
求y对x的回归直线方程,并说明回归模型拟合效果的好坏.互动探究学案命题方向1 ?概念的理解和判断C [思路分析] 由题目可获取以下信息:①线性回归分析;②散点图;③相关性检验等的相关概念及意义.
解答本题可先逐一核对相关概念及其性质,然后再逐一作出判断,最后得出结论.『规律方法』 解答概念辨析题,应紧扣线性回归分析中每个概念的定义进行,要准确把握概念的内涵.〔跟踪练习1〕
下面变量关系是相关关系的是(  )
①学生的学习态度与学习成绩之间的关系;
②教师的执教水平与学生的学习成绩之间的关系;
③学生的身高与学生的学习成绩之间的关系;
④家庭的经济条件与学生的学习成绩之间的关系.
A.①② B.①③
C.②③ D.②④
[解析] ①②是相关关系,③④是非相关关系.A命题方向2 ?求线性回归方程
A 命题方向3 ?利用相关系数检验两个变量间的相关性[解析] (1)利用题中给出的数据得到散点图为:
从散点图中可以发现:样本点大致分布在一个条形区域内,因此我们认为广告投入x和销售额y之间具有线性相关关系.但是这种判断的准确度我们无法给出.
[分析] 可以把训练次数和成绩分别作为表格的列,另外加上x、y、xiyi三列,并在表格的底部进行合计,得到相关统计量,再代入求相关系数r的公式求得r.[解析] 如下表所示:准确理解概念和参数的含义
[辨析] 明确R2的大小与拟合效果的关系
用相关指数R2来比较模型的拟合效果,R2越大,模型的拟合效果越好,并不是R2越小模型的拟合效果越好.哪位同学的试验结果体现A,B两变量关系的模型拟合精度高?(  )
A.甲   B.乙  
C.丙   D.丁D线性回归分析 [解析] (1)散点图如下图所示:(3)由表中数据可以看出误差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力呈线性关系.由误差表中的数值可以看出第3个样本点的误差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型.『规律方法』 1.线性回归分析的过程:
(1)随机抽取样本,确定数据,形成样本点;
(2)由样本点形成散点图,判定是否具有线性相关关系;
(3)由最小二乘法求线性回归方程;
(4)进行误差分析,分析模型的拟合效果,不合适时,分析错因,予以纠正;
(5)依据回归方程作出预报.
2.用散点图可粗略判断两个变量间有无线性相关关系,用相关指数R2可以描述两个变量之间的密切程度.1.在画两个变量的散点图时,下列叙述正确的是(  )
A.预报变量在x轴上,解释变量在y轴上
B.解释变量在x轴上,预报变量在y轴上
C.可以选择两个变量中任意一个变量在x轴上
D.可以选择两个变量中任意一个变量在y轴上B2.下列哪些变量是相关关系(  )
A.出租车车费与行驶的路程
B.房屋面积与房屋价格
C.人的身高与体重
D.铁块的大小与质量
3.已知某人加工零件的个数x与花费时间y(h)之间的线性回归方程为=0.01x+0.5,则加工600个零件大约需要___________h.C6.5 4.已知某商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:
(1)画出y关于x的散点图;
(2)求出回归直线方程;
(3)计算R2的值,并说明回归模型拟合程度的好坏.[解析] 散点图如图所示:课 时 作 业 学 案第一章 §1 第2课时
A级 基础巩固
一、选择题
1.由一组数据(x1,y1),(x2,y2),…,(xn,yn)得到的回归直线方程=x+,则下列说法不正确的是( B )
A.直线=x+必过点(,)
B.直线=x+至少经过点(x1,y1)(x2,y2)…(xn,yn)中的一个点
C.直线=x+的斜率为
D.直线=x+和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差是该坐标平面上所有直线与这些点的偏差中最小的直线
2.对于指数曲线y=aebx,令u=lny,c=lna,经过非线性化回归分析之后,可以转化成的形式为( A )
A.u=c+bx B.u=b+cx
C.y=b+cx D.y=c+bx
[解析] 对方程y=aebx两边同时取对数,然后将u=lny,c=lna代入,不难得出u=c+bx.
3.某学校开展研究性学习活动,某同学获得一组实验数据如下表:
x
1.99
3
4
5.1
6.12
y
1.5
4.04
7.5
12
18.01
对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是( D )
A.y=2x-2 B.y=()x
C.y=log2x D.y=(x2-1)
[解析] 代入检验,当x取相应的值时,所得y值与已知数据差的平方和最小的便是拟合程度最高的.
4.下列数据符合的函数模型为( D )
x
1
2
3
4
5
6
7
8
9
10
y
2
2.69
3
3.38
3.6
3.8
4
4.08
4.2
4.3
A.y=2+x      B.y=2ex
C.y=2e D.y=2+lnx
[解析] 分别将x的值代入解析式判断知满足y=2+lnx.
二、填空题
5.在两个变量的回归分析中,作散点图的目的是__从散点图中看出数据的大致规律,再根据这个规律选择适当的函数进行拟合__;相关系数是度量__两个变量之间线性相关程度__的量.
6.若回归直线方程中的回归系数b=0时,则相关系数r的值为__0__.
[解析] 若b=0,则iyi-n  =0,∴r=0.
三、解答题
7.某工厂今年1~4月份生产某种产品的数量分别是1万件、1.2万件、1.3万件、1.37万件.为了估测以后每个月的产量,可用函数y=aebx来模拟该产品的月产量y(万件)与月份x的关系,求模拟函数.
[解析] 设μ=lny,c=lna,则μ=c+bx.
月份x
1
2
3
4
产量y(万件)
1
1.2
1.3
1.37
x
1
2
3
4
μ
0
0.182 3
0.262 4
0.314 8
i=10,i=0.759 5,=30,≈0.201 2,
iμi=2.411,=2.5,≈0.189 9,相关系数r=
≈
≈0.959 7,相关程度较强.
b=≈=0.102 4,c=-b≈0.189 9-0.102 4×2.5=-0.066 1,
所以μ=-0.066 1+0.102 4x,y=e-0.066 1+0.0102 4x.
B级 素养提升
一、选择题
1.我国1990—2000年的国内生产总值如下表所示:
年份
1990
1991
1992
1993
1994
1995
产值/亿元
18 598.4
21 662.5
26 651.9
34 560.5
46 670.0
57 494.9
年份
1996
1997
1998
1999
2000
产值/亿元
66 850.5
73 142.7
76 967.1
80 422.8
89 404.0
则反映这一时期国内生产总值发展变化的函数模型可能为( B )
A.y=aekx B.y=a+bx
C.y=axb D.y=ae
[解析] 画出散点图,观察可用y=a+bx刻画国内生产总值发展变化的趋势.
2.设由线性相关的样本点(x1,y1),(x2,y2),(x3,y3),…,(xn,yn),求得的回归直线方程为=bx+a,定义残差ei=yi-i=yi-bxi-a,i=1,2,…,n,残差平方和m=e+e+…+e.已知甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:




r
0.82
0.78
0.69
0.85
m
106
115
124
103
则哪位同学的试验结果体现A、B两变量有更强的线性相关性( D )
A.甲 B.乙
C.丙 D.丁
[解析] r越接近1,相关性越强,残差平方和m越小,相关性越强,故选D.
二、填空题
3.若一函数模型为y=ax2+bx+c(a≠0),则作变换t=__(x+)2 才能转为y是t的线性回归方程.
[解析] ∵y=ax2+bx+c=a(x+)2+,∴令t=(x+)2,则y=at+,此时y为t的线性回归方程.
4.若x、y满足
x
-2
-1.5
-1
-0.5
0
0.5
1
y
0.27
0.45
0.73
1.21
1.99
3.30
5.44
则可用来描述x与y之间关系的函数解析式为__y=2ex__.
[解析] 画出散点图,形如y=a·ebx,其中a≈2,b≈1.
∴y=2ex.
5.若x、y满足
x
0.1
0.2
0.3
0.5
1
2
3
4
5
y
20
9
6
4
2
0.94
0.65
0.51
0.45
则可用来描述x与y之间关系的函数解析式为__y= .
[解析] 画出散点图,观察图像形如y=,通过计算知b≈2,∴y=.
三、解答题
6.如下表所示,某地区一段时间内观察到的大于或等于某震级x的地震次数为N,试建立N对x的回归方程,并表述二者之间的关系.
震级
3
3.2
3.4
3.6
3.8
4
4.2
4.4
地震数
28 381
20 380
14 795
10 695
7 641
5 502
3 842
2 698
震级
4.6
4.8
5.0
5.2
5.4
5.6
5.8
6
地震数
1 919
1 356
973
746
604
435
274
206
震级
6.2
6.4
6.6
6.8
7
地震数
148
98
57
41
25
[解析] 由表中数据得散点图如图1.从散点图中可以看出,震级x与大于或等于该震级的地震次数N之间呈现出一种非线性的相关性,随着x的减少,所考察的地震数N近似地以指数形式增长.于是令y=lgN.得到的数据如下表所示.
图1
x
3
3.2
3.4
3.6
3.8
4
4.2
4.4
y
4.453
4.309
4.170
4.029
3.883
3.741
3.585
3.431
x
4.6
4.8
5.0
5.2
5.4
5.6
5.8
6
y
3.283
3.132
2.988
2.873
2.781
2.638
2.438
2.314
x
6.2
6.4
6.6
6.8
7
y
2.170
1.991
1.756
1.613
1.398
x和y的散点图如图2.
图2
从散点图2中可以看出x和y之间有很强的线性相关性,因此由最小二乘法得a≈6.704,b≈-0.741,故线性回归方程为y=-0.741x+6.704.因此,所求的回归方程为:lgN=-0.741x+6.704,故=10-0.741x+6.704.
7.下表所示是一组试验数据:
x
0.5
0.25

0.125
0.1
y
64
138
205
285
360
(1)作出散点图,并猜测y与x之间的关系;
(2)利用所得的函数模型,预测x=10时y的值.
[解析] (1)散点图如图所示,从散点图可以看出y与x不具有线性相关关系.
根据已有知识发现样本点分布在函数y=+a的图像的周围,其中a,b为待定参数.令x′=,y′=y,由已知数据制成下表:
序号i
xi′
yi′
x′
y′
x′iy′i
1
2
64
4
4 096
128
2
4
138
16
19 044
552
3
6
205
36
42 025
1 230
4
8
285
64
81 225
2 280
5
10
360
100
129 600
3 600

30
1 052
220
275 990
7 790
′=6,′=210.4,故′-5(′)2=40,′-5′2=54 649.2,r=≈0.999 7,由于r非常接近于1,
∴x′与y′具有很强的线性关系,计算知b≈36.95,a=210.4-36.95×6=-11.3,
∴y′=-11.3+36.95x′,
∴y对x的回归曲线方程为y=-11.3.
(2)当x=10时,y=-11.3=-7.605.
C级 能力提高
1.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:
房屋面积(m2)
115
110
80
135
105
销售价格(万元)
24.8
21.6
18.4
29.2
22
(1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线;
(3)据(2)的结果估计当房屋面积为150m2时的销售价格.
[解析] (1)数据对应的散点图如下图所示:
(2)=xi=109,lxx= (xi-)2=1 570,
=23.2,lxy= (xi-)(yi-)=308.
设所求回归直线方程为=x+,
则==≈0.196 2,=-=1.816 6.
故所求回归直线方程为=0.196 2x+1.816 6.
(3)据(2),当x=150 m2时,销售价格的估计值为
=0.196 2×150+1.816 6=31.246 6(万元).
2.某商店各个时期的商品流通率y(%)和商品零售额x(万元)资料如下:
x
9.5
11.5
13.5
15.5
17.5
y
6
4.6
4
3.2
2.8
x
19.5
21.5
23.5
25.5
27.5
y
2.5
2.4
2.3
2.2
2.1
散点图显示出x与y的变动关系为一条递减的曲线.经济理论和实际经验都证明,流通率y决定于商品的零售额x,体现着经营规模效益,假定它们之间存在关系式:y=a+.试根据上表数据,求出a与b的估计值,并估计商品零售额为30万元时的商品流通率.
[解析] 设u=,则y≈a+bu,得下表数据:
u
0.105 3
0.087 0
0.074 1
0.064 5
0.057 1
y
6
4.6
4
3.2
2.8
u
0.051 3
0.046 5
0.042 6
0.039 2
0.036 4
y
2.5
2.4
2.3
2.2
2.1
进而可得n=10,≈0.060 4,=3.21,
-102≈0.004 557 3,
iyi-10 ≈0.256 35,
b≈≈56.25,
a=-b·≈-0.187 5,
所求的回归方程为=-0.187 5+.当x=30时,y=1.687 5,即商品零售额为30万元时,商品流通率为1.687 5%.
课件54张PPT。第一章统计案例§1 回归分析第2课时 可线性化的回归分析自主预习学案对于两变量之间非线性相关是否能用直线来拟合?有什么弊端?1.非线性回归问题
(1)在实际问题中,当变量之间不是线性相关关系时,不能用线性回归方程描述它们之间的相关关系,需要进行非线性回归分析.在具体问题中,我们首先应该作出原始数据(x,y)的__________,从__________中看出数据的大致规律,再根据这个规律选择适当的函数进行拟合.
(2)可线性化的回归分析:非线性回归问题的非线性回归方程一般很难求,因此把非线性回归化为线性回归是解决问题的好方法:把非线性回归化为____________,再利用线性回归的方法确定参数a及b的估计值.散点图 散点图 线性回归 2.非线性回归问题
在大量的实际问题中,研究的两个变量不一定呈线性相关关系,它们之间可能呈指数关系或对数关系.在某些情况下可以借助线性回归模型研究呈非线性关系的两个变量之间的关系.非线性回归问题的解题方法是:(1)若问题中已经给出公式,则可通过变换,将变量的非线性关系转化为线性关系,将问题转化为线性回归问题来解决;(2)若问题中没有给出公式,需要我们画出已知数据的散点图,通过与各种函数(如指数函数、对数函数、幂函数等)的图像做比较,选择一种与这些散点拟合的最好的函数,然后采用适当的变量变换,将问题转化为线性回归分析问题.1.幂函数曲线y=xb,当b>1时的图像为(  )A[解析] 当b>1时,图像为选项A;当0[解析] ∵y=3e-2x,∴y>0,排除A、C,又x∈R,排除D.B3.某地今年上半年患某种传染病的人数y(人)与月份x(月)之间满足函数关系,模型为y=aebx,确定这个函数解析式__________________.y=e3.911 58+0.09x 互动探究学案命题方向1 ?给定函数模型,求回归方程若y与t之间满足y=aebt关系,求函数解析式,若按此增长趋势,估计大约在哪一年我国人口达到14亿?
[思路分析] 函数模型为指数函数,可转化为线性相关关系,从而求出.
[解析] 设μ=lny,c=lna,则μ=c+bt.『规律方法』 已知曲线类型进行回归分析的步骤:
(1)将非线性函数通过变量代换转化为线性函数.
(2)将所给数据点加以转换.
(3)按最小二乘法原理求线性回归方程并进行检验.
(4)将线性回归方程转换为关于原始变量x、y的回归方程.
(5)依据回归方程作出预报.命题方向2 ?函数模型的选取『规律方法』 实际问题中非线性相关的函数模型的选取
1.采集数据、画出散点图;
2.根据散点图中点的分布状态选取所有可能的函数类型;
3.作变量代换,将函数转化为线性函数;
4.作出线性相关的散点图,或计算线性相关系数r,通过比较选定函数模型;
5.求回归直线方程,并检查;
6.作出预报.〔跟踪练习2〕
为了研究某种细菌繁殖的个数随时间x变化的情况,收集数据如下:
(1)用天数作为解释变量,繁殖个数作为预报变量,作出这些数据的散点图;
(2)描述解释变量与预报变量之间的关系.[解析] (1)作出散点图如图所示.[辨析] 上述解答过程没有作出散点图(或求相关系数r)进行判断,就直接求回归直线方程导致错误.由散点图(如图2)也可以看出,这些点基本上分布在一条直线附近,可以认为y与t具有线性相关关系,列表如下:可线性化的回归分析 (3)分析模型的拟合效果
对于同一问题可以有几种不同的拟合模型,对于给定的样本点(x1,y1),(x1,y2),…,(xn,yn),可以通过以下几种方式确定选用哪种模型更合适.
①可以根据转换后的对应数据作散点图来确定线性回归的拟合情况,判断使用哪一种曲线模型较为合适.
②可以通过原始数据及y和x之间的非线性回归方程列出残差对比分析表,一般通过残差平方和比较两种模型的拟合效果,其中残差平方和较小的拟合效果较好.
③还可以用R2来比较模型的拟合效果,R2越大(越接近1),拟合效果越好.[解析] 根据收集的数据作散点图如图.
根据样本点的分布情况,可选用指数型函数模型y=c1ec2x(c1,c2为待定的参数),
令z=lny,则z=c2x+lnc1,即变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的附近,由y与x的数据表得z与x的数据表如下:
作出z与x的散点图如图『规律方法』 解决非线性回归问题的具体做法是:(1)若问题中已给出经验公式,可以将解释变量进行变换(换元),将变量的非线性关系转化为线性关系,将问题转化为线性回归分析问题解决.(2)若问题中没有给出经验公式,需要画出已知数据的散点图,通过与各种函数(指数函数、对数函数、幂函数等)的图像做比较,选择与这些散点拟合最好的函数,然后采用适当的变量变换,将问题转化为线性回归问题解决.1.下列说法错误的是(  )
A.当变量之间的相关关系不是线性相关关系时,也能直接用线性回归方程描述它们之间的相关关系
B.把非线性回归化线性回归为我们解决问题提供一种方法
C.当变量之间的相关关系不是线性相关关系时,也能描述变量之间的相关关系
D.当变量之间的相关关系不是线性相关关系时,可以通过适当的变换使其转换为线性关系,将问题化为线性回归分析问题来解决
[解析] 此题考查解决线性相关问题的基本思路.A2.下表是某厂1~4月份用水量(单位:百吨)的一组数据:
由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是y=-0.7x+a,则a等于(  )
A.10.5       B.5.15
C.5.2 D.5.25D3.在某种新型材料的研制中,试验人员获得了下列一组试验数据,现准备用下列四个函数中的一个近似地表示这些数据的规律,其中最接近的一个是(  )
[解析] 作散点图,从图中观察可知,应为对数函数模型.B课 时 作 业 学 案
同课章节目录