北师大版数学选修2-3 §3.1 回归分析79张PPT

文档属性

名称 北师大版数学选修2-3 §3.1 回归分析79张PPT
格式 zip
文件大小 5.7MB
资源类型 教案
版本资源 北师大版
科目 数学
更新时间 2019-11-23 12:03:27

文档简介

第三章 §1
A级 基础巩固
一、选择题
1.关于回归分析,下列说法错误的是( D )
A.回归分析是研究两个具有相关关系的变量的方法
B.散点图中,解释变量在x轴,预报变量在y轴
C.回归模型中一定存在随机误差
D.散点图能明确反映变量间的关系
[解析] 用散点图反映两个变量间的关系时,存在误差.
2.由变量x与y相对应的一组数据(1,y1)、(5,y2)、(7,y3)、(13,y4)、(19,y5)得到的线性回归方程为=2x+45,则=( D )
A.135   B.90  
C.67   D.63
[解析] ∵=(1+5+7+13+19)=9,=2+45,
∴=2×9+45=63,故选D.
3.观测两个相关变量,得到如下数据:
x
-1
-2
-3
-4
-5
5
4
3
2
1
y
-0.9
-2
-3.1
-3.9
-5.1
5
4.1
2.9
2.1
0.9
则两变量之间的线性回归方程为( B )
A.=0.5x-1 B.=x
C.=2x+0.3 D.=x+1
[解析] 因为=0,
==0,根据回归直线方程必经过样本中心点(,)可知,回归直线方程过点(0,0),所以选B.
4.一位母亲记录了儿子3~9岁的身高,数据(略),由此建立的身高与年龄的回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( C )
A.身高一定是145.83cm B.身高在145.83cm以上
C.身高在145.83cm左右 D.身高在145.83cm以下
[解析] 将x的值代入回归方程=7.19x+73.93时,得到的值是年龄为x时,身高的估计值,故选C.
5.(2019·深圳一模)其食品研究部门为了解一种酒品的储藏年份与芳香度之间的相关关系,在市场上收集到了一部分不同年份的该酒品,并测定了其芳香度(如表).
年份x
0
1
4
5
6
8
芳香度y
1.3
1.8
5.6
7.4
9.3
由最小二乘法得到回归方程=1.03x+1.13,但不小心在检测后滴到表格上一滴检测液,污损了一个数据,请你推断该数据为( A )
A.6.1 B.6.28
C.6.5 D.6.8
[解析] 由表中数据:=(0+1+4+5+6+8)=4,
回归方程=1.03x+1.13,
∴=1.03×4+1.13=5.25,
∴=(1.3+1.8+5.6+?+7.4+9.3)=5.25,
解得:?=6.1.
故选A.
6.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( D )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1cm,则其体重约增加0.85kg
D.若该大学某女生身高为170cm,则可断定其体重必为58.79kg
[解析] 本题考查线性回归方程.
D项中身高为170cm时,体重“约为”58.79,而不是“确定”,回归方程只能作出“估计”,而非确定“线性”关系.
二、填空题
7.下列五个命题,正确命题的序号为__③④⑤__.
①任何两个变量都具有相关关系;
②圆的周长与该圆的半径具有相关关系;
③某商品的需求量与该商品的价格是一种非确定性关系;
④根据散点图求得的回归直线方程可能是没有意义的;
⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.
[解析] 变量的相关关系是变量之间的一种近似关系,并不是所有的变量都有相关关系,而有些变量之间是确定的函数关系.例如,②中圆的周长与该圆的半径就是一种确定的函数关系;另外,线性回归直线是描述这种关系的有效方法;如果两个变量对应的数据点与所求出的直线偏离较大,那么,这条回归直线的方程就是毫无意义的.
8.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg).由散点图初步判定其具有线性相关关系,则由此得到的回归方程的斜率是__4.75__.
施化肥量x
15
20
25
30
35
40
45
水稻产量y
330
345
365
405
445
450
455
[解析] 列表如下,
i
1
2
3
4
5
6
7
xi
15
20
25
30
35
40
45
yi
330
345
365
405
445
450
455
xiyi
4 950
6 900
9 125
12 150
15 575
18 000
20 475
=30,≈399.3,=7 000,iyi=87 175
则≈≈4.75.
回归方程的斜率即回归系数.
9.以下是某地区的降雨量与年平均气温的一组数据:
年平均气温(℃)
12.51
12.84
12.84
13.69
13.33
12.74
13.05
年降雨量(mm)
542
507
813
574
701
432
464
根据这组数据可以推断,该地区的降雨量与年平均气温__不具有__相关关系.(填“具有”或“不具有”)
[解析] 画出散点图,观察可知,降雨量与年平均气温没有相关关系.
三、解答题
10.为了迎接2019年世界男篮世界杯,某协会组织了一次“迎2019世界杯,手工制作助威旗”活动,将男篮世界杯的标志以手工刺绣的方式刺绣到红色的三角形的旗子上面,来为世界杯加油.在10次制作中测得的数据如下:
助威旗数x(个)
10
20
30
40
50
60
70
80
90
100
加工时间Y(小时)
62
68
75
81
89
95
102
108
115
122
试问:(1)x与Y是否具有线性相关关系?
(2)如果x与Y具有线性相关关系,求出Y对x的回归直线方程,并根据回归直线方程,预测加工2 010个助威旗需多少天(精确到1)?
注:每天工作8小时.
(参考数据:=55,=91.7,=38 500,=87 777,iyi=55 950,38 500-10×552=8 250,≈91,≈61)
[解析] (1)作散点图如图所示
从图中可以看出,各点都散布在一条直线附近,即它们线性相关.
(2)由所给数据求得
b==
≈0.668
∴a=-b=91.7-0.668×55
=54.96
∴Y对x的回归直线方程为
=54.96+0.668x
当x=2 010时,=54.96+0.668×2 010
=1 397.64(小时)
又1 397.64÷8=174.705(天)
∴加工2 010个助威旗所需时间约为175天.
B级 素养提升
1.已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程为=x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( C )
A.>b′,>a′ B.>b′,C.a′ D.[解析] 本题考查线性回归方程,考查运算能力.
由公式=求得=,代入(,)求得=-,而由两点确定的方程为y=2x-2,∴a′.
2.(2019·武汉高二检测)在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:
年龄
23
27
39
41
45
49
50
53
56
58
60
脂肪
9.5
17.8
21.2
25.9
27.5
26.3
28.2
29.6
31.4
33.5
35.2
通过计算得到回归方程为=0.577x-0.448,利用这个方程,我们得到年龄37岁时体内脂肪含量为20.90%,那么数据20.90%的意义是( D )
A.某人年龄37岁,他体内脂肪含量为20.90%
B.某人年龄37岁,他体内脂肪含量为20.90%的概率最大
C.某人年龄37岁,他体内脂肪含量的期望值为20.90%
D.20.90%是对年龄为37岁的人群中的大部分人的体内脂肪含量所作出的估计
[解析] 利用回归方程=0.577x-0.448,
可得x=37时,=20.901,
即到年龄37岁时体内脂肪含量约为20.90%,
故20.90%是对年龄为37岁的人群中的大部分人的体内脂肪含量所作出的估计,
故选D.
二、填空题
3.已知两个变量x和y之间有线性相关性,5次试验的观测数据如下表:
x
100
120
140
160
180
y
45
54
62
75
92
那么变量y关于x的回归方程是__=0.575x-14.9__.
[解析] 根据公式计算可得=0.575,=-14.9,所以回归直线方程是=0.575x-14.9.
4.某品牌服装专卖店为了解保暖衬衣的销售量y(件)与平均气温x(℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表:
时间
二月上旬
二月中旬
二月下旬
三月上旬
旬平均气温x(℃)
3
8
12
17
旬销售量y(件)
55
m
33
24
由表中数据算出线性回归方程=bx+a中的b=-2,样本中心点为(10,38).
(1)表中数据m=__40__;
(2)气象部门预测三月中旬的平均气温约为22℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为__14件__.
[解析] (1)由=38,得m=40.
(2)由a=-b得a=58,
故=-2x+58,
当x=22时,=14,
故三月中旬的销售量约为14件.
三、解答题
5.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:
房屋面积(m2)
115
110
80
135
105
销售价格(万元)
24.8
21.6
18.4
29.2
22
(1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线;
(3)据(2)的结果估计当房屋面积为150m2时的销售价格.
[解析] (1)数据对应的散点图如下图所示:
(2)=xi=109,lxx= (xi-)2=1 570,
=23.2,lxy= (xi-)(yi-)=308.
设所求回归直线方程为=x+,
则==≈0.196 2,=-=1.816 6.
故所求回归直线方程为=0.196 2x+1.816 6.
(3)据(2),当x=150m2时,销售价格的估计值为
=0.196 2×150+1.816 6=31.246 6(万元).
6.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=x+;
(3)已知该 厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
[解析] (1)由题设所给数据,可得散点图如图:
(2)由对照数据,计算得=86,==4.5,==3.5,已知iyi=66.5,所以,由最小二乘法确定的回归方程的系数===0.7,=- =3.5-0.7×4.5
=0.35.
因此,所求的线性回归方程为y=0.7x+0.35.
(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,知降低的生产能耗为90-(0.7×100+0.35)=19.65(吨标准煤).
C级 能力拔高
 (2018·全国卷Ⅱ理,18)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值.
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
[解析] (1)利用模型①,可得该地区2018年的环境基础设施投资额的预测值为=-30.4+13.5×19=226.1(亿元).
利用模型②,可得该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
课件79张PPT。第 三 章统计案例
本章知识概述:本章内容是新课标教材的新增内容,目的是通过案例介绍一些统计方法,体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用.因此高考试题中注重的是统计思想,所涉及的数据计算不会很繁琐.
本章的重点是:回归分析与独立性检验的基本思想与方法;难点是:回归分析与独立性检验的初步应用.学习时,应注意以下几点:
1.注意用最小二乘法建立变量之间线性回归方程的方法的复习,理解用散点图判断变量之间近似成线性相关关系及用线性相关系数刻画变量之间线性相关程度.
2.非线性回归方程可转化为线性回归方程来解决,转化时要熟悉几种常见的函数拟合模型,理解非线性方程与线性方程变量间的关系.
3.牢记统计量χ2的计算公式,理解独立性检验的思想,对实际问题作出统计推断.§1 回归分析自主预习学案2015年4月25日尼泊尔发生了8.1级地震,此次地震系21世纪陆地第5次八级大地震,余震频繁而且震级还高,仅7级以上余震就发生了2次,你知道地震的震级与地震次数之间有什么关系吗?
1.线性回归分析的步骤
(1)画出两个变量的__________;
(2)求________________;
(3)由线性回归方程进行________.散点图 线性回归方程 预测 变量之间线性相关系数r具有如下性质:
(1)r2≤1,故变量之间线性相关系数r的取值范围为[-1,1].
(2)|r|值越大,变量之间的____________________;|r|值越接近0,变量之间的____________________.
(3)当r>0时,两个变量的值总体上呈现出同时增减的趋势,此时称两个变量__________;当r<0时,一个变量增加,另一个变量有减少的趋势,称两个变量__________;当r=0时,称两个__________________.线性相关程度越高 线性相关程度越低 正相关 负相关 变量线性不相关 1.在对两个变量x,y进行线性回归分析时,有下列步骤:
①对所求出的回归直线方程作出解释;
②收集数据(xi,yi),i=1,2,…,n;
③求线性回归方程;
④求相关系数;
⑤根据所搜集的数据绘制散点图.
如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是 (  )
A.①②⑤③④    B.③②④⑤①
C.②④③①⑤ D.②⑤④③①D 
[解析] 对两个变量进行回归分析时,
首先收集数据(xi,yi),i=1,2,…,n;根据所搜集的数据绘制散点图.
观察散点图的形状,判断线性相关关系的强弱,
求相关系数,写出线性回归方程,
最后依据所求出的回归直线方程作出解释;
故正确顺序是②⑤④③①
故选D.B 3.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是 (  )
A.l1和l2有交点(s,t)
B.l1与l2相关,但交点不一定是(s,t)
C.l1与l2必定平行
D.l1与l2必定重合
[解析] 由题意知(s,t)是甲、乙两位同学所做试验的样本点的中心,而线性回归直线恒过样本点的中心,故选A.A 4.下图是根据变量x、y的观测数据(xi,yi)(i=1,2,…,10)得到的散点图,由这些散点图可以判断变量x、y具有相关关系的图是 (  )
A.①②       B.①④
C.②③ D.③④
[解析] 根据散点图中点的分布情况,可判断③④中的变量x,y具有相关的关系.D 互动探究学案命题方向1 ?变量间的相关性检测典例 1『规律总结』 变量间是否具有线性相关关系,可通过散点图或相关系数作出判断,散点图只是粗略作出判断,用相关系数能够较准确的判断相关的程度.命题方向2 ?求线性回归方程典例 2『规律总结』 1.散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,从图中看它们有无关系,关系的密切程度,再进行相关的回归分析.
2.求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.〔跟踪练习2〕
(2019·湖南郴州质检)为了探究车流量与PM2.5的浓度是否相关,现采集到北方某城市2016年12月份某星期星期一到星期日某一时间段车流量与PM2.5的数据如下表:命题方向3 ?线性回归分析典例 3[解析] (1)作出该运动员训练次数(x)与成绩(y)的散点图,如图所示.由散点图可知,它们之间具有相关关系.『规律总结』 1.解答本类题目应先通过散点图来分析两个变量间的关系是否线性相关,再利用求回归方程的公式求解回归方程,并利用残差图或R2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.
命题方向4 ?非线性回归问题     有一测量水流的实验装置——量水堰,测得试验数据如下表:
根据表中数据,建立Q与h之间的回归方程.
[思路分析] 作散点图,观察确定y与x的近似函数关系,作变量替换,列出新的对应值表求出对应的线性回归方程,再作变量替换得回归方程.典例 4[解析] 根据测得数据作出散点图,如图,根据已有的函数知识,可以发现样本点分布在某一条幂函数型曲线Q=αhβ(α、β是待定的正常数)①的周围.为此将Q=αhβ两边取对数,得到lgQ=βlgh+lgα②,令lgQ=y,lgh=x,于是②式可化为y=βx+lgα.这样y就是x的线性函数了.可以利用线性回归模型来建立y和x之间的线性回归方程y=bx+a(β=b,lgα=a)了.『规律总结』 1.在建立经验公式时,选择合适的函数类型是十分重要的.通常是根据实验数据,画出散点图,从中观察其变化规律,并与已知函数的图像对比,看接近于什么函数,根据实践经验来决定选取公式的类型,所选的类型是否符合实际,还需要通过实践来检验.有时候还需要选择不同的模拟函数作比较.
2.如果观察散点图,发现点的分布不呈条状分布,而是与某种曲线相近,这时可选择这条曲线对应的函数作为拟合函数,作恰当变换,转化为线性函数,用线性回归模型求解.
〔跟踪练习4〕
以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=lny,其变换后得到线性回归方程z=0.3x+4,则c=_____.
[解析] ∵y=cekx,
∴两边取对数,可得lny=ln(cekx)=lnc+lnekx=lnc+kx,
令z=lny,可得z=lnc+kx,
∵z=0.3x+4,∴lnc=4,∴c=e4.故答案为e4.
e4 利用线性回归方程可以进行预报,线性回归方程将部分观测值所反映的规律进行延伸,是我们对有线性相关关系的两个变量进行分析和控制的依据.典例 5利用线性回归方程进行预报变量的估计(规律方法)  (1)在给定的坐标系中画出表中数据的散点图;[解析] (1)散点图如图所示:
C 
典例 4必须在两变量线性相关的条件下,才能用最小二乘法求回归直线方程[辨析] 此题解法是错误的,原因是这两个变量之间不是线性相关关系.此类问题的解决,应先对两个变量间的相关关系进行相关性检验,然后结合作出的散点图,选择适宜的回归方程.[正解] 由数值表可作散点图如图所示:由置换后的数值表作散点如图所示:[解析] (1)散点图如图所示:D [解析] r越接近1,相关性越强,残差平方和m越小,相关性越强,故选D.D 68 [解析] (1)散点图如图所示,可以看出x和y具有线性相关关系.课 时 作 业 学 案
同课章节目录