数学选修1-2教学资料,补习资料:1.1.1线性回归的思想方法及应用17张PPT

文档属性

名称 数学选修1-2教学资料,补习资料:1.1.1线性回归的思想方法及应用17张PPT
格式 zip
文件大小 3.5MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2019-09-10 21:23:22

文档简介

课件17张PPT。回归分析选修1-2(一)必修3(第二章 统计)知识结构 收集数据 (随机抽样)整理、分析数据估计、推断简单随机抽样分层抽样系统抽样用样本估计总体变量间的相关关系 用样本的频率分布估计总体分布 用样本数字特征估计总体数字特征线性回归分析统计的基本思想实际样本模 拟抽 样分 析1、两个变量的关系不相关相关关系函数关系线性相关非线性相关问题1:现实生活中两个变量间的关系有哪些呢?相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。函数关系中的两个变量间是一种确定性关系
相关关系是一种非确定性关系思考:相关关系与函数关系有怎样的不同? 函数关系是一种理想的关系模型
相关关系在现实生活中大量存在,是更一般的情况问题2:对于线性相关的两个变量用什么方法来刻划之间的关系呢?2、最小二乘估计最小二乘估计下的线性回归方程: 对一作直线运动的质点的运动过程作了8次观测,得到下表,试估计x=9s时的位置y的值。例如:3、回归分析的基本步骤:画散点图求回归方程预报、决策数学3——统计
画散点图
求出b,a的值。
求回归直线方程
用回归直线方程解决应用问题4、线性回归模型其中a+bx是确定性函数, ? 是随机误差注:? 产生的主要原因:
(1)所用确定性函数不恰当;
(2)忽略了某些因素的影响;
(3)观测误差。思考:在时刻x=9s时,质点运动位置一定是22.6287cm吗?对于线性回归模型
应注意以下两个问题:I 模型的合理性;II 在模型合理的情况下,如何估计a,b.例1.下表给出我国从1949至1999年人口数
据资料,试根据表中数据估计我国2004年
的人口数。分析:先画图例题2.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得数据如下:(1)y与x是否具有线性相关?
(2)若y与x具有线性相关关系,求回归直线方程
(3)预测加工200个零件需花费多少时间?分析:这是一个回归分析问题,应先进行线性相关检验或作散点图来判断x与y是否具有线性相关才可以求解后面的问题。作散点图如下:不难看出x,y成线性相关。解(1)列出下表:问题:有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义。在怎样的情况下求得的回归直线方程才有实际意义?即建立的线性回归模型是否合理?如何对一组数据之间的线性相关程度作出定量分析?统计案例
回归分析的基本思想及初步应用
1.1.1线性回归的思想方法及应用
课前预习学案
一、课前预习
预习目标:回顾回归直线的求法,并利用回归直线进行总体估计。
二、预习内容
1.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。
求回归直线方程的一般步骤:① ;② ;③
2.典型例题:
研究某灌溉渠道水的流速 与水深 之间的关系,测得一组数据如下:
水深
1.40
1.50
1.60
1.70
1.80
1.90
2.00
2.10
流速
1.70
1.79
1.88
1.95
2.03
2.10
2.16
2.21
(1)求 对 的回归直线方程;
(2)预测水深为1.95 时水的流速是多少?
课内探究学案
一、学习目标:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.
学习重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析.
学习难点:解释残差变量的含义,了解偏差平方和分解的思想.
二、学习过程
1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?
2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据作散点图求回归直线方程利用方程进行预报.
3. 典型例题:
例1 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:
编 号
 1
 2
 3
 4
 5
 6
 7
 8
身高/cm
165
165
157
170
175
165
155
170
体重/kg
48
57
50
54
64
61
43
59
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重. (分析思路教师演示学生整理)
评注:事实上,观察上述散点图,我们可以发现女大学生的体重和身高之间的关系并不能用一次函数来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果(即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型,其中残差变量中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.
4.相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.
5. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.
课后练习与提高
1.对具有相关关系的两个变量统计分析的一种常用的方法是(   )
A.回归分析   B.相关系数分析   C.残差分析   D.相关指数分析
2.在画两个变量的散点图时,下面叙述正确的是(   )
A.预报变量在 轴上,解释变量在 轴上  
B.解释变量在 轴上,预报变量在 轴上
C.可以选择两个变量中任意一个变量在 轴上
D.可以选择两个变量中任意一个变量在 轴上
3.两个变量相关性越强,相关系数 (   )
A.越接近于0     B.越接近于1   C.越接近于-1   D.绝对值越接近1
4.若散点图中所有样本点都在一条直线上,解释变量与预报变量的相关系数为(   ) 
 A.0   B.1     C.-1     D.-1或1
5.一位母亲记录了她儿子3到9岁的身高,数据如下表:
年龄(岁)
3
4
5
6
7
8
9
身高(
94.8
104.2
108.7
117.8
124.3
130.8
139.0
由此她建立了身高与年龄的回归模型 ,她用这个模型预测儿子10岁时的身高,则下面的叙述正确的是(   )
A.她儿子10岁时的身高一定是145.83   
B.她儿子10岁时的身高在145.83 以上
C.她儿子10岁时的身高在145.83 左右
D.她儿子10岁时的身高在145.83 以下
统计案例
1.1回归分析的基本思想及初步应用
1.1.1线性回归的思想方法及应用
教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.
教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析.
教学难点:解释残差变量的含义,了解偏差平方和分解的思想.
教学过程:
一、复习准备:
1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?
2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据作散点图求回归直线方程利用方程进行预报.
二、讲授新课:
1. 教学例题:
① 例1 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:
编 号
 1
 2
 3
 4
 5
 6
 7
 8
身高/cm
165
165
157
170
175
165
155
170
体重/kg
48
57
50
54
64
61
43
59
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重. (分析思路教师演示学生整理)
 第一步:作散点图 第二步:求回归方程 第三步:代值计算
② 提问:身高为172cm的女大学生的体重一定是60.316kg吗?
不一定,但一般可以认为她的体重在60.316kg左右.
③ 解释线性回归模型与一次函数的不同
事实上,观察上述散点图,我们可以发现女大学生的体重和身高之间的关系并不能用一次函数来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果(即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型,其中残差变量中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.
2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.
3. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.

高中新课标选修(1-2)统计案例测试题1
一、选择题
1.下列属于相关现象的是(  )
A.利息与利率
B.居民收入与储蓄存款
C.电视机产量与苹果产量
D.某种商品的销售额与销售价格
答案:B
2.如果有的把握说事件和有关,那么具体算出的数据满足(  )
A. B.
C. D.
答案:A
3.如图所示,图中有5组数据,去掉   组数据后(填字母代号),剩下的4组数据的线性相关性最大(  )
A. B. C. D.
答案:A
4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)
不患肺癌
患肺癌
合计
不吸烟
7775
42
7817
吸烟
2099
49
2148
合计
9874
91
9965
根据表中数据,你认为吸烟与患肺癌有关的把握有(  )
A. B. C. D.
答案:C
5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表:
晚上
白天
合计
男婴
24
31
55
女婴
8
26
34
合计
32
57
89
你认为婴儿的性别与出生时间有关系的把握为(  )
A. B. C. D.
答案:B
6.已知有线性相关关系的两个变量建立的回归直线方程为,方程中的回归系数(  )
A.可以小于0 B.只能大于0 C.可以为0 D.只能小于0
答案:A
7.每一吨铸铁成本(元)与铸件废品率建立的回归方程,下列说法正确的是(  )
A.废品率每增加,成本每吨增加64元
B.废品率每增加,成本每吨增加
C.废品率每增加,成本每吨增加8元
D.如果废品率增加,则每吨成本为56元
答案:C
8.下列说法中正确的有:①若,则增大时,也相应增大;②若,则增大时,也相应增大;③若,或,则与的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.(  )
A.①② B.②③ C.①③ D.①②③
答案:C
9.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:
摄氏温度
0
4
7
12
15
19
23
27
31
36
热饮杯数
156
150
132
128
130
116
104
89
93
76
54
如果某天气温是,则这天卖出的热饮杯数约为(  )
A.100 B.143 C.200 D.243
答案:B
10.甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表:
优秀
不优秀
合计
甲班
10
35
45
乙班
7
38
45
合计
17
73
90
利用独立性检验估计,你认为推断“成绩与班级有关系”错误的概率介于(  )
A. B. C. D.
答案:B
二、填空题
11.某矿山采煤的单位成本与采煤量有关,其数据如下:
采煤量
(千吨)
289
298
316
322
327
329
329
331
350
单位成本
(元)
43.5
42.9
42.1
39.6
39.1
38.5
38.0
38.0
37.0
则对的回归系数为     .
答案:
12.对于回归直线方程,当时,的估计值为    .
答案:390
13.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则    .
答案:16.373
14.某工厂在2004年里每月产品的总成本(万元)与该月产量(万件)之间有如下一组数据:
1.08
1.12
1.19
1.28
1.36
1.48
1.59
1.68
1.80
1.87
1.98
2.07
2.25
2.37
2.40
2.55
2.64
2.75
2.92
3.03
3.14
3.26
3.36
3.50
则月总成本对月产量的回归直线方程为    .
答案:
三、解答题
15.某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:
积极支持教育改革
不太赞成教育改革
合计
大学专科以上学历
39
157
196
大学专科以下学历
29
167
196
合计
68
324
392
对于教育机构的研究项目,根据上述数据能得出什么结论.
解:.
因为,所以我们没有理由说人具有大学专科以上学历(包括大学专科)和对待教育改革态度有关.
16.1907年一项关于16艘轮船的研究中,船的吨位区间位于192吨到3246吨,船员的人数从5人到32人,船员的人数关于船的吨位的回归分析得到如下结果:船员人数吨位.
(1)假定两艘轮船相差1000吨,船员平均人数相差多少?
(2)对于最小的船估计的船员数为多少?对于最大的船估计的船员数是多少?
解:由题意知:(1)船员平均人数之差吨位之差,
船员平均相差6;
(2)最小的船估计的船员数为(人).
最大的船估计的船员数:(人).
17.假设一个人从出生到死亡,在每个生日都测量身高,并作出这些数据散点图,则这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析.下表是一位母亲给儿子作的成长记录:
年龄/周岁
3
4
5
6
7
8
9
身高/cm
90.8
97.6
104.2
110.9
115.69
122.0
128.5
年龄/周岁
10
11
12
13
14
15
16
身高/cm
134.2
140.8
147.6
154.2
160.9
167.6
173.0
(1)作出这些数据的散点图;
(2)求出这些数据的回归方程;
(3)对于这个例子,你如何解释回归系数的含义?
(4)用下一年的身高减去当年的身高,计算他每年身高的增长数,并计算他从3~16岁身高的年均增长数.
(5)解释一下回归系数与每年平均增长的身高之间的联系.
解:(1)数据的散点图如下:
(2)用表示身高,表示年龄,则数据的回归方程为;
(3)在该例中,回归系数6.317表示该人在一年中增加的高度;
(4)每年身高的增长数略.3~16岁身高的年均增长数约为6.323cm;
(5)回归系数与每年平均增长的身高之间近似相等.
18.某个服装店经营某种服装,在某周内获纯利(元),与该周每天销售这种服装件数之间的一组数据关系见表:
3
4
5
6
7
8
9
66
69
73
81
89
90
91
已知,,.
(1)求;
(2)画出散点图;
(3)判断纯利与每天销售件数之间是否线性相关,如果线性相关,求出回归方程.
解:(1),

(2)略;
(3)由散点图知,与有线性相关关系,
设回归直线方程:,


回归直线方程.