北师大版高中数学选修2-3第三章《统计案例》全部教案

文档属性

名称 北师大版高中数学选修2-3第三章《统计案例》全部教案
格式 zip
文件大小 386.7KB
资源类型 教案
版本资源 北师大版
科目 数学
更新时间 2012-02-12 00:22:00

图片预览

文档简介

北师大版高中数学选修2-3第三章《统计案例》全部教案
扶风县法门高中 姚连省
§1 回归分析
第一课时 回归分析
一、教学目标:(1)通过实例引入线性回归模型,感受产生随机误差的原因;(2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法;(3)能求出简单实际问题的线性回归方程。
二、教学重点,难点:线性回归模型的建立和线性回归系数的最佳估计值的探求方法。
三、教学方法:讨论交流,探析归纳
四、教学过程
(一)、问题情境
1、情境:对一作直线运动的质点的运动过程观测了次,得到如下表所示的数据,试估计当x=9时的位置y的值.
时刻/s
位置观测值/cm
根据《数学(必修)》中的有关内容,解决这个问题的方法是:
先作散点图,如下图所示:
从散点图中可以看出,样本点呈直线趋势,时间与位置观测值y之间有着较好的线性关系.因此可以用线性回归方程来刻画它们之间的关系.根据线性回归的系数公式,
可以得到线性回归方为,所以当时,由线性回归方程可以估计其位置值为
2、问题:在时刻时,质点的运动位置一定是吗?
(二)、学生活动
思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映与之间的关系,的值不能由完全确定,它们之间是统计相关关系,的实际值与估计值之间存在着误差。
(三)、新课探析
1、线性回归模型的定义:我们将用于估计值的线性函数作为确定性函数;的实际值与估计值之间的误差记为,称之为随机误差;将称为线性回归模型.
说明:(1)产生随机误差的主要原因有:①所用的确定性函数不恰当引起的误差;②忽略了某些因素的影响;③存在观测误差.
(2)对于线性回归模型,我们应该考虑下面两个问题: ①模型是否合理(这个问题在下一节课解决); ②在模型合理的情况下,如何估计,?
2、探求线性回归系数的最佳估计值:
对于问题②,设有对观测数据,根据线性回归模型,对于每一个,对应的随机误差项,我们希望总误差越小越好,即要使越小越好.所以,只要求出使取得最小值时的,值作为,的估计值,记为,.
注:这里的就是拟合直线上的点到点的距离.用什么方法求,?
回忆《数学3(必修)》“2.4线性回归方程”P71“热茶问题”中求,的方法:最小二乘法.利用最小二乘法可以得到,的计算公式为
,其中,
由此得到的直线就称为这对数据的回归直线,此直线方程即为线性回归方程.其中,分别为,的估计值,称为回归截距,称为回归系数,称为回归值.
在前面质点运动的线性回归方程中,,.
3、线性回归方程中,的意义是:以为基数,每增加1个单位,相应地平均增加个单位。
(四)、数学运用
1、例题:
例1、下表给出了我国从年至年人口数据资料,试根据表中数据估计我国年的人口数.
年份
人口数/百万
解:为了简化数据,先将年份减去,并将所得值用表示,对应人口数用表示,得到下面的数据表:
作出个点构成的散点图,由图可知,这些点在一条直线附近,可以用线性回归模型来表示它们之间的关系.
根据公式(1)可得
这里的分别为的估
计值,因此线性回归方程为。由于年对应的,代入线性回归方程可得(百万),即年的人口总数估计为13.23亿。
例2、 从某大学中随机选取 8 名女大学生,其身高和体重数据如表
编号 1 2 3 4 5 6 7 8
身高/cm 165 165 157 170 175 165 155 170
体重/kg 48 57 50 54 64 61 43 59
求根据女大学生的身高预报体重的回归方程,并预报一名身高为 172 cm 的女大学生的体重.
解:由于问题中要求根据身高预报体重,因此选取身高为自变量 x ,体重为因变量 y .
作散点图
从图中可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用线性回归方程来近似刻画它们之间的关系.
根据探究中的公式(1)和(2 ) ,可以得到. 于是得到回归方程
.因此,对于身高172 cm 的女大学生,由回归方程可以预报其体重为
( kg ) . 是斜率的估计值,说明身高 x 每增加1个单位时,体重y就增加0.849 位,这表明体重与身高具有正的线性相关关系。
2、练习:课本P76页练习题
(五)、课堂小结:1、线性回归模型与确定性函数相比,它表示与之间是统计相关关系(非确定性关系)其中的随机误差提供了选择模型的准则以及在模型合理的情况下探求最佳估计值,的工具;2、线性回归方程中,的意义是:以为基数,每增加1个单位,相应地平均增加个单位;3、求线性回归方程的基本步骤。
(六)作业:课本P85页习题3-1中第1题
五、教后反思:
第二课时 相关系数
一、教学目标:1、通过实例了解相关系数的概念和性质,感受相关性检验的作用;2、能对相关系数进行显著性检验,并解决简单的回归分析问题;3、进一步了解回归的基本思想、方法及初步应用。
二、教学重点,难点:相关系数的性质及其显著性检验的基本思想、操作步骤.
三、教学方法:讨论交流,探析归纳
四、教学过程
(一)、问题情境
1、情境:下面是一组数据的散点图,若求出相应的线性回归方程,求出的线性回归方程可以用作预测和估计吗?
2.问题:思考、讨论:求得的线性回归方程是否有实际意义.
(二)、学生活动
对任意给定的样本数据,由计算公式都可以求出相应的线性回归方程,但求得的线性回归方程未必有实际意义.左图中的散点明显不在一条直线附近,不能进行线性拟合,求得的线性回归方程是没有实际意义的;右图中的散点基本上在一条直线附近,我们可以粗略地估计两个变量间有线性相关关系,但它们线性相关的程度如何,如何较为精确地刻画线性相关关系呢?这就是上节课提到的问题①,即模型的合理性问题.为了回答这个问题,我们需要对变量与的线性相关性进行检验(简称相关性检验).
(三)、探析新课
1、相关系数的计算公式:对于,随机取到的对数据,样本相关系数的计算公式为

2、相关系数的性质:(1);(2)越接近与1,,的线性相关程度越强;(3)越接近与0,,的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关.
3、对相关系数进行显著性检验的步骤: 相关系数的绝对值与1接近到什么程度才表明利用线性回归模型比较合理呢?这需要对相关系数进行显著性检验.对此,在统计上有明确的检验方法,基本步骤是:(1)提出统计假设:变量,不具有线性相关关系;(2)如果以的把握作出推断,那么可以根据与(是样本容量)在附录(教材P111)中查出一个的临界值(其中称为检验水平);(3)计算样本相关系数;(4)作出统计推断:若,则否定,表明有的把握认为变量与之间具有线性相关关系;若,则没有理由拒绝,即就目前数据而言,没有充分理由认为变量与之间具有线性相关关系。
说明:1、对相关系数进行显著性检验,一般取检验水平,即可靠程度为.
2、这里的指的是线性相关系数,的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.3.这里的是对抽样数据而言的.有时即使,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释.4.对于上节课的例1,可按下面的过程进行检验:(1)作统计假设:与不具有线性相关关系;(2)由检验水平与在附录中查得;(3)根据公式得相关系数;(4)因为,即,所以有﹪的把握认为与之间具有线性相关关系,线性回归方程为是有意义的。
(四)、数学运用
1、例题:
例1、下表是随机抽取的对母女的身高数据,试根据这些数据探讨与之间的关系.
母亲身高
女儿身高
解:所给数据的散点图如图所示:由图可以看出,这些点在一条直线附近,
因为,,



所以,
由检验水平及,在附录中查得,因为,所以可以认为与之间具有较强的线性相关关系.线性回归模型中的估计值分别为

故对的线性回归方程为.
例2、要分析学生高中入学的数学成绩对高一年级数学学习的影响,在高一年级学生中随机抽取名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩如下表:
学生编号
入学成绩
高一期末成绩
(1)计算入学成绩与高一期末成绩的相关系数;(2)如果与之间具有线性相关关系,求线性回归方程;(3)若某学生入学数学成绩为分,试估计他高一期末数学考试成绩.
解:(1)因为,,
,,.
因此求得相关系数为.
结果说明这两组数据的相关程度是比较高的。
小结解决这类问题的解题步骤:(1)作出散点图,直观判断散点是否在一条直线附近;(2)求相关系数;(3)由检验水平和的值在附录中查出临界值,判断与是否具有较强的线性相关关系;(4)计算,,写出线性回归方程。
2、练习:课本P79页练习题。
(五)、回顾小结:1、相关系数的计算公式与回归系数计算公式的比较;2、相关系数的性质;3、探讨相关关系的基本步骤。
(六)、作业:课本P85习题3-1第2题。
五、教后反思:
第三课时 可线性化的回归分析
一、教学目标:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用。
二、教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。
三、教学方法:讨论交流,探析归纳
四、教学过程:
(一)、复习引入:
1、给出例题:一只红铃虫的产卵数和温度有关,现收集了7组观测数据列于下表中,试建立与之间的回归方程.
温度  21  23  25  27  29  32  35
产卵数个  7  11  21  24  66  115  325
(学生描述步骤,教师演示)
2、讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系.
(二)、新课探究:
1. 探究非线性回归方程的确定:
① 如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模.
② 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y=的周围(其中是待定的参数),故可用指数函数模型来拟合这两个变量.
③ 在上式两边取对数,得,再令,则,而与间的关系如下:
X  21  23  25  27  29  32  35
z 1.946 2.398 3.045 3.178 4.190 4.745 5.784
观察与的散点图,可以发现变换后样本点分布在一条直线的附近,因此可以用线性回归方程来拟合.
④ 利用计算器算得,与间的线性回归方程为,因此红铃虫的产卵数对温度的非线性回归方程为.
⑤ 利用回归方程探究非线性回归问题,可按“作散点图建模确定方程”这三个步骤进行.
其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题.
2. 小结:(1)、用回归方程探究非线性回归问题的方法、步骤.
(2)、化归思想(转化思想)在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式.
(1),令,,则有.
(2),令,,,则有.
(3),令,,,则有.
(4),令,,,则有.
(5),令,,则有.
(三)、巩固练习:
为了研究某种细菌随时间x变化,繁殖的个数,收集数据如下:
天数x/天 1 2 3 4 5 6
繁殖个数y/个 6 12 25 49 95 190
(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图;
(2)试求出预报变量对解释变量的回归方程。
【答案:所求非线性回归方程为.】
(四)、作业:课本P85页习题3-1中3、4
五、教后反思:
§2 独立性检验
第四课时 独立性检验
一、教学目标:1、通过对典型案例的探究,了解独立性检验(只要求列联表)的基本思想、方法及初步应用;2、经历由实际问题建立数学模型的过程,体会其基本方法。
二、教学重点、难点:独立性检验的基本方法是重点.基本思想的领会及方法应用是难点。
三、教学方法:讨论交流,探析归纳
四、教学过程
(一)、问题情境
5月31日是世界无烟日。有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题:
某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病.
问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”?
(二)、学生活动
为了研究这个问题,(1)引导学生将上述数据用下表来表示:
患病 未患病 合计
吸烟 37 183 220
不吸烟 21 274 295
合计 58 457 515
(2)估计吸烟者与不吸烟者患病的可能性差异:
在吸烟的人中,有的人患病,在不吸烟的人中,有的人患病.
问题:由上述结论能否得出患病与吸烟有关?把握有多大?
(三)、探析新课
1.独立性检验:
(1)假设:患病与吸烟没有关系.
若将表中“观测值”用字母表示,则得下表:
患病 未患病 合计
吸烟
不吸烟
合计
(近似的判断方法:设,如果成立,则在吸烟的人中患病的比例与
不吸烟的人中患病的比例应差不多,由此可得,即,因此,越小,患病与吸烟之间的关系越弱,否则,关系越强.)
设,
在假设成立的条件下,可以通过求 “吸烟且患病”、“吸烟但未患病”、“不吸烟但患病”、“不吸烟且未患病”的概率(观测频率),将各种人群的估计人数用表示出来.
例如:“吸烟且患病”的估计人数为;
“吸烟但未患病” 的估计人数为;
“不吸烟但患病”的估计人数为;
“不吸烟且未患病”的估计人数为.
如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据(观测值)不能否定假设.否则,应认为假设不能接受,即可作出与假设相反的结论.
2、独立性检验与反证法:
反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立;
独立性检验(假设检验)原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立.
(四)、课堂练习:课本P90页练习题
(五)、回顾小结:
吸烟与肺癌列联表
不患肺癌 患肺癌 总计
不吸烟 a b a+b
吸烟 c d c+d
总计 a+c b+d a+b+c+d
a恰好为事件AB发生的频数;a+b 和a+c恰好分别为事件A和B发生的频数.由于频率近似于概率,所以在H0成立的条件下应该有,其中为样本容量, (a+b+c+d)≈(a+b)(a+c) , 即ad≈bc.因此,|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;|ad -bc|越大,说明吸烟与患肺癌之间关系越强。
(六)、课外作业:课本第94页 习题3-1 第2、3题。
五、教学反思:
第五课时 独立性检验的基本思想
一、教学目标:通过对典型案例的探究,进一步巩固独立性检验的基本思想、方法,并能运用统计量进行独立性检验。
二、教学重点,难点:独立性检验的基本方法是重点.基本思想的领会及方法应用是难点.
三、教学方法:讨论交流,探析归纳
四、教学过程
(一)、提出问题,导入新课
在上一节研究吸烟是否对患肺癌有影响的问题中,我们表明了|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;|ad -bc|越大,说明吸烟与患肺癌之间关系越强。但这些量究竟要多大才能说明变量之间不独立呢?我们能不能选择一个量,用它的大小来检验变量之间是否不独立呢?
(二)、探究新课:
为了使不同样本容量的数据有统一的评判标准,基于上面的分析,我们构造一个随机变量卡方统计量:为了消除样本对上式的影响,通常用卡方统计量()来进行估计。
1、卡方统计量公式:
(其中)
由此若成立,即患病与吸烟没有关系,则χ2的值应该很小.把代入计算得χ2,统计学中有明确的结论,在成立的情况下,随机事件“”
发生的概率约为,即,也就是说,在成立的情况下,对统计量χ2进行多次观测,观测值超过的频率约为.由此,我们有99%的把握认为不成立,即有99%的把握认为“患病与吸烟有关系”.
象以上这种用统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验.
说明:(1)估计吸烟者与不吸烟者患病的可能性差异是用频率估计概率,利用χ2进行独立性检验,可以对推断的正确性的概率作出估计,观测数据取值越大,效果越好.在实际应用中,当均不小于5,近似的效果才可接受.(2)这里所说的“呼吸道疾病与吸烟有关系”是一种统计关系,这种关系是指“抽烟的人患呼吸道疾病的可能性(风险)更大”,而不是说“抽烟的人一定患呼吸道疾病”.(3)在假设下统计量χ2应该很小,如果由观测数据计算得到χ2的观测值很大,则在一定程度上说明假设不合理(即统计量χ2越大,“两个分类变量有关系”的可能性就越大).
2、独立性检验的一般步骤:
一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值:类和类(如吸烟与不吸烟),Ⅱ也有两类取值:类和类(如患呼吸道疾病与不患呼吸道疾病),得到如下表所示:

类 类 合计
Ⅰ 类

合计
推断“Ⅰ和Ⅱ有关系”的步骤为:第一步,提出假设:两个分类变量Ⅰ和Ⅱ没有关系;第二步,根据2×2列联表和公式计算χ2统计量;第三步,查对课本中临界值表,作出判断。
(三)、方法运用
1、例题:
例1、在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:该种血清能否起到预防感冒的作用?
未感冒 感冒 合计
使用血清 258 242 500
未使用血清 216 284 500
合计 474 526 1000
分析:在使用该种血清的人中,有的人患过感冒;在没有使用该种血清的人中,有的人患过感冒,使用过血清的人与没有使用过血清的人的患病率相差较大.从直观上来看,使用过血清的人与没有使用过血清的人的患感冒的可能性存在差异.
解:提出假设:感冒与是否使用该种血清没有关系.由列联表中的数据,求得
∵当成立时,的概率约为,∴我们有99%的把握认为:该种血清能起到预防感冒的作用.
例2、为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示.根据所选择的193个病人的数据,能否作出药的效果与给药方式有关的结论?
有效 无效 合计
口服 58 40 98
注射 64 31 95
合计 122 71 193
分析:在口服的病人中,有的人有效;在注射的病人中,有的人有效.从直观上来看,口服与注射的病人的用药效果的有效率有一定的差异,能否认为用药效果与用药方式一定有关呢?下面用独立性检验的方法加以说明.
解:提出假设:药的效果与给药方式没有关系.由列联表中的数据,求得
当成立时,的概率大于,这个概率比较大,所以根据目前的调查数据,不能否定假设,即不能作出药的效果与给药方式有关的结论.
说明:如果观测值,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“成立”,即Ⅰ与Ⅱ没有关系.
2、练习:课本第91页中练习题.
(四)课堂小结:1、独立性检验的思想方法及一般步骤。2、卡方统计量公式。3、临界值。
(五)、作业:课本P94页习题3-2中3、4
五、教后反思:
第六课时 独立性检验的应用
一、教学目标
通过对典型案例的探究,进一步巩固独立性检验的基本思想、方法,并能运用统计量进行独立性检验。
二、教学重点,难点:独立性检验的基本方法是重点.基本思想的领会及方法应用是难点.
三、教学方法:讨论交流,探析归纳
四、教学过程
(一)、学生活动
练习:
(1)某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集哪些数据? .
(2)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
非统计专业 统计专业
男 13 10
女 7 20
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到
,∵χ2,
所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 .(答案:5%)
附:临界值表(部分):
() 0.10 0.05 0.025 0.010
2.706 3.841 5.024 6.635
(二)运用探析
1、例题:
例1、在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动。
(1)根据以上数据建立一个2× 2列联表;(2)判断性别与休闲方式是否有关系。
解:(1)2× 2的列联表:
休闲方式性别 看电视 运动 总计
女 43 27 70
男 21 33 54
总计 64 60 124
(2)假设“休闲方式与性别无关”
因为,所以有理由认为假设“休闲方式与性别无关”是不合理的,即有97.5%的把握认为“休闲方式与性别有关”。
例2、气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行对比,所得数据如表所示.问它们的疗效有无差异(可靠性不低于99%)?
有效 无效 合计
复方江剪刀草 184 61 245
胆黄片 91 9 100
合计 275 70 345
分析:由列联表中的数据可知,服用复方江剪刀草的患者的有效率为,服用胆黄片的患者的有效率为,可见,服用复方江剪刀草的患者与服用胆黄片的患者的有 效率存在较大差异.下面用进行独立性检验,以确定能有多大把握作出这一推断.
解:提出假设:两种中草药的治疗效果没有差异,即病人使用这两种药物中的何种药物对疗效没有明显差异。
由列联表中的数据,求得
当成立时,的概率约为,而这里
所以我们有的把握认为:两种药物的疗效有差异。
例3、下表中给出了某周内中学生是否喝过酒的随机调查结果,若要使结论的可靠性不低于95%,根据所调查的数据,能否作出该周内中学生是否喝过酒与性别有关的结论?
喝过酒 没喝过酒 合计
男生 77 404 481
女生 16 122 138
合计 93 526 619
解:提出假设:该周内中学生是否喝过酒与性别无关。
由列联表中的数据,求得 ,
当成立时,的概率约为,而这里,
所以,不能推断出喝酒与性别有关的结论。
(三)、回顾小结:1.独立性检验的思想方法及一般步骤。2、卡方统计量公式。3、临界值。
(四)、课外作业:课本P94页习题3-2中5、6题
五、教后反思:
第七课时 《统计案例》小结与复习
一、教学目标:会利用散点图和线性回归方程,分析变量间的相关关系;掌握独立性检验的步骤与方法。
二、教学重难点:会利用散点图和线性回归方程,分析变量间的相关关系;掌握独立性检验的步骤与方法。
三、教学方法:探析归纳,讲练结合
四、教学过程
(一)、知识归纳与梳理
1、线性回归:
(1)相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。注:与函数关系不同,相关关系是一种非确定性关系。
(2)回归分析:对具有相关关系的两个变量进行统计分析的方法。
(3)散点图:表示具有相关关系的两个变量的一组数据的图形。
(4)回归直线方程:,其中, 。相应的直线叫回归直线,对两个变量所进行的上述统计叫做回归分析。
(5)相关系数:
相关系数的性质:(1)|r|≤1。(2)|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小。
2、独立性检验
①列联表:列出的两个分类变量和,它们的取值分别为和的样本频数表称为列联表1
分类 1 2 总计
1
2
总计
构造随机变量(其中)
得到常与以下几个临界值加以比较:
如果 ,就有的把握因为两分类变量和是有关系;
如果  就有的把握因为两分类变量和是有关系;
如果  就有的把握因为两分类变量和是有关系;
如果,就认为没有充分的证据说明变量和是有关系.
(二)、典例探析
例1、一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由如下一组数据:
x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07
y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50
1)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程.
解:
i 1 2 3 4 5 6 7 8 9 10 11 12
xi 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07
yi 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50
xiyi 2.43 2.264 2.856 3.264 3.590 4.07 4.643 5.090 5.652 6.096 6.653 7.245
=,==2.8475,=29.808,=99.2081,=54.243
1)画出散点图:
2)r=
=
在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值r0 05=0.576<0.997891, 这说明每月产品的总成本y(万元)与该月产量x(万件)之间存在线性相关关系.
3)设回归直线方程,
利用,计算a,b,得b≈1.215, a=≈0.974,
∴回归直线方程为:
例2、在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动。(1)根据以上数据建立一个2× 2列联表;
(2)判断性别与休闲方式是否有关系。
解:(1)2× 2的列联表:
休闲方式性别 看电视 运动 总计
女 43 27 70
男 21 33 54
总计 64 60 124
(2)假设“休闲方式与性别无关”
因为,所以有理由认为假设“休闲方式与性别无关”是不合理的,即有97.5%的把握认为“休闲方式与性别有关”。
(三)、练习:课本P100页复习题三第2题
(四)、课堂小结:会利用散点图和线性回归方程,分析变量间的相关关系;掌握独立性检验的步骤与方法。
(五)、作业:课本P100页复习题三第1、4题
五、教后反思:




PAGE
23
同课章节目录