【讲练测·三位一体】2014年春高中数学人教A版选修2-3教学课件:第三章 统计案例(4份)

文档属性

名称 【讲练测·三位一体】2014年春高中数学人教A版选修2-3教学课件:第三章 统计案例(4份)
格式 zip
文件大小 1.5MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2014-03-10 09:45:29

文档简介

课件42张PPT。3.1 回归分析的基本思想及其初步应用 1.通过典型案例的探究,了解回归分析的基本思想、方法及初步应用.
2.通过对回归分析的学习,提高对现代计算技术与统计方法的应用认识.本节重点:线性回归模型及相关概念.
本节难点:线性回归模型的理解及应用残差分析和相关指数的模型诊断方法,判断模型的拟合效果.1.与函数不同,相关关系是一种 关系,对具有 的两个变量进行 的方法叫做回归分析.非确定性相关关系统计分析r具有以下性质:当r>0时,表明两个变量 ;当r<0时,表明两个变量 .r的绝对值接近1,表明两个变量的线性相关性 ;r的绝对值接近于0时,表明两个变量之间几乎不存在线性相关关系.
4.y=bx+a+e,这里a和b为模型的未知参数,e是y与=bx+a之间的误差.通常e为随机变量,称为随机误差,它的均值E(e)=0,方差D(e)=σ2>0.这样线性回归模型的完整表达式为:
.正相关负相关越强
[例1] 炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据,如下表.(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的关系吗?
(2)求回归直线方程;
(3)预测当钢水含碳量为160时,应冶炼多长时间?[解析] (1)以x轴表示含碳量,y轴表示冶炼时间,可作散点图如图.从图中可以看出,各点散布在一条直线附近,即含碳量与冶炼时间线性相关.[例2] 研究某灌溉渠道水的流速y与水深x之间的关系,测得一组数据如下:
(1)求y对x的回归直线方程;
(2)预测水深为1.95m时水的流速是多少?[分析] 从散点图可以直观地看出变量x与y之间有无线性相关关系,为此把这8对数据描绘在平面直角坐标系中,得到平面上8个点,如图所示.
由图容易看出,x与y之间有线性相关关系.故可用线性回归模型解决.[解析] (2)由(1)中求出的回归直线方程,把x=1.95代入,易得=0.694+0.733×1.95≈2.12(m/s).
计算结果表明,当水深为1.95m时可以预测渠水的流速约为2.12m/s.
[例3] 关于两个变量x和y的7组数据如下表所示:
试判断x与y是否线性相关.一、选择题
1.炼钢时钢水的含碳量与冶炼时间有
(  )
A.确定性关系   B.相关关系
C.函数关系 D.无任何关系
[答案] B
[解析] 解答本题的关键是弄清相关关系的定义、相关关系与函数关系的区别.函数关系是一种确定性关系,而相关关系是一种非确定性关系,带有一定的随机性.故答案选B.[答案] D [答案] B 二、填空题
4.如图所示有5组数据,去掉________后,剩下的4组数据的线性相关性更强.[答案] D(3,10)
[解析] 根据散点图判定两变量的线性相关性,样本数据点越集中在某一直线附近,这两变量的线性相关性越强,显然去掉D(3,10)后,其余各点更能集中在某一直线的附近,即线性相关性更强.5.在7块并排,形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg).由散点图初步判定其具有线性相关关系,则由此得到的回归方程的斜率是________.
[答案] 4.75[解析] 列表如下,三、解答题
6.为研究弹簧自身重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6根弹簧进行测量,数据如下表:
(1)画出散点图;
(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的回归直线方程;
(3)对x,y两个变量进行相关性检验.[解析] (1)如图所示,从散点图看,这是一个属于线性回归模型的问题.[点评] 两变量之间的线性相关性可以通过散点图判定,也可以通过线性相关系数r进行检验,当|r|接近1时,说明y与x两变量间有较强的线性相关关系,可以用线性回归方程进行分析,也就是说进行线性回归分析是有意义的,否则是无意义的.课件42张PPT。1.通过本节的学习进一步了解回归分析的基本思想、方法和初步应用.
2.培养学生对数据的直观感觉,认识统计方法的直观特点,体会统计方法应用的广泛性.本节重点:回归分析方法.
本节难点:在实际问题中,应用回归分析方法作出推断.3.残差图:作图时,纵坐标为 ,横坐标可以选为样本编号,或有关数据,这样作出的图形称为残差图.如果残差点比较均匀地落在 中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度 ,回归方程的预报精度也 .残差水平的带状区域越高越高我们可以用残差图和相关指数R2=
来刻画回归的效果.4.建立回归模型的基本步骤
(1)确定研究对象,明确哪个变量是 ,哪个变量是 ;
(2)画出确定好的解释变量和预报变量的 ,观察它们之间的关系(如是否存在线性关系等);
(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程 );
解释变量预报变量散点图(4)按一定规则估计回归方程中的参数(如最小二乘法);
(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等等);若存在异常,则检查 是否有误,或 是否合适等.数据模型
[例1] 以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:
(1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线;
(3)据(2)的结果估计当房屋面积为150m2时的销售价格.[解析] (1)数据对应的散点图如下图所示:(3)据(2),当x=150m2时,销售价格的估计值为
=0.1962×150+1.8166=31.2466(万元).
[点评] 已知x与y呈线性相关关系,就无需进行相关性检验,否则要进行相关性检验.如果两个变量不具备相关关系,或者相关关系不显著,即使求出回归方程也是毫无意义的,用其估计和预测也是不可信的.进行线性相关的判断,可通过散点图直观判断,散点图不明显的可进行相关性检验.
[例2] 假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下表的统计资料:
若由资料知,y对x呈线性相关关系.(2)求残差平方和;
(3)求相关指数R2;
(4)估计使用年限为10年时,维修费用是多少?
[分析] ∵y对x呈线性相关关系,用线性相关的公式分别计算.[解析] (1)由已知条件制成下表: [点评] (1)残差平方和越小,预报精确度越高.(2)相关指数R2取值越大,说明模型的拟合效果越好.
[例3] 在试验中得到变量y与x的数据如下表:
由经验知,y与 之间具有线性相关关系,试求y与x之间的回归曲线方程,当x0=0.038时,预测y0的值.
[分析] 通过换元转化为线性回归问题.[解析] 令u= ,由题目所给数据可得下表所示的数据;一、选择题
1.下面两个变量间的关系不是函数关系的是
(  )
A.正方形的棱长与体积
B.角的度数与它的正弦值
C.单产为常数时,土地面积与粮食总产量
D.日照时间与水稻亩产量
[答案] D2.变量x、y的散点图如图所示,那么x、y之间的样本相关系数r的最接近的值为 (  )A.1     B.-0.5   
C.0     D.0.5
[答案] C
[解析] 从散点图中,我们可以看出x与y没有线性相关关系,因而r的值接近于0.3.在一次试验中,测得(x,y)的四组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的相关系数为
(  )
A.1 B.-2
C.0 D.-1
[答案] D二、填空题
4.(2010·哈尔滨高二检测)已知回归方程 =4.4x+838.19,则可估计x与y的速度之比约为__________.
[答案] 1∶4.45.以下是某地区的降雨量与年平均气温的一组数据:
根据这组数据可以推断,该地区的降雨量与年平均气温________相关关系.(填“具有”或“不具有”)[答案] 不具有
[解析] 画出散点图,观察可知,降雨量与年平均气温没有相关关系.三、解答题
6.关于x与y有如下数据:[点评] R2的取值越大,模型的拟合效果越好. 课件41张PPT。3.2 独立性检验的基本思想及其初步应用 1.通过对典型案例的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用
2.通过对数据的收集、整理和分析,增强学生的社会实践能力,培养学生分析问题、解决问题的能力.
本节重点、难点:独立性检验的思想方法与初步应用.1.两分类变量之间关联关系的定性分析
(1)分类变量:取不同的“值”表示个体所属不同类别的变量称为分类变量.
说明:①对分类变量的正确理解:这里的“变量”和“值”都应作为广义的变量和值进行理解.如:对于性别变量,其取值为男、女两种,所以这里的“变量”指的是“性别”,这里的“值”指的是“男”和“女”.故这里所说的“变量”和“值”不一定是具体的数值.②分类变量是大量存在的,如吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别.
(2)频率分析:通过对样本中每个分类变量的不同类别的事件发生的频率大小比较来分析分类变量之间是否有关联.(3)图形分析:利用三维柱形图及二维条形图来分析分类变量之间是否具有关联分析,图形的形象直观更能说明相关数据的总体状况.
一般地,假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频率列联表(即2×2列联表)如下表:在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,说明X与Y有关的可能性越大,当ad与bc的差趋近于零时,X与Y几乎没有关系,可以说X与Y是相互独立的.2.独立性检验
(1)定义:利用随机变量
K2= (其中n=a+b+c+d)来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.独立性检验的基本思想类似于反证法,要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下随机变量K2应该很小. 如果由观测数据计算得到的K2的观测值k很大,则在一定可信程度上说明假设不合理.根据随机变量K2的含义,可以通过概率P(K2≥k0)的大小来评价该假设不合理的程度有多大,从而得出“两个分类变量有关系”这一结论成立的可信程度有多大.(2)如何用K2的值判断X与Y之间是否有关?
首先列2×2列联表,当得到的观测数据a,b,c,d都不小于5时,由2×2列联表求出K2的观测值k.若k≥10.828,则我们有99.9%的把握认为X与Y有关,这种判断结果出错的可能性约为0.1%;若k≥6.635,则我们有99%的把握认为X与Y有关,这种判断结果出错的可能性约为1%;若k≥2.706,则我们有90%的把握认为X与Y有关,这种判断结果出错的可能性约为10%;若k<2.706,则没有充分的证据显示X与Y有关,但也不能认为X与Y无关.3.独立性检验的基本方法
一般地,假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
若要推断的结论为:H1:“X与Y有关系”,可以按如下步骤判断结论H1成立的可能性:(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.①在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,H1成立的可能性就越大.①如果k≥10.828,就有99.9%的把握认为“X与Y有关系”;②如果k≥7.879,就有99.5%的把握认为“X与Y有关系”;③如果k≥6.635,就有99%的把握认为“X与Y有关系”;④如果k≥5.024,就有97.5%的把握认为“X与Y有关系”;⑤如果k≥3.841,就有95%的把握认为“X与Y有关系”;⑥如果k≥2.706,就有90%的把握认为“X与Y有关系”;⑦如果k<2.706,就认为没有充分的证据认为“X与Y有关系”.1.分类变量:变量的不同“值”表示个体所属的不同类别,这类变量称为 .
2.在独立性检验中,常用 和 直观地反映相关数据的总体情况.分类变量二维条形图三维柱形图3.样本频数列联表:一般地,假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(即2×2列联表)为:
K2= (其中n= 为样本容量).a+b+c+d4.利用随机变量K2来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的 .独立性检验
[例1] 某电视台联合相关报社对“男女同龄退休”这一公众关注的问题进行了民意调查,数据如下表所示:
根据表中数据,能否在犯错误的概率不超过0.001的前提下认为对这一问题的看法与性别有关系?(P(K2≥10.828)≈0.001)[解析] 假设H0:“对这一问题的看法与性别无关”,
由列联表中的数据,可以得到:
≈125.161>10.828
又P(K2≥10.828)≈0.001,故在犯错误概率不超过0.001的前提下认为对“男女同龄退休”这一问题的看法与性别有关.[点评] 可以利用独立性检验来判断两个分类变量是否有关系,具体做法是:
[例2] 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下,问铅中毒病人和对照组的尿棕色素阳性数有无差别?[解析] 由上述列联表可知,在铅中毒病人中尿棕色素为阳性的占80.56%,而对照组仅占24.32%.说明他们之间有较大差别.根据列联表作出三维柱形图(如图1),二维条形图(如图2),频率分布条形图(如图3所示),由上述三图可知,铅中毒病人中与对照组相比较,尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性存在关联关系.[点评] 由两个分类变量之间频率大小差异可说明这两个变量之间是有关联关系的.而利用三维柱形图、二维条形图、频率分布条形图都能形象直观地反映它们之间差异的关系,进而推断它们之间是否具有关联关系.其中作三维柱形图时应注意恰当的视角,使每个柱体都能看到.而频率分布条形图由于是等高的,因此它与二维条形图相比较更能直观地反映它们之间的差异的大小,特别是当样本容量差异明显时更是如此.一、选择题
1.调查男女学生购买食品时是否看出厂日期与性别有无关系时,最有说服力的是
(  )
A.期望      B.方差
C.正态分布 D.独立性检验
[答案] D2.10名学生在一次数学考试中的成绩如下表:
要研究这10名学生成绩的平均情况,则最能说明问题的是
(  )
A.概率 B.期望
C.方差 D.独立性检验
[答案] B3.下面是一个2×2列联表
则表中a、b处的值分别为 (  )
A.94、96 B.52、50
C.52、59 D.54、52
[答案] C二、填空题
4.用K2统计量进行独立性检验时,使用的表称为____________,要求表中的四个数据____________.
[答案] 2×2列联表 均大于55.若两个分类变量x和y的列联表为:
则x与y之间有关系的概率约为________.
[答案] 99%三、解答题
6.为调查学生对国家大事关心与否是否与性别有关,在学生中进行随机抽样调查,结果如下表,根据统计数据作出合适的判断分析.[点评] 根据随机变量K2的值判断两分类变量是否有关的步骤:第一,假设两分类变量无关,第二,由数据及公式计算K2的观测值k,第三,将k的值与临界值比较得出结论.课件17张PPT。
[例1] 下列属于相关关系的是
(  )
A.利息与利率
B.居民收入与储蓄存款
C.电视机产量与苹果产量
D.某种商品的销售额与销售价格[解析] 本题考查相关关系的概念,相关关系不是函数关系,但两个变量之间存在着关系,是一种非确定关系,但二者之间不能没有任何关系,如选项C中:电视机产量与苹果产量之间无关系.
[答案] B
[例2] 一家保险公司调查其总公司营业部的加班情况,收集了10周中每周加班工作时间y(小时)与签发新保单数目x的数据如下表,则用最小二乘法估计求出的线性回归方程是 (  )[答案] A
[例3] 要分析学生初中升学的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽选10名学生分析他们入学的数学成绩和高一年级期末数学考试成绩,如下表所示:表中x是学生入学数学成绩,y是指高一年级期末考试数学成绩.
(1)画出散点图;
(2)求回归直线方程;
(3)若某学生王明亮的入学成绩为80分,试预测他在高一年级期末考试中的数学成绩为多少?[解析] (1)作出散点图如图所示,从散点图可以看出,这两个变量具有线性相关关系.(2)[点评] 本题为求回归直线方程中的最常见问题,应注意作图要准确.
[例4] 某保键药品推销商为推销其药品,在广告中宣传:“在服用该药品的105人中有100人未患A疾病”.经调查发现,在不使用该药品的418人中仅有18人患A疾病.请用所学知识分析该药品对防治A疾病是否有效?[解析] 将问题中的数据写成2×2列联表如下表: [点评] 利用独立性检验可以帮助我们定量地分析两个分类变量之间是否有关系,因此利用它可以帮助我们理性地看待广告中的某些数字,从而不被某些虚假广告所蒙骗.