【讲练测·三位一体】2014年春高中数学人教A版选修1-2教学课件:第一章 统计案例(3份)

文档属性

名称 【讲练测·三位一体】2014年春高中数学人教A版选修1-2教学课件:第一章 统计案例(3份)
格式 zip
文件大小 1.5MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2014-02-25 13:30:47

文档简介

课件46张PPT。1.1 回归分析的基本思想及其初步应用
1.知识与技能
通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.
2.过程与方法
通过求线性回归方程,探究相关性检验的基本思想.
通过对典型案例的探究,体会回归分析在生产实际和日常生活中的广泛应用.本节重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法——相关指数和残差分析.
本节难点:解释残差变量的含义,了解偏差平方和分解的思想.一、相关关系的概念
当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.
二、回归分析的相关概念
1.回归分析是处理两个变量之间 的一种统计方法.若两个变量之间具有线性相关关系,则称相应的回归分析为 .相关关系线性回归分析3.线性相关关系强与弱的判断:用 来描述线性相关关系的强弱.当r>0时,表明两个变量 ;当r<0时,表明两个变量 .r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值接近于0时,表明两个变量之间 线性相关关系.通常当|r|大于 时,认为两个变量有很强的线性相关关系.
4.随机误差的概念:当样本点散布在某一条直线的附近,而不是在一条直线上时,不能用一次函数y=bx+a来描述两个变量之间的关系,而是用线性回归模型 来表示,其中 为模型的未知参数, 称为随机误差.相关系数r正相关负相关几乎不存在0.75y=bx+a+ea和be
R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越 .在线性回归模型中,R2表示解释变量对预报变量变化的 .R2越接近于1,表示回归的效果越好(因为R2越接近于1,表示解释变量和预报变量的线性相关性越强).好贡献率(2)利用图形来分析残差特性,作图时纵坐标为 ,横坐标可以选为 ,这样作出的图形称为残差图.如果图中有某个样本点的残差比较大,需要确认在采集这个样本点的过程中是否有人为的错误.如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因.另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.残差样本编号回归分析问题有线性回归问题和非线性回归问题,对于非线性回归问题,往往利用转换变量的方法进行转化,转变为线性回归问题.[例1] 有下列说法:
①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;
②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;
④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.
其中正确命题的个数是 (  )A.1        B.2
C.3 D.4
[分析] 由题目可获取以下信息:
①线性回归分析;
②散点图;
③相关性检验等的相关概念及意义.
解答本题可先逐一核对相关概念及其性质,然后再逐一作出判断,最后得出结论.
[答案]C
[解析] ①反映的正是最小二乘法思想,故正确.
②反映的是画散点图的作用,也正确.
③解释的是回归方程=x+的作用,故也正确.
④是不正确的,在求回归方程之前必须进行相关性检验,以体现两变量的关系.
[点评] 线性回归分析的过程:
(1)随机抽取样本,确定数据,形成样本点
(2)由样本点形成散点图,判定是否具有线性相关关系;
(3)由最小二乘法确定线性回归方程;
(4)由回归方程观察变量的取值及变化趋势.
下列有关线性回归的说法,不正确的是 (  )
A.变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个量的一组数据的图形叫做散点图
C.线性回归方程最能代表具有线性相关关系的x,y之间的关系
D.任何一组观测值都能得到具有代表意义的线性回归方程[答案] D
[解析] 只有对两个变量具有线性相关性作出判断时,利用最小乘法求出线性方程才有意义.
[例2] 某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:
(1)画出散点图;
(2)求y关于x的回归直线方程.[解析] (1)散点图如图所示.(2)列出下表,并用科学计算器进行有关计算.
[点评] 求回归直线方程,关键在于正确地求出,,由于,的计算量较大,计算时要仔细谨慎、分层进行,避免计算失误.
[例3] 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得数据如下:
把零件数x作为解释变量,加工时间y作为预报变量.
(1)计算总偏差平方和、残差平方和及相关指数;
(2)作出残差图;
(3)进行残差分析.[解析] (1)由x,y的数据得散点图如图.由散点图可以认为样本点大致分布在某条直线的附近,因此可以用线性回归模型来拟合.设线性回归方程为=+x,列出下表:
续表
将数据代入相应公式可得如下数据表:
续表
(2)作出残差图如图,横坐标为零件数的数据,纵坐标为残差.(3)由题中数据可得样本相关系数r的值为0.9998,再结合散点图可以说明x与y有很强的线性相关关系.由R2的值可以看出回归效果很好,也说明用线性回归模型拟合数据效果很好.
由残差图也可以观察到,第4个样本点和第5个样本点的残差比较大,需要确认在采集在这两个样本点的过程中是否有人为的错误.
[点评] 本题涉及公式多且复杂,计算量也很大,需首先了解公式,明白原理.
(2)在利用残差图对数据进行残差分析时,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.一、选择题
1.下列说法中错误的是 (  )
A.如果变量x与y之间存在着线性相关关系,则我们根据实验数据得到的点(xi,yi)(i=1,2,…,n)将散布在某一条直线的附近
B.如果两个变量x与y之间不存在线性关系,那么根据它们的一组数据(xi,yi)(i=1,2,…,n)不能写出一个线性方程
[答案] B
[解析] 两变量x与y之间不存在线性关系,根据它们的一组数据(xi,yi)(i=1,2,3,…n)可通过已有的函数知识进行变换,利用线性回归模型来建立y与x之间的非线性回归方程
A.y平均增加2.5个单位
B.y平均增加2个单位
C.y平均减少2.5个单位
D.y平均减少2个单位
[答案] C[答案] C4.下列两个变量之间的关系不是函数关系的是(  )
A.角度和余弦值
B.正n边形的边数和一个内角的度数
C.棱锥的体积和底面积
D.某种物质和溶解度和温度
[答案] D6.某种产品的广告费支出x与销售额y(单位:万元)之间有下表关系:
已知y与x之间是线性相关关系,若实际销售额不低于82.5万元,则广告费支出最少是__________万元.
[答案] 10
[解析] 由本节例2可知y关于x的回归直线方程为=6.5x+17.5由6.5x+17.5≥82.5得x≥10.故广告费支出最少为10万元.课件35张PPT。1.2 独立性检验的基本思想及其初步应用
1.知识与技能
通过典型案例,初步经历案例学习的过程,学习一些常见的统计思想与方法,并能用这些方法解决一些实际问题.
2.过程与方法
通过对案例的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用.
3.情感态度与价值观
通过对数据的收集、整理和分析,增强社会实践能力,培养学生分析问题、解决问题的能力.本节重点:理解独立性检验的基本思想及实施步骤.
本节难点:(1)了解独立性检验的基本思想.
(2)了解随机变量K2的含义.
在学习中要多从实际问题考虑,对一些典型案例的数据的处理,了解和使用一些常用的统计方法,树立应用数学的意识,树立数学为实践服务的思想.1.分类变量和列联表
(1)分类变量
变量的不同“值”表示个体所属的 ,像这样的变量称为分类变量.
(2)列联表
①定义:列出的两个分类变量的 称为列联表.
②2×2列联表
一般地,假设两个分类变量X和Y,它们的取值分别为 和 ,其样本频数列联表(也称为2×2列联表)为下表.不同类别频数表{x1,x2}{y1,y2}
2.等高条形图
(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否 ,常用等高条形图展示列联表数据的 .互相影响频率特征③如果 ,就推断“X与Y有关系”,这种推断犯错误的概率不超过a,否则就认为在 不超过a的前提下不能推断“X与Y的关系”,或者在样本数据中 支持结论“X与Y有关系”.
4.在独立性检测中,当K2> 时,有95%的把握说事件A与B有关;当K2> 时;有99%的把握说事件A与B有关;当K2≤ 时,认为 .k≥k0犯错误的概率没有发现足够证据3.8416.6353.841事件A与B是无关的
[例1] 在一项有关医疗保健的社会调查中,发现被调查的男性有530人,女性有670人,其中男性中喜欢吃甜食的有117人,而女性中喜欢吃甜食的有492人,试判断喜不喜欢吃甜食与性别有无关系.[解析] 作列联表如下(单位:人):
性别与喜欢吃甜食列联表
画三维柱形图,如图.比较来说,主、副对角线上两个柱体高度的乘积差别较大,因而可以在某种程度上认为“喜不喜欢吃甜食与性别有关系”.
[点评] 在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上两个柱形高度的乘积相差越大,两个分类变量有关系的可能性就越大.
作三维柱形图时,作图要精确,且比较易于观察,以便对结论的判断不出现偏差.
[例2] 下面2×2列联表的K2的值为________.
[答案] 1.780
2.将K2的数值与两个临界值3.841与6.635进行对比;
做出统计推断:当根据具体的数据算出的K2>3.841时,有95%的把握说事件A与B有关;当K2>6.635时,有99%的把握说事件A与B有关;当K2≤3.841时,认为事件A与B是无关的.
某防疫站对屠宰场及肉食零售点的猪肉检查沙门氏菌情况,结果如下表,试检验屠宰场与零售点猪肉带菌率有无差异.[分析] 这是一个2×2列联表,可以用K2检验来检验屠宰场与零售点猪肉带菌率有无差异.
[例3] 在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,通过图形判断色盲与性别是否有关.利用独立性检验判断,是否能够以99.9%的把握认为“色盲与性别有关系”.你所得到的结论在什么范围内有效?
[解析] 根据题目所给的数据作出如下的列联表(单位:名):色盲与性别列联表
根据列联表作出相应的二维条形图,如图所示.[点评] 本题应首先作出调查数据的列联表,再根据列联表画出二维条形图或三维柱形图,并进行分析,最后利用独立性检验作出判断.
1.利用图形来判断两个分类变量是否有关系,可以画出三维柱形图,也可以画出二维条形图,仅从图形上只可以粗略地判断两个分类变量是否有关系,可以结合所给的数值来进行比较.作图应注意单位统一,图形准确,但它不能给我们两个分类变量有关或无关的精确的可信程度,若要作出精确的判断,可以作独立性检验的有关计算.2.当需要利用公式计算K2的观测值大小来对问题作出推断时,首先要牢记公式,再将经过准确运算后得到的结果与临界值进行比较,最后才能得出合乎情理的结论.[例4] 有甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计后,得到如下的列联表
班级与成绩列联表
试问能有多大把握认为“成绩与班级有关系”?
[辨析] 由于对2×2列联表中n11,n12,n21,n22的位置不确定,在代入公式时代错了数值导致计算结果的错误.一、选择题
1.可以粗略地判断两个分类变量是否有关系的是
(  )
A.散点图
B.三维柱形图和二维条形图
C.独立性检验的思想
D.以上都不对
[答案] B
[解析] 用三维柱形图和二维条形图可以粗略地判断两个分类变量是否有关系,但无法精确给出结论的可靠程度.2.下表是一个2×2列联表:
则表中a,b处的值分别为 (  )
A.94,96   B.52,50  
C.52,54   D.54,52[答案] C3.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是 (  )
A.k越大,推断“X与Y有关系”,犯错误的概率越大
B.k越小,推断“X与Y有关系”,犯错误的概率越大
C.k越接近于0,推断“X与Y无关”,犯错误的概率越大
D.k越大,推断“X与Y无关”,犯错误的概率越小
[答案] B4.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅临界值表来确定断言“X与Y有关系”的可信度,如果k>5.024,那么就推断“X和Y有关系”,这种推断犯错误的概率不超过 (  )
A.0.25        B.0.75
C.0.025 D.0.975
[答案] C
[解析] 通过查表确定临界值k.当k>k0=5.024时,推断“X与Y”有关系这种推断犯错误的概率不超过0.025.二、填空题
5.如果K2的观测值k为8.654,可推断“X与Y有关”犯错误的概率不超过______.
[答案] 0.005
[解析] k=8.654>7.879,就推断“X与Y有关”犯错误的概率不超过0.005.6.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天内的结果如下表所示:
进行统计分析时的统计假设是__________________.
[答案] 假设电离辐射的剂量与人体受损程度无关.课件27张PPT。章末归纳总结2.建立回归模型的一般步骤
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系).(4)按一定规则估计回归方程中的参数.
(5)得出结果后分析残差图是否有异常(个别数据对应的残差过大,或残差呈现不随机的规律性,等等),若残差存在异常,则应检查数据是否有误,或模型是否合适等.
二、独立性检验
1.判断两个分类变量之间是否有关系的方式有三种:三维柱形图、二维条形图和独立性检验.其中三维柱形图和二维条形图只能粗略地判断两个分类变量是否有关系,而独立性检验可以精确地得到可靠的结论.2.独立性检验的一般步骤:
(1)根据样本数据制成2×2列联表.
(2)根据公式计算K2的值.
(3)比较K2与临界值的大小关系作统计推断.
[例1] 已知对两个变量x、y的观测数据如下表:
(1)画出x、y的散点图;
(2)求出回归直线方程.[解析] (1)散点图如下图所示.
[例2] 想象一下一个人从出生到死亡,在每个生日都测量身高,并作出这些数据散点图,这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析.下表是一位母亲给儿子作的成长记录.(1)年龄(解释变量)和身高(预报变量)之间具有怎样的相关关系?
(2)如果年龄相差5岁,则身高有多大差异?(3~16岁之间)
(3)如果身高相差20cm,其年龄相差多少?
(4)计算残差,说明该函数模型能够较好地反映年龄与身高的关系吗?请说明理由.
(2)如果年龄相差5岁,则预报变量变化6.314×5=31.570.R2≈0.999,
所以残差平方和为4.53,相关指数为0.999,故该函数模型能够较好地反映年龄与身高的关系.
[例3] (2010·辽宁理,18)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做实验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.
下表1和表2分别是注射药物A和B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表
表2:注射药物B后皮肤疱疹面积的频数分布表
①完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;
②完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.
表3:
[解析] 本小题考查频率分布直方图、独立性检验及2×2列联表等统计学知识.
解题思路是(1)绘制频率分布直方图,并从图中观察出中位数进行比较,(2)从频率分布表中读取数值填制2×2列联表并计算K2与临界值比较,说明是否有关.
解:①可以看出注射药物A后的疱疹面积的中位数在65至70之间,而注射药物B后的疱疹面积的中位数在70至75之间,所以注射药物A后疱疹面积的中位数小于注射药物B后疱疹面积的中位数.
②表3:
由于K2>10.828,所以有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.
[点评] 本题比较新颖,将统计学与古典概型、组合联系在一起,难度不大,但考查知识全面,而且还需要一定的识图表能力,是今年命题一热点方向.