高二数学导学案 新授课 2课时
8.1.1 变量的相关关系 8.1.2 样本相关系数
【课标要求】
1.了解变量间的相关关系.
2.能根据散点图,判断两个变量是否具有相关关系.
3.了解相关系数的概念及公式,会判断相关性的强弱
—————————课前案——————————
【知识梳理】
知识点1变量的相关关系
1.相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
2.散点图:将样本中的每一个编号下的成对样本数据都用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
3.正相关与负相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
4.线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
5.非线性相关:一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
过关自诊1
1.判断正误.(正确的画√,错误的画×)
(1)相关关系是两个变量之间的一种确定的关系.( )
(2)对于给定的两个变量的统计数据,都可以作出散点图.( )
(3)圆的周长和圆的半径是相关关系.( )
2.相关关系与函数关系有什么异同点
知识点2 样本相关系数
对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),(x2,y2),…,(xn,yn),其中x1,x2,…,xn和y1,y2,…,yn的均值分别为 ,则
我们称r为变量x和变量y的样本相关系数.
名师点睛 样本相关系数r的性质
(1)当r>0时,称成对数据正相关;当r<0时,称成对数据负相关.
(2)当|r|越接近1时,成对样品数据的线性相关程度越强;当|r|越接近0时,成对样品数据的线性相关程度越弱.
(3)样本相关系数r的取值范围为[-1,1].
过关自诊
1.判断正误.(正确的画√,错误的画×)
(1)相关系数是描述成对样本数据之间线性相关程度的量.( )
(2)若r=0,则说明成对样本数据间是函数关系.( )
(3)若r=±1,则说明成对样本数据的两个分量之间具有一种线性关系.( )
(4)|r|越接近于0,说明成对样本数据的线性相关程度越强.( )
2.以下是对四组数据进行统计获得的散点图,根据散点图的特点你能得出对应样本相关系数的大小关系吗
—————————课中案——————————
探究点一:相关关系的概念
【例1】判断以下两个变量之间是否具有相关关系
(1)正方形的面积与其周长之间的关系;
(2)父母的身高与子女的身高之间的关系;
(3)学生的学号与身高;
(4)汽车匀速行驶时的路程与时间的关系.
规律方法 函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
变式训练1
(多选题)下列说法正确的是( )
A.闯红灯与交通事故发生率的关系是相关关系
B.同一物体的加速度与作用力是函数关系
C.圆的周长与面积的关系是相关关系
D.广告费用与销售量之间的关系是相关关系
探究点二:散点图的应用
【例2】 某公司2016~2021年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如表所示:
判断x与y是否线性相关,若是线性相关,试判断是正相关还是负相关
规律方法 判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
变式训练2
对变量x,y由观测数据得散点图(1);对变量y,z由观测数据得散点图(2).由这两个散点图可以判断()
A.变量x与y正相关,z与y正相关B.变量x与y正相关,z与y负相关
C.变量x与y负相关,z与y正相关D.变量x与y负相关,z与y负相关
探究点三:样本相关系数的应用
【例3】 现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩x与入学后第一次考试的数学成绩y如下表:
这10名学生的两次数学成绩是否具有线性相关关系
规律方法 利用样本相关系数判断线性相关的求解策略
先计算样本相关系数r的值,再用|r|与0或1比较,进而对变量x与变量y的相关关系作出判断.
变式训练3已知两个变量x和y的七组数据如下表:
试判断x与y之间是否具有线性相关关系.
【课堂小结】
—————————课后案——————————
1.若“名师出高徒”成立,则名师与高徒之间存在什么关系( )
A.相关关系 B.函数关系C.无任何关系 D.不能确定
2.已知x,y是两个变量,下列四个散点图中,x,y呈正相关趋势的是( )
3.(多选题)下列说法正确的是( )
A.变量间的关系是非确定性关系,因此因变量不能由自变量唯一确定
B.样本相关系数可以是正的,也可以是负的
C.如果r=±1,说明x与y之间满足一种线性关系
D.样本相关系数r∈(-1,1)
4.(2022湖北期中)甲、乙、丙、丁四名同学各自对x,y两变量进行线性相关试验,并分别求得相关系数r如表:
则这四名同学的试验结果能体现出x,y两变量有更强的线性相关性的是 .
5.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:
已知记忆力x和判断力y是线性相关的,求相关系数r.高二数学导学案 新授课 2课时
8.2.1 一元线性回归模型 8.2.2 一元线性回归模型参数的最小二乘估计
【课标要求】
1.了解随机误差、残差、残差图的概念,会通过残差分析判断线性回归模型的拟合效果.
2.了解回归分析的基本思想方法和初步应用.
—————————课前案——————————
【知识梳理】
知识点1 一元线性回归模型
我们称该式为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称自
变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机
误差.
过关自诊1
1.判断正误.
(1)两个变量之间产生随机误差的原因仅仅是因为测量工具产生的误差.( )
(2)在画两个变量的散点图时,响应变量在x轴上,解释变量在y轴上.( )
(3)随机误差一般是不可观测的随机变量.( )
知识点2 一元线性回归模型参数的最小二乘估计
经验回归方程
2.残差与残差分析
对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的 称为预测值,观测值减去预测值称为残差.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.在残差图中,当残差比较均匀地分布在横轴的两边,说明残差比较符合一元线性回归模型的假定.
过关自诊
1.判断正误.(正确的画√,错误的画×)
(1)任何一组数据都可以由最小二乘法得出经验回归方程.( )
(2)残差平方和越接近0,线性回归模型的拟合效果越好.( )
(3)R2越小,线性回归模型的拟合效果越好.( )
(4)进行回归分析前,要先进行相关性的分析.( )
(5)经验回归直线过样本点的中心( ).
2.在回归分析中,利用经验回归方程求出的值一定是真实值吗 为什么
—————————课中案——————————
探究点一:求经验回归方程
【例1】 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,建立y关于x的经验回归方程;
(3)试根据求出的经验回归方程,预测记忆力为9的同学的判断力.
规律方法 求经验回归方程:
变式训练1
(2022陕西咸阳月考)某医疗器械厂统计了口罩生产车间每名工人的生产速度,并将所得数据分成五组,绘制出如图所示的频率分布直方图.
(1)估计口罩生产车间工人生产速度的中位数(结果写成分数的形式);
(2)为了解该车间工人的生产速度是否与他们的工作年限有关,现从车间所有工人中随机调查了5名工人的生产速度以及他们的工龄(参加工作的年限),所得数据如表:
根据上表数据求每名工人的生产速度y关于他的工龄x的经验回归方程
探究点二:回归分析
【例2】 某运动员训练次数x与成绩y的数据如下:
(1)作出散点图;
(2)建立成绩y关于次数x的经验回归方程;
(3)作出残差图;
(4)计算R2,并用R2说明拟合效果的好坏.
规律方法
1.解答本类题目应先通过散点图、样本相关系数来分析两个变量是否线性相关,再利用求经验回归方程的公式求解经验回归方程,并利用残差图或R2来分析模型的拟合效果.
2.“R2、残差图”在回归分析中的作用:
(1)R2是用来刻画回归效果的,由R2=1- ,可知R2越大,意味着残差平方和越小,也就是说模型的拟合效果越好.
(2)残差图也是用来刻画回归效果的,判断依据是:残差比较均匀地分布在横轴的两边,说明残差比较符合一元线性回归模型的假定.
变式训练2
在一段时间内,某种商品的价格x(单位:元)和需求量y(单位:件)之间的一组数据如下:
已知x与y线性相关,求出y关于x的经验回归方程,并用R2说明拟合效果的好坏.
探究点三:求非线性经验回归方程
【例3】 某地区六年来轻工业产品利润总额y(单位:亿元)与年次x的数据如下:
由经验知,年次x与利润总额y(单位:亿元)近似有如下关系:y=abxe0.其中a,b均为正数,求y关于x的经验回归方程.
规律方法 非线性经验回归方程的求法
变式训练3
某展会一天上午9点半到下午2点的即时参观人数如下表:
已知时间与参观人数具有很强的相关关系,试求出这段时间内即时参观人数关于时间的经验回归方程.
【课堂小结】高二数学导学案 新授课 2课时
8.3.1 分类变量与列联表 8.3.2 独立性检验
【课标要求】
1.能利用2×2列联表进行独立性检验,提升利用图表进行数据分析的能力.
2.参考反证法,理解独立性检验的基本思想和步骤,并能够利用独立性检验解决一些实际问题.
3.通过对独立性检验和统计等知识的综合应用,体会数学知识的交汇运用.
—————————课前案——————————
【知识梳理】
知识点1 分类变量与列联表
1.分类变量:为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.
2.列联表:在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存.这种形式的数据统计表称为2×2列联表.2×2列联表给出了成对分类变量数据的交叉分类频数.
过关自诊
1.判断正误.(正确的画√,错误的画×)
(1)分类变量中的变量与函数中的变量是同一概念.( )
(2)2×2列联表只有4个格子.( )
(3)列联表中的数据是两个分类变量数据的交叉分类频数.( )
(4)列联表、频率分析法、等高堆积条形图都可初步分析两分类变量是否有关系.( )
2.2×2列联表的主要作用是什么
知识点2 独立性检验
1.2×2列联表
上表是关于分类变量X和Y的抽样数据的2×2列联表:最后一行的前两个数分别是事件{Y=0}和{Y=1}的频数;最后一列的前两个数分别是事件{X=0}和{X=1}的频数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的频数;右下角格中的数n是样本容量.
2.χ2统计量的计算公式 ………………………….
3.独立性的判断方法
基于小概率值α的检验规则是:概率值α越小,临界值xα越大
当χ2≥xα时,我们就推断H0不成立,即认为 ,该推 ;
当χ24.独立性检验
利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,
简称独立性检验.
过关自诊
1.判断正误.(正确的画√,错误的画×)
(1)χ2统计量也可以用来作相关性的度量,χ2越小说明变量之间越独立,χ2越大说明变量之间越相关.( )
(2)独立性检验的思想类似于反证法.( )
(3)独立性检验的结论是有多大的把握认为两个分类变量有关系.( )
2.独立性检验在实际中的重要作用是什么
—————————课中案——————————
探究点一:独立性检验
【例1】 打鼾不仅影响别人休息,而且可能与患心脏病有关.下表是一次调查所得的数据:
根据小概率值α=0.001的独立性检验,能否认为每一晚都打鼾与患心脏病有关系
规律方法 独立性检验的具体做法
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.
(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
(3)根据检验规则得出推断结论.
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
变式训练1
某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.
(1)根据以上数据建立一个2×2列联表;
(2)试根据小概率值α=0.01的独立性检验,分析对新课程教学模式的赞同情况与教师年龄是否有关联.
探究点二:独立性检验的综合应用
【例2】 海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计事件A的概率;
(2)填写下面列联表,并依据α=0.01的独立性检验,分析箱产量与养殖方法是否有关联;
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).
附:
规律方法 两个分类变量相关关系的判断
通过2×2列联表,先计算χ2的值,再借助χ2的取值判断两个分类变量是否有关联.
变式训练2
为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查,并得到了如下的2×2列联表:
已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为
(1)请将上面的2×2列联表补充完整(不用写计算过程).
(2)依据α=0.05的独立性检验,能否认为喜爱打篮球与性别有关联 说明你的理由.
(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X,求X的分布列与均值.
【课堂小结】
—————————课后案——————————
1.下面是一个2×2列联表:
则表中a,b处的值分别为( ) A.94,96 B.52,50 C.52,60 D.54,52
2.在对人们休闲方式的一次调查中,根据数据建立如下的2×2列联表:
附:
A.0.99 B.0.95 C.0.01 D.0.05
3.手机给人们的生活带来便捷,但同时也对中学生的生活和学习造成了严重的影响.某校高一几个学生成立研究性学习小组,就使用手机对学习成绩的影响随机抽取了该校100名学生的期末考试成绩并制成下表,则下列说法正确的是( )
A.依据α=0.001的独立性检验认为使用手机与学习成绩有关联
B.依据α=0.001的独立性检验认为使用手机与学习成绩无关联
C.依据α=0.005的独立性检验认为使用手机对学习成绩无影响
D.依据α=0.01的独立性检验认为使用手机对学习成绩有影响