第八章 成对数据的统计分析 章末复习与总结(课件 学案)高中数学人教A版(2019)选择性必修 第三册

文档属性

名称 第八章 成对数据的统计分析 章末复习与总结(课件 学案)高中数学人教A版(2019)选择性必修 第三册
格式 zip
文件大小 1.6MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2025-08-04 22:56:11

文档简介

一、回归分析
  回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其基本步骤为通过散点图和经验选择经验回归方程的类型:对于线性回归分析,直接根据最小二乘法求出经验回归方程;而非线性回归分析,则要通过换元,或取对数等代数变换转化为线性回归分析模型,最后应用于实际或对预报变量进行预测.
【例1】 如图是某采矿厂的污水排放量y(单位:吨)与矿产品年产量x(单位:吨)的折线图:
(1)依据折线图计算样本相关系数r(精确到0.01),并据此判断是否可用线性回归模型拟合y与x的关系?(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合)
(2)若可用线性回归模型拟合y与x的关系,请建立y关于x的经验回归方程,并预测年产量为10吨时的污水排放量.
相关公式r=,
经验回归方程=x+中,=,=-.
参考数据:≈0.55,≈0.95.
反思感悟
解决回归分析问题的一般步骤
(1)画散点图:根据已知数据画出散点图;
(2)判断变量的相关性并求经验回归方程:通过观察散点图,直观感知两个变量是否具有相关关系.在此基础上,利用最小二乘法求,,然后写出经验回归方程;
(3)回归分析:画残差图或计算R2,进行残差分析;
(4)实际应用:依据求得的经验回归方程解决实际问题.
【跟踪训练】
近年来我国外贸企业一手抓质量,一手抓生产,产销形势喜人.自2023年6月以来,我国外贸进出口连续实现正增长,出口国际市场占世界的份额不断攀升,外贸发展韧性强劲.某个远洋运输公司出口营业额增长数据表如下:
月份 2023年 6月 2023年 7月 2023年 8月 2023年 9月
月份代码x 1 2 3 4
新增出口营业额 y亿元 2.4 2.8 3.6 5.1
月份 2023年 10月 2023年 11月 2023年 12月 2024年 1月
月份代码x 5 6 7 8
新增出口营业额 y亿元 7.1 9.1 11.7 14.2
某位同学分别用两种模型:①=x2+,②=x+进行拟合,得到相应的经验回归方程并进行残差分析,残差图如下(注:残差等于yi-):
这位同学在进行拟合时,对数据作了初步处理,得到一些统计量的值:
(xi-)(yi-)=72.8,(xi-)2=42,(ti-)(yi-)=686.8,(ti-)2=3 570.其中ti=,=ti.
(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由;
(2)根据(1)的判断结果及表中数据,建立y关于x的经验回归方程,并预测该远洋运输公司2024年3月新增出口营业额.(精确到0.01)
附:对于一组数据(u1,υ1),(u2,υ2),…,(un,υn),经验回归直线=+u的斜率和截距的最小二乘估计公式分别为=,=-.
二、独立性检验
  独立性检验研究的主要问题是讨论两个分类变量之间关联性问题.为此需先列出2×2列联表,从表格中可以直观地得到两个分类变量是否有关系.另外等高堆积条形图能更直观地反映两个分类变量之间的情况.独立性检验的思想是先假设二者无关系,求随机变量χ2的值,若χ2大于临界值,则拒绝假设,否则,接受假设.
【例2】 2023年12月28日,小米汽车举行了技术发布会,首款产品SU7揭开神秘面纱,引起了广大车迷爱好者的热议,为了了解车迷们对该款汽车的购买意愿与性别是否具有相关性,某车迷协会随机抽取了200名车迷朋友进行调查,所得数据统计如下表所示:
性别 购车意愿 合计
愿意购置该款汽车 不愿购置该款汽车
男性 100 20 120
女性 50 30 80
合计 150 50 200
请根据小概率值α=0.001的独立性检验,分析车迷们对该款汽车的购买意愿与性别是否有关.
参考公式:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
反思感悟
解独立性检验应用问题的关注点
(1)两个明确:①明确两类主体;②明确研究的两个问题;
(2)两个准确:①准确列出2×2列联表;②准确理解χ2.
【跟踪训练】
某机构为了了解患色盲是否与性别有关,随机抽取了1 000名成年人进行调查,在调查的480名男性中有38名患色盲,520名女性中有6名患色盲,分别利用图形和独立性检验(α=0.001)的方法来判断患色盲与性别是否有关.
章末复习与总结
【例1】 解:(1)由折线图,得==5,==4,
(xi-)(yi-)=3+0+0+0+3=6,
=9+1+0+1+9=20,
=1+0+0+0+1=2,
所以样本相关系数r==≈0.95,
因为|r|>0.75,所以可用线性回归模型拟合y与x的关系.
(2)===0.3,=-=4-0.3×5=2.5,
所以经验回归方程为=0.3x+2.5,
当x=10时,=5.5,
所以预测年产量为10吨时的污水排放量为5.5吨.
跟踪训练
 解:(1)选择模型①.
理由如下:根据残差图可以看出,模型①的估计值和真实值相对比较接近,模型②的残差相对较大一些,所以模型①的拟合效果相对较好.
(2)由(1),可知y关于x的经验回归方程为=x2+,令t=x2,则=t+.
由所给数据可得=ti=×(1+4+9+16+25+36+49+64)=25.5.
=yi=×(2.4+2.8+3.6+5.1+7.1+9.1+11.7+14.2)=7.
所以==≈0.19.
=-≈7-0.19×25.5≈2.16.
所以y关于x的经验回归方程为=0.19x2+2.16.
预测该远洋运输公司2024年3月新增出口营业额为=0.19×102+2.16=21.16(亿元).
【例2】 解:零假设为H0:车迷们对该款汽车的购买意愿与性别无关.
根据表中数据可得χ2==≈11.111>10.828=x0.001,
根据小概率值α=0.001的独立性检验,我们推断H0不成立,
即认为车迷们对该款汽车的购买意愿与性别有关.
跟踪训练
 解:根据题目所给的数据作出如下的列联表:
性别 色盲 合计
患色盲 未患色盲
男 38 442 480
女 6 514 520
合计 44 956 1 000
根据列联表作出相应的等高堆积条形图,如图所示.
图中两个深色条的高分别表示男性和女性中患色盲的频率,从图中可以看出,男性中患色盲的频率明显高于女性中患色盲的频率,因此我们可认为患色盲与性别有关.
零假设为H0:患色盲与性别无关.
根据列联表中所给的数据,得
χ2=≈27.139>10.828=x0.001,根据小概率值α=0.001的独立性检验,推断H0不成立,即认为患色盲与性别有关,此推断犯错误的概率不超过0.001.
3 / 3(共23张PPT)
章末复习与总结
一、回归分析
  回归分析是对具有相关关系的两个变量进行统计分析的一种常用
方法.其基本步骤为通过散点图和经验选择经验回归方程的类型:对
于线性回归分析,直接根据最小二乘法求出经验回归方程;而非线性
回归分析,则要通过换元,或取对数等代数变换转化为线性回归分析
模型,最后应用于实际或对预报变量进行预测.
【例1】 如图是某采矿厂的污水排放量y(单位:吨)与矿产品年产
量x(单位:吨)的折线图:
(1)依据折线图计算样本相关系数r(精确到
0.01),并据此判断是否可用线性回归模
型拟合y与x的关系?(若|r|>0.75,则
线性相关程度很高,可用线性回归模型拟合)
解: 由折线图,得 = =5, = =4,
(xi- )(yi- )=3+0+0+0+3=6,
=9+1+0+1+9=20,
=1+0+0+0+1=2,
所以样本相关系数r= = ≈0.95,
因为|r|>0.75,所以可用线性回归模型拟合y与x的关系.
(2)若可用线性回归模型拟合y与x的关系,请建立y关于x的经验回
归方程,并预测年产量为10吨时的污水排放量.
相关公式r= ,
经验回归方程 = x+ 中, = , = - .
参考数据: ≈0.55, ≈0.95.
解: = = =0.3, = - =4-0.3×5=2.5,所以经验回归方程为 =0.3x+2.5,当x=10时, =5.5,所以预测年产量为10吨时的污水排放量为5.5吨.
反思感悟
解决回归分析问题的一般步骤
(1)画散点图:根据已知数据画出散点图;
(2)判断变量的相关性并求经验回归方程:通过观察散点图,直观
感知两个变量是否具有相关关系.在此基础上,利用最小二乘法
求 , ,然后写出经验回归方程;
(3)回归分析:画残差图或计算R2,进行残差分析;
(4)实际应用:依据求得的经验回归方程解决实际问题.
【跟踪训练】
近年来我国外贸企业一手抓质量,一手抓生产,产销形势喜人.自
2023年6月以来,我国外贸进出口连续实现正增长,出口国际市场占
世界的份额不断攀升,外贸发展韧性强劲.某个远洋运输公司出口营
业额增长数据表如下:
月份 2023年6月 2023年7月 2023年8月 2023年9月
月份代码x 1 2 3 4
新增出口营
业额y亿元 2.4 2.8 3.6 5.1
月份代码x 5 6 7 8
新增出口营
业额y亿元 7.1 9.1 11.7 14.2
某位同学分别用两种模型:① = x2+ ,② = x+ 进行拟合,
得到相应的经验回归方程并进行残差分析,残差图如下(注:残差等
于yi- ):
这位同学在进行拟合时,对数据作了初步处理,得到一些统计量
的值:
(xi- )(yi- )=72.8, (xi- )2=42, (ti- )
(yi- )=686.8, (ti- )2=3 570.其中ti= , = ti.
(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模
型?并简要说明理由;
解: 选择模型①.
理由如下:根据残差图可以看出,模型①的估计值和真实值相
对比较接近,模型②的残差相对较大一些,所以模型①的拟合
效果相对较好.
(2)根据(1)的判断结果及表中数据,建立y关于x的经验回归方
程,并预测该远洋运输公司2024年3月新增出口营业额.(精确
到0.01)
附:对于一组数据(u1,υ1),(u2,υ2),…,(un,υn),
经验回归直线 = + u的斜率和截距的最小二乘估计公式分
别为 = , = - .
解: 由(1),可知y关于x的经验回归方程为 = x2+
,令t=x2,则 = t+ .
由所给数据可得 = ti= ×(1+4+9+16+25+36+49+
64)=25.5.
= yi= ×(2.4+2.8+3.6+5.1+7.1+9.1+11.7+
14.2)=7.
所以 = = ≈0.19.
= - ≈7-0.19×25.5≈2.16.
所以y关于x的经验回归方程为 =0.19x2+2.16.
预测该远洋运输公司2024年3月新增出口营业额为 =0.19×102
+2.16=21.16(亿元).
二、独立性检验
  独立性检验研究的主要问题是讨论两个分类变量之间关联性问
题.为此需先列出2×2列联表,从表格中可以直观地得到两个分类变
量是否有关系.另外等高堆积条形图能更直观地反映两个分类变量之
间的情况.独立性检验的思想是先假设二者无关系,求随机变量χ2的
值,若χ2大于临界值,则拒绝假设,否则,接受假设.
【例2】 2023年12月28日,小米汽车举行了技术发布会,首款产品
SU7揭开神秘面纱,引起了广大车迷爱好者的热议,为了了解车迷们
对该款汽车的购买意愿与性别是否具有相关性,某车迷协会随机抽取
了200名车迷朋友进行调查,所得数据统计如下表所示:
性别 购车意愿 合计
愿意购置该款汽车 不愿购置该款汽车
男性 100 20 120
女性 50 30 80
合计 150 50 200
请根据小概率值α=0.001的独立性检验,分析车迷们对该款汽车的
购买意愿与性别是否有关.
参考公式:χ2= ,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解:零假设为H0:车迷们对该款汽车的购买意愿与性别无关.
根据表中数据可得χ2= = ≈11.111>10.828
=x0.001,
根据小概率值α=0.001的独立性检验,我们推断H0不成立,
即认为车迷们对该款汽车的购买意愿与性别有关.
反思感悟
解独立性检验应用问题的关注点
(1)两个明确:①明确两类主体;②明确研究的两个问题;
(2)两个准确:①准确列出2×2列联表;②准确理解χ2.
【跟踪训练】
某机构为了了解患色盲是否与性别有关,随机抽取了1 000名成年人进
行调查,在调查的480名男性中有38名患色盲,520名女性中有6名患
色盲,分别利用图形和独立性检验(α=0.001)的方法来判断患色
盲与性别是否有关.
解:根据题目所给的数据作出如下的列联表:
性别 色盲 合计
患色盲 未患色盲
男 38 442 480
女 6 514 520
合计 44 956 1 000
根据列联表作出相应的等高堆积
条形图,如图所示.
图中两个深色条的高分别表示男
性和女性中患色盲的频率,从图
中可以看出,男性中患色盲的频
率明显高于女性中患色盲的频率,因此我们可认为患色盲与性别有关.
零假设为H0:患色盲与性别无关.根据列联表中所给的数据,得χ2= ≈27.139>10.828=x0.001,根据小概率值
α=0.001的独立性检验,推断H0不成立,即认为患色盲与性别有
关,此推断犯错误的概率不超过0.001.
谢 谢 观 看!