第9章 章末复习与总结(课件 学案)高中数学苏教版(2019)选择性必修 第二册

文档属性

名称 第9章 章末复习与总结(课件 学案)高中数学苏教版(2019)选择性必修 第二册
格式 zip
文件大小 1.8MB
资源类型 教案
版本资源 苏教版(2019)
科目 数学
更新时间 2025-08-09 14:55:46

文档简介

一、变量的相关性
  变量的相关关系与样本相关系数是学习线性回归模型的前提和基础,前者可借助散点图从直观上分析变量间的相关性,后者从数量上准确刻画了两个变量的相关程度.
【例1】 (2022·全国乙卷理19题·节选)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得=0.038,=1.615 8,xiyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01).
附:样本相关系数
r=,≈1.377.
反思感悟
判断变量相关性的两种方法
(1)散点图法:直观形象;
(2)公式法:可用公式精确计算,需注意特殊情形的样本相关系数.如点在一条直线上,|r|=1,且当r=1时,正相关;r=-1时,负相关.
【跟踪训练】
1.某次考试,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩对应如下表:
学生编号 1 2 3 4 5 6 7 8
数学成绩x 60 65 70 75 80 85 90 95
物理成绩y 72 77 80 84 88 90 93 95
绘出散点图如下.
根据以上信息,判断下列结论:
①根据此散点图,可以判断数学成绩与物理成绩具有线性相关关系;
②根据此散点图,可以判断数学成绩与物理成绩具有一次函数关系;
③甲同学数学考了80分,那么,他的物理成绩一定比数学只考了60分的乙同学的物理成绩要高.
其中正确的个数为(  )
A.0          B.3
C.2 D.1
2.相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到经验回归方程为=x+,样本相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到经验回归方程为=x+,样本相关系数为r2.则(  )
A.0<r1<r2<1 B.0<r2<r1<1
C.-1<r1<r2<0 D.-1<r2<r1<0
二、经验回归方程
  主要考查两个变量线性相关的判定,以及利用最小二乘法求经验回归方程,并应用于实际或对因变量进行预测.
【例2】 某项研究发现某地的PM10浓度与车流量之间有线性相关关系.现采集到该地一周内车流量x与PM10浓度y的数据如下表:
时间 车流量x(单位:万辆) PM10浓度y(单位:μg/m3)
星期一 25.4 35.7
星期二 24.6 34.5
星期三 23.5 35.2
星期四 24.4 33.6
星期五 25.8 36.1
星期六 19.7 30.9
星期日 20.3 29.4
(1)在如图所示的坐标系中作出表中数据的散点图;
(2)根据表中的统计数据,求出经验回归方程=x+(精确到0.01).
反思感悟
解决回归分析问题的一般步骤
(1)画散点图.根据已知数据画出散点图;
(2)判断变量的相关性并求经验回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出经验回归方程;
(3)实际应用.依据求得的经验回归方程解决实际问题.
【跟踪训练】
近年来我国外贸企业一手抓质量,一手抓生产,产销形势喜人.自2023年6月以来,我国外贸进出口连续实现正增长,出口国际市场占世界的份额不断攀升,外贸发展韧性强劲.某个远洋运输公司出口营业额增长数据表如下:
月份 2023年6月 2023年7月 2023年8月 2023年9月
月份代码x 1 2 3 4
新增出口营业额 y亿元 2.4 2.8 3.6 5.1
月份 2023年10月 2023年11月 2023年12月 2024年1月
月份代码x 5 6 7 8
新增出口营业额 y亿元 7.1 9.1 11.7 14.2
某位同学分别用两种模型:①=x2+,②=x+进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差等于yi-):
这位同学在进行拟合时,对数据作了初步处理,得到一些统计量的值:
(ti-)(yi-)=686.8,(ti-)2=3 570.其中ti=,=ti.
(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由;
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测该远洋运输公司2024年3月新增出口营业额.(精确到0.01)
附:对于一组数据(u1,υ1),(u2,υ2),…,(un,υn),经验回归直线=+u的斜率和截距的最小二乘估计公式分别为=,=-.
三、独立性检验
  独立性检验研究的主要问题是讨论两个分类变量之间关联性问题.为此需先列出2×2列联表,从表格中可以直观地得到两个分类变量是否有关系.独立性检验的思想是先假设二者无关系,求随机变量χ2的值,若χ2大于临界值,则拒绝假设,否则,接受假设.
【例3】 2023年12月28日,小米汽车举行了技术发布会,首款产品SU7揭开神秘面纱,引起了广大车迷爱好者的热议,为了了解车迷们对该款汽车的购买意愿与性别是否具有相关性,某车迷协会随机抽取了200名车迷朋友进行调查,所得数据统计如下表所示:
购车意愿
愿意购置 该款汽车 不愿购置 该款汽车 合计
性别 男性 100 20 120
女性 50 30 80
合计 150 50 200
判断是否有99%把握认为车迷们对该款汽车的购买意愿与性别有关.
参考公式:χ2=,其中n=a+b+c+d.
P(χ2≥x0) 0.1 0.05 0.01 0.005 0.001
x0 2.706 3.841 6.635 7.879 10.828
反思感悟
解独立性检验应用问题的关注点
(1)两个明确:①明确两类主体;②明确研究的两个问题;
(2)两个准确:①准确列出2×2列联表;②准确理解χ2.
【跟踪训练】
随着手机的发展,“微信”逐渐成为人们交流的一种形式,某机构对“使用微信交流”的态度进行调查,随机抽取了50人,他们年龄的频数分布及对“使用微信交流”赞成人数如下表:
年龄/岁 [15, 25) [25, 35) [35, 45) [45, 55) [55, 65) [65, 75]
频数 5 10 15 10 5 5
赞成人数 5 10 12 7 2 1
(1)若以“年龄45岁为分界点”,由以上统计数据完成下面2×2列联表,并判断是否有99%的把握认为“使用微信交流”的态度与人的年龄有关;
年龄不低于 45岁的人数 年龄低于 45岁的人数 合计
赞成
不赞成
合计
(2)若从年龄在[55,65)的被调查人中随机选取2人进行追踪调查,求2人中至少有1人不赞成“使用微信交流”的概率.
附:χ2=.
P(χ2≥x0) 0.10 0.05 0.01 0.005 0.001
x0 2.706 3.841 6.635 7.879 10.828
章末复习与总结
【例1】 解:(1)估计该林区这种树木平均一棵的根部横截面积===0.06,
估计该林区这种树木平均一棵的材积量===0.39.
(2)(xi-)(yi-)=xiyi-10=0.013 4,
(xi-)2=-10()2=0.002,
(yi-)2=-10()2=0.094 8,
所以
==≈0.01×1.377=0.013 77,
所以样本相关系数
r=≈≈0.97.
跟踪训练
1.D 对于①②,根据此散点图知,各点都分布在一条直线附近,可以判断数学成绩与物理成绩具有较强的线性相关关系,不是一次函数关系,①正确,②错误;对于③,甲同学数学考了80分,他的物理成绩可能比数学只考了60分的乙同学的物理成绩要高,③错误.综上,正确的命题是①,只有1个.
2.D 由散点图得两个变量呈负相关关系,所以r1<0,r2<0,因为剔除点(10,21)后,剩下点的数据的线性相关性更强,|r|更接近1,所以-1<r2<r1<0.故选D.
【例2】 解:(1)如图所示.
(2)由表中数据得≈23.4,≈33.6,=≈≈0.97,
=-=33.6-0.97×23.4≈10.90.
所以y关于x的经验回归方程为=0.97x+10.90.
跟踪训练
 解:(1)选择模型①.
理由如下:根据残差图可以看出,模型①的估计值和真实值相对比较接近,模型②的残差相对较大一些,所以模型①的拟合效果相对较好.
(2)由(1),可知y关于x的回归方程为=x2+,令t=x2,则=t+.
由所给数据可得=ti=×(1+4+9+16+25+36+49+64)=25.5,
=yi=×(2.4+2.8+3.6+5.1+7.1+9.1+11.7+14.2)=7,
所以==≈0.19,
=-≈7-0.19×25.5≈2.16,
所以y关于x的回归方程为=0.19x2+2.16.
预测该远洋运输公司2024年3月新增出口营业额为=0.19×102+2.16=21.16(亿元).
【例3】 解:原假设为H0:车迷们对该款汽车的购买意愿与性别无关.
根据表中数据可得
χ2==≈11.111>10.828,
所以有99%的把握认为车迷们对该款汽车的购买意愿与性别有关.
跟踪训练
 解:(1)由题中统计数据填写2×2列联表,如下:
年龄不低于 45岁的人数 年龄低于 45岁的人数 合计
赞成 10 27 37
不赞成 10 3 13
合计 20 30 50
根据公式计算,得
χ2=≈9.98>6.635,
所以有99%的把握认为“使用微信交流”的态度与人的年龄有关.
(2)设年龄在[55,65)中不赞成“使用微信交流”的人分别为A,B,C,赞成“使用微信交流”的人分别为a,b,
则从5人中随机选取2人有AB,AC,Aa,Ab,BC,Ba,Bb,Ca,Cb,ab,共10个结果.
其中2人中至少有1人不赞成“使用微信交流”的有AB,AC,Aa,Ab,BC,Ba,Bb,Ca,Cb,共9个结果,
所以2人中至少有1人不赞成“使用微信交流”的概率P=.
5 / 5(共37张PPT)
章末复习与总结
一、变量的相关性
  变量的相关关系与样本相关系数是学习线性回归模型的前提和基
础,前者可借助散点图从直观上分析变量间的相关性,后者从数量上
准确刻画了两个变量的相关程度.
【例1】 (2022·全国乙卷理19题·节选)某地经过多年的环境治理,
已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随
机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和
材积量(单位:m3),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截 面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得 =0.038, =1.615 8, xiyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材
积量;
解: 估计该林区这种树木平均一棵的根部横截面积 =
= =0.06,
估计该林区这种树木平均一棵的材积量 = = =0.39.
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数
(精确到0.01).
附:样本相关系数r= ,
≈1.377.
解: (xi- )(yi- )= xiyi-10 =0.013 4,
(xi- )2= -10( )2=0.002,
(yi- )2= -10( )2=0.094 8,
所以 = =
≈0.01×1.377=0.013 77,
所以样本相关系数r= ≈ ≈0.97.
反思感悟
判断变量相关性的两种方法
(1)散点图法:直观形象;
(2)公式法:可用公式精确计算,需注意特殊情形的样本相关系数.
如点在一条直线上,|r|=1,且当r=1时,正相关;r=-1
时,负相关.
【跟踪训练】
1. 某次考试,班主任从全班同学中随机抽取一个容量为8的样本,他
们的数学、物理成绩对应如下表:
学生
编号 1 2 3 4 5 6 7 8
数学
成绩x 60 65 70 75 80 85 90 95
物理
成绩y 72 77 80 84 88 90 93 95
绘出散点图如下.
根据以上信息,判断下列结论:
①根据此散点图,可以判断数学成绩与物理成绩具有线性相关
关系;
②根据此散点图,可以判断数学成绩与物理成绩具有一次函数
关系;
③甲同学数学考了80分,那么,他的物理成绩一定比数学只考了60
分的乙同学的物理成绩要高.
其中正确的个数为(  )
A. 0 B. 3
C. 2 D. 1
解析:  对于①②,根据此散点图知,各点都分布在一条直线附
近,可以判断数学成绩与物理成绩具有较强的线性相关关系,不是
一次函数关系,①正确,②错误;对于③,甲同学数学考了80分,
他的物理成绩可能比数学只考了60分的乙同学的物理成绩要高,③
错误.综上,正确的命题是①,只有1个.
2. 相关变量x,y的散点图如图所示,现对这两个变量进行线性相关
分析,方案一:根据图中所有数据,得到经验回归方程为 = x
+ ,样本相关系数为r1;方案二:剔除点(10,21),根据剩
下数据得到经验回归方程为 = x+ ,样本相关系数为r2.则
(  )
A. 0<r1<r2<1 B. 0<r2<r1<1
C. -1<r1<r2<0 D. -1<r2<r1<0
解析:  由散点图得两个变量呈负相关关系,所以r1<0,r2<
0,因为剔除点(10,21)后,剩下点的数据的线性相关性更
强,|r|更接近1,所以-1<r2<r1<0.故选D.
二、经验回归方程
  主要考查两个变量线性相关的判定,以及利用最小二乘法求经验
回归方程,并应用于实际或对因变量进行预测.
【例2】 某项研究发现某地的PM10浓度与车流量之间有线性相关关
系.现采集到该地一周内车流量x与PM10浓度y的数据如下表:
时间 车流量x(单位:万辆) PM10浓度y(单位:μg/m3)
星期一 25.4 35.7
星期二 24.6 34.5
星期三 23.5 35.2
星期四 24.4 33.6
星期五 25.8 36.1
星期六 19.7 30.9
星期日 20.3 29.4
(1)在如图所示的坐标系中作出表中数据的散点图;
解: 如图所示.
(2)根据表中的统计数据,求出经验回归方程 = x+ (精确到
0.01).
解: 由表中数据得 ≈23.4, ≈33.6, = ≈ ≈0.97, = - =33.6-0.97×23.4≈10.90.
所以y关于x的经验回归方程为 =0.97x+10.90.
反思感悟
解决回归分析问题的一般步骤
(1)画散点图.根据已知数据画出散点图;
(2)判断变量的相关性并求经验回归方程.通过观察散点图,直观感
知两个变量是否具有相关关系;在此基础上,利用最小二乘法
求回归系数,然后写出经验回归方程;
(3)实际应用.依据求得的经验回归方程解决实际问题.
【跟踪训练】
近年来我国外贸企业一手抓质量,一手抓生产,产销形势喜人.自
2023年6月以来,我国外贸进出口连续实现正增长,出口国际市场占
世界的份额不断攀升,外贸发展韧性强劲.某个远洋运输公司出口营
业额增长数据表如下:
月份 2023年6月 2023年7月 2023年8月 2023年9月
月份代码x 1 2 3 4
新增出口营
业额y亿元 2.4 2.8 3.6 5.1
月份代码x 5 6 7 8
新增出口营
业额y亿元 7.1 9.1 11.7 14.2
某位同学分别用两种模型:① = x2+ ,② = x+ 进行拟合,
得到相应的回归方程并进行残差分析,残差图如下(注:残差等于yi
- ):
这位同学在进行拟合时,对数据作了初步处理,得到一些统计量
的值:
(ti- )(yi- )=686.8, (ti- )2=3 570.其中ti=
, = ti.
(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模
型?并简要说明理由;
解: 选择模型①.
理由如下:根据残差图可以看出,模型①的估计值和真实值相
对比较接近,模型②的残差相对较大一些,所以模型①的拟合
效果相对较好.
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,
并预测该远洋运输公司2024年3月新增出口营业额.(精确到
0.01)
附:对于一组数据(u1,υ1),(u2,υ2),…,(un,υn),
经验回归直线 = + u的斜率和截距的最小二乘估计公式分
别为 = , = - .
解: 由(1),可知y关于x的回归方程为 = x2+ ,令
t=x2,则 = t+ .
由所给数据可得 = ti= ×(1+4+9+16+25+36+49+
64)=25.5,
= yi= ×(2.4+2.8+3.6+5.1+7.1+9.1+11.7+
14.2)=7,
所以 = = ≈0.19,
= - ≈7-0.19×25.5≈2.16,
所以y关于x的回归方程为 =0.19x2+2.16.
预测该远洋运输公司2024年3月新增出口营业额为 =0.19×102
+2.16=21.16(亿元).
三、独立性检验
  独立性检验研究的主要问题是讨论两个分类变量之间关联性问
题.为此需先列出2×2列联表,从表格中可以直观地得到两个分类变
量是否有关系.独立性检验的思想是先假设二者无关系,求随机变量χ2
的值,若χ2大于临界值,则拒绝假设,否则,接受假设.
【例3】 2023年12月28日,小米汽车举行了技术发布会,首款产品
SU7揭开神秘面纱,引起了广大车迷爱好者的热议,为了了解车迷们
对该款汽车的购买意愿与性别是否具有相关性,某车迷协会随机抽取
了200名车迷朋友进行调查,所得数据统计如下表所示:
购车意愿
愿意购置 该款汽车 不愿购置 该款汽车 合计

别 男性 100 20 120
女性 50 30 80
合计 150 50 200
判断是否有99%把握认为车迷们对该款汽车的购买意愿与性别有关.
参考公式:χ2= ,其中n=a+b+c+d.
P
(χ2≥x0) 0.1 0.05 0.01 0.005 0.001
x0 2.706 3.841 6.635 7.879 10.828
解:原假设为H0:车迷们对该款汽车的购买意愿与性别无关.
根据表中数据可得χ2= = ≈11.111>
10.828,
所以有99%的把握认为车迷们对该款汽车的购买意愿与性别有关.
反思感悟
解独立性检验应用问题的关注点
(1)两个明确:①明确两类主体;②明确研究的两个问题;
(2)两个准确:①准确列出2×2列联表;②准确理解χ2.
【跟踪训练】
随着手机的发展,“微信”逐渐成为人们交流的一种形式,某机构对
“使用微信交流”的态度进行调查,随机抽取了50人,他们年龄的频
数分布及对“使用微信交流”赞成人数如下表:
年龄/岁 [15,
25) [25,
35) [35,
45) [45,
55) [55,
65) [65,75]
频数 5 10 15 10 5 5
赞成人数 5 10 12 7 2 1
(1)若以“年龄45岁为分界点”,由以上统计数据完成下面2×2列
联表,并判断是否有99%的把握认为“使用微信交流”的态度
与人的年龄有关;
年龄不低于 45岁的人数 年龄低于 45岁的人数 合计
赞成
不赞成
合计
解: 由题中统计数据填写2×2列联表,如下:
年龄不低于 45岁的人数 年龄低于 45岁的人数 合计
赞成 10 27 37
不赞成 10 3 13
合计 20 30 50
根据公式计算,得χ2= ≈9.98>6.635,
所以有99%的把握认为“使用微信交流”的态度与人的年龄
有关.
(2)若从年龄在[55,65)的被调查人中随机选取2人进行追踪调
查,求2人中至少有1人不赞成“使用微信交流”的概率.
附:χ2= .
P(χ2≥x0) 0.10 0.05 0.01 0.005 0.001
x0 2.706 3.841 6.635 7.879 10.828
解: 设年龄在[55,65)中不赞成“使用微信交流”的人
分别为A,B,C,赞成“使用微信交流”的人分别为a,b,
则从5人中随机选取2人有AB,AC,Aa,Ab,BC,Ba,
Bb,Ca,Cb,ab,共10个结果.
其中2人中至少有1人不赞成“使用微信交流”的有AB,AC,
Aa,Ab,BC,Ba,Bb,Ca,Cb,共9个结果,
所以2人中至少有1人不赞成“使用微信交流”的概率P= .
谢 谢 观 看!