第八章成对数据的统计分析“四步复习法”单元复习讲义(有答案)

文档属性

名称 第八章成对数据的统计分析“四步复习法”单元复习讲义(有答案)
格式 docx
文件大小 850.1KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2023-05-31 20:43:45

图片预览

文档简介

第八章 成对数据的统计分析
——2022-2023学年高二数学人教A版(2019)选择性必修第三册
大单元“四步复习法”
第一步:单元学习目标整合
1.成对数据的相关关系 (1)会画出成对样本数据的散点图. (2)会通过散点图判断成对样本数据的相关性. (3)结合实例,了解样本相关系数的统计含义,会通过相关系数比较多组成对数据的相关性.
2.一元线性回归模型及其应用 (1)了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件. (2)会用一元线性回归模型进行预测实际问题.
3.分类变量与列联表 (1)通过实例,理解列联表的统计意义. (2)通过实例,了解列联表与独立性检验及其应用.
第二步:单元思维导图回顾知识
第三步:单元重难知识易混易错
重难知识
1.变量间的相关关系
(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系.与函数关系不同,相关关系是一种非确定性关系.
(2)在散点图中,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在从左上角到右下角的区域内,两个变量的相关关系称为负相关.
2.两个变量的线性相关
(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)回归直线方程
①最小二乘法:通过求的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.
②回归方程:方程是两个具有线性相关关系的变量的一组数据
的回归方程,其中是待定参数.
,其中称为样本点的中心.
(3)相关系数r
①;
②当时,表明两个变量正相关;当时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.当r的绝对值大于或等于0.75时,认为两个变量有很强的线性相关关系.
(4)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.在线性回归模型中,因变量y的值由自变量x和随机误差e共同确定,即自变量x只能解释部分y的变化,在统计中,我们把自变量x称为解释变量,因变量y称为预报变量.
3.分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
4.列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为和,其样本频数列联表(称为2×2列联表)为:
总计
a b
c d
总计
可构造一个随机变量,其中为样本容量.
5.独立性检验
利用独立性假设、随机变量来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
两个分类变量X和Y是否有关系的判断标准:
统计学研究表明:当时,认为X与Y无关;
当时,有95%的把握说X与Y有关;
当时,有99%的把握说X与Y有关;
当时,有99.9%的把握说X与Y有关.
典型例题
1.已知某产品的营销费用x(单位:万元)与销售额y(单位:万元)的统计数据如表所示:
营销费用x/万元 2 3 4 5
销售额y/万元 15 20 30 35
根据上表可得y关于x的回归直线方程为,则当该产品的营销费用为6万元时,销售额为( )
A.40.5万元 B.41.5万元 C.42.5万元 D.45万元
2.(多选)已知某中学的高中女生体重y(单位:kg)与身高x(单位;cm)具有线性相关关系,根据一组样本数据,由最小二乘法近似得到y关于x的回归直线方程为,则下列结论中正确的是()
A.y与x是正相关的
B.该回归直线必过点
C.若该中学某高中女生身高增加1cm,则其体重约增加0.85kg
D.若该中学某高中女生身高为160cm,则其体重必为50.29kg
3.某班班主任对全班50名学生进行了喜欢玩电脑游戏与认为作业多少是否有关系的调查,所得数据如下表:
认为作业多 认为作业不多 总计
喜欢玩电脑游戏 18 9 27
不喜欢玩电脑游戏 8 15 23
总计 26 24 50
根据以上数据得__________(结果保留到小数点后三位).由此得出结论:喜欢玩电脑游戏与认为作业多少有关系的把握为_________%.
4.销售费用预算是以销售收入预算为基础,通过分析销售收入、销售利润和销售费用的关系,力求实现销售费用的最有效使用.根据往年的相关数据显示,某高新技术企业的年销售费用占年销售收入的为合理区间,当年销售费用超出年销售收入的,说明企业的销售环节出现一定的问题,需要加强销售管理.下表为该企业的年销售费用x(单位:千万元)和年销售收入y(单位:千万元)的相关数据:
2017 2018 2019 2020 2021 2022
x 3 5 6 8 9 11
y 31 50 54 86 85 114
(1)求年销售费用x的方差.
(2)通过数据分析,该企业的年销售用x与年销售收入y之间符合线性相关关系,求出线性回归方程.
(3)若该企业2023年预算年销售费用为12千万元,试预测2023年的年销售收入,并判断2023年的年销售费用预测值是否在合理区间内.(精确到0.01千万元)
参考数据:374.
参考公式:,,,.
5.为响应国家在《“十四五”工业绿色发展规划》中提出的“推动绿色发展,促进人与自然和谐共生”理念,某企业计划生产一批太阳能电池板,现有甲、乙两种生产工艺可供选择.为了解两种生产工艺所生产的电池板的质量情况,从中各随机抽取100件进行质量检测,得到如下所示的频率分布直方图.
并规定:
综合得分
质量等级 二等品 一等品
(1)从这100个甲工艺所生产的电池板中按质量等级分层抽样抽取4个,再从这4个中随机抽取2个做进一步研究,求恰有1个质量等级为一等品电池板的概率;
(2)根据频率分布直方图完成下面的列联表,并判断是否有的把握认为电池板的质量等级与生产工艺有关
一等品 二等品
甲生产工艺
乙生产工艺
附:
0.050 0.010 0.001
k 3.841 6.635 10.828
答案以及解析
1.答案:C
解析:由题中表格数据可知,,因为回归直线一定经过点,所以,解得,
所以回归直线方程为,将代入,得.
所以当该产品的营销费用为6万元时,销售额为42.5万元.
故选:C.
2.答案:ABC
解析:根据y关于x的回归直线方程,易知y与x是正相关的,所以A正确;回归直线过点,所以B正确;根据回归直线方程的斜率为0.85,可知该中学某高中女生身高增加1cm,其体重约增加0.85kg,所以C正确;回归直线方程确定之后只能用于预测,所以D错误.故选ABC.
3.答案:5.059;95
解析:由的计算公式可得.,有95%的把握认为二者有关系.
4.答案:(1)
(2)
(3)2023年的年销隺费用预测值在合理区间内
解析:(1)由已知,得,
所以.
(2)因为,
所以.
由题表中的数据,得.
又因为,所以,
所以,
所以该企业的年销售费用x与年销售收入y之间的线性回归方程为.
(3)由(2)可得2023年的年销售收入的预测值(千万元).
所以2023年的年销售费用预测值在合理区间内.
5.答案:(1)
(2)有的把握认为电池板的质量等级与生产工艺有关
解析:(1)根据综合得分与质量等级的关系,结合频率分布直方图可知,
甲生产工艺所生产的100件产品中,一等品有件,
二等品有件,
从这100个甲工艺所生产的电池板中按质量等级分层抽样抽取4个,则一等品抽取3个,记为A,B,C;二等品抽取1个,记为a.
再从这4个中随机抽取2个,所有可能的结果为AB,AC,Aa,BC,Ba,Ca,共6种,
其中恰有1个质量等级为一等品的电池板对应的结果有Aa,Ba,Ca,共3种,
故所求概率为.
(2)由(1)可知,甲生产工艺所生产的100件产品中,一等品有75件,二等品有25件;
乙生产工艺所生产的100件产品中,一等品有件,
二等品有件.
得到列联表如下:
一等品 二等品
甲生产工艺 75 25
乙生产工艺 45 55
故有的把握认为电池板的质量等级与生产工艺有关.
第四步:单元核心素养对接高考
核心素养
回归分析在高考中考查较多,主要考查求回归方程、利用回归方程进行预测,一般以解答题的形式出现,难度中等,有时也以小题形式出现,考查变量的相关性;对于独立性检验,一般以解答题中的一问进行考查,多与概率知识结合命题,特别是以社会现实问题为背景的统计、统计案例与概率相结合的综合题是今后命题的重点与难点,这与新课标对数据分析核心素养的要求密切相关.
真题对接
1.【2022年 新高考Ⅰ卷,20】一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好 良好
病例组 40 60
对照组 10 90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(ⅰ)证明:;
(ⅱ)利用该调查数据,给出,的估计值,并利用(ⅰ)的结果给出R的估计值.
附:,
0.050 0.010 0.001
k 3.841 6.635 10.828
2.【2020年 新高考Ⅰ卷,19】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的和浓度(单位:),得下表:
32 18 4
6 8 12
3 7 10
(1)估计事件“该市一天空气中浓度不超过75,且浓度不超过150”的概率;
(2)根据所给数据,完成下面的列联表:
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中浓度与浓度有关.
附:,
0.050 0.010 0.001
3.841 6.635 10.828
答案以及解析
1.解析:(1),
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(ⅰ),
由题意知,证明即可,
左边,
右边.
左边=右边,故.
(ⅱ)由调查数据可知,,
且,,
所以.
2.解析:(1)根据抽查数据,该市100天的空气中浓度不超过75,且浓度不超过150的天数为,因此,该市一天空气中浓度不超过75,且浓度不超过150的概率的估计值为.
(2)根据抽查数据,可得列联表:
64 16
10 10
(3)根据(2)的列联表得.
由于,故有99%的把握认为该市一天空气中浓度与浓度有关.