选择性必修三第八章 成对数据的统计分析 大单元教学设计

文档属性

名称 选择性必修三第八章 成对数据的统计分析 大单元教学设计
格式 docx
文件大小 427.0KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2025-11-03 22:12:04

图片预览

文档简介

《成对数据的统计分析》大单元教学设计
教材分析
内容分析
本单元是人教 A 版(2019 年)选择性必修三第八章《成对数据的统计分析》,整体围绕成对数据展开,涵盖变量间的相关关系、一元线性回归模型及其应用、列联表与独立性检验等核心内容。
8.1 节主要探讨变量间的相关关系,通过散点图直观判断两个变量是否存在相关关系以及相关关系的类型(正相关、负相关)、强弱程度,为后续回归模型的建立奠定基础。8.2 节包含三个课时。第一课时介绍一元线性回归模型的基本概念,让学生了解模型的表达式及其中随机误差项的意义;第二课时重点讲解一元线性回归模型参数的最小二乘估计,推导参数估计公式,并学习借助软件进行计算;第三课时则是一元线性回归模型的应用,涉及线性回归实例、非线性回归问题的转化以及模型的评价与改进。8.3 节学习列联表与独立性检验,通过列联表分析两个分类变量之间是否存在关联,掌握独立性检验的基本思想和方法。
本单元各课时内容层层递进,从认识相关关系到建立回归模型,再到模型的应用与评价,最后学习分类变量的独立性检验,形成了完整的成对数据统计分析知识体系。
素养分析
在本单元的学习过程中,学生通过对成对数据的观察、分析、建模和推断,能够有效提升数据分析素养,学会从数据中提取有用信息;在建立回归模型和进行独立性检验的过程中,培养数学建模素养,将实际问题转化为数学问题并加以解决;通过推导公式、进行逻辑推理和论证,增强逻辑推理素养;同时,对相关概念和原理的抽象概括,有助于提高数学抽象素养。此外,本单元内容也是加强学生 “四基”(基础知识、基本技能、基本思想、基本活动经验),提高 “四能”(发现问题、提出问题、分析问题、解决问题的能力)的重要载体。
学情分析:
学生在之前的学习中已经接触过一些统计知识,对数据处理有一定的基础,但本单元内容理论性较强,涉及较多抽象概念和复杂公式推导,如最小二乘估计、决定系数、独立性检验的卡方统计量等,学生理解起来有一定难度。同时,数据处理要求高、计算量大,容易出错。不过,学生对统计知识在实际生活中的应用比较感兴趣,学习积极性较高。在教学中,可适当降低手工计算要求,借助 GeoGebra、Excel 等软件辅助教学,让学生将更多精力集中在对理论知识的理解和应用上。此外,由于内容难度较大,需要教师多鼓励、多引导,激发学生的探索精神和科学钻研精神。
单元教学目标:
能通过具体实例判断两个变量之间是否存在相关关系,区分正相关和负相关,并用散点图直观表示。理解一元线性回归模型的含义,掌握参数的最小二乘估计方法,能运用软件计算参数并得到经验回归方程。能对回归模型进行残差分析和决定系数分析,评价模型的拟合效果,根据需要对模型进行修改和改进,能将某些非线性回归问题转化为线性回归问题。了解列联表的概念,掌握独立性检验的基本思想和方法,能运用独立性检验判断两个分类变量是否有关联。通过本单元的学习,提高数据分析、数学建模、逻辑推理和数学抽象等核心素养,增强运用统计知识解决实际问题的能力。
单元教学重点和难点
重点
变量间相关关系的判断;一元线性回归模型的建立、参数的最小二乘估计及经验回归方程的应用;非线性回归问题的转化;列联表与独立性检验的方法和应用。
难点
对一元线性回归模型中随机误差项的理解;最小二乘估计原理的理解和公式推导;运用合适的变换将非线性相关问题转化为线性相关问题;独立性检验的基本思想和卡方统计量的意义。
教学支持条件分析
在本单元教学中,需要借助多种教学工具和软件辅助教学。利用 GeoGebra 软件绘制散点图、拟合回归直线、进行非线性拟合、计算参数估计值、进行残差分析以及绘制列联表相关图形等;运用 Excel 软件进行数据处理、计算统计量等,帮助学生更直观地理解和掌握知识,降低计算难度,提高课堂效率。
分课时教学过程设计
第一课时:一元线性回归模型(第一课时)
情境引入:
展示生活中存在相关关系的实例,如父亲身高与儿子身高、学习时间与考试成绩等,引导学生思考这些变量之间的关系。通过提问“这些变量之间的关系是函数关系吗?如果不是,它们之间存在怎样的联系?”引发学生兴趣,进而引出本节课要学习的一元线性回归模型。
新知探究:
讲解相关关系的概念,说明相关关系是一种非确定性关系,与函数关系不同。 介绍散点图的绘制方法,让学生动手绘制上述实例的散点图,观察散点的分布特征,判断变量间是否存在线性相关关系以及是正相关还是负相关。 引出一元线性回归模型的表达式y = bx + a+e,其中y是响应变量,x是解释变量,a和b是模型参数,e是随机误差项。解释各部分的含义,强调随机误差项e的存在是因为影响y的因素除了x还有很多其他未考虑到的因素,以及测量误差等。
巩固练习:
给出一组变量数据,让学生判断是否存在线性相关关系,并尝试写出可能的一元线性回归模型表达式。
课堂小结:
结本节课学习的相关关系、散点图以及一元线性回归模型的基本概念和表达式。
作业布置:
让学生收集一组生活中存在线性相关关系的数据,绘制散点图,并尝试写出一元线性回归模型。
第二课时:一元线性回归模型参数的最小二乘估计(第二课时)
复习回顾:
之前我们学习了在一元线性回归模型中,用最小二乘法估计参数值,推导了计算公式,并学习了借助残差分析对模型作出更符合实际的预测与决策的思想。我们介绍了用GeoGebra软件在绘制散点图、处理数据及“回归”分析方面的基本操作。那么,如何利用这些理论与工具呢?请大家一起解决一个这样的实际问题吧。
实例引入:
例:经验表明,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高。由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高。在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据,试根据这些数据建立树高关于胸径的经验回归方程。
解:以胸径数据为横坐标,对应树高为纵坐标,用GeoGebra软件做出散点图,散点大致分布在一条从左下角到右上角的直线附近,表明两个变量线性相关,并且是正相关,因此可以用一元线性回归模型刻画树高与胸径之间的关系。 以d表示胸径,h表示树高,根据最小二乘法,计算得到经验回归方程为:h=0.2493d +14.84。
根据经验回归方程,由表中胸径的数据可以计算出树高的预测值以及相应的残差(表略)
对该模型进行残差分析,得到相应图像。 观察残差表和残差图,可以看到,残差的绝对值最大是0.8,所有残差分布在以横轴为对称轴、宽度小于2的带状区域内,可见经验回归方程较好地刻画了树高与胸径的关系,我们可以根据经验回归方程由胸径预测树高。
知识讲解:
详细讲解最小二乘法的原理,即通过使残差平方和最小来估计模型参数。推导一元线性回归模型中参数a和b的最小二乘估计公式,结合上述实例进行说明,让学生理解公式的由来和意义。
软件操作演示:
再次演示使用GeoGebra软件进行数据输入、绘制散点图、计算回归方程参数以及进行残差分析的操作步骤,让学生熟悉软件的使用方法,以便在后续学习中能够自主运用软件处理数据。
课堂练习:
给出另一组存在线性相关关系的数据,让学生分组合作,运用最小二乘法原理和GeoGebra软件,建立经验回归方程,并进行残差分析,评价模型的拟合效果。
课堂小结:
总结本节课学习的最小二乘法估计参数的方法、经验回归方程的建立以及残差分析的作用,强调在实际应用中如何运用这些知识解决问题。
作业布置:
让学生寻找一个与生活相关的存在线性相关关系的实际问题,收集数据,建立经验回归方程,进行残差分析,并撰写一份简短的分析报告。
第三课时:一元线性回归模型的应用(第三课时)
复习回顾
之前我们学习了在一元线性回归模型中,用最小二乘法估计参数值,推导了计算公式,并学习了借助残差分析对模型作出更符合实际的预测与决策的思想。我们介绍了用GeoGebra软件在绘制散点图、处理数据及“回归”分析方面的基本操作。那么,如何利用这些理论与工具呢?请大家一起解决一个这样的实际问题吧。
实例引入
例 经验表明,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据,试根据这些数据建立树高关于胸径的经验回归方程.
编号 1 2 3 4 5 6 7 8 9 10 11 12
胸径/cm 18.1 20.1 22.2 24.4 26 28.3 29.6 32.4 33.7 35.7 38.3 40.2
树高/m 18.8 19.2 21 21 22.1 22.1 22.4 22.6 23 24.3 23.9 24.7
解:以胸径数据为横坐标,对应树高为纵坐标,用GeoGebra软件做出散点图,散点大致分布在一条从左下角到右上角的直线附近,表明两个变量线性相关,并且是正相关,因此可以用一元线性回归模型刻画树高与胸径之间的关系。
以d表示胸径,h表示树高,根据最小二乘法,计算得到经验回归方程为:
.
根据经验回归方程,由表中胸径的数据可以计算出树高的预测值以及相应的残差,如下表所示:
编号 胸径/cm 树高观测值/m 树高预测值/m 残差/m
1 18.1 18.8 19.4 -0.6
2 20.1 19.2 19.9 -0.7
3 22.2 21 20.4 0.6
4 24.4 21 20.9 0.1
5 26 22.1 21.3 0.8
6 28.3 22.1 21.9 0.2
7 29.6 22.4 22.2 0.2
8 32.4 22.6 22.9 -0.3
9 33.7 23 23.2 -0.2
10 35.7 24.3 23.7 0.6
11 38.3 23.9 24.4 -0.5
12 40.2 24.7 24.9 -0.2
对该模型进行残差分析,得到以下图像:
观察残差表和残差图,可以看到,残差的绝对值最大是0.8,所有残差分布在以横轴为对称轴、宽度小于2的带状区域内,可见经验回归方程较好地刻画了树高与胸径的关系,我们可以根据经验回归方程由胸径预测树高。
应用升华
问题:人们常将男子短跑100m的高水平运动员称为“百米飞人”.下表给出了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据.试依据这些成对数据,建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程.
编号 1 2 3 4 5 6 7 8
年份 1896 1912 1921 1930 1936 1956 1960 1968
纪录/s 11.8 10.6 10.4 10.3 10.2 10.1 10 9.95
以成对数据中的世界纪录产生年份为横坐标,世界纪录为纵坐标作散点图如下:
在散点图中,散点看上去大致分布在一条直线附近,似乎可用一元线性回归模型建立经验回归方程.
用Y表示男子短跑100m的世界纪录,t表示纪录产生的年份,利用一元线性回归模型
来刻画世界纪录和世界纪录产生年份之间的关系.根据最小二乘法,由表中的数据得到经验回归方程为

将经验回归直线叠加进散点图,可以该回归直线的不足之处,第一个世界纪录所对应的散点远离经验回归直线,并且前后两时间段中的散点都在经验回归直线的上方,中间时段的散点都在经验回归直线的下方.这说明散点并不是随机分布在经验回归直线的周围,而是围绕着经验回归直线有一定的变化规律,即成对样本数据呈现出明显的非线性相关的特征.
问题二:你能对以上模型进行修改,以使其更好地反映散点的分布特征吗?
观察图像,发现散点的趋向更像是函数的图像具有类似的形状特征.注意到第一个世界纪录产生于1896年,因此可以认为散点是集中在曲线
的周围,其中为未知参数,且.
我们引入一个中间变量x,令,通过转化,得到新的成对数据,如下表:
编号 1 2 3 4 5 6 7 8
年份/t 1896 1912 1921 1930 1936 1956 1960 1968
x 0.00 2.83 3.26 3.56 3.71 4.11 4.17 4.29
Y/s 11.80 10.60 10.40 10.30 10.20 10.10 10.00 9.95
以x为横坐标,以Y为纵坐标画出表中成对数据的散点图,散点分布呈现出很强的线性相关特征.再用一元线性回归模型,得到经验回归方程,如下图:
则 ②
在同一坐标系中画出方程①(红色)、②(蓝色)的图像,进行比较:
我们发现,散点图中各散点都非常靠近方程②的图像,直观上看出方程②对原始数据的拟合效果要好于方程①.
问题三:我们从直观感受上判断出方程②对原始数据的拟合效果更好,请问你有更严谨的方法来验证这一现象吗?
对两个模型分别进行残差分析
分别算出两个模型各自的残差平方和,残差平方和越小的拟合效果越好.利用GeoGebra软件求得Q1=0.6687;Q2=0.0043.则说明确实是方程②的效果更好.
比较两个模型的决定系数
R 越大,表示残差平方和越小,即模型的拟合效果越好,R 越小,表示残差平方和越大,即模型拟合效果越差。显然0≤R ≤1,R 越接近1,则线性回归刻画的效果越好.利用GeoGebra软件求得方程①的R =0.7325;方程②的R =0.9983.再一次说明了方程②的拟合效果更好.
增加新的观测数据来检验模型拟合的效果
这个环节由学生自主读教材,分析教材中新增的观测数据,直观印证非线性回归模型更好。
注意事项
使用经验回归方程进行预测时,需注意以下问题:
回归方程只适用于我们所研究的样本的总体;
我们所建立的回归方程一般都有时间性;
样本采集的范围会影响回归方程的适用范围;
不能期望回归方程得到的预报值就是预报变量的精确值.事实上,它是预报变量的可取值的平均值.
建立回归模型的基本步骤:
确定研究对象,明确哪个变量是解释变量,哪个变量是响应变量.
画出解释变量与响应变量的散点图,观察它们之间的关系(如是否存在线性关系等).
由经验确定回归方程的类型.若为非线性回归模型,先通过变换,将非线性经验回归模型转化为线性经验回归模型.
按一定规则(如最小二乘法)估计经验回归方程中的参数.若为非线性回归模型,消去新元,得到非线性经验回归方程.
得出结果后需进行线性回归分析.
①残差平方和越小,模型的拟合效果越好.
②决定系数R2取值越大,说明模型的拟合效果越好.
理论知识
当经验回归方程并非形如y=bx+a(a,b∈R)时,称之为非线性经验回归方程,当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来模拟,常见的非线性经验回归方程的转换方式总结如下:
小结
请学生进行小结,围绕线性回归模型求解的步骤,非线性回归模型求解的步骤,残差分析和决定系数的意义等内容进行,必要时教师做补充。
作业布置
某景区的各景点从2009年取消门票实行免费开放后,旅游的人数不断地增加,不仅带动了该市淡季的旅游,而且优化了旅游产业的结构,促进了该市旅游向“观光、休闲、会展”三轮驱动的理想结构快速转变.下表是从2009年至2018年,该景点的旅游人数(万人)与年份的数据:
第年 1 2 3 4 5 6 7 8 9 10
旅游人数(万人) 300 283 321 345 372 435 486 527 622 800
该景点为了预测2021年的旅游人数,建立了与的两个回归模型:
模型①:由最小二乘法公式求得与的线性回归方程;
模型②:由散点图的样本点分布,可以认为样本点集中在曲线的附近.
(1)根据表中数据,求模型②的回归方程.精确到个位,精确到.
(2)根据下列表中的数据,比较两种模型的相关指数,并选择拟合精度更高、更可靠的模型,预测2021年该景区的旅游人数(单位:万人,精确到个位).
回归方程 ① ②
30407 14607
参考公式、参考数据及说明:
①对于一组数据,,,,,,,其回归直线的斜率和截距的最小二乘法估计分别为.
②刻画回归效果的相关指数.
③参考数据:,.
5.5 449 6.05 83 4195 9.00
表中.
第四课时:列联表与独立性检验(第一课时)
情境引入
展示生活中常见的分类变量实例,如 “吸烟与患肺癌”“性别与数学成绩偏好” 等,提出问题 “这些分类变量之间是否存在关联呢?” 引发学生思考,从而引出本节课的主题 —— 列联表与独立性检验。
新知探究
列联表的概念:结合实例讲解列联表的定义,即列出两个分类变量的频数分布表。以 “吸烟与患肺癌” 为例,展示列联表的结构,说明表中各个数据的含义(如吸烟且患肺癌的人数、吸烟但未患肺癌的人数等)。
(2)观察与初步判断:引导学生观察列联表中的数据,通过计算比例(如吸烟者中患肺癌的比例、不吸烟者中患肺癌的比例),初步判断两个分类变量之间是否可能存在关联。
(3)独立性检验的基本思想引入:提出问题 “如何更科学地判断两个分类变量是否有关联呢?” 简要介绍独立性检验的基本思路,即假设两个分类变量无关联(独立性假设),然后根据样本数据计算相关统计量,判断假设是否成立。
3. 案例分析:
给出一个具体的列联表数据(如不同性别对某门选修课的选择情况),让学生动手制作列联表,计算相关比例,初步判断性别与选修课选择是否有关联。
4.课堂练习:
提供几组分类变量数据,让学生自主制作列联表,并通过比例比较,初步分析变量间的关联情况。
5.课堂小结:
总结列联表的概念、结构以及通过列联表初步判断分类变量关联的方法,强调列联表是分析分类变量关系的重要工具。
6.作业布置:
让学生收集一组生活中的分类变量数据(如 “是否熬夜与是否近视”),制作列联表,并进行初步的关联分析。
第五课时:列联表与独立性检验(第二课时)
复习引入:
考虑以Ω为样本空间的古典概型,设X和Y为定义在Ω上,取值于{0,1}的成对分类变量,我们希望判断事件{X=1}和{Y=1}之间是否有关联。注意到{X=0}和{X=1}, {Y=0}和{Y=1}都是互对立事件,与前面的讨论类似,我们需要判断下面的假定关系H0:P(Y=1|X=0)=P(Y=1|X=1)是否成立,通常称H0为零假设或原假设。
P(Y=1|X=0)表示从{X=0}中随机选取一个样本点,该样本点属于{X=0,Y=1}的概率; P(Y=1|X=1)表示从{X=1}中随机选取一个样本点,该样本点属于{X=1,Y=1}的概率。
探究新知:
由条件概率的定义可知,零假设H0等价于
P(X=0,Y=1)P(X=1)=P(X=1,Y=1)P(X=0). ①
注意到(X=0)和(X=1)为对立事件,于是P(X=0)=1-P(X=1).
再由概率的性质,我们有P(X=0,Y=1)=P(Y=1)-P(X=1,Y=1).
由此推得①式等价于P(X=1)P(Y=1)=P(X=1,Y=1).因此,零假设H0等价于{X=1}与{Y=1}独立。
根据已经学过的概率知识,下面的四条性质彼此等价:{ X=0}与{Y=0}独立;{X=0}与{Y=1}独立;{X=1}与{Y=0}独立;{X=1}与{Y=1}独立。
以上性质成立,我们就称分类变量X和Y独立,这相当于下面四个等式成立;
P(X=0,Y=0)=P(X=0)P(Y=0); P(X=0,Y=1)=P(X=0)P(Y=1);
P(X=1,Y=0)=P(X=1)P(Y=0); P(X=1,Y=1)=P(X=1)P(Y=1). ②
我们可以用概率语言,将零假设改述为H0:分类变量X和Y独立.
假定我们通过简单随机抽样得到了X和Y的抽样数据列联表,如下表所示。
表是关于分类变量X和Y的抽样数据的2×2列联表:最后一行的前两个数分别是事件{Y=0}和{Y=1}的频数;最后一列的前两个数分别是事件{X=0}和{X=1}的频数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x, y=0,1)的频数;右下角格中的数n是样本容量。
公式推导:
(1)思考:
如何基于②中的四个等式及列联表中的数据,构造适当的统计量,对成对分类变量X和Y是否相互独立作出推断
在零假设H0成立的条件下,根据频率稳定于概率的原理,由②中的第一个等式,我们可以用概率P(X=0)和P(Y=0)对应的频率的乘积估计概率P(X=0,Y=0),而把视为事件{X=0.Y=0}发生的频数的期望值(或预期值).这样,该频数的观测值a和期望值应该比较接近.
综合②中的四个式子,如果零假设H0成立 ③ 反之,当这些量的取值较大时,就可以推断H0不成立。
分别考虑③中的四个差的绝对值很困难,我们需要找到一个既合理又能够计算分布的统计量,来推断H0是否成立.
一般来说,若频数的期望值较大,则③中相应的差的绝对值也会较大;而若频数的期望值较小,则③中相应的差的绝对值也会较小.
为了合理地平衡这种影响,我们将四个差的绝对值取平方后分别除以相应的期望值再求和,得到如下的统计量:
该表达式可化简为:
统计学家建议,用随机变量取值的大小作为判断零假设H0是否成立的依据,当它比较大时推断H0不成立,
否则认为H0成立.
(2)问题:那么,究竟大到什么程度,可以推断H0不成立呢 或者说,怎样确定判断大小的标准呢
根据小概率事件在一次试验中不大可能发生的规律, 可以通过确定一个与H0相矛盾的小概率事件来实现,在假定H0的条件下,对于有放回简单随机抽样,当样本容量n充分大时,统计学家得到了的近似分布,忽略的实际分布与该近似分布的误差后,对于任何小概率值α,可以找到相应的正实数xα,
使得下面关系成立:P(≥xα)=α ④
我们称xα为α的临界值,这个临界值就可作为判断大小的标准,概率值α越小,临界值xα越大,当总体很大时,抽样有、无放回对的分布影响较小.因此,在应用中往往不严格要求抽样必须是有放回的.
由④式可知,只要把概率值α取得充分小,在假设H0成立的情况下,事件不大可能发生的.根据这个规律,如果该事件发生,我们就可以推断H0不成立.不过这个推断有可能犯错误,但犯错误的概率不会超过α.
(3)临界值的定义:
对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立,我们称xα为α的临界值,这个临界值可作为判断χ2大小的标准,概率值α越小,临界值xα越大.
基于小概率值α的检验规则:
当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2用χ2取值的大小作为判断零假设H0是否成立的依据,当它比较大时推断H0不成立,否则认为H0成立。这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
χ2独立性检验中几个常用的小概率值和相应的临界值
χ2独立性检验中几个常用的小概率值和相应的临界值.
例题讲授:
例2:依据小概率值=0.1的独立性检验,分析例1中的抽样数据,能否据此推断两校学生的数学成绩优秀率有差异?
例3.某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值=0.005的独立性检验,分析乙种疗法的效果是否比甲种疗法好.
问题若对调两种疗法的位置或对调两种疗效的位置,这样做会影响取值的计算结果吗?
例4.为了调查吸烟是否对肺癌有影响,某肿瘤研究所采取有放回简单随机抽样,调查了9965人,得到如下结果(单位:人)依据小概率值α=0.001的独立性检验,分析吸烟是否会增加患肺癌的风险。
课堂小结:
独立性检验解决实际问题大致应包括以下几个主要环节:
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.
(2)根据抽样数据整理出2×2列联表,计算的值,并与临界值比较.
(3)根据检验规则得出推断结论.
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
注意:上述几个环节的内容可以根据不同情况进行调整,
例如,在有些时候,分类变量的抽样数据列联表是问题中给定的.
单元小结
引导学生对本单元内容进行全面总结,梳理知识脉络,包括变量间的相关关系、一元线性回归模型的建立与应用、列联表与独立性检验等内容,强调各部分知识之间的联系和区别,以及在实际生活中的应用价值。
单元作业布置:
选择一个自己感兴趣的实际问题,收集相关数据,运用本单元所学的统计知识进行分析,包括判断变量间关系、建立合适的模型(回归模型或进行独立性检验)、评价模型并进行预测或推断,形成一份分析报告。完成教材中本单元的综合练习题,巩固所学知识。