《列联表与独立性检验》教学设计
课时1分类变量和列联表
必备知识 学科能力 学科素养 高考考向
分类变量与列联表 学习理解能力 观察记忆 概括理解 应用实践能力 分析计算 推测解释 简单问题解决 创造迁移能力 综合问题解决 猜想探究 数学抽象 数据分析 【考查内容】 分类变量的认识、列联表的认识、频率稳定于概率原理的应用以及误差分析,独立性检验的基本思想、方法及其初步应用 【考查题型】 选择题、填空题、解答题
两个事件相互独立 数学抽象
零假设及其表达 逻辑推理
检验统计量 数学建模 数学运算
独立性检验 数据分析 数学运算
一、本节内容分析
本节所涉及的分类变量与列联表的概念是新教材增加的一部分做铺垫的知识,理解分类变量与列联表的概念是能够进行独立性检验的必要前提,本节课旨在让学生了解分类变量的意义,并且通过对全部数学的分析和抽样数据的分析进行推理,结合频率稳定于概率,认识到独立性检验的必要性.
利用独立性检验进一步分析两个分类变量之间是否有关系,是高中数学知识中体现统计思想的重要课节.本节的主要内容就是两个分类变量是否有关系的推断,从生活实例出发,发现数学概念、方法与结论,体验数学来源于生活,数学又服务于生活.
本节的教学中,重点放在了独立性检验的统计学原理上,理解独立性检验的基本思想,明确独立性检验的基本步骤.通过对典型案例的研究,介绍了独立性检验的基本思想、方法和解决问题的一般步骤.独立性检验的基本思想和反证法类似,它们都是假设结论不成立,反证法是在假设结论不成立基础上推出矛盾从而证得结论成立,而独立性检验是在假设结论成立基础上判断拒绝假设的小概率事件是否发生,进而推断假设是否成立的.因为小概率事件在一次试验中通常是不会发生的,所以有利于结论成立的小概率事件的发生为否定假设提供了有力的证据.但在全部逻辑推理正确的情况下,反证法不会犯错误,但独立性检验会犯随机性错误.
本节包含的核心知识和体现的核心素养如下:
核心知识 1.分类变量和列联表 2.两个事件相互独立 3.零假设及其表达 4.检验统计量 5.独立性检验 数学抽象 逻辑推理 数学建模 数学运算 数据分析 核心素养
二、学情整体分析
本节内容较为容易理解,比较难的地方在于学生对之前学过的古典概型、条件概率、频率稳定于概率的原理有所淡忘,特别是条件概率,虽然本节涉及的条件概率难度很低,但是部分同学对此很陌生.
学生在必修二学完统计后有了一定的数据处理,高二学生的逻辑推理能力也比较强,但是数学建模能力锻炼较少,很多同学对数学建模比较模糊,从实际问题抽象出数学问题的能力比较差.
在知识的逻辑联系上,学生比较容易衔接,从生活中的实例入手,层层探究,符合学生的认知规律,但独立性检验中的卡方公式及临界值的确定,超出绝大多数高中生对新知的探究能力,因此在教学上采用的是让学生个体精读思考、相互交流讨论、集中解答释疑的教学模式,通过与反证法的相同与不同之处的思考,让学生了解独立性检验的基本思想,但学生对在一次试验中小概率事件几乎不可能发生而引发的矛盾这一思想的理解可能存在一定的难度,所以在讲解中注重进行层层突破.
学情补充:____________________________________________________________________
_________________________________________________________________________________
三、教学活动准备
【任务专题设计】
1.分类变量和列联表
2.独立性检验
【教学目标设计】
1.结合实例,让学生认识分类变量;通过计算让学生分析分类变量的关联性.
2.结合实例引入2×2列联表,并让学生通过描述性说明了解其含义;用抽样数据构成的2×2列联表,利用频率稳定于概率的原理,结合条形图分析分类变量的关联性,并了解其存在误差的原因.
3.结合具体实例,了解独立性检验的思想方法,掌握独立性检验的基本步骤,进一步提升数据分析核心素养.
4.了解统计推断可能犯错误的特点,体会检验统计量的产生过程.
【教学策略设计】
1.首先设置问题情境,在具体问题中让学生认识分类变量,进而利用教材中普查的数据通过计算认识两个分类变量的关联性,计算过程中依据教材的两种方法:简单计算频率和概率角度,进而引导学生思考如果数据不是普查的,而是抽样得到的数据,频率和概率之间是存在误差的,推断也将存在误差.
2.列联表的引入主要是考虑到原始数据保存的难度,不给出严格的定义,只给出描述性的说明即可.最后要引导学生利用频率稳定于概率的思想方法,推断两个分类变量的关联性,并要意识到推断过程中存在误差.
3.复习回顾古典概型及两个事件相互独立的知识,给出分类变量的零假设的两种严格的数学表达,提升学生数学建模、数学运算的核心素养.
4.根据观测值与期望值的差异的大小,构造检验统计量进行刻画,在推导过程中感悟合理性,提升数据分析核心素养.
5.认识小概率值的检验规则,总结独立性检验的主要环节,并与反证法进行了比较.
【教学方法建议】
讲授教学法、启发教学法,还有________________________________________________
【教学重点难点】
重点 1.分类变量和2×2列联表的认识.
2.会初步通过计算推断分类变量的关联性.
3.独立性检验的思想和方法.
难点 1.理解抽样数据分析因频率和概率存在误差,导致推断分类变量的关联性的误差.
2.统计量的推导和意义;独立性检验的思想和方法.
【教学材料准备】
1.常规材料:多媒体课件、________________________________________________
2.其他材料:_____________________________________________________________
四、教学活动设计
教学导入
师:在现实生活中,人们经常要回答一定范围内的两种现象或性质之间是否存在关联性或相互影响的问题.例如,就读不同的学校是否对学生的成绩有影响,不同班级学生用于体育锻炼的时间是否有差别,吸烟是否会增加患肺癌的风险,等等.本节要学习的独立性检验方法为我们提供了解决这类问题的方案.
在讨论问题时,为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示,学生所在的班级可以用1,2,3等表示,男性、女性可以用1,0表示,那么同学想一下,这些实数有没有大小关系和运算意义
生:没有,就像代号一样.
师:非常好,这里的数字仅作为分类用,没有其他含义,比较0和1的大小没有意义,通常计算其均值和方差也没有意义.
本节我们主要讨论取值于{0,1}的分类变量的关联性问题.
【设计意图】
从日常生活实例中,思考其中蕴含的分类变量知识,激发学生兴趣,引出课题.
教学精讲
探究1 分类变量的概念
师:同学们,要想理解什么是分类变量,我们得结合实际问题去看,首先来看以下问题.
【情景设置】
统计普查数据判断分类变量的关联性
问题:为了有针对性的提高学生体育锻炼的积极性,某中学需要了解性别因素是否与本校学生体育锻炼的经常性有关联,为此对学生是否经常锻炼的情况进行了普查,全校学生的普查数据如下:523名女生中有331名经常锻炼;601名男生中有473名经常锻炼.你能用这些数据,说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗
【设情境 巧激趣】
结合实例,教师提示学生怎样去研究分类变量的关联性,让学生通过实际案例探究出认为合理的方法,激发学生自主探求知识的兴趣.
师:大家先思考一下,用什么方法来推断其中的关联性
【学生积极思考,合作交流,回答问题,教师指定同学回答解题思路】
生:算一下男女生各自经常锻炼的比例.
师:非常好,大家来计算一下男女生各自经常锻炼的比例.
【教师提示】这是一个简单的统计问题.最直接的解答方法是,比较经常锻炼的学生在女生和男生中的比率.为了方便,我们设, .
师:大家来计算一下两个数据.
生:结果如下.
.
师:上面的问题还可以通过建立一个古典概型,使用条件概率的语言,给出另外一种解答方法.用表示该校全体学生构成的集合,这是我们所关心的对象的总体.考虑以为样本空间的古典概型,并定义一对分类变量X和Y如下:对于中的每一名学生,分别令
师:大家来思考一下,我们需要计算哪两个条件概率
生:,由可知,男生
经常锻炼的比率比女生高出15.4个百分点,所以该校的女生和男生在体育锻炼的经常性方面有差异,而且男生更经常锻炼.
师:很好,我们把数据整理成一个表格(单位:人)的形式,更清晰的呈现出来.
【情景设置】
表格整理
单位:人
性别 锻炼 合计
不经常(Y=0) 经常(Y=1)
女生(X=0) 192 331 523
男生(X=1) 128 473 601
合计 320 804 1124
【综合问题解决能力】
分析题目条件,在不熟悉的问题情境中,找出数学模型,运用相关解题方法计算得到新的解题规律,学生在之前学习了条件概率,现在让学生自己构建数学模型应用条件概率解决问题.锻炼学生的综合问题解决能力.
【以学定教】
以表格的形式呈现给同学们数据,让学生们可以更直观地分析数据,体现了教师在课堂上以学生的理解为中心的以学定教教学策略.
师:大家再来思考一下,这下面两种情况分别代表了什么
..
生:分别代表了该校女生和男生在体育锻炼的经常性方面没有关联和有关联.
师:非常好.
我们希望通过比较条件概率和回答上面的问题.按照条件概率的直观解释,如果从该校女生和男生中各随机选取一名学生,那么该女生属于经常锻炼群体的概率是,而该男生属于经常锻炼群体的概率是.因此,“性别对体育锻炼的经常性没有影响”可以描述为.
而“性别对体育锻炼的经常性有影响”可以描述为
.
下边大家来计算一下两个条件概率.
生: .
.
师:好,计算非常准确.由大于可以作出判断,在该校的学生中,性别对体育锻炼的经常性有影响,即该校的女生和男生在体育锻炼的经常性方面存在差异,而且男生更经常锻炼.
师:所以总结一下,什么是分类变量.
【深度学习】
学生在教师设置的分步提问下,由浅入深,逐层思考,分析数据,并计算求值,达到深度学习的效果.
【整体设计 分步落实】
通过教师设计问题串,学生在教师引导下由浅入深地解决问题归纳总结出分类变量的概念.
【要点知识】
分类变量的概念
特殊的随机变量以区别不同的现象或性质,分类变量的取值可以用实数表示.
探究2 2×2列联表
师:在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存.我们将在前一个问题中整理的这种形式的数据统计表就称为2×2列联表.
【要点知识】
2×2列联表
一般地,假设有两个分类变量X和Y,它们的取值分别为{0,1},其样本频数列联表为:
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
最后一行的前两个数分别是事件和中样本点的频数.最后一列的前两个数是事件和中样本点的频数.中间的四个数a,b,c,d是事件的频数.右下角格中的数n为样本容量.
师:大家来回想一下,在上面问题的解答中,使用了学校全部学生的调查数据,利用这些数据能够完全确定解答问题所需的比率和条件概率,然而,对于大多数实际问题,我们无法获得所关心的全部对象的数据,大家能举一个例子吗
生:一个城市的吸烟人群在男女各自中的频数.
师:非常好,整个城市也许通过人口普查数据男女各自人数我们能获得,但是每一个人是否吸烟是很难统计的,这样我们也就无法准确计算出有关的比率或条件概率.在这种情况下,古典概型和条件概率的观点为我们提供了一个解决问题的思路.那我们怎么获取数据呢
生:利用随机抽样获得.
师:好,这就是我们之前学习抽样方法的意义所在.我们可以利用随机事件发生的频率稳定于概率的原理对问题答案作出推断.请看下面的例题.
【典型例题】
用抽样数据研究分类变量的关联性
例1 为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生.通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀试分析两校学生中数学成绩优秀率之间是否存在差异.
师:我们用古典概型和条件概率的方法来研究,同学们仿照上一个问题解答一下.
比如我们可以用表示两所学校的全体同学构成的集合.考虑以为样本空间的古典概型.对于中的每一位学生,定义分类变量X和Y如下:
请同学们将数据整理成表格的形式(格式如课本所示).
生:
学校 数学成绩 合计
不优秀(Y=0) 优秀(Y=1)
甲校(X=0) 33 10 43
乙校(X=1) 38 7 45
合计 71 17 88
师:这个表格是关于分类变量X和Y的2×2列联表:最后一行的前两个数分别是事件{Y=0}和{Y=1}的频数;最后一列的前两个数分别是事件{X=0}和{X=1}的频数;中间的四个格中的数是事件的频数;右下角格中的数是样本容量.因此,甲校学生中数学成绩不优秀和优秀的频率分别是什么
生:;
师:乙校学生中数学成绩不优秀和优秀的频率分别是什么
生:.
师:我们可以用等高堆积条形图直观展示上述结果.
【深度学习】
将所关心的对象的全体看成古典概型的样本空间,就可以用概率的语言刻画问题,进而用频率稳定于概率的原理推断问题的答案.很多统计方法都是基于这种思想建立起来的.
【先学后教】
教师引导学生主动思考、联系例1中遇到的数据分析整理的表格,引出列联表,使学生易于接受,并且有助于学生理解所学内容,更好的掌握列联表的相关方法.
【简单问题解决能力】
学生通过观察表格,分析数据,通过计算求值解答得出频率的数值,并用等高堆积图直观展示结果,锻炼了简单问题解决能力.
【典型例题】
【情境学习】
在给出等高堆积条形图之后,教师结合图形进行讲解,给学生创设好问题背景后,提出研究方法,在具体情境下学习,有助于学生加深学习印象.
师:在等高堆积条形图中,左边的蓝色和红色条的高度分别是甲校学生中数学成绩不优秀和数学成绩优秀的频率;右边的蓝色和红色条的高度分别是乙校学生中数学成绩不优秀和数学成绩优秀的频率.通过比较发现,两个学校学生抽样数据中数学成绩优秀的频率存在差异,甲校的频率明显高于乙校的频率.依据频率稳定于概率的原理,可以推断.也就是说,如果从甲校和乙校各随机选取一名学生,那么甲校学生数学成绩优秀的概率大于乙校学生数学成绩优秀的概率.因此,可以认为两校学生的数学成绩优秀率存在差异,甲校学生的数学成绩优秀率比乙校学生的高.同学们,你认为“两校学生的数学成绩优秀率存在差异”是否有可能是错误的
生:有可能!
师:事实上,“两校学生的数学成绩优秀率存在差异”这个结论是根据两个频率间存在差异推断出来的.有可能出现这种情况:在随机抽取的这个样本中,两个频率间确实存在差异,但两校学生的数学成绩优秀率实际上是没有差别的.这就是说,样本的随机性导致了两个频率间出现较大差异.在这种情况下,我们推断出的结论就是错误的.后面我们将讨论犯这种错误的概率大小问题.
师:本节课我们认识了分类变量,然后我们从普查数据和抽样数据两个实际问题研究了分类变量的关联性,研究过程中应用了古典概型和条件概率的方法,还介绍了2×2列联表的应用,最后分析了抽样数据研究分类变量的关联性的推断不一定准确.
【以学论教】
教师通过询问问题,启发学生主动思考,并对学生的解答作出严谨的论证,强化研究方法,让学生明白其合理性和科学性,从而体会分析数据的严谨性和应用过程中的实用性.
师:好了,同学们,我们来做一下课堂练习:
【巩固练习】
分类变量与列联表
1.成语“名师出高徒”可以解释为“知名老师指导出高水平学生的概率较大”,即教师的名声与学生的水平之间有关联.你能举出更多的描述生活中两种属性或现象之间关联的成语吗
2.例1中的随机抽样数据是否足够确定与X和Y有关的所有概率和条件概率 为什么
3.根据有关规定,香烟盒上必须印上“吸烟有害健康”的警示语.那么
(1)吸烟是否对每位烟民一定会引发健康问题
(2)有人说吸烟不一定引起健康问题,因此可以吸烟.这种说法对吗
4.假设在本小节“问题”中,只是随机抽取了44名学生,按照性别和体育锻炼情况整理为如下的列联表:
单位:人
性别 锻炼 合计
不经常 经常
女生 5 15 20
男生 6 18 24
合计 11 33 44
(1)据此推断性别因素是否影响学生锻炼的经常性;
(2)说明你的推断结论是否可能犯错,并解释原因.
【分析计算能力】
布置几道与本节课分类变量、列联表密切相关的题目,让学生独立练习,使课堂教学得到了延续和强化,巩固了列联表相关数据分析方法,提升了学生的分析计算能力.
【整体学习】
通过先学习知识,后进行巩固练习的方式,整体学习本节课,使学生的理论和实践相结合,提高学习效果.
【学生积极思考,独立完成课堂练习】
生解:1.例如水涨船高、登高望远等.
2.不能.因为随机抽样得到的样本具有随机性,根据样本数据计算出来的频率也具有随机性.在统计推断中,依据频率稳定于概率的原理,可以利用频率推断与X和Y有关的概率和条件概率,但由于频率具有随机性,这种推断可能犯错误.因此,随机抽样数据不足以确定与X和Y有关的有概率和条件概率.
3.(1)从已掌握的知识来看,吸烟会损害身体的健康.但除了吸烟之外,身体的健康还受许多其他随机因素的影响,它是很多因素共同作用的结果.吸烟导致患病的案例非常普遍,但也可以找到长寿的吸烟者.因此健康与吸烟有关联,即从统计意义上讲,吸烟会损害健康,但不一定会对每位烟民都引起健康问题.
(2)这种说法不正确.虽然吸烟不一定会对每个人都引起健康问题,但根据统计数据,吸烟比不吸烟引起健康问题的可能性大,因此“吸烟不一定引起健康问题,因此可以吸烟”的说法是不对的.
4.(1)根据列联表中的数据,计算得女生中不经常锻炼和经常锻炼的频率分别为,男生中不经常锻炼和经常锻炼的频率分别为.
通过对比发现,女生中不经常锻炼和经常锻炼的频率与男生中不经常锻炼和经常锻炼的频率分别相等,依据频率稳定于概率的原理,可以推断.因此,可以认为性别对体育锻炼的经常性没有影响.
(2)推断可能犯错误.因为样本是通过随机抽样得到的,频率具有随机性,因此推断可能犯错误.
师:好的,同学们完成得都非常好!最后,回顾一下学过的内容,同学们自己先总结一下.
【学生各自表达自己的想法,教师归纳总结】
【课堂小结】
分类变量和列联表
1.分类变量:特殊的随机变量以区别不同的现象或性质,分类变量的取值可以用实数表示.
2.2×2列联表:列出的两个分类变量的频数表,称为列联表.
3.等高堆积条形图:等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,可以推断结果.
【设计意图】
通过分类变量和列联表的教学内容,利用了设情境巧激趣、以学定教等教学策略和深度学习、情境学习、整体学习的学习策略,培养了学生概括理解能力、分析计算能力、简单问题解决等学科能力,提升了学生的直观想象、数学运算、数学抽象、数据分析等核心素养.
教学评价
学完本节课,要了解独立性检验(2×2列联表)的基本思想,能对两个事件是否关联作出判断;明确独立性检验的基本步骤,能用独立性检验的基本思想解决实际问题.应用独立性检验解决实际问题时,为了保证一定的精度,通常要求列联表中的四个数α,b,c和d都不小于5;独立性检验可能会犯错误,对于这种错误概率的估计是的独立性检验的重要组成部分.
【设计意图】
引导学生加深理解列联表与独立性检验的概念、主要环节、具体应用等知识,学生体会知识的生成、发展、完善的过程,让学生在运用课程教学过程中所学到的概括理解、分析计算、猜想探究等学样能力进行解决问题,从而达到数学抽象、数据分析等核心素养目标.
应用所学知识,完成下面各题.
1.为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽流感有显著效果的图形是( )
A.
B.
C.
D.
答案:D
解析:通过对条形图的分析分类变量之间的关系,还是要通过比例对比,差距明显的关联性大.分析四个等高条形图得,选项D中,不服用药物患病的概率最大,服用药物患病的概率最小,所以最能体现该药物对预防禽流感有显著效果.
2.下表是关于男婴与女婴出生时间调查的列联表:
晚上 白天 合计
男婴 45 A B
女婴 E 35 C
合计 98 D 180
那么,A=_____,B=_____,C=_____,D=_____,E=_____.
答案:47,92,88,82,53
解析:本题是考察2×2列联表的概念的理解,要抓住列联表横纵统计的方法.
由列联表知识得解得
【简单问题解决能力】
通过学生独立练习,使课堂教学得到了延续和强化,巩固了独立性检验相关数据分析方法,提升了学生的简单问题解决能力.
3.给出下列实际问题:①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有关系;③吸烟者得肺病的概率;④吸烟人群是否与性别有关系;⑤上网与青少年的犯罪率是否有关系.其中,用独立性检验可以解决的问题有_________.
答案:②④⑤
解析:本题考查独立性检验的定义,独立性检验主要对两个分类变量是否有关系进行检验,主要涉及两种变量对同一种事情的影响,或者是两种变量在同一问题上体现的性质区别等,由此可得用独立性检验可以解决的问题有②④⑤.
4.某校团委对“学生性别和喜欢篮球运动是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢篮球运动的人数占男生人数的,女生喜欢篮球运动的人数占女生人数的;若有95%的把握认为是否喜欢篮球运动和性别有关,则调查人数中男生最少有( )人
附:
0.050 0.010
3.841 6.635
A.25
B.45
C.60
D.40
答案:B
解析:本题主要考查了独立性检验的应用,解题关键是根据男女人数相等及频率的信息设出合适的未知量进而得到列联表.
设男生的人数为,根据题意列出列联表如下表所示:
男生 女生 合计
喜欢篮球运动 4n 3n 7n
不喜欢篮球运动 n 2n 3n
合计 3n 5n 10n
,有95%的把握认为是否喜欢篮球运动和性别有关,,即,得8.0661【综合问题解决能力】
通过对独立性检验习题的练习,掌握计算的方法,推理判断零假设是否成立,提升综合问题解决能力.
【分析计算能力】
通过教学评价练习,学生在数据获得与处理的过程中,锻炼分析计算能力,提升数学运算核心素养.
教学反思
通过本节的教学,主要是让学生认识一些简单的概念,最重要的是让学生学会数学思想,通过实例,让学生养成熟练建模的意识和能力,可以通过本节的学习让学生体会统计学的思想方法.学完本节课,要了解分类变量的概念和2×2列联表的格式,要会利用古典概型和条件概率的角度分析分类变量的关联性,还要明白抽样获取的数据分析分类变量的关联性不一定准确.另外独立性检验作为统计推断的一种基本形式,其基本思想是根据观测或试验的结果去检验一个假设是否成立,独立性检验的基本原理是根据观测值和期望值的差异的大小作出推断,这种差异由统计量进行刻画,其大小的标准根据推理有关联时犯错误的概率确定.
【以学定教】
教师要让学生理解分类变量的概念,并掌握2×2列联表以及独立性检验的数据处理和分析方法,能在不同的具体问题情境中合理应用,综合解决问题.
【以学论教】
对教学的重难点知识进行追踪落实,根据学生实际学习情况和课堂效果总结教学过程,要结合实例,使学生理解数据分析的全过程,并善于和学过的知识,例如相互独立事件、条件概率、反证法相比较,达到学生自主思考,理解深刻的课堂效果.
1 / 16