8.3 列联表与独立性检验(教学设计)(表格式)-2024--2025学年高中《数学》·选择性必修第三册人教A版

文档属性

名称 8.3 列联表与独立性检验(教学设计)(表格式)-2024--2025学年高中《数学》·选择性必修第三册人教A版
格式 docx
文件大小 1.1MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2024-10-03 11:13:08

图片预览

文档简介

教学设计
课程基本信息
学科 数学 年级 高二 学期 秋季
课题 独立性检验
教科书 书 名:数学选择性必修第三册教材 出版社:人民教育出版社 出版日期:2020年3月
教学目标
1. 通过实例了解独立性检验的基本思想 掌握独立性检验的基本步骤 会用独立性检验解决简单的实际问题,提升数据分析能力。
教学内容
教学重点:独立性检验的思想方法;
教学难点: 统计量的导出和意义。
教学过程
1.问题引入及情境架设 (1)旧知回顾:在上一节课,我们学习了列联表,由随机事件的稳定性,了解并作出判断两个分类变量是否有关联,请同学们思考:用频率推断两个分类变量是否独立有什么缺点? 引导学生对频率与概率的比较,由频率具有随机性,与概率之间存在差异; 通过数据改变,由样本容量较小时,犯错误的概率较大. (2)问题激发:有没有更合理的推断方法,同时也希望对出现的错误推断的概率一定的控制或估算?由概率知识分析,如果两个事件的独立,它们的充要条件是什么? 我们需要更好的方法弥补因频率的随机性带来判断两个分类变量的不可靠性,改进提高判断的结论科学性与稳定性.如何改进提高,先回头看独立事件,我们已知道,事件与事件独立的充要条件是,这与两个分类变量的频率之间又有什么样的联系呢? 2.教师引导分析与学生合作探究 我们将两个分类变量的列联表抽象简化,以0,1分别表示事件发生的两种结果,,独立的另一层含义,即我们需要了解事件与是否存在关联? 我们知道与不独立,互为对立事件,与不独立,互为对立事件. 我们需要判断下面的假定关系:是否成立? 通常称为零假设或原假设(nullhypothesis). 这里,表示从中随机选取一个样本点,该样本点属于的概率;而表示从中随机选取一个样本点,该样本点属于的概率. 由条件概率的定义可知,零假设等价于. ; 同理:独立含义的全解(展示) 与独立; 与独立; 与独立; 与独立; 我们将列联表分类汇总: 得到,, 和对应的频率的乘积; 发生的频率的期望值; 其中与实际值应当相差不大,如何衡量两者之间的差别呢? 同理,,, ,,这四个量差别也不应太大, 疑问:有没有更好的方式一次性将4个量全部考虑包含? 1900年,英国数学家卡方·皮尔逊在研究的基础上,提出了如下统计量: 化简得是不是看起来更好一点?
其中具体的化简过程为:(本部分内容不讲,留学有余力的同学自行完成) 把代人上式各项分子, 得, 对上式右边的分式进行通分, 得 进一步化简得. 应用探究:为研究吸烟是否与肺癌有关,某肿瘤研究所采取有放回简单随机抽样的方法,调查了9965人,得到下表所示的成对样本观测数据的分类统计结果.依据小概率值α=0.001的独立性检验,分析吸烟是否会增加患肺癌的风险. 这个值到底告诉了我们什么呢? 连续疑问:卡方统计量有什么用呢? 统计学家建议,用卡方的大小作为判断零假设是否成立的依据,当它比较大时推断不成立,否则认为成立.那么,究竟大到什么程度,可以推断不成立呢?或者说,怎样确定判断卡方大小的标准呢? 在假定的条件下,对于有放回简单随机抽样,当样本容量充分大时,统计学家得到了卡方的近似分布。忽略卡方的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数,使得下面关系成立:.(*) 我们称为的临界值,这个临界值就可作为判断大小的标准.概率值越小,临界值越大.当总体很大时,抽样有、无放回对的分布影吅较小.因此,在应用中往往不严格要求抽样必须是有放回的. 由(*)式可知,只要把概率值取得充分小,在假设成立的情况下,事件是不大可能发生的.根据这个规律,如果该事件发生,我们就可以推断不成立.不过这个推断有可能犯错误,但犯错误的概率不会超过. 基于小概率值的检验规则是: 当时,我们就推断不成立,即认为和不独立, 该推断犯错误的概率不超过; 当时,我们没有充分证据推断不成立,可以认为和独立. 这种利用的取值推断分类变量和是否独立的方法称为独立性检验, 读作“卡方独立性检验”,简称独立性检验(testofindependence). (小概率值)临界值表 流程: 一、根据需要,列出列联表 二、提出零假设H0:X和Y相互独立 三、计算χ2的值,并与临界值xα比较 四、根据检验规则下结论 例2.为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生,通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀。依据的卡方独立性检验,试分析两校学生中数学成绩优秀率之间是否存在差异? 解:零假设:分类变量与相互独立, 即两校学生的数学成绩优秀率无差异根据表中的数据, 计算得到, 根据小概率值的卡方独立性检验,没有允分证据推断不成立, 因此可以认为成立,即认为两校的数学成绩优秀率没有差异. 基于这些数据计算出的频率与例1中的相同.然而在相同的检验标准下作独立性检验,可以推出两校学生数学成绩的优秀率有明显差异,结论却发生了变化. 思考:为什么出现了与例1完全不同的结论? 例1事实上是根据两个频率的差异进行推断的,没有考虑随机性的影响。但事实上,即便两个样本来自同一个总体,也会因为随机性使得频率产生差异,因此需要用概率的方法进行推断,由于样本具有随机性,依据频率所作的推断可能会犯错误. 通常情况下,样本量越大,提供的信息越充分,观测的结果通常会更准确.与例1中的数据相比,这里的每个数据都变为原来的10倍,即样本量变为原来的10倍,这种差异无法通过频率的计算表现出来,而独立性检验可能会得出不同的结论,可见统计量能够有效地提取样本所包含的有用信息. 4.总结独立性检验的步骤 应用独立性检验解决实际问题主要环节: (1)提出零假设:和相互独立,并给出在问题中的解释. (2)根据抽样数据整理出列联表,计算的值,并与临界值比较. (3)根据检验规则得出推断结论. (4)在和不独立的情况下,根据需要,通过比较相应的频率,分析和间的影响规律. 5.思考与升华 思考1:列联表中,对换行或列的值,会影响卡方的取值计算结果吗?自己动手试一试! 教师借助于GGB软件展示,结论对换行或列的值是不会影响卡方的取值计算结果. 思考2:独立性检验与反证法有什么区别? 反证法:在假设下,如果推出一个矛盾,则证明不成立;若末推出矛盾、不能对下任何结论,即反证法不成功. 独立性检验:在假设下,如果出现一个与相矛盾的小概率事件,则推断不成立,且该推断犯错误的概率不大于这个小概率.否则,不能推断不成立,通常会接受,即认为两个分类变量相互独立. 通述的讲,反证法只有两种结果中的一种,在严密正确的推理下,结论100%可靠;但独立性检验不是,结论是否成立与犯错误的概率有关系,有可能出现将正解的结论判断成错误,也有可能将错误的结论判断成正确.