《独立性检验》教学设计
教学环节 教学内容 师生互动 设计意图
情境引入 在现实问题中,我们常常需要推断两个分类变量之间是否存在关联.5月31日是世界无烟日.有关医学研究表明,许多疾病,例如,心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手.这些疾病与吸烟有关的结论是怎样得出的呢 现在让我们一起学习有关独立性检验有关的问题吧! 教师叙述相关实例,点明课题. 以具体实例引出学习内容.
问题探究1 探究1 为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生.通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀,乙校45名学生中有7名数学成绩优秀.试分析两校学生中数学成绩优秀率之间是否存在差异. 根据已知数据列出列联表如下: 甲校学生中数学成绩优秀的频率为,乙校学生中数学成绩优秀的频率为,因为,且差距较大,所以可以认为两校学生的数学成绩优秀率存在差异. 问题1 你认为“两校学生的数学成绩优秀率存在差异”这一结论是否有可能是错误的 有可能.“两校学生的数学成绩优秀率存在差异”这个结论是根据两个频率间存在差异推断出来的.有可能出现这种情况:在随机抽取的这个样本中,两个频率间确实存在差异,但两校学生的数学成绩优秀率实际上是没有差别的.对于随机样本而言,因为频率具有随机性,频率与概率之间存在误差,所以我们的推断可能犯错误,而且在样本容量较小时,犯错误的可能性会较大.因此,需要找到一种更为合理的推断方法,同时也希望能对出现错误推断的概率有一定的控制或估算. 考虑以为样本空间的古典概型.设和为定义在上,取值于的成对分类变量.我们希望判断事件和之间是否有关联.注意到和和都是互为对立事件,我们需要判断下面的假定关系:是否成立,通常称为零假设或原假设(null hypothesis).这里,表示从中随机选取一个样本点,该样本点属于的概率;而表示从中随机选取一个样本点,该样本点属于的概率. 由条件概率的定义可知,零假设等价于,或.① 注意到和为对立事件,于是.再由概率的性质,我们有.由此推得①式等价于.因此,零假设等价于与独立. 根据已经学过的概率知识,下面的四条性质彼此等价: 与独立; 独立; 与独立; 与独立. 如果这些性质成立,我们就称分类变量和独立.这相当于下面四个等式成立: }; }; }; . 因此,我们可以用概率语言,将零假设改述为:分类变量和独立. 假定我们通过简单随机抽样得到了和的抽样数据列联表,如下表所示. 上表是关于分类变量和的抽样数据的列联表:最后一行的前两个数分别是事件和的频数;最后一列的前两个数分别是事件和的频数;中间的四个数是事件的频数;右下角格中的数是样本容量. 问题2 如何基于②中的四个等式及列联表中的数据,构造适当的统计量,对成对分类变量和是否相互独立作出推断 提示:在零假设成立的条件下,根据频率稳定于概率的原理,由②中的第一个等式,我们可以用概率和对应的频率的乘积估计概率,而把视为事件发生的频数的期望值(或预期值).这样,该频数的观测值和期望值应该比较接近. 综合②中的四个式子,如果零假设成立,下面四个量的取值都不应该太大: ③ 反之,当这些量的取值较大时,就可以推断不成立. 显然,分别考虑③中的四个差的绝对值很困难.我们需要找到一个既合理又能够计算分布的统计量,来推断是否成立. 一般来说,若频数的期望值较大,则③中相应的差的绝对值也会较大;而若频数的期望值较小,则③中相应的差的绝对值也会较小.为了合理地平衡这种影响,我们将四个差的绝对值取平方后分别除以相应的期望值再求和,得到如下的统计量: . 该表达式可化简为. 统计学家建议,用随机变量取值的大小作为判断零假设是否成立的依据,当它比较大时推断不成立,否则认为成立. 问题3 那么,究竟大到什么程度,可以推断不成立呢 或者说,怎样确定判断大小的标准呢 提示:根据小概率事件在一次试验中不大可能发生的规律,用随机变量取值的大小作为判断零假设是否成立的依据这个想法可以通过确定一个与相矛盾的小概率事件来实现.在假定的条件下,对于有放回简单随机抽样,当样本容量充分大时,统计学家得到了的近似分布.忽略的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数,使得下面关系成立:④.我们称为的临界值,这个临界值就可作为判断大小的标准.概率值越小,临界值越大.当总体很大时,抽样有、无放回对的分布影响较小.因此,在应用中往往不严格要求抽样必须是有放回的. 由④式可知,只要把概率值取得充分小,在假设成立的情况下,事件是不大可能发生的.根据这个规律,如果该事件发生,我们就可以推断不成立.不过这个推断有可能犯错误,但犯错误的概率不会超过. 师:根据上节课学过的2×2列联表或等高堆积条形图粗略判断两校学生中数学成绩优秀率之间是否存在差异. 学生回忆上节课内容并进行判断. 学生分组讨论,然后教师点拨解决问题的思路. 引导学生理解零假设的两种数学表述. 学生思考统计量的构建,难度较大,教师重点给予讲解,然后学生相互交流. 教师讲解,让学生理解统计量的临界值的来源. 让学生回顾上节课针对这一问题的解决方案,为引出探究问题作铺垫. 帮助学生理解零假设的概念. 探索假设检验的思想和方法. 体会统计量的构建过程. 提升学生的数学逻辑推理核心素养.
概念形成 1.假定通过简单随机抽样得到了分类变量和的抽样数据的列联表如下: 则可通过的观测值来判断与的关联性. 利用随机变量的取值推断分类变量和是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验. 2.基于小概率值的检验规则: (1)当时,我们就推断不成立,即认为和不独立,该推断犯错误的概率不超过; (2)当时,我们没有充分证据推断不成立,可以认为和独立. 引导学生整理列联表及统计量公式,并总结独立性检验的概念. 引导学生总结出基于小概率值的检验原则. 掌握由列联表得到统计量,通过假设两变量相互独立,探寻两变量是否有关系的方法,进而通过统计量判断两变量间是否有关系.
问题探究2 问题4 依据小概率值的独立性检验,分析探究1中的抽样数据,能否据此推断两校学生的数学成绩优秀率有差异 解:零假设为:分类变量与相互独立,即两校学生的数学成绩优秀率无差异. 因为 所以 . 根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为成立,即认为两校的数学成绩优秀率没有差异. 学生自主练习,教师投影学生所做,总结出此类题目的解答步骤. 通过举例,让学生理解独立性检验,初步体会利用独立性检验解决问题的基本要领.
应用举例 例1 某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值的独立性检验,分析乙种疗法的效果是否比甲种疗法好. 解:零假设为:疗法与疗效独立,即两种疗法效果没有差异. 将所给数据进行整理,得到两种疗法治疗数据的列联表,如下表所示. 根据列联表中的数据,经计算得到 根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为成立,即认为两种疗法效果没有差异. 例2 为研究吸烟是否与肺癌有关,某肿瘤研究所采取有放回简单随机抽样的方法,调查了9965人,得到成对样本观测数据的分类统计结果,如下表所示.依据小概率值的独立性检验,分析吸烟是否会增加患肺癌的风险. 解:零假设为:吸烟与患肺癌之间无关联. 根据列联表中的数据,经计算得到 . 根据小概率值的独立性检验,我们推断不成立,即认为吸烟与患肺癌有关联,此推断犯错误的概率不大于. 根据表中的数据计算,不吸烟者中不患肺癌和患肺癌的频率分别为 ; 吸烟者中不患肺癌和患肺癌的频率分别为 . 由可见,在被调查者中,吸烟者患肺癌的频率是不吸烟者患肺癌频率的4倍以上.于是,根据频率稳定于概率的原理,我们可以认为吸烟者患肺癌的概率明显大于不吸烟者患肺癌概率,即吸烟更容易引发肺癌. 跟踪训练 某校对学生课外活动的内容进行调查,结果整理成下表: 试用你所学过的知识分析能否在犯错误的概率不超过的前提下认为“喜欢体育还是文娱与性别有关系”. 临界值参考表: 解:零假设为:喜欢体育还是喜欢文娱与性别没有关系. 根据列联表中的数据计算可得 因为,且, 所以“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于,即在犯错误的概率不超过的前提下认为“喜欢体育还是喜欢文娱与性别有关”. 学生自主练习. 师:应用独立性检验解决实际问题大致应包括的主要环节有哪些 生:(1)提出零假设和相互独立,并给出在问题中的解释. (2)根据抽样数据整理出列联表,计算的值,并与临界值比较. (3)根据检验规则得出推断结论. (4)在和不独立的情况下,根据需要,通过比较相应的频率,分析和间的影响规律. 做完后,学生同桌之间相互评价,给出意见和建议,教师展示标准答案. 掌握独立性检验题目的解题步骤. 应用频率检验独立性检验结论的正确性,提升学生数据分析的能力 帮助学生巩固应用独立性检验解决问题的步骤.
课堂小结 1.知识 (1)独立性检验的基本思想. (2)独立性检验的规则及步骤. (3)独立性检验的应用. 2.思想方法 反证法思想. 学生归纳小结,教师补充完善. 引导学生构建知识和能力框架,从整体上把握本节内容.
布置作业 教材第134页练习第4题 学生独立完成,教师批阅. 通过练习巩固本节重点知识.
板书设计:
8.3.2 独立性检验 一、独立性检验 利用随机变量的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验 二、独立性检验的基本解题步骤 应用独立性检验解决实际问题的主要环节 三、例题 例1 例2 跟踪训练 四、小结 1.知识 2.思想方法
教学研讨:
本节课的内容涉及的有关知识点比较多,可事先回顾一下独立事件、条件概率等有关知识.关于统计量公式的引入与推导是个难点,教师可以进行师生互动、生生互动等,借助实际问题让学生充分动手动脑,从而熟练掌握两个分类变量是否相关联的判断方法.
1 / 10