独立性检验
学习目标 1.通过实例,理解2×2列联表的统计意义,了解2×2列联表独立性检验及其应用.
学习活动
导入:有关法律规定:香烟盒上必须印上“吸烟有害健康”的警示语,那么吸烟和健康之间有关系吗 每一个吸烟者的健康问题都是由吸烟引起的吗
目标一:通过实例,理解2×2列联表的统计意义 任务:通过下列实例,理解2×2列联表的统计意义. 为了有针对性地提高学生体育锻炼的积极性,某中学需要了解学生跑步情况.为此对学生跑步情况进行了抽查,抽查数据如下:共抽查110个学生,其中女生有50人;且这110人中,喜欢长跑的有60人,其中女生20人. 为了方便起见,把数据整理成如下的表格形式: 因为这个表格中,核心的数据是中间的4个格子,所以这样的表格通常称为2×2列联表. 问题:任意抽取一名学生,记A:喜欢长跑,B:是女生. (1)喜欢长跑的概率P(A)可以估计为多少?是女生的概率P(B)可以估计为多少?喜欢长跑且是女生的概率P(AB)可以估计为多少? (2)可以利用P(AB)=P(A)P(B)是否成立来判断A与B是否独立吗?为什么? (3)如果A与B独立,P(A)P(B)与P(AB)大小关系如何?由此理论上和实际上,喜欢长跑的女生数分别是多少?它们之间大小关系如何? (4)能否找到一个量或选用一个标准,来说明A,B之间的独立性是否成立?说说你的想法.
目标二:通过实例,了解2×2列联表独立性检验及其应用. 任务:阅读教材P113~115页的内容,完成下列问题. (1)反证法:要证明结论A,先假设结论A不成立,进行推理,推出矛盾则结论A成立;没有找到矛盾,则不能下结论.类比反证法,说说独立性检验的基本思想是怎样的? (2)若χ2≥6.635,关于事件A,B可以得到什么结论?χ2<3.84呢? (3)若χ2≥k成立,关于事件A,B可以得到的什么结论?χ2学习总结
任务:根据下列关键词,构建知识导图. “独立性检验”“统计量χ2”“2×2列联表”
2独立性检验
学习目标 1.通过实例,理解2×2列联表的统计意义,了解2×2列联表独立性检验及其应用.
学习活动
导入:有关法律规定:香烟盒上必须印上“吸烟有害健康”的警示语,那么吸烟和健康之间有关系吗 每一个吸烟者的健康问题都是由吸烟引起的吗
目标一:通过实例,理解2×2列联表的统计意义 任务:通过下列实例,理解2×2列联表的统计意义. 为了有针对性地提高学生体育锻炼的积极性,某中学需要了解学生跑步情况.为此对学生跑步情况进行了抽查,抽查数据如下:共抽查110个学生,其中女生有50人;且这110人中,喜欢长跑的有60人,其中女生20人. 为了方便起见,把数据整理成如下的表格形式: 因为这个表格中,核心的数据是中间的4个格子,所以这样的表格通常称为2×2列联表. 问题:任意抽取一名学生,记A:喜欢长跑,B:是女生. (1)喜欢长跑的概率P(A)可以估计为多少?是女生的概率P(B)可以估计为多少?喜欢长跑且是女生的概率P(AB)可以估计为多少? (2)可以利用P(AB)=P(A)P(B)是否成立来判断A与B是否独立吗?为什么? 参考答案: (1) (2)不可以.事件A与B独立的充要条件是P(AB)=P(A)P(B),通过概率的计算来判断两个事件是否独立. 因为(1)中P(A),P(B),P(AB)都是根据样本数据得到的估计值,而估计是有误差的,因此直接用P(AB)=P(A)P(B)是否成立来判断A与B是否独立是不合理的. (3)如果A与B独立,P(A)P(B)与P(AB)大小关系如何?由此理论上和实际上,喜欢长跑的女生数分别是多少?它们之间大小关系如何? 参考答案: 如果A与B独立,那么P(A)P(B)应该可以作为P(AB)的近似值,这是从统计意义上做出的合理推断,即尽管随机性会对数据的准确性带来影响,但理论上,如果A与B是独立的,则这种影响也一定不会太大. 理论上喜欢长跑的女生数:; 实际上喜欢长跑的女生数:. 两者近似相等. (4)能否找到一个量或选用一个标准,来说明A,B之间的独立性是否成立?说说你的想法. 参考答案: 由(3)可知,如果A与B独立,那么P(A)P(B)应该可以作为P(AB)的近似值.因此 不会太大. 为了减小随机性的影响做如下处理: ① 其值应该也不会太大. 考虑与B,A与,与,可知 ② ③ ④ 都不会太大. 若记①+②+③+④=χ2(读作“卡方”),代入数据算得χ2≈7.8. 概率学上可以证明,如果A与B独立,则χ2≥6.635的概率只有1%,即P(χ2≥6.635)=1%.因为算出的χ2值7.8大于6.635,所以若A与B独立(即“喜欢长跑”与“是女生”独立),则该事件发生的概率不超过1%. 这也可以说成,在犯错误的概率不超过1%的前提下,可以认为“喜欢长跑”与“是女生”不独立(也称为是否喜欢长跑与性别有关);或说有99%的把握认为是否喜欢长跑与性别有关. 上述1%通常称为显著性水平,而6.635称为显著性水平1%所对应的分位数.
目标二:通过实例,了解2×2列联表独立性检验及其应用. 任务:阅读教材P113~115页的内容,完成下列问题. (1)反证法:要证明结论A,先假设结论A不成立,进行推理,推出矛盾则结论A成立;没有找到矛盾,则不能下结论.类比反证法,说说独立性检验的基本思想是怎样的? (2)若χ2≥6.635,关于事件A,B可以得到什么结论?χ2<3.84呢? (3)若χ2≥k成立,关于事件A,B可以得到的什么结论?χ26.635,所以在犯错概率不超过1%的前提下,可以认为阅读量多少与幸福感强弱有关. 【归纳总结】 独立性检验的步骤: (1)绘制2×2列联表; (2)计算卡方数值χ2; (3)与显著性水平对应的分位数α比较; (4)若χ2≥k,就称犯错误的概率不超过α的前提下,可以认为A与B不独立(也称A与B有关),或者说1-α的把握认为A与B有关. 练一练 报刊对男女学生是否喜欢书法进行了一个随机调查,调查的数据如下表所示. 根据调查数据回答:有95%的把握认为性别与是否喜欢书法有关吗? 参考答案: 由题意可知 又因为1-95%=5%,而且查表可得 P(χ2≥3.841)=0.05, 由于0.078<3.841,所以没有95%的把握认为性别与是否喜欢书法有关.
学习总结
任务:根据下列关键词,构建知识导图. “独立性检验”“统计量χ2”“2×2列联表”
2