2019-2020学年高中北师大版数学选修1-2第一章统计案例2第2课时独立性检验的基本思想及其初步应用课件:58张PPT

文档属性

名称 2019-2020学年高中北师大版数学选修1-2第一章统计案例2第2课时独立性检验的基本思想及其初步应用课件:58张PPT
格式 zip
文件大小 1.7MB
资源类型 教案
版本资源 北师大版
科目 数学
更新时间 2020-02-01 16:06:56

图片预览

文档简介

课件58张PPT。第一章统计案例§2 独立性检验第2课时 独立性检验的基本思想及其初步应用自主预习学案饮用水的质量是人类普遍关心的问题.据统计,饮用优质水的518人中,身体状况优秀的有466人,饮用一般水的312人中,身体状况优秀的有218人,人的身体健康状况与饮用水的质量之间有关系吗?
1.分类变量和列联表
(1)分类变量:
变量的不同“值”表示个体所属的____________,像这样的变量称为分类变量.
(2)列联表:
①定义:列出的两个分类变量的__________称为列联表.不同类别 频数表 ②2×2列联表.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
2.等高条形图
(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否____________,常用等高条形图表示列联表数据的____________.
(2)观察等高条形图发现______和______相差很大,就判断两个分类变量之间有关系.相互影响 频率特征 3.独立性检验a+b+c+d 临界值k0 观测值k k≥k0 犯错误的概率 没有发现足够证据 3.841 6.635 2.706 1.分类变量与定量变量
分类变量也称为属性变量或定性变量,它的不同值表示个体所属的不同类别.分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量只取男、女两个值,商品的等级变量只取一级、二级、三级等等.有时也可以把分类变量的不同取值用数字来表示,但这时的数字除了分类以外没有其他的含义.例如,用0表示“男”,1表示“女”,性别变量就变成取值为0和1的随机变量,但是这些数字并没有其他的含义.此时比较性别变量的两个不同值之间的大小没有意义,性别变量的均值和方差也没有意义.定量变量的取值一定是实数,它们的取值大小有特定的含义,不同取值之间的运算也有特定的含义.例如身高、体重、考试成绩等,张明的身高是180 cm,李立的身高是175 cm,说明张明比李立高180-175=5(cm).定量变量的数字特征,如均值和方差都有实际意义.
2.利用独立性检验的思想解决实际问题.
利用独立性检验的思想解决实际问题的思路如下:
(1)独立性检验原理只能解决“包含两个对象,且每个对象有两类属性”这一类的问题,所以对于一个实际问题,我们要首先看能不能用独立性检验的思想加以解决.1.对于分类变量X与Y的随机变量χ2的观测值k,下列说法正确的是(  )
A.k越大,推断“X与Y有关系”,犯错误的概率越大
B.k越小,推断“X与Y有关系”,犯错误的概率越大
C.k越接近于0,推断“X与Y无关”,犯错误的概率越大
D.k越大,推断“X与Y无关”,犯错误的概率越小B2.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅临界值表来确定断言“X与Y有关系”的可信度,如果k>5.024,那么就推断“X和Y有关系”,这种推断犯错误的概率不超过(  )
A.0.25       B.0.75
C.0.025 D.0.975
[解析] 通过查表确定临界值k.当k>k0=5.024时,推断“X与Y”有关系这种推断犯错误的概率不超过0.025.C3.甲、乙两校体育达标抽样测试,其数据见下表:
两校体育达标情况抽检
若要考察体育达标情况与学校是否有关系最适宜的统计方法是(  )
A.回归分析 B.独立性检验
C.相关系数 D.平均值B4.(2019·全国卷Ⅰ文,17)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:互动探究学案命题方向1 ?独立性检验的应用 现规定平均成绩在80分以上(不含80分)的为优秀.
(1)试分析估计两个班级的优秀率;
(2)由以上统计数据填写下面2×2列联表,根据以上数据,能否有95%的把握认为加强“语文阅读理解”训练对提高“数学应用题”得分率有帮助?[思路分析] (1)由表格统计出甲、乙两个班的总人数和优秀人数,求出优秀率;
(2)依统计数据填写列联表,代入公式计算K2的估计值,查表下结论.
如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.
2.由于独立性检验计算量大,要细致,避免计算失误.〔跟踪练习1〕
“十一”黄金周前某地的一旅游景点票价上浮,黄金周过后,统计本地与外地来的游客人数,与去年同期相比,结果如下:
能否在犯错误的概率不超过0.01的前提下认为票价上浮后游客人数与所处地区有关系?命题方向2 ?综合应用〔跟踪练习2〕
为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做实验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.
下表1和表2分别是注射药物A和B后的试验结果.(疱疹面积单位:mm2)
表1:注射药物A后皮肤疱疹面积的频数分布表表2:注射药物B后皮肤疱疹面积的频数分布表
(1)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;(2)完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.
表3:[解析] 本小题考查频率分布直方图、独立性检验及2×2列联表等统计学知识.
解题思路是(1)绘制频率分布直方图,并从图中观察出中位数进行比较,(2)从频率分布表中读取数值填制2×2列联表并计算χ2与临界值比较,说明是否有关.(1)可以看出注射药物A后的疱疹面积的中位数在65至70之间,而注射药物B后的疱疹面积的中位数在70至75之间,所以注射药物A后疱疹面积的中位数小于注射药物B后疱疹面积的中位数.(2)表3:准确掌握公式中的参数含义 〔跟踪练习3〕
调查者通过询问男女大学生在购买食品时是否看营养说明得到的数据如下表所示.能否在犯错误的概率不超过0.10的前提下认为是否看营养说明与性别有关系?独立性检验的基本思想 1.独立性检验的基本思想
独立性检验的基本思想是要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设“两个分类变量没有关系”成立,在该假设下我们构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2的观测值k很大,则在一定程度上说明假设不合理,根据随机变量χ2的含义,可以通过P(k≥6.635)≈0.01来评价假设不合理的程度,计算出k>6.635,说明假设不合理的程度约为99%,即两个分类变量有关这一结论成立的可信度为99%,不合理的程度可查下表得出:2.反证法与假设检验的对照表3.独立性检验与反证法的异同
独立性检验的思想来自统计中的假设检验思想,它与反证法类似.假设检验和反证法都是先假设结论不成立,然后根据是否能够推出“矛盾”来断定结论是否成立.但二者“矛盾”的含义不同,反证法中的“矛盾”是指一种不符合逻辑事情的发生,而假设检验中的“矛盾”是指一种不符合逻辑的小概率事件的发生,即在结论不成立的假设下,推出有利于结论成立的小概率事件发生.我们知道小概率事件在一次试验中通常是不会发生的,若在实际中这个事件发生了,说明保证这个事件为小概率事件的条件有问题,即结论在很大的程度上应该成立.其基本步骤如下:
(1)考察需抽样调查的背景问题,确定所涉及的变量是否为二值分类变量.
(2)根据样本数据作出2×2列联表.
(3)通过等高条形图直观地判断两个分类变量是否相关.
(4)计算随机变量χ2,并查表分析,当χ2的观测值很大时,就认为两个变量有关系;否则就认为没有充分的证据显示两个变量有关. 海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)设A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有90%的把握认为箱产量与养殖方法有关;
[思路分析] (1)根据频率估计概率.
(2)根据独立性检验的步骤求解.
(3)观察频率分布直方图得出平均值(或中位数)的取值区间,再进行比较.
[解析] (1)旧养殖法的箱产量低于50 kg的频率为
(0.012+0.014+0.024+0.034+0.040)×5=0.62,
因此,事件A的概率估计值为0.62.
(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.1.对服用某种维生素对婴儿头发稀疏与稠密的影响调查如下:服用的60人中头发稀疏的有5人,不服用的60人中头发稀疏的有46人,作出如下列联表:
则表中a,b的值分别为(  )
A.9,14        B.55,14
C.55,24 D.69,14B
2.对两个分类变量进行独立性检验的主要作用是(  )
A.判断模型的拟合效果
B.对两个变量进行相关分析
C.给出两个分类变量有关系的可靠程度
D.估计预报变量的平均值
[解析] 独立性检验的目的就是明确两个分类变量有关系的可靠程度.C3.在研究“吸烟与患肺癌”的关系中,通过收集数据,整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是(  )
A.在100个吸烟者中至少有99人患肺癌
B.如果1个人吸烟,那么这个人至少有99%的概率患肺癌
C.在100个吸烟者中一定有患肺癌的人
D.在100个吸烟在者中可能一个患肺癌的人也没有
4.若由一个2×2列联表中的数据计算得χ2的观测值k≈4.013,那么在犯错误的概率不超过____________的前提下,认为两个分类变量之间有关系.D0.05 5.高二(1)班班主任对全班50名同学的学习积极性与对待班级工作的态度进行调查, 统计数据如表所示:
试运用独立性检验的思想方法分析,能否在犯错误的概率不超过0.001的前提下认为学生的学习积极性与对待班级工作的态度有关系.
同课章节目录