(共20张PPT)
3. 1 独立性检验
学习目标
1.会列2×2列联表
2.了解独立性检验的基本思想和、方法及其简单应用
性别
{
男
女
是否近视
不近视
近视
这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量。
{
是否吸烟
民族
宗教信仰
国籍
问题:某中学1264名学生,男生中近视眼和正常视力的人数分别为415和301人,女生中近视眼和正常视力的人数分别为399和149人,如何让这些数据看起来更加一目了然呢?
列出的两个分类变量的频数表称为2×2列联表
近视眼 正常视力 合计
男生
女生
合计
例1.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:
已知在全部105人中随机抽取1人,成绩
优秀的概率为 ,则x= ,y= 。
优秀 非优秀 总计
甲班 10 x
乙班 y 30
总计 105
练习:下面是一个2×2列联表则表中,试求a ,b的值
不健康 健 康 总计
不优秀 a= , 21 73
优 秀 2 25 27
总 计 b = , 46 100
问题:某中学1264名学生,男生中近视眼和正常视力的人数分别为415和301人,女生中近视眼和正常视力的人数分别为399和149人,如何让这些数据看起来更加一目了然呢?
近视眼 正常视力 合计
男生 415 301 716
女生 399 149 548
合计 814 450 1264
独立性检验
为了使不同样本容量的数据有统一的评判标准,基于上述分析,我们构造一个随机变量
卡方统计量
B1 B2 合计
A1 a b a+b
A2 c d c+d
合计 a+c b+d n
近视眼 正常视力 合计
男生 415 301 716
女生 399 149 548
合计 814 450 1264
问题:某中学1264名学生,男生中近视眼和正常视力的人数分别为415和301人,女生中近视眼和正常视力的人数分别为399和149人,如何让这些数据看起来更加一目了然呢?
a c a+c
b d b+d
a+b c+d n=a+b+c+d
那么这个值到底能告诉我们什么呢?
近视眼 正常视力 合计
男生 415 301 716
女生 399 149 548
合计 814 450 1264
临界值:
统计学家们经过研究,得到两临界值:3.841和6.635
临界值表
犯错误不超过0.050(0.010的前提下认为两事件有关
0.050 0.010
k0 3.841 6.635
0.100 0.050 0.025 0.010 0.005 0.001
k0 2.706 3.841 5.024 6.635 7.879 10.828
例2.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;
喜欢甜品 不喜欢甜品 合计
南方学生 60 20 80
北方学生 10 10 20
合计 70 30 100
(I)用分层抽样的方法在喜爱打篮球的学生中抽6人,其中男生抽多少人?
(II)在上述抽取的人中选2人,求恰有一名女生的概率;
(III)你是否有95%的把握认为喜爱打篮球与性别有关?说明你的理由
例3.为了解某班学生喜爱打篮球是否与性别有关,对本班60人进行了问卷调查得到了如下的2×2列联表
喜爱打篮球 不喜爱打篮球 总计
男生 24 8 32
女生 12 16 28
总计 36 24 60
某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数,如图所示.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.)
(3)试问其亲属的饮食习惯与年龄有关吗?
(1)根据茎叶图,帮助这位同学说明其亲属30人的饮食习惯
(2)根据以上数据完成如表所示的2×2列联表.
主食蔬菜 主食肉类 总计
50岁以下
50岁以上
总计
课堂小结
1.2×2列联表
2.独立性检验的基本思想和、方法及其简单应用
网络对现代人的生活影响较大,尤其对青少年.
为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生随机抽取了1000人调查,发现其中经常上网的有200人,其中有80人期末考试不及格,而另外800人中,有120人不及格.问:中学生经常往往是否影响学习?为什么?
(辽宁高考题)电视传媒公司为了解某地区电视观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.
(I)根据已知条件完成下面2×2列联表,并据此资料你是否认为“体育迷”与性别有关?
(II)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.
非体育迷 体育迷 合计
男
女
合计