3 独立性检验问题
课时目标
1.通过实例理解2×2列联表的统计意义.
2.了解随机变量χ2的意义,通过对典型案例分析,了解独立性检验的基本思想和方法.
逐点清(一) 独立性检验
[多维度理解]
设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=1;变量B:B1,B2=1.通过观察得到如表所示的数据:
A B
B1 B2 总计
A1 a b ______________
A2 c d ______________
总计 ________ ________ n=a+b+c+d
上表称为变量A,B的2×2列联表.
[细微点练明]
1.下面是一个2×2列联表,其中a,b处填的值分别为( )
y1 y2 总计
x1 a 21 73
x2 2 25 27
总计 b 46 100
A.52,54 B.54,52
C.94,146 D.146,94
2.在2×2列联表中,两个变量有关系的可能性越大相差越大的两个比值为( )
A.与 B.与
C.与 D.与
3.为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液做尿棕色素定性检查,结果如下:
组别 阳、阴性情况 总计
阳性数B1 阴性数B2
铅中毒病人组A1 29 7 36
对照组A2 9 28 37
总计 38 35 73
问铅中毒病人组和对照组的尿棕色素阳性数有无差别?是否存在关联?
逐点清(二) 独立性检验的基本思想
[多维度理解]
在2×2列联表中,令χ2=.在统计中,用以下结果对变量的独立性进行判断.
①当χ2≤________时,没有充分的证据判断变量A,B有关联,可以认为变量A,B是没有关联的;
②当χ2>2.706时,有________的把握判断变量A,B有关联;
③当χ2>3.841时,有________的把握判断变量A,B有关联;
④当χ2>6.635时,有________的把握判断变量A,B有关联.
[细微点练明]
1.下列关于χ2的说法正确的是( )
A.χ2在任意相互独立的问题中都可以用于检验有关还是无关
B.χ2的值越大,两个事件相关的可能性就越大
C.χ2是用来判断两个变量是否相关的统计量,当χ2的值很小时可以判定两个变量不相关
D.χ2=
2.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得到“吸烟与患肺癌有关系”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法正确的是( )
A.100个吸烟者中至少有99人患有肺癌
B.1个人吸烟,那么这个人有99%的概率患有肺癌
C.在100个吸烟者中一定有患有肺癌的人
D.在100个吸烟者中可能一个患肺癌的人也没有
3.某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,调查了500名同学,运用2×2列联表进行独立性检验.
男 女
不支持 p 40
支持 160 270
经计算得(a+b)(c+d)(a+c)(b+d)≈1.77×109.
(1)求p的值,并计算χ2的数值(保留两位有效数字);
(2)根据(1)的结果,写出一个正确的统计学结论.
逐点清(三) 独立性检验的应用
[典例] 某中学对高二甲、乙两个同类班级进行“加强‘语文阅读理解’训练,对提高‘数学应用题’得分率的作用”的试验,其中甲班为试验班(加强“语文阅读理解”训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:
60分以下 61~70分 71~80分 81~90分 91~100分
甲班(人数) 3 11 6 12 18
乙班(人数) 7 8 10 10 15
现规定平均成绩在80分以上(不含80分)的为优秀.
(1)试估计两个班级的优秀率;
(2)由以上统计数据填写下面2×2列联表,根据以上数据,能否有95%的把握认为加强“语文阅读理解”训练对提高“数学应用题”得分率有帮助?
优秀人数 非优秀人数 总计
甲班
乙班
总计
听课记录:
这类问题的解决方法为先确定a,b,c,d,n的值,并求出χ2的值,再与临界值相比较,作出判断.解题时注意正确运用公式,代入数据准确计算.
[针对训练]
某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总成绩优秀的人数如下表所示,能否认为数学成绩优秀与物理、化学、总成绩优秀有关系?
物理优秀 化学优秀 总分优秀
数学优秀 228 225 267
数学非优秀 143 156 99
注:该年级在此次考试中数学成绩优秀的有360人,非优秀的有880人.
3 独立性检验问题
[逐点清(一)]
[多维度理解] a+b c+d a+c b+d
[细微点练明]
1.选A 由题意可得解得所以a,b的值分别为52,54.
2.选A 以表格为例,变量B与变量A相关性越强,则两个频率与相差越大.
B 总计
A a b a+b
c d c+d
总计 a+c b+d a+b+c+d
3.解:法一 由上述列联表可知,在铅中毒病人组中尿棕色素呈阳性的约占80.56%,而对照组中尿棕色素呈阳性的约占24.32%,说明它们之间有较大差别.
法二 假设A1,B1独立,
则P(A1B1)=P(A1)P(B1).
P(A1B1)=≈39.73%,P(A1)P(B1)=×≈25.67%,很显然两者不相等,且相差较大.所以铅中毒病人组和对照组的尿棕色素阳性数有差别,存在关联.
[逐点清(二)]
[多维度理解]
2.706 90% 95% 99%
[细微点练明]
1.选B χ2只适用于2×2列联表问题,且χ2只能推断两个变量相关,但不能判断两个变量不相关,故A、C错误.选项D中公式错误,分子上少了平方.
2.选D 独立性检验的结论是一个数学统计量,它与实际问题中的确定性是存在差异的,A、B、C错误.
3.解:(1)由列联表得p=500-40-160-270=30.
所以χ2=
=≈0.82.
(2)因为χ2≈0.82<3.841,所以没有95%的把握说“学生性别”与“支持该活动”是有关的.
[逐点清(三)]
[典例] 解:(1)由题意知,甲、乙两班均有学生50人,
甲班优秀人数为30人,优秀率为=60%,
乙班优秀人数为25人,优秀率为=50%,
所以甲、乙两班的优秀率分别为60%和50%.
(2)填写2×2列联表如下:
优秀人数 非优秀人数 总计
甲班 30 20 50
乙班 25 25 50
总计 55 45 100
因为χ2=≈1.010<3.841,所以没有95%的把握认为加强“语文阅读理解”训练对提高“数学应用题”得分率有帮助.
[针对训练]
解:列出数学成绩与物理成绩的2×2列联表如下:
数学学科 物理学科 总计
物理优秀 物理非优秀
数学优秀 228 132 360
数学非优秀 143 737 880
总计 371 869 1 240
将表中数据代入独立性检验公式,得
χ=≈270.1>6.635.
列出数学成绩与化学成绩的2×2列联表如下:
数学学科 化学学科 总计
化学优秀 化学非优秀
数学优秀 225 135 360
数学非优秀 156 724 880
总计 381 859 1 240
将表中数据代入独立性检验公式,得
χ=≈240.6>6.635.
列出数学成绩与总成绩的2×2列联表如下:
数学学科 总分情况 总计
总分优秀 总分非优秀
数学优秀 267 93 360
数学非优秀 99 781 880
总计 366 874 1 240
将表中数据代入独立性检验公式,得
χ=≈486.1>6.635.
所以有99%的把握认为数学成绩优秀与物理、化学、总成绩优秀都有关系.(共70张PPT)
§3
独立性检验问题
(概念课—逐点理清式教学)
课时目标
1.通过实例理解2×2列联表的统计意义.
2.了解随机变量χ2的意义,通过对典型案例分析,了解独立性检验的基本思想和方法.
CONTENTS
目录
1
2
3
逐点清(一) 独立性检验
逐点清(二) 独立性检验的
基本思想
逐点清(三) 独立性检验的应用
4
课时跟踪检测
逐点清(一) 独立性检验
01
多维度理解
A B
B1 B2 总计
A1 a b
________________
A2 c d
_______________
总计 ______________ ______________ n=a+b+c+d
a+b
c+d
a+c
b+d
细微点练明
1.下面是一个2×2列联表,其中a,b处填的值分别为( )
y1 y2 总计
x1 a 21 73
x2 2 25 27
总计 b 46 100
A.52,54 B.54,52
C.94,146 D.146,94
√
√
3.为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液做尿棕色素定性检查,结果如下:
组别 阳、阴性情况 总计
阳性数B1 阴性数B2
铅中毒病人组A1 29 7 36
对照组A2 9 28 37
总计 38 35 73
问铅中毒病人组和对照组的尿棕色素阳性数有无差别?是否存在关联?
解:法一 由上述列联表可知,在铅中毒病人组中尿棕色素呈阳性的约占80.56%,而对照组中尿棕色素呈阳性的约占24.32%,说明它们之间有较大差别.
法二 假设A1,B1独立,则P(A1B1)=P(A1)P(B1).
逐点清(二) 独立性检验的
基本思想
02
多维度理解
2.706
90%
95%
99%
细微点练明
√
解析:χ2只适用于2×2列联表问题,且χ2只能推断两个变量相关,但不能判断两个变量不相关,故A、C错误.选项D中公式错误,分子上少了平方.
√
2.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得到“吸烟与患肺癌有关系”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法正确的是( )
A.100个吸烟者中至少有99人患有肺癌
B.1个人吸烟,那么这个人有99%的概率患有肺癌
C.在100个吸烟者中一定有患有肺癌的人
D.在100个吸烟者中可能一个患肺癌的人也没有
解析:独立性检验的结论是一个数学统计量,它与实际问题中的确定性是存在差异的,A、B、C错误.
3.某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,调查了500名同学,运用2×2列联表进行独立性检验.
男 女
不支持 p 40
支持 160 270
逐点清(三) 独立性检验的应用
03
[典例] 某中学对高二甲、乙两个同类班级进行“加强‘语文阅读理解’训练,对提高‘数学应用题’得分率的作用”的试验,其中甲班为试验班(加强“语文阅读理解”训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:
60分以下 61~70分 71~80分 81~90分 91~100分
甲班 (人数) 3 11 6 12 18
乙班 (人数) 7 8 10 10 15
现规定平均成绩在80分以上(不含80分)的为优秀.
(1)试估计两个班级的优秀率;
(2)由以上统计数据填写2×2列联表,根据以上数据,能否有95%的把握认为加强“语文阅读理解”训练对提高“数学应用题”得分率有帮助?
优秀人数 非优秀人数 总计
甲班
乙班
总计
解:(1)由题意知,甲、乙两班均有学生50人,
(2)填写2×2列联表如下:
优秀人数 非优秀人数 总计
甲班 30 20 50
乙班 25 25 50
总计 55 45 100
方法技巧
这类问题的解决方法为先确定a,b,c,d,n的值,并求出χ2的值,再与临界值相比较,作出判断.解题时注意正确运用公式,代入数据准确计算.
某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总成绩优秀的人数如下表所示,能否认为数学成绩优秀与物理、化学、总成绩优秀有关系?
针对训练
物理优秀 化学优秀 总分优秀
数学优秀 228 225 267
数学非优秀 143 156 99
解:列出数学成绩与物理成绩的2×2列联表如下:
数学学科 物理学科 总计
物理优秀 物理非优秀
数学优秀 228 132 360
数学非优秀 143 737 880
总计 371 869 1 240
将表中数据代入独立性检验公式,得
数学学科 化学学科 总计
化学优秀 化学非优秀
数学优秀 225 135 360
数学非优秀 156 724 880
总计 381 859 1 240
将表中数据代入独立性检验公式,得
数学学科 总分情况 总计
总分优秀 总分非优秀
数学优秀 267 93 360
数学非优秀 99 781 880
总计 366 874 1 240
将表中数据代入独立性检验公式,得
课时跟踪检测
04
1
3
4
5
6
7
8
9
10
11
2
√
1.如果有95%的把握判断事件A与B有关系,那么具体计算出的数据( )
A.χ2>3.841 B.χ2<3.841
C.χ2>6.635 D.χ2<6.635
1
3
4
5
6
7
8
9
10
11
2
解析:χ2的值与临界值比较,从而确定A与B有关的可信程度.当χ2>6.635时,有99%的把握判断A与B有关系;当χ2>3.841时,有95%的把握判断A与B有关系;当χ2>2.706时,有90%的把握判断A与B有关系;当χ2≤2.706时,就没有充分的证据判断A与B有关系.
1
5
6
7
8
9
10
11
2
3
4
2.假设有两个变量X与Y,它们的可能取值分别为{X1,X2}和{Y1,Y2},其2×2列联表为
X Y
Y1 Y2
X1 10 18
X2 m 26
1
5
6
7
8
9
10
11
2
3
4
则当m取下面何值时,X与Y的关系最弱( )
A.8 B.9
C.14 D.19
解析:由10×26=18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.
√
1
5
6
7
8
9
10
11
3
4
2
3.在对某小学的学生进行吃零食的调查中,得到如表数据:
吃零食 不吃零食 总计
男学生 27 34 61
女学生 12 29 41
总计 39 63 102
1
5
6
7
8
9
10
11
3
4
2
√
1
5
6
7
8
9
10
11
3
4
2
4.某高校为调查学生喜欢应用统计课程是否与性别有关,随机抽取了选修该课程的55名学生,得到数据如下表:
性别 是否喜欢应用统计课程 总计
喜欢应用统计课程 不喜欢应用统计课程
男生 20 5 25
女生 10 20 30
总计 30 25 55
1
5
6
7
8
9
10
11
3
4
2
得到的正确结论是( )
A.有99%的把握判断“是否喜欢应用统计课程与性别有关”
B.有99%的把握判断“是否喜欢应用统计课程与性别无关”
C.有95%的把握判断“是否喜欢应用统计课程与性别有关”
D.有95%的把握判断“是否喜欢应用统计课程与性别无关”
√
1
5
6
7
8
9
10
11
3
4
2
1
5
6
7
8
9
10
11
3
4
2
5.某高校《统计》课程的教师随机给出了选该课程的一些情况,具体数据如下:
非统计专业 统计专业
男 13 10
女 7 20
1
5
6
7
8
9
10
11
3
4
2
为了判断选修统计专业是否与性别有关,根据表中数据,计算得χ2≈4.844>3.841,所以可以判定选修统计专业与性别有关.那么这种判断出错的可能性为( )
A.5% B.95%
C.1% D.99%
√
1
5
6
7
8
9
10
11
3
4
2
解析:χ2≈4.844>3.841,说明有95%的把握认为选修统计专业与性别有关,也就是认为“选修统计专业与性别有关”出错的可能性为5%.
1
5
6
7
8
9
10
11
3
4
2
6.[多选]对甲、乙两个班级共105名学生的数学考试成绩按照优秀和不优秀统计人数后,得到下表:
班级 成绩情况 总计
优秀 不优秀
甲班 10 b 10+b
乙班 c 30 30+c
总计 10+c 30+b 40+b+c
1
5
6
7
8
9
10
11
3
4
2
√
√
1
5
6
7
8
9
10
11
3
4
2
7.[多选]某校计划在课外活动中新增攀岩项目,为了解学生喜欢攀岩和性别是否有关联,面向学生开展了一次随机调查,其中参加调查的男、女生人数相同,男生喜欢攀岩的占80%,女生不喜欢攀岩的占70%,则( )
A.参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多
B.参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多
1
5
6
7
8
9
10
11
3
4
2
√
1
5
6
7
8
9
10
11
3
4
2
C.若参与调查的男、女生人数均为100,则依据独立性检验的思想认为喜欢攀岩和性别有关联
D.无论参与调查的男、女生人数为多少,都可以依据独立性检验的思想认为喜欢攀岩和性别有关联
√
1
5
6
7
8
9
10
11
3
4
2
解析:由题意设参加调查的男、女生人数均为m,则得到如下2×2列联表:
喜欢攀岩 不喜欢攀岩 总计
男生 0.8m 0.2m m
女生 0.3m 0.7m m
总计 1.1m 0.9m 2m
1
5
6
7
8
9
10
11
3
4
2
所以参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多,参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数少,故A正确,B错误.
1
5
6
7
8
9
10
11
3
4
2
8.若两个变量X与Y的2×2列联表为
y1 y2 总计
x1 10 15 25
x2 40 16 56
总计 50 31 81
99%
1
5
6
7
8
9
10
11
3
4
2
P(χ2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
1
5
6
7
8
9
10
11
3
4
2
9.为了有针对性地提高学生体育锻炼的积极性,某校需要了解学生是否经常锻炼与性别因素有关,为此随机对该校100名学生进行问卷调查,得到如下列联表.
经常锻炼 不经常锻炼 总计
男 35
女 25
总计 100
1
5
6
7
8
9
10
11
3
4
2
1
5
6
7
8
9
10
11
3
4
2
经常锻炼 不经常锻炼 总计
男 35 25 60
女 15 25 40
总计 50 50 100
1
5
6
7
8
9
10
11
3
4
2
1
5
6
7
8
9
10
11
3
4
2
10.为了纪念中国古代数学家祖冲之,2019年11月26日,联合国教科文组织在第四十届大会宣布每年的3月14日定为“国际数学日”.某高中为了让同学们感受数学魅力,传播数学文化,从2020年起,于每年的“国际数学日”开始举办为期一周的数学文化节,并且该校每年在数学文化节活动结束后,都会从全校学生中随机抽取150名学生了解他们参与活动的情况,经统计得到如下表格.
1
5
6
7
8
9
10
11
3
4
2
年份 2020 2021 2022 2023
年份代码X 1 2 3 4
参与活动人数Y 95 100 105 120
1
5
6
7
8
9
10
11
3
4
2
(2)2023年,该校为了了解不同性别的学生对数学文化节是否满意,从参与数学文化节活动的学生中随机抽取150名,统计得到如下2×2列联表,判断是否有90%的把握认为该校学生对数学文化节活动是否满意与学生的性别有关.
满意 不满意 总计
男生 90 15 105
女生 30 15 45
总计 120 30 150
1
5
6
7
8
9
10
11
3
4
2
1
5
6
7
8
9
10
11
3
4
2
1
5
6
7
8
9
10
11
3
4
2
②令X=5,得Y=125,
1
5
6
7
8
9
10
11
3
4
2
11.为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查,得到了如下的2×2列联表:
喜爱打篮球 不喜爱打篮球 总计
男生 6
女生 10
总计 48
1
5
6
7
8
9
10
11
3
4
2
1
5
6
7
8
9
10
11
3
4
2
解:(1)列联表补充如下:
喜爱打篮球 不喜爱打篮球 总计
男生 22 6 28
女生 10 10 20
总计 32 16 48
1
5
6
7
8
9
10
11
3
4
2
1
5
6
7
8
9
10
11
3
4
2课时跟踪检测(六十一) 独立性检验问题
1.如果有95%的把握判断事件A与B有关系,那么具体计算出的数据( )
A.χ2>3.841 B.χ2<3.841
C.χ2>6.635 D.χ2<6.635
2.假设有两个变量X与Y,它们的可能取值分别为{X1,X2}和{Y1,Y2},其2×2列联表为
X Y
Y1 Y2
X1 10 18
X2 m 26
则当m取下面何值时,X与Y的关系最弱( )
A.8 B.9
C.14 D.19
3.在对某小学的学生进行吃零食的调查中,得到如表数据: 吃零食 不吃零食 总计
男学生 27 34 61
女学生 12 29 41
总计 39 63 102
根据上述数据分析,我们得出的χ2约为( )
A.2.072 B.2.334
C.3.957 D.4.514
4.某高校为调查学生喜欢应用统计课程是否与性别有关,随机抽取了选修该课程的55名学生,得到数据如下表:
性别 是否喜欢应用统计课程 总计
喜欢应用统计课程 不喜欢应用统计课程
男生 20 5 25
女生 10 20 30
总计 30 25 55
得到的正确结论是( )
A.有99%的把握判断“是否喜欢应用统计课程与性别有关”
B.有99%的把握判断“是否喜欢应用统计课程与性别无关”
C.有95%的把握判断“是否喜欢应用统计课程与性别有关”
D.有95%的把握判断“是否喜欢应用统计课程与性别无关”
5.某高校《统计》课程的教师随机给出了选该课程的一些情况,具体数据如下:
非统计专业 统计专业
男 13 10
女 7 20
为了判断选修统计专业是否与性别有关,根据表中数据,计算得χ2≈4.844>3.841,所以可以判定选修统计专业与性别有关.那么这种判断出错的可能性为( )
A.5% B.95%
C.1% D.99%
6.[多选]对甲、乙两个班级共105名学生的数学考试成绩按照优秀和不优秀统计人数后,得到下表:
班级 成绩情况 总计
优秀 不优秀
甲班 10 b 10+b
乙班 c 30 30+c
总计 10+c 30+b 40+b+c
已知在这105名学生中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.c的值为20,b的值为45
B.c的值为15,b的值为50
C.有95%的把握认为成绩是否优秀与班级有关系
D.没有95%的把握认为成绩是否优秀与班级有关系
7.[多选]某校计划在课外活动中新增攀岩项目,为了解学生喜欢攀岩和性别是否有关联,面向学生开展了一次随机调查,其中参加调查的男、女生人数相同,男生喜欢攀岩的占80%,女生不喜欢攀岩的占70%,则( )
A.参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多
B.参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多
C.若参与调查的男、女生人数均为100,则依据独立性检验的思想认为喜欢攀岩和性别有关联
D.无论参与调查的男、女生人数为多少,都可以依据独立性检验的思想认为喜欢攀岩和性别有关联
8.若两个变量X与Y的2×2列联表为
y1 y2 总计
x1 10 15 25
x2 40 16 56
总计 50 31 81
则有________的把握认为“X与Y之间有关系”.
附:χ2=,其中n=a+b+c+d.
P(χ2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
9.为了有针对性地提高学生体育锻炼的积极性,某校需要了解学生是否经常锻炼与性别因素有关,为此随机对该校100名学生进行问卷调查,得到如下列联表.
经常锻炼 不经常锻炼 总计
男 35
女 25
总计 100
已知从这100名学生中任选1人,经常锻炼的学生被选中的概率为.
(1)完成上面的列联表;
(2)根据列联表中的数据,判断能否有90%的把握认为该校学生是否经常锻炼与性别因素有关.
10.为了纪念中国古代数学家祖冲之,2019年11月26日,联合国教科文组织在第四十届大会宣布每年的3月14日定为“国际数学日”.某高中为了让同学们感受数学魅力,传播数学文化,从2020年起,于每年的“国际数学日”开始举办为期一周的数学文化节,并且该校每年在数学文化节活动结束后,都会从全校学生中随机抽取150名学生了解他们参与活动的情况,经统计得到如下表格.
年份 2020 2021 2022 2023
年份代码X 1 2 3 4
参与活动人数Y 95 100 105 120
(1)①已知可用线性回归模型拟合Y与X之间的关系,求Y关于X的线性回归方程Y=X+;
②若该校共有3 600名学生,据此预测2024年全校参与数学文化节活动的人数;
(2)2023年,该校为了了解不同性别的学生对数学文化节是否满意,从参与数学文化节活动的学生中随机抽取150名,统计得到如下2×2列联表,判断是否有90%的把握认为该校学生对数学文化节活动是否满意与学生的性别有关.
满意 不满意 总计
男生 90 15 105
女生 30 15 45
总计 120 30 150
11.为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查,得到了如下的2×2列联表:
喜爱打篮球 不喜爱打篮球 总计
男生 6
女生 10
总计 48
已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为.
(1)请将上面的2×2列联表补充完整;(不用写计算过程)
(2)能否有95%的把握认为喜爱打篮球与性别有关?请说明理由;
(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X,求X的分布列与均值.
课时跟踪检测(六十一)
1.选A χ2的值与临界值比较,从而确定A与B有关的可信程度.当χ2>6.635时,有99%的把握判断A与B有关系;当χ2>3.841时,有95%的把握判断A与B有关系;当χ2>2.706时,有90%的把握判断A与B有关系;当χ2≤2.706时,就没有充分的证据判断A与B有关系.
2.选C 由10×26=18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.
3.选B 由公式得
χ2=≈2.334.
4.选A χ2===≈12.0>6.635,故有99%的把握判断“是否喜欢应用统计课程与性别有关”.
5.选A χ2≈4.844>3.841,说明有95%的把握认为选修统计专业与性别有关,也就是认为“选修统计专业与性别有关”出错的可能性为5%.
6.选AC 由题意,知成绩优秀的学生人数是105×=30,成绩不优秀的学生人数是105-30=75,所以c=20,b=45,A正确,B错误;因为χ2=≈6.1>3.841,所以有95%的把握认为成绩是否优秀与班级有关系,C正确,D错误.
7.选AC 由题意设参加调查的男、女生人数均为m,则得到如下2×2列联表:
喜欢攀岩 不喜欢攀岩 总计
男生 0.8m 0.2m m
女生 0.3m 0.7m m
总计 1.1m 0.9m 2m
所以参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多,参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数少,故A正确,B错误.由列联表中的数据,计算得到χ2==,当m=100时,χ2==≈50.505>6.635,所以当参与调查的男、女生人数均为100时,依据独立性检验,我们有99%的把握判断喜欢攀岩和性别有关联,故C正确,D错误.故选AC.
8.解析:由列联表数据,可求得χ2=≈7.227>6.635,所以有99%的把握认为“X与Y之间有关系”.
答案:99%
9.解:(1)设这100名学生中经常锻炼的学生有x人,则=,解得x=50.
列联表完成如下.
经常锻炼 不经常锻炼 总计
男 35 25 60
女 15 25 40
总计 50 50 100
(2)由(1)可知,
χ2=≈4.167.
因为4.167>2.706,所以有90%的把握认为该校学生是否经常锻炼与性别因素有关.
10.解:(1)①由题意可得==,
=×(95+100+105+120)=105,
(xi-)(yi-)=×(95-105)+×(100-105)+×
(105-105)+×(120-105)=40,
(xi-)2=2+2+2+2=5,
所以===8,
=105-×8=85,故Y关于X的线性回归方程为Y=8X+85.
②令X=5,得Y=125,
据此预测2024年全校参与数学文化节活动的人数为3 600×=3 000.
(2)χ2==≈7.143>2.706,
故有90%的把握认为该校学生对数学文化节活动是否满意与学生的性别有关.
11.解:(1)列联表补充如下:
喜爱打篮球 不喜爱打篮球 总计
男生 22 6 28
女生 10 10 20
总计 32 16 48
(2)能.理由如下:
根据(1)中列联表中的数据可以求得χ2=≈4.286>3.841,所以有95%的把握认为喜爱打篮球与性别有关.
(3)喜爱打篮球的女生人数X的可能取值为0,1,2,其概率分别为P(X=0)==,
P(X=1)==,
P(X=2)==,
故X的分布列为
X 0 1 2
P
故X的均值EX=0×+1×+2×=1.