课时素养评价三 独立性检验 独立性检验的基本思想 独立性检验的应用
(20分钟·50分)
一、选择题(每小题5分,共20分)
1.经过对χ2的研究,得到了若干个临界值,当χ2≤2.706时,我们认为事件A与B
( )
A.有95%的把握认为A与B有关系
B.有99%的把握认为A与B有关系
C.没有充分理由说明事件A与B有关系
D.不能确定
【解析】选C.当χ2>2.706时,有90%以上的把握说明A与B有关系,但当χ2≤2.706时,只能说明A与B是否有关系的理由不够充分.
2.利用独立性检验的方法调查高中生性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用2×2列联表,由计算可得χ2≈7.245,参照下表:得到的正确结论是
( )
P(χ2≥x0)
0.01
0.05
0.025
0.010
0.005
0.001
x0
2.706
3.841
5.024
6.635
7.879
10.828
A.有99%以上的把握认为“爱好该项运动与性别无关”
B.有99%以上的把握认为“爱好该项运动与性别有关”
C.有95%的把握认为“爱好该项运动与性别有关”
D.有95%的把握认为“爱好该项运动与性别无关”
【解析】选B.由χ2≈7.245>6.635,可得有99%以上的把握认为“爱好该项运动与性别有关”.
3.为了研究性格和血型的关系,抽查80人试验,血型和性格情况如下:O型或A型者是内向型的有18人,外向型的有22人,B型或AB型是内向型的有12人,外向型的有28人,则有多大的把握认为性格与血型有关系
( )
A.95%
B.99%
C.没有充分的证据显示有关
D.1%
【解析】选C.
O型或A型
B型或AB型
总计
外向
22
28
50
内向
18
12
30
总计
40
40
80
χ2==1.92<2.706,所以没有充分的证据显示有关.
4.以下关于独立性检验的说法错误的是
( )
A.独立性检验依赖小概率原理
B.独立性检验得到的结论一定正确
C.样本不同,独立性检验的结论可能有差异
D.独立性检验不是判定两事物是否相关的唯一方法
【解析】选B.受样本选取的影响,独立性检验得到的结论不一定正确.
二、填空题(每小题5分,共10分)
5.以下三个命题中:①在回归分析中,可用相关系数r的值判断模型的拟合效果,|r|(|r|≤1)越大,模拟的拟合效果越好;②在一组样本数据(x1,y1),(x2,
y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,
yi)(i=1,2,…,n)都在直线y=-x+1上,则这组样本数据的线性相关系数为-;
③对分类变量x与y的随机变量χ2来说,χ2越小,判断“x与y有关系”的把握程度越大.其中真命题的个数为________.?
【解析】①在回归分析中,可用相关系数r的值判断模型的拟合效果,|r|(|r|≤1)越大,模型的拟合效果越好,①正确;
②相关系数反映的是两变量之间线性相关程度的强弱,与回归直线斜率无关,题中样本数据的线性相关系数为-1,②错误;
③对分类变量x与y的随机变量χ2来说,χ2越大,判断“x与y有关系”的把握程度越大.③错误.
故正确命题的个数为1.
答案:1
6.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射14天内的结果如表所示:
死亡
存活
总计
第一种剂量
14
11
25
第二种剂量
6
19
25
总计
20
30
50
进行统计分析时的统计假设是________.?
【解析】根据独立性检验的基本思想,可知类似于反证法,即要确认“两个分量有关系”这一结论成立的可信程度,首先假设该结论不成立.对于本题,进行统计分析时的统计假设应为“小白鼠的死亡与电离辐射的剂量无关”.
答案:小白鼠的死亡与电离辐射的剂量无关
三、解答题(每小题10分,共20分)
7.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据.
总成绩好
总成绩不好
总计
数学成绩好
478
a
490
数学成绩不好
399
24
423
总计
b
c
913
(1)计算a,b,c的值.
(2)文科学生总成绩不好与数学成绩不好有关系吗?
【解析】(1)由478+a=490,得a=12.
由a+24=c,得c=12+24=36.
由b+c=913,得b=913-36=877.
(2)χ2=≈6.233>3.841.
所以有95%的把握认为文科学生总成绩不好与数学成绩不好有关系.
8.微信是现代生活进行信息交流的重要工具,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信的时间在一小时以上,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段.那么使用微信的人中75%是青年人.若规定:每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中有是青年人.
(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出2×2列联表:
青年人
中年人
总计
经常使用微信
不经常使用微信
总计
(2)根据2×2列表中的数据利用独立性检验的方法判断是否有99.9%的把握认为“经常使用微信与年龄有关”?
附:χ2=.
P(χ2≥k0)
0.010
0.001
k0
6.635
10.828
【解析】(1)由已知可得,该公司员工中使用微信的有200×90%=180(人),
经常使用微信的有180-60=120(人),
其中,经常使用微信的青年人有120×=80(人),
使用微信的人中青年人有180×75%=135(人),
故2×2列联表如下:
青年人
中年人
总计
经常使用微信
80
40
120
不经常使用微信
55
5
60
总计
135
45
180
(2)将列联表中数据代入公式可得,
χ2=≈13.333,
由于13.333>10.828,所以有99.9%的把握认为“经常使用微信与年龄有关”.
(15分钟·30分)
1.(5分)对某校学生进行心理障碍测试得到如下列联表.
焦虑
说谎
懒惰
总计
女生
5
10
15
30
男生
20
10
50
80
总计
25
20
65
110
在这三种心理障碍中哪一种与性别关系最大
( )
A.焦虑
B.说谎
C.懒惰
D.全部一样
【解析】选B.由题设表格可得三个新的表格如下:
关于是否焦虑的结论:
焦虑
不焦虑
总计
女生
5
25
30
男生
20
60
80
总计
25
85
110
关于是否说谎的结论:
说谎
不说谎
总计
女生
10
20
30
男生
10
70
80
总计
20
90
110
关于是否懒惰的结论:
懒惰
不懒惰
总计
女生
15
15
30
男生
50
30
80
总计
65
45
110
对于三种心理障碍分别构造三个统计量,,,由表中数据可得
=≈0.863<2.706,
=≈6.366>3.841,
=≈1.410<2.706.
所以没有充分的证据显示焦虑与性别有关;
有95%的把握认为说谎与性别有关;
没有充分的证据显示懒惰与性别有关.
这说明在这三种心理障碍中说谎与性别关系最大.
2.(5分)下列说法中,正确说法的个数是
( )
①在用2×2列联表分析两个分类变量A与B之间的关系时,随机变量χ2越大,说明“A与B有关系”的可信度越大;
②以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln
y,将其变换后得到线性方程z=0.3x+4,则c,k的值分别是e4和0.3;
③已知两个变量具有线性相关关系,其回归直线方程为y=a+bx,若b=2,=1,=3,则a=1.
A.0
B.1
C.2
D.3
【解析】选D.对于①,分类变量A与B的随机变量χ2越大,说明“A与B有关系”的可信度越大,正确;
对于②,因为y=cekx,所以两边取对数,可得ln
y=ln(cekx)=ln
c+ln
ekx=ln
c+kx,令z=ln
y,可得z=ln
c+kx,因为z=0.3x+4,所以ln
c=4,k=0.3,所以c=e4.即②正确;
对于③,根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y=a+bx中,b=2,=1,=3,则a=1.故③正确.
3.(5分)利用独立性检验对两个分类变量是否有关系进行研究时,若有99%的把握认为事件A和B有关系,则具体计算出的数据应该是
( )
A.χ2>6.635
B.χ2<6.635
C.χ2>3.841
D.χ2<3.841
【解析】选A.有99%的把握认为事件A和B有关系,即犯错误的概率为1%,对应的χ2的值为6.635,由独立性检验的思想可知应为χ2>6.635.
4.(5分)为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:
无效
有效
总计
男性患者
15
35
50
女性患者
6
44
50
总计
21
79
100
则统计量χ2的值≈________,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.?
【解析】由公式计算得χ2≈4.882,所以我们有95%的把握认为服用此药的效果与患者的性别有关,从而出错的可能性为5%.
答案:4.882 5%
5.(10分)新冠肺炎疫情期间,讲究卫生,垃圾分类已经深入人心,某校通过网络组织了高三年级学生参与了“垃圾分类,从我做起”的知识问卷作答,随机抽出男、女各20名同学的问卷进行打分,作出如图所示的茎叶图,成绩大于70分的为“合格”.
男
女
总计
合格
不合格
总计
(1)由以上数据绘制成2×2列联表,是否有95%以上的把握认为“性别”与“问卷结果”有关?
(2)从上述样本中,成绩在60分以下(不含60分)的男、女学生问卷中任意选2个,求这2个学生性别不同的概率.
【解析】(1)根据茎叶图可得
男
女
总计
合格
10
16
26
不合格
10
4
14
总计
20
20
40
χ2==≈3.956>3.841,知有95%以上的把握认为“性别”与“问卷结果”有关.
(2)从题干茎叶图可知,成绩在60分以下(不含60分)的男、女学生人数分别是4人和2人,分别用A,B,C,D和E,F表示,
基本事件为:AB,AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF,共有15个,
其中性别不同的基本事件有AE,AF,BE,BF,CE,CF,DE,DF,共8个,所求概率为.
1.某校学生会为研究该校学生的性别与语文、数学、英语成绩这3个变量之间的关系,随机抽查了100名学生,得到某次期末考试的成绩数据如表1至表3,根据表中数据可知该校学生语文、数学、英语这三门学科中( )
表1语文成绩
性别
不及格
及格
总计
男
14
36
50
女
16
34
50
总计
30
70
100
表2数学成绩
性别
不及格
及格
总计
男
10
40
50
女
20
30
50
总计
30
70
100
表3英语成绩
性别
不及格
及格
总计
男
25
25
50
女
5
45
50
总计
30
70
100
A.语文成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小
B.数学成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小
C.英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小
D.英语成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小
【解析】选C.因为<
<,所以英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小.
2.(2017·全国卷Ⅱ改编)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图所示:
(1)记A表示事件“旧养殖法的箱产量低于50
kg”,估计A的概率.
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50
kg
箱产量≥50
kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.
χ2=.
【解析】(1)“旧养殖法的箱产量低于50
kg”的频率为:
(0.012+0.014+0.024+0.034+0.040)×5=0.62,因此,事件A的概率估计值为0.62.
(2)根据箱产量频率分布直方图得到列联表:
箱产量<50
kg
箱产量≥50
kg
旧养殖法
62
38
新养殖法
34
66
χ2=≈15.705.
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
(3)由频率分布直方图可得:旧养殖法100个网箱产量的平均数=(27.5×0.012+32.5×0.014+37.5×0.024+42.5×0.034+47.5×0.040+52.5×0.032+57.5×0.020+62.5×0.012+67.5×0.012)×5=47.1.
新养殖法100个网箱产量的平均数=(37.5×0.004+42.5×0.020+47.5×0.044+52.5×0.068+57.5×0.046+62.5×0.010+67.5×0.008)×5=52.35;比较可得<,故新养殖法优于旧养殖法.
PAGE课时素养评价三 独立性检验 独立性检验的基本思想 独立性检验的应用
(20分钟·50分)
一、选择题(每小题5分,共20分)
1.经过对χ2的研究,得到了若干个临界值,当χ2≤2.706时,我们认为事件A与B
( )
A.有95%的把握认为A与B有关系
B.有99%的把握认为A与B有关系
C.没有充分理由说明事件A与B有关系
D.不能确定
2.利用独立性检验的方法调查高中生性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用2×2列联表,由计算可得χ2≈7.245,参照下表:得到的正确结论是
( )
P(χ2≥x0)
0.01
0.05
0.025
0.010
0.005
0.001
x0
2.706
3.841
5.024
6.635
7.879
10.828
A.有99%以上的把握认为“爱好该项运动与性别无关”
B.有99%以上的把握认为“爱好该项运动与性别有关”
C.有95%的把握认为“爱好该项运动与性别有关”
D.有95%的把握认为“爱好该项运动与性别无关”
3.为了研究性格和血型的关系,抽查80人试验,血型和性格情况如下:O型或A型者是内向型的有18人,外向型的有22人,B型或AB型是内向型的有12人,外向型的有28人,则有多大的把握认为性格与血型有关系
( )
A.95%
B.99%
C.没有充分的证据显示有关
D.1%
4.以下关于独立性检验的说法错误的是
( )
A.独立性检验依赖小概率原理
B.独立性检验得到的结论一定正确
C.样本不同,独立性检验的结论可能有差异
D.独立性检验不是判定两事物是否相关的唯一方法
二、填空题(每小题5分,共10分)
5.以下三个命题中:①在回归分析中,可用相关系数r的值判断模型的拟合效果,|r|(|r|≤1)越大,模拟的拟合效果越好;②在一组样本数据(x1,y1),(x2,
y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,
yi)(i=1,2,…,n)都在直线y=-x+1上,则这组样本数据的线性相关系数为-;
③对分类变量x与y的随机变量χ2来说,χ2越小,判断“x与y有关系”的把握程度越大.其中真命题的个数为________.?
6.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射14天内的结果如表所示:
死亡
存活
总计
第一种剂量
14
11
25
第二种剂量
6
19
25
总计
20
30
50
进行统计分析时的统计假设是________.?
三、解答题(每小题10分,共20分)
7.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据.
总成绩好
总成绩不好
总计
数学成绩好
478
a
490
数学成绩不好
399
24
423
总计
b
c
913
(1)计算a,b,c的值.
(2)文科学生总成绩不好与数学成绩不好有关系吗?
8.微信是现代生活进行信息交流的重要工具,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信的时间在一小时以上,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段.那么使用微信的人中75%是青年人.若规定:每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中有是青年人.
(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出2×2列联表:
青年人
中年人
总计
经常使用微信
不经常使用微信
总计
(2)根据2×2列表中的数据利用独立性检验的方法判断是否有99.9%的把握认为“经常使用微信与年龄有关”?
附:χ2=.
P(χ2≥k0)
0.010
0.001
k0
6.635
10.828
(15分钟·30分)
1.(5分)对某校学生进行心理障碍测试得到如下列联表.
焦虑
说谎
懒惰
总计
女生
5
10
15
30
男生
20
10
50
80
总计
25
20
65
110
在这三种心理障碍中哪一种与性别关系最大
( )
A.焦虑
B.说谎
C.懒惰
D.全部一样
2.(5分)下列说法中,正确说法的个数是
( )
①在用2×2列联表分析两个分类变量A与B之间的关系时,随机变量χ2越大,说明“A与B有关系”的可信度越大;
②以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln
y,将其变换后得到线性方程z=0.3x+4,则c,k的值分别是e4和0.3;
③已知两个变量具有线性相关关系,其回归直线方程为y=a+bx,若b=2,=1,=3,则a=1.
A.0
B.1
C.2
D.3
3.(5分)利用独立性检验对两个分类变量是否有关系进行研究时,若有99%的把握认为事件A和B有关系,则具体计算出的数据应该是
( )
A.χ2>6.635
B.χ2<6.635
C.χ2>3.841
D.χ2<3.841
4.(5分)为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:
无效
有效
总计
男性患者
15
35
50
女性患者
6
44
50
总计
21
79
100
则统计量χ2的值≈________,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.?
5.(10分)新冠肺炎疫情期间,讲究卫生,垃圾分类已经深入人心,某校通过网络组织了高三年级学生参与了“垃圾分类,从我做起”的知识问卷作答,随机抽出男、女各20名同学的问卷进行打分,作出如图所示的茎叶图,成绩大于70分的为“合格”.
男
女
总计
合格
不合格
总计
(1)由以上数据绘制成2×2列联表,是否有95%以上的把握认为“性别”与“问卷结果”有关?
(2)从上述样本中,成绩在60分以下(不含60分)的男、女学生问卷中任意选2个,求这2个学生性别不同的概率.
1.某校学生会为研究该校学生的性别与语文、数学、英语成绩这3个变量之间的关系,随机抽查了100名学生,得到某次期末考试的成绩数据如表1至表3,根据表中数据可知该校学生语文、数学、英语这三门学科中( )
表1语文成绩
性别
不及格
及格
总计
男
14
36
50
女
16
34
50
总计
30
70
100
表2数学成绩
性别
不及格
及格
总计
男
10
40
50
女
20
30
50
总计
30
70
100
表3英语成绩
性别
不及格
及格
总计
男
25
25
50
女
5
45
50
总计
30
70
100
A.语文成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小
B.数学成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小
C.英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小
D.英语成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小
2.(2017·全国卷Ⅱ改编)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图所示:
(1)记A表示事件“旧养殖法的箱产量低于50
kg”,估计A的概率.
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50
kg
箱产量≥50
kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.
χ2=.
PAGE