第一章 统计案例
1.2 独立性检验的基本思想及其初步应用
A级 基础巩固
一、选择题
1.给出下列实际问题,其中不可以用独立性检验解决的是( )
A.喜欢参加体育锻炼与性别是否有关
B.喝酒者得胃病的概率
C.喜欢喝酒与性别是否有关
D.青少年犯罪与上网成瘾是否有关
解析:独立性检验主要是对两个分类变量是否有关进行检验,故不可用独立性检验解决的问题是B.
答案:B
2.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出( )
A.性别与喜欢理科无关
B.女生中喜欢理科的比为80%
C.男生比女生喜欢理科的可能性大些
D.男生不喜欢理科的比为60%
解析:由等高条形图知:女生喜欢理科的比例为20%,男生不喜欢理科的比例为40%,因此,B、D不正确.从图形中,男生比女生喜欢理科的可能性大些.
答案:C
3.某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下2×2列联表:
分类
偏爱蔬菜
偏爱肉类
总计
50岁以下
4
8
12
50岁以上
16
2
18
总计
20
10
30
则可以说其亲属的饮食习惯与年龄有关的把握为( )
A.90% B.95%
C.99% D.99.9%
解析:因为K2的观测值k==10>6.635,所以有99%的把握认为其亲属的饮食习惯与年龄有关.
答案:C
4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:
分类
作文成绩优秀
作文成绩一般
总计
课外阅读量较大
22
10
32
课外阅读量一般
8
20
28
总计
30
30
60
由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是( )
A.没有充足的理由认为课外阅读量大与作文成绩优秀有关
B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关
C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关
D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关
解析:根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.
答案:D
5.某卫生机构抽取了366人进行健康体验,阳性家族史者糖尿病发病的有16人,不发病的有93人,阴性家族史者糖尿病发病的有17人,不发病的有240人,则认为糖尿病与遗传有关系出错的概率不超过( )
A.0.001 B.0.005
C.0.01 D.0.025
解析:作出糖尿病患者与遗传列联表:
项目
糖尿病发病
糖尿病不发病
总计
阳性家族史者
16
93
109
阴性家族史者
17
240
257
总计
33
333
366
根据列联表中的数据,得到K2的观测值k=≈6.067>5.024.
故在犯错误的概率不超过0.025的前提下认为糖尿病患者与遗传有关系.
答案:D
二、填空题
6.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射后14天内的结果如表所示:
项目
死亡
存活
总计
第一种剂量
14
11
25
第二种剂量
6
19
25
总计
20
30
50
进行统计分析时的统计假设是________.
解析:要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立.对本题,进行统计分析时的统计假设应是“小白鼠的死亡与剂量无关”.
答案:小白鼠的死亡与剂量无关
7.为了判断高中学生的文理科选修是否与性别有关系,随机调查了50名学生,得到如下2×2列联表:
分类
理科
文科
男
13
10
女
7
20
已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.
根据表中数据,得到K2的观测值k=≈4.844.可认为选修文理科与性别有关系的可能性不低于________.
解析:因为K2的观测值k≈4.844>3.841,且P(K2≥3.841)≈0.05,这表明在犯错误的概率不超过0.05的前提下认为选修文理科与性别之间有关系,即选修文理科与性别有关系的可能性不低于95%.
答案:95%
8.对某校小学生进行心理障碍测试得到的列联表
分类
有心理障碍
没有心理障碍
总计
女生
10
20
30
男生
10
70
80
总计
20
90
110
试说明心理障碍与性别的关系:________.
解析:由2×2列联表,代入计算k2的观测值k=
=≈6.365 7.
因为6.365 7>5.024,所以在犯错误的概率不超过0.025的前提下认为心理障碍与性别有关系.
答案:在犯错误的概率不超过0.025的前提下认为心理障碍与性别有关系.
三、解答题
9.考取驾照是一个非常严格的过程,有的人并不能够一次性通过,需要进行补考.现在有一张某驾校学员第一次考试结果汇总表,由于保管不善,只残留如下数据:
项目
合格
不合格
总计
男性
45
10
女性
30
总计
105
(1)完成列联表;
(2)根据列联表判断性别与考试成绩是否有关系.
解:(1)完成列联表如下:
项目
合格
不合格
总计
男性
45
10
55
女性
30
20
50
总计
75
30
105
(2)由第一问中列联表所给数据得K2的观测值
k=≈6.109.
由于6.109>5.024,且P(K2≥5.024)≈0.025.
故在犯错误的概率不超过0.025的前提下认为“性别与考试成绩有关系”.
10.为了了解青少年的肥胖是否与常喝碳酸饮料有关,现对30名青少年进行调查,得到如下列联表:
项目
常喝
不常喝
总计
肥胖
2
不肥胖
18
总计
30
已知从这30名青少年中随机抽取1名,抽到肥胖青少年的概率为.
(1)请将上面的列联表补充完整;
(2)是否有99.5%的把握认为青少年的肥胖与常喝碳酸饮料有关?
解:(1)设常喝碳酸饮料且肥胖的青少年有x名,
则=,解得x=6.
列联表如下:
项目
常喝
不常喝
总计
肥胖
6
2
8
不肥胖
4
18
22
总计
10
20
30
(2)由第一问中列联表中的数据可求得随机变量K2的观测值k=≈8.523>7.879,
因此有99.5%的把握认为青少年的肥胖与常喝碳酸饮料有关.
[B级 能力提升]
1.下面是一个2×2列联表:
项目
y1
y2
总计
x1
a
21
73
x2
2
25
27
总计
b
46
则表中a,b处的值分别为( )
A.94,96 B.52,50
C.52,54 D.54,52
解析:由得
答案:C
2.有两个分类变量X,Y,其一组的列联表如下所示:
项目
Y1
Y2
X1
a
20-a
X2
15-a
30+a
其中a,15-a均为大于6的整数,若在犯错误的概率不超过0.05的前提下认为X,Y有关,则a的值为________.
解析:根据公式,得K2的观测值
k=
=>3.841,
根据a>6且15-a>6,a∈Z,求得a=8满足题意.
答案:8
3.“开门大吉”是某电视台推出的游戏节目,选手面对1~8号8扇大门,依次按响门上的门铃,门铃会播放一段音乐(将一首经典流行歌曲以单音色旋律的方式演绎),选手需正确回答出这首歌的名字,方可获得该扇门对应的家庭梦想基金.在一次场外调查中,发现参赛选手多数分为两个年龄段:20~30;30~40(单位:岁).其猜对歌曲名称与否的人数如图所示.
(1)写出2×2列联表;判断能否在犯错误的概率不超过0.10的前提下认为猜对歌曲名称与年龄有关系,说明你的理由.(下面的临界值表供参考)
P(K2≥k0)
0.10
0.05
0.010
0.005
k0
2.706
3.841
6.635
7.879
(2)现计划在这次场外调查中按年龄段用分层抽样的方法选取6名选手,求20~30岁与30~40岁各有几人.
参考公式:K2=,其中n=a+b+c+d.
解析:(1)根据所给的二维条形图得到列联表:
分类
正确
错误
总计
20~30岁
10
30
40
30~40岁
10
70
80
总计
20
100
120
根据列联表所给的数据代入观测值的公式得到
k==3.
因为3>2.706,
所以在犯错误的概率不超过0.10的前提下认为猜对歌曲名称与年龄有关系.
(2)按照分层抽样方法可知,
20~30岁年龄段抽取:6×=2(人);
30~40岁年龄段抽取:6×=4(人).
在上述抽取的6名选手中,年龄在20~30岁的有2人,年龄在30~40岁的有4人.
课件39张PPT。第一章 统计案例