8.3.1分类变量与列联表8.3.2 独立性检验(Word含答案解析)

文档属性

名称 8.3.1分类变量与列联表8.3.2 独立性检验(Word含答案解析)
格式 docx
文件大小 190.2KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2022-04-25 21:41:22

图片预览

文档简介

8.3 列联表与独立性检验
8.3.1 分类变量与列联表
8.3.2 独立性检验
基础过关练
题组一 分类变量与列联表
1.(2020河南南阳六校高二下联考)下面是一个2×2列联表:
y1 y2 合计
x1 35 a 70
x2 15 15 30
合计 50 b 100
其中a,b处填的值分别为         .
2.根据如图所示的等高堆积条形图可知吸烟与患肺病   关系(填“有”或“没有”).
3.某学校对高三学生进行了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高堆积条形图,利用条形图判断该校高三学生考前心情紧张与性格类型是否有关系.
题组二 独立性检验及其应用
4.下列说法中不正确的是(  )
A.独立性检验是检验两个分类变量是否有关的一种统计方法
B.独立性检验得到的结论一定是正确的
C.独立性检验的样本不同,其结论可能不同
D.独立性检验的基本思想是带有概率性质的反证法
5.(2020陕西榆林高二下阶段测试)在一项中学生近视情况的调查中,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时最有说服力的方法是(  )
                  
A.平均数与方差 B.回归分析
C.独立性检验 D.概率
6.某学校食堂对30名高三学生偏爱蔬菜与偏爱肉类进行了一次调查,将统计数据制成如下表格:
偏爱蔬菜 偏爱肉类
男生/人 4 8
女生/人 16 2
则认为偏爱蔬菜与偏爱肉类与性别有关的把握至少有(  )
附:χ2=,n=a+b+c+d.
α 0.01 0.005 0.001
xα 6.635 7.879 10.828
A.95% B.99%
C.99.5% D.99.9%
7.(2020广东清远阳山中学高二下教学质量检测)在独立性检验中,统计量χ2有两个临界值:3.841和6.635.当χ2≥3.841时,至少有95%的把握说明两个事件有关,当χ2≥6.635时,至少有99%的把握说明两个事件有关,当χ2<3.841时,认为两个事件无关.在一项打鼾与患心脏病的调查中,共调查了2 000人,经计算χ2=20.87.根据这一数据分析,我们可认为打鼾与患心脏病之间是    的(填“有关”或“无关”).
8.某校数学课外兴趣小组为研究数学成绩是否与性别有关,统计了本校高三年级每名学生一学期数学成绩的平均分(采用百分制),剔除平均分在40分以下的学生后,共有男生300名,女生200名.现采用分层随机抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生的成绩分为6组,得到下表.
分数段 性别    [40, 50) [50, 60) [60, 70) [70, 80) [80, 90) [90, 100]
男/人 3 9 18 15 6 9
女/人 6 4 5 10 13 2
(1)估计男、女生各自的平均分(同一组数据用该组区间中点值作代表),从计算结果判断数学成绩与性别是否有关;
(2)规定成绩在80分以上为优秀(含80分),请你根据已知条件补全所列的2×2列联表,并依据α=0.1的独立性检验,分析数学成绩与性别是否有关.
单位:人
优秀 非优秀 合计
男生
女生
合计
附表及公式:
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
χ2=,其中n=a+b+c+d.
9.某校在高一部分学生中调查男女同学对某项体育运动的喜欢情况,其二维条形图如图(黑色代表喜欢,白色代表不喜欢).
(1)写出2×2列联表;
(2)依据α=0.01的独立性检验,分析喜欢这项体育运动是否与性别有关;
(3)在这次调查中,从喜欢这项体育运动的一名男生和两名女生中任选两人进行专业培训,求恰是一男一女的概率.
附表及公式:
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
χ2=,其中n=a+b+c+d.
10.(2020重庆第八中学高三下月考)某企业有甲、乙两套设备生产同一种产品,为了检测两套设备的生产质量情况,随机从两套设备生产的大量产品中各抽取了50件产品作为样本,检测一项质量指标值,若该项质量指标值落在[100,120)内,则为合格品,否则为不合格品.现得到相关统计情况如下:
甲套设备的样本的频率分布直方图
乙套设备的样本的频数分布表
质量指标值 [95, 100) [100, 105) [105, 110) [110, 115) [115, 120) [120, 125]
频数 1 6 19 18 5 1
(1)根据上述所得统计数据,计算产品的合格率,并对两套设备的优劣进行比较;
(2)填写下面的列联表,并依据α=0.05的独立性检验,分析该企业生产的这种产品的质量指标值与甲、乙两套设备的选择是否有关.
单位:件
甲设备 乙设备 合计
合格品
不合格品
合计
附表及公式:
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
χ2=,其中n=a+b+c+d.
能力提升练
题组一 独立性检验及其应用
1.(2020江西吉安、抚州、赣州高三联考,)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A100天的日落和夜晚天气,得到如下2×2列联表:
夜晚天气 日落云里走 下雨 未下雨
出现 25 5
未出现 25 45
附表:
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
经计算得到χ2≈19.05,下列对地区A天气的判断不正确的是(  )
A.夜晚下雨的概率约为
B.未出现“日落云里走”时夜晚下雨的概率约为
C.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关
D.出现“日落云里走”,有99.9%的把握认为夜晚会下雨
2.(2020广东深圳中学高二月考,)2019年10月18日至27日,第七届世界军人运动会在湖北武汉举办,中国代表团共获得133金64银42铜,共239枚奖牌.为了调查各国参赛人员对主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如下表所示:
单位:人
男性运动员 女性运动员
对主办方表示满意 200 220
对主办方表示不满意 50 30
现有如下说法:①在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为;②在犯错误的概率不超过1%的前提下可以认为“是否对主办方表示满意与运动员的性别有关”;③没有99.9%的把握认为“是否对主办方表示满意与运动员的性别有关”.则正确说法的个数为(  )
A.0 B.1 C.2 D.3
附:χ2=,x0.01=6.635.
题组二 独立性检验的综合应用
3.(2020山东临沂高二下期中联考,)在贯彻中共中央、国务院关于精准扶贫政策的过程中,某单位在某市定点帮扶某村100户贫困户.为了做到精准帮扶,工作组对这100户村民的年收入情况、危旧房情况、患病情况等进行调查,并把调查结果转化为各户的贫困指标x.将指标x按照[0,0.2),[0.2,0.4),[0.4,0.6),[0.6,0.8),[0.8,1.0]分成五组,得到如图所示的频率分布直方图.规定若0≤x<0.6,则认定该户为“绝对贫困户”,否则认定该户为“相对贫困户”;当0≤x<0.2时,认定该户为“亟待帮助户”.工作组又对这100户家庭的受教育水平进行评测,家庭受教育水平分为“良好”与“不好”两种.
(1)完成下面的列联表,并依据α=0.05的独立性检验,分析绝对贫困户数与受教育水平不好是否有关;
单位:户
受教育水平良好 受教育水平不好 合计
绝对贫困户 2
相对贫困户 52
合计 100
(2)上级部门为了调查这个村的特困户分布情况,在贫困指标处于[0,0.4)的贫困户中,随机选取两户,用X表示所选两户中“亟待帮助户”的户数,求X的分布列和数学期望E(X).
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
4.(2020湖南株洲第二中学高二下期中,)某班级数学兴趣小组为了研究人脚的大小与身高的关系,随机抽测了20位同学,得到如下数据:
序号 1 2 3 4 5 6 7 8 9 10
身高x(厘米) 192 164 172 177 176 159 171 166 182 166
脚长y(码) 48 38 40 43 44 37 40 39 46 39
序号 11 12 13 14 15 16 17 18 19 20
身高x(厘米) 169 178 167 174 168 179 165 170 162 170
脚长y(码) 43 41 40 43 40 44 38 42 39 41
(1)若身高大于175厘米为“高个”,身高小于或等于175厘米为“非高个”;脚长大于42码为“大脚”,脚长小于或等于42码为“非大脚”.请根据上表数据作出2×2列联表,求出χ2的值(结果精确到小数点后三位),并说明有多大的把握认为人脚的大小与身高有关系;
(2)请根据序号为5的倍数的几组数据,求出y关于x的经验回归方程=x+.
附表及公式:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
χ2=,其中n=a+b+c+d,
=,=-.
5.(2019甘肃天水一中高二上学期期末,)《中华人民共和国道路交通安全法》第47条规定:“机动车行经人行横道时,应当减速行驶;遇行人正在通过人行横道,应当停车让行.机动车行经没有交通信号的道路时,遇行人横过道路,应当避让.”俗称“礼让斑马线”.下表是某市一主干路口监控设备所抓拍的5个月内驾驶员不“礼让斑马线”行为的统计数据:
月份x 1 2 3 4 5
违章驾驶员人数y 120 105 100 90 85
(1)请利用所给数据求违章驾驶员人数y与月份x之间的经验回归方程=x+;
(2)交警从这5个月内通过该路口的驾驶员中随机抽查了50人,调查驾驶员“礼让斑马线”行为与驾龄的关系,并得到如下2×2列联表:
单位:人
不礼让斑马线 礼让斑马线 合计
驾龄不超过1年 22 8 30
驾龄1年以上 8 12 20
合计 30 20 50
依据α=0.025的独立性检验,分析“礼让斑马线”行为与驾龄是否有关.
参考公式及数据:
=
α 0.1 0.05 0.025 0.01 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
χ2=,其中n=a+b+c+d.
答案全解全析
8.3 列联表与独立性检验
8.3.1 分类变量与列联表
8.3.2 独立性检验
基础过关练
1.答案 35,50
解析 由a+35=70,得a=35,由a+15=b,得b=50.
2.答案 有
解析 从等高堆积条形图上可以明显地看出吸烟患肺病的频率远远大于不吸烟患肺病的频率,所以吸烟与患肺病有关系.
3.解析 作列联表如下:
单位:人
性格内向 性格外向 合计
考前心情紧张 332 213 545
考前心情不紧张 94 381 475
合计 426 594 1 020
相应的等高堆积条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张的样本中性格内向占的比例高,可以认为该校高三学生考前心情紧张与性格类型有关.
4.B 独立性检验是检验两个分类变量是否有关的一种统计方法,只是在一定的可信度下进行判断,不一定正确,会因为样本不同导致结论可能不同,带有反证法思想.
故选B.
5.C 判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.
6.C 由已知,2×2列联表为
偏爱蔬菜 偏爱肉类 合计
男生/人 4 8 12
女生/人 16 2 18
合计 20 10 30
则χ2==10>7.879=x0.005,故至少有99.5%的把握认为偏爱蔬菜与偏爱肉类与性别有关,故选C.
7.答案 有关
解析 χ2=20.87>6.635时,至少有99%的把握认为打鼾与患心脏病有关.
8.解析 (1)=45×0.05+55×0.15+65×0.3+75×0.25+85×0.1+95×0.15=71.5,
=45×0.15+55×0.1+65×0.125+75×0.25+85×0.325+95×0.05=71.5,
从男、女生各自的平均分来看,数学成绩与性别无关.
(2)由题表可知,在抽取的100名学生中,男生组中成绩优秀的有15人,女生组中成绩优秀的有15人,据此可得2×2列联表如下:
单位:人
优秀 非优秀 合计
男生 15 45 60
女生 15 25 40
合计 30 70 100
零假设为H0:数学成绩与性别无关.计算可得χ2=≈1.79<2.706=x0.1.依据α=0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为数学成绩与性别无关.
9.解析 (1)观察二维条形图可得,
经调查的男生总共45人,其中喜欢这项运动的有15人,不喜欢的有30人;
经调查的女生总共45人,其中喜欢这项运动的有5人,不喜欢的有40人.
由此写出列联表如下:
单位:人
喜欢 不喜欢 合计
男 15 30 45
女 5 40 45
合计 20 70 90
(2)零假设为H0:喜欢这项体育运动与性别无关.计算可得χ2=≈6.429<6.635=x0.01,
所以依据α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为喜欢这项体育运动与性别无关.
(3)设喜欢这项体育运动的一名男生和两名女生分别为A,B,C.
任选两人的情况为(A,B),(A,C),(B,C),
选一名男生和一名女生的情况为(A,B),(A,C),
所以P=,
即恰是一男一女的概率为.
10.解析 (1)甲设备生产的产品的合格率为1-(0.008+0.020)×5=0.86,乙设备生产的产品的合格率=1-=0.96,
从合格率可以看出,乙设备比甲设备好一些.
(2)列联表如下:
单位:件
甲设备 乙设备 合计
合格品 43 48 91
不合格品 7 2 9
合计 50 50 100
零假设为H0:该企业生产的这种产品的质量指标值与甲、乙两套设备的选择无关.计算可得
χ2=≈3.053<3.841=x0.05,依据α=0.05的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为该企业生产的这种产品的质量指标值与甲、乙两套设备的选择无关.
能力提升练
1.D 用频率估计概率可得,夜晚下雨的概率约为=,故A判断正确;
未出现“日落云里走”时夜晚下雨的概率约为=,故B判断正确;
由χ2≈19.05>10.828,可得有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,故C判断正确,D判断不正确.故选D.
2.B 任取1名参赛人员,抽到对主办方表示满意的男性运动员的概率为=,故①错误;
χ2=≈5.952<6.635=x0.01,故②错误,③正确.故选B.
3.解析 (1)由题意可知,绝对贫困户有(0.25+0.50+0.75)×0.2×100=30(户),可得出如下列联表:
单位:户
受教育水平 良好 受教育水平 不好 合计
绝对贫困户 2 28 30
相对贫困户 18 52 70
合计 20 80 100
零假设为H0:绝对贫困户数与受教育水平不好无关.计算可得χ2=≈4.762>3.841=x0.05.
依据α=0.05的独立性检验,推断H0不成立,即认为绝对贫困户数与受教育水平不好有关.
(2)贫困指标在[0,0.4)的贫困户共有(0.25+0.5)×0.2×100=15(户),
“亟待帮助户”共有0.25×0.2×100=5(户),
依题意X的可能取值为0,1,2,
P(X=0)==,P(X=1)==,P(X=2)==,
则X的分布列为
X 0 1 2
P
故E(X)=0×+1×+2×=.
4.解析 (1)根据题意,列出2×2列联表如下:
单位:人
高个 非高个 合计
大脚 5 2 7
非大脚 1 12 13
合计 6 14 20
由表中数据,得χ2=≈8.802>7.879=x0.005,
所以有99.5%的把握认为人脚的大小与身高有关系.
(2)序号为5的倍数的数据有4组:
x1=176,y1=44,x2=166,y2=39,x3=168,y3=40,x4=170,y4=41,
则=×(176+166+168+170)=170,=×(44+39+40+41)=41,
所以=
=
,=-=41-×170=-44,
从而y关于x的经验回归方程是=x-44.
5.解析 (1)由题表中数据得,=3,=100,
∴===-8.5,
∴=-=125.5,∴所求的经验回归方程为=-8.5x+125.5.
(2)零假设为H0:“礼让斑马线”行为与驾龄无关.由题表中的数据得χ2==≈5.556>5.024=x0.025,
依据α=0.025的独立性检验,推断H0不成立,即认为“礼让斑马线”行为与驾龄有关.