9.2独立性检验
一、单选题
1.某医疗研究所为了检查新研发的疫苗对某种病毒的预防作用,把1000只已注射疫苗的小白鼠与另外1000只未注射疫苗的小白鼠的感染记录作比较,提出原假设:“这种疫苗不能起到预防该病毒传染的作用.”并计算得,则下列说法正确的是( )
A.这种疫苗对预防该病毒传染的有效率为1%
B.若某人未使用疫苗,则他有99%的可能性传染该病毒
C.有99%的把握认为“这种疫苗能起到预防该病毒传染的作用”
D.有1%的把握认为“这种疫苗能起到预防该病毒传染的作用”
【答案】C
【分析】由已知,根据题意给的卡方值,应用独立性检验的基本思想可以得到结论.
【解析】由已知,,说明假设不合理的程度为99%,
即这种疫苗不能起到防范病毒的作用不合理的程度约为99%,
所以有99%的把握认为这种疫苗能起到预防病毒的作用.
故选:C.
2.假设2个分类变量和的列联表如下:
合计
a 10
c 30
合计 40 100
对于同一样本,以下数据能说明和有关系的可能性最大的一组是( )A., B.,
C., D.,
【答案】B
【分析】根据列联表和独立性检验的相关知识,知当,一定时,,相差越大,就越大,从而和有关系的可能性越大,再结合选项判断即可.
【解析】解:,
根据列联表和独立性检验的相关知识,知当,一定时,,相差越大,
与相差就越大,就越大,即和有关系的可能性越大,
结合选项,知B中与其他选项相比相差最大.
故选:B.
3.为考查某种营养品对儿童身高增长的影响,用一部分儿童进行试验,根据100个有放回简单随机样本的数据,得到如下列联表:由表可知下列说法正确的是( )
身高 合计
有明显增长 无明显增长
食用该营养品 a 10 50
未食用该营养品 b 30 50
合计 60 40 100
参考公式:,其中.
参考数据:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.
B.
C.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是
D.根据小概率值的独立性检验,可以认为该营养品对儿童身高增长有影响
【答案】D
【分析】根据列联表求出、,即可判断A,再计算出卡方,即可判断B、D,最后根据古典概型的概率公式判断C.
【解析】解:由题可知,,所以A错误.
,所以根据小概率值的独立性检验,
可以认为该营养品对儿童身高增长有影响,所以B错误,D正确.
从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是,所以C错误.
故选:D
4.已知两个统计案例如下:
①某机构调查了100位社区网络员手机即时通讯软件的使用情况,结果如下表:
35岁以上 35岁以下 总计
微信 45 20 65
QQ 13 22 35
总计 58 42 100
②为了解某地母亲身高与女儿身高的关系,随机测得10对母女的身高数据如下表:
母亲身高/cm 159 160 160 163 159 154 159 158 159 157
女儿身高/cm 158 159 160 161 161 155 162 157 162 156
则对这些数据的处理所采用的统计方法是( )A.①回归分析,②取平均值 B.①回归分析,②独立性检验
C.①独立性检验,②回归分析 D.①独立性检验,②取平均值
【答案】C
【分析】利用回归分析和独立性检验的概念解决即可.
【解析】独立性检验是判断两个分类变量是否有关联的一种方法,而回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,①中的两个变量为分类变量,采用的统计方法为独立性检验,②中的两个变量是具有相关关系的,采用的统计方法为回归分析,
故选:C.
5.第24届冬季奥林匹克运动会将于2022年在北京举办,为了解某城市居民对冰雪运动的关注情况,随机抽取了该市100人进行调查统计,得到如下列联表:
关注冰雪运动 不关注冰雪运动 合计
男 45 10 55
女 25 20 45
合计 70 30 100
下列说法正确的是( )
参考公式:,其中.
附表:
0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
A.有99%以上的把握认为“关注冰雪运动与性别有关”
B.有99%以上的把握认为“关注冰雪运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“关注冰雪运动与性别无关”
D.在犯错误的概率不超过0.1%的前提下,认为“关注冰雪运动与性别有关”
【答案】A
【分析】根据给定数据及参考公式计算的观测值,再与临界值表比对判断作答.
【解析】依题意,的观测值为,
所以有99%以上的把握认为“关注冰雪运动与性别有关”,A正确,B不正确;
而犯错误的概率不超过1%,不能确定犯错误的概率不超过0.1%的情况,C,D不正确.
故选:A
6.以下四个命题,其中正确的个数有( )
①线性回归方程必过;
②在线性回归方程中,当变量x每增加一个单位时,变量平均增加0.2个单位;
③由独立性检验可知,有99%的把握认为物理成绩与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀;
④在一个列联表中,由计算得,则有99.9%的把握确认这两个变量间有关系(其中).
A.1个 B.2个 C.3个 D.4个
【答案】B
【分析】根据独立性检验即可判断CD,根据线性回归直线方程的含义即可判断AB.
【解析】对于①,线性回归方程必过样本中心,所以①正确,
对于②,线性回归方程中,当变量x每增加一个单位时,变量平均减少0.2个单位,故②错误,
对于③,由独立性检验可知,有99%的把握认为物理成绩与数学成绩有关,是指不出错的概率概率为,并不是某人数学成绩优秀,他有99%的可能物理优秀;故③错误,
对于④,由知,则有99.9%的把握确认这两个变量间有关系,故④正确,
故选:B
二、多选题
7.某校为了解学生对餐厅食品质量的态度(满意或不满意),对在餐厅就餐的学生随机做了一次调查,其中被调查的男、女生人数相同,有的男生态度是“不满意”,有的女生态度是“不满意”,若有99%的把握判断男生和女生对餐厅食品质量的态度有差异,则调查的总人数可能为( )
参考公式:,其中.
临界值表:
0.10 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.120 B.170 C.200 D.240
【答案】CD
【分析】根据题意进行独立性检验,得到不等式,判断出调查的总人数至少为180.对照选项下结论.
【解析】设总人数为2n,则列联表为:
性别 学生态度 男 女 总计
满意
不满意
总计 n n 2n
,由题意得,解得,因为n为整数,所以调查的总人数至少为180.
故选:CD.
8.某市在对学生的综合素质评价中,将其测评结果分为“优秀”“合格”“不合格”三个等级,其中不小于80分为“优秀”,小于60分为“不合格”,其他为“合格”.该市某校高二年级有男生500人,女生400人,为了解性别对该综合素质评价结果的影响,采用分层随机抽样的方法从高二学生中抽取了90名学生的综合素质评价结果,其各个等级的频数统计如表(单位:人):
等级 性别 优秀 合格 不合格
男 30 8
女 30 6
根据表中统计的数据,下列说法正确的是( )A.
B.
C.没有90%的把握判断综合素质评价结果为优秀与性别有关
D.有95%的把握判断综合素质评价结果为优秀与性别有关
【答案】AC
【分析】根据分层抽样求出男女生人数,计算判断AB,再由判断CD即可.
【解析】设从高二年级男生中抽出人,则,解得,
所以,,故A正确,B错误;
根据评价结果是否优秀可以得到列联表为(单位:人)
等级 性别 优秀 非优秀 总计
男 30 20 50
女 30 10 40
总计 60 30 90
则,故没有90%的把握判断综合素质评价结果为优秀与性别有关,故C正确,D错误.
故选:AC.
9.为了增强学生体育锻炼的积极性,某中学需要了解性别因素与学生对体育锻炼的喜好是否有影响,为此对学生是否喜欢体育锻炼的情况进行普查.得到下表:
性别 合计
男性 女性
喜欢 280 p 280+p
不喜欢 q 120 120+q
合计 280+q 120+p 400+p+q
附:,.
0.15 0.10 0.05 0.025 0.010 0.00l
2.072 2.706 3.841 5.024 6.635 10.828
已知男生喜欢该项运动的人数占男生人数的,女生喜欢该项运动的人数占女生人数的,则下列说法正确的是( )A.列联表中的值为,的值为
B.随机对一名学生进行调查,此学生有的可能喜欢该项运动
C.有的把握认为学生的性别与其对该项运动的喜好有关系
D.没有的把握认为学生的性别与其对该项运动的喜好有关系
【答案】ACD
【分析】根据题意求出q、p,补全列联表,分析数据,利用卡方计算公式求出,结合独立性检验的思想依次判断选项即可.
【解析】A:由题意知,男生喜欢该项运动的人数占男生人数的,
女生喜欢该项运动的人数占女生人数的,
则,,解得,故A正确;
B:补全列联表如下:
男性 女性 合计
喜欢 280 180 460
不喜欢 120 120 240
合计 400 300 700
所以随机抽一名学生进行调查,喜欢该项运动的概率约为,故B错误;
C:,
而,
所以有的把握认为学生的性别与其对该项运动的喜好有关系,故C正确;
D:由选项C知,没有的把握认为学生的性别与其对该项运动的喜好有关系,
故D正确.
故选:ACD
三、填空题
10.已知下列命题:
①在线性回归模型中,相关指数表示解释变量对于预报变量的贡献率,越接近于1,表示回归效果越好;
②两个变量相关性越强,则相关系数的绝对值就越接近于1;
③在回归直线方程中,当解释变量每增加一个单位时,预报变量平均减少0.5个单位;
④对分类变量与,它们的随机变量的观测值来说,越小,“与有关系”的把握程度越大.其中正确命题的序号是__________.
【答案】①②③
【分析】根据相关指数、相关系数的实际意义判断①、②;由回归直线方程估计解释变量与的变化关系判断③;由独立性检验的基本思想判断④.
【解析】①由相关系数的实际意义,相关指数表示解释变量对于预报变量的贡献率,越接近于1,表示回归效果越好;正确;
②由相关系数的实际意义,两个变量相关性越强,则相关系数r的绝对值就越接近于1,正确;
③在回归直线方程中,当解释变量每增加一个单位时,预报变量平均减少0.5个单位,因为样本点不都落在回归方程上,故只能是估计值,所以说是平均增长,正确;
④对分类变量与,它们的随机变量的观测值来说,越小则“与有关系”的把握程度越小,故错误;
故答案为:①②③.
11.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
专业 性别 非统计专业 统计专业
男 13 10
女 7 20
为了判断主修统计专业是否与性别有关系,根据表中的数据,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为____.()
0.050 0.010 0.001
k 3.841 6.635 10.828
【答案】##
【分析】首先计算,再和临界值表中的数据比较大小,即可判断.
【解析】由题意知为了判断主修统计专业是否与性别有关系,根据表中的数据,
得到,由临界值表可以得到,判定主修统计专业与性别有关系的这种判断出错的可能性最高为.
故答案为:.
四、解答题
12.为了了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对名六年级学生进行了问卷调查,得到如下列联表:
常喝 不常喝 总计
肥胖
不肥胖
总计
已知从这名学生中随机抽取人,抽到肥胖学生的概率为.
(1)请将上面的列联表补充完整;
(2)通过计算判断是否有的把握认为肥胖与常喝碳酸饮料有关
附:,其中.
【答案】(1)列联表答案见解析
(2)有
【分析】(1)计算出这名学生中,肥胖学生的人数,即可完善列联表;
(2)计算出的观测值,结合临界值表可得出结论.
【解析】(1)解:因为从这名学生中随机抽取人,抽到肥胖学生的概率为,
所以,这名学生中,肥胖学生的人数为,完善列联表如下表所示:
常喝 不常喝 总计
肥胖
不肥胖
总计
(2)解:,
因此,有的把握认为肥胖与常喝碳酸饮料有关.
13.在传染病学中,通常把从致病刺激物侵入机体内或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段时间称为潜伏期,因此面对新冠肺炎疫情我们应该注意做好良好的防护措施和隔离措施.某研究团队统计了某地区10000名新冠肺炎患者的相关信息,得到如下表格:
潜伏期(天)
人数 600 1900 3000 2500 1600 250 150
(1)新冠肺炎的潜伏期受诸多因素的影响,为研究潜伏期与年龄的关系,通过分层抽样(按潜伏期天和潜伏期天分层)抽取200人进行研究,完成下面的列联表:
潜伏期天 潜伏期天 总计
60岁以上(含60岁) 150
60岁以下 30
总计 200
(2)能否在犯错误的概率不超过0.001的前提下认为潜伏期与患者年龄有关?
附:,.
0.150 0.100 0.050 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
【答案】(1)列联表见解析
(2)能
【分析】(1)由表中数据可知,潜伏期大于8天的人数,即可补充列联表;
(2)由(1)中的列联表求出卡方,即可判断.
【解析】(1)解:由表中数据可知,潜伏期大于8天的人数为人,
补充完整的列联表如下,
潜伏期天 潜伏期天 总计
60岁以上(含60岁) 130 20 150
60岁以下 30 20 50
总计 160 40 200
(2)根据(1)中的列联表,可得,
故能在犯错误的概率不超过的前提下认为潜伏期与患者年龄有关.9.2独立性检验
一、单选题
1.某医疗研究所为了检查新研发的疫苗对某种病毒的预防作用,把1000只已注射疫苗的小白鼠与另外1000只未注射疫苗的小白鼠的感染记录作比较,提出原假设:“这种疫苗不能起到预防该病毒传染的作用.”并计算得,则下列说法正确的是( )
A.这种疫苗对预防该病毒传染的有效率为1%
B.若某人未使用疫苗,则他有99%的可能性传染该病毒
C.有99%的把握认为“这种疫苗能起到预防该病毒传染的作用”
D.有1%的把握认为“这种疫苗能起到预防该病毒传染的作用”
2.假设2个分类变量和的列联表如下:
合计
a 10
c 30
合计 40 100
对于同一样本,以下数据能说明和有关系的可能性最大的一组是( )A., B.,
C., D.,
3.为考查某种营养品对儿童身高增长的影响,用一部分儿童进行试验,根据100个有放回简单随机样本的数据,得到如下列联表:由表可知下列说法正确的是( )
身高 合计
有明显增长 无明显增长
食用该营养品 a 10 50
未食用该营养品 b 30 50
合计 60 40 100
参考公式:,其中.
参考数据:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.
B.
C.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是
D.根据小概率值的独立性检验,可以认为该营养品对儿童身高增长有影响
4.已知两个统计案例如下:
①某机构调查了100位社区网络员手机即时通讯软件的使用情况,结果如下表:
35岁以上 35岁以下 总计
微信 45 20 65
QQ 13 22 35
总计 58 42 100
②为了解某地母亲身高与女儿身高的关系,随机测得10对母女的身高数据如下表:
母亲身高/cm 159 160 160 163 159 154 159 158 159 157
女儿身高/cm 158 159 160 161 161 155 162 157 162 156
则对这些数据的处理所采用的统计方法是( )A.①回归分析,②取平均值 B.①回归分析,②独立性检验
C.①独立性检验,②回归分析 D.①独立性检验,②取平均值
5.第24届冬季奥林匹克运动会将于2022年在北京举办,为了解某城市居民对冰雪运动的关注情况,随机抽取了该市100人进行调查统计,得到如下列联表:
关注冰雪运动 不关注冰雪运动 合计
男 45 10 55
女 25 20 45
合计 70 30 100
下列说法正确的是( )
参考公式:,其中.
附表:
0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
A.有99%以上的把握认为“关注冰雪运动与性别有关”
B.有99%以上的把握认为“关注冰雪运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“关注冰雪运动与性别无关”
D.在犯错误的概率不超过0.1%的前提下,认为“关注冰雪运动与性别有关”
6.以下四个命题,其中正确的个数有( )
①线性回归方程必过;
②在线性回归方程中,当变量x每增加一个单位时,变量平均增加0.2个单位;
③由独立性检验可知,有99%的把握认为物理成绩与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀;
④在一个列联表中,由计算得,则有99.9%的把握确认这两个变量间有关系(其中).
A.1个 B.2个 C.3个 D.4个
二、多选题
7.某校为了解学生对餐厅食品质量的态度(满意或不满意),对在餐厅就餐的学生随机做了一次调查,其中被调查的男、女生人数相同,有的男生态度是“不满意”,有的女生态度是“不满意”,若有99%的把握判断男生和女生对餐厅食品质量的态度有差异,则调查的总人数可能为( )
参考公式:,其中.
临界值表:
0.10 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.120 B.170 C.200 D.240
8.某市在对学生的综合素质评价中,将其测评结果分为“优秀”“合格”“不合格”三个等级,其中不小于80分为“优秀”,小于60分为“不合格”,其他为“合格”.该市某校高二年级有男生500人,女生400人,为了解性别对该综合素质评价结果的影响,采用分层随机抽样的方法从高二学生中抽取了90名学生的综合素质评价结果,其各个等级的频数统计如表(单位:人):
等级 性别 优秀 合格 不合格
男 30 8
女 30 6
根据表中统计的数据,下列说法正确的是( )A.
B.
C.没有90%的把握判断综合素质评价结果为优秀与性别有关
D.有95%的把握判断综合素质评价结果为优秀与性别有关
9.为了增强学生体育锻炼的积极性,某中学需要了解性别因素与学生对体育锻炼的喜好是否有影响,为此对学生是否喜欢体育锻炼的情况进行普查.得到下表:
性别 合计
男性 女性
喜欢 280 p 280+p
不喜欢 q 120 120+q
合计 280+q 120+p 400+p+q
附:,.
0.15 0.10 0.05 0.025 0.010 0.00l
2.072 2.706 3.841 5.024 6.635 10.828
已知男生喜欢该项运动的人数占男生人数的,女生喜欢该项运动的人数占女生人数的,则下列说法正确的是( )A.列联表中的值为,的值为
B.随机对一名学生进行调查,此学生有的可能喜欢该项运动
C.有的把握认为学生的性别与其对该项运动的喜好有关系
D.没有的把握认为学生的性别与其对该项运动的喜好有关系
三、填空题
10.已知下列命题:
①在线性回归模型中,相关指数表示解释变量对于预报变量的贡献率,越接近于1,表示回归效果越好;
②两个变量相关性越强,则相关系数的绝对值就越接近于1;
③在回归直线方程中,当解释变量每增加一个单位时,预报变量平均减少0.5个单位;
④对分类变量与,它们的随机变量的观测值来说,越小,“与有关系”的把握程度越大.其中正确命题的序号是__________.
11.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
专业 性别 非统计专业 统计专业
男 13 10
女 7 20
为了判断主修统计专业是否与性别有关系,根据表中的数据,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为____.()
0.050 0.010 0.001
k 3.841 6.635 10.828
四、解答题
12.为了了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对名六年级学生进行了问卷调查,得到如下列联表:
常喝 不常喝 总计
肥胖
不肥胖
总计
已知从这名学生中随机抽取人,抽到肥胖学生的概率为.
(1)请将上面的列联表补充完整;
(2)通过计算判断是否有的把握认为肥胖与常喝碳酸饮料有关
附:,其中.
13.在传染病学中,通常把从致病刺激物侵入机体内或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段时间称为潜伏期,因此面对新冠肺炎疫情我们应该注意做好良好的防护措施和隔离措施.某研究团队统计了某地区10000名新冠肺炎患者的相关信息,得到如下表格:
潜伏期(天)
人数 600 1900 3000 2500 1600 250 150
(1)新冠肺炎的潜伏期受诸多因素的影响,为研究潜伏期与年龄的关系,通过分层抽样(按潜伏期天和潜伏期天分层)抽取200人进行研究,完成下面的列联表:
潜伏期天 潜伏期天 总计
60岁以上(含60岁) 150
60岁以下 30
总计 200
(2)能否在犯错误的概率不超过0.001的前提下认为潜伏期与患者年龄有关?
附:,.
0.150 0.100 0.050 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828