人教A版(2019)高中数学选必修3 第10讲 列联表及独立性检验(含解析)

文档属性

名称 人教A版(2019)高中数学选必修3 第10讲 列联表及独立性检验(含解析)
格式 zip
文件大小 1.1MB
资源类型 试卷
版本资源 人教A版(2019)
科目 数学
更新时间 2024-02-28 12:13:51

文档简介

中小学教育资源及组卷应用平台
第10讲 列联表及独立性检验
一、分类变量
1.为了方便,用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.
2.判断分类变量之间关系的方法:(1)利用数形结合思想,借助等高堆积条形图来判断两个分类变量是否相关是判断变量是否相关的常见方法;(2)在等高堆积条形图中,与相差越大,两个分类变量有关系的可能性就越大.
二、列联表
一般地,假设两个分类变量和,它们的取值为,其样本频数列联表(列联表)如下:
合计
合计
三、等高堆积条形图
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
四、独立性检验
1.计算公式:,其中.
2.临界值的定义:对于任何小概率值,可以找到相应的正实数,使得成立,我们称为的临界值,概率值越小,临界值越大.
3.独立性检验:,通常称为零假设或原假设.
基于小概率值的检验规则是:
当时,我们就推断不成立,即认为和不独立,该推断犯错误的概率不超过;
当时,我们没有充分证据推断不成立,可以认为和独立.
这种利用的取值推断分类变量和是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验.
4.独立性检验中几个常用的小概率值和相应的临界值
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
5.独立性检验的一般方法
(1)根据题目信息,完善列联表;
(2)提出零假设:假设两个变量相互独立,并给出在问题中的解释;
(3)根据列联表中的数据及计算公式求出的值;
(4)当时,我们就推断不成立,即两个变量不独立,该推断犯错误的概率不超过;
当时,我们没有充分证据推断不成立,可以认为两个变量相互独立。
【课堂训练】
一、单选题
1.假设有两个分类变量与,它们的可能取值分别为和,其列联表为
Y X 总计
10 18 28
m 26 m+26
总计 m+10 44 m+54
则当整数取______时,与的关系最弱( )
A.8 B.9 C.14 D.19
2.某学校为了了解该校学生对于某项运动的爱好是否与性别有关,通过随机抽查110名学生,得到如下2×2的列联表:
喜欢该项运动 不喜欢该项运动 总计
男 40 20 60
女 20 30 50
总计 60 50 110
由公式,算得
附表:
0.025 0.01 0.005
5.024 6.635 7.879
参照附表,以下结论正确的是
A.有以上的把握认为“爱好该项运动与性别有关”
B.有以上的把握认为“爱好该项运动与性别无关”
C.有以上的把握认为“爱好该项运动与性别有关”
D.有以上的把握认为“爱好该项运动与性别无关”
3.在独立性检验中,统计量有两个临界值:3.841和6.635;当>3.841时,有95%的把握说明两个事件有关,当>6.635时,有99%的把握说明两个事件相关,当< 3.841时,认为两个事件无关.在一项调查某种药是否对心脏病有治疗作用时,共调查了3000人,经计算的=9.56,根据这一数据分析,认为此药物与心脏病之间( )
A.有95%的把握认为两者相关 B.约有95%的心脏病患者使用药物有作用
C.有99%的把握认为两者相关 D.约有99%的心脏病患者使用药物有作用
4.为了了解某高中生对电视台某节目的态度,在某中学随机调查了110名同学,得到如下列联表:
男 女 总计
喜欢 40 20 60
不喜欢 20 30 50
总计 60 50 110
由算得.
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“喜欢该节目与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“喜欢该节目与性别无关”
C.有99%的把握认为“喜欢该节目与性别有关”
D.有99%的把握认为“喜欢该节目与性别无关”
5.下列说法中正确的是( )
A.对于独立性检验,随机变量的观测值越小,判定“两个分类变量有关系”犯错误的概率越小
B.若事件与相互独立,且,,则
C.若随机变量服从正态分布且,则
D.在回归分析中,对一组给定的样本数据、、、,样本数据的线性相关程度越强,则越接近
6.为研究市民性别和喜欢某项体育运动是否有关,某校社团学生在部分市民中进行了一次调查,得到下表:
该项运动的喜好 性别 合计
男性 女性
喜欢 140
不喜欢 80
合计
已知男性喜欢该项运动的人数占男性人数的,女性喜欢该项运动的人数占女性人数的,则下列说法不正确的是( )
A.列联表中的值为60,的值为120
B.有的把握认为市民性别和喜欢该项运动有关系
C.随机对一路人进行调查,有的可能性对方喜欢该项运动
D.没有的把握认为市民性别和喜欢该项运动有关系
7.某市对机动车单双号限行进行了调查,在参加调查的2748名有车人中有1760名持反对意见,2652名无车人中有1400名持反对意见,在运用这些数据说明“拥有车辆”与“反对机动车单双号限行”是否相关时,用下列哪种方法最有说服力( )
A.平均数 B.方差 C.独立性检验 D.回归直线方程
8.随着国家对中小学“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报为研究“支持增加中学生体育锻炼时间的政策是否与性别有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如下数据(,)
支持 不支持
男生
女生
通过计算有95%以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,则在这被调查的80名女生中支持增加中学生体育锻炼时间的人数的最小值为( )
附:,其中.
0.100 0.050 0.010 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.15 B.65 C.16 D.66
9.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:K2=7.8.(参考数据).下面正确的结论是( )
男 女 总计
爱好 40 20 60
不爱好 20 30 50
总计 60 50 110
回归系数
参考数据:,
0.15 0.10 0.05 0.025 0.01 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
10.当前新冠病毒肆虐,已经成为全球性威胁.为了检测某种新冠病毒疫苗的效果,现随机抽取100只小白鼠进行试验,得到如下列联表:
感染 未感染 总计
注射 10 40 50
未注射 20 30 50
总计 30 70 100
则下列说法一定正确的是( ).
附:(其中).
临界值表:
0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
A.有的把握认为“小白鼠有无被感染与是否注射疫苗有关”
B.有的把握认为“小白鼠有无被感染与是否注射疫苗无关”
C.在犯错误的概率不超过的前提下,认为“小白鼠有无被感染与是否注射疫苗有关”
D.在犯错误的概率不超过的前提下,认为“小白鼠有无被感染与是否注射疫苗无关”
二、多选题
11.以下结论正确的是( )
A.两个随机变量的线性相关性越强,则相关系数r的绝对值越接近于1
B.在检验A与B是否有关的过程中,根据数据算得的值,越小,认为“A与B有关”的把握越小
C.随机变量,若,,则
D.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合效果越好
12.千百年来,我国劳动人民在生产实践中根据云的形状、走向速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩销云,地上雨淋林”“日落云里走,雨在半夜后”……小明同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下2×2列联表:
夜晚天气 日落云里走 下雨 不下雨 临界值表
0.10 0.05 0.010 0.001
出现 25 5
不出现 25 45 2.706 3.841 6.635 10.828
并计算得到,下列小明对地区天气判断正确的是( )
A.夜晚下雨的概率约为
B.未出现“日落云里走”,但夜晚下雨的概率约为
C.出现“日落云里走”,有的把握认为夜晚会下雨
D.有的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关
13.某工厂有25周岁及以上工人300名,25周岁以下工人200名.统计了他们某日产品的生产件数,然后按“25周岁及以上”和“25周岁以下”分成两组,再分别将两组工人的日生产件数分成5组“,,,,”加以汇总,得到如图所示的频率分布直方图.规定生产件数不少于80件者为“生产能手”,零假设:生产能手与工人所在的年龄组无关.( )
注:,
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.该工厂工人日生产件数的25%分位数在区间内
B.日生产件数的平均数“25周岁及以上组”小于“25周岁以下组”
C.从生产不足60件的工人中随机抽2人,至少1人25周岁以下的概率为
D.根据小概率值的独立性检验,我们推断不成立
14.下列命题正确的是( )
A.已知由一组样本数据(xi,yi)(i=12...,n)得到的回归直线方程为y=4x+20,且,则这组样本数据中一定有
B.已知,若根据2×2列联表得到2的观测值为4.153,则有95%的把握认为两个分类变量有关
C.在残差图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好
D.两个变量线性相关性越强,则相关系数r就越接近1
15.在检验X与Y是否有关的过程中,表示的意义是( )
A.有99%的把握认为X与Y没有关系
B.有1%的把握认为X与Y有关系
C.有99%的把握认为X与Y有关系
D.在犯错误的概率不超过1%的前提下,可以认为X与Y有关系
16.下列命题正确的是( )
附:
0.050 0.01 0.005
3.841 6.635 7.879
A.若甲、乙两组数据的相关系数分别为0.66和,则乙组数据的线性相关性更强
B.已知样本数据的方差为4,则的标准差是4
C.在检验A与B是否有关的过程中,根据所得数据算得,则有99%的把握认为A和B有关
D.对具有线性相关关系的变量x、y,有一组观测数据,其线性回归方程是,且,则实数的值是
17.以下四个命题中正确的是( )
A.质检员每隔一小时从一条生产流水线上抽取一件产品进行某项指标检测,这样的抽样是系统抽样
B.两个随机变量的线性相关性越强,则相关系数的绝对值越接近于
C.在某项测量中,测量结果服从正态分布(),若在内取值的概率为,则在内取值的概率为
D.对分类变量与的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大
18.则下列说法正确的是( )
A.在回归分析中,残差的平方和越小,模型的拟合效果越好;
B.在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;
C.若数据,,…,的平均数为1,则,,…的平均数为2;
D.对分类变量与的随机变量的观测值来说,越小,判断“与有关系”的把握越大.
三、填空题
19.某高校《统计》课程的教师随机调查了选该课的一些学生情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,得到
专业 性别 非统计专业 统计专业
男 13 10
女 7 20
因为,所以有 的把握判定主修统计专业与性别有关系.
20.为了了解高中学生对乡村音乐的态度与性别的关系,现随机抽取名学生,根据调查数据得到,若由此认为“喜欢乡村音乐与性别有关”,则此结论出错的概率不超过 .
21.某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在如表“性别与会外语”的列联表中, .
会外语 不会外语 合计
男 a b 20
女 6 d
合计 18 50
22.如下表是对于喜欢足球与否的统计列联表依据表中的数据,得到 .
23.在吸烟与患肺病这两个分类变量的计算中,“若的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系”这句话的意思:
①是指“在100个吸烟的人中,必有99个人患肺病
②是指“有1%的可能性认为推理出现错误”;
③是指“某人吸烟,那么他有99%的可能性患有肺病”;
④是指“某人吸烟,如果他患有肺病,那么99%是因为吸烟”.
其中正确的解释是 .
24.为探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射后14天内的结果如下表所示:
死亡 存活 总计
第一种剂量 14 11 25
第二种剂量 6 19 25
总计 20 30 50
在研究小白鼠的死亡与剂量是否有关时,根据以上数据求得 .
25.某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计得下方的列联表.则根据列联表可知:
年轻人 非年轻人 总计
经常用流行用 125 25 150
不常用流行用语 35 15 50
总计 160 40 200
参考公式:独立性检验统计量,其中.
下面的临界值表供参考:
0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
有___________的把握认为“经常用流行用语”与“年轻人”有关系
26.为了判断高中学生的文理科选修是否与性别有关,随机调查了50名学生,得到如下列联表:
理科 文科 总计
男 20 5 25
女 10 15 25
总计 30 20 50
那么,认为“高中学生的文理科选修与性别有关系”犯错误的概率不超过 ;
27.2018年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考查某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:
感染 未感染 总计
注射 10 40 50
未注射 20 30 50
总计 30 70 100
参照附表,在犯错误的概率最多不超过 的前提下,可认为“注射疫苗”与“感染流感”有关系.
【参考公式:.】
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
28.已知下列命题:
①在线性回归模型中,相关指数表示解释变量对于预报变量的贡献率,越接近于1,表示回归效果越好;
②两个变量相关性越强,则相关系数的绝对值就越接近于1;
③在回归直线方程中,当解释变量每增加一个单位时,预报变量平均减少0.5个单位;
④对分类变量与,它们的随机变量的观测值来说,越小,“与有关系”的把握程度越大.其中正确命题的序号是 .
四、解答题
29.为了有针对性地提高学生体育锻炼的积极性,某中学随机抽取了80名学生,按照性别和体育锻炼情况整理为如下列联表:
性别 锻炼 合计
不经常 经常
男生 20 20 40
女生 24 16 40
合计 44 36 80
(1)依据的独立性检验,能否认为性别因素会影响学生锻炼的经常性;
(2)若列联表中的所有样本观测数据都变为原来的10倍,再做第(1)问,得到的结论还一样吗?请说明理由;
附:①,其中.
②临界值表
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
30.年卡塔尔世界杯即将于月日开幕.某球迷协会欲了解会员是否前往现场观看比赛,按性别进行分层随机抽样,已知男女会员人数之比为,统计得到如下列联表:
前往现场观看 不前往现场观看 合计
女性
男性
合计
(1)求,的值,依据小概率值的独立性检验,能否认为是否前往现场观看比赛与性别有关?
(2)用频率估计概率,假设会员是否前往现场观看互不影响,若从拟前往现场观看的会员中随机抽取人进行访谈,求在访谈者中,女性不少于人的概率.
附:,其中.
31.随着寒冷冬季的到来,羽绒服进入了销售旺季,某调查机构随机调查了400人,询问他们选购羽绒服时更关注保暖性能还是更关注款式设计,得到以下的列联表:
更关注保暖性能 更关注款式设计 合计
女性 160 80 240
男性 120 40 160
合计 280 120 400
附:.
0.10 0.05 0.010
2.706 3.841 6.635
(1)是否有95%的把握认为男性和女性在选购羽绒服时的关注点有差异?
(2)若从被调查的更关注保暖性能的人中按男女比例用分层抽样的方法抽取7人进行采访,再从这7人中任选2人赠送羽绒服,求这2人都是女性的概率.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)中小学教育资源及组卷应用平台
第10讲 列联表及独立性检验
1.C
【分析】利用分类变量的相关性进行计算求解.
【详解】在两个分类变量的列联表中,当的值越小时,认为两个分类变量有关的可能性越小.
令,得,解得,
又为整数,所以当时,与的关系最弱,故A,B,D错误.
故选:C.
2.C
【分析】由题中所给的观测值,可知有1%的机会出错,即可得正确选项.
【详解】解:由题意知本题所给的观测值,
∴这个结论有0.010的机会出错,
即有99%以上的把握认为“爱好体育运动与性别有关”.
故选:C.
3.C
【分析】根据统计了的值与的关系,判断两个事件间的关系即可.
【详解】由题知,,说明有的把握认为此药物与心脏病之间有关,
故选:C
4.C
【分析】根据求出的数据,结合临界值表判断即可
【详解】解:因为,
所以在犯错误的概率不超过1%的前提下,认为“喜欢该节目与性别有关”,或有99%的把握认为“喜欢该节目与性别有关”,
故选:C
5.B
【分析】利用独立性检验可判断A选项;利用条件概率和独立事件的概率公式可判断B选项;利用正态分布曲线的对称性可判断C选项;利用样本系数与线性相关关系的强弱可判断D选项.
【详解】对于独立性检验,随机变量的观测值越小,判定“两个分类变量有关系”犯错误的概率越大,故A错;
若随机变量服从正态分布且,
则,故C错;
样本相关系数的绝对值越接近,样本数据的线性相关程度越强,故D错;
若事件与相互独立,且,,
则,故B对.
故选:B.
6.C
【分析】根据已知条件,结合频率与频数的关系,以及独立性检验公式,即可求解.
【详解】解:依题意,,解得,由,解得,故A正确;
,则有的把握认为市民性别与喜欢该项运动有关系,故B正确;
随机对一路人进行调查,喜欢该项运动的频率为,则有的可能性对方喜欢该项运动,故C不正确;
因为,所以没有的把握认为市民性别与喜欢该项运动有关系,故D正确.
故选:C.
7.C
【分析】根据在参加调查的2748名有车人中有1760名持反对意见,2652名无车人中有1400名持反对意见,求出的值判断.
【详解】解:由在参加调查的2748名有车人中有1760名持反对意见,2652名无车人中有1400名持反对意见,
得,
所以有的把握认为“拥有车辆”与“反对机动车单双号限行”有关,
故利用独立性检验方法最有说服力,
故:C
8.D
【分析】根据独立性检验公式列出不等式,进而求解即可.
【详解】因为有95%以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,
所以,
即,
因为函数在时单调递增,
且,,,
所以的最小值为16,
所以在这被调查的80名女生中支持增加中学生体育锻炼时间的人数的最小值为.
故选:D.
9.A
【分析】题目的条件中已经给出这组数据的观测值,只要把参考数据给的观测值7.8同已知表中数据进行比较,发现它大于6.635.因此,在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别有关”.
【详解】由题意, K2=7.8,参照附表,
可得在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别有关”,
即:有99%以上的把握认为“爱好该项运动与性别有关”.
故选:A.
10.A
【分析】由列联表中数据计算的观测值,对照临界值得出结论.
【详解】解:由列联表中数据,计算,且,
所以有的把握认为“小白鼠有无被感染与是否注射疫苗有关”.
故选:.
11.ABD
【分析】A选项,当相关系数r的绝对值越接近1时,两个随机变量线性相关性越强;B选项,越大,越能认为两个变量有关,进而判断B正确;C选项,利用二项分布的数学期望与方差公式得到,进而求出,D选项,在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合效果越好.
【详解】对于A,两个随机变量的线性相关性越强,则相关系数r的绝对值越接近于1,所以A选项正确;
对于B,越小,认为“A与B有关”的把握越小,故B选项正确;
对于C,若,若,,所以,所以,,故C选项错误;
对于D,在残差图中,残差图的带状区域的宽度越窄,说明模型的拟合精度越高,回归方程的预报精度越高,说明模型的拟合效果越好,故D选项正确;
故选:ABD
12.BD
【分析】根据题意计算对应的频率,即可判断A、B,再由独立性检验判断选项C、D.
【详解】由题意,把频率看作概率可得夜晚下雨的概率,A错误;未出现“日落云里走”,但夜晚下雨的概率约为,B正确;由,所以可知有的把握认为“日落云里走’是否出现”与“当晚是否下雨”有关,故D正确,C错误.
故选:BD
13.ABD
【分析】A选项,利用分位数的计算公式进行求解;B选项,分别计算出25周岁及以上组的平均数和25周岁以下组的平均数,比较得到结论;C选项,利用组合知识求解古典概型的概率;D选项,计算出卡方,与7.879比较得到结论.
【详解】该工厂工人一共有200+300=500人,则,则选取第125名和126名的平均数作为25%分位数,
其中25周岁及以上组在区间的人数为,
25周岁以下组在区间的人数为,
25周岁及以上组在区间的人数为,
25周岁以下组在区间的人数为,
因为,,
故该工厂工人日生产件数的25%分位数在区间内,A正确;
25周岁及以上组的平均数为,
25周岁以下组的平均数为,
因为,所以日生产件数的平均数“25周岁及以上组”小于“25周岁以下组”,B正确;
生产不足60件的工人一共有25人,其中25周岁及以上组有15人,25周岁以下组有10人,所以从生产不足60件的工人中随机抽2人,至少1人25周岁以下的概率为,故C错误;
填写列联表,如下:
生产能手 非生产能手 总计
25周岁及以上组 75 225 300
25周岁以下组 75 125 200
合计 150 350 500
则,
故可以推断不成立,D正确.
故选:ABD
14.BC
【分析】根据回归方程的性质、相关系数的性质可分别判断AB的正误,根据独立性检验的性质、残差的性质可分别判断CD的正误.
【详解】对于A,因为,故,故样本中心为,
回归直线一定过样本中心,但样本数据中不一定有,故A错误.
对于B,因为,故有95%的把握认为两个分类变量有关,故B正确.
对于C,在残差图中,残差分布的水平带状区域的宽度越窄,说明拟合精度越高,即拟合效果越好,故C正确.
对于D,两个变量线性相关性越强,则相关系数的绝对值就越接近1,故D错误.
故选:BC.
15.CD
【分析】根据独立性检验的意义判断.
【详解】在独立性检验中,表示的意义是:
在犯错误的概率不超过1%的前提下,可以认为X与Y有关系,
即有99%的把握认为X与Y有关系,所以C,D正确.
故选:CD.
16.ABD
【分析】比较相关系数的绝对值大小即可判断A;根据方差和标准差的关系即可判断B;根据即可判断C;先算出,,再根据其线性回归方程即可求得实数的值,进而即可判断D.
【详解】对于A,由,则乙组数据的线性相关性更强,故A正确;
对于B,由样本数据的方差为4,则的方差是,所以其标准差为4,故B正确;
对于C,由,则没有99%的把握认为A和B有关,故C错误;
对于D,依题意可得,,则,得,故D正确.
故选:ABD.
17.BC
【解析】对于A,只有当生产流水线是匀速的,该抽样才是系统抽样;
对于B,根据两个随机变量的线性相关性强弱的结论,可知正确;
对于C,根据正态曲线的对称性可知正确;
对于D,根据判断“分类变量有关系”的把握程度的结论可知不正确.
【详解】对于A,质检员每隔一小时从一条生产流水线上抽取一件产品进行某项指标检测,当生产流水线是匀速的,则该抽样是系统抽样,当生产流水线不是匀速的,则该抽样是随机抽样,故A错,
对于B,两个随机变量的线性相关性越强,则相关系数的绝对值越接近于,故B对,
对于C,在某项测量中,测量结果服从正态分布(),根据正态曲线的对称性可知,若在内取值的概率为,则在内取值的概率也为,所以在内取值的概率为,故C对,
对于D,对分类变量与的随机变量的观测值来说,越大,判断“与有关系”的把握程度越大,故 D错,
故选:BC.
【点睛】关键点点睛:掌握系统抽样的概念、两个随机变量的线性相关性强弱的结论,正态曲线的对称性以及判断“分类变量有关系”的把握程度的结论是解题关键.
18.ABC
【分析】根据残差的意义,可判定AB真命题;根据数据的平均值的计算公式,可得C真命题;根据独立性检验中观测值的几何意义,可判定D为假命题.
【详解】根据残差的意义知,残差的平方和越小,模型的拟合效果越好,所以A正确;
由残差的意义知,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适,
所以B正确;
若数据,,…,的平均数为1,则,,…的平均数为也扩大为原来的2倍,即平均数为2,所以C正确;
对分类变量与的随机变量的观测值来说,应该是越大,判断“与有关系”的把握越大,所以D不正确.
故选:ABC.
19.
【分析】根据独立性检验临界值表,即可得出答案.
【详解】,
故有的把握认为主修统计专业与性别有关,
故答案为:.
20./
【分析】根据可得出结论.
【详解】因为,所以根据小概率值的独立性检验,
认为“喜欢乡村音乐与性别有关”,此结论出错的概率不超过.
故答案为:.
21.24
【分析】根据题意列方程组求解即可
【详解】由题意得所以,,.
故答案为:24
22.
【详解】试题分析:.
考点:独立性检验.
23.②
【分析】根据独立性检验的特点可判断.
【详解】若的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系,
这一句话的意思是有有99%的把握认为这个推理是正确的,有1%的可能性认为推理出现错误,因此②正确.
故答案为:②.
24.
【解析】根据的计算公式,由题中数据,直接计算,即可得出结果.
【详解】根据题中条件可得,.
故答案为:.
【点睛】本题主要考查求的值,熟记公式即可,属于基础题型.
25.95%
【分析】先求出,再与临界值比较,即可求解
【详解】,
根据临界值知有95%的把握认为经常用流行语与年轻人有关系,
故答案为:95%
26.
【详解】试题分析:由公式; 因为8.3>7.879,
所以我们认为“高中学生的文理科选修与性别有关系”犯错误的概率不超过.
考点:独立性检验的运用.
27.0.05
【详解】分析:直接利用独立性检验公式计算即得解.
详解:由题得,
所以犯错误的概率最多不超过0.05的前提下,可认为“注射疫苗”与“感染流感”有关系.
故答案为0.05.
点睛:本题主要考查独立性检验和的计算,意在考查学生对这些知识的掌握水平和解决实际问题的能力.
28.①②③
【分析】根据相关指数、相关系数的实际意义判断①、②;由回归直线方程估计解释变量与的变化关系判断③;由独立性检验的基本思想判断④.
【详解】①由相关系数的实际意义,相关指数表示解释变量对于预报变量的贡献率,越接近于1,表示回归效果越好;正确;
②由相关系数的实际意义,两个变量相关性越强,则相关系数r的绝对值就越接近于1,正确;
③在回归直线方程中,当解释变量每增加一个单位时,预报变量平均减少0.5个单位,因为样本点不都落在回归方程上,故只能是估计值,所以说是平均增长,正确;
④对分类变量与,它们的随机变量的观测值来说,越小则“与有关系”的把握程度越小,故错误;
故答案为:①②③.
29.(1)不能
(2)不一样,理由见解析
【分析】(1)根据列联表中的数据,求得,再与临界值表对照下结论;
(2)根据数据,求得,再与临界值表对照即可.
【详解】(1)解:零假设为性别与锻炼的经常性无关,
根据列联表中的数据,经计算得到

根据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即不能认为性别因素会影响学生锻炼的经常性.
(2)由题意得,
根据小概率值的独立性检验,我们推断不成立,
因此可以认为性别因素会影响学生锻炼的经常性,此推断犯错误的概率不大于0.05,
得到的结论不一样.
30.(1),不能认为是否前往现场观看比赛与性别有关
(2)
【分析】(1)计算的值,由此作出判断;
(2)根据题意设抽到女性人数为,且服从二项分布,按照二项分布概率可得结果.
【详解】(1)由已知数据,知男女会员人数之比为,因此,根据分层随机抽样,
抽取男会员人,女会员人,故.
∵,
由于,根据小概率值的独立性检验,
不能认为是否前往现场观看比赛与性别有关.
(2)记抽到的人中,女性人数为,由题意,
∴,
即在访谈者中,女性不少于人的概率为.
31.(1)没有95%的把握认为男性和女性在选购羽绒服时的关注点有差异
(2)
【分析】(1)将(2)数据代入公式,然后跟附表中3.841对比,如果所求数更大则有95%的把握认为男性和女性在选购羽绒服时的关注点有差异,否则无.
(2)运用组合数和古典概型概率公式求解.
【详解】(1)因为,
因为,所以没有95%的把握认为男性和女性在选购羽绒服时的关注点有差异.
(2)选出的女性人数为,选出的男性人数为
7人中任选2人的总方法数为种,
选取的两人都为女性的方法数为种,
故所求的概率为
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)