【对点解密变式练】必考点08 列联表与独立性检验 学案(原卷版+解析版)

文档属性

名称 【对点解密变式练】必考点08 列联表与独立性检验 学案(原卷版+解析版)
格式 zip
文件大小 1.6MB
资源类型 试卷
版本资源 人教A版(2019)
科目 数学
更新时间 2022-06-15 11:39:05

文档简介

中小学教育资源及组卷应用平台
必考点08 列联表与独立性检验
题型一列联表和等高堆积条形图的应用
例题1为了解户籍性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人,男性40人,女性60人,绘制不同群体中倾向选择生育二胎与选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则关于样本下列叙述中正确的是( )
A.是否倾向选择生育二胎与户籍无关
B.是否倾向选择生育二胎与性别有关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
例题2假设有两个分类变量X与Y,它们的可能取值分别为和,其2×2列联表为:
Y X
10 18
m 26
则当m取下面何值时,X与Y的关系最弱( )
A.8 B.9 C.14 D.19
【解题技巧提炼】
等高堆积条形图的优劣点
(1)优点:较直观地展示了与的差异性.
(2)劣点:不能给出推断“两个分类变量有关系”犯错误的概率.
题型二由χ2进行独立性检验
例题1(2020·全国卷Ⅲ)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
   锻炼人次 空气质量等级      [0,200] (200,400] (400,600]
1(优) 2 16 25
2(良) 5 10 12
3(轻度污染) 6 7 8
4(中度污染) 7 2 0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400 人次>400
空气质量好
空气质量不好
附:χ2=,
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
例题2下表是某届某校本科志愿报名时,对其中304名学生进入高校时是否知道想学专业的调查表:
知道想学专业 不知道想学专业 合计
男生 63 117 180
女生 42 82 124
合计 105 199 304
根据表中数据,则下列说法正确的是________.(填序号)
①性别与知道想学专业有关;
②性别与知道想学专业无关;
③女生比男生更易知道所学专业.
【解题技巧提炼】
解决独立性检验问题的基本步骤
(1)根据已知的数据作出列联表;
(2)作出相应的等高堆积条形图,可以利用图形做出相应判断;
(3)求χ2的观测值;
(4)判断可能性:与临界值比较,得出事件有关的可能性大小.    
独立性检验解决实际问题的主要环节
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.
(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
(3)根据检验规则得出推断结论.
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
题型一列联表和等高堆积条形图的应用
1.根据如图所示的等高堆积条形图可知喝酒与患胃病________关系.(填“有”或“没有”)
2.为考察A,B两种药物预防某疾病的效果,进行动物试验,分别得到如下等高堆积条形图:
根据图中信息,在下列各项中,说法最佳的一项是(  )
A.药物B的预防效果优于药物A的预防效果
B.药物A的预防效果优于药物B的预防效果
C.药物A,B对该疾病均有显著的预防效果
D.药物A,B对该疾病均没有预防效果
题型二 利用回归直线方程对总体进行估计
1.(2020·新高考全国卷Ⅰ)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
  SO2 PM2.5   [0,50] (50,150] (150,475]
[0,35] 32 18 4
(35,75] 6 8 12
(75,115] 3 7 10
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
  SO2 PM2.5   [0,150] (150,475]
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?
附:χ2=,
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
2.某省进行高中新课程改革,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.
(1)根据以上数据建立一个2×2列联表;
(2)试根据小概率值α=0.01的独立性检验,分析对新课程教学模式的赞同情况与教师年龄是否有关系.
一、单选题
1.为了调查中学生近视情况,某校名男生中有名近视,名女生中有名近视,在检验这些中学生眼睛近视是否与性别有关时,用什么方法最有说服力( )
A.平均数 B.方差 C.回归分析 D.独立性检验
2.利用独立性检验的方法调查高中性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用2×2列联表,由计算可得,得到的正确结论是( )
0.01 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
A.有99%以上的把握认为“爱好该项运动与性别无关”
B.有99%以上的把握认为“爱好该项运动与性别有关”、
C.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别无关”
3.在研究肥胖与高血压的关系时,通过收集数据、整理分析数据得到“高血压与肥胖有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是( )
A.在100个高血压患者中一定有肥胖的人
B.在100个肥胖的人中至少有99人患有高血压
C.在100个高血压患者中可能没有肥胖的人
D.肥胖的人至少有99%的概率患有高血压
4.利用独立性检验的方法调查高中生性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用列联表,由计算可得,参照下表:得到的正确结论是( )
A.有99%以上的把握认为“爱好该项运动与性别无关”
B.有99%以上的把握认为“爱好该项运动与性别有关”
C.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关"
D.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别无关”
5.现在,很多人都喜欢骑“共享单车”,但也有很多市民并不认可.为了调查人们对这种交通方式的认可度,某同学从交通拥堵不严重的城市和交通拥堵严重的城市分别随机调查了20名市民,得到如下列联表:
总计
认可 13 5 18
不认可 7 15 22
总计 20 20 40
附:.
0.1 0.05 0.010 0.005
2.706 3.841 6.635 7.879
根据表中的数据,下列说法中正确的是( )
A.没有95%以上的把握认为“是否认可与城市的拥堵情况有关”
B.有99%以上的把握认为“是否认可与城市的拥堵情况有关”
C.可以在犯错误的概率不超过0.01的前提下认为“是否认可与城市的拥堵情况有关”
D.可以在犯错误的概率不超过0.05的前提下认为“是否认可与城市的拥堵情况有关”
6.现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男 女学生意愿的一份样本,制作出如下两个等高堆积条形图:
根据这两幅图中的信息,下列哪个统计结论是不正确的( )
A.样本中的女生数量多于男生数量
B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量
C.样本中的男生偏爱两理一文
D.样本中的女生偏爱两文一理
7.北京市人民政府新闻办公室召开疫情防控第200场例行新闻发布会时表示不在18~59岁接种年龄段范围的人员,需要等待进一步临床试验数据.近日专家对该年龄段内和该年龄段外的110人进行了临床试验,得到如下2×2列联表:
能接种 不能接种 总计
18~59岁内 40 20 60
18~59岁外 20 30 50
总计 60 50 110
附:,其中.
0.050 0.010 0.001
k 3.841 6.635 10.828
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“能接种与年龄段无关”
B.在犯错误的概率不超过0.1%的前提下,认为“能接种与年龄段有关”
C.有99%以上的把握认为“能接种与年龄段无关”
D.有99%以上的把握认为“能接种与年龄段有关”
8.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播 微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男 女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男 女学生总数量可能为( )
附:,其中.
0.1 0.05 0.01 0.001
2.706 3.841 6.635 10.828
A.130 B.190 C.240 D.250
二、多选题
9.某校对“学生性别和喜欢锻炼是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢锻炼的人数占男生总人数的,女生喜欢锻炼的人数占女生总人数的.若至少有95%的把握认为“学生性别和喜欢锻炼有关”,则被调查学生中男生的人数可能为( )
附:
0.050 0.010
3.841 6.635
A.35 B.40 C.45 D.50
10.为了增强学生的身体素质,提高适应自然环境、克服困难的能力,某校在课外活动中新增了一项登山活动,并对“学生喜欢登山和性别是否有关”做了一次调查,得到如图所示的等高条形统计图,则下列说法中正确的有( )
A.被调查的学生中喜欢登山的男生人数比不喜欢登山的女生人数多
B.被调查的男生中喜欢登山的人数比不喜欢登山的人数多
C.是否有99%的把握认为喜欢登山和性别有关不会受到被调查的男女生人数影响
D.是否有99%的把握认为喜欢登山和性别有关会受到被调查的男女生人数影响
11.某市为了研究该市空气中的PM2.5浓度和浓度之间的关系,环境监测部门对该市空气质量进行调研,随机抽查了100天空气中的PM2.5浓度和浓度(单位:),得到如下所示的2×2列联表:
PM2.5
64 16
10 10
经计算,则可以推断出( )
附:
0.050 0.010 0.001
3.841 6.635 10.828
A.该市一天空气中PM2.5浓度不超过,且浓度不超过的概率估计值是0.64
B.若2×2列联表中的天数都扩大到原来的10倍,的观测值不会发生变化
C.有超过99%的把握认为该市一天空气中PM2.5浓度与浓度有关
D.在犯错的概率不超过1%的条件下,认为该市一天空气中PM2.5浓度与浓度有关
12.针对当下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”做了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有的把握认为是否喜欢抖音和性别有关,则调查人数中男生有可能( )
附:
A. B. C. D.
三、填空题
13.如下是一个2×2列联表,则______.
x y 合计
x1 a 35 45
x2 7 b n
合计 m 73 s
14.某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55个学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30个.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过______.
附:
0.05 0.025 0.010 0.001
3.841 5.024 6.635 10.828
15.如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400名(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层抽样的方法抽取23人,则抽取的男生人数为______.
16.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若有的把握认为中学生追星与性别有关,则男生至少有__________人.
参考数据及公式如下:
0.050 0.010 0.001
3.841 6.635 10.828
,.
四、解答题
17.在一次模拟考试中,某校共有名文科学生参加考试,其中语文考试成绩低于的占,如果成绩不低于的为特别优秀,数学成绩的频率分布直方图如图.
(1)求数学成绩特别优秀的人数及数学成绩的平均分;
(2)如果语文和数学两科都特别优秀的共有人.根据以上数据,完成列联表,并分析是否有的把握认为语文特别优秀的同学,
数学也特别优秀.
语文特别优秀 语文不特别优秀 合计
数学特别优秀
数学不特别优秀
合计
参考数据:①;



18.某疫苗研发机构将其生产的某款疫苗在征集的志愿者中进行人体试验,现随机选取100名试验者检验结果并评分(满分为100分),其中评分不低于80分视为强力有效,否则视为效力一般.得到如图所示的频率分布直方图.
(1)求的值,并估计所有试验者的平均得分(同一组中的数据用该组区间的中点值作代表);
(2)将选取的100名试验者的性别与疫苗是否强力有效进行统计,请将下列2×2列联表补充完整,并能否判断在犯错误的概率不超过0.05的前提下认为疫苗的强效力与性别有关
强力有效 效力一般 合计
男性 50
女性 10
合计 100
参考数据:
0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
,其中.
19.某网站的调查显示,健身操类 跑步类 拉伸运动类等健身项目在大众健康项目中是比较火热的,但是大多数人的健身科学类知识相对缺乏,尤其是在健身指导方面.从某健身房随机抽取200名会员,对其平均每天健身时间进行调查,如下表,健身之前他们的体重情况如柱状图(1)所示,该健身房的教练为他们制订了健身计划,四个月后他们的体重情况如柱状图(2)所示.
平均每天健身时间(分钟)
人数 20 36 44 50 40 10
(1)若这200名会员的平均体重减少不低于,就认为该计划有效,根据上述柱状图,试问:该计划是否有效?(每组数据用该组区间的中点值作代表)
(2)请根据图中数椐填写下面的列联表,试问:是否有99%的把握认为平均每天健身时间与会员健身前的体重有关?
平均每天健身时间低于60分钟 平均每天健身时间不低于60分钟 合计
健身前体重低于
健身前体重不低于 80
合计 200
(3)以这200名会员平均每天健身时间的频率,代替该健身房1名会员平均每天健身时间发生的概率,若在该健身房随机调查12名会员,则其中平均每天的健身时间不低于70分钟的人数最有可能(即概率最大)是多少?
参考公式:,其中.
参考数据:
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
20.某学校共有1000名学生参加知识竞赛,其中男生400人,为了解该校学生在知识竞赛中的情况,采取分层抽样随机抽取了100名学生进行调查,分数分布在分之间,根据调查的结果绘制的学生分数频率分布直方图如图所示:
将分数不低于750分的学生称为“高分选手”.
(1)求的值,并估计该校学生分数的平均数、中位数和众数(同一组中的数据用该组区间的中点值作代表);
(2)现采用分层抽样的方式从分数落在,内的两组学生中抽取10人,再从这10人中随机抽取3人,记被抽取的3名学生中属于“高分选手”的学生人数为随机变量,求的分布列及数学期望;
(3)若样本中属于“高分选手”的女生有10人,完成下列列联表,并判断是否有%的把握认为该校学生属于“高分选手”与“性别”有关?
属于“高分选手” 不属于“高分选手” 合计
男生
女生
合计
(参考公式:,期中)
21.直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力贫困地区农民脱贫增收.某贫困地区有统计数据显示,2020年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示.若将销售主播按照年龄分为“年轻人”(岁~岁)和“非年轻人”(岁及以下或者岁及以上)两类,将一周内使用的次数为次或次以上的称为“经常使用直播销售用户”,使用次数为次或不足次的称为“不常使用直播销售用户”,则“经常使用直播销售用户”中有是“年轻人”.
(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为的样本,请你根据图表中的数据,完成列联表,并根据列联表判断是否有的把握认为经常使用网络直播销售与年龄有关?
使用直播销售情况与年龄列联表
年轻人 非年轻人 合计
经常使用直播销售用户
不常使用直播销售用户
合计
(2)某投资公司在2021年年初准备将万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:
方案一:线下销售.根据市场调研,利用传统的线下销售,到年底可能获利,可能亏损,也可能不赔不赚,且这三种情况发生的概率分别为;
方案二:线上直播销售.根据市场调研,利用线上直播销售,到年底可能获利,可能亏损,也可能不赔不赚,且这三种情况发生的概率分别为.
针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.
参考数据:独立性检验临界值表
其中,.
21世纪教育网(www.21cnjy.com)
(北京)股份有限公司中小学教育资源及组卷应用平台
必考点08 列联表与独立性检验
题型一列联表和等高堆积条形图的应用
例题1为了解户籍性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人,男性40人,女性60人,绘制不同群体中倾向选择生育二胎与选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则关于样本下列叙述中正确的是( )
A.是否倾向选择生育二胎与户籍无关
B.是否倾向选择生育二胎与性别有关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
【答案】D
【解析】对于A,城镇户籍中选择生育二胎,农村户籍中选择生育二胎,相差较大,则是否倾向选择生育二胎与户籍有关,A错误;
对于B,男性和女性中均有选择生育二胎,则是否倾向选择生育二胎与性别无关,B错误;
对于C,由于男性和女性中均有选择生育二胎,但样本中男性40人,女性60人,则倾向选择生育二胎的人员中,男性人数与女性人数不同,C错误;
对于D,倾向选择不生育二胎的人员中,农村户籍有人,城镇户籍有人,农村户籍人数少于城镇户籍人数,D正确.故选:D.
例题2假设有两个分类变量X与Y,它们的可能取值分别为和,其2×2列联表为:
Y X
10 18
m 26
则当m取下面何值时,X与Y的关系最弱( )
A.8 B.9 C.14 D.19
【答案】C
【解析】当时,由,解得,所以当时,X与Y的关系最弱.故选:C
【解题技巧提炼】
等高堆积条形图的优劣点
(1)优点:较直观地展示了与的差异性.
(2)劣点:不能给出推断“两个分类变量有关系”犯错误的概率.
题型二由χ2进行独立性检验
例题1(2020·全国卷Ⅲ)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
   锻炼人次 空气质量等级      [0,200] (200,400] (400,600]
1(优) 2 16 25
2(良) 5 10 12
3(轻度污染) 6 7 8
4(中度污染) 7 2 0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400 人次>400
空气质量好
空气质量不好
附:χ2=,
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
【解析】(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如表:
空气质量等级 1 2 3 4
概率的估计值 0.43 0.27 0.21 0.09
(2)一天中到该公园锻炼的平均人次的估计值为
×(100×20+300×35+500×45)=350.
(3)根据所给数据,可得2×2列联表:
人次≤400 人次>400
空气质量好 33 37
空气质量不好 22 8
根据列联表得
χ2=≈5.820.
由于5.820>3.841=x0.050,根据小概率值α=0.05的独立性检验,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
例题2下表是某届某校本科志愿报名时,对其中304名学生进入高校时是否知道想学专业的调查表:
知道想学专业 不知道想学专业 合计
男生 63 117 180
女生 42 82 124
合计 105 199 304
根据表中数据,则下列说法正确的是________.(填序号)
①性别与知道想学专业有关;
②性别与知道想学专业无关;
③女生比男生更易知道所学专业.
【答案】②
【解析】χ2=≈0.041≤2.706=x0.1,所以性别与知道想学专业无关.
【解题技巧提炼】
解决独立性检验问题的基本步骤
(1)根据已知的数据作出列联表;
(2)作出相应的等高堆积条形图,可以利用图形做出相应判断;
(3)求χ2的观测值;
(4)判断可能性:与临界值比较,得出事件有关的可能性大小.    
独立性检验解决实际问题的主要环节
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.
(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
(3)根据检验规则得出推断结论.
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
题型一列联表和等高堆积条形图的应用
1.根据如图所示的等高堆积条形图可知喝酒与患胃病________关系.(填“有”或“没有”)
【答案】有
【解析】从等高堆积条形图上可以明显地看出喝酒患胃病的频率远远大于不喝酒患胃病的频率.
2.为考察A,B两种药物预防某疾病的效果,进行动物试验,分别得到如下等高堆积条形图:
根据图中信息,在下列各项中,说法最佳的一项是(  )
A.药物B的预防效果优于药物A的预防效果
B.药物A的预防效果优于药物B的预防效果
C.药物A,B对该疾病均有显著的预防效果
D.药物A,B对该疾病均没有预防效果
【答案】B
【解析】从等高堆积条形图可以看出,服用药物A后未患病的比例比服用药物B后未患病的比例大得多,预防效果更好.
题型二 利用回归直线方程对总体进行估计
1.(2020·新高考全国卷Ⅰ)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
  SO2 PM2.5   [0,50] (50,150] (150,475]
[0,35] 32 18 4
(35,75] 6 8 12
(75,115] 3 7 10
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
  SO2 PM2.5   [0,150] (150,475]
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?
附:χ2=,
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
【解析】(1)根据抽查数据,该市100天空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为=0.64.
(2)根据抽查数据,可得2×2列联表:
  SO2 PM2.5   [0,150] (150,475]
[0,75] 64 16
(75,115] 10 10
(3)根据(2)的列联表得
χ2=≈7.484.
由于7.484>6.635=x0.010,根据小概率值α=0.010的独立性检验,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.
2.某省进行高中新课程改革,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.
(1)根据以上数据建立一个2×2列联表;
(2)试根据小概率值α=0.01的独立性检验,分析对新课程教学模式的赞同情况与教师年龄是否有关系.
【解析】(1)2×2列联表如下表所示:
教师年龄 对新课程教学模式 合计
赞同 不赞同
老教师 10 10 20
青年教师 24 6 30
合计 34 16 50
(2)零假设为H0:对新课程教学模式的赞同情况与教师年龄无关.
由公式得χ2=≈4.963<6.635=x0.01,
根据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,即认为对新课程教学模式的赞同情况与教师年龄无关.
一、单选题
1.为了调查中学生近视情况,某校名男生中有名近视,名女生中有名近视,在检验这些中学生眼睛近视是否与性别有关时,用什么方法最有说服力( )
A.平均数 B.方差 C.回归分析 D.独立性检验
【答案】D
【解析】分析已知条件,得如下表格.
男生 女生 合计
近视 80 70 150
不近视 70 70 140
合计 150 140 290
根据列联表利用公式可得的值,
再与临界值比较,检验这些中学生眼睛近视是否与性别有关,
故利用独立性检验的方法最有说服力.故选:D.
2.利用独立性检验的方法调查高中性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用2×2列联表,由计算可得,得到的正确结论是( )
0.01 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
A.有99%以上的把握认为“爱好该项运动与性别无关”
B.有99%以上的把握认为“爱好该项运动与性别有关”、
C.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别无关”
【答案】B
【解析】由,可得有以上的把握认为“爱好该项运动与性别有关”.
故选:B.
3.在研究肥胖与高血压的关系时,通过收集数据、整理分析数据得到“高血压与肥胖有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是( )
A.在100个高血压患者中一定有肥胖的人
B.在100个肥胖的人中至少有99人患有高血压
C.在100个高血压患者中可能没有肥胖的人
D.肥胖的人至少有99%的概率患有高血压
【答案】C
【解析】因为在犯错误的概率不超过0.01的前提下认为这个结论是成立的,
得有99%的把握认为“高血压与肥胖有关”,只是结论成立的可能性,与有多少个人患高血压无关,更谈不上概率,A,B,D不正确,C正确.
故选:C
4.利用独立性检验的方法调查高中生性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用列联表,由计算可得,参照下表:得到的正确结论是( )
A.有99%以上的把握认为“爱好该项运动与性别无关”
B.有99%以上的把握认为“爱好该项运动与性别有关”
C.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关"
D.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别无关”
【答案】B
【解析】因为,
所以有99%以上的把握认为“爱好该项运动与性别有关”.故选:B.
5.现在,很多人都喜欢骑“共享单车”,但也有很多市民并不认可.为了调查人们对这种交通方式的认可度,某同学从交通拥堵不严重的城市和交通拥堵严重的城市分别随机调查了20名市民,得到如下列联表:
总计
认可 13 5 18
不认可 7 15 22
总计 20 20 40
附:.
0.1 0.05 0.010 0.005
2.706 3.841 6.635 7.879
根据表中的数据,下列说法中正确的是( )
A.没有95%以上的把握认为“是否认可与城市的拥堵情况有关”
B.有99%以上的把握认为“是否认可与城市的拥堵情况有关”
C.可以在犯错误的概率不超过0.01的前提下认为“是否认可与城市的拥堵情况有关”
D.可以在犯错误的概率不超过0.05的前提下认为“是否认可与城市的拥堵情况有关”
【答案】D
【解析】由题意,根据列联表中的数据,得,
又,
所以可以在犯错误的概率不超过0.05的前提下认为“是否认可与城市的拥堵情况有关”.
故选:D.
6.现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男 女学生意愿的一份样本,制作出如下两个等高堆积条形图:
根据这两幅图中的信息,下列哪个统计结论是不正确的( )
A.样本中的女生数量多于男生数量
B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量
C.样本中的男生偏爱两理一文
D.样本中的女生偏爱两文一理
【答案】D
【解析】由条形图知女生数量多于男生数量,故A正确;
有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故B正确;
男生偏爱两理一文,故C正确;
女生中有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故D错误.故选:D.
7.北京市人民政府新闻办公室召开疫情防控第200场例行新闻发布会时表示不在18~59岁接种年龄段范围的人员,需要等待进一步临床试验数据.近日专家对该年龄段内和该年龄段外的110人进行了临床试验,得到如下2×2列联表:
能接种 不能接种 总计
18~59岁内 40 20 60
18~59岁外 20 30 50
总计 60 50 110
附:,其中.
0.050 0.010 0.001
k 3.841 6.635 10.828
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“能接种与年龄段无关”
B.在犯错误的概率不超过0.1%的前提下,认为“能接种与年龄段有关”
C.有99%以上的把握认为“能接种与年龄段无关”
D.有99%以上的把握认为“能接种与年龄段有关”
【答案】D
【解析】由2×2列联表可得.
因为,
所以在犯错误的概率不超过1%的前提下,认为“能接种与年龄段有关”,即有99%以上的把握认为“能接种与年龄段有关” .故选:D
8.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播 微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男 女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男 女学生总数量可能为( )
附:,其中.
0.1 0.05 0.01 0.001
2.706 3.841 6.635 10.828
A.130 B.190 C.240 D.250
【答案】B
【解析】依题意,设男、女学生的人数都为,则男、女学生的总人数为,建立列联表如下,
喜欢网络课程 不喜欢网络课程 总计
男生
女生
总计
故,由题意可得,
所以,结合选项可知,只有B符合题意.故选:B.
二、多选题
9.某校对“学生性别和喜欢锻炼是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢锻炼的人数占男生总人数的,女生喜欢锻炼的人数占女生总人数的.若至少有95%的把握认为“学生性别和喜欢锻炼有关”,则被调查学生中男生的人数可能为( )
附:
0.050 0.010
3.841 6.635
A.35 B.40 C.45 D.50
【答案】CD
【解析】由题意被调查的男女生人数相同,设男生的人数为:,,由题意可列出列联表:
男生 女生 合计
喜欢锻炼
不喜欢锻炼
合计

由于有的把握认为“学生性别和喜欢锻炼有关”,
所以;
解得:,
则的可能取值为:9、10、11、12、13;
则选项中被调查学生中男生的人数可能45或50.故选:.
10.为了增强学生的身体素质,提高适应自然环境、克服困难的能力,某校在课外活动中新增了一项登山活动,并对“学生喜欢登山和性别是否有关”做了一次调查,得到如图所示的等高条形统计图,则下列说法中正确的有( )
A.被调查的学生中喜欢登山的男生人数比不喜欢登山的女生人数多
B.被调查的男生中喜欢登山的人数比不喜欢登山的人数多
C.是否有99%的把握认为喜欢登山和性别有关不会受到被调查的男女生人数影响
D.是否有99%的把握认为喜欢登山和性别有关会受到被调查的男女生人数影响
【答案】BD
【解析】因为不知道被调查的学生中,男生与女生的人数,所以不能确定喜欢登山的男生人数比不喜欢登山的女生人数多,因此选项A不正确;
由统计图中可以确定被调查的男生中喜欢登山的人数的百分比为,所以被调查的男生中喜欢登山的人数比不喜欢登山的人数多,因此选项B正确;
因为不知道被调查的学生中,男生与女生的人数,所以不能由卡方公式进行计算判断,所以选项C不正确,选项D正确,故选:BD
11.某市为了研究该市空气中的PM2.5浓度和浓度之间的关系,环境监测部门对该市空气质量进行调研,随机抽查了100天空气中的PM2.5浓度和浓度(单位:),得到如下所示的2×2列联表:
PM2.5
64 16
10 10
经计算,则可以推断出( )
附:
0.050 0.010 0.001
3.841 6.635 10.828
A.该市一天空气中PM2.5浓度不超过,且浓度不超过的概率估计值是0.64
B.若2×2列联表中的天数都扩大到原来的10倍,的观测值不会发生变化
C.有超过99%的把握认为该市一天空气中PM2.5浓度与浓度有关
D.在犯错的概率不超过1%的条件下,认为该市一天空气中PM2.5浓度与浓度有关
【答案】ACD
【解析】补充完整列联表如下:
PM2.5 合计
64 16 80
10 10 20
合计 74 26 100
对于A选项,该市一天中,空气中PM2.5浓度不超过,且浓度不超过的概率估计值为,故A正确;
对于B选项,,故B不正确;因为7.4844>6.635,根据临界值表可知,在犯错的概率不超过1%的条件下,即有超过99%的把握认为该市一天空气中PM2.5浓度与浓度有关,故C,D均正确.
故选:ACD.
12.针对当下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”做了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有的把握认为是否喜欢抖音和性别有关,则调查人数中男生有可能( )
附:
A. B. C. D.
【答案】BC
【解析】由题意被调查的男女生人数相同,设男生的人数为:,,由题意可列出列联表:
男生 女生 合计
喜欢锻炼
不喜欢锻炼
合计

由于有的把握认为是否喜欢抖音和性别有关,
所以;
解得:,因为,
故的可能取值为:9、10、11、12、13,即男生的人数可以是45,50,55,60,65.
则选项中被调查学生中男生的人数可能45或60.
故选:BC.
三、填空题
13.如下是一个2×2列联表,则______.
x y 合计
x1 a 35 45
x2 7 b n
合计 m 73 s
【答案】62
【解析】根据2×2列联表可知,
解得,
则,
又由,解得,
则,
故.
故答案为:62
14.某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55个学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30个.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过______.
附:
0.05 0.025 0.010 0.001
3.841 5.024 6.635 10.828
【答案】0.025
【解析】
集中培训 分散培训 合计
一次考过 45 30 75
一次未考过 10 20 30
合计 55 50 105
,故答案为:0.025.
15.如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400名(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层抽样的方法抽取23人,则抽取的男生人数为______.
【答案】15
【解析】根据等高条形图可知: 喜欢徒步的男生人数为,喜欢徒步的女生人数为,
所以喜欢徒步的总人数为,
按分层抽样的方法抽取23人,则抽取的男生人数为人.
故答案为:15
16.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若有的把握认为中学生追星与性别有关,则男生至少有__________人.
参考数据及公式如下:
0.050 0.010 0.001
3.841 6.635 10.828
,.
【答案】30
【解析】设男生人数为,依题意可得列联表如下:
喜欢追星 不喜欢追星 总计
男生
女生
总计
若在犯错误的概率不超过的前提下认为是否喜欢追星和性别有关,
则,由,解得,
由题知应为6的整数倍,
若在犯错误的概率不超过的前提下认为是否喜欢追星和性别有关,
则男生至少有30人,故答案为:30.
四、解答题
17.在一次模拟考试中,某校共有名文科学生参加考试,其中语文考试成绩低于的占,如果成绩不低于的为特别优秀,数学成绩的频率分布直方图如图.
(1)求数学成绩特别优秀的人数及数学成绩的平均分;
(2)如果语文和数学两科都特别优秀的共有人.根据以上数据,完成列联表,并分析是否有的把握认为语文特别优秀的同学,
数学也特别优秀.
语文特别优秀 语文不特别优秀 合计
数学特别优秀
数学不特别优秀
合计
参考数据:①;



【解析】(1)数学成绩特别优秀的概率为,
数学特别优秀的同学有人.
分.
(2)共有名文科学生参加考试,其中语文考试成绩低于的占,语文成绩特别优秀的概率为,语文特别优秀的同学有人,
列联表:
语文特别优秀 语文不特别优秀 合计
数学特别优秀
数学不特别优秀
合计
所以.
所以有的把握认为语文特别优秀的同学,数学也特别优秀.
18.某疫苗研发机构将其生产的某款疫苗在征集的志愿者中进行人体试验,现随机选取100名试验者检验结果并评分(满分为100分),其中评分不低于80分视为强力有效,否则视为效力一般.得到如图所示的频率分布直方图.
(1)求的值,并估计所有试验者的平均得分(同一组中的数据用该组区间的中点值作代表);
(2)将选取的100名试验者的性别与疫苗是否强力有效进行统计,请将下列2×2列联表补充完整,并能否判断在犯错误的概率不超过0.05的前提下认为疫苗的强效力与性别有关
强力有效 效力一般 合计
男性 50
女性 10
合计 100
参考数据:
0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
,其中.
【解析】(1)由,解得:
平均得分为
(2)由己知可得强力有效人数有人,
则列联表为:
强力有效 效力一般 合计
男性 20 30 50
女性 10 40 50
合计 30 70 100
所以能在犯错误的概率不超过的前提下认为疫苗强效力与性别有关.
19.某网站的调查显示,健身操类 跑步类 拉伸运动类等健身项目在大众健康项目中是比较火热的,但是大多数人的健身科学类知识相对缺乏,尤其是在健身指导方面.从某健身房随机抽取200名会员,对其平均每天健身时间进行调查,如下表,健身之前他们的体重情况如柱状图(1)所示,该健身房的教练为他们制订了健身计划,四个月后他们的体重情况如柱状图(2)所示.
平均每天健身时间(分钟)
人数 20 36 44 50 40 10
(1)若这200名会员的平均体重减少不低于,就认为该计划有效,根据上述柱状图,试问:该计划是否有效?(每组数据用该组区间的中点值作代表)
(2)请根据图中数椐填写下面的列联表,试问:是否有99%的把握认为平均每天健身时间与会员健身前的体重有关?
平均每天健身时间低于60分钟 平均每天健身时间不低于60分钟 合计
健身前体重低于
健身前体重不低于 80
合计 200
(3)以这200名会员平均每天健身时间的频率,代替该健身房1名会员平均每天健身时间发生的概率,若在该健身房随机调查12名会员,则其中平均每天的健身时间不低于70分钟的人数最有可能(即概率最大)是多少?
参考公式:,其中.
参考数据:
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
【解析】(1)柱状图(1)中的体重平均值为.
柱状图(2)中的体重平均值为.
因为,所以该计划有效.
(2)列联表如下:
平均每天健身时间低于60分钟 平均每天健身时间不低于60分钟 合计
健身前体重低于 40 20 60
健身前体重不低于 60 80 140
合计 100 100 200
的观测值为.
所以有99%的把握认为平均每天健身时间与会员健身前的体重有关.
(3)由题意可知,该健身房每名会员平均每天的健身时间不低于70分钟的概率为.
设抽取的12人中平均每天的健身时间不低于70分钟的人数为,则,
,,1,2,…,12.


化简得,又,所以,
即12名会员中平均每天的健身时间不低于70分钟的人数最有可能是3人.
20.某学校共有1000名学生参加知识竞赛,其中男生400人,为了解该校学生在知识竞赛中的情况,采取分层抽样随机抽取了100名学生进行调查,分数分布在分之间,根据调查的结果绘制的学生分数频率分布直方图如图所示:
将分数不低于750分的学生称为“高分选手”.
(1)求的值,并估计该校学生分数的平均数、中位数和众数(同一组中的数据用该组区间的中点值作代表);
(2)现采用分层抽样的方式从分数落在,内的两组学生中抽取10人,再从这10人中随机抽取3人,记被抽取的3名学生中属于“高分选手”的学生人数为随机变量,求的分布列及数学期望;
(3)若样本中属于“高分选手”的女生有10人,完成下列列联表,并判断是否有%的把握认为该校学生属于“高分选手”与“性别”有关?
属于“高分选手” 不属于“高分选手” 合计
男生
女生
合计
(参考公式:,期中)
【解析】(1)由题意知,
解得,
样本平均数为,
中位数650,众数600.
(2)由题意,从中抽取7人,从中抽取3人,
随机变量的所有可能取值有0,1,2,3.

所以随机变量的分布列为:
0 1 2 3
随机变量的数学期望.
(3)由题可知,样本中男生40人,女姓60人,属于“高分选手”的25人,其中女姓10人;得出以下列联表;
属于“高分选手” 不属于“高分选手” 合计
男生 15 25 40
女生 10 50 60
合计 25 75 100

所以有%的把握认为该校学生属于“高分选手”与性别有关.
21.直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力贫困地区农民脱贫增收.某贫困地区有统计数据显示,2020年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示.若将销售主播按照年龄分为“年轻人”(岁~岁)和“非年轻人”(岁及以下或者岁及以上)两类,将一周内使用的次数为次或次以上的称为“经常使用直播销售用户”,使用次数为次或不足次的称为“不常使用直播销售用户”,则“经常使用直播销售用户”中有是“年轻人”.
(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为的样本,请你根据图表中的数据,完成列联表,并根据列联表判断是否有的把握认为经常使用网络直播销售与年龄有关?
使用直播销售情况与年龄列联表
年轻人 非年轻人 合计
经常使用直播销售用户
不常使用直播销售用户
合计
(2)某投资公司在2021年年初准备将万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:
方案一:线下销售.根据市场调研,利用传统的线下销售,到年底可能获利,可能亏损,也可能不赔不赚,且这三种情况发生的概率分别为;
方案二:线上直播销售.根据市场调研,利用线上直播销售,到年底可能获利,可能亏损,也可能不赔不赚,且这三种情况发生的概率分别为.
针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.
参考数据:独立性检验临界值表
其中,.
【解析】(1)由图1知,“年轻人”占比为,即有(人),“非年轻人”有(人)
由图2知,“经常使用直播销售用户”占比为,即有(人),“不常使用直播销售用户” 有(人).
“经常使用直播销售用户的年轻人”有中有(人),“经常使用直播销售用户的非年轻人”有(人)
补全的列联表如下:
年轻人 非年轻人 合计
经常使用直播销售用户
不常使用直播销售用户
合计
于是.

即有的把握认为经常使用网络直播销售与年龄有关.
(2)若按方案一,设获利万元,则可取的值为行,的分布列为:
(万元),
若按方案二,设获利万元,则可取的值为,的分布列为:
(万元),

由方案二的方差要比方案一的方差大得多,从稳定性方面看方案一线下销售更稳妥,故选方案一.
21世纪教育网(www.21cnjy.com)
(北京)股份有限公司