【尖子生培优专练】专题21 统计案例综合问题难点专练(原卷版+解析版)

文档属性

名称 【尖子生培优专练】专题21 统计案例综合问题难点专练(原卷版+解析版)
格式 zip
文件大小 3.3MB
资源类型 试卷
版本资源 上教版(2020)
科目 数学
更新时间 2021-11-11 11:21:43

文档简介

中小学教育资源及组卷应用平台
专题21统计案例综合问题难点专练(原卷版)
学校:___________姓名:___________班级:___________考号:___________
一、单选题
1.下列说法中正确的个数是( )
①某校共有女生2021人,用简单随机抽样的方法先剔除21人,再按简单随机抽样的方法抽取为200人,则每个女生被抽到的概率为;【来源:21·世纪·教育·网】
②设有一个回归方程,变量增加1个单位时,平均增加5个单位;
③将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;
④具有线性相关关系的两个变量,的相关系数为r.则越接近于0,,之间的线性相关程度越高;
⑤在一个列联表中,由计算得出,而,则在犯错误的概率不超过0.001的前提下认为这两个变量之间有相关关系【版权所有:21教育】
A.1 B.2 C.3 D.4
2.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,调查样本中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若有的把握认为是否追星和性别有关,则调查样本中男生至少有( )2-1-c-n-j-y
参考数据及公式如下:
A.12人 B.11人 C.10人 D.18人
3.2021年河北省采用“”新高考模式,其中“3”为全国统考科目语文 数学和外语;“1”为考生在物理和历史中选择一门;“2”为考生在思想政治 地理 化学和生物四门中再选择两门.某中学调查了高一年级学生的选科倾向,随机抽取人,其中选考物理的人,选考历史的人,统计各选科人数如下表,则下列说法正确的是( )
选择科目选考类别 思想政治 地理 化学 生物
物理类 80 100 145 115
历史类 50 45 30 35
附:
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
A.物理类的学生中选择政治的比例比历史类的学生中选择政治的比例高
B.物理类的学生中选择地理的比例比历史类的学生中选择地理的比例高
C.没有以上的把握认为选择生物与选考类别有关
D.有以上的把握认为选择生物与选考类别有关
4.如图,5个数据,去掉后,下列说法错误的是( )
( http: / / www.21cnjy.com / )
A.相关系数r变大 B.残差平方和变大
C.R2变大 D.解释变量x与预报变量y的相关性变强
5.下列正确命题的序号有( )
A.若随机变量X~B(100,p),且E(X)=20,则
B.在一次随机试验中,彼此互斥的事件A,B,C,D发生的概率分别为0.2,0.2,0.3,0.3,则A与BCD是互斥事件,也是对立事件21教育名师原创作品
C.在独立性检验中,K2的观测值越小,则认为“这两个分类变量有关”的把握越大
D.由一组样本数据,,…得到回归直线方程,那么直线至少经过,,…中的一个点
6.根据下面的列联表
嗜酒 不嗜酒 总计
患肝病 7775 42 7817
未患肝病 2099 49 2148
总计 9874 91 9965
得到如下几个判断:
①有99.9%的把握认为患肝病与嗜酒有关;
②有99%的把握认为患肝病与嗜酒有关;
③认为患肝病与嗜酒有关的出错的可能为1%;
④认为患肝病与嗜酒有关的出错的可能为10%;
其中正确命题的个数为( )
A.0 B.1 C.2 D.3
7.中国是茶的故乡,也是茶文化的发源地.为了弘扬中国茶文化,某酒店推出特色茶食品“排骨茶”,为了解每壶“排骨茶”中所放茶叶克数与食客的满意率的关系,调查研究发现,可选择函数模型来拟合与的关系,根据以下统计数据:
茶叶克数 1 2 3 4 5
4.34 4.36 4.44 4.45 4.51
可求得关于的非线性经验回归方程为( )
A. B.
C. D.
8.已知一组样本点,其中,根据最小二乘法求得的回归直线方程是,则下列说法正确的是( )
A.若所有样本点都在回归直线方程上,则变量间的相关系数为1
B.至少有一个样本点落在回归直线方程上
C.对所有的(),预测值一定与实际值有误差
D.若的斜率,则变量与正相关
9.某工科院校对,两个专业的男、女生人数进行调查统计,得到以下列联表:
专业类型性别 专业 专业 总计
女 12
男 46 84
总计 50 100
则该工科院校,两个专业中性别与专业有关的把握为( )
A.99.5% B.99% C.99.9% D.95%
10.某大学为了解喜欢看篮球赛是否与性别有关,随机调查了部分学生,在被调查的学生中,男生人数是女生人数的2倍,男生喜欢看篮球赛的人数占男生人数的,女生喜欢看篮球赛的人数占女生人数的.若被调查的男生人数为,且有95%的把握认为喜欢看篮球赛与性别有关,则的最小值为( )21cnjy.com
A.6 B.12 C.18 D.36
二、填空题
11.给出以下四个命题:
①设是空间中的三条直线,若,,则.
②在面积为的的边上任取一点,则的面积大于的概率为.
③已知一个回归直线方程为,则.
④数列为等差数列的充要条件是其通项公式为的一次函数.
其中正确命题的序号为________.(把所有正确命题的序号都填上)
12.和的散点图如图所示,则下列说法中所有正确命题的序号为______.
( http: / / www.21cnjy.com / )
①,是负相关关系;
②,之间不能建立线性回归方程;
③在该相关关系中,若用拟合时的相关指数为,用拟合时的相关指数为,则.
13.回归方程在样本处的残差为________.
14.给出下列结论:
①在回归分析中,可用相关指数的值判断模型的拟合效果,越大,模型的拟合效果越好;
②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;
③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;www.21-cn-jy.com
④甲、乙两人向同一目标同时射击一次,事件:“甲、乙中至少一人击中目标”与事件:“甲、乙都没有击中目标”是相互独立事件.2·1·c·n·j·y
其中结论正确的是______.
15.下列说法:
①线性回归方程必过;
②命题“”的否定是“”
③相关系数越小,表明两个变量相关性越弱;
④在一个列联表中,由计算得,则有的把握认为这两个变量间有关系;
其中正确的说法是__________.(把你认为正确的结论都写在横线上)
本题可参考独立性检验临界值表:
16.给出下列命题:
①命题“,”的非命题是“,”;
②命题“已知x,,若,则或”的逆否命题是真命题;
③命题“若,则函数只有一个零点”的逆命题是真命题;
④命题“为真”是命题“为真”的充分不必要条件;
⑤若n组数据,,的散点都在上,则相关系数;
其中是真命题的有______.(把你认为正确的命题序号都填上)
17.有下列四个命题:
①在回归分析中,残差的平方和越小,模型的拟合效果越好;
②在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;
③若数据,,,的平均数为1,则,,,的平均数为2;
④对分类变量与的随机变量的观测值来说,越小,判断“与有关系”的把握越大;
其中真命题的个数为___________.
18.下表是某饮料专卖店一天卖出奶茶的杯数y与当天气温x(单位:)的对比表,已知表中数据计算得到y关于x的线性回归方程为,则相应于点的残差为________.21·cn·jy·com
气温 5 10 15 20 25
杯数y 26 20 16 14 14
19.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若有的把握认为中学生追星与性别有关,则男生至少有__________人.21世纪教育网版权所有
参考数据及公式如下:
0.050 0.010 0.001
3.841 6.635 10.828
,.
20.有两个分类变量和,其中一组观测值为如下的2×2列联表:
总计
15
50
总计 20 45 65
其中,均为大于5的整数,则__________时,在犯错误的概率不超过的前提下为“和之间有关系”.附:
三、解答题
21.在2020年某高中举行的校数学竞赛中,名考生的免赛成绩统计如图所示.
( http: / / www.21cnjy.com / )
(1)估计这名考生的竞赛平均成绩;
(2)记分以上为优秀,外及以下为非优秀,结合频率分布直方图完成下表,并判断是否有的把握认为该学科竞赛成绩与性别有关?21·世纪*教育网
非优秀 优秀 合计
女生
男生
合计
附:
,其中.
22.目前,新冠病毒引发的肺炎 ( http: / / www.21cnjy.com )疫情在全球肆虐,为了解新冠肺炎传播途径,采取有效防控措施,某医院组织专家统计了该地区500名患者新冠病毒潜伏期的相关信息,数据经过汇总整理得到如图所示的频率分布直方图(频率作为概率).潜伏期不高于平均数的患者,称为“短潜伏着”,潜伏期高于平均数的患者,称为“长潜伏者”.
( http: / / www.21cnjy.com / )
(1)求这500名患者潜伏期的平均数(同一组中的数据用该组区间的中点值作代表),并计算出这500名患者中“长潜伏者”的人数;21教育网
(2)为研究潜伏期与患者年龄的关系,以潜伏期是否高于平均数为标准进行分层抽样,从上述500名患者中抽取300人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有的把握认为潜伏期长短与患者年龄有关:www-2-1-cnjy-com
短潜伏者 长潜伏者 合计
60岁及以上 _________ _________ 160
60岁以下 60 _________ _______
合计 _________ _________ 300
(3)研究发现,有5种药物对新冠病毒有一定的抑制作用,其中有2种特别有效,现在要通过逐一试验直到把这2种特别有效的药物找出来为止,每一次试验花费的费用是600元,设所需要的试验费用为X,求X的分布列与数学期望.
附表及公式:
0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
23.直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力贫困地区农民脱贫增收.某贫困地区有统计数据显示,2020年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示.若将销售主播按照年龄分为“年轻人”(岁~岁)和“非年轻人”(岁及以下或者岁及以上)两类,将一周内使用的次数为次或次以上的称为“经常使用直播销售用户”,使用次数为次或不足次的称为“不常使用直播销售用户”,则“经常使用直播销售用户”中有是“年轻人”.21*cnjy*com
( http: / / www.21cnjy.com / ) ( http: / / www.21cnjy.com / )
(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为的样本,请你根据图表中的数据,完成列联表,并根据列联表判断是否有的把握认为经常使用网络直播销售与年龄有关?
使用直播销售情况与年龄列联表
年轻人 非年轻人 合计
经常使用直播销售用户
不常使用直播销售用户
合计
(2)某投资公司在2021年年初准备将万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:【来源:21cnj*y.co*m】
方案一:线下销售.根据市场调研,利用传统的线下销售,到年底可能获利,可能亏损,也可能不赔不赚,且这三种情况发生的概率分别为;
方案二:线上直播销售.根据市场调研,利用线上直播销售,到年底可能获利,可能亏损,也可能不赔不赚,且这三种情况发生的概率分别为.
针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.
参考数据:独立性检验临界值表
其中,.
24.某种疾病可分为、两种类型.为了解该疾病类型与性别的关系,在某地区随机抽取了患该疾病的病人进行调查,其中女性是男性的倍,男性患型病的人数占男性病人的,女性患型病的人数占女性病人的.【出处:21教育名师】
(1)若在犯错误的概率不超过的前提下认为“所患疾病类型”与“性别”有关,求男性患者至少有多少人?
(2)某药品研发公司欲安排甲乙两个研发团队来研发此疾病的治疗药物.两个团队各至多安排个接种周期进行试验.甲团队研发的药物每次接种后产生抗体的概率为,每人每次接种花费元,每个周期至多接种3次,第一个周期连续次出现抗体则终止本接种周期进入第二个接种周期,否则需依次接种至第一周期结束,再进入第二周期:第二接种周期连续2次出现抗体则终止试验,否则需依次接种至至试验结束:乙团队研发的药物每次接种后产生抗体的概率为,每人每次花费元,每个周期接种次,每个周期必须完成次接种,若一个周期内至少出现次抗体,则该周期结束后终止试验,否则进入第二个接种周期,假设两个研发团队每次接种后产生抗体与否均相互独立.当,时,从两个团队试验的平均花费考虑,试证明该公司选择乙团队进行药品研发的决策是正确的.21*cnjy*com
附:,
0.10 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
25.十三届全国人大四次会议3月11日表决通过了关于国民经济和社会发展第十四个五年规划和2035年远景目标纲要的决议,决定批准这个规划纲要.纲要指出:“加强原创性引领性科技攻关”.某企业集中科研骨干,攻克系列“卡脖子”技术,已成功实现离子注入机全谱系产品国产化,包括中束流 大束流 高能 特种应用及第三代半导体等离子注入机,工艺段覆盖至28,为我国芯片制造产业链补上重要一环,为全球芯片制造企业提供离子注入机一站式解决方案.此次技术的突破可以说为国产芯片的制造做出了重大贡献.该企业使用新技术对某款芯片进行试生产.
(1)在试产初期,该款芯片的批次生产有四道工序,前三道工序的生产互不影响,第四道是检测评估工序,包括智能自动检测与人工抽检.已知该款芯片在生产中,前三道工序的次品率分别为,,.
①求批次芯片的次品率;
②第四道工序中智能自动检测为次品的芯片会被自动淘汰,合格的芯片进入流水线并由工人进行抽查检验.已知批次的芯片智能自动检测显示合格率为,求工人在流水线进行人工抽检时,抽检一个芯片恰为合格品的概率(百分号前保留两位小数).
(2)已知某批次芯片的次品率为,设个芯片中恰有个不合格品的概率为,记的最大值点为,改进生产工艺后批次的芯片的次品率.某手机生产厂商获得批次与批次的芯片,并在某款新型手机上使用.现对使用这款手机的用户回访,对开机速度进行满意度调查.据统计,回访的名用户中,安装批次有部,其中对开机速度满意的有人;安装批次有部,其中对开机速度满意的有人.求,并判断是否有的把握认为芯片质量与用户对开机速度满意度有关?
附:.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://21世纪教育网(www.21cnjy.com)
" 21世纪教育网(www.21cnjy.com)中小学教育资源及组卷应用平台
专题21统计案例综合问题难点专练(解析版)
学校:___________姓名:___________班级:___________考号:___________
一、单选题
1.下列说法中正确的个数是( )
①某校共有女生2021人,用简单随机抽样的方法先剔除21人,再按简单随机抽样的方法抽取为200人,则每个女生被抽到的概率为;21*cnjy*com
②设有一个回归方程,变量增加1个单位时,平均增加5个单位;
③将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;
④具有线性相关关系的两个变量,的相关系数为r.则越接近于0,,之间的线性相关程度越高;
⑤在一个列联表中,由计算得出,而,则在犯错误的概率不超过0.001的前提下认为这两个变量之间有相关关系
A.1 B.2 C.3 D.4
【答案】B
【分析】
利用系统抽样,回归直线的方程,方差,拟合效果,列联表的应用,逐个判断,即可得出答案.
【详解】
解:对于①,某校共有女生2021人,用简单随机抽样的方法先剔除21人,再按系统抽样的方法抽取为200人,古典概率中,每个个体被抽的概率都是一样的,都等于,故①错误;
对于②,一个回归方程,变量增加1个单位时,平均减小5个单位,故②不正确;
对于③:方差的计算公式,
一组数据中的每一个数据都加上或减去同一个常数后,它的平均数也会都加上或减去同一个常数,故方差不变,故③正确;
对于④:设具有线性相关关系的两个变量,的相关系数为.则越接近于0,,之间的线性相关程度越低,故④不正确;
对于⑤,在一个列联表中,由计算得出,而,则在犯错误的概率不超过0.001的前提下认为这两个变量之间有相关关系,故⑤正确.
故选:B.
2.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,调查样本中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若有的把握认为是否追星和性别有关,则调查样本中男生至少有( )
参考数据及公式如下:
A.12人 B.11人 C.10人 D.18人
【答案】A
【分析】
设男生人数为,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论.www-2-1-cnjy-com
【详解】
设男生人数为,依题意可得列联表如下:
喜欢追星 不喜欢追星 总计
男生
女生
总计
若在犯错误的概率不超过的前提下认为是否喜欢追星和性别有关,则,
由,解得,
因为为整数,
所以若在犯错误的概率不超过的前提下认为是否喜欢追星和性别有关,则男生至少有人.
故选:A
3.2021年河北省采用“”新高考模式,其中“3”为全国统考科目语文 数学和外语;“1”为考生在物理和历史中选择一门;“2”为考生在思想政治 地理 化学和生物四门中再选择两门.某中学调查了高一年级学生的选科倾向,随机抽取人,其中选考物理的人,选考历史的人,统计各选科人数如下表,则下列说法正确的是( )
选择科目选考类别 思想政治 地理 化学 生物
物理类 80 100 145 115
历史类 50 45 30 35
附:
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
A.物理类的学生中选择政治的比例比历史类的学生中选择政治的比例高
B.物理类的学生中选择地理的比例比历史类的学生中选择地理的比例高
C.没有以上的把握认为选择生物与选考类别有关
D.有以上的把握认为选择生物与选考类别有关
【答案】C
【分析】
由所给的数据分别计算各比例即可判断选项A、B;列出列联表计算与临界值比较可判断选项C、D,进而可得正确选项.
【详解】
对于A:物理类的学生中选择政治的比例为,
历史类的学生中选择政治的比例为,因为,故选项A不正确;
对于B:物理类的学生中选择地理的比例为,
历史类的学生中选择地理的比例,因为,故选项B不正确;
对于C和D:根据已知数据可得列联表如图:
选生物 不选生物 合计
物理类
历史类
合计
所以,所以没有以上的把握认为选择生物与选考类别有关,故选项C正确,选项D不正确,
故选:C.
4.如图,5个数据,去掉后,下列说法错误的是( )
( http: / / www.21cnjy.com / )
A.相关系数r变大 B.残差平方和变大
C.R2变大 D.解释变量x与预报变量y的相关性变强
【答案】B
【分析】
根据图中的点,计算去掉前后的相关系数、残差平方和、,即可判断各选项的正误.
【详解】
由图,,,则,,,
∴相关系数.
令回归方程,则,
∴,即回归方程为,可得为,,,,,
∴残差平方和,故,
去掉后,
,,则,,,
∴相关系数.
∴,A、D正确;
令回归方程,则,
∴,即回归方程为,可得为,,,,
∴残差平方和,故,
∴,B错误,C正确;
故选:B
5.下列正确命题的序号有( )
A.若随机变量X~B(100,p),且E(X)=20,则
B.在一次随机试验中,彼此互斥的事件A,B,C,D发生的概率分别为0.2,0.2,0.3,0.3,则A与BCD是互斥事件,也是对立事件21教育网
C.在独立性检验中,K2的观测值越小,则认为“这两个分类变量有关”的把握越大
D.由一组样本数据,,…得到回归直线方程,那么直线至少经过,,…中的一个点
【答案】B
【分析】
A根据二项分布的期望、方差求法求,再由求方差;B根据互斥事件、独立事件的性质判断事件与的关系;C由独立性检验K2的意义判断;D理解回归方程与样本数据是拟合关系,而不是过样本点.21·cn·jy·com
【详解】
A:由,而,得,且,所以,故错误;
B:由A,B,C,D彼此互斥,则与为互斥事件,又、,即,易知与也为对立事件,故正确;
C:在独立性检验中,K2的观测值越小,则认为“这两个分类变量有关”的把握越小,故错误;
D:因为回归方程与样本数据是拟合关系,不一定过样本点,所以不一定过样本数据中的点,故错误.
故选:B
6.根据下面的列联表
嗜酒 不嗜酒 总计
患肝病 7775 42 7817
未患肝病 2099 49 2148
总计 9874 91 9965
得到如下几个判断:
①有99.9%的把握认为患肝病与嗜酒有关;
②有99%的把握认为患肝病与嗜酒有关;
③认为患肝病与嗜酒有关的出错的可能为1%;
④认为患肝病与嗜酒有关的出错的可能为10%;
其中正确命题的个数为( )
A.0 B.1 C.2 D.3
【答案】B
【分析】
计算的值,由此确定正确命题的个数.
【详解】

故有99.9%的把握认为患肝病与嗜酒有关①正确,②③④错误.
正确命题的个数为个.
故选:B
7.中国是茶的故乡,也是茶文化的发源地.为了弘扬中国茶文化,某酒店推出特色茶食品“排骨茶”,为了解每壶“排骨茶”中所放茶叶克数与食客的满意率的关系,调查研究发现,可选择函数模型来拟合与的关系,根据以下统计数据:
茶叶克数 1 2 3 4 5
4.34 4.36 4.44 4.45 4.51
可求得关于的非线性经验回归方程为( )
A. B.
C. D.
【答案】A
【分析】
令,由线性回归方程经过样本中心点,利用表中数据求得,代入选项即得.
【详解】
由题表中数据可知,
令,则,
对于A,化简变形可得,等号两边同取对数,可得,将代入可得,所以A正确;
对于B,,
∴,将代入可得,
,故B错误;
对于C,∵,将代入可得,
∴,故C错误;
对于D,∵,将代入可得,
∴,故D错误.
故选:A.
8.已知一组样本点,其中,根据最小二乘法求得的回归直线方程是,则下列说法正确的是( )
A.若所有样本点都在回归直线方程上,则变量间的相关系数为1
B.至少有一个样本点落在回归直线方程上
C.对所有的(),预测值一定与实际值有误差
D.若的斜率,则变量与正相关
【答案】D
【分析】
选项A,相关系数,故A错误;
选项B,样本点可能都不在经验回归直线上,故B错误;
选项C,可以存在;对应的预测值与实际值没有误差,故C错误;
选项D,,样本点的分布从左至右上升,变量与正相关,故D正确.
【详解】
选项A,若所有样本点都在直线上,则变量间的相关系数的绝对值为1 ,相关系数,故A错误;
选项B,经验回归直线必过样本点的中心,但样本点可能都不在经验回归直线上,故B错误;
选项C,样本点可能在直线上,即可以存在;对应的预测值与实际值没有误差,故C错误;
选项D,相关系数与符号相同,若的斜率,则,样本点的分布从左至右上升,变量与正相关,故D正确.21cnjy.com
故选:D
9.某工科院校对,两个专业的男、女生人数进行调查统计,得到以下列联表:
专业类型性别 专业 专业 总计
女 12
男 46 84
总计 50 100
则该工科院校,两个专业中性别与专业有关的把握为( )
A.99.5% B.99% C.99.9% D.95%
【答案】D
【分析】
补全列联表,据此计算,比较临界值,作出结论即可.
【详解】
根据题意,填写列联表,得到以下表格:
专业类型性别 专业 专业 总计
女 12 4 16
男 38 46 84
总计 50 50 100
计算得,且,
所以有95%的把握认为该工科院校,两个专业中性别与专业有关.
故选:D
10.某大学为了解喜欢看篮球赛是否与性别有关,随机调查了部分学生,在被调查的学生中,男生人数是女生人数的2倍,男生喜欢看篮球赛的人数占男生人数的,女生喜欢看篮球赛的人数占女生人数的.若被调查的男生人数为,且有95%的把握认为喜欢看篮球赛与性别有关,则的最小值为( )2·1·c·n·j·y
A.6 B.12 C.18 D.36
【答案】B
【分析】
列出列联表,计算,解不等式,即可求解.
【详解】
由题意得到如下列联表:
喜欢看篮球赛情况性别 喜欢 不喜欢 总计


总计
所以.
因为有95%的把握认为喜欢看篮球赛与性别有关,所以,
即,得.
又,,为整数,所以的最小值为12.
故选:B
二、填空题
11.给出以下四个命题:
①设是空间中的三条直线,若,,则.
②在面积为的的边上任取一点,则的面积大于的概率为.
③已知一个回归直线方程为,则.
④数列为等差数列的充要条件是其通项公式为的一次函数.
其中正确命题的序号为________.(把所有正确命题的序号都填上)
【答案】②③
【分析】
对①,举出反例即可.
对②,根据几何概型的方法确定的面积大于的概率即可.
对③,利用回归直线方程经过样本中心点求解即可.
对④,举出反例即可.
【详解】
对①,长方体中相交于同一顶点的三条棱互相垂直,满足,,但.故①错误.
对②,当的面积大于时,,故②正确.
对③,易得,又,故③正确.
对④,也为等差数列,但通项公式不为的一次函数.故④错误.
故②③正确.
故答案为:②③
【点睛】
本题主要考查了命题真假的判定, ( http: / / www.21cnjy.com )包括空间中的线面位置关系判定、几何概型、回归方程与等差数列等,需要根据各章节的知识点进行证明或者举出反例,属于中档题.
12.和的散点图如图所示,则下列说法中所有正确命题的序号为______.
( http: / / www.21cnjy.com / )
①,是负相关关系;
②,之间不能建立线性回归方程;
③在该相关关系中,若用拟合时的相关指数为,用拟合时的相关指数为,则.
【答案】①③
【分析】
由图可知,散点图呈整体下降趋势,据 ( http: / / www.21cnjy.com )此判断①的正误;由试验数据得到的点将散布在某一直线周围,因此,可以认为关于的回归函数的类型为线性函数,据此判断②的正误;根据散点图比较两个方程的拟合效果,比较那个拟合效果更好,据此判断③;.
【详解】
在散点图中,点散布在从左上角到右下角的区域,因此,是负相关关系,故①正确;
x,,y之间可以建立线性回归方程,但拟合效果不好,故②错误;
由散点图知用拟合比用拟合效果要好,则,故③正确.
故答案为:①③.
【点睛】
本题考查由散点图反应两个 ( http: / / www.21cnjy.com )变量的相关关系,散点图中如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关,属于中档题.
13.回归方程在样本处的残差为________.
【答案】
【分析】
根据残差的定义直接计算即可.
【详解】
由题当x=4时,,

所以回归方程在样本处的残差为.
故答案为:
【点睛】
本题主要考查了残差的概念,考查了运算能力,属于容易题.
14.给出下列结论:
①在回归分析中,可用相关指数的值判断模型的拟合效果,越大,模型的拟合效果越好;
②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;
③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;www.21-cn-jy.com
④甲、乙两人向同一目标同时射击一次,事件:“甲、乙中至少一人击中目标”与事件:“甲、乙都没有击中目标”是相互独立事件.【来源:21·世纪·教育·网】
其中结论正确的是______.
【答案】①③
【分析】
①在回归分析中,根据相关指数越大,模型的拟合效果越好即可判断;②根据离散型随机变量的概念即可判断;③根据样本的标准差是样本数据到平均数的一种平均距离,样本的方差是标准差的平方即可判断;④根据相互独立事件的定义即可判断.
【详解】
解:①用相关指数的值判断模型的拟合效果,越大,模型的拟合效果越好,故①正确;
②某工厂加工的某种钢管,内径与规定的内径尺寸之差是不确定,无法一一列举出来,不是离散型随机变量,故②错误;2-1-c-n-j-y
③样本的标准差是样本数据到平均数的 ( http: / / www.21cnjy.com )一种平均距离,样本的方差是标准差的平方,反映了样本数据的分散程度的大小它们越小,则随机变量偏离均值的平均程度越小,故③正确;【版权所有:21教育】
④甲、乙两人向同一目标同时射击一次,事件:“甲、乙中至少一人击中目标”与事件:“甲、乙都没有击中目标”是对立事件,但不是相互独立事件,因为事件对事件发生有影响.21教育名师原创作品
故答案为:①③.
【点睛】
本题考查了相关系数的意义、离散型随机变量的概念、样本的标准差与方差的概念与应用、对立事件与相互独立事件的区别,是拔高题.
15.下列说法:
①线性回归方程必过;
②命题“”的否定是“”
③相关系数越小,表明两个变量相关性越弱;
④在一个列联表中,由计算得,则有的把握认为这两个变量间有关系;
其中正确的说法是__________.(把你认为正确的结论都写在横线上)
本题可参考独立性检验临界值表:
【答案】①④
【详解】
分析:根据性回归方程,独立性检验,相关关系,以及命题的否定等知识,选出正确的,得到结果.
详解:线性回归方程必过样本中心点,故①正确.
命题“”的否定是“” 故②错误
③相关系数r绝对值越小,表明两个变量相关性越弱,故不正确;
④在一个列联表中,由计算得,则有的把握认为这两个变量间有关系,正确.
故答案为①④.
点睛:本题以命题真假的判断为载体,着重考查了相关系数、命题的否定、独立性检验、回归直线方程等知识点,属于中档题.
16.给出下列命题:
①命题“,”的非命题是“,”;
②命题“已知x,,若,则或”的逆否命题是真命题;
③命题“若,则函数只有一个零点”的逆命题是真命题;
④命题“为真”是命题“为真”的充分不必要条件;
⑤若n组数据,,的散点都在上,则相关系数;
其中是真命题的有______.(把你认为正确的命题序号都填上)
【答案】②④⑤
【分析】
根据四种命题的相互转化即可判断②、 ( http: / / www.21cnjy.com )③真假判断.利用特称命题的否定,即可判断①,利用充分必要条件的定义即可判断④,利用相关系数的概念即可判断⑤.
【详解】
①命题“,”的非命题是“,”;不正确
②命题“已知x,,若,则或”的逆否命题是“已知x,,若且,则”正确
③命题“若,则函数只有一个零点”的逆命题是“若函数只有一个零点,则”有可能是零,不正确
④命题“为真”是命题“为真”的必要不充分条件,正确
⑤若n组数据,…,的散点都在上,则x,y成负相关相关系数,正确
故答案为:②④⑤
【点睛】
本题主要考查了四大命题的转化,以及特称命题的否定,考查了充分必要条件的判断,以及相关系数的判断,属于综合类题目,属于中档题.
17.有下列四个命题:
①在回归分析中,残差的平方和越小,模型的拟合效果越好;
②在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;
③若数据,,,的平均数为1,则,,,的平均数为2;
④对分类变量与的随机变量的观测值来说,越小,判断“与有关系”的把握越大;
其中真命题的个数为___________.
【答案】3
【分析】
根据残差的意义,可判定①②真命题;根据数据的平均值的计算公式,可得③真命题;根据独立性检验中观测值的几何意义,可判定④为假命题.
【详解】
根据残差的意义知,残差的平方和越小,模型的拟合效果越好,所以①为真命题;由残差的意义知,残差点比较均匀地落在水平带状区域内,说明选用的模型比较合适,所以②为真命题;若数据的平均数为1,则的平均数也扩大原来的2倍,即平均数为2,所以③为真命题;对分类变量与的随机变量的观测值来说,应该越大,判断与有关系的把握越大,所以④为假命题.
故答案为:3.
18.下表是某饮料专卖店一天卖出奶茶的杯数y与当天气温x(单位:)的对比表,已知表中数据计算得到y关于x的线性回归方程为,则相应于点的残差为________.
气温 5 10 15 20 25
杯数y 26 20 16 14 14
【答案】.
【分析】
由表中数据计算出,,代入线性回归方程求出,进而可求得结果.
【详解】
,,
代入线性回归方程得,解得,
则线性回归方程为.
所以,则相应于点的残差为.
故答案为:.
19.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若有的把握认为中学生追星与性别有关,则男生至少有__________人.
参考数据及公式如下:
0.050 0.010 0.001
3.841 6.635 10.828
,.
【答案】30
【分析】
设男生人数为,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论.
【详解】
设男生人数为,依题意可得列联表如下:
喜欢追星 不喜欢追星 总计
男生
女生
总计
若在犯错误的概率不超过的前提下认为是否喜欢追星和性别有关,
则,
由,解得,
由题知应为6的整数倍,
若在犯错误的概率不超过的前提下认为是否喜欢追星和性别有关,
则男生至少有30人,
故答案为:30.
20.有两个分类变量和,其中一组观测值为如下的2×2列联表:
总计
15
50
总计 20 45 65
其中,均为大于5的整数,则__________时,在犯错误的概率不超过的前提下为“和之间有关系”.附:
【答案】9
【分析】
由题意,计算,列出不等式求出的取值范围,再根据题意求得的值.
【详解】
解:由题意知:,
则,
解得:或,
因为:且,,
综上得:,,
所以:.
故答案为:9.
【点睛】
本题考查独立性检验的应用问题.
三、解答题
21.在2020年某高中举行的校数学竞赛中,名考生的免赛成绩统计如图所示.
( http: / / www.21cnjy.com / )
(1)估计这名考生的竞赛平均成绩;
(2)记分以上为优秀,外及以下为非优秀,结合频率分布直方图完成下表,并判断是否有的把握认为该学科竞赛成绩与性别有关?
非优秀 优秀 合计
女生
男生
合计
附:
,其中.
【答案】(1);(2)列联表答案见解析,有的把握认为该学科竞赛成绩与性别有关.
【分析】
(1)利用频率分布直方图,由每一组数据的中点值乘以该组的频率,进行求和即得;
(2)根据条件填写列联表,并由表中数据求出,然后对照临界值判断即可.
【详解】
(1)由题意,得:
中间值
频率

名老考生的竞赛平均成绩为.
(2)由题意分以上的频率为,
频数为,分及以下为.
由此填写列联表如下:
非优秀 优秀 合计
女生
男生
合计
由表中数据可得,,
有的把握认为该学科竞赛成绩与性别有关.
22.目前,新冠病毒引发的肺炎疫 ( http: / / www.21cnjy.com )情在全球肆虐,为了解新冠肺炎传播途径,采取有效防控措施,某医院组织专家统计了该地区500名患者新冠病毒潜伏期的相关信息,数据经过汇总整理得到如图所示的频率分布直方图(频率作为概率).潜伏期不高于平均数的患者,称为“短潜伏着”,潜伏期高于平均数的患者,称为“长潜伏者”.
( http: / / www.21cnjy.com / )
(1)求这500名患者潜伏期的平均数(同一组中的数据用该组区间的中点值作代表),并计算出这500名患者中“长潜伏者”的人数;
(2)为研究潜伏期与患者年龄的关系,以潜伏期是否高于平均数为标准进行分层抽样,从上述500名患者中抽取300人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有的把握认为潜伏期长短与患者年龄有关:
短潜伏者 长潜伏者 合计
60岁及以上 _________ _________ 160
60岁以下 60 _________ _______
合计 _________ _________ 300
(3)研究发现,有5种药物对新冠病毒有一定的抑制作用,其中有2种特别有效,现在要通过逐一试验直到把这2种特别有效的药物找出来为止,每一次试验花费的费用是600元,设所需要的试验费用为X,求X的分布列与数学期望.
附表及公式:
0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
【答案】(1) 这500名患者潜伏期的平均数为6,这500名患者中“长潜伏者”的人数为250;(2)列联表见解析,有的把握认为潜伏期长短与患者年龄有关;(3)分布列见解析,.【来源:21cnj*y.co*m】
【分析】
(1)利用各区间的中点值乘该区间的面积相加可得这500名患者潜伏期的平均数,由频率分布表确定样本中“长潜伏者”的频率,由此计算这500名患者中“长潜伏者”的人数;(2)补充列联表,并根据列联表数据计算的值,查表确定临界值,半径两者大小,确定是否接受假设,(3)由条件确定随机变量X的所有可能取值,并求取各值的概率,由此可得X的分布列,再根据期望的定义求的值.
【详解】
(1) 这500名患者潜伏期的平均数可表示为:,
∴ 这500名患者潜伏期的平均数为6,
“长潜伏者”即潜伏期时间不 ( http: / / www.21cnjy.com )低于6天的人,由频率分布直方图可得这500名患者中“长潜伏者”的频率为(0.18+0.03+0.03+0.01)×2,即0.5,
∴ 这500名患者中“长潜伏者”的人数为250,
(2)∵ 500名患者中“长潜伏者”的人数为250,
由分层抽样性质可得,抽取300人中“长潜伏者”有人,即150人,所以“短潜伏者”有150人,又300人中60岁以上的人有160人,故60岁以下的人有140人,
∴ 列联表为:
短潜伏者 长潜伏者 合计
60岁及以上 90 70 160
60岁以下 60 80 140
合计 150 150 300
∴ ,
又查表可得,5.357>5.024
∴ 有的把握认为潜伏期长短与患者年龄有关;
(3)由已知可得随机变量X的可能取值有1200,1800,2400,
,,,
∴X的分布列为:
X 1200 1800 2400
P
∴ .
23.直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力贫困地区农民脱贫增收.某贫困地区有统计数据显示,2020年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示.若将销售主播按照年龄分为“年轻人”(岁~岁)和“非年轻人”(岁及以下或者岁及以上)两类,将一周内使用的次数为次或次以上的称为“经常使用直播销售用户”,使用次数为次或不足次的称为“不常使用直播销售用户”,则“经常使用直播销售用户”中有是“年轻人”.21世纪教育网版权所有
( http: / / www.21cnjy.com / ) ( http: / / www.21cnjy.com / )
(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为的样本,请你根据图表中的数据,完成列联表,并根据列联表判断是否有的把握认为经常使用网络直播销售与年龄有关?
使用直播销售情况与年龄列联表
年轻人 非年轻人 合计
经常使用直播销售用户
不常使用直播销售用户
合计
(2)某投资公司在2021年年初准备将万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:【出处:21教育名师】
方案一:线下销售.根据市场调研,利用传统的线下销售,到年底可能获利,可能亏损,也可能不赔不赚,且这三种情况发生的概率分别为;
方案二:线上直播销售.根据市场调研,利用线上直播销售,到年底可能获利,可能亏损,也可能不赔不赚,且这三种情况发生的概率分别为.
针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.
参考数据:独立性检验临界值表
其中,.
【答案】(1)列联表见解析,有的把握认为经常使用网络直播销售与年龄有关;(2)选方案一,理由见解析.
【分析】
(1)由图1知,“年轻人”有人,“非年轻人”有人,由图2知,“经常使用直播销售用户”有人,“不常使用直播销售用户” 有人,即可补全的列联表,计算,判断是否有的把握认为经常使用网络直播销售与年龄有关.
(2)按方案一,设获利万元,列的分布列,并计算期望和;按方案二,设获利万元列,列的分布列,并计算期望和,比较两个方案的期望和方程,从而选取方案.
【详解】
(1)由图1知,“年轻人”占比为,即有(人),“非年轻人”有(人)
由图2知,“经常使用直播销售用户”占比为,即有(人),“不常使用直播销售用户” 有(人).
“经常使用直播销售用户的年轻人”有中有(人),“经常使用直播销售用户的非年轻人”有(人)
补全的列联表如下:
年轻人 非年轻人 合计
经常使用直播销售用户
不常使用直播销售用户
合计
于是.

即有的把握认为经常使用网络直播销售与年龄有关.
(2)若按方案一,设获利万元,则可取的值为行,的分布列为:
(万元),
若按方案二,设获利万元,则可取的值为,的分布列为:
(万元),

由方案二的方差要比方案一的方差大得多,从稳定性方面看方案一线下销售更稳妥,故选方案一.
【点睛】
方法点睛:本题考查列联表的应用以及离散型随机变量的分布列和数学期望,求离散型随机变量的分布列,首先要根据具体情况确定的取值情况,然后利用排列,组合,概率知识求出取各个值时对应的概率,对应服从某种特殊分布的随机变量,其分布列可以直接应用公式给出,考查学生逻辑推理能力与计算能力,属于中档题.
24.某种疾病可分为、两种类型.为了解该疾病类型与性别的关系,在某地区随机抽取了患该疾病的病人进行调查,其中女性是男性的倍,男性患型病的人数占男性病人的,女性患型病的人数占女性病人的.21*cnjy*com
(1)若在犯错误的概率不超过的前提下认为“所患疾病类型”与“性别”有关,求男性患者至少有多少人?
(2)某药品研发公司欲安排甲乙两个研发团队来研发此疾病的治疗药物.两个团队各至多安排个接种周期进行试验.甲团队研发的药物每次接种后产生抗体的概率为,每人每次接种花费元,每个周期至多接种3次,第一个周期连续次出现抗体则终止本接种周期进入第二个接种周期,否则需依次接种至第一周期结束,再进入第二周期:第二接种周期连续2次出现抗体则终止试验,否则需依次接种至至试验结束:乙团队研发的药物每次接种后产生抗体的概率为,每人每次花费元,每个周期接种次,每个周期必须完成次接种,若一个周期内至少出现次抗体,则该周期结束后终止试验,否则进入第二个接种周期,假设两个研发团队每次接种后产生抗体与否均相互独立.当,时,从两个团队试验的平均花费考虑,试证明该公司选择乙团队进行药品研发的决策是正确的.
附:,
0.10 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【答案】(1);(2)该公司选择乙团队进行药品研发的决策是正确的.
【分析】
(1)设男性患者有人,则女性患者有人,列出列联表,计算出的观测值,根据题意可得出关于的不等式,结合、可求得整数的最小值;
(2)设甲研发团队试验总花费为元,设乙研发团队试验总花费为元,计算出、,利用函数的单调性可得出,由此可得出结论.
【详解】
(1)设男性患者有人,则女性患者有人,列联表如下:
Ⅰ型病 Ⅱ型病 合计
男 z

合计
要使在犯错误的概率不超过的前提下认为“所患疾病类型”与“性别”有关,
则,解得,
∵,,的最小整数值为,因此,男性患者至少有人;
(2)设甲研发团队试验总花费为元,则的可能取值为、、,
,,


在递减,,
设乙研发团队试验总花费为元,则的可能取值为、,
,,

设,,
函数在递减,,恒成立,
所以,该公司选择乙团队进行药品研发的决策是正确的.
【点睛】
方法点睛:求离散型随机变量均值与方差的基本方法:
(1)已知随机变量的分布列求它的均值、方差,按定义求解.
(2)已知随机变量的均值、方差,求的线性函数的均值、方差,可直接用的均值、方差的性质求解;
(3)如果所给随机变量是服从常用的分布(如两点分布、二项分布等),利用它们的均值、方差公式求解.
25.十三届全国人大四次会议3月11日表决通过了关于国民经济和社会发展第十四个五年规划和2035年远景目标纲要的决议,决定批准这个规划纲要.纲要指出:“加强原创性引领性科技攻关”.某企业集中科研骨干,攻克系列“卡脖子”技术,已成功实现离子注入机全谱系产品国产化,包括中束流 大束流 高能 特种应用及第三代半导体等离子注入机,工艺段覆盖至28,为我国芯片制造产业链补上重要一环,为全球芯片制造企业提供离子注入机一站式解决方案.此次技术的突破可以说为国产芯片的制造做出了重大贡献.该企业使用新技术对某款芯片进行试生产.21·世纪*教育网
(1)在试产初期,该款芯片的批次生产有四道工序,前三道工序的生产互不影响,第四道是检测评估工序,包括智能自动检测与人工抽检.已知该款芯片在生产中,前三道工序的次品率分别为,,.
①求批次芯片的次品率;
②第四道工序中智能自动检测为次品的芯片会被自动淘汰,合格的芯片进入流水线并由工人进行抽查检验.已知批次的芯片智能自动检测显示合格率为,求工人在流水线进行人工抽检时,抽检一个芯片恰为合格品的概率(百分号前保留两位小数).
(2)已知某批次芯片的次品率为,设个芯片中恰有个不合格品的概率为,记的最大值点为,改进生产工艺后批次的芯片的次品率.某手机生产厂商获得批次与批次的芯片,并在某款新型手机上使用.现对使用这款手机的用户回访,对开机速度进行满意度调查.据统计,回访的名用户中,安装批次有部,其中对开机速度满意的有人;安装批次有部,其中对开机速度满意的有人.求,并判断是否有的把握认为芯片质量与用户对开机速度满意度有关?
附:.
【答案】(1)①;②;(2),有的把握认为芯片质量与用户对开机速度满意度有关.
【分析】
(1)①利用对立事件、相互独立事件概率乘法公式求得所求的次品率.
②根据条件概率计算公式,计算出所求概率.
(2)先求得的表达式,利用导数求得,填写列联表,计算,由此作出判断.
【详解】
(1)①Ⅰ批次芯片的次品率为
.
②设批次Ⅰ的芯片智能自动检测合格为事件,人工抽检合格为事件,
由己知得,,
则工人在流水线进行人工抽检时,抽检一个芯片恰为合格品为事件,
.
(2)个芯片中恰有个不合格的概率.
因此,
令,得.
当时,;当时,.
所以的最大值点为.
由(1)可知,,,故批次芯片的次品率低于批次,故批次的芯片质量优于批次.
由数据可建立2×2列联表如下:(单位:人)
开机速度满意度 芯片批次 合计
I J
不满意 12 3 15
满意 28 57 85
合计 40 60 100
根据列联表得
.
因此,有的把握认为芯片质量与用户对开机速度满意度有关.
【点睛】
求解最值点有关的题目,是利用导数研究函数的单调性,由此来求得最值点.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://21世纪教育网(www.21cnjy.com)
" 21世纪教育网(www.21cnjy.com)
同课章节目录