第9章 统计 综合复习训练(含解析)2023——2024学年高中数学苏教版(2019)选择性必修第二册

文档属性

名称 第9章 统计 综合复习训练(含解析)2023——2024学年高中数学苏教版(2019)选择性必修第二册
格式 docx
文件大小 878.6KB
资源类型 教案
版本资源 苏教版(2019)
科目 数学
更新时间 2024-04-16 21:01:02

图片预览

文档简介

第9章 统计 综合复习训练
学校:___________姓名:___________班级:___________考号:___________
一、单选题
1.已知变量与之间的一组数据如表:
2 4 5 6 8
30 50 70
若与的线性回归方程为,则的值为( )
A.60 B.70 C.100 D.110
2.设变量和变量的样本相关系数为,变量和变量的样本相关系数为,且,,则( )
A.和之间呈正线性相关关系,且和的线性相关程度强于和的线性相关程度
B.和之间呈负线性相关关系,且和的线性相关程度强于和的线性相关程度
C.和之间呈负线性相关关系,且和的线性相关程度弱于和的线性相关程度
D.和之间呈正线性相关关系,且和的线性相关程度弱于和的线性相关程度
3.有以下几组的统计数据:要使剩下的数据具有较强的相关关系,应去掉的一组数据是( )
A. B. C. D.
4.用最小二乘法得到一组数据的线性回归方程为,若,则等于( )
A.53 B.65 C.13 D.11
5.某合金冶炼厂2023年1月至4月合金的煅烧量(单位:百万吨)如表所示,已知煅烧量与月份之间有较好的线性相关关系,其线性回归方程是,则( )
月份 1 2 3 4
煅烧量/百万吨 6.5 7 8 8.5
A.7.8 B.9.25 C.12.75 D.5.75
6.假设有两个分类变量与,它们的可能取值分别为和,其列联表为:
10 18
26
则当取下面何值时,与的关系最弱( )
A.8 B.9
C.14 D.19
7.在一元线性回归模型中,设变量和变量的样本相关系数为,决定系数为,变量和变量的样本相关系数为,决定系数为,且,,则( )
A.和之间呈正线性相关关系,且
B.和之间呈负线性相关关系,且
C.和之间呈负线性相关关系,且
D.和之间呈正线性相关关系,且
8.为研究高中生的性别与是否喜欢数学课程之间的关系,运用列联表进行检验,经计算,参考下表,则认为“性别与喜欢数学有关”犯错误的概率不超过( )
0.100 0.050 0.025 0.010 0.001
2.706 3.841 5.024 6.635 10.828
A. B. C. D.
二、多选题
9.下列说法中,正确的是( )
A.设有一个经验回归方程为,变量增加1个单位时,平均增加2个单位
B.已知随机变量,若,则
C.两组样本数据和.若已知且,则
D.已知一系列样本点的经验回归方程为,若样本点与的残差相等,则
10.某厂近几年陆续购买了几台 A 型机床,该型机床已投入生产的时间x(单位:年)与当年所需要支出的维修费用y(单位:万元)有如下统计资料:
x 2 3 4 5 6
y 2.2 3.8 5.5 6.5 7
根据表中的数据可得到经验回归方程为. 则( )
A.
B.y与x的样本相关系数
C.表中维修费用的第60百分位数为6
D.该型机床已投入生产的时间为 10年时,当年所需要支出的维修费用一定是12.38万元
11.下列说法中正确的是( )
A.公式中的和不具有线性相关关系
B.已知变量的对数据为,则回归直线可以不经过点,其中
C.若相关系数的绝对值越接近1,则两个变量的线性相关性越强
D.对于变量与的统计量来说,越大,判断“与有关系”的把握越大
12.下表是某地从2019年至2023年能源消费总量近似值(单位:千万吨标准煤)的数据表:
年份 2019 2020 2021 2022 2023
年份代号 1 2 3 4 5
能源消费总量近似值(单位:千万吨标准煤) 44.2 44.6 46.2 47.8 50.8
以为解释变量,为响应变量,若以为回归方程,则决定系数0.9298,若以为回归方程,则,则下面结论中正确的有( )
A.变量和变量的样本相关系数为正数
B.比的拟合效果好
C.由回归方程可准确预测2024年的能源消费总量
D.
三、填空题
13.收集数据,利用列联表,分析学习成绩好与上课注意力集中是否有关时,提出的零假设为:学习成绩好与上课注意力集中 (填:有关或无关)
14.①线性回归方程必过;②独立性检验的统计假设是各事件之间相互独立③相关系数越小,表明两个变量相关性越弱;④在一个列联表中,由计算得,则有的把握认为这两个变量间有关系;其中正确的说法是 .(把你认为正确的结论都写在横线上)
15.由样本数据(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5)得到的回归方程为y=x+a,已知,,则实数a的值为 .
16.某公司为了增加某商品的销售利润,调查了该商品投入的广告费用:(单位:万元)与销售利润(单位:万元)的相关数据,如表所示,根据表中数据,得到经验回归方程,则下列命题正确的是 (请填写序号)
广告费用 3 4 5 8
销售利润 4 5 7 8
①; ②;③直线必过点;④直线必过点
四、解答题
17.某校对学生课外活动进行调查,结果整理成下表,用你所学过的知识进行分析,能否有的把握认为“喜欢体育还是文娱与性别有关系”?
体育 文娱 合计
男生 21 23 44
女生 6 29 35
合计 27 52 79
附:
0.05 0.025 0.010 0.005
3.841 5.024 6.635 7.879
18.2023年9月23日至10月8日,第19届亚洲运动会在中国杭州举行,这是我国继北京、广州亚运会后第三次举办亚运会,浙江某市一调研机构为了解本市市民对“亚运会”相关知识的认知程度,举办了一次“亚运会”网络知识竞赛,满分100分,并规定成绩不低于80分的市民获得优秀奖,成绩不低于70分的市民则认为成绩达标,现从参加了竞赛的男、女市民中各抽取了100名市民的竞赛成绩作为样本进行数据分析,对男市民的竞赛成绩进行统计后,得到如下图所示的成绩频率分布直方图.
(1)试分别估计男市民成绩达标以及获得优秀奖的概率;
(2)已知样本中女市民获得优秀奖的人数占比为5%,则是否有99.9%的把握认为该市市民在这次知识竞赛中获得优秀奖与性别有关?
附:,其中.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
19.甲公司推出一种新产品,为了解某地区消费者对新产品的满意度,从中随机调查了1000名消费者,得到下表:
满意 不满意
男 440 60
女 460 40
(1)能否有的把握认为消费者对新产品的满意度与性别有关;
(2)若用频率估计概率,从该地区消费者中随机选取3人,用X表示不满意的人数,求X的分布列与数学期望.
附:,.
0.1 0.05 0.01
k 2.706 3.841 6.635
20.某校为了让学生有一个良好的学习环境,特制定学生满意度调查表,调查表分值满分为100分.工作人员从中随机抽取了100份调查表将其分值作为样本进行统计,作出频率分布直方图如图.
(1)估计此次满意度调查所得的平均分值(同一组中的数据用该组区间的中点值为代表);
(2)在选取的100位学生中,男女生人数相同,规定分值在(1)中的以上为满意,低于为不满意,据统计有32位男生满意.据此判断是否有的把握认为“学生满意度与性别有关”?
(3)在(2)的条件下,学校从满意度分值低于分的学生中抽取部分进行座谈,先用分层抽样的方式选出8位学生,再从中随机抽取2人,求恰好抽到男女生各一人的概率.
附:,其中.
21.为了检测某种抗病毒疫苗的免疫效果,需要进行动物与人体试验,研究人员将疫苗注射到200只小白鼠体内,一段时间后测量小白鼠的某项指标值,按[0,20),[20,40),[40,60),[60,80)分组,绘制频率分布直方图如图所示,试验发现小白鼠体内产生抗体的共有160只,其中该项指标值不小于60的有110只.假设小白鼠注射疫苗后是否产生抗体相互独立.
(1)填写下面的列联表(单位:只),并根据列联表及的独立性检验,判断能否认为注射疫苗后小白鼠产生抗体与指标值不小于60有关.
抗体 指标值 合计
小于60 不小于60
有抗体
没有抗体
合计
(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40只小白鼠进行第二次注射疫苗,结果又有20只小白鼠产生抗体.用频率估计概率,记一只小白鼠注射2次疫苗后产生抗体的概率p,并以p作为人体注射2次疫苗后产生抗体的概率,进行人体接种试验,记n个人注射2次疫苗后产生抗体的数量为随机变量X.试验后统计数据显示,当时,取最大值,求参加人体接种试验的人数n.
参考公式:(其中为样本容量)
参考数据:
0.50 0.40 0.25 0.15 0.100 0.050 0.025
0.455 0.708 1.323 2.072 2.706 3.841 5.024
第1页 共4页 ◎ 第2页 共4页
第1页 共4页 ◎ 第2页 共4页
参考答案:
1.C
【分析】首先求出,根据回归直线方程必过样本中心点,即可求出,再由平均数公式计算可得.
【详解】因为,又与的线性回归方程为,
所以,即,解得.
故选:C.
2.D
【分析】根据对变量间的相关系数的意义和辨析即可得出结果.
【详解】由线性相关系数,可知变量与之间呈负线性相关关系,
由线性相关系数,可知变量与之间呈正线性相关关系,
又,
所以变量与的线性相关程度比变量与的线性相关程度强.
故选:D.
3.C
【分析】在坐标系中画出五个点,结果除去之外,其余的点都在一条线附近,去掉这个点以后剩下的数据更具有相关关系.
【详解】,在坐标系中画出五个点,
结果除去之外,其余的点都在一条线附近,
去掉这个点以后剩下的数据更具有相关关系,
故选:C
4.B
【分析】根据题意,由条件可得,由线性回归方程必过样本中心,代入计算,即可得到结果.
【详解】因为,则,代入可得,
所以.
故选:B
5.D
【分析】求出样本点中心,代入求解即可.
【详解】,,

故选:D.
6.C
【分析】利用分类变量的相关性进行计算求解.
【详解】在两个分类变量的列联表中,当的值越小时,认为两个分类变量有关的可能性越小.
令,得,解得,
所以当时,与的关系最弱,故A,B,D错误.
故选:C.
7.A
【分析】根据相关系数的正负判断正负相关关系,根据相关系数绝对值的大小判断决定系数的大小.
【详解】因为,,故和之间呈正线性相关关系,和之间呈负线性相关关系,
故BD错误,
而,故,故A正确,C错误,
故选:A.
8.B
【分析】根据与临界值的大小关系确定犯错误的概率的范围.
【详解】因为,结合表格可知,所以认为“性别与喜欢数学有关”犯错误的概率不超过0.010.
故选:B.
9.BC
【分析】根据回归方程可判定A,根据正态分布可判定B,根据数据的平均数可判定C,根据回归方程及残差的概念可判定D.
【详解】若有一个经验回归方程,随着的增大,会减小,A错误;
曲线关于对称,因为,所以,
所以,B正确;
因为,
所以,
故,C正确;
经验回归方程为,且样本点与的残差相等,
则,所以,D错误.
故选:BC.
10.ABC
【分析】对A,计算出样本中心,代入方程计算出,对B,根据相关系数的概念可判断,对C,根据百分位数的定义求解,对D,根据回归分析概念判断.
【详解】根据题意可得,,,
所以样本中心点为,
对于A,将样本中心点代入回归方程,可得,故A正确;
对于B,由表中数据可得随着增大而增大,与正相关,所以相关系数,故B正确;
对于C,维修费用从小到大依次为,第60百分位数为,故C正确;
对于D,根据回归分析的概念,机床投入生产的时间为 10年时,所需要支出的维修费用大概是12.38万元,故D错误.
故选:ABC.
11.ACD
【分析】A选项,根据线性相关的定义进行判断;B选项,回归直线一定经过样本中心点;C选项,由相关系数的性质进行判断;D选项,根据的定义判断D正确.
【详解】A选,公式中的和为二次函数关系,故不具有线性相关关系,A正确;
B选项,回归直线一定经过样本中心点,即,B错误;
C选项,若相关系数的绝对值越接近1,则两个变量的线性相关性越强,C正确;
D选项,对于变量与的统计量来说,越大,判断“与有关系”的把握越大,D正确.
故选:ACD
12.ABD
【分析】随着变量的增加,变量也在增加可判断A选项;根据决定系数越接近1,拟合效果越好可判断B选项;由经验回归方程的定义可判断C选项;由经验回归方程必过样本中心点可判断D选项.
【详解】对于A选项:随着变量的增加,变量也在增加,故变量和变量成正相关,即样本相关系数为正数,正确;
对于B选项:因为,故比的拟合效果好,正确;
对于C选项:回归方程可预测2024年的能源消费总量,不可准确预测,错误;
对于D选项:由回归方程必过样本中心点,可知,正确.
故选:ABD.
13.无关
【分析】根据题意,由零假设的定义,即可得到结果.
【详解】零假设等价于两个变量相互独立,
所以此题中的零假设为:学习成绩好与上课注意力集中无关.
故答案为:无关
14.①②④
【分析】根据相关的概念逐一判断即可.
【详解】①线性回归方程过样本点中心,正确;
②独立性检验的统计假设是各事件之间相互独立,正确;
③相关系数的绝对值越小,表明两个变量相关性越弱,错误;
④④在一个列联表中,由计算得,则有的把握认为这两个变量间有关系,正确.
故答案为:①②④
15.2.4
【详解】由题表得x=2.4,=4.4,代入回归方程,解得a=2.4.
16.①②④
【分析】
根据平均数的求解可判断④③,利用最小二乘法求解系数即可判断①②.
【详解】
由表中数据可得,,,
则样本中心为,故直线必过点,故④正确,③错误,
,,
则,①②正确.
故答案为:①②④.
17.有的把握认为喜欢体育还是喜欢文娱与性别有关系
【分析】根据题意求,并与临界值对比分析.
【详解】零假设:喜欢体育还是喜欢文娱与性别没有关系.
因为,
则,
因为当成立时,的概率约为0.005,
根据极小概率可知:零假设不成立,
所以我们有的把握认为喜欢体育还是喜欢文娱与性别有关系.
18.(1)
(2)有99.9%的把握认为该市市民在这次知识竞赛中获得优秀奖与性别有关.
【分析】(1)由频率分布直方图计算频率的公式分别计算即可得解;
(2)根据条件列出列联表,由的计算公式计算可判断结果.
【详解】(1)设取得的成绩为,
男市民成绩打标的概率为,
男市民获得优秀奖的概率为:.
(2)因为女市民获得优秀奖的人数占比为5%,所以女市民优秀人数为:人,男市民优秀人数为人,
列联表如图:
分类 优秀 不优秀 总计
女市民 5 95 100
男市民 25 75 100
总计 30 170 200

所以有99.9%的把握认为该市市民在这次知识竞赛中获得优秀奖与性别有关.
19.(1)有的把握认为消费者对新产品的满意度与性别有关
(2)分布列见解析,期望
【分析】(1)先利用所给数据表完善列联表,再利用公式求出,利用临界值表进行判定;
(2)先求出不满意的概率为,由二项分布求解概率,列表得到分布列,利用期望公式进行求解
【详解】(1)补全列联表如图所示:
满意 不满意 总计
男 440 60 500
女 460 40 500
总计 900 100 1000

故有的把握认为消费者对新产品的满意度与性别有关.
(2)由题知,从该地区的消费者中随机抽取1人,不满意的概率为,的所有可能取值为0,1,2,3,
且.

所以的分布列为:
0 1 2 3
所以.
20.(1)
(2)有的把握认为“学生满意度与性别有关”
(3)
【分析】(1)利用频率分布直方图平均数的求法求解即可;
(2)利用(1)的结论及给定信息得到列联表,再计算的观测值,与临界值表比对作答即可得解;
(3)求出8位业主中男女人数,利用列举法及古典概率公式即可得解.
【详解】(1)根据频率分布直方图知,,
所以此次满意度调查中物业所得的平均分值为分.
(2)由(1)及已知得列联表如下:
不满意 满意 总计
男 18 32 50
女 30 20 50
总计 48 52 100
则的观测值为:,
所以有的把握认为“业主满意度与性别有关”.
(3)由(2)知满意度分值低于70分的业主有48位,其中男士18位,女士30位,
用分层抽样方式抽取8位业主,其中男士3位,女士5位,
记男士为a,b,c,记女士为1,2,3,4,5,
从中随机抽取两位为监督员事件为:,
共计28个基本事件,
其中抽到男女各一人有,共15个基本事件,
所以恰好抽到男女各一人为监督员的概率为.
21.(1)列联表见解析,能认为注射疫苗后小白鼠产生抗体与指标值不小于60有关
(2)109或110
【分析】(1)根据给定的频率分布直方图,计算并填写二列联,计算的观测值作答.
(2)利用独立事件、对立事件的概率求出,再用二项分布的概率公式列出不等式,求解作答.
【详解】(1)由频率分布直方图知,在内有(只),
在内有(只),在内有(只),
在内有(只),在内有(只),
依题意,有抗体且指标值小于60的有50只,而指标值小于60的小白鼠共有(只),
于是指标值小于60且没有抗体的小白鼠有20只,同理指标值不小于60且没有抗体的小白鼠有20只,
所以列联表如下:
抗体 指标值 合计
小于60 不小于60
有抗体 50 110 160
没有抗体 20 20 40
合计 70 130 200
零假设:注射疫苗后小白鼠产生抗体与指标值不小于60无关联,
由列联表中数据,得,
由的独立性检验,推断不成立,即认为注射疫苗后小白鼠产生抗体与指标值不小于60有关,此推断犯错误的概率不大于0.05.
(2)令事件“小白鼠第一次注射疫苗产生抗体”,事件小白鼠第二次注射疫苗产生抗体”,
事件“小白鼠注射2次疫苗后产生抗体”,记事件发生的概率分别为,
则,于是,
因此一只小白鼠注射2次疫苗后产生抗体的概率,
依题意,随机变量,则,
因为当时,取最大值,即最大,
于是,即
亦即,整理得,解得,
而是整数,因此或,
所以接受接种试验的人数为109或110.
答案第1页,共2页
答案第1页,共2页