2023-2024学年高二数学-第8章: 成对数据的统计分析全章综合测试(人教A版2019选择性必修第三册)
参考答案与试题解析
一.选择题(共8小题,满分40分,每小题5分)
1.(5分)(22-23高一下·河南省直辖县级单位·期末)下列两个变量具有相关关系的是( )
A.正方形的边长与面积 B.匀速行驶的车辆的行驶距离与时间
C.人的身高与视力 D.人的身高与体重
【解题思路】
根据函数关系及相关关系的定义判断即可.
【解答过程】对于A,由正方形的面积与边长的公式知,即正方形的边长与面积具有函数关系,故A错误;
对于B,匀速行驶车辆的行驶距离与时间为,其中为匀速行驶的速度,
即匀速行驶的车辆的行驶距离与时间具有函数关系,故B错误;
对于C,人的身高与视力无任何关系,故C错误;
对于D,人的身高会影响体重,但不是唯一因素,即人的身高与体重具有相关关系,故D正确.
故选:D.
2.(5分)(2024高三·天津·专题练习)下列说法中正确的个数为( )个
①互斥事件一定是对立事件.
②在回归直线方程中,当解释变量每增加一个单位时,预报变量增加个单位;
③两个随机变量的线性相关性越强,相关系数的绝对值越接近于;
④在回归分析模型中,若相关指数越大,则残差平方和越小,模型的拟合效果越好.
A. B. C. D.
【解题思路】根据对立事件与互斥事件定义、回归直线中回归系数的含义、相关系数的计算公式和回归分析的基本思想依次判断各个选项即可.
【解答过程】对于①,对立事件一定是互斥事件,但互斥事件未必是对立事件,①错误;
对于②,根据回归直线方程中回归系数的含义可知:当解释变量每增加一个单位时,预报变量增加个单位,②正确;
对于③,根据相关系数的计算公式可知:相关系数的绝对值越接近,两个变量的线性相关性越强,③正确;
对于④,根据回归分析的基本思想可知:相关指数越大,残差平方和越小,模型的拟合度越高,④正确.
故选:C.
3.(5分)(22-23高二下·福建福州·期中)下面的等高条形图可以说明的问题是( )
A.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的
B.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同
C.此等高条形图看不出两种手术有什么不同的地方
D.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有的把握
【解题思路】根据等高条形图判断即可得正确答案.
【解答过程】由等高条形图可知“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的频率不同,
所以“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有的把握,所以选项D正确,
故选:D.
4.(5分)(2024·四川成都·二模)对变量有观测数据,得散点图1;对变量有观测数据,得散点图2.表示变量之间的线性相关系数,表示变量之间的线性相关系数,则下列说法正确的是( )
A.变量与呈现正相关,且 B.变量与呈现负相关,且
C.变量与呈现正相关,且 D.变量与呈现负相关,且
【解题思路】利用散点图,结合相关系数的知识可得答案.
【解答过程】由题意可知,变量的散点图中,随的增大而增大,所以变量与呈现正相关;
再分别观察两个散点图,图比图点更加集中,相关性更好,所以线性相关系数.
故选:C.
5.(5分)(22-23高二下·广西河池·期末)假设有两个变量x与y的列联表如下表:
a b
c d
对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【解题思路】计算每个选项中的值,最大的即对同一样本能说明x与y有关系的可能性最大.
【解答过程】对于A, ,
对于B,,
对于C,,
对于D,
显然B中最大,该组数据能说明x与y有关系的可能性最大,
故选:B.
6.(5分)(23-24高三上·广东佛山·阶段练习)据一组样本数据,…,,求得经验回归方程为,且.现发现这组样本数据中有两个样本点和误差较大,去除后重新求得的经验回归直线的斜率为1.2,则( )
A.去除两个误差较大的样本点后,的估计值增加速度变快
B.去除两个误差较大的样本点后,重新求得的回归方程一定过点
C.去除两个误差较大的样本点后,重新求得的回归方程为
D.去除两个误差较大的样本点后,相应于样本点的残差为0.05
【解题思路】对A:比较原线性回归方程的斜率和新回归方程的斜率,即可求解;
对B:由新的样本可求解;
对C:由线性回归方程的性质,即可求解;
对D:利用残差公式,即可求解.
【解答过程】对A,因为,所以去除两个误差较大的样本点后的估计值增加速度变慢,故A错误;
对B,当时,,设去掉两个误差较大的样本点后,横坐标的平均值为,纵坐标的平均值为,
则,,故B错误;
对C,因为去除两个误差较大的样本点后,重新求得回归直线的斜率为1.2,
所以,解得,
所以去除两个误差较大的样本点后的经验回归方程为,故C正确;
对D,因为,所以,故D错误.
故选:C.
7.(5分)(2024·天津河西·一模)随着居民家庭收入的不断提高,人们对居住条件的改善的需求也在逐渐升温.某城市统计了最近5个月的房屋交易量,如下表所示:
时间 1 2 3 4 5
交易量(万套) 0.8 1.0 1.2 1.5
若与满足一元线性回归模型,且经验回归方程为,则下列说法错误的是( )
A.根据表中数据可知,变量与正相关
B.经验回归方程中
C.可以预测时房屋交易量约为(万套)
D.时,残差为
【解题思路】首先求出、,根据回归方程必过样本中心点求出参数,从而得到回归方程,再一一判断即可.
【解答过程】对于B,依题意,,
所以,解得,所以,故B正确;
对于A,因为经验回归方程,,
所以变量与正相关,故A正确;
对于C,当时,,
所以可以预测时房屋交易量约为(万套),故C正确;
对于D,当时,,
所以时,残差为,故D错误.
故选:D.
8.(5分)(2023高二·全国·专题练习)针对时下的“航天热”,某校团委对“是否喜欢航天与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢航天的人数占男生人数的,女生中喜欢航天的人数占女生人数的,若依据 的独立性检验,认为是否喜欢航天与学生性别有关,则被调查的学生中男生的人数不可能为( )
A.25 B.45 C.60 D.75
【解题思路】
利用独立性检验卡方的计算公式求得,从而得到关于的不等式,由此得解.
【解答过程】
依题意,设男生的人数为,根据题意列出列联表如下所示:
是否喜欢航天 性别 合计
男生 女生
喜欢航天
不喜欢航天
合计
则,
∵依据的独立性检验,认为是否喜欢航天与学生性别有关,
∴,即,得,
∴,又,∴结合选项知B、C、D都可以.
故选:A.
二.多选题(共4小题,满分20分,每小题5分)
9.(5分)(23-24高二上·辽宁沈阳·期末)对两个变量和进行回归分析,则下列结论正确的为()
A.回归直线至少会经过其中一个样本点
B.残差平方和越小的模型,拟合的效果越好
C.建立两个回归模型,模型的相关系数,模型的相关系数,则模型的拟合度更好
D.以模型去拟合某组数据时,为了求出回归方程,设,将其变换后得到线性方程
,则的值分别为
【解题思路】根据回归方程、残差、相关系数、非线性回归等知识对选项进行分析,从而确定正确答案.
【解答过程】A选项,回归直线不一定经过样本点,A选项错误.
B选项,残差平方和越小的模型,拟合的效果越好,B选项正确.
C选项,,所以模型的拟合度更好,C选项错误.
D选项,由,得,D选项正确.
故选:BD.
10.(5分)(23-24高二下·辽宁大连·阶段练习)某同学将收集到的六组数据制作成散点图如图所示,并得到其回归直线的方程为,计算其相关系数为.经过分析确定点F为“离群点”,把它去掉后,再利用剩下的5组数据计算得到回归直线的方程为,相关系数为,以下结论中,正确的是( )
A. B.
C. D.
【解题思路】去掉“离群点”F后,两变量的线性相关性更强,由此可判断A,B的正误;回归直线必经过样本中心点,可求,判断C的正误;回归直线必经过样本中心点,可求,判断D的正误.
【解答过程】由题图可知两变量呈现正相关,故,,故A正确;
去掉“离群点”F后,两变量的线性相关性更强,故,故B错误;
设去掉“离群点”F前的样本中心点为,
由散点图可得:,,
可知回归直线必经过样本中心点,
所以,故C正确;
设去掉“离群点”F后的样本中心点为,
由散点图可得:,,
回归直线必经过样本中心点,
所以,得,即,故D正确,
故选:ACD.
11.(5分)(2024·甘肃陇南·一模)某厂近几年陆续购买了几台 A 型机床,该型机床已投入生产的时间x(单位:年)与当年所需要支出的维修费用y(单位:万元)有如下统计资料:
x 2 3 4 5 6
y 2.2 3.8 5.5 6.5 7
根据表中的数据可得到经验回归方程为. 则( )
A.
B.y与x的样本相关系数
C.表中维修费用的第60百分位数为6
D.该型机床已投入生产的时间为 10年时,当年所需要支出的维修费用一定是12.38万元
【解题思路】对A,计算出样本中心,代入方程计算出,对B,根据相关系数的概念可判断,对C,根据百分位数的定义求解,对D,根据回归分析概念判断.
【解答过程】根据题意可得,,,
所以样本中心点为,
对于A,将样本中心点代入回归方程,可得,故A正确;
对于B,由表中数据可得随着增大而增大,与正相关,所以相关系数,故B正确;
对于C,维修费用从小到大依次为,第60百分位数为,故C正确;
对于D,根据回归分析的概念,机床投入生产的时间为 10年时,所需要支出的维修费用大概是12.38万元,故D错误.
故选:ABC.
12.(5分)(2024·广东湛江·一模)某养老院有110名老人,经过一年的跟踪调查,过去的一年中他们是否患过某流行疾病和性别的相关数据如下表所示:
性别 是否患过某流行疾病 合计
患过该疾病 未患过该疾病
男 b
女 c
合计 80 110
下列说法正确的有( )
参考公式:,其中.
附表:
0.1 0.05 0.025 0.01 0.001
2.706 3.841 5.024 6.635 10.828
A.
B.
C.根据小概率值的独立性检验,认为是否患过该流行疾病与性别有关联
D.根据小概率值的独立性检验,没有充分的证据推断是否患过该流行疾病与性别有关联
【解题思路】利用表格中提供数据可判断A正确,代入计算可判断B正确,结合附表参考数据可得C正确,D错误.
【解答过程】根据列联表中的数据可求得;
对于A,代入计算可得,正确;
对于B,经计算可得,可得B正确;
对于CD,结合附表数值以及独立性检验的实际意义,可认为根据小概率值的独立性检验,认为是否患过该流行疾病与性别有关联,即C正确,D错误;
故选:ABC.
三.填空题(共4小题,满分20分,每小题5分)
13.(5分)(23-24高二上·全国·课后作业)下面是列联表:
总计
总计
则 .
【解题思路】
根据列联表中的数据求得,进而求得.
【解答过程】
,
所以.
故答案为:.
14.(5分)(2024高三·全国·专题练习)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:
天数x 1 2 3 4 5 6 7
一次最多答对题数y 12 15 16 18 21 24 27
参考数据:,,,,,
相关系数
由表中数据可知该老师每天一次最多答对题数y与天数x之间是正相关,其相关系数 0.99 (结果保留两位小数).
【解题思路】
根据题意,由相关系数的计算公式代入计算,即可得到结果.
【解答过程】由题意
.
故答案为:.
15.(5分)(23-24高二下·吉林长春·阶段练习)随着我国对新冠肺炎疫情的控制,全国消费市场逐渐回暖,2023年7月28日长春市民翘首以盼的大型商城华润万象城正式营业,商场统计的客流盘x(单位:万人)与销售额y(单位:百万元)的数据表有部分污损,如下所示:
x 10 8 6 4 2
y 68 41 31 15
已知x与y有线性相关关系,且经验回归方程为,则表中污损数据应为 50 .
【解题思路】根据回归方程必经过点计算可得.
【解答过程】设污损数据为,则,,
由 .
故答案为:50.
16.(5分)(2023·四川绵阳·模拟预测)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,调查样本中女生人数是男生人数的,男生追星人数占男生人数的,女生追星的人数占女生人数的,若有95%的把握认为是否追星和性别有关,则调查样本中男生至少有 12 人.
参考数据及公式如下:
0.050 0.010 0.001
3.841 6.635 10.828
【解题思路】设男生人数为,得到列联表,根据题意得到,列出不等式,求得的取值范围,结合,为整数,即可求解.
【解答过程】设男生人数为,依题 意可得列联表如下:
喜欢追星 不喜欢追星 总计
男生
女生
总计
若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,则,
由,解得,因为,为整数,
所以若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,
则男生至少有12人.
故答案为:.
四.解答题(共6小题,满分70分)
17.(10分)(23-24高二下·江苏·课前预习)判断以下两个变量之间是否具有相关关系?
(1)正方形的面积与其周长之间的关系;
(2)父母的身高与子女的身高之间的关系;
(3)学生的学号与身高;
(4)汽车匀速行驶时的路程与时间的关系.
【解题思路】根据题意,由相关关系的定义,逐一判断,即可得到结果.
【解答过程】(1)设正方形的面积为S,周长为C,则,
即正方形的面积由其周长唯一确定,因此二者是函数关系,不是相关关系;
(2)子女身高除了与父母的身高有一定关系外,还与其他因素有关,
即子女的身高并不是由其父母的身高唯一确定的,因此二者之间具有相关关系;
(3)学生的学号与身高之间没有任何关系,不具有相关关系;
(4)若汽车匀速行驶时的速度为v,行驶的路程为s,时间为t,则有,
因此当速度一定时,路程由时间唯一确定,二者之间具有函数关系,而不是相关关系.
18.(12分)(23-24高二·全国·课后作业)某省即将实行新高考,不再实行文理分科.某校为了研究数学成绩优秀是否对选择物理有影响,对该校2020级的1000名学生进行调查,收集到相关数据如下:
根据以上提供的信息,完成2×2列联表,并完善等高条形图.
选物理 不选物理 总计
数学成绩优秀
数学成绩不优秀 260
总计 600 1000
【解题思路】根据列联表所给的数据和等高条形图即可完成列联表,进而完善等高条形图即可.
【解答过程】根据题意填写列联表如下:
选物理 不选物理 总计
数学成绩优秀 420 320 740
数学成绩不优秀 180 80 260
总计 600 400 1000
等高条形图,如图所示:
19.(12分)(23-24高二下·陕西·阶段练习)某地经过多年的环境治理,已将荒山改造成了绿水青山,为估计一林区某种树木的总材积量.随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截面积 0.04 0.06 0.04 0.03 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 9.40 3.9
并计算得.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01).
附:相关系数,.
【解题思路】(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)代入题给相关系数公式去计算即可求得样本的相关系数值;
【解答过程】(1)样本中10棵这种树木的根部横截面积的平均值,
样本中10棵这种树木的材积量的平均值,
据此可估计该林区这种树木平均一棵的根部横截面积为,
平均一棵的材积量为.
(2)(2)
,
则.
20.(12分)(2024·内蒙古包头·二模)某企业拟对某产品进行科技升级,根据市场调研与模拟,得到科技升级投入(万元)与科技升级直接收益(万元)的数据统计如下:
序号 1 2 3 4 5 6 7
2 3 4 6 8 10 13
13 22 31 42 50 56 58
根据表格中的数据,建立了与的两个回归模型:模型①:模型②:.
(1)根据下列表格中的数据,比较模型① ②的相关指数的大小,并选择拟合精度更高 更可靠的模型;
(2)根据(1)选择的模型,预测对该产品科技升级的投入为100万元时的直接收益.
回归模型 模型① 模型②
回归方程
182.4 79.2
(附:刻画回归效果的相关指数越大,模型的拟合效果越好)
【解题思路】(1)利用相关指数的定义判断相关性即可.
(2)将给定数值代入拟合模型中求预测值即可.
【解答过程】(1)由表格中的数据,,
所以,模型①的相关指数小于模型②的相关指数,
即模型②的拟合效果精度更高 更可靠.
(2)当万元时,科技升级直接收益的预测值为:
(万元).
21.(12分)(2024高三·全国·专题练习)近年来,随着国家对新能源汽车产业的支持,很多国产新能源汽车迅速崛起,其因颜值高、动力充沛、提速快、空间大、用车成本低等特点得到民众的追捧,但是充电难成为影响新能源汽车销量的主要原因,国家为了加快新能源汽车的普及程度,在全国范围内逐步增建充电桩.某地区2019-2023年的充电桩数量及新能源汽车的年销量如表所示:
年份 2019 2020 2021 2022 2023
充电桩数量x/万台 1 3 5 7 9
新能源汽车年销量y/万辆 25 37 48 58 72
(1)已知可用线性回归模型拟合y与x的关系,请用相关系数加以说明(结果精确到0.001);
(2)求y关于x的线性回归方程,预测当该地区充电桩数量为24万台时,新能源汽车的年销量是多少万辆?
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.
参考数据:,,,.
【解题思路】(1)先求出,,结合题意中的公式计算即可求解;
(2)根据最小二乘法计算,进而求出,写出线性回归方程.将代入方程即可下结论.
【解答过程】(1)由题知,,
又,,,
所以,
因为y与x的相关系数近似为0.999,非常接近1,
所以y与x的线性相关程度很高,可以用线性回归模型拟合y与x的关系.
(2),,
所以y关于x的线性回归方程为.
当时,,
故当充电桩数量为24万台时,该地区新能源汽车的年销量为157.25万辆.
22.(12分)(2024·四川泸州·二模)某校为了让学生有一个良好的学习环境,特制定学生满意度调查表,调查表分值满分为100分.工作人员从中随机抽取了100份调查表将其分值作为样本进行统计,作出频率分布直方图如图.
(1)估计此次满意度调查所得的平均分值(同一组中的数据用该组区间的中点值为代表);
(2)在选取的100位学生中,男女生人数相同,规定分值在(1)中的以上为满意,低于为不满意,据统计
有32位男生满意.据此判断是否有的把握认为“学生满意度与性别有关”?
(3)在(2)的条件下,学校从满意度分值低于分的学生中抽取部分进行座谈,先用分层抽样的方式选出8位学生,再从中随机抽取2人,求恰好抽到男女生各一人的概率.
附:,其中.
【解题思路】(1)利用频率分布直方图平均数的求法求解即可;
(2)利用(1)的结论及给定信息得到列联表,再计算的观测值,与临界值表比对作答即可得解;
(3)求出8位业主中男女人数,利用列举法及古典概率公式即可得解.
【解答过程】(1)根据频率分布直方图知,,
所以此次满意度调查中物业所得的平均分值为分.
(2)由(1)及已知得列联表如下:
不满意 满意 总计
男 18 32 50
女 30 20 50
总计 48 52 100
则的观测值为:,
所以有的把握认为“业主满意度与性别有关”.
(3)由(2)知满意度分值低于70分的业主有48位,其中男士18位,女士30位,
用分层抽样方式抽取8位业主,其中男士3位,女士5位,
记男士为a,b,c,记女士为1,2,3,4,5,
从中随机抽取两位为监督员事件为:,
共计28个基本事件,
其中抽到男女各一人有,共15个基本事件,
所以恰好抽到男女各一人为监督员的概率为.2023-2024学年高二数学-第8章: 成对数据的统计分析全章综合测试(人教A版2019选择性必修第三册)
考试时间:120分钟;满分:150分
姓名:___________班级:___________考号:___________
考卷信息:
本卷试题共22题,单选8题,多选4题,填空4题,解答6题,满分150分,限时120分钟,本卷题型针对性
较高,覆盖面广,选题有深度,可衡量学生掌握本章内容的具体情况!
一.选择题(共8小题,满分40分,每小题5分)
1.(5分)(22-23高一下·河南省直辖县级单位·期末)下列两个变量具有相关关系的是( )
A.正方形的边长与面积 B.匀速行驶的车辆的行驶距离与时间
C.人的身高与视力 D.人的身高与体重
2.(5分)(2024高三·天津·专题练习)下列说法中正确的个数为( )个
①互斥事件一定是对立事件.
②在回归直线方程中,当解释变量每增加一个单位时,预报变量增加个单位;
③两个随机变量的线性相关性越强,相关系数的绝对值越接近于;
④在回归分析模型中,若相关指数越大,则残差平方和越小,模型的拟合效果越好.
A. B. C. D.
3.(5分)(22-23高二下·福建福州·期中)下面的等高条形图可以说明的问题是( )
A.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的
B.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同
C.此等高条形图看不出两种手术有什么不同的地方
D.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有的把握
4.(5分)(2024·四川成都·二模)对变量有观测数据,得散点图1;对变量有观测数
据,得散点图2.表示变量之间的线性相关系数,表示变量之间的线性相关系数,则下列说法正确的是( )
A.变量与呈现正相关,且 B.变量与呈现负相关,且
C.变量与呈现正相关,且 D.变量与呈现负相关,且
5.(5分)(22-23高二下·广西河池·期末)假设有两个变量x与y的列联表如下表:
a b
c d
对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
6.(5分)(23-24高三上·广东佛山·阶段练习)据一组样本数据,…,,求得经验回归方程为,且.现发现这组样本数据中有两个样本点和误差较大,去除后重新求得的经验回归直线的斜率为1.2,则( )
A.去除两个误差较大的样本点后,的估计值增加速度变快
B.去除两个误差较大的样本点后,重新求得的回归方程一定过点
C.去除两个误差较大的样本点后,重新求得的回归方程为
D.去除两个误差较大的样本点后,相应于样本点的残差为0.05
7.(5分)(2024·天津河西·一模)随着居民家庭收入的不断提高,人们对居住条件的改善的需求也在逐渐升温.某城市统计了最近5个月的房屋交易量,如下表所示:
时间 1 2 3 4 5
交易量(万套) 0.8 1.0 1.2 1.5
若与满足一元线性回归模型,且经验回归方程为,则下列说法错误的是( )
A.根据表中数据可知,变量与正相关
B.经验回归方程中
C.可以预测时房屋交易量约为(万套)
D.时,残差为
8.(5分)(2023高二·全国·专题练习)针对时下的“航天热”,某校团委对“是否喜欢航天与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢航天的人数占男生人数的,女生中喜欢航天的人数占女生人数的,若依据 的独立性检验,认为是否喜欢航天与学生性别有关,则被调查的学生中男生的人数不可能为( )
A.25 B.45 C.60 D.75
二.多选题(共4小题,满分20分,每小题5分)
9.(5分)(23-24高二上·辽宁沈阳·期末)对两个变量和进行回归分析,则下列结论正确的为()
A.回归直线至少会经过其中一个样本点
B.残差平方和越小的模型,拟合的效果越好
C.建立两个回归模型,模型的相关系数,模型的相关系数,则模型的拟合度更好
D.以模型去拟合某组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别为
10.(5分)(23-24高二下·辽宁大连·阶段练习)某同学将收集到的六组数据制作成散点图如图所示,并得到其回归直线的方程为,计算其相关系数为.经过分析确定点F为“离群点”,把它去掉后,再利用剩下的5组数据计算得到回归直线的方程为,相关系数为,以下结论中,正确的是( )
A. B.
C. D.
11.(5分)(2024·甘肃陇南·一模)某厂近几年陆续购买了几台 A 型机床,该型机床已投入生产的时间x(单位:年)与当年所需要支出的维修费用y(单位:万元)有如下统计资料:
x 2 3 4 5 6
y 2.2 3.8 5.5 6.5 7
根据表中的数据可得到经验回归方程为. 则( )
A.
B.y与x的样本相关系数
C.表中维修费用的第60百分位数为6
D.该型机床已投入生产的时间为 10年时,当年所需要支出的维修费用一定是12.38万元
12.(5分)(2024·广东湛江·一模)某养老院有110名老人,经过一年的跟踪调查,过去的一年中他们是否患过某流行疾病和性别的相关数据如下表所示:
性别 是否患过某流行疾病 合计
患过该疾病 未患过该疾病
男 b
女 c
合计 80 110
下列说法正确的有( )
参考公式:,其中.
附表:
0.1 0.05 0.025 0.01 0.001
2.706 3.841 5.024 6.635 10.828
A.
B.
C.根据小概率值的独立性检验,认为是否患过该流行疾病与性别有关联
D.根据小概率值的独立性检验,没有充分的证据推断是否患过该流行疾病与性别有关联
三.填空题(共4小题,满分20分,每小题5分)
13.(5分)(23-24高二上·全国·课后作业)下面是列联表:
总计
总计
则 .
14.(5分)(2024高三·全国·专题练习)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:
天数x 1 2 3 4 5 6 7
一次最多答对题数y 12 15 16 18 21 24 27
参考数据:,,,,,
相关系数
由表中数据可知该老师每天一次最多答对题数y与天数x之间是正相关,其相关系数 (结果保留两位小数).
15.(5分)(23-24高二下·吉林长春·阶段练习)随着我国对新冠肺炎疫情的控制,全国消费市场逐渐回暖,2023年7月28日长春市民翘首以盼的大型商城华润万象城正式营业,商场统计的客流盘x(单位:万人)与销售额y(单位:百万元)的数据表有部分污损,如下所示:
x 10 8 6 4 2
y 68 41 31 15
已知x与y有线性相关关系,且经验回归方程为,则表中污损数据应为 .
16.(5分)(2023·四川绵阳·模拟预测)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,调查样本中女生人数是男生人数的,男生追星人数占男生人数的,女生追星的人数占女生人数的,若有95%的把握认为是否追星和性别有关,则调查样本中男生至少有 人.
参考数据及公式如下:
0.050 0.010 0.001
3.841 6.635 10.828
四.解答题(共6小题,满分70分)
17.(10分)(23-24高二下·江苏·课前预习)判断以下两个变量之间是否具有相关关系?
(1)正方形的面积与其周长之间的关系;
(2)父母的身高与子女的身高之间的关系;
(3)学生的学号与身高;
(4)汽车匀速行驶时的路程与时间的关系.
18.(12分)(23-24高二·全国·课后作业)某省即将实行新高考,不再实行文理分科.某校为了研究数学成绩优秀是否对选择物理有影响,对该校2020级的1000名学生进行调查,收集到相关数据如下:
根据以上提供的信息,完成2×2列联表,并完善等高条形图.
选物理 不选物理 总计
数学成绩优秀
数学成绩不优秀 260
总计 600 1000
19.(12分)(23-24高二下·陕西·阶段练习)某地经过多年的环境治理,已将荒山改造成了绿水青山,为估计一林区某种树木的总材积量.随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截面积 0.04 0.06 0.04 0.03 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 9.40 3.9
并计算得.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01).
附:相关系数,.
20.(12分)(2024·内蒙古包头·二模)某企业拟对某产品进行科技升级,根据市场调研与模拟,得到科技
升级投入(万元)与科技升级直接收益(万元)的数据统计如下:
序号 1 2 3 4 5 6 7
2 3 4 6 8 10 13
13 22 31 42 50 56 58
根据表格中的数据,建立了与的两个回归模型:模型①:模型②:.
(1)根据下列表格中的数据,比较模型① ②的相关指数的大小,并选择拟合精度更高 更可靠的模型;
(2)根据(1)选择的模型,预测对该产品科技升级的投入为100万元时的直接收益.
回归模型 模型① 模型②
回归方程
182.4 79.2
(附:刻画回归效果的相关指数越大,模型的拟合效果越好)
21.(12分)(2024高三·全国·专题练习)近年来,随着国家对新能源汽车产业的支持,很多国产新能源汽车迅速崛起,其因颜值高、动力充沛、提速快、空间大、用车成本低等特点得到民众的追捧,但是充电难成为影响新能源汽车销量的主要原因,国家为了加快新能源汽车的普及程度,在全国范围内逐步增建充电桩.某地区2019-2023年的充电桩数量及新能源汽车的年销量如表所示:
年份 2019 2020 2021 2022 2023
充电桩数量x/万台 1 3 5 7 9
新能源汽车年销量y/万辆 25 37 48 58 72
(1)已知可用线性回归模型拟合y与x的关系,请用相关系数加以说明(结果精确到0.001);
(2)求y关于x的线性回归方程,预测当该地区充电桩数量为24万台时,新能源汽车的年销量是多少万辆?
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.
参考数据:,,,.
22.(12分)(2024·四川泸州·二模)某校为了让学生有一个良好的学习环境,特制定学生满意度调查表,调查表分值满分为100分.工作人员从中随机抽取了100份调查表将其分值作为样本进行统计,作出频率分布直方图如图.
(1)估计此次满意度调查所得的平均分值(同一组中的数据用该组区间的中点值为代表);
(2)在选取的100位学生中,男女生人数相同,规定分值在(1)中的以上为满意,低于为不满意,据统计有32位男生满意.据此判断是否有的把握认为“学生满意度与性别有关”?
(3)在(2)的条件下,学校从满意度分值低于分的学生中抽取部分进行座谈,先用分层抽样的方式选出8位学生,再从中随机抽取2人,求恰好抽到男女生各一人的概率.
附:,其中.