人教A版选择性必修三第八章 成对数据的统计分析 同步检测(含答案)

文档属性

名称 人教A版选择性必修三第八章 成对数据的统计分析 同步检测(含答案)
格式 docx
文件大小 188.5KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2025-07-08 13:44:58

图片预览

文档简介

人教A版选择性必修三第八章成对数据的统计分析同步检测
一、单选题:本题共11小题。在每小题给出的选项中,只有一项是符合题目要求的。
1.某市对机动车单双号限行进行了调查,在参加调查的名有车人中有名持反对意见,名无车人中有名持反对意见,在运用这些数据说明“拥有车辆”与“反对机动车单双号限行”是否相关时,用下列哪种方法最有说服力( )
A. 平均数 B. 方差 C. 独立性检验 D. 回归直线方程
2.根据成对样本数据及其散点图,两个变量,满足非线性回归模型,其中,是待定系数,为了利用一元线性回归模型估计参数,,需要引进的变换可以是( )
A. B. C. D.
3.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
4.根据分类变量与的成对样本数据,计算得到已知,依据小概率值的独立性检验,以下结论正确的是( )
A. 变量与独立
B. 变量与独立,这个结论犯错误的概率不超过
C. 变量与不独立
D. 变量与不独立,这个结论犯错误的概率不超过
5.某市卫健委为了研究本市初中男生的脚长单位:和身高单位:的关系,从该市随机抽取名初中男生,根据测量数据的散点图可以看出与之间有线性相关关系设其经验回归方程为,,,若该市某位初中男生的脚长为,据此估计其身高为( )
A. B. C. D.
6.具有相关关系的变量满足的线性回归直线方程为,的数据如下:


求的最小值( )
A. B. C. D.
7.为了解喜爱钓鱼是否与性别有关,某同学随机在人群中抽取了若干人进行调查,抽取女性人数是男性人数的倍,男性喜爱钓鱼的人数占男性人数的,女性喜爱钓鱼的人数占女性人数的,若本次调查得出“有的把握认为是否喜爱钓鱼与性别有关”的结论,则被调查的男性至少有( )
附:,.
A. 人 B. 人 C. 人 D. 人
8.某科技公司随着技术的进步和管理的逐渐规范,生产成本逐年降低,该公司对年至年的生产成本万元进行统计,根据统计数据作出如下散点图:

由此散点图,判断下列四个经验回归方程类型中最适合作为年至年该公司的生产成本与时间变量的经验回归方程类型的是( )
A. B.
C. D.
9.已知下列命题:
两个变量相关性越强,则相关系数就越接近于.
用最小二乘法求得的一元线性回归模型的残差和一定是.
用最小二乘法求得的回归直线恒过样本点的中心,且至少过一个样本点.
从统计量中得知有的把握认为吸烟与患肺病有关系,是指推断有的可能性出现错误.
其中正确命题的个数是( )
A. B. C. D.
10.年月日,很多商场都在搞促销活动重庆市物价局派人对个商场某商品同一天的销售量及其价格进行调查,得到该商品的售价元和销售量件之间的一组数据如下表所示:
用最小二乘法求得关于的经验回归直线是,相关系数,则下列说法错误的是( )
A. 变量与负相关且相关性较强 B.
C. 当时,的估计值为 D. 相应于点的残差为
11.下列说法中正确的有( )
线性回归方程至少经过一个样本点;
可以用相关系数刻画两个变量的相关程度强弱,值越大则两个变量的相关程度越强;
在回归分析中,决定系数的模型比的模型拟合效果要好;
残差图中残差点所在的水平带状区域越窄,则回归方程的预报精确度越高.
A. 个 B. 个 C. 个 D. 个
二、多选题:本题共5小题。在每小题给出的选项中,有多项符合题目要求。
12.下列说法正确的是( )
A. ∽,越小,该正态分布对应的正态密度曲线越扁平
B. 运用最小二乘法得到的线性回归直线一定经过样本中心点
C. 相关系数越接近,与相关的程度就越弱
D. 利用进行独立性检验时,的值越大,说明有更大的把握认为两事件有关系
13.某款盲盒内可能装有某一套玩偶的、、三种样式,且每个盲盒只装一个玩偶.某销售网点为调查该款盲盒的受欢迎程度,随机发放了份问卷,并全部收回.经统计,有的人购买了该款盲盒,在这些购买者当中,女生占;而在未购买者当中,男生女生各占则下列说法中正确的是( )
参考数据:
参考公式:,其中.
A. 若每个盲盒装有、、三种样式玩偶的概率相同.某同学已经有了样式的玩偶,若他再购买两个这款盲盒,恰好能收集齐这三种样式的概率是
B. 以下列联表中的值为;
男生 女生 合计
未购买过该款盲盒
购买过该款盲盒
合计
C. 由上述数据可知,可以在犯错误概率不超过的前提下认为“购买该款盲盒与性别有关”
D. 由上述数据可知,有把握认为“购买该款盲盒与性别有关”
14.已知由样本数据点,,,求得的回归直线方程为,且,现发现两个数据点和的误差较大,剔除后重新求得的回归直线的斜率为,则( )
A. 变量和具有负相关关系
B. 剔除后不变
C. 剔除后的回归直线方程为
D. 剔除后对应于样本数据点的残差为
15.下列说法中正确的是( )
A. 对于独立性检验,的值越大,说明两事件的相关程度越大
B. 以模型去拟合一组数据时,为了求出回归方程,设,若其变换后得到线性方程,则,的值分别是和为自然对数的底数
C. 在具有线性相关关系的两个变量的统计数据所得的回归直线方程中,,,,则
D. 通过回归直线及回归系数,可以精确反映变量的取值和变化趋势
16.下列关于成对数据统计的表述中,正确的是( )
A. 成对样本数据的经验回归直线一定经过点
B. 依据小概率事件的独立性检验对零假设进行检验,根据列联表中的数据计算发现,由可推断不成立,即认为和不独立,该推断犯错误的概率不超过
C. 在残差图中,残差点的分布随解释变量增大呈现扩散的趋势,说明残差的方差不是一个常数,不满足一元线性回归模型对随机误差的假设
D. 决定系数越大,表示残差平方和越大,即模型的拟合效果越差
三、填空题:本题共4小题。
17.已知两个具有线性相关关系的变量,的一组数据,,,,根据上述数据可得关于的回归直线方程,则实数 .
18.如图是调查某学校男、女学生是否喜欢徒步运动而得到的等高条形图,阴影部分表示喜欢徒步运动的频率.已知该学校男生人,女生人假设所有学生都参加了调查,把所有喜欢徒步运动的学生按性别进行分层,用分层随机抽样的方法抽取一个容量为的样本,如果样本按比例分配,则抽取的男生人数为 .
19.在线性回归分析中,已知,,,,则 .
20.已知下列命题:
在线性回归模型中,相关指数表示解释变量对于预报变量的贡献率,越接近于,表示回归效果越好;
两个变量相关性越强,则相关系数的绝对值就越接近于;
在回归直线方程中,当解释变量每增加一个单位时,预报变量平均减少个单位;
对分类变量与,它们的随机变量的观测值来说,越小,“与有关系”的把握程度越大
其中正确命题的序号是___________.
四、解答题:本题共5小题。解答应写出文字说明,证明过程或演算步骤。
21.某大型企业响应政府“节能环保,还人民一个蔚蓝的天空”的号召,对生产过程进行了节能降耗的环保技术改造.下表提供了技术改造后生产甲产品过程中记录的产量与相应的生产能耗标准煤的几组对照数据:
请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
参考公式:,
已知该企业技术改造前生产甲产品耗能为标准煤,试根据求出的线性回归方程,预测生产甲产品的耗能比技术改造前降低多少标准煤?
22.我国为了鼓励新能源汽车的发展,推行了许多购车优惠政策,包括:国家财政补贴、地方财政补贴、免征车辆购置税、充电设施奖补、车船税减免、放宽汽车消费信贷等为了了解群众对新能源车和传统燃油车的偏好是否与年龄有关,调查组对名不同年龄段岁以上的车主进行了问卷调查,其中有名车主偏好新能源汽车,这名车主中各年龄段所占百分比见下图:
在所有被调查车主中随机抽取人,抽到偏好传统燃油车且在岁年龄段的概率为.
请将下列列联表直接补充完整.
偏好新能源汽车 偏好燃油车 合计

岁以上
合计
并判断能否在犯错误的概率不超过的前提下,认为偏好新能源汽车与年龄有关
将上述调查中的频率视为概率,按照分层随机抽样方法,从偏好新能源汽车的车主中选取人,再从这人中任意取人,求人中恰有人在岁年龄段的概率.
附:,其中.
23.某款级别游戏自发布以来便受到了广泛关注,仅用了三天时间便在各大平台上卖出超过万份,这一速度令人惊讶下表是该游戏发布以来在某一平台各月的销售量统计表.
月份编号
销售量百万份
依据表中的统计数据,计算样本相关系数结果保留两位小数,并判断月份编号与销售量之间是否具有较强的线性相关性;
预计该平台半年时间的销售量能否突破百万份.
参考数据:;
参考公式:.
24. “每天锻炼一小时,健康工作五十年,幸福生活一辈子.”一科研单位为了解员工爱好运动是否与性别有关,从单位随机抽取名员工进行了问卷调查,得到了如下列联表:
男性 女性 合计
爱好
不爱好
合计
已知在这人中随机抽取人抽到爱好运动的员工的概率是.
参考公式:.
附表:
请将上面的列联表补充完整,根据小概率值的独立性检验,分析爱好运动与否与性别是否有关?
若从这人中的女性员工中随机抽取人参加一活动,记爱好运动的人数为,求的分布列、数学期望.
25.一个调查学生记忆力的研究团队从某中学随机挑选名学生进行记忆测试,通过讲解个陌生单词后,相隔十分钟进行听写测试,间隔时间分钟和答对人数的统计表格如下:
时间分钟
答对人数
时间与答对人数和的散点图如下:
附:,,,,,对于一组数据,,,,其回归直线方程的斜率和截距的最小二乘估计分别为:,.
请根据表格数据回答下列问题:
根据散点图判断,与哪个更适宜作为线性回归模型?给出判断即可,不必说明理由
根据的判断结果,建立与的回归方程;或,的计算结果均保留到小数点后三位
根据请估算要想答对人数不少于人,至多间隔多少分钟需要重新记忆一遍.结果四舍五入保留整数参考数据:,
答案和解析
1.【答案】
【解析】在检验两个变量是否相关时,
最有说服力的方法是独立性检验,
故选C.
2.【答案】
【解析】显然引进变换后,非线性回归模型变为线性回归模型.
3.【答案】
【解析】由给出的四组数据的散点图可以看出,
图和图是正相关,相关系数大于,
图和图是负相关,相关系数小于,
图和图的点相对更集中在一条直线附近,所以相关性更强,
所以接近于,接近于,
由此,可得.
4.【答案】
【解析】当时,,大于则相关,不独立,
而,
依据的独立性检验变量与独立,
故选A.
5.【答案】
【解析】由,,得样本的中心点为,
则,
解得,
因此经验回归方程为,
当时,

故选:.
6.【答案】
【解析】因为具有相关关系的变量满足的线性回归直线方程为,
结合数据表得两变量正相关即,且,
样本中心,
又样本中心在回归直线上,

当且仅当且,即:时等号成立.
的最小值为.
故选:.
7.【答案】
【解析】设男性人数为,
依题意,得列联表如下:
性别 是否喜爱钓鱼 合计
喜爱 不喜爱
男性
女性
合计

本次调查得出“有的把握认为是否喜爱钓鱼与性别有关”的结论,
于是,即,解得,
而,且,因此.
8.【答案】
【解析】根据图中散点图可知,散点大致分布在一条“对数型”函数曲线的周围,
而对于选项是“抛物线型”的拟合函数,且是增加的;
选项是“直线型”的拟合函数,且是增加的;
选项是“幂函数型”的拟合函数,且是增加的,
只有选项的拟合函数符合题意.
故选:.
9.【答案】
【解析】两个变量相关性越强,
则相关系数的绝对值就越接近于,故错误;
用最小二乘法求得的一元线性回归模型的残差和不一定是,故错误;
回归直线恒过样本点的中心,
不一定过样本点,故错误;
从统计量中得知有的把握认为吸烟与患肺病有关系,
是指有的可能性使得推断出现错误,故正确,
综上正确的有.
故选:.
10.【答案】
【解析】对于,由回归直线可得变量,线性负相关,且由相关系数,可知相关性较强,故A正确;
对于,由表中数据可得,,,
故回归直线恒过点,故,解得,故B正确;
对于,当时,,故C错误;
对于,相应于点的残差,故D正确.
故选:
11.【答案】
【解析】关于,线性回归方程的是由最小二乘法计算出来的,它不一定经过其样本点,则错误
关于,当越大越接近,两个变量的相关程度越强,但当时,值越大越小,两变量相关程度越弱,则错误:
关于,在回归分析中,决定系数越大的模型拟合效果越好,则正确:
关于,在残差图中,残差点比较均匀地落在水平带状区域中,说明选用的模型比较合适,带状区域越窄,说明回归方程的预报精确度越高,则正确.
故选B.
12.【答案】
【解析】由正态分布的特征可知,当越小时,表示随机变量的分布比较集中,正态密度曲线的就越瘦高,故A错误;
由最小二乘法原理可知,一定满足所求的线性回归直线方程,即线性回归直线一定过样本中心点,故B正确;
样本相关系数的取值范围为,样本相关系数的绝对值大小可以反映成对样本数据之间线性相关的程度,当越接近时,成对样本数据的线性相关程度越强,故C错误;
对于独立性检验,越大,说明零假设事件发生的可能性越小,即两事件有关系的把握程度就越大,故D正确.
13.【答案】
【解析】选项A,该同学再购买两个这款盲盒,基本事件有:,,,,,,,,,
能收集齐这三种样式的基本事件有,,
所以恰好能收集齐这三种样式的概率是,故选项A正确.
选项B,购买了该款盲盒的人有人,由在这些购买者当中,女生占,
所以购买了该款盲盒的人中男生有人,女生人,
有人没有购买,其中男生人,女生人,
所以列联表中的值为,故选项B正确.
选项C,列联表如下
男生 女生 合计
未购买过该款盲盒
购买过该款盲盒
合计

所以在犯错误概率不超过的前提下不能认为“购买该款盲盒与性别有关”,故选项C不正确.
选项D,由可知,
所以有把握认为“购买该款盲盒与性别有关”,故选项D正确.
故选:.
14.【答案】
【解析】对于,由剔除前回归直线的斜率为 ,
剔除后重新求得的回归直线 的斜率为 ,
两者均大于,则变量 与 具有正相关关系,
A错误;
对于,剔除前 ,
而剔除的两个数据点 , ,
因此剔除后 不变,B正确;
对于,剔除后 , ,
而回归直线 的斜率为 ,
则回归直线方程为 ,C正确;
对于,
剔除后的回归直线方程为 ,
当 时, ,
则残差为 ,D错误.
故选:.
15.【答案】
【解析】对于,根据独立性检验的性质知,的值越大,说明两个分类变量相关程度越大,A正确;
对于,由,两边取自然对数,可得,
令,得,
,,则,B正确;
对于,回归直线方程中,,C正确;
对于,通过回归直线及回归系数,可估计和预测变量的取值和变化趋势,D错误.
故选ABC.
16.【答案】
【解析】成对样本数据的经验回归直线一定经过样本中心点,A正确;
依据小概率事件的独立性检验对零假设进行检验,
根据列联表中的数据计算发现,
则可推断 成立,即认为和 无关,B错误;
在残差图中,残差点的分布随解释变量增大呈现扩散的趋势,
说明残差的方差不是一个常数,不满足一元线性回归模型对随机误差的假设,C正确;
决定系数越大,表示残差平方和越小,即模型的拟合效果越好, D错误.
17.【答案】
【解析】由题中数据可知,因为回归直线一定经过点,
所以.
故答案为:.
18.【答案】
【解析】由等高条形图,男生不喜欢徒步的有,则喜欢徒步的有人,
女生不喜欢徒步的有,则喜欢徒步的有人,
由分层抽样得,抽取喜欢徒步的男生为.
故答案为:.
19.【答案】
【解析】因为,,,,
所以

解得.
故答案为.
20.【答案】
【解析】 在线性回归模型中,相关指数越接近于,
表示解释变量对于预报变量的相关性越强,回归效果越好,因此正确
两个变量相关性越强,则相关系数的绝对值就越接近于,
两个随机变量相关性越弱,则相关系数的绝对值越接近于,因此正确
在回归直线方程中,当解释变量每增加一个单位时,
预报变量平均减少个单位,因此正确
对分类变量与的随机变量的观侧值来说,越小,“与有关系”的把握程度越小,因此不正确.
故答案为.
21.【解析】由已知得:,,,
,,
所以.
当时,,

故预测生产甲产品的耗能比技术改造前降低标准煤.
22.【解析】列联表如下所示
偏好新能源汽车 偏好燃油车 合计

岁以上
合计

则能在犯错误的概率不超过的前提下,认为偏好新能源汽车与年龄有关;
按照分层随机抽样,从偏好新能源汽车的车主中选取人,
其中在岁年龄段的人数为,岁以上的人数为,
从人中任意取人,共有种情况,其中恰有人在岁年龄段的有种情况,
故人中恰有人在岁年龄段的概率为.
23.【解析】由题意,
因为



所以,
所以月份编号与销售量之间具有较强的线性相关性.
因为,,
所以经验回归方程为
当时,,
所以该平台半年时间的销售量不能突破百万份.
24.【解析】由人中随机抽取人抽到爱好运动的员工的概率是,故爱好运动的员工共有人,
由表中男性爱好运动的员工为人,可得女性爱好运动的员工有人,
故列联表补充如下:
男性 女性 合计
爱好
不爱好
合计
零假设为:爱好运动与否与性别没有关系.
由已知数据可求得:

根据小概率值的独立性检验,没有充分证据推断不成立,即认为爱好运动与否与性别没有关系;
的可能取值为,女性一共有人,爱好活动的有人,


所以的分布列为:
的数学期望为:

25.【解析】由图象可知,更适宜作为线性回归模型.
设,由条件可得,,,
,,
所以,因此.
由题意知,
即,
解得,
则,即至多分钟,就需要重新记忆一遍.
第13页,共17页