人教2019A版高中数学选择性必修三第八章成对数据的统计分析单元测试卷
数学试题
(全卷满分150分,考试用时120分钟)
第一部分(选择题60分)
一、单项选择题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.两个变量x与y的回归模型中,分别选择了四个不同的模型来拟合y与x之间的关系,它们的样本相关系数r如下,其中拟合效果最好的模型是( )
模型 1 2 3 4
r 0.98 0.80 0.50 0.25
A.模型1 B.模型2 C.模型3 D.模型4
2.(2021云南昆明盘龙高二上期末)实数x,y的取值如下表所示:
x 3 4 5 6 7
y 4 9 10 14 18
从散点图分析y与x有较好的线性相关关系,并由最小二乘法求得经验回归方程为,则下列说法一定正确的是( )
A. B.
C. D.与11的大小关系不确定
3.某工厂为了确定工效进行了5次试验,收集数据如下:
加工零件个数x 10 20 30 40 50
加工时间y(分钟) 64 69 75 82 90
经检验,这组样本数据的变量x与y具有线性相关关系,下列说法中正确的是( )
A.变量x与y负相关,其经验回归直线经过点(30,75)
B.变量x与y正相关,其经验回归直线经过点(30,75)
C.变量x与y负相关,其经验回归直线经过点(30,76)
D.变量x与y正相关,其经验回归直线经过点(30,76)
4.(2021河南创新发展联盟高二下联考)假设两个分类变量X和Y的取值分别为{x1,x2}和{y1,y2},其样本频数列联表如下:
y1 y2 合计
x1 a b a+b
x2 c d c+d
合计 a+c b+d a+b+c+d
以下数据中,对同一样本说明X与Y有关的可能性最大的一组是( )
A.a=10,b=5,c=8,d=6 B.a=9,b=5,c=7,d=8
C.a=12,b=6,c=9,d=5 D.a=12,b=8,c=6,d=7
5.(2021黑龙江大庆铁人中学高三下模拟)某公司2019年1月至7月空调销售完成情况如图所示,其中x为月份,y为销售量,下面四个回归方程类型中,最适合作为销售量y和月份x的回归方程类型的是( )
A.y=a+bx B.y=a+bx2 C.y=a+bex D.y=a+bln x
6.(2021江苏新高考基地学校高三大联考)根据2010—2020年我国某地16~59岁人口比重统计数据y(%),拟合了y与年份x的经验回归方程为=-0.74x+1 551,则我国16~59岁人口比重开始低于50%的年份是( )
A.2023 B.2026 C.2029 D.2032
7.(2021江苏徐州高三模拟)对于数据组(xi,yi)(i=1,2,3,…,n),如果由经验回归方程得到的对应于自变量xi的估计值是,那么将yi-称为相应于点(xi,yi)的残差.某工厂为研究某种产品产量x(吨)与所需某种原材料y(吨)的相关性,在生产过程中收集了4组(x,y)的数据如下表所示:
x 3 4 5 6
y 2.5 3 4 m
根据表中数据,得出y关于x的经验回归方程为=0.7x+,据此计算出样本点(4,3)处的残差为-0.15,则表中m的值为( )
A.3.3 B.4.5 C.5 D.5.5
8.(2021山东济南高三模拟)第24届冬季奥林匹克运动会将于2022年在北京举办.为了解某城市居民对冰雪运动的关注情况,随机抽取了该市100人进行调查统计,得到如下2×2列联表.
单位:人
男性 女性 合计
关注冰雪运动 35 25 60
不关注冰雪运动 15 25 40
合计 50 50 100
参考公式:χ2=,其中n=a+b+c+d.
附表:
α 0.100 0.050 0.010 0.001
xα 2.706 3.841 6.635 10.828
根据列联表可知 ( )
A.该市女性居民中大约有5%的人关注冰雪运动
B.该市男性居民中大约有95%的人关注冰雪运动
C.有95%的把握认为该市居民是否关注冰雪运动与性别有关
D.有99%的把握认为该市居民是否关注冰雪运动与性别有关
二、多项选择题(本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,有选错的得0分,部分选对的得3分)
9.(2021江苏南通高二下期中)2020年3月15日,某市物价部门对5家商场的某商品一天的销售量及其价格进行调查,5家商场的售价x(元)和销售量y(件)之间的一组数据如表所示:
售价x(元) 9 9.5 10 10.5 11
销售量y(件) 11 10 8 6 5
按公式计算,y与x的经验回归方程是=-3.2x+,样本相关系数|r|=0.986,则下列说法正确的有( )
A.变量x与y线性负相关且相关性较强
B.=40
C.当x=8.5时,=12.8
D.点(10.5,6)的残差约为0.4
10.(2021湖南永州高三三模)某校对“学生性别和喜欢锻炼是否有关”进行了一次调查,其中被调查的男、女生人数相同,男生喜欢锻炼的人数占男生总人数的,女生喜欢锻炼的人数占女生总人数的.若大约有95%的把握认为“学生性别和喜欢锻炼有关”,则被调查的学生中男生的人数可能为( )
附:χ2=,n=a+b+c+d.
α 0.050 0.010
xα 3.841 6.635
A.35 B.40 C.45 D.50
11.(2021辽宁丹东高三二模)晚上睡眠充足是提高学习效率的必要条件,河北衡水某高中的高三年级学生晚上10点10分必须休息,另一所同类高中的高三年级学生晚上11点休息,并鼓励学生还可以继续进行夜自习,稍晚再休息.有关人员分别对这两所高中的高三年级学习总成绩前50名学生的学习效率进行问卷调查,其中衡水某高中有30名学生的学习效率高,且从这100名学生中随机抽取1人,抽到学习效率高的学生的概率是0.4,则( )
附:χ2=,n=a+b+c+d.
α 0.050 0.010 0.005 0.001
xα 3.841 6.635 7.879 10.828
A.衡水某高中的前50名学生中有60%的学生学习效率高
B.另一所同类高中的前50名学生中有40%的学生学习效率高
C.有99.9%的把握认为“学生学习效率高低与晚上睡眠是否充足有关”
D.认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率超过0.05
12.(2021广东广州天河高二下期末)某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从2012年到2020年共9年“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额y看成年份序号x(2012年作为第1年)的函数.运用Excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如下图,则下列说法中正确的为( )
注:其中R2=1-,R2越接近于1,表示回归的效果越好.
A.销售额y与年份序号x呈正相关关系
B.销售额y与年份序号x线性相关不显著
C.三次函数回归曲线的拟合效果好于回归直线的拟合效果
D.根据三次函数回归曲线可以预测2021年“年货节”期间的销售额约为8 454亿元
第二部分(非选择题90分)
三、填空题(本题共4小题,每小题5分,共20分)
13.(2021河南开封五县高二下期中联考)下表是不完整的2×2列联表,其中3a=c,b=2d,则a=_______.
y1 y2 合计
x1 a b 55
x2 c d
合计 120
14.为了判断某高中学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:
单位:人
选修理科 选修文科 合计
男生 13 10 23
女生 7 20 27
合计 20 30 50
已知P(χ2≥3.841)≈0.05,P(χ2≥6.635)≈0.01.根据表中数据,得到χ2=≈4.844,则认为选修文科与性别有关系出错的概率约为___________.
15.(2021山东烟台高三一模)2021年2月25日,全国脱贫攻坚总结表彰大会在北京举行,习近平总书记庄严宣告我国脱贫攻坚战取得了全面胜利.已知在党委政府精准扶贫政策下,自2017年起某地区贫困户第x年的年人均收入y(单位:万元)的统计数据如下表:
年份 2017 2018 2019 2020
年份编号x 1 2 3 4
年人均收入y 0.6 0.8 1.1 1.5
根据上表可得经验回归方程=x+中的为0.3,据此模型预报该地区贫困户2021年的年人均收入为 万元.
16.(2021陕西西安莲湖高二下期末)已知具有相关关系的两个随机变量的一组观测数据的散点分布在函数y=2e2x+1的图象附近,设z=ln y,将其变换后得到经验回归方程为z=mx+n,则mn=_________.
四、解答题(本题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)
17.(本小题满分10分) (2021宁夏石嘴山高三下三模)商务部会同海关总署、国家药监局于3月31日发布了《关于有序开展医疗物资出口的公告》.如医疗物资出口中出现质量问题,将认真调查,发现一起,查处一起,切实维护“中国制造”的形象,更好地发挥医疗物资对支持全球疫情防控的重要作用.为了监控某种医疗物资的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个医疗物资,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个医疗物资的尺寸:
抽取次序 1 2 3 4 5 6 7 8
医疗物资尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
抽取次序 9 10 11 12 13 14 15 16
医疗物资尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得==9.97,s==≈0.212,≈18.439,=-2.78,其中xi为抽取的第i个医疗物资的尺寸,i=1,2,3,…,16.
(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为医疗物资尺寸不随生产过程的进行而系统地变大或变小);
(2)一天内抽检的医疗物资中,如果出现了尺寸在(-3s,+3s)之外的医疗物资,
就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,是否需对当天的生产过程进行检查?
附:样本(xi,yi)(i=1,2,…,n)的相关系数r=.
18.(本小题满分12分) (2021河北邢台第二中学高二下期末)近年来,共享单车行业在我国各城市迅猛发展,单车为人们的出行提供了便利,但也给城市的交通管理带来了一些困难,为掌握共享单车在C省的发展情况,某调查机构从该省抽取了5个城市,并统计了共享单车的A指标x和B指标y,数据如下表所示:
城市1 城市2 城市3 城市4 城市5
A指标x 2 4 5 6 8
B指标y 3 4 4 4 5
(1)试求y与x间的样本相关系数r,并说明y与x是否具有较强的线性相关关系(若|r|≥0.75,则认为y与x具有较强的线性相关关系,否则认为没有较强的线性相关关系);
(2)建立y关于x的经验回归方程,并预测当A指标为7时,B指标的估计值;
(3)若某城市的共享单车的A指标x在区间(-3s,+3s)的右侧,则认为该城市共享单车数量过多,对城市的交通管理有较大的影响,交通管理部门将进行治理,直至A指标x在区间(-3s,+3s)内.现已知C省某城市共享单车的A指标为13,则该城市的交通管理部门是否需要进行治理?试说明理由.
参考公式:经验回归方程=x+中,斜率和截距的最小二乘估计分别为=,=-,相关系数r=.
参考数据:s==2,≈0.55,≈0.95.
19.(本小题满分12分) (2021广东广州越秀高二下期末)通过随机询问100名不同性别的大学生是否爱好某项运动,得到如下图表:
单位:人
男生 女生 合计
爱好 35 55
不爱好 30
合计 100
(1)补全2×2列联表与等高堆积条形图,并通过图形判断爱好该项运动与性别是否有
关系;
(2)根据列联表及独立性检验,能否在犯错误的概率不超过0.01的前提下认为爱好该项运动与性别有关系?
附:χ2=,其中n=a+b+c+d.
α 0.10 0.01 0.001
xα 2.706 6.635 10.828
20.(本小题满分12分) (2021江西上饶高三三模)目前我市逐步建立了以政府为主导、以企业为主体,全社会共同推进的节能减排工作机制,某企业响应号召,对现有设备进行改造,为了分析设备改造前后的效果,现从设备改造前后生产的大量产品中各抽取200件产品作为样本,检测一项质量指标值,该项质量指标值落在[20,40)内的产品视为合格品,否则为不合格品.如图是设备改造前样本的频率分布直方图,如表是设备改造后样本的频数分布表.
设备改造前样本的频率分布直方图
设备改造后样本的频数分布表
质量指标值 [15,20) [20,25) [25,30) [30,35) [35,40) [40,45]
频数 4 36 96 28 32 4
(1)完成下面的2×2列联表,并判断是否有99%的把握认为该企业生产的这种产品
的质量指标值与设备改造有关;
单位:件
设备改造前 设备改造后 合计
合格品
不合格品
合计
(2)根据市场调查,设备改造后,每生产一件合格品企业可获利180元,每生产一件
不合格品企业亏损100元,用频率估计概率,则生产1 000件产品企业大约能获利多少元?
附:
α 0.100 0.050 0.010
xα 2.706 3.841 6.635
χ2=,n=a+b+c+d.
21.(本小题满分12分) (2021四川攀枝花高三二模)2020年3月,工业和信息化部信息通信发展司发布《工业和信息化部关于推动5G加快发展的通知》,鼓励基础电信企业通过套餐升级优惠、信用购机等举措,促进5G终端消费,加快用户向5G迁移.为了落实通知要求,掌握用户升级迁移情况及电信企业服务措施,某市调研部门随机选取了甲、乙两个电信企业的用户共165户作为样本进行满意度调查,并针对企业服务措施设置了达标分数线,按照不低于80分的定为满意,低于80分的定为不满意,调研人员制作了如下2×2列联表.已知从样本的165户中随机抽取1户为满意的概率是.
单位:户
满意 不满意 合计
甲企业用户 75
乙企业用户 20
合计
(1)将2×2列联表补充完整,并判断是否有95%的把握认为“满意度与电信企业服务
措施有关系”;
(2)视样本的频率为概率,在该市乙企业的所有用户中任取3户,记取出的3户中不满意的户数为ξ,求ξ的分布列和数学期望.
下面临界值表仅供参考:
α 0.10 0.05 0.010 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
参考公式:χ2=,其中n=a+b+c+d.
22.(本小题满分12分) (2021重庆育才中学高三上月考)随着电子阅读的普及,传统纸质媒体遭受到了强烈的冲击.某杂志社近9年来的纸质广告收入如下表所示:
年份 2012 2013 2014 2015 2016 2017 2018 2019 2020
时间代号t 1 2 3 4 5 6 7 8 9
广告收入y (千万元) 2 2.2 2.5 2.8 3 2.5 2.3 2 1.8
根据这9年的数据,对t和y作线性相关性检验,求得样本相关系数的绝对值为0.243;根据后5年的数据,对t和y作线性相关性检验,求得样本相关系数的绝对值为0.984.
(1)如果要用线性回归方程预测该杂志社2021年的纸质广告收入,现在有两个方案,方案一:选取这9年数据进行预测,方案二:选取后5年数据进行预测.从实际生活背景以及线性相关性检验的角度分析,你觉得哪个方案更合适?
(2)某购物网站同时销售某本畅销书籍的纸质版和电子书,据统计,在该网站购买该书籍的大量读者中,只购买电子书的读者比例为50%,纸质版和电子书同时购买的读者比例为10%,现用此统计结果作为概率.
(i)若从该网站购买该书籍的大量读者中任取一位,求他只购买纸质版的概率;
(ii)若从上述读者中随机调查3位,求购买电子书人数多于只购买纸质版人数的概率.
参考答案
一、单项选择题
1.A;2.A;3.D;4.B;5.B;6.C;7.B;8.C.
二、多项选择题
9.ABC;10.CD;11.AC;12.AC.
三、填空题
13.15;14.0.05;15.1.75;16.2ln2+2.
四、解答题
17.(1)r=≈≈-0.18.
由于|r|<0.25,因此可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小.
(2)易知=9.97,s≈0.212,故(-3s,+3s)=(9.334,10.606).
由题表可知抽取的第13个医疗物资的尺寸在(9.334,10.606)之外,因此需对当天的生产过程进行检查.
18.(1)由题表得==5,==4.
所以=6,=20,=2.
所以r==≈0.95.
因为0.95>0.75,所以y与x具有较强的线性相关关系.
(2)由(1)得==0.3,=4-0.3×5=2.5,所以经验回归方程为=0.3x+2.5.
当x=7时,=0.3×7+2.5=4.6,即当A指标为7时,B指标的估计值为4.6.
(3)该城市的交通管理部门需要进行治理.理由如下:
由题意得(-3s,+3s)=(-1,11),
因为13>11,所以该城市的交通管理部门需要进行治理.
19.(1)列联表如下:
单位:人
男生 女生 合计
爱好 35 20 55
不爱好 15 30 45
合计 50 50 100
等高堆积条形图如下:
由等高堆积条形图可得,爱好该项运动与性别有关.
(2)χ2==≈9.091>6.635,
所以能在犯错误的概率不超过0.01的前提下认为爱好该项运动与性别有关系.
20.(1)由题图知,设备改造前质量指标值不落在[20,40)内的产品有(0.008+0.02)×5×200=28(件),因此设备改造前质量指标值落在[20,40)内的产品有200-28=172(件).
由题表知设备改造后质量指标值不落在[20,40)内的产品有4+4=8(件),因此设备改造后质量指标值落在[20,40)内的产品有200-8=192(件).
根据以上的计算可得2×2列联表:
单位:件
设备改造前 设备改造后 合计
合格品 172 192 364
不合格品 28 8 36
合计 200 200 400
χ2=≈12.21.
因为12.21>6.635,
所以有99%的把握认为该企业生产的这种产品的质量指标值与设备改造有关.
(2)用频率估计概率,1 000件产品中大约有×1 000=960件合格品,1 000-960=40件不合格品.
所以该企业大约能获利180×960-100×40=168 800(元).
21.(1)设样本中乙企业用户中满意的有x户,则=,解得x=60.
2×2列联表如下:
单位:户
满意 不满意 合计
甲企业用户 75 10 85
乙企业用户 60 20 80
合计 135 30 165
χ2==≈4.853>3.841,
故有95%的把握认为“满意度与电信企业服务措施有关系”.
(2)设“从样本中的乙企业用户中任取一户为不满意”为事件A,则P(A)==.
ξ的可能取值为0,1,2,3,
则P(ξ=0)==,P(ξ=1)=××=,
P(ξ=2)=××=,P(ξ=3)==.
所以ξ的分布列为
ξ 0 1 2 3
P
所以E(ξ)=0×+1×+2×+3×=.
22.(1)选取方案二更合适.理由如下:
①从题表中可以看出,从2016年开始,广告收入呈现逐年下降的趋势,所以可以预见,2021年的纸质广告收入会接着下跌,前四年的增长趋势已经不能作为预测后续数据的依据.
②根据这9年的数据得到的样本相关系数的绝对值为0.243,且0.243<0.75,所以我们没有理由认为y与t具有线性相关关系;而后5年的数据得到的样本相关系数的绝对值为0.984,且0.984>0.75,所以我们认为y与t具有很强的线性相关关系.
(2)(i)由题意得,从该网站购买该书籍的大量读者中任取一位,他购买电子书的概率为+=,
所以他只购买纸质版的概率为.
(ii)购买电子书人数多于只购买纸质版人数有两种情况:3人购买电子书,2人购买电子书、1人只购买纸质版.
故所求概率为×+××=.