【高考押题预测】2025年高考数学核心考点考前冲刺 样本相关系数(解答题)(含解析)

文档属性

名称 【高考押题预测】2025年高考数学核心考点考前冲刺 样本相关系数(解答题)(含解析)
格式 docx
文件大小 193.8KB
资源类型 试卷
版本资源 通用版
科目 数学
更新时间 2025-06-02 21:21:42

图片预览

文档简介

中小学教育资源及组卷应用平台
样本相关系数(解答题)
一.解答题(共20小题)
1.广阳岛,作为长江上游最大的江心岛,其面积在枯水期约为10平方公里.自2017年起,重庆市开始对广阳岛进行系统的生态修复,摒弃了曾经的商业开发计划,转而建设“长江风景眼,重庆生态岛”.经过数年的努力,广阳岛的生态得到了显著的改善,不仅植被丰富,生物多样性也得到了极大的提升.据监测,岛上的鸟类从生态修复前的124种增加到213种,其中包括中华秋沙鸭、游隼、白琵鹭等珍稀鸟类.为调查广阳岛某种鸟的数量,将其分成面积相近的50个地块,从这些地块中用简单随机抽样的方法抽取5个作为样区,调查得到样本数据(xi,yi)(i=1,2, ,5),其中xi和yi分别表示第i个样区的植被覆盖面积(单位:平方公里)和这种鸟的数量.
i 1 2 3 4 5
xi 0.171 0.152 0.192 0.189 0.196
yi 12 10 16 14 18
(1)求广阳岛这种鸟数量的估计值(这种鸟数量的估计值等于样区这种鸟数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2, ,5)的相关系数(精确到0.01);
(3)根据统计资料,各地块间植物覆盖面积差异较大.为提高样本的代表性以获得广阳岛这种鸟数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数.
2.某沙漠地区经过治理,生态系统得到很大改善,人工栽培和野生植物数量不断增加.为调查该地区某种植物的数量,将其分成面积相近的150个地块,从这些地块中用简单随机抽样的方法抽取15个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,15),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种植物的数量,并计算得,,,,.
(1)求该地区这种植物数量的估计值(这种植物数量的估计值等于样区这种植物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,15)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种植物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数,.
3.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2, ,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量(单位:头),并计算得,,,,.
(1)估计该地区这种野生动物的数量;
(2)求样本(xi,yi)(i=1,2, ,20)的相关系数.(精确到0.01)
4.大学生刘铭去某工厂实习,实习结束时从自己制作的某种零件中随机选取了10个样品,测量每个零件的横截面积(单位:mm2)和耗材量(单位:mm3),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
零件的横截面积xi 0.03 0.05 0.04 0.07 0.07 0.04 0.05 0.06 0.06 0.05 0.52
耗材量yi 0.24 0.40 0.23 0.55 0.50 0.34 0.35 0.45 0.43 0.41 3.9
并计算得0.0286,1.6166,0.2131.
(1)估算刘铭同学制作的这种零件平均每个零件的横截面积以及平均一个零件的耗材量;
(2)求刘铭同学制作的这种零件的横截面积和耗材量的样本相关系数(精确到0.01);
(3)刘铭同学测量了自己实习期制作的所有这种零件的横截面积,并得到所有这种零件的横截面积的和为182mm2,若这种零件的耗材量和其横截面积近似成正比,请帮刘铭计算一下他制作的零件的总耗材量的估计值.
附:参考公式和数据:相关系数.r;1.221.
5.为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).如表是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序 1 2 3 4 5 6 7 8
零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
抽取次序 9 10 11 12 13 14 15 16
零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得,,,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在
之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ii)请利用已经学过的方差公式:来证明方差第二公式.
(iii)在之外的数据称为离群值,试剔除离群值,并利用(ii)中公式估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(xi,yi)(i=1,2,…,n)的相关系数,.
6.将保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中15个区域进行编号,统计抽取到的每个区域的某种水源指标xi和区域内该植物分布的数量yi(i=1,2, ,15),得到数组(xi,yi).已知,,(xi)(yi)=480.
(1)求样本(xi,yi)(i=1,2, ,15)的样本相关系数;
(2)假设该植物的寿命为随机变量X(X可取任意正整数),研究人员统计大量数据后发现,对于任意的k∈N*,寿命为k+1的样本在寿命超过k的样本里的数量占比与寿命为1的样本在全体样本中的数量占比相同,均为0.1,这种现象被称为“几何分布的无记忆性”.用含k的式子表示P(X=k)(k∈N*),并求P(X=2024)的值.
附:样本相关系数,当k足够大时,k×0.9k≈0.
7.某食品加工厂新研制出一种袋装食品(规格:500g/袋),下面是近六个月每袋出厂价格(单位:元)与销售量(单位:万袋)的对应关系表:
月份序号 1 2 3 4 5 6
每袋出厂价格xi 10.5 10.9 11 11.5 12 12.5
月销售量yi 2.2 2 1.9 1.8 1.5 1.4
并计算得,,.
(1)计算该食品加工厂这六个月内这种袋装食品的平均每袋出厂价格、平均月销售量和平均月销售收入;
(2)求每袋出厂价格与月销售量的样本相关系数(精确到0.01);
(3)若样本相关系数|r|≥0.75,则认为相关性很强;否则没有较强的相关性.你认为该食品加工厂制定的每袋食品的出厂价格与月销售量是否有较强的相关性.
附:样本相关系数,.
8.黄河是中华民族的母亲河、生命河,也是一条桀骜难驯的忧患之河.小浪底水利枢纽工程位于河南省济源市、洛阳市孟津区边界,是黄河治理开发的关键控制性工程.它控制着黄河92%的流域面积、91%的径流量和近100%的泥沙,以防洪、防淩、减淤为主,兼顾供水、灌溉、发电,不仅是中华民族治黄史上的丰碑,也是世界水利工程史上最具标志性的杰作之一,其大坝为预测渗压值和控制库水位,工程师在水库选取一支编号为HN1渗压计,随机收集10个该渗压计管内水位和水库水位监测数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
水库水位xi/m 75.69 75.74 75.77 75.78 75.81 75.85 75.67 75.87 75.9 75.93 758.01
HN1渗压计管内水位y1/m 72.88 72.90 72.92 72.92 72.93 72.94 72.94 72.95 72.96 72.98 729.32
并计算得,53190.77,55283.20,72.9322=5319.076624,75.8012=5745.791601,.
(Ⅰ)求该水库HN1号渗压计管内水位与水库水位的样本相关系数(精确到0.01);
(Ⅱ)某天雨后工程师测量了水库水位,并得到水库的水位为76m.利用以上数据给出此时HN1号渗压计管内水位的估计值.
附:相关系数,,.
9.住房和城乡建设部等六部门发布通知提出,到2025年,农村生活垃圾无害化处理水平明显提升.我国生活垃圾主要有填埋、焚烧与堆肥三种处理方式,随着我国垃圾处理结构的不断优化调整,焚烧处理逐渐成为市场主流.根据国家统计局公布的数据,对2013﹣2020年全国生活垃圾焚烧无害化处理厂的个数y(单位:座)进行统计,得到如下表格:
年份 2013 2014 2015 2016 2017 2018 2019 2020
年份代码x 1 2 3 4 5 6 7 8
生活垃圾焚烧无害化处理厂的个数y 166 188 220 249 286 331 389 463
(1)由表中数据可知,可用线性回归模型拟合y与x之间的关系,请用相关系数加以说明;(精确到0.01)
(2)求出y关于x的线性回归方程,并预测2022年全国生活垃圾焚烧无害化处理厂的个数;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,还能用所求的线性回归方程预测吗?请简要说明理由.
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.
参考数据:,,,,5732=328329,,.
10.“十四五”规划纲要提出,全面推动长江经济带发展,协同推动生态环境保护和经济发展.长江水资源约占全国总量的36%,长江流域河湖、水库、湿地面积约占全国的20%,珍稀濒危植物约占全国的39.7%,淡水鱼类约占全国的33%.长江经济带在我国生态文明建设中占据重要位置.长江流域某地区经过治理,生态系统得到很大改善,水生动物数量有所增加.为调查该地区A种水生动物的数量,将其分成面积相近的100个小水域,从这些小水域中用简单随机抽样的方法抽取20个作为样本,调查得到样本数据(xi,yi)(i=1,2, ,20),其中xi和yi分别表示第i个样本区域的水草覆盖面积(单位:公顷)和A种水生动物的数量,并计算得.
(1)求该地区A种水生动物数量的估计值(A种水生动物数量的估计值等于样本区域A种水生动物数量的平均数乘以小水域数);
(2)求样本(xi,yi)(i=1,2, ,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间水草覆盖面积差异很大.为提高样本的代表性以获得该地区A种水生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r1.732.
11.为了了解高中学生课后自主学习数学时间(x分钟/每天)和他们的数学成绩(y分)的关系,某实验小组做了调查,得到一些数据(表一).
编号 1 2 3 4 5
学习时间x 30 40 50 60 70
数学成绩y 65 78 85 99 108
(1)求数学成绩y与学习时间x的相关系数(精确到0.001);
(2)请用相关系数说明该组数据中y与x之间的关系可用线性回归模型进行拟合,并求出y关于x的回归直线方程,并由此预测每天课后自主学习数学时间为100分钟时的数学成绩(参考数据:,xi的方差为200);
(3)基于上述调查,某校提倡学生周末在校自主学习.经过一学期的实施后,抽样调查了220位学生.按照是否参与周末在校自主学习以及成绩是否有进步统计,得到2×2列联表(表二).依据表中数据及小概率值α=0.001的独立性检验,分析“周末在校自主学习与成绩进步”是否有关.
没有进步 有进步 合计
参与周末在校自主学习 35 130 165
未参与周末不在校自主学习 25 30 55
合计 60 160 220
附:方差:
相关系数:
回归方程bx+a中斜率和截距的最小二乘估计公式分别为,,.
α 0.10 0.05 0.010 0.005 0.001
χα 2.706 3.841 6.635 7.879 10.828
12.国家发改委和住建部等六部门发布通知,提到:2025年,农村生活垃圾无害化处理水平将明显提升,现阶段我国生活垃圾有填埋、焚烧、堆肥等三种处理方式,随着我国生态文明建设的不断深入,焚烧处理已逐渐成为主要方式,根据国家统计局公布的数据,对2013﹣2020年全国生活垃圾焚烧无害化处理厂的个数y(单位:座)进行统计,得到如下表格:
年份 2013 2014 2015 2016 2017 2018 2019 2020
年份代码x 1 2 3 4 5 6 7 8
垃圾焚烧无害化 处理厂的个数y 166 188 220 249 286 331 389 463
(1)根据表格中的数据,可用一元线性回归模型刻画变量y与变量x之间的线性相关关系,请用相关系数加以说明(精确到0.01);
(2)求出y关于x的线性回归方程(回归方程系数精确到0.01),并预测2024年全国生活垃圾焚烧无害化处理厂的个数;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,还能用(2)所求的线性回归方程预测吗?请简要说明理由,
参考公式:相关系数
回归方程中斜率和截距的最小二乘法估计公式分别为
参考数据:,
13.住房和城乡建设部等六部门发布通知提出,到2025年,农村生活垃圾无害化处理水平明显提升.我国生活垃圾主要有填埋、焚烧与堆肥三种处理方式,随着我国垃圾处理结构的不断优化调整,焚烧处理逐渐成为市场主流.根据国家统计局公布的数据,对2013—2020年全国生活垃圾焚烧无害化处理厂的个数y(单位:座)进行统计,得到如表表格:
年份 2013 2014 2015 2016 2017 2018 2019 2020
年份代码x 1 2 3 4 5 6 7 8
生活垃圾焚烧无害化处理厂的个数y 166 188 220 249 286 331 389 463
(1)由表中数据可知,可用线性回归模型拟合y与x之间的关系,请用相关系数加以说明;(精确到0.01)
(2)求出y关于x的线性回归方程,并预测2022年全国生活垃圾焚烧无害化处理厂的个数;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,还能用所求的线性回归方程预测吗?请简要说明理由.
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为.
参考数据:.
14.为了研究昼夜温差与引发感冒的关系,医务人员对某高中在同一时间段相同温差下的学生感冒情况进行抽样调研,所得数据统计如表1所示,并将男生感冒的人数与温差情况统计如表2所示.
表1
性别 患感冒的情况 合计
患感冒人数 不患感冒人数
男生 30 70 100
女生 42 58
p
合计
m
n
200
表2
温差x 6 7 8 9 10
患感冒人数y 8 10 14 20 23
(1)写出m,n,p的值;
(2)依据小概率值α=0.05的独立性检验判断是否可以认为在相同的温差下“性别”与“患感冒的情况”具有相关性;
(3)根据表2数据,计算y与x的相关系数r,并说明y与x的线性相关性强弱(若0.75≤|r|≤1,则认为y与x线性相关性很强;若0.3≤|r|<0.75,则认为y与x线性相关性一般;若|r|≤0.25,则认为y与x线性相关性较弱).
附表:
α 0.100 0.050 0.010 0.001
xα 2.706 3.841 6.635 10.828
参考公式及数据:,其中n=a+b+c+d.
,,,.
15.航班正点率是指航空旅客运输部门在执行运输计划时,航班实际出发时间与计划出发时间较为一致的航班数量与全部航班数量的比率.人们常用航班正点率来衡量一个航空公司的运行效率和服务质量.现随机抽取10家航空公司,对其近一年的航班正点率和顾客投诉次数进行调查,得到数据如表:
航空公司编号 1 2 3 4 5 6 7 8 9 10
航班正点率xi/% 82 77 77 76 74 73 71 70 91 69
顾客投诉次数yi/次 21 58 79 68 74 93 72 122 18 125
整理数据得:,,,,,.
(1)(i)证明:样本相关系数;
(ii)根据以上数据计算样本相关系数(结果保留2位小数),并由此推断顾客投诉次数与航班正点率之间的线性相关程度(若0.8≤|r|≤1,则认为线性相关程度很强;若0.3≤|r|<0.8,则认为线性相关程度一般;若|r|<0.3,则认为线性相关程度很弱).
(2)用一元线性回归模型对上表中的样本数据进行拟合,得到顾客投诉次数关于航班正点率的经验回归方程为.现有一家航空公司拟通过加强内部管理来减少由于公司自身原因引起的航班延误次数,并希望一年内收到的顾客投诉不超过73次,试估计该公司的航班正点率应达到多少?
参考公式:样本相关系数.
16.“十四五”规划纲要提出,全面推动长江经济带发展,协同推动生态环境保护和经济发展长江水资源约占全国总量的36%,长江流域河湖、水库、湿地面积约占全国的20%,珍稀濒危植物占全国的39.7%,淡水鱼类占全国的33%.长江经济带在我国生态文明建设中占据重要位置.长江流域某地区经过治理,生态系统得到很大改善,水生动物数量有所增加.为调查该地区某种水生动物的数量,将其分成面积相近的100个水域,从这些水域中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的水草覆盖面积(单位:公顷)和这种水生动物的数量,并计算得,,,.
(1)求该地区这种水生动物数量的估计值(这种水生动物数量的估计值等于样区这种水生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间水草覆盖面积差异很大.为提高样本的代表性以获得该地区这种水生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数.
17.新冠病毒传播以来,在世界各地造成极大影响.“动态清零”政策是我国根据疫情防控经验的总结和提炼,是现阶段我们疫情防控的一个最佳选择和总方针.为落实动态清零政策下的常态化防疫,要求学校作为重点人群,每天要进行核酸检测.某高中学校核酸抽检工作:每天下午2:30开始,当天安排1150位师生核酸检测,教职员工每天都要检测,学生五天时间全员覆盖.
(1)该校教职员工有440人,高二学生有1200人,高三学生有1100人,
①用分层抽样的方法,求高一学生每天抽检人数;
②高一年级共20个班,该年级每天抽检的学生有两种安排方案,方案一:集中来自部分班级;方案二:分散来自所有班级,每班随机抽取20%.你认为哪种方案更合理,并给出理由.
(2)学校开展核酸抽检的某轮核酸抽检用时记录如下:
第x天 1 2 3 4 5
用时y(小时) 2.5 2.3 2.1 2.1 2.0
计算变量x和y的相关系数r(精确到0.01),说明两变量线性相关的强弱;并根据r的计算结果,判定变量x和y是正相关,还是负相关,给出可能的原因.
参考数据和公式:,相关系数.
18.某公司进行工资改革,将工作效率作为工资定档的一个重要标准,大大提高了员工的工作积极性,但也引起了一些老员工的不满.为了调查员工的工资与工龄的情况,人力资源部随机从公司的技术研发部门中抽取了16名员工了解情况,结果如下:
工龄(年): 1 2 3 4 5 6 7 8
年薪(万): 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
工龄(年): 9 10 11 12 13 14 15 16
年薪(万): 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得,,,,其中xi表示工龄为i年的年薪,i=1,2,…,16.
(1)求年薪xi与工龄i(i=1,2,…,16)的相关系数r,并回答是否可以认为年薪与工龄具有线性相关关系(若|r|<0.25,则可以认为年薪与工龄不具有线性相关关系).
(2)在抽取的16名员工中,如果年薪都在之内,则继续推进工资改革,同时给每位老员工相应的补贴,如果有员工年薪在之外,该员工会被人力资源部约谈并进行岗位调整,且需要重新计算原抽取的16名员工中留下的员工年薪的均值和标准差,由于人力资源部需要安抚老员工的情绪,工作繁重,现请你帮忙计算留下的员工年薪的均值和标准差.(精确到0.01)
附:样本(xi,yi)(i=1,2,3,…,n)的相关系数,,0.2122+9.972≈99.446,15×10.02=1506.006,9.222≈85.008.
19.某公司进行工资改革,将工作效率作为工资定档的一个重要标准,大大提高了员工的工作积极性,但也引起了一些老员工的不满.为了调查员工的工资与工龄的情况,人力资源部随机从公司的技术研发部门中抽取了16名员工了解情况,结果如下:
工龄(年) 1 2 3 4 5 6 7 8
年薪(万 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
工龄(年) 9 10 11 12 13 14 15 16
年薪(万 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得,,,
其中xi表示工龄为i年的年薪,i=1,2,…,16.
(1)求年薪xi与工龄i(i=1,2,…,16)的相关系数r,并回答是否可以认为年薪与工龄具有线性相关关系(若|r|<0.25,则可以认为年薪与工龄不具有线性相关关系).
(2)在抽取的16名员工中,如果年薪都在之内,则继续推进工资改革,同时给每位老员工相应的补贴,如果有员工年薪在之外,该员工会被人力资源部门约谈并进行岗位调整,且需要重新计算原抽取的16名员工中留下的员工年薪的均值和标准差.(精确到0.01).
附:样本(xi,yi)(i=1,2,…,16)的相关系数,,0.2122+9.972≈99.446,15×10.02=1506.006,9.222≈85.008.
20.某校20名学生的数学成绩xi(i=1,2, ,20)和知识竞赛成绩yi(i=1,2, ,20)如下表:
学生编号i 1 2 3 4 5 6 7 8 9 10
数学成绩xi 100 99 96 93 90 88 85 83 80 77
知识竞赛成绩yi 290 160 220 200 65 70 90 100 60 270
学生编号i 11 12 13 14 15 16 17 18 19 20
数学成绩xi 75 74 72 70 68 66 60 50 39 35
知识竞赛成绩yi 45 35 40 50 25 30 20 15 10 5
计算可得数学成绩的平均值是,知识竞赛成绩的平均值是,并且,,.
(1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到0.01).
(2)设N∈N*,变量x和变量y的一组样本数据为{(xi,yi)|i=1,2, ,N},其中xi(i=1,2, ,N)两两不相同,yi(i=1,2, ,N)两两不相同.记xi在{xn|n=1,2, ,N}中的排名是第Ri位,yi在{yn|n=1,2, ,N}中的排名是第Si位,i=1,2, ,N.定义变量x和变量y的“斯皮尔曼相关系数”(记为ρ)为变量x的排名和变量y的排名的样本相关系数.
(i)记di=Ri﹣Si,i=1,2, ,N.证明:.
(ii)用(i)的公式求这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”(精确到0.01).
(3)比较(1)和(2)(ii)的计算结果,简述“斯皮尔曼相关系数”在分析线性相关性时的优势.
注:参考公式与参考数据.;;.
样本相关系数(解答题)
参考答案与试题解析
一.解答题(共20小题)
1.广阳岛,作为长江上游最大的江心岛,其面积在枯水期约为10平方公里.自2017年起,重庆市开始对广阳岛进行系统的生态修复,摒弃了曾经的商业开发计划,转而建设“长江风景眼,重庆生态岛”.经过数年的努力,广阳岛的生态得到了显著的改善,不仅植被丰富,生物多样性也得到了极大的提升.据监测,岛上的鸟类从生态修复前的124种增加到213种,其中包括中华秋沙鸭、游隼、白琵鹭等珍稀鸟类.为调查广阳岛某种鸟的数量,将其分成面积相近的50个地块,从这些地块中用简单随机抽样的方法抽取5个作为样区,调查得到样本数据(xi,yi)(i=1,2, ,5),其中xi和yi分别表示第i个样区的植被覆盖面积(单位:平方公里)和这种鸟的数量.
i 1 2 3 4 5
xi 0.171 0.152 0.192 0.189 0.196
yi 12 10 16 14 18
(1)求广阳岛这种鸟数量的估计值(这种鸟数量的估计值等于样区这种鸟数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2, ,5)的相关系数(精确到0.01);
(3)根据统计资料,各地块间植物覆盖面积差异较大.为提高样本的代表性以获得广阳岛这种鸟数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数.
【分析】(1)求出样本平均数,再乘以地块数得出结果;
(2)根据题中所给数据,代入,可得结果;
(3)由(2)知各样区的这种鸟的数量与植物覆盖面积有很强的正相关,各地块间这种植物数量差异很大,适合采用分层抽样.
【解答】解:(1)由已知得样本平均数(12+10+16+14+18)=14,
∴广阳岛这种鸟数量的估计值为14×50=700.
(2)0.18,14,
0.009×2+0.028×4+0.012×2+0.016×4=0.218,
∴样本的相关系数r0.94.
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对50个地块进行分层抽样.
理由如下:
由(2)知各样区的这种鸟数量与植物覆盖面积有很强的正相关,
由于各地块间植物覆盖面积差异很大,从而各地块间这种鸟数量差异也很大,
采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,
提高了样本的代表性,从而可以获得广阳岛这种鸟数量晴儿准确的估计.
【点评】本题考查平均数、方差、求和公式、相关系数、分层抽样等基础知识,考查运算求解能力,是基础题.
2.某沙漠地区经过治理,生态系统得到很大改善,人工栽培和野生植物数量不断增加.为调查该地区某种植物的数量,将其分成面积相近的150个地块,从这些地块中用简单随机抽样的方法抽取15个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,15),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种植物的数量,并计算得,,,,.
(1)求该地区这种植物数量的估计值(这种植物数量的估计值等于样区这种植物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,15)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种植物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数,.
【分析】(1)根据已知条件,先求出样本平均数,在乘以地块,即可求解.
(2)根据已知条件,结合相关系数的公式,即可求解.
(3)根据已知条件,结合分层抽样的定义,即可求解.
【解答】解:(1)由已知得样本平均数,
从而该地区这种植物数量的估计值为700×150=105000.
(2)样本(xi,yi)(i=1,2,…,15)的相关系数.
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对150个地块进行分层抽样,
理由如下:由(2)知各样区的这种植物数量与植物覆盖面积有很强的正相关,
由于各地块间植物覆盖面积差异很大,从而各地块间这种植物数量差异也很大,
采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种植物数量更准确的估计.
【点评】本题主要考查相关系数的公式,以及分层抽样的定义,属于基础题.
3.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2, ,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量(单位:头),并计算得,,,,.
(1)估计该地区这种野生动物的数量;
(2)求样本(xi,yi)(i=1,2, ,20)的相关系数.(精确到0.01)
【分析】(1)先计算20个样区的野生动物的平均数量,再计算200,即可;
(2)根据相关系数r的计算公式,即可得解.
【解答】解:(1)由题意知,20个样区的野生动物的平均数量60头,
所以200个地块的野生动物的数量为200×60=12000头.
(2)相关系数r0.94.
【点评】本题考查样本平均数与相关系数的求法,考查逻辑推理能力和运算能力,属于基础题.
4.大学生刘铭去某工厂实习,实习结束时从自己制作的某种零件中随机选取了10个样品,测量每个零件的横截面积(单位:mm2)和耗材量(单位:mm3),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
零件的横截面积xi 0.03 0.05 0.04 0.07 0.07 0.04 0.05 0.06 0.06 0.05 0.52
耗材量yi 0.24 0.40 0.23 0.55 0.50 0.34 0.35 0.45 0.43 0.41 3.9
并计算得0.0286,1.6166,0.2131.
(1)估算刘铭同学制作的这种零件平均每个零件的横截面积以及平均一个零件的耗材量;
(2)求刘铭同学制作的这种零件的横截面积和耗材量的样本相关系数(精确到0.01);
(3)刘铭同学测量了自己实习期制作的所有这种零件的横截面积,并得到所有这种零件的横截面积的和为182mm2,若这种零件的耗材量和其横截面积近似成正比,请帮刘铭计算一下他制作的零件的总耗材量的估计值.
附:参考公式和数据:相关系数.r;1.221.
【分析】(1)由已知直接利用平均数公式求解;(2)直接利用相关系数公式求解;(3)利用这种零件的耗材量和其横截面积近似成正比列式求解.
【解答】解:(1)样本中10个这种零件的横截面积的平均值,
样本中10个这种零件的耗材量的平均值,
由此可估算刘铭同学制作的这种零件平均每个零件的横截面积为0.052mm2,
平均一个零件的耗材量为0.39mm3;
(2)r
0.84;
(3)设这种零件的总耗材量的估计值为tmm3,
又已知这种零件的耗材量和其横截面积近似成正比,
∴,解得t=1365mm3,
故这种零件的总耗材量的估计值为1365mm3.
【点评】本题考查平均数与相关系数的求法,考查运算求解能力,是基础题.
5.为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).如表是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序 1 2 3 4 5 6 7 8
零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
抽取次序 9 10 11 12 13 14 15 16
零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得,,,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在
之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ii)请利用已经学过的方差公式:来证明方差第二公式.
(iii)在之外的数据称为离群值,试剔除离群值,并利用(ii)中公式估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(xi,yi)(i=1,2,…,n)的相关系数,.
【分析】(1)代入数据计算,比较|r|与0.25的大小作出结论;
(2)(i)计算合格零件尺寸范围,得出结论;
(ii)利用方差公式证明即可;
(iii)代入公式计算即可.
【解答】解:(1)r0.18.
∵|r|<0.25,
∴可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小;
(2)(i)9.97,s=0.212,
∴合格零件尺寸范围是(9.334,10.606),
显然第13号零件尺寸不在此范围之内,
∴需要对当天的生产过程进行检查;
(ii)证明:[2](2)2;
(iii)剔除离群值后,剩下的数据平均值为10.02,
由s22可得,16×0.2122+16×9.972=1591.134,
∴1591.134﹣9.222,
∴剔除离群值后样本方差为(1591.134﹣9.222)﹣10.022≈0.008,
∴剔除离群值后样本标准差约为0.09.
【点评】本题考查了相关系数的计算,样本均值与标准差的计算,属于中档题.
6.将保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中15个区域进行编号,统计抽取到的每个区域的某种水源指标xi和区域内该植物分布的数量yi(i=1,2, ,15),得到数组(xi,yi).已知,,(xi)(yi)=480.
(1)求样本(xi,yi)(i=1,2, ,15)的样本相关系数;
(2)假设该植物的寿命为随机变量X(X可取任意正整数),研究人员统计大量数据后发现,对于任意的k∈N*,寿命为k+1的样本在寿命超过k的样本里的数量占比与寿命为1的样本在全体样本中的数量占比相同,均为0.1,这种现象被称为“几何分布的无记忆性”.用含k的式子表示P(X=k)(k∈N*),并求P(X=2024)的值.
附:样本相关系数,当k足够大时,k×0.9k≈0.
【分析】(1)根据相关系数r的公式计算;
(2)由题意可知P(X=k+1)=0.1P(X>k),当k≥2时,把k换成k﹣1,则P(X=k)=0.1P(X>k﹣1),两式相减得,即{P(X=k)}是首项为0.1,公比为0.9的等比数列,再结合等比数列的通项公式求出P(X=k),令k=2024即可求出P(X=2024)的值.
【解答】解:(1)由题意可知,,,,
所以样本相关系数r0.8;
(2)依题意,P(X=1)=P(X=k+1|X>k)=0.1,又,
则P(X=k+1)=0.1P(X>k),
当k≥2时,把k换成k﹣1,则P(X=k)=0.1P(X>k﹣1),
两式相减得,P(X=k)﹣P(X=k+1)=0.1P(X=k),
即,
又P(X=2)=0.1P(X>1)=0.1×(1﹣P(X=1))=0.9P(X=1),
所以 对任意k∈N*都成立,
从而{P(X=k)}是首项为0.1,公比为0.9的等比数列,
所以P(X=k)=0.1×0.9k﹣1,
因为当k足够大时,k×0.9k≈0,
所以P(X=2024)=0.1×0.92023≈0.
【点评】本题主要考查了相关系数的计算,考查了条件概率公式的应用,以及等比数列的应用,属于中档题.
7.某食品加工厂新研制出一种袋装食品(规格:500g/袋),下面是近六个月每袋出厂价格(单位:元)与销售量(单位:万袋)的对应关系表:
月份序号 1 2 3 4 5 6
每袋出厂价格xi 10.5 10.9 11 11.5 12 12.5
月销售量yi 2.2 2 1.9 1.8 1.5 1.4
并计算得,,.
(1)计算该食品加工厂这六个月内这种袋装食品的平均每袋出厂价格、平均月销售量和平均月销售收入;
(2)求每袋出厂价格与月销售量的样本相关系数(精确到0.01);
(3)若样本相关系数|r|≥0.75,则认为相关性很强;否则没有较强的相关性.你认为该食品加工厂制定的每袋食品的出厂价格与月销售量是否有较强的相关性.
附:样本相关系数,.
【分析】(1)由表格中数据和参考数据进行计算即可;
(2)将样本相关系数公式转化为,利用表中数据和参考数据进行计算即可;
(3)将(2)中样本相关系数的绝对值与0.75进行比较即可.
【解答】解:(1)该食品加工厂这六个月内这种袋装食品的平均每袋出厂价格为:
(元),
平均月销售量为(万袋),
平均月销售收入为(万元);
(2)由已知,每袋出厂价格与月销售量的样本相关系数为:

(3)由于每袋出厂价格与月销售量的样本相关系数|r|≈0.98>0.75,
所以该食品加工厂制定的每袋食品的出厂价格与月销售量有较强的相关性.
【点评】本题主要考查了相关系数的计算,考查了线性回归方程的求解,属于中档题.
8.黄河是中华民族的母亲河、生命河,也是一条桀骜难驯的忧患之河.小浪底水利枢纽工程位于河南省济源市、洛阳市孟津区边界,是黄河治理开发的关键控制性工程.它控制着黄河92%的流域面积、91%的径流量和近100%的泥沙,以防洪、防淩、减淤为主,兼顾供水、灌溉、发电,不仅是中华民族治黄史上的丰碑,也是世界水利工程史上最具标志性的杰作之一,其大坝为预测渗压值和控制库水位,工程师在水库选取一支编号为HN1渗压计,随机收集10个该渗压计管内水位和水库水位监测数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
水库水位xi/m 75.69 75.74 75.77 75.78 75.81 75.85 75.67 75.87 75.9 75.93 758.01
HN1渗压计管内水位y1/m 72.88 72.90 72.92 72.92 72.93 72.94 72.94 72.95 72.96 72.98 729.32
并计算得,53190.77,55283.20,72.9322=5319.076624,75.8012=5745.791601,.
(Ⅰ)求该水库HN1号渗压计管内水位与水库水位的样本相关系数(精确到0.01);
(Ⅱ)某天雨后工程师测量了水库水位,并得到水库的水位为76m.利用以上数据给出此时HN1号渗压计管内水位的估计值.
附:相关系数,,.
【分析】(Ⅰ)根据相关系数公式计算即可;
(Ⅱ)根据最小二乘法计算可得回归方程,再代入76m可得预测数据.
【解答】解:(Ⅰ)由表格易得:水库的平均水位,
HN1号渗压计管内平均水位,
又,
同理可得:,



(Ⅱ)∵,

∴HN1号渗压计管内水位关于水库水位的经验回归方程为,
当x=76时,预测值y=0.23×76+55.5=72.98,
即水库的水位为76m时,HN1号渗压计管内水位的估计值为72.98m.
【点评】本题考查了相关系数和回归方程的计算,属于中档题.
9.住房和城乡建设部等六部门发布通知提出,到2025年,农村生活垃圾无害化处理水平明显提升.我国生活垃圾主要有填埋、焚烧与堆肥三种处理方式,随着我国垃圾处理结构的不断优化调整,焚烧处理逐渐成为市场主流.根据国家统计局公布的数据,对2013﹣2020年全国生活垃圾焚烧无害化处理厂的个数y(单位:座)进行统计,得到如下表格:
年份 2013 2014 2015 2016 2017 2018 2019 2020
年份代码x 1 2 3 4 5 6 7 8
生活垃圾焚烧无害化处理厂的个数y 166 188 220 249 286 331 389 463
(1)由表中数据可知,可用线性回归模型拟合y与x之间的关系,请用相关系数加以说明;(精确到0.01)
(2)求出y关于x的线性回归方程,并预测2022年全国生活垃圾焚烧无害化处理厂的个数;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,还能用所求的线性回归方程预测吗?请简要说明理由.
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.
参考数据:,,,,5732=328329,,.
【分析】(1)由题意计算出,,结合已知代入相关系数r公式计算可得答案;
(2)计算出,代入可得y关于x的线性回归方程,2022年对应的年份代码x=10,代入所求线性回归方程可得答案;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,不能用所求线性回归方程预测,理由说出一点即可.
【解答】解:(1)由题意,,,
所以相关系数,
因为y与x的相关系数r≈0.98,接近于1,
所以y与x的线性相关程度相当高,可用线性回归模型拟合y与x之间的关系;
(2)根据参考数据可得,,
所以,
所以y关于x的线性回归方程为,
因为2022年对应的年份代码x=10,
所以当x=10时,,
即预测2022年全国生活垃圾焚烧无害化处理厂的个数为513;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,不能用所求线性回归方程预测,
理由如下(说出一点即可):
①线性回归方程具有时效性,不能预测较远情况;
②全国生活垃圾焚烧无害化处理厂的个数有可能达到上限,一段时间内不再新建;
③受国家政策的影响,可能产生新的生活垃圾无害化处理方式.
【点评】本题主要考查了相关系数的求解和性质,考查了利用最小二乘法求线性回归方程,属于中档题.
10.“十四五”规划纲要提出,全面推动长江经济带发展,协同推动生态环境保护和经济发展.长江水资源约占全国总量的36%,长江流域河湖、水库、湿地面积约占全国的20%,珍稀濒危植物约占全国的39.7%,淡水鱼类约占全国的33%.长江经济带在我国生态文明建设中占据重要位置.长江流域某地区经过治理,生态系统得到很大改善,水生动物数量有所增加.为调查该地区A种水生动物的数量,将其分成面积相近的100个小水域,从这些小水域中用简单随机抽样的方法抽取20个作为样本,调查得到样本数据(xi,yi)(i=1,2, ,20),其中xi和yi分别表示第i个样本区域的水草覆盖面积(单位:公顷)和A种水生动物的数量,并计算得.
(1)求该地区A种水生动物数量的估计值(A种水生动物数量的估计值等于样本区域A种水生动物数量的平均数乘以小水域数);
(2)求样本(xi,yi)(i=1,2, ,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间水草覆盖面积差异很大.为提高样本的代表性以获得该地区A种水生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r1.732.
【分析】(1)根据该地区这种水生动物数量的估计值的计算方法求解即可;
(2)根据相关系数的公式求解即可;
(3)根据(2)中的结论各样区的这种水生动物的数量与水草覆盖面积有很强的正相关性考虑即可.
【解答】解:(1)样区水生动物平均数为,地块数为100,该地区这种水生动物的估计值为100×60=6000.
(2)样本(xi,yi)(i=1,2,…,20)的相关系数为
(3)由(2)知各样区的这种水生动物的数量与水草覆盖面积有很强的正相关性,由于各地块间水草覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,所以采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地区这种水生动物数量更准确的估计.
【点评】本题考查了相关系数的计算以及抽样方式的选择,属于中档题.
11.为了了解高中学生课后自主学习数学时间(x分钟/每天)和他们的数学成绩(y分)的关系,某实验小组做了调查,得到一些数据(表一).
编号 1 2 3 4 5
学习时间x 30 40 50 60 70
数学成绩y 65 78 85 99 108
(1)求数学成绩y与学习时间x的相关系数(精确到0.001);
(2)请用相关系数说明该组数据中y与x之间的关系可用线性回归模型进行拟合,并求出y关于x的回归直线方程,并由此预测每天课后自主学习数学时间为100分钟时的数学成绩(参考数据:,xi的方差为200);
(3)基于上述调查,某校提倡学生周末在校自主学习.经过一学期的实施后,抽样调查了220位学生.按照是否参与周末在校自主学习以及成绩是否有进步统计,得到2×2列联表(表二).依据表中数据及小概率值α=0.001的独立性检验,分析“周末在校自主学习与成绩进步”是否有关.
没有进步 有进步 合计
参与周末在校自主学习 35 130 165
未参与周末不在校自主学习 25 30 55
合计 60 160 220
附:方差:
相关系数:
回归方程bx+a中斜率和截距的最小二乘估计公式分别为,,.
α 0.10 0.05 0.010 0.005 0.001
χα 2.706 3.841 6.635 7.879 10.828
【分析】(1)根据题意分别求出,,代入到相关系数:,求得结果即可;
(2)知r≈0.996接近1,故与之间具有极强的线性相关关系,用公式求
,,最后代入x=100即可求得;
(3)计算出χ2与临界值比较可得出周末在校自主学习与成绩进步是否有关.
【解答】解:(1),,
又xi(i=1,2,3, ,5)的方差为,
=484+81+4+144+441=1154,

(2)由(1)知r≈0.996接近1,故与之间具有极强的线性相关关系,可用线性回归直线方程模型进行拟合,
∴,

故,
当x=100时,y=140.5,
故预测每天课后自主学习数学时间达到100分钟时的数学成绩为140;
(3)零假设H0:周末在校自主学习与成绩进步无关,
根据数据,计算得到:

因为12.22>10.828,
所以依据α=0.001的独立性检验,可以认为“周末自主学习与成绩进步”有关.
【点评】本题考查线性回归分析的应用,独立性检验原理的应用,属中档题.
12.国家发改委和住建部等六部门发布通知,提到:2025年,农村生活垃圾无害化处理水平将明显提升,现阶段我国生活垃圾有填埋、焚烧、堆肥等三种处理方式,随着我国生态文明建设的不断深入,焚烧处理已逐渐成为主要方式,根据国家统计局公布的数据,对2013﹣2020年全国生活垃圾焚烧无害化处理厂的个数y(单位:座)进行统计,得到如下表格:
年份 2013 2014 2015 2016 2017 2018 2019 2020
年份代码x 1 2 3 4 5 6 7 8
垃圾焚烧无害化 处理厂的个数y 166 188 220 249 286 331 389 463
(1)根据表格中的数据,可用一元线性回归模型刻画变量y与变量x之间的线性相关关系,请用相关系数加以说明(精确到0.01);
(2)求出y关于x的线性回归方程(回归方程系数精确到0.01),并预测2024年全国生活垃圾焚烧无害化处理厂的个数;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,还能用(2)所求的线性回归方程预测吗?请简要说明理由,
参考公式:相关系数
回归方程中斜率和截距的最小二乘法估计公式分别为
参考数据:,
【分析】(1)根据相关系数的公式,即可代入求值,根据相关系数的大小即可作出判断;
(2)利用参考公式及参考数据求,由此可得回归方程,利用回归方程预测2024年全国生活垃圾焚烧无害化处理厂的个数;
(3)根据相关关系不是确定的函数关系,而受多因素影响,即可求解.
【解答】解:(1),
相关系数

因为y与x的相关系数r=0.98,接近1,所以y与x的线性相关程度很高,
所以可用线性回归模型拟合y与x的关系.
(2),

又2024年对应的年份代码x=12,
当x=12时,,
所以预测2024年全国生活垃圾焚烧无害化处理厂的个数为595.
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,不能由(2)所求的线性回归方程预测,理由如下(说出一点即可):
①线性回归方程具有时效性,不能预测较远情况;
②全国生活垃圾焚烧无害化处理厂的个数有可能达到上限,一段时间内不再新建;
③受国家政策的影响,可能产生新的生活垃圾无害化处理方式.
【点评】本题主要考查了相关系数的求解和性质,考查了利用最小二乘法求线性回归方程,属于中档题.
13.住房和城乡建设部等六部门发布通知提出,到2025年,农村生活垃圾无害化处理水平明显提升.我国生活垃圾主要有填埋、焚烧与堆肥三种处理方式,随着我国垃圾处理结构的不断优化调整,焚烧处理逐渐成为市场主流.根据国家统计局公布的数据,对2013—2020年全国生活垃圾焚烧无害化处理厂的个数y(单位:座)进行统计,得到如表表格:
年份 2013 2014 2015 2016 2017 2018 2019 2020
年份代码x 1 2 3 4 5 6 7 8
生活垃圾焚烧无害化处理厂的个数y 166 188 220 249 286 331 389 463
(1)由表中数据可知,可用线性回归模型拟合y与x之间的关系,请用相关系数加以说明;(精确到0.01)
(2)求出y关于x的线性回归方程,并预测2022年全国生活垃圾焚烧无害化处理厂的个数;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,还能用所求的线性回归方程预测吗?请简要说明理由.
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为.
参考数据:.
【分析】(1)利用相关系数的定义求出r,即可求解;
(2)先求,,即可得到线性回归方程,再将x=10代入即可求解;
(3)言之有理即可.
【解答】解:(1)由题意,4.5,286.5,
r
0.98>0.75,
所以y与x的线性相关程度相当高,可用线性回归模型拟合y与x之间的关系;
(2)由题意,41.12,286.5﹣41.12×4.5=101.46,
所以y关于x的线性回归方程为41.12x+101.46,
当x=10时,41.12×10+101.46=512.66≈513,
所以预测2022年全国生活垃圾焚烧无害化处理厂的个数为513;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,不能用所求线性回归方程预测,理由如下:
①线性回归方程具有时效性,不能预测较远情况;
②全国生活垃圾焚烧无害化处理厂的个数有可能达到上限,一段时间内不再新建;
③受国家政策的影响,可能产生新的生活垃圾无害化处理方式.
【点评】本题考查相关系数以及线性回归方程,属于中档题.
14.为了研究昼夜温差与引发感冒的关系,医务人员对某高中在同一时间段相同温差下的学生感冒情况进行抽样调研,所得数据统计如表1所示,并将男生感冒的人数与温差情况统计如表2所示.
表1
性别 患感冒的情况 合计
患感冒人数 不患感冒人数
男生 30 70 100
女生 42 58
p
合计
m
n
200
表2
温差x 6 7 8 9 10
患感冒人数y 8 10 14 20 23
(1)写出m,n,p的值;
(2)依据小概率值α=0.05的独立性检验判断是否可以认为在相同的温差下“性别”与“患感冒的情况”具有相关性;
(3)根据表2数据,计算y与x的相关系数r,并说明y与x的线性相关性强弱(若0.75≤|r|≤1,则认为y与x线性相关性很强;若0.3≤|r|<0.75,则认为y与x线性相关性一般;若|r|≤0.25,则认为y与x线性相关性较弱).
附表:
α 0.100 0.050 0.010 0.001
xα 2.706 3.841 6.635 10.828
参考公式及数据:,其中n=a+b+c+d.
,,,.
【分析】(1)根据表1计算可得结果;
(2)先零假设,再计算χ2,结合临界值表可得结论;
(3)根据公式计算r可得结论.
【解答】解:(1)m=30+42=72,n=70+58=128,p=42+58=100.
(2)零假设H0:在相同的温差下“性别”与“患感冒的情况”不具有相关性,

因为3.125<x0.05=3.841,所以根据小概率值α=0.05的独立性检验,没有充分证据推断H0不成立,
因此可以认为H0成立,即不能认为在相同的温差下“性别”与“患感冒的情况”具有相关性.
(3),,
(6﹣8)(8﹣15)+(7﹣8)(10﹣15)+(8﹣8)(14﹣15)+(9﹣8)(20﹣15)+(10﹣8)(23﹣15)=40,
所以0.9877>0.75,
所以y与x线性相关性很强.
【点评】本题考查独立性检验相关知识,属于中档题.
15.航班正点率是指航空旅客运输部门在执行运输计划时,航班实际出发时间与计划出发时间较为一致的航班数量与全部航班数量的比率.人们常用航班正点率来衡量一个航空公司的运行效率和服务质量.现随机抽取10家航空公司,对其近一年的航班正点率和顾客投诉次数进行调查,得到数据如表:
航空公司编号 1 2 3 4 5 6 7 8 9 10
航班正点率xi/% 82 77 77 76 74 73 71 70 91 69
顾客投诉次数yi/次 21 58 79 68 74 93 72 122 18 125
整理数据得:,,,,,.
(1)(i)证明:样本相关系数;
(ii)根据以上数据计算样本相关系数(结果保留2位小数),并由此推断顾客投诉次数与航班正点率之间的线性相关程度(若0.8≤|r|≤1,则认为线性相关程度很强;若0.3≤|r|<0.8,则认为线性相关程度一般;若|r|<0.3,则认为线性相关程度很弱).
(2)用一元线性回归模型对上表中的样本数据进行拟合,得到顾客投诉次数关于航班正点率的经验回归方程为.现有一家航空公司拟通过加强内部管理来减少由于公司自身原因引起的航班延误次数,并希望一年内收到的顾客投诉不超过73次,试估计该公司的航班正点率应达到多少?
参考公式:样本相关系数.
【分析】(1)(i)将展开,结合平均数意义化简可得,然后分别用替代,用分别替代可证;
(ii)根据所给数据代入公式计算,然后可作出判断;
(2)利用样本中心点求,然后根据回归方程解不等式可得.
【解答】解:(1)(i)证明:

在上式中分别用替代,得,
同理,也有,
故样本相关系数.
(ii)可知,.
∴,




故顾客投诉次数与航班正点率之间的线性相关程度很强.
(2),
令5x+453≤73,得x≥76,即该公司的航班正点率应达到76%.
【点评】本题主要考查相关系数,线性回归方程,考查运算求解能力,属于中档题.
16.“十四五”规划纲要提出,全面推动长江经济带发展,协同推动生态环境保护和经济发展长江水资源约占全国总量的36%,长江流域河湖、水库、湿地面积约占全国的20%,珍稀濒危植物占全国的39.7%,淡水鱼类占全国的33%.长江经济带在我国生态文明建设中占据重要位置.长江流域某地区经过治理,生态系统得到很大改善,水生动物数量有所增加.为调查该地区某种水生动物的数量,将其分成面积相近的100个水域,从这些水域中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的水草覆盖面积(单位:公顷)和这种水生动物的数量,并计算得,,,.
(1)求该地区这种水生动物数量的估计值(这种水生动物数量的估计值等于样区这种水生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间水草覆盖面积差异很大.为提高样本的代表性以获得该地区这种水生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数.
【分析】(1)根据该地区这种水生动物数量的估计值的计算方法求解即可;
(2)根据相关系数的公式求解即可;
(3)根据(2)中的结论各样区的这种水生动物的数量与水草覆盖面积有很强的正相关性考虑即可
【解答】解:(1)样区水生动物平均数为yi,地块数为100,该地区这种水生动物的估计值为60×100=6000.
(2)样本(xi,yi)(i=1,2,3...20)的相关系数为
r0.96.
(3)由(2)知各样区的这种水生动物的数量与水草覆盖面积有很强的正相关性,由于各地块间水草覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,所以采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地区这种水生动物数量更准确的估计.
【点评】本题考查相关系数的概念,是中档题.
17.新冠病毒传播以来,在世界各地造成极大影响.“动态清零”政策是我国根据疫情防控经验的总结和提炼,是现阶段我们疫情防控的一个最佳选择和总方针.为落实动态清零政策下的常态化防疫,要求学校作为重点人群,每天要进行核酸检测.某高中学校核酸抽检工作:每天下午2:30开始,当天安排1150位师生核酸检测,教职员工每天都要检测,学生五天时间全员覆盖.
(1)该校教职员工有440人,高二学生有1200人,高三学生有1100人,
①用分层抽样的方法,求高一学生每天抽检人数;
②高一年级共20个班,该年级每天抽检的学生有两种安排方案,方案一:集中来自部分班级;方案二:分散来自所有班级,每班随机抽取20%.你认为哪种方案更合理,并给出理由.
(2)学校开展核酸抽检的某轮核酸抽检用时记录如下:
第x天 1 2 3 4 5
用时y(小时) 2.5 2.3 2.1 2.1 2.0
计算变量x和y的相关系数r(精确到0.01),说明两变量线性相关的强弱;并根据r的计算结果,判定变量x和y是正相关,还是负相关,给出可能的原因.
参考数据和公式:,相关系数.
【分析】(1)①直接利用分层抽样的公式求出高一学生每天抽检的人数;
②根据实际情况,结合题意,判断方案二更合理些;
(2)利用公式计算变量x和y的相关系数r,由此判断两变量线性相关的强弱,以及正、负相关性.
【解答】解:(1)①用分层抽样法,计算高一学生每天抽检人数为1150﹣440250;
②方案二更合理,因为新冠病毒奥密克戎毒株传染性更强、潜伏期更短,
分散抽检可以全面检测年级中每个班级学生的状况,更有利于防控筛查工作;
(2)由表中数据,计算(1+2+3+4+5)=3,(2.5+2.3+2.1+2.1+2.0)=2.2,
(xi)(yi)=(﹣2)×0.3+(﹣1)×0.1+0×(﹣0.1)+1×(﹣0.1)+2×(﹣0.2)=﹣1.2,
(﹣2)2+(﹣1)2+02+12+22=10,
0.32+0.12+(﹣0.1)2+(﹣0.1)2+(﹣0.2)2=0.16,
所以变量x和y的相关系数r0.95,
因为|r|=0.95,说明两变量线性相关很强,根据r<0知,变量x和y是负相关,
可能的原因是,随着抽检工作的开展,学校相关管理协调工作效率提高,因此用时较短.
【点评】本题考查了相关系数的应用问题,也考查了数据分析与计算求解能力,是中档题.
18.某公司进行工资改革,将工作效率作为工资定档的一个重要标准,大大提高了员工的工作积极性,但也引起了一些老员工的不满.为了调查员工的工资与工龄的情况,人力资源部随机从公司的技术研发部门中抽取了16名员工了解情况,结果如下:
工龄(年): 1 2 3 4 5 6 7 8
年薪(万): 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
工龄(年): 9 10 11 12 13 14 15 16
年薪(万): 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得,,,,其中xi表示工龄为i年的年薪,i=1,2,…,16.
(1)求年薪xi与工龄i(i=1,2,…,16)的相关系数r,并回答是否可以认为年薪与工龄具有线性相关关系(若|r|<0.25,则可以认为年薪与工龄不具有线性相关关系).
(2)在抽取的16名员工中,如果年薪都在之内,则继续推进工资改革,同时给每位老员工相应的补贴,如果有员工年薪在之外,该员工会被人力资源部约谈并进行岗位调整,且需要重新计算原抽取的16名员工中留下的员工年薪的均值和标准差,由于人力资源部需要安抚老员工的情绪,工作繁重,现请你帮忙计算留下的员工年薪的均值和标准差.(精确到0.01)
附:样本(xi,yi)(i=1,2,3,…,n)的相关系数,,0.2122+9.972≈99.446,15×10.02=1506.006,9.222≈85.008.
【分析】(1)计算相关系数r,与|r|<0.25比较即可得出结论.
(2)求出之内的范围,找出离群值,剔除离群值,计算剩下的数据平均值和方差、标准差.
【解答】解:(1)计算相关系数r0.18.
因为|r|<0.25,所以可认为年薪与工龄不具有线性相关关系.
(2)因为9.97,s=0.212,所以在之内的范围是(9.334,10.606),
显然第13号员工不在此范围之内,所以需要对余下的员工进行计算,剔除离群值后,剩下的数据平均值为(16×9.97﹣9.22)=10.02,
16×0.2122+16×9.972=1591.134,
所以剔除离群值后样本方差为(1591.134﹣9.222﹣15×10.022)=0.008,
剔除离群值后样本标准差为0.09.
【点评】本题考查了相关系数、平均值和方差、标准差的计算问题,也考查了数据分析与运算求解能力,是中档题.
19.某公司进行工资改革,将工作效率作为工资定档的一个重要标准,大大提高了员工的工作积极性,但也引起了一些老员工的不满.为了调查员工的工资与工龄的情况,人力资源部随机从公司的技术研发部门中抽取了16名员工了解情况,结果如下:
工龄(年) 1 2 3 4 5 6 7 8
年薪(万 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
工龄(年) 9 10 11 12 13 14 15 16
年薪(万 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得,,,
其中xi表示工龄为i年的年薪,i=1,2,…,16.
(1)求年薪xi与工龄i(i=1,2,…,16)的相关系数r,并回答是否可以认为年薪与工龄具有线性相关关系(若|r|<0.25,则可以认为年薪与工龄不具有线性相关关系).
(2)在抽取的16名员工中,如果年薪都在之内,则继续推进工资改革,同时给每位老员工相应的补贴,如果有员工年薪在之外,该员工会被人力资源部门约谈并进行岗位调整,且需要重新计算原抽取的16名员工中留下的员工年薪的均值和标准差.(精确到0.01).
附:样本(xi,yi)(i=1,2,…,16)的相关系数,,0.2122+9.972≈99.446,15×10.02=1506.006,9.222≈85.008.
【分析】(1)根据题目中的数据,计算相关系数r,即可得出统计结论.
(2)由和s求出,找出离群值,再重新计算留下的员工年薪的均值和方差、标准差.
【解答】解:(1)因为s≈0.212,,,
所以相关系数r0.18,
因为|r|=0.18<0.25,所以可以认为年薪与工龄不具有线性相关关系.
(2)因为9.97,s=0.212,所以在之内的范围是(9.334,10.606),
所以13号员工年薪在之外,
重新计算原抽取的16名员工中留下的员工年薪的均值为(16×9.97﹣9.22)=10.02,
由16×0.2122+16×9.972=16×99.446=1591.134,
所以剔除离群值后样本方差为(1591.134﹣9.222﹣15×10.022)(1591.134﹣85.008﹣1506.006)=0.008,
所以标准差为0.09.
【点评】本题考查了相关系数计算问题,也考查了均值与方差、标准差计算问题,是中档题.
20.某校20名学生的数学成绩xi(i=1,2, ,20)和知识竞赛成绩yi(i=1,2, ,20)如下表:
学生编号i 1 2 3 4 5 6 7 8 9 10
数学成绩xi 100 99 96 93 90 88 85 83 80 77
知识竞赛成绩yi 290 160 220 200 65 70 90 100 60 270
学生编号i 11 12 13 14 15 16 17 18 19 20
数学成绩xi 75 74 72 70 68 66 60 50 39 35
知识竞赛成绩yi 45 35 40 50 25 30 20 15 10 5
计算可得数学成绩的平均值是,知识竞赛成绩的平均值是,并且,,.
(1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到0.01).
(2)设N∈N*,变量x和变量y的一组样本数据为{(xi,yi)|i=1,2, ,N},其中xi(i=1,2, ,N)两两不相同,yi(i=1,2, ,N)两两不相同.记xi在{xn|n=1,2, ,N}中的排名是第Ri位,yi在{yn|n=1,2, ,N}中的排名是第Si位,i=1,2, ,N.定义变量x和变量y的“斯皮尔曼相关系数”(记为ρ)为变量x的排名和变量y的排名的样本相关系数.
(i)记di=Ri﹣Si,i=1,2, ,N.证明:.
(ii)用(i)的公式求这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”(精确到0.01).
(3)比较(1)和(2)(ii)的计算结果,简述“斯皮尔曼相关系数”在分析线性相关性时的优势.
注:参考公式与参考数据.;;.
【分析】(1)利用相关系数的公式进行计算即可;
(2)(i)根据题意,及相关系数的公式进行计算即可证明;(ii)利用表格写出对应的Ri与Si 得值,然后用“斯皮尔曼相关系数”的公式进行计算即可;
(3)只要能说出斯皮尔曼相关系数与一般的样本相关系数相比的优势即可.
【解答】解:(1)由题意,这组学生数学成绩和知识竞赛成绩的样本相关系数为:
0.70,
(2)(i)证明:因为{Ri}和{Si}都是1,2, ,N的一个排列,


从而{Ri}和{Si}的平均数都是.
因此,,
同理可得,
由于,
所以;
(ii)由题目数据,可写出Ri与Si的值如下:
同学编号i 1 2 3 4 5 6 7 8 9 10
数学成绩排名Ri 1 2 3 4 5 6 7 8 9 10
知识竞赛成绩排名Si 1 5 3 4 9 8 7 6 10 2
同学编号i 11 12 13 14 15 16 17 18 19 20
数学成绩排名Ri 11 12 13 14 15 16 17 18 19 20
知识竞赛成绩排名Si 12 14 13 11 16 15 17 18 19 20
所以N=20,并且.
因此这组学生的数学成绩和知识竞赛成绩的斯皮尔曼相关系数是.
(3)答案①,斯皮尔曼相关系数对于异常值不太敏感,如果数据中有明显的异常值,那么用斯皮尔曼相关系数比用相关系数更能刻画某种线性关系;
答案②,斯皮尔曼相关系数刻画的是用本数据排名的样本相关系数,与具体的数值无关,只与排名有关.如果一组数据有异常值,但排名依然符合一定的线性关系,则可以采用斯皮尔曼相关系数刻画线性关系.
【点评】本题考查相关系数相关知识,属于较难题.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)
同课章节目录