9.1.1变量的相关性-高二数学同步精品讲义(含解析)(苏教版2019选择性必修第二册)

文档属性

名称 9.1.1变量的相关性-高二数学同步精品讲义(含解析)(苏教版2019选择性必修第二册)
格式 docx
文件大小 1.3MB
资源类型 教案
版本资源 苏教版(2019)
科目 数学
更新时间 2024-04-26 19:34:59

图片预览

文档简介

第九章 统计
9.1.1变量的相关性
课程标准 重难点
1.通过实例,能够理解两个变量的线性相关关系以及 正相关、负相关. 2.利用给出的数据会画两个变量的散点图,通过散点 图能够判断出两个变量的相关性. 3.了解两个随机变量间的相关系数r,会利用公式求 相关系数r,并能利用相关系数r判断两个随机变量间线性相关程度的强弱. 重点:借助概率分布直方图的几何直观,了解正态分布的特征; 难点:正态分布的均值、标准差、方差及其含义.
知识点01 变量的相关关系
1.相关关系的概念∶我们所研究的很多问题中,两个变量之间经常存在着相互影响、相互依赖的关系.这些关系常见的有两类∶函数关系和相关关系.
[概念辨析]相关关系与函数关系的异同∶
异同点 关系 函数关系 相关关系
相同点 两者均是两个变量之间的关系
不同的 是一种确定性关系 是一种非确定性关系
是一种因果关系 不一定是因果关系,也可能是伴随关系
是一种理想的关系 是更为一般的情况
2.散点图
(1)概念∶一般地,如果收集到了变量x和变量y的n对数据(简称为成对数据),如下表所示:
序号i 1 2 3 ... n
变量x x1 x2 x3 ... xn
变量y y1 y2 y3 ... yn
则在平面直角坐标系xOy中描出点(xi,yi),i=1,2,3,…,n,就可以得到这n对数据的散点图.
(2)作用∶散点图展示了样本点散布的位置.根据散点图中点的分布趋势分析两个变量之间的关系,可直观地判断并得出结论.
注意:
(1)散点图具有直观、简明的特点,我们可以根据散点图来判断两个变量有没有相关关系;
(2)通过散点图不但可以判断测量值的大小、变动范围与整体趋势,还可以通过观察剔
除异常数值,提高估计相关程度的准确性;
(3)当所画的散点图的横坐标与纵坐标所对应的数据差距很大时,可在实际作图时,将
横坐标与纵坐标取不同的单位长度,使画出的散点图形象、美观.
3.正相关与负相关
(1)从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,称
这两个变量正相关,散点图如图(甲)所示;
(2)从整体上看,当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,称这
两个变量负相关,散点图如图(乙)所示.
4. 线性相关与非线性相关∶
(1)线性相关∶如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,称这两个变量线性相关
(2)非线性相关∶如果两个变量具有相关性,但不是线性相关,就称这两个变量非线性相关或曲线相关.【即学即练1】下列语句所表示的事件中的因素不具有相关关系的是()
A. 瑞雪兆丰年B.上梁不正下梁歪C. 吸烟有害健康D.喜鹊叫喜,乌鸦叫丧
【即学即练2】(2023春·上海徐汇·高二统考阶段练习)下列关于散点图的说法中,正确的是( )
A.任意给定统计数据,都可以绘制散点图 B.从散点图中可以看出两个量是否具有一定的关系
C.从散点图中可以看出两个量的因果关系 D.从散点图中无法看出数据的分布情况
知识点02 相关系数
1.定义:统计学里,一般用来衡量y与x的线性相关性强弱,这里的r称为线性相关系数(简称为相关系数).
2.性质:
可以证明,相关系数r具有以下性质∶
|r|≤1,且y与x正相关的充要条件是r>0,y与x负相关的充要条件是r<0;
(2)|r|越小,说明两个变量之间的线性相关性越弱,也就是得出的回归直线方程越没有价值,即方程越不能反映真实的情况; | r|越大,说明两个变量之间的线性相关性越强,也就是得出的回归直线方程越有价值.
(3)|r| =1的充要条件是成对数据构成的点都在回归直线上.
注意:(1)样本的相关系数r可以定量地反映出变量间的相关程度,明确给出有无必要建立两变量间的回归方程;
(2)|r|很小只是说明两个变量之间的线性相关程度弱,但不一定不相关.
【即学即练3】(多选)(2021春·河北衡水·高二校联考阶段练习)关于相关系数r,下面说法正确的是( )
A.
B.若,则两个变量线性不相关
C.若,则一个变量增加,另一个变量有减少的趋势
D.越小,变量之间的线性相关程度越高
【即学即练4】(2017春·天津红桥·高二统考期中)关于相关系数,下列说法错误的是( )
A.当时,表明两个变量正相关
B.当 时,表明两个变量负相关
C.的绝对值大于时,认为两个变量有很强的线性相关性
D.的绝对值越接近于1,表明两个变量之间几乎不存在线性相关关系
◆考点01 相关关系与函数关系的辨析
【典例1】(2023·全国·高二专题练习)下列说法正确的是( )
A.中的x,y是具有相关关系的两个变量
B.正四面体的体积与棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.传染病医院感染传染病的医务人员数与医院收治的传染病人数是具有相关关系的两个变量
【典例2】(多选)(2022·高二课时练习)下列关系中,属于相关关系的是( ).
A.正方形的边长与面积之间的关系
B.农作物的产量与施肥量之间的关系
C.出租车车费与行驶的里程之间的关系
D.降雪量与交通事故的发生率之间的关系
【典例3】(2022·高二课时练习)判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画.
回归模型:________;函数模型:________.
①某公司的销售收入和广告支出;
②某城市写字楼的出租率和每平米月租金;
③航空公司的顾客投诉次数和航班正点率;
④某地区的人均消费水平和人均国内生产总值(GDP);
⑤学生期末考试成绩和考前用于复习的时间;
⑥一辆汽车在某段路程中的行驶速度和行驶时间;
⑦正方形的面积与周长.
◆考点02 散点图与相关性
【典例4】(2022春·陕西渭南·高一校考期末)下列四个图中,两个变量x,y具有线性相关关系的是( )
A.①② B.①②④ C.②③④ D.②④
【典例5】(2022·高二课时练习)给出成对值的数据如下:
1 2 4 8
3 5 9 17
则根据数据可以判断和的关系是______.(填“确定关系”“相关关系”或“没有关系”)
【典例6】(2022·高二课时练习)某商场五天内某种恤衫的销售情况如下表:
第天
销售量y(件)
则下列说法正确的是( )A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
◆考点03 正负相关的判断
【典例7】(2023秋·四川成都·高二四川省成都市新都一中校联考期末)以下两个变量成负相关的是_____.
①学生的学籍号与学生的数学成绩;
②坚持每天吃早餐的人数与患胃病的人数;
③气温与冷饮销售量;
④电瓶车的重量和行驶每千米的耗电量.
【典例8】(2023·高二课时练习)对变量有观测数据(),得表1;对变量 有观测数据(),得表2.由这两个表可以判断:变量x与y______,变量u与v______.(填写“正相关”或“负相关”)
表1
x 1 2 3 4 5
y 2.9 3.3 3.6 4.4 5.1
表2
u 1 2 3 4 5
v 25 20 21 15 13
【典例9】(2023秋·四川遂宁·高二遂宁中学校考期末)如图,是对某位同学一学期次体育测试成绩(单位:分)进行统计得到的散点图,关于这位同学的成绩分析,下列结论错误的是( )
A.该同学的体育测试成绩总的趋势是在逐步提高,且次测试成绩的极差超过分
B.该同学次测试成绩的众数是分
C.该同学次测试成绩的中位数是分
D.该同学次测试成绩与测试次数具有相关性,且呈正相关
◆考点04 线性相关的强弱
【典例10】(2022·全国·高三专题练习)对于,两变量,有四组样本数据,分别算出它们的线性相关系数(如下),则线性相关性最强的是( )
A.-0.82 B.0.78 C.-0.69 D.0.87
【典例11】(2023·全国·高二专题练习)已知四组不同数据的两变量的线性相关系数如下:数据组①的相关系数;数据组②的相关系数;数据组③的相关系数;数据组④的相关系数.则下列说法正确的是( )
A.数据组①对应的数据点都在同一直线上
B.数据组②中的两变量线性相关性最强
C.数据组③中的两变量线性相关性最强
D.数据组④中的两变量线性相关性最弱
【典例12】(多选)(2023·全国·高二专题练习)某校高三1班48名物理方向的学生在一次质量检测中,语文成绩、数学成绩与六科总成绩在全年级中的排名情况如下图所示,“”表示的是该班甲、乙、丙三位同学对应的点.从这次考试的成绩看,下列结论正确的是( )
A.该班六科总成绩排名前6的同学语文成绩比数学成绩排名更好
B.在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是语文
C.数学成绩与六科总成绩的相关性比语文成绩与六科总成绩的相关性更强
D.在甲、乙两人中,其语文成绩名次比其六科总成绩名次靠前的学生是甲
◆考点05 成对数据相关系数的计算
【典例13】(2022·全国·高三专题练习)某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
使用年限x(单位:年) 1 2 3 4 5 6 7
失效费y(单位:万元) 2.90 3.30 3.60 4.40 4.80 5.20 5.90
由上表数据可知,y与x的相关系数为______.
(精确到0.01,参考公式和数据:,,,)
【典例14】(2022·高二课时练习)有人收集了某城市居民年收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如表所示.
第n年 1 2 3 4 5 6 7 8 9 10
居民年收入(亿元) 32.2 31.1 32.9 35.8 37.1 38 39 43 44.6 46
A商品销售额(万元) 25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0
画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数推断居民年收入与A商品销售额的相关程度和变化趋势的异同.
参考数据:,,,,.
【典例15】(2023·全国·高二专题练习)样本相关系数
(1)设由变量x和y获得的两组数据分别为和(i=1,2,…,n),其对应关系如下表所示:
变量x …
变量y …
两组数据和的__________是度量两个变量x与y之间线性相关程度的统计量,其计算公式为,其中,,,它们分别是这两组数据的算术平均数.
(2)相关系数r的性质:
①当时,称成对样本数据______相关;
当时,成对样本数据______相关;
当时,成对样本数据间没有线性相关关系;
②样本相关系数r的取值范围为______;
当越接近1时,成对样本数据的线性相关程度越______;
当越接近0时,成对样本数据的线性相关程度越______.
◆考点06 相关系数的实际应用
【典例16】(2023·全国·高二专题练习)某学校组织学生观看了“天宫课堂”第二课的直播后,极大地激发了学生学习科学知识的兴趣,提高了学生学习的积极性,特别是对实验操作的研究与探究.现有某化学兴趣小组的同学在老师的指导下,开展了某项化学实验操作,为了解实验效度与实验中原料的消耗量(单位:)的关系,该校实验员随机选取了10个小组的实验数据如下表.
小组编号 1 2 3 4 5 6 7 8 9 10 总计
实验效度 6
原料的消耗量 15
并计算得.
(1)求这10个小组的实验效度与实验中原料的消耗量的平均值;
(2)求这10个小组的实验效度与实验中原料的消耗量的相关系数(精确到);
(3)经该校实验员统计,以往一个学年各种实验中需用到原料的实验有200次左右.假设在一定的范围内,每次实验中原料的消耗量与实验效度近似成正比,其比例系数可近似为样本中相应的平均值的比值.根据要求,实验效度平均值需达到.请根据上述数据信息,估计该校本学年原料的消耗量.
附:相关系数
【典例17】(2022秋·陕西西安·高二陕西师大附中校考阶段练习)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi) (i=1,2,…,20)的相关系数(精确到0.01);(附:相关系数, )
【典例18】(2022·全国·高三专题练习)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据,其中和分别表示第个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量(单位:头),并计算得,,,,.
(1)估计该地区这种野生动物的数量;
(2)求样本的相关系数.(精确到0.01)
题组A 基础过关练
一、单选题
1.(2023·全国·高二专题练习)经济学专业的学生们为研究流通费率y和销售额x(单位:千万元)的关系,对同类型10家企业的相关数据()进行整理,并得到如下散点图:
由此散点图,在2千万元至1亿元之间,下面四个回归方程类型中最适宜作为流通费率y和销售额x的回归方程类型的是( )
A. B.
C. D.
2.(2023秋·上海浦东新·高二统考期末)小明同学每天阅读数学文化相关的书籍,他每天阅读的页数分别为:4、5、4.5、5、6、8、7、5、4.5、6(单位:页).下列图形中不利于描述这些数据的是(  )
A.条形图 B.茎叶图 C.散点图 D.扇形图
3.(2023·全国·高二专题练习)如图是近十年来全国城镇人口、乡村人口的折线图(数据来自国家统计局).
根据该折线图,下列说法错误的是( )
A.城镇人口与年份呈现正相关 B.乡村人口与年份的相关系数接近
C.城镇人口逐年增长率大致相同 D.可预测乡村人口仍呈现下降趋势
4.(2022·高二课时练习)下面各图中,散点图与相关系数r不符合的有( )
A. B.
C. D.
5.(2022·高二课时练习)下列变量之间的关系是相关关系的是(  )
A.正方体的表面积与体积
B.光照时间与果树的产量
C.匀速行驶车辆的行驶距离与时间
D.某运动会中某代表团的足球队的比赛成绩与乒乓球队的比赛成绩
6.(2022·高二课时练习)变量X与Y相对应的一组数据为,,,,;变量U与V相对应的一组数据为,,,,.记为变量X与Y之间的相关系数.为变量U与V之间的相关系数,则( )
A. B. C. D.
二、多选题
7.(2022·高二课时练习)下列变量间可能用直线拟合的是( )
A.光照时间与大棚内蔬菜的产量 B.某正方形的边长与此正方形的面积
C.举重运动员所能举起的最大重量与他的体重 D.某人的身高与视力
8.(2022春·新疆塔城·高一沙湾县第一中学校考期末)某市气象部门根据2020年各月的每天最高气温与最低气温的平均数据,绘制如下折线图,那么下列叙述正确的是( )
A.各月的每天最高气温平均值与最低气温平均值总体呈正相关
B.从2020年1月至8月该市每天最高气温平均值与最低气温平均值一直在上升
C.全年中各月最高气温平均值不低于25℃的月份有5个
D.全年中,2月份的最高气温平均值与最低气温平均值的差值最大
三、填空题
9.(2022·高二单元测试)若线性回归方程中的回归系数,则相关系数______.
10.(2022·高二课时练习)对于相关系数r,下列说法中错误的是________.
①r越大,线性相关程度越强;
②越小,线性相关程度越强;
③越大,线性相关程度越弱,越小,线性相关程度越强;
④,且越接近1,线性相关程度越强,越接近0,线性相关程度越弱.
11.(2022春·河南信阳·高二统考期末)若一组观测值,,…,()对应的点位于同一直线上,则x,y的相关系数为______.
12.(2022春·江苏南通·高二海门中学校考阶段练习)以模型去拟合一组数据时,已知如下数据:,则实数k的值为_______.
四、解答题
13.(2021春·陕西延安·高二子长市中学校考期末)某电器公司的市场研究人员为了解公司的经营状况,对该公司最近六个月内的市场占有率进行了统计,结果如下表所示:
月份 1月 2月 3月 4月 5月 6月
月份代码 1 2 3 4 5 6
市场占有率(%) 11 13 16 15 20 21
(1)用相关系数说明市场占有率与月份代码之间的关系是否可用线性回归模型拟合?(结果保留两位小数)
(2)求关于的线性回归方程,并预测该公司10月份的市场占有率.
参考数据:,,,.
参考公式:相关系数,线性回归方程的斜率和截距的最小二乘法估计分别为,.
14.(2021春·陕西渭南·高二统考期末)某高中生参加社会实践活动,对某公司1月份至5月份销售的某种配件的销售量及销售单价进行了调查,销售单价和销售量之间的一组数据如下表所示:
月份 1 2 3 4 5
销售单价元 9 9.5 10 10.5 11
销售量件 11 10 8 6 5
(1)由上表数据知,可用线性回归模型拟合与的关系,请用相关系数加以说明;(精确到0.01)
(2)求出关于的线性回归方程;
(3)预计在今后的销售中,销售量与销售单价仍然服从(2)中的关系,如果该种配件的成本是2.5元/件,那么该种配件的销售单价应定为多少元才能获得最大利润?(注:利润销售收入成本)
参考公式:相关系数,线性回归方程的斜率和截距的最小二乘法估计分别为.
参考数据:
题组B 能力提升练
一、单选题
1.(2023·全国·高三专题练习)在研究急刹车的停车距离问题时,通常假定停车距离等于反应距离(,单位:m)与制动距离(,单位:m)之和.如图为某实验所测得的数据,其中“KPH”表示刹车时汽车的初速度(单位:km/h).根据实验数据可以推测,下面四组函数中最适合描述,与的函数关系的是( )
A., B.,
C., D.,
2.(2022春·上海浦东新·高二上海南汇中学校考期末)要判断成对数据的线性相关程度的强弱,可以通过比较它们的样本相关系数r的大小,以下是四组数据的相关系数的值,则线性相关最强的是( )
A. B.
C. D.
3.(2022·全国·高三专题练习)给出下列说法:①回归直线恒过样本点的中心,且至少过一个样本点;②两个变量相关性越强,则相关系数就越接近1;③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程中,当解释变量增加一个单位时,预报变量平均减少0.5个单位.其中说法正确的是( )
A.①②④ B.②③④ C.①③④ D.②④
4.(2022春·江西赣州·高二校联考期中)下列说法:①命题“,若,则”是真命题:②以模型去拟合一组数据时,为了求出回归方程,设﹐将其变换后得到线性方程,则c,k的值分别是和0.3:③已知是双曲线的一个焦点,则点F到双曲线E的渐近线的距离等于b.正确的个数是( )
A.0 B.1 C.2 D.3
5.(2022春·河南南阳·高二校考阶段练习)袁隆平院士是我国的杂交水稻之父,他一生致力于杂交水稻的研究,为解决中国人民的温饱和保障国家粮食安全做出了重大的贡献.某杂交水稻研究小组先培育出第一代杂交水稻,再由第一代培育出第二代,第二代培育出第三代,以此类推.已知第一代至第四代杂交水稻的每穗总粒数分别为197粒,193粒,201粒,209粒,且亲代与子代的每穗总粒数成线性相关.根据以上信息,预测第五代杂交水稻每穗的总粒数为( )
(注:①亲代是产生后一代生物的生物,对后代生物来说是亲代,所产生的后一代叫子代:②,)
A.211 B.212 C.213 D.214
6.(2022·高二课时练习)已知r1表示变量X与Y之间的线性相关系数,r2表示变量U与V之间的线性相关系数,且r1=0.837,r2=﹣0.957,则( )
A.变量X与Y之间呈正相关关系,且X与Y之间的相关性强于U与V之间的相关性
B.变量X与Y之间呈负相关关系,且X与Y之间的相关性强于U与V之间的相关性
C.变量U与V之间呈负相关关系,且X与Y之间的相关性弱于U与V之间的相关性
D.变量U与V之间呈正相关关系,且X与Y之间的相关性弱于U与V之间的相关性
二、多选题
7.(2023·重庆·统考模拟预测)下列命题中正确的是( ).
A.一组从小到大排列的数据0,1,3,4,6,7,9,x,11,11,去掉x与不去掉x,它们的80%分位数都不变,则
B.两组数据,,,…,与,,,…,,设它们的平均值分别为与,将它们合并在一起,则总体的平均值为
C.已知离散型随机变量,则
D.线性回归模型中,相关系数r的值越大,则这两个变量线性相关性越强
8.(2022·高二单元测试)四对变量与进行线性相关检验,已知是观测值组数,是相关系数,则变量和具有线性相关关系的是( ).
相关系数的临界值表
A.、 B.、
C.、 D.、
9.(2022·高二课时练习)已知与之间的四组数据如下表:
2 3 4 5
1.5 3.5
上表数据中的平均值为,若某同学对赋了两个值,分别为,,得到两条回归直线的方程分别为,,对应的相关系数分别为,,则( )A.两条回归直线的交点为 B.
C. D.
三、填空题
10.(2022·全国·高三专题练习)某品牌餐饮公司准备在10个规模相当的地区开设加盟店,为合理安排各地区加盟店的个数,先在其中5个地区进行试点,得到试点地区加盟店个数x及单店日平均营业额y(万元)的::数据如下:
x 1 2 3 4 5
y 10.9 10.2 9.0 7.8 7.1
根据上表可得y关于x线性相关,为保证规模和效益,该公司要求在其他5个地区需满足同一地区所有加盟店的日平均营业额预计值总和不低于35万元,则一个地区开设的加盟店个数m的所有可能取值为______.(参考数据:,)
11.(2021春·陕西咸阳·高二武功县普集高级中学校考阶段练习)下列说法:
①线性回归方程必过;
②命题“”的否定是“”
③相关系数越小,表明两个变量相关性越弱;
④在一个列联表中,由计算得,则有的把握认为这两个变量间有关系;
其中正确的说法是__________.(把你认为正确的结论都写在横线上)
本题可参考独立性检验临界值表:
四、解答题
12.(2023·陕西安康·统考二模)某公司进行工资改革,将工作效率作为工资定档的一个重要标准,大大提高了员工的工作积极性,但也引起了一些老员工的不满.为了调查员工的工资与工龄的情况,人力资源部随机从公司的技术研发部门中抽取了16名员工了解情况,结果如下:
工龄(年): 1 2 3 4 5 6 7 8
年薪(万): 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
工龄(年): 9 10 11 12 13 14 15 16
年薪(万): 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得,,,,其中表示工龄为年的年薪,.
(1)求年薪与工龄的相关系数,并回答是否可以认为年薪与工龄具有线性相关关系(若,则可以认为年薪与工龄不具有线性相关关系).
(2)在抽取的16名员工中,如果年薪都在之内,则继续推进工资改革,同时给每位老员工相应的补贴,如果有员工年薪在之外,该员工会被人力资源部约谈并进行岗位调整,且需要重新计算原抽取的16名员工中留下的员工年薪的均值和标准差,由于人力资源部需要安抚老员工的情绪,工作繁重,现请你帮忙计算留下的员工年薪的均值和标准差.(精确到0.01)
附:样本的相关系数,,,,.
13.(2022春·重庆沙坪坝·高二重庆八中校考期末)有一个开房门的游戏,其玩法为:
盒中先放入两把钥匙和两把钥匙,能够打开房门,不能打开房门.
每次从盒中随机取一把试开,试开后不放回钥匙.第一次打开房门后,关上门继续试开,第二次打开房门后停止抽取,称为进行了一轮游戏.
若每一轮取钥匙不超过三次,则该轮“成功”,否则为“失败”,如果某一轮“成功”,则游戏终止;若“失败”,则将所有钥匙重新放入盒中,并再放入一把钥匙,继续下一轮抽取,直至“成功”.
(1)有名爱好者独立参与这个游戏,记表示“成功”时抽取钥匙的轮次数,表示对应的人数,部分统计数据如下表:
若将作为关于的经验回归方程,估计抽取轮才“成功”的人数(人数精确到个位);
(2)由于时间关系,规定:进行游戏时,最多进行三轮,若均未“成功”也要终止游戏.求游戏要进行三轮的概率.
参考公式:最小二乘估计,.
参考数据:取,,其中,.
题组C 培优拔尖练
1.(2022·全国·高三专题练习)近年来,“共享汽车”在我国各城市迅猛发展,为人们的出行提供了便利,但也给城市交通管理带来了一些困难.为了解“共享汽车”在M省的发展情况,M省某调查机构从该省随机拍取了5个城市,分别收集和分析了“共享汽车”的A,B,C三项指标数据,, ,数据如下表所示;
城市编号i 1 2 3 4 5
A指标 4 6 2 8 5
B指标 4 4 3 5 4
C指标 3 6 2 5 4
(1)分别求y与x之间的相关系数及z与x之间的相关系数,并比较y与x,z与x之间相关性的强弱;
(2)利用向量夹角来分析y与x之间及z与x之间的相关关系.
附:相关系数.
参考数据:,,,
,,,.
2.(2023·全国·高三专题练习)在某生态系统中,有甲、乙两个种群,两种群之间为竞争关系.设t时刻甲、乙种群的数量分别为,(起始时刻为).由数学家Lotka和Volterra提出的模型是函数,满足方程,,其中a,b,c,d均为非负实数.
(1)下图为没有乙种群时,一段时间内甲种群数量与时间的关系折线图.为预测甲种群的数量变化趋势,研究人员提出了两种可能的数学模型:①;②,其中m,n均为大于1的正数.根据折线图判断,应选用哪种模型进行预测,并说明理由.
(2)设,.
①函数的单调性;
②根据①中的结论说明:在绝大多数情况下,经过充分长的时间后,或者甲种群灭绝,或者乙种群灭绝.
注:在题设条件下,各种群数量均有上限值.
第九章 统计
9.1.1变量的相关性
课程标准 重难点
1.通过实例,能够理解两个变量的线性相关关系以及 正相关、负相关. 2.利用给出的数据会画两个变量的散点图,通过散点 图能够判断出两个变量的相关性. 3.了解两个随机变量间的相关系数r,会利用公式求 相关系数r,并能利用相关系数r判断两个随机变量间线性相关程度的强弱. 重点:借助概率分布直方图的几何直观,了解正态分布的特征; 难点:正态分布的均值、标准差、方差及其含义.
知识点01 变量的相关关系
1.相关关系的概念∶我们所研究的很多问题中,两个变量之间经常存在着相互影响、相互依赖的关系.这些关系常见的有两类∶函数关系和相关关系.
[概念辨析]相关关系与函数关系的异同∶
异同点 关系 函数关系 相关关系
相同点 两者均是两个变量之间的关系
不同的 是一种确定性关系 是一种非确定性关系
是一种因果关系 不一定是因果关系,也可能是伴随关系
是一种理想的关系 是更为一般的情况
2.散点图
(1)概念∶一般地,如果收集到了变量x和变量y的n对数据(简称为成对数据),如下表所示:
序号i 1 2 3 ... n
变量x x1 x2 x3 ... xn
变量y y1 y2 y3 ... yn
则在平面直角坐标系xOy中描出点(xi,yi),i=1,2,3,…,n,就可以得到这n对数据的散点图.
(2)作用∶散点图展示了样本点散布的位置.根据散点图中点的分布趋势分析两个变量之间的关系,可直观地判断并得出结论.
注意:
(1)散点图具有直观、简明的特点,我们可以根据散点图来判断两个变量有没有相关关系;
(2)通过散点图不但可以判断测量值的大小、变动范围与整体趋势,还可以通过观察剔
除异常数值,提高估计相关程度的准确性;
(3)当所画的散点图的横坐标与纵坐标所对应的数据差距很大时,可在实际作图时,将
横坐标与纵坐标取不同的单位长度,使画出的散点图形象、美观.
3.正相关与负相关
(1)从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,称
这两个变量正相关,散点图如图(甲)所示;
(2)从整体上看,当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,称这
两个变量负相关,散点图如图(乙)所示.
4. 线性相关与非线性相关∶
(1)线性相关∶如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,称这两个变量线性相关
(2)非线性相关∶如果两个变量具有相关性,但不是线性相关,就称这两个变量非线性相关或曲线相关.【即学即练1】下列语句所表示的事件中的因素不具有相关关系的是()
A. 瑞雪兆丰年B.上梁不正下梁歪C. 吸烟有害健康D.喜鹊叫喜,乌鸦叫丧
【解析】D .选项A,B,C中描述的变量间都具有相关关系,而选项D是迷信说法,没有科学依据.
【即学即练2】(2023春·上海徐汇·高二统考阶段练习)下列关于散点图的说法中,正确的是( )
A.任意给定统计数据,都可以绘制散点图 B.从散点图中可以看出两个量是否具有一定的关系
C.从散点图中可以看出两个量的因果关系 D.从散点图中无法看出数据的分布情况
【答案】B
【分析】根据散点图的概念判断即可.
【详解】散点图不适合用于展示百分比占比的数据,另外数据量较少的数据也不适合用散点图表示,故A错误;
散点图能看出两个量是否具有一定关系,但是并一定是因果关系,故B正确,C错误;
散点图中能看出数据的分布情况,故D错误.
故选:B
知识点02 相关系数
1.定义:统计学里,一般用来衡量y与x的线性相关性强弱,这里的r称为线性相关系数(简称为相关系数).
2.性质:
可以证明,相关系数r具有以下性质∶
|r|≤1,且y与x正相关的充要条件是r>0,y与x负相关的充要条件是r<0;
(2)|r|越小,说明两个变量之间的线性相关性越弱,也就是得出的回归直线方程越没有价值,即方程越不能反映真实的情况; | r|越大,说明两个变量之间的线性相关性越强,也就是得出的回归直线方程越有价值.
(3)|r| =1的充要条件是成对数据构成的点都在回归直线上.
注意:(1)样本的相关系数r可以定量地反映出变量间的相关程度,明确给出有无必要建立两变量间的回归方程;
(2)|r|很小只是说明两个变量之间的线性相关程度弱,但不一定不相关.
【即学即练3】(多选)(2021春·河北衡水·高二校联考阶段练习)关于相关系数r,下面说法正确的是( )
A.
B.若,则两个变量线性不相关
C.若,则一个变量增加,另一个变量有减少的趋势
D.越小,变量之间的线性相关程度越高
【答案】ABC
【分析】根据相关系数的定义以及性质即可求解.
【详解】,故A正确,若,则两个变量线性不相关,故B正确,若,则一个变量增加,另一个变量有减少的趋势,C正确,越大,变量之间的线性相关程度越高,故D错误,
故选:ABC
【即学即练4】(2017春·天津红桥·高二统考期中)关于相关系数,下列说法错误的是( )
A.当时,表明两个变量正相关
B.当 时,表明两个变量负相关
C.的绝对值大于时,认为两个变量有很强的线性相关性
D.的绝对值越接近于1,表明两个变量之间几乎不存在线性相关关系
【答案】D
【分析】根据相关系数的含义,逐项判定,即可求解.
【详解】根据相关系数的含义,可得当时,表明两个变量正相关;当 时,表明两个变量负相关,的绝对值大于时,认为两个变量有很强的线性相关性;当的绝对值越接近于1时,两个变量的相关系越强,所以A、B、C正确,D错误.
故选:D.
◆考点01 相关关系与函数关系的辨析
【典例1】(2023·全国·高二专题练习)下列说法正确的是( )
A.中的x,y是具有相关关系的两个变量
B.正四面体的体积与棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.传染病医院感染传染病的医务人员数与医院收治的传染病人数是具有相关关系的两个变量
【答案】D
【分析】根据相关关系的定义、函数的定义即可判断
【详解】A,B均为函数关系,故A、B错误;C,D为相关关系,故C错,D对.
故选:D
【典例2】(多选)(2022·高二课时练习)下列关系中,属于相关关系的是( ).
A.正方形的边长与面积之间的关系
B.农作物的产量与施肥量之间的关系
C.出租车车费与行驶的里程之间的关系
D.降雪量与交通事故的发生率之间的关系
【答案】BD
【分析】根据相关关系的概念逐项分析可得答案.
【详解】A中,正方形的边长与面积之间的关系是函数关系;
B中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;
C中,出租车车费与行驶的里程之间的关系为确定的函数关系;
D中,降雪量与交通事故的发生率之间具有相关关系.
故选:BD.
【典例3】(2022·高二课时练习)判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画.
回归模型:________;函数模型:________.
①某公司的销售收入和广告支出;
②某城市写字楼的出租率和每平米月租金;
③航空公司的顾客投诉次数和航班正点率;
④某地区的人均消费水平和人均国内生产总值(GDP);
⑤学生期末考试成绩和考前用于复习的时间;
⑥一辆汽车在某段路程中的行驶速度和行驶时间;
⑦正方形的面积与周长.
【答案】 ①②③④⑤ ⑥⑦
【分析】利用回归模型与函数模型的定义依次分析即可.
【详解】对于①,销售收入虽然跟广告支出有关,但并不是广告打得多就对销售得多,还得看产品质量等其他因素,故其为回归模型;
对于②,某城市写字楼的出租率和每平米月租金有关,但写字楼的出租率还跟租户的收入、写字楼的地理位置等因素有关,故其为回归模型;
对于③,航空公司的顾客投诉次数和航班正点率有关,但航班正点率还跟天气等因素有关,故其为回归模型;
对于④,某地区的人均消费水平和人均国内生产总值(GDP)有关,但同样的GDP,一线城市与十八线城市的人均消费显然是不一样的,故其为回归模型;
对于⑤,学生期末考试成绩和考前用于复习的时间有关,但显然跟学生原本的知识基础、智商水平等因素有关,故其为回归模型;
对于⑥,一辆汽车在某段路程中的行驶速度和行驶时间,由可知其为函数模型;
对于⑦,正方形的面积为,周长为,故,故其为函数模型.
故答案为:①②③④⑤;⑥⑦
◆考点02 散点图与相关性
【典例4】(2022春·陕西渭南·高一校考期末)下列四个图中,两个变量x,y具有线性相关关系的是( )
A.①② B.①②④ C.②③④ D.②④
【答案】D
【分析】当散点图中的点集中在一条直线的附近时,说明两个变量具有线性相关关系,由此进行判断即可
【详解】由图可知,②④中的点集中在一条直线的附近,所以图②④中的两个变量具有线性相关关系,
故选:D.
【典例5】(2022·高二课时练习)给出成对值的数据如下:
1 2 4 8
3 5 9 17
则根据数据可以判断和的关系是______.(填“确定关系”“相关关系”或“没有关系”)
【答案】确定关系
【分析】根据两个变量的相关关系的概念分析可得答案.
【详解】由题表中数据可以得到x,y之间是一种函数关系,函数解析式为,
所以x,y之间是一种确定的关系,即函数关系.
故答案为:确定关系.
【典例6】(2022·高二课时练习)某商场五天内某种恤衫的销售情况如下表:
第天
销售量y(件)
则下列说法正确的是( )A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
【答案】B
【分析】作出散点图,可得出结论.
【详解】根据表格中的数据作出散点图如图,
可知所有点都在一条直线附近波动,是线性相关的,且值随着值的增大而增大,即与正相关,
故选:B.
◆考点03 正负相关的判断
【典例7】(2023秋·四川成都·高二四川省成都市新都一中校联考期末)以下两个变量成负相关的是_____.
①学生的学籍号与学生的数学成绩;
②坚持每天吃早餐的人数与患胃病的人数;
③气温与冷饮销售量;
④电瓶车的重量和行驶每千米的耗电量.
【答案】②
【分析】根据相关关系的知识确定正确答案.
【详解】①无相关关系;②负相关;③④正相关.
故答案为:②
【典例8】(2023·高二课时练习)对变量有观测数据(),得表1;对变量 有观测数据(),得表2.由这两个表可以判断:变量x与y______,变量u与v______.(填写“正相关”或“负相关”)
表1
x 1 2 3 4 5
y 2.9 3.3 3.6 4.4 5.1
表2
u 1 2 3 4 5
v 25 20 21 15 13
【答案】 正相关 负相关
【分析】根据图表判断变量之间的变化关系,即可判断两变量间的“正相关”或“负相关”关系.
【详解】由图表可知随着x的增大,相应的y值也增大,其散点图将呈上升趋势,故变量正相关,
随着的增大,相应的值整体上是减小的,其散点图将呈下降趋势,故变量负相关,
故答案为:正相关;负相关
【典例9】(2023秋·四川遂宁·高二遂宁中学校考期末)如图,是对某位同学一学期次体育测试成绩(单位:分)进行统计得到的散点图,关于这位同学的成绩分析,下列结论错误的是( )
A.该同学的体育测试成绩总的趋势是在逐步提高,且次测试成绩的极差超过分
B.该同学次测试成绩的众数是分
C.该同学次测试成绩的中位数是分
D.该同学次测试成绩与测试次数具有相关性,且呈正相关
【答案】C
【分析】根据给定的散点图,逐一分析各个选项即可判断作答.
【详解】对于A,由散点图知,8次测试成绩总体是依次增大,极差为,A正确;
对于B,散点图中8个数据的众数是48,B正确;
对于C,散点图中的8个数由小到大排列,最中间两个数都是48,则次测试成绩的中位数是分,C不正确;
对于D,散点图中8个点落在某条斜向上的直线附近,则次测试成绩与测试次数具有相关性,且呈正相关,D正确.
故选:C
◆考点04 线性相关的强弱
【典例10】(2022·全国·高三专题练习)对于,两变量,有四组样本数据,分别算出它们的线性相关系数(如下),则线性相关性最强的是( )
A.-0.82 B.0.78 C.-0.69 D.0.87
【答案】D
【分析】根据相关系数与变量间相关性的关系,即可得答案.
【详解】由相关系数的绝对值越大,变量间的线性相关性越强知:各选项中的绝对值最大.
故选:D
【典例11】(2023·全国·高二专题练习)已知四组不同数据的两变量的线性相关系数如下:数据组①的相关系数;数据组②的相关系数;数据组③的相关系数;数据组④的相关系数.则下列说法正确的是( )
A.数据组①对应的数据点都在同一直线上
B.数据组②中的两变量线性相关性最强
C.数据组③中的两变量线性相关性最强
D.数据组④中的两变量线性相关性最弱
【答案】B
【分析】根据线性相关系数的性质逐个判断即可
【详解】对A,数据组①的相关系数,故数据组①对应的数据点无线性关系,故A错误;
对BC,数据组②的相关系数为4组中绝对值的最大值,故数据组②中的两变量线性相关性最强,故B正确,C错误;
对D,数据组①的相关系数为4组中绝对值最小,故数据组①中的两变量线性相关性最弱,故D错误
故选:B
【典例12】(多选)(2023·全国·高二专题练习)某校高三1班48名物理方向的学生在一次质量检测中,语文成绩、数学成绩与六科总成绩在全年级中的排名情况如下图所示,“”表示的是该班甲、乙、丙三位同学对应的点.从这次考试的成绩看,下列结论正确的是( )
A.该班六科总成绩排名前6的同学语文成绩比数学成绩排名更好
B.在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是语文
C.数学成绩与六科总成绩的相关性比语文成绩与六科总成绩的相关性更强
D.在甲、乙两人中,其语文成绩名次比其六科总成绩名次靠前的学生是甲
【答案】BCD
【分析】结合图形可分析出答案.
【详解】由图可得,该班六科总成绩排名前6的同学数学成绩比语文成绩排名更好,故A错误;
由右图可得丙同学的总成绩排在班上倒数第三名,其语文成绩排在250到300名之间,
从左图可得其数学成绩排在400名左右,故B正确;
数学成绩与六科总成绩的相关性比语文成绩与六科总成绩的相关性更强,因为右图的点的分布较左图更分散,故C正确;
由左图可得甲的总成绩排在班上第7名,年级名次100多一点,
对应到右图可得,其语文成绩排在年级近100名,故甲的语文成绩名次比其六科总成绩名次靠前,
由左图可得甲的总成绩排在班上第27名,年级名次接近250名,
对应到右图可得,其语文成绩排在年级250名之后,故乙的语文成绩名次比其六科总成绩名次靠后,故D正确;
故选:BCD
◆考点05 成对数据相关系数的计算
【典例13】(2022·全国·高三专题练习)某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
使用年限x(单位:年) 1 2 3 4 5 6 7
失效费y(单位:万元) 2.90 3.30 3.60 4.40 4.80 5.20 5.90
由上表数据可知,y与x的相关系数为______.
(精确到0.01,参考公式和数据:,,,)
【答案】0.99
【分析】分别求出,,,再利用参考公式和数据计算即可.
【详解】由题意,知,

.
所以.
所以y与x的相关系数近似为0.99.
故答案为:0.99.
【典例14】(2022·高二课时练习)有人收集了某城市居民年收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如表所示.
第n年 1 2 3 4 5 6 7 8 9 10
居民年收入(亿元) 32.2 31.1 32.9 35.8 37.1 38 39 43 44.6 46
A商品销售额(万元) 25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0
画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数推断居民年收入与A商品销售额的相关程度和变化趋势的异同.
参考数据:,,,,.
【答案】答案见解析
【分析】根据表中数据画出散点图即可,再根据参考数据以及相关系数的公式求值即可.
【详解】画出散点图如下.从散点图看,A商品销售额与居民年收入的样本数据呈现线性相关关系.

可以推断居民年收入与A商品销售额正相关,即居民年收入越高,A商品销售额也越大.
【典例15】(2023·全国·高二专题练习)样本相关系数
(1)设由变量x和y获得的两组数据分别为和(i=1,2,…,n),其对应关系如下表所示:
变量x …
变量y …
两组数据和的__________是度量两个变量x与y之间线性相关程度的统计量,其计算公式为,其中,,,它们分别是这两组数据的算术平均数.
(2)相关系数r的性质:
①当时,称成对样本数据______相关;
当时,成对样本数据______相关;
当时,成对样本数据间没有线性相关关系;
②样本相关系数r的取值范围为______;
当越接近1时,成对样本数据的线性相关程度越______;
当越接近0时,成对样本数据的线性相关程度越______.
【答案】 线性相关系数 正 负 强 弱
【分析】根据相关系数的定义,以及相关的性质内容,即可作答.
【详解】根据相关系数的定义,,
其中,,,它们分别是这两组数据的算术平均数.
和的线性相关系数是度量两个变量x与y之间线性相关程度的统计量.
当时,称成对样本数据正相关;
当时,成对样本数据负相关;
当时,成对样本数据间没有线性相关关系;
样本相关系数r的取值范围为;
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
故答案为:线性相关系数;正;负;;强;弱.
◆考点06 相关系数的实际应用
【典例16】(2023·全国·高二专题练习)某学校组织学生观看了“天宫课堂”第二课的直播后,极大地激发了学生学习科学知识的兴趣,提高了学生学习的积极性,特别是对实验操作的研究与探究.现有某化学兴趣小组的同学在老师的指导下,开展了某项化学实验操作,为了解实验效度与实验中原料的消耗量(单位:)的关系,该校实验员随机选取了10个小组的实验数据如下表.
小组编号 1 2 3 4 5 6 7 8 9 10 总计
实验效度 6
原料的消耗量 15
并计算得.
(1)求这10个小组的实验效度与实验中原料的消耗量的平均值;
(2)求这10个小组的实验效度与实验中原料的消耗量的相关系数(精确到);
(3)经该校实验员统计,以往一个学年各种实验中需用到原料的实验有200次左右.假设在一定的范围内,每次实验中原料的消耗量与实验效度近似成正比,其比例系数可近似为样本中相应的平均值的比值.根据要求,实验效度平均值需达到.请根据上述数据信息,估计该校本学年原料的消耗量.
附:相关系数
【答案】(1)0.6,1.5g
(2)0.75
(3)
【分析】(1)根据数值计算即可;(2)先化简公式:,,然后再代入相关数据计算可得结果;(3)由比例关系直接计算即可.
【详解】(1)由题意得这10个小组的实验效度的平均值为,
这10个小组实验中原料的消耗量的平均值为.
相关系数
.
(3)设该校本学年原料的消耗量为,
则由题可知,
所以估计该校本学年原料的消耗量为.
【典例17】(2022秋·陕西西安·高二陕西师大附中校考阶段练习)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi) (i=1,2,…,20)的相关系数(精确到0.01);(附:相关系数, )
【答案】(1)12000
(2)
【分析】(1)由已知数据求得20个样区野生动物数量的平均数,乘以200得答案;
(2)由已知直接利用相关系数公式求解.
【详解】(1)由已知得样本平均数,从而该地区这种野生动物数量的估计值为60×200=12000.
(2)样本 的相关系数
【典例18】(2022·全国·高三专题练习)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据,其中和分别表示第个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量(单位:头),并计算得,,,,.
(1)估计该地区这种野生动物的数量;
(2)求样本的相关系数.(精确到0.01)
【答案】(1)
(2)
【分析】(1)计算出样区野生动物的数量的平均值,乘以地块数,即得答案;
(2)根据相关系数公式进行计算,可得答案.
【详解】(1)由已知得样本平均数 ,
从而该地区这种野生动物数量的估计值为.
(2)由,,,
可得样本 的相关系数为
.
题组A 基础过关练
一、单选题
1.(2023·全国·高二专题练习)经济学专业的学生们为研究流通费率y和销售额x(单位:千万元)的关系,对同类型10家企业的相关数据()进行整理,并得到如下散点图:
由此散点图,在2千万元至1亿元之间,下面四个回归方程类型中最适宜作为流通费率y和销售额x的回归方程类型的是( )
A. B.
C. D.
【答案】D
【分析】根据散点图的变化趋势,分析各选项中方程表示的曲线的特点,看是否合乎题意,即可得答案.
【详解】根据散点图,可以知道各点基本上是沿着一条具有递减趋势的曲线分布,并且变化趋势较平缓,
A中表示直线,变化趋势是定的,不合题意;
B中表示的曲线既有上升又有下降部分,不合题意;
C中表示的曲线不论是上升还是下降,都将比较快,曲线较“陡峭”,不合题意,
D中表示的曲线不论是上升还是下降,都将比较平缓,合乎题意,
故选:D.
2.(2023秋·上海浦东新·高二统考期末)小明同学每天阅读数学文化相关的书籍,他每天阅读的页数分别为:4、5、4.5、5、6、8、7、5、4.5、6(单位:页).下列图形中不利于描述这些数据的是(  )
A.条形图 B.茎叶图 C.散点图 D.扇形图
【答案】C
【分析】根据相关图的特征理解判断.
【详解】条形图:是用宽度相同的条形的高度(或长度)表示数据的频数,故符合题意;
茎叶图:即可以保留原始数据又可以方便记录数据,故符合题意;
散点图:用两组数据构成多个坐标点,通常用于比较跨类别的成对数据,不符合题意;
扇形图:是用整个圆表示总体,用圆内各个扇形的大小表示各个部分占总体的百分数,扇形图可以容易看出各个部分所占总体的比例,故符合题意;
故选:C.
3.(2023·全国·高二专题练习)如图是近十年来全国城镇人口、乡村人口的折线图(数据来自国家统计局).
根据该折线图,下列说法错误的是( )
A.城镇人口与年份呈现正相关 B.乡村人口与年份的相关系数接近
C.城镇人口逐年增长率大致相同 D.可预测乡村人口仍呈现下降趋势
【答案】B
【分析】根据折线图判断乡村人口与年份、城镇人口与年份的相关关系以及线性相关关系的强弱,逐项判断可得出合适的选项.
【详解】对于A选项,由折线图可知,城镇人口与年份呈现正相关,A对;
对于B选项,因为乡村人口与年份呈负线性相关关系,且线性相关性很强,所以接近,B错;
对于C选项,城镇人口与年份呈现正相关,且线性相关性很强,相关系数接近,
故城镇人口逐年增长率大致相同,C对;
对于D选项,由折线图可知,乡村人口与年份呈负线性相关关系,可预测乡村人口仍呈现下降趋势,D对.
故选:B.
4.(2022·高二课时练习)下面各图中,散点图与相关系数r不符合的有( )
A. B.
C. D.
【答案】B
【分析】根据散点图和相关系数的知识确定正确选项.
【详解】对于A,散点图上所有点都在一条斜率小于0的直线上,所以相关系数r=-1,A正确;
对于B,散点图上所有点都在一条斜率大于0的直线上,所以相关系数r=1,B错误;
对于C,散点图上所有点从左到右是向下的带状分布,所以相关系数,C正确;
对于D,散点图中,x,y之间的相关关系非常不明显,所以相关系数r=0,D正确.
故选:B.
5.(2022·高二课时练习)下列变量之间的关系是相关关系的是(  )
A.正方体的表面积与体积
B.光照时间与果树的产量
C.匀速行驶车辆的行驶距离与时间
D.某运动会中某代表团的足球队的比赛成绩与乒乓球队的比赛成绩
【答案】B
【分析】A与C是一种函数关系,D不具备相关关系,B满足相关关系.
【详解】对于A,正方体的体积确定,则表面积随之确定,是一种确定性关系,A错误;
对于B,光照时间越长,果树的产量相对越大,是一种线性相关关系,B正确;
对于C,行驶速度与时间是一种确定的函数关系,C错误;
对于D,足球比赛成绩与乒乓球比赛成绩没有关系,不具有相关关系,D错误.
故选:B
6.(2022·高二课时练习)变量X与Y相对应的一组数据为,,,,;变量U与V相对应的一组数据为,,,,.记为变量X与Y之间的相关系数.为变量U与V之间的相关系数,则( )
A. B. C. D.
【答案】B
【分析】根据题意可得数据间的正负关系,从而进行判断即可.
【详解】由变量X与Y的对应数据可得变量X与Y之间呈正相关,因此;由变量U与V的对应数据可得变量U与V之间呈负相关,因此.故.
故选:B
二、多选题
7.(2022·高二课时练习)下列变量间可能用直线拟合的是( )
A.光照时间与大棚内蔬菜的产量 B.某正方形的边长与此正方形的面积
C.举重运动员所能举起的最大重量与他的体重 D.某人的身高与视力
【答案】AC
【分析】判断两个变量之间是否有线性相关性进行求解.
【详解】对于选项A,光照时间与大棚内蔬菜的产量中的两个变量之间均存在某种关系,若存在线性关系就可用直线拟合,故A正确;
对于选项B,某正方形的边长与此正方形的面积这两个变量之间是确定的函数关系,不能用直线拟合,故B错误;
对于选项C,举重运动员所能举起的最大重量与他的体重中的两个变量之间均存在某种关系,若存在线性关系就可用直线拟合,故C正确;
对于选项D,某人的身高与视力这两个变量之间无任何关系,不能用直线拟合,故D错误.
故选:AC.
8.(2022春·新疆塔城·高一沙湾县第一中学校考期末)某市气象部门根据2020年各月的每天最高气温与最低气温的平均数据,绘制如下折线图,那么下列叙述正确的是( )
A.各月的每天最高气温平均值与最低气温平均值总体呈正相关
B.从2020年1月至8月该市每天最高气温平均值与最低气温平均值一直在上升
C.全年中各月最高气温平均值不低于25℃的月份有5个
D.全年中,2月份的最高气温平均值与最低气温平均值的差值最大
【答案】ACD
【分析】观察绘制出的折线图逐项判断即可.
【详解】由绘制出的折线图知,对于A项,各月最高气温平均值与最低气温平均值为正相关,故A正确;
对于B项,1月到2月的最低气温平均值下降,故B不正确;
对于C项,全年中各月最高气温平均值不低于25℃的月份有5月,6月,7月,8月,9月共5个,故C正确;
对于D项,2月的最高气温平均值与最低气温平均值的差值最大,故D正确.
故答案为:ACD.
三、填空题
9.(2022·高二单元测试)若线性回归方程中的回归系数,则相关系数______.
【答案】0
【分析】结合已知条件,利用回归系数公式和相关系数公式求解即可.
【详解】∵,
∴,
∴.
故答案为:0.
10.(2022·高二课时练习)对于相关系数r,下列说法中错误的是________.
①r越大,线性相关程度越强;
②越小,线性相关程度越强;
③越大,线性相关程度越弱,越小,线性相关程度越强;
④,且越接近1,线性相关程度越强,越接近0,线性相关程度越弱.
【答案】①②③
【分析】根据相关系数的性质依次判断即可.
【详解】相关系数,且越接近1,线性相关程度越强,越接近0,线性相关程度越弱,
故①②③错误,④正确.
故答案为:①②③
11.(2022春·河南信阳·高二统考期末)若一组观测值,,…,()对应的点位于同一直线上,则x,y的相关系数为______.
【答案】
【分析】根据相关系数的定义可得答案.
【详解】由已知条件和相关系数的定义得,x,y的相关系数为.
故答案为:
12.(2022春·江苏南通·高二海门中学校考阶段练习)以模型去拟合一组数据时,已知如下数据:,则实数k的值为_______.
【答案】3
【分析】由指数的运算性质知,即可求结果.
【详解】由 ,则.
故答案为:3
四、解答题
13.(2021春·陕西延安·高二子长市中学校考期末)某电器公司的市场研究人员为了解公司的经营状况,对该公司最近六个月内的市场占有率进行了统计,结果如下表所示:
月份 1月 2月 3月 4月 5月 6月
月份代码 1 2 3 4 5 6
市场占有率(%) 11 13 16 15 20 21
(1)用相关系数说明市场占有率与月份代码之间的关系是否可用线性回归模型拟合?(结果保留两位小数)
(2)求关于的线性回归方程,并预测该公司10月份的市场占有率.
参考数据:,,,.
参考公式:相关系数,线性回归方程的斜率和截距的最小二乘法估计分别为,.
【答案】(1)答案见解析
(2),预测该公司10月份的市场占有率为29%
【分析】(1)根据题中所给的相关系数公式,结合相关系数的性质进行运算求解判断即可;
(2)根据题中所给的公式进行求解即可.
【详解】(1)∵,,,
∴,
∴两变量之间具有较强的线性相关关系,
故市场占有率y与月份代码x之间的关系可用线性回归模型拟合;
(2),
又,,
∴,
故y关于x的线性回归方程为,
当时,,
∴预测该公司10月份的市场占有率为29%.
14.(2021春·陕西渭南·高二统考期末)某高中生参加社会实践活动,对某公司1月份至5月份销售的某种配件的销售量及销售单价进行了调查,销售单价和销售量之间的一组数据如下表所示:
月份 1 2 3 4 5
销售单价元 9 9.5 10 10.5 11
销售量件 11 10 8 6 5
(1)由上表数据知,可用线性回归模型拟合与的关系,请用相关系数加以说明;(精确到0.01)
(2)求出关于的线性回归方程;
(3)预计在今后的销售中,销售量与销售单价仍然服从(2)中的关系,如果该种配件的成本是2.5元/件,那么该种配件的销售单价应定为多少元才能获得最大利润?(注:利润销售收入成本)
参考公式:相关系数,线性回归方程的斜率和截距的最小二乘法估计分别为.
参考数据:
【答案】(1)答案见解析
(2)
(3)7.5元
【分析】(1)根据所给公式及数据求出相关系数,即可判断;
(2)根据所给公式及数据求出、,即可得到回归方程;
(3)设销售利润为,则,,再根据二次函数的性质计算可得.
【详解】(1)解: ,,,
由于与的相关系数近似为,说明与的线性相关程度相当高,
从而可以用线性回归模型拟合与的关系.
(2)解:,,
又,,
关于的线性回归方程为.
(3)解:设销售利润为,则,
整理得,
所以当时,故该配件的销售单价应定为元才能获得最大利润.
题组B 能力提升练
一、单选题
1.(2023·全国·高三专题练习)在研究急刹车的停车距离问题时,通常假定停车距离等于反应距离(,单位:m)与制动距离(,单位:m)之和.如图为某实验所测得的数据,其中“KPH”表示刹车时汽车的初速度(单位:km/h).根据实验数据可以推测,下面四组函数中最适合描述,与的函数关系的是( )
A., B.,
C., D.,
【答案】B
【分析】设,,根据图象得到函数图象上的点,作出散点图,即可得到答案.
【详解】设,.
由图象知,过点,,,,,,,,,,,,,,.
作出散点图,如图1.
由图1可得,与呈现线性关系,可选择用.
过点,,,,,,,,,,,,,,.
作出散点图,如图2.
由图2可得,与呈现非线性关系,比较之下,可选择用.
故选:B.
2.(2022春·上海浦东新·高二上海南汇中学校考期末)要判断成对数据的线性相关程度的强弱,可以通过比较它们的样本相关系数r的大小,以下是四组数据的相关系数的值,则线性相关最强的是( )
A. B.
C. D.
【答案】A
【分析】利用相关系数的含义,判断每个选项里的相关系数的绝对值的大小即可.
【详解】当时,表明两个变量正相关;当时,表明两个变量负相关; ,且 越接近于1,相关程度越大;越接近于0,相关程度越小,
故 ,因此线性相关最强的是A,
故选:A
3.(2022·全国·高三专题练习)给出下列说法:①回归直线恒过样本点的中心,且至少过一个样本点;②两个变量相关性越强,则相关系数就越接近1;③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程中,当解释变量增加一个单位时,预报变量平均减少0.5个单位.其中说法正确的是( )
A.①②④ B.②③④ C.①③④ D.②④
【答案】B
【分析】① 中,根据回归直线方程的特征,可判定是不正确;② 中,根据相关系数的意义,可判定是正确的;③ 中,根据方差的计算公式,可判定是正确的;④中,根据回归系数的含义,可判定是正确的.
【详解】对于① 中,回归直线恒过样本点的中心,但不一定过一个样本点,所以不正确;
对于② 中,根据相关系数的意义,可得两个变量相关性越强,则相关系数就越接近1,所以是正确的;
对于③ 中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;
对于④ 中,根据回归系数的含义,可得在回归直线方程中,当解释变量增加一个单位时,预报变量平均减少0.5个单位,所以是正确的.
故选:B.
4.(2022春·江西赣州·高二校联考期中)下列说法:①命题“,若,则”是真命题:②以模型去拟合一组数据时,为了求出回归方程,设﹐将其变换后得到线性方程,则c,k的值分别是和0.3:③已知是双曲线的一个焦点,则点F到双曲线E的渐近线的距离等于b.正确的个数是( )
A.0 B.1 C.2 D.3
【答案】D
【分析】对于①,先求出其逆否命题,再判断逆否命题的真假,从而可判断出原命题的真假,对于②,由,两边取对数,对应,从而可求出c,k的值,对于③,先求出以曲线的渐近线方程,然后利用点到直线的距离公式求解判断
【详解】对于①,命题“,若,则”的逆否命题为“若,则”为真命题,所以原命题是真命题,所以①正确,
对于②,由,两边取对数,得,令,则,
因为,所以,所以,所以②正确,
对于③,双曲线的渐近线方程为,由双曲线的对称性,取一条渐近线方程,即,则到直线的距离为,即点F到双曲线E的渐近线的距离等于b,所以③正确,
故选:D
5.(2022春·河南南阳·高二校考阶段练习)袁隆平院士是我国的杂交水稻之父,他一生致力于杂交水稻的研究,为解决中国人民的温饱和保障国家粮食安全做出了重大的贡献.某杂交水稻研究小组先培育出第一代杂交水稻,再由第一代培育出第二代,第二代培育出第三代,以此类推.已知第一代至第四代杂交水稻的每穗总粒数分别为197粒,193粒,201粒,209粒,且亲代与子代的每穗总粒数成线性相关.根据以上信息,预测第五代杂交水稻每穗的总粒数为( )
(注:①亲代是产生后一代生物的生物,对后代生物来说是亲代,所产生的后一代叫子代:②,)
A.211 B.212 C.213 D.214
【答案】C
【分析】利用最小二乘法求得亲代与子代的每穗总粒数之间的线性回归方程,进而得解.
【详解】由题意,设亲代每穗总粒数,子代的每穗总粒数,
则,

所以线性回归方程为
当时,
预测第五代杂交水稻每穗的总粒数为213
故选:C
6.(2022·高二课时练习)已知r1表示变量X与Y之间的线性相关系数,r2表示变量U与V之间的线性相关系数,且r1=0.837,r2=﹣0.957,则( )
A.变量X与Y之间呈正相关关系,且X与Y之间的相关性强于U与V之间的相关性
B.变量X与Y之间呈负相关关系,且X与Y之间的相关性强于U与V之间的相关性
C.变量U与V之间呈负相关关系,且X与Y之间的相关性弱于U与V之间的相关性
D.变量U与V之间呈正相关关系,且X与Y之间的相关性弱于U与V之间的相关性
【答案】C
【分析】根据线性相关系数|r|越接近1,表示两个变量之间的相关性越强,线性相关系数r的正负表示两个变量之间呈正相关关系或负相关关系.
【详解】因为线性相关系数r1=0.837,r2=﹣0.957,
所以变量X与Y之间呈正相关关系,变量U与V之间呈负相关关系,
X与Y之间的相关性弱于U与V之间的相关性.
故选:C
二、多选题
7.(2023·重庆·统考模拟预测)下列命题中正确的是( ).
A.一组从小到大排列的数据0,1,3,4,6,7,9,x,11,11,去掉x与不去掉x,它们的80%分位数都不变,则
B.两组数据,,,…,与,,,…,,设它们的平均值分别为与,将它们合并在一起,则总体的平均值为
C.已知离散型随机变量,则
D.线性回归模型中,相关系数r的值越大,则这两个变量线性相关性越强
【答案】AB
【分析】根据百分位数的计算公式,计算即可验证选项A;由平均值的定义和公式验证选项B;由二项分布的方差公式计算结果验证选项C;由线性相关系数的性质判断选项D.
【详解】对于A:一组从小到大排列的数据0,1,3,4,6,7,9,x,11,11,共10个数据,
因为80%×10=8,所以样本数据的80%分位数为第8个和第9个数据的平均数,即,
若去掉x,一组从小到大排列的数据0,1,3,4,6,7,9,11,11,共9个数据,
因为80%×9=7.2,所以样本数据的80%分位数为第8个数据,即,
去掉x与不去掉x,它们的80%分位数都不变,则,解得,A选项正确;
对于B:两组数据,,,…,与,,,…,,设它们的平均值分别为与,将它们合并在一起,有,则总体的平均值为 ,B选项正确;
对于C:已知离散型随机变量, 有,则,C选项错误;
对于D: 线性回归模型中,相关系数的值越大,则这两个变量线性相关性越强,D选项错误.
故选:AB
8.(2022·高二单元测试)四对变量与进行线性相关检验,已知是观测值组数,是相关系数,则变量和具有线性相关关系的是( ).
相关系数的临界值表
A.、 B.、
C.、 D.、
【答案】AC
【分析】由于小概率与在附表中分别查得值,然后与选项中的值比较即可求解.
【详解】由于小概率与在附表中分别查得:
A选项的,B选项的,C选项的,D选项的,
因此知A、C中相关系数比大,变量和具有线性相关关系,
而B、D中的相关系数小于,故变量与不具有线性相关关系,
故选:AC.
9.(2022·高二课时练习)已知与之间的四组数据如下表:
2 3 4 5
1.5 3.5
上表数据中的平均值为,若某同学对赋了两个值,分别为,,得到两条回归直线的方程分别为,,对应的相关系数分别为,,则( )A.两条回归直线的交点为 B.
C. D.
【答案】ACD
【分析】由已知数据求出样本中心点可判断A;分别求出,时的值,再由公式计算出,,,可判断BC;由公式求出和可判断D,进而可得正确选项.
【详解】因为,,所以两条回归直线过样本点的中心,即两条回归直线的交点为,故选项A正确;
当时,由,可得,


所以,,
当时,由,可得,

所以,,
所以,,故选项B错误,选项C正确;
当,时,因为,
所以,
当,时,,
所以,则,故选项D正确,
故选:ACD.
三、填空题
10.(2022·全国·高三专题练习)某品牌餐饮公司准备在10个规模相当的地区开设加盟店,为合理安排各地区加盟店的个数,先在其中5个地区进行试点,得到试点地区加盟店个数x及单店日平均营业额y(万元)的::数据如下:
x 1 2 3 4 5
y 10.9 10.2 9.0 7.8 7.1
根据上表可得y关于x线性相关,为保证规模和效益,该公司要求在其他5个地区需满足同一地区所有加盟店的日平均营业额预计值总和不低于35万元,则一个地区开设的加盟店个数m的所有可能取值为______.(参考数据:,)
【答案】5,6,7
【分析】根据题意求出,利用最小二乘法求出,进而求出即可得出线性回归方程,根据题意列出不等式,解之即可.
【详解】由题意可得,,,


设线性回归方程为,
则,,
故线性回归方程为.
根据题意,,解得,又,
所以m的所有可能取值为5,6,7.
故答案为:5,6,7
11.(2021春·陕西咸阳·高二武功县普集高级中学校考阶段练习)下列说法:
①线性回归方程必过;
②命题“”的否定是“”
③相关系数越小,表明两个变量相关性越弱;
④在一个列联表中,由计算得,则有的把握认为这两个变量间有关系;
其中正确的说法是__________.(把你认为正确的结论都写在横线上)
本题可参考独立性检验临界值表:
【答案】①④
【详解】分析:根据性回归方程,独立性检验,相关关系,以及命题的否定等知识,选出正确的,得到结果.
详解:线性回归方程必过样本中心点,故①正确.
命题“”的否定是“” 故②错误
③相关系数r绝对值越小,表明两个变量相关性越弱,故不正确;
④在一个列联表中,由计算得,则有的把握认为这两个变量间有关系,正确.
故答案为①④.
点睛:本题以命题真假的判断为载体,着重考查了相关系数、命题的否定、独立性检验、回归直线方程等知识点,属于中档题.
四、解答题
12.(2023·陕西安康·统考二模)某公司进行工资改革,将工作效率作为工资定档的一个重要标准,大大提高了员工的工作积极性,但也引起了一些老员工的不满.为了调查员工的工资与工龄的情况,人力资源部随机从公司的技术研发部门中抽取了16名员工了解情况,结果如下:
工龄(年): 1 2 3 4 5 6 7 8
年薪(万): 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
工龄(年): 9 10 11 12 13 14 15 16
年薪(万): 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得,,,,其中表示工龄为年的年薪,.
(1)求年薪与工龄的相关系数,并回答是否可以认为年薪与工龄具有线性相关关系(若,则可以认为年薪与工龄不具有线性相关关系).
(2)在抽取的16名员工中,如果年薪都在之内,则继续推进工资改革,同时给每位老员工相应的补贴,如果有员工年薪在之外,该员工会被人力资源部约谈并进行岗位调整,且需要重新计算原抽取的16名员工中留下的员工年薪的均值和标准差,由于人力资源部需要安抚老员工的情绪,工作繁重,现请你帮忙计算留下的员工年薪的均值和标准差.(精确到0.01)
附:样本的相关系数,,,,.
【答案】(1),可以认为年薪与工龄不具有线性相关关系
(2)均值为万元,标准差为
【分析】(1)由样本数据得相关系数, 可以认为年薪与工龄不具有线性相关关系;
(2) 由样本数据可以看出工龄为13年的员工年薪在以外,留下15名员工,求剩下员工年薪的均值和标准差即可.
【详解】(1)由样本数据得的相关系数为,
,因此可以认为年薪与工龄不具有线性相关关系.
(2)由于,,由样本数据可以看出工龄为13年的员工年薪在以外,
因此会被约谈并进行岗位调整,所以留下15名员工,剩下员工年薪的均值为万元,
余下员工年薪的方差为
所以标准差的估计值为
13.(2022春·重庆沙坪坝·高二重庆八中校考期末)有一个开房门的游戏,其玩法为:
盒中先放入两把钥匙和两把钥匙,能够打开房门,不能打开房门.
每次从盒中随机取一把试开,试开后不放回钥匙.第一次打开房门后,关上门继续试开,第二次打开房门后停止抽取,称为进行了一轮游戏.
若每一轮取钥匙不超过三次,则该轮“成功”,否则为“失败”,如果某一轮“成功”,则游戏终止;若“失败”,则将所有钥匙重新放入盒中,并再放入一把钥匙,继续下一轮抽取,直至“成功”.
(1)有名爱好者独立参与这个游戏,记表示“成功”时抽取钥匙的轮次数,表示对应的人数,部分统计数据如下表:
若将作为关于的经验回归方程,估计抽取轮才“成功”的人数(人数精确到个位);
(2)由于时间关系,规定:进行游戏时,最多进行三轮,若均未“成功”也要终止游戏.求游戏要进行三轮的概率.
参考公式:最小二乘估计,.
参考数据:取,,其中,.
【答案】(1)人
(2)
【分析】(1)利用参考数据以及最小二乘法公式求出、的值,可得出经验回归方程,然后在回归方程中令,可求得结果;
(2)设事件为“第一轮成功”,事件为“第二轮成功”,则、相互独立,分析可知游戏要进行三轮,即前两轮均失败,计算出、的值,利用对立事件和独立事件的概率公式可求得所求事件的概率.
【详解】(1)解:令,设,
由条件知,,
所以,
,从而,
故所求的回归方程为.
所以,估计当时,,即抽取轮才“成功”的人数约为人.
(2)解:由条件知,游戏要进行三轮,即前两轮均失败.
设事件为“第一轮成功”,事件为“第二轮成功”,则、相互独立.
因为,,
所以,前两轮均失败的概率为.
故游戏要进行三轮的概率为.
题组C 培优拔尖练
1.(2022·全国·高三专题练习)近年来,“共享汽车”在我国各城市迅猛发展,为人们的出行提供了便利,但也给城市交通管理带来了一些困难.为了解“共享汽车”在M省的发展情况,M省某调查机构从该省随机拍取了5个城市,分别收集和分析了“共享汽车”的A,B,C三项指标数据,, ,数据如下表所示;
城市编号i 1 2 3 4 5
A指标 4 6 2 8 5
B指标 4 4 3 5 4
C指标 3 6 2 5 4
(1)分别求y与x之间的相关系数及z与x之间的相关系数,并比较y与x,z与x之间相关性的强弱;
(2)利用向量夹角来分析y与x之间及z与x之间的相关关系.
附:相关系数.
参考数据:,,,
,,,.
【答案】(1),,y与x之间的相关性比z与x之间的相关性强;
(2)y与x之间的相关性比z与x之间的相关性强.
【分析】(1)应用相关系数公式求,并比较大小,即可得结论;
(2)将各数据集中数据减去对应平均数得到数据集对应的向量,应用向量夹角的坐标表示求向量夹角余弦值,根据其符号和绝对值大小,确定结论.
(1)
由已知,,,,
所以,

所以y与x、z与x正相关,又,则y与x之间的相关性比z与x之间的相关性强.
(2)
由(1)知:,,,
将题表中x,y,z的相关数据分别减去,,,
记,


则,,,
于是,

所以y与x、z与x正相关,又,则y与x之间的相关性比z与x之间的相关性强.
2.(2023·全国·高三专题练习)在某生态系统中,有甲、乙两个种群,两种群之间为竞争关系.设t时刻甲、乙种群的数量分别为,(起始时刻为).由数学家Lotka和Volterra提出的模型是函数,满足方程,,其中a,b,c,d均为非负实数.
(1)下图为没有乙种群时,一段时间内甲种群数量与时间的关系折线图.为预测甲种群的数量变化趋势,研究人员提出了两种可能的数学模型:①;②,其中m,n均为大于1的正数.根据折线图判断,应选用哪种模型进行预测,并说明理由.
(2)设,.
①函数的单调性;
②根据①中的结论说明:在绝大多数情况下,经过充分长的时间后,或者甲种群灭绝,或者乙种群灭绝.
注:在题设条件下,各种群数量均有上限值.
【答案】(1)应选用模型②预测甲种群数量的变化趋势;理由见解析
(2)①为常函数;②答案见解析
【分析】(1)根据图像特点即可判断答案
(2)第一小问可先求出,根据值的正负情况判断的单调性;第二小问由(i)知 为常数,,通过对种群初始数量和时刻数量的分类讨论来确定种群的变化趋势,从而得出结论
【详解】(1)由折线图知,甲种群数量的增长速度随着时间的推移而加快.而增长速度大致对应种群数量对时间的导数.
如选用模型①,,是关于时间的减函数,不符合折线图;
如选用模型②,,是关于时间的增函数,符合折线图.
所以应选用模型②预测甲种群数量的变化趋势
(2)由题设知,.
(i),.
消去条件中的得,所以.
所以为常函数.
(ii)由(i),,.
由于各种群数量均有上限值,不妨设甲乙种群数量的上限值分别为,.
①若,.
则当时,,此时可以近似认为甲种群灭绝;
②若,.
则当时,,此时可以近似认为乙种群灭绝;
③若,,甲乙种群数量之比保持恒定,可能不出现灭绝的情况.
综上所述,对所有的情况,经过充分长的时间后,或者甲种群灭绝,或者乙种群灭绝
【点睛】本题属于中档偏难题,考察非线性回归、创新情境等,,结合生态学知识、线性微分方程组等知识,以统计学基础知识为载体,考察考生的综合能力.