第9章第1节 线性回归分析
题型1 散点图 题型2 变量间的相关关系
题型3 样本相关系数
▉题型1 散点图
【知识点的认识】
1.散点图的概念:
在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.
2.曲线拟合的概念:
从散点图可以看出如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这种近似的过程称为曲线拟合.
3.正相关和负相关:
(1)正相关:对于相关关系的两个变量,如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关,正相关时散点图的点散布在从左下角到右上角的区域内.
(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关,负相关时散点图的点散布在从左上角到右下角的区域.
3、注意:画散点图的关键是以成对的一组数据,分别为此点的横、纵坐标,在平面直角坐标系中把其找出来,其横纵坐标的单位长度的选取可以不同,应考虑数据分布的特征,散点图只是形象的描述点的分布,如果点的分布大致呈一种集中趋势,则两个变量可以初步判断具有相关关系,如图中数据大致分布在一条直线附近,则表示的关系是线性相关,如果两个变量统计数据的散点图呈现如下图所示的情况,则两个变量之间不具备相关关系,例如学生的身高和学生的英语成绩就没有相关关系.
4、散点图又称散点分布图,是以一个变量为横坐标,另一变量为纵坐标,利用散点(坐标点)的分布形态反映变量统计关系的一种图形.特点是能直观表现出影响因素和预测对象之间的总体关系趋势.优点是能通过直观醒目的图形方式反映变量间关系的变化形态,以便决定用何种数学表达方式来模拟变量之间的关系.散点图不仅可传递变量间关系类型的信息,也能反映变量间关系的明确程度.
1.下列关于散点图的说法中,正确的是( )
A.任意给定统计数据,都可以绘制散点图
B.从散点图中可以看出两个量是否具有一定的关系
C.从散点图中可以看出两个量的因果关系
D.从散点图中无法看出数据的分布情况
2.对两组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )
A.r1<﹣r2<0 B.r2<﹣r1<0 C.r2>﹣r1>0 D.r1>﹣r2>0
3.已知5个成对数据(x,y)的散点图如下,若去掉点D(4,3),则下列说法正确的是( )
A.变量x与变量y呈正相关
B.变量x与变量y的相关性变强
C.残差平方和变大
D.样本相关系数r变大
4.对两个变量的三组数据进行统计,得到以下散点图,关于两个变量相关系数的比较,正确的是( )
A.r1>r2>r3 B.r2>r3>r1 C.r1>r3>r2 D.r3>r2>r1
5.观察下列散点图,则①正相关,②负相关,③不相关,这三句话与散点图的位置相对应的是( )
A.①②③ B.②③① C.②①③ D.①③②
6.如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是( )
A.相关系数r变大
B.残差平方和变大
C.相关指数R2变大
D.解释变量x与预报变量y的相关性变强
▉题型2 变量间的相关关系
【知识点的认识】
1、变量之间的相关关系
两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系.当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系.相关关系是一种非确定性关系,如长方体的高与体积之间的关系就是确定的函数关系,而人的身高与体重的关系,学生的数学成绩好坏与物理成绩的关系等都是相关关系.
2、线性相关和非线性相关:
两个变量之间的相关关系又可分为线性相关和非线性相关,如果所有的样本点都落在某一函数曲线的附近,则变量之间具有相关关系(不确定性的关系),如果所有样本点都落在某一直线附近,那么变量之间具有线性相关关系,相关关系只说明两个变量在数量上的关系,不表明他们之间的因果关系,也可能是一种伴随关系.
3、两个变量相关关系与函数关系的区别和联系
(1)相同点:两者均是两个变量之间的关系.
(2)不同点:函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系,相关关系是一种非确定的关系,如一块农田的小麦产量与施肥量之间的关系,函数关系是两个随机变量之间的关系,而相关关系是非随机变量与随机变量之间的关系;函数关系式一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
7.对两组数据进行统计后得到如图所示的散点图,下列结论不正确的是( )
A.图1、图2两组数据都具有线性相关关系
B.图1数据正相关,图2数据负相关
C.图1相关系数r1小于图2相关系数r2
D.图1相关系数和图2相关系数之和小于0
8.已知气候温度和海水表层温度相关,且相关系数为负数,对此描述正确的是( )
A.气候温度高,海水表层温度就高
B.气候温度高,海水表层温度就低
C.随着气候温度由低到高,海水表层温度呈上升趋势
D.随着气候温度由低到高,海水表层温度显下降趋势
9.下列各关系不属于相关关系的是( )
A.产品的样本与生产数量
B.球的表面积与体积
C.家庭的支出与收入
D.人的年龄与体重
10.对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图1;对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图2.由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
11.张大爷种植了10亩小麦,每亩施肥x千克,小麦总产量为y千克,则( )
A.x,y之间有依赖关系 B.x,y之间有函数关系
C.y是x的函数 D.x是y的函数
(多选)12.为了研究变量y和x的线性相关关系,收集了下图5对样本数据.若已求得,一元线性回归方程为,则下列选项中正确的是( )
x 1 2 3 4 5
y 0.5 0.9 1 1.1 1.5
A.变量y和x正相关
B.变量y和x负相关
C.
D.当x=5时的残差为0.06
13.变量X与Y相对应的一组数据为:(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5); 变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,是则r1与r2的大小关系是r2<r1 .
▉题型3 样本相关系数
【知识点的认识】
1、概念:
相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度.于是,著名统计学家卡尔 皮尔逊设计了统计指标﹣﹣相关系数.相关系数是用以反映变量之间相关关系密切程度的统计指标.相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数.
2、相关系数用r表示,计算公式为
其中:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.
3、残差:
相关指数R2用来刻画回归的效果,其计算公式是
在含有一个解释变量的线性模型中,R2恰好等于相关系数r的平方.显然,R2取值越大,意味着残差平方和越小,也就是模型的拟合效果越好.
【解题方法点拨】
建立回归模型的基本步骤:
(1)确定研究对象,明确哪个变量是解释变量,哪个是预报变量;
(2)画出解释变量和预报变量的散点图,观察它们之间的关系;
(3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程:x);
(4)按一定规则估计回归方程中的参数(如最小二乘法);
(5)得出结果分析残差图是否有异常,若存在异常,则检查数据是否有误,或模型是否适当.当回归方程不是形如:x时,我们称之为非线性回归方程.
14.如果两种证券在一段时间内收益数据的相关系数为0.8,那么表明( )
A.两种证券的收益有反向变动的倾向
B.两种证券的收益有同向变动的倾向
C.两种证券的收益之间存在完全反向的联动关系,即涨或跌是相反的
D.两种证券的收益之间存在完全同向的联动关系,即同时涨或同时跌
15.下列说法正确的是( )
A.一组数据的标准差为0,则这组数据中的数均相等
B.两组数据的标准差相等,则这两组数据的平均数相等
C.若两个变量的相关系数越接近于0,则这两个变量的相关性越强
D.已知变量X,Y由它们的样本数据计算得到K2的观测值k≈5.527,K2的部分临界值如下表:则在犯错误的概率不超过0.025的前提下认为变量X,Y没有关系
P(K2≥k0) 0.1 0.05 0.025 0.01
k0 2.706 3.841 5.024 6.635
16.已知变量x和变量y的3对随机观测数据(0,4),(3,3),(6,2),则该组样本数据点的相关系数r=( )
(参考公式:)
A. B.﹣1 C. D.1
17.在某生态系统中,研究人员发现两种生物近期的数量线性相关,且相关系数为0.75,这说明( )
A.一种生物的数量增长时,另一种生物的数量会减少
B.一种生物的数量增长时,另一种生物的数量也增长
C.两种生物的数量增减性有相同的趋势
D.两种生物的数量增减性有相反的趋势
18.日日新学习频道对四组数据进行统计,获得如图所示的散点图.则其相关系数最大的是( )
A.r1 B.r2 C.r3 D.r4
19.如果两种证券在一段时间内收益数据的相关系数为正数,那么表明( )
A.两种证券的收益之间存在完全同向的联动关系,即同时涨或同时跌
B.两种证券的收益之间存在完全反向的联动关系,即涨或跌是相反的
C.两种证券的收益有同向变动的倾向
D.两种证券的收益有反向变动的倾向
20.在研究线性回归模型时,样本数据(xi,yi)(i=1,2,3, ,n)所对应的点均在直线上,用r表示解释变量对于反应变量变化的线性相关度,则r= .
21.在陈塘关,哪吒发现高中学生的仙术成绩(类似数学成绩设为x)、法宝操控成绩(类似物理成绩设为y)、灵符绘制成绩(类似化学成绩设为z)两两成正相关关系.哪吒随机抽取了55名仙童,仙术成绩x和法宝操控成绩y的样本线性相关系数为,法宝操控成绩y和灵符绘制成绩z的样本线性相关系数为,求仙术成绩x和灵符绘制成绩z的样本线性相关系数的最大值为 .第9章第1节 线性回归分析
题型1 散点图 题型2 变量间的相关关系
题型3 样本相关系数
▉题型1 散点图
【知识点的认识】
1.散点图的概念:
在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.
2.曲线拟合的概念:
从散点图可以看出如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这种近似的过程称为曲线拟合.
3.正相关和负相关:
(1)正相关:对于相关关系的两个变量,如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关,正相关时散点图的点散布在从左下角到右上角的区域内.
(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关,负相关时散点图的点散布在从左上角到右下角的区域.
3、注意:画散点图的关键是以成对的一组数据,分别为此点的横、纵坐标,在平面直角坐标系中把其找出来,其横纵坐标的单位长度的选取可以不同,应考虑数据分布的特征,散点图只是形象的描述点的分布,如果点的分布大致呈一种集中趋势,则两个变量可以初步判断具有相关关系,如图中数据大致分布在一条直线附近,则表示的关系是线性相关,如果两个变量统计数据的散点图呈现如下图所示的情况,则两个变量之间不具备相关关系,例如学生的身高和学生的英语成绩就没有相关关系.
4、散点图又称散点分布图,是以一个变量为横坐标,另一变量为纵坐标,利用散点(坐标点)的分布形态反映变量统计关系的一种图形.特点是能直观表现出影响因素和预测对象之间的总体关系趋势.优点是能通过直观醒目的图形方式反映变量间关系的变化形态,以便决定用何种数学表达方式来模拟变量之间的关系.散点图不仅可传递变量间关系类型的信息,也能反映变量间关系的明确程度.
1.下列关于散点图的说法中,正确的是( )
A.任意给定统计数据,都可以绘制散点图
B.从散点图中可以看出两个量是否具有一定的关系
C.从散点图中可以看出两个量的因果关系
D.从散点图中无法看出数据的分布情况
【答案】B
【解答】解:散点图不适合用于展示百分比占比的数据,另外数据量较少的数据也不适合用散点图表示,故A错误;
散点图能看出两个量是否具有一定关系,但是并一定是因果关系,故B正确,C错误;
散点图中能看出数据的分布情况,故D错误.
故选:B.
2.对两组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )
A.r1<﹣r2<0 B.r2<﹣r1<0 C.r2>﹣r1>0 D.r1>﹣r2>0
【答案】D
【解答】解:由散点图可知,由相关系数绝对值越接近于1,则相关性越强,
可得图(1)中两个变量成正相关,且散点图近似在一条直线上,
所以r1>0且r1趋近于1;
图(2)中两个变量成负相关,且散点图比较分散,所以r2<0且|r1|>|r2|,
所以r1>﹣r2>0.
故选:D.
3.已知5个成对数据(x,y)的散点图如下,若去掉点D(4,3),则下列说法正确的是( )
A.变量x与变量y呈正相关
B.变量x与变量y的相关性变强
C.残差平方和变大
D.样本相关系数r变大
【答案】B
【解答】解:由散点图可知,去掉点D(4,3)后,y与x的线性相关加强,且为负相关,
所以B正确,A错误;
由于y与x的线性相关加强,所以残差平方和变小,所以C错误,
由于y与x的线性相关加强,且为负相关,所以相关系数的绝对值变大,
而相关系数为负的,所以样本相关系数r变小,所以D错误.
故选:B.
4.对两个变量的三组数据进行统计,得到以下散点图,关于两个变量相关系数的比较,正确的是( )
A.r1>r2>r3 B.r2>r3>r1 C.r1>r3>r2 D.r3>r2>r1
【答案】C
【解答】解:由散点图可知第1个图表示的正相关,故r1>0,
第2,3图表示的负相关,且第2个图中的点比第3个图中的点分布更为集中,
故r2,r3<0,且|r2|>|r3|,故r2<r3<0,
综合可得r2<r3<r1,
即r1>r3>r2.
故选:C.
5.观察下列散点图,则①正相关,②负相关,③不相关,这三句话与散点图的位置相对应的是( )
A.①②③ B.②③① C.②①③ D.①③②
【答案】D
【解答】解:由散点图的分布图2分布比较集中,成圆形区域为不相关;图1中成向右上方倾斜的带状区域,为正相关.
故选:D.
6.如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是( )
A.相关系数r变大
B.残差平方和变大
C.相关指数R2变大
D.解释变量x与预报变量y的相关性变强
【答案】B
【解答】解:由散点图知,去掉D(3,10)后,y与x的线性相关加强,且为正相关,
所以r变大,R2变大,残差平方和变小.
故选:B.
▉题型2 变量间的相关关系
【知识点的认识】
1、变量之间的相关关系
两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系.当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系.相关关系是一种非确定性关系,如长方体的高与体积之间的关系就是确定的函数关系,而人的身高与体重的关系,学生的数学成绩好坏与物理成绩的关系等都是相关关系.
2、线性相关和非线性相关:
两个变量之间的相关关系又可分为线性相关和非线性相关,如果所有的样本点都落在某一函数曲线的附近,则变量之间具有相关关系(不确定性的关系),如果所有样本点都落在某一直线附近,那么变量之间具有线性相关关系,相关关系只说明两个变量在数量上的关系,不表明他们之间的因果关系,也可能是一种伴随关系.
3、两个变量相关关系与函数关系的区别和联系
(1)相同点:两者均是两个变量之间的关系.
(2)不同点:函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系,相关关系是一种非确定的关系,如一块农田的小麦产量与施肥量之间的关系,函数关系是两个随机变量之间的关系,而相关关系是非随机变量与随机变量之间的关系;函数关系式一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
7.对两组数据进行统计后得到如图所示的散点图,下列结论不正确的是( )
A.图1、图2两组数据都具有线性相关关系
B.图1数据正相关,图2数据负相关
C.图1相关系数r1小于图2相关系数r2
D.图1相关系数和图2相关系数之和小于0
【答案】C
【解答】解:对于选项A,因为散点图都呈直线型,所以图1、图2两组数据都具有线性相关关系,故A正确;
对于选项B,图1散点从左至右呈上升趋势,所以数据正相关,
图2散点从左至右呈下降趋势,所以数据负相关,故B正确;
对于选项C,图1正相关,图2负相关,所以r1>r2,故C错误;
对于选项D,因为图2相关程度更强,所以r1+r2<0,故D正确.
故选:C.
8.已知气候温度和海水表层温度相关,且相关系数为负数,对此描述正确的是( )
A.气候温度高,海水表层温度就高
B.气候温度高,海水表层温度就低
C.随着气候温度由低到高,海水表层温度呈上升趋势
D.随着气候温度由低到高,海水表层温度显下降趋势
【答案】D
【解答】解:气候温度和海水表层温度相关,且相关系数为负数,
则随着气候温度由低到高,海水表层温度显下降趋势.
故选:D.
9.下列各关系不属于相关关系的是( )
A.产品的样本与生产数量
B.球的表面积与体积
C.家庭的支出与收入
D.人的年龄与体重
【答案】B
【解答】解:对于选项A,产品的样本与生产数量是相关关系,故A正确;
对于选项B,球的表面积与体积是一种函数关系,故B错误;
对于选项C,家庭的支出与收入是相关关系,故C正确;
对于选项D,人的年龄与体重是相关关系,故D正确.
故选:B.
10.对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图1;对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图2.由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
【答案】C
【解答】解:由图可知,
在图1中,u变大,v也变大,则u与v正相关;
在图2中,x变大,y变小,则y与x负相关;
故选:C.
11.张大爷种植了10亩小麦,每亩施肥x千克,小麦总产量为y千克,则( )
A.x,y之间有依赖关系 B.x,y之间有函数关系
C.y是x的函数 D.x是y的函数
【答案】A
【解答】解:小麦的总产量与种子、施肥量、水、日照时间等因素有相关关系,但不一定是函数关系.
故选:A.
(多选)12.为了研究变量y和x的线性相关关系,收集了下图5对样本数据.若已求得,一元线性回归方程为,则下列选项中正确的是( )
x 1 2 3 4 5
y 0.5 0.9 1 1.1 1.5
A.变量y和x正相关
B.变量y和x负相关
C.
D.当x=5时的残差为0.06
【答案】ACD
【解答】解:根据表中数据可知,选项A正确,选项B错误,
对于选项C,将(3,1)代入,得,
解得,所以选项C正确,
对于选项D,由C可知,y=0.22x+0.34,
当x=5时,,
所以残差为,故选项D正确.
故选:ACD.
13.变量X与Y相对应的一组数据为:(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5); 变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,是则r1与r2的大小关系是r2<r1 .
【答案】r2<r1
【解答】解:由变量X与Y相对应的一组数据为:(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5).
可得:变量Y与X之间的正相关,因此r1>0.
而由变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),可知:变量V与U之间的负相关,∴r2<0.
因此r1与r2的大小关系是 r2<r1.
故答案为:r2<r1.
▉题型3 样本相关系数
【知识点的认识】
1、概念:
相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度.于是,著名统计学家卡尔 皮尔逊设计了统计指标﹣﹣相关系数.相关系数是用以反映变量之间相关关系密切程度的统计指标.相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数.
2、相关系数用r表示,计算公式为
其中:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.
3、残差:
相关指数R2用来刻画回归的效果,其计算公式是
在含有一个解释变量的线性模型中,R2恰好等于相关系数r的平方.显然,R2取值越大,意味着残差平方和越小,也就是模型的拟合效果越好.
【解题方法点拨】
建立回归模型的基本步骤:
(1)确定研究对象,明确哪个变量是解释变量,哪个是预报变量;
(2)画出解释变量和预报变量的散点图,观察它们之间的关系;
(3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程:x);
(4)按一定规则估计回归方程中的参数(如最小二乘法);
(5)得出结果分析残差图是否有异常,若存在异常,则检查数据是否有误,或模型是否适当.当回归方程不是形如:x时,我们称之为非线性回归方程.
14.如果两种证券在一段时间内收益数据的相关系数为0.8,那么表明( )
A.两种证券的收益有反向变动的倾向
B.两种证券的收益有同向变动的倾向
C.两种证券的收益之间存在完全反向的联动关系,即涨或跌是相反的
D.两种证券的收益之间存在完全同向的联动关系,即同时涨或同时跌
【答案】B
【解答】解:相关系数是用以反映变量之间相关关系密切程度的统计指标,
当相关系数为正数时,表示两种证券的收益有同向变动的倾向;
当相关系数为负数时,表示两种证券的收益有反向变动的倾向,
相关系数为0.8(0.8>0),所以表明两种证券的收益有同向变动的倾向,
故A错误,C错误,B正确,
而相关系数为1时表示两种证券的收益之间存在完全同向的联动关系,为﹣1时表示完全反向的联动关系,
所以D错误.
故选:B.
15.下列说法正确的是( )
A.一组数据的标准差为0,则这组数据中的数均相等
B.两组数据的标准差相等,则这两组数据的平均数相等
C.若两个变量的相关系数越接近于0,则这两个变量的相关性越强
D.已知变量X,Y由它们的样本数据计算得到K2的观测值k≈5.527,K2的部分临界值如下表:则在犯错误的概率不超过0.025的前提下认为变量X,Y没有关系
P(K2≥k0) 0.1 0.05 0.025 0.01
k0 2.706 3.841 5.024 6.635
【答案】A
【解答】解:A选项,一组数据x1,x2, ,xn的标准差时,
显然,故A正确;
B选项,两组数据的标准差相等,这两组数据的平均数未必相等,
如均为1和均为2的两组数据,它们的标准差均为0,
但它们的平均数分别为1和2,故B错误;
C选项,两个变量的相关系数越接近于0,两个变量的相关性越弱,故C错误;
D选项,k≈5.527>5.024,根据独立性检验原理,
在犯错误的概率不超过0.025的前提下认为变量X,Y有关系,故D错误.
故选:A.
16.已知变量x和变量y的3对随机观测数据(0,4),(3,3),(6,2),则该组样本数据点的相关系数r=( )
(参考公式:)
A. B.﹣1 C. D.1
【答案】B
【解答】解:已知变量x和变量y的3对随机观测数据(0,4),(3,3),(6,2),
由题可得,,
则
,,
,
则.
故选:B.
17.在某生态系统中,研究人员发现两种生物近期的数量线性相关,且相关系数为0.75,这说明( )
A.一种生物的数量增长时,另一种生物的数量会减少
B.一种生物的数量增长时,另一种生物的数量也增长
C.两种生物的数量增减性有相同的趋势
D.两种生物的数量增减性有相反的趋势
【答案】C
【解答】解:由题意可知,两种生物近期的数量线性相关,且相关系数为0.75,
所以两种生物的数量正相关,
所以两种生物的数量增减性有相同的趋势.
故选:C.
18.日日新学习频道对四组数据进行统计,获得如图所示的散点图.则其相关系数最大的是( )
A.r1 B.r2 C.r3 D.r4
【答案】A
【解答】解:根据相关系数的定义知,|r|越接近于1关联性越强,
结合图象知,第一、三两幅图为正相关,且第一幅图的相关性较强,所以0<r3<r1,
又因为第二、四幅图变量之间为负相关,且第二幅图的相关性较强,所以r2<r4<0,
所以相关系数最大的是r1.
故选:A.
19.如果两种证券在一段时间内收益数据的相关系数为正数,那么表明( )
A.两种证券的收益之间存在完全同向的联动关系,即同时涨或同时跌
B.两种证券的收益之间存在完全反向的联动关系,即涨或跌是相反的
C.两种证券的收益有同向变动的倾向
D.两种证券的收益有反向变动的倾向
【答案】C
【解答】解:A,两种证券完全同向联动,同涨或同跌,相关系数必须为1,但题目中说的是相关系数为正数,不一定为1,故A选项错误;
B,两种证券完全反向联动,涨和跌是完全相反的,相关系数必须为﹣1,但题目中说的是相关系数为正数,故B选项错误;
C,题目中说的是相关系数为正数,也就是说两种证券之间变化是正相关,因此是同向变动,故C选项正确;
D,两种证券收益反向变动为负相关,与题目中的相关系数为正数不符,故D选项错误.
故选:C.
20.在研究线性回归模型时,样本数据(xi,yi)(i=1,2,3, ,n)所对应的点均在直线上,用r表示解释变量对于反应变量变化的线性相关度,则r= ﹣1 .
【答案】﹣1.
【解答】解:由题意可知,已知样本数据(xi,yi)(i=1,2,3, ,n)所对应的点均在直线上,
由相关系数的定义可知,|r|=1,
又因为,
所以变量x,y之间是负相关,即r<0,
所以r=﹣1.
故答案为:﹣1.
21.在陈塘关,哪吒发现高中学生的仙术成绩(类似数学成绩设为x)、法宝操控成绩(类似物理成绩设为y)、灵符绘制成绩(类似化学成绩设为z)两两成正相关关系.哪吒随机抽取了55名仙童,仙术成绩x和法宝操控成绩y的样本线性相关系数为,法宝操控成绩y和灵符绘制成绩z的样本线性相关系数为,求仙术成绩x和灵符绘制成绩z的样本线性相关系数的最大值为 .
【答案】.
【解答】解:设(x1,x2,…,xn),(y1,y2,…,yn),(z1,z2,…,zn),
(x1,x2,…,xn),(y1,y2,…,yn),(z1,z2,…,zn),
设与的夹角为α,与的夹角为β,
由题意知,x与y的样本相关系数为,即cosα,y与z的样本相关系数为,即cosβ;
由题意知α与β均为锐角,且β>α,
所以与夹角余弦的最大值为cos(β﹣α)=cosβcosα+sinβsinα
,
即x与z的样本相关系数的最大值为.
故答案为:.