人教版高中数学必修三知识讲解,巩固练习(教学资料,补习资料):专题2.3 变量间的相关关系

文档属性

名称 人教版高中数学必修三知识讲解,巩固练习(教学资料,补习资料):专题2.3 变量间的相关关系
格式 zip
文件大小 380.5KB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2019-09-26 08:15:17

图片预览

文档简介

第二章 统计
2.3 变量间的相关关系
知识
1.变量之间的相关关系
当自变量取值一定时,因变量的取值带有一定的_________,则这两个变量之间的关系叫相关关系.由于相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断.
注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系.
2.散点图
将样本中的个数据点描在平面直角坐标系中,所得图形叫做散点图.根据散点图中点的分布可以直观地判断两个变量之间的关系.
(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为_________,如图(1)所示;
(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为_________,如图(2)所示.
3.两个变量的线性相关
(1)如果散点图中点的分布从整体上看大致在_________附近,我们就称这两个变量之间具有_________,这条直线叫做回归直线.
回归直线对应的方程叫做回归直线方程(简称回归方程).
(2)设已经得到两个具有线性相关关系的变量的一组数据,直线方程,其中是待定参数.
经数学上的推导,的值由下列公式给出:.
其中,回归直线的斜率为,截距为,即回归方程为.
上述求回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做_________.
(3)利用回归方程,我们可以进行预测并对总体进行估计.
4.相关关系的强与弱
若相应于变量的取值,变量的观测值为,则变量与的相关系数,即,通常用来衡量与之间的线性关系的强弱.的范围为,为正时,与正相关;为负时,与负相关.越接近于1,与的相关程度越大;越接近于0,二者的相关程度越小.当时,所以数据点都在一条直线上.
知识参考【答案】
1.随机性
2.(1)正相关 (2)负相关
3.(1)一条直线 线性相关关系 (2)最小二乘法
重点
重点
会画散点图,利用散点图认识两个变量之间的线性关系,求线性回归方程
难点
求线性回归方程
易错
(1)易忽略求回归方程的前提,即两个变量线性相关;
(2)求回归方程时,易记错求,的公式或混淆,的位置
1.回归方程的求解
(1)求回归方程的步骤:列表→计算相关量的值→代入公式计算,的值→写出回归方程.
(2)回归直线一定经过样本点的中心.
【例1】假设关于某设备的使用年限(年)和所支出的年平均维修费用(万元)(即维修费用之和除以使用年限),有如下的统计资料:
使用年限
2
3
4
5
6
维修费用
2.2
3.8
5.5
6.5
7.0
(1)画出散点图;
(2)从散点图中发现使用年限与所支出的年平均维修费用之间关系的一般规律;
(3)求回归方程;
(4)估计使用年限为10年时所支出的年平均维修费用是多少?
【答案】答案详见解析.
【解析】(1)画出散点图如图所示:
(2)由上图可知,各点散布在从左下角到右上角的区域里,因此,使用年限与所支出的年平均维修费用之间成正相关,即使用年限越长,所支出的年平均维修费用越多.
(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,两变量呈线性相关关系.
由题表数据可得,
由公式可得,
即回归方程是.
(4)由(3)知,当时,.
故估计使用年限为10年时所支出的年平均维修费用是12.38万元.
【名师点睛】若两个变量之间呈线性相关关系,则不需要进行相关性的检验,否则,应先进行相关性的检验,再求回归方程.若两个变量之间不具有相关关系,则求出的回归方程是无意义的.
2.回归直线的理解及其应用
在回归方程中,是回归直线的斜率,它代表每增加一个单位,的平均增加单位数,而不是增加单位数.
对于具有线性相关关系的两个变量,在求出回归方程后,就可以对总体的数据进行估计或者由已知数据的趋势去预测未知数据的值.
【例2】根据如下样本数据得到的回归方程为,若,则每增加个单位,就
3
4
5
6
7
4
2.5
0.5
A.增加个单位 B.减少个单位
C.增加个单位 D.减少个单位
【答案】B
【解析】∵,且,即在回归直线上,∴,解得,故回归方程为,则每增加1个单位,就减少个单位,故选B.
【名师点睛】当时,两个变量呈正相关关系,含义为:每增加一个单位,平均增加个单位数;当时,两个变量呈负相关关系,含义为:每增加一个单位,平均减少个单位数.
【例3】中国柳州从2011年起每年国庆期间都举办一届国际水上狂欢节,到2016年已举办了六届,旅游部门统计在每届水上狂欢节期间,吸引了不少外地游客到柳州,这将极大地推进柳州的旅游业的发展,现将前五届水上狂欢节期间外地游客到柳州的人数统计如下表:
年份
2011年
2012年
2013年
2014年
2015年
水上狂欢节届编号
1
2
3
4
5
外地游客人数(单位:十万)
0.6
0.8
0.9
1.2
1.5
(1)求关于的线性回归方程;
(2)旅游部门统计在每届水上狂欢节期间,每位外地游客可为本市增加100元左右的旅游收入,利用(1)中的线性回归方程,预测2017年第7届柳州国际水上狂欢节期间外地游客可为本市增加的旅游收入达多少?
参考公式:,.
【答案】答案详见解析.
(2)由(1)知,当时,,
于是预测2017年第七届中国柳州国际水上狂欢节到柳州的外地游客可达18万8千人,
由(元),预测2017年第7届柳州国际水上狂欢节期间外地游客可为本市增加的旅游收入达1880万元.
【名师点睛】注意所得的值只是一个估计值,不是精确值.
3.弄错回归方程中,的位置
【例4】某班5名学生的数学和物理成绩如下表:
(1)画出散点图.
(2)求物理成绩y对数学成绩x的线性回归方程.
【答案】答案详见解析.
【错解】(1)散点图如图所示:
(2)计算得,,


所以,.
所以y对x的线性回归方程是.
【错因分析】错解中回归方程记忆错误,应为.
【正解】(1)散点图如图所示:
(2)计算得,



所以,.
所以y对x的线性回归方程是.
【名师点睛】不要受前面学习的直线方程的影响,而将回归方程写为,实际上,回归方程应为.
基础训练
1.下列两个变量之间的关系不具有线性关系的是
A.小麦产量与施肥值
B.球的体积与表面积
C.蛋鸭产蛋个数与饲养天数
D.甘蔗的含糖量与生长期的日照天数
2.下列命题正确的是
①任何两个变量都具有相关关系;
②圆的周长与该圆的半径具有相关关系;
③某商品的需求量与该商品的价格是一种非确定性关系;
④根据散点图求得的回归直线方程可能是没有意义的;
⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.
A.①③④          B.②③④
C.③④⑤ D.②④⑤
3.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图图1;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图图2.由这两个散点图可以判断
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
4.下列变量是线性相关的是
A.人的体重与视力
B.圆心角的大小与所对的圆弧长
C.收入水平与购买能力
D.人的年龄与体重
5.已知变量x,y之间具有线性相关关系,其散点图如图所示,则其回归方程可能为
A.=1.5x+2 B.=-1.5x+2
C.=1.5x-2 D.=-1.5x-2
6.下列关系中,属于相关关系的是________
①正方形的边长与面积之间的关系;
②农作物的产量与施肥量之间的关系;
③人的身高与年龄之间的关系;
④降雪量与交通事故的发生率之间的关系.
7.若施肥量x(kg)与水稻产量y(kg)的线性回归方程为=5x+250,当施肥量为80 kg时,预计水稻产量约为________kg.
8.正常情况下,年龄在18岁到38岁的人,体重y(kg)对身高x(cm)的回归方程为=0.72x-58.2,张红同学(20岁)身高为178 cm,她的体重应该在________ kg左右.
9.下表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据:
x
3
4
5
6
y
2.5
t
4
4.5
根据上表提供的数据,求出y关于x的线性回归方程=0.7x+0.35,那么表中t的值为________.
10.下列两个变量之间的关系是相关关系的是____________.
①正方体的棱长和体积;
②单位圆中圆心角的度数和所对弧长;
③单产为常数时,土地面积和总产量;
④日照时间与水稻的亩产量.
能力提升
11.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是
A.直线l过点(,)
B.回归直线必通过散点图中的多个点
C.直线l的斜率必在(0,1)
D.当n为偶数时,分布在l两侧的样本点的个数一定相同
12.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是
A.y与x具有正的线性相关关系
B.回归直线过样本的中心点(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
13.对有线性相关关系的两个变量建立的回归直线方程=+x中,回归系数
A.不能小于0 B.不能大于0
C.不能等于0 D.只能小于0
14.某考察团对全国10大城市职工人均工资x与居民人均消费y进行统计调查,y与x具有线性相关关系,线性回归方程=0.66x+1.562(单位:千元),若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比约为____________.
15.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的人数5~32人,船员人数y关于吨位x的回归方程为=9.5+0.006 2x,
(1)若两艘船的吨位相差1 000,求船员平均相差的人数.
(2)估计吨位最大的船和最小的船的船员人数.
16.某工厂对某种产品的产量与成本的资料分析后有如下数据:
产量x(千件)
2
3
5
6
成本y(万元)
7
8
9
12
(1)画出散点图;
(2)求成本y与产量x之间的线性回归方程;
(3)预计产量为8千件时的成本.
17.某城市理论预测2014年到2018年人口总数y(单位:十万)与年份(用2014+x表示)的关系如表所示:
年份中的x
0
1
2
3
4
人口总数y
5
7
8
11
19
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归方程=bx+a;
(3)据此估计2019年该城市人口总数.
(参考数据:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30)
参考公式:线性回归方程为,其中.
真题练习
18.(2017?山东)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为x+,已知xi=225,yi=1600,=4,该班某学生的脚长为24,据此估计其身高为
A.160 B.163 C.166 D.170
19.(2018?新课标Ⅱ)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=–30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
参考答案
1
2
3
4
5
11
12
13
18
B
C
C
C
B
A
D
C
C
1.【答案】B
【解析】A,小麦的产量和施肥值是一种不确定的关系,是一种相关关系,具有线性关系;
B,根据球的体积公式和表面积公式可知,体积和表面积和球的半径存在一种确定的关系,所以它们是一种确定的函数关系.不是一次函数,不是线性关系;
C,蛋鸭产蛋个数与饲养天数是一种不确定的关系,是一种相关关系,具有线性关系;
D,甘蔗的含糖量与生长期的日照天数是一种不确定的关系,是一种相关关系,具有线性关系.故选B.
2.【答案】C
【解析】①显然不对,②是函数关系,③④⑤正确.
6.【答案】②④
【解析】在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.
7.【答案】650
【解析】把x=80 kg代入回归方程可得其预测值=5×80+250=650(kg).
8.【答案】69.96
【解析】用回归方程对身高为178 cm的人的体重进行预测,当x=178时,=0.72×178-58.2=69.96(kg).
9.【答案】3
【解析】由回归直线过点(,),即=0.7+0.35,得=0.7×+0.35,即=3.5,解得t=3.
10.【答案】④
【解析】根据题意,依次分析4个命题:对于①,由正方体的棱长和体积的公式知,V=a3(a>0),故其是函数关系,不符合题意;对于②,单位圆中角的度数n和所对弧长l的关系为l=,故其是函数关系,不符合题意;对于③,单产为常数k时,土地面积S和总产量L的关系为:L=k?S,故其是函数关系,不符合题意;对于④,日照时间会影响水稻的亩产量,但不是唯一因素,它们之间有相关性,符合题意.故答案为:④.
13.【答案】C
【解析】当=0时,r=0,这时不具有线性相关关系,但能大于0,也能小于0.
14.【答案】83%
【解析】因为=7.675,所以7.675=0.66x+1.562,所以x=9.262,由题意×100%≈83%,故答案为:83%.
15.【答案】(1)船员平均相差6人;(2)吨位最大和最小的船的船员数分别为29人和10人.
【解析】(1)设两艘船的吨位分别为x1,x2则
1-2=9.5+0.006 2x1-(9.5+0.006 2x2)=0.006 2×1 000≈6,
即船员平均相差6人.
(2)当x=192时,=9.5+0.006 2×192≈10,
当x=3 246时,=9.5+0.006 2×3 246≈29.
即估计吨位最大和最小的船的船员数分别为29人和10人.
16.【答案】(1)详见解析;(2)=1.1x+4.6;(3)产量为8千件时,成本约为13.4万元.
【解析】(1)散点图如下:
(2)设成本y与产量x的线性回归方程为=x+,
==4,==9.
===1.1,
=-=9-1.1×4=4.6.
所以,回归方程为=1.1x+4.6.
(3)当x=8时,=1.1×8+4.6=8.8+4.6=13.4,即产量为8千件时,成本约为13.4万元.
17.【答案】(1)详见解析;(2)y=3.2x+3.6;(3)估计2019年该城市人口总数约为196万.
【解析】(1)根据表格画出散点图:可得y与x是正相关.
概据题中数表画出数据的散点图如下图所示.
(2)由题中数表,知:(0+1+2+3+4)=2,(5+7+8+11+19)=10,
∴b==3.2,a=–b=3.6,∴回归方程为y=3.2x+3.6.
(3)当x=5时,求得y=19.6(十万)=196(万).
答:估计2019年该城市人口总数约为196万.
18.【答案】C
【解析】由线性回归方程为=4x+,则xi=22.5,yi=160,则数据的样本中心点(22.5,160),由回归直线方程样本中心点,则–4x=160–4×22.5=70,∴回归直线方程为=4x+70,当x=24时,=4×24+70=166,则估计其身高为166,故选C.
19.【答案】(1)利用模型①,求出该地区2018年的环境基础设施投资额的预测值是226.1亿元;
利用模型②,求出该地区2018年的环境基础设施投资额的预测值是256.5亿元;
(2)模型②得到的预测值更可靠;理由详见解析.
(2)模型②得到的预测值更可靠;
因为从总体数据看,该地区从2000年到2016年的环境基础设施投资额是逐年上升的,
而从2000年到2009年间递增的幅度较小些,
从2010年到2016年间递增的幅度较大些,
所以,利用模型②的预测值更可靠些.