(共51张PPT)
10.3.1 变量间的相关
关系及回归模型
课标要求 考情分析
1.会作两个有关联变量的数据的散点 图,会利用散点图认识变量间的相关关 系. 2.了解最小二乘法的思想,能根据给出 的经验回归方程系数公式建立经验回归 方程. 3.了解独立性检验及回归分析的基本思 想、方法及其简单应用. 考点考法:高考命题常以选择
题、填空题的形式考查求经验回
归方程系数以及利用经验回归方
程进行预测,在解答题中单独考
查或与概率及其分布结合探究经
验回归方程以及独立性检验.
核心素养:数学建模、数学运
算、数据分析
必备知识 自主排查
核心考点 师生共研
必备知识 自主排查
01
1.变量的相关关系
(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)散点图:每一个成对样本数据都可用直角坐标系中的____表示出来,
由这些点组成了统计图.我们把这样的统计图叫做散点图.
(3)相关关系的分类:________和________.
(4)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散
点落在__________附近,我们就称这两个变量线性相关.
点
正相关
负相关
一条直线
[提醒] 相关关系与函数关系不同,函数关系中的两个变量间是一种确定性关系,相关关系是一种非确定性关系,即相关关系是随机变量与随机变量之间的关系.
2.样本相关系数
(1) .
(2)当 时,称成对样本数据____相关;当 时,称成对样本数
据____相关.
(3) .当 越接近1时,成对样本数据的线性相关程度越____;当
越接近0时,成对样本数据的线性相关程度越____.
正
负
强
弱
3.一元线性回归模型
(1)经验回归直线:从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做经验回归直线.
(2)经验回归方程为 ,
其中 ,
.
(3)通过求 的最小值而得到经验回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.
4.判断回归模型的拟合效果
由成对样本数据 按照最小二乘法得到经验回归方程 ,其中 叫做观测值, 叫做预测值,残差 .相应于样本点 的随机误差 .
(1)残差分析法
①作残差图:作图时纵坐标为______,横坐标可以选为样本编号,或 数据,
或 数据,这样作出的图形称为残差图;
②残差分析:残差点比较均匀地落在水平的带状区域中,说明选用的模型比
较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,经验回归方
程的预报精度越高.
(2)决定系数 法: (其中 ). 的值越
趋近于1,模型的拟合效果越好.
残差
【练一练】
1.判断正误(正确的打“√”,错误的打“×”)
(1)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性
关系来表示.( )
√
(2)经验回归直线 至少经过点 , , ,
中的一个点.( )
×
(3)任何一组数据都对应着一个经验回归方程.( )
×
2.(人A选择性必修第三册 复习参考题 变条件、变设问)两个变
量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右
分别反映的变量间的相关关系是( )
A.①②③ B.②③④ C.②①③ D.①③②
√
解析:选D.第一个散点图中,散点图中的点是从左下角区域分布到右上角区域,是正相关;第三个散点图中,散点图中的点是从左上角区域分布到右下角区域,是负相关;第二个散点图中,散点图中的点的分布没有什么规律,是不相关,所以应该是①③②.
3.已知变量 与 正相关,且由观测数据算得样本平均数 , ,
则由该观测数据算得的经验回归方程可能是( )
A. B.
C. D.
解析:选A.由题意, 与 正相关,故排除C,D,将 代入经验回归方程检验得A正确.
√
核心考点 师生共研
02
考点一 变量间相关关系的判断(自主练透)
1.通过抽样调研发现,某地第三季度的医院心脑血管疾病的人数和便利店
购买冷饮的人数的相关系数很高,甲认为这是巧合,两者其实没有关系;
乙认为冷饮的某种摄入成分导致了疾病;丙认为病人对冷饮会有特别需求;
丁认为两者的相关关系是存在的,但不能视为因果.则意见最可能成立的成
员是( )
A.甲 B.乙 C.丙 D.丁
√
解析:选D.该地第三季度的医院心脑血管疾病的人数和便利店购买冷饮的人数的相关系数很高,但相关关系是一种非确定性关系,相关关系不等于因果关系,丁的意见最可能成立.故选D.
2.(多选)对小明在连续9次高考模拟数学测试
中的成绩(单位:分)进行统计得到如图所示
的散点图.他的同桌小刚根据散点图对他的数学
成绩进行分析,其中正确的有( )
A.小明的数学成绩总的趋势是在逐步提高
B.小明在这连续9次测试中的最高分与最低分的差超过40分
C.小明的数学成绩与测试序号具有线性相关关系,且为负相关
D.小明的数学成绩与测试序号具有线性相关关系,且为正相关
√
√
√
解析:选ABD.散点图从左向右看呈上升趋势,则小明的数学成绩总的趋势是在逐步提高,A正确;小明在这连续9次测试中的最高分大于130分,最低分小于90分,两者的差超过40分,B正确;散点落在某条直线附近,小明的数学成绩与测试序号具有比较明显的线性相关关系,且为正相关,C错误,D正确.故选ABD.
3.(2023·吉林长春吉大附中模拟)在以下4幅散
点图中,图________中的 和 之间存在相关
关系.(填序号)
②③④
解析:图②③中的点成带状区域分布在某一直线附近,④中点分布在某一曲线附近,故②③④中的 和 之间存在相关关系.
判定两个变量相关性的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.
(2)相关系数:当 时,正相关;当 时,负相关; 越接近
于1,相关性越强.
(3)经验回归方程:当 时,正相关;当 时,负相关.
考点二 样本相关系数(师生共研)
例1.(1)(2023·河北衡水模拟)相关变量 , 的散
点图如图所示,现对这两个变量进行线性相关分析.
方案一:根据图中所有数据,得到经验回归方程
,相关系数为 ;方案二:剔除点
A. B.
C. D.
,根据剩下的数据得到经验回归方程 ,相关系数为
.则( )
√
解析:由散点图可知这两个变量为负相关,所以 , .因为剔除点 后,剩下点的数据线性相关性更强, 更接近1,所以 .故选D.
(2)(2023·山东青岛模拟)某种机械设备随着使用年限的增加,它的使用
功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换
算成费用,称之为“失效费”.某种机械设备的使用年限 (单位:年)与失
效费 (单位:万元)的统计数据如下表所示:
使用年限 (单位:年) 1 2 3 4 5 6 7
失效费 (单位:万元) 2.90 3.30 3.60 4.40 4.80 5.20 5.90
由上表数据可知, 与 的相关系数为_____.
(精确到0.01,参考公式和数据: , , , )
解析:由题意,知 ,
,
.
所以 .
所以 与 的相关系数近似为0.99.
相关系数 的统计含义及应用
(1)由 的正、负可判断成对样本数据中两相关变量是正相关还是负相关.
(2)可根据 的大小从量的角度判断成对样本数据是否具有线性相关性,
进而可知能否用经验回归方程进行分析和预测.
[注意]相关系数 为判定两个变量是否线性相关的指标,且绝对值越大,
线性相关性越强,不是 越大线性相关性越强.
【对点训练】
第24届冬奥会于2022年2月4日在北京市和张家口市联合举行,此项赛事大
大激发了国人对冰雪运动的热情.某滑雪场在冬奥会期间开业,下表统计了
该滑雪场开业第 天的滑雪人数 (单位:百人)的数据.
天数代码 1 2 3 4 5 6 7
滑雪人数 百人 11 13 16 15 20 21 23
根据第1至7天的数据分析,可用线性回归模型拟合 与 的关系,请用相
关系数加以说明.(保留两位有效数字)
参考数据: , .
参考公式:
对于一组数据 , , , ,其相关系数
.
解:因为 ,
,
所以 ,
所以 ,
所以样本相关系数 的绝对值接近于 ,
所以可以推断 和 这两个变量线性相关,且相关程度很强.
考点三 经验回归模型(多维探究)
角度1 回归模型的辨析
例2.(1)一组实验数据构成的散点图如图,以下函数
中适合作为 与 的回归方程模型的是( )
A. B.
C. D.
解析:由散点图中各点的变化趋势知,各点不在一条直线上,排除A.由散点图中各点呈单调递减趋势,排除B.又图中点的横坐标有正有负,故排除C.故选D.
√
(2)(2023·福建莆田模拟)关于 与 有如下数据:
2 4 5 6 8
30 40 60 50 70
为了对 , 两个变量进行统计分析,现有以下两种线性模型:甲:
,乙: ,则____(填“甲”或“乙”)模型的拟
合效果更好.
甲
解析:由题意得 ,
甲模型中,
,
;
乙模型中,
,
.
设甲模型的决定系数为 ,则 ;
设乙模型的决定系数为 ,则 .因为
,即 ,所以甲模型的拟合效果更好.
回归模型选择的两种方法
(1)利用散点图,根据 的变化趋势判断 的系数,结合函数的图象确
定回归模型.
(2)利用决定系数 法, 的值越趋近于1,模型的拟合效果越好.
角度2 线性经验回归问题
例3 某研究机构为调查人的最大可视距离 (单位:米)和年龄 (单位:
岁)之间的关系,对不同年龄的志愿者进行了研究,收集数据得到下表:
20 25 30 35 40
167 160 150 143 130
(1)根据上表提供的数据,求出 关于 的经验回归方程 ;
【解】 由题意可得 ,
,
,
,
所以 ,
则 ,
故所求经验回归方程为 .
(2)根据(1)中求出的经验回归方程,估计年龄为50岁的人的最大可视
距离.
参考公式:经验回归方程 中斜率和截距的最小二乘估计公式分
别为 , .
【解】 当 时, ,
即年龄为50岁的人的最大可视距离约为113.6米.
线性回归分析问题的解题策略
(1)利用最小二乘估计公式,求出回归系数 ;
(2)利用经验回归直线过样本点的中心求系数 ;
(3)写出经验回归方程,并利用经验回归方程进行预测.
角度3 非线性经验回归问题
例4.(1)(2023·福建厦门模拟)用模型 拟合一组数据时,
设 ,将其变换后得到回归方程为 ,则 ( )
A. B. C. D.
√
解析:因为 ,
所以 .
又 , ,所以
解得 所以 ,故选D.
(2)由样本数据 , , , , ,得到经验
回归方程为 ,已知如下数据: , ,
,则实数 的值为_____.
解析:令 ,则经验回归方程 必过样本中心点 ,又
, ,
则 ,解得 .
有些非线性回归分析问题并不给出经验回归公式,这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)的图象进行比较,挑选一种跟这些散点拟合得最好的函数,用适当的变量进行变换,把问题化为线性回归问题,使之得到解决.
其一般步骤为:
【对点训练】
1.(多选)某工厂研究某种产品的产量 (单位:吨)与某种材料需求量
(单位:吨)之间的相关关系,在生产过程中收集了一组数据如表所示.
根据表中数据可得经验回归方程为 ,则下列说法中正确的为
( )
3 4 6 7
2.5 3 4 5.9
A.变量 与 正相关
B. 与 的相关系数
C.
D.产量为8吨时,预测所需材料约为5.95吨
√
√
√
解析:选ACD.因为经验回归方程为 ,所以产量 与材料需求
量 呈正相关,所以相关系数 ,故A正确,B错误;
由表格可得 , ,则
,解得 ,故C正确;
所以经验回归方程为 ,当 时,
,即产量为8吨时,预测所需材料约为5.95吨,故
D正确.故选ACD.
2.(2023·山东烟台模拟)已知变量 关于 的回归方程为 ,若对
两边取自然对数,可以发现 与 线性相关,现有一组数据
如下表所示, 时,预测 值为_ ___.
1 2 3 4
解析:对 两边取对数,得 ,令 ,则
.
1 2 3 4
1 3 4 6
, ,
代入 ,得 ,故 ,故
, ,
当 时, .
3.树木根部半径与树木的高度呈正相关,即树木根部越粗,树木的高度也
就越高.某块山地上种植了 树木,某农科所为了研究 树木的根部半径与
树木的高度之间的关系,从这些地块中用简单随机抽样的方法抽取6棵
树木,调查得到 树木根部半径 (单位:米)与 树木高度 (单位:
米)的相关数据如表所示:
0.1 0.2 0.3 0.4 0.5 0.6
1.1 1.3 1.6 1.5 2.0 2.1
(1)求 关于 的经验回归方程;
解:由已知得 ,
,
,
,
则 ,
,
故 关于 的经验回归方程为 .
(2)对(1)中得到的经验回归方程进行残差分析,若某 树木的残差为
零,则认为该树木“长势标准”,在此片树木中随机抽取1棵树木,估计这
棵树木“长势标准”的概率.
参考公式:经验回归方程为 ,其中
, .
解: 当 时, ,残差为 ,
当 时, ,残差为 ,
当 时, ,残差为 ,
当 时, ,残差为 ,
当 时, ,残差为 ,
当 时, ,残差为 ,
则这6棵 树木中残差为零的有3棵,占比为 ,所以这棵树木“长势
标准”的概率为 .10.3.1-变量间的相关关系及回归模型-专项训练【原卷版】
1.根据如下样本数据:
x 3 4 5 6 7 8
y 4.0 2.5 0.5 0.5 0.4 0.1
得到的经验回归方程为=x+,则( )
A.>0,>0 B.>0,<0
C.<0,>0 D.<0,<0
2.已知x与y之间的一组数据如表:
x 0 1 2 3
y m 3 5.5 7
已求得y关于x的经验回归方程为=2.1x+0.85,则m的值为( )
A.1 B.0.85
C.0.7 D.0.5
3.已知变量x,y相对应的一组数据为(10,1.5),(11,3.2),(11,8.3),(12.5,14),(13,5),变量x′,y′相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),用r1表示变量x与y之间的线性相关系数,用r2表示变量x′与y′间的线性相关系数,则有( )
A.r2C.r2<04.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有线性相关关系,且经验回归方程为=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( )
A.66% B.67%
C.79% D.84%
5.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
A.-1 B.0
C. D.1
6.某工厂为了对一种新研究的产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元) 4 5 6 7 8 9
销量y(件) 90 84 83 80 75 68
由表中数据,求得经验回归方程为=-4x+.若在这些样本点中任取一点,则它在经验回归直线左下方的概率为________.
7.国际青年物理学家竞赛(简称IYPT)是当今最受重视的中学生顶级国际物理赛事,某中学物理兴趣小组通过实验对其中一道竞赛题的两个物理量u、v进行测量,得到10组数据(u1,v1),(u2,v2),…,(u10,v10),通过散点图发现具有较强的线性相关关系,并且利用最小二乘法求得经验回归方程为=1.5u+1,由于数据保存失误导致i丢失,但i=50被保存,通过所学知识可以求得i=________.
8.为了提高农民收入,某农科所实地考察,研究发现某村适合种植A,B两种经济作物,通过大量考察研究得到如下统计数据:经济作物A的亩产量约为300公斤,其收购价格处于上涨趋势,最近五年的价格如下表:
年份编号x 1 2 3 4 5
年份 2017 2018 2019 2020 2021
单价y(元/公斤) 18 20 23 25 29
经济作物B的收购价格始终为25元/公斤,其亩产量的频率分布直方图如下:
(1)若经济作物A的单价y(单位:元/公斤)与年份编号x具有线性相关关系,请求出y关于x的经验回归方程,并估计2022年经济作物A的单价;
(2)用上述频率分布直方图估计经济作物B的平均亩产量(每组数据以区间的中点值为代表),若不考虑其他因素,试判断2022年该村应种植经济作物A还是经济作物B?并说明理由.
附:==,=-.
9.毛绒玩具是由毛绒面料与其他纺织材料为主要面料,内部填塞各种填充物而制成的玩具,色差和色度是衡量毛绒玩具质量优劣的重要指标之一,现抽检一批该产品测得以下数据:
色差X 21 23 25 27 29 31
色度Y 15 16 17 21 22 23
由大量实验数据可知该产品的色差和色度之间满足线性相关关系,且=0.25x+,现有一对测量数据为(32,21.25),则该组数据的残差为( )
A.0.65 B.0.75
C.-0.75 D.0.95
10.已知变量y关于x的经验回归方程为=ebx-0.5,其一组数据如下表所示:
x 1 2 3 4
y e e3 e4 e6
若x=5,则预测y的值可能为( )
A.e5 B.e
C.e7 D.e
11.在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系)
学生的编号i 1 2 3 4 5
数学成绩x 80 75 70 65 60
物理成绩y 70 66 68 64 62
现已知其经验回归方程为=0.36x+,则=________,根据此经验回归方程估计数学得90分的同学的物理成绩为________.(四舍五入到整数)
12.随着科技的发展,网购已经逐渐融入了人们的生活.在家里面不用出门就可以买到自己想要的东西,在网上付款即可,两三天就会送到自己的家门口.某公司组织统计了近五年来该公司网购的人数yi(单位:人)与时间ti(单位:年)的数据,列表如下:
ti 1 2 3 4 5
yi 24 27 41 64 79
(1)依据表中给出的数据,是否可用经验回归模型拟合y与t的关系,请计算相关系数r并加以说明(计算结果精确到0.01);(若|r|>0.75,则线性相关程度很高,可用经验回归模型拟合)
附:相关系数公式r=, ==,参考数据≈75.47.
(2)建立y关于t的经验回归方程,并预测第六年该公司的网购人数(计算结果精确到整数).(参考公式:=-)
13.中国茶文化博大精深,已知茶水的口感与茶叶类型以及水温有关.经验表明,某种绿茶用85 ℃的水泡制,再等到茶水温度降至60 ℃时饮用,可以产生最佳口感.某学习研究小组通过测量,得到了下面表格中的数据(室温是20 ℃).
泡制时间x/min 0 1 2 3 4
水温y/℃ 85 79 74 71 65
(1)小组成员根据上面表格中的数据绘制散点图,并根据散点图分布情况,考虑到茶水温度降到室温(即20 ℃)就不能再降的事实,决定选择函数模型y=kcx+20(x≥0)来刻画.
①令z=ln(y-20),求出z关于x的经验回归方程;
②利用①的结论,求出y=kcx+20(x≥0,c>0)中的k与c.
(2)你认为该品种绿茶用85 ℃的水大约泡制多久后饮用,可以产生最佳口感?
参考数据:ln 65≈4.2,ln 59≈4.1,ln 54≈4.0,ln 51≈3.9,ln 45≈3.8,log0.90.6≈4.8,e-0.1≈0.9,e4.2≈66.7,≈0.6.参考公式:=x+,=,=-.
10.3.1-变量间的相关关系及回归模型-专项训练【解析版】
1.根据如下样本数据:
x 3 4 5 6 7 8
y 4.0 2.5 0.5 0.5 0.4 0.1
得到的经验回归方程为=x+,则( )
A.>0,>0 B.>0,<0
C.<0,>0 D.<0,<0
解析:B 根据给出的数据可发现:整体上y与x呈现负相关,所以<0,由样本点(3,4.0)及(4,2.5)可知>0,故选B.
2.已知x与y之间的一组数据如表:
x 0 1 2 3
y m 3 5.5 7
已求得y关于x的经验回归方程为=2.1x+0.85,则m的值为( )
A.1 B.0.85
C.0.7 D.0.5
解析:D ==1.5,==,因为点(,)在经验回归方程上,所以=2.1×1.5+0.85,解得m=0.5,故选D.
3.已知变量x,y相对应的一组数据为(10,1.5),(11,3.2),(11,8.3),(12.5,14),(13,5),变量x′,y′相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),用r1表示变量x与y之间的线性相关系数,用r2表示变量x′与y′间的线性相关系数,则有( )
A.r2C.r2<0解析:C ∵从第一组数据中看出1>0,故r1>0;从第二组数据中看出2<0,故r2<0;于是有r2<04.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有线性相关关系,且经验回归方程为=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( )
A.66% B.67%
C.79% D.84%
解析:D ∵y与x具有线性相关关系,且满足经验回归方程=0.6x+1.2,该城市居民人均工资为=5,∴可以估计该城市的职工人均消费=0.6×5+1.2=4.2,∴可以估计该城市人均消费额占人均工资收入的百分比为=84%.
5.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
A.-1 B.0
C. D.1
解析:D 由题设知,所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,可知这组样本数据完全正相关,故其相关系数为1,故选D.
6.某工厂为了对一种新研究的产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元) 4 5 6 7 8 9
销量y(件) 90 84 83 80 75 68
由表中数据,求得经验回归方程为=-4x+.若在这些样本点中任取一点,则它在经验回归直线左下方的概率为________.
解析:由表中数据得=6.5,=80,由=-4x+,得=106,故经验回归方程为=-4x+106.将(4,90),(5,84),(6,83),(7,80),(8,75),(9,68)分别代入经验回归方程,可知有6个样本点,因84<-4×5+106=86,68<-4×9+106=70,故(5,84)和(9,68)在经验回归直线的左下方,满足条件的只有2个样本点,故所求概率为=.
答案:
7.国际青年物理学家竞赛(简称IYPT)是当今最受重视的中学生顶级国际物理赛事,某中学物理兴趣小组通过实验对其中一道竞赛题的两个物理量u、v进行测量,得到10组数据(u1,v1),(u2,v2),…,(u10,v10),通过散点图发现具有较强的线性相关关系,并且利用最小二乘法求得经验回归方程为=1.5u+1,由于数据保存失误导致i丢失,但i=50被保存,通过所学知识可以求得i=________.
解析:由i=50,得=i=50×=5,再由经验回归方程恒过样本点的中心可得,=1.5×+1=1.5×5+1=8.5,∴i=10=10×8.5=85.
答案:85
8.为了提高农民收入,某农科所实地考察,研究发现某村适合种植A,B两种经济作物,通过大量考察研究得到如下统计数据:经济作物A的亩产量约为300公斤,其收购价格处于上涨趋势,最近五年的价格如下表:
年份编号x 1 2 3 4 5
年份 2017 2018 2019 2020 2021
单价y(元/公斤) 18 20 23 25 29
经济作物B的收购价格始终为25元/公斤,其亩产量的频率分布直方图如下:
(1)若经济作物A的单价y(单位:元/公斤)与年份编号x具有线性相关关系,请求出y关于x的经验回归方程,并估计2022年经济作物A的单价;
(2)用上述频率分布直方图估计经济作物B的平均亩产量(每组数据以区间的中点值为代表),若不考虑其他因素,试判断2022年该村应种植经济作物A还是经济作物B?并说明理由.
附:==,=-.
解:(1)∵==3,
==23,
∴==2.7,
=23-2.7×3=14.9.
则y关于x的经验回归方程为=2.7x+14.9.
当x=6时,=2.7×6+14.9=31.1,
故估计2022年经济作物A的单价为31.1元/公斤.
(2)利用频率和为1得
2m==0.01,
∴m=0.005.
经济作物B的亩产量的平均值为(360×0.005+380×0.010+400×0.017 5+420×0.012 5+440×0.005)×20=401,
故经济作物A的亩产值为300×31.1=9 330(元),
经济作物B的亩产值为25×401=10 025(元).
∵9 330<10 025,
∴应该种植经济作物B.
9.毛绒玩具是由毛绒面料与其他纺织材料为主要面料,内部填塞各种填充物而制成的玩具,色差和色度是衡量毛绒玩具质量优劣的重要指标之一,现抽检一批该产品测得以下数据:
色差X 21 23 25 27 29 31
色度Y 15 16 17 21 22 23
由大量实验数据可知该产品的色差和色度之间满足线性相关关系,且=0.25x+,现有一对测量数据为(32,21.25),则该组数据的残差为( )
A.0.65 B.0.75
C.-0.75 D.0.95
解析:B 残差在数理统计中是指实际观察值与估计值(拟合值)之间的差.由题意得到样本中心点的坐标为(26,19),代入经验回归方程得到=12.5,=0.25x+12.5,将x=32代入,求解得到对应的估计值为20.5,所以所求残差为21.25-20.5=0.75,故选B.
10.已知变量y关于x的经验回归方程为=ebx-0.5,其一组数据如下表所示:
x 1 2 3 4
y e e3 e4 e6
若x=5,则预测y的值可能为( )
A.e5 B.e
C.e7 D.e
解析:D 由=ebx-0.5,得ln =bx-0.5,令z=ln ,则z=bx-0.5.
x 1 2 3 4
z 1 3 4 6
==2.5,==3.5.∵样本点的中心(,)满足z=bx-0.5,∴3.5=b×2.5-0.5,解得b=1.6,∴z=1.6x-0.5,∴=e1.6x-0.5.当x=5时,=e1.6×5-0.5=e,故选D.
11.在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系)
学生的编号i 1 2 3 4 5
数学成绩x 80 75 70 65 60
物理成绩y 70 66 68 64 62
现已知其经验回归方程为=0.36x+,则=________,根据此经验回归方程估计数学得90分的同学的物理成绩为________.(四舍五入到整数)
解析:==70,==66,所以66=0.36×70+,即=40.8,即经验回归方程为=0.36x+40.8.当x=90时,=0.36×90+40.8=73.2≈73.
答案:40.8 73
12.随着科技的发展,网购已经逐渐融入了人们的生活.在家里面不用出门就可以买到自己想要的东西,在网上付款即可,两三天就会送到自己的家门口.某公司组织统计了近五年来该公司网购的人数yi(单位:人)与时间ti(单位:年)的数据,列表如下:
ti 1 2 3 4 5
yi 24 27 41 64 79
(1)依据表中给出的数据,是否可用经验回归模型拟合y与t的关系,请计算相关系数r并加以说明(计算结果精确到0.01);(若|r|>0.75,则线性相关程度很高,可用经验回归模型拟合)
附:相关系数公式r=, ==,参考数据≈75.47.
(2)建立y关于t的经验回归方程,并预测第六年该公司的网购人数(计算结果精确到整数).(参考公式:=-)
解:(1)由题知=3,=47,iyi=852, =, =,
则r==
==≈≈0.97>0.75.
故y与t的线性相关程度很高,可用经验回归模型拟合.
(2)由(1)得====14.7,=47-14.7×3=2.9.
所以y关于t的经验回归方程为=14.7t+2.9.
将t=6带入经验回归方程,得=91.1≈91,
所以预测第6年该公司的网购人数约为91人.
13.中国茶文化博大精深,已知茶水的口感与茶叶类型以及水温有关.经验表明,某种绿茶用85 ℃的水泡制,再等到茶水温度降至60 ℃时饮用,可以产生最佳口感.某学习研究小组通过测量,得到了下面表格中的数据(室温是20 ℃).
泡制时间x/min 0 1 2 3 4
水温y/℃ 85 79 74 71 65
(1)小组成员根据上面表格中的数据绘制散点图,并根据散点图分布情况,考虑到茶水温度降到室温(即20 ℃)就不能再降的事实,决定选择函数模型y=kcx+20(x≥0)来刻画.
①令z=ln(y-20),求出z关于x的经验回归方程;
②利用①的结论,求出y=kcx+20(x≥0,c>0)中的k与c.
(2)你认为该品种绿茶用85 ℃的水大约泡制多久后饮用,可以产生最佳口感?
参考数据:ln 65≈4.2,ln 59≈4.1,ln 54≈4.0,ln 51≈3.9,ln 45≈3.8,log0.90.6≈4.8,e-0.1≈0.9,e4.2≈66.7,≈0.6.参考公式:=x+,=,=-.
解:(1)①由已知得出x与z的关系,如下表:
泡制时间x/min 0 1 2 3 4
z 4.2 4.1 4.0 3.9 3.8
设经验回归方程为=x+,
由题意,得==2,
==4,
∴(xi-)(zi-)=(-2)×0.2+(-1)×0.1+1×(-0.1)+2×(-0.2)=-1,
(xi-)2=(-2)2+(-1)2+12+22=10,
则===-0.1,
=-=4+0.1×2=4.2,
则z关于x的经验回归方程为=-0.1x+4.2.
②由y=kcx+20(x≥0),得y-20=kcx(x≥0),
两边取对数得,ln(y-20)=ln k+xln c,
利用①的结论得:ln c=-0.1,ln k=4.2,
∴c=e-0.1≈0.9,k=e4.2≈66.7.
(2)由(1)得,y=66.7×0.9x+20(x≥0),
令y=60,得x=log0.90.6≈4.8.
∴该品种绿茶用85 ℃的水泡制4.8 min后饮用,口感最佳.