1 一元线性回归
课时目标
1.能结合实例,根据散点图,判断两个变量是否具有相关关系.
2.了解最小二乘法的原理,会求线性回归方程,并能根据线性回归方程进行预测.
逐点清(一) 直线拟合
[多维度理解]
1.散点图
每个点对应的一对数据(xi,yi),称为成对数据.这些点构成的图称为散点图.
2.曲线拟合与直线拟合
从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个大致趋势,这种趋势通常可以用一条光滑的曲线来近似地描述.这样近似描述的过程称为____________.若在两个变量X和Y的散点图中,所有点看上去都在一条直线附近波动,此时就可以用一条直线来近似地描述这两个量之间的关系,称之为____________.
微点助解
(1)两个变量不满足函数关系,但两者确实有关系,这种关系称为相关关系.
(2)判断两个变量X和Y之间是否具有线性关系,常用的简便方法就是绘制散点图.
(3)散点图中包含的数据越多,拟合效果就越好.
(4)从散点图看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,则称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.
[细微点练明]
1.下列两个量之间的关系是相关关系的是( )
A.匀速直线运动中时间与位移的关系
B.学生的成绩和身高
C.儿童的年龄与体重
D.物体的体积和质量
2.在下列所示的四个图中,每个图的两个变量具有线性相关关系的图是( )
3.某种木材体积与树木的树龄之间有如下的对应关系:
树龄 2 3 4 5 6 7 8
体积 30 34 40 60 55 62 70
(1)请作出这些数据的散点图;
(2)你能由散点图发现木材的体积与树木的树龄近似呈什么关系吗?
逐点清(二) 一元线性回归方程
[多维度理解]
1.一元线性回归方程
直线方程__________________称作Y关于X的__________________,相应的直线称作Y关于X的____________,,是这个线性回归方程的系数.
2.计算,的公式
=,=-.
其中,=xi,=yi.
3.2个注意点
(1)系数的计算,有时利用公式
=;
(2)回归直线Y=X+必经过样本点的中心(,).
[细微点练明]
1.两个线性相关变量X,Y满足如下关系:
X 2 4 5 6 8
Y 2.2 4.2 4.8 6.5 7.3
则Y与X的回归直线Y=X+一定过其样本点的中心,其坐标为( )
A.(5,5) B.(4,5)
C.(4,4) D.(5,4)
2.已知变量X和Y的统计数据如下表:
X 1 2 3 4 5
Y 5 5 6 6 8
根据上表可得线性回归方程Y=0.7X+a,据此当X=6时,Y=( )
A.8.9 B.8.6
C.8.2 D.8.1
3.某研究机构对高三学生的记忆力X和判断力Y进行统计分析,得下表数据:
X 6 8 10 12
Y 2 3 5 6
(1)根据上表中的数据画出散点图;
(2)如果近似量存在线性关系,请画出一条直线来近似地表示这种线性关系;
(3)用最小二乘法求出Y关于X的线性回归方程Y=+X.
逐点清(三) 回归分析在实际问题中的应用
[典例] 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:
零件数 X/个 10 20 30 40 50 60 70 80 90 100
加工时间Y/min 62 68 75 81 89 95 102 108 115 122
(1)画出散点图;
(2)求Y关于X的线性回归方程;
(3)关于加工零件的个数与加工时间,你能得出什么结论?
参考公式:回归直线Y=X+,=,=-.
听课记录:
(1)解决问题时应首先对X,Y进行相关性检验,如果两个变量之间本身不具有相关关系或者它们之间的相关关系不明显,即使求出线性回归方程进行估计和预测的量也是不可信的.
(2)线性回归方程Y=+X中的实际意义:表示X每增加1个单位时Y的变化量,即X每增加1个单位时,Y相应地平均变化个单位.
[针对训练]
某市从2019年起每年6月都举办一届民俗文化周,到2024年已举办了六届,据旅游部门统计,在每届民俗文化周期间,吸引了不少外地游客,极大地推进了该市的旅游业发展.现将前五届民俗文化周期间外地游客的人数统计如下表:
年份 2019年 2020年 2021年 2022年 2023年
民俗文化周 届数编号X 1 2 3 4 5
外地游客人数Y (单位:十万) 0.6 0.8 0.9 1.2 1.5
(1)求Y关于X的线性回归方程Y=X+;
(2)据旅游部门统计,在每届民俗文化周期间,每位外地游客可为本市增加100元左右的旅游收入,利用(1)中的线性回归方程,预测2025年第七届民俗文化周期间的外地游客可为本市增加的旅游收入为多少万元.
1 一元线性回归
[逐点清(一)]
[多维度理解] 2.曲线拟合 直线拟合
[细微点练明]
1.选C A、D是函数关系;B不是相关关系;C是相关关系,故选C.
2.选B A中,两个变量x与y之间具有函数关系,不是相关关系,不符合题意;B中,两个变量x与y构成的点在一条直线附近带状分布,所以两个变量之间是线性相关关系,符合题意;C中,两个变量x与y构成的点不在一条直线附近带状分布,所以两个变量之间不是线性相关关系,不符合题意;D中,两个变量x与y构成的点不在一条直线附近带状分布,所以两个变量之间不是线性相关关系,不符合题意.
3.解:(1)以x轴表示树木的树龄,y轴表示木材的体积,可得相应的散点图如图所示.
(2)由散点图发现木材体积随着树龄的增加而呈增加的趋势,且散点落在一条直线附近,所以木材的体积与树木的树龄呈线性关系.
[逐点清(二)]
[多维度理解]
1.Y=+X 线性回归方程 回归直线
[细微点练明]
1.选A 由题意,知其样本点的中心为(,),则==5,
==5,
所以样本点的中心为(5,5).
2.选D 由题表中的数据可得==3,==6,由于回归直线过样本点的中心(,),
所以0.7×3+a=6,解得a=3.9,
所以线性回归方程为Y=0.7X+3.9.
当X=6时,Y=0.7×6+3.9=8.1.
3.解:(1)如图:
(2)观察发现这四个点在点(6,2)和点(10,5)连线的附近,故过两点的直线可以近似地表示记忆力与判断力的关系.如图所示.
(3)由题表中数据可得,
==9,==4,
4·=4×9×4=144,
xiyi=6×2+8×3+10×5+12×6=158,
x=62+82+102+122=344,
则===0.7,
=-=4-0.7×9=-2.3,
故Y关于X的线性回归方程为Y=0.7X-2.3.
[逐点清(三)]
[典例] 解:(1)由题表数据,得散点图如下,x轴表示零件数/个,y轴表示加工时间/min,
(2)由=xi=55,=yi=91.7,xiyi=55 950,x=38 500,
得=
=≈0.668 5,
则=-=91.7-0.668 5×55=54.932 5.
所以Y关于X的线性回归方程为
Y=0.668 5X+54.932 5.
(3)由(2)所得线性回归方程知,每多加工10个零件,需多花费6.685 min.
[针对训练]
解:(1)由所给数据计算得
=×(1+2+3+4+5)=3,
=×(0.6+0.8+0.9+1.2+1.5)=1,
(xi-)2=4+1+0+1+4=10,
(xi-)(yi-)=(-2)×(-0.4)+(-1)×(-0.2)+0+1×0.2+2×0.5=2.2,
===0.22,
=-=1-0.22×3=0.34,
所以Y关于X的线性回归方程为
Y=0.22X+0.34.
(2)由(1)知,当X=7时,Y=0.22×7+0.34=1.88,
于是预测2025年第七届民俗文化周期间的外地游客可达18万8千人,
由188 000×100=18 800 000(元),所以预测2025年第七届民俗文化周期间的外地游客可为本市增加的旅游收入达1 880万元.(共71张PPT)
§1
一元线性回归
(概念课—逐点理清式教学)
课时目标
1.能结合实例,根据散点图,判断两个变量是否具有相关关系.
2.了解最小二乘法的原理,会求线性回归方程,并能根据线性回归方程进行预测.
CONTENTS
目录
1
2
3
逐点清(一) 直线拟合
逐点清(二) 一元线性回归方程
逐点清(三) 回归分析在实际
问题中的应用
4
课时跟踪检测
逐点清(一) 直线拟合
01
多维度理解
1.散点图
每个点对应的一对数据(xi,yi),称为成对数据.这些点构成的图称为散点图.
2.曲线拟合与直线拟合
从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个大致趋势,这种趋势通常可以用一条光滑的曲线来近似地描述.这样近似描述的过程称为___________.若在两个变量X和Y的散点图中,所有点看上去都在一条直线附近波动,此时就可以用一条直线来近似地描述这两个量之间的关系,称之为__________.
曲线拟合
直线拟合
微点助解
(1)两个变量不满足函数关系,但两者确实有关系,这种关系称为相关关系.
(2)判断两个变量X和Y之间是否具有线性关系,常用的简便方法就是绘制散点图.
(3)散点图中包含的数据越多,拟合效果就越好.
(4)从散点图看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,则称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.
1.下列两个量之间的关系是相关关系的是( )
A.匀速直线运动中时间与位移的关系
B.学生的成绩和身高
C.儿童的年龄与体重
D.物体的体积和质量
解析:A、D是函数关系;B不是相关关系;C是相关关系,故选C.
细微点练明
√
2.在下列所示的四个图中,每个图的两个变量具有线性相关关系的图是( )
√
解析:A中,两个变量x与y之间具有函数关系,不是相关关系,不符合题意;
B中,两个变量x与y构成的点在一条直线附近带状分布,所以两个变量之间是线性相关关系,符合题意;
C中,两个变量x与y构成的点不在一条直线附近带状分布,所以两个变量之间不是线性相关关系,不符合题意;
D中,两个变量x与y构成的点不在一条直线附近带状分布,所以两个变量之间不是线性相关关系,不符合题意.
3.某种木材体积与树木的树龄之间有如下的对应关系:
树龄 2 3 4 5 6 7 8
体积 30 34 40 60 55 62 70
(1)请作出这些数据的散点图;
(2)你能由散点图发现木材的体积与树木的树龄近似呈什么关系吗?
解:(1)以x轴表示树木的树龄,y轴表示木材的体积,可得相应的散点图如图所示.
逐点清(二) 一元线性回归方程
02
多维度理解
线性回归方程
回归直线
细微点练明
1.两个线性相关变量X,Y满足如下关系:
X 2 4 5 6 8
Y 2.2 4.2 4.8 6.5 7.3
√
2.已知变量X和Y的统计数据如下表:
√
3.某研究机构对高三学生的记忆力X和判断力Y进行统计分析,得下表数据:
X 6 8 10 12
Y 2 3 5 6
解:(1)如图:
(2)观察发现这四个点在点(6,2)和点(10,5)连线的附近,故过两点的直线可以近似地表示记忆力与判断力的关系.如图所示.
(3)由题表中数据可得,
逐点清(三) 回归分析在实际
问题中的应用
03
[典例] 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:
零件数X/个 10 20 30 40 50 60 70 80 90 100
加工时间Y/min 62 68 75 81 89 95 102 108 115 122
所以Y关于X的线性回归方程为Y=0.668 5X+54.932 5.
(3)由(2)所得线性回归方程知,每多加工10个零件,需多花费6.685 min.
方法技巧
某市从2019年起每年6月都举办一届民俗文化周,到2024年已举办了六届,据旅游部门统计,在每届民俗文化周期间,吸引了不少外地游客,极大地推进了该市的旅游业发展.现将前五届民俗文化周期间外地游客的人数统计如下表:
针对训练
年份 2019年 2020年 2021年 2022年 2023年
民俗文化周届数编号X 1 2 3 4 5
外地游客人数Y (单位:十万) 0.6 0.8 0.9 1.2 1.5
解:(1)由所给数据计算得
(2)由(1)知,当X=7时,Y=0.22×7+0.34=1.88,
于是预测2025年第七届民俗文化周期间的外地游客可达18万8千人,
由188 000×100=18 800 000(元),
所以预测2025年第七届民俗文化周期间的外地游客可为本市增加的旅游收入达1 880万元.
课时跟踪检测
04
1
3
4
5
6
7
8
9
10
11
12
2
√
1.[多选]如图四个散点图中,适合用直线拟合其中两个变量的是( )
√
1
3
4
5
6
7
8
9
10
11
12
2
解析:由题图易知A、C两个图中样本点在一条直线附近,因此适合用直线拟合两个变量.
1
5
6
7
8
9
10
11
12
2
3
4
√
2.下表是X和Y之间的一组数据,则Y关于X的回归直线必过点( )
X 1 2 3 4
Y 1 3 5 7
1
5
6
7
8
9
10
11
12
3
4
2
√
X 0 1 2 3 4
Y 2.2 4.3 4.5 4.8 6.7
1
5
6
7
8
9
10
11
12
3
4
2
1
5
6
7
8
9
10
11
12
3
4
2
√
4.有如下样本数据:
X 3 4 5 6 7
Y 4.0 2.5 -0.5 0.5 -2.0
1
5
6
7
8
9
10
11
12
3
4
2
1
5
6
7
8
9
10
11
12
3
4
2
√
1
5
6
7
8
9
10
11
12
3
4
2
1
5
6
7
8
9
10
11
12
3
4
2
6.[多选]某企业节能降耗技术改造后,在生产某产品过程中记录的产量X(吨)与相应的生产能耗Y(吨)的几组对应数据如表.现发现表中有个数据看不清,已知线性回归方程为Y=6.3X+6.8,下列说法正确的是( )
X 2 3 4 5 6
Y 19 25 ★ 38 44
1
5
6
7
8
9
10
11
12
3
4
2
A.看不清的数据★的值为34
B.回归直线Y=6.3X+6.8必经过样本点(4,★)
C.系数6.3的含义是产量每增加1吨,相应的生产能耗一定增加6.3吨
D.据此模型预测产量为7吨时,相应的生产能耗为50.9吨
√
√
1
5
6
7
8
9
10
11
12
3
4
2
1
5
6
7
8
9
10
11
12
3
4
2
回归直线Y=6.3X+6.8过样本点(4,32),B错误;系数6.3的含义是产量每增加1吨,相应的生产能耗预测增加6.3吨,C错误;
X=7时,Y=6.3X+6.8=6.3×7+6.8=50.9,所以据此模型预测产量为7吨时,相应的生产能耗为50.9吨,D正确.故选AD.
1
5
6
7
8
9
10
11
12
3
4
2
7.如图所示,有5组数据:A(1,3),B(2,4),C(3,8),D(7,10),E(10,12),去掉______组数据后剩下的4组数据的线性相关关系最大.
C
1
5
6
7
8
9
10
11
12
3
4
2
解析:仔细观察点A(1,3),B(2,4),C(3,8),D(7,10),E(10,12),
可知点A,B,D,E在一条直线附近,而C点明显偏离此直线,
由此可知去掉点C后,剩下的四点组成的数组线性相关关系最大.
1
5
6
7
8
9
10
11
12
3
4
2
8.某商家对一种新产品进行试销,得到如下数据:
单价X/元 16 16.4 16.8 17.2 17.6 18
销售量Y/件 180 168 166 160 150 136
通过绘制散点图,得知Y与X具有近似的线性关系.若该产品每件成本9元,要使该产品销售总利润最大,则单价约为______元.(销售总利润=(单价-成本)×销售量)
17
1
5
6
7
8
9
10
11
12
3
4
2
1
5
6
7
8
9
10
11
12
3
4
2
1
5
6
7
8
9
10
11
12
3
4
2
1
5
6
7
8
9
10
11
12
3
4
2
9.某食品研究部门为了解一种酒品的储藏年份与芳香度之间的相关关系,在市场上收集到了一部分不同年份的该酒品,并测定了其芳香度(如下表).
年份X 0 1 4 5 6 8
芳香度Y 1.3 1.8 5.6 7.4 9.3
6.1
1
5
6
7
8
9
10
11
12
3
4
2
1
5
6
7
8
9
10
11
12
3
4
2
10.为研究拉力X(N)对弹簧长度Y(cm)的影响,对不同拉力的6根弹簧进行测量,测得如下表中的数据:
X 5 10 15 20 25 30
Y 7.25 8.12 8.95 9.9 10.9 11.8
1
5
6
7
8
9
10
11
12
3
4
2
解:(1)散点图如图所示.
1
5
6
7
8
9
10
11
12
3
4
2
(2)将已知表中的数据列成下表:
xi 5 10 15 20 25 30
yi 7.25 8.12 8.95 9.9 10.9 11.8
xiyi 36.25 81.2 134.25 198 272.5 354
x 25 100 225 400 625 900
1
5
6
7
8
9
10
11
12
3
4
2
1
5
6
7
8
9
10
11
12
3
4
2
1
5
6
7
8
9
10
11
12
3
4
2
1
5
6
7
8
9
10
11
12
3
4
2
1
5
6
7
8
9
10
11
12
3
4
2
12.某新能源汽车制造公司,为鼓励消费者购买其生产的某品牌汽车,约定从今年1月开始,凡购买一辆该品牌汽车,在行驶三年后,公司将给予适当金额的购车补贴.某调研机构对已购买该品牌汽车的消费者,就购车补贴金额的心理预期值进行了抽样调查,得其样本频率分布直方图如图所示.
1
5
6
7
8
9
10
11
12
3
4
2
(1)估计已购买该品牌汽车的消费群体对购车补贴金额的心理预期值的平均数和中位数(精确到0.01);
(2)统计今年以来1月~5月该品牌汽车的市场销售量,得其频数分布表如下,预测该品牌汽车在今年6月份的销售量约为多少万辆?
月份 1月 2月 3月 4月 5月
销售量/万辆 0.5 0.6 1.0 1.4 1.7
1
5
6
7
8
9
10
11
12
3
4
2
1
5
6
7
8
9
10
11
12
3
4
2
因为0.1+0.3<0.5<0.1+0.3+0.3,
所以中位数在区间[3,4)内,设中位数为3+x,
1
5
6
7
8
9
10
11
12
3
4
2
由散点图(图略)可知,5组样本数据呈线性相关关系,
1
5
6
7
8
9
10
11
12
3
4
2课时跟踪检测(五十九) 一元线性回归
1.[多选]如图四个散点图中,适合用直线拟合其中两个变量的是( )
2.下表是X和Y之间的一组数据,则Y关于X的回归直线必过点( )
X 1 2 3 4
Y 1 3 5 7
A.(2,3) B.(1.5,4)
C.(2.5,4) D.(2.5,5)
3.已知具有线性关系的两个变量X,Y之间的一组数据如表所示,且线性回归方程为Y=0.95X+,则当X=6时,Y的预测值为( )
X 0 1 2 3 4
Y 2.2 4.3 4.5 4.8 6.7
A.8.4 B.8.3
C.8.2 D.8.1
4.有如下样本数据:
X 3 4 5 6 7
Y 4.0 2.5 -0.5 0.5 -2.0
由此得到的线性回归方程为Y=X+,若=7.9,则X每增加1个单位,Y就平均( )
A.增加1.4个单位 B.减少1.4个单位
C.增加1.2个单位 D.减少1.2个单位
5.为了研究某班学生的听力成绩X(单位:分)与笔试成绩Y(单位:分)的关系,从该班随机抽取20名学生,根据散点图发现X与Y之间有线性关系,设其回归直线为Y=X+,已知xi=400,yi=1 580,=-1,若该班某学生的听力成绩为26,据此估计其笔试成绩约为( )
A.99 B.101
C.103 D.105
6.[多选]某企业节能降耗技术改造后,在生产某产品过程中记录的产量X(吨)与相应的生产能耗Y(吨)的几组对应数据如表.现发现表中有个数据看不清,已知线性回归方程为Y=6.3X+6.8,下列说法正确的是( )
X 2 3 4 5 6
Y 19 25 ★ 38 44
A.看不清的数据★的值为34
B.回归直线Y=6.3X+6.8必经过样本点(4,★)
C.系数6.3的含义是产量每增加1吨,相应的生产能耗一定增加6.3吨
D.据此模型预测产量为7吨时,相应的生产能耗为50.9吨
7.如图所示,有5组数据:A(1,3),B(2,4),C(3,8),D(7,10),E(10,12),去掉______组数据后剩下的4组数据的线性相关关系最大.
8.某商家对一种新产品进行试销,得到如下数据:
单价X/元 16 16.4 16.8 17.2 17.6 18
销售量Y/件 180 168 166 160 150 136
通过绘制散点图,得知Y与X具有近似的线性关系.若该产品每件成本9元,要使该产品销售总利润最大,则单价约为________元.(销售总利润=(单价-成本)×销售量)
参考公式:回归直线Y=X+中,斜率和截距的最小二乘估计分别为=
=,=-;
参考数据:xi=102,yi=960,xiyi=16 264,x=1 736.8.
9.某食品研究部门为了解一种酒品的储藏年份与芳香度之间的相关关系,在市场上收集到了一部分不同年份的该酒品,并测定了其芳香度(如下表).
年份X 0 1 4 5 6 8
芳香度Y 1.3 1.8 5.6 7.4 9.3
由最小二乘法得到线性回归方程Y=1.03X+1.13,但不小心在检测后滴到表格上一滴检测液,污损了一个数据,请你推断该数据为________.
10.为研究拉力X(N)对弹簧长度Y(cm)的影响,对不同拉力的6根弹簧进行测量,测得如下表中的数据:
X 5 10 15 20 25 30
Y 7.25 8.12 8.95 9.9 10.9 11.8
(1)画出散点图;
(2)如果散点图中的各点大致分布在一条直线的附近,求Y关于X的线性回归方程.
11.从某居民区随机抽取10个家庭,获得第i个家庭的年收入X(单位:万元)与年储蓄Y(单位:万元)的数据资料,经计算得xi=80,yi=20,xiyi=184,x=720.
(1)求家庭的年储蓄Y关于年收入X的线性回归方程Y=X+;
(2)若该居民区某家庭年收入为7万元,预测该家庭的年储蓄.
12.某新能源汽车制造公司,为鼓励消费者购买其生产的某品牌汽车,约定从今年1月开始,凡购买一辆该品牌汽车,在行驶三年后,公司将给予适当金额的购车补贴.某调研机构对已购买该品牌汽车的消费者,就购车补贴金额的心理预期值进行了抽样调查,得其样本频率分布直方图如图所示.
(1)估计已购买该品牌汽车的消费群体对购车补贴金额的心理预期值的平均数和中位数(精确到0.01);
(2)统计今年以来1月~5月该品牌汽车的市场销售量,得其频数分布表如下,预测该品牌汽车在今年6月份的销售量约为多少万辆?
月份 1月 2月 3月 4月 5月
销售量/万辆 0.5 0.6 1.0 1.4 1.7
参考公式:==,=-.
课时跟踪检测(五十九)
1.选AC 由题图易知A、C两个图中样本点在一条直线附近,因此适合用直线拟合两个变量.
2.选C 回归直线必过样本点的中心(,),即(2.5,4).
3.选B 由已知数据可得=2,=4.5,∴4.5=0.95×2+,∴=2.6,∴线性回归方程为Y=0.95X+2.6,当X=6时,Y的预测值为0.95×6+2.6=8.3.
4.选B 由题可知==5,=×[4+2.5+(-0.5)+0.5+(-2)]=0.9,所以样本点的中心为(5,0.9),将样本点的中心(5,0.9)代入线性回归方程可得0.9=×5+7.9,解得=-1.4,所以X每增加1个单位,Y就平均减少1.4个单位.
5.选C 因为xi=400,所以==20.
又yi=1 580,所以==79,
故点(20,79)在回归直线上,即79=20-1,得=4,即Y=4X-1,当X=26时,代入计算得到Y=103.
6.选AD 设看不清的数字为a,计算=×(2+3+4+5+6)=4,=×(19+25+a+38+44)=,代入线性回归方程Y=6.3X+6.8中,得=6.3×4+6.8,解得a=34,所以=32,所以看不清的数据★的值为34,A正确;回归直线Y=6.3X+6.8过样本点(4,32),B错误;系数6.3的含义是产量每增加1吨,相应的生产能耗预测增加6.3吨,C错误;X=7时,Y=6.3X+6.8=6.3×7+6.8=50.9,所以据此模型预测产量为7吨时,相应的生产能耗为50.9吨,D正确.故选AD.
7.解析:仔细观察点A(1,3),B(2,4),C(3,8),D(7,10),E(10,12),可知点A,B,D,E在一条直线附近,而C点明显偏离此直线,由此可知去掉点C后,剩下的四点组成的数组线性相关关系最大.
答案:C
8.解析:=xi=×102=17,
=yi=×960=160,
又xiyi=16 264,x=1 736.8,
∴==
=-=-20,
=-=160-(-20)×17=500.
∴Y关于X的线性回归方程为Y=-20X+500.
则产品的销售利润Z=(X-9)(-20X+500)=-20X2+680X-4 500.
当X==17时,该产品销售总利润最大.
答案:17
9.解析:由表格数据知=×(0+1+4+5+6+8)=4,设污损的数据为a,
则=×(1.3+1.8+5.6+a+7.4+9.3)=,∴=1.03×4+1.13,
解得a=6.1,即污损的数据为6.1.
答案:6.1
10.解:(1)散点图如图所示.
(2)将已知表中的数据列成下表:
xi 5 10 15 20 25 30
yi 7.25 8.12 8.95 9.9 10.9 11.8
xiyi 36.25 81.2 134.25 198 272.5 354
x 25 100 225 400 625 900
=17.5,≈9.49,xiyi=1 076.2,
x=2 275.
∴=≈≈0.18,
=-≈9.49-0.18×17.5=6.34,
∴Y关于X的线性回归方程为Y=0.18X+6.34.
11.解:(1)由题意知n=10,=xi==8,=yi==2,
又x-102=720-10×82=80,
xiyi-10 =184-10×8×2=24,
由此可得===0.3,
=-=2-0.3×8=-0.4,
故所求线性回归方程为Y=0.3X-0.4.
(2)将X=7代入线性回归方程,可以预测该家庭的年储蓄约为Y=0.3×7-0.4=1.7(万元).
12.解:(1)因为频率分布直方图的组距为1,则各组频率即为相应小矩形的高,
所以平均数的估计值为=1.5×0.1+2.5×0.3+3.5×0.3+4.5×0.15+5.5×0.1+6.5×0.05=3.5万元.
因为0.1+0.3<0.5<0.1+0.3+0.3,
所以中位数在区间[3,4)内,设中位数为3+x,
则有0.1+0.3+0.3x=0.5,解得x=≈0.33,所以中位数的估计值为3.33万元.
(2)记xi=i(i=1,2,3,4,5),y1=0.5,y2=0.6,y3=1.0,y4=1.4,y5=1.7,
由散点图(图略)可知,5组样本数据呈线性相关关系,因为==3,
=×(0.5+0.6+1.0+1.4+1.7)=1.04,
则有xiyi=0.5+1.2+3+5.6+8.5=18.8,
x=1+4+9+16+25=55,
所以==0.32,
=1.04-0.32×3=0.08,
所以线性回归方程为Y=0.32X+0.08.
当X=6时,Y=0.32×6+0.08=2,
所以预测该品牌汽车在今年6月份的销售量约为2万辆.