2019年数学湘教版必修5新设计同步(讲义):第12章 12.4 数据的相关性

文档属性

名称 2019年数学湘教版必修5新设计同步(讲义):第12章 12.4 数据的相关性
格式 zip
文件大小 616.2KB
资源类型 教案
版本资源 湘教版
科目 数学
更新时间 2019-04-30 18:04:02

图片预览

文档简介

12.4数据的相关性
1.相关关系
变量x,y之间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这时我们称x和y有相关关系.
2.散点图
具有相关关系的两个数据xi和yi成对出现,这时称数据对(xi,yi),i=1,2,…,n,为样本或观测数据,在坐标系中用点表示样本得到的图称为观测数据的散点图.
3.正相关、负相关
(1)随x的增加,y有明显的增加趋势,且数据(x1,y1)(x2,y2)…(xn,yn)十分明显地集中在一条上升的直线附近,称x和y是高度正相关的,集中的程度不明显时,称x和y是中度正相关.
(2)当数据(x1,y1),(x2,y2)…(xn,yn)十分明显地集中在一条下降的直线附近,称x和y高度负相关的,集中程度不十分明显时称x和y中度负相关.
4.回归直线
(1)如果有n个点,(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:
(y1-a-bx1)2+(y2-a-bx2)2+…+(yn-a-bxn)2,
使得上式达到最小值的直线y=a+bx就是我们所要求的直线,即回归直线,这种方法称为最小二乘估计.
(2)b=,a=-b,sxy=-.其中和分别表示{xi}和{yi}的样本均值,s表示{xi}的方差.
1.相关关系与函数关系有什么异同点?
提示:相同点:两者均是指两个变量存在一定的关系.
不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
2.回归直线和散点图中各点之间有什么关系?
提示:各点到回归直线的距离的平方和最小.
利用散点图判断两个变量的相关关系
5个学生的数学和物理成绩如下表:
  学生
学科  
A
B
C
D
E
数学
80
75
70
65
60
物理
70
66
68
64
62
画出散点图,判断它们是否有相关关系.
[解] 以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示.
由散点图可知,两者之间具有相关关系,且为正相关.
两个变量是否相关的两种判断方法
(1)根据实际经验:借助积累的经验进行分析判断.
(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.
1.某中学的兴趣小组在某座山测得海拔高度、气压和沸点的六组数据绘制成散点图如图所示,则下列说法错误的是(  )
A.沸点与海拔高度呈正相关
B.沸点与气压呈正相关
C.沸点与海拔高度呈负相关
D.沸点与海拔高度、沸点与气压的相关性都很强
解析:选A 由左图知气压随海拔高度的增加而减小,由右图知沸点随气压的升高而升高,所以沸点与气压呈正相关,沸点与海拔高度呈负相关,由于两个散点图中的点都成线性分布,所以沸点与海拔高度、沸点与气压的相关性都很强,故B、C、D正确,A错误.
回归直线方程的求法及应用
下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归直线方程y=bx+a;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
[解] (1)由题设所给数据,可得散点图如图所示:
(2)==4.5,
==3.5,
x1y1+x2y2+x3y3+x4y4=66.5,
s=[(3-4.5)2+(4-4.5)2+(5-4.5)2+(6-4.5)2]=1.25,
sxy=-4.5×3.5=0.875,
∴b===0.7,
a=-b=3.5-0.7×4.5=0.35,
因此,所求回归直线l:y=0.7x+0.35.
(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为90-(0.7×100+0.35)=19.65(吨标准煤).
利用回归直线可以对总体进行预测估计,回归直线将部分观测值所反映的规律进行延伸,使我们对有线性相关关系的两个变量进行分析和控制,依据自变量的取值估计和预报因变量的值,在现实生活中有广泛的应用.
2.假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料:
使用年限x
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知y对x呈线性相关关系.试求:
(1)线性回归方程y=bx+a的回归系数a,b;
(2)估计使用年限为10年时,维修费用是多少?
解:(1)=4,=5,
x1y1+x2y2+x3y3+x4y4+x5y5=112.3,
s=[(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2]=2,
Sxy=-4×5=22.46-20=2.46,
b===1.23,
a=-b=5-1.23×4=0.08,
∴回归直线为y=1.23x+0.08.
(2)由(1)知回归直线方程为y=1.23x+0.08,
当x=10时,y=1.23×10+0.08=12.38,
即估计使用10年时的维修费用是12.38万元.
[随堂体验落实]
1.下列两变量中具有相关关系的是(  )
A.正方体的体积与棱长
B.人的身高与体重
C.匀速行驶车辆的行驶距离与时间
D.球的半径与表面积
解析:选B A,C,D中的两个变量是函数关系,B是相关关系.
2.已知变量x,y之间具有线性相关关系,其散点图如图所示,则其回归方程可能为
A.y=1.5x+2
B.y=-1.5x+2
C.y=1.5x-2
D.y=-1.5x-2
解析:选B 设回归方程为y=bx+a,由散点图可知变量x,y之间负相关,回归直线在y轴上的截距为正数,所以b<0,a>0,因此方程可能为y=-1.5x+2.
3.工人工资y(元)与劳动生产率x(千元)的相关关系的回归直线方程为y=50+80x,下列判断正确的是(  )
A.劳动生产率为1 000元时,工人工资为130元
B.劳动生产率提高1 000元时,工人工资平均提高80元
C.劳动生产率提高1 000元时,工人工资平均提高130元
D.当月工资为250元时,劳动生产率为2 000元
解析:选B 回归直线斜率为80,所以x每增加1,y平均增加80,即劳动生产率提高1 000元时,工人工资平均提高80元.
4.正常情况下,年龄在18岁到38岁的人,体重y(kg)对身高x(cm)的回归方程为y=0.72x-58.2,张红同学(20岁)身高为178 cm,她的体重应该在________ kg左右.
解析:用回归方程对身高为178 cm的人的体重进行预测,
当x=178时,y=0.72×178-58.2=69.96(kg).
答案:69.96
5.试验测得四组(x,y)的值分别为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为________.
解析:==2.5, ==3.5.
x1y1+x2y2+x3y3+x4y4=1×2+2×3+3×4+4×5=40,
s=[(1-2.5)2+(2-2.5)2+(3-2.5)2+(4-2.5)2]=1.25,
∴b===1.
a=1,
∴回归直线为y=x+1.
答案:y=x+1
6.一台机器由于使用时间较长,生产的零件有一些会有缺损,按不同转速生产出来的零件有缺损的统计数据如下表所示:
转速x(转/秒)
16
14
12
8
每小时生产有缺损零件数y(个)
11
9
8
5
(1)作出散点图;
(2)如果y与x线性相关,求出回归直线方程;
(3)若实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么,机器的运转速度应控制在什么范围内?
解:(1)作散点图如图所示:
(2)由散点图可知y与x线性相关.
故可设回归直线方程为
y=bx+a.
依题意,用计算器可算得:
=12.5,=8.25,s=(x+x+x+x)-2=8.75,
sxy=-=6.375,
∴b=≈0.73,
a=-b =8.25-0.73×12.5=-0.875.
∴所求回归直线方程为y=0.73x-0.875.
(3)令y=10,得0.73x-0.875=10,解得x≈15.
即机器的运转速度应控制在15转/秒内.
[感悟高手解题]
[妙解题]
某企业的某种产品产量与单位成本统计数据如下:
月份
1
2
3
4
5
6
产量(千件)
2
3
4
3
4
5
单位成本(元/件)
73
72
71
73
69
68
(1)试确定回归直线方程;
(2)指出产量每增加1 000件时,单位成本下降多少?
(3)假定产量为6 000件时,单位成本是多少?
[解] (1)设x表示每月产量(单位:千件),y表示单位成本(单位:元/件),作散点图.由图知y与x间呈线性相关关系,
设线性回归方程为y=bx+a.
由公式可求得b≈-1.818,a=77.363,
∴回归直线方程为y=-1.818x+77.363.
(2)由回归方程知,每增加1 000件产量,单位成本下降1.818元.
(3)当x=6时,y=-1.818×6+77.363=66.455,
∴产量为6 000件时,单位成本是66.455元/件.
一、选择题
1.下列说法中正确的是(  )
A.任何两个变量都具有相关关系
B.圆的周长与该圆的半径具有相关关系
C.农作物的产量与施肥量之间是一种确定关系
D.某商品的销售量与该商品的价格之间是一种非确定关系
解析:选D A,B,C的说法是不正确的.D是正确的.
2.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图1;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图2.由这两个散点图可以判断(  )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
解析:选C 由图1可知,各点整体呈递减趋势,x与y负相关.
由图2可知,各点整体呈递增趋势,u与v正相关.
3.(山东高考)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为=x+,已知i=225,i=1 600,=4.该班某学生的脚长为24,据此估计其身高为(  )
A.160            B.163
C.166 D.170
解析:选C 由题意可知=4x+,
又=22.5,=160,
因此160=22.5×4+,解得=70,
所以=4x+70.
当x=24时,=4×24+70=166.
4.具有线性相关关系的两个变量满足如下关系:
x
10
15
20
25
30
y
1 003
1 005
1 010
1 011
1 014
两变量的回归方程为(  )
A.y=0.56x+997.4 B.y=0.63x-231.2
C.y=50.2x+501.4 D.y=60.4x+400.7
解析:选A 利用公式b==0.56,a=-b=997.4,
得回归方程为y=0.56x+997.4.
二、填空题
5.若施肥量x(kg)与小麦产量y(kg)之间的回归直线方程为y=250+4x,当施肥量为50 kg时,预计小麦产量为________ kg.
解析:将x=50代入y=250+4x,得y=450.
答案:450
6.已知回归方程y=4.4x+383.19,则可估计x与y的增长速度之比约为________.
解析:回归直线y=bx+a中b的几何意义是回归直线的斜率,
所以x与y的增长速度之比为1∶4.4=5∶22.
答案:5∶22
7.在研究硝酸钠的可溶性程度时,在不同的温度下观测它在水中的溶解度,得观测结果如下表:
温度x/℃
0
10
20
50
70
溶解度y/(%)
66.7
76.0
85.0
112.3
128.0
则由此得到的回归直线的斜率是________.
解析:==30,
==93.6,
b=≈0.880 9.
答案:0.880 9
8.在一次试验中,测得(x,y)的四组数据分别为A(1,3),B(2,3.4),C(3,5.6),D(4,6),假设它们存在线性相关关系,则y与x之间的回归方程为________.
解析:==,
==.
b==
==1.12.
a=-b=-1.12×=1.7.
∴y=1.7+1.12x.
答案:y=1.12x+1.7
三、解答题
9.在一段时间内,某种商品的价格x(元)和需求量y(件)之间具有线性相关关系,测得一组数据为
价格x
14
16
18
20
22
需求量y
12
10
7
5
3
求出y对x的线性回归方程.
解:=×(14+16+18+20+22)=18,
=×(12+10+7+5+3)=7.4,
iyi=14×12+16×10+18×7+20×5+22×3=620,
所以===-=-1.15,
∴a=7.4+1.15×18=28.1,
∴线性回归方程为y=-1.15x+28.1.
10.某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据:
广告支出x(单位:万元)
1
2
3
4
销售收入y(单元:万元)
12
28
42
56
(1)画出表中数据的散点图;
(2)求出y对x的回归直线方程;
(3)若广告费为9万元,则销售收入约为多少万元?
解:(1)作出的散点图如图所示:
(2)观察散点图可知各点大致分布在一条直线附近,列出下表:
序号
x
y
x2
xy
1
1
12
1
12
2
2
28
4
56
3
3
42
9
126
4
4
56
16
224

10
138
30
418
易得=,=,
所以b===,
a=-b =-×=-2.
故y对x的回归直线方程为y=x-2.
(3)当x=9时,y=×9-2=129.4.
故当广告费为9万元时,销售收入约为129.4万元.
1.简单随机抽样,分层抽样和系统抽样
三种方法的共同特点是在抽样过程中每个个体被抽取的机会相同,体现了抽样方法的客观性和公平性.其中简单随机抽样是最简单和最基本的抽样方法,在进行系统抽样和分层抽样时都要用到简单随机抽样方法.当总体中的个数较少时,常采用简单随机抽样;当总体中的个数较多时,常采用系统抽样,当已知总体由差异明显的几部分组成时,常采用分层抽样.
2.对抽取的样本进行计算与分析来对总体做出估计的方法.
(1)列出频率分布表、画出频率分布直方图、频率分布折线图、茎叶图;
(2)用样本的数字特征(如平均数、标准差等)估计总体的数字特征;
3.变量间的相关关系
在本章中,我们学习了线性相关关系,其回归直线方程为y=a+bx,通过建立回归直线方程,就可以根据其部分观测值,获得对这两个变量之间的整体关系的了解.借助散点图可以直观地看出两个变量之间是否有相关关系,用最小二乘法思想建立线性回归方程,定量的描述两个变量的关系.
抽样方法的应用
选择合适的抽样方法抽样,写出抽样过程.
(1)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个.抽取10个入样.
(2)有甲厂生产的30个篮球,其中一箱21个,另一箱9个.抽取3个入样.
(3)有甲厂生产的300个篮球,抽取10个入样.
(4)有甲厂生产的300个篮球,抽取30个入样.
[解] (1)总体由差异明显的几个层次组成,需选用分层抽样法.
第一步:确定抽取个数.=,所以甲厂生产的应抽取21×=7个,乙厂生产的应抽取9×=3个;
第二步:用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个.这些篮球便组成了我们要抽取的样本.
(2)总体容量较小,用抽签法.
第一步:将30个篮球编号,编号为00,01,02,…,29;
第二步:将以上30个编号分别写在一张小纸条上,揉成小球,制成号签;
第三步:把号签放到不透明的盒子里,搅拌均匀.
第四步:从盒子里逐一抽取号签记下号码与对应的篮球组成了样本.
(3)总体容量较大,样本容量较小,宜用随机数法.
第一步:将300个篮球用随机方式编号,编号为1,2,…,300;用计算机在1至300中随机抽取10个数,例如这10个随机数为:286,211,234,297,207,013,027,086,284,281,这10个号码,这就是所要抽取的10个个体的号码.
(4)总体容量较大,样本容量也较大,宜用系统抽样法.
第一步:将300个篮球用随机方式编号,编号为000,001,002,…,299,并分成30段;
第二步:在第一段000,001,002,…,009这十个编号中用简单随机抽样法抽出一个(如002)作为起始号码;
第三步:将编号为002,012,022,…,292的个体抽出,组成样本.
1.某学校为调查学生的学习情况,对学生的课堂笔记进行了抽样调查,已知某班级一共有56名学生,根据学号(001~056),用系统抽样的方法抽取一个容量为4的样本,已知007号、021号、049号在样本中,那么样本中还有一个学生的学号为(  )
A.014          B.028
C.035 D.042
解析:选C 由系统抽样的原理知抽样的间隔为=14,
故第一组的学号为001~014,所以007为第一组内抽取的学号,
所以第二组抽取的学号为021;
第三组抽取的学号为035;
第四组抽取的学号为049.故选C.
2.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况,从他们中抽取容量为36的样本,最适合抽取样本的方法是(  )
A.简单随机抽样       B.系统抽样
C.分层抽样 D.以上均不对
解析:选C 因总体中个体差异较大,故采用分层抽样.
3.某校有老师200人,学生2 200人,其中男生1 200人,女生1 000人,现用分层抽样的方法从所有师生中抽取一个容量为n的样本.已知从女生中抽取的人数为80,则n=________.
解析:分层抽样的关键是确定比例,然后按同一比例从各层中抽取样本.
由=,得n=192.
答案:192
用频率分布估计总体
从某校高一年级的1 002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm)
168
165
171
167
170
165
170
152
175
174
165
170
168
169
171
166
164
155
164
158
170
155
166
158
155
160
160
164
156
162
160
170
168
164
174
171
165
179
163
172
180
174
173
159
163
172
167
160
164
169
151
168
158
168
176
155
165
165
169
162
177
158
175
165
169
151
163
166
163
167
178
165
158
170
169
159
155
163
153
155
167
163
164
158
168
167
161
162
167
168
161
165
174
156
167
166
162
161
164
166
(1)试作出该样本的频率分布表;
(2)画出频率分布直方图;
(3)估计身高小于160cm的频率.
[解] (1)在全部数据中找出最大值180和最小值151,则两者之差为29,确定全距为30,决定以组距3将区间[150.5,180.5]分成10个组,从第一组[150.5,153.5)开始,分别统计各组中的样本数,再计算各组的频率,并将结果填入下表:
身高i
发生次数ni
fi=发生频率
[150.5,153.5)
4
0.04
[153.5,156.5)
8
0.08
[156.5,159.5)
8
0.08
[159.5,162.5)
11
0.11
[162.5,165.5)
22
0.22
[165.5,168.5)
19
0.19
[168.5,171.5)
14
0.14
[171.5,174.5)
7
0.07
[174.5,177.5)
4
0.04
[177.5,180.5]
3
0.03
合计
100
1.00
(2)如图:
(3)从频率分布表可以看出,该样本中小于160 cm的频率为0.04+0.08+0.08=0.2,
故可估计该校高一新生中身高小于160 cm的频率为0.2.
4.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示.根据此图,估计该校2 000名高中男生中体重大于70.5公斤的人数为(  )
A.300 B.360
C.420 D.450
解析:选B 样本中体重大于70.5公斤的频率为:
(0.04+0.034+0.016)×2=0.090×2=0.18.
故可估计该校2 000名高中男生中体重大于70.5公斤的人数为:2 000×0.18=360(人).
5.李大伯承包了一个果园,种植了100棵樱桃树,今年已进入收获期.收获时,从中任选并采摘了10棵树的樱桃,分别称得每棵树所产樱桃的质量如下表:
序号
1
2
3
4
5
6
7
8
9
10
质量
(千克)
14
21
27
17
18
20
19
23
19
22
据调查,市场上今年樱桃的批发价格为每千克15元.用所学的统计知识估计今年此果园樱桃的总产量与按批发价格销售樱桃所得的总收入分别约为(  )
A.200千克,3 000元 B.1 900千克,28 500元
C.2 000千克,30 000元 D.1 850千克,27 750元
解析:选C 依题意此果园平均每棵树所产樱桃的质量是:
×(14+21+27+17+18+20+19+23+19+22)=20(千克),
所以100棵樱桃树所产樱桃的质量约是20×100=2 000(千克),又因为批发价格为每千克15元,所以2 000千克樱桃所得的总收入为15×2 000=30 000(元).
均值和方差的应用
甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图所示.
(1)填写下表:
平均数
方差
命中9环及以上

7
1.2
1

5.4
3
(2)请从四个不同的角度对这次测试进行分析:
①从平均数和方差结合分析偏离程度;
②从平均数分析谁的成绩好些;
③从平均数和命中9环以上的次数相结合看谁的成绩好些;
④从折线图上两人射击命中环数及走势分析谁更有潜力.
[解] (1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10.可知乙=(2+4+6+8+7+7+8+9+9+10)=7,所以填7.(2)①甲、乙的平均数相同:均为7,但s<s,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.
②甲、乙平均水平相同.
③甲、乙平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.
④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,有潜力可挖.
6.下列说法正确的是(  )
A.在两组数据中,平均数较大的一组方差较大
B.平均数反映数据的集中趋势,方差则反映数据离平均数的波动大小
C.方差的求法是求出各个数据与平均数的差的平方后再求和
D.在记录两个人射击环数的两组数据中,方差大的表示射击水平高
解析:选B 平均数反映了数据的集中趋势,方差则反映数据离平均数的波动大小.
7.某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为(  )
A.,s2+1002 B.+100,s2+1002
C.,s2 D.+100,s2
解析:选D 法一:因为每个数据都加上了100,故平均数也增加100,而离散程度应保持不变.
法二:由题意知x1+x2+…+xn=n,s2=,
则所求均值=[(x1+100)+(x2+100)+…+(xn+100)]=(n+n×100)=+100,
而所求方差t2=[(x1+100-)2+(x2+100-)2+…+(xn+100-)2]=[(x1-)2+(x2-)2+…+(xn-)2]=s2.
8.抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:
运动员
第一次
第二次
第三次
第四次
第五次

87
91
90
89
93

89
90
91
88
92
则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.
解析:对于甲,平均成绩为=90,
所以方差为s2=×[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4;
对于乙,平均成绩为=90,
方差为s2=×[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.
由于2<4,所以乙的平均成绩较为稳定.
答案:2
散点图和回归直线的应用
在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x之间相应的一组观察值如下表:
x(s)
5
10
15
20
30
40
50
60
70
90
120
y(μm)
6
10
10
13
16
17
19
23
25
29
46
(1)画出表中数据的散点图;
(2)求y对x的回归直线方程;
(3)试预测腐蚀时间为100 s时腐蚀深度是多少.
[解] (1)散点图如图所示.
(2)根据公式求腐蚀深度y对腐蚀时间x的回归直线方程的步骤如下:
=,=,b=≈0.313,
a=-b≈4.94,
腐蚀深度y对腐蚀时间x的回归直线方程为
y=0.313x+4.94,这里的回归系数b=0.313,它的意义是:腐蚀时间x每增加一个单位(s),腐蚀深度y增加0.313个单位(μm).
(3)根据上面求得的回归直线方程,当腐蚀时间为100s时,y=0.313×100+4.94=36.24,即腐蚀深度大约是36.24μm.
9.回归直线方程y=bx+a中,若b=0.304,=12,=46.362,则a的值为________.
解析:将b,,的值代入y=bx+a中可得a.
a=42.714.
答案:42.714.
10.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:
房屋面积/平方米
115
110
80
135
105
销售价格/万元
24.8
21.6
18.4
29.2
22
(1)画出数据对应的散点图;
(2)求回归直线方程,并在散点图中画出回归直线;
(3)根据(2)的结论估计当房屋面积为150平方米时的销售价格.
解:(1)散点图如图所示.
(2)=i=109,s=(xi-)2=314,
=23.2,sxy=-=61.6.
设所求回归直线方程为y=bx+a,
则b==≈0.196 2,a=-b=1.814 2.
故所求回归直线方程为y=0.196 2x+1.814 2.
(3)据(2),当x=150 平方米时,销售价格的估计值为
=0.196 2×150+1.814 2=31.244 2(万元).
同课章节目录