3.1 独立性检验
课时目标1.会利用2×2列联表,通过计算χ2的值,进行独立性检验.2.理解两个临界值的意义,正确对独立性检验问题进行判断.
1.2×2列联表
B
合计
A
n11
n12
n1+
n21
n22
n2+
合计
n+1
n+2
n
2.卡方公式
χ2=________________________________(其中n=n11+n12+n21+n22为样本容量).
3.两个临界值
χ2>3.841时,有______的把握说事件A与B有关;χ2>6.635时,有______的把握说事件A与B有关;χ2≤3.841时,认为事件A与B是无关的.
一、选择题
1.调查男女学生购买食品时是否看出厂日期与性别有无关系时,最有说服力的是( )
A.期望 B.方差
C.正态分布 D.独立性检验
2.若用独立性检验我们有99%的把握说事件A与B有关,则( )
A.χ2>0.618 B.χ2>6.635
C.χ2≤3.841 D.χ2>0.632
3.下面是一个2×2列联表:
y1
y2
总计
x1
a
21
73
x2
8
25
33
总计
b
46
则表中a、b处的值分别为( )
A.94、96 B.52、50
C.52、60 D.54、52
4.有下列四个命题:
(1)若判定两事件A与B无关,则两个事件互不影响;
(2)事件A与B关系越密切,则χ2就越大;
(3)χ2的大小是判定事件A与B是否有关的唯一根据;
(4)若判定两事件A与B有关,则A发生B一定发生.
其中正确命题的个数为( )
A.1 B.2 C.3 D.4
5.为了考察高中生的性别与是否喜欢数学课程之间的关系,在某校高中生中随机抽取了300名学生,得到下表:
喜欢数学课程
不喜欢数学课程
合计
男
37
85
122
女
35
143
178
合计
72
228
300
你认为性别与是否喜欢数学课程之间有关系的把握有( )
A.0 B.95% C.99% D.100%
二、填空题
6.有甲、乙两个班级进行一门课程的考试,按照学生考试成绩优秀和不优秀统计成绩后,得到下表:
优秀
不优秀
合计
甲班
10
35
45
乙班
7
38
45
合计
17
73
90
利用表中数据的独立性检验估计,成绩与班级______(填“有”或“无”)关系.
7.在一次独立性检验中,有300人按性别和是否色弱分类如下表:
男
女
正常
142
140
色弱
13
5
由此表计算得χ2=________.
8.某市政府在调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算发现χ2=6.023,根据这一数据查表,市政府断言市民收入增减与旅游愿望有关系,这一断言犯错误的概率不超过________.
三、解答题
9.在对人们休闲的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.
(1)根据以上数据建立一个2×2的列联表;
(2)检验性别与休闲方式是否有关系.
10.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:
积极支持改革
不太赞成改革
合计
工作积极
54
40
94
工作一般
32
63
95
合计
86
103
189
依据表中的数据对人力资源部的研究项目进行分析,能够得出什么结论?
能力提升
11.在吸烟与患肺病是否相关的判断中,有下面的说法:
①若χ2>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;
②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,若某人吸烟,则他有99%的可能患有肺病;
③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.
其中说法正确的是________.
12.为了调查网络游戏玩家与暴力犯罪倾向是否有关,某调查公司随机调查了500名青少年,并将获得的数据制成下表:
玩网络游戏
不玩网络游戏
合计
具有暴力
犯罪倾向
35
28
63
不具有暴力
犯罪倾向
165
272
437
合计
200
300
500
问:具有暴力犯罪倾向与玩网络游戏是否有关?
1.利用χ2统计量的大小可以推断两个事件是否独立.
2.χ2值越大,两个事件有关的可能性越大.
3.两个临界值是我们进行独立性检验的重要标准.
第三章 统计案例
3.1 独立性检验
答案
知识梳理
2.
3.95% 99%
作业设计
1.D
2.B
3.C [由列联表知,a=73-21=52,
b=a+8=52+8=60.]
4.A [②正确,其余均错.]
5.B [利用独立性检验,由公式计算得χ2≈4.514>3.841,所以有95%的把握判定“性别与是否喜欢数学课程之间有关系”.]
6.无
解析 成绩与班级有无关系,就是看χ2的值与临界值3.841的大小关系,由公式求得
χ2≈0.653<3.841,所以成绩与班级无关.
7.3.24
解析 代入χ2公式计算即可.
8.0.05
9.解 (1)2×2的列联表:
休闲方式
性别
看电视
运动
合计
女
43
27
70
男
21
33
54
合计
64
60
124
(2)根据列联表中的数据得到
χ2=≈6.201.
因为χ2>3.841,所以有95%的把握认为休闲方式与性别有关系.
10.解 χ2=≈10.759.
由于10.759>6.635,所以有99%的把握认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.
11.③
解析 χ2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.
12.解 由公式得χ2=
≈7.268.
因为7.268>6.635,所以我们有99%的把握说具有暴力犯罪倾向与玩网络游戏有关.
3.2 回归分析
课时目标1.理解建立回归模型的步骤.2.会利用相关系数判断两个变量线性相关的程度.3.利用回归模型可以对变量的值进行估计.
1.线性回归模型
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),我们知道其回归直线 = x+ 的斜率和截距的最小二乘估计分别为
==, =________________,其中=____________,=____________,____________称为样本点的中心.
2.相关性检验
相关系数r具有以下性质:
|r|____1,并且|r|越接近于1,线性相关程度______;|r|越接近于0,线性相关程度________.
3.临界值
|r|>________,表明有95%的把握认为两个变量之间具有线性相关关系.
一、选择题
1.下列说法正确的是( )
A.y=2x2+1中的x、y是具有相关关系的两个变量
B.正四面体的体积与其棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.传染病医院感染甲型H1N1流感的医务人员数与医院收治的甲型流感人数是具有相关关系的两个变量
2.两个变量成负相关关系时,散点图的特征是( )
A.点散布特征为从左下角到右上角区域
B.点散布在某带形区域内
C.点散布在某圆形区域内
D.点散布特征为从左上角到右下角区域内
3.已知x与y之间的一组数据如下表:
x
0
1
2
3
y
1
3
5
7
则y关于x的回归直线方程必过( )
A.(2,2)点 B.(1.5,0)点
C.(1,2)点 D.(1.5,4)点
4.工人月工资(元)依劳动生产率(千元)变化的回归方程为 =50+80x,下列判断正确的是( )
A.劳动生产率为1 000元时,工资为130元
B.劳动生产率提高1 000元,则平均工资提高80元
C.劳动生产率提高1 000元,则平均工资提高130元
D.当某人的月工资为210元时,其劳动生产率为2 000元
5.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得 =0.577x-0.448(x为人的年龄,y为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )
A.年龄为37岁的人体内脂肪含量都为20.90%
B.年龄为37岁的人体内脂肪含量为21.01%
C.年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%
D.年龄为37岁的人群中的大部分人的体内脂肪含量为31.5%
二、填空题
6.已知两个变量x和y之间具有线性相关关系,5次试验的观测数据如下:
x
100
120
140
160
180
y
45
54
62
75
92
那么变量y关于x的回归直线方程是__________.
7.如图所示,有5组数据:A(1,3),B(2,4),C(4,5),D(3,10),E(10,12),去掉________组数据后剩下的4组数据的线性相关系数最大.
8.已知回归直线方程为 =0.50x-0.81,则x=25时,y的估计值为________.
三、解答题
9.某企业上半年产品产量与单位成本资料如下:
月份
产量(千件)
单位成本(元)
1
2
73
2
3
72
3
4
71
4
3
73
5
4
69
6
5
68
(1)求出回归直线方程;
(2)指出产量每增加1 000件时,单位成本平均变动多少?
(3)假定产量为6 000件时,单位成本为多少元?
10.某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:
尿汞含量x
(毫克/升)
2
4
6
8
10
消光系数y
64
138
205
285
360
(1)对变量y与x进行相关性检验;
(2)如果y与x之间具有线性相关关系,求回归直线方程.
能力提升
11.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v,有观测数据(ui,vi)(i=1,2,…,10),得散点图(2),由这两个散点图可以判断( )
(1) (2)
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
12.某工业部门进行了一项研究,分析该部门的产量与生产费用之间的关系,从这个工业部门内随机提选了10个企业作样本,有如下资料:
产量
(千件)x
40
42
48
55
65
79
88
100
120
140
生产费用
(千元)Y
150
140
160
170
150
162
185
165
190
185
完成下列要求:
(1)计算x与Y的相关系数;
(2)对这两个变量之间是否线性相关进行相关性检验;
(3)设回归直线方程为 = x+ ,求 , .
1.(1)求回归直线方程的步骤为
①作出散点图;②利用公式计算回归系数 及 的值;③写出回归直线方程.
(2)一般地,我们可以利用回归直线方程进行预测,这里所得到的值是预测值,但不是精确值.
2.相关性检验
计算r,|r|越大,线性相关程度越强.
3.2 回归分析
答案
知识梳理
1.- xi yi (,)
2.≤ 越强 越弱
3.r0.05
作业设计
1.D [感染的医务人员数不仅受医院收治的病人数的影响,还受防护措施等其他因素的影响.]
2.D [散点图的主要作用是直观判断两个变量之间的相关关系.
一般地说,当散点图中的点是呈“由左下角到右上角”的趋势时,则两个变量之间具有正相关关系;而当散点图中的点是呈“由左上角到右下角”的趋势时,则两个变量之间具有负相关关系.]
3.D [在本题中,样本点的中心为(1.5,4),所以回归直线方程过(1.5,4)点.]
4.B [由回归系数b的意义知,b>0时,自变量和因变量按同向变化;b<0时,自变量和因变量按反向变化.b=80,可知B正确.]
5.C [当x=37时, =0.577×37-0.448=20.901≈20.90,由此估计:年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%.]
6. =0.575x-14.9
7.D
解析 各组数据所表示的点越集中靠在同一条直线上,相关系数越大,观察图象可知应去掉D组数据.
8.11.69
解析 y的估计值就是当x=25时的函数值,即0.50×25-0.81=11.69.
9.解 (1)n=6,xi=21,yi=426,=3.5,
=71,x=79,xiyi=1 481,
==≈-1.82.
=- =71+1.82×3.5=77.37.
所以回归直线方程为 = + x=77.37-1.82x.
(2)因为单位成本平均变动 =-1.82<0,且产量x的计量单位是千件,所以根据回归系数 的意义有:
产量每增加一个单位即1 000件时,单位成本平均减少1.82元.
(3)当产量为6 000件时,即x=6,代入回归直线方程:
=77.37-1.82×6=66.45(元)
当产量为6 000件时,单位成本为66.45元.
10.解 (1)=(2+4+…+10)=6,=(64+138+…+360)=210.4,x-52=(22+42+…+102)-5×62=40.
xiyi-5 =(2×64+4×138+…+10×360)-5×6×210.4=1 478,y-52=(642+1382+…+3602)-5×210.42=54 649.2,
所以r=≈0.999 7,由小概率0.05与n-2=3在附表中查得r0.05=0.878,由|r|>r0.05得,有95%的把握认为y与x之间具有线性相关关系.
(2)回归系数 ==36.95, =210.4-36.95×6=-11.3,所以所求回归直线方程为 =36.95x-11.3.
11.C [图(1)中的数据随着x的增大而y减小,因此变量x与变量y负相关;图(2)中的数据随着u的增大,v也增大,因此u与v正相关.]
12.解 (1)根据题意制表如下:
i
1
2
3
4
5
6
7
8
9
10
合计
xi
40
42
48
55
65
79
88
100
120
140
777
yi
150
140
160
170
150
162
185
165
190
185
1 657
x
1 600
1 764
2 304
3 025
4 225
6 241
7 744
10 000
14 400
19 600
70 903
y
22 500
19 600
25 600
28 900
22 500
26 244
34 225
27 225
36 100
34 225
277 119
xiyi
6 000
5 880
7 680
9 350
9 750
12 798
16 280
16 500
22 800
25 900
132 938
=77.7,=165.7;∑x=70 903;∑y=277 119;∑xiyi=132 938
r=
≈0.808,即x与Y的相关系数为0.808.
(2)由小概率0.05与n-2=8在附表中查得r0.05=0.632,因为r>r0.05,所以有95%的把握认为x与Y之间具有线性相关关系.
(3) =≈0.398,
=165.7-0.398×77.7≈134.8.
第3章 统计案例
习题课
课时目标1.进一步理解回归分析的基本思想.2.了解一些非线性回归问题的解法.
1.回归直线方程: = + x一定过点(,).
2.用相关系数可以对两个变量之间的________________进行较为精确的刻画,运用________的方法研究一些非线性相关问题.
一、选择题
1.下列说法中错误的是( )
A.如果变量x与y之间存在着线性相关关系,则我们根据实验数据得到的点(xi,yi)(i=1,2,…,n)将散布在某一条直线的附近
B.如果两个变量x与y之间不存在线性关系,那么根据它们的一组数据(xi,yi)(i=1,2,…,n)不能写出一个线性方程
C.设x、y是具有相关关系的两个变量,且x关于y的线性回归方程为 = x+ , 叫做回归系数
D.为使求出的线性回归方程有意义,可用统计假设检验的方法来判断变量y与x之间是否存在线性相关关系
2.回归方程是 =1.5x-15,则( )
A. =1.5,x=15 B.15是回归系数
C.1.5是回归系数 D.x=10时, =0
3.有下列说法:
①线性回归分析就是由样本点去寻找贴近这些样本点的一条直线的数学方法;
②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;
③通过回归方程 = x+ 及其回归系数 ,可以估计和观测变量的取值和变化趋势;
④因为由任何一组观测值都可以求得一个回归直线方程,所以没有必要进行相关性检验.
其中正确命题个数是( )
A.1 B.2 C.3 D.4
4.在对两个变量x,y进行线性回归分析时有下列步骤:
①对所求出的回归直线方程作出解释;
②收集数据(xi,yi),i=1,2,…,n;
③求回归直线方程;
④根据所搜集的数据绘制散点图.
如果根据可靠性要求能够得出变量x,y具有线性相关的结论,则正确的操作顺序是( )
A.①②④③ B.③②④①
C.②③①④ D.②④③①
5.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1、l2,已知两人所得的试验数据中,变量x和y的数据的平均值都相等,且分别是s、t,那么下列说法正确的是( )
A.直线l1和l2一定有公共点(s,t)
B.直线l1和l2相交,但交点不一定是(s,t)
C.必有l1∥l2
D.l1与l2必定重合
二、填空题
6.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:
零件数x/个
10
20
30
40
50
60
70
80
90
100
加工时间y/分
62
68
75
81
89
95
102
108
115
122
则加工时间y(分)与零件数x(个)之间的相关系数r=________(精确到0.000 1).
7.根据统计资料,我国能源生产自1986年以来发展很快.下面是我国能源生产总量(单位:亿吨标准煤)的几个统计数据:
年份
1986
1991
1996
2001
产量
8.6
10.4
12.9
16.1
根据有关专家预测,到2010年我国能源生产总量将达到21.7亿吨左右,则专家所选择的回归模型是下列四种模型中的哪一种________.(填序号)
8.下列说法中正确的是________.(填序号)
①回归分析就是研究两个相关事件的独立性;②回归模型都是确定性的函数;③回归模型都是线性的;④回归分析的第一步是画散点图或求相关系数;⑤回归分析就是通过分析、判断,确定相关变量之间的内在的关系的一种统计方法.
三、解答题
9.假设学生在初一和初二的数学成绩是线性相关的.若10个学生初一(x)和初二(y)数学分数如下:
x
74
71
72
68
76
73
67
70
65
74
y
76
75
71
70
76
79
65
77
62
72
试求初一和初二数学分数间的回归直线方程.
10.在某化学实验中,测得如下表所示的6对数据,其中x(单位:min)表示化学反应进行的时间,y(单位:mg)表示未转化物质的质量.
x/min
1
2
3
4
5
6
y/mg
39.8
32.2
25.4
20.3
16.2
13.3
(1)设y与x之间具有关系y=cdx,试根据测量数据估计c和d的值(精确到0.001);
(2)估计化学反应进行到10 min时未转化物质的质量(精确到0.1).
能力提升
11.测得10对某国父子身高(单位:英寸)如下:
父亲身高(x)
60
62
64
65
66
67
68
70
72
74
儿子身高(y)
63.6
65.2
66
65.5
66.9
67.1
67.4
68.3
70.1
70
(1)对变量y与x进行相关性检验;
(2)如果y与x之间具有线性相关关系,求回归直线方程;
(3)如果父亲的身高为73英寸,估计儿子的身高.
12.某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:
x
1
2
3
5
10
20
30
50
100
200
y
10.15
5.52
4.08
2.85
2.11
1.62
1.41
1.30
1.21
1.15
检验每册书的成本费y与印刷册数的倒数之间是否具有线性相关关系?如有,求出y对x的回归方程.
1.利用回归分析可对一些实际问题作出预测.
2.非线性回归方程有时并不给出回归模型,这时我们可以画出已知数据的散点图,把它与我们所学过的各种函数(幂函数、指数函数、对数函数、二次函数等)图象进行比较,挑选一种拟和比较好的函数,把问题通过变量转换,转化为线性的回归分析问题,使之得到解决.
习题课
答案
知识梳理
2.线性相关程度 转化
作业设计
1.B
2.D
3.C [①反映的正是最小二乘法思想,故正确.②反映的是画散点图的作用,也正确.③解释的是回归方程 = x+ 的作用,故也正确.④是不正确的,在求回归方程之前必须进行相关性检验,以体现两变量的关系.]
4.D
5.A [线性回归直线方程为 = x+ .而 =- ,即 =t- s,t= s+ .
∴(s,t)在回归直线上.
∴直线l1和l2一定有公共点(s,t).]
6.0.999 8
解析 =55,=91.7,x=38 500,
y=87 777,xiyi=55 950,
所以r=≈0.999 8.
7.①
8.④⑤
解析 回归分析就是研究两个事件的相关性;回归模型是需要通过散点图模拟的;回归模型有线性和非线性之分.
9.解 因为=71,=72.3,=50 520,iyi=51 467,
所以, =≈1.218 2
=72.3-1.218 2×71=-14.192 2,
回归直线方程是 =1.218 2x-14.192 2.
10.解 (1)在y=cdx两边取自然对数,令ln y=z,ln c=a,ln d=b,则z=a+bx.由已知数据,得
x
1
2
3
4
5
6
y
39.8
32.2
25.4
20.3
16.2
13.3
z
3.684
3.472
3.235
3.011
2.785
2.588
由公式得 ≈3.905 5, ≈-0.221 9,则线性回归方程为 =3.905 5-0.221 9x.而ln c=3.905 5,ln d=-0.221 9,故c≈49.681,d≈0.801,所以c、d的估计值分别为49.681,0.801.
(2)当x=10时,由(1)所得公式可得y≈5.4(mg).
11.解 (1)=66.8,=67.01,
x=44 794,y=44 941.93, =4 476.27,
2=4 462.24,2=4 490.34,xiyi=44 842.4.
所以r=
=
=≈≈0.980 2.
由小概率0.05与n-2=8在附表中查得r0.05=0.632,因为r>r0.05,所以有95%的把握认为y与x之间具有线性相关关系.
(2)设回归直线方程为 = x+ .
由 ===≈0.464 5,
=- =67.01-0.464 5×66.8≈35.981 4.
故所求的回归直线方程为 =0.464 5x+35.981 4.
(3)当x=73时, =0.464 5×73+35.981 4≈69.9,所以当父亲身高为73英寸时,估计儿子的身高约为69.9英寸.
12.解 把置换为z,则有z=,
从而z与y的数据为
z
1
0.5
0.333
0.2
0.1
0.05
0.033
0.02
0.01
0.005
y
10.15
5.52
4.08
2.85
2.11
1.62
1.41
1.30
1.21
1.15
可作出散点图,从图可看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合.
=×(1+0.5+0.333+0.2+0.1+0.05+0.033+0.02+0.01+0.005)=0.225 1,
=×(10.15+5.52+4.08+…+1.15)=3.14,
z=12+0.52+0.3332+…+0.012+0.0052≈1.415,
y=10.152+5.522+…+1.212+1.152=171.803,
ziyi=1×10.15+0.5×5.52+…+0.005×1.15
=15.221 02,
所以 =≈8.976,
=- =3.14-8.976×0.225 1≈1.120,
所以所求的z与y的回归方程为 =8.976z+1.120.
又因为z=,所以 =+1.120.
第3章 统计案例
章末总结
—
知识点一 独立性检验
一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
2×2列联表
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
若要推断的论述为H1:“X与Y有关系”,可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度,具体做法是:根据观测数据计算由公式给出的检验随机变量χ2的值,其值越大,说明“X与Y有关系”成立可能性越大.当得到的观测数据a,b,c,d都不小于5时,可以通过两个临界值来确定结论“X与Y有关系”的可信程度.
①若χ2>3.841,则有95%的把握认为“X与Y有关系”;
②若χ2>6.635,则有99%的把握认为“X与Y有关系”;
③若χ2≤3.841,则认为“X与Y无关系”.
例1 有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:
冷漠
不冷漠
合计
多看电视
68
42
110
少看电视
20
38
58
合计
88
80
168
试问:多看电视与人变冷漠有关吗?
知识点二 回归分析
回归分析是指对具有相关关系的两个变量进行统计分析的一种常用方法:可以利用散点图观察,代入公式求出回归直线方程,然后利用相关系数r进行相关性检验.
例2 针对某工厂某产品产量与单位成本的资料进行线性回归分析:
月份
产量(千件)x
单位成本(元/件)y
x2
xy
1
2
73
4
146
2
3
72
9
216
3
4
71
16
284
4
3
73
9
219
5
4
69
16
276
6
5
68
25
340
合计
21
426
79
1 481
例3 炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据如下表所示:
x (0.01%)
104
180
190
177
147
134
150
191
204
121
y (分钟)
100
200
210
185
155
135
170
205
235
125
(1)y与x是否具有线性相关关系?
(2)如果y与x具有线性相关关系,求回归直线方程.
(3)预测当钢水含碳量为160个0.01%时,应冶炼多少分钟?
章末总结
答案
重点解读
例1 解 由公式得χ2=≈11.377>6.635,所以我们有99%的把握说,多看电视与人变冷漠有关.
例2 解 设回归直线方程为 = x+ .
=3.5,=71,x=79,xiyi=1 481,
所以代入公式, ==≈-1.82
=71-(-1.82)×3.5≈77.37,
故回归直线方程为 =77.37-1.82x;
由回归系数 的意义可知:产量每增加1 000件,产品的单位成本就降低约1.82元.
例3 解 (1)列出下表,并利用科学计算器计算可得
i
1
2
3
4
5
6
7
8
9
10
xi
104
180
190
177
147
134
150
191
204
121
yi
100
200
210
185
155
135
170
205
235
125
xiyi
10 400
36 000
39 900
32 745
22 785
18 090
25 500
39 155
47 940
15 125
=159.8,=172,
x=265 448,y=312 350,xiyi=287 640
r=≈0.990 6.
由小概率0.05与n-2=8在附表中查得r0.05=0.632,由r>r0.05知,y与x具有线性相关关系.
(2)设所求的回归直线方程为 = x+ .
∴ =≈1.267, =- ≈-30.467.
即所求的回归直线方程为 =1.267x-30.467.
(3)当x=160时, =1.267×160-30.467≈172(min),即大约冶炼172 min.