章末总结
—
知识点一 独立性检验
一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
2×2列联表
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
若要推断的论述为H1:“X与Y有关系”,可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度,具体做法是:根据观测数据计算由公式给出的检验随机变量χ2的值,其值越大,说明“X与Y有关系”成立可能性越大.当得到的观测数据a,b,c,d都不小于5时,可以通过两个临界值来确定结论“X与Y有关系”的可信程度.
①若χ2>3.841,则有95%的把握认为“X与Y有关系”;
②若χ2>6.635,则有99%的把握认为“X与Y有关系”;
③若χ2≤3.841,则认为“X与Y无关系”.
例1 有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:
冷漠
不冷漠
合计
多看电视
68
42
110
少看电视
20
38
58
合计
88
80
168
试问:多看电视与人变冷漠有关吗?
知识点二 回归分析
回归分析是指对具有相关关系的两个变量进行统计分析的一种常用方法:可以利用散点图观察,代入公式求出回归直线方程,然后利用相关系数r进行相关性检验.
例2 针对某工厂某产品产量与单位成本的资料进行线性回归分析:
月份
产量(千件)x
单位成本(元/件)y
x2
xy
1
2
73
4
146
2
3
72
9
216
3
4
71
16
284
4
3
73
9
219
5
4
69
16
276
6
5
68
25
340
合计
21
426
79
1481
例3 炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据如下表所示:
x (0.01%)
104
180
190
177
147
134
150
191
204
121
y (分钟)
100
200
210
185
155
135
170
205
235
125
(1)y与x是否具有线性相关关系?
(2)如果y与x具有线性相关关系,求回归直线方程.
(3)预测当钢水含碳量为160个0.01%时,应冶炼多少分钟?
章末总结
答案
重点解读
例1 解 由公式得χ2=≈11.377>6.635,所以我们有99%的把握说,多看电视与人变冷漠有关.
例2 解 设回归直线方程为=x+.
=3.5,=71,x=79,xiyi=1481,
所以代入公式,==≈-1.82
=71-(-1.82)×3.5≈77.37,
故回归直线方程为=77.37-1.82x;
由回归系数的意义可知:产量每增加1000件,产品的单位成本就降低约1.82元.
例3 解 (1)列出下表,并利用科学计算器计算可得
i
1
2
3
4
5
6
7
8
9
10
xi
104
180
190
177
147
134
150
191
204
121
yi
100
200
210
185
155
135
170
205
235
125
xiyi
10400
36000
39900
32745
22785
18090
25500
39155
47940
15125
=159.8,=172,
x=265448,y=312350,xiyi=287640
r=≈0.9906.
由小概率0.05与n-2=8在附表中查得r0.05=0.632,由r>r0.05知,y与x具有线性相关关系.
(2)设所求的回归直线方程为=x+.
∴=≈1.267,=-≈-30.467.
即所求的回归直线方程为=1.267x-30.467.
(3)当x=160时,=1.267×160-30.467≈172(min),即大约冶炼172min.