第1章 统计案例
章末总结
知识点一 独立性检验
独立性检验是对两个变量之间是否存在相关关系的一种案例分析方法:由题意列出2×2列联表.根据公式计算出χ2.要熟记χ2与三个临界值:2.706,6.635,10.828之间的关系与变量X与Y相关与否的意义.
例1 调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表,试问婴儿的性别与出生的时间是否有关系?
出生时间
性别
晚上
白天
总计
男婴
15
31
46
女婴
8
26
34
总计
23
57
80
例2 研究某特殊药物有无副作用(比如服用后恶心),给50个患者服用此药,给另外50个患者服用安慰剂,记录每类样本中出现恶心的数目如下表:
恶心
不恶心
合计
给药A
15
35
50
给安慰剂
4
46
50
合计
19
81
100
试问此药物有无恶心的副作用?
知识点二 回归分析
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.在求变量x与y之间的回归方程之前先进行线性相关检验.由公式计算出相关系数r,|r|越接近1,线性相关程度越强;|r|越近0,线性相关程度越弱,回归直线方程 = + x.其中 , 可由公式求出;可利用相关系数r进行显著性检验.
例3 某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x(x取整数)元与日销售量y台之间有如下对应数据:
单价x/元
35
40
45
50
日销量y/台
56
41
28
11
(1)画出散点图并说明y与x是否具有线性相关关系?如果有,求出线性回归方程;(方程的斜率保留一个有效数字)
(2)设经营此商品的日销售利润为P元,根据(1)写出P关于x的函数关系式,并预测当销售单价x为多少元时,才能获得最大日销售利润?
例4 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(g/L)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.
甲醛浓度
(g/L)
18
20
22
24
26
28
30
缩醛化度
(克分子%)
26.86
28.35
28.75
28.87
29.75
30.00
30.36
(1)画散点图;
(2)求y对x的线性回归方程;
(3)求相关系数r,并判断x与y之间是否有线性相关关系.
章末总结
答案
重点解读
例1 解 χ2=
≈0.787<2.706.
所以我们没有把握认为“婴儿的性别与出生的时间有关”.
例2 解 由题意,问题可以归纳为独立检验.
假设H1:服该药物(A)与恶心(B)独立,为了检验假设,
计算统计量χ2=≈7.86>6.635,
故拒绝H1,即不能认为药物无恶心副作用,也可以说,我们有99%的把握说,该药物与副作用(恶心)有关.
例3 解
(1)散点图如图所示:从图中可以看出这些点大致分布在一条直线附近,因此两个变量具有线性相关关系.
设线性回归方程为 = x+ ,由题知=42.5,=34,则求得
==-≈-3.
=- =34-(-3)×42.5=161.5.
∴ =-3x+161.5.
(2)依题意有P=(-3x+161.5)(x-30)
=-3x2+251.5x-4 845
=-3(x-)2+-4 845,
∴当x=≈42时,P有最大值.
即预测销售单价为42元时,能获得最大日销售利润.
例4 解 (1)
(2)==24,=,xiyi=4 900.16,
x=4 144.
==
≈0.264 3,
=- =-0.264 3×24=22.648,
∴回归方程为 =22.648+0.264 3x.
(3)y≈5 892,
r=
=
≈0.96.
∵0.96>r0.05=0.754.
∴有95%的把握认为x与y之间具有线性相关关系.