第八章 成对数据的统计分析章末复习
知识体系
题型突破
题型一 回归分析
【例1】某地收集到的新房屋的销售价格y和房屋的面积x的数据如下表:
房屋面积x/m2 115 110 80 135 105
销售价格y/万元 24.8 21.6 18.4 29.2 22
(1)画出数据对应的散点图;
(2)若y与x线性相关,建立y关于x的经验回归方程;
(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格.
【反思感悟】
经验回归方程的求法及应用
在散点图中,样本点大致分布在一条直线附近,利用公式求出,即可写出经验回归方程,利用经验回归模型进行研究,可近似地利用经验回归方程x+来预测.
【跟踪训练】
1. 已知某连锁经营公司的5个零售店某月的销售额和利润额资料如下表:
商店名称 A B C D E
销售额x/千万元 3 5 6 7 9
利润额y/千万元 2 3 3 4 5
(1)画出散点图;
(2)根据如下的参考公式与参考数据,建立利润额y与销售额x的经验回归方程;
(3)若该公司还有一个零售店某月销售额为10千万元,试估计它的利润额是多少.
(参考公式:.参考数据:xiyi=112,=200)
题型二 一元线性回归模型分析
【例2】 在研究弹簧伸长长度y(单位:cm)与拉力x(单位:N)的关系时,对不同拉力的6根弹簧进行测量,测得如下表中的数据:
x/N 5 10 15 20 25 30
y/cm 7.25 8.12 8.95 9.90 10.9 11.8
若依据散点图可知x与y线性相关,且由最小二乘法求出的经验回归方程为=0.18x+6.34,求R2,并利用R2说明拟合效果.
【反思感悟】
一元线性回归模型拟合问题的求解策略
在一元线性回归模型中,R2与相关系数r都能刻画模型拟合数据的效果.|r|越大,R2就越大,用模型拟合数据的效果就越好.
【跟踪训练】
2.关于x与y有以下数据:
x 2 4 5 6 8
y 30 40 60 50 70
已知x与y线性相关,由最小二乘法得=6.5.
(1)建立y关于x的经验回归方程;
(2)现有第二个模型:=7x+17,且R2=0.82.若与(1)的模型比较,则哪一个模型拟合效果比较好,请说明理由.
题型三 独立性检验
【例3】为了调查胃病是否与生活规律有关联,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人.
(1)根据以上数据列出2×2列联表;
(2)依据α=0.005的独立性检验,能否认为40岁以上的人患胃病与生活规律有关联
【感悟反思】
独立性检验的一般步骤
(1)根据样本数据制成2×2列联表;
(2)根据公式计算χ2;
(3)比较χ2与临界值xα的大小关系,得到推断结论.
【跟踪训练】
3.为了解某班学生喜爱打篮球是否与性别有关联,对本班50人进行问卷调查得到了如下的列联表:
性别 喜爱打篮球 不喜爱打篮球 合计
男生 5
女生 10
合计 50
已知在全部50人中随机抽取1人抽到喜爱打篮球的学生的概率为0.6.
(1)请将上面的列联表补充完整(不用写计算过程).
(2)依据α=0.01的独立性检验,能否认为喜爱打篮球与性别有关联 说明你的理由.
(参考公式:χ2=)
参考答案
[例1]解:(1)数据对应的散点图如图所示.
(2)由散点图知y与x具有线性相关关系.
由表中数据知xi=109,yi=23.2,=60 975,xiyi=12 952.
设所求经验回归方程为x+,
则≈0.196 2,≈1.814 2.
故所求经验回归方程为=0.196 2x+1.814 2.
(3)由(2)可知,当x=150时,=0.1962×150+1.814 2=31.2442.
故销售价格的估计值为31.244 2万元.
【跟踪训练】
1.解:(1)散点图如下.
(2)由(1)中散点图可知,y与x线性相关.由已知数据计算得n=5,
=6,=3.4.
=0.5,=3.4-0.5×6=0.4.
故经验回归方程为=0.5x+0.4.
(3)将x=10代入经验回归方程中得到=0.5×10+0.4=5.4,
即估计该零售店的利润额为5.4千万元.
【例2】解:列表求值如下:
xi 5 10 15 20 25 30
yi 7.25 8.12 8.95 9.90 10.9 11.8
xiyi 36.25 81.2 134.25 198 272.5 354
25 100 225 400 625 900
yi- 0.01 -0.02 -0.09 -0.04 0.06 0.06
yi- -2.24 -1.37 -0.54 0.41 1.41 2.31
=17.5,≈9.49,xiyi=1 076.2,=2 275,
(yi-)2=0.017 4,(yi-)2=14.678 4.
所以R2=1-≈0.998 81,模型拟合效果较好.
【跟踪训练】
2.解:(1)依题意设y关于x的经验回归方程为=6.5x+.
∵ =5,=50,
又经验回归直线经过(),
∴ 50=6.5×5+.
∴ =17.5.
∴ y关于x的经验回归方程为=6.5x+17.5.
(2)
yi- -0.5 -3.5 10 -6.5 0.5
yi- -20 -10 10 0 20
所以(yi-)2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155.
(yi-)2=(-20)2+(-10)2+102+02+202=1 000.
所以=1-=1-=0.845.
因为R2=0.82,所以>R2.
所以(1)的模型拟合效果比较好.
【例3】解:(1)由题意可列2×2列联表如下:
类型 患胃病 未患胃病 合计
生活规律 20 200 220
生活不规律 60 260 320
合计 80 460 540
(2)零假设为H0:40岁以上的人患胃病与生活规律无关联.根据列联表得
χ2=≈9.638>7.879=x0.005.
依据α=0.005的独立性检验,我们推断H0不成立,即认为40岁以上的人患胃病和生活规律有关联.
【跟踪训练】
3.解:(1)依题意可知喜爱打篮球的学生的人数为50×0.6=30.
列联表补充如下:
性别 喜爱打篮球 不喜爱打篮球 合计
男生 20 5 25
女生 10 15 25
合计 30 20 50
(2)零假设为H0:喜爱打篮球与性别无关联.根据列表中的数据,经计算得到χ2=≈8.333>6.635=x0.01,依据α=0.01的独立性检验,我们推断H0不成立,即认为喜爱打篮球与性别有关联.