课件35张PPT。 r具有以下性质:|r|≤1,并且r越接近1,线性相关程度越
;|r|越接近0,线性相关程度越 .
(2)检验步骤如下:
①作统计假设:x与Y不具有线性相关关系.
②根据小概率0.05与n-2在附表中查出r的一个临界值r0.05.
③根据样本相关系数计算公式算出r的值.
④作出统计推断.如果 ,表明有95%把握认为x与Y之间具有线性相关关系.
如果 ,我们没有理由拒绝原来的假设.这时寻找回归直线方程是毫无意义的.强弱|r|>r0.05|r|≤r0.05 1.判断变量之间的线性相关关系,一般用散点图,但在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就必须利用样本相关系数来判断.
2.|r|越接近1,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据的效果就越好.
3.样本相关系数r只能描述两个变量之间的变化方向及密切程度,不能揭示二者之间的本质联系.
4.样本相关系数r可以定量地反映出变量间的相关程度,明确的给出有无必要建立两变量间的回归方程. [例1] 某种产品的广告费用支出x与销售额Y(单位:百万元)之间有如下的对应数据:(1)画出散点图;
(2)求回归直线方程;
(3)试预测广告费用支出为10百万元时,销售额多大?[精解详析] (1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算:
答案:-60.52.在研究硝酸钠的可溶性程度时,对不同的温度观测它在
水中的溶解度,得观测结果如下表:由此得到回归直线的斜率是0.880 9,则线性回归方程为________. [例2] 炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x与冶炼时间Y(从炉料熔化完毕到出钢的时间)的一组数据,如下表所示: (1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗?
(2)求线性回归方程.
(3)预测当钢水含碳量为160时,应冶炼多少分钟?
[思路点拨] 判断两变量之间是否具有相关关系,要计算出相关系数r,比较r与临界值的大小.依据线性回归直线方程,对冶炼时间进行预报. [一点通] 已知x与Y呈线性相关关系,就无需进行相关性检验,否则要进行相关性检验.如果两个变量不具备相关关系,或者相关关系不显著,即使求出回归直线方程也是毫无意义的,用其估计和预测也是不可信的.如果通过散点图能发现线性相关关系,也可以避免求相关系数的麻烦.3.某厂的生产原料耗费x(单位:百万元)与销售额Y(单位:
百万元)之间有如下的对应关系:
(1)x与Y之间是否具有线性相关关系?若有,求其回归直线方程;
(2)若实际销售额不少于50百万元,则原料耗费应该不少于多少? [例3] (12分)下表为收集到的一组数据: 试建立Y与x之间的回归方程.
[思路点拨] 画出散点图或进行相关性检验,确定两变量x,Y是否线性相关.由散点图得x,Y之间的回归模型,求回归方程. [精解详析] 作出散点图,如图.
从散点图中可以看出x与Y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y=c1ec2x的周围,其中c1,c2为待定的参数.? (5分) [一点通] 非线性回归问题有时并不给出经验公式,这时我们可以画出已知数据的散点图,把它与已经学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后像本例这样,采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.4.某地区不同身高的男性的体重平均值如下表:(1)试建立Y与x之间的回归方程;
(2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地区一名身高为175 cm体重为82 kg的在校男生体重是否正常?解:(1)根据上表中的数据画出散点图(如图所示).由图可看出,样本点分布在某条指数函数曲线y=c1ec2x的周围,于是令Z=ln Y,得下表:作出散点图如图所示. 1.判断变量的相关性通常有两种方式:一是散点图,二是相关系数r,前者只能粗略的说明变量间具有相关性,而后者从定量的角度分析变量相关性的强弱.
2.应用回归方程时应注意:
(1)回归方程只适用于我们所研究的样本的总体;
(2)我们所建立的回归方程一般都有时间性;
(3)样本取值的范围会影响回归方程的适用范围,一般不能超过这个适用范围,否则,将没有实用价值; (4)不能期望回归方程得到的预报值就是预报变量的准确值,事实上,它是预报变量的可能取值的平均值.
3.建立回归模型的基本步骤如下:
(1)确定研究对象.
(2)画出散点图,观察它们之间的关系.
(3)由经验确定好回归方程的类型.
(4)按照一定的规则估计回归方程中的参数.