年龄 脂肪含量
23 9.5
27 17.8
39 21.2
41 25.9
45 27.5
49 26.3
50 28.2
53 29.6
54 30.2
56 31.4
57 30.8
58 33.5
60 35.2
61 34.6
摄氏温度(℃) 热饮杯数
-5 156
0 150
4 132
7 128
12 130
15 116
19 104
23 89
27 93
31 76
36 54(共36张PPT)
“如果你的数学成绩好,那么你的物理学习就不会有什么大问题”你如何认识学生的数学成绩与物理成绩之间存在的关系
不能通过一个人的数学成绩来确定他的物理成绩,两个变量之间是一种不确定关系。
数学成绩
物理成绩
学习兴趣
学习时间
其他因素
我们不能通过一个人的数学成绩是多少就准确地断定其物理成绩能达到多少,学习兴趣、学习时间、教学水平等,也是影响物理成绩的一些因素.但这两个变量是有一定关系的,它们之间是一种不确定性的关系.
两个变量的相关关系
定义:当自变量取值一定,因变量的取值带有一定的随机性时,两个变量之间 的关系称为相关关系。相关关系是一种非确定性关系。
(2)相关关系与函数关系的异同点:
下列问题中两个变量之间的关系是相关关系吗:
(1)商品销售收入与广告支出经费;
(2)粮食产量与施肥量;
(3)人体内的脂肪含量与年龄.
(4)已知y=x,x和y是相关关系吗?
定义:当自变量取值一定,因变量的取值带有一定的随机性时,两个变量之间 的关系称为相关关系。相关关系是一种非确定性关系。
相关关系与函数关系的异同点:
不同点:
①函数关系是一种确定性关系;相关关系是一种非确定性关系。
②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。如:在校儿童脚的大小与阅读能力有很强的相关关系,但不是因果关系。
联系:
两者均是指两个变量的关系;在一定条件下可以相互转化。
例1:下列各关系中具有相关关系的是( )
(A)正方体的体积与边长;
(B)匀速行驶的车辆的行驶距离与时间;
(C)人的身高与体重; (D)人的身高与视力
C
例2:下列各关系中,不属于相关关系的是( )
(A)名师出高徒;(B)球的表面积与体积;
(C)家庭的支出与收入(D)人的年龄与体重
B
由于相关关系的不确定性,在寻找变量相关关系的过程中,统计具有非常重要的作用。我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对他们的关系作出判断。
相关关系的分析方向
散点图
【问题】在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:
其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.
年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
年龄 53 54 56 57 58 60 61
脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
思考1:对某一个人来说,他的体内脂肪含量不一定随年龄增长而增加或减少,但是如果把很多个体放在一起,就可能表现出一定的规律性.观察上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?
年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
年龄 53 54 56 57 58 60 61
脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
思考2:为了确定年龄和人体脂肪含量之间的更明确的关系,我们需要对数据进行分析,通过作图可以对两个变量之间的关系有一个直观的印象.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?
年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
年龄 53 54 56 57 58 60 61
脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
散点图定义:
在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.
观察散点图的大致趋势,人的年龄与人体脂肪含量具有什么相关关系?
一般地,对于某个人来说,她的体内脂肪不一定随年龄的增长而增加或减少。但是如果把很多个体放在一起,这时就可能表现出一定的规律。大体上来看,随年龄的增加,人体中脂肪的百分比也在增加。
观察散点图的大致趋势,人的年龄与人体脂肪含量具有什么相关关系?
在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.
如果两个变量成负相关,从整体上看这两个变量的变化趋势如何?其散点图有什么特点?
一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的区域.
从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在从左下角到右上角的区域。称它们成正相关。但有的两个变量的相关,如下图所示:
如高原含氧量与海拔高度
的相关关系,海平面以上,
海拔高度越高,含氧量越
少。
作出散点图发现,它们散
布在从左上角到右下角的区
域内。又如汽车的载重和汽
车每消耗1升汽油所行使的
平均路程,称它们成负相关.
O
典型例题分析
例1 在下列两个变量的关系中,哪些是相关关系?
①正方形边长与面积之间的关系;
②作文水平与课外阅读量之间的关系;
③人的身高与年龄之间的关系;
④降雪量与交通事故的发生率之间的关系.
回归直线
思考:一组样本数据的平均数是样本数据的中心,那么散点图中样本点的中心如何确定?它一定是散点图中的点吗?
思考:在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?
这些点大致分布在一条直线附近.
思考:如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.对具有线性相关关系的两个变量,其回归直线一定通过样本点的中心吗?
思考:对一组具有线性相关关系的样本数据,你认为其回归直线是一条还是几条?
思考:在样本数据的散点图中,能否用直尺准确画出回归直线?
回归方程
在直角坐标系中,任何一条直线都有相应的方程.
回归直线的方程称为回归方程.
对一组具有线性相关关系的样本数据,如果能够求出它的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行估计.
思考:回归直线与散点图中各点的位置应具有怎样的关系?
整体上最接近
实际上,求回归直线的关键是如何用数学的方法来刻画“从整体上看,各点到此直线的距离最小”.
这样的方法叫做最小二乘法.
人们经过长期的实践与研究,已经找到了计算回归方程的一般公式 ,其中:
以上公式的推导较复杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫最小二乘法。
理论迁移
例 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的饮料杯数与当天气温的对比表:
摄氏温度(℃) -5 0 4 7 12
热饮杯数 156 150 132 128 130
15 19 23 27 31 36
116 104 89 93 76 54
摄氏温度(℃) -5 0 4 7 12
热饮杯数 156 150 132 128 130
15 19 23 27 31 36
116 104 89 93 76 54
(1)画出散点图;
(2)从散点图中发现气温与热饮杯数之 间关系的一般规律;
(3)求回归方程;
(4)如果某天的气温是2℃,预测这天卖出的热饮杯数.
1、散点图
2、从图3-1看到,各点散布在从左上角到由下角的区域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖出去的热饮杯数越少。
3、从散点图可以看出,这些点大致分布在一条直线的附近,因此利用公式求出回归方程的系数。 Y= -2.352x+147.767
4、当x=2时,Y=143.063 因此,某天的气温为2摄氏度时,这天大约可以卖出143杯热饮。
练习:给出施化肥量对水稻产量影响的
试验数据:
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
求出回归直线
从而得回归直线方程是
解:表中的数据进行具体计算,列成以下表格
20475
18000
15575
12150
9125
6900
4950
xiyi
455
450
445
405
365
345
330
yi
45
40
35
30
25
20
15
xi
7
6
5
4
3
2
1
i
.
故可得到
1、列表
2、代入公式计算得
3、写出回归直线方程
小结
1.求样本数据的线性回归方程,可按下列步骤进行:
第一步,列表计算平均数 ,
第二步,求和 ,
第三步,计算
第四步,写出回归方程