(共22张PPT)
通过观察散点图中成对样本数据的分布规律,
我们可以大致推断两个变量是否存在相关关系、是正相关还是负相关、
是线性相关还是非线性相关等.
散点图虽然直观,但无法确切地反映成对样本数据的相关程度,
也就无法量化两个变量之间相关程度的大小.
课堂探究
问题:如何引入一个恰当的“数字特征”,
对成对样本数据的相关程度进行定量分析?
为了研究数学成绩和物理成绩这种相关关系,
现抽取某次考试中一个班级(共50名学生)的数学成绩与物理成绩.
84 72 51 72 66 72 74 63 83 86
68 73 37 75 66 72 72 55 74 70
77 71 67 59 61 64 73 79 82 80
81 65 60 74 49 63 68 83 69 85
88 60 75 58 89 66 88 72 69 61
89 46 67 50 88 73 70 66 60 63
76 59 95 81 75 64 65 70 67 82
68 50 91 67 61 43 52 79 55 65
83 58 81 50 71 72 59 42 46 45
56 61 82 57 60 77 41 50 41 40
数学成绩X
物理成绩Y
数学成绩X
物理成绩Y
数学成绩X
物理成绩Y
数学成绩X
物理成绩Y
数学成绩X
物理成绩Y
课堂探究
散点图中,
我们看到物理成绩和数学成绩
这两个变量成正相关关系。
数学成绩
物理成绩
课堂探究
84 72 51 72 66 72 74 63 83 86
68 73 37 75 66 72 72 55 74 70
77 71 67 59 61 64 73 79 82 80
81 65 60 74 49 63 68 83 69 85
88 60 75 58 89 66 88 72 69 61
89 46 67 50 88 73 70 66 60 63
76 59 95 81 75 64 65 70 67 82
68 50 91 67 61 43 52 79 55 65
83 58 81 50 71 72 59 42 46 45
56 61 82 57 60 77 41 50 41 40
数学成绩X
物理成绩Y
数学成绩X
物理成绩Y
数学成绩X
物理成绩Y
数学成绩X
物理成绩Y
数学成绩X
物理成绩Y
怎么分析一个同学的数学成绩和物理成绩的好与不好?
问题1
84 72 51 72 66 72 74 63 83 86
68 73 37 75 66 72 72 55 74 70
77 71 67 59 61 64 73 79 82 80
81 65 60 74 49 63 68 83 69 85
88 60 75 58 89 66 88 72 69 61
89 46 67 50 88 73 70 66 60 63
76 59 95 81 75 64 65 70 67 82
68 50 91 67 61 43 52 79 55 65
83 58 81 50 71 72 59 42 46 45
56 61 82 57 60 77 41 50 41 40
数学成绩X
物理成绩Y
数学成绩X
物理成绩Y
数学成绩X
物理成绩Y
数学成绩X
物理成绩Y
数学成绩X
物理成绩Y
怎么从数据上说明随着数学成绩的增加,物理成绩也增加呢?
问题2
怎么从数据上说明随着数学成绩的增加,物理成绩也增加呢?
问题2
13.94 1.94 -19.06 1.94 -4.06 1.94 3.94 -7.06 12.94 15.94
3.46 8.46 -27.54 10.46 1.46 7.46 7.46 -9.54 9.46 5.46
6.94 0.94 -3.06 -11.06 -9.06 -6.06 2.94 8.94 11.94 9.94
16.46 0.46 -4.54 9.46 -15.54 -1.54 3.46 18.46 4.46 20.46
17.94 -10.06 4.94 -12.06 18.94 -4.06 17.94 1.94 -1.06 -9.06
24.46 -18.54 2.46 -14.54 23.46 8.46 5.46 1.46 -4.54 -1.54
5.94 -11.06 24.94 10.94 4.94 -6.06 -5.06 -0.06 -3.06 11.94
3.46 -14.54 26.46 2.46 -3.54 -21.54 -12.54 14.46 -9.54 0.46
12.94 -12.06 10.94 -20.06 0.94 1.94 -11.06 -28.06 -24.06 -25.06
-8.54 -3.54 17.46 -7.54 -4.54 12.46 -23.54 -14.54 -23.54 -24.54
从上述讨论得到启发,
利用散点 的横、纵坐标是否同号,
可以构造一个量:
一般情形下,Lxy>0表明成对样本数据正相关;
Lxy <0表明成对样本数据负相关.
课堂探究
一般情形下,Lxy>0表明成对样本数据正相关;
Lxy <0表明成对样本数据负相关.
Lxy的大小是否一定能度量出成对样本数据的相关程度吗
问题3
这是否意味着(1)中的成对样本数据的相关程度就比较强呢?
成对样本数据相关关系的强与弱还与
每个变量整体的偏离水平有关系,
即还要考虑它们各自的标准差.
除以标准差,
就是把变量变化的幅度对
相关程度的影响剔除掉了.
课堂探究
r
由于身高单位的不统一,导致x的变化幅度不一样,因此我们需要消除单位对于Lxy的影响
我们称 为变量x和变量y的样本相关系数.
样本相关系数r是一个描述成对样本数据的数字特征,
结论:r的符号反映了相关关系
的正负性.
课堂探究
当 时,表明变量 与
当 时,表明变量 与
负相关.
正相关.
思考:相关系数r的取值范围是多少?
提示:观察r的结构能够联想到什么?
由-1≤cosθ≤1,可知-1≤ r ≤1 .
思考:当|r|=1时,成对样本数据之间具有怎样的关系
课堂探究
当|r|=1时,r=cosθ中的θ=0或π,向量 共线 .
存在实数λ,使得 ,即
这表明成对样本数据(xi , yi)都落在直线 上.
这时, 成对样本数据的两个变量之间满足一种线性关系.
样本相关系数的性质:① 当r>0时,成对样本数据正相关;
当r<0时,成对样本数据负相关.
② |r|≤1;
③ 当|r|越接近1时,成对数据的线性相关程度越强;
当|r|越接近0时,成对数据的线性相关程度越弱;
特别地,当|r|=0时,成对数据的没有线性相关关系;
但不排除它们有其他相关关系
当|r|=1时,成对数据都落在一条直线上.
注意:若0.75≤|r|≤1,则认为y与x的线性相关程度很强;
若0.3≤|r|<0.75,则认为y与x的线性相关程度一般;
若|r|≤0.25,则认为y与x的线性相关程度较弱)
84 72 51 72 66 72 74 63 83 86
68 73 37 75 66 72 72 55 74 70
77 71 67 59 61 64 73 79 82 80
81 65 60 74 49 63 68 83 69 85
88 60 75 58 89 66 88 72 69 61
89 46 67 50 88 73 70 66 60 63
76 59 95 81 75 64 65 70 67 82
68 50 91 67 61 43 52 79 55 65
83 58 81 50 71 72 59 42 46 45
56 61 82 57 60 77 41 50 41 40
数学成绩X
物理成绩Y
数学成绩X
物理成绩Y
数学成绩X
物理成绩Y
数学成绩X
物理成绩Y
数学成绩X
物理成绩Y
说明物理成绩与数学成绩的正相关性很强.
课堂探究
图1的r=0.97,
成对样本数据的正线性相关程度很强,
图2的r=-0.85,
成对样本数据的负线性相关程度比较强,
图3的r=0.24,
成对样本数据的线性相关程度很弱.
图4的r=-0.05,
成对样本数据的线性相关程度极弱.
1.对四组数据进行统计,获得以下散点图,关于其相关系数比较,
正确的是( )
A.r2B.r4C.r4D.r2课堂练习
如图所示的散点图与相关系数r一定不符合的是( )
A.①②③ B.①②④ C.①③④ D.②③④
y
x
o
y
x
o
y
x
o
y
x
o
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
r=0.5
r=0.75
r=-1
r=1
①
②
③
④
课堂练习
根据下表中脂肪含量和年龄的样本数据,判断两个变量是否线性相关,
计算并计算样本相关系数,并判断它们的相关程度.
参考数据:
课堂练习
解:先画出散点图, 如图所示.
观察散点图,
可以看出样本点都集中在一条直线附近,
由此推断脂肪含量和年龄线性相关.
根据下表中脂肪含量和年龄的样本数据,判断两个变量是否线性相关,
计算并计算样本相关系数,并判断它们的相关程度.
参考数据:
课堂练习
解:
由样本相关系数r≈0.97,
可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强.
现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩(x)与
入学后第一次考试的数学成绩(y)如下:
学生号 1 2 3 4 5 6 7 8 9 10
x 120 108 117 104 103 110 104 105 99 108
y 84 64 84 68 69 68 69 46 57 71
请问:这10名学生的两次数学成绩是否具有线性关系?
相关系数为r=
由此可看出这10名学生的两次数学成绩具有线性相关关系.
课堂练习
练习:假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有如下统计资料:
x 2 3 4 5 6
y 2.2 3.8 5.5 6.5 7.0
所以x与y之间具有很强的线性相关关系.
样本相关系数r是一个描述成对样本数据的数字特征,
课堂小结
研究两个变量之间的相关关系
①定性研究:绘制散点图
②定量研究:计算样本相关系数r
样本相关系数的性质:① 当r>0时,成对样本数据正相关;
当r<0时,成对样本数据负相关.
② |r|≤1;
③ 当|r|越接近1时,成对数据的线性相关程度越强;
当|r|越接近0时,成对数据的线性相关程度越弱;
特别地,当|r|=0时,成对数据的没有线性相关关系;
当|r|=1时,成对数据都落在一条直线上.
注意:若0.75≤|r|≤1,则认为y与x的线性相关程度很强;
若0.3≤|r|<0.75,则认为y与x的线性相关程度一般;
若|r|≤0.25,则认为y与x的线性相关程度较弱)