(共34张PPT)
第八章 成对数据的统计分析
数字特征
正相关
负相关
[-1, 1]
≤
1
0
正负性
直线
越大
答案:D
答案:A
答案:D
答案:B
答案:C
+X
wuH
IV
1=0310
0:哪-D,90
Ta
g
+X)
1=10813
0-D900=m7
S03
概念
样本相
关系数意义
知识
性质
两个变量的相关
性与样本相关系
相关关系的方法
数间的关系
判断方法
数据分析数学运算
素养或思想A级 基础巩固
1.已知两个变量的样本数据如下表,则这两个变量线性相关程度( )
x 5 10 15 20 25
y 103 105 110 111 114
A.较强 B.较弱
C.不相关 D.不确定
解析:由题意,得=1 375,xiyi=8 285,=59 051,=15,=108.6.
所以r=
=
≈0.982 6.
故两个变量间的线性相关程度较强.
答案:A
2.在一组样本数据为(x1, y1), (x2, y2),…,(xn, yn)(n≥2)的散点图中,若所有样本点(xi, yi)(i=1,2,…,n)都在直线y=-x+2上,则这组数据的样本相关系数为( )
A.- B. C.1 D.-1
解析:因为所有样本点均在直线y=-x+2上,y随着x的增大而减小,所以这两个变量是负相关,即这组样本数据的样本相关系数为负值.因为所有样本点(xi,yi)(i=1,2,…,n)都在一条直线上,所以|r|=1,故样本相关系数r=-1.故选D.
答案:D
3.已知变量x,y线性相关,样本相关系数r>0,则在以(,)为坐标原点的坐标系下的散点图中,大多数的点都落在第一、三象限.
解析:因为当r>0时,变量x与y正相关,所以在以(,)为坐标原点的坐标系下的散点图中,大多数点落在第一、三象限.
4.某10个工业企业生产性固定资产价值(单位:百万元)与工业增加值(单位:百万元)资料如下表:
固定资产价值/百万元 3 3 5 6 6 7 8 9 9 10
工业增加值/百万元 15 17 25 28 30 36 37 42 40 45
根据上表资料计算得样本相关系数r≈0.991 8,则固定资产价值与工业增加值之间的线性相关程度较强(填“较强”或“较弱”).
解析:由于样本相关系数r≈0.991 8接近于1,故固定资产价值与工业增加值之间的线性相关程度较强.
5.为了研究三月下旬的平均气温x(单位:℃)与4月份棉花害虫化蛹高峰日y的关系,某地区统计了2014年至2019年的情况,得到了下面的数据表:
年份 x/℃ y
2014 24.4 19
2015 29.5 6
2016 32.9 1
2017 28.7 10
2018 30.3 1
2019 28.9 8
试判断变量x与y之间的相关关系.
解:由表中数据,得=×(24.4+29.5+…+28.9)≈29.12,
=×(19+6+…+8)=7.5,
=24.42+29.52+…+28.92=5 125.01,
=192+62…+82=563,
xiyi=24.4×19+…+28.9×8=1 222.
所以r=≈-0.966.
因为|r|≈0.966接近于1,
所以y与x存在很强的线性相关关系.
B级 拓展提高
6.已知变量x, y的散点图如图所示,现用两种方案对这两个变量进行线性相关分析.方案一:根据图中所有数据,得到样本相关系数为r1;方案二:剔除点(10, 21),根据剩下的点对应的数据得到样本相关系数为r2,则 ( )
A.0B.0C.-1D.-1解析:由散点图得变量x与y呈现负相关,所以r1<0, r2<0.因为剔除点(10, 21)后,剩下的点对应的数据具有更强的线性相关性,|r2|更接近1,所以-1答案:D
7.已知变量x与y的样本相关系数为0.857,若设y1=100y,x1=1 000x,则y1与x1的样本相关系数为0.857.
解析:当新变量是原变量的正比例函数(系数大于0)时,样本相关系数不变.
C级 挑战创新
8.多空题在钢铁碳含量对于电阻的效应研究中,得到如下数据表:
碳含量x/% 0.10 0.30 0.40 0.55 0.70 0.80 0.95
20℃时电阻y/Ω 15 18 19 21 22.6 23.6 26
则样本相关系数r≈0.996,说明钢铁碳含量与电阻之间具有较强的线性相关关系(填“较强”或“较弱”).
解析:由表中数据,得≈0.543,≈20.743,=2.595,=
3 094.72,xiyi=85.45,
所以r≈≈0.996.
由于r接近于1,故钢铁碳含量与电阻之间的线性相关关系较强.