(机构适用)8.1成对数据的统计相关性-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册讲义(Word版含解析)

文档属性

名称 (机构适用)8.1成对数据的统计相关性-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册讲义(Word版含解析)
格式 docx
文件大小 159.9KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2021-05-17 16:02:17

图片预览

文档简介

1了解变量的相关关系
2.理解散点图
3.掌握样本相关系数
一、变量的相关关系
1.相关关系
两个变量间的关系有函数关系,相关关系和不相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系
2.正相关、负相关
从整体上看,当一个变量的值增加时,另一个变量的相应值也星现增加的趋势,我们就称这两个变量正相关;如果一个变量值增加时,另一个变量的相应值呈现减少的趋势,则称这个两个变量负相关
3.线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条线附近,
我们就称这两个变量线性相关
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关
二、样本相关系数
1.相关系数r的计算
注意:相关系数是研究变量之间线性相关程度的量
假设两个随机变量的数据分别为,对数据作进一步的“标准化处理”处理,用,分别除和(和分别为和的均值),得,,,为简单起见把上述“标准化”处理后的成对数据分别记为,,则变量x和变量y的样本相关系数r的计算公式如下:
2.相关系数r的性质
(1)当r>0时,称成对样本数据正相关;当r<0时,成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系.
(2)样本相关系数r的取值范围为
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
样本相关系数与标准化数据向量夹角的关系
(其中=(),=(),,为向量和向量的夹角)
1..习近平总书记在党的十九大报告中指出,要在“幼有所育、学有所教、劳有所得、病有所医、老有所养、住有所居、弱有所扶”上不断取得新进展,保证全体人民在共建共享发展中有更多获得感.现S市政府针对全市10所由市财政投资建设的敬老院进行了满意度测评,得到数据如下表:
敬老院
A
B
C
D
E
F
G
H
I
K
满意度x(%)
20
34
25
19
26
20
19
24
19
13
投资原y(万元)
80
89
89
78
75
71
65
62
60
52
参考数据:




.
附:对于一组数据
,其回归直线
的斜率和截距的最小二乘估计公式分别为:
.线性相关系数
.
(1)求投资额
关于满意度
的相关系数;
(2)我们约定:投资额
关于满意度
的相关系数
的绝对值在0.75以上(含0.75)是线性相关性较强,否则,线性相关性较弱.如果没有达到较强线性相关,则采取“末位淘汰”制(即满意度最低的敬老院市财政不再继续投资,改为区财政投资).求在剔除“末位淘汰”的敬老院后投资额
关于满意度
的线性回归方程(系数精确到0.1)
【答案】
(1)解:由题意,根据相关系数的公式,可得
.(2)解:由(1)可知,因为
,所以投资额
关于满意度
没有达到较强线性相关,
所以要“末位淘汰”掉K敬老院.
重新计算得




所以

.
所以所求线性回归方程为
.
【考点】变量间的相关关系
【解析】(1)由题意,根据相关系数的公式,可得
的值,即可求解;(2)由(1)可知,得投资额
关于满意度
没有达到较强线性相关,利用公式求得
的值,即可得出回归直线的方程.
2.冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如表所示:
根据以上数据试判断含杂质的高低与设备改造有无关系?
【答案】
解:由已知数据得到如下2×2列联表
由公式K2=≈13.11,
由于13.11>10.828,
故有99.9%的把握认为含杂质的高低与设备是否改造是有关的.
【考点】两个变量的线性相关
【解析】根据所给的数据写出列联表,把列联表的数据代入观测值的公式,求出两个变量之间的观测值,把观测值同临界值表中的数据进行比较,得到有99.9%的把握认为含杂质的高低与设备是否改造是有关的。
3.下表为某地近几年机动车辆数与交通事故数的统计资料,请判断交通事故数与机动车辆数是否有线性相关关系.
【答案】
解:在直角坐标系中描出数据的散点图,直观判断散点不在一条直线附近,故不具有线性相关关系.
【考点】相关系数
【解析】在直角坐标系中描出数据的散点图,直观判断散点不在一条直线附近,即可的得出结论.
4.山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg).
施化肥量x
15
20
25
30
35
40
45
棉花产量y
330
345
365
405
445
450
455
(1)画出散点图;
(2)判断是否具有相关关系.
【答案】
解:(1)根据已知表格中的数据可得施化肥量x和产量y的散点图如下所示:
(2)根据(1)中散点图可知,
各组数据对应点大致分布在一个条形区域内(一条直线附近)
故施化肥量x和产量y具有线性相关关系.
【考点】散点图
【解析】(1)根据已知中表中7块并排、形状大小相同的试验田上,施化肥量x和产量y所得的数据,描点后可得散点图;
????????????
(2)根据(1)中散点图中的点大致分布在一个条形区域内(一条直线附近)可得两个变量具有相关关系.
1.对四组数据进行统计,获得以下散点图,关于其线性相关系数比较,正确的是(?
?)
A.????????????????????????????????????????????B.?
C.????????????????????????????????????????????D.?
2.在一组样本数据









不全相等)的散点图中,若所有样本点

,2,

都在直线
上,则这组样本数据的样本相关系数为(???

A.?-1?????????????????????????????????????????B.?0?????????????????????????????????????????C.??????????????????????????????????????????D.?1
3.如图是根据

的观测数据
得到的点图,由这些点图可以判断变量

具有线性相关关系的图(???

A.?①②?????????????????????????????????????B.?①④?????????????????????????????????????C.?②③?????????????????????????????????????D.?③④
4.设


为空间的三个不同向量,如果
成立的等价条件为
,则称


线性无关,否则称它们线性相关.若


线性相关,则
(??
)
A.?9???????????????????????????????????????????B.?7???????????????????????????????????????????C.?5???????????????????????????????????????????D.?3
参考答案
1.【答案】
B
【解析】
解:由给出的四组数据的散点图可以看出,
图1和图3是正相关,相关系数大于0,则

图2和图4是负相关,相关系数小于0,则

图3和图4的点相对更加集中,所以相关性较强,所以
接近于1,
接近于

图1和图2的点相对分散一些,所以相关性较弱,所以

比较接近0,
由此可得:
.
2.【答案】
A
【解析】
因为回归直线方程是

所以这两个变量是负相关,故这组样本数据的样本相关系数为负值,
又所有样本点

,2,

都在直线上,
所以

所以相关系数

3.【答案】
B
【解析】
由题图知,②③的点呈片状分布,没有明显的线性相关关系;
①中y随x的增大而减小,各点整体呈下降趋势,x与y负相关;
④中y随x的增大而增大,各点整体呈上升趋势,y与x正相关.
4.【答案】
A
【解析】
依题意,三个向量线性相关,则存在不全为0的实数


,使得
成立.故



,代入
,得
,由于


不全为0,故
,则