(机构适用)8.1成对数据的统计相关性-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册学案(Word版含解析)

文档属性

名称 (机构适用)8.1成对数据的统计相关性-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册学案(Word版含解析)
格式 docx
文件大小 155.3KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2021-05-17 15:53:21

图片预览

文档简介

1了解变量的相关关系
2.理解散点图
3.掌握样本相关系数
一、变量的相关关系
1.相关关系
两个变量间的关系有函数关系,相关关系和不相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系
2.正相关、负相关
从整体上看,当一个变量的值增加时,另一个变量的相应值也星现增加的趋势,我们就称这两个变量正相关;如果一个变量值增加时,另一个变量的相应值呈现减少的趋势,则称这个两个变量负相关
3.线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条线附近,
我们就称这两个变量线性相关
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关
二、样本相关系数
1.相关系数r的计算
注意:相关系数是研究变量之间线性相关程度的量
假设两个随机变量的数据分别为,对数据作进一步的“标准化处理”处理,用,分别除和(和分别为和的均值),得,,,为简单起见把上述“标准化”处理后的成对数据分别记为,,则变量x和变量y的样本相关系数r的计算公式如下:
2.相关系数r的性质
(1)当r>0时,称成对样本数据正相关;当r<0时,成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系.
(2)样本相关系数r的取值范围为
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
样本相关系数与标准化数据向量夹角的关系
(其中=(),=(),,为向量和向量的夹角)
1.新生儿某疾病要接种三次疫苗免疫(即0、1、6月龄),假设每次接种之间互不影响,每人每次接种成功的概率相等为了解新生儿该疾病疫苗接种剂量与接种成功之间的关系,现进行了两种接种方案的临床试验:10μg/次剂量组与20μg/次剂量组,试验结果如下:
接种成功
接种不成功
总计(人)
10μg/次剂量组
900
100
1000
20μg/次剂量组
973
27
1000
总计(人)
1873
127
2000
(1)根据数据说明哪种方案接种效果好?并判断能否有99.9%的把握认为该疾病疫苗接种成功与两种接种方案有关?
(2)以频率代替概率,若选用接种效果好的方案,参与该试验的1000人的成功人数比此剂量只接种一次的成功人数平均提高多少人.
参考公式:
,其中
参考附表:
0.050
0.010
0.001
3.841
6.635
10.828
【答案】
(1)解:由于两种接种方案都是1000人接受临床试验,接种成功人数10μg/次剂量组900人,20μg/次剂量组973人,973>900,所以方案20μg/次剂量组接种效果好;
由公式
所以有99.9%的把握认为该疾病疫苗接种成功与两种接种方案有关
(2)解:假设20μg/次剂量组临床试验接种一次成功的概率为p,
由数据,三次接种成功的概率为
,不成功的概率为

由于三次接种之间互不影响,每人每次接种成功的概率相等,
所以
,得

设参与试验的1000人此剂量只接种一次成功的人数为X,
显然

参与试验的1000人此剂量只接种一次成功的人数平均为700人,
且973-700=273,
所以选用20μg/次剂量组方案,参与该试验的1000人比此剂量只接种一次成功人数平均提高273人.
【考点】变量间的相关关系,相互独立事件的概率乘法公式,离散型随机变量的期望与方差,二项分布与n次独立重复试验的模型
【解析】(1)比较两种方案的成功人数可得,按公式计算
得结论;(2)按题意成功人数是
人,假设接种一次成功概率为
,由独立重复试验的概率公式可计算出
,设参与试验的1000人此剂量只接种一次成功的人数为X,显然
,计算出期望即平均人数后可得提高的人数.
2.某基地蔬菜大棚采用水培、无土栽培方式种植各类菠菜.根据统计,该基地的西红种增加量y(百斤)与使用某种液体肥料x(千克)之间对应数据为如图所示的折线图.依据折线图及其提供的数据,是否可用线性回归模型拟合y与x的关系?如果可以,请计算相关系数r并加以说明(精确到0.01),(若
,则线性相关程度很高,可用线性回归模型拟合)
附:相关系数公式
,参考数据:


【答案】
解:如图、连结其中两点得一直线可以知道相关数据对应的点在直线附近.所以可用线性回归模型拟合y与x的关系,
由已知数据可得


因为



所以相关系数

因为
,所以可用线性回归摸型拟合y与x的关系
【考点】两个变量的线性相关,相关系数
【解析】由由题意求出
,代入公式求值,从而得到回归直线方程.
3.为调查银川市某校高中生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了50人,结果如下:
下面的临界值表供参考:
P(K2≥k)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
独立性检验统计量
其中
(1)用分层抽样的方法在愿意提供志愿者服务的学生中抽取6人,其中男生抽取多少人?
(2)在(1)中抽取的6人中任选2人,求恰有一名女生的概率;
(3)你能否在犯错误的概率不超过0.010的前提下,认为该校高中生是否愿意提供志愿者服务与性别有关?
【答案】
(1)解:在愿意提供志愿者服务的学生中抽取6人,则抽取比例为
所以男生应该抽取20
(2)解:在(Ⅰ)中抽取的6名学生中,女生有2人,男生有4人,男生4人记为
2人记为
,则从6名学生中任取2名的所有情况为:共15种情况。
恰有一名女生的概率为
(3)解:因为
?
?且
所以在犯错误的概率不超过0.010的前提下认为是否愿意提供志愿者服务是与性别有关系的。
【考点】两个变量的线性相关
【解析】(I)根据题目中所给的条件的特点,根据分层抽样,即可得到正确的答案.
(II)利用排列组合写出所有事件的事件数,及满足条件的事件数,利用等可能事件的概率公式得到概率.
(III)计算K2

同临界值表进行比较,得到有多大把握认为该校高中生是否愿意提供志愿者服务与性别有关.
4.冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如表所示:
根据以上数据试判断含杂质的高低与设备改造有无关系?
【答案】解:由已知数据得到如下2×2列联表
由公式K2=
≈13.11,
由于13.11>10.828,
故有99.9%的把握认为含杂质的高低与设备是否改造是有关的.
【考点】两个变量的线性相关
【解析】根据所给的数据写出列联表,把列联表的数据代入观测值的公式,求出两个变量之间的观测值,把观测值同临界值表中的数据进行比较,得到有99.9%的把握认为含杂质的高低与设备是否改造是有关的.
1.如图是九江市2019年4月至2020年3月每月最低气温与最高气温(℃)的折线统计图:已知每月最低气温与最高气温的线性相关系数r=0.83,则下列结论错误的是(???

?
A.?每月最低气温与最高气温有较强的线性相关性,且二者为线性正相关
B.?月温差(月最高气温﹣月最低气温)的最大值出现在10月
C.?9﹣12月的月温差相对于5﹣8月,波动性更大
D.?每月最高气温与最低气温的平均值在前6个月逐月增加
2.研究变量
得到一组样本数据,进行回归分析,有以下结论
①残差图中残差点所在的水平带状区域越窄,则回归方程的预报精确度越高;
②用相关指数
来刻画回归效果,
越小说明拟合效果越好;
③在回归直线方程
中,当变量
每增加1个单位时,变量
就增加2个单位
④若变量y和x之间的相关系数为
,则变量

之间的负相关很强
以上正确说法的个数是(???

A.?1???????????????????????????????????????????B.?2???????????????????????????????????????????C.?3???????????????????????????????????????????D.?4
3.对于相关系数
,下列说法中正确的是(???

A.?
越大,线性相关程度越强
B.?
越小,线性相关程度越强
C.?
越大,线性相关程度越弱,
越小,线性相关程度越强
D.?
,且
越接近
,线性相关程度越强,
越接近
,线性相关程度越弱
4.已知具有线性相关关系的两个变量

之间的一组数据如下:
0
1
2
3
4
2.2
4.3
4.8
6.7
且回归方程是
,则
(???

A.?2.5????????????????????????????????????????B.?3.5????????????????????????????????????????C.?4.5????????????????????????????????????????D.?5.5
参考答案
1.【答案】
D
【解析】
每月最低气温与最高气温的线性相关系数r=0.83,比较接近于
,则每月最低气温与最高气温有较强的线性相关性,且二者为线性正相关,则A符合题意;
由所给的折线图可以看出月温差(月最高气温﹣月最低气温)的最大值出现在10月,则B符合题意;
5﹣8月的月温差分别为18,17,16,16,9﹣12月的月温差分别为20,31,24,21,则9﹣12月的月温差相对于5﹣8月,波动性更大,C符合题意;
每月的最高气温与最低气温的平均值在前5个月逐月增加,第六个月开始减少,所以A符合题意,则D不符合题意;
2.【答案】
C
【解析】
对于①,残差图中残差点所在的水平带状区域越窄,则回归方程的预报精确度越高;故①正确;
对于②,用相关指数
来刻画回归效果,
越大说明拟合效果越好,故②不正确;
对于③,在回归直线方程
中,当变量
每增加1个单位时,变量
就增加2个单位是正确的;故③正确;
对于④,
说明变量

呈负相关,
接近于1说明变量

相关性很强,故④正确.
3.【答案】
D
【解析】
解:对于A,
越大,线性相关程度越强,即A不符合题意;
对于B,
越小,线性相关程度越弱,即B不符合题意;
对于C,
越大,线性相关程度越强,
越小,线性相关程度越弱,
即C不符合题意;
对于D,
,且
越接近
,线性相关程度越强,
越接近
,线性相关程度越弱,即D符合题意,
4.【答案】
C
【解析】
由题意得,根据表中的数据,
可知
,且

所以
,解得