2019备战高考数学全国真题精练(2016-2018)第10章 第4节 变量间的相关关系、统计案例

文档属性

名称 2019备战高考数学全国真题精练(2016-2018)第10章 第4节 变量间的相关关系、统计案例
格式 zip
文件大小 2.6MB
资源类型 试卷
版本资源 人教新课标A版
科目 数学
更新时间 2019-01-05 10:57:12

文档简介

2019年备战高考数学全国各地真题精练(2016-2018)
第10章 第4节 变量间的相关关系、统计案例(学生版)
备战基础·零风险
1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系.
2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.
4.了解回归分析的基本思想、方法及其简单应用.
两个变量的线性相关
(1)正相关
在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.
(2)负相关
在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.
(3)线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在 附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
回归方程
(1)最小二乘法
求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.
(2)回归方程
方程=x+是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中,是 .
回归分析
(1)定义
对具有相关关系的两个变量进行统计分析的一种常用方法.
(2)样本点的中心
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)中(,)称为样本点的中心.
(3)相关系数
当r>0时,表明两个变量 ;
当r<0时,表明两个变量 .
r的绝对值越接近于1,表明两个变量的线性相关性 .
r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于 时,认为两个变量有很强的线性相关性.
独立性检验
(1)分类变量:
变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
(2)列联表:
列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计



构造一个随机变量K2=,其中n=a+b+c+d为样本容量.
(3)独立性检验
利用随机变量 来判断“两个分类变量有关系”的方法称为独立性检验.
备战方法·巧解题
规律
方法
1.“相关关系与函数关系”的区别
函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.
2.三点提醒 一是回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.如(5).
二是根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.
三是独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解
3.在回归直线方程=x+中,代表x每增加一个单位,y平均增加的单位数,一般来说,当回归系数>0时,说明两个变量呈正相关关系;当回归系数<0时,说明两个变量呈负相关关系.
4. (1)正确理解计算,的公式和准确的计算是求线性回归方程的关键.
(2)回归直线方程 =x+必过样本点中心(,).
(3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.
5. 利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.独立性检验就是考察两个分类变量是否有关系,并能较为准确地给出这种判断的可信度,具体做法是根据公式K2=,计算随机变量的观测值k,k值越大,说明“两个变量有关系”的可能性越大.
小结
1.求回归方程,关键在于正确求出系数,,由于,的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.
2.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求线性回归方程.
3.根据K2的值可以判断两个分类变量有关的可信程度. 
备战练习·固基石
一、单选题
1.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是(? ?)
A.?男、女人患色盲的频率分别为0.038,0.006??????????
B.?男、女人患色盲的概率分别为 , C.?男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的??????????
D.?调查人数太少,不能说明色盲与性别有关
2.下列结论正确的是(  ) ①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
A.?①②????????????????????????????????B.?①②③????????????????????????????????C.?①②④????????????????????????????????D.?①②③④
3.实验测得四组 的值为 , , , ,则 与 之间的回归直线方程为(?? )
A.???????????????????????????B.??????????????C.???????????????????????????D.?
4.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1 , l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是 (?? )
A.?直线l1和l2有交点(s,t) B.?直线l1和l2相交,但是交点未必是点(s,t)
D.直线l1和l2必定重合 C.?直线l1和l2由于斜率相等,所以必定平行
5.下面是一个2×2列联表,则表中a、b的值分别为 (?? )
y1
y2
合计
x1
a
21
73
x2
2
25
27
合计
b
46
100
A.?94、96??????????????????????????????B.?52、50??????????????????????????????C.?52、54??????????????????????????????D.?54、52
6.已知变量x,y之间具有线性相关关系,其散点图如图所示,则其回归方程可能为(?? )
A.? =1.5x+2???????????????????????B.? =-1.5x+2???????????????????????C.? =1.5x-2???????????????????????D.? =-1.5x-2
7.在一次试验中,测得 的四组值分别是A(1,2),B(3,4),C(5,6)D(7,8),则y与x之间的回归直线方程为(?? )
A.?????????????????B.?????????????C.???????????????????????????D.?
8.下列有关线性回归的说法,不正确的是( ??)
A.?变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫作相关关系??????????B.?在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫作散点图 C.?回归方程最能代表观测值 之间的线性关系??????????D.?任何一组观测值都能得到具有代表意义的回归直线
9.假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:
x
1
2
3
4
5
y
5
6
7
8
10
由资料可知y对x呈线性相关关系,且线性回归方程为 ,请估计使用年限为20年时,维修费用约为(? )
A.?26.2??????????????????????????????????????B.?27??????????????????????????????????????C.?27.6??????????????????????????????????????D.?28.2
10.经市场调查,某旅游线路票销售量 (张)与旅游单价 (元/张)负相关,则其回归方程可能是(?? )
A.?????????????????????????????????????????B.? C.?????????????????????????????????????????D.?
11.下列说法: ①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选择的模型比较合适; ②用相关指数可以刻画回归的效果,值越大说明模型的拟和效果越好; ③比较两个模型的拟和效果,可以比较残差平方和的大小,残差平方和越小的模型拟和效果越好. 其中说法正确的个数为(  )
A.?0个???????????????????????????????????????B.?1个???????????????????????????????????????C.?2个???????????????????????????????????????D.?3个
12.某研究小组在一项实验中获得一组数据,将其整理得到如图所示的散点图,下列函数中,最能近似刻画y与t之间关系的是(?? )
A.?y=2t??????????????????????????????????B.?y=2t2??????????????????????????????????C.?y=t3??????????????????????????????????D.?y=log2t
13.根据如下样本数据得到的回归方程为 = x+ ,若 =4.5,则x每增加1个单位,y就(?? )
x
3
4
5
6
7
y
4
2.5
﹣0.5
0.5
﹣2
A.?增加0.9个单位???????????????B.?减少0.9个单位???????????????C.?增加0.72个单位???????????????D.?减少0.72个单位
14.某班主任对全班50名学生进行了作业量多少的调查,根据列联表数据计算得到K2=5.059,因为P(K2≥5.024)=0.025,则认为“喜欢玩电脑游戏与认为作业量的多少有关系”的把握大约为(?? )
A.?2.5%???????????????????????????????B.?95%???????????????????????????????C.?97.5%???????????????????????????????D.?不具有相关性
15.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁.为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表: 附表:
P(K2≥k)
0.10
0.05
0.025
k
2.706
3.841
5.024
参照附表,下列结论正确的是(  )
A.?在犯错误的概率不超5%过的前提下,认为“小动物是否被感染与有没有服用疫苗有关” B.?在犯错误的概率不超5%过的前提下,认为“小动物是否被感染与有没有服用疫苗无关” C.?有97.5%的把握认为“小动物是否被感染与有没有服用疫苗有关” D.?有97.5%的把握认为“小动物是否被感染与有没有服用疫苗无关”
16.假设有两个分类变量m和n其2×2列联表为:
n1
n2
总计
m1
a
b
a+b
m2
c
d
c+d
总计
a+c
b+d
a+b+c+d
对于同一样本来说,能说明m和n有关的可能性最大的一组数据为(  )
A.?a=8,b=7,c=6,d=5?????????????????????????????????????B.?a=8,b=6,c=7,d=5 C.?a=5,b=6,c=7,d=8?????????????????????????????????????D.?a=5,b=6,c=8,d=7
17.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为( ??)
A.?????B.?????????C.???????D.?
18.对于散点图下列说法中正确的是(  )
A.?通过散点图一定可以看出变量之间的变化规律 B.?通过散点图一定不可以看出变量之间的变化规律 C.?通过散点图可以看出正相关与负相关有明显区别 D.?通过散点图看不出正相关与负相关有什么区别
19.人的年龄x与人体脂肪含量的百分数y的回归方程为=0.577x-0.448,如果某人36岁,那么这个人的脂肪含量(  )
A.?一定20.3%????????B.?在20.3%附近的可能性比较大????????C.?无任何参考数据????????D.?以上解释都无道理
20.以下三个命题中: ①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样; ②老张身高176cm,他爷爷、父亲、儿子的身高分别是173cm、170cm和182cm,因儿子的身高与父亲的身高有关,用回归分析的方法得到的回归方程为 , 则预计老张的孙子的身高为180cm; ③设样本数据x1 , x2 , …,x10的均值和方差均为2,若yi=xi+m(m为非零实数,i=1,2,…,10)的均值和方差分别为22+m,2(  )
A.?0???????????????????????????????????????????B.?1???????????????????????????????????????????C.?2???????????????????????????????????????????D.?3
二、填空题
21.某热饮店6天卖的热茶杯数(y)与当天气温(x)之间是线性相关的,已知这6天气温平均12℃,回归方程为y=﹣2x+58,则这6天热饮店平均卖出热茶杯数为________
22.下列说法中正确的有________. ①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法
23.某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:
月平均气温x(℃)
17
13
8
2
月销售量y(件)
24
33
40
55
由表中数据算出线性回归方程 中的b≈﹣2.气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月毛衣的销售量约为________件. (参考公式:b= )
24.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
8
8.2
8.4
8.6
8.8
9
销量y(件)
90
84
83
80
75
68
由表中的数据得线性回归方程 =bx+ 中的b=﹣20,预测当产品价格定为9.5(元)时,销量为________件.
25.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:
专业 性别
非统计专业
统计专业
男生
13
10
女生
7
20
为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K2的观测值为 .因为k>3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________.
26.已知由样本数据点集合 ,求得的回归直线方程为 ?,且 。若去掉两个数据点 和 后重新求得的回归直线 的斜率估计值为 ,则此回归直线 的方程为________。
27.为考察高中生的性别与是否喜欢数学课程之间的关系,在我市某普通中学高中生中随机抽取200名学生,得到如下2×2列联表:
喜欢数学课
不喜欢数学课
合计

30
60
90

20
90
110
合计
50
150
200
经计算K2≈6.06,根据独立性检验的基本思想,约有________(填百分数)的把握认为“性别与喜欢数学课之间有关系”.
28.已知x,y取值如表:
x
0
1
4
5
6
8
y
1.3
1.8
5.6
6.1
7.4
9.3
从所得的散点图分析可知:y与x线性相关,且 =0.95x+a,则a=________.
三、解答题
29.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得 , , , . (Ⅰ)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a; (Ⅱ)判断变量x与y之间是正相关还是负相关; (Ⅲ)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程y=bx+a中, , ,其中 , 为样本平均值,线性回归方程也可写为 .
30.某成衣批发店为了对一款成衣进行合理定价,将该款成衣按事先拟定的价格进行试销,得到了如下数据:
批发单价x(元)
80
82
84
86
88
90
销售量y(件)
90
84
83
80
75
68
(1)求回归直线方程 ,其中
(2)预测批发单价定为85元时,销售量大概是多少件?
(3)假设在今后的销售中,销售量与批发单价仍然服从(1)中的关系,且该款成衣的成本价为40元/件,为使该成衣批发店在该款成衣上获得更大利润,该款成衣单价大约定为多少元?
31.为了解春季昼夜温差大小与某种子发芽多少之间的关系,现在从4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天100颗种子浸泡后的发芽数,得到如下资料:
日期
4月1日
4月7日
4月15日
4月21日
4月30日
温差x/℃
10
11
13
12
8
发芽数y/颗
23
25
30
26
16
(Ⅰ)从这5天中任选2天,记发芽的种子数分别为m,n,求事件“m,n均不小于25”的概率. (Ⅱ)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另3天的数据,求出y关于x的线性回归方程 = x+ . (参考公式: = , = ﹣ )
32.某地区2012年至2016年农村居民家庭人均纯收入y(单位:千元)的数据如表:
年份
2012
2013
2014
2015
2016
年份代号t
1
2
3
4
5
人均纯收入y
5
6
7
8
10
(1)求y关于t的线性回归方程;
(2)利用(1)中的回归方程,分析2012年至2016年该地区农村居民家庭人均纯收入的变化情况,并预测该地区农村居民家庭人均纯收入在哪一年约为10.8千元. 附:回归直线的斜率和截距的最小二乘估计公式分别为 = , = ﹣ .
33.某商店对新引进的商品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
定价 (元)
9
9.2
9.4
9.6
9.8
10
销量 (件)
100
94
93
90
85
78
(1)求回归直线方程 ;
(2)假设今后销售依然服从(Ⅰ)中的关系,且该商品金价为每件5元,为获得最大利润,商店应该如何定价?(利润=销售收入-成本) 参考公式: .
34.在一次联考后,某校对甲、乙两个理科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀,统计成绩后,得到如下的2×2列联表,且已知在甲、乙两个理科班全部110人中随机抽取1人,成绩为优秀的概率为 .
优秀
非优秀
合计
甲班
10
乙班
30
合计
110
参考公式和数据:
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
(1)请完成右面的列联表,根据列联表的数据,能否有99%的把握认为成绩与班级有关系?
(2)在甲、乙两个理科班优秀的学生中随机抽取两名学生,用ξ表示抽得甲班的学生人数,求ξ的分布列.
35.2015男篮亚锦赛决赛阶段,中国男篮以9连胜的不败战绩赢得第28届亚锦赛冠军,同时拿到亚洲唯一1张直通里约奥运会的入场券.赛后,中国男篮主力易建联荣膺本届亚锦赛MVP(最有价值球员),如表是易建联在这9场比赛中投篮的统计数据.
比分
易建联技术统计
投篮命中
罚球命中
全场得分
真实得分率
中国91﹣42新加坡
3/7
6/7
12
59.52%
中国76﹣73韩国
7/13
6/8
20
60.53%
中国84﹣67约旦
12/20
2/5
26
58.56%
中国75﹣62哈萨克期坦
5/7
5/5
15
81.52%
中国90﹣72黎巴嫩
7/11
5/5
19
71.97%
中国85﹣69卡塔尔
4/10
4/4
13
55.27%
中国104﹣58印度
8/12
5/5
21
73.94%
中国70﹣57伊朗
5/10
2/4
13
55.27%
中国78﹣67菲律宾
4/14
3/6
11
33.05%
注:①表中a/b表示出手b次命中a次; ②TS%(真实得分率)是衡量球员进攻的效率,其计算公式为: TS%= . (Ⅰ)从上述9场比赛中随机选择一场,求易建联在该场比赛中TS%超过50%的概率; (Ⅱ)从上述9场比赛中随机选择两场,求易建联在这两场比赛中TS%至少有一场超过60%的概率; (Ⅲ)用x来表示易建联某场的得分,用y来表示中国队该场的总分,画出散点图如图所示,请根据散点图判断y与x之间是否具有线性相关关系?结合实际简单说明理由.
36.山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg).
施化肥量x
15
20
25
30
35
40
45
棉花产量y
330
345
365
405
445
450
455
(1)画出散点图; (2)判断是否具有相关关系.
备战真题·勇闯天涯
一、单选题
1.(2017?山东)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为 = x+ ,已知 xi=225, yi=1600, =4,该班某学生的脚长为24,据此估计其身高为(  )
A.?160??????????????????????????????????????B.?163??????????????????????????????????????C.?166??????????????????????????????????????D.?170
二、填空题
2.某班主任对全班50名学生作了一次调查,所得数据如表:
认为作业多
认为作业不多
总计
喜欢玩电脑游戏
18
9
27
不喜欢玩电脑游戏
8
15
23
总计
26
24
50
由表中数据计算得到K2的观测值k≈5.059,于是________(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.
三、解答题
3.(2018?卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额 (单位:亿元)的折线图。 为了预测该地区2018年的环境基础设施投资额,建立了 与时间变量t的两个线性回归模型,根据2000年至2016年的数据(时间变量 的值依次为1,2,…,17)建立模型①:=-30.4+13.5t .根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由。
4.(2018?卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项项目生产任务的两种新的生产方式,为比较两种生产方式的效率,选取40名工人,将他们随即分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式,根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
超过m
不超过m
第一种生产方式
第二种生产方式
(3)根据2中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附: ,
5.(2018?卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成项目生产任务的两种新的生产方式,为比较两种生产方式的效率,选取40名工人,将他们随即分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式,根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
超过m
不超过m
第一种生产方式
第二种生产方式
(3)根据2中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附: ,
6.(2017?新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下: (Ⅰ)记A表示时间“旧养殖法的箱产量低于50kg”,估计A的概率; (Ⅱ)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50kg
箱产量≥50kg
旧养殖法
新养殖法
(Ⅲ)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较. 附:
P(K2≥K)
0.050
0.010
0.001
K
3.841
6.635
10.828
K2= .
7.(2017?新课标Ⅰ卷)为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:(12分)
抽取次序
1
2
3
4
5
6
7
8
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得 = xi=9.97,s= = =0.212, ≈18.439, (xi﹣ )(i﹣8.5)=﹣2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
(1)求(xi , i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在( ﹣3s, +3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查? (ⅱ)在( ﹣3s, +3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01) 附:样本(xi , yi)(i=1,2,…,n)的相关系数r= , ≈0.09.
8.(2016?全国)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图. 注:年份代码1﹣7分别对应年份2008﹣2014.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以证明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据: =9.32, =40.17, =0.55, ≈2.646. 参考公式: , 回归方程 中斜率和截距的最小二乘估计公式分别为: , .
2019年备战高考数学全国各地真题精练(2016-2018)
第10章 第4节 变量间的相关关系、统计案例(教师版)
备战基础·零风险
1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系.
2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.
4.了解回归分析的基本思想、方法及其简单应用.
两个变量的线性相关
(1)正相关
在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.
(2)负相关
在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.
(3)线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
回归方程
(1)最小二乘法
求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.
(2)回归方程
方程=x+是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中,是待定参数.
回归分析
(1)定义
对具有相关关系的两个变量进行统计分析的一种常用方法.
(2)样本点的中心
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)中(,)称为样本点的中心.
(3)相关系数
当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强.
r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.
独立性检验
(1)分类变量:
变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
(2)列联表:
列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
构造一个随机变量K2=,其中n=a+b+c+d为样本容量.
(3)独立性检验
利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.
备战方法·巧解题
规律
方法
1.“相关关系与函数关系”的区别
函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.
2.三点提醒 一是回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.如(5).
二是根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.
三是独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解
3.在回归直线方程=x+中,代表x每增加一个单位,y平均增加的单位数,一般来说,当回归系数>0时,说明两个变量呈正相关关系;当回归系数<0时,说明两个变量呈负相关关系.
4. (1)正确理解计算,的公式和准确的计算是求线性回归方程的关键.
(2)回归直线方程 =x+必过样本点中心(,).
(3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.
5. 利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.独立性检验就是考察两个分类变量是否有关系,并能较为准确地给出这种判断的可信度,具体做法是根据公式K2=,计算随机变量的观测值k,k值越大,说明“两个变量有关系”的可能性越大.
小结
1.求回归方程,关键在于正确求出系数,,由于,的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.
2.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求线性回归方程.
3.根据K2的值可以判断两个分类变量有关的可信程度. 
备战练习·固基石
一、单选题
1.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是(? ?)
A.?男、女人患色盲的频率分别为0.038,0.006??????????
B.?男、女人患色盲的概率分别为 , C.?男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的??????????
D.?调查人数太少,不能说明色盲与性别有关
【答案】C
【考点】独立性检验的应用
【解析】【解答】男人中患色盲的比例为 ,要比女人中患色盲的比例 大, 其差值为 ,差值较大,所以认为患色盲与性别是有关的. 故答案为:C. 【分析】越大,越有利于结论“X和Y有关系”,它越小,越有利于结论“X和Y没有关系”.
2.下列结论正确的是(  ) ①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
A.?①②????????????????????????????????B.?①②③????????????????????????????????C.?①②④????????????????????????????????D.?①②③④
【答案】C
【考点】变量间的相关关系
【解析】【分析】①函数关系是一种确定性关系,这是一个正确的结论. ②相关关系是一种非确定性关系,是一个正确的结论. ③回归分析是对具有相关关系的两个变量进行统计分析的一种方法,所以③不对. 与③对比,依据定义知④是正确的, 故答案为C。
3.实验测得四组 的值为 , , , ,则 与 之间的回归直线方程为(?? )
A.???????????????????????????B.??????????????C.???????????????????????????D.?
【答案】D
【考点】线性回归方程
【解析】【解答】解: ? ∴这组数据的样本中心点是 ? 把样本中心点代入四个选项中,只有 成立, 故答案为:D . 【分析】因为线性回归方程必过(,),所以可以求出x和y的平均数代入选项看是否成立即可得出答案。
4.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1 , l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是 (?? )
A.?直线l1和l2有交点(s,t) B.?直线l1和l2相交,但是交点未必是点(s,t)
D.直线l1和l2必定重合
C.?直线l1和l2由于斜率相等,所以必定平行
【答案】A
【考点】回归分析
【解析】【解答】回归直线方程必过样本点的中心( , )即点(s,t),所以直线l1和l2有交点(s,t)
故答案为:A
【分析】根据题意可得两组数据的样本中心点为(s,t),回归直线经过样本的中心点,故有两条直线交点为(s,t)。
5.下面是一个2×2列联表,则表中a、b的值分别为 (?? )
y1
y2
合计
x1
a
21
73
x2
2
25
27
合计
b
46
100
A.?94、96??????????????????????????????B.?52、50??????????????????????????????C.?52、54??????????????????????????????D.?54、52
【答案】C
【考点】独立性检验
【解析】【解答】由a+21=73,得a=52,由b+46=100,得b=54. 故答案为:C.【分析】题目中的表格称为列联表,是两个分类变量的频数表.
6.已知变量x,y之间具有线性相关关系,其散点图如图所示,则其回归方程可能为(?? )
A.? =1.5x+2???????????????????????B.? =-1.5x+2???????????????????????C.? =1.5x-2???????????????????????D.? =-1.5x-2
【答案】B
【考点】线性回归方程
【解析】【解答】设回归方程为 ,由散点图可知变量x、y之间负相关,回归直线在y轴上的截距为正数,所以 <0, >0,因此方程可能为 =-1.5x+2. 故答案为:B. 【分析】结合线性回归方程参数意义,即可得出答案。
7.在一次试验中,测得 的四组值分别是A(1,2),B(3,4),C(5,6)D(7,8),则y与x之间的回归直线方程为(?? )
A.???????????????????B.?????????????????C.???????????????????????????D.?
【答案】A
【考点】散点图,最小二乘法,线性回归方程
【解析】【解答】解:∵ , ? ∴这组数据的样本中心点是(4,5) 把样本中心点代入四个选项中,只有y=x+1成立, 故答案为:A. 【分析】此题考查的是结合散点图中的四个散点A、B、C、D的坐标,利用公式和求出它们的中心点坐标,再将中心点坐标代入选项中的线性回归直线方程中去检验是否成立,若成立则是所求回归直线方程,从而选出答案。
8.下列有关线性回归的说法,不正确的是( ??)
A.?变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫作相关关系??????????B.?在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫作散点图 C.?回归方程最能代表观测值 之间的线性关系??????????D.?任何一组观测值都能得到具有代表意义的回归直线
【答案】D
【考点】变量间的相关关系,散点图,线性回归方程
【解析】【解答】A:由相关变量的意义,正确; B:由散点图的定义,正确; C:由线性回归方程的定义,正确; D:只有具有线性相关的两个观测值才能得到具体代表意义的回归直线方程,则D错误, 故答案为:D。 【分析】结合相关关系,散点图和线性回归方程的意义,即可得出答案。
9.假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:
x
1
2
3
4
5
y
5
6
7
8
10
由资料可知y对x呈线性相关关系,且线性回归方程为 ,请估计使用年限为20年时,维修费用约为(? )
A.?26.2??????????????????????????????????????B.?27??????????????????????????????????????C.?27.6??????????????????????????????????????D.?28.2
【答案】C
【考点】线性回归方程
【解析】【解答】解:∵由表格可知 =3, =7.2, ∴这组数据的样本中心点是(3,7.2), 根据样本中心点在线性回归直线上, ∴7.2=a+1.2×3, ∴a=3.6, ∴这组数据对应的线性回归方程是y=1.2x+3.6, ∵x=20, ∴y=1.2×20+3.6=27.6. 故选:C. 【分析】根据所给的数据求出这组数据的横标和纵标的平均数,即这组数据的样本中心点,根据样本中心点在线性回归直线上,把样本中心点代入求出a的值,写出线性回归方程,代入x的值,预报出结果.
10.经市场调查,某旅游线路票销售量 (张)与旅游单价 (元/张)负相关,则其回归方程可能是(?? )
A.?????????????????????????????????????????B.? C.?????????????????????????????????????????D.?
【答案】A
【考点】变量间的相关关系,回归分析
【解析】【解答】 销售量 (张)与旅游单价 负相关,选项 的相关系数为正数, 不正确,可排除选项 ; 当 时, ,不符合现实, 不正确,可排除选项 , 故答案为:A. 【分析】根据某旅游线路票销售量 y (张)与旅游单价 x (元/张)负相关,故回归系数应为负,再结合实际进行分析,即可得到答案.
11.下列说法: ①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选择的模型比较合适; ②用相关指数可以刻画回归的效果,值越大说明模型的拟和效果越好; ③比较两个模型的拟和效果,可以比较残差平方和的大小,残差平方和越小的模型拟和效果越好. 其中说法正确的个数为(  )
A.?0个???????????????????????????????????????B.?1个???????????????????????????????????????C.?2个???????????????????????????????????????D.?3个
【答案】C
【考点】回归分析
【解析】【解答】一般不能用残差图判断模型的拟合效果,故①不正确, 用系数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好,故②正确, 可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故③正确 综上可知有2个命题正确, 故选C. 【分析】据可以用来衡量模拟效果好坏的几个量分别是相关指数,残差平方和和相关系数,只有残差平方和越小越好,其他的都是越大越好。
12.某研究小组在一项实验中获得一组数据,将其整理得到如图所示的散点图,下列函数中,最能近似刻画y与t之间关系的是(?? )
A.?y=2t??????????????????????????????????B.?y=2t2??????????????????????????????????C.?y=t3??????????????????????????????????D.?y=log2t
【答案】D
【考点】散点图
【解析】【解答】解:根据所给的散点图,观察出图象在第一象限, 单调递增,并且增长比较缓慢,一般用对数函数来模拟, 在选项中只有一个底数是2的对数函数, 故选D. 【分析】根据所给的散点图,观察出图象在第一象限,图象单调递增,并且增长比较缓慢,一般用对数函数来模拟,在选项中只有一个底数是2的对数函数,得到结果.
13.根据如下样本数据得到的回归方程为 = x+ ,若 =4.5,则x每增加1个单位,y就(?? )
x
3
4
5
6
7
y
4
2.5
﹣0.5
0.5
﹣2
A.?增加0.9个单位???????????????B.?减少0.9个单位????????C.?增加0.72个单位???????????????D.?减少0.72个单位
【答案】D
【考点】线性回归方程
【解析】【解答】解:根据题意,计算 = ×(3+4+5+6+7)=5, = ×(4+2.5﹣0.5+0.5﹣2)=0.9; 回归方程 且 ,过样本中心点(5,0.9), ∴0.9=5 +4.5, 解得 =﹣0.72, 即 =﹣0.72x+4.5, ∴x每增加1个单位,y就减少0.72个单位. 故选:D. 【分析】根据题意计算 、 ,利用回归方程过样本中心点求出回归系数 ,即可得出x每增加1个单位y的变化量.
14.某班主任对全班50名学生进行了作业量多少的调查,根据列联表数据计算得到K2=5.059,因为P(K2≥5.024)=0.025,则认为“喜欢玩电脑游戏与认为作业量的多少有关系”的把握大约为(?? )
A.?2.5%???????????????????????????????B.?95%???????????????????????????????C.?97.5%???????????????????????????????D.?不具有相关性
【答案】C
【考点】独立性检验的应用
【解析】【解答】解:∵根据列联表数据计算得到K2=5.059,P(K2≥5.024)=0.025, ∴认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为1﹣0.025=97.5% 故选C. 【分析】根据条件中所给的计算出的观测值的数据,把观测值同临界值进行比较,得到认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为1﹣0.025=97.5%.
15.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁.为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表: 附表:
P(K2≥k)
0.10
0.05
0.025
k
2.706
3.841
5.024
参照附表,下列结论正确的是(  )
A.?在犯错误的概率不超5%过的前提下,认为“小动物是否被感染与有没有服用疫苗有关” B.?在犯错误的概率不超5%过的前提下,认为“小动物是否被感染与有没有服用疫苗无关” C.?有97.5%的把握认为“小动物是否被感染与有没有服用疫苗有关” D.?有97.5%的把握认为“小动物是否被感染与有没有服用疫苗无关”
【答案】A
【考点】独立性检验的应用
【解析】【解答】解:由题意算得,k2=4.762>3.841,参照附表,可得 在犯错误的概率不超过5%的前提下,认为“小动物是否被感染与有没有服用疫苗有关”. 故选:A. 【分析】题目的条件中已经给出这组数据的观测值,我们只要把所给的观测值同节选的观测值表进行比较,发现它大于3.841,在犯错误的概率不超过5%的前提下,认为“小动物是否被感染与有没有服用疫苗有关”.
16.假设有两个分类变量m和n其2×2列联表为:
n1
n2
总计
m1
a
b
a+b
m2
c
d
c+d
总计
a+c
b+d
a+b+c+d
对于同一样本来说,能说明m和n有关的可能性最大的一组数据为(  )
A.?a=8,b=7,c=6,d=5?????????????????????????????????????B.?a=8,b=6,c=7,d=5 C.?a=5,b=6,c=7,d=8?????????????????????????????????????D.?a=5,b=6,c=8,d=7
【答案】D
【考点】两个变量的线性相关
【解析】【解答】根据观测值求解的公式可以知道, 当ad与bc差距越大,两个变量有关的可能性就越大, 检验四个选项中所给的ad与bc的差距,前三个选项都一样, 只有第四个选项差距大, 故选D. 【分析】当ad与bc差距越大,两个变量有关的可能性就越大,检验四个选项中所给的ad与bc的差距,前三个选项都一样,只有第四个选项差距大,得到结果。
17.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为( ??)
A.???????B.?????C.??????????????D.?
【答案】C
【考点】线性回归方程
【解析】【解答】解:由线性回归的斜率的估计值为 ,可排除 ,
由线性回归直线方程样本点的中心为 ,
将 分别代入 ,其值依次为 ,排除 ,
故答案为:C.
【分析】由线性回归直线过样本点的中心,及已知回归直线的斜率的估计值可得选项.
18.对于散点图下列说法中正确的是(  )
A.?通过散点图一定可以看出变量之间的变化规律 B.?通过散点图一定不可以看出变量之间的变化规律 C.?通过散点图可以看出正相关与负相关有明显区别 D.?通过散点图看不出正相关与负相关有什么区别
【答案】C
【考点】散点图
【解析】【解答】给出一组样本数据,总可以作出相应的散点图, 但不一定能分析出两个变量的关系,不一定存在回归直线来模拟这组数据, 但是通过散点图可以看出正相关与负相关有明显区别.故C正确. 故选C. 【分析】给出一组样本数据,总可以作出相应的几对有序数对,做出对应的散点图,但不一定能分析出两个变量的关系,不一定存在回归直线来模拟这组数据。
19.人的年龄x与人体脂肪含量的百分数y的回归方程为=0.577x-0.448,如果某人36岁,那么这个人的脂肪含量(  )
A.?一定20.3%????????B.?在20.3%附近的可能性比较大????????C.?无任何参考数据????????D.?以上解释都无道理
【答案】B
【考点】回归分析
【解析】【解答】将x=36代入回归方程=0.577x-0.448 计算知=20.324, 根据回归分析的意义得: 预报值仅仅是一个估计值,而不是精确值, 故选B. 【分析】由已知中人的年龄x与人体脂肪含量的百分数y的回归方程为=0.577x-0.448,将年龄x=36代入回归直线方程,即可得到y的估计值,然后根据回归分析的意义,我们不难得到结论.
20.以下三个命题中: ①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样; ②老张身高176cm,他爷爷、父亲、儿子的身高分别是173cm、170cm和182cm,因儿子的身高与父亲的身高有关,用回归分析的方法得到的回归方程为 , 则预计老张的孙子的身高为180cm; ③设样本数据x1 , x2 , …,x10的均值和方差均为2,若yi=xi+m(m为非零实数,i=1,2,…,10)的均值和方差分别为22+m,2(  )
A.?0???????????????????????????????????????????B.?1???????????????????????????????????????????C.?2???????????????????????????????????????????D.?3
【答案】A
【考点】回归分析的初步应用
【解析】【解答】解:①由抽样方法的定义可知为系统抽样,故①错; , a=3,∴得线性回归方程y=x+3,当x=182时,y=185,故②不正确; ③设样本数据x1 , x2 , …,x10的均值和方差均为2,若yi=xi+m(m为非零实数,i=1,2,…,10)的均值和方差分别为2+m,2,故不正确, 故选:A. 【分析】①根据抽样方法的定义和特点即可判断;②求出线性回归方程,可得结论;③利用均值和方差的公式即可判断出正误.
二、填空题
21.某热饮店6天卖的热茶杯数(y)与当天气温(x)之间是线性相关的,已知这6天气温平均12℃,回归方程为y=﹣2x+58,则这6天热饮店平均卖出热茶杯数为________
【答案】34
【考点】回归分析的初步应用
【解析】【解答】由题意,=12, ∵回归方程为y=﹣2x+58, ∴=34. 故答案为:34. 【分析】由题意,=12,利用回归方程为y=﹣2x+58,可得这6天热饮店平均卖出热茶杯数。
22.下列说法中正确的有________. ①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法
【答案】①②④
【考点】回归分析
【解析】【解答】本题考查函数关系、相关关系及回归分析的概念.根据函数关系及相关关系的定义,①函数关系是一种确定性关系,②相关关系是一种非确定性关系,①②均正确;由回归分析的定义及应用可知,④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.故答案为①②④ 【分析】本题主要考查了回归分析,解决问题的关键是根据回归分析的原理分析即可
23.某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:
月平均气温x(℃)
17
13
8
2
月销售量y(件)
24
33
40
55
由表中数据算出线性回归方程 中的b≈﹣2.气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月毛衣的销售量约为________件. (参考公式:b= )
【答案】46
【考点】线性回归方程
【解析】【解答】解:由表格得( , )为:(10,38), 又( , )在回归方程y=bx+a中的b=﹣2, ∴38=10×(﹣2)+a, 解得:a=58, ∴y=﹣2x+58, 当x=6时,y=﹣2×6+58=46. 故答案为:46. 【分析】根据所给的表格做出本组数据的样本中心点,根据样本中心点在线性回归直线上,利用待定系数法做出a的值,可得线性回归方程,根据所给的x的值,代入线性回归方程,预报要销售的件数.
24.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
8
8.2
8.4
8.6
8.8
9
销量y(件)
90
84
83
80
75
68
由表中的数据得线性回归方程 =bx+ 中的b=﹣20,预测当产品价格定为9.5(元)时,销量为________件.
【答案】60
【考点】线性回归方程
【解析】【解答】解:由题意: = =8.5; = =80. ∵ =﹣20. ∴ =80+20×8.5=250, 从而得到回归直线方程为:y=﹣20x+250. 当x=9.5时,可得y=60. 故答案为:60. 【分析】由题意求出 , ,利用公式求出 ,即可得出线性回归方程,当x=9.5时,可得结论.
25.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:
专业 性别
非统计专业
统计专业
男生
13
10
女生
7
20
为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K2的观测值为 .因为k>3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________.
【答案】5%
【考点】独立性检验,独立性检验的基本思想
【解析】【解答】因为随机变量K2的观测值k>3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%.【分析】由题意知根据表中所给的数据得到观测值是4.844,从临界值表中可以知道4.844>3.841,根据临界值表中所给的概率得到与本题所得的数据对应的概率是0.05,得到结论.
26.已知由样本数据点集合 ,求得的回归直线方程为 ?,且 。若去掉两个数据点 和 后重新求得的回归直线 的斜率估计值为 ,则此回归直线 的方程为________。
【答案】
【考点】回归分析的初步应用
【解析】【解答】因为 ,所以 因为去掉两个数据点 和 ,而 ,所以新回归直线 过 ,因此 【分析】由题意,可知新回归直线 l 过 ( 4 , 5 ) ,代入回归直线的方程,求得a的值,即可得到答案。
27.为考察高中生的性别与是否喜欢数学课程之间的关系,在我市某普通中学高中生中随机抽取200名学生,得到如下2×2列联表:
喜欢数学课
不喜欢数学课
合计

30
60
90

20
90
110
合计
50
150
200
经计算K2≈6.06,根据独立性检验的基本思想,约有________(填百分数)的把握认为“性别与喜欢数学课之间有关系”.
【答案】97.5%
【考点】独立性检验的基本思想
【解析】【解答】因为K2≈6.06>5.024,对照表格:
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
所以有97.5%的把握认为“性别与喜欢数学课之间有关系”. 【分析】本题主要考查了独立性检验的基本思想,解决问题的关键是根据所给变量关系结合独立性检验的基本思想分析计算即可
28.已知x,y取值如表:
x
0
1
4
5
6
8
y
1.3
1.8
5.6
6.1
7.4
9.3
从所得的散点图分析可知:y与x线性相关,且 =0.95x+a,则a=________.
【答案】1.45
【考点】线性回归方程
【解析】【解答】解:由题意, = (0+1+4+5+6+8)=4, = (1.3+1.8+5.6+6.1+7.4+9.3)=5.25 ∵y与x线性相关,且 =0.95x+a, ∴5.25=0.95×4+a, ∴a=1.45 故答案为1.45. 【分析】计算平均数,可得样本中心点,代入线性回归方程,即可求得a的值.
三、解答题
29.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得 , , , . (Ⅰ)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a; (Ⅱ)判断变量x与y之间是正相关还是负相关; (Ⅲ)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程y=bx+a中, , ,其中 , 为样本平均值,线性回归方程也可写为 .
【答案】解:(Ⅰ)由题意可知n=10, = = =8, = = =2,故lxx= =720﹣10×82=80,lxy= =184﹣10×8×2=24, 故可得b= ═ =0.3,a= =2﹣0.3×8=﹣0.4, 故所求的回归方程为:y=0.3x﹣0.4; (Ⅱ)由(Ⅰ)可知b=0.3>0,即变量y随x的增加而增加,故x与y之间是正相关; (Ⅲ)把x=7代入回归方程可预测该家庭的月储蓄为y=0.3×7﹣0.4=1.7(千元)
【考点】线性回归方程
【解析】【分析】(Ⅰ)由题意可知n, , ,进而可得 , ,代入可得b值,进而可得a值,可得方程;(Ⅱ)由回归方程x的系数b的正负可判;(Ⅲ)把x=7代入回归方程求其函数值即可.
30.某成衣批发店为了对一款成衣进行合理定价,将该款成衣按事先拟定的价格进行试销,得到了如下数据:
批发单价x(元)
80
82
84
86
88
90
销售量y(件)
90
84
83
80
75
68
(1)求回归直线方程 ,其中
(2)预测批发单价定为85元时,销售量大概是多少件?
(3)假设在今后的销售中,销售量与批发单价仍然服从(1)中的关系,且该款成衣的成本价为40元/件,为使该成衣批发店在该款成衣上获得更大利润,该款成衣单价大约定为多少元?
【答案】(1)解: =85, =80, ∵回归直线方程 ,其中 , ∴a=250, ∴y=﹣2x+250 (2)解:x=85时,y=﹣170+250=80,即销售量大概是80件 (3)解:设该款成衣单价大约定为x元,则利润L=(x﹣40)(﹣2x+250)= , ∴x=82.5元,该成衣批发店在该款成衣上获得更大利润
【考点】线性回归方程
【解析】【分析】(1)求出样本中心点,即可求出回归直线方程;(2)x=85时,y=﹣170+250=80,即可得到销售量;(3)设该款成衣单价大约定为x元,则利润L=(x﹣40)(﹣2x+250)= ,即可得出结论.
31.为了解春季昼夜温差大小与某种子发芽多少之间的关系,现在从4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天100颗种子浸泡后的发芽数,得到如下资料:
日期
4月1日
4月7日
4月15日
4月21日
4月30日
温差x/℃
10
11
13
12
8
发芽数y/颗
23
25
30
26
16
(Ⅰ)从这5天中任选2天,记发芽的种子数分别为m,n,求事件“m,n均不小于25”的概率. (Ⅱ)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另3天的数据,求出y关于x的线性回归方程 = x+ . (参考公式: = , = ﹣ )
【答案】解:(Ⅰ)用数组(m,n)表示选出2天的发芽情况, m,n的所有取值情况有: (23,25),(23,30),(23,26),(23,16),(25,30), (25,26),(25,16),(30,26),(30,16),(30,26),共有10个 设“m,n均不小于25”为事件A, 则包含的基本事件有(25,30),(25,26),(30,26) 所以P(A)= , 故m,n均不小于25的概率为 ; (Ⅱ)由数据得 =12, =27,3 ? =972, xiyi=977, xi2=434,3 2=432. 由公式,得 = = , =27﹣ ×12=﹣3. 所以y关于x的线性回归方程为 = x﹣3
【考点】线性回归方程
【解析】【分析】(Ⅰ)用数组(m,n)表示选出2天的发芽情况,用列举法可得m,n的所有取值情况,分析可得m,n均不小于25的情况数目,由古典概型公式,计算可得答案;(Ⅱ)根据所给的数据,先做出x,y的平均数,即做出本组数据的样本中心点,根据最小二乘法求出线性回归方程的系数,写出线性回归方程.
32.某地区2012年至2016年农村居民家庭人均纯收入y(单位:千元)的数据如表:
年份
2012
2013
2014
2015
2016
年份代号t
1
2
3
4
5
人均纯收入y
5
6
7
8
10
(1)求y关于t的线性回归方程;
(2)利用(1)中的回归方程,分析2012年至2016年该地区农村居民家庭人均纯收入的变化情况,并预测该地区农村居民家庭人均纯收入在哪一年约为10.8千元. 附:回归直线的斜率和截距的最小二乘估计公式分别为 = , = ﹣ .
【答案】(1)解:由所给数据计算得 = ×(1+2+3+4+5)=3, = ×(5+6+7+8+10)=7.2, =4+1+0+1+4=10, =(﹣2)×(﹣2.2)+(﹣1)×(﹣1.2)+0×(﹣0.2)+1×0.8+2×2.8=12, = = =1.2, =7.2﹣1.2×3=3.6, 所求回归方程为y=1.2t+3.6. (2)解:由(1)知, =1.2>0,故2012年至2016年该地区农村居民家庭人均纯收入逐年增加,平均每年增加1.2千元. 令1.2t+3.6=10.8,解得t=6 故预测该地区2017年农村居民家庭人均纯收入约为10.8千元.
【考点】线性回归方程
【解析】【分析】(1)根据数据求出样本平均数以及对应的系数即可求y关于t的线性回归方程;(2)根据条件进行估计预测即可得到结论.
33.某商店对新引进的商品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
定价 (元)
9
9.2
9.4
9.6
9.8
10
销量 (件)
100
94
93
90
85
78
(1)求回归直线方程 ;
(2)假设今后销售依然服从(Ⅰ)中的关系,且该商品金价为每件5元,为获得最大利润,商店应该如何定价?(利润=销售收入-成本) 参考公式: .
【答案】(1)解: , , , (2)解:设商店的获利为 元,则 , 当且仅当 时, 取得最大值405,即商店应定为9.5元
【考点】线性回归方程,回归分析的初步应用
【解析】【分析】(1)根据表中数据计算,即可求出线性回归方程;
(2)设商店获得的利润为L元,利用利润=销售收入-成本建立函数,利用配方法可求商店获得利润最大时产品的定价.
34.在一次联考后,某校对甲、乙两个理科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀,统计成绩后,得到如下的2×2列联表,且已知在甲、乙两个理科班全部110人中随机抽取1人,成绩为优秀的概率为 .
优秀
非优秀
合计
甲班
10
乙班
30
合计
110
参考公式和数据:
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
(1)请完成右面的列联表,根据列联表的数据,能否有99%的把握认为成绩与班级有关系?
(2)在甲、乙两个理科班优秀的学生中随机抽取两名学生,用ξ表示抽得甲班的学生人数,求ξ的分布列.
【答案】(1)解:如表格所示,
?优秀
?非优秀
?合计
?甲班
?10
?50
?60
?乙班
?20
?30
?50
?合计
?30
?80
?110
由于从甲、乙两个理科班全部110人中随机抽取人为优秀的概率为 , ∴两个班优秀的人数为110× =30, ∴乙班优秀的人数=30﹣10=20,甲班非优秀的人数=110﹣(10+20+30)=50; 即可完成表格; 假设成绩与班级无关,根据列联表中的数据可得: K2= ≈7.487. ∴K2>6.635,因此有99%的把握知假设不成立,成绩与班级有关 (2)解:由(1)知:甲、乙两个理科班优秀的人数分别为10,20; ξ的可能取值为0,1,2,且ξ服从超几何分布; ∴P(ξ=0)= = , P(ξ=1)= = , P(ξ=2)= = . ∴ξ的分布列为:

?0
?1
?2
?P
【考点】独立性检验
【解析】【分析】(1)计算两个班的优秀人数,填写2×2列联表,根据列联表中的数据计算K2 , 对照临界值表即可得出结论;(3)由(1)知甲、乙两个理科班优秀的人数,得出ξ的可能取值,且ξ服从超几何分布,写出频率分布即可.
35.2015男篮亚锦赛决赛阶段,中国男篮以9连胜的不败战绩赢得第28届亚锦赛冠军,同时拿到亚洲唯一1张直通里约奥运会的入场券.赛后,中国男篮主力易建联荣膺本届亚锦赛MVP(最有价值球员),如表是易建联在这9场比赛中投篮的统计数据.
比分
易建联技术统计
投篮命中
罚球命中
全场得分
真实得分率
中国91﹣42新加坡
3/7
6/7
12
59.52%
中国76﹣73韩国
7/13
6/8
20
60.53%
中国84﹣67约旦
12/20
2/5
26
58.56%
中国75﹣62哈萨克期坦
5/7
5/5
15
81.52%
中国90﹣72黎巴嫩
7/11
5/5
19
71.97%
中国85﹣69卡塔尔
4/10
4/4
13
55.27%
中国104﹣58印度
8/12
5/5
21
73.94%
中国70﹣57伊朗
5/10
2/4
13
55.27%
中国78﹣67菲律宾
4/14
3/6
11
33.05%
注:①表中a/b表示出手b次命中a次; ②TS%(真实得分率)是衡量球员进攻的效率,其计算公式为: TS%= . (Ⅰ)从上述9场比赛中随机选择一场,求易建联在该场比赛中TS%超过50%的概率; (Ⅱ)从上述9场比赛中随机选择两场,求易建联在这两场比赛中TS%至少有一场超过60%的概率; (Ⅲ)用x来表示易建联某场的得分,用y来表示中国队该场的总分,画出散点图如图所示,请根据散点图判断y与x之间是否具有线性相关关系?结合实际简单说明理由.
【答案】解:(Ⅰ)设易建联在比赛中TS%超过50%为事件A, 则共有8场比赛中TS%超过50%, 故P(A)= . (Ⅱ)设易建联在这两场比赛中TS%至少有一场超过60%为事件B, 则易建联在这两场比赛中TS%至少有一场均不超过60%为事件 , 由题意可得易建联在比赛中TS%不超过60%的有5场, 故P( )= = , 故P(B)=1﹣P( )= . (Ⅲ)不具有线性相关关系. 因为散点图并不是分布在某一条直线的周围. 篮球是集体运动,个人无法完全主宰一场比赛
【考点】回归分析,可线性化的回归分析
【解析】【分析】(Ⅰ)由已知,结合古典概型概率计算公式可得:易建联在该场比赛中TS%超过50%的概率;(Ⅱ)由已知,结合古典概型概率计算公式可得:易建联在这两场比赛中TS%至少有一场超过60%的概率;(Ⅲ)根据散点图并不是分布在某一条直线的周围,可得结论.
36.山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg).
施化肥量x
15
20
25
30
35
40
45
棉花产量y
330
345
365
405
445
450
455
(1)画出散点图; (2)判断是否具有相关关系.
【答案】解:(1)根据已知表格中的数据可得施化肥量x和产量y的散点图如下所示: (2)根据(1)中散点图可知, 各组数据对应点大致分布在一个条形区域内(一条直线附近) 故施化肥量x和产量y具有线性相关关系.
【考点】散点图
【解析】【分析】(1)根据已知中表中7块并排、形状大小相同的试验田上,施化肥量x和产量y所得的数据,描点后可得散点图; ???????????? (2)根据(1)中散点图中的点大致分布在一个条形区域内(一条直线附近)可得两个变量具有相关关系.
备战真题·勇闯天涯
一、单选题
1.(2017?山东)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为 = x+ ,已知 xi=225, yi=1600, =4,该班某学生的脚长为24,据此估计其身高为(  )
A.?160??????????????????????????????????????B.?163??????????????????????????????????????C.?166??????????????????????????????????????D.?170
【答案】C
【考点】线性回归方程
【解析】【解答】解:由线性回归方程为 =4x+ , 则 = xi=22.5, = yi=160, 则数据的样本中心点(22.5,160), 由回归直线经过样本中心点,则 = ﹣4x=160﹣4×22.5=70, ∴回归直线方程为 =4x+70, 当x=24时, =4×24+70=166, 则估计其身高为166, 故选C. 【分析】由数据求得样本中心点,由回归直线方程必过样本中心点,代入即可求得 ,将x=24代入回归直线方程即可估计其身高.
二、填空题
2.某班主任对全班50名学生作了一次调查,所得数据如表:
认为作业多
认为作业不多
总计
喜欢玩电脑游戏
18
9
27
不喜欢玩电脑游戏
8
15
23
总计
26
24
50
由表中数据计算得到K2的观测值k≈5.059,于是________(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.
【答案】不能
【考点】独立性检验,独立性检验的基本思想
【解析】【解答】查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k0=6.635.本题中,k≈5.059<6.635,所以不能在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.【分析】这是一个独立性检验应用题,处理本题时要根据列联表,及K2的计算公式,计算出K2的值,并代入临界值表中进行比较,不难得到答案.
三、解答题
3.(2018?卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额 (单位:亿元)的折线图。 为了预测该地区2018年的环境基础设施投资额,建立了 与时间变量t的两个线性回归模型,根据2000年至2016年的数据(时间变量 的值依次为1,2,…,17)建立模型①:=-30.4+13.5t .根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由。
【答案】(1)由题意可知模型①中,2018年对应的t=19,
预测值 =-30.4+13.5×19=226.1亿元
此时基础设施的投资预测值为226.1亿元;
模型②中,2018年对应的t=9,
预测值 =99+17.5×9=256.5亿元
此时基础设施的投资预测值为:256.5亿元; (2)用模型②预测得到的2018年的基础设施的投资更可靠。因为从折线图上看,基础设施的投资在2009年到2010年发生了很大程度上的突变,所以用模型①预测2018年的会有一定程度的失真。
【考点】线性回归方程
【解析】【分析】(1)根据函数表达式可求预估值;(2)看图易知可靠性.
4.(2018?卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项项目生产任务的两种新的生产方式,为比较两种生产方式的效率,选取40名工人,将他们随即分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式,根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
超过m
不超过m
第一种生产方式
第二种生产方式
(3)根据2中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附: ,
【答案】(1)解:第二种生产方式效率更高,因为第二组多数数据集中在70min~80min之间,第一组多数数据集中在80min~90min,所以第一组完成任务的平均时间大于第二组, , E1> 则第二种生产方式的效率更高。 (2)解:由题意
超过m
不超过m
第一种生产方式
15
5
第二种生产方式
5
15
(3)解: 有99%的把握认为两种生产方式的效率有差异
【考点】众数、中位数、平均数,独立性检验
【解析】【分析】第一问是算平均数,第二三问是列出连表,算独立性检验
5.(2018?卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成项目生产任务的两种新的生产方式,为比较两种生产方式的效率,选取40名工人,将他们随即分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式,根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
超过m
不超过m
第一种生产方式
第二种生产方式
(3)根据2中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附: ,
【答案】(1)解:第二种生产方式效率更高,因为第二组多数数据集中在70min~80min之间,第一组多数数据集中在80min~90min,所以第一组完成任务的平均时间大于第二组, , E1> 则第二种生产方式的效率更高。 (2)解:由题意
超过m
不超过m
第一种生产方式
15
5
第二种生产方式
5
15
(3)解: 有99%的把握认为两种生产方式的效率有差异
【考点】众数、中位数、平均数,独立性检验
【解析】【分析】第一问是算平均数,第二三问是列出连表,算独立性检验.
6.(2017?新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下: (Ⅰ)记A表示时间“旧养殖法的箱产量低于50kg”,估计A的概率; (Ⅱ)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50kg
箱产量≥50kg
旧养殖法
新养殖法
(Ⅲ)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较. 附:
P(K2≥K)
0.050
0.010
0.001
K
3.841
6.635
10.828
K2= .
【答案】解:(Ⅰ)根据题意,由旧养殖法的频率分布直方图可得: P(A)=(0.012+0.014+0.024+0.034+0.040)×5=0.62; (Ⅱ)根据题意,补全列联表可得:
箱产量<50kg
箱产量≥50kg
总计
旧养殖法
62
38
100
新养殖法
34
66
100
总计
96
104
200
则有K2= ≈7.853>6.635, 故有99%的把握认为箱产量与养殖方法有关; (Ⅲ)由频率分布直方图可得: 旧养殖法100个网箱产量的平均数 1=(27.5×0.012+32.5×0.014+37.5×0.024+42.5×0.034+47.5×0.040+52.5×0.032+57.5×0.032+62.5×0.012+67.5×0.012)×5=5×9.42=47.1; 新养殖法100个网箱产量的平均数 2=(37.5×0.004+42.5×0.020+47.5×0.044+52.5×0.068+57.5×0.046+62.5×0.010+67.5×0.008)×5=5×10.47=52.35; 比较可得: 1< 2 , 故新养殖法更加优于旧养殖法.
【考点】频率分布直方图,独立性检验,独立性检验的应用
【解析】【分析】(Ⅰ)根据题意,由旧养殖法的频率分布直方图计算可得答案; (Ⅱ)由频率分布直方图可以将列联表补全,进而计算可得K2= ≈7.853>6.635,与附表比较即可得答案; (Ⅲ)由频率分布直方图计算新旧养殖法产量的平均数,比较即可得答案.
7.(2017?新课标Ⅰ卷)为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:(12分)
抽取次序
1
2
3
4
5
6
7
8
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得 = xi=9.97,s= = =0.212, ≈18.439, (xi﹣ )(i﹣8.5)=﹣2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
(1)求(xi , i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在( ﹣3s, +3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查? (ⅱ)在( ﹣3s, +3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01) 附:样本(xi , yi)(i=1,2,…,n)的相关系数r= , ≈0.09.
【答案】(1)解:r= = =﹣0.18. ∵|r|<0.25,∴可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小. (2)(i) =9.97,s=0.212,∴合格零件尺寸范围是(9.334,10,606), 显然第13号零件尺寸不在此范围之内, ∴需要对当天的生产过程进行检查. (ii)剔除离群值后,剩下的数据平均值为 =10.22, =16×0.2122+16×9.972=1591.134, ∴剔除离群值后样本方差为 (1591.134﹣9.222﹣15×10.022)=0.008, ∴剔除离群值后样本标准差为 ≈0.09.
【考点】众数、中位数、平均数,极差、方差与标准差,相关系数
【解析】【分析】(1.)代入数据计算,比较|r|与0.25的大小作出结论; (2.)(i)计算合格零件尺寸范围,得出结论; (ii)代入公式计算即可.
8.(2016?全国)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图. 注:年份代码1﹣7分别对应年份2008﹣2014.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以证明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据: =9.32, =40.17, =0.55, ≈2.646. 参考公式: , 回归方程 中斜率和截距的最小二乘估计公式分别为: , .
【答案】(1)解:由折线图看出,y与t之间存在较强的正相关关系,理由如下: ∵ = ≈ ≈ ≈0.996, ∵0.996>0.75, 故y与t之间存在较强的正相关关系; (2)解: = ≈ ≈0.10, ≈1.331﹣0.10×4≈0.93, ∴y关于t的回归方程 =0.103+0.93, 2016年对应的t值为9, 故 =0.10×9+0.93=1.83, 预测2016年我国生活垃圾无害化处理量为1.83亿吨.
【考点】线性回归方程
【解析】【分析】(1)由折线图看出,y与t之间存在较强的正相关关系,将已知数据代入相关系数方程,可得答案;(2)根据已知中的数据,求出回归系数,可得回归方程,2016年对应的t值为9,代入可预测
同课章节目录