中小学教育资源及组卷应用平台
备考2020 高考二轮复习
变量间的相关关系及统计案例 专项跟踪测试题解析版
1.
解析 依题意,K2=5,且P(K2≥3.841)=0.05,因此有95%的把握认为“X和Y有关系”,选A.
答案 A
2.
解析 由题意知==5,
==4,
将点(5,4)代入=x-0.25,解得=0.85,
则=0.85x-0.25,
所以当x=8时,=0.85×8-0.25=6.55,故选C.
答案 C
3.
解析 根据2×2列联表与独立性检验可知,当与相差越大时,X与Y有关系的可能性越大,即a,c相差越大,与相差越大,故选A.
答案 A
4.
解析 由-0.7<0,得变量x,y之间呈负相关关系,故A正确;当x=20时,=-0.7×20+10.3=-3.7,故B正确;由表格数据可知=×(6+8+10+12)=9,=(6+m+3+2)=,则=-0.7×9+10.3,解得m=5,故C错;由m=5,得==4,所以该回归直线必过点(9,4),故D正确.故选C.
答案 C
5.
解析 由题意知=0.2,=-1.7,
∴==≈0.73>0,
∴=-1.7-0.73×0.2≈-1.85<0,故选C.
答案 C
二、填空题(每小题5分)
6.
解析 由题图知==2,==2.6,将(2,2.6)代入=x+1中,解得=0.8.
答案 0.8
7.
解析 K2≈3.918≥3.841,而P(K2≥3.814)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.
答案 ①
三、解答题(共25分)
8.解析 (1)从高一年级学生中随机抽取1人,抽到男生的概率约为=.
(2)根据统计数据,可得2×2列联表如下:
选择自然科学类 选择社会科学类 合计
男生 60 45 105
女生 30 45 75
合计 90 90 180
则K2的观测值为k==≈5.142 9>5.024,
所以能在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关.
9.
解析 (1)由所给数据计算得=(1+2+3+4+5+6+7)=4,
=(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
(ti-)2=9+4+1+0+1+4+9=28,
(ti-)(yi-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,
===0.5,
=-t=4.3-0.5×4=2.3,
所求线性回归方程为=0.5t+2.3.
(2)由(1)知,=0.5>0,故2012年至2018年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.
将2020年的年份代号t=9代入(1)中的线性回归方程,得
=0.5×9+2.3=6.8,故预测该地区2020年农村居民家庭人均纯收入约为6.8千元.
10.
解析 独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.
若从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误.故选C.
答案 C
11.
解析 由所给的数据计算可得=3,=2,回归方程为
=0.6x+0.2,过点A1,A2的直线方程为y=x.
所以①m>,>n,正确;
②直线l1过点A3,正确;
综上可得,正确的命题有2个.选B.
答案 B
12.
解析 对于A,取a=-1,b=-2,不能推出a2>b2,故错误;对于B,命题p:?x∈R,2x>0的否定为?x0∈R,2x0≤0,故错误;对于C,为了了解800名学生对学校某项教改实验的意见,用系统抽样的方法从中抽取一个容量为40的样本,则分组的组距为800÷40=20,故错误;对于D,因为回归直线的斜率的估计值为1.23,所以回归直线方程可写成=1.23x+,根据回归直线过样本点的中心(4,5),则=0.08,所以回归直线方程为=1.23x+0.08,故正确.故选D.
答案 D
13.
解析
月份 1 2 3 4 5 6 7 8 9 10
最高气温 5 9 9 11 17 24 27 30 31 21
最低气温 -12 -3 1 -2 7 17 19 23 25 10
温差 17 12 8 13 10 7 8 7 6 11
由表格可知最低气温大致随最高气温的增大而增大,A正确;每月最高气温与最低气温的平均值在前8个月不是逐月增加,B错;月温差(最高气温减最低气温)的最大值出现在1月,C正确;1月至4月的月温差(最高气温减最低气温)相对于7月至10月,波动性更大,D正确,故选B.
答案 B
14.
解析 (1)=
==1.7,
∴=-=28.4,
故y关于x的线性回归方程是=1.7x+28.4.
(2)∵0.75<0.93,
∴二次函数回归模型更合适.
当x=3时,=33.47.
故选择二次函数回归模型更合适,并且用此模型预测A超市广告费支出3万元时的销售额约为33.47万元.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://21世纪教育网(www.21cnjy.com)
" 21世纪教育网(www.21cnjy.com)
中小学教育资源及组卷应用平台
备考2020 高考二轮复习
变量间的相关关系及统计案例 专项跟踪测试题原卷版
一、选择题(每小题5分)
1.为了判定两个分类变量X和Y是否有关系,应用独立性检验法算得K2的观测值为5,又已知P(K2≥3.841)=0.05,P(K2≥6.635)=0.01,则下列说法正确的是
A.有95%的把握认为“X和Y有关系”
B.有95%的把握认为“X和Y没有关系”
C.有99%的把握认为“X和Y有关系”
D.有99%的把握认为“X和Y没有关系”
2.已知变量x和y的统计数据如下表:
x 3 4 5 6 7
y 2.5 3 4 4.5 6
根据上表可得回归直线方程为=x-0.25, 据此可以预测当x=8时,=
A.6.4 B.6.25 C.6.55 D.6.45
3.假设有两个分类变量X和Y的2×2列联表如下:
Y X y1 y2 总计
x1 a 10 a+10
x2 c 30 c+30
总计 60 40 100
对同一样本,以下数据能说明X与Y有关系的可能性最大的一组为
A.a=45,c=15 B.a=40,c=20
C.a=35,c=25 D.a=30,c=30
4.已知变量x,y之间的线性回归方程为=-0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法错误的是
x 6 8 10 12
y 6 m 3 2
A.变量x,y之间呈负相关关系
B.可以预测,当x=20时,=-3.7
C.m=4
D.该回归直线必过点(9,4)
5.已知两个随机变量x,y之间的相关关系如下表所示:
x -4 -2 1 2 4
y -5 -3 -1 -0.5 1
根据上述数据得到的回归方程为=x+,则大致可以判断
A.>0,>0 B.>0,<0
C.<0,>0 D.<0,<0
二、填空题(每小题5分)
6.如图是一组数据(x,y)的散点图,经最小二乘估计公式计算,y与x之间的线性回归方程为=x+1,则=________.
7.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.
①有95%的把握认为“这种血清能起到预防感冒的作用”;
②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;
③这种血清预防感冒的有效率为95%;
④这种血清预防感冒的有效率为5%.
三、解答题(共25分)
8.(12分)(2019·合肥质检)某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调查.现从高一年级学生中随机抽取180名学生,其中男生105名;在这180名学生中选择社会科学类的男生、女生均为45名.
(1)试问:从高一年级学生中随机抽取1人,抽到男生的概率约为多少?
(2)根据抽取的180名学生的调查结果,完成下面的2×2列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关?
选择自然科学类 选择社会科学类 合计
男生
女生
合计
附:K2=,其中n=a+b+c+d.
P(K2≥k0) 0.500 0.400 0.250 0.150 0.100 0.050 0.025 0.010 0.005 0.001
k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
9.某地区2012年至2018年农村居民家庭人均纯收入y(单位:千元)的数据如下表:
年份 2012 2013 2014 2015 2016 2017 2018
年份代号t 1 2 3 4 5 6 7
人均纯收入y 2.9 3.3 3.6 4.4 4.8 5.2 5.9
(1)求y关于t的线性回归方程;
(2)利用(1)中的线性回归方程,分析2012年至2018年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2020年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为:
=,=-.
10.在吸烟与患肺癌这两个分类变量的独立性检验的计算中,下列说法正确的是
A.若K2的观测值为k=6.635,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患有肺癌
B.由独立性检验可知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有99%的可能患有肺癌
C.若从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误
D.以上三种说法都不正确
11.已知具有线性相关的五个样本点A1(0,0),A2(2,2),A3(3,2),A4(4,2),A5(6,4),用最小二乘法得到回归直线方程l1:=x+,过点A1,A2的直线方程l2:y=mx+n,那么下列四个命题中,
正确的命题有
A.1个 B.2个 C.3个 D.4个
12.下列说法中正确的是
A.“a>b”是“a2>b2”成立的充分不必要条件
B.命题p:?x∈R,2x>0,则綈p:?x0∈R,2x0<0
C.为了了解800名学生对学校某项教改实验的意见,用系统抽样的方法从中抽取一个容量为40的样本,则分组的组距为40
D.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为=1.23x+0.08
13.下表是我国某城市在2017年1月份至10月份10个月的最低气温与最高气温(℃)的数据一览表.
月份 1 2 3 4 5 6 7 8 9 10
最高气温 5 9 9 11 17 24 27 30 31 21
最低气温 -12 -3 1 -2 7 17 19 23 25 10
已知该城市各月的最低气温与最高气温具有相关关系,根据表格下列结论错误的是
A.最低气温与最高气温为正相关
B.每月最高气温和最低气温的平均值在前8个月逐月增加
C.月温差(最高气温减最低气温)的最大值出现在1月
D.1月至4月的月温差(最高气温减最低气温)相对于7月至10月,波动性更大
14.某市春节期间7家超市广告费支出xi(万元)和销售额yi(万元)数据如下表:
超市 A B C D E F G
广告费支出xi 1 2 4 6 11 13 19
销售额yi 19 32 40 44 52 53 54
(1)若用线性回归模型拟合y与x的关系,求y与x的线性回归方程;
(2)若用二次函数回归模型拟合y与x的关系,可得回归方程:=-0.17x2+5x+20,经计算,二次函数回归模型和线性回归模型的R2分别约为0.93和0.75,请用R2说明选择哪个回归模型更合适,并用此模型预测A超市广告费支出3万元时的销售额.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://21世纪教育网(www.21cnjy.com)
" 21世纪教育网(www.21cnjy.com)