中小学教育资源及组卷应用平台
通用版高考数学一轮复习
课时突破练62 成对数据的统计分析
基础达标练
1.下列有关线性回归的说法,不正确的是( )
A.具有相关关系的两个变量不是因果关系
B.散点图能直观地反映数据的相关程度
C.回归直线最能代表线性相关的两个变量之间的关系
D.任一组数据都有经验回归方程
2.观察下列各图,其中两个分类变量x,y之间关系最强的是( )
A. B.
C. D.
3.(2024·山西运城一模)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图1;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图2.r1表示变量x,y之间的样本相关系数,r2表示变量u,v之间的样本相关系数,则( )
图1
图2
A.-1B.-1C.0D.04.(2024·江苏南通高三期中)已知表格中的数据y关于x的线性经验回归方程为=36x-48,
x 1 2 3 4 5
y 5 15 35 t 140
则样本点(4,t)的残差为( )
A.9
B.96
C.105
D.t-96
5.(2024·陕西西安一模)已知变量x,y之间的一组相关数据如下表所示:
x 6 8 10 12
y 6 m 3 2
据此得到变量x,y之间的线性回归方程为=-0.7x+10.3,则下列说法不正确的是( )
A.变量x,y之间成负相关关系
B.可以预测,当x=20时,=-3.7
C.m=4
D.该回归直线必过点(9,4)
6.(多选)(2024·河南郑州模拟)为考察一种新型药物预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的2×2列联表中,由列联表中的数据计算得χ2≈9.616.参照附表,下列结论正确的是( )
附表:
P(χ2≥k) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
A.根据小概率值α=0.001的独立性检验,分析认为“药物有效”
B.根据小概率值α=0.001的独立性检验,分析认为“药物无效”
C.根据小概率值α=0.005的独立性检验,分析认为“药物有效”
D.根据小概率值α=0.005的独立性检验,分析认为“药物无效”
7.(多选)下列说法正确的是( )
A.在经验回归方程=-0.85x+2.3中,当解释变量x每增加1个单位时,响应变量平均减少2.3个单位
B.在经验回归方程=-0.85x+2.3中,相对于样本点(1,1.2)的残差为-0.25
C.在残差图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好
D.若两个变量的决定系数R2越大,表示残差平方和越小,即模型的拟合效果越好
8.已知x和y的散点图如图所示,在相关关系中,若用y=c1拟合时的决定系数为,用x+拟合时的决定系数为,则中较大的是 .
能力提升练
9.(2024·广西贵港模拟)下列说法中错误的是( )
A.独立性检验的本质是比较观测值与期望值之间的差异
B.两个变量x,y的相关系数为r,若|r|越接近1,则x与y之间的线性相关程度越强
C.若一组样本数据(xi,yi)(i=1,2,3,…,n)的样本点都在直线y=0.98x+3上,则这组数据的相关系数r为0.98
D.由一组样本数据(xi,yi)(i=1,2,3,…,n)求得的回归直线方程为=0.98x+3,设=0.98xi+3,则<1
10.(2024·江苏泰州高三检测)用模型y=aekx拟合一组数据组(xi,yi)(i=1,2,3,…,7),其中x1+x2+…+x7=7,设z=ln y,得变换后的线性回归方程为=x+4,则y1y2…y7=( )
A.e70
B.e35
C.70
D.35
11.(2024·江苏扬州模拟预测)某工厂为研究某种产品的产量x(单位:吨)与所需某种原材料的质量y(单位:吨)的相关性,在生产过程中收集4组对应数据(x,y),如表所示.
x 3 4 5 6
y 2.5 3 4 m
根据表中数据,得出y关于x的经验回归方程为=0.7x+0.35,则表中m的值为 .
12.(多选)(2024·湖北一模)某校为了解高一新生对数学是否感兴趣,从400名女生和600名男生中通过分层随机抽样的方式随机抽取100名学生进行问卷调查,将调查的结果得到如下等高堆积条形图和列联表,则( )
性别 数学兴趣 合计
感兴趣 不感兴趣
女 a b a+b
男 c d c+d
合计 a+c b+d 100
参考数据:本题中χ2=≈3.94
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.表中a=12,c=30
B.可以估计该校高一新生中对数学不感兴趣的女生人数比男生多
C.根据小概率值α=0.05的χ2独立性检验,可以认为性别与对数学的兴趣有差异
D.根据小概率值α=0.01的χ2独立性检验,可以认为性别与对数学的兴趣没有差异
素养拔高练
13.(2024·山东滨州高三期末)某学校一同学研究温差x(单位:℃)与本校当天新增感冒人数y(单位:人)的关系,该同学记录了5天的数据:
x 5 6 8 9 12
y 16 20 25 28 36
由上表中数据求得温差x与新增感冒人数y满足经验回归方程x+2.6,则下列结论不正确的是( )
A.x与y有正相关关系
B.经验回归直线经过点(8,25)
C.=2.4
D.x=9时,残差为0.2
答案:
1.D 根据两个变量具有相关关系的概念,可知A正确;散点图能直观地描述呈相关关系的两个变量的相关程度,且回归直线最能代表它们之间的相关关系,所以B,C正确;具有相关关系的成对样本数据才有经验回归方程,所以D不正确.
2.D 观察等高堆积条形图易知D选项两个分类变量之间关系最强.
3.A 从图象中看出y随x增大而减少(图象下降),u随v增大而减少(图象下降),则y与x呈负相关关系,u与v呈负相关关系,即r1<0,r2<0,故C,D不正确;另外对比两图,容易看出y与x相关性更强,故r1越接近-1,所以得-14.A =3,=39+,所以39+=36×3-48,解得t=105,当x=4时,=36×4-48=96,所以样本点(4,t)的残差为105-96=9.
5.C 对于A中,由-0.7<0,可得变量x,y之间呈现负相关关系,所以A正确;对于B中,当x=20,可得=-0.7×20+10.3=-3.7,所以B正确;对于C中,由表格中的数据,可得(6+8+10+12)=9,(6+m+3+2)=,则=-0.7×9+10.3,解得m=5,所以C不正确;对于D中,由m=5,可得=4,所以该回归直线必经过点(9,4),所以D正确.
6.BC 因为χ2≈9.616,所以7.879<χ2<10.828,所以根据小概率值α=0.001的独立性检验,分析认为“药物无效”.根据小概率值α=0.005的独立性检验,分析认为“药物有效”.
7.BCD 对于A,根据经验回归方程,当解释变量x每增加1个单位时,响应变量平均减少0.85个单位,故A错误;对于B,当解释变量x=1时,响应变量=1.45,则样本点(1,1.2)的残差为-0.25,故B正确;对于C,在残差图中,残差分布的水平带状区域的宽度越窄,说明拟合精度越高,即拟合效果越好,故C正确;对于D,由决定系数R2的意义可知,R2越大,表示残差平方和越小,即模型的拟合效果越好,故D正确.
8 由散点图知,用y=c1拟合的效果比x+拟合的效果要好,所以,故较大者为
9.C 选项A,独立性检验的本质是比较观测值与期望值之间的差异,从而确定研究对象是否有关联,A正确;选项B,两个变量x,y的相关系数为r,若|r|越接近1,则x与y之间的线性相关程度越强,B正确;选项C,若一组样本数据(xi,yi)(i=1,2,3,…,n)的样本点都在直线y=0.98x+3上,则这组数据的相关系数r为1,C错误;选项D,由残差分析可知,在0与1之间,D正确.
10.B 因为x1+x2+…+x7=7,所以=1,则+4=5,即(ln y1+ln y2+…+ln y7)=5,即ln(y1y2…y7)=35,所以y1y2…y7=e35.
11.4.5 样本中心点的横坐标为=4.5,样本中心点的纵坐标为,
所以由样本中心点必在回归方程所对应的直线上,可得=0.7×4.5+0.35,解得m=4.5.
12.ACD 由题可知,抽取男生人数为600=60,女生抽取的人数为400=40,由等高条形图知,抽取男生感兴趣的人数为60×0.5=30,抽取男生不感兴趣的人数为60×0.5=30,抽取女生感兴趣的人数为40×0.3=12,抽取女生不感兴趣的人数为40×0.7=28,
2×2的列联表如下:
性别 数学兴趣 合计
感兴趣 不感兴趣
女 12 28 40
男 30 30 60
合计 42 58 100
由此表可知,a=12,c=30,故A正确;女生不感兴趣的人数约为400=280,男生不感兴趣的人数约为600=300,所以估计该校高一新生中对数学不感兴趣的女生人数比男生少,故B错误;零假设为H0:性别与对数学的兴趣没有差异,χ2=3.941>3.841.
依据小概率值α=0.05的独立性检验,有充分证据推断H0不成立,因此可以认为不成立,即可以认为性别与对数学的兴趣有差异,故C正确;零假设为H0:性别与对数学的兴趣没有差异,χ2=3.941<6.635.依据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为成立,即可以认为性别与对数学的兴趣没有差异,故D正确.
13.C 由表格可知,x越大,y越大,所以x与y有正相关关系,故A正确;
=8,=25,样本点中心为(8,25),经验回归直线经过点(8,25),故B正确;
将样本点中心代入直线方程,得25=8+2.6,所以=2.8,故C错误;
=2.8x+2.6,当x=9时,=27.8,y-=28-27.8=0.2,故D正确.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)