中小学教育资源及组卷应用平台
2027全国版高考数学一轮复习
课时规范练60 成对数据的统计分析
(分值:90分)
(单选题每小题5分,多选题每小题6分,填空题每小题5分)
参考公式:样本相关系数r=,
经验回归方程x中斜率与截距的最小二乘估计公式分别为.
基础 巩固练
1.(2025·安徽蚌埠三模)医疗研究者会创建散点图来显示少女的体重指数(BMI)和身体脂肪百分比之间的相关关系,如图,下列说法正确的是( )
脂肪百分比与BMI的散点图
A.BMI越大,脂肪百分比越大
B.BMI越大,脂肪百分比越小
C.BMI与脂肪百分比正相关
D.BMI与脂肪百分比负相关
2.(2025·河南新乡模拟)某企业产品的广告费用与销售量的统计数据如表所示:
广告费用/万元 4 2 3 5
销售额/万元 49 26 39 54
根据表中各数据可得回归方程x+,其中=9.4,假设该企业广告费用为6万元时,则销售额为( )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
3.(2025·湖南长沙模拟)某科技公司对2013年至2025年的生产成本y(单位:万元)进行统计,根据统计数据作出如下散点图:
由此散点图,判断最适合作为该公司的生产成本y与时间变量x(x的值依次为1,2,…,13)的经验回归方程类型的是( )
A.y=ax2+b(a>0) B.y=ax+b(a>0)
C.y=aln x+b(a<0) D.y=+b(a<0)
4.(2025·江苏苏州三模)某公司对100名员工进行了工作量的调查,数据如表:
性别 调查结果 合计
认为工作量大 认为工作量不大
男 40 20 60
女 20 20 40
合计 60 40 100
若推断“员工的性别与认为工作量大有关”,则这种推断犯错误的概率不超过( )
附:χ2=
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
A.0.10 B.0.05 C.0.001 D.0.01
5.(2025·山东聊城二模)为了研究某市高中生的脚长x(单位:cm)和身高y(单位:cm)的关系,市卫健委从该市随机抽取若干名高中生做调查,经统计,所调查数据的=19.25,=161,根据最小二乘法算得脚长和身高的经验回归方程为=4x+.已知被调查的某学生的脚长为25 cm,身高180 cm,则该样本点的残差为( )
A.1 cm B.-1 cm
C.4 cm D.-4 cm
6.(多选题)(2024·山东菏泽模拟)某公司给一款新产品投放广告,根据统计,投入x(单位:万元)的广告费与该产品的收益y(单位:万元)的统计数据如下表所示,根据表中的数据可得到经验回归方程为x+2.6,则下列结论正确的是( )
x 5 6 8 9 12
y 16 20 25 28 36
A.y与x的样本相关系数r>0
B.=2.8
C.当投入15万元的广告费时,该产品的收益一定是44.6万元
D.x=12时,残差为0.2
7.(多选题)(2025·河北石家庄一模)下列结论正确的是( )
A.当研究两个变量之间的关联程度时,若相关系数的绝对值|r|越接近于1,则两个变量的线性相关程度越弱
B.在评估模型拟合效果时,决定系数R2越接近1,表示模型对数据的拟合效果越好
C.通过样本数据得到的回归直线x+一定经过点()
D.设关于分类变量X与Y的独立性检验的零假设为H0:X与Y无关,根据分类变量X与Y的成对样本数据,计算得到χ2=4.172,依据α=0.05的独立性检验,没有充分证据推断H0不成立,即认为X与Y无关
8.(多选题)(2025·广东广州二模)一组成对样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥10,n∈N*)的散点位于一条直线附近,它的样本相关系数为r,由最小二乘法求得经验回归方程x+,则( )
A.若r>0,则>0
B.若zi=yi-2(i=1,2,…,n),则成对数据(xi,zi)的样本相关系数r1等于r
C.若zi=2yi(i=1,2,…,n),则成对数据(xi,zi)的样本相关系数r2大于r
D.若zi=2yi(i=1,2,…,n),则成对数据(xi,zi)的经验回归方程=2x+2
9.(2025·广东汕头一模)在政府发布的光伏发电补贴政策的引导下,西北某地光伏发电装机量急剧上升,现对2017年至2024年的新增光伏装机量进行调查,根据散点图选择了两个模型进行拟合,并得到相应的经验回归方程.为判断模型的拟合效果,甲、乙、丙三位同学进行了如下分析:
(1)甲同学通过计算残差作出两个模型的残差图,如图所示;
(2)乙同学求出模型①的残差平方和为0.417 5、模型②的残差平方和为1.562 5;
(3)丙同学分别求出模型①的决定系数=0.952 0、模型②的决定系数为=0.978 1.
经检验,模型①拟合效果最佳,则甲、乙、丙三位同学中,运算结果肯定出错的同学是 .(填“甲”或“乙”或“丙”)
10.(13分)(2025·湖南衡阳模拟)中国的非遗项目丰富多样,涵盖广泛,体现了中华民族的智慧和独特的文化魅力.春节期间某地为充分宣扬该地非遗物质文化,加大非遗传承人的技艺展示.该地市场开发与发展机构统计了非遗传承人的技艺展示量与市场消费收入的6组数据如下表:
技艺展示量x/个 21 23 24 27 29 32
市场消费收入y/万元 6 11 20 27 57 77
(1)若用线性回归理论进行统计分析,求市场消费收入y关于技艺展示量x的回归方程x+(精确到0.1);
(2)若用非线性回归模型求得市场消费收入y关于技艺展示量x的回归方程为=0.06e0.230 3x,且决定系数R2=0.952 2,与(1)中的线性回归模型相比,应用决定系数R2说明哪种模型的拟合效果更好.
参考数据:(xi-)(yi-)=557,=84,=3 930,线性回归模型的残差平方和为=236.64(其中xi,yi分别为非遗传承人的技艺展示量和市场消费收入,i=1,2,3,4,5,6).
综 合 提升练
11.(2025·广东广州模拟)一组样本数据(xi,yi),i∈{1,2,3,…,100},其中xi>1 895,xi=2×105,yi=970,求得其经验回归方程为=-0.02x+,残差为.对样本数据进行处理:xi'=ln(xi-1 895),得到新的数据(xi',yi),求得其经验回归方程为=-0.42x+,其残差为分布如图所示,且~N(0,),~N(0,),则下列说法错误的是( )
图1
图2
A.成对样本数据负相关
B.=49.7
C.
D.处理后的决定系数变大
12.(13分)某狂欢节共举行了8场精彩的烟花秀节目.前5场的观众人数(单位:万人)与场次的统计数据如表所示:
场次编号X 1 2 3 4 5
观众人数Y 0.7 0.8 1 1.2 1.3
(1)已知可用线性回归模型拟合Y与X的关系,请建立Y关于X的经验回归方程;
(2)若该烟花秀节目分A,B,C三个等次的票价,某机构随机调查了该烟花秀节目现场200位观众的性别与购票情况,得到的部分数据如下表所示,请将2×2列联表补充完整,依据α=0.01的独立性检验,分析判断该烟花秀节目的观众购买A等票与性别是否有关联.
性别 购买票等次 合计
购买A等票 购买非A等票
男性观众 60
女性观众 60
合计 110 200
创 新 应用练
13.(多选题)(2025·广东珠海模拟预测)某公司2020年研发成功一款新产品投放市场,为了做好后期的市场开拓工作,该公司收集了2020年至2024年共5年的销售量数据如下表:
年份 2020 2021 2022 2023 2024
年份代码x 1 2 3 4 5
销售量y/万个 2 17 36 93 142
根据上表,利用最小二乘法可得y关于x的回归方程为=bx2-8,则下列说法正确的是( )
A.五年销售量的极差是140
B.五年销售量的第80百分位数是93
C.b=6
D.根据回归方程估计2025年销售量为760万个
14.某校对“学生性别和喜欢跑步是否有关”进行了一次调查,其中被调查的男生、女生人数相同,男生喜欢跑步的人数占男生人数的,女生喜欢跑步的人数占女生人数的,若依据α=0.05的独立性检验判断是否喜欢跑步和性别有关,则调查人数中男生可能有 人.(填一个即可)
α 0.100 0.050 0.010
xα 2.706 3.841 6.635
附:χ2=
参考答案
1.C 解析 由散点图可得BMI增大时,脂肪百分比或变大或变小,故A,B错误;
根据散点图的分布可得BMI与脂肪百分比正相关,故C正确,D错误.故选C.
2.B 解析 根据表格数据得=42,将点(,42)代入x+,解得=9.4,∴42=9.4,解得=9.1,于是回归方程为=9.4x+9.1,令x=6,得=65.5,故选B.
3.C 解析 根据图中散点图可知,散点大致分布在一条“对数型”函数曲线的周围,
A选项是“抛物线型”的拟合函数,且是增加的,故A错误;
B选项是“直线型”的拟合函数,且是增加的,故B错误;
D选项是“幂函数型”的拟合函数,且是增加的,故D错误;
只有C选项的拟合函数符合题意,故C正确.故选C.
4.A 解析 χ2=2.778≥2.706,因为P(χ2>2.706)=0.10,所以这种推断犯错误的概率不超过0.10.故选A.
5.D 解析 因为=19.25,=161,又经验回归方程=4x+必过点(),所以161=4×19.25+,解得=84,所以=4x+84,当x=25时=4×25+84=184,所以该样本点的残差为180-184=-4(cm).故选D.
6.AB 解析 由表格可知,x越大,y越大,所以x与y正相关,所以样本相关系数r>0,故A正确;=8,=25,则经验回归直线经过点(8,25),则25=8+2.6,所以=2.8,故B正确;因为=2.8x+2.6,当x=15时,=2.8×15+2.6=44.6,该产品的收益大概是44.6万元,C选项错误;因为=2.8x+2.6,当x=12时,=2.8×12+2.6=36.2,则残差为y-=36-36.2=-0.2,故D选项错误.故选AB.
7.BC 解析 相关系数绝对值越接近于1两个变量的线性相关程度越强,故A错误;
因为决定系数R2越接近1,表示模型的拟合效果越好,故B正确;
因为回归直线x+一定经过点(),故C正确;
因为χ2=4.172>3.841,推断零假设H0不成立,即认为X与Y有关联,而非无关,故D错误.故选BC.
8.ABD 解析 当r>0时,变量正相关,所以>0,故A正确;
因为zi=yi-2(i=1,2,…,n),所以成对数据(xi,zi)的对应点相当于把成对数据(xi,yi)的对应点向下平移2个单位长度,不改变变量的相关性,故B正确;
因为zi=2yi(i=1,2,…,n),则成对数据(xi,zi)的对应点相当于把成对数据(xi,yi)的对应点横坐标不变,纵坐标变为原来的2倍,故变量间的相关性不变,故C错误;
当zi=2yi(i=1,2,…,n),由可知,新的回归直线方程中斜率变为2'=2-2=2()=2,则成对数据(xi,zi)的经验回归方程=2x+2,故D正确.
9.丙 解析 甲的残差图中,模型①的残差点更均匀地分布在以横轴为对称轴的水平带状区域内,且水平带状区域更窄,说明模型①拟合效果更好;
残差平方和越大,即决定系数越小,说明数据点越离散,所以乙的计算结果显示模型①的拟合效果更好,而丙的计算结果显示模型②的拟合效果更好.所以运算结果出错的是丙.
10.解 (1)由题意n=6,则xi==26,
yi==33,
6.6,=33-6.6×26=-138.6,
y关于x的经验回归方程为=6.6x-138.6.
(2)对于线性回归模型,=3 930,=236.64,
决定系数为1-=1-1-0.060 2=0.939 8,
因为0.939 8<0.952 2,所以用非线性回归模型拟合效果更好.
11.C 解析 经验回归方程=-0.02x+中斜率-0.02<0,则成对样本数据负相关,A正确;
原样本均值:=2×103,=9.7,由=-0.02,得=9.7+0.02×2×103=49.7,B正确;
由题图1的数据波动较大可得更集中,则,C错误;
由题图1的残差平方和较题图2的残差平方和大知,处理后拟合效果更好,决定系数变大,D正确.故选C.
12.解 (1)由题表数据可知=3,=1,可得(xi-)(yi-)=(-2)×(-0.3)+(-1)×(-0.2)+0×0+1×0.2+2×0.3=1.6,
=(-2)2+(-1)2+0+1+22=10,
则=0.16,-0.16=0.52,所以Y=0.16X+0.52.
(2)根据数据补全列联表如下.
性别 购买票等次 合计
购买A等票 购买非A等票
男性观众 30 60 90
女性观众 60 50 110
合计 90 110 200
零假设为H0:观众购买A等票与性别无关.
所以χ2=9>6.635,
根据α=0.01的独立性检验,推断H0不成立,即认为该烟花秀节目的观众购买A等票与性别有关,此推断犯错误的概率不大于0.01.
13.AC 解析 五年销售量的极差是142-2=140,故A正确;
5×0.8=4,所以2,17,36,93,142的第80百分位数为=117.5,故B错误;
令t=x2,则y关于x的回归方程为=bx2-8,转化为=bt-8,=11,=58,所以58=b×11-8,解得b=6,故C正确.
由上述分析可知=6x2-8,估计2025年销售量为=6×62-8=208(万个),故D错误.故选AC.
14.45(答案不唯一,大于等于45的5的整数倍都符合题意) 解析 设调查了x位男生,已知被调查的男生、女生人数相同,男生喜欢跑步的人数占男生人数的,女生喜欢跑步的人数占女生人数的,根据题意列出表格,
爱好 性别 合计
男生 女生
喜欢跑步 x x x
不喜欢跑步 x x x
合计 x x 2x
则χ2=3.841,解得x≥40.330 5,因为男生喜欢跑步的人数占男生人数的,女生喜欢跑步的人数占女生人数的,所以男生人数是5的倍数,所以男生人数x∈{x|x=45+5k,k∈N}.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)