中小学教育资源及组卷应用平台
2025人教A版高中数学选择性必修第三册
本章复习提升
易混易错练
易错点1 选错回归模型致错
1.(2024湖南岳阳月考)某企业为了研究新能源汽车在某地区的月销售量y(单位:千辆)与月份x的关系,统计了今年前5个月该地区的月销售量,得到下面的图、表.
) )
9.5 29.5 185.6
表中ti=(i=1,2,3,4,5).
(1)根据散点图判断两变量x,y的关系用y=a+bx与y=c+dx2中的哪一个比较合适;
(2)根据(1)中的判断结果及表中数据,求y关于x的经验回归方程(的值精确到0.1),并预测从今年几月份起该地区的月销售量不低于3.6万辆.
附:在经验回归方程中,.
2.(2023陕西西安第一中学阶段测试)下图是某市2014年至2023年在售二手房均价y(单位:千元/平方米)关于年份代码x的散点图(图中年份代码1~10分别对应2014—2023年).现根据散点图选择用y=a+bx和y=ec+dx两个模型来拟合y与x的关系,经过数据处理得到两个模型对应的经验回归方程的决定系数R2和一些统计量的值,如表所示:
模型 y=a+bx y=ec+dx
决定系数R2 0.882 1 0.904 6
)2 )· (yi-) )· (wi-)
6.81 1.89 82.5 44.55 6.6
表中w=ln y,wi.
(1)请利用决定系数R2判断哪个模型的拟合效果更好,并求出该模型对应的回归方程;
(2)根据(1)中得到的方程预测,该市的在售二手房均价到哪一年能超过10.5千元/平方米.
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归方程u中,.
参考数据:ln 10.5≈2.35.
易错点2 用错公式致错
3.(2024辽宁新高考联盟月考)某公司研发某新产品的投入金额x(单位:百万元)与收益y(单位:百万元)的5组统计数据如下表所示:
x 5 6 8 9 12
y 16 20 25 28 36
由表中数据求得y关于x的经验回归方程为x+2.6,则下列结论不正确的是( )
A.x与y有正相关关系
B.经验回归直线必过点(8,25)
C.=2.4
D.当x=9时,残差为0.2
4.(2024江苏常州期末)杭州第19届亚运会结束后,某调查小组为了解杭州市不同年龄段的市民每日运动的情况,在市民中随机抽取了200人进行调查,结果如下表所示,其中每日平均运动低于1万步的人数占样本总数的,40岁以上(含40岁)的人数占样本总数的.
单位:人
每日平均运动 1万步或以上 每日平均运动 低于1万步 总计
40岁以上 (含40岁) 80
40岁以下
总计 200
(1)将题中表格补充完整;
(2)判断是否有99.9%的把握认为该市市民每日平均运动的步数与年龄有关.
附:χ2=,其中n=a+b+c+d.
α 0.025 0.010 0.005 0.001
xα 5.024 6.635 7.879 10.828
5.(2023四川乐山沫若中学月考)近年来,随着社会对教育的重视,家庭的平均教育支出增长较快,某机构随机调查了某市2017—2023年的家庭教育支出(单位:万元),得到如下折线图.(年份代码1~7分别对应2017—2023年)
经计算得tiyi=1 178,≈2.65,)=126.
(1)用线性回归模型拟合y与t的关系,求出样本相关系数r(精确到0.01),并说明y与t相关性的强弱;
(2)建立y关于t的经验回归方程;
(3)若2025年该市某家庭总支出为10万元,预测2025年该家庭的教育支出.
附:①样本相关系数r=,|r|>0.8时,认为y与t是高度相关的,即相关性很强.
②在经验回归方程中,.
思想方法练
一、数形结合思想在统计中的应用
1.下图是某地区2013年至2022年污染天数y与年份x的折线图,根据2013—2017年的数据,2018—2022年的数据,2013—2022年的数据分别得到经验回归方程,则( )
A.
C.
2.(2023浙江嘉兴期末)为积极响应“反诈”宣传教育活动的要求,某企业特举办了一次“反诈”知识竞赛,规定:满分为100分,60分及以上为合格.该企业从甲、乙两个车间中各抽取了100位职工,以他们的竞赛成绩为样本,对甲车间100位职工的成绩进行统计后得到了如图所示的频率分布直方图.
(1)估算甲车间职工此次“反诈”知识竞赛的合格率;
(2)将频率视为概率,以样本估计总体,从甲车间职工中采用有放回简单随机抽样的方法抽取3次,每次抽1人,每次抽取的结果相互独立,记被抽取的3人中成绩合格的人数为X,求随机变量X的分布列;
(3)若乙车间参加此次知识竞赛的合格率为60%,请根据所给数据,完成下面的2×2列联表,并根据α=0.01的独立性检验分析此次职工“反诈”知识竞赛的成绩与其所在车间是否有关.
单位:人
甲车间 乙车间 合计
合格
不合格
合计
参考公式: χ2=,其中n=a+b+c+d.
临界值表:
α 0.10 0.05 0.010 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
二、转化与化归思想在统计中的应用
3.(2023江西九所重点中学联考)若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-附近波动,则实数b的值为 附:=23.
4.(2024山西太原五中月考)某电动车公司为了抢占更多的市场份额,计划加大广告投入,该公司近5年的年广告费x(单位:百万元)和年销售量y(单位:百万辆)的关系如图所示:
令v=ln x,数据经过初步处理得到下表:
yi vi (xi- )2 (yi- )2 (vi- )2 (xi- ) (yi- )
44 4.8 10 40.3 1.612 19.5 8.06
现有①y=bx+a和②y=nln x+m两种方案作为y关于x的回归分析模型,其中a,b,m,n均为常数.
(1)请从相关系数的角度分析哪一个模型拟合程度更好;
(2)根据(1)中所选的模型及表中数据,求出y关于x的经验回归方程,并预测年广告费为6百万元时,产品的年销售量是多少;
(3)该公司生产的电动车毛利润为每辆200元(不含广告费、研发经费).该公司在加大广告投入的同时也加大研发经费的投入,年研发经费为年广告费的199倍.电动车的年净利润除了受年广告费和年研发经费的影响外,还受随机变量ξ的影响,设随机变量ξ服从正态分布N(600,σ2),且满足P(ξ>800)=0.3.在(2)的条件下,求该公司年净利润的最大值大于1 000百万元的概率.(年净利润=毛利润×年销售量-年广告费-年研发经费-随机变量的值)
附:①对于(x1,y1),(x2,y2),…,(xn,yn),相关系数r=,经验回归方程x中,;
②参考数据:≈20.1,ln 5≈1.6,ln 6≈1.8.
答案与分层梯度式解析
本章复习提升
易混易错练
1.解析 (1)由题中散点图可知,点分布在一条曲线附近,相邻两点的纵坐标的差值呈增大趋势,
故y=c+dx2比较合适.
(2)由t=x2,知y关于t的经验回归方程为t,
易得×(1+4+9+16+25)=11,
)2=374,
所以≈0.5,=9.5-0.5×11=4,
故=4+0.5t,
故y关于x的经验回归方程为=4+0.5x2,
令4+0.5x2≥3.6×10,
解得x≥8或x≤-8(舍去),
故估计从今年8月份起该地区的月销售量不低于3.6万辆.
易错警示 解决回归模型问题,选择适当的回归方程模型是关键,可借助散点图直观地选择方程模型,也可计算决定系数R2选择方程模型.解题时要防止选错模型导致解题错误.
2.解析 (1)由0.904 6>0.882 1,知模型y=ec+dx的拟合效果更好.
对y=ec+dx的两边取自然对数,得ln y=c+dx,
由w=ln y,可知w与x之间具有线性相关关系,
且w关于x的经验回归方程为x,
易得×(1+2+…+10)=5.5,
则=0.08,
=1.89-0.08×5.5=1.45,
所以w关于x的经验回归方程为=1.45+0.08x,
故y关于x的经验回归方程为=e1.45+0.08x.
(2)令=e1.45+0.08x>10.5,
得1.45+0.08x>2.35,
解得x>11.25,取x=12,对应2025年,
所以预测该市的在售二手房均价到2025年能超过10.5千元/平方米.
易错警示 从题中所给多个模型中选择一个最合适的模型时,常因选择的不是最佳模型而导致错误.产生错误的原因一般有两种:一是根据散点图判断时,由于题中所给散点的个数不多,造成错误判断;二是对数据的分析过于简单,比如仅从变量间的增减进行判断,缺乏对线性与非线性、增减快与慢的分析等.
3.C 对于A,由题表中数据可知,x越大,y越大,所以x与y有正相关关系,因此A正确;
对于B,=25,
则样本点中心为(8,25),所以经验回归直线必过点(8,25),因此B正确;
对于C,将样本点中心的坐标代入经验回归方程,得25=8+2.6,所以=2.8,因此C错误;
对于D,由C得=2.8x+2.6,当x=9时,=2.8×9+2.6=27.8,
则残差为y-=28-27.8=0.2,因此D正确.故选C.
易错警示 经验回归直线必过样本点的中心,残差=观测值-预测值,解题时防止记错公式导致错误.
4.解析 (1)由题意可知,40岁以上(含40岁)的人数为200×=100,40岁以下的人数为100,
每日平均运动低于1万步的人数为200×=80,
所以2×2列联表如下:
单位:人
每日平均运动 1万步或以上 每日平均运动 低于1万步 总计
40岁以上 (含40岁) 80 20 100
40岁以下 40 60 100
总计 120 80 200
(2)由2×2列联表可得χ2=>10.828,
所以有99.9%的把握认为该市市民每日平均运动的步数与年龄有关.
易错警示 注意χ2的计算公式中a,b,c,d的各项要准确对应,不要弄混.
5.解析 (1)由题意得×(1+2+3+4+5+6+7)=4,
)2=(1-4)2+(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2+(7-4)2=28,
故,
故r=≈0.88,
因为|0.88|>0.8,所以y与t的相关性很强.
(2)易得=4.5,
-18=19,
所以y关于t的经验回归方程为=4.5t+19.
(3)2025年对应的年份代码t=9,
当t=9时,=4.5×9+19=59.5,
故预测2025年该家庭的教育支出为10×59.5%=5.95(万元).
易错警示 决定系数R2,样本相关系数r以及经验回归方程中的公式很相似,使用时首先要分清公式结构,不要弄混,其次数字计算都较为复杂,计算时需仔细.
思想方法练
1.C 由题中统计图可知2013—2017年,y随着x的增加平缓下降,2018—2022年,y随着x的增加迅速下降,
(根据题图可直观得出污染天数y与年份x在每个阶段的关系,体现了数形结合的思想)
根据经验回归方程的几何意义可知,<0,由点的分布可知,∈(∈(),所以.
故选C.
2.解析 (1)根据题图可得甲车间职工此次“反诈”知识竞赛的合格率为(0.02×10+0.03×10+0.02×10+0.01×10)×100%=80%.
(由题中频率分布直方图求出甲车间的合格率)
(2)由题意,得X~B(3,0.8),
P(X=0)=×0.80×0.23=0.008,
P(X=1)=×0.81×0.22=0.096,
P(X=2)=×0.82×0.21=0.384,
P(X=3)=×0.83×0.20=0.512,
故随机变量X的分布列为
X 0 1 2 3
P 0.008 0.096 0.384 0.512
(3)根据题中统计数据可填写2×2列联表如下:
单位:人
甲车间 乙车间 合计
合格 80 60 140
不合格 20 40 60
合计 100 100 200
零假设H0:此次职工“反诈”知识竞赛的成绩与其所在车间无关.经计算得χ2=≈9.524>6.635=x0.01,所以根据α=0.01的独立性检验,有充分证据推断H0不成立,即认为此次职工“反诈”知识竞赛的成绩与其所在车间有关,此推断犯错误的概率不大于0.01.
思想方法 数形结合思想是一种非常重要的思想方法,就是把“数”与“形”巧妙地结合起来,充分应用“形”的直观性、“数”的严密性与准确性,使抽象问题直观化、复杂问题简单化,从而使问题得到解决.
3.答案
解析 令t=x2,则y=bt-,
(通过换元将非线性回归模型转化为线性回归模型)
因为,
所以,解得b=.
4.解析 (1)设模型①和②的相关系数分别为r1,r2,
由题意可得r1=≈0.97,
在模型y=nln x+m中,由v=ln x得y=nv+m,
(通过换元,将非线性回归模型转化为线性回归模型,进而计算相关系数)
r2==1,
所以|r1|<|r2|,由相关系数的相关性质可得,模型②的拟合程度更好.
(2)由(1)知,选择模型②y=nln x+m,由v=ln x得y=nv+m,
(通过换元将对数型函数模型转化为线性回归模型,利用线性回归模型的相关公式解决问题)
由题中已知数据得=5,
又yi=8.8,
所以=8.8-0.96×5=4,
所以+4,即y关于x的经验回归方程为=5ln x+4,
当x=6时,=5ln 6+4≈13,
因此当年广告费为6百万元时,产品的年销售量约为13百万辆.
(3)设公司年净利润为g(x)百万元,则g(x)=200×(5ln x+4)-200x-ξ,
所以g'(x)=,令g'(x)>0,得05.
故y=g(x)在(0,5)上单调递增,在(5,+∞)上单调递减,
所以g(x)max=g(5)=200×(5ln 5+4-5)-ξ≈1 400-ξ,
由题意得1 400-ξ>1 000,即ξ<400,
又ξ~N(600,σ2),所以P(ξ<400)=P(ξ>800)=0.3,
即该公司年净利润的最大值大于1 000百万元的概率为0.3.
思想方法 转化与化归思想在本章中的应用主要体现在解决非线性回归问题中,即两个变量不是线性相关关系时,利用变量间的转换,把非线性回归问题转化为线性回归问题加以解决.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)