中小学教育资源及组卷应用平台
2025苏教版高中数学选择性必修第二册
综合拔高练
五年高考练
考点1 变量间的相关关系与线性回归分析
1.(2023上海,14)根据身高和体重散点图,下列说法正确的是( )
A.身高越高,体重越重
B.身高越高,体重越轻
C.身高与体重成正相关
D.身高与体重成负相关
2.(2023天津,7)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰“鸢飞戾天,鱼跃于渊”.鸢尾花因花瓣形如鸢尾而得名(图1),寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm),绘制对应散点图(图2).
计算得样本相关系数为0.864 2,利用最小二乘法求得相应的经验回归方程为=0.750 1x+0.610 5.根据以上信息,如下判断正确的为( )
A.花萼长度与花瓣长度不存在相关关系
B.花萼长度与花瓣长度负相关
C.花萼长度为7 cm的该品种鸢尾花的花瓣长度的平均值约为5.861 2 cm
D.若选取其他品种鸢尾花进行抽样,所得花萼长度与花瓣长度的样本相关系数一定为0.864 2
3.(2022全国乙理,19)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本 号i 1 2 3 4 5 6 7 8 9 10 总和
根部 横截 面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.070.06 0.6
材积 量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.420.40 3.9
并计算得=1.615 8,xiyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数r=,
≈1.377.
考点2 独立性检验及其应用
4.(2024全国甲理,17)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品 合格品 不合格品 总计
甲车间 26 24 0 50
乙车间 70 28 2 100
总计 96 52 2 150
(1)填写如下列联表:
优级品 非优级品
甲车间
乙车间
能否有95%的把握认为甲、乙两车间产品的优级品率存在差异 能否有99%的把握认为甲、乙两车间产品的优级品率存在差异
(2)已知升级改造前该工厂产品的优级品率p=0.5.设为升级改造后抽取的n件产品的优级品率,如果,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了 (≈12.247)
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
.
5.(2023全国甲理,19)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).
(1)设X表示指定的两只小白鼠中分配到对照组的只数,求X的分布列和数学期望;
(2)试验结果如下:
对照组的小白鼠体重的增加量从小到大排序为
15.2 18.8 20.2 21.3 22.5 23.2 25.8
26.5 27.5 30.1 32.6 34.3 34.8 35.6
35.6 35.8 36.2 37.3 40.5 43.2
试验组的小白鼠体重的增加量从小到大排序为
7.8 9.2 11.4 12.4 13.2 15.5 16.5
18.0 18.8 19.2 19.8 20.2 21.6 22.8
23.6 23.9 25.1 28.2 32.3 36.5
(i)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表:
对照组
试验组
(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异
附:K2=,
P(K2≥k) 0.100 0.050 0.010
k 2.706 3.841 6.635
.
6.(2022全国新高考Ⅰ,20)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好 良好
病例组 40 60
对照组 10 90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(i)证明:R=;
(ii)利用该调查数据,给出P(A|B),P(A|)的估计值,并利用(i)的结果给出R的估计值.
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
.
7.(2022全国甲文,17)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
准点班次数 未准点班次数
A 240 20
B 210 30
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关
附:K2=,
P(K2≥k) 0.100 0.050 0.010
k 2.706 3.841 6.635
.
三年模拟练
应用实践
1.(2024江苏苏州部分学校调研)为研究某地区一灾情结束后一段时间内的复工率,用模型(1)和模型(2)模拟复工率y(%)与复工时间x(单位:天,x的取值为5,10,15,20,25,30)的回归关系,模型(1):y=a+bx,模型(2):y=ec+dx,设两模型的决定系数分别为.若两模型的残差图分别如下,则( )
A.
B.
C.
D.的关系不能确定
2.(2023江苏连云港灌南高级中学期中)设两个相关变量x和y分别满足下表:
x 1 2 3 4 5
y 1 2 8 8 16
若相关变量x和y可拟合为回归方程,则当x=6时,y的估计值为( )
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归方程u的斜率和截距的最小二乘估计分别为.参考数据:25.1≈34,25.2≈37.
A.33 B.37 C.65 D.73
3.(2024江苏徐州适应性测试)某中学对该校学生的学习兴趣和预习情况进行了长期的调查,学习兴趣分为兴趣高和兴趣一般两类,预习分为主动预习和不太主动预习两类.设事件A为学习兴趣高,事件B为主动预习.据统计显示,P(.
(1)计算P(A)和P(A|B)的值,并判断A与B是不是相互独立事件;
(2)为研究学习兴趣与主动预习是否有关,该校用分层抽样的方法抽取了一个容量为m(m∈N*)的样本,利用独立性检验,计算得=1.350.为提高检验结论的可靠性,现将样本容量变为原来的t(t∈N*)倍,使得能有99.5%的把握认为学习兴趣与主动预习有关,试确定t的最小值.
附: χ2=,其中n=a+b+c+d.
P(χ2≥x0) 0.10 0.05 0.010 0.005 0.001
x0 2.706 3.841 6.635 7.879 10.828
迁移创新
4.(2022江西宜春期末)某公司生产的玩偶自上市以来就好评不断,该公司某部门通过收集整理出了宣传力度(x)与好评量(y)之间的散点图(如图所示).
根据散点图中的数据,令s=,统计整理得到(si,yi)与(ti,yi)(i=1,2,3,…,13)的如下数据表,现计划用模型y=a+b或y=c+作为y关于x的回归方程.
10.15 109.94 3.04 0.16 13.94
-2.1 11.67 0.21 21.22
(1)设(si,yi)与(ti,yi)(i=1,2,3,…,13)的样本相关系数分别为r1,r2,求r1,r2的值,并根据其意义判断哪种模型更适合作为y与x的回归方程模型,求出该方程;
(2)为发挥线上购物的优越性,该公司通过网购平台提高销售量,组织A,B,C三家网店开展“秒杀”抢购活动,其中甲在A网店抢购一个订单,乙在B网店抢购一个订单,丙在C网店抢购一个订单,若三人在三家网店抢购订单成功的概率均为p,且三人是否抢购成功互不影响,记三人抢购成功的订单总数为Z.
①求Z的概率分布及E(Z);
②若每个订单由k(k≥2,k∈N*)个玩偶构成,记三人抢购成功的玩偶总数量为T,假设p=,求E(T)取最小值时正整数k的值.
参考数据:≈15.736 5,≈2.111 0.
答案与分层梯度式解析
综合拔高练
五年高考练
1.C 由于身高比较高的人,其体重可能大,也可能小,故选项A,B不正确;
由题中散点图知,身高和体重有明显的相关性,且身高增加时,体重也呈现增加的趋势,
所以身高与体重成正相关,故C正确,D错误.
故选C.
教材溯源 教材的例题及练习题具有典型性、示范性,而且具有可拓展的功能,高考试题中有许多以教材例题及练习题为原型,从题设、结论等方面多角度的探究与联想,类比迁移,延伸拓展.本题即是对教材P158练习T1(4)的改编.
2.C 题图2中的散点大致落在一条从左下角到右上角的直线附近,这说明成对样本数据之间存在正相关关系,故A、B错误;
把x=7代入经验回归方程=0.750 1x+0.610 5,得=5.861 2,故C正确;由于样本发生变化,故样本相关系数不一定相同,故D错误.
3.解析 (1)估计该林区这种树木平均一棵的根部横截面积为=0.06(m2),
平均一棵的材积量为=0.39(m3).
(2)样本相关系数r=
=
=
=
=≈0.97.
即该林区这种树木的根部横截面积与材积量的样本相关系数约为0.97.
(3)设这种树木的根部横截总面积为X m2,总材积量为Y m3,
则,则Y==1 209,
故该林区这种树木的总材积量的估计值为1 209 m3.
高考风向 高考对回归分析的考查,主要是基于最小二乘法的线性回归模型或可通过换元转化为线性回归模型的非线性回归模型,其中样本相关系数r用来判断成对数据的线性相关程度,决定系数R2用来判断模型拟合效果.解决成对数据的统计相关性问题,是要通过散点图或样本相关系数的计算、推断出两变量之间相关关系的类型,以及能够利用所提供的参考公式和数据进行回归方程的求解,并能利用回归方程进行预测.
4.解析 (1)
优级品 非优级品
甲车间 26 24
乙车间 70 30
K2=
==4.687 5,
∵3.841<4.687 5<6.635,
∴有95%的把握认为甲、乙两车间产品的优级品率存在差异,没有99%的把握认为甲、乙两车间产品的优级品率存在差异.
(2)由题知=0.64,p=0.5,n=150,
p+1.65≈0.5+≈0.567.
∵0.64>0.567,
∴,
∴可以认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
5.解析 (1)X的可能取值为0,1,2.
P(X=0)=,
∴X的分布列为
X 0 1 2
P
∴E(X)=0×=1.
(2)(i)m==23.4.
完成的列联表如下:
对照组 6 14
试验组 14 6
(ii)由(i)可得K2==6.4>3.841.
∴有95%的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异.
高考风向 借助于2×2列联表对分类变量的独立性检验是高考的重要考点.解决独立性检验问题的关键是理解独立性检验的基本思想,掌握独立性检验的基本步骤.本题在解决问题的过程中需要利用分布列、数学期望、中位数、成对数据的独立性检验等相关知识对条件和设问进行分析,体现了综合性和应用性.
6.解析 (1)列联表如下:
不够良好 良好 合计
病例组 40 60 100
对照组 10 90 100
合计 50 150 200
故K2==24>6.635,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(i)证明:
R=
=
=.
(ii)由题意得,P(A|B)=,
P(A|,
P(,
P(,
所以R==6.
7.解析 (1)由题意可得A公司长途客车准点的概率P1=,B公司长途客车准点的概率P2=.
(2)因为K2=≈3.205>2.706,
所以有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
三年模拟练
1.A 根据题图知模型(2)的残差点比较均匀地落在水平的带状区域中,且带状区域宽度窄,拟合精度较高,所以,故选A.
2.B 令z=log2y,则.
由题意得=12+22+32+42+52=55,
所以-1×3=-0.8,所以=2x-0.8,
当x=6时,=25.2≈37.故选B.
3.解析 (1)由已知,得P(A|B)=1-P(,
P(A|,
所以P(A)=P(B)P(A|B)+P(,
则P(A)P(B)=,
又P(AB)=P(B)P(A|B)=,
所以P(AB)≠P(A)P(B),
所以A与B不是相互独立事件.
(2)假设原列联表为
兴趣高 兴趣一般 合计
主动预习 a b a+b
不太主 动预习 c d c+d
合计 a+c b+d a+b+c+d
根据原数据有=1.350.
若将样本容量调整为原来的t(t∈N*)倍,
则新的列联表为
兴趣高 兴趣一般 合计
主动预习 ta tb t(a+b)
不太主 动预习 tc td t(c+d)
合计 t(a+c) t(b+d) t(a+b+c+d)
则χ2==1.350t≥7.879,解得t≥5.84,
又t∈N*,所以t的最小值为6.
4.解析 (1)易得r1=≈0.885 8,r2=≈-0.994 8.
∵|r1|<|r2|,
∴模型y=c+作为y关于x的回归方程模型更合适.
易得=-10,
=109.94+10×0.16=111.54,
∴y关于x的回归方程为+111.54.
(2)①由题意得Z~B(3,p),
则P(Z=0)=(1-p)3,
P(Z=1)=p(1-p)2=3p(1-p)2,
P(Z=2)=p2(1-p)=3p2(1-p),
P(Z=3)=p3,
∴Z的概率分布为
Z 0 1 2 3
P (1-p)3 3p(1-p)2 3p2(1-p) p3
∴E(Z)=3p.
②∵T=kZ,
∴E(T)=kE(Z)=3kp=3k,
令Sk=1-,则Sk+1=1-,
∴Sk+1-Sk=,
当k=2时,S33时,>Sk.
∴E(T)取最小值时正整数k的值为3或4.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)