11.2 成对数据的统计分析--2027通用版高考数学第一轮章节练(含答案)

文档属性

名称 11.2 成对数据的统计分析--2027通用版高考数学第一轮章节练(含答案)
格式 docx
文件大小 587.9KB
资源类型 试卷
版本资源 通用版
科目 数学
更新时间 2026-01-31 00:00:00

图片预览

文档简介

中小学教育资源及组卷应用平台
2027通用版高考数学第一轮
11.2 成对数据的统计分析
考点1 变量间的相关关系
五年高考
1.★★(2023天津,7,5分)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰“鸢飞戾天,鱼跃于渊”.鸢尾花因花瓣形如鸢尾而得名(图1),寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm),绘制对应散点图(图2).
计算得样本相关系数为0.864 2,利用最小二乘法求得相应的经验回归方程为=0.750 1x+0.610 5.根据以上信息,如下判断正确的为 (  )
A.花萼长度与花瓣长度不存在相关关系
B.花萼长度与花瓣长度负相关
C.花萼长度为7 cm的该品种鸢尾花的花瓣长度的平均值约为5.861 2 cm
D.若选取其他品种鸢尾花进行抽样,所得花萼长度与花瓣长度的样本相关系数一定为0.864 2
2.★★(2024天津,3,5分)下列散点图中,样本相关性系数最大的是 (  )
       
3.★★(跨学科·生物)(2020课标Ⅰ,文5,理5,5分)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是 (  )
A.y=a+bx    B.y=a+bx2
C.y=a+bex   D.y=a+bln x
4.★★★(2025上海,17,14分)2024年东京奥运会,中国获得了男子4×100米混合泳接力金牌.以下是历届奥运会男子4×100米混合泳接力项目冠军成绩记录(单位:秒),数据按照升序排列:206.78,207.46,207.95,209.34,209.35,210.68,213.73,214.84,216.93,216.93.
(1)求这组数据的极差与中位数;
(2)从这10个数据中任选3个,求恰有2个数据在211以上的概率;
(3)若比赛成绩y关于年份x的回归方程为,年份x的平均数为2 006,预测2028年冠军队的成绩(精确到0.01秒).
5.★★★(2022全国乙理,19,12分)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 1 2 3 4 5 6
根部横截面积xi 材积量yi 0.04 0.25 0.06 0.40 0.04 0.22 0.08 0.54 0.08 0.51 0.05 0.34
样本号i 7 8 9 10 总和
根部横截面积xi 材积量yi 0.05 0.36 0.07 0.46 0.07 0.42 0.06 0.40 0.6 3.9
并计算得=0.038,=1.615 8,xiyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数=,≈1.377.
三年模拟
1.★(2025届福建龙岩一中开学考,1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的相关系数为 (  )
A.-1   B.0   C.   D.1
2.★★(2026届广东毕业班第一次调研,3)已知样本点数据(xi,yi)(i=1,2,3,4,5)大致呈线性分布,且yi≤yi+1,其经验回归方程为,若y3=5,y5=8,数据yi的80%分位数为7,则当i=4时,随机误差的残差为 (  )
A.-0.5   B.0.5   C.-1.5   D.1.5
3.★★(2026届湖南部分学校大联考,4)为了研究y关于x的线性相关关系,收集了5组样本数据(见下表).若已求得一元线性回归方程x+0.34,则下列选项中正确的是 (  )
x 1 2 3 4 5
y 0.5 0.9 1 1.1 1.5
A.=0.22
B.x与y呈现负相关
C.当x=8时,y的预估值为2.2
D.去掉样本点(3,1)后,x与y的样本相关系数r必会改变
4.★★(2026届浙江Z20第一次联考,2)将收集到的6对样本数据(xi,yi)(i=1,2,3,4,5,6)制作成如图所示的散点图(点旁数据为该点坐标),由最小二乘法计算得回归直线l1的方程:,相关系数为r1,决定系数为.残差分析后确定点E对应残差过大,把它去掉后,再用剩下的5对样本数据计算得回归直线l2的方程:,相关系数为r2,决定系数为.则以下结论中,不正确的是 (  )
A.r1>0,r2>0    B.>0,>0
C.
5.★★★(多选)(2026届湖南衡阳八中期中,10)根据变量Y和x的成对样本数据,由一元线性回归模型,对应的残差如图所示,则残差模型 (  )
A.满足回归模型E(e)=0的假设
B.不满足回归模型E(e)=0的假设
C.满足回归模型D(e)=σ2的假设
D.不满足回归模型D(e)=σ2的假设
6.★★★(多选)(2025届广东广州摸底,9)中欧班列是推进“一带一路”沿线国家道路联通、贸易畅通的重要举措.在中欧班列带动下,某外贸企业出口额逐年提升,以下为该企业近6个月的出口额情况统计,若已求得y关于x的经验回归方程为=28x+,则 (  )
月份编号x 1 2 3 4 5 6
出口额y/万元 16 25 43 77 102 159
A.y与x正相关
B.样本数据y的第40百分位数为34
C.当x=3时,残差的绝对值最小
D.用模型y=enx+m描述y与x的关系更合适
7.★★★(2026届福建莆田一中月考,13)若变量x和y的4对观测数据为(-2,-10),(-1,-5),(1,4),(2,11),两个变量满足一元线性回归模型(随机误差ei=yi-bxi),则参数b的最小二乘估计值为    .
8.★★★(2026届广东广州阶段测试,15)经验表明,一般树的胸径(树的主干在地面以上1.3 m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据,并根据数据作出散点图(如图).
经计算得xi=348,yi=264,xiyi=7 793,=24,=6.
(1)推断两个变量是否线性相关,计算样本相关系数r(精确到0.01),并推断它们的相关程度;
(2)试根据以上数据建立树高关于胸径的经验回归方程(系数精确到0.01),并预测胸径为45 cm的树高.
附:相关系数r=,回归方程中,,.
9.★★★★(2026届重庆实验外国语学校月考,18)蝗虫能对农作物造成严重伤害,每只蝗虫的平均产卵数y(单位:个)和平均温度x(单位:℃)有关.现收集到一只蝗虫的产卵数y和温度x的8组观测数据,制成图1所示的散点图.现用两种模型①y=ebx+a,②y=cx2+d分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
根据收集到的数据,计算得到如下值:
(xi-)2 (ti-)2 (zi-) (xi-) (yi- )(ti-)
24 36 2.9 646 168 422 688 50.4 70 308
表中zi=ln yi,zi,ti=,ti.
(1)根据残差图,比较模型①、②的拟合效果,模型    比较合适.根据所选择的模型,利用上表中的参考数据,求出y关于x的回归方程.
(2)根据以往统计,该地每年平均温度达到30 ℃以上时蝗虫会对农作物造成严重伤害,需要人工防治,其他情况均不需要人工防治.设该地每年平均温度达到30 ℃以上的概率为p(0①求f(p)取得最大值时对应的概率p0;
②当f(p)取最大值时,设该地今后5年需要人工防治的次数为X,求X的均值和方差.
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线,.
考点2 独立性检验
五年高考
1.★★(2025全国一卷,15,13分)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1 000人,得到如下列联表:
    超声波检查结果 组别 正常 不正常 合计
患该疾病 20 180 200
未患该疾病 780 20 800
合计 800 200 1 000
(1)记超声波检查结果不正常者患该疾病的概率为p,求p的估计值;
(2)根据小概率值α=0.001的独立性检验,分析超声波检查结果是否与患该疾病有关.
附: χ2=,
P(χ2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
2.★★★(2024全国甲理,17,12分)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品 合格品 不合格品 总计
甲车间 26 24 0 50
乙车间 70 28 2 100
总计 96 52 2 150
(1)填写如下列联表:
优级品 非优级品
甲车间
乙车间
能否有95%的把握认为甲、乙两车间产品的优级品率存在差异 能否有99%的把握认为甲、乙两车间产品的优级品率存在差异
(2)已知升级改造前该工厂产品的优级品率p=0.5.设为升级改造后抽取的n件产品的优级品率,如果,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了 (≈12.247)
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
三年模拟
1.★★(创新情境)(2026届辽宁部分学校联考,15)随着我国人工智能(AI)的突破性发展,近期许多优秀的人工智能(AI)应用软件发布并上线.这些软件凭借强大的创新功能和极具吸引力的用户体验,在社交媒体上引发了广泛的讨论,产生了显著的社会效应.某科技公司新开发了一款人工智能(AI)应用软件,为了测试青年人和中年人对该软件的应用体验是否良好,某机构从中青年用户中随机调查了300人,得到如下2×2列联表(单位:人):
组别 应用体验 合计
良好 不良好
青年用户 3m+n 2m-n
中年用户 m+n m+2n 150
合计 300
(1)求m,n的值;
(2)补全2×2列联表,根据小概率值α=0.001的独立性检验,分析不同年龄段的用户对该软件的应用体验是否存在差异.
附:χ2=,n=a+b+c+d.
P(χ2≥k) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
2.★★★(2026届山东潍坊联考,15)某青少年跳水队共有100人,在强化训练前后,教练组对他们进行了成绩测试,分别得到如图1所示的强化训练前的频率分布直方图,如图2所示的强化训练后的频率分布直方图.
(1)根据图中数据,估计强化训练后的成绩(同一组中的数据用该组区间的中点值作代表)的众数与成绩的60%分位数;
(2)规定得分80分以上(含80分)的为“优秀”,低于80分的为“非优秀”.
组别 是否优秀 合计
优秀 非优秀
强化训练前
强化训练后
合计
将上面的表格补充完整,依据小概率值α=0.005的独立性检验,能否据此推断跳水运动员是否优秀与强化训练有关
附:χ2=,n=a+b+c+d.
α 0.05 0.010 0.005 0.001
xα 3.841 6.635 7.879 10.828
11.2 成对数据的统计分析
考点1 变量间的相关关系
五年高考
1.★★(2023天津,7,5分)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰“鸢飞戾天,鱼跃于渊”.鸢尾花因花瓣形如鸢尾而得名(图1),寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm),绘制对应散点图(图2).
计算得样本相关系数为0.864 2,利用最小二乘法求得相应的经验回归方程为=0.750 1x+0.610 5.根据以上信息,如下判断正确的为 (  )
A.花萼长度与花瓣长度不存在相关关系
B.花萼长度与花瓣长度负相关
C.花萼长度为7 cm的该品种鸢尾花的花瓣长度的平均值约为5.861 2 cm
D.若选取其他品种鸢尾花进行抽样,所得花萼长度与花瓣长度的样本相关系数一定为0.864 2
答案 C 
2.★★(2024天津,3,5分)下列散点图中,样本相关性系数最大的是 (  )
       
答案 A 
3.★★(跨学科·生物)(2020课标Ⅰ,文5,理5,5分)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是 (  )
A.y=a+bx    B.y=a+bx2
C.y=a+bex   D.y=a+bln x
答案 D 
4.★★★(2025上海,17,14分)2024年东京奥运会,中国获得了男子4×100米混合泳接力金牌.以下是历届奥运会男子4×100米混合泳接力项目冠军成绩记录(单位:秒),数据按照升序排列:206.78,207.46,207.95,209.34,209.35,210.68,213.73,214.84,216.93,216.93.
(1)求这组数据的极差与中位数;
(2)从这10个数据中任选3个,求恰有2个数据在211以上的概率;
(3)若比赛成绩y关于年份x的回归方程为,年份x的平均数为2 006,预测2028年冠军队的成绩(精确到0.01秒).
解析 (1)由题意,数据的最大值为216.93,最小值为206.78,则极差为216.93-206.78=10.15;
数据中间两数为209.35与210.68,
则中位数为=210.015.
故极差为10.15,中位数为210.015.
(2)由题意,数据共10个,211以上数据有4个,
设事件A=“恰有2个数据在211以上”,
则P(A)=,
故恰有2个数据在211以上的概率为.
(3)由题意,成绩的平均数为×(206.78+207.46+207.95+209.34+209.35+210.68+213.73+214.84+216.93+216.93)=211.399,
由直线过点(2 006,211.399),
得=211.399+0.311×2 006=835.265,
故回归直线方程为=-0.311x+835.265.
当x=2 028时,y=-0.311×2 028+835.265=204.557≈204.56.
故预测2 028年冠军队的成绩为204.56秒.
5.★★★(2022全国乙理,19,12分)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 1 2 3 4 5 6
根部横截面积xi 材积量yi 0.04 0.25 0.06 0.40 0.04 0.22 0.08 0.54 0.08 0.51 0.05 0.34
样本号i 7 8 9 10 总和
根部横截面积xi 材积量yi 0.05 0.36 0.07 0.46 0.07 0.42 0.06 0.40 0.6 3.9
并计算得=0.038,=1.615 8,xiyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数=,≈1.377.
解析 (1)估计该林区这种树木平均一棵的根部横截面积为=0.06(m2),平均一棵的材积量为=0.39(m3).
(2)样本相关系数
=
=
=
=
≈≈0.97.
【计算r=时,需要将分子、分母稍加变换,采用题设中给出的数据求解】
即该林区这种树木的根部横截面积与材积量的样本相关系数约为0.97.
(3)设这种树木的根部横截总面积为X m2,总材积量为Y m3,则,则Y==1 209,
所以该林区这种树木的总材积量的估计值为1 209 m3.
三年模拟
1.★(2025届福建龙岩一中开学考,1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的相关系数为 (  )
A.-1   B.0   C.   D.1
答案 D 
2.★★(2026届广东毕业班第一次调研,3)已知样本点数据(xi,yi)(i=1,2,3,4,5)大致呈线性分布,且yi≤yi+1,其经验回归方程为,若y3=5,y5=8,数据yi的80%分位数为7,则当i=4时,随机误差的残差为 (  )
A.-0.5   B.0.5   C.-1.5   D.1.5
答案 B 
3.★★(2026届湖南部分学校大联考,4)为了研究y关于x的线性相关关系,收集了5组样本数据(见下表).若已求得一元线性回归方程x+0.34,则下列选项中正确的是 (  )
x 1 2 3 4 5
y 0.5 0.9 1 1.1 1.5
A.=0.22
B.x与y呈现负相关
C.当x=8时,y的预估值为2.2
D.去掉样本点(3,1)后,x与y的样本相关系数r必会改变
答案 A 
4.★★(2026届浙江Z20第一次联考,2)将收集到的6对样本数据(xi,yi)(i=1,2,3,4,5,6)制作成如图所示的散点图(点旁数据为该点坐标),由最小二乘法计算得回归直线l1的方程:,相关系数为r1,决定系数为.残差分析后确定点E对应残差过大,把它去掉后,再用剩下的5对样本数据计算得回归直线l2的方程:,相关系数为r2,决定系数为.则以下结论中,不正确的是 (  )
A.r1>0,r2>0    B.>0,>0
C.
答案 D 
5.★★★(多选)(2026届湖南衡阳八中期中,10)根据变量Y和x的成对样本数据,由一元线性回归模型,对应的残差如图所示,则残差模型 (  )
A.满足回归模型E(e)=0的假设
B.不满足回归模型E(e)=0的假设
C.满足回归模型D(e)=σ2的假设
D.不满足回归模型D(e)=σ2的假设
答案 BD 
6.★★★(多选)(2025届广东广州摸底,9)中欧班列是推进“一带一路”沿线国家道路联通、贸易畅通的重要举措.在中欧班列带动下,某外贸企业出口额逐年提升,以下为该企业近6个月的出口额情况统计,若已求得y关于x的经验回归方程为=28x+,则 (  )
月份编号x 1 2 3 4 5 6
出口额y/万元 16 25 43 77 102 159
A.y与x正相关
B.样本数据y的第40百分位数为34
C.当x=3时,残差的绝对值最小
D.用模型y=enx+m描述y与x的关系更合适
答案 AD 
7.★★★(2026届福建莆田一中月考,13)若变量x和y的4对观测数据为(-2,-10),(-1,-5),(1,4),(2,11),两个变量满足一元线性回归模型(随机误差ei=yi-bxi),则参数b的最小二乘估计值为    .
答案 5.1
8.★★★(2026届广东广州阶段测试,15)经验表明,一般树的胸径(树的主干在地面以上1.3 m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据,并根据数据作出散点图(如图).
经计算得xi=348,yi=264,xiyi=7 793,=24,=6.
(1)推断两个变量是否线性相关,计算样本相关系数r(精确到0.01),并推断它们的相关程度;
(2)试根据以上数据建立树高关于胸径的经验回归方程(系数精确到0.01),并预测胸径为45 cm的树高.
附:相关系数r=,回归方程中,,.
解析 (1)根据树高与树的胸径的散点图,可判断两个变量线性相关.
根据题中所给数据,得n=12,=29,=22.
所以r=≈0.95>0.75,
由于r的值接近于1,因此线性相关性较强.
故两个变量线性相关,且相关程度较强.
(2)由(1)知n=12,=29,=22.
所以
=≈0.24,
×29≈15.10.
所以经验回归方程为=0.24x+15.10.
当x=45时,=0.24×45+15.10=25.9,即树高的预测值为25.9 m.
故树高关于胸径的经验回归方程为=0.24x+15.10,预测胸径为45 cm的树高为25.9 m.
9.★★★★(2026届重庆实验外国语学校月考,18)蝗虫能对农作物造成严重伤害,每只蝗虫的平均产卵数y(单位:个)和平均温度x(单位:℃)有关.现收集到一只蝗虫的产卵数y和温度x的8组观测数据,制成图1所示的散点图.现用两种模型①y=ebx+a,②y=cx2+d分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
根据收集到的数据,计算得到如下值:
(xi-)2 (ti-)2 (zi-) (xi-) (yi- )(ti-)
24 36 2.9 646 168 422 688 50.4 70 308
表中zi=ln yi,zi,ti=,ti.
(1)根据残差图,比较模型①、②的拟合效果,模型    比较合适.根据所选择的模型,利用上表中的参考数据,求出y关于x的回归方程.
(2)根据以往统计,该地每年平均温度达到30 ℃以上时蝗虫会对农作物造成严重伤害,需要人工防治,其他情况均不需要人工防治.设该地每年平均温度达到30 ℃以上的概率为p(0①求f(p)取得最大值时对应的概率p0;
②当f(p)取最大值时,设该地今后5年需要人工防治的次数为X,求X的均值和方差.
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线,.
解析 (1)模型①比较合适,理由如下:
模型①残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②带状区域宽度窄,所以模型①的拟合效果更好,故选模型①比较合适.
【思路探究:换元法解决非线性回归方程问题,在模型①y=ebx+a中,两边取自然对数:ln y=bx+a,换元:z=ln y,将非线性回归模型转化为线性回归模型解决】
y=ebx+a,则ln y=bx+a,令z=ln y,则x,
由所给的参考数据可得,
=0.3,
所以=2.9-0.3×24=-4.3,
因此z关于x的经验回归方程为=0.3x-4.3,即ln y=0.3x-4.3,
所以产卵数y关于温度x的回归方程为=e0.3x-4.3.
(2)①由题意得, f(p)=p2(1-p)n-2(0【思路探究:二项分布问题直接用公式求概率,再利用导数知识求最大值】
所以f'(p)=2p(1-p)n-2-(n-2)p2·(1-p)n-3=p(1-p)n-3[2(1-p)-(n-2)·p]=p(1-p)n-3(2-np),
令f'(p)=0,得p=,当p∈时, f'(p)>0,当p∈时, f'(p)<0,
所以f(p)在上单调递增,在上单调递减,
所以f(p)取得最大值时对应的概率p0=(n≥3,n∈N*).
②由①知,当p0=(n≥3,n∈N*)时, f(p)取最大值,所以当n=5时,p0=,
由题意可知每年需要人工防治的概率为p=,且X服从二项分布,即X~B,
所以E(X)=np=5×=2,D(X)=np(1-p)=5××.
考点2 独立性检验
五年高考
1.★★(2025全国一卷,15,13分)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1 000人,得到如下列联表:
    超声波检查结果 组别 正常 不正常 合计
患该疾病 20 180 200
未患该疾病 780 20 800
合计 800 200 1 000
(1)记超声波检查结果不正常者患该疾病的概率为p,求p的估计值;
(2)根据小概率值α=0.001的独立性检验,分析超声波检查结果是否与患该疾病有关.
附: χ2=,
P(χ2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
解析 (1)由题意知超声波检查结果不正常的人数为200,患该疾病的人数为180,
所以超声波检查结果不正常者患该疾病的概率的估计值p==0.9.
(2)零假设为H0:超声波检查结果与患该疾病无关.
χ2=
=765.625>10.828=x0.001,
根据小概率值α=0.001的独立性检验,我们推断H0不成立,即超声波检查结果与患该疾病有关.
2.★★★(2024全国甲理,17,12分)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品 合格品 不合格品 总计
甲车间 26 24 0 50
乙车间 70 28 2 100
总计 96 52 2 150
(1)填写如下列联表:
优级品 非优级品
甲车间
乙车间
能否有95%的把握认为甲、乙两车间产品的优级品率存在差异 能否有99%的把握认为甲、乙两车间产品的优级品率存在差异
(2)已知升级改造前该工厂产品的优级品率p=0.5.设为升级改造后抽取的n件产品的优级品率,如果,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了 (≈12.247)
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
解析 (1)列联表如下:
优级品 非优级品
甲车间 26 24
乙车间 70 30
K2==4.687 5,
∵3.841<4.687 5<6.635,
∴有95%的把握认为甲、乙两车间产品的优级品率存在差异,没有99%的把握认为甲、乙两车间产品的优级品率存在差异.
(2)由题知=0.64,
∵p=0.5,∴p+1.65=0.5+1.65×
=0.5+≈0.5+≈0.567,
∵,∴可以认为生产线智能化升级改造后,该工厂的优级品率提高了.
三年模拟
1.★★(创新情境)(2026届辽宁部分学校联考,15)随着我国人工智能(AI)的突破性发展,近期许多优秀的人工智能(AI)应用软件发布并上线.这些软件凭借强大的创新功能和极具吸引力的用户体验,在社交媒体上引发了广泛的讨论,产生了显著的社会效应.某科技公司新开发了一款人工智能(AI)应用软件,为了测试青年人和中年人对该软件的应用体验是否良好,某机构从中青年用户中随机调查了300人,得到如下2×2列联表(单位:人):
组别 应用体验 合计
良好 不良好
青年用户 3m+n 2m-n
中年用户 m+n m+2n 150
合计 300
(1)求m,n的值;
(2)补全2×2列联表,根据小概率值α=0.001的独立性检验,分析不同年龄段的用户对该软件的应用体验是否存在差异.
附:χ2=,n=a+b+c+d.
P(χ2≥k) 0.1 0.05 0.01 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
解析 (1)由已知得青年用户的人数为300-150=150,

(2)补全2×2列联表如下:
组别 应用体验 合计
良好 不良好
青年用户 120 30 150
中年用户 60 90 150
合计 180 120 300
零假设为H0:不同年龄段的用户对该软件的应用体验不存在差异,
由题意得χ2==50>10.828.
根据小概率值α=0.001的独立性检验,推断H0不成立,
即认为不同年龄段的用户对该软件的应用体验存在差异.
2.★★★(2026届山东潍坊联考,15)某青少年跳水队共有100人,在强化训练前后,教练组对他们进行了成绩测试,分别得到如图1所示的强化训练前的频率分布直方图,如图2所示的强化训练后的频率分布直方图.
(1)根据图中数据,估计强化训练后的成绩(同一组中的数据用该组区间的中点值作代表)的众数与成绩的60%分位数;
(2)规定得分80分以上(含80分)的为“优秀”,低于80分的为“非优秀”.
组别 是否优秀 合计
优秀 非优秀
强化训练前
强化训练后
合计
将上面的表格补充完整,依据小概率值α=0.005的独立性检验,能否据此推断跳水运动员是否优秀与强化训练有关
附:χ2=,n=a+b+c+d.
α 0.05 0.010 0.005 0.001
xα 3.841 6.635 7.879 10.828
解析 (1)强化训练后的成绩的众数约为85,
由于前三组频率之和为0.04+0.16+0.2=0.4,前四组频率之和为0.4+0.32=0.72,
故设60%分位数为80+x,则0.032x=0.2,
解得x=6.25,所以60%分位数约为86.25.
(2)零假设为H0:跳水运动员是否优秀与强化训练无关.
补充完整的表格为
组别 是否优秀 合计
优秀 非优秀
强化训练前 40 60 100
强化训练后 60 40 100
合计 100 100 200
则χ2==8>7.879=x0.005.
根据小概率值α=0.005的独立性检验,推断H0不成立,即认为跳水运动员是否优秀与强化训练有关.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)
同课章节目录