中小学教育资源及组卷应用平台
2025人教A版数学选择性必修第三册
第八章综合训练
一、选择题(本题共8小题,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关联时,最有说服力的方法是( )
A.平均数与方差
B.回归分析
C.独立性检验
D.概率
2.[2024上海浦东新区高三期中]通过随机抽样,我们绘制了如图所示的某种商品每千克价格(单位:元)与该商品消费者年需求量(单位:千克)的散点图.若去掉图中右下方的点A后,下列说法正确的是 ( )
消费者年需求量与商品每千克价格的散点图
A.“每千克价格”与“年需求量”这两个变量由负相关变为正相关
B.“每千克价格”与“年需求量”这两个变量的线性相关程度不变
C.“每千克价格”与“年需求量”这两个变量的样本相关系数变大
D.“每千克价格”与“年需求量”这两个变量的样本相关系数变小
3.[2024陕西高二期末]设变量X和变量Y的样本相关系数为r1,变量U和变量V的样本相关系数为r2,且r1=-0.734,r2=0.984,则( )
A.X和Y正相关,且X和Y的线性相关程度强于U和V的线性相关程度
B.X和Y负相关,且X和Y的线性相关程度强于U和V的线性相关程度
C.U和V负相关,且X和Y的线性相关程度弱于U和V的线性相关程度
D.U和V正相关,且X和Y的线性相关程度弱于U和V的线性相关程度
4.[2024黑龙江高二开学考试]色差和色度是衡量玩具质量优劣的重要指标,已知某产品的色度y和色差x之间满足线性相关关系,且=0.8x-1.8,现有一对测量数据为(30,22.8),则该数据的残差为 ( )
A.0.6 B.0.4 C.-0.4 D.-0.6
5.下列关于回归分析的说法错误的是( )
A.经验回归直线一定过点()
B.在残差图中,残差比较均匀地落在水平的带状区域中,说明选用的模型比较合适
C.残差平方和越小,模型的拟合的效果越好
D.若甲、乙两个模型的R2分别约为0.98和0.80,则模型乙的拟合效果更好
6.某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到两种疗法治疗数据的2×2列联表.
单位:人
疗法 疗效 合计
未治愈 治愈
甲 15 52 67
乙 6 63 69
合计 21 115 136
经计算得到χ2≈4.881,根据小概率值α=0.005的独立性检验(已知χ2独立性检验中x0.005=7.879),则可以认为( )
A.两种疗法的效果存在差异
B.两种疗法的效果存在差异,这种判断犯错误的概率不超过0.005
C.两种疗法的效果没有差异
D.两种疗法的效果没有差异,这种判断犯错误的概率不超过0.005
7.经验表明,某种树的高度y(单位:m)与胸径x(单位:cm)(树的主干在地面以上1.3米处的直径)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的经验回归方程为=0.25x+15.据此模型进行推测,下列结论正确的是 ( )
A.y与x负相关
B.胸径为20 cm的树,其高度一定为20 m
C.经过一段时间,样本中一棵树的胸径增加1 cm,估计其高度增加0.25 m
D.样本数据(xi,yi)(i=1,2,…,n)中至少有一对满足经验回归方程=0.25x+15
8.2025年第九届亚冬会在哈尔滨举办,校团委对“是否喜欢冰雪运动与学生性别的关联”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢冰雪运动的人数占男生人数的,女生中喜欢冰雪运动的人数占女生人数的,若依据α=0.05的独立性检验,认为是否喜欢冰雪运动与学生性别有关联,则被调查的学生中男生的人数不可能是( )
附:χ2=.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.48 B.54 C.60 D.66
二、选择题(本题共3小题,在每小题给出的选项中,有多项符合题目要求)
9.某地响应号召,建立农业科技图书馆,供农民免费借阅,收集了近5年的借阅数据如下表:
年份 2019 2020 2021 2022 2023
年份代码x 1 2 3 4 5
年借阅量y/万册 4.9 5.1 5.5 5.7 5.8
根据上表,可得y关于x的经验回归方程为=0.24x+,则下列说法正确的有( )
A.=4.68
B.近5年借阅量估计以0.24万册/年的速度增长
C.x与y的样本相关系数r>0
D.2024年的借阅量一定不少于6.12万册
10.下列结论正确的有( )
A.在一组样本数据的散点图中,若所有样本点(xi,yi)都在直线y=0.95x+1上,则这组样本数据的样本相关系数为0.95
B.已知随机变量ξ~N(3,4),若ξ=2η+1,则D(η)=1
C.在2×2列联表中,若每个数据a,b,c,d均变成原来的2倍,则χ2也变成原来的2倍χ2=,其中n=a+b+c+d
D.分别抛掷2枚质地均匀的骰子,若事件A=“第一枚骰子正面向上的点数是奇数”,B=“2枚骰子正面向上的点数相同”,则A,B互为独立事件
11.某养老院有110名老人,经过一年的跟踪调查,过去的一年中他们是否患过某流行疾病和性别的相关数据如下表所示:
性别 是否患过某流行疾病 合计
患过该疾病 未患过该疾病
男 a=20 b a+b
女 c d=50 c+d
合计 a+c 80 110
下列说法正确的有( )
参考公式:χ2=,其中n=a+b+c+d.
附表:
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
A.
B.χ2>6.635
C.根据小概率值α=0.01的独立性检验,认为是否患过该流行疾病与性别有关联,此推断犯错误的概率不超过0.01
D.根据小概率值α=0.01的独立性检验,没有充分的证据推断是否患过该流行疾病与性别有关联
三、填空题(本题共3小题)
12.某高校“统计初步”课程的教师随机统计了一些学生的情况,具体数据如下表:
性别 不选该课程 选择该课程
男 13 10
女 7 20
根据表中的数据,依据α=0.05的独立性检验,认为选择该门课程与性别 关联.(填“有”或“没有”)
13.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=bxi+a+ei(i=1,2,…,n),且ei=0,则R2为 .
14.[2024河南驻马店高二期末]以曲线Y=cekX拟合一组数据时,经Z=ln Y代换后的经验回归方程为=3X+5,则c= ,k= .
四、解答题(本题共5小题,解答应写出文字说明、证明过程或演算步骤)
15.[2024河南南阳高二阶段练习]如图是我国2016年至2022年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1~7分别对应年份2016~2022.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用样本相关系数(精确到0.01)加以说明;
(2)建立y关于t的经验回归方程t+精确到0.01),预测2024年我国生活垃圾无害化处理量.
参考数据:yi=9.32,tiyi=40.08,=0.55,≈2.646.
参考公式:样本相关系数r=,经验回归直线t+的斜率和截距的最小二乘估计公式分别为.
16.已知甲、乙两地生产同一种瓷器,现从两地的瓷器中随机抽取了一共300件统计质量指标值,得到如图所示的两个统计图,其中甲地瓷器的质量指标值在区间[95,105]和[125,135]上的频数相等.
甲地瓷器质量频率分布直方图
乙地瓷器质量扇形图
(1)求频率分布直方图中x的值,并估计甲地瓷器质量指标值的平均值;(同一组中的数据用该组区间的中点值作代表)
(2)规定该种瓷器的质量指标值不低于125为特等品,且已知样本中甲地的特等品比乙地的特等品多10个,结合乙地瓷器质量扇形图完成下面的2×2列联表,并依据α=0.05的独立性检验,分析甲、乙两地的瓷器质量是否有差异.
单位:件
生产地 质量指标 合计
特等品 非特等品
甲地
乙地
合计
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
17.为推行“新课堂”教学法,某化学老师分别用传统教学和“新课堂”两种不同的教学方式,在甲、乙两个平行班级进行教学实验,为了比较教学效果,期中考试后,分别从两个班级中各随机抽取20名学生的成绩进行统计,结果如下表.记成绩不低于70分者为“成绩优良”.
分数 [50,59) [60,69) [70,79) [80,89) [90,100]
甲班频数 5 6 4 4 1
乙班频数 1 3 6 5 5
(1)由以上统计数据填写下面2×2列联表,依据α=0.05的独立性检验,能否认为成绩优良与教学方式有关联
单位:人
成绩 班级 合计
甲班 乙班
优良
不优良
合计
(2)现从上述40人中,学校按成绩是否优良采用分层随机抽样的方法抽取8人进行考核.在这8人中,记乙班成绩不优良的人数为X,求X的分布列及数学期望.
附:χ2=.
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
18.近期某公交公司推出扫码支付乘车优惠活动.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如下表所示:
x 1 2 3 4 5 6 7
y 6 11 21 34 66 101 196
根据以上数据,绘制了散点图.
(1)根据散点图判断,y=a+bx与y=cdx(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x的经验回归方程模型;(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中的数据,求y关于x的经验回归方程,并预测活动推出第8天使用扫码支付的人次.
参考数据:其中vi=lg yi,vi
xiyi xivi 100.54
62.14 1.54 2 535 50.12 3.47
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归直线 u的斜率和截距的最小二乘估计分别为.
19.某医疗队针对某非洲国家制定的猴痘病毒防控措施之一是要求猴痘病毒确诊患者的密切接触者集中医学观察21天.在医学观察期结束后发现密切接触者中未接种过天花疫苗者感染病毒的比例较大.对该国家200个接种与未接种天花疫苗的密切接触者样本医学观察结束后,统计了感染病毒情况,得到下面的列联表:
单位:人
天花疫苗 猴痘病毒 合计
感染 未感染
未接种 30 60 90
接种 20 90 110
合计 50 150 200
(1)依据α=0.01的独立性检验,分析密切接触者感染猴痘病毒与未接种天花疫苗是否有关联.
(2)以样本中结束医学观察的密切接触者感染猴痘病毒的频率估计概率.现从该国所有结束医学观察的密切接触者中随机抽取4人进行感染猴痘病毒人数统计,求其中至多有2人感染猴痘病毒的概率.
(3)该国现有一个中风险村庄,当地政府决定对村庄内所有住户进行排查.在排查期间,发现一户3口之家与确诊患者有过密切接触,这种情况下医护人员要对其家庭成员逐一进行猴痘病毒检测.每名成员进行检测后即告知结果,若检测结果呈阳性,则该家庭被确定为“感染高危家庭”.假设该家庭每个成员检测呈阳性的概率均为p(0
附:χ2=,n=a+b+c+d.
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
参考答案
第八章综合训练
1.C
2.D 对于A,去掉图中右下方的点A后,根据图象,两个变量还是负相关,故A错误;
对于B,C,D,去掉图中右下方的点A后,相对来说数据会集中,相关程度会更高,
但因为是负相关,样本相关系数会更接近-1,即样本相关系数会变小,故D正确,B,C错误.故选D.
3.D 由样本相关系数r1=-0.734<0,可知变量X与Y负相关,
由样本相关系数r2=0.984>0,可知变量U与V正相关.
又|r1|<|r2|,
所以变量U与V的线性相关程度比变量X与Y的线性相关程度强.
故选D.
4.A 当x=30时,=0.8×30-1.8=22.2,
所以该数据的残差为22.8-22.2=0.6.故选A.
5.D 对于A,经验回归直线一定过点(),故A正确;
对于B,可用残差图判断模型的拟合效果,残差比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高,故B正确;
对于C,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故C正确;
对于D,因为R2取值越大,说明残差平方和越小,模型的拟合效果越好,又因为甲、乙两个模型的R2分别约为0.98和0.80,且0.98>0.80,所以甲模型的拟合效果好,故D错误.
故选D.
6.C 零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.
根据列联表中的数据,χ2≈4.881<7.879=x0.005,根据小概率值α=0.005的独立性检验,
没有充分证据推断H0不成立,
因此可以认为H0成立,
即认为两种疗法效果没有差异.故选C.
7.C 由经验回归方程=0.25x+15,可知y与x正相关,故A错误;
取x=20,得=0.25×20+15=20,说明胸径为20 cm的树,预测其高度为20 m,但也不一定就是20 m,故B错误;
样本中一棵树的胸径增加1 cm,估计其高度增加0.25 m,故C正确;
经验回归直线恒过样本点的中心,但样本中的点不一定经过经验回归直线,故D错误.
8.A 设男生人数为6n(n∈N*),
因为被调查的男、女生人数相同,
所以女生人数也为6n(n∈N*),根据题意列出2×2列联表.
单位:人
是否喜欢冰雪运动 性别 合计
男 女
喜欢 5n 4n 9n
不喜欢 n 2n 3n
合计 6n 6n 12n
零假设为H0:是否喜欢冰雪运动与学生性别无关联.
χ2=
因为依据α=0.05的独立性检验,认为是否喜欢冰雪运动与学生性别有关联,
所以χ2≥x0.05,即3.841,解得6n≥51.854,
又n∈N*,
所以A选项中的人数不符合题意.故选A.
9.ABC 把=3,=5.4代入=0.24x+,可得=4.68,故A正确;
由=0.24x+,得直线的斜率为0.24,0.24万册是每年的借阅量的增长量的预测值,故B正确;
因为=0.24>0,所以x与y正相关,故r>0,故C正确;
把x=6代入=0.24x+4.68,得=6.12,然而6.12万册是预测值,不是精确值,故D错误.
故选ABC.
10.BCD 对于A,若所有样本点(xi,yi)都在直线y=0.95x+1上,则这组样本数据的样本相关系数为1,故A错误;
对于B,若ξ~N(3,4),则D(ξ)=4,又ξ=2η+1,即η=-,
则D(η)=D(ξ)=1,故B正确;
对于C,在2×2列联表中,若每个数据a,b,c,d均变成原来的2倍,
则=2,
即χ2也变成原来的2倍,故C正确;
对于D,分别抛掷2枚质地均匀的骰子,样本点总数为6×6=36,
事件A=“第一枚骰子正面向上的点数是奇数”,则事件A包含的样本点数为3×6=18,
事件B=“2枚骰子正面向上的点数相同”,则事件B包含的样本点数为6×1=6,
所以P(A)=,P(B)=,
P(AB)=,
所以P(AB)=P(A)P(B),则A,B互为独立事件,故D正确.故选BCD.
11.ABC 根据列联表中的数据可得a=20,b=30,c=10,d=50.
对于A,经计算可得,故A正确;
对于B,零假设为H0:是否患过该流行疾病与性别无关联,经计算可得χ2=7.486>6.635=x0.01,根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为是否患过该流行疾病与性别有关联,此推断犯错误的概率不超过0.01,故B,C正确,D错误.故选ABC.
12.有 零假设为H0:选择该门课程与性别无关联.根据表中的数据,得到χ2=4.84>3.841=x0.05,依据α=0.05的独立性检验,我们推断H0不成立,即认为选择该门课程与性别有关联,此推断犯错误的概率不超过0.05.
13.1 由ei=0,知yi=,即yi-=0,
故R2=1-=1-0=1.
14.e5 3 因为Y=cekX,所以ln Y=ln (cekX)=ln c+ln ekX=ln c+kX.
令Z=ln Y,则Z=ln c+kX.
所以ln c=5,k=3,则c=e5,k=3.
15.解 (1)=4,
=1+4+9+16+25+36+49=140,
r==
0.96,
说明这组样本数据的线性相关程度很强.
(2)由(1)可知=4,=140,
==0.1,
-0.1×4≈0.93,所以=0.1t+0.93.
当t=9时,=0.1×9+0.93=1.83,
所以y关于t的经验回归方程为=0.1t+0.93.
预测2024年我国生活垃圾无害化处理量约为1.83亿吨.
16.解(1)由(0.008+x+0.026+0.03+x+0.004)×10=1,解得x=0.016.
甲地瓷器质量指标的平均值为=90×0.08+100×0.16+110×0.26+120×0.3+130×0.16+140×0.04=114.2.
(2)设300件样品中甲地瓷器有m件,则乙地瓷器有(300-m)件,因为甲地的特等品比乙地的特等品多10个,从而有0.2m-(300-m)×30%=10,解得m=200.
零假设为H0:甲、乙两地的瓷器质量没有差异.
从而2×2列联表如下:
单位:件
生产地 质量指标 合计
特等品 非特等品
甲地 40 160 200
乙地 30 70 100
合计 70 230 300
所以χ2=3.727<3.841=x0.05,所以依据α=0.05的独立性检验,没有充分证据推断H0不成立,因此认为H0成立,即认为甲、乙两地的瓷器质量没有差异.
17.解(1) 单位:人
成绩 班级 合计
甲班 乙班
优良 9 16 25
不优良 11 4 15
合计 20 20 40
零假设为H0:成绩优良与教学方式无关联.根据2×2列联表中的数据,可得χ2=5.227>3.841=x0.05,依据α=0.05的独立性检验,我们推断H0不成立,即认为成绩优良与教学方式有关联,此推断犯错误的概率不大于0.05.
(2)由列联表可知在8人中成绩不优良的人数为8=3,则X的可能取值为0,1,2,3.
P(X=0)=;P(X=1)=;
P(X=2)=;P(X=3)=
所以X的分布列为
X 0 1 2 3
P
E(X)=0+1+2+3
18.解(1)根据散点图判断y=cdx适宜作为扫码支付的人次y关于活动推出天数x的经验回归方程模型.
(2)由(1)知y=cdx,两边同时取对数得lg y=lg c+(lg d)·x,设v=lg y,
则=4,=12+22+32+42+52+62+72=140,
所以lgd==0.25,
所以lgc=-(lg d)=1.54-0.25×4=0.54.
所以v关于x的经验回归方程为=0.54+0.25x,则y关于x的非线性经验回归方程为=100.54+0.25x=3.47×100.25x,当x=8时,=3.47×102=347,故预测活动推出第8天使用扫码支付的人次为347.
19.解(1)零假设为H0:密切接触者感染猴痘病毒与未接种天花疫苗无关联.
依题意知,χ2=6.061<6.635=x0.01,所以依据α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为密切接触者感染猴痘病毒与未接种天花疫苗无关联.
(2)由题意得,该地区每名密切接触者感染病毒的概率为
设随机抽取的4人中至多有2人感染病毒为事件A,
则P(A)=1-3-4=
(3)设事件B为该家庭检测了2名成员确定为“感染高危家庭”;事件C为该家庭检测了3名成员确定为“感染高危家庭”,
则P(B)=(1-p)p,P(C)=(1-p)2p,
所以f(p)=(1-p)p+(1-p)2p=p(1-p)(2-p),
设x=1-p,x>0,则p=1-x,所以y=(1-x)x(1+x)=x-x3,
对其求导得y'=1-3x2,令y'=0,得x=,此时p=1-,f(p)取得最大值.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)