2024人教版高中数学选择性必修第三册同步练习题(含解析)--第八章 成对数据的统计分析拔高练

文档属性

名称 2024人教版高中数学选择性必修第三册同步练习题(含解析)--第八章 成对数据的统计分析拔高练
格式 docx
文件大小 1.1MB
资源类型 试卷
版本资源 人教A版(2019)
科目 数学
更新时间 2023-10-16 17:54:29

图片预览

文档简介

中小学教育资源及组卷应用平台
2024人教版高中数学选择性必修第三册同步
第八章 成对数据的统计分析
综合拔高练
五年高考练
考点1 变量的相关关系与一元线性回归模型
1.(2020全国Ⅰ理,5)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是(  )
A.y=a+bx    B.y=a+bx2
C.y=a+bex    D.y=a+bln x
2.(山东高考,5)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为=x+.已知xi=225,yi=1 600,=4.该班某学生的脚长为24,据此估计其身高为(  )
A.160    B.163  
C.166    D.170
3.(2022全国乙理,19)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本 号i 1 2 3 4 5 6 7 8 9 10
根部 横截 面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积 量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得=0.038,=1.615 8,xiyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数r=,≈1.377.
考点2 独立性检验及其应用
4.(2022全国甲文,17)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
准点班次数 未准点班次数
A 240 20
B 210 30
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关
附:K2=,
P(K2≥k) 0.100 0.050 0.010
k 2.706 3.841 6.635
.
5.(2020全国Ⅲ理,18)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
     锻炼人次 空气质量等级     [0,200] (200,400] (400,600]
1(优) 2 16 25
2(良) 5 10 12
3(轻度污染) 6 7 8
4(中度污染) 7 2 0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
人次≤400 人次>400
空气质量好
空气质量不好
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
.
6.(2023全国甲理,19)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).
(1)设X表示指定的两只小白鼠中分配到对照组的只数,求X的分布列和数学期望;
(2)试验结果如下:
对照组的小白鼠体重的增加量从小到大排序为
15.2 18.8 20.2 21.3 22.5 23.2 25.8
26.5 27.5 30.1 32.6 34.3 34.8 35.6
35.6 35.8 36.2 37.3 40.5 43.2
试验组的小白鼠体重的增加量从小到大排序为
7.8 9.2 11.4 12.4 13.2 15.5 16.5
18.0 18.8 19.2 19.8 20.2 21.6 22.8
23.6 23.9 25.1 28.2 32.3 36.5
(i)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表:
对照组
试验组
(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异
附:K2=,
P(K2≥k) 0.100 0.050 0.010
k 2.706 3.841 6.635
.
7.(2022新高考Ⅰ,20)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好 良好
病例组 40 60
对照组 10 90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(i)证明:R=·;
(ii)利用该调查数据,给出P(A|B),P(A|)的估计值,并利用(i)的结果给出R的估计值.
附:K2=,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
.
三年模拟练
应用实践
1.(2023江苏连云港灌南高级中学期中)设两个相关变量x和y分别满足下表:
x 1 2 3 4 5
y 1 2 8 8 16
若相关变量x和y可拟合为非线性经验回归方程=,则当x=6时,y的估计值为(  )
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归方程=+u的斜率和截距的最小二乘估计分别为=,=-.
参考数据:25.1≈34,25.2≈37.
A.33  B.37  C.65  D.73
2.(2022四川大数据精准教学联盟统测)某县对高一年级学生进行体质测试(简称体测),现随机抽取了800名学生的体测结果等级(“良好以下”或“良好及以上”)进行分析,并制成如下列联表.
单位:名
良好以下 良好及以上 合计
男生 400 550
女生 50
合计 600 800
(1)将列联表补充完整,并依据α=0.05的独立性检验,分析本次体测结果等级与性别是否有关系;
(2)将频率视为概率,用样本估计总体.若从全县所有高一学生中,采取简单随机抽样的方法每次抽取1名学生,对其成绩进行具体指标分析,连续抽取4次,且每次抽取的结果相互独立,记被抽取的4名学生的体测结果等级为“良好及以上”的人数为ξ,求ξ的分布列和数学期望E(ξ).
附: χ2=,n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
3.(2022福建厦门二检)一个车间为了规定工时定额,需要确定一台机器持续加工零件所花费的时间,为此进行了10次试验,相关数据如下表所示:
零件数量x/个 10 20 30 40 50
时间y/分钟 76 85 92 95 100
零件数量x/个 60 70 80 90 100
时间y/分钟 110 115 121 125 131
(1)通过数据分析,发现y与x之间呈线性相关关系,求y关于x的经验回归方程,并预测持续加工480个零件所花费的时间;
(2)机器持续工作,高负荷运转,会影响产品质量.经调查,机器持续工作前6小时内所加工出来的零件的次品率为0.1,之后加工出来的零件的次品率为0.2(机器持续工作时间不超过12小时).已知每个正品零件的售价为100元,次品零件作废,持续加工x个零件的生产成本P=0.01x2+66x(单位:元).根据(1)中求得的经验回归方程,估计一台机器持续工作多少分钟时所获利润最大(利润=零件正品数×售价-生产成本).
参考数据:.
参考公式:在经验回归方程=x+中,==,=-.
4.(2023辽宁六校协作体联考)某IT公司基于5G领先技术的支持,经济收入在短期内逐月攀升,该IT公司在某年1月至6月的经济收入y(单位:百万元)关于月份x的数据如下表所示,并根据数据绘制了如图所示的散点图.
月份x 1 2 3 4 5 6
收入y(百万元) 6.6 8.6 16.1 21.6 33.0 41.0
(1)根据散点图判断,y=ax+b与y=cedx(a,b,c,d均为常数)哪一个更适宜作为经济收入y关于月份x的回归方程类型;(给出判断即可,不必说明理由)
(2)根据(1)的结果及表中的数据,求出y关于x的回归方程,并预测该公司7月份的经济收入;(结果保留小数点后两位)
(3)从前6个月的收入中抽取2个,记收入超过20百万元的个数为X,求X的分布列和数学期望.
参考数据:
(xi -)2 (xi- )(yi-) (xi- )(ui-) e1.52 e2.66
3.50 21.15 2.85 17.50 125.35 6.73 4.57 14.30
其中u=ln y.
参考公式:对于一组数据(xi,vi)(i=1,2,3,…,n),其经验回归方程=x+的斜率和截距的最小二乘估计分别为=,=-.
5.(2023江西南昌第五中学月考)为检测某种抗病毒疫苗的免疫效果,需要进行动物与人体试验.研究人员将疫苗注射到200只小白鼠体内,一段时间后测量小白鼠的某项指标值,按[0,20),[20,40),[40,60),[60,80),[80,100]分组,绘制成频率分布直方图如图所示.试验发现小白鼠体内产生抗体的共有160只,其中该项指标值不小于60的有110只.假设小白鼠注射疫苗后是否产生抗体相互独立.
(1)完成下面的2×2列联表,并根据α=0.05的独立性检验,判断能否认为注射疫苗后小白鼠产生抗体与指标值不小于60有关;
单位:只
抗体 指标值 合计
小于60 不小于60
有抗体
没有抗体
合计
(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40只小白鼠进行第二次注射疫苗,结果又有20只小白鼠产生抗体.
①用频率估计概率,求一只小白鼠注射2次疫苗后产生抗体的概率;
②以①中确定的概率作为人体注射2次疫苗后产生抗体的概率,进行人体接种试验,记n个人注射2次疫苗后产生抗体的数量为随机变量X,试验后统计数据显示,当X=90时,P(X)取最大值,求参加人体接种试验的人数n及E(X).
参考公式: χ2=,其中n=a+b+c+d.
参考数据:
α 0.15 0.100 0.050 0.025
xα 2.072 2.706 3.841 5.024
迁移创新
6.(2022江西宜春期末)某公司生产的玩偶自上市以来就好评不断,该公司某部门通过收集整理出了宣传力度(x)与好评量(y)之间的散点图(如图所示).
根据散点图中的数据,令s=,t=,统计整理得到(si,yi)与(ti,yi)(i=1,2,3,…,13)的如下数据表,现计划用模型y=a+b或y=c+作为y关于x的回归方程.
siyi-13 
10.15 109.94 3.04 0.16 13.94
tiyi-13  -13 -13 -13
-2.1 11.67 0.21 21.22
(1)设(si,yi)与(ti,yi)(i=1,2,3,…,13)的样本相关系数分别为r1,r2,求r1,r2的值并根据其意义判断哪种模型更适合作为y与x的回归方程,求出该方程;
(2)为发挥线上购物的优越性,该公司通过网购平台提高销售量,组织A,B,C三家网店开展“秒杀”抢购活动,其中甲在A网店抢购一个订单,乙在B网店抢购一个订单,丙在C网店抢购一个订单,若三人在三家网店抢购订单成功的概率均为p,且三人是否抢购成功互不影响,记三人抢购成功的订单总数为随机变量Z.
①求Z的分布列及E(Z);
②若每个订单由k(k≥2,k∈N*)个玩偶构成,记三人抢购成功的玩偶总数量为T,假设p=-,求E(T)取最小值时正整数k的值.
参考数据:≈15.736 5,≈2.111 0.
参考公式:经验回归方程=+u的斜率和截距的最小二乘估计分别为=,=-,样本相关系数r=.
答案与分层梯度式解析
第八章 成对数据的统计分析
综合拔高练
五年高考练
1.D 观察散点图可知,散点用光滑曲线连接起来后比较接近对数型函数的图象,故选D.
2.C 由题意可知=22.5,=160,
∴160=4×22.5+,解得=70,
∴=4x+70,
∴当x=24时,=4×24+70=166.故选C.
3.解析 (1)估计该林区这种树木平均一棵的根部横截面积为==0.06(m2),平均一棵的材积量为==0.39(m3).
(2)样本相关系数r=
=
=
==≈≈0.97,
即该林区这种树木的根部横截面积与材积量的样本相关系数约为0.97.
(3)设这种树木的根部横截总面积为X m2,总材积量为Y m3,则=,则Y===1 209,
所以该林区这种树木的总材积量的估计值为1 209 m3.
4.解析 (1)由题意可得A公司长途客车准点的概率P1==,B公司长途客车准点的概率P2==.
(2)零假设H0:甲、乙两城之间的长途客车是否准点与客车所属公司无关.
因为K2=≈3.205>2.706,
所以有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
5.解析 (1)由所给数据,得该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:
空气质量等级 1 2 3 4
概率的估计值 0.43 0.27 0.21 0.09
(2)一天中到该公园锻炼的平均人次的估计值为×(100×20+300×35+500×45)=350.
(3)根据所给数据,可得2×2列联表如下:
人次≤400 人次>400
空气质量好 33 37
空气质量不好 22 8
零假设H0:一天中到该公园锻炼的人次与该市当天的空气质量无关.
根据列联表得K2=≈5.820.
由于5.820>3.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
6.解析 (1)X的可能取值为0,1,2.
P(X=0)==,
P(X=1)==,
P(X=2)==,
∴X的分布列为
X 0 1 2
P
E(X)=0×+1×+2×=1.
(2)(i)m==23.4.
完成的列联表如下:
对照组 6 14
试验组 14 6
(ii)零假设H0:小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量无差异.
由(i)可得K2==6.4>3.841,
∴有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.
7.解析 (1)零假设H0:患该疾病群体与未患该疾病群体的卫生习惯无差异.
由题中数据可知K2==24>6.635,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(i)证明:因为R=·=···=,
且·=···=,
所以R=·.
(ii)由题表中数据可知P(A|B)==,P(A|)==,P(|B)==,P(|)==,
所以R=·=×=6.
三年模拟练
1.B 令z=log2y,则=x+.
由题意得=×(0+1+3+3+4)=,=×(1+2+3+4+5)=3,xizi=1×0+2×1+3×3+4×3+5×4=43,=12+22+32+42+52=55,
所以===1,=-=-1×3=-0.8,所以=2x-0.8,
当x=6时,=25.2≈37.故选B.
2.解析 (1)补充完整的列联表如下:
单位:名
良好以下 良好及以上 合计
男生 400 150 550
女生 200 50 250
合计 600 200 800
零假设H0:本次体测结果等级与性别无关系.
计算得χ2=≈4.848>3.841=x0.05.
根据α=0.05的独立性检验,有充分证据推断H0不成立,即认为本次体测结果等级与性别有关系,此推断犯错误的概率不大于0.05.
(2)由(1)中列联表可知,“良好及以上”的频率为=,
由题意可知ξ~B,
且P(ξ=k)=,k=0,1,2,3,4.
∴ξ的分布列为
ξ 0 1 2 3 4
P
E(ξ)=4×=1.
3.解析 (1)由题意得=xi=55,=×yi=105,
所以===0.6,
=-=105-0.6×55=72,
所以y关于x的经验回归方程为=0.6x+72,
当x=480时,=0.6×480+72=360,所以预测持续加工480个零件所花费的时间为360分钟.
(2)由=0.6x+72≤6×60,得x≤480;
由=0.6x+72≤12×60,得x≤1 080.
①当x≤480,x∈N时,设所获利润为z1元,依题意知,z1=(1-0.1)x×100-(0.01x2+66x)=-0.01x2+24x=-0.01(x-1 200)2+14 400,
所以当x=480时,z1取最大值,为9 216.
②当480所以当x=700时,z2取最大值,为9 700.
因为9 700>9 216,
所以一台机器持续加工700个零件时所获利润最大,
此时持续工作时间为0.6×700+72=492(分钟).
故估计一台机器持续工作492分钟时所获利润最大.
4.解析 (1)根据散点图判断,y=cedx更适宜作为经济收入y关于月份x的回归方程类型.
(2)对y=cedx两边同时取自然对数得ln y=ln c+dx.
设u=ln y,则u=ln c+dx,
==≈0.38,
ln c=-≈2.85-0.38×3.50=1.52,
∴=1.52+0.38x,即ln =1.52+0.38x,∴=e1.52+0.38x=4.57×e0.38x.
令x=7,得=4.57×e2.66=4.57×14.30≈65.35,故预测该公司7月份的经济收入为65.35百万元.
(3)易知前6个月的收入中超过20百万元的有3个,
∴随机变量X的可能取值为0,1,2,
P(X=0)==,
P(X=1)==,
P(X=2)==,
故X的分布列为
X 0 1 2
P
E(X)=0×+1×+2×=1.
5.解析 (1)由题图得,该项指标值在[0,60)内的小白鼠有(0.002 5+0.006 25+0.008 75)×20×200=70(只);该项指标值在[60,100]内的小白鼠有(0.025+0.007 5)×20×200=130(只).
由题意得,有抗体且指标值小于60的小白鼠有160-110=50(只),而指标值小于60的小白鼠有70只,所以指标值小于60且没有抗体的小白鼠有70-50=20(只).同理,指标值不小于60且没有抗体的小白鼠有130-110=20(只).
2×2列联表如下:
单位:只
抗体 指标值 合计
小于60 不小于60
有抗体 50 110 160
没有抗体 20 20 40
合计 70 130 200
零假设H0:注射疫苗后小白鼠产生抗体与指标值不小于60无关联.
根据列联表中数据,得χ2=≈4.945>3.841=x0.05.
根据α=0.05的独立性检验,有充分证据推断H0不成立,即认为注射疫苗后小白鼠产生抗体与指标值不小于60有关,此推断犯错误的概率不大于0.05.
(2)①设事件A=“小白鼠第一次注射疫苗后产生抗体”,事件B=“小白鼠第二次注射疫苗后产生抗体”,事件C=“小白鼠注射2次疫苗后产生抗体”,
则P(A)==0.8,P(B)==0.5,
所以P(C)=P(A)+P()P(B)=0.8+0.2×0.5=0.9.
②由题意得X~B(n,0.9),则P(X=k)=×0.9k×0.1n-k(k=0,1,2,…,n).
因为P(X=90)最大,
所以
解得99≤n≤,
因为n是整数,所以n=99或n=100,
所以参加人体接种试验的人数为99或100.
当接种人数为99时,E(X)=99×0.9=89.1;
当接种人数为100时,E(X)=100×0.9=90.
6.解析 (1)易得r1===≈≈0.885 8,r2===≈≈-0.994 8.
∵|r1|<|r2|<1,∴模型y=c+作为y关于x的回归方程更合适.
易得===-10,
=-=109.94+10×0.16=111.54,
∴y关于x的回归方程为=-+111.54.
(2)①由题意得Z~B(3,p),
P(Z=0)=(1-p)3,
P(Z=1)=p(1-p)2=3p(1-p)2,
P(Z=2)=p2(1-p)=3p2(1-p),
P(Z=3)=p3,
∴Z的分布列为
Z 0 1 2 3
P (1-p)3 3p(1-p)2 3p2(1-p) p3
E(Z)=3p.
②∵T=kZ,∴E(T)=kE(Z)=3kp=3k=3,
令Sk=1-,则Sk+1=1-,
∴Sk+1-Sk=-=,
当k=2时,S33时,>Sk.
∴E(T)取最小值时正整数k的值为3或4.
素养评析 第(1)问主要考查数学运算的素养,直接将数据代入公式计算即可;第(2)问主要考查逻辑推理、数学运算的素养,结合二项分布得到分布列与期望,然后结合数列中求最值的方法求正整数k.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)