2025-2026学年人教A版数学选择性必修第三册 第八章 成对数据的统计分析 单元测试(含答案)

文档属性

名称 2025-2026学年人教A版数学选择性必修第三册 第八章 成对数据的统计分析 单元测试(含答案)
格式 docx
文件大小 186.9KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2026-03-23 00:00:00

图片预览

文档简介

第八章 成对数据的统计分析
(时间:120分钟,分值:150分)
一、单项选择题(本题共8小题,每小题5分,共 40分)
1.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是(  )
A.用决定系数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好
B.由样本数据得到的经验回归直线=x+必过样本点的中心(,)
C.残差平方和越小的模型,拟合的效果越好
D.若样本相关系数r=-0.936 2,则变量y与x之间具有较强的线性相关关系
2.已知呈线性相关关系的变量x,y之间的一组数据如下表所示,则y关于x的经验回归直线一定过点(  )
x 0.1 0.2 0.3 0.5
y 2.11 2.85 4.08 10.15
A.(0.1,2.11) B.(0.2,2.85)
C.(0.3,4.08) D.(0.275,4.797 5)
3.观察下列的等高堆积条形图,其中最有把握认为两个分类变量x,y之间没有关系的是(  )
4.若y关于x的经验回归方程为=2-3.5x,则变量x增加1个单位,变量y平均(  )
A.减少3.5个单位
B.增加2个单位
C.增加3.5个单位
D.减少2个单位
5.下表是某厂1~4月份用水量(单位:百吨)的一组数据:
月份x 1 2 3 4
用水量y 4.5 4 3 2.5
由散点图可知用水量y与月份x之间有较强的线性相关关系,其经验回归方程是=-0.7x+,则等于(  )
A.10.5 B.5.15
C.5.2 D.5.25
6.某校团委针对学生性别和中学生追星是否有关做了一次抽样调查,样本中女生人数是男生人数的,男生喜欢追星的人数占男生人数的,女生喜欢追星的人数占女生人数的.若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则样本中男生至少有(  )
附:χ2=.
A.12人 B.11人
C.10人 D.18人
7.某种微生物的繁殖速度y与生长环境中的营养物质浓度x相关,在一定条件下可用回归模型y=2lg x进行拟合.在这个条件下,要使y增加2个单位,则应该(  )
A.使x增加1个单位
B.使x增加2个单位
C.使x增加到原来的2倍
D.使x增加到原来的10倍
8.关于变量x与y,下列说法中正确的是(  )
①若r>0,则x增大时,y也相应增大;
②若r<0,则x增大时,y也相应增大;
③若r=1或r=-1,则x与y的关系为函数关系,散点图中的各点均在一条直线上.
A.①②
B.②③
C.①③
D.①②③
二、多项选择题(本题共3小题,每小题6分,共18分)
9.已知在最小二乘法原理下,具有相关关系的变量x,y之间的经验回归方程为=-0.7x+10.3,且变量x,y之间的相关数据如表所示,则下列说法错误的是(  )
x 6 8 10 12
y 6 m 3 2
A.变量x,y之间呈正相关关系
B.可以预测,当x=20时,y=3.7
C.m=4.7
D.经验回归直线=-0.7x+10.3必过点(9,4)
10.如图是某小区2023年8月至2024年8月各月在售二手房均价(单位:万元/m2)的散点图.(图中月份代码1~13分别对应2023年8月~2024年8月)
根据散点图选择y=a+b和y=c+dln x两个模型进行拟合,经过数据处理得到的两个经验回归方程分别为=0.936 9+0.028 5和=0.955 4+0.030 6ln x,并得到以下一些统计量的值:
经验回归方程 =0.936 9+0.028 5 =0.955 4+0.030 6 ln x
R2 0.923 0.973
则下列说法正确的是(  )
A.当月在售二手房均价y与月份代码x呈负相关关系
B.由=0.936 9+0.028 5预测该小区2025年8月在售二手房均价约为1.079 4万元/m2
C.曲线=0.936 9+0.028 5与=0.955 4+0.030 6ln x都经过点(,)
D.模型=0.955 4+0.030 6ln x的拟合效果比模型=0.936 9+0.028 5的拟合效果好
11.某市通过随机询问100名居民用餐能否做到“光盘”,得到如下的 2×2列联表,则(  )
单位:名
性别 光盘 合计
不能做到 能做到
男 45 b 55
女 c 15
合计 100
A.c=30
B.进行独立性检验时,零假设为H0:能否做到“光盘”与性别有关
C.χ2>3.841
D.在犯错误的概率不超过0.1的前提下,可以认为该市居民能否做到“光盘”与性别有关
三、填空题(本题共3小题,每小题5分,共15分)
12.已知y关于x的经验回归方程为=x+,当x=3时,y的估计值是17,当x=8时,y的估计值是22,y关于x的经验回归方程为__________;当x=________时,y的估计值是38.
13.某旅行社为调查市民对人文景观的态度(喜欢或不喜欢)是否与年龄有关,随机调查了55名市民,所得数据如下表所示.
单位:名
年龄 态度 合计
喜欢 不喜欢
大于40岁 20 5 25
20岁至40岁 10 20 30
合计 30 25 55
根据小概率值α=0.005的独立性检验,________推断出市民对人文景观的态度与年龄有关.(填“能”或“不能”)
14.一般来说,一个人脚越长,他的身高就越高.现对10名成年人的脚长x(单位:cm)与身高y(单位:cm)进行测量,得到数据作出散点图后,发现各点集中在一条直线附近.经计算得到一些数据:
=24.5,=171.5,(xi-)(yi-)=577.5,(xi-)2=82.5.某刑侦人员在某案发现场发现一对裸脚印,量得每个脚印长26.5 cm,则估计嫌疑人的身高为________ cm.
四、解答题(本题共5小题,共77分)
15.(13分)已知某设备的使用年限x(单位:年)和所需的维修费用y(单元:万元)有如下的统计资料:
x 2 3 4 5 6
y 2.2 3.8 5.5 6.5 7.0
(1)y与x之间是否具有线性相关关系?若有,求出经验回归方程.
(2)估计使用年限为10年时,维修费用是多少.
16.(15分)长跑对于培养人们克服困难、磨炼刻苦耐劳的顽强意志具有良好的作用,某校开展 冬季长跑活动,为了解学生对冬季长跑活动是否感兴趣与性别是否有关,某调查小组随机抽取该校100名学生进行问卷调查,根据所得数据制成如下2×2列联表:
单位:人
性别 对冬季长跑活动是否感兴趣 合计
是 否
男 8
女 32
合计 80 100
(1)完成上面的2×2列联表,依据小概率值α=0.1的独立性检验,能否认为学生对冬季长跑活动是否感兴趣与性别有关联?
(2)若不感兴趣的男生中恰有3名高三学生,现从不感兴趣的男生中随机选出3名学生进行二次调查,记选出的学生中高三学生的人数为X,求X的分布列与数学期望.
附:χ2=,其中n=a+b+c+d.
17.(15分)(2022·新高考全国Ⅰ卷)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
单位:人
组别 卫生习惯
不够良好 良好
病例组 40 60
对照组 10 90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,事件A表示“选到的人卫生习惯不够良好”,事件B表示“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
①证明:R=·;
②利用调查数据,给出P(A|B),P(A|)的估计值,并利用①中的结果给出R的估计值.
18.(17分)某农科所对冬季昼夜温差与某反季节大豆新品种发芽数之间的关系进行分析研究,他们分别记录了12月1日至12月5日每天的昼夜温差与每100颗种子中的发芽数,得到如下资料:
日期 12月1日 12月2日 12月3日 12月4日 12月5日
温差x/℃ 10 11 13 12 8
发芽数y/颗 23 25 30 26 16
该农科所确定的研究方案是先从这5组数据中任选2组,用剩下的3组数据求经验回归方程,再对被选取的2组数据进行检验.
(1)求选取的2组数据恰好是不相邻2天数据的概率;
(2)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y关于x的经验回归方程=x+;
(3)若由经验回归方程得到的估计数据与所选出的检验数据的误差均不超过2,则认为得到的经验回归方程是可靠的,试问(2)中所得到的经验回归方程是否可靠.
19.(17分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层随机抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄分为25周岁以上(含25周岁)和25周岁以下两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.
(1)从样本中日平均生产件数小于60的工人中随机抽取2名,求至少抽到1名25周岁以下组工人的概率;
(2)规定日平均生产件数不小于80者为生产能手,请你根据已知条件列出2×2列联表,并依据小概率值α=0.1的独立性检验,分析生产能手与工人所在的年龄组是否有关.
第八章 成对数据的统计分析
(时间:120分钟,分值:150分)
一、单项选择题(本题共8小题,每小题5分,共 40分)
1.A 解析:对于A,用决定系数R2来刻画回归效果,R2的值越接近1,说明模型的拟合效果越好,错误.对于B,由样本数据得到的经验回归直线=x+必过样本点的中心(,),正确.对于C,残差平方和越小的模型,拟合效果越好,正确.对于D,越接近1,变量y与x之间的线性相关关系越强,正确.故选A.
2.D 解析:经验回归直线一定过点(,),通过题表中的数据计算得=0.275,=4.797 5,易知选D.
3.B 解析:在等高堆积条形图中,当x1,x2所占比例相差越大时,越有把握认为两个分类变量x,y之间有关系.
B选项中,x1,x2所占比例相差无几,所以最有把握认为两个分类变量x,y之间没有关系.故选B.
4.A 解析:由经验回归方程可知=-3.5,则变量x增加1个单位,变量y平均减少3.5个单位.
5.D 解析:因为==2.5,==3.5,所以3.5=-0.7×2.5+,解得=5.25.
6.A 解析:设男生人数为x,依题意可得如下列联表:
单位:人
性别 是否追星 合计
是 否
男 x

合计 x
若在犯错误的概率不超过0.05的前提下认为是否追星和性别有关,则χ2≥3.841.由χ2==x≥3.841及,为整数,可知若在犯错误的概率不超过0.05的前提下认为是否追星和性别有关,则男生至少有12人.故选A.
7.D 解析:设y的增加量为Δy=y1-y2,x的增加量为Δx=x1-x2,
故可得Δy=2lg x1-2lg x2=2lg=2,
解得=10.
故要使得y增加2个单位,x应增加到原来的10倍.故选D.
8.C 解析:若r>0,表示两个变量正相关,x增大时,y也相应增大,故①正确.若r<0,表示两个变量负相关,x增大时,y相应减小,故②错误.|r|越接近1,表示两个变量相关性越强,|r|=1表示两个变量有确定的关系(即函数关系),故③正确.
二、多项选择题(本题共3小题,每小题6分,共18分)
9.ABC 解析:对于A,由x与y的经验回归方程,可知=-0.7<0,
所以变量x,y之间呈负相关关系,故A错误;
对于B,当x=20时,=-0.7×20+10.3=-3.7,故B错误;
对于C,由表中数据可知=9,==,由点(,)必在经验回归直线上,得=-0.7×9+10.3,解得m=5,故C错误;
对于D,因为m=5,所以==4,所以经验回归直线必过点(9,4),故D正确.故选ABC.
10.BD 解析:对于A,由题图可知散点从左下到右上分布,所以当月在售二手房均价y与月份代码x呈正相关关系,故A不正确;对于B,令x=25,得=0.936 9+0.028 5×=1.079 4,所以可以预测2025年8月在售二手房均价约为1.079 4万元/m2,故B正确;对于C,非线性回归曲线不一定经过点(,),故C错误;对于D,R2越大,模型拟合效果越好,0.923<0.973,故D正确.
11.AD 解析:由2×2列联表得到a=45,b=10,c=30,d=15,则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,
零假设为H0:能否做到“光盘”与性别无关.
χ2=≈3.030.
因为2.706<3.030<3.841,
所以在犯错误的概率不超过0.1的前提下,可以认为该市居民能否做到“光盘”与性别有关.
三、填空题(本题共3小题,每小题5分,共15分)
12. =x+14 24 解析:把(3,17),(8,22)代入经验回归方程得解得
所以经验回归方程为=x+14.
令x+14=38,得x=24.
13.能 解析:零假设为H0:市民对人文景观的态度与年龄无关.由题表中数据计算可得χ2=≈11.978>7.879=x0.005,根据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为市民对人文景观的态度与年龄有关,此推断犯错误的概率不大于0.005.
14. 185.5 解析:由已知得===7,=-=0,故经验回归方程为=7x.
当x=26.5时,=185.5.
故答案为185.5.
四、解答题(本题共5小题,共77分)
15.解:(1)作出散点图,如图所示.
由散点图可知,y与x呈线性相关关系.
由题可得=4,=5,=112.3,=90,所以==1.23,
=- =5-1.23×4=0.08.
所以经验回归方程为=1.23x+0.08.
(2)当x=10时,
=1.23×10+0.08=12.3+0.08=12.38.
所以估计使用年限为10年时,维修费用是12.38万元.
16.解:(1)根据已知数据可补全2×2列联表如下:
单位:人
性别 对冬季长跑活动是否感兴趣 合计
是 否
男 48 8 56
女 32 12 44
合计 80 20 100
零假设为H0:学生对冬季长跑活动是否感兴趣与性别无关.
由表中数据计算得χ2=≈2.597<2.706=x0.1,
所以依据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,即可以认为学生对“冬季长跑活动”是否感兴趣与性别无关.
(2)由题知X的所有可能取值为0,1,2,3,
因为P(X=0)===,
P(X=1)===,
P(X=2)==,
P(X=3)==,
所以X的分布列为
X 0 1 2 3
P
E(X)=0×+1×+2×+3×=.
17.(1)解:由已知得χ2==24.
又因为P(χ2≥6.635)=0.01,24>6.635,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)①证明:因为R=·=···,
所以R=···
=·.
②解:由已知得P(A|B)=,P(A|)=,
P(|B)=,P(|)=,
所以R=·=6.
18.解:(1)设“抽到不相邻的两组数据”为事件A,因为从5组数据中选取2组数据共有10种情况:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5),其中数据为12月份的日期数.
每种情况都是等可能出现的,事件A包含的样本点有6个,所以P(A)==.
所以选取的2组数据恰好是不相邻2天数据的概率是.
(2)由题表中数据,求得=12,=27,xiyi=977,x=434,
所以==2.5,=27-2.5×12=-3.
所以y关于x的经验回归方程为=2.5x-3.
(3)当x=10时,=2.5×10-3=22,|22-23|<2;
当x=8时,=2.5×8-3=17,|17-16|<2;
所以该农科所得到的经验回归方程是可靠的.
19.解:(1)由已知得,样本中有25周岁以上(含25周岁)组工人60名,25周岁以下组工人40名,
所以样本中日平均生产件数不足60的工人中,
25周岁以上(含25周岁)组工人有60×0.05=3(名),
记为A1,A2,A3;
25周岁以下组工人有40×0.05=2(名),
记为B1,B2.
从中随机抽取2名工人,所有的可能结果共有10种:
(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).
其中,至少有1名25周岁以下组工人的可能结果共有7种:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).
故所求的概率p=.
(2)由题图可知,在抽取的100名工人中,
25周岁以上(含25周岁)组中的生产能手有60×0.25=15(名),
25周岁以下组中的生产能手有40×0.375=15(名).
据此可得2×2列联表如下:
单位:名
组别 生产能手 合计
是 不是
25周岁以上(含25周岁)组 15 45 60
25周岁以下组 15 25 40
合计 30 70 100
零假设为H0:生产能手与工人所在的年龄组无关.
由数据得χ2==≈1.79<2.706=x0.1.
依据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即生产能手与工人所在的年龄组无关.
1/18