中小学教育资源及组卷应用平台
第八章 成对数据的统计分析 章末综合检测
(时间:120分钟,满分:150分)
一、单项选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.下列两个变量之间的关系是相关关系的为( )
A.正方体的体积与棱长的关系
B.学生的成绩和体重
C.路上酒后驾驶的人数和交通事故发生的多少
D.水的体积和重量
2.下列四个图各反映了两个变量的某种关系,其中可以看作具有较强线性相关关系的是( )
A.①③ B.①④
C.②③ D.①②
3.如图所示的5个数据,去掉点D(3,10)后,下列说法错误的是( )
A.样本相关系数r变大
B.残差平方和变大
C.R2变大
D.解释变量x与响应变量y的相关性变强
4.已知经验回归方程=x+,其中=3,且样本点的中心为(1,2),则经验回归方程为( )
A.=x+3 B.=-2x+3
C.=-x+3 D.=x-3
5.某学校开展研究性学习活动,某同学获得一组实验数据如下:(1.99,1.5),(3,4.04),(4,7.5),(5.1,12),(6.12,18.01).对于这组数据,现在给出以下拟合曲线,其中拟合程度最好的是( )
A.y=2x-2 B.y=
C.y=log2x D.y=(x2-1)
6.根据如下成对样本数据:
x 3 4 5 6 7 8
y 4 2.5 -0.5 0.5 -2 -3
得到的经验回归方程为=x+,则( )
A.>0,<0 B.>0,>0
C.<0,>0 D.<0,<0
7.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用过血清的人与另外500名未使用过血清的人一年中的感冒记录进行比较,提出零假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查临界值表和P(χ2≥3.814)≈0.05.对此,有以下四个结论,正确的是( )
A.依据小概率值α=0.05的独立性检验,可以认为“这种血清能起到预防感冒的作用”
B.若某人未使用该血清,那么他在一年中有95%的可能性得感冒
C.这种血清预防感冒的有效率为95%
D.这种血清预防感冒的有效率为5%
8.(2021·湖南省长沙市期中)用模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln y,其变换后得到经验回归方程z=0.3x+4,则c=( )
A. 0.3 B.e0.3
C.4 D.e4
二、多项选择题:本题共4小题,每小题5分,共20分.在每小题给出的四个选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.下列说法表述恰当的有( )
A.决定系数R2可以刻画回归模型的拟合效果,R2越接近于1,说明模型的拟合效果越好
B.在经验回归模型中,R2表示解释变量对于响应变量的贡献率,R2越接近于1,表示解释变量和响应变量的相关程度越强
C.若残差图中个别点的残差比较大,则应确认在采集样本点的过程中是否有人为的错误或模型是否恰当
D.χ2在任何相互独立问题中都可以用来检验有关还是无关
10.以下关于线性回归的判断,正确的是( )
A.若散点图中所有点都在一条直线附近,则这条直线为经验回归直线
B.散点图中的绝大多数点都线性相关,个别特殊点不影响线性回归,如图中的A,B,C三点
C.已知经验回归方程为=0.50x-0.81,则x=25时,y的估计值为11.69
D.经验回归直线的意义是它反映了样本整体的变化趋势
11.为了判断英语词汇量与阅读水平是否相互独立,某语言培训机构随机抽取了100位英语学习者进行调查,经过计算χ2≈7,根据这一数据和下表分析,下列说法正确的是( )
α 0.05 0.01 0.005 0.001
xα 3.841 6.635 7.879 10.828
A.有99%以上的把握认为英语词汇量与阅读水平无关
B.有99%以上的把握认为英语词汇量与阅读水平有关
C.有99.9%以上的把握认为英语词汇量与阅读水平有关
D.在犯错误的概率不超过1%的前提下,可以认为英语词汇量与阅读水平有关
12.下表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据,根据表中提供的数据,求得y关于x的经验回归方程为=0.7x+0.35,则下列结论正确的是( )
x 3 4 5 6
y 2.5 t 4 4.5
A.产品的生产能耗与产量呈正相关
B.经验回归直线一定过点(4.5,3.5)
C.A产品每多生产1吨,则相应的生产能耗约增加0.7吨
D.t的值是3.15
三、填空题:本题共4小题,每小题5分,共20分,将答案填在题中的横线上.
13.某艺术馆为了研究学生性别和喜欢国画之间的联系,随机抽取80名学生进行调查(其中有男生50名,女生30名),并绘制等高堆积条形图(如图所示),则这80名学生中喜欢国画的人数为________.
14.某小卖部为了了解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:
气温(℃) 18 13 10 -1
杯数 24 34 38 64
若由表中数据算得经验回归方程=x+中的=-2,则=________,当气温为-5℃时,热茶销售量约为________杯.
15.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=bxi+a+ei(i=1,2,…,n),若ei恒为0,则R2为________.
16.图书馆工作人员想知道每天到图书馆的人数x(百人)与借出的图书本数y(百本)之间的关系,已知上个月图书馆共开放25天,且得到资料:xi=200,yi=300,x=1 660,y=3 696,,x iyi=2 436,则y关于x的经验回归方程为________.
四、解答题:本题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤.
17.(本小题满分10分)冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如表所示.
杂质高 杂质低
旧设备 37 121
新设备 22 202
根据表中数据试判断含杂质的高低与设备改造有无关系.
18.(本小题满分12分)某种产品的广告费支出x与销售额y(单位:万元)之间有如下对应数据:
x 2 4 5 6 8
y 30 40 60 50 70
(1)画出散点图;
(2)求经验回归方程;
(3)试预测广告费支出为10万元时,销售额为多少?
19.(本小题满分12分)2021年某市开展了“寻找身边的好老师”活动,市六中积极行动,认真落实,通过微信关注评选“身边的好老师”,并对选出的五位“好老师”的班主任的工作年限和被关注数量进行了统计,得到如下数据:
班主任工作年限x(单位:年) 4 6 8 10 12
被关注数量y(单位:百人) 10 20 40 60 50
(1)若“好老师”的被关注数量y与其班主任的工作年限x满足经验回归方程,试求=x+,并就此分析:“好老师”的班主任工作年限为15年时被关注的数量;
(2)若用(i=1,2,3,4,5)表示统计数据时被关注数量的“即时均值”(四舍五入到整数),从“即时均值”中任选2组,求这2组数据之和小于8的概率.
20.(本小题满分12分)某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x(x取整数)(元)与日销售量y(台)之间有如下关系:
x(元) 35 40 45 50
y(台) 56 41 28 11
(1)画出散点图,并判断y与x是否具有线性相关关系;
(2)求日销售量y对销售单价x的经验回归方程;
(3)设经营此商品的日销售利润为P元,根据(2)写出P关于x的函数关系式,并预测当销售单价x为多少元时,才能获得最大日销售利润.
21.(本小题满分12分)孝汉城铁开通后,C5302、C5321两列车乘务组工作人员为了了解乘坐两列车的乘客每月的需求情况,分别在两个车次各随机抽取了100名旅客进行调查,下面是根据调查结果,绘制的乘车次数的频率分布直方图和频数分布表.
C5321次乘客月乘坐次数频数分布表
乘车次数分组 频数
[0,5) 15
[5,10) 20
[10,15) 25
[15,20) 24
[20,25) 11
[25,30] 5
(1)若将频率视为概率,月乘车次数不低于15次的称之为“老乘客”,试问:哪一车次的“老乘客”较多?简要说明理由;
(2)已知在C5321次列车随机抽到的50岁以上人员有35名,其中有10名是“老乘客”,由条件完成下面2×2列联表,并根据小概率值α=0.1的独立性检验,能否认为年龄与乘车次数有关联?并说明理由.
老乘客 新乘客 合计
50岁以上
50岁以下
合计
附:χ2=(其中n=a+b+c+d),
α 0.25 0.15 0.1 0.05 0.025
xα 1.323 2.072 2.706 3.841 5.024
22.(本小题满分12分)在“新零售”模式的背景下,某大型零售公司为推广线下分店,计划在S市的A区开设分店.为了确定在该区开设分店的个数,该公司对该市已开设分店的其他区的数据作了初步处理后得到下列表格.记x表示在其他各区开设分店的个数,y表示这x个分店的年收入之和.
x(个) 2 3 4 5 6
y(百万元) 2.5 3 4 4.5 6
(1)该公司已经过初步判断,可用经验回归模型拟合y与x的关系,求y关于x的经验回归方程;
(2)假设该公司在A区获得的总年利润z(单位:百万元)与x,y之间的关系为z=y-0.05x2-1.4,请结合(1)中的经验回归方程,估算该公司应在A区开设多少个分店时,才能使A区平均每个分店的年利润最大?
参考公式:=eq \f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do4(i=1))x-n2)=eq \f(\o(∑,\s\up6(n),\s\do4(i=1)) (xi-)(yi-),\o(∑,\s\up6(n),\s\do4(i=1)) (xi-)2),=x+,=-.
参考答案
1解析:选C.A中,由正方体的棱长和体积的公式知,V=a3(a>0),是确定的函数关系,故A错误;B中,学生的成绩和体重,没有关系,故B错误;C中,路上酒后驾驶的人数会影响交通事故发生的多少,但不是唯一因素,它们之间有相关关系,故C正确;D中,水的体积V和重量x的关系为V=k·x,是确定的函数关系,故D错误.
2解析:选B.对于两个变量的散点图,若样本点成带状分布,则两个变量具有线性相关关系,所以两个变量具有线性相关关系的图是①和④,故选B.
3解析:选B.由题中散点图知去掉点D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.
4解析:选C.因为经验回归直线一定经过样本点的中心,所以只需将样本点的中心坐标代入方程,用待定系数法求出即可.
5解析:选D.本题若求R2或残差来分析拟合效果,运算将很烦琐,计算量太大,可以将各组数据代入检验,发现D最接近.故选D.
6解析:选A.根据题意,画出散点图(图略).根据散点图,知两个变量为负相关,且经验回归直线与y轴的交点在y轴正半轴,所以>0,<0.
7解析:选A.由题意,因为χ2≈3.918,P(χ2≥3.841)≈0.05,所以依据小概率值α=0.05的独立性检验,可以认为“这种血清能起到预防感冒的作用”.
8解析:选D.由y=cekx,等式两边取对数得ln y=ln c+kx.由z=ln y,得z=ln c+kx.由z=0.3x+4,得ln c=4,解得c=e4.故选D.
9解析:选ABC.由回归分析的相关概念知ABC都正确,χ2只适用于2×2型列联表问题,且χ2只能推定两个分类变量相关,但不能推定两个变量不相关,故D错误.
10解析:选BCD.能使所有数据点都在它附近的直线不止一条,而据经验回归直线的定义知只有按最小二乘法求得回归系数,得到的直线=x+才是经验回归直线,所以A不对;B正确;将x=25代入=0.50x-0.81,得=11.69,所以C正确;D正确.
11解析:选BD.χ2≈7>6.635=x0.01,所以在犯错误的概率不超过1%的前提下,可以认为英语词汇量与阅读水平有关,或者可以说有99%以上的把握认为英语词汇量与阅读水平有关.
12解析:选ABC.因为经验回归方程=0.7x+0.35,所以产品的生产能耗与产量呈正相关,A产品每多生产1吨,则相应的生产能耗约增加0.7吨,A,C正确;由题意,得==4.5,
因为=0.7x+0.35,
所以=0.7×4.5+0.35=3.5,
所以t=4×3.5-2.5-4-4.5=3,所以B正确,D错误.
13解析:由等高堆积条形图可知,男生中喜欢国画的占80%,女生中喜欢国画的占60%,则这80名学生中喜欢国画的人数为50×80%+30×60%=58.
答案:58
14解析:根据表格中的数据可求得=×(18+13+10-1)=10,=×(24+34+38+64)=40.
所以=-=40-(-2)×10=60,所以=-2x+60,当x=-5时,=-2×(-5)+60=70.
答案:60 70
15解析:ei恒为0,说明随机误差对yi贡献为0,这时候变量x,y之间是函数关系,故R2=1.
答案:1
16解析:将已知量代入经验回归方程可得=7.2,=0.6.
答案:=7.2+0.6x
17解:由已知数据得到如下2×2列联表:
杂质高 杂质低 合计
旧设备 37 121 158
新设备 22 202 224
合计 59 323 382
零假设为H0:含杂质的高低与设备改造无关.由表中数据得χ2=≈13.11>10.828=x0.001,根据小概率值α=0.001的χ2独立性检验,我们推断H0不成立,故在犯错误概率不超过0.01的情况下认为含杂质的高低与设备改造是有关的.
18解:(1)根据表格中的5组数据,绘制散点图如图所示:
(2)由表格数据可知:
=(2+4+5+6+8)=5,
=(30+40+60+50+70)=50,
故=eq \f(\o(∑,\s\up6(5),\s\do4(i=1))xiyi-5,\o(∑,\s\up6(5),\s\do4(i=1))x-52)==6.5,
=-=50-6.5×5=17.5,故所求经验回归方程为=6.5x+17.5.
(3)由(2)知,=6.5x+17.5,
令x=10,解得=82.5.
故广告费支出为10万元时,销售额约为82.5万元.
19解:(1) =8,=36,
==6,
=36-48=-12,所以=6x-12,
当x=15时,=6×15-12=78(百人)=7 800(人).
(2)这5次统计数据,被关注数量的“即时均值”分别为3,3,5,6,4.
从5组“即时均值”任选2组,共有C=10种情况,其中2组数据之和小于8为(3,3),(3,4),(3,4)共3种情况,所以这2组数据之和小于8的概率为.
20解:(1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.
(2)因为=×(35+40+45+50)=42.5,
=×(56+41+28+11)=34.
xiyi=35×56+40×41+45×28+50×11=5 410.
x=352+402+452+502=7 350.
所以===≈-3.
=-=34-(-3)×42.5=161.5.
所以经验回归方程为=161.5-3x.
(3)依题意,有P=(161.5-3x)(x-30)
=-3x2+251.5x-4 845
=-3+-4 845.
所以当x=≈42时,P有最大值,约为426元.即预测当销售单价为42元时,能获得最大日销售利润.
21解:(1)根据题意,C5302次“老乘客”的概率为P1=(0.052+0.04+0.008)×5=0.5,
C5321次“老乘客”的概率为P2==0.4,
因为P1>P2,所以C5302次“老乘客”较多.
(2)零假设为H0:年龄与乘车次数无关联.填写2×2列联表如下:
老乘客 新乘客 合计
50岁以上 10 25 35
50岁以下 30 35 65
合计 40 60 100
χ2=≈2.93>2.706=x0.1,依据小概率值α=0.1的独立性检验,我们推断H0不成立,即认为年龄与乘车次数有关联,此推断犯错误的概率不大于0.1.
22解:(1)方法一:由表中数据和参考数据得,
=4,=4, (xi-)2=10,
(xi-)(yi-)=8.5,
所以=eq \f(\o(∑,\s\up6(5),\s\do4(i=1)) (xi-)(yi-),\o(∑,\s\up6(5),\s\do4(i=1)) (xi-)2)==0.85,
所以=-=4-4×0.85=0.6,
所以经验回归方程为=0.85x+0.6,
方法二:由表中数据和参考数据得,
=4,=4,xiyi=88.5,x=90,
所以=eq \f(\o(∑,\s\up6(5),\s\do4(i=1))xiyi-5\o(x,\s\up6(-))\o(y,\s\up6(-)),\o(∑,\s\up6(5),\s\do4(i=1))x-52)==0.85,
所以=-=4-4×0.85=0.6,
所以经验回归方程为=0.85x+0.6.
(2)由题意,可知总年利润z的预测值与x之间的关系为=-0.05x2+0.85x-0.8,
设该区平均每个分店的年利润为t,则t=,
所以t的预测值与x之间的关系为
=-0.05x-+0.85=-0.01+0.85≤-0.01×2+0.85=0.45,
当且仅当5x=,即x=4时,取得最大值,
所以估计该公司在A区开设4个分店时,才能使A区平均每个分店的年利润最大.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://www.21cnjy.com/" 21世纪教育网(www.21cnjy.com)