单元素养测评卷(三)
1.C [解析] C中的两个变量之间是确定的函数关系,A,B,D中的两个变量之间的关系都是相关关系.故选C.
2.B [解析] 由变量x,y的样本相关系数为-0.96,知x,y负相关,所以<0.因为xi=-8,yi=-15,所以点(-0.8,-1.5)在经验回归直线上,且该点在第三象限,所以经验回归直线经过第二、三、四象限.故选B.
3.D [解析] 对于A,去掉图中右下方的点A后,两个变量还是负相关,A错误;对于B,C,D,去掉图中右下方的点A后,样本点会更集中在一条直线附近,两个变量的线性相关程度更强,但因为是负相关,所以样本相关系数会更接近-1,样本相关系数会变小,故D正确,B,C错误.故选D.
4.C [解析] 由题图①可知,不管是选择甲还是选择乙,女生占比均高于男生,故样本中的女生人数多于男生人数,A错误;从题图②可以看出,男生和女生中选择乙的人数均多于选择甲的人数,B,D错误,C正确.故选C.
5.C [解析] 由样本相关系数的绝对值越接近1表明模型的拟合效果越好,可知选C,D;由误差平方和及均方根值都越小越好,可知选C.故选C.
6.B [解析] 对于选项A,由题中数据可知,y随x的增大而减小,所以变量y与x负相关,故A中说法正确;对于选项B,由表中数据知==3,==3.9,所以经验回归直线过点(3,3.9),将点(3,3.9)的坐标代入=-0.6x+,得=3.9+1.8=5.7,所以经验回归方程为=-0.6x+5.7,所以当x=5时,=-0.6×5+5.7=2.7,所以残差为2.5-2.7=-0.2,故B中说法错误;对于选项C,当x=6时,=-0.6×6+5.7=2.1,所以预测第6个月的销售量为2.1万只,故C中说法正确;对于选项D,由上知=5.7,故D中说法正确.故选B.
7.A [解析] 由题意可得m=5×2+4=14,假设甲输入的(x1,y1)为(3,2),则3+x2+x3+x4+x5+x6+x7=2×7=14,则x2+x3+x4+x5+x6+x7=11,且2+y2+y3+y4+y5+y6+y7=7×14=98,则y2+y3+y4+y5+y6+y7=96,所以改为正确数据后,'=×(2+11)=,'=×(3+96)=,所以经验回归直线=kx+7过点,可得=k+7,解得k=.故选A.
8.C [解析] 设x=log2(i+1),i=1,2,3,4,5,则=x+5,所以==≈=1.9,又=9,所以9=×1.9+5,得=,所以=log2(i+1)+5.下午4点时对应i=7,此时=×log28+5≈11.3.故选C.
9.BD [解析] 因为共有8个点,离群点B的横坐标较小,而纵坐标相对过大,所以去掉离群点B后经验回归直线的斜率变大,而截距变小,故A错误,B正确;去掉离群点B后线性相关程度变强,拟合效果也更好,且还是正相关,所以r110.BD [解析] 对于A,因为经验回归直线的斜率为-2,所以变量x增加1个单位时,平均减少2个单位,故A错误.对于B,因为经验回归方程为=2x+1,所以ln =2x+1,即=e2x+1=e·e2x,所以c=e,k=2,故B正确;对于C,样本相关系数r的绝对值越大,两个变量的线性相关程度越强,故C错误;对于D,因为χ2=4.712>3.841,所以根据小概率值α=0.05的独立性检验,我们推断X与Y有关联,此推断犯错误的概率不大于0.05,故D正确.故选BD.
11.BC [解析] 根据小概率值α=0.05的独立性检验,认为X与Y之间有关联,则χ2的值大于或等于3.841.由χ2==≥3.841,且a∈Z,得a≥8或a≤1.又a>5且15-a>5,所以a=8或a=9.故选BC.
12.0.05 [解析] 因为χ2≈4.844>3.841=x0.05,所以根据小概率值α=0.05的独立性检验,认为是否为统计专业与性别有关联.
13.0.3 [解析] 由题意知0.9=0.6×3.5+,解得=-1.2,所以=0.6x-1.2.由z=ln y,得ln =0.6x-1.2,所以=e0.6x-1.2=e-1.2·e0.6x,则m=e-1.2≈0.3.
14.44 [解析] 由题意可知χ2=≥3.841,即(100m-4000)2≥502×42×3.841,又m≥40,m∈N,所以m≥44,故m的最小值为44.
15.解:(1)甲机床生产的产品中一级品的频率为=,
乙机床生产的产品中一级品的频率为=.
(2)零假设为H0:甲机床生产的产品质量与乙机床生产的产品质量无差异.根据表中数据,计算得到χ2=≈10.256>6.635=x0.01.根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为甲机床生产的产品质量与乙机床生产的产品质量有差异.
16.解:(1)由题意,知==4,
==4.3,
(xi-)2=(1-4)2+(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2+(7-4)2=28,
则y与x的样本相关系数r==≈≈0.99.
∵y与x的样本相关系数近似为0.99,∴y与x的线性相关程度很强,从而可以用线性回归模型拟合y与x的关系.
(2)∵===0.5,∴=-=4.3-0.5×4=2.3,∴y关于x的经验回归方程为=0.5x+2.3.
将x=10代入经验回归方程,得=0.5×10+2.3=7.3,
∴预测该种机械设备使用10年的失效费为7.3万元.
17.解:由题知==3,==14,
所以(ti-)(wi-)=(-2)×(-10)+(-1)×(-5)+0×0+1×4+2×11=51,(ti-)2=(-2)2+(-1)2+02+12+22=10,
所以==5.1,=14-5.1×3=-1.3,所以=5.1t-1.3,
当t=7时,=5.1×7-1.3=34.4,故w关于t的经验回归方程为=5.1t-1.3,预测2025年该品牌新能源汽车的销售量为34.4万辆.
18.解:(1)根据散点图判断,y=cedx更适合作为y关于x的回归模型.
将y=cedx两边同时取自然对数,得ln y=ln c+dx,
因为z=ln y,所以z关于x的经验回归方程为=ln +x.
依题意,(xi-)(zi-)=33.6,(xi-)2=-7=5215-7×272=112,
因此===0.3,
所以ln =-=3.6-0.3×27=-4.5,
于是z关于x的经验回归方程为=0.3x-4.5,
所以y关于x的经验回归方程为=e0.3x-4.5.
(2)依题意,X的可能取值为0,1,2,3,
P(X=0)===,P(X=1)===,
P(X=2)===,P(X=3)===,
所以X的分布列为
X 0 1 2 3
P
19.解:(1)样本中仅参加书法兴趣小组的学生人数为25+30+15+10=80,
样本中仅参加绘画兴趣小组的学生人数为10+20+25+5=60,
所以样本中书法兴趣小组和绘画兴趣小组都参加的学生人数为150-80-60-5=5,故估计全校学生中书法兴趣小组和绘画兴趣小组都参加的人数为×3000=100.
(2)在样本中,从仅参加书法兴趣小组的学生中随机抽取1人,此人每周投入时间大于5小时的概率为=,从仅参加绘画兴趣小组的学生中随机抽取1人,此人每周投入时间大于5小时的概率为=.
X的所有可能取值为0,1,2,则P(X=0)=×=,
P(X=1)=×+×=,P(X=2)=×=,所以X的分布列为
X 0 1 2
P
故E(X)=0×+1×+2×=.
(3)由题意得==20,==15,所以=×[(25-20)2+(30-20)2+(15-20)2+(10-20)2]=,即s1=,
=×[(10-15)2+(20-15)2+(25-15)2+(5-15)2]=,即s2=,xiyi=×(25×10+30×20+15×25+10×5)=,
所以r===0.3.
因为0.3<0.4,所以仅参加书法兴趣小组和仅参加绘画兴趣小组的学生在各投入时间段人数呈低度线性相关.单元素养测评卷(三)
[第八章]
(时间:120分钟 分值:150分)
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.下列变量之间的关系不是相关关系的是 ( )
A.光照时间与大棚内蔬菜的产量
B.举重运动员所能举起的最大重量与他的体重
C.某正方形的边长与此正方形的面积
D.人的身高与体重
2.已知由样本数据(xi,yi)(i=1,2,3,…,10)组成的一个样本,变量x,y具有线性相关关系,其经验回归方程为y=x+,并计算出变量x,y的样本相关系数为-0.96,xi=-8,yi=-15,则经验回归直线经过 ( )
A.第一、二、三象限 B.第二、三、四象限
C.第一、二、四象限 D.第一、三、四象限
3.通过随机抽样,我们绘制了如图所示的某种商品的每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.若去掉图中右下方的点A,则下列说法正确的是 ( )
A.“每千克价格”与“年需求量”这两个变量由负相关变为正相关
B.“每千克价格”与“年需求量”这两个变量的线性相关程度不变
C.“每千克价格”与“年需求量”这两个变量的样本相关系数变大
D.“每千克价格”与“年需求量”这两个变量的样本相关系数变小
4.某学校抽取了部分男、女学生,根据他们对甲、乙两个课外活动项目的选择意愿制作出如图所示的两个等高堆积条形图.
根据图中的信息,下列统计结论正确的是 ( )
A.样本中的男生人数多于女生人数
B.样本中选择乙的学生人数少于选择甲的学生人数
C.样本中选择乙的男生人数多于选择甲的男生人数
D.样本中选择甲的女生人数多于选择乙的女生人数
5.已知建筑地基沉降预测对于保证施工安全,实现信息化监控有着重要意义.某工程师建立了四个函数模型来模拟建筑地基沉降随时间的变化趋势,并用样本相关系数、误差平方和、均方根值三个指标来衡量拟合效果.样本相关系数的绝对值越接近1表明模型的拟合效果越好,误差平方和越小表明误差越小,均方根值越小越好.依此判断下面模型拟合效果最好的是 ( )
A.
样本相关系数 误差平方和 均方根值
0.949 5.491 0.499
B.
样本相关系数 误差平方和 均方根值
0.933 4.179 0.436
C.
样本相关系数 误差平方和 均方根值
0.997 1.701 0.141
D.
样本相关系数 误差平方和 均方根值
0.997 2.899 0.326
6.2023年第19届亚运会在杭州举行,亚运会的吉祥物深受大家喜爱,某商家统计了从销售吉祥物开始5个月的销售量,所得数据如下表所示:
第x个月 1 2 3 4 5
销售量y(万只) 5 4.5 4 3.5 2.5
若y与x线性相关,且经验回归方程为=-0.6x+,则下列说法错误的是 ( )
A.由题中数据可知,变量y与x负相关
B.当x=5时,残差为0.2
C.预测第6个月的销售量为2.1万只
D.=5.7
7.某学习小组对一组数据(xi,yi)(i=1,2,3,4,5,6,7)进行回归分析,甲同学首先求出经验回归方程为=5x+4,=2,=m.乙同学对甲同学的计算过程进行检查,发现甲将数据(2,3)误输成(3,2),将这两个数据修正后得到的经验回归方程为=kx+7,则实数k= ( )
A. B.
C. D.
8.在某活动现场,为了解不同时段的入口游客人流量,从上午10点开始第一次向指挥中心反馈入口游客人流量,以后每过1个小时反馈一次.指挥中心统计了前5次的数据(i,yi),其中i=1,2,3,4,5,yi为第i次入口游客人流量(单位:百人),由此得到y关于i的非线性经验回归方程为=log2(i+1)+5.已知=9,则预测下午4点时入口游客的人流量约为(参考数据:log23≈1.6,log25≈2.3) ( )
A.9.6百人 B.11.0百人
C.11.3百人 D.12.0百人
二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.变量x与y的成对数据的散点图如图所示,并由最小二乘法计算得到经验回归直线l1的方程为=x+,样本相关系数为r1,决定系数为.经过残差分析确定第二个点B为离群点(对应残差过大),把点B去掉后,再用剩下的7组数据计算得到经验回归直线l2的方程为=x+,样本相关系数为r2,决定系数为.则以下结论中正确的是 ( )
A.< B.<
C.r1>r2 D.<
10.下列说法正确的是 ( )
A.已知y关于x的经验回归方程为=1-2x,则变量x增加1个单位时,平均增加2个单位
B.用模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=ln y,求得经验回归方程为=2x+1,则c,k的值分别是e和2
C.样本相关系数r越大,两个变量的线性相关程度越强,反之,线性相关程度越弱
D.根据分类变量X与Y的成对样本数据,计算得到χ2=4.712,根据小概率值α=0.05的独立性检验(x0.05=3.841),可判断X与Y有关联,此推断犯错误的概率不大于0.05
11.有两个分类变量X与Y,其2×2列联表如下表所示:
X Y 合计
Y=0 Y=1
X=0 a 20-a 20
X=1 15-a 30+a 45
合计 15 50 65
其中a,15-a均为大于5的整数,根据小概率值α=0.05的独立性检验,认为X与Y之间有关联,则a的值可以为 ( )
A.7 B.8
C.9 D.6
三、填空题:本题共3小题,每小题5分,共15分.
12.某高校“统计初步”课程的教师随机调查了选该课程的一些学生情况,具体数据如下表:
单位:人
性别 专业 合计
非统计专业 统计专业
男 13 10 23
女 7 20 27
合计 20 30 50
为了判断是否为统计专业与性别是否有关联,根据表中数据,得到χ2=≈4.844>3.841,所以根据小概率值α= 的独立性检验,认为是否为统计专业与性别有关联.
13.[2024·南阳高二期中] 已知变量x和y之间的关系可以用模型y=menx来拟合.设z=ln y,若根据样本数据计算可得=3.5,=0.9,且x与z的经验回归方程为=0.6x+,则m≈ .(参考数据:ln 0.3≈-1.2,ln 0.25≈-1.4)
14.为了考察某种药物预防疾病的效果,进行动物试验,得到如下的2×2列联表:
单位:只
药物 疾病 合计
未患病 患病
服用 m 50-m 50
未服用 80-m m-30 50
合计 80 20 100
若根据小概率值α=0.05的独立性检验,我们推断此种药物对疾病预防有显著效果,则m(m≥40,m∈N)的最小值为 .
四、解答题:本题共5小题,共77分.解答应写出文字说明、证明过程或演算步骤.
15.(13分)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
单位:件
机床类别 产品质量 合计
一级品 二级品
甲机床 150 50 200
乙机床 120 80 200
合计 270 130 400
(1)甲、乙机床生产的产品中一级品的频率分别是多少
(2)根据小概率值α=0.01的独立性检验,分析甲机床生产的产品质量与乙机床生产的产品质量是否有差异.
16.(15分)某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
使用年限x(单位:年) 1 2 3 4 5 6 7
失效费y(单位:万元) 2.9 3.3 3.6 4.4 4.8 5.2 5.9
(1)由上表数据可知,可用线性回归模型拟合y与x的关系,请用样本相关系数(精确到0.01)加以说明;
(2)求出y关于x的经验回归方程,并预测该种机械设备使用10年的失效费.
参考数据:(xi-)(yi-)=14,(yi-)2=7.08,≈14.08.
17.(15分)为推动新能源汽车产业高质量发展,国家出台了系列政策举措,对新能源汽车产业发展带来了巨大的推动效果.下表是某新能源汽车品牌从2019年到2023年新能源汽车的年销售量w(单位:万辆)和年份代码t的几组数据.已知根据散点图和样本相关系数判断,它们之间的线性相关程度很强,求w关于t的经验回归方程=t+,并预测2025年该品牌新能源汽车的销售量.
年份代码t 1 2 3 4 5
年销售量w/万辆 4 9 14 18 25
18.(17分)[2024·广东六校高二期中] 红铃虫是棉花的主要害虫之一,能对农作物造成严重伤害.每只红铃虫的平均产卵个数y和平均温度x(单位:℃)有关,现收集了7组数据,得到如图所示的散点图及一些统计量的值.
(1)根据散点图判断,y=bx+a与y=cedx(其中e为自然对数的底数)哪一个更适合作为y关于x的回归模型(给出判断即可,不必说明理由) 并由判断结果及表中数据,求出y关于x的经验回归方程.
(2)现在有10根棉花纤维,其中有6根为长纤维,4根为短纤维,从中随机抽取3根棉花纤维,设抽到的长纤维棉花的根数为X,求X的分布列.
附:经验回归方程=x+中,=.
参考数据(z=ln y)
(xi-)(yi-) (xi-)(zi-)
5215 2347.3 33.6 27 81.3 3.6
19.(17分)为丰富第二课堂,拓展素质教育,某校鼓励学生参加书法兴趣小组和绘画兴趣小组,开展相关实践活动.该校共有3000名学生,为了解学生的参加情况,从全校学生中随机抽取150名学生进行调查,发现有5人没有参加兴趣小组,且样本中仅参加书法兴趣小组和仅参加绘画兴趣小组的学生每周投入时间的情况如下表:
兴趣小组活动类别 每周投入时间(小时)
(0,3] (3,5] (5,10] 大于10
仅参加书法兴趣小组人数z 25 30 15 10
仅参加绘画兴趣小组人数y 10 20 25 5
(1)用频率估计概率,试估计全校学生中书法兴趣小组和绘画兴趣小组都参加的人数;
(2)在样本中,从仅参加书法兴趣小组和仅参加绘画兴趣小组的学生中各随机抽取1人,用X表示2人中每周投入时间大于5小时的人数,求X的分布列和数学期望;
(3)根据公式r=计算仅参加书法兴趣小组和仅参加绘画兴趣小组的学生在各投入时间段人数的样本相关系数r,并推断它们的相关程度,其中,s1分别为仅参加书法兴趣小组的学生在各投入时间段人数的均值和标准差,,s2分别为仅参加绘画兴趣小组的学生在各投入时间段人数的均值和标准差.
附:
样本相关系数r 0<|r|≤0.4 0.4<|r|<0.7 0.7≤|r|<1
相关程度 低度线性相关 显著线性相关 高度线性相关