INCLUDEPICTURE "课后达标检测LLL.TIF"
一、选择题
1.设两个变量x和y之间具有线性相关关系,它们的样本相关系数为r,y关于x的经验回归方程为=x+,则( )
A.与r的符号相反 B.与r的符号相同
C.与r的符号相同 D.与r的符号相反
解析:选C.由线性相关关系可知:若>0,等价于两个变量正相关,等价于r>0;若<0,等价于两个变量负相关,等价于r<0,所以与r的符号相同,故A错误,C正确;又因为与r的符号没有关系,故B,D错误.故选C.
2.下列关于独立性检验的说法正确的是( )
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以100%确定两个变量之间是否具有某种关系
C.利用χ2独立性检验推断吸烟与患肺病的关联中,根据小概率值α=0.01的独立性检验,认为吸烟与患肺病有关系时,则我们可以说在100个吸烟的人中,有99人患肺病
D.对于独立性检验,随机变量χ2的值越小,判定两变量有关系犯错误的概率越大
解析:选D.对于A,独立性检验是通过卡方计算来判断两个变量存在关联的可能性的一种方法,并非检验二者是否是线性相关,故A错误;对于B,独立性检验并不能100%确定两个变量相关,故B错误;对于C,99%是指“吸烟”和“患肺病”存在关联的可能性,并非吸烟人中患肺病的发病率,故C错误;对于D,根据χ2计算的定义可知该选项正确.故选D.
3.已知四组不同数据的两个变量的样本相关系数r如下:数据组①的样本相关系数r1=0;数据组②的样本相关系数r2=-0.95;数据组③的样本相关系数|r3|=0.89;数据组④的样本相关系数r4=0.75.则下列说法正确的是( )
A.①对应的数据点都在同一直线上
B.②中的两个变量线性相关程度最强
C.③中的两个变量线性相关程度最强
D.④中的两个变量线性相关程度最强
解析:选B.因为r1=0,所以数据组①中的两个变量不是线性相关关系,对应的数据点不可能都在同一直线上,故A不正确;因为|r2|最大,所以数据组②中的两个变量线性相关程度最强,故B正确,C,D不正确.故选B.
4.已知两个统计案例如下:
①某机构调查了100位社区网络员手机即时通讯软件的使用情况,结果如下表:
类别 35岁以上 35岁以下 合计
微信 45 20 65
QQ 13 22 35
合计 58 42 100
②为了解某地母亲身高与女儿身高的关系,随机测得10对母女的身高数据如下表:
母亲身高/cm 159 160 160 163 159 154 159 158 159 157
女儿身高/cm 158 159 160 161 161 155 162 157 162 156
则对这些数据的处理所采用的统计方法是( )
A.①回归分析,②取平均值
B.①回归分析,②独立性检验
C.①独立性检验,②回归分析
D.①独立性检验,②取平均值
解析:选C.独立性检验是判断两个分类变量是否有关联的一种方法,而回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.①中的两个变量为分类变量,采用的统计方法为独立性检验,②中的两个变量是具有相关关系的,采用的统计方法为回归分析.故选C.
5.手机给人们的生活带来便捷,但同时也对中学生的生活和学习造成了一定的影响.某校几个学生成立研究性学习小组,就使用手机对学习成绩的影响随机抽取了该校100名学生的期末考试成绩并制成如下列联表,则下列说法正确的是( )
单位:名
手机使用情况 成绩 合计
成绩优秀 成绩不优秀
不用手机 40 10 50
使用手机 5 45 50
合计 45 55 100
(参考公式:χ2=,其中n=a+b+c+d,x0.1=2.706,x0.01=6.635,x0.001=10.828)
A.依据小概率值α=0.01的独立性检验,认为使用手机与学习成绩无关
B.依据小概率值α=0.1的独立性检验,认为使用手机与学习成绩无关
C.在犯错误的概率不超过0.001的前提下认为使用手机与学习成绩有关
D.依据小概率值α=0.001的独立性检验,认为使用手机与学习成绩无关
解析:选C.由题表中的数据,计算χ2=≈49.49>10.828>6.635>2.706,所以在犯错误的概率不超过0.001的前提下认为使用手机与学习成绩有关,故A,B,D错误,C正确.故选C.
6.假设变量x与变量y的n对观测数据为(x1,y1),(x2,y2),…,(xn,yn),两个变量满足一元线性回归模型要利用成对样本数据求参数b的最小二乘估计,即求使Q(b)=(yi-bxi)2取最小值时的b的值,则( )
A.= eq \f(\i\su(i=1,n,x)iyi,\i\su(i=1,n,x))
B.= eq \f(\i\su(i=1,n,x)iyi,\i\su(i=1,n,y))
C.= eq \f(\i\su(i=1,n,x)iyi,\r(\i\su(i=1,n,x)·\i\su(i=1,n,y)))
D.=
解析:选A.因为Q(b)=(yi-bxi)2=(y-2bxiyi+b2x)=b2-2biyi+,上式是关于b的二次函数,因此要使Q取得最小值,当且仅当b的取值为= eq \f(\i\su(i=1,n,x)iyi,\i\su(i=1,n,x)) .故选A.
7.云计算是信息技术发展的集中体现,近年来,我国云计算市场规模持续增长.已知某科技公司2019年至2023年云计算市场规模数据,且市场规模y与年份代码x的关系可以用模型y=c1ec2x(其中e为自然对数的底数)拟合,设z=ln y,得到数据统计表如下:
年份 2019年 2020年 2021年 2022年 2023年
年份代码x 1 2 3 4 5
云计算市场规模y/千万元 7.4 11 20 36.6 66.7
z=ln y 2 2.4 3 3.6 4
由上表可得经验回归方程=0.52x+,则2026年该科技公司云计算市场规模y的估计值为( )
A.e5.08 B.e5.6
C.e6.12 D.e6.5
解析:选B.因为=3,=3,所以=-0.52=3-3×0.52=1.44,即经验回归方程=0.52x+1.44,当x=8时,=0.52×8+1.44=5.6,所以y=ez=e5.6,即2026年该科技公司云计算市场规模y的估计值为e5.6.故选B.
8.(多选)下列说法错误的是( )
A.当样本相关系数r满足|r|=1时,成对样本数据的两个变量之间满足一种线性关系
B.残差等于预测值减去观测值
C.决定系数R2越大,模型拟合效果越差
D.在独立性检验中,当χ2≥xα(xα为α的临界值)时,推断零假设H0不成立
解析:选BC.当样本相关系数r=±1 时,成对样本数据的两个变量之间满足一种线性关系,故A正确;残差等于观测值减去预测值,故B错误;决定系数R2越大,模型拟合效果越好,故C错误;根据独立性检验的规则,当χ2≥xα时,推断零假设H0不成立,D正确.故选BC.
9.(多选)某机构通过抽样调查,利用2×2列联表和χ2统计量研究秃顶与患心脏病是否有关时,零假设为H0:秃顶与患心脏病无关.经查对临界值表知x0.1=2.706,x0.05=3.841,下列说法正确的是( )
A.若χ2=3.503,依据小概率值α=0.1的独立性检验,推断H0不成立,即认为秃顶与患心脏病有关联
B.若χ2=3.503,依据小概率值α=0.05的独立性检验,推断H0不成立,即认为秃顶与患心脏病有关联
C.若依据小概率值α=0.05的独立性检验推断H0不成立,即认为秃顶与患心脏病有关联,是说某人秃顶,那么他有95%的可能性患心脏病
D.若依据小概率值α=0.1的独立性检验推断H0不成立,即认为秃顶与患心脏病有关联,该推断犯错误的概率不大于0.1
解析:选AD.依据小概率值α=0.1的独立性检验,χ2=3.503>2.706,则推断H0不成立,即认为秃顶与患心脏病有关联,故A正确;
依据小概率值α=0.05的独立性检验,χ2=3.503<3.841,则没有充分证据推断H0不成立,因此可以认为H0成立,即认为秃顶与患心脏病无关,故B错误;
若依据小概率值α=0.05的独立性检验推断H0不成立,则认为秃顶与患心脏病有关联,此推断犯错误的概率不大于0.05,故C错误;若依据小概率值α=0.1的独立性检验推断H0不成立,即认为秃顶与患心脏病有关联,该推断犯错误的概率不大于0.1,故D正确.故选AD.
10.(多选)已知随机变量x与y的4组样本数据(记为(x1,y1),(x2,y2),(x3,y3),(x4,y4))如下表:
x 1 2 3 4
y 1 m n 4
已知上表数据中=2.5.若某同学对m赋了三个值分别为1.5,2,2.5,得到三条经验回归直线分别为=1x+1,=2x+2,=3x+3,对应的样本相关系数分别为r1,r2,r3,下列结论中正确的是( )
参考公式:= eq \f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,n,x)-n\o(x,\s\up6(-))2) ,=-,
r= eq \f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\i\su(i=1,n,x)-n\o(x,\s\up6(-))2)\r(\i\su(i=1,n,y)-n\o(y,\s\up6(-))2))
A.三条回归直线有共同交点
B.三个样本相关系数中,r2最大
C.1>2
D.1>2
解析:选ABC.由题意,1+m+n+4=10,即m+n=5.若m=1.5,则n=3.5,此时==2.5,=2.5,iyi=1×1+2×1.5+3×3.5+4×4=30.5,则1= eq \f(\i\su(i=1,4,x)iyi-4\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,4,x)-4\o(x,\s\up6(-))2) ===1.1,1=-1=2.5-1.1×2.5=-0.25,r1= eq \f(\i\su(i=1,4,x)iyi-4\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\i\su(i=1,4,x)-4\o(x,\s\up6(-))2)\r(\i\su(i=1,4,y)-4\o(y,\s\up6(-))2)) =≈ ;若m=2,则n=3,此时=2.5,=2.5,iyi=30,同理得2=1,2=0,r2=1;若m=2.5,则n=2.5,iyi=29.5,此时=2.5,=2.5,同理得3=0.9,3=0.25,r3=.三条经验回归直线均经过点(2.5,2.5),故A正确;由上得,三个样本相关系数中r2最大,1>2,1<2,故B,C正确,D错误.故选ABC.
二、填空题
11.由样本数据(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5)得到的经验回归方程为=x+,已知i=12,i=22,则实数的值为________.
解析:由题意得=2.4,=4.4,代入经验回归方程,解得=2.4.
答案:2.4
12.根据下面的数据:
x 1 2 3 4
y 31.6 52.5 72 91.9
求得y关于x的经验回归方程为=20x+12,则这组数据相对于所求的经验回归方程的4个残差的方差为________.
解析:根据=20x+12,将x=1,2,3,4代入求得分别为32,52,72,92,则4个残差为-0.4,0.5,0,-0.1,残差的平均数为0,故残差的方差为s2=×[(-0.4-0)2+(0.5-0)2+(0-0)2+(-0.1-0)2]=0.105.
答案:0.105
13.为研究交通事故中摩托车骑乘人员伤亡情况是否与戴头盔情况有关,现对发生交通事故的摩托车骑乘人员进行相关调查,制成如下2×2列联表(单位:人).
单位:人
戴头盔情况 伤亡情况 合计
致死 不致死
不戴头盔 80 20 100
戴头盔 20 80 100
合计 100 100 200
现从交通事故致死的摩托车骑乘人员中按照分层随机抽样的方法抽取5人,再从这5人中抽取2人进行调查,这2人都是不戴头盔致死的概率为________,依据小概率值α=0.01的独立性检验,可以认为交通事故中摩托车骑乘人员伤亡情况与戴头盔情况________.(填“有关”或“无关”)(附:x0.01=6.635)
解析:在交通事故致死的摩托车骑乘人员中,不戴头盔与戴头盔的人数比例是80∶20=4∶1,所以按照分层随机抽样的方法抽取的5人中,不戴头盔的有5×=4(人),戴头盔的有5×=1(人),从5人中随机抽取2人,共有C种可能的结果,而这2人都是不戴头盔的有C种可能的结果,所以这2人都是不戴头盔致死的概率P= eq \f(C,C) =;由题表计算可得,χ2==72>6.635,依据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为交通事故中摩托车骑乘人员伤亡情况与戴头盔情况有关,此推断犯错误的概率不大于0.01.
答案: 有关
14.汽车轮胎凹槽深度是影响汽车刹车的因素之一,汽车行驶会导致轮胎面磨损.某实验室通过实验测得行驶里程与某品牌轮胎凹槽深度的数据,建立了如下回归模型y=c1·ec2x,通过实验数据分析与计算得到如下结论:①c2=-0.18;②=10,令u=ln y,=0.35,则回归方程应为________.
解析:因为回归模型为y=c1·ec2x,因为c2=-0.18,可得y=c1·e-0.18x,两边同时取对数,可得ln y=ln (c1·e-0.18x)=ln c1-0.18x,令u=ln y,此时u=ln c1-0.18x,又因为=10,=0.35,所以ln c1=0.35+0.18×10=2.15,即c1=e2.15,所以=e2.15·e-0.18x=e2.15-0.18x.
答案:=e2.15-0.18x
三、解答题
15.由于航天行业拥有广阔的发展前景,有越来越多的公司开始从事航天研究,某航天公司研发了一种火箭推进器,为测试其性能,对推进器飞行距离与损坏零件数进行了统计,数据如下:
飞行距离x/km 56 63 71 79 90 102 110 117
损坏零件数y/个 61 73 90 105 119 136 149 163
参考数据:=86,=112,iyi=82 743,
=62 680.
(1)建立y关于x的经验回归模型y=bx+a,根据所给数据及回归模型,求y关于x的经验回归方程(精确到0.1,精确到1);
(2)该公司进行了第二项测试,从所有同型号推进器中随机抽取100台进行等距离飞行测试,对其中60台进行飞行前保养,测试结束后,有20台报废,其中保养过的推进器占比30%,请根据统计数据完成2×2列联表,并根据小概率值α=0.01的独立性检验,能否认为推进器是否报废与保养情况有关?
单位:台
报废情况 保养情况 合计
保养 未保养
报废 20
未报废
合计 60 100
附:经验回归方程=x+中斜率和截距的最小二乘估计公式分别为= eq \f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-)) \o(y,\s\up6(-)),\i\su(i=1,n,x)-n\o(x,\s\up6(-))2) ,=-,χ2=,n=a+b+c+d;
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
解:(1)由题意得= eq \f(\i\su(i=1,8,x)iyi-8\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,8,x)-8\o(x,\s\up6(-))2) =≈1.6,
则=-≈112-1.6×86≈-26,
所以=1.6x-26.
(2)由题意,报废推进器中保养过的共20×30%=6(台),未保养的推进器共20-6=14(台),
补充2×2列联表如下:
单位:台
报废情况 保养情况 合计
保养 未保养
报废 6 14 20
未报废 54 26 80
合计 60 40 100
零假设为H0:推进器是否报废与保养情况无关,则χ2==9.375>6.635=x0.01,
根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为推进器是否报废与保养情况有关,此推断犯错误的概率不大于0.01.
16.某学校为学生开设了一门模具加工课,经过一段时间的学习,拟举行一次模具加工大赛,学生小明、小红打算报名参加大赛.赛前,小明、小红分别进行了为期一周的封闭强化训练,下表记录了两人在封闭强化训练期间每天加工模具成功的次数,其中小明第7天的成功次数a忘了记录,但知道36≤a≤55,a∈Z(yi,zi分别表示小明、小红第i天的成功次数).
类别 序号x 小明成功次数(y) 小红成功次数(z)
第一天 1 16 16
第二天 2 20 22
第三天 3 20 25
第四天 4 25 26
第五天 5 30 32
第六天 6 36 35
第七天 7 a 35
(1)求这7天内小明成功的总次数不少于小红成功的总次数的概率;
(2)根据小明这7天内前6天的成功次数,求其成功次数y关于序号x的经验回归方程,并估计小明第七天成功次数a的值.
参考公式:经验回归方程=x+中斜率与截距的最小二乘估计公式分别为:
== eq \f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,n,x)-n\o(x,\s\up6(-))2) ,=-.
参考数据:iyi=582,=91.
解:(1)因为36≤a≤55,且a∈Z,所以a的取值共有55-36+1=20种情况,yi,zi分别表示小明、小红第i天的成功次数,又当小明成功的总次数不少于小红成功的总次数时,i+a≥i,
即16+20+20+25+30+36+a≥16+22+25+26+32+35+35,得a≥44,
又36≤a≤55,所以可得44≤a≤55,且a∈Z,所以小明成功的总次数不少于小红成功的总次数时,a的取值共有55-44+1=12种情况,
所以这7天内小明成功的总次数不少于小红成功的总次数的概率为=.
(2)由题设可知
iyi=582,=91,
==,
==,
所以==,
=-=-×=11,
所以成功次数y关于序号x的经验回归方程为=x+11.
当x=7时,=×7+11=38,符合题意,则估计小明第七天成功次数a的值为38.
17.杭州亚运会开幕式于2023年9月23日在杭州奥体中心体育场举行.为了解某高校大一学生对亚运会开幕式的关注情况,从该校大一学生中随机抽取了200人进行调查,调查对象中女生有60人.下图是根据调查结果绘制的等高堆积条形图.
INCLUDEPICTURE "25-BS6A.TIF"
(1)完成下面的2×2列联表,根据小概率值α=0.05的独立性检验,判断对亚运会开幕式的关注是否与性别有关;
单位:人
性别 关注情况 合计
关注 没关注
男
女
合计
(2)从上述关注亚运会开幕式的学生中,按分层随机抽样的方法抽出18人,然后从这18人中随机选出3人赠送开幕式门票,记被抽取的3人中获得赠送亚运会开幕式门票的女生人数为随机变量X,求X的分布列及均值.
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
解:(1)根据题意,男生有200-60=140(人).
关注亚运会开幕式的男生有140×=70(人),女生有60×(1-)=20(人);
没有关注亚运会开幕式的男生有140×=70(人),女生有60×=40(人);
因此,2×2列联表完成如下:
单位:人
性别 关注情况 合计
关注 没关注
男 70 70 140
女 20 40 60
合计 90 110 200
零假设为H0:对亚运会开幕式的关注情况与性别无关.
由列联表数据可得χ2==≈4.714>3.841=x0.05,
根据小概率值α=0.05的独立性检验,推断H0不成立,即认为对亚运会开幕式的关注情况与性别有关,此推断犯错误的概率不大于0.05.
(2)由(1)知,关注亚运会开幕式的学生总人数为90,按分层随机抽样的方法抽出18人,
则抽样比为=,其中男生人数为70×=14,女生人数为20×=4.
从其中随机选出3人赠送开幕式门票,则X的所有可能取值为0,1,2,3.
P(X=0)= eq \f(CC,C) =,P(X=1)= eq \f(CC,C) =,
P(X=2)= eq \f(CC,C) =,P(X=3)= eq \f(CC,C) =,
故X的分布列为
X 0 1 2 3
P
所以X的均值E(X)=0×+1×+2×+3×=.