滚动习题(五)
1.B [解析] R2的值越大,表示残差平方和越小,也就是说拟合效果越好,故模型2的拟合效果最好.
2.D [解析] 前三种方法只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度.独立性检验通过计算得出相关的可能性,较为准确.故选D.
3.A [解析] 因为经验回归直线=0.202 3x+0.202的斜率大于0,所以x与y正相关.因为y与z负相关,所以可设=y+,<0,则=y+=0.202 3x+0.202+,因为0.202 2<0,所以x与z负相关.故选A.
4.B [解析] y关于x的非线性经验回归方程为=20.2x-1,令x=50,得=29,所以当x=50时,y的预测值为29,故选B.
5.B [解析] 由题意可知,χ2=5.236>3.841=x0.05,根据独立性检验可知,变量Ⅰ与Ⅱ有关联,这个结论犯错误的概率不超过0.05.故选B.
6.D [解析] 由散点图可知,散点集中在曲线y=a+bln x的周围,故选D.
7.B [解析] 由题意可得解得4≥6.635,可得m≥6.07,故m=7.故选B.
8.BD [解析] 对于A,|r|越接近1,则y和x之间的线性相关程度越强,反之越弱,故A错误;根据残差的定义知C错误;易知B,D均正确.故选BD.
9.AC [解析] 对于A,因为被调查的男、女生人数相同,所以由等高堆积条形图可知被调查的学生中喜欢登山的男生人数比喜欢登山的女生人数多,所以A正确;对于B,由等高堆积条形图可知,被调查的女生中喜欢登山的人数比不喜欢登山的人数少,所以B错误;对于C,根据题中数据,得到2×2列联表如下:
单位: 人
登山 性别 合计
男生 女生
喜欢 80 30 110
不喜欢 20 70 90
合计 100 100 200
零假设为H0:是否喜欢登山与性别无关,由列联表中数据,得χ2=≈50.505>6.635=x0.01,根据小概率值α=0.01的独立性检验,推断H0不成立,即认为是否喜欢登山与性别有关,所以C正确;对于D,当被调查的男、女生人数均为10时,2×2列联表如下:
单位: 人
登山 性别 合计
男生 女生
喜欢 8 3 11
不喜欢 2 7 9
合计 10 10 20
零假设为H0:是否喜欢登山与性别无关,由表中数据知χ2=≈5.051<6.635=x0.01,根据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为是否喜欢登山与性别无关,所以D错误.故选AC.
10.-0.5 [解析] 设x=-1时的观测值为m,则==0,==,将点的坐标代入=-0.9x+2.6,可得=2.6,解得m=3.把x=-1代入=-0.9x+2.6,得=3.5,∴当x=-1时,残差为3-3.5=-0.5.
11.有 [解析] 依题意,可得到如下2×2列联表:
单位: 名
对该手机的态度 国内外潜在用户代表 合计
国内 国外
不乐观 40 60 100
乐观 60 40 100
合计 100 100 200
零假设为H0:对该手机的态度和国内外差异无关.根据表中数据得χ2==8>7.879=x0.005,根据小概率值α=0.005的独立性检验,推断H0不成立,即认为对该手机的态度和国内外差异有关.
12. [解析] 令t=x2,则=x2-即为=t-,==,===,因为点在直线=t-上,所以=-,解得=.
13.解:(1)依题意,r===≈≈-0.98,所以|r|=0.98>0.75,所以x与y间的线性相关程度较高.
(2)===-0.58,=-=4.8+0.58×3=6.54,所以=-0.58x+6.54,当x=6时,=-0.58×6+6.54=3.06,所以估计该地区2025年的新增碳排放量为3.06万吨.
14.解:(1)零假设为H0:产品的合格与技术升级无关,经计算得到χ2==≈10.256>7.879=x0.005,根据小概率值α=0.005的独立性检验,推断H0不成立,即认为产品合格与技术升级有关联.
(2)由题意,升级前后合格品的比例为4∶5,故抽取的9件产品中有4件属于升级前生产的,有5件属于升级后生产的.X>Y包括X=4,Y=0和X=3,Y=1两种情况:当X=4,Y=0时,其概率P1==,当X=3,Y=1时,其概率P2==,则X>Y的概率P=P1+P2=.
15.解:(1)设ω关于v的经验回归方程为=v+,
而=vi=4.1,=wi=3.05,
则===0.5,
=-=3.05-0.5×4.1=1,所以ω关于v经验回归方程为=0.5v+1 .
因为vi=ln xi,wi=ln yi,所以ln =0.5ln x+1,所以=ex0.5,故y关于x的经验回归方程为=ex0.5.
(2)零假设为H0:关注的旅游项目和年龄无关联.
χ2==≈5.556>3.841=x0.05,
故依据小概率值α=0.05的独立性检验,推断H0不成立,即认为关注的旅游项目和年龄有关联.滚动习题(五)
[范围8.1~8.3]
(时间:45分钟 分值:100分)
一、单项选择题(本大题共7小题,每小题5分,共35分)
1.在建立两个变量y与x的回归模型时,分别选择了4个不同的模型,它们的决定系数R2如下表,其中拟合效果最好的模型为 ( )
模型1 模型2 模型3 模型4
R2 0.75 0.90 0.25 0.55
A.模型1 B.模型2
C.模型3 D.模型4
2.判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精确的是 ( )
A.三维柱形图 B.二维条形图
C.等高条形图 D.独立性检验
3.已知y关于x的经验回归方程为=0.202 3x+0.202,变量y与z负相关,则下列结论正确的是 ( )
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
4.已知y关于x的非线性经验回归方程为=20.2x-1,则当x=50时,y的预测值为 ( )
A.0 B.29
C.210 D.1
5.[2024·江苏盐城中学高二月考] 根据分类变量Ⅰ与Ⅱ的统计数据,计算得到χ2=5.236,则 ( )
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.变量Ⅰ与Ⅱ有关联
B.变量Ⅰ与Ⅱ有关联,这个结论犯错误的概率不超过0.05
C.变量Ⅰ与Ⅱ无关联
D.变量Ⅰ与Ⅱ无关联,这个结论犯错误的概率不超过0.05
6.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽试验,由试验数据(xi,yi)(i=1,2,…,20)得到如图所示的散点图.
由此散点图,在10 ℃至40 ℃之间,下面四个模型中最适宜作为发芽率y和温度x的回归模型的是 ( )
A.y=a+bx
B.y=a+bx2
C.y=a+bex
D.y=a+bln x
7.已知2×2列联表如下:
X Y 合计
Y=0 Y=1
X=0 m 12-m 12
X=1 10-m 20+m 30
合计 10 32 42
其中m,12-m均为大于4的整数,若在犯错误的概率不超过0.01的前提下认为X和Y之间有关联,则m= ( )
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
A.6 B.7
C.8 D.9
二、多项选择题(本大题共2小题,每小题6分,共12分)
8.有一组样本数据(x1,y1),(x2,y2),…,(xn,yn),由这组样本数据得到的经验回归方程为=x+,则 ( )
A.样本相关系数r越大,两个变量的线性相关程度越强;反之,线性相关程度越弱
B.经验回归直线=x+必经过点(,)
C.若样本数据(x1,y1)的残差为1,则样本中必有数据(xi,yi)(2≤i≤n)的残差为-1
D.当样本相关系数r=1时,样本数据(x1,y1),(x2,y2),…,(xn,yn)都在直线=x+上
9.为了增强学生的身体素质,提高适应自然环境、克服困难的能力,某校在课外活动中新增了一项登山活动,并对“学生是否喜欢登山与性别是否有关”做了一次调查,其中被调查的男、女生人数相同,得到如图所示的等高堆积条形图,则下列说法中正确的有 ( )
附:χ2=,其中n=a+b+c+d.
α 0.05 0.01
xα 3.841 6.635
A.被调查的学生中喜欢登山的男生人数比喜欢登山的女生人数多
B.被调查的女生中喜欢登山的人数比不喜欢登山的人数多
C.若被调查的男、女生人数均为100,则根据小概率值α=0.01的独立性检验,认为是否喜欢登山与性别有关
D.无论被调查的男、女生人数为多少,根据小概率值α=0.01的独立性检验,都可以认为是否喜欢登山与性别有关
三、填空题(本大题共3小题,每小题5分,共15分)
10.已知变量x和y的统计数据如下表:
x -2 -1 0 1 2
y 5 2 2 1
如果由表中的数据得到y关于x的经验回归方程为=-0.9x+2.6,那么当x=-1时,残差为 .
11.某手机营销商为了拓展业务,现对该手机的潜在用户进行调查,随机抽取国内、国外潜在用户代表各100名,调查用户对该手机的态度,得到如图所示的等高堆积条形图.根据小概率值α=0.005的独立性检验,认为对该手机的态度和国内外差异 关.(填“有”或“无”)
12.在样本点(xi,yi)(i=1,2,3,4,5,6)的散点图中,所有的点都在曲线=x2-附近波动.经计算得xi=12,yi=14,=23,则实数的值为 .
四、解答题(本大题共3小题,共38分.解答应写出必要的文字说明、证明过程或演算步骤)
13.(10分)[2024·陕西渭南高二期末] 某地区响应“节能减排,低碳生活”的号召,开展系列的措施控制碳排放.环保部门收集到近5年内新增碳排放量,如下表所示,其中x为年份代号,y(单位:万吨)为新增碳排放量.
年份 2020 2021 2022 2023 2024
年份代号x 1 2 3 4 5
新增碳排放量y(万吨) 6.1 5.2 4.9 4 3.8
(1)请计算样本相关系数r,并说明x与y间的线性相关程度是否较高(若|r|>0.75,则线性相关程度较高)
(2)求y关于x的经验回归方程,并据此估计该地区2025年的新增碳排放量.
参考数据:=3,=4.8,xiyi=66.2,=55,=118.7,≈1.87,≈5.92.
参考公式:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归直线=x+的斜率和截距的最小二乘估计分别为=,=-,样本相关系数r=.
14.(13分)[2024·聊城三中高二月考] 某生产企业对原有的生产线进行技术升级,在技术升级前后,分别从其产品中(单位:件)随机抽取样本数据进行统计,制作了如下2×2列联表:
单位:件
技术 产品 合计
合格 不合格
升级前 120 80 200
升级后 150 50 200
合计 270 130 400
(1)根据上表,依据小概率值α=0.005的独立性检验,能否认为产品合格与技术升级有关联
(2)在抽取的所有合格品中,按升级前后合格品进行比例分配的分层随机抽样,抽取9件产品,然后从这9件产品中随机抽取4件,记其中属于升级前生产的产品有X件,属于升级后生产的产品有Y件,求X>Y的概率.
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
15.(15分)[2024·河南南阳高二期中] 某市旅游局通过文旅度假项目考察后,在“五一”期间推出了多个具体项目,销售火爆.其中乡村旅游项目推出了六条经典路线,六款不同价位的套票与相应价格x的数据如下表.
旅游线路 奇山秀水游 古村落游 慢生活游 新子游 采摘游 舌尖之旅
套票型号 A B C D E F
价格x(元) 39 49 58 67 77 86
经数据分析、描点绘图,发现价格x与购买人数y近似满足关系式y=mxn(m>0,n>0),对上述数据进行初步处理,其中vi=ln xi,wi=ln yi,i=1,2,…,6.
(1)根据所给数据,求y关于x的经验回归方程.
(2)为进一步优化旅游方面的投资,相关部门在“五一”期间随机调查了200位旅游者,以了解不同年龄段的旅游者对不同项目的关注情况,得到列联表如下:
单位:人
关注的旅游项目 年龄 合计
50岁以上 50岁以下
项目A,B,C 80 40 120
项目D,E,F 40 40 80
合计 120 80 200
依据小概率值α=0.05的独立性检验,能否认为关注的旅游项目和年龄有关联
附:viwi=75.3,vi=24.6,wi=18.3,=101.4.
对于一组数据(v1,w1),(v2,w2),…,(vn,wn),其经验回归直线=v+的斜率和截距的最小二乘估计分别为==,=-.
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
χ2=,n=a+b+c+d.(共41张PPT)
滚动习题(五)范围8.1~8.3
一、单项选择题(本大题共7小题,每小题5分,共35分)
1.在建立两个变量与 的回归模型时,分别选择了4个不同的模型,
它们的决定系数 如下表,其中拟合效果最好的模型为( )
模型1 模型2 模型3 模型4
0.75 0.90 0.25 0.55
A.模型1 B.模型2 C.模型3 D.模型4
[解析] 的值越大,表示残差平方和越小,也就是说拟合效果越好,
故模型2的拟合效果最好.
√
2.判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精
确的是( )
A.三维柱形图 B.二维条形图 C.等高条形图 D.独立性检验
[解析] 前三种方法只能直观地看出两个分类变量与 是否相关,但
看不出相关的程度.
独立性检验通过计算得出相关的可能性,较为准确.故选D.
√
3.已知关于的经验回归方程为,变量与 负
相关,则下列结论正确的是( )
A.与正相关,与负相关 B.与正相关,与 正相关
C.与负相关,与负相关 D.与负相关,与 正相关
[解析] 因为经验回归直线的斜率大于0,所以
与正相关.
因为与负相关,所以可设, ,则
,
因为,所以 与 负相关.故选A.
√
4.已知关于的非线性经验回归方程为,则当 时,
的预测值为( )
A.0 B. C. D.1
[解析] 关于的非线性经验回归方程为,令 ,得
,所以当时,的预测值为 ,故选B.
√
5.[2024·江苏盐城中学高二月考]根据分类变量Ⅰ与Ⅱ的统计数据,计算
得到 ,则( )
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.变量Ⅰ与Ⅱ有关联
B.变量Ⅰ与Ⅱ有关联,这个结论犯错误的概率不超过0.05
C.变量Ⅰ与Ⅱ无关联
D.变量Ⅰ与Ⅱ无关联,这个结论犯错误的概率不超过0.05
[解析] 由题意可知, ,根据独立性检验
可知,变量Ⅰ与Ⅱ有关联,这个结论犯错误的概率不超过0.05.故选B.
√
6.某校一个课外学习小组为研究某作物
种子的发芽率和温度 (单位: )的
关系,在20个不同的温度条件下进行种
子发芽试验,由试验数据 得到如图所示的散点图.
由此散点图,在至 之间,下面四个模型中最适宜作为发芽
率和温度 的回归模型的是( )
A. B.
C. D.
[解析] 由散点图可知,散点集中在曲线 的周围,故选D.
√
7.已知 列联表如下:
合计
12
30
合计 10 32 42
其中, 均为大于4的整数,若在犯错误的概率不超过0.01的前
提下认为和之间有关联,则 ( )
附:,其中 .
0.1 0.05 0.01 0.005
2.706 3.841 6.635 7.879
A.6 B.7 C.8 D.9
√
[解析] 由题意可得解得,
又为整数, 只能取5,6,7.
由表中数据可得, ,
可得,故 .故选B.
二、多项选择题(本大题共2小题,每小题6分,共12分)
8.有一组样本数据,, , ,由这组样本数据得到的
经验回归方程为 ,则( )
A.样本相关系数 越大,两个变量的线性相关程度越强;反之,线性
相关程度越弱
B.经验回归直线必经过点
C.若样本数据 的残差为1,则样本中必有数据
的残差为
D.当样本相关系数时,样本数据,, , 都
在直线 上
√
√
[解析] 对于A,越接近1,则和 之间的线性相关程度越强,反之
越弱,故A错误;
根据残差的定义知C错误;
易知B,D均正确.故选 .
9.为了增强学生的身体素质,提高适应自然环
境、克服困难的能力,某校在课外活动中新
增了一项登山活动,并对“学生是否喜欢登山
与性别是否有关”做了一次调查,其中被调查
的男、女生人数相同,得到如图所示的等高
堆积条形图,则下列说法中正确的有( )
附:,其中 .
0.05 0.01
3.841 6.635
A.被调查的学生中喜欢登山的男生人数比喜
欢登山的女生人数多
B.被调查的女生中喜欢登山的人数比不喜欢
登山的人数多
C.若被调查的男、女生人数均为100,则根据
小概率值 的独立性检验,认为是否喜
欢登山与性别有关
D.无论被调查的男、女生人数为多少,根据
小概率值 的独立性检验,都可以认为
是否喜欢登山与性别有关
√
√
[解析] 对于A,因为被调查的男、女生人数相
同,所以由等高堆积条形图可知被调查的学
生中喜欢登山的男生人数比喜欢登山的女生
人数多,所以A正确;
对于B,由等高堆积条形图可知,被调查的女生中喜欢登山的人数
比不喜欢登山的人数少,所以B错误;
对于C,根据题中数据,得到 列联表如下:
单位: 人
登山 性别 合计
男生 女生 喜欢 80 30 110
不喜欢 20 70 90
合计 100 100 200
零假设为 是否喜欢登山与性别无关,由列
联表中数据,得
,根据小概率值的独立性检验,推断 不成立,即认为是否喜欢登山与性别有关,所以C正确;
对于D,当被调查的男、女生人数均为10时,
列联表如下:
单位: 人
登山 性别 合计
男生 女生 喜欢 8 3 11
不喜欢 2 7 9
合计 10 10 20
零假设为 是否喜欢登山与性别无关,由表中数据知
,根据小概率值
的独立性检验,没有充分证据推断不成立,因此可以认为 成立,
即认为是否喜欢登山与性别无关,所以D错误.故选 .
三、填空题(本大题共3小题,每小题5分,共15分)
10.已知变量和 的统计数据如下表:
0 1 2
5 ? 2 2 1
如果由表中的数据得到关于的经验回归方程为 ,
那么当 时,残差为______.
[解析] 设时的观测值为,则 ,
,
将点的坐标代入 ,
可得,解得.
把代入 ,得 ,
当时,残差为 .
11.某手机营销商为了拓展业务,现对该手机的
潜在用户进行调查,随机抽取国内、国外潜在用
户代表各100名,调查用户对该手机的态度,得
到如图所示的等高堆积条形图.根据小概率值
有
的独立性检验,认为对该手机的态度和国内外差异 ____关.
(填“有”或“无”)
[解析] 依题意,可得到如下 列联表:
单位: 名
对该手机的态度 国内外潜在用户代表 合计
国内 国外 不乐观 40 60 100
乐观 60 40 100
合计 100 100 200
零假设为 对该手机的态度和国内外差异无关.
根据表中数据得 ,
根据小概率值的独立性检验,推断 不成立,即认为对
该手机的态度和国内外差异有关.
12.在样本点 的散点图中,所有的点都在曲线
附近波动.经计算得,, ,
则实数 的值为___.
[解析] 令,则即为, ,
,
因为点在直线 上,所以,解得 .
四、解答题(本大题共3小题,共38分.解答应写出必要的文字说
明、证明过程或演算步骤)
13.(10分)[2024·陕西渭南高二期末] 某地区响应“节能减排,低碳
生活”的号召,开展系列的措施控制碳排放.环保部门收集到近5年内
新增碳排放量,如下表所示,其中为年份代号, (单位:万吨)
为新增碳排放量.
年份 2020 2021 2022 2023 2024
1 2 3 4 5
6.1 5.2 4.9 4 3.8
(1)请计算样本相关系数,并说明与 间的线性相关程度是否较
高(若 ,则线性相关程度较高)?
参考数据:,,, ,
,, .
参考公式:对于一组数据,, , ,样本相
关系数 .
解:依题意,
,所以,所以与 间的线性相关程度较高.
(2)求关于 的经验回归方程,并据此估计该地区2025年的新增碳
排放量.
参考数据:,,, ,
,, .
参考公式:对于一组数据,, , ,其经验
回归直线 的斜率和截距的最小二乘估计分别为
, .
解: ,
,所以 ,
当时, ,所以估计该地区2025年的
新增碳排放量为3.06万吨.
14.(13分)[2024·聊城三中高二月考] 某生产企业对原有的生产线
进行技术升级,在技术升级前后,分别从其产品中(单位:件)随
机抽取样本数据进行统计,制作了如下 列联表:
单位:件
技术 产品 合计
合格 不合格 升级前 120 80 200
升级后 150 50 200
合计 270 130 400
(1)根据上表,依据小概率值 的独立性检验,能否认为
产品合格与技术升级有关联?
附:,其中 .
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
解:零假设为 产品的合格与技术升级无关,经计算得到
,
根据小概率值的独立性检验,推断 不成立,即认为产品
合格与技术升级有关联.
(2)在抽取的所有合格品中,按升级前后合格品进行比例分配的分
层随机抽样,抽取9件产品,然后从这9件产品中随机抽取4件,记其
中属于升级前生产的产品有件,属于升级后生产的产品有 件,求
的概率.
解:由题意,升级前后合格品的比例为 ,故抽取的9件产品中有4
件属于升级前生产的,有5件属于升级后生产的.
包括 , 和,两种情况:
当, 时,其概率,
当,时,其概率,
则 的概率 .
15.(15分)[2024·河南南阳高二期中] 某市旅游局通过文旅度假项
目考察后,在“五一”期间推出了多个具体项目,销售火爆.其中乡村
旅游项目推出了六条经典路线,六款不同价位的套票与相应价格 的
数据如下表.
旅游线路 奇山秀 水游 古村落游 慢生活游 新子游 采摘游 舌尖之旅
套票型号
39 49 58 67 77 86
经数据分析、描点绘图,发现价格与购买人数 近似满足关系式
,对上述数据进行初步处理,其中 ,
,,2, ,6.
(1)根据所给数据,求关于 的经验回归方程.
附:,,, .
对于一组数据,, , ,其经验回归直线
的斜率和截距的最小二乘估计分别为
, .
解:设 关于的经验回归方程为 ,
而, ,
则 ,
,所以 关于 经验回归方程为
.
因为,,所以,所以 ,
故关于的经验回归方程为 .
(2)为进一步优化旅游方面的投资,相关部门在“五一”期间随机调
查了200位旅游者,以了解不同年龄段的旅游者对不同项目的关注情
况,得到列联表如下:
单位:人
关注的旅游项目 年龄 合计
50岁以上 50岁以下 80 40 120
40 40 80
合计 120 80 200
依据小概率值 的独立性检验,能否认为关注的旅游项目和
年龄有关联?
附:
0.1 0.05 0.01 0.001
2.706 3.841 6.635 10.828
, .
解:零假设为 关注的旅游项目和年龄无关联.
,
故依据小概率值的独立性检验,推断 不成立,即认为关
注的旅游项目和年龄有关联.