第八章 成对数据的统计分析 专题一 利用回归直线方程过样本中心和最小二乘法求参和线性回归方程 2024-2025学年数学人教A版(2019) 选择性第三册

文档属性

名称 第八章 成对数据的统计分析 专题一 利用回归直线方程过样本中心和最小二乘法求参和线性回归方程 2024-2025学年数学人教A版(2019) 选择性第三册
格式 docx
文件大小 543.5KB
资源类型 试卷
版本资源 人教A版(2019)
科目 数学
更新时间 2025-05-14 17:28:54

图片预览

文档简介

中小学教育资源及组卷应用平台
成对数据的统计分析 专题一 利用回归直线方程过样本中心和最小二乘法求参和线性回归方程
2024-2025学年数学人教A版(2019) 选择性第三册
一、单选题
1.下列说法不正确的是( )
A.对具有线性相关关系的变量、,且回归方程为,若样本点的中心为,则实数的值是
B.若随机变量服从正态分布,且,则
C.若线性相关系数越接近1,则两个变量的线性相关程度越高
D.一组数据10,11,11,12,13,14,16,18,20,22的第60百分位数为14
2.若变量y与x之间存在线性相关关系,且根据最小二乘法得到的经验回归方程为,样本点中心为,则样本点的残差为( )
A. B.1.5 C.0.5 D.
二、多选题
3.下列说法正确的是( )
A.若随机变量X服从正态分布,且,则
B.一组数据10,11,11,12,13,14,16,18,20,22的下四分位数为18
C.若两个变量的线性相关系数越大,则这两个变量的线性相关性越强,反之,则越弱
D.对具有线性相关关系的变量x,y,其线性回归方程为,若样本点的中心为,则实数m的值是
4.已知两个变量与对应关系如下表:
若与满足一元线性回归模型,且经验回归方程为,则( )
A.与正相关 B.
C.样本数据的第百分位数为 D.各组数据的残差和为
三、填空题
5.已知,之间的一组数据:若与满足经验回归方程,则此曲线必过点 .
x
y
6.两个线性相关变量与的统计数据如表:
9 9.5 10 10.5 11
11 10 8 6 5
其回归直线方程是,则相对应于点的残差为 .
7.已知一系列样本点的一个经验回归方程为,若样本点的残差为1,则 .
四、解答题
8.科技创新赋能高质量发展,某公司研发新产品投入x(单位:百万)与该产品的收益y(单位:百万)的5组统计数据如表所示(其中m为后期整理数据时导致数据缺失),且由该5组数据用最小二乘法得到的回归直线方程为.
x 5 6 8 9 12
y 16 20 25 28 m
(1)求m的值.
(2)若将表中的点去掉,样本相关系数r是否改变?说明你的理由.
参考公式:相关系数.
9.某种产品2014年到2018年的年投资金额(万元)与年利润(万元)的数据统计如下,由散点图知,与之间的关系可以用线性回归模型拟合,已知5年利润的平均值是4.7.
年份 2014 2015 2016 2017 2018
年投资金额万元 1 2 3 4 5
年利润万元 2.4 2.7 6.4 7.9
(1)求表中实数的值;
(2)求关于的线性回归方程.
参考公式:回归直线方程中的斜率和截距的最小二乘估计公式分别为,.
10.根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.
(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若,则线性相关程度很高,可用线性回归模型拟合);
(2)求y关于x的回归方程,并预测当液体肥料每亩使用量为10千克时,西红柿亩产量的增加量约为多少?
附:相关系数公式.
参考数据:
回归方程中斜率和截距的最小二乘估计公式分别为.
11.新冠肺炎疫情发生以来,中医药全面参与疫情防控救治,做出了重要贡献.某中医药企业根据市场调研与模拟,得到研发投入x(亿元)与产品收益y(亿元)的数据统计如下:
研发投入x(亿元) 1 2 3 4 5
产品收益y(亿元) 3 7 9 10 11
(1)计算x,y的相关系数r,并判断是否可以认为研发投入与产品收益具有较高的线性相关程度?(若,则线性相关程度一般,若,则线性相关程度较高)
(2)求出y关于x的线性回归方程,并预测研发投入20(亿元)时产品的收益.
参考数据:,,.
附:相关系数公式:,回归直线方程的斜率,截距.
12.如图是某采矿厂的污水排放量单位:吨与矿产品年产量单位:吨的折线图:
(1)依据折线图计算相关系数精确到,并据此判断是否可用线性回归模型拟合y与x的关系?若,则线性相关程度很高,可用线性回归模型拟合
(2)若可用线性回归模型拟合与的关系,请建立关于的线性回归方程,并预测年产量为10吨时的污水排放量.
相关公式:,参考数据:.
回归方程中,
13.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:
推销员编号 1 2 3 4 5
工作年限x/年 3 5 6 7 9
推销金额y/万元 2 3 3 4 5
(1)求年推销金额y关于工作年限x的线性回归方程;
(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.
附:回归直线的斜率和截距的最小二乘法估计公式分别为.
14.某商场对商品近天的销售情况进行整理,得到如下数据,经统计分析,日销售量(件)与时间(天)之间具有线性相关关系.
时间()
日销售量()
(1)请根据表格提供的数据,用最小二乘法原理求出关于的线性回归方程.
(2)已知商品近天内的日销售价格(元)与时间(天)的关系为.根据(1)中求出的线性回归方程,预测为何值时,商品的日销售额最大.
(参考公式,)
参考答案
题号 1 2 3 4
答案 D B AD AD
1.D
【分析】利用线性回归方程中的基本量即可判断选项A,利用正态分布的性质即可判断选项B,根据线性相关系数的性质即可判断选项C, 利用百分位数的定义即可判断选项D.
【详解】对A:样本点的中心为,所以,,
因为满足线性回归方程,所以,所以,A正确.
对B:若随机变量服从正态分布,且,
则,则,B正确;
对C:若线性相关系数越接近,则两个变量的线性相关性越强,C正确;
对于D,因为,所以第百分位数为,D错误;
故选:D.
2.B
【分析】先求出线性回归方程,再由残差的定义求解即可.
【详解】依题意,,所以,即经验回归方程为,
又当时,,所以样本点的残差为,
故选:B.
3.AD
【分析】根据正态曲线的性质求解即可判断A;根据百分位数的概念计算即可判断B;根据两个变量的线性相关系数的表示意义即可判断C;根据将中心代入线性回归方程计算即可判断D.
【详解】A:因为,所以,故A正确;
B:由题意,,所以该10个数据的下四分位数为第2个数和第3个数的平均数11,故B错误;
C:若两个变量的线性相关系数越接近于1,则这两个变量的线性相关性越强,所以C错误;
D:由题意,线性回归方程过样本点中心,所以,解得,故D正确.
故选:AD
4.AD
【分析】利用相关性的定义及线性回归直线可判断选项A;根据样本中心点在回归方程上可判断选项B;利用百分位数的计算可判断选项C;利用回归方程计算预测值可得残差即可判断选项D.
【详解】由回归直线方程知:,所以与正相关,故选项A正确;
由表格数据及回归方程易知,,解得,
故选项B错误;
易知,所以样本数据的第70百分位数为9,故选项C错误;
由回归直线方程知时对应的预测值分别为,,,,,对应残差分别为,,,,,显然残差之和为0,故选项D正确.
故选:AD.
5.
【分析】设,则,根据回归方程性质可得回归直线所过定点.
【详解】由已知,
设,则,
由回归直线性质可得在直线上,
又,,
所以点在直线上,故点在曲线上.
故答案为:.
6.0.2/
【分析】根据线性回归方程一定经过样本点中心,进而求解参数,再根据残差的计算公式即可得出答案.
【详解】,
所以样本点中心为,代入回归方程得:,解得,
所以回归方程为,当时,,
所以残差为:.
故答案为:.
7.
【分析】根据残差计算公式计算即可.
【详解】根据题意得,解得.
故答案为:.
8.(1)
(2)不变,理由见解析
【分析】(1)计算平均数得样本中心,即可代入求解,
(2)根据相关系数的计算公式即可求解.
【详解】(1)由题意可知,,,
所以样本中心为,将点代入,可得,解得.
(2)由(1)可得,样本中心为,所以,.
由相关系公式知,,将点去掉后,样本相关系数r不变
9.(1);
(2).
【分析】(1)由5年利润的平均值是4.7结合平均数公式求得值;
(2)由已知数据求得和的值,即可得到线性回归方程.
【详解】(1)由题意得,,解得
(2)由题意得,,,
,故,
则,
故所求线性回归方程为.
10.(1),说明见解析
(2);550千克
【分析】(1)根据散点图中的数据分别求得可得,,,,,进而求得相关系数,再与0.75比较下结论.
(2)结合(1)中的数据,分别求得,,写出回归方程,然后将代入求解.
【详解】(1)由已知数据可得,,
所以,


所以相关系数.
因为,所以可用线性回归模型拟合y与x的关系.
(2),,
所以回归方程为.
当时,.
即当液体肥料每亩使用量为10千克时,西红柿亩产量的增加量约为550千克
11.(1),具有较高的线性相关程度
(2),40.3亿元
【分析】(1)将已知数据代入相关系数公式计算即可得结论.
(2)求出回归直线方程,将代入线性回归方程计算即可.
【详解】(1)∵,,,
∴,
∴该中医药企业的研发投入x与产品收益y具有较高的线性相关程度.
(2)∵,

∴.
∴y关于x的线性回归方程为,
将代入线性回归方程可得,,
∴预测研发投入20(亿元)时产品的收益为40.3(亿元).
12.(1)相关系数,可用线性回归模型拟合y与x的关系
(2),吨
【分析】(1)代入数据,算出相关系数r,将其绝对值与比较,即可判断可用线性回归模型拟合y与x的关系.
(2)先求出回归方程,求出当时的值,即为预测值.
【详解】(1)由折线图得如下数据计算得:
,,,
所以相关系数,
因为,所以可用线性回归模型拟合y与x的关系
(2)

所以回归方程为,
当时,,
所以预测年产量为10吨时的污水排放量为吨
13.(1);(2)5.9万元.
【分析】(1)根据表中的数据求出,,再利用公式可求出,,从而可求出推销金额y关于工作年限x的线性回归方程;
(2)将化入回归方程中求解即可
【详解】解(1)设所求的线性回归方程为,
,,
所以,

所以年推销金额y关于工作年限x的线性回归方程为.
(2)当时,(万元).
所以可以估计第6名推销员的年推销金额为5.9万元
14.(1);(2).
【分析】(1)借助公式算出每个参数即可得解;
(2)先求出日销售额,再根据分段函数分别算出每一段的最大值,比较大小,取整体最大值即可.
【详解】(1)根据题意,,

所以回归系数为:,,
故所求的线性回归方程为;
(2)由题意日销售额为;
当,时,,即当时,(元);
当,时,,即当时,(元),
综上所述,当时,(元),
所以估计天时,商品的日销售额最大,为元.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)