8.2 一元线性回归模型及其应用
教材课后习题
1.如果散点图中所有的散点都落在一条斜率为非0的直线上,请回答下列问题:
(1)解释变量和响应变量的关系是什么?
(2)是多少?
2.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如表所示.
零件数/个 10 20 30 40 50 60 70 80 90 100
加工时间 62 68 75 81 89 95 102 108 115 122
(1)画出散点图;
(2)建立加工时间关于零件数的一元线性回归模型;
(3)关于加工零件的个数与加工时间,你能得出什么结论?
3.根据8.1.2节例2中某城市居民年收入与A商品销售额的数据:
(1)建立A商品销售额关于居民年收入的一元线性回归模型;
(2)如果这座城市居民的年收入达到40亿元,估计A商品的销售额是多少.
4.人口问题是关乎国计民生的大问题.下表是1949—2016年我国的人口总数(摘自《中国统计年鉴2017》).
年份 总人口/万人 年份 总人口/万人 年份 总人口/万人
1949 54167 1982 101654 2000 126743
1950 55196 1983 103008 2001 127627
1951 56300 1984 104357 2002 128453
1955 61465 1985 105851 2003 129227
1960 66207 1986 107507 2004 129988
1965 72538 1987 109300 2005 130756
1970 82992 1988 111026 2006 131448
1971 85229 1989 112704 2007 132129
1972 87177 1990 114333 2008 132802
1973 89211 1991 115823 2009 133450
1974 90859 1992 117171 2010 134091
1975 92420 1993 118517 2011 134735
1976 93717 1994 119850 2012 135404
1977 94974 1995 121121 2013 136072
1978 96259 1996 122389 2014 136782
1979 97542 1997 123626 2015 137462
1980 98705 1998 124761 2016 138271
1981 100072 1999 125789
(1)画出散点图;
(2)建立总人口数关于年份的一元线性回归模型;
(3)直接用上面建立的回归模型预测2020年的我国人口总数,得到的结果合理吗?为什么?
5.在某地区的一段时间内观测到的不小于某震级x的地震数N的数据如下表:
震级x 3.0 3.2 3.4 3.6 3.8 4.0 4.2
地震数N 28381 20380 14795 10695 7641 5502 3842
震级x 4.4 4.6 4.8 5.0 5.2 5.4 5.6
地震数N 2698 1919 1356 973 746 604 435
震级x 5.8 6.0 6.2 6.4 6.6 6.8 7.0
地震数N 274 206 148 98 57 41 25
试建立经验回归方程表示二者之间的关系,该模型对预测地震有帮助吗?
6.生活中有许多变量之间的关系是值得我们去研究的.例如,数学成绩、物理成绩和化学成绩两两之间是相关的吗?哪两个学科成绩之间相关性更大,你能解释其中的原因吗?语文成绩对数学成绩有影响吗?等等,请用你们班的某次考试成绩,研究它们之间的关系.如果它们之间有关系,请建立统计模型进行分析.
定点变式训练
7.随着城市生活节奏的加快,网上订餐成为很多上班族的选择,下表是某外卖骑手某时间段订餐数量x与送餐里程y的统计数据表:
订餐数x/份 12 23 31
送餐里程y/里 15 30 45
现已求得上表数据的回归直线方程中的值为1.5,则据此线性回归模型可以预测,订餐100份时外卖骑手所行驶的路程约为( )
A.155里 B.145里 C.147里 D.148里
8.在一次实验中,测得的五组数值如表所示.
x 0 1 2 3 4
y 10 15 20 30 35
经计算知,y关于x的回归直线方程是6.,预测当时,( )
A.47.5 B.48 C.49 D.49.5
9.色差和色度是衡量毛线玩具质量优劣的两个重要指标,现抽检一批毛线玩具并将测得数据列于表中.已知该产品的色度y和色差x之间满足线性相关关系,且,现有一对测量数据为,则该数据的残差为( )
色差x 21 23 25 27
色度y 15 18 19 20
A.-0.96 B.-0.8 C.0.8 D.0.96
10.我国西北某地区开展改造沙漠的巨大工程,该地区对近5年投入的沙漠治理经费X(亿元)和沙漠治理面积Y(万亩)的相关数据进行统计,如下表所示:
治理经费X/亿元 3 4 5 6 7
治理面积Y/万亩 10 12 11 12 20
根据表中所给的数据,得到Y关于X的线性回归方程为,则( )
A.1 B.2 C.3 D.4
11.据统计,某产品的市场销售量y(万台)与广告费用投入x(万元)之间的对应数据的散点图如图所示,由图可知,y与x之间有较强的线性相关关系,其回归直线方程是.预测广告费用投入10万元时,估计该产品的市场销售量y约为( )
A.6.1万台 B.5.5万台 C.5.2万台 D.6万台
12.(多选)2020年初以来,5G技术在我国已经进入高速发展的阶段,5G手机的销量也逐渐上升,某手机商城统计了近5个月来5G手机的实际销量,如下表所示:
月份 2020年2月 2020年3月 2020年4月 2020年5月 2020年6月
月份编号X 1 2 3 4 5
销量Y/千部 37 104 a 196 216
若Y与X线性相关,且求得线性回归方程为,则下列说法正确的是( )
A.
B.Y与X正相关
C.Y与X的相关系数为负数
D.8月份该手机商城的5G手机的销量约为36.5万部
13.已知一系列样本点的线性回归方程为.若样本点与的残差相同,则_________.
14.某单位为了制定节能减排的目标,先调查了用电量与气温之间的关系,随机统计了某4天的用电量与当天气温,并制成了对照表:
气温/℃ 18 13 10
用电量/ 24 34 38 64
由表中数据,得线性回归方程.当气温为时,预测用电量约为__________.
15.赤霉素在幼芽、幼根、未成熟的种子中合成,其作用是促进细胞的生长,使得植株变高,每粒种子的赤霉素含量x(单位:)直接影响该粒种子后天的生长质量.现通过生物仪器采集了赤霉素含量分别为10,20,30,40,50的种子各20粒,并跟踪每粒种子后天生长的情况,收集种子后天生长的优质数量y(单位:粒),得到的数据如下表所示.
赤霉素含量x 10 20 30 40 50
后天生长的优质数量y 2 3 7 8 10
(1)求y关于x的回归直线方程;
(2)利用(1)中的回归直线方程,估计1000粒赤霉素含量为的种子后天生长的优质数量.
附:回归直线的斜率和截距的最小二乘估计公式分别为,.
答案以及解析
1.答案:(1)线性函数关系
(2)
解析:(1)解释变量和响应变量的关系是线性函数关系.
(2)残差平方和为0,所以.
2.答案:(1)图见解析
(2)
(3)结论见解析
解析:(1)画出散点图如图所示.
(2)由表格数据,得,,,,
,,
.
(3)加工零件的个数与加工时间呈正线性相关关系,线性相关关系程度很强.
3.答案:(1)
(2)42.04万元
解析:(1)由表中数据,得,,,,
所以,,
所以经验回归方程为.
(2)将代入经验回归方程,得,
所以A商品的销售额大约为42.04万元.
4.答案:(1)图见解析
(2)
(3)结果不太合适,理由见解析
解析:(1)散点图如图所示.
(2)由表中数据,得,,
,,.
,
所以经验回归方程为.
(3)当时,万人.得到的结果不太合适,因为由散点图可以看出近些年人口增长速度缓慢.
5.答案:该模型对预测地震有帮助
解析:由表中数据得散点图如图(1)所示.
从散点图中可以看出震级x与地震数N之间不具有线性相关关系.从图中可以看出,随着x的减少,所考察的地震数N近似地以指数函数图象的形式增长.作变换,得到的数据如下表:
x 3.0 3.2 3.4 3.6 3.8 4.0 4.2 4.4 4.6 4.8 5.0
y 4.453 4.309 4.170 4.029 3.883 3.741 3.585 3.431 3.283 3.132 2.988
x 5.2 5.4 5.6 5.8 6.0 6.2 6.4 6.6 6.8 7.0
y 2.873 2.781 2.638 2.438 2.314 2.170 1.991 1.756 1.613 1.398
x和y的散点图如图(2)所示.
从这个散点图可以看出x和y之间有很强的线性相关关系,因此可以用线性回归模型拟合它们之间的关系.根据截距和斜率的最小二乘计算公式得,,从而经验回归方程为.可求得,因此可以用回归方程描述x和N之间的关系,该模型对预测地震有帮助.
6.答案:该题目的结果与具体的数据有关,不作统一答案.
解析:
7.答案:C
解析:由题意得,,则,可得,故,当时,.
8.答案:B
解析:由题意知,,,由回归直线过点得,解得,故.所以当时,.故选B.
9.答案:C
解析:由题意可知,,,将代入,即,解得,所以,当时,,所以该数据的残差为.故选C.
10.答案:C
解析:因为,,且回归直线过点,所以将其坐标代入,得,解得.故选C.
11.答案:B
解析:由题意知,.将代入,即,解得,即,将代入,得.故选B.
12.答案:AB
解析:由题表中的数据,得,所以,于是,解得,故A正确.由回归方程中X的系数为正可知,Y与X正相关,且其相关系数,故B正确,C错误.8月份时,,所以,故D错误.选AB.
13.答案:3
解析:由残差的定义可得,化简得.
14.答案:70
解析:由表格中的数据,得,,即样本中心点坐标为.又点在回归直线上,,解得,.当时,,即气温为时,预测用电量约为.
15.答案:(1)
(2)615
解析:(1),,,,
则,,
故y关于x的回归直线方程为.
(2)将代入,得,
则估计1000粒赤霉素含量为的种子后天生长的优质数量为.