§1 一元线性回归
学习目标 1.结合实例,了解散点图与曲线拟合、直线拟合的关系. 2.了解最小二乘法原理,了解一元线性回归模型的含义及模型参数的统计意义. 3.了解回归分析的基本思想方法和初步应用,针对实际问题,会用一元线性回归模型进行预测. 4.通过变量间相关关系及散点图的学习,培养数学抽象、直观想象的核心素养. 5.通过一元线性回归模型参数的最小二乘法估计方法求经验回归方程,提升数学建模、数据分析、数学运算的核心素养.
任务一 直线拟合
问题1.在一次对人体脂肪含量百分比和年龄的关系的研究中,研究人员获得了一组样本数据:
年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
年龄 53 54 56 57 58 60 61
脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.根据上述数据,你能推断出人体的脂肪含量与年龄之间存在怎样的关系吗?
提示:画出散点图,散点图中的点散布在一条直线附近,推断这两个变量之间存在直线拟合关系.
直线拟合
1.成对数据与散点图:每个点对应的一对数据(xi,yi),称为成对数据.这些点构成的图称为散点图.
2.曲线拟合:从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个大致趋势,这种趋势通常可以用一条光滑的曲线来近似地描述,这样近似描述的过程称为曲线拟合.
3.直线拟合:若在两个变量X和Y的散点图中,所有点看上去都在一条直线附近波动,此时就可以用一条直线来近似地描述这两个量之间的关系,称之为直线拟合.
[微提醒] (1)两个变量不满足函数关系,但两者确实有关系,这种关系称为相关关系.(2)判断两个变量X和Y之间是曲线拟合还是直线拟合,常用的简便方法就是绘制散点图.
下表是某小卖部6天卖出热茶的杯数(单位:杯)与当天气温(单位:℃)的对比表:
气温/℃ 26 18 13 10 4 -1
杯数/杯 20 24 34 38 50 64
(1)根据上表中的数据画出散点图;
(2)你能从散点图中发现当天气温与卖出热茶的杯数近似地呈现什么关系吗?
解:(1)设当天气温为x ℃时,卖出热茶的杯数为y杯,表中的数据制成散点图如下图.
(2)从散点图中发现温度与卖出热茶的杯数所对应的点都在一条直线附近波动,所以温度与卖出热茶的杯数两变量可以直线拟合.
1.绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就可以直线拟合,注意不要受个别点的位置的影响.
2.准确理解回归分析的基本思想、基本方法,掌握回归分析的一些关键性词语,是解决这类问题的基础.
对点练1.某市104路公交车上午7:05—8:55时段在起点站每9分钟发一班次.公交公司为了了解早高峰时段各班次上客情况,某日上午7:14—8:35记录了在起点站各班次车辆上客的人数:
发车 时刻 7:14 7:23 7:32 7:41 7:50 7:59 8:08 8:17 8:26 8:35
上车乘 客数/人 10 13 13 18 17 15 12 9 3 3
请绘制这组成对数据的散点图,并通过观察散点图大致判断客车发车时刻与上车乘客人数是否可以直线拟合?
解:绘制散点图如图所示,
观察散点图可知,发车时刻与上车乘客人数所对应的点在一条曲线附近波动,所以发车时刻与上车乘客人数两变量应该曲线拟合,而不适合直线拟合.
任务二 一元线性回归方程
根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图如图所示.思考并回答下面的问题:
问题2.依据数据的散点图,推断西红柿亩产量的增加量Y 与液体肥料使用量X适合直线拟合还是曲线拟合?
提示:适合直线拟合.
问题3.如果西红柿亩产量的增加量Y 与液体肥料使用量X直线拟合的话,如何求该直线方程?
提示:可以选取两个点,使其余点尽量在该直线两侧分布.
1.最小二乘法
如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用[yi-(a+bxi)]2来刻画这些点与直线Y=a+bX的接近程度,使得上式达到最小值的直线Y=a+bX就是要求的直线,这种方法称为最小二乘法.
2.线性回归方程
(1)直线方程Y=+X称作Y关于X的线性回归方程,相应的直线称作Y关于X的回归直线,,是这个线性回归方程的系数.
(2)计算,的公式:==,=-.
[微提醒] 回归直线Y=+X必经过样本点的中心(,).
某连锁日用品销售公司下属5个社区便利店某月的销售额与利润额如下表所示.
便利店编号 1 2 3 4 5
销售额 X/万元 30 60 45 80 89
利润额Y/万元 2.3 3.5 3.2 4.0 5.3
(1)绘制销售额和利润额的散点图;
(2)若销售额和利润额可以直线拟合,试计算利润额Y与销售额 X的线性回归方程.
解:(1)根据题意,作散点图如下:
(2)==60.8,
==3.66,
所以=
=
==≈0.043,
=-≈1.046,
所以线性回归方程为Y=0.043X+1.046.
求线性回归方程的一般步骤
对点练2.为了探讨学生的物理成绩Y与数学成绩X之间的关系,从某批学生中随机抽取10名学生的成绩,并已计算出xi=758,=58 732,yi=774,xiyi=59 686.试求物理成绩Y关于数学成绩X的线性回归方程.
解:由已知数据可知,=xi=75.8,=yi=77.4,
==≈0.8,
=-=77.4-0.8×75.8=16.76,
所以Y关于X的线性回归方程为Y=0.8X+16.76.
任务三 线性回归方程的应用
(链教材P239例1)某公司为提升A款产品的核心竞争力,准备加大A款产品的研发投资,为确定投入A款产品的年研发费用,需了解年研发费用x(单位:万元)对年利润y(单位:万元)的影响.该公司统计了最近8年每年投入A款产品的年研发费用与年利润的数据,得到下图所示的散点图:
经数据分析知,变量Y与 X之间存在近似的线性关系.经计算得,xi=80,yi=200,=250,=500.
(1)建立Y关于 X的线性回归方程Y=X+;
(2)若该公司对A款产品欲投入的年研发费用为30万元,根据(1)得到的线性回归方程,预测年利润为多少万元?
附:=,=-.
解:(1)因为xi=80,yi=200,
所以==10,==25.
因为=250,=500,
所以===2.
所以=-=25-2×10=5.
所以Y关于X的线性回归方程为Y=2X+5.
(2)由(1)可得,Y=2X+5.
所以当X=30时,Y=2×30+5=65.
所以对A款产品投入30万元年研发费用,年利润约为65万元.
1.正确理解,的公式和准确计算是求线性回归方程的关键,由于计算量较大,所以在计算时应认真细致,谨防计算中出现错误.
2.利用所求出的线性回归方程,可以进行估计与预测.
对点练3.假设关于某设备的使用年限X和所支出的维修费用Y(万元)统计数据如下:
使用年限X 2 3 4 5 6
维修费用Y 2.2 3.8 5.5 6.5 7.0
若有数据知Y与X可以直线拟合.其线性回归方程为Y=1.23X+a,请估计使用10年时的维修费用是 万元.
答案:12.38
解析:由题意可得==4,=(2.2+3.8+5.5+6.5+7.0)=5,由线性回归方程过点可得5=1.23×4+a,解得a=0.08,故方程为Y=1.23X+0.08,把X=10代入可得Y=1.23×10+0.08=12.38.
任务再现 1.散点图、直线拟合.2.一元线性回归方程及其应用
方法提炼 公式法、数形结合思想
易错警示 用最小二乘法求时,两公式结构易混淆、带入数据易出错
1.下列关于散点图的说法中,正确的是( )
A.任意给定统计数据,都可以绘制散点图
B.从散点图中可以看出两个量是否具有一定的关系
C.从散点图中可以看出两个量的因果关系
D.从散点图中无法看出数据的分布情况
答案:B
解析:散点图不适合用于展示百分比占比的数据,另外数据量较少的数据也不适合用散点图表示,故A错误;散点图能看出两个量是否具有一定的关系,但是不一定是因果关系,故B正确,C错误;散点图中能看出数据的分布情况,故D错误.故选B.
2.一位母亲记录了儿子3岁~9岁的身高,由此建立的身高Y(单位:cm)与年龄X(单位:岁)的回归模型为Y=7.19X+73.93.用这个模型预测这个孩子10岁时的身高,则下列叙述正确的是( )
A.身高一定是145.83 cm
B.身高在145.83 cm以上
C.身高在145.83 cm以下
D.身高在145.83 cm左右
答案:D
解析:X=10时,Y=7.19×10+73.93=145.83,但这是预测值,而不是精确值,所以只有D符合题意.故选D.
3.根据2010~2019年我国16~59岁人口比重统计数据Y,拟合了Y与年份X的线性回归方程为Y=-0.74X+1 551,据此估计我国约从 年开始16~59岁人口比重低于50%.
答案:2029
解析:令Y=-0.74X+1 551<50,解得X>≈2 028.4,所以估计我国约从2029年开始16~59岁人口比重低于50%.
4.下表是某单位1~4月份用水量(单位:百吨)的一组数据:
月份X 1 2 3 4
用水量Y 4 5 a 7
若由数据求得:用水量Y与月份X之间的线性回归方程是Y=X+3.05,则表中a的值为 .
答案:6.2
解析:由表格中的数据,可得=(1+2+3+4)=,=(4+5+a+7)=4+,把(,4+)代入回归方程Y=X+3.05,可得4+=2.5+3.05,解得a=6.2.
课时分层评价47 一元线性回归
(时间:60分钟 满分:100分)
(1—9,每小题5分,共45分)
1.下图是根据X,Y的观测数据(xi,yi)(i=1,2,…,10)得到的散点图,则变量X,Y能用线性回归方程Y=+X来刻画,且<0的是( )
答案:A
解析:根据变量X,Y具有线性关系,则散点在某条直线附近,又<0,所以散点从左上至右下.故选A.
2.下表是X和Y之间的一组数据,则Y关于X的回归直线必过点( )
X 1 2 3 4
Y 1 3 5 7
A.(2,3) B.(1.5,4)
C.(2.5,4) D.(2.5,5)
答案:C
解析:回归直线必过样本点的中心(,),即(2.5,4).故选C.
3.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得Y=0.577X-0.448(X为人的年龄,Y为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )
A.年龄为37岁的人体内脂肪含量一定为20.90
B.年龄为37岁的人体内脂肪含量约为21.01
C.年龄为37岁的人群中的体内脂肪含量平均为20.90
D.年龄为37岁的人群中的大部分人的体内脂肪含量约为31.5
答案:C
解析:当X=37时,Y=0.577×37-0.448=20.901≈20.90,由此估计,年龄为37岁的人群中的体内脂肪含量平均为20.90.故选C.
4.如下表给出5组数据(x,y),为选出4组数据使其线性关系更强,且保留第1组数据,则应去掉( )
i 1 2 3 4 5
xi 5 4 3 2 -4
yi 3 2 7 1 -6
A. B.
C. D.
答案:B
解析:根据表格数据,得到散点图如图所示:
由散点图可知数据偏离程度最高,故应该去掉数据.故选B.
5.科研人员在对人体的脂肪含量和年龄之间的关系的研究中发现,年龄X(岁)和脂肪含量占比Y(%)满足经验回归方程Y=0.58X-0.62,若已知某个体在其两个年龄的脂肪含量占比相差10.44%,则两年龄相差( )
A.15岁 B.17岁
C.18岁 D.20岁
答案:C
解析:设两个年龄分别为x1,x2,脂肪含量占比分别为y1,y2,由Y=0.58X-0.62得y1-y2=0.58(x1-x2),即10.44=0.58,解得x1-x2=18.故选C.
6.(多选题)为研究某种材料的抗震强度Y与抗压强度X的关系,某研究部门得到下表中的样本数据.若Y与X具有线性相关关系,且经验回归方程为Y=0.1X+,则下列说法正确的是( )
X 140 150 170 180 195
Y 23 24 26 28 28
A.=9.1
B.当X增加1个单位时,Y增加约0.1个单位
C.抗压强度变大,抗震强度一定增强
D.若抗压强度为220时,抗震强度一定是31.1
答案:AB
解析:因为==167,==25.8,所以25.8=0.1×167+,解得=9.1,故A正确;因此线性经验回归方程为Y=0.1X+9.1,可知当X增加1个单位时,Y增加约0.1个单位,故B正确;对于C,抗压强度变大,有抗震强度增强的趋势,但不一定增强,故C错误;对于D,当X=220时,Y=0.1×220+9.1=31.1,因此抗震强度约为31.1,故D错误.故选AB.
7.(2025·上海奉贤三模)为了研究某班学生的脚步X(单位:厘米)和身高Y(单位:厘米)之间有线性关系,设其回归直线方程为Y=4X+70.该班某学生的脚长为24,据此估计其身高为 厘米.
答案:166
解析:由题意知,令X=24,则Y=4×24+70=166,即该班某学生的脚长为24,据此估计其身高为166厘米.
8.(2025·山西运城高二期中)随着夏季的来临,遮阳帽开始畅销,某商家为了解某种遮阳帽如何定价才可以获得最大利润,现对这种遮阳帽进行试销售,经过统计发现销售量Y(单位:顶)与单价X(单位:元)具有线性关系,且线性回归方程为Y=-3X+200,若想要销售量为80顶,则预计该遮阳帽的单价定为 元.
答案:40
解析:若销售量为80顶,则Y=-3X+200=80,解得X=40,所以预计单价应定为40元.
9.为了解某社区居民2024年家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入X(万元) 8.2 8.6 10.0 11.3 11.9
支出Y(万元) 6.2 7.5 8.0 t 9.7
根据上表可得线性回归方程为Y=0.76X+0.4,则t= .
答案:8.6
解析:==10,==,故样本点的中心的坐标为,代入Y=0.76X+0.4,得=0.76×10+0.4,解得t=8.6.
10.(15分)(2025·江苏徐州高二期中)下表提供了某厂进行技术改造后生产产品过程中记录的产能X(单位:t)与相应的生产能耗Y(单位:t标准煤)的几组对应数据:
X/t 3 4 5 6
Y/t标准煤 3.5 4 5 5.5
(1)求Y关于X的线性回归方程Y=X+;
(2)已知该厂技术改造前100 t产品的生产能耗为90 t标准煤,试根据(1)中求出的线性回归方程,预测该厂技术改造后100 t产品的生产能耗比技术改造前降低了多少t标准煤.
参考公式:
解:(1)=4.5,=4.5,xiyi=84.5,xiyi-4=3.5,
-4=5,所以==0.7,=4.5-0.7×4.5=1.35,
所以Y=0.7X+1.35.
(2)X=100,Y=71.35,即改造后预测生产能耗为71.35 t标准煤,
90-71.35=18.65.
所以预测该厂技术改造后100 t产品的生产能耗比技术改造前降低了18.65 t标准煤.
(11—13,每小题5分,共15分)
11.已知一组数据大致呈线性分布,其回归直线方程为Y=2X-9,则yi的最小值为( )
A.-4 B.-8
C.-16 D.无法确定
答案:C
解析:回归直线Y=2X-9经过,且=×=,=yi,代入回归方程得yi=×2-9=n-8,即yi=(n-8)n=(n-4)2-16,所以当n=4时,yi的最小值为-16.故选C.
12.(多选题)如图是某地区2015年至2024年的空气污染天数Y(单位:天)与年份X的折线图.根据2015年至2019年的数据,2020年至2024年的数据,2015年至2024年的数据分别建立线性回归模型Y=X+,Y=X+,Y=X+,则( )
A.<< B.<<
C.<< D.<<
答案:BC
解析:记三条回归直线分别为l1:Y=X+,l2:Y=X+,l3:Y=X+,画出这三条回归直线的大致图象,如图所示:
由图可知这三条回归直线的斜率大小关系为<<<0,截距大小关系为>>>0.故选BC.
13.(2025·四川绵阳高二期末)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价(元) 4 5 6 7 8 9
销量(件) 90 84 83 80 75 68
由表中数据,求得线性回归方程为Y=-4X+a,若在这些样本点中任取一点,则它在回归直线右上方的概率为 .
答案:
解析:由已知==6.5,==80,又样本中心(,)在回归直线Y=-4X+a上,即80=-4×6.5+a,解得a=106,所以回归直线方程为Y=-4X+106,当X=4时,Y=-4×4+106=90,所以点在回归直线上;当X=5时,Y=-4×5+106=86,所以点在回归直线左下方;当X=6时,Y=-4×6+106=82,所以点在回归直线右上方;当X=7时,Y=-4×7+106=78,所以点在回归直线右上方;当X=8时,Y=-4×8+106=74,所以点在回归直线右上方;当X=9时,Y=-4×9+106=70,所以点在回归直线左下方.所以6个样本点中在回归直线右上方的有3个,所以在这些样本点中任取一点,则它在回归直线右上方的概率为.
14.(15分)(2025·陕西西安高二期末)某高科技公司组织大型招聘会,全部应聘人员的笔试成绩统计如图所示:
(1)求m的值,并估计全部应聘人员笔试成绩的中位数;
(2)该公司2020—2024年每年招聘的新员工人数逐年增加,且这五年招聘的新员工总人数为500,若用这五年的数据求出每年招聘的新员工人数Y关于年份代码X(X=年份-2019)的线性回归方程为Y=X-2,请根据此回归模型预测该公司2026年招聘的新员工人数是否会超过250.
解:(1)由题意得,0.004×10+0.022×10+0.03×10+0.028×10+10m+0.004×10=1,
解得m=0.012,
前两组的频率之和为0.004×10+0.022×10=0.26,
前三组的频率之和为0.004×10+0.022×10+0.03×10=0.56,
所以中位数在区间内,
估计中位数为60+×10=68.
(2)依题意==3,==100,
把代入Y=X-2中,有100=3-2,解得=34,
故线性回归方程为Y=34X-2,
当X=7时,Y=34×7-2=238-2=236<250,
故预测该公司2026年招聘的新员工人数不超过250.
(15、16,每小题5分,共10分)
15.在研究变量X与Y之间的相关关系时,进行实验后得到了一组样本数据,,…,,,利用此样本数据求得的经验回归方程为Y=-1.5X+,现发现数据误差较大,剔除这对数据后,求得的经验回归方程为Y=-6X+21,且yi=36,则=( )
A.13.5 B.14
C.14.5 D.15
答案:A
解析:因为yi=36,剔除异常数据后,=×36=6,因为点在Y=-6X+21上,所以6=-6+21,解得=2.5,设利用原始数据求得的经验回归直线过点,则'==3,'==9,因为'=-1.5'+,所以=9+1.5×3=13.5.故选A.
16.某地种植超级杂交稻,产量从第一期大面积亩产760千克,到第二期亩产810千克,第三期亩产860千克,第四期亩产1 030千克.将第一期视为第二期的父代,第二期视为第三期的父代,或第一期视为第三期的祖父代,并且认为子代的产量与父代的产量有关,则用线性回归分析的方法预测第五期的产量为每亩 千克.
附:用最小二乘法求得线性回归方程为Y=X+,其中=,=-.
答案:1 384
解析:设父代产量为xi,子代产量为yi(i=1,2,3),则=(760+810+860)=810,==900,所以(xi-)(yi-)=(-50)×(-90)+0×(-40)+50×130=11 000,
(xi-)2=(760-810)2+(810-810)2+(860-810)2=5 000,所以===2.2,=-=900-2.2×810=-882.则线性回归方程为Y=2.2X-882,当X=1 030时,Y=1 030×2.2-882=1 384.所以预测第五期的产量为每亩1 384千克.
21世纪教育网(www.21cnjy.com)(共63张PPT)
§1 一元线性回归
第七章 统计案例
学习目标
1.结合实例,了解散点图与曲线拟合、直线拟合的关系.
2.了解最小二乘法原理,了解一元线性回归模型的含义及模 型参数的统计意义.
3.了解回归分析的基本思想方法和初步应用,针对实际问 题,会用一元线性回归模型进行预测.
4.通过变量间相关关系及散点图的学习,培养数学抽象、直 观想象的核心素养.
5.通过一元线性回归模型参数的最小二乘法估计方法求经验 回归方程,提升数学建模、数据分析、数学运算的核心
素养.
任务一 直线拟合
问题导思
问题1.在一次对人体脂肪含量百分比和年龄的关系的研究中,研究人员获得了一组样本数据:
年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
年龄 53 54 56 57 58 60 61
脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.根据上述数据,你能推断出人体的脂肪含量与年龄之间存在怎样的关系吗?
提示:画出散点图,散点图中的点散布在一条直线附近,推断这两个变量之间存在直线拟合关系.
新知构建
直线拟合
1.成对数据与散点图:每个点对应的一对数据(xi,yi),称为__________.这些点构成的图称为________.
2.曲线拟合:从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个大致趋势,这种趋势通常可以用一条光滑的曲线来近似地描述,这样近似描述的过程称为__________.
3.直线拟合:若在两个变量X和Y的散点图中,所有点看上去都在一条直线附近波动,此时就可以用一条直线来近似地描述这两个量之间的关系,称之为__________.
成对数据
散点图
曲线拟合
直线拟合
微提醒
(1)两个变量不满足函数关系,但两者确实有关系,这种关系称为相关关系.(2)判断两个变量X和Y之间是曲线拟合还是直线拟合,常用的简便方法就是绘制散点图.
下表是某小卖部6天卖出热茶的杯数(单位:杯)与当天气温(单位:℃)的对比表:
典例
1
气温/℃ 26 18 13 10 4 -1
杯数/杯 20 24 34 38 50 64
(1)根据上表中的数据画出散点图;
解:设当天气温为x ℃时,卖出热茶的杯数为y杯,表中的数据制成散点图如下图.
(2)你能从散点图中发现当天气温与卖出热茶的杯数近似地呈现什么关
系吗?
解:从散点图中发现温度与卖出热茶的杯数所对应的点都在一条直线附近波动,所以温度与卖出热茶的杯数两变量可以直线拟合.
规律方法
1.绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就可以直线拟合,注意不要受个别点的位置的影响.
2.准确理解回归分析的基本思想、基本方法,掌握回归分析的一些关键性词语,是解决这类问题的基础.
对点练1.某市104路公交车上午7:05—8:55时段在起点站每9分钟发一班次.公交公司为了了解早高峰时段各班次上客情况,某日上午7:14—8:35记录了在起点站各班次车辆上客的人数:
发车时刻 7:14 7:23 7:32 7:41 7:50 7:59 8:08 8:17 8:26 8:35
上车乘客数/人 10 13 13 18 17 15 12 9 3 3
请绘制这组成对数据的散点图,并通过观察散点图大致判断客车发车时刻与上车乘客人数是否可以直线拟合?
解:绘制散点图如图所示,
观察散点图可知,发车时刻与上车乘客人数所对应的点在一条曲线附近波动,所以发车时刻与上车乘客人数两变量应该曲线拟合,而不适合直线
拟合.
返回
任务二 一元线性回归方程
问题导思
根据统计,某蔬菜基地西红柿亩产量的增加量y(百
千克)与某种液体肥料每亩使用量x(千克)之间的对
应数据的散点图如图所示.思考并回答下面的问题:
问题2.依据数据的散点图,推断西红柿亩产量的增
加量Y 与液体肥料使用量X适合直线拟合还是曲线拟合?
提示:适合直线拟合.
问题3.如果西红柿亩产量的增加量Y 与液体肥料使用量X直线拟合的话,如何求该直线方程?
提示:可以选取两个点,使其余点尽量在该直线两侧分布.
新知构建
最小二乘法
线性回归方程
回归直线
线性回归方程的系数
微提醒
某连锁日用品销售公司下属5个社区便利店某月的销售额与利润额如下表所示.
典例
2
便利店编号 1 2 3 4 5
销售额 X/万元 30 60 45 80 89
利润额Y/万元 2.3 3.5 3.2 4.0 5.3
(1)绘制销售额和利润额的散点图;
解:根据题意,作散点图如下:
规律方法
求线性回归方程的一般步骤
返回
任务三 线性回归方程的应用
(链教材P239例1)某公司为提升A款产品的核心竞争力,准备加大A款产品的研发投资,为确定投入A款产品的年研发费用,需了解年研发费用x(单位:万元)对年利润y(单位:万元)的影响.该公司统计了最近8年每年投入A款产品的年研发费用与年利润的数据,得到下图所示的散点图:
典例
3
规律方法
对点练3.假设关于某设备的使用年限X和所支出的维修费用Y(万元)统计数据如下:
使用年限X 2 3 4 5 6
维修费用Y 2.2 3.8 5.5 6.5 7.0
若有数据知Y与X可以直线拟合.其线性回归方程为Y=1.23X+a,请估计使用10年时的维修费用是 万元.
12.38
课堂小结
任务再现 1.散点图、直线拟合.2.一元线性回归方程及其应用
方法提炼 公式法、数形结合思想
易错警示
返回
随堂评价
√
1.下列关于散点图的说法中,正确的是
A.任意给定统计数据,都可以绘制散点图
B.从散点图中可以看出两个量是否具有一定的关系
C.从散点图中可以看出两个量的因果关系
D.从散点图中无法看出数据的分布情况
散点图不适合用于展示百分比占比的数据,另外数据量较少的数据也不适合用散点图表示,故A错误;散点图能看出两个量是否具有一定的关系,但是不一定是因果关系,故B正确,C错误;散点图中能看出数据的分布情况,故D错误.故选B.
√
2.一位母亲记录了儿子3岁~9岁的身高,由此建立的身高Y(单位:cm)与年龄X(单位:岁)的回归模型为Y=7.19X+73.93.用这个模型预测这个孩子10岁时的身高,则下列叙述正确的是
A.身高一定是145.83 cm
B.身高在145.83 cm以上
C.身高在145.83 cm以下
D.身高在145.83 cm左右
X=10时,Y=7.19×10+73.93=145.83,但这是预测值,而不是精确值,所以只有D符合题意.故选D.
2029
4.下表是某单位1~4月份用水量(单位:百吨)的一组数据:
月份X 1 2 3 4
用水量Y 4 5 a 7
若由数据求得:用水量Y与月份X之间的线性回归方程是Y=X+3.05,则表中a的值为 .
6.2
返回
课时分层评价
√
√
2.下表是X和Y之间的一组数据,则Y关于X的回归直线必过点
A.(2,3) B.(1.5,4)
C.(2.5,4) D.(2.5,5)
X 1 2 3 4
Y 1 3 5 7
√
3.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得Y=0.577X-0.448(X为人的年龄,Y为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是
A.年龄为37岁的人体内脂肪含量一定为20.90
B.年龄为37岁的人体内脂肪含量约为21.01
C.年龄为37岁的人群中的体内脂肪含量平均为20.90
D.年龄为37岁的人群中的大部分人的体内脂肪含量约为31.5
当X=37时,Y=0.577×37-0.448=20.901≈20.90,由此估计,年龄为37岁的人群中的体内脂肪含量平均为20.90.故选C.
√
i 1 2 3 4 5
xi 5 4 3 2 -4
yi 3 2 7 1 -6
√
5.科研人员在对人体的脂肪含量和年龄之间的关系的研究中发现,年龄X(岁)和脂肪含量占比Y(%)满足经验回归方程Y=0.58X-0.62,若已知某个体在其两个年龄的脂肪含量占比相差10.44%,则两年龄相差
A.15岁 B.17岁
C.18岁 D.20岁
√
√
X 140 150 170 180 195
Y 23 24 26 28 28
X 140 150 170 180 195
Y 23 24 26 28 28
7.(2025·上海奉贤三模)为了研究某班学生的脚步X(单位:厘米)和身高Y(单位:厘米)之间有线性关系,设其回归直线方程为Y=4X+70.该班某学生的脚长为24,据此估计其身高为 厘米.
166
由题意知,令X=24,则Y=4×24+70=166,即该班某学生的脚长为24,据此估计其身高为166厘米.
8.(2025·山西运城高二期中)随着夏季的来临,遮阳帽开始畅销,某商家为了解某种遮阳帽如何定价才可以获得最大利润,现对这种遮阳帽进行试销售,经过统计发现销售量Y(单位:顶)与单价X(单位:元)具有线性关系,且线性回归方程为Y=-3X+200,若想要销售量为80顶,则预计该遮阳帽的单价定为 元.
40
若销售量为80顶,则Y=-3X+200=80,解得X=40,所以预计单价应定为40元.
9.为了解某社区居民2024年家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
根据上表可得线性回归方程为Y=0.76X+0.4,则t= .
收入X(万元) 8.2 8.6 10.0 11.3 11.9
支出Y(万元) 6.2 7.5 8.0 t 9.7
8.6
10.(15分)(2025·江苏徐州高二期中)下表提供了某厂进行技术改造后生产产品过程中记录的产能X(单位:t)与相应的生产能耗Y(单位:t标准煤)的几组对应数据:
X/t 3 4 5 6
Y/t标准煤 3.5 4 5 5.5
√
√
√
13.(2025·四川绵阳高二期末)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
由表中数据,求得线性回归方程为Y=-4X+a,若在这些样本点中任取一
点,则它在回归直线右上方的概率为 .
单价(元) 4 5 6 7 8 9
销量(件) 90 84 83 80 75 68
单价(元) 4 5 6 7 8 9
销量(件) 90 84 83 80 75 68
14.(15分)(2025·陕西西安高二期末)某高科技公司组织大型招聘会,全部应聘人员的笔试成绩统计如图所示:
√
1 384
返回