校本作业67 成对数据的统计分析-福建省厦门外国语学校2025届高三上学期一轮复习(含解析)

文档属性

名称 校本作业67 成对数据的统计分析-福建省厦门外国语学校2025届高三上学期一轮复习(含解析)
格式 docx
文件大小 141.5KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2025-09-22 13:00:17

图片预览

文档简介

厦门外国语学校2025届高三上数学校本作业67《成对数据的统计分析》
班级: 姓名: 座号:
一、选择题
1.(湘豫名校模拟)根据如表样本数据:
x 2 3 4 5 6
y 4 2.5 -0.5 -2 -3
得到的经验回归方程为=x+,则(  )
A.>0,>0 B.>0,<0 C.<0,>0 D.<0,<0
2.某种产品的广告费支出x与销售额y(单位:万元)之间的关系如表:
x 2 4 5 6 8
y 30 40 60 50 70
y与x的经验回归方程为=6.5x+17.5,当广告支出6万元时,随机误差的残差为(  )
A.-5 B.-5.5 C.-6 D.-6.5
3.(泉州模拟)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y(单位:℃)存在着较强的线性相关关系.某地观测人员根据如表的观测数据,建立了y关于x的经验回归方程=0.25x+k,则下列说法不正确的是(  )
x(次数/分钟) 20 30 40 50 60
y(℃) 25 27.5 29 32.5 36
A.k的值是20 B.变量x,y呈正相关关系
C.若x的值增加1,则y的值约增加0.25
D.当蟋蟀52次/分鸣叫时,该地当时的气温预测值为33.5 ℃
4.某中学调查了高一年级学生的选科倾向,随机抽取300人,其中选考物理的有220人,选考历史的有80人,统计各选科人数如表,则下列说法正确的是(  )
选择科目 选考类别 思想政治 地理 化学 生物
物理类 80 100 145 115
历史类 50 45 30 35
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
A.物理类的学生中选择政治的比例比历史类的学生中选择政治的比例高
B.物理类的学生中选择地理的比例比历史类的学生中选择地理的比例高
C.根据小概率值α=0.1的独立性检验,我们认为选择生物与选考类别无关
D.根据小概率值α=0.1的独立性检验,我们认为选择生物与选考类别有关
5.已知变量y与x的一组数据如表所示,根据数据得到y关于x的经验回归方程为=ebx-1.
x 1 2 3 4
y e2 e3 e5 e6
若=e13,则x等于(  )
A.6 B.7 C.8 D.9
6.研究两个变量x,y的相关关系,得到了7个数据,作出其散点图如图K54-1所示,对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性经验回归方程=x+,相关系数为r1;方案二:剔除点3对应的数据,根据剩下数据得到线性经验回归方程=x+,相关系数为r2.则 ( )
A.<0,<0,-10,>0,-1C.>0,>0,00,>0,07.已知一组数据确定的经验回归方程为=-x+2且=4,通过残差分析,发现两个数据(-1.7,2.9),(-2.3,5.1)误差较大,去除这两个数据后,重新求得经验回归直线的斜率为-1.5,则当x=-4时,= (  )
A.6 B.7 C.8 D.13
8.2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总人数可能为(  )
参考公式:χ2=,其中n=a+b+c+d.
参考数据:
α 0.15 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.072 2.706 3.841 5.024 6.635 7.879 10.828
A.130 B.190 C.240 D.250
9.(多选)下列关于成对样本数据的统计分析的判断中正确的有(  )
A.若样本相关系数r=0,则说明成对样本数据没有相关性
B.样本相关系数r越大,成对样本数据的线性相关性越强
C.用最小二乘法求得的一元线性回归模型的残差和一定是0
D.决定系数R2越大,残差平方和越小,模型的拟合效果越好
10.(多选)下列说法正确的是(  )
A.设有一个经验回归方程=3-5x,变量x增加一个单位时,y平均增加5个单位
B.若两个具有线性相关关系的变量的相关性越强,则样本相关系数r的值越接近于1
C.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高
D.在一元线性回归模型中,决定系数R2越接近于1,说明回归的效果越好
11.(多选)(武汉联考)下列选项中,正确的是(  )
A.对于回归分析,样本相关系数r的绝对值越小,说明拟合效果越好
B.以模型y=c·ekx去拟合一组数据时,为了求出经验回归方程,设z=ln y,将其变换后得到经验回归方程=0.3x+4,则c,k的值分别是e4和0.3
C.经验回归方程=x+中,的符号和样本相关系数r的符号一致
D.通过经验回归直线=x+及回归系数,可以精确反映变量的取值和变化趋势
12.(多选)已知由样本数据(xi,yi),i=1,2,3,4,5,6求得的经验回归方程为=2x+1,且=3.现发现一个样本数据(8,12)误差较大,去除该数据后重新求得的经验回归直线l的纵截距依然是1,则下列说法正确的是(  )
A.去除前变量x每增加1个单位,变量y一定增加2个单位
B.去除后剩余样本数据中x的平均数为2
C.去除后的经验回归方程为=2.5x+1
D.去除后样本相关系数r变大
二、填空题
13.(广州模拟)某车间为了提高工作效率,需要测试加工零件所花费的时间,为此进行了5次试验,这5次试验的数据如下表:
零件数x(个) 10 20 30 40 50
加工时间y(min) 62 a 75 81 89
若用最小二乘法求得经验回归方程为=0.67x+54.9,则a的值为________.
14.(青岛模拟)某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55个学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30个.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过________.
附:χ2=,其中n=a+b+c+d;
α 0.05 0.025 0.010 0.001
xα 3.841 5.024 6.635 10.828
15.(漳州模拟)根据下面的数据:
x 1 2 3 4
y 32 48 72 88
求得y关于x的经验回归方程为=19.2x+12,则这组数据相对于所求的经验回归方程的4个残差的方差为________.(注:残差是指实际观测值与预测值之间的差)
16.已知由样本数据点(xi,yi),i=1,2,…,n,求得的经验回归方程为=1.5x+0.5,且=3.现发现两个数据点(1.1,2.1)和(4.9,7.9)误差较大,去除后重新求得的经验回归直线l的斜率为1.2,那么,当x=2时,y的预测值为________.
三、解答题
17.6月2日某中学成功地举办了一年一度的大型学生社团文化节,吸引了众多学生.该中学目前共有社团近40个,由高一和高二的学生组成,参加社团的学生共有四百人左右.已知巴蜀中学高一和高二的所有学生中男生与女生人数比为6∶4,为了解学生参加社团活动的情况,按性别采用比例分配的分层随机抽样的方法抽取部分学生,统计得到如图K54-4所示的等高堆积条形图.
(1)从该中学参加社团的学生中,任选1人,抽出的是男生的概率.
(2)若抽取了100名学生,完成下列2×2列联表,并依据小概率值α=0.05的独立性检验,能否认为该中学高一和高二的学生的性别与是否参加社团有关联 请说明理由.
性别 是否参加社团 合计
参加社团 未参加社团
男生
女生
合计
附:χ2=,其中n=a+b+c+d.
临界值表:
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
18.现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本和企业利润的数据(单位:万元)如表所示:
月份 1 2 3 4 5 6 7 8
物流成本x 83 83.5 80 86.5 89 84.5 79 86.5
利润y 114 116 106 122 132 114 m 132
残差=yi- 0.2 0.6 1.8 -3 -1 -4.6 -1
根据最小二乘法估计公式求得经验回归方程为=3.2x-151.8.
(1)求m的值,并利用已知的经验回归方程求出8月份对应的残差值8;
(2)请先求出一元线性回归模型=3.2x-151.8的决定系数R2(精确到0.000 1);若根据非线性回归模型y=267.76ln x-1 069.2求得解释变量(物流成本)对于响应变量(利润)的决定系数R=0.905 7,请说明以上两种模型哪种模型拟合效果更好?
(3)通过残差分析,怀疑残差绝对值最大的那组数据有误,经再次核实后发现其真正利润应该为116万元.请重新根据最小二乘法的思想与公式,求出新的经验回归方程.
附(修正前的参考数据):iyi=78 880,=56 528,=84,(yi-)2=904.
19.菏泽二模] “十四五”是我国全面建成小康社会、实现第一个百年奋斗目标之后,乘势而上开启全面建设社会主义现代化国家新征程、向第二个百年奋斗目标进军的第一个五年,实施时间为到.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备加大研发资金投入,为了解年研发资金投入额x(单位:亿元)对年盈利额y(单位:亿元)的影响,通过对“十二五”和“十三五”规划发展10年期间年研发资金投入额xi和年盈利额yi(i=1,2,…,10)数据进行分析,选用了两个模型:
y=α+βx2,y=eλx+t,其中α,β,λ,t均为常数,e为自然对数的底数.
令ui=,vi=ln yi(i=1,2,…,10),经计算得如下数据:=26,=215,=680,=5.36,.
(1)请从相关系数的角度,分析哪一个模型拟合效果更好
(2)根据(1)的选择及表中数据,建立y关于x的经验回归方程.(系数精确到0.01)
(3)若希望盈利额y为500亿元,请预测的研发资金投入额x为多少亿元 (结果精确到0.01)
参考数据:ln 2≈0.693,ln 5≈1.609.
厦门外国语学校2025届高三上数学校本作业67《成对数据的统计分析》
班级: 姓名: 座号:
一、选择题
1.(湘豫名校模拟)根据如表样本数据:
x 2 3 4 5 6
y 4 2.5 -0.5 -2 -3
得到的经验回归方程为=x+,则(  )
A.>0,>0 B.>0,<0 C.<0,>0 D.<0,<0
答案 B
解析 由表中的数据可得,变量y随着x的增大而减小,则<0,
==4,
==0.2,
又经验回归方程=x+经过点(4,0.2),可得>0.
2.某种产品的广告费支出x与销售额y(单位:万元)之间的关系如表:
x 2 4 5 6 8
y 30 40 60 50 70
y与x的经验回归方程为=6.5x+17.5,当广告支出6万元时,随机误差的残差为(  )
A.-5 B.-5.5
C.-6 D.-6.5
答案 D
解析 由题意结合经验回归方程的预测作用可得,当x=6时,=6.5×6+17.5=56.5,则随机误差的残差为50-56.5=-6.5.
3.(泉州模拟)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y(单位:℃)存在着较强的线性相关关系.某地观测人员根据如表的观测数据,建立了y关于x的经验回归方程=0.25x+k,则下列说法不正确的是(  )
x(次数/分钟) 20 30 40 50 60
y(℃) 25 27.5 29 32.5 36
A.k的值是20
B.变量x,y呈正相关关系
C.若x的值增加1,则y的值约增加0.25
D.当蟋蟀52次/分鸣叫时,该地当时的气温预测值为33.5 ℃
答案 D
解析 由题意,得
=×(20+30+40+50+60)=40,
=×(25+27.5+29+32.5+36)=30,
则k=-0.25=30-0.25×40=20,
故A正确;
由经验回归方程可知,=0.25>0,
变量x,y呈正相关关系,故B正确;
若x的值增加1,则y的值约增加0.25,
故C正确;
当x=52时,=0.25×52+20=33,
故D不正确.
4.某中学调查了高一年级学生的选科倾向,随机抽取300人,其中选考物理的有220人,选考历史的有80人,统计各选科人数如表,则下列说法正确的是(  )
选择科目 选考类别 思想政治 地理 化学 生物
物理类 80 100 145 115
历史类 50 45 30 35
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
A.物理类的学生中选择政治的比例比历史类的学生中选择政治的比例高
B.物理类的学生中选择地理的比例比历史类的学生中选择地理的比例高
C.根据小概率值α=0.1的独立性检验,我们认为选择生物与选考类别无关
D.根据小概率值α=0.1的独立性检验,我们认为选择生物与选考类别有关
答案 C
解析 对于A,物理类的学生中选择政治的比例为=,
历史类的学生中选择政治的比例为=,
因为<,故选项A不正确;
对于B,物理类的学生中选择地理的比例为
=,
历史类的学生中选择地理的比例为=,
因为<,故选项B不正确;
对于C和D,零假设为H0:选择生物与选考类别无关.
根据已知数据可得2×2列联表如表:
选生物 不选生物 合计
物理类 115 105 220
历史类 35 45 80
合计 150 150 300
所以χ2==≈1.705<2.706=x0.1,
根据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为选择生物与选考类别无关,故选项C正确,选项D不正确.
5.已知变量y与x的一组数据如表所示,根据数据得到y关于x的经验回归方程为=ebx-1.
x 1 2 3 4
y e2 e3 e5 e6
若=e13,则x等于(  )
A.6 B.7 C.8 D.9
答案 B
解析 由=ebx-1,得ln =bx-1,
令z=ln y,则=bx-1,
由题意知,==2.5,
==4,
因为(,)满足=bx-1,
所以4=b×2.5-1,解得b=2,
所以=2x-1,所以=e2x-1,
令e2x-1=e13,解得x=7.
6.研究两个变量x,y的相关关系,得到了7个数据,作出其散点图如图K54-1所示,对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性经验回归方程=x+,相关系数为r1;方案二:剔除点3对应的数据,根据剩下数据得到线性经验回归方程=x+,相关系数为r2.则 ( )
图K54-1
A.<0,<0,-10,>0,-1C.>0,>0,00,>0,0答案D [解析] 根据变量x,y的散点图知,变量x,y正相关,且点3是离群值.方案一中,没有剔除离群值,线性相关性弱些,成正相关,故>0;方案二中,剔除离群值,线性相关性强些,也是正相关,故>0.07.已知一组数据确定的经验回归方程为=-x+2且=4,通过残差分析,发现两个数据(-1.7,2.9),(-2.3,5.1)误差较大,去除这两个数据后,重新求得经验回归直线的斜率为-1.5,则当x=-4时,= (  )
A.6 B.7 C.8 D.13
答案B [解析] 设这组数据为(x1,y1),(x2,y2),…,(xn-2,yn-2),(-1.7,2.9),(-2.3,5.1),数据x1,x2,…,xn-2,-1.7,-2.3的均值为,由题意知=2-=2-4=-2,设x1,x2,…,xn-2和y1,y2,…,yn-2的均值分别为和,则==-2,==4,设新的经验回归直线方程为=-1.5x+m,则4=-1.5×(-2)+m,得m=1,即=-1.5x+1,故当x=-4时,=-1.5×(-4)+1=7.故选B.
8.2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总人数可能为(  )
参考公式:χ2=,其中n=a+b+c+d.
参考数据:
α 0.15 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.072 2.706 3.841 5.024 6.635 7.879 10.828
A.130 B.190
C.240 D.250
答案 B
解析 依题意,设男、女生的人数均为5x,建立2×2列联表如下所示:
喜欢网络课程 不喜欢网络课程 总计
男生 4x x 5x
女生 3x 2x 5x
总计 7x 3x 10x
故χ2==,由题可知6.635≤<10.828,∴139.335≤10x<227.388,只有B符合题意.故选B.
9.(多选)下列关于成对样本数据的统计分析的判断中正确的有(  )
A.若样本相关系数r=0,则说明成对样本数据没有相关性
B.样本相关系数r越大,成对样本数据的线性相关性越强
C.用最小二乘法求得的一元线性回归模型的残差和一定是0
D.决定系数R2越大,残差平方和越小,模型的拟合效果越好
答案 CD
解析 对于A,当r=0时,只表明成对样本数据间没有线性相关关系,但是不排除它们之间有其他相关关系,故A错误;
对于B,样本相关系数|r|越大,成对样本数据的线性相关性越强,故B错误;
对于C,残差和为
(yi-i)=yi-(xi+)]
=i-i-
=n-n-n
=n(--)=0,故C正确;
对于D,决定系数R2越大,表示残差平方和越小,即模型的拟合效果越好,故D正确.
10.(多选)下列说法正确的是(  )
A.设有一个经验回归方程=3-5x,变量x增加一个单位时,y平均增加5个单位
B.若两个具有线性相关关系的变量的相关性越强,则样本相关系数r的值越接近于1
C.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高
D.在一元线性回归模型中,决定系数R2越接近于1,说明回归的效果越好
答案 CD
解析 A选项,因为=3-5x,所以变量x增加一个单位时,y平均减少5个单位,故A错误;
B选项,线性相关性具有正负,相关性越强,则样本相关系数r的绝对值越接近于1,故B错误;
C选项,在残差图中,残差点分布的水平带状区域越窄,说明波动越小,即模型的拟合精度越高,故C正确;
D选项,在一元线性回归模型中,决定系数R2越接近于1,说明模型拟合的精度越高,即回归的效果越好,故D正确.
11.(多选)(武汉联考)下列选项中,正确的是(  )
A.对于回归分析,样本相关系数r的绝对值越小,说明拟合效果越好
B.以模型y=c·ekx去拟合一组数据时,为了求出经验回归方程,设z=ln y,将其变换后得到经验回归方程=0.3x+4,则c,k的值分别是e4和0.3
C.经验回归方程=x+中,的符号和样本相关系数r的符号一致
D.通过经验回归直线=x+及回归系数,可以精确反映变量的取值和变化趋势
答案 BC
解析 对于A,回归分析中,样本相关系数绝对值越大,拟合效果越好,A不正确;
对于B,由y=c·ekx两边取对数得
ln y=kx+ln c,
依题意,k=0.3,ln c=4,即c=e4,B正确;
对于C,由公式知,C正确.
对于D,经验回归直线=x+及回归系数,不能精确反映变量的取值和变化趋势,D不正确.
12.(多选)已知由样本数据(xi,yi),i=1,2,3,4,5,6求得的经验回归方程为=2x+1,且=3.现发现一个样本数据(8,12)误差较大,去除该数据后重新求得的经验回归直线l的纵截距依然是1,则下列说法正确的是(  )
A.去除前变量x每增加1个单位,变量y一定增加2个单位
B.去除后剩余样本数据中x的平均数为2
C.去除后的经验回归方程为=2.5x+1
D.去除后样本相关系数r变大
答案 BCD
解析 当=3时,=2×3+1=7,
则i=6=18,i=6=42,
去除样本数据(8,12)后的新数据,
==2,==6,
设去除样本数据(8,12)后重新求得的经验回归方程为=x+1,
则2+1=6,解得=2.5,故去除后的经验回归方程为=2.5x+1,C正确;
对于A选项,去除前变量x每增加1个单位,变量y大约增加2个单位,A错误;
对于B选项,去除后剩余样本数据中x的平均数为2,B正确;
对于D选项,去除了误差较大的样本数据后,线性相关性变强,因为y关于x为正相关,则r>0,所以,样本相关系数r变大,D正确.
二、填空题
13.(广州模拟)某车间为了提高工作效率,需要测试加工零件所花费的时间,为此进行了5次试验,这5次试验的数据如下表:
零件数x(个) 10 20 30 40 50
加工时间y(min) 62 a 75 81 89
若用最小二乘法求得经验回归方程为=0.67x+54.9,则a的值为________.
答案 68
解析 由已知==30,
==61+,
所以61+=0.67×30+54.9,解得a=68.
14.(青岛模拟)某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55个学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30个.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过________.
附:χ2=,其中n=a+b+c+d;
α 0.05 0.025 0.010 0.001
xα 3.841 5.024 6.635 10.828
答案 0.025
解析 由题意可得列联表如下,
集中培训 分散培训 合计
一次考过 45 30 75
一次未考过 10 20 30
合计 55 50 105
χ2=≈6.109>5.024=x0.025.
15.(漳州模拟)根据下面的数据:
x 1 2 3 4
y 32 48 72 88
求得y关于x的经验回归方程为=19.2x+12,则这组数据相对于所求的经验回归方程的4个残差的方差为________.(注:残差是指实际观测值与预测值之间的差)
答案 3.2
解析 把x=1,2,3,4依次代入经验回归方程
=19.2x+12,所得预测值依次为1=31.2,
2=50.4,3=69.6,4=88.8,
对应的残差依次为0.8,-2.4,2.4,-0.8,它们的平均数为0,所以4个残差的方差为s2==3.2.
16.已知由样本数据点(xi,yi),i=1,2,…,n,求得的经验回归方程为=1.5x+0.5,且=3.现发现两个数据点(1.1,2.1)和(4.9,7.9)误差较大,去除后重新求得的经验回归直线l的斜率为1.2,那么,当x=2时,y的预测值为________.
答案 3.8
解析 将代入=1.5x+0.5,得=5.所以样本点的中心为(3,5),由数据点(1.1,2.1)和(4.9,7.9)知=3,=5,故去除这两个数据点后,样本点的中心不变.
设新的经验回归方程为=1.2x+,将样本点的中心坐标代入得=1.4,
所以,当x=2时,y的预测值为3.8.
三、解答题
17.6月2日某中学成功地举办了一年一度的大型学生社团文化节,吸引了众多学生.该中学目前共有社团近40个,由高一和高二的学生组成,参加社团的学生共有四百人左右.已知巴蜀中学高一和高二的所有学生中男生与女生人数比为6∶4,为了解学生参加社团活动的情况,按性别采用比例分配的分层随机抽样的方法抽取部分学生,统计得到如图K54-4所示的等高堆积条形图.
图K54-4
(1)从该中学参加社团的学生中,任选1人,抽出的是男生的概率.
(2)若抽取了100名学生,完成下列2×2列联表,并依据小概率值α=0.05的独立性检验,能否认为该中学高一和高二的学生的性别与是否参加社团有关联 请说明理由.
单位:人
性别 是否参加社团 合计
参加社团 未参加社团
男生
女生
合计
附:χ2=,其中n=a+b+c+d.
临界值表:
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
.解:(1)设高一和高二的所有学生中任选1人是男生、是女生分别为事件A,.
设高一和高二的所有学生中任选一人参加社团为事件B,
则P(A)=60%,P()=40%,
则P(A|B)===
==.
(2)2×2列联表如下:
单位:人
性别 是否参加社团 合计
参加社团 未参加社团
男生 6 54 60
女生 8 32 40
合计 14 86 100
零假设为H0:学生性别与是否参加社团独立,即学生性别与是否参加社团无关.
根据列联表中的数据,经计算得到χ2=≈1.993<3.841=x0.05,
依据小概率值α=0.05的独立性检验,没有充分的证据推断H0不成立,
因此可以认为H0成立,即学生性别与是否参加社团无关.
18.现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本和企业利润的数据(单位:万元)如表所示:
月份 1 2 3 4 5 6 7 8
物流成本x 83 83.5 80 86.5 89 84.5 79 86.5
利润y 114 116 106 122 132 114 m 132
残差=yi- 0.2 0.6 1.8 -3 -1 -4.6 -1
根据最小二乘法估计公式求得经验回归方程为=3.2x-151.8.
(1)求m的值,并利用已知的经验回归方程求出8月份对应的残差值8;
(2)请先求出一元线性回归模型=3.2x-151.8的决定系数R2(精确到0.000 1);若根据非线性回归模型y=267.76ln x-1 069.2求得解释变量(物流成本)对于响应变量(利润)的决定系数R=0.905 7,请说明以上两种模型哪种模型拟合效果更好?
(3)通过残差分析,怀疑残差绝对值最大的那组数据有误,经再次核实后发现其真正利润应该为116万元.请重新根据最小二乘法的思想与公式,求出新的经验回归方程.
附(修正前的参考数据):iyi=78 880,
=56 528,=84,(yi-)2=904.
解 (1)因为=3.2x-151.8,=84,
所以=3.2×84-151.8=117,
114+116+106+122+132+114+m+132
=117×8,
解得m=100,
所以8月份对应的残差值
8=132-3.2×86.5+151.8=7.
(2)由已知公式得(yi-)2=0.22+0.62+1.82+(-3)2+(-1)2+(-4.6)2+(-1)2+72=84.8,
R2=1-=1-≈0.906 2>R,
所以一元线性回归模型=3.2x-151.8拟合效果更好.
(3)第八组数据的利润应为116万元,
此时iyi=78 880-86.5×16=77 496,
又=56 528,=84,
=117-=115,
所以=
==2.7,
=115-2.7×84=-111.8,所以重新采集数据后,经验回归方程为=2.7x-111.8.
19.菏泽二模] “十四五”是我国全面建成小康社会、实现第一个百年奋斗目标之后,乘势而上开启全面建设社会主义现代化国家新征程、向第二个百年奋斗目标进军的第一个五年,实施时间为到.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备加大研发资金投入,为了解年研发资金投入额x(单位:亿元)对年盈利额y(单位:亿元)的影响,通过对“十二五”和“十三五”规划发展10年期间年研发资金投入额xi和年盈利额yi(i=1,2,…,10)数据进行分析,选用了两个模型:
y=α+βx2,y=eλx+t,其中α,β,λ,t均为常数,e为自然对数的底数.
令ui=,vi=ln yi(i=1,2,…,10),经计算得如下数据:=26,=215,=680,=5.36,.
(1)请从相关系数的角度,分析哪一个模型拟合效果更好
(2)根据(1)的选择及表中数据,建立y关于x的经验回归方程.(系数精确到0.01)
(3)若希望盈利额y为500亿元,请预测的研发资金投入额x为多少亿元 (结果精确到0.01)
参考数据:ln 2≈0.693,ln 5≈1.609.
.解:(1)为了判断两个模型y=α+βx2,y=eλx+t的拟合效果,只需要判断模型y=α+βu,v=λx+t的拟合效果即可.
设u和y的相关系数为r1,x和v的相关系数为r2,
由题意知
显然r2>r1>0,因此从相关系数的角度,模型y=eλx+t的拟合效果更好.
(2)先建立v关于x的线性经验回归方程,
由=得ln =x+,即=x+,
所以v关于x的线性经验回归方程为=0.18x+0.68,即ln =0.18x+0.68,
故所求经验回归方程为=e0.18x+0.68.
(3)若盈利额为500亿元,则500=e0.18x+0.68,
即ln 500=3ln 5+2ln 2=0.18x+0.68,
即3×1.609+2×0.693=6.213≈0.18x+0.68,解得x≈30.74,所以的研发资金投入额约为30.74亿元.
同课章节目录