第八章成对数据的统计分析复习提升(Word含答案解析)

文档属性

名称 第八章成对数据的统计分析复习提升(Word含答案解析)
格式 docx
文件大小 180.2KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2022-04-25 21:44:43

图片预览

文档简介

本章复习提升
易混易错练
易错点1 选错回归模型致错
1.(2020山西康杰中学高二下月考,)在一次抽样调查中测得5组成对数据,其数值及散点图如下:
x 0.25 0.5 1 2 4
y 16 12 5 2 1
(1)根据散点图判断y=a+bx与y=c+k·x-1哪一个更适宜作为y关于x的经验回归方程类型;(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,试建立y与x的经验回归方程;(计算结果保留整数)
(3)在(2)的条件下,设z=y+x且x∈[4,+∞),试求z的最小值.
参考公式:经验回归方程=x+中,
=-.
易错点2 求χ2用错公式致错
2.(2020河南郑州高二下第一次联考,)为了解人们对延迟退休年龄政策的态度,某部门从年龄在15岁到65岁的人群中随机调查了100人,并得到如图所示的频率分布直方图,在这100人中不支持延迟退休年龄政策的人数与年龄的统计结果如下表所示.
年龄 不支持延迟退休年龄政策的人数
[15,25) 15
[25,35) 5
[35,45) 15
[45,55) 23
[55,65] 17
(1)由频率分布直方图,估计这100人年龄的平均数(同一组数据用该区间的中点值代表);
(2)根据以上统计数据填写下面的2×2列联表,并依据α=0.05的独立性检验,分析以45岁为分界点的不同人群对延迟退休年龄政策的态度是否存在差异.
单位:人
45岁以下 45岁及以上 合计
不支持
支持
合计
附表及公式:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
χ2=,其中n=a+b+c+d.
3.(2020江西百所名校高三第四次联考,)今年1月至2月由新型冠状病毒引起的肺炎病例陡然增多,为了严控疫情扩散,做好重点人群的预防工作,某地区共统计返乡人员100人,其中50岁及以上的共有40人.这100人中确诊的有10人,其中50岁以下的人占.
(1)试估计50岁及以上的返乡人员因感染新型冠状病毒而引起肺炎的概率;
(2)请将下面的列联表补充完整,并依据α=0.05的独立性检验,分析确诊患新冠肺炎与年龄是否有关.
单位:人
确诊患新冠肺炎 未确诊患新冠肺炎 合计
50岁及以上 40
50岁以下
合计 10 100
附表及公式:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
χ2=,其中n=a+b+c+d.
4.(2020重庆高三上期末,)某地区在“精准扶贫”工作中切实贯彻习近平总书记提出的“因地制宜”的指导思想,扶贫工作小组经过多方调研,综合该地区的气候、地质、地理位置等特点,决定向当地农户推行某类景观树苗种植.工作小组根据市场前景重点考察了A,B两种景观树苗,为对比两种树苗的成活率,工作小组进行了引种试验,分别引种树苗A,B各50株,试验发现有80%的树苗成活,未成活的树苗A,B株数之比为1∶3.
(1)完成下面的2×2列联表,依据α=0.01的独立性检验,分析树苗A,B的成活率是否有差异;
树苗A 树苗B 合计
成活株数
未成活株数
合计 50 50 100
(2)已知树苗A引种成活后再经过1年的生长即可作为景观树A在市场上出售,但每株售价y(单位:百元)受其树干的直径x(单位:cm)影响,扶贫工作小组对一批已出售的景观树A的相关数据进行统计,得到结果如下表:
直径x 10 15 20 25 30
单株售价y 4 8 10 16 27
根据上述数据,判断是否可以用线性回归模型拟合y与x的关系,并用样本相关系数r加以说明.(一般认为|r|>0.75为高度线性相关)
深度解析
参考公式及数据:样本相关系数r=,=250,
=320.
χ2=,其中n=a+b+c+d.
附表:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
思想方法练
一、数形结合思想在统计中的应用
1.(2020福建泉州高三适应性线上测试,)下图是某地区2010年至2019年污染天数y与年份x的折线图,根据2010年至2014年的数据,2015年至2019年的数据,2010年至2019年的数据分别建立一元线性回归模型=b1x+a1,=b2x+a2,=b3x+a3,则(  )
A.b1B.b1C.b2D.b22.()某研究机构对高三学生的记忆力x和判断力y进行统计分析,得到下表数据:
x 6 8 10 12
y 2 3 5 6
(1)画出散点图;
(2)请根据上表提供的数据,求出y关于x的经验回归方程=x+.
参考公式:=,=-.
3.(2020山西运城河津二中高一上月考,)某医院用光电比色计检查尿汞时,得尿汞含量(毫克/升)与消光系数如下表:
尿汞含量x 2 4 6 8 10
消光系数y 64 138 205 285 360
(1)画出散点图;
(2)如果y与x之间具有线性相关关系,求y关于x的经验回归方程;
(3)估计尿汞含量为9毫克/升时的消光系数(结果保留整数).
参考公式:==,
=-.
参考数据:22+42+62+82+102=220,2×64+4×138+6×205+8×285+10×360=7 790.
4.(2020陕西榆林高三三模,)根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图如图所示.
(1)依据散点图判断是否可以用线性回归模型拟合y与x的关系,并用样本相关系数r加以说明(若r>0.75,则线性相关程度很高,可用线性回归模型拟合);
(2)求y关于x的经验回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量.
附:样本相关系数r==,经验回归方程=x+中,==,=-.
二、转化与化归思想在统计中的应用
5.(2020四川攀枝花高二上教学质量监测,)某公司为了确定下一年度投入某种产品的宣传费用,需了解年宣传费x(单位:万元)对年销售量y(单位:吨)和年利润(单位:万元)的影响.对2014年至2019年的宣传费xi和年销售量yi(i=1,2,3,4,5,6)的数据进行了初步统计,并绘制成如下表格:
年份 2014 2015 2016 2017 2018 2019
年宣传费x(万元) 38 48 58 68 78 88
年销售量y(吨) 16.8 18.8 20.7 22.4 24.0 25.5
经电脑模拟,发现年宣传费x(万元)与年销售量y(吨)之间近似满足关系式y=a·xb(a,b>0),即ln y=bln x+ln a.对上述数据进行了初步处理,得到的相关值如下表:
(ln xi·ln yi) ln xi ln yi (ln xi)2
75.3 24.6 18.3 101.4
(1)从表中所给出的6年的年销售量数据中任选2个数据进行年销售量的调研,求所选数据中至多有一年的年销售量低于20吨的概率;
(2)根据所给数据,求y关于x的经验回归方程;
(3)若生产该产品的固定成本为200万元,且每生产1吨产品的生产成本为20万元(总成本=固定成本+生产成本+年宣传费),销售收入为R(x)=[-x+(40+20e)+500]万元,假定该产品产销平衡(即生产的产品都能卖掉),则2020年该公司应该投入多少宣传费才能使利润最大 (其中e=2.718 28…)
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归直线=u+中的斜率和截距的最小二乘估计分别为=,=-.
答案全解全析
本章复习提升
易混易错练
1.解析 (1)由题中散点图可以判断,y=c+k·x-1更适宜作为y关于x的经验回归方程类型.
(2)令t=x-1,则y=c+kt,构造新的成对数据,如下表:
t 4 2 1 0.5 0.25
y 16 12 5 2 1
易知y与t存在线性相关关系.
计算得=1.55,=7.2,≈4,=- =1,所以y关于t的经验回归方程为=4t+1,
所以y关于x的经验回归方程为=+1.
(3)由(2)得z=y+x=+x+1,易得z=+x+1在x∈[4,+∞)上是单调递增函数,即最小值为6.
2.解析 (1)估计这100人年龄的平均数为20×0.2+30×0.1+40×0.2+50×0.3+60×0.2=42(岁).
(2)由题中频率分布直方图可知,45岁以下的有50人,45岁及以上的有50人.
可得2×2列联表如下:
单位:人
45岁以下 45岁及以上 合计
不支持 35 40 75
支持 15 10 25
合计 50 50 100
零假设为H0:不同人群与态度相互独立,即以45岁为分界点的不同人群对延迟退休年龄政策的态度不存在差异.计算可得χ2=≈1.333<3.841=x0.05,依据α=0.05的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为以45岁为分界点的不同人群对延迟退休年龄政策的态度不存在差异.
3.解析 (1)因为100人中确诊的有10人,50岁以下的人占,
所以50岁以下的确诊人数为3,50岁及以上的确诊人数为7,
因为50岁及以上的共有40人,
所以50岁及以上的返乡人员因感染新型冠状病毒而引起肺炎的概率约为.
(2)补充列联表如下:
单位:人
确诊患 新冠肺炎 未确诊患 新冠肺炎 合计
50岁及以上 7 33 40
50岁以下 3 57 60
合计 10 90 100
零假设为H0:确诊患新冠肺炎与年龄无关.计算可得χ2==≈4.167>3.841=x0.05.
依据α=0.05的独立性检验,推断H0不成立,即认为确诊患新冠肺炎与年龄有关.
4.解析 试验发现有80%的树苗成活,故未成活的树苗有20株,未成活的树苗A,B株数之比为1∶3,所以树苗A未成活5株,成活45株,树苗B未成活15株,成活35株.
(1)补充列联表如下:
树苗A 树苗B 合计
成活株数 45 35 80
未成活株数 5 15 20
合计 50 50 100
零假设为H0:树苗A,B的成活率无差异.计算可得χ2==6.25<6.635=x0.01,
依据α=0.01的独立性检验,没有充分证据推断H0不成立,因此认为H0成立,即认为树苗A,B的成活率无差异.
(2)可以用线性回归模型拟合y与x的关系.由题表中数据易得=20,=13,
所以r=
≈0.95>0.75.故可以用线性回归模型拟合y与x的关系.
思想方法练
1.C 经验回归直线应分布在散点图的附近,由题中统计图可知2010年至2014年,y随着x的增加而减少,2015年至2019年,y随着x的增加而减少的更多,根据经验回归方程=x+中,的几何意义可知,a2>a1,b22.解析 (1)散点图如图所示.
(2)易得==9,==4,
xiyi=6×2+8×3+10×5+12×6=158,
=62+82+102+122=344,
所以===0.7,
=-=4-0.7×9=-2.3,
故经验回归方程为=0.7x-2.3.
3.解析 (1)散点图如图所示.
(2)设经验回归方程为=x+,
易得=6,=210.4,===36.95,
∴=210.4-36.95×6=-11.3.
∴y关于x的经验回归方程为=36.95x-11.3.
(3)当x=9时,=36.95×9-11.3=321.25≈321.
故估计尿汞含量为9毫克/升时消光系数为321.
4.解析 (1)可以用线性回归模型拟合y与x的关系.易得==5,==5,
(xi-)(yi-)=(-3)×(-2)+(-1)×(-1)+0×0+1×1+3×2=14,
=(-3)2+(-1)2+02+12+32=20,
=(-2)2+(-1)2+02+12+22=10.
∴r===>0.75.
∴可以用线性回归模型拟合y与x的关系.
(2)设经验回归方程为=x+,===0.7,=-=5-0.7×5=1.5,∴=0.7x+1.5.
当x=12时,=0.7×12+1.5=9.9.
∴预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量为9.9百千克.
5.解析 (1)记事件A表示“至多有一年的年销售量低于20吨”,由题表中数据可知6年的数据中2014年和2015年的年销售量低于20吨,记这两年分别为c,d,其余四年分别为e,f,g,h,则从6年中任选2年,共有(c,d),(c,e),(c,f),(c,g),(c,h),(d,e),(d,f),(d,g),(d,h),(e,f),(e,g),(e,h),(f,g),(f,h),(g,h)15种取法,
事件A包括(c,e),(c,f),(c,g),(c,h),(d,e),(d,f),(d,g),(d,h),(e,f),(e,g),(e,h),(f,g),(f,h),(g,h),共14种取法,故P(A)=.
(2)根据题意,令u=ln x,v=ln y,得v=ln a+b·u,由题中数据得,==4.1,==3.05,
又uivi=(ln xi·ln yi)=75.3,=(ln xi)2=101.4,
所以===0.5,由ln =-=3.05-0.5×4.1=1,得=e,故所求经验回归方程为=e.
(3)设该公司的年利润为f(x)万元,因为利润=销售收入-总成本,所以由题意可知
f(x)=-x+(40+20e)+500-(200+20e+x)=-2x+40+300=-2(-10)2+500,所以当=10,即x=100时,年利润f(x)取得最大值,为500万元,故2020年该公司应该投入100万元的宣传费才能使利润最大.