高考数学(理科)重点生专题特训:高考微点24 统计与统计案例

文档属性

名称 高考数学(理科)重点生专题特训:高考微点24 统计与统计案例
格式 zip
文件大小 377.3KB
资源类型 教案
版本资源 通用版
科目 数学
更新时间 2020-05-15 11:24:14

文档简介

高考微点24 统计与统计案例
一、频率分布直方图
[微要点]
1.牢记频率分布直方图的关系式
(1)频率=;
(2)小长方形面积=组距×=频率;
(3)所有小长方形面积的和=各组频率和=1.
2.注意两个易误点
(1)易忽视频率分布直方图中纵轴表示的应为.
(2)同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同.
[微练习]
1.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大依次构成等比数列{an}(n=1,2,3,4),已知a2=2a1,且样本容量为300,则小长方形面积最小的一组的频数为(  )
A.20 B.40
C.30 D.无法确定
解析:选A 由已知,得4个小长方形的面积依次为a1,2a1,4a1,8a1,所以a1+2a1+4a1+8a1=1,a1=,因此面积最小的一组的频数为×300=20.
2.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:g)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100 g的个数是36,则样本中净重大于或等于98 g并且小于104 g的产品的个数是(  )

A.90          B.75
C.60 D.45
解析:选A 产品净重小于100 g的频率为(0.050+0.100)×2=0.300,已知样本中产品净重小于100 g的个数是36,设样本容量为n,则=0.300,所以n=120,净重大于或等于98 g并且小于104 g的产品的频率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98 g并且小于104 g的产品的个数是120×0.75=90.

[微要点]
1.数据x1,x2,x3,…,xn的数字特征公式
(1)平均数:=.
(2)方差:
s2=[(x1-)2+(x2-)2+…+(xn-)2].
(3)标准差:
s= .
2.平均数的性质
(1)若给定一组数据x1,x2,…,xn的平均数为,则ax1,ax2,…,axn的平均数为a;ax1+b,ax2+b,…,axn+b的平均数为a+b.
(2)若M个数的平均数是X,N个数的平均数是Y,则这(M+N)个数的平均数是;若两组数据x1,x2,…,xn和y1,y2,…,yn的平均数分别是和,则x1+y1,x2+y2,…,xn+yn的平均数是+.
3.方差的性质
若给定一组数据x1,x2,…,xn,其方差为s2,则ax1,ax2,…,axn的方差为a2s2;ax1+b,ax2+b,…,axn+b的方差为a2s2,特别地,当a=1时,有x1+b,x2+b,…,xn+b的方差为s2,这说明将一组数据中的每一个数据都加上一个相同的常数,方差是不变的,即不影响数据的波动性.
[微练习]
1.某品牌空调在元旦期间举行促销活动,如图所示的茎叶图表示某专卖店记录的每天销售量情况(单位:台),则销售量的中位数是(  )
A.13 B.14
C.15 D.16
解析:选C 由题意得,中位数是=15.
2.已知样本数据3,4,5,x,y的平均数是5,方差是2,则xy=(  )
A.42 B.40
C.36 D.30
解析:选A 由=5,得x+y=13.①
由×[(3-5)2+(4-5)2+(5-5)2+(x-5)2+(y-5)2]=2,得x2+y2-10x-10y+45=0,x2+y2=85.②
①2-②得,2xy=84,即xy=42,故选A.
3.若数据x1,x2,x3,…,xn的平均数为=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为(  )
A.5,2 B.16,2
C.16,18 D.16,9
解析:选C ∵x1,x2,x3,…,xn的平均数为5,
∴=5,
∴+1=3×5+1=16,
∵x1,x2,x3,…,xn的方差为2,
∴3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18.故选C.

[微要点]
1.线性回归方程
方程=x+称为线性回归方程,其中=,=-,(,)称为样本点的中心.

2.随机变量
K2=,其中n=a+b+c+d.
3.2个易误点
(1)易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
(2)回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(,)点,可能所有的样本数据点都不在直线上.

[微练习]
1.随机询问某幼儿园的100名孩子是否爱吃零食,得到如下的2×2列联表:
男孩 女孩 总计
爱吃零食 10 40 50
不爱吃零食 20 30 50
总计 30 70 100

附:
P(K2≥k0) 0.10 0.05 0.025
k0 2.706 3.841 5.024

由K2=计算得
K2=≈4.762.
则得到的正确结论是(  )
A.在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”
B.在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别无关”
C.有97.5%以上的把握认为“是否爱吃零食与性别有关”
D.有97.5%以上的把握认为“是否爱吃零食与性别无关”
解析:选A ∵K2≈4.762>3.841,∴在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”.
2.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,计算得i=80,i=20,iyi=184,=720.已知家庭的月储蓄y关于月收入x的线性回归方程为=x+,则变量x与y________(填“正相关”或“负相关”);若该居民区某家庭月收入为7千元,预测该家庭的月储蓄是________千元.
解析:由题意知n=10,=i=8,=i=2,
∴==0.3,=2-0.3×8=-0.4,
∴=0.3x-0.4,∵0.3>0,∴变量x与y正相关.
当x=7时,=0.3×7-0.4=1.7(千元).
答案:正相关 1.7


1.某同学将全班某次数学考试成绩整理成频率分布直方图后,并将每个小矩形上方线段的中点连接起来得到频率分布折线图(如图所示).据此估计此次考试成绩的众数是(  )

A.100 B.110
C.115 D.120
解析:选C 众数是一组数据中出现次数最多的数,结合题中频率分布折线图可以看出,数据“115”对应的纵坐标最大,所以相应的频率最大,频数最大,据此估计此次考试成绩的众数是115.
2.某小卖部为了了解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:
气温(℃) 18 13 10 -1
杯数 24 34 38 64

由表中数据算得回归方程=x+中的=-2,预测当天气温为-5 ℃时,热茶销售量为(  )
A.70 B.50
C.60 D.80
解析:选A 由表中数据,得=×(18+13+10-1)=10,=×(24+34+38+64)=40,
将(10,40)代入回归方程=x+中,且=-2,
所以40=10×(-2)+,解得=60,
所以=-2x+60.
所以当x=-5时,=-2×(-5)+60=70,
预测当天气温为-5 ℃时,热茶销售量为70杯.
3.某校随机抽取20个班调查各班有出国意向的学生人数,所得数据的茎叶图如图所示,以5为组距将数据分成[0,5),[5,10),…,[30,35),[35,40],则对应的频率分布直方图是(  )

解析:选A 法一:由茎叶图可知数据在[0,5)内的有1个,其为=0.01,在[5,10)内的有1个,其为=0.01,在[10,15)内的有4个,其为=0.04,结合选项可知选A.
法二:由频率分布直方图的组距为5,可排除C、D选项,又在区间[0,5),[5,10)内的数据个数相等,所以其相等,故排除B选项,选A.
4.某单位有840名职工,现采用系统抽样的方法抽取42名职工进行对公司福利满意度的问卷调查,将840人按1,2,3,…,840随机编号,若从抽取的42人中随机抽取1人进行追踪调查,则此人的编号落入区间[481,720]的概率为(  )
A. B..
C. D.
解析:选B 由题意得,系统抽样的分段间隔为=20,则编号落入区间[481,720]的人数为=12,所以所求概率P==.




5.如图是甲、乙两位同学高二上学期历史成绩的茎叶图,有一个数字被污损,用a(3≤a≤8且a∈N)表示被污损的数字.则甲同学的历史平均成绩不低于乙同学的历史平均成绩的概率为(  )
A. B.
C. D.
解析:选D 甲同学的历史平均成绩为(88+90+93+94+95)=92分,若甲同学的历史平均成绩不低于乙同学的历史平均成绩,则(86+88+92+98+90+a)≤92,得a≤6.因为3≤a≤8,所以3≤a≤6且a∈N,记甲同学的历史平均成绩不低于乙同学的历史平均成绩为事件A,则事件A包含4个基本事件,而基本事件总数共有6个,所以事件A的概率P(A)==.
6.某校在一次模拟考试中约有1 000人参加考试,其数学考试成绩X~N(90,a2)(a>0,试卷满分150分),统计结果显示数学考试成绩在70分到110分之间的人数约为总人数的,则此次数学考试成绩不低于110分的学生人数为(  )
A.600 B.400
C.300 D.200
解析:选D 由正态分布密度曲线可得P(707.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,其9个分数的茎叶图如图所示,后来有1个数据模糊,无法辨认,在图中以x表示,则7个剩余分数的方差为(  )


A. B..
C.36 D.

解析:选B 由题意,知=91,解得x=4.所以s2=×[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=×(16+9+1+0+1+9+0)=.
8.某学校开展研究性学习活动,某同学获得一组实验数据如下表:
x 1.99 3 4 5.1 6.12
y 1.5 4.04 7.5 12 18.01

对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是(  )
A.y=2x-2 B.y=x
C.y=log2x D.y=(x2-1)
解析:选D 直线y=2x-2是均匀变化的,不符合要求;指数函数y=x是单调递减的,不符合要求;对数函数y=log2x的增长缓慢,不符合要求;将表中数据代入选项D中,基本符合要求.故选D.
9.如图所示的茎叶图记录了甲、乙两班各六名同学一周的课外阅读时间(单位:时),已知甲班数据的平均数为13,乙班数据的中位数为17,那么茎叶图中x的值为______,y的值为________.

解析:∵甲班数据的平均数为13,
∴=13,解得x=3.
∵乙班的中位数是17,∴=17,
解得y=8.综上所述,x,y的值分别为3,8.
答案:3 8
10.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:
甲 乙 丙 丁
r 0.82 0.78 0.69 0.85
m 106 115 124 103

则根据试验结果,体现A,B两变量有更强的线性相关性的是________.
解析:丁的数据中r最大,m最小,故更能体现变量A,B的线性相关性.
答案:丁
11.一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示.

将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.X表示在未来3天内日销售量不低于100个的天数,则E(X)=________,方差D(X)=________.
解析:将频率视为概率,则日销售量不低于100个的概率为(0.006+0.004+0.002)×50=0.6,则X~B(3,0.6),所以期望E(X)=3×0.6=1.8,方差D(X)=3×0.6×(1-0.6)=0.72.
答案:1.8 0.72
12.(2019·兰州诊断考试)已知样本数据a1,a2,…,a2 018的方差是4,若bi=ai-2(i=1,2,…,2 018),则数据b1,b2,…,b2 018的标准差为________.
解析:∵bi=ai-2(i=1,2,…,2 018),∴数据b1,b2,…,b2 018的方差与样本数据a1,a2,…,a2 018的方差相等,均是4,所以数据b1,b2,…,b2 018的标准差为2.
答案:2
13.某省高考改革实施方案指出:该省高考考生总成绩将由语文、数学、外语3门统一高考成绩和学生自主选择的学业水平等级性考试科目成绩共同构成,该省教育厅为了解正在读高中的学生家长对高考改革方案所持的态度,从中随机抽取了100名城乡家长作为样本进行调查,调查结果显示样本中有25人持不赞成意见,如图是根据样本的调查结果绘制的等高条形图.

(1)根据已知条件与等高条形图完成下面的2×2列联表,并判断我们能否有95%的把握认为“对高考改革方案的态度与城乡户口有关”?

赞成 不赞成 合计
城镇居民
农村居民
合计

(2)用样本的频率估计概率,若随机在全省不赞成高考改革方案的家长中抽取3个,记这3个家长中是城镇户口的人数为X,试求X的分布列及数学期望E(X).
P(K2≥k0) 0.10 0.05 0.005
k0 2.706 3.841 7.879

附:K2=,其中n=a+b+c+d.
解:(1)完成2×2列联表,如下:
赞成 不赞成 合计
城镇居民 30 15 45
农村居民 45 10 55
合计 75 25 100

代入公式,得K2==≈3.03<3.841.
∴我们没有95%的把握认为“对高考改革方案的态度与城乡户口有关”.
(2)用样本的频率估计概率,随机在全省不赞成高考改革方案的家长中抽取一人,该人是城镇户口的概率为0.6,是农村户口的概率为0.4.
X的所有可能取值为0,1,2,3.
P(X=0)=(0.4)3=0.064,
P(X=1)=C×0.6×(0.4)2=0.288,
P(X=2)=C×0.62×0.4=0.432,
P(X=3)=C×0.63=0.216.
∴X的分布列为
X 0 1 2 3
P 0.064 0.288 0.432 0.216

E(X)=0×0.064+1×0.288+2×0.432+3×0.216=1.8.
14.随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网站为增加收入,促销策略越来越多样化,促销费用也不断增加,下表是某购物网站2019年1~8月促销费用x(万元)和产品销量y(万件)的具体数据.
月份 1 2 3 4 5 6 7 8
促销费用x 2 3 6 10 13 21 15 18
产品销量y 1 1 2 3 3.5 5 4 4.5


(1)根据数据绘制的散点图能够看出可用线性回归模型拟合y与x的关系,请用相关系数r加以说明;(系数精确到0.001)
(2)建立y关于x的回归方程=x+(系数精确到0.01),如果该公司计划在9月份实现产品销量超6万件,预测至少需投入促销费用多少万元.(结果精确到0.01)
参考数据: (xi-11)(yi-3)=74.5, (xi-11)2=340, (yi-3)2=16.5,≈18.44,≈4.06,其中xi,yi分别为第i个月的促销费用和产品销量,i=1,2,3,…,8.
参考公式:(ⅰ)样本(xi,yi)(i=1,2,…,n)的相关系数r=.
(ⅱ)对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程=x+的斜率和截距的最小二乘估计分别为=,=-.
解:(1)由题可知=11,=3,
将数据代入r=,
得r≈≈0.995.
因为y与x的相关系数近似为0.995,说明y与x的线性相关性很强,从而可以用线性回归模型拟合y与x的关系.(需要突出“很强”,“一般”或“较弱”不给分)
(2)将数据代入=,得=≈0.219,
=-=3-0.219×11≈0.59,
所以y关于x的回归方程为=0.22x+0.59.
由=0.22x+0.59>6,解得x>24.59,
即至少需要投入促销费用24.59万元.

高考微点24 统计与统计案例
一、频率分布直方图
[微要点]
1.牢记频率分布直方图的关系式
(1)频率=;
(2)小长方形面积=组距×=频率;
(3)所有小长方形面积的和=各组频率和=1.
2.注意两个易误点
(1)易忽视频率分布直方图中纵轴表示的应为.
(2)同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同.
[微练习]
1.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大依次构成等比数列{an}(n=1,2,3,4),已知a2=2a1,且样本容量为300,则小长方形面积最小的一组的频数为(  )
A.20 B.40
C.30 D.无法确定

2.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:g)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100 g的个数是36,则样本中净重大于或等于98 g并且小于104 g的产品的个数是(  )

A.90          B.75
C.60 D.45


[微要点]
1.数据x1,x2,x3,…,xn的数字特征公式
(1)平均数:=.
(2)方差:
s2=[(x1-)2+(x2-)2+…+(xn-)2].
(3)标准差:
s= .
2.平均数的性质
(1)若给定一组数据x1,x2,…,xn的平均数为,则ax1,ax2,…,axn的平均数为a;ax1+b,ax2+b,…,axn+b的平均数为a+b.
(2)若M个数的平均数是X,N个数的平均数是Y,则这(M+N)个数的平均数是;若两组数据x1,x2,…,xn和y1,y2,…,yn的平均数分别是和,则x1+y1,x2+y2,…,xn+yn的平均数是+.
3.方差的性质
若给定一组数据x1,x2,…,xn,其方差为s2,则ax1,ax2,…,axn的方差为a2s2;ax1+b,ax2+b,…,axn+b的方差为a2s2,特别地,当a=1时,有x1+b,x2+b,…,xn+b的方差为s2,这说明将一组数据中的每一个数据都加上一个相同的常数,方差是不变的,即不影响数据的波动性.
[微练习]
1.某品牌空调在元旦期间举行促销活动,如图所示的茎叶图表示某专卖店记录的每天销售量情况(单位:台),则销售量的中位数是(  )
A.13 B.14
C.15 D.16

2.已知样本数据3,4,5,x,y的平均数是5,方差是2,则xy=(  )
A.42 B.40
C.36 D.30

3.若数据x1,x2,x3,…,xn的平均数为=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为(  )
A.5,2 B.16,2
C.16,18 D.16,9


[微要点]
1.线性回归方程
方程=x+称为线性回归方程,其中=,=-,(,)称为样本点的中心.

2.随机变量
K2=,其中n=a+b+c+d.
3.2个易误点
(1)易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
(2)回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(,)点,可能所有的样本数据点都不在直线上.

[微练习]
1.随机询问某幼儿园的100名孩子是否爱吃零食,得到如下的2×2列联表:
男孩 女孩 总计
爱吃零食 10 40 50
不爱吃零食 20 30 50
总计 30 70 100

附:
P(K2≥k0) 0.10 0.05 0.025
k0 2.706 3.841 5.024

由K2=计算得
K2=≈4.762.
则得到的正确结论是(  )
A.在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”
B.在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别无关”
C.有97.5%以上的把握认为“是否爱吃零食与性别有关”
D.有97.5%以上的把握认为“是否爱吃零食与性别无关”

2.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,计算得i=80,i=20,iyi=184,=720.已知家庭的月储蓄y关于月收入x的线性回归方程为=x+,则变量x与y________(填“正相关”或“负相关”);若该居民区某家庭月收入为7千元,预测该家庭的月储蓄是________千元.


1.某同学将全班某次数学考试成绩整理成频率分布直方图后,并将每个小矩形上方线段的中点连接起来得到频率分布折线图(如图所示).据此估计此次考试成绩的众数是(  )

A.100 B.110
C.115 D.120

2.某小卖部为了了解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:
气温(℃) 18 13 10 -1
杯数 24 34 38 64

由表中数据算得回归方程=x+中的=-2,预测当天气温为-5 ℃时,热茶销售量为(  )
A.70 B.50
C.60 D.80

3.某校随机抽取20个班调查各班有出国意向的学生人数,所得数据的茎叶图如图所示,以5为组距将数据分成[0,5),[5,10),…,[30,35),[35,40],则对应的频率分布直方图是(  )


4.某单位有840名职工,现采用系统抽样的方法抽取42名职工进行对公司福利满意度的问卷调查,将840人按1,2,3,…,840随机编号,若从抽取的42人中随机抽取1人进行追踪调查,则此人的编号落入区间[481,720]的概率为(  )
A. B..
C. D.

5.如图是甲、乙两位同学高二上学期历史成绩的茎叶图,有一个数字被污损,用a(3≤a≤8且a∈N)表示被污损的数字.则甲同学的历史平均成绩不低于乙同学的历史平均成绩的概率为(  )
A. B.
C. D.

6.某校在一次模拟考试中约有1 000人参加考试,其数学考试成绩X~N(90,a2)(a>0,试卷满分150分),统计结果显示数学考试成绩在70分到110分之间的人数约为总人数的,则此次数学考试成绩不低于110分的学生人数为(  )
A.600 B.400
C.300 D.200

7.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,其9个分数的茎叶图如图所示,后来有1个数据模糊,无法辨认,在图中以x表示,则7个剩余分数的方差为(  )


A. B..
C.36 D.

8.某学校开展研究性学习活动,某同学获得一组实验数据如下表:
x 1.99 3 4 5.1 6.12
y 1.5 4.04 7.5 12 18.01

对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是(  )
A.y=2x-2 B.y=x
C.y=log2x D.y=(x2-1)

9.如图所示的茎叶图记录了甲、乙两班各六名同学一周的课外阅读时间(单位:时),已知甲班数据的平均数为13,乙班数据的中位数为17,那么茎叶图中x的值为______,y的值为________.


10.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:
甲 乙 丙 丁
r 0.82 0.78 0.69 0.85
m 106 115 124 103

则根据试验结果,体现A,B两变量有更强的线性相关性的是________.

11.一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示.

将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.X表示在未来3天内日销售量不低于100个的天数,则E(X)=________,方差D(X)=________.

12.(2019·兰州诊断考试)已知样本数据a1,a2,…,a2 018的方差是4,若bi=ai-2(i=1,2,…,2 018),则数据b1,b2,…,b2 018的标准差为________.

13.某省高考改革实施方案指出:该省高考考生总成绩将由语文、数学、外语3门统一高考成绩和学生自主选择的学业水平等级性考试科目成绩共同构成,该省教育厅为了解正在读高中的学生家长对高考改革方案所持的态度,从中随机抽取了100名城乡家长作为样本进行调查,调查结果显示样本中有25人持不赞成意见,如图是根据样本的调查结果绘制的等高条形图.

(1)根据已知条件与等高条形图完成下面的2×2列联表,并判断我们能否有95%的把握认为“对高考改革方案的态度与城乡户口有关”?

赞成 不赞成 合计
城镇居民
农村居民
合计

(2)用样本的频率估计概率,若随机在全省不赞成高考改革方案的家长中抽取3个,记这3个家长中是城镇户口的人数为X,试求X的分布列及数学期望E(X).
P(K2≥k0) 0.10 0.05 0.005
k0 2.706 3.841 7.879

附:K2=,其中n=a+b+c+d.

14.随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网站为增加收入,促销策略越来越多样化,促销费用也不断增加,下表是某购物网站2019年1~8月促销费用x(万元)和产品销量y(万件)的具体数据.
月份 1 2 3 4 5 6 7 8
促销费用x 2 3 6 10 13 21 15 18
产品销量y 1 1 2 3 3.5 5 4 4.5


(1)根据数据绘制的散点图能够看出可用线性回归模型拟合y与x的关系,请用相关系数r加以说明;(系数精确到0.001)
(2)建立y关于x的回归方程=x+(系数精确到0.01),如果该公司计划在9月份实现产品销量超6万件,预测至少需投入促销费用多少万元.(结果精确到0.01)
参考数据: (xi-11)(yi-3)=74.5, (xi-11)2=340, (yi-3)2=16.5,≈18.44,≈4.06,其中xi,yi分别为第i个月的促销费用和产品销量,i=1,2,3,…,8.
参考公式:(ⅰ)样本(xi,yi)(i=1,2,…,n)的相关系数r=.
(ⅱ)对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程=x+的斜率和截距的最小二乘估计分别为=,=-.


同课章节目录