单元测评(五) 统计案例(A卷)
(时间:90分钟 满分:120分)
第Ⅰ卷(选择题,共50分)
一、选择题:本大题共10小题,共50分.
1.下列说法正确的是( )
A.相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义
B.独立性检验对分类变量关系的研究没有100%的把握,所以独立性检验研究的结果在实际中也没有多大的实际意义www-2-1-cnjy-com
C.相关关系可以对变量的发展趋势进行预报,这种预报可能会是错误的
D.独立性检验如果得出的结论有99%的可信度就意味着这个结论一定是正确的
解析:相关关系虽然是一种不确定关系,但是回归分析可以在某种程度上对变量的发展趋势进行预报,这种预报在尽量减小误差的条件下可以对生产与生活起到一定的指导作用,独立性检验对分类变量的检验也是不确定的,但是其结果也有一定的实际意义.2-1-c-n-j-y
答案:C
2.在对两个变量x,y进行线性回归分析时有下列步骤:
①对所求出的回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.
如果根据可靠性要求能够作出变量x,y具有线性相关结论,则下列操作顺序正确的是( )
A.①②⑤③④ B.③②④⑤①
C.②④③①⑤ D.②⑤④③①
解析:由对两个变量进行回归分析的步骤,知选D.
答案:D
3.下列说法中错误的是( )
A.如果变量x与y之间存在着线性相关关系,则我们根据实验数据得到的点(xi,yi)(i=1,2,…,n)将散布在某一条直线的附近 21*cnjy*com
B.如果两个变量x与y之间不存在着线性关系,那么根据它们的一组数据(xi,yi)(i=1,2,…,n)不能写出一个线性方程【来源:21cnj*y.co*m】
C.设x,y是具有相关关系的两个变量,且y关于x的线性回归方程为=x+,叫做回归系数
D.为使求出的线性回归方程有意义,可用统计检验的方法来判断变量y与x之间是否存在线性相关关系
解析:任何一组(xi,yi)(i=1,2,…,n)都能写出一个线性方程,只是有的无意义.
答案:B
4.在建立两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的相关指数R2如下,其中拟合得最好的模型为( )
A.模型1的相关指数R2为0.75
B.模型2的相关指数R2为0.90
C.模型3的相关指数R2为0.25
D.模型4的相关指数R2为0.55
解析:相关指数R2的值越大,意味着残差平方和越小,也就是说拟合效果越好.
答案:B
5.下列说法中正确的有:( )
①若r>0,则x增大时,y也相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.21·世纪*教育网
A.①② B.②③
C.①③ D.①②③
解析:若r>0,表示两个相关变量正相关,x增大时,y也相应增大,故①正确.r<0,表示两个变量负相关,x增大时,y相应减小,故②错误.|r|越接近1,表示两个变量相关性越高,|r|=1表示两个变量有确定的关系(即函数关系),故③正确.【版权所有:21教育】
答案:C
6.由一组观测数据(x1,y1),(x2,y2),…,(x12,y12)得=1.542,=2,847 5,x=29.808,y=99.208,xiyi=54.243,则回归直线方程为( )21*cnjy*com
A.=1.218x-0.969
B.=-1.218x+0.969
C.=0.969x+1.218
D.=1.218x+0.969
解析:∵=1.542,=2.847 5,
利用公式可得==1.218,
又=-=0.969,
∴回归直线方程为=1.218x+0.969.
答案:D
7.对有线性相关关系的两个变量建立的回归直线方程=+x中,回归系数( )
A.可以小于0 B.大于0
C.能等于0 D.只能小于0
解析:∵=0时,则r=0,这时不具有线性相关关系,但可以大于0也可以小于0.
答案:A
8.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为=0.66x+1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )
A.83% B.72%
C.67% D.66%
解析:将=7.675代入回归方程,可计算得x≈9.262,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83≈83%,即约为83%.
答案:A
9.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线为l1和l2,已知在两人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t,那么下列说法正确的是( )
A.直线l1和直线l2有交点(s,t)
B.直线l1和直线l2相交,但交点未必是点(s,t)
C.直线l1和直线l2由于斜率相等,所以必定平行
D.直线l1和直线l2必定重合
解析:l1与l2都过样本中心(,).
答案:A
10.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:
则在犯错误的概率不超过__________的前提下认为吸烟量与年龄有关.( )
A.0.001 B.0.01
C.0.05 D.没有理由
解析:利用题中列联表,代入公式计算.
K2=≈22.16>10.828,
所以我们在犯错误的概率不超过0.001的前提下认为吸烟量与年龄有关.
答案:A
第Ⅱ卷(非选择题,共70分)
二、填空题:本大题共4小题,每小题5分,共20分.
11.已知某车间加工零件的个数x与所花费时间y(h)之间的线性回归方程为=0.01x+0.5,则加工600个零件大约需要__________h.
解析:当x=600时,=0.01×600+0.5=6.5.
答案:6.5
12.某单位为了制定节能减排的目标,先调查了用电量y(单位:度)与气温x(单位:℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:21世纪教育网版权所有
x
18
13
10
-1
y
24
34
38
64
由表中数据,得线性回归方程=-2x+,当气温为-5 ℃时,预测用电量约为__________度.21教育网
解析:由表中数据知,=(18+13+10-1)=10,=(24+34+38+64)=40.
∵回归直线过点(,),∴40=-2×10+a.
∴a=60.
∴x=-5 ℃时,y=-2×(-5)+60=70(度).
答案:70
13.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=a+bxi+ei(i=1,2,…,n),若ei恒为0,则R2为__________.www.21-cn-jy.com
解析:由ei恒为0,知yi=i,即yi-i=0,
故R2=1-=1-0=1.
答案:1
14.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为__________cm.【出处:21教育名师】
解析:设父亲身高为x cm,儿子身高为y cm,则
x
173
170
176
y
170
176
182
=173,=176,==1,
=-=176-1×173=3,
所以=x+3,当x=182时,=185.
答案:185
三、解答题:本大题共4小题,满分50分.
15.(12分)某学校高三年级有学生1 000名,经调查,其中750名同学经常参加体育锻炼(称为A类同学),另外250名同学不经常参加体育锻炼(称为B类同学),现用分层抽样方法(按A类、B类分两层)从该年级的学生中共抽查100名同学,如果以身高达165 cm作为达标的标准,对抽取的100名学生,得到以下列联表:21教育名师原创作品
身高达标
身高不达标
总计
积极参加体育锻炼
40
不积极参加体育锻炼
15
总计
100
(1)完成上表;
(2)能否在犯错误的概率不超过0.05的前提下认为体育锻炼与身高达标有关系(K2的观测值精确到0.001)?
解:(1)填写列联表如下:
身高达标
身高不达标
总计
积极参加体育锻炼
40
35
75
不积极参加体育锻炼
10
15
25
总计
50
50
100
(6分)
(2)K2的观测值为
k=≈1.333<3.841.
所以不能在犯错误的概率不超过0.05的前提下认为体育锻炼与身高达标有关系.(12分)
16.(12分)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:21cnjy.com
单价x(元)
8
8.2
8.4
8.6
8.8
9
销量y(件)
90
84
83
80
75
68
(1)求回归直线方程=bx+a,其中b=-20,a=-b;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)21·cn·jy·com
解:(1)由于=(x1+x2+x3+x4+x5+x6)=8.5,
=(y1+y2+y3+y4+y5+y6)=80.
所以a=-b=80+20×8.5=250,从而回归直线方程为=-20x+250.(6分)
(2)设工厂获得的利润为L元,依题意得
L=x(-20x+250)-4(-20x+250)
=-20x2+330x-1 000
=-202+361.25.
当且仅当x=8.25时,L取得最大值.
故当单价定为8.25元时,工厂可获得最大利润.
(12分)
17.(12分)针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的.
若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少多少人?
解:设男生人数为x,依题意可得列联表如下:
喜欢韩剧
不喜欢韩剧
总计
男生
x
女生
总计
x
x
若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则k>3.841.(6分)
由K2==x>3.841,
解得x>10.24.(8分)
∵,为整数,
∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有12人.
(12分)
18.(14分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:
日期
12月1日
12月2日
12月3日
12月4日
12月5日
温差x℃
10
11
13
12
8
发芽数y(颗)
23
25
30
26
16
该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.
(1)求选取的2组数据恰好是不相邻2天数据的概率;
(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程=x+;
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得到的线性回归方程是否可靠?2·1·c·n·j·y
解:(1)设抽到不相邻的两组数据为事件A,因为从5组数据中选取2组数据共有10种情况:(1,2)(1,3)(1,4)(1,5)(2,3)(2,4)(2,5)(3,4)(3,5)(4,5),其中数据为12月份的日期数.【来源:21·世纪·教育·网】
每种情况都是等可能出现的,事件A包括的基本事件有6种.
所以P(A)==.
所以选取的2组数据恰好是不相邻2天数据的概率是.(4分)
(2)由数据,求得=12,=27.
由公式,求得=,=-=-3.
所以y关于x的线性回归方程为=x-3.
(8分)
(3)当x=10时,=×10-3=22,|22-23|<2;
同样,当x=8时,=×8-3=17,|17-16|<2;
所以,该研究所得到的回归方程是可靠的.
(14分)
单元测评(六) 统计案例(B卷)
(时间:90分钟 满分:120分)
第Ⅰ卷(选择题,共50分)
一、选择题:本大题共10小题,共50分.
1.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得=0.577x-0.448(x为人的年龄,y为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )
A.年龄为37岁的人体内脂肪含量都为20.90%
B.年龄为37岁的人体内脂肪含量为21.01%
C.年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%
D.年龄为37岁的大部分的人体内脂肪含量为31.5%
解析:当x=37时,=0.577×37-0.448=20.901≈20.90,由此估计:年龄在37岁的人群中的大部分人的体内脂肪含量为20.90%.
答案:C
2.对变量x,y由观测数据(xi,yi)(i=1,2,…,10),得散点图1;对变量u,v由观测数据(ui,vi)(i=1,2,…,10),得散点图2.由这两个散点图可以判断( )2-1-c-n-j-y
图1
图2
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
解析:由这两个散点图可以判断,变量x与y负相关,u与v正相关,选C.
答案:C
3.收集一只棉铃虫的产卵数y与温度x的几组数据后发现两个变量有相关关系,并按不同的曲线来拟合y与x之间的回归方程,并算出了对应相关指数R2如下表:【出处:21教育名师】
拟合曲线
直线
指数曲线
抛物线
二次曲线
y与x回
归方程
=19.8x-463.7
=e0.27x-3.84
=0.367x2-202
=
相关指数R2
0.746
0.996
0.902
0.002
则这组数据模型的回归方程的最好选择应是( )
A.=19.8x-463.7
B.=e0.27x-3.84
C.=0.367x2-202
D.=
解析:用相关指数R2来刻画回归效果,R2的值越大,说明模型的拟合效果越好.
答案:B
4.对于P(K2≥k),当k>2.706时,就推断“X与Y有关系”,这种推断犯错误的概率不超过( )21·世纪*教育网
A.0.01 B.0.05
C.0.10 D.以上都不对
解析:由k>2.706,知P(K2≥2.706)≈0.10,即若k>2.706,在犯错误的概率不超过0.10的前提下认为“X与Y有关系”. 21*cnjy*com
答案:C
5.假设有两个分类变量x与y的2×2列联表如下表:
y1
y2
x1
a
b
x2
c
d
对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为( )
A.a=5,b=4,c=3,d=2
B.a=5,b=3,c=4,d=2
C.a=2,b=3,c=4,d=5
D.a=2,b=3,c=5,d=4
解析:显然D中|ad-bc|最大,故选D.
答案:D
6.以下有关线性回归分析的说法不正确的是( )
A.通过最小二乘法得到的线性回归直线经过样本的中心(,)
B.用最小二乘法求回归直线方程,是寻求使 (yi-bxi-a)2最小的a,b的值
C.在回归分析中,变量间的关系若是非确定性关系,但因变量也能由自变量唯一确定
D.如果回归系数是负的,y的值随x的增大而减小
解析:在回归分析中,因变量不能由自变量唯一确定,故选C.
答案:C
7.某国2002-2012年的国内生产总值如下表所示.
年份
2002
2003
2004
2005
产值/亿元
18 598.4
21 662.5
26 651.9
34 560.5
年份
2006
2007
2008
2009
产值/亿元
46 670.0
57 494.9
66 850.5
73 142.7
年份
2010
2011
2012
产值/亿元
76 567.1
80 422.8
89 404.0
则反映这一时期国内生产总值发展变化的函数模型可能为( )
A.y=aebx B.y=a+bx
C.y=axb D.y=ae
解析:画出散点图观察,可用y=a+bx刻画国内生产总值发展变化的趋势.
答案:B
8.某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算发现K2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游愿望有关系的可信程度是( )
P(K2≥k)
0.25
0.15
0.10
0.025
0.010
0.005
k
1.323
2.072
2.706
5.024
6.635
7.879
A.90% B.95%
C.97.5% D.99.5%
解析:∵K2=6.023>5.024.故其可信度为97.5%.
答案:C
9.已知一组样本点(xi,yi),其中i=1,2,3,…,30.根据最小二乘法求得的回归方程是=bx+a,则下列说法正确的是( )21世纪教育网版权所有
A.若所有样本点都在=bx+a上,则变量间的相关系数为1
B.至少有一个样本点落在回归直线=bx+a上
C.对所有的预报变量xi(i=1,2,3,…,30),bxi+a的值一定与yi有误差
D.若=bx+a斜率b>0,则变量x与y正相关
解析:所有样本点都在=bx+a上,则变量间的相关系数为±1,故A错误;
回归直线必过样本数据中心点,但样本点可能全部不在回归直线上,故B错误;
若所有样本点都在=bx+a上,则bxi+a的值与yi相等,故C错误;
相关系数r与b符号相同,若=bx+a斜率b>0,则r>0,样本点分布从左到右应该是上升的,则变量x与y正相关,故D正确.
答案:D
10.变量U与V相对应的一组样本数据为(1,1.4),(2,2.2),(3,3),(4,3.8),由上述样本数据得到U与V的线性回归分析,R2表示解释变量对于预报变量变化的贡献率,则R2=( )21·cn·jy·com
A. B.
C.1 D.3
解析:在线性回归中,相关指数R2等于相关系数,由x1=1,x2=2,x3=3,x4=4得:=2.5,y1=1.4,y2=2.2,y3=3,y4=3.8得:=2.6,
所以相关系数
r=
====1.故选C.
答案:C
第Ⅱ卷(非选择题,共70分)
二、填空题:本大题共4小题,每小题5分,共20分.
11.某工厂的某种型号的机器的使用年限x和所支出的维修费用y(万元)有下表的统计资料:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
根据上表可得回归方程=1.23x+,据此模型估计,该型号机器使用年限为10年时维修费用约__________万元(结果保留两位小数).
解析:=4,=5,=0.08.所以回归方程=1.23x+0.08,该型号机器使用年限为10年时维修费用约1.23×10+0.08=12.38万元.
答案:12.38
12.根据下表,计算K2的观测值k≈__________.(保留两位小数)
又发病
未发病
作移植手术
39
157
未作移植手术
29
167
解析:k=≈1.78.
答案:1.78
13.已知一回归直线方程为=1.5x+45,x∈{1,5,7,13,19},则=__________.2·1·c·n·j·y
解析:因为=(1+5+7+13+19)=9,且=1.5+45,所以=1.5×9+45=58.5.【来源:21cnj*y.co*m】
答案:58.5
14.已知x,y的取值如下表所示:
x
0
1
3
4
y
2.2
4.3
4.8
6.7
从散点图分析,y与x线性相关,且=0.95x+a,则a=__________.
解析:∵=2,=4.5,又=0.95x+a,
∴4.5=0.95×2+a,∴a=2.6.
答案:2.6
三、解答题:本大题共4小题,满分50分.
15.(12分)以下是某地区不同身高的未成年男性的体重平均值表
身高/cm
60
70
80
90
100
110
120
130
140
150
160
170
体重/kg
6.13
7.9
9.99
12.15
15.02
17.5
20.92
26.86
31.11
38.85
47.25
55.05
(1)给出两个回归方程:
①y=0.429 4x-25.318,
②y=2.004e0.019 7x.
通过计算,得到它们的相关指数分别是:R=0.931 1,R=0.998.试问哪个回归方程拟合效果最好?【版权所有:21教育】
(2)若体重超过相同身高男性平均值的1.2倍为偏胖,低于0.8为偏瘦,那么该地区某中学一男生身高为175 cm,体重为78 kg,他的体重是否正常?21教育名师原创作品
解:(1)∵R>R,
∴选择第二个方程拟合效果最好.(4分)
(2)把x=175代入y=2.004e0.019 7x,得y=62.97,
由于=1.24>1.2,所以这名男生偏胖.
(12分)
16.(12分)某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:
推销员编号
1
2
3
4
5
工作年限x/年
3
5
6
7
9
年推销金额y/万元
2
3
3
4
5
(1)求年推销金额y关于工作年限x的线性回归方程;
(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.
解:(1)设所求的线性回归方程为=x+,
则===0.5,
=-=0.4.
所以年推销金额y关于工作年限x的线性回归方程为=0.5x+0.4.(6分)
(2)当x=11时,=0.5x+0.4=0.5×11+0.4=5.9(万元).
所以可以估计第6名推销员的年推销金额为5.9万元.(12分)
17.(12分)在关于人的脂肪含量(百分比)和年龄的关系的研究中,研究人员获得了一组数据如下表:
年龄x
23
27
39
41
45
49
50
53
54
56
57
58
60
61
脂肪含量y
9.5
17.8
21.2
25.9
27.5
26.3
28.2
29.6
30.2
31.4
30.8
33.5
35.2
34.6
(1)作出散点图,并判断y与x是否线性相关,若线性相关,求线性回归方程;
(2)给出37岁时人的脂肪含量的预测值.
解:(1)散点图如图所示.由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系.21教育网
设线性回归方程为=x+,则由计算器算得≈0.576,=-0.448,所以线性回归方程为=0.576x-0.448.(6分)www.21-cn-jy.com
(2)当x=37时,=0.576×37-0.448≈20.9,
故37岁时人的脂肪含量约为20.9%.
18.(14分)电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:www-2-1-cnjy-com
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.
(1)根据已知条件完成下面的2×2列联表,据此资料你是否认为“体育迷”与性别有关?
非体育迷
体育迷
总计
男
女
10
55
总计
(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次
抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列,期望E(X)和方差D(X).21cnjy.com
解:(1)由所给的频率分布直方图知,
“体育迷”人数为100×(10×0.020+10×0.005)=25,
“非体育迷”人数为75,则据题意完成2×2列联表:
非体育迷
体育迷
总计
男
30
15
45
女
45
10
55
总计
75
25
100
将2×2列联表的数据代入公式计算:
K2==
≈3.030>2.706.
所以在犯错误的概率不超过0.1的前提下,认为“体育迷”与性别有关.(6分)
(2)由频率分布直方图知,抽到“体育迷”的概率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为.由题意,X~B,从而X的分布列为【来源:21·世纪·教育·网】
X
0
1
P
C3
C2
X
2
3
P
C2
C3
X的数学期望为E(X)=np=3×=,X的方差为D(X)=np(1-p)=3××=.
(14分)