(时间:120分钟,满分:150分)
一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下面的抽样方法是简单随机抽样的是( )
A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖
B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,检验其质量是否合格
C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见
D.用抽签法从10件产品中选取3件进行质量检验
解析:选D.对每个选项逐条落实简单随机抽样的特点.A、B不是简单随机抽样,因为抽取的个体间的间隔是固定的;C不是简单随机抽样,因为总体的个体有明显的层次;D是简单随机抽样.
2.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为( )
A.7 B.15
C.25 D.35
解析:选B.由题意知青年职工人数∶中年职工人数∶老年职工人数=350∶250∶150=7∶5∶3.由样本中青年职工为7人得样本容量为15.
3.下列说法:①一组数据不可能有两个众数;②一组数据的方差必须是正数;③将一组数据中的每一个数据都加上或减去同一常数后,方差恒不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率.其中错误的有( )
A.0个 B.1个
C.2个 D.3个
解析:选C.一组数据的众数不唯一,即①不对;一组数据的方差必须是非负数,即②不对;根据方差的定义知③正确;根据频率分布直方图的概念知④正确.
4.对一个样本容量为100的数据分组,各组的频率如下:
[17,19),1;[19,21),1;[21,23),3;[23,25),3;[25,27),18;[27,29),16;[29,31),28;[31,33],30.
根据累积频率分布,估计小于29的数据大约占总体的( )
A.42% B.58%
C.40% D.16%
解析:选A.数据小于29(不包括29)的频数为1+1+3+3+18+16=42.故其所占比例为=42%.
5.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体均值为3,中位数为4
B.乙地:总体均值为1,总体方差大于0
C.丙地:中位数为2,众数为3
D.丁地:总体均值为2,总体方差为3
解析:选D.根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项A中,中位数为4,可能存在大于7的数;同理,在选项C中也有可能;选项B中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项D中,根据方差公式,如果有大于7的数存在,那么方差不会为3.
6.两个样本,甲:5,4,3,2,1;乙:4,0,2,1,-2.那么样本甲和样本乙的波动大小情况是( )
A.甲乙波动大小一样 B.甲的波动比乙的波动大
C.乙的波动比甲的波动大 D.甲乙的波动大小无法比较
解析:选C.样本甲:1==3.
∴=×[(5-3)2+(4-3)2+(3-3)2+(2-3)2+(1-3)2]=2.
样本乙:2=[4+0+2+1+(-2)]=1.
∴=×[(4-1)2+(0-1)2+(2-1)2+(1-1)2+(-2-1)2]=4.
显然<,故样本乙的波动比甲的波动大.
7.为了研究两个变量x与y之间的线性相关性,甲、乙两个同学各自独立做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知在两个人的试验中发现对变量x的观察数据的平均数恰好相等,都为s,对变量y的观察数据的平均数也恰好相等,都为t,那么下列说法正确的是( )
A.直线l1和l2有交点(s,t)
B.直线l1和l2相交,但是交点未必是(s,t)
C.直线l1和l2平行
D.直线l1和l2必定重合
解析:选A.∵线性回归方程为y=bx+a,而a=-b,
∴a=t-bs,即t=bs+a,∴点(s,t)在回归直线上,
∴直线l1和l2有交点(s,t).
8.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为( )
A.1 B.2
C.3 D.4
解析:选D.由平均数为10,
得(x+y+10+11+9)×=10,
则x+y=20;又由于方差为2,
则[(x-10)2+(y-10)2+(10-10)2+(11-10)2+(9-10)2]×=2,故x2+y2=208,∴2xy=192,
所以有|x-y|===4,故选D.
9.下列调查的样本不合理的是( )
①在校内发出一千张印有全校各班级的选票,要求被调查学生在其中一个班级旁画“√”,以了解最受欢迎的教师是谁;
②从一万多名工人中,经过选举,确定100名代表,然后投票表决,了解工人们对厂长的信任情况;
③到老年公寓进行调查,了解全市老年人的健康状况;
④为了了解全班同学每天的睡眠时间,在每个小组中各选取3名学生进行调查.
A.①② B.①③
C.②③ D.②④
解析:选B.①中样本不符合有效性原则,在班级前画“√”与了解最受欢迎的老师没有关系.③中样本缺少代表性.②、④都是合理的样本.故选B.
10.某大学共有学生5600人,其中有专科生1300人、本科生3000人、研究生1300人,现采用分层抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本为280人,则在专科生、本科生与研究生这三类学生中应分别抽取( )
A.65人、150人、65人 B.30人、150人、100人
C.93人、94人、93人 D.80人、120人、80人
解析:选A.抓住分层抽样按比例抽取的特点有===,∴x=z=65,y=150,即专科生、本科生与研究生应分别抽取65人、150人、65人.
二、填空题(本大题共5小题,每小题5分,共25分.把答案填在横线上)
11.若总体中含有1645个个体,采用系统抽样的方法从中抽取容量为35的样本,则编号后确定编号分为________段,分段间隔k=________,每段有________个个体.
解析:因为N=1645,n=35,则编号后确定编号分为35段,且k===47,则分段间隔k=47,每段有47个个体.
答案:35 47 47
12.在如图所示的“茎叶图”表示的数据中,众数和中位数分别为________、________.
解析:由茎叶图可知这组数据为:
12,14,20,23,25,26,30,31,31,41,42.
∴众数和中位数分别为31、26.
答案:31 26
13.(2010年高考北京卷)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=__________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为__________.
解析:∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴a==0.030.由题意知,身高在[120,130),[130,140),[140,150]的学生分别为30人,20人,10人,∴由分层抽样可知抽样比为=,∴在[140,150]中选取的学生应为3人.
答案:0.030 3
14.某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:
月平均气温x(℃) 17 13 8 2
月销售量y(件) 24 33 40 55
由表中数据算出线性回归方程y=bx+a中的b≈-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月毛衣的销售量约为________件.
(参考公式:b=,a=-b)
解析:由所提供数据可计算出=10,=38,又b≈-2,代入公式a=-b,得a=58.
即线性回归方程为y=-2x+58,将x=6代入可得.
答案:46
15.某市煤气消耗量与使用煤气户数的历史记录资料如表:
i(年) 1 2 3 4 5
x(户数:万户) 1 1.2 1.6 1.8 2
y(煤气消耗量:百万立方米) 6 7 9.8 12 12.1
i(年) 6 7 8 9 10
x(户数:万户) 2.5 3.2 4 4.2 4.5
y(煤气消耗量:百万立方米) 14.5 20 24 25.4 27.5
其散点图如图所示:
从散点图知,煤气消耗量与使用煤气户数________(填线性相关或线性不相关);若回归方程为y=6.057x+0.082,则当煤气用户扩大到5万户时,该市煤气消耗量估计是________万立方米.
解析:由散点图知,变量x,y线性相关,
当x=5时,y=6.057×5+0.082=30.367(百万立方米)
=3036.7(万立方米).
答案:线性相关 3036.7
三、解答题(本大题共6小题,共75分.解答应写出文字说明、证明过程或演算步骤)
16.(本小题满分12分)某制罐厂每小时生产易拉罐120000个,每天的生产时间为12小时,为了保证产品的合格率,每隔一段时间就要抽取一个易拉罐送检,工厂规定每天要抽取1200个进行检测,请设计一个合理的抽样方案.若工厂规定每天共抽取980个进行检测呢?
解:每天共生产易拉罐120000个,共抽取1200个,所以分成1200组,每组100个,然后采用简单随机抽样法从001~100中随机选出1个编号,例如选出的是13号,则从第13个易拉罐开始,每隔100个拿出一个送检,或者根据每小时生产10000个,每隔×3600=36(秒)拿出一个易拉罐.
若共要抽取980个进行检测,则要分980组,由于980不能整除120000,所以应先剔除120000-980×122=440(个),再将剩下的119560个平均分成980组,每组122个,然后采用简单随机抽样法从001~122中随机选出1个编号,例如选出的编号是108号,则从第108个易拉罐开始,每隔122个,拿出一个送检.
17.(本小题满分12分)有关部门从甲、乙两个城市所有的自动售货机中随机抽取了16台,记录了上午8∶00~11∶00之间各自的销售情况(单位:元):
甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;
乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.
试用两种不同的方式分别表示上面的数据,并简要说明各自的优点.
解:法一:从题目中的数不易直接看出各自的分布情况,为此,我们将以上数据用条形统计图表示.如图:
法二:茎叶图如图,两竖线中间的数字表示甲、乙销售额的十位数,两边的数字表示甲、乙销售额的个位数.
从法一可以看出条形统计图能直观地反映数据分布的大致情况,并且能够清晰地表示出各个区间的具体数目;从法二可以看出,用茎叶图表示有关数据,对数据的记录和表示都带来方便.
18.(本小题满分12分)据报道,某公司的33名职工的月工资(单位:元)如下:
职务 董事长 副董事长 董事 总经理 经理 管理员 职员
人数 1 1 2 1 5 3 20
工资 5500 5000 3500 3000 2500 2000 1500
(1)求该公司职工月工资的平均数、中位数、众数.
(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是什么?(精确到元)
(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.
解:(1)平均数是=1500+
≈1500+591=2091(元).
中位数是1500元,众数是1500元.
(2)新的平均数是′=1500+
≈1500+1788=3288(元).
中位数是1500元,众数是1500元.
(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.
19.(本小题满分13分)为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频率分布表和频数分布直方图,解答下列问题:
分组 频数 频率
[50.5,60.5) 4 0.08
[60.5,70.5) 0.16
[70.5,80.5) 10
[80.5,90.5) 16 0.32
[90.5,100.5)
合计 50
(1)完成频率分布表的空格(将答案直接填在表格内);
(2)补全频数分布直方图;
(3)若成绩在[75.5,85.5)分的学生为二等奖,问获得二等奖的学生约有多少人?
解:(1)
分组 频数 频率
[50.5,60.5) 4 0.08
[60.5,70.5) 8 0.16
[70.5,80.5) 10 0.20
[80.5,90.5) 16 0.32
[90.5,100.5) 12 0.24
合计 50 1.00
(2)频数分布直方图如图所示.
(3)成绩在[75.5,80.5)分的学生占[70.5,80.5)分的学生的,因为成绩在[70.5,80.5)分的学生频率为0.2,所以成绩在[75.5,80.5)分的学生频率为0.1.成绩在[80.5,85.5)分的学生占[80.5,90.5)分的学生的.因为成绩在[80.5,90.5)分的学生频率为0.32,所以成绩在[80.5,85.5)分的学生频率为0.16.所以成绩在[75.5,85.5)分的学生频率为0.26.由于有900名学生参加了这次竞赛,所以该校获得二等奖的学生约为0.26×900=234(人).
20.(本小题满分13分)现有A,B两个班级,每个班级各有45名学生参加测验,参加的每名学生可获得0分、1分、2分、3分、4分、5分、6分、7分、8分、9分这几种不同分值中的一种,A班的测试结果如下表所示:
分数(分) 0 1 2 3 4 5 6 7 8 9
人数(名) 1 3 5 7 6 8 6 4 3 2
B班的成绩如图所示.
(1)你认为哪个班级的成绩比较稳定?
(2)若两班共有60人及格,则参加者最少获得多少分才可能及格?
解:(1)A班成绩的平均数为:
A=×(0×1+1×3+2×5+3×7+4×6+5×8+6×6+7×4+8×3+9×2)≈4.53(分),
所以A班成绩的方差为:
=×[(0-A)2+3×(1-A)2+5×(2-A)2+7×(3-A)2+6×(4-A)2+8×(5-A)2+6×(6-A)2+4×(7-A)2+3×(8-A)2+2×(9-A)2]≈4.96(分2).
B班成绩的平均数为:
B=×(1×3+2×3+3×8+4×18+5×10+6×3)≈3.84(分),
所以B班成绩的方差为:
=×[3×(1-B)2+3×(2-B)2+8×(3-B)2+18×(4-B)2+10×(5-B)2+3×(6-B)2]≈1.54(分2).
因为>,即B班成绩的方差较小,所以B班的成绩较为稳定.
(2)由图表可知,两个班级1分以下(含1分)的学生共有7人,2分以下(含2分)的学生共有15人,3分以下(含3分)的学生共有30人,4分以下(含4分)的学生共有54人,5分以下(含5分)的学生共有72人.
因为两个班级及格的总人数为60人,而4分以下的共有54人,5分以下的共有72人,所以参加者最少获得4分才可能及格.
21.(本小题满分13分)对某电子元件进行寿命追踪调查,情况如下:
寿命(h) [100,200) [200,300) [300,400) [400,500) [500,600]
个数 20 30 80 40 30
(1)列出频率分布表;
(2)画出频率分布直方图;
(3)估计电子元件寿命在100 h~400 h以内的频率;
(4)估计电子元件寿命在400 h以上的频率.
解:(1)样本频率分布表如下:
寿命(h) 频数 频率
[100,200) 20 0.10
[200,300) 30 0.15
[300,400) 80 0.40
[400,500) 40 0.20
[500,600] 30 0.15
合计 200 1.00
(2)频率分布直方图如图所示:
(3)电子元件寿命在100 h~400 h以内的频数为130,
则频率为=0.65.
(4)寿命在400 h以上的电子元件的频数为70,
则频率为=0.35.1.在用样本频率估计总体分布的过程中,下列说法正确的是( )
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确
解析:选C.样本容量越大,估计越接近于总体,因而越精确.
2.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为( )
A.5 B.15
C.2 D.8
解析:选A.频数=20×0.25=5.
3.容量为100的样本按从小到大的顺序分为8组,如表:
组号 1 2 3 4 5 6 7 8
频数 10 13 14 14 15 13 12 9
第3组的频数与频率分别是 ( )
A.14,0.14 B.0.14,14
C.,0.14 D.,
解析:选A.由表可知第3组的频数为14,频率为=0.14.
4.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95).由此得到的频率分布直方图,如图所示,则这20名工人中一天生产该产品数量在[55,75)的人数是______.
解析:由频率分布直方图知[55,75)之间的频率为0.4+0.25=0.65,故[55,75)之间的人数为0.65×20=13.
答案:13
一、选择题
1.一个容量为100的样本,其数据的分组与各组的频数如下:
组别 (0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70]
频数 12 13 24 15 16 13 7
则样本数据落在(10,40]上的频率为( )
A.0.13 B.0.39
C.0.52 D.0.64
解析:选C.由列表可知样本数据落在(10,40]上的频数为52,故其频率为0.52.
2.如图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知( )
A.甲运动员的成绩好于乙运动员
B.乙运动员的成绩好于甲运动员
C.甲、乙两名运动员的成绩没有明显的差异
D.甲运动员的最低得分为0分
解析:选A.从这个茎叶图可以看出甲运动员的得分大致对称,平均得分及中位数都是30多分;乙运动员的得分除一个52外,也大致对称,平均得分及中位数都是20多分.因此,甲运动员发挥比较稳定,总体得分情况比乙好.
3.将一个容量为50的样本数据分组后,组距与频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),6;[30.5,33.5],3.则估计小于30的数据大约占总体的( )
A.94% B.6%
C.92% D.12%
解析:选C.由样本的频率分布估计总体的分布.小于30.5的样本频数为3+8+9+11+10+6=47,所以其频率为=94%.小于27.5的样本频数为3+8+9+11+10=41,所以其频率为=82%.因此小于30的样本频率应在82%~94%之间,满足条件的只有92%,故正确答案为C.
4.(2010年高考福建卷)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
解析:选A.按照从小到大的顺序排列为
87,89,90,91,92,93,94,96.
∵有8个数据,∴中位数是中间两个的平均数:=91.5,
平均数:=91.5,故选A.
5.某工厂对一批产品进行了抽样检测,右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )
A.90 B.75
C.60 D.45
解析:选A.产品净重小于100克的频率为0.1+0.2=0.3,已知样本中产品净重小于100克的个数是36,设样本容量为n,则=0.3,所以n=120.产品净重大于或等于98克并且小于104克的频率为0.2+0.3+0.25=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.
6.某校高中研究性学习小组对本地区2007年至2009年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图,根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭( )
A.82万盒 B.83万盒
C.84万盒 D.85万盒
解析:选D.三年中该地区每年平均销售盒饭=85(万盒).故选D.
二、填空题
7.一个容量为n的样本,分成若干组,已知某数的频数和频率分别为50和0.25,则n=________.
解析:=0.25,∴n=200.
答案:200
8.(2010年高考天津卷)甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.
解析:甲=.
∴甲=24,同理可求乙=23.
答案:24 23
9.容量为100的样本的部分频率分布直方图如图所示,试根据图形中的数据填空.
(1)样本数据落在范围[6,10)内的频率为________;
(2)样本数据落在范围[10,14)内的频数为________;
(3)总体在[2,10)内的频率约为________.
解析:样本数据在[6,10)内的频率为0.32;
在[10,14)内的频数为100×0.36=36;
总体在[2,10)内的频率约为0.08+0.32=0.40.
答案:0.32 36 0.40
三、解答题
10.某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:
甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50;
乙的得分:8,13,14,16,23,26,28,33,38,39,51.
(1)画出甲、乙两名运动员得分数据的茎叶图;
(2)根据茎叶图分析甲、乙两名运动员的水平.
解:(1)作出茎叶图如下图:
(2)由上面的茎叶图可以看出,甲运动员的得分情况是大致对称的,中位数是36分;乙运动员的得分情况除一个特殊得分外,也大致对称,中位数是26分.因此甲运动员的发挥比较稳定,总体得分情况比乙运动员好.
11.为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:千克),并将所得数据分组,画出频率分布直方图(如图所示),
(1)求出各组相应的频率;
(2)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数.
解:(1)由频率分布直可得下表
分组 频率
[1.00,1.05) 0.05
[1.05,1.10) 0.20
[1.10,1.15) 0.28
[1.15,1.20) 0.30
[1.20,1.25) 0.15
[1.25,1.30] 0.02
(2)由分层抽样中每个个体被抽到的概率相同知:设水库中鱼的总条数为N,则=,即N=2000,故水库中鱼的总条数约为2000条.
12.(2010年高考安徽卷)某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
(1)完成频率分布表;
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.
请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
解:(1)频率分布表:
分组 频数 频率
[41,51) 2
[51,61) 1
[61,71) 4
分组 频数 频率
[71,81) 6
[81,91) 10
[91,101) 5
[101,111] 2
(2)频率分布直方图如图所示:
(3)答对下述两条中的一条即可:
①该市一个月中空气污染指数有2天处于优的水平,占当月天数的;有26天处于良的水平,占当月天数的;处于优或良的天数为28,占当月天数的.说明该市空气质量基本良好.
②轻微污染有2天,占当月天数的;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数17,占当月天数的,超过50%,说明该市空气质量有待进一步改善.1.为了了解高一年级学生的视力情况,特别是近视率问题,抽测了其中100名同学的视力情况.在这个过程中,100名同学的视力情况(数据)是( )
A.总体 B.个体
C.总体的一个样本 D.样本容量
解析:选C.100名同学的视力情况(数据)是从总体中抽取的一部分个体所组成的集合,所以是总体的一个样本,故选C.
2.已知一组数据20,30,40,50,50,60,70,80,则其平均数、中位数和众数的大小关系是( )
A.平均数=中位数>众数
B.平均数<中位数=众数
C.平均数<中位数<众数
D.平均数=中位数=众数
解析:选D.==50,中位数为50,众数也为50.
3.样本101,98,102,100,99的标准差为( )
A. B.0
C.1 D.2
解析:选A.样本平均数=100,方差为s2=2,
∴标准差s=,故选A.
4.为了了解参加运动会的2000名运动员的年龄情况,从中抽取20名运动员的年龄进行统计分析.就这个问题,下列说法中正确的有________.
①2000名运动员是总体;
②每个运动员是个体;
③所抽取的20名运动员是一个样本;
④样本容量为20.
解析:①2000名运动员不是总体,2000名运动员的年龄才是总体;②每个运动员的年龄是个体;③20名运动员的年龄是一个样本.
答案:④
一、选择题
1.(2011年抚顺高一检测)某学校为了解高一800名新入学同学的数学学,从中随机抽取100名同学的中考数学成绩进行分析,在这个问题中,下列说法正确的是( )
A.800名同学是总体 B.100名同学是样本
C.每名同学是个体 D.样本容量是100
解析:选D.据题意总体是指800名新入学同学的中考数学成绩,样本是指抽取的100名同学的中考数学成绩,个体是指每名同学的中考数学成绩,样本容量是100,故只有D正确.
2.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是( )
A.85、85、85 B.87、85、86
C.87、85、85 D.87、85、90
解析:选C.从小到大列出所有数学成绩:75,80,85,85,85,85,90,90,95,100,观察知众数和中位数均为85,计算得平均数为87.
3.奥运会体操比赛的计分规则为:当评委亮分后,其成绩先去掉一个最高分,去掉一个最低分,再计算剩下分数的平均值,这是因为( )
A.减少计算量 B.避免故障
C.剔除异常值 D.活跃赛场气氛
解析:选C.因为在体操比赛的评分中使用的是平均分,记分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量公平.
4.(2010年高考山东卷)样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为( )
A. B.
C. D.2
解析:选D.由样本平均值为1,知(a+0+1+2+3)=1,故a=-1.
∴样本方差s2=[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=(4+1+0+1+4)=2.
5.(2011年太原高一检测)某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是( )
A.3.5 B.-3
C.3 D.-0.5
解析:选B.少输入90,=3,平均数少3,求出的平均数减去实际的平均数等于-3.
6.一个样本a,3,5,7的平均数是b,且a、b是方程x2-5x+4=0的两根,则这个样本的方差是( )
A.3 B.4
C.5 D.6
解析:选C.x2-5x+4=0的两根是1,4.
当a=1时,a,3,5,7的平均数是4;当a=4时,a,3,5,7的平均数不是1.
∴a=1,b=4.则方差s2=×[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5.
二、填空题
7.一个样本按从小到大的顺序排列为10,12,13,x,17,19,21,24,其中位数为16,则x=________.
解析:由中位数的定义知=16,∴x=15.
答案:15
8.若40个数据的平方和是56,平均数是,则这组数据的方差是________,标准差是________.
解析:设40个数据xi(i=1,2,…,40),平均数为.
则s2=×[(x1-)2+(x2-)2+…+(x40-)2]
=(x+x+…+x-402)
=×(56-40×)
=0.9.
∴s===.
答案:0.9
9.甲、乙两人在相同条件下练习射击,每人打5发子弹,命中环数如下:
甲 6 8 9 9 8
乙 10 7 7 7 9
则两人射击成绩的稳定程度是________.
解析:∵甲=8,乙=8,而s=1.2,s=1.6,s答案:甲比乙稳定
三、解答题
10.从高一(1)班和高一(2)班中分别抽取(随机)10名学生的数学成绩如下(单位:分)
高一(1)班:76 90 84 86 81 87 86 82 85 83
高一(2)班:82 84 85 89 79 80 91 89 79 74
试求出各班10名同学成绩的中位数、平均数、方差.
解:给两组数字排序:
高一(1)班:76 81 82 83 84 85 86 86 87 90
高一(2)班:74 79 79 80 82 84 85 89 89 91
由此得中位数:高一(1)班:84.5分;高一(2)班:83分.
高一(1)班:
平均数:
1=×(76+81+82+83+84+85+86+86+87+90)=85+×(-9-4-3-2-1+0+1+1+2+5)
=85-×10=84(分).
方差:
s=×[(76-84)2+(81-84)2+(82-84)2+(83-84)2+(84-84)2+(85-84)2+(86-84)2+(86-84)2+(87-84)2+(90-84)2]
=×(64+9+4+1+0+1+4+4+9+36)
=×132=13.2.
高一(2)班:
平均数:
2=×(74+79+79+80+82+84+85+89+89+91)
=82+(-8-3-3-2+0+2+3+7+7+9)
=82+×12=83.2(分).
方差:
s=×[(74-83.2)2+(79-83.2)2+(79-83.2)2+(80-83.2)2+(82-83.2)2+(84-83.2)2+(85-83.2)2+(89-83.2)2+(89-83.2)2+(91-83.2)2]
=×263.6=26.36.
11.某公司销售部有销售人员15人,销售部为了制定某种商品的月销售定额,统计了这15人某月的销售量如下:
销售量(件) 1800 510 250 210 150 120
人数 1 1 3 5 3 2
(1)求这15位销售人员该月销售量的平均数、中位数及众数;
(2)假设销售部负责人把月销售额定为320件,你认为是否合理,为什么?如不合理,请你制定一个较为合理的销售定额.
解:(1)平均数为(1800×1+510×1+250×3+210×5+150×3+120×2)=320(件),中位数为210件,众数为210件.
(2)不合理,因为15人中有13人的销售量未达到320件,也就是说,虽然320是这一组数据的平均数,但它却不能反映全体销售人员的销售水平.销售额定为210件更合理些,这是由于210既是中位数,又是众数,是大部分人都能达到的定额.
12.如图是甲、乙两人在一次射击比赛中中靶的情况(击中靶中心的圆面为10环,靶中各数字表示该数字所在圆环被击中所得的环数),每人射击了6次.
(1)请用列表法将甲、乙两人的射击成绩统计出来;
(2)请你用学过的统计知识,对甲、乙两人这次的射击情况进行比较.
解:(1)
环数 6 7 8 9 10
甲命中次数 2 2 2
乙命中次数 1 3 2
(2)甲=9环,乙=9环,s=,s=1,
因为甲=乙,s<s,
所以甲与乙的平均成绩相同,但甲的发挥比乙稳定.1.下列抽样方法是简单随机抽样的是( )
A.某工厂从老年、中年、青年职工中按2∶5∶3的比例选取职工代表
B.从实数集中逐个抽取10个数分析能否被2整除
C.福利彩票用摇奖机摇奖
D.规定凡买到明信片的最后几位号码是“6637”的人获三等奖
解析:选C.简单随机抽样要求总体个数有限,从总体中逐个进行不放回抽样,每个个体有相同的可能性被抽到.分析可知选C.
2.在简单随机抽样中,某一个个体被抽中的可能性( )
A.与第几次抽样有关,第一次被抽中的可能性要大些
B.与第几次抽样无关,每次被抽中的可能性都相等
C.与第几次抽样有关,最后一次被抽中的可能性要大些
D.与第几次抽样无关,最后一次被抽中的可能性要大些
解析:选B.简单随机抽样是一种等可能性抽样,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.
3.下列说法中正确的是( )
A.在抽签法抽样中,由于是随机抽取的,所以每次抽取时每个个体必定有相同的可能性被抽到
B.随机数表中每个位置出现各数字的可能性相同,因而随机数表是惟一的
C.当总体容量较大时,不可用简单随机抽样方法抽取样本
D.要考察总体情况,一定要把总体中每个个体都考察一遍
答案:A
4.福利彩票是从1~36共36个号码中选出7个号码来按规则确定中奖情况,这种从36个号码中选出7个的抽样方法宜采用________.
解析:当总体的个数不多时,宜采用抽签法,因为它简便易行.
答案:抽签法
一、选择题
1.下列问题中,最适合用简单随机抽样方法抽样的是( )
A.某电影院有32排座位,每排有40个座位,座位号是1~40.有一次报告会坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈
B.从10台冰箱中抽出3台进行质量检验
C.某学校有在编人员160人.其中行政人员16人,教师112人,后勤人员32人.教育部门为了解学校机构改革意见,要从中抽取一个容量为20的样本
D.某乡农田有山地8000亩,丘陵12000亩,平地24000亩,洼地4000亩,现抽取农田480亩估计全乡农田平均产量
解析:选B.根据简单随机抽样的特点进行判断.
A的总体容量较大,用简单随机抽样法比较麻烦;B的总体容量较小,用简单随机抽样法比较方便;C由于学校各类人员对这一问题的看法可能差异很大,不宜采用简单随机抽样法;D总体容量较大,且各类田地的产量差别很大,也不宜采用简单随机抽样法.
2.关于简单随机抽样的特点,有以下几种说法,其中不正确的是( )
A.要求总体的个数有限
B.从总体中逐个抽取
C.它是一种不放回抽样
D.每个个体被抽到的机会不一样,与先后顺序有关
解析:选D.简单随机抽样除具有A、B、C三个特点外,它还是等可能抽样,每个个体被抽到的机会相等,与先后顺序无关.
3.抽签法中确保样本具有代表性的关键是( )
A.制签 B.搅拌均匀
C.逐一抽取 D.抽取不放回
解析:选B.在数理统计里,为了使样本具有较好的代表性,设计抽样方法时,最重要的是将总体“搅拌均匀”,使每个个体有同样的机会被抽到.而抽签法是简单随机抽样,因此在给总体标号后,一定要搅拌均匀.
4.某工厂的质检人员对生产的100件产品,采用随机数法抽取10件检查,对100件产品采用下面的编号方法
①1,2,3,…,100;
②001,002,…,100;
③00,01,02,…,99;
④01,02,03,…,100.
其中正确的序号是( )
A.②③④ B.③④
C.②③ D.①②
解析:选C.根据随机数表的步骤可知,①④编号位数不统一.
5.下列抽样试验中,适合用抽签法的有( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
解析:选B.A、D中个体的总数较大,不适于用抽签法;C中甲、乙两厂生产的两箱产品性质可能差别较大,因此未达到搅拌均匀的条件,也不适于用抽签法;B中个体数和样本容量均较小,且同厂生产的两箱产品,性质差别不大,可以看成是搅拌均匀了.
6.从总数为N的一批零件中抽取一个容量为30的样本,若每个零件被抽取的可能性为25%,则N为( )
A.200 B.150
C.120 D.100
解析:选C.由=25%,得N=120,故选C.
二、填空题
7.下列调查中属于抽样调查的是________.
(1)每隔5年进行一次人口普查;(2)某商品的质量优劣;
(3)某报社对某个事件进行舆论调查;(4)高考考生的身体检查.
解析:由(1)(4)都是普查,都不正确,(2)(3)是抽样调查.
答案:(2)(3)
8.一个布袋中有6个同样质地的小球,从中不放回地抽取3个小球,则某一特定小球入样的可能性估计是________;第三次抽取时,每个小球入样的可能性估计是________.
解析:因为简单随机抽样时每个个体入样的可能性均为,所以某一特定小球入样的可能性是.此抽样是不放回抽样,所以第一次抽取时,每个小球入样的可能性均为;第二次抽取时,剩余5个小球中每个小球入样的可能性均为;第三次抽取时,剩余4个小球中每个小球入样的可能性均为.
答案:
9.一个总体的60个个体编号为00,01,…,59,现需从中抽取一容量为8的样本,请从随机数表的倒数第5行(下表为随机数表的最后5行)第11列开始,向右读取,直到取足样本,则抽取样本的号码是________.
解析:由随机数法的抽取规则可得.
答案:18,00,38,58,32,26,25,39
三、解答题
10.为了缓解城市的交通拥堵情况,某大城市准备出台限制私家车的政策,为此要进行民意调查,某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果会怎样?
解:一个城市的交通状况的好坏将直接影响着生活在这个城市中的每一个人,关系到每个人的利益.为了调查这个问题,在抽样时,应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该市的所有市民进行随机地抽样调查,不要只关注到拥有私家车的市民.
11.假设要从高三年级全体学生450人中随机抽出20人参加一项活动,请分别用抽签法和随机数表法抽出人选,写出抽取过程.
解:抽签法:先把450名同学的学号写在相同小纸片上,揉成大小相同的小球,放在一个不透明的袋子中,充分搅拌后,再从中逐个抽出20个小球,这样就抽出20人参加活动.
随机数表法:第一步,先将450人编号,可以编为000,001,002,…,449;第二步,在随机数表中任取一个数,例如选出第6行的第8个数4;第三步,从选定的数字开始向右读,每次读3个数字,组成一个三位数,把小于或等于449的三位数依次取出,直到取完20个号码,与这20个号码相应的学生去参加活动.
12.一个学生在一次竞赛中要回答的8道题是这样产生的:从15道物理题中随机抽取3道;从20道化学题中随机抽取3道;从12道生物题中随机抽取2道.请选用合适的方法确定这个学生所要回答的三门学科的题的序号(物理题的编号为1~15,化学题的编号为16~35,生物题的编号为36~47).
解:可用抽签法确定,步骤如下:
第一步:将物理、化学、生物题依次编号为1~47,分别写到大小、形状都相同的号签上,并将物理、化学、生物题的号签分别放在三个不透明的容器中,都搅拌均匀;
第二步:分别从装有物理、生物、化学题的容器中逐个抽取3个、3个、2个号签,并记录所得号签的编号,这便是所要回答的问题的序号.1.(2011年龙岩高一检测)一个年级有12个班,每个班有50名同学,随机编号1,2,…,50,为了了解它们在课外的兴趣,要求每班第40号同学留下来进行问卷调查,这里运用的抽样方法是( )
A.抽签法 B.有放回抽样
C.随机数表法 D.系统抽样
解析:选D.根据抽样方法的特点可知,该抽样方法为系统抽样.
2.下列抽样试验中,最适宜用系统抽样法的是( )
A.某市的4个区共有2000名学生,这4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样
B.从某厂生产的2000个电子元件中随机抽取5个入样
C.从某厂生产的2000个电子元件中随机抽取200个入样
D.从某厂生产的20个电子元件中随机抽取5个入样
解析:选C.A总体有明显层次,不适宜用系统抽样法;B样本容量很小,适宜用随机数法;D总体容量很小,适宜用抽签法.
3.已知某单位有职工120人,其中男职工90人,现采用分层抽样(按男、女分层)抽取一个样本,若样本中有27名男职工,则样本容量为( )
A.30 B.36
C.40 D.无法确定
解析:选B.因为分层抽样中各层中的抽样比是相等的,由抽样比为27∶90=3∶10,所以样本容量为120×=36.
4.(2011年高考山东卷)某高校甲、乙、丙、丁四个专业分别有150、150、400、300名学生,为了解学生的就业倾向,用分层抽样的方法从该校这四个专业共抽取40名进行调查,应在丙专业抽了的学生人数为________.
解析:由题意知,抽取比例为3∶3∶8∶6,所以应在丙专业抽取的学生人数为40×=16.
答案:16
一、选择题
1.某市场想通过检查发票及销售记录的2%来快速估计每月的销量总额.采取如下方法:从某本发票的存根中随机抽一张,如15号,然后按顺序往后将65号,115号,165号,…抽出,发票上的销售额组成一个调查样本.这种抽取样本的方法是( )
A.抽签法 B.随机数法
C.系统抽样法 D.其他的抽样方法
解析:选C.上述抽样方法是将发票平均分成若干组,每组50张.从第一组中抽取15号,以后各组抽取15+50n(n∈N+)号,符合系统抽样的特点.故选C.
2.(2010年高考湖北卷)将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为( )
A.26,16,8 B.25,17,8
C.25,16,9 D.24,17,9
解析:选B.由题意知间隔为=12,故抽到的号码为12k+3(k=0,1,…,49),列出不等式可解得:第Ⅰ营区抽25人,第Ⅱ营区抽17人,第Ⅲ营区抽8人.
3.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上(包括50岁)的人,用分层抽样的方法从中抽20人,各年龄段分别抽取的人数为( )
A.7,5,8 B.9,5,6
C.7,5,9 D.8,5,7
解析:选B.由于样本容量与总体个体数之比为=,故各年龄段抽取的人数依次为45×=9(人),25×=5(人),20-9-5=6(人).
4.(2011年济宁高二检测)某社区有500户家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取一个容量为100的样本,记作①;某学校高一年级有12名女排运动员,要从中选出3人调查学习负担情况,记作②.那么完成上述两项调查应采用的抽样方法是( )
A.①用简单随机抽样法,②用系统抽样法
B.①用分层抽样法,②用简单随机抽样法
C.①用系统抽样法,②用分层抽样法
D.①用分层抽样法,②用系统抽样法
解析:选B.对于有关抽样问题,应该准确领会各种抽样方法的含义,视具体问题特点灵活选择相应的抽样方法.①中的500户家庭收入有高收入、中等收入、低收入三个层次,个体差异明显,故宜用分层抽样;②中个体数较小,故宜用简单随机抽样.
5.(2010年高考四川卷)一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是( )
A.12,24,15,9 B.9,12,12,7
C.8,15,12,5 D.8,16,10,6
解析:选D.由题意,各种职称的人数比为160∶320∶200∶120=4∶8∶5∶3,所以抽取的具有高、中、初级职称的人数和其他人员的人数分别为40×=8,40×=16,40×=10,40×=6.
6.从2011名学生志愿者中选取50名组成一个志愿团,若采用下面的方法选取:先用简单随机抽样从2011人中剔除11人,余下的2000人再按系统抽样的方法进行选取,则每人入选的机会( )
A.不全相等 B.均不相等
C.都相等 D.无法确定
解析:选C.系统抽样是公平的,所以每个个体被抽到的可能性都相等,与是否剔除无关.
二、填空题
7.某小礼堂有25排座位,每排20个座位.一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的25名学生进行测试,这里运用的是________抽样方法.
解析:间隔相同,符合系统抽样的定义.
答案:系统
8.某中学高一年级有400人,高二年级有320人,高三年级有280人.若该中学提取一个容量为n的样本,使每个人被抽到的可能性均为,则n=________.
解析:根据总体中个体数为N,从中逐个抽取容量为n的样本,则每个个体被抽到的可能性均为可知=,由此可得n=200.
答案:200
9.(2010年高考安徽卷)某地有居民100000户,其中普通家庭99000户,高收入家庭1000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是__________.
解析:∵990∶99000=1∶100,∴低收入家庭中拥有3套或3套以上住房的大约为50×100=5000(户).
又∵100∶1000=1∶10,∴高收入家庭中拥有3套或3套以上住房的大约为70×10=700(户).
∴约有5000+700=5700(户).故=5.7%.
答案:5.7%
三、解答题
10.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
解:(1)设登山组人数为x,游泳组中,青年人、中年人、老年人各占比例分别为a、b、c,则有
=47.5%,=10%,
解得b=50%,c=10%.
故a=100%-50%-10%=40%,
即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%.
(2)游泳组中,抽取的青年人数为200××40%=60(人);抽取的中年人数为200××50%=75(人);抽取的老年人数为200××10%=15(人).
11.下面给出某村委调查本村各户收入情况所作的抽样,阅读并回答问题:
本村人口:1200人,户数300,每户平均人数4人;
应抽户数:30户;
抽样间隔:=40;
确定随机数字:取一张人民币,编码的后两位数为12;
确定第一样本户:编码的后两位数为12的户为第一样本户;
确定第二样本户:12+40=52,52号为第二样本户;
……
(1)该村委采用了何种抽样方法?
(2)抽样过程中存在哪些问题?并修改;
(3)何处用的是简单随机抽样?
解:(1)系统抽样.
(2)本题是对某村各户进行抽样,而不是对某村人口抽样,抽样间隔为:=10,其他步骤相应改为确定随机数字:取一张人民币,编码的后两位数为12,确定第一样本户:编号为12的户为第一样本户;确定第二样本户:12+10=22,22号为第二样本户.
(3)确定随机数字用的是简单随机抽样,取一张人民币,编码的后两位数为12.
12.某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,职员20人.上级机关为了了解政府机构改革的意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施操作.
解:采用分层抽样方法.
抽取比例为:=,故:10×=2;70×=14;20×=4.
∴从副处级以上干部中抽取2人,从一般干部中抽取14人,从职员中抽取4人.
因副处级以上干部与职员人数都较少,他们分别按1~10编号与1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人采用00,01,…,69编号,然后用随机数法抽取14人.1.下列关系中为相关关系的有( )
①学生的学习态度和学习成绩之间的关系;
②教师的执教水平与学生的学习成绩之间的关系;
③学生的身高与学生的学习成绩之间的关系;
④家庭的经济条件与学生的学习成绩之间的关系.
A.①② B.①③
C.②③ D.②④
解析:选A.由相关关系的定义知,①②为相关关系,③④无相关关系.
2.在对两个变量x,y进行线性回归分析时有下列步骤:
①对所求出的回归方程作出解释;
②收集数据(xi,yi),i=1,2,…,n;
③求回归直线方程;
④求相关系数;
⑤根据所搜集的数据绘制散点图.
如果根据可靠性要求能够作出变量x,y具有线性相关结论,则在下列操作顺序中正确的是( )
A.①②⑤③④ B.③②④⑤①
C.②④③①⑤ D.②⑤④③①
解析:选D.由线性回归分析的步骤可知.
3.(2011年高考山东卷)某产品的广告费用x与销售额y的统计数据如下表
广告费用x(万元) 4 2 3 5
销售额y(万元) 49 26 39 54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
解析:选B.由表可计算==,==42,因为点(,42)在回归直线=x+上,且为9.4,所以42=9.4×+,解得=9.1,故回归方程为=9.4x+9.1,令x=6得=65.5,选B.
4.下列关系中,属于相关关系的是________.
①正方形的边长与面积之间的关系;
②农作物的产量与施肥量之间的关系;
③人的身高与年龄之间的关系;
④降雪量与交通事故的发生率之间的关系.
解析:在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.
答案:②④
一、选择题
1.下列变量之间的关系是函数关系的是( )
A.已知二次函数y=ax2+bx+c,其中a、c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4ac
B.光照时间和果树亩产量
C.降雪量和交通事故发生率
D.父母的身高和子女的身高
解析:选A.B、C、D选项是相关关系.故选A.
2.试从下面四个图中的点在散点图上的分布状态,直观上初步判断两个变量之间有线性相关关系的是( )
解析:选C.在图A中点的分布毫无规则,横轴、纵轴表示的两个变量之间的相关程度很小.在图B中所有的点严格地分布在一条直线上,横轴、纵轴表示的两个量之间有确定的关系——函数关系.在图C中,点的分布基本上集中在一个带状区域内,横轴、纵轴表示的两个变量之间有相关关系——当一个变量变化时,另一个变量的值虽然不能完全确定,但大体上总是落在带状区域内,这时我们可以寻找一条合适的直线来近似表示两个变量之间的关系(如图中的直线),即两个变量之间的关系可以近似地表示成线性关系,因此这两个变量具有线性相关关系.图D与图C类似,点的分布基本上也集中在由某条曲线两侧组成的带状区域内,因此横轴、纵轴表示的两个变量也有相关关系,只是它是非线性相关关系.
3.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
解析:选C.图(1)中的数据y随着x的增大而减小,因此变量x与变量y负相关;图(2)中的数据v随着u的增大而增大,因此u与v正相关.
4.(2010年高考湖南卷)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )
A.y=-10x+200 B.y=10x+200
C.y=-10x-200 D.y=10x-200
解析:选A.可判断B、D正相关,C不合实际意义.
5.两个相关变量满足如下关系:
x 10 15 20 25 30
y 1003 1005 1010 1011 1014
两变量的回归直线方程为( )
A.y=0.56x+997.4 B.y=0.63x-231.2
C.y=50.2x+501.4 D.y=60.4x+400.7
解析:选A.b==0.56,
a=-b=997.4,
所以回归直线方程为=0.56x+997.4.所以选A.
6.在2011年3月15日那天,济宁市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商品的售价x元与销售量y件之间的一组数据如下表所示:
价格x 9 9.5 10 10.5 11
销售量y 11 10 8 6 5
由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是:y=-3.2x+a,则a=( )
A.24 B.35.6
C.40 D.40.5
解析:选C.易求==10,
==8,
∴y=-3.2x+a一定过(10,8),
∴8=-3.2×10+a,∴a=40.
二、填空题
7.下列说法:
①回归方程适用于一切样本和总体;
②回归方程一般都有局限性;
③样本取值的范围会影响回归方程的适用范围;
④回归方程得到的预测值是预测变量的精确值.
正确的是________(将你认为正确的序号都填上).
解析:样本或总体具有线性相关关系时,才可求回归方程,而且由回归方程得到的函数值是近似值,而非精确值,因此回归方程有一定的局限性.所以①④错.
答案:②③
8.(2010年高考广东卷)某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:
年份 2005 2006 2007 2008 2009
收入x 11.5 12.1 13 13.3 15
支出Y 6.8 8.8 9.8 10 12
根据统计资料,居民家庭年平均收入的中位数是______,家庭年平均收入与年平均支出有__________线性相关关系.
解析:2005~2009年居民家庭的年平均收入按从小到大排列依次为:11.5、12.1、13、13.3、15,由中位数定义知年平均收入的中位数是13万元.由统计资料可知家庭年平均收入与年平均支出具有正线性相关关系.
答案:13 正
9.正常情况下,年龄在18岁到38岁的人,体重y(kg)对身高x(cm)的回归方程为y=0.72x-58.2,张红同学(20岁)身高178 cm,她的体重应该在________kg左右.
解析:用回归方程对身高为178 cm的人的体重进行预测,当x=178时,y=0.72×178-58.2=69.96(kg).
答案:69.96
三、解答题
10.某调查机构为了了解某地区的家庭收入水平与消费支出的相关情况,抽查了多个家庭,根据调查资料得到以下数据:每户平均年收入为88000元,每户平均年消费支出为50000元,支出对于收入的回归系数为0.6.
(1)求支出对于收入的回归方程;
(2)年收入每增加100元,年消费支出平均增加多少元?
(3)若某家庭年消费支出为80000元,试估计该家庭的年收入为多少元?
解:(1)设年收入为x元,年支出为y元,知=88000元,=50000元,b=0.6,则a=-b=50000-0.6×88000=-2800.故支出对于收入的回归方程为y=0.6x-2800.
(2)年收入每增加100元,年消费支出平均增加60元.
(3)某家庭年消费支出为80000元,根据回归方程y=0.6x-2800,可得80000=0.6x-2800,解得x=138000,即估计该家庭的年收入为138000元.
11.要分析学生升学的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽选10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩,如下表所示:
x 63 67 45 88 81 71 52 99 58 76
y 65 78 52 82 92 89 73 98 56 75
表中x是学生入学成绩,y是高一年级期末考试数学成绩.
(1)画出散点图,若y与x有线性相关关系,求回归直线方程;
(2)若小明的入学成绩为80分,试预测他在高一年级期末考试中的数学成绩为多少?
解:(1)作出散点图如图所示,制表:
序号 x y x2 xy
1 63 65 3969 4095
2 67 78 4489 5226
3 45 52 2025 2340
4 88 82 7744 7216
5 81 92 6561 7452
6 71 89 5041 6319
7 52 73 2704 3796
8 99 98 9801 9702
9 58 56 3364 3248
10 76 75 5776 5700
合计 700 760 51474 55094
从散点图可以看出,这两个变量具有线性相关关系.
可求得=(63+67+…+76)=70,
=(65+78+…+75)=76,
∴b==≈0.766,
a≈76-0.766×70=22.38.
所求的线性回归方程为y=0.766x+22.38.
(2)若小明的入学成绩为80分,代入(1)中的回归直线方程得y=0.766×80+22.38≈84(分).
12.下面是某市一周内申请领结婚证的新郎和新娘的年龄,记为(y,x),其中新郎年龄为y,新娘年龄为x.
(37,30),(30,27),(65,56),(45,40),(32,30),(28,26),(45,31),(29,24),(26,23),(28,25),(42,29),(36,33),(33,29),(24,22),(32,33),(21,29),(37,46),(28,25),(33,34),(21,23),(24,23),(49,44),(28,29),(30,30),(24,25),(22,23),(68,60),(25,25),(32,27),(42,37),(24,24),(24,22),(28,27),(36,31),(23,24),(30,26).
以下考虑y关于x的回归问题:
(1)如果每个新郎和新娘都同岁,穿过这些点的回归直线的斜率和截距等于什么?
(2)如果每个新郎都比新娘大5岁,穿过这些点的回归直线的斜率和截距等于什么?
(3)如果每个新郎都比新娘大10%,穿过这些点的回归直线的斜率和截距等于什么?
(4)对上面的实际年龄求回归方程,你从新郎和新娘的年龄模型中可得出什么结论?
解:(1)当y=x时,易得b=1,a=0.
故回归直线的斜率为1,截距为0.
(2)当y=x+5时,易得b=1,a=5.
故回归直线的斜率为1,截距为5.
(3)当y=x(1+10%)时,易得b=1.1,a=0.
故回归直线的斜率为1.1,截距为0.
(4)回归直线为y=1.1x-1.1.
从回归方程可以看出,新郎的年龄一般比新娘的年龄大,尤其是在大龄夫妇中.