第二章综合素质检测
时间120分钟,满分150分。
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中只有一个是符合题目要求的)
1.要从容量为102的总体中用系统抽样法随机抽取一个容量为9的样本,则下列叙述正确的是( )
A.将总体分11组,每组间隔为9
B.将总体分9组,每组间隔为11
C.从总体中剔除2个个体后分11组,每组间隔为9
D.从总体中剔除3个个体后分9组,每组间隔为11
[答案] D
[解析] 102=9×11+3.所以需从总体中剔除3个个体后分9组,每组间隔为11.
2.中国跳水队被誉之为“梦之队”,是我们的骄傲.如图是2008年在水立方举行的奥运会上,七位评委为某位参加比赛的选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )
A.84,4.84 B.84,1.6
C.85,1.6 D.85,4
[答案] C
7 9
8 4 4 6 4 7
9 3
[解析] 去掉最低分79分和最高分93分,剩下5个有效分为84,84,86,84,87,其平均数为85,利用方差公式可求得方差为1.6.
3.某学校有职工140人,其中教师91人,教辅行政人员28人,总务后勤人员21人.为了解职工的某种情况,要从中抽取一个容量为20的样本.以下的抽样方法中,依简单随机抽样,系统抽样,分层抽样顺序的是( )
方法1:将140人从1~140编号,然后制作出编号为1~140的形状、大小相同的号签,并将号签放入同一箱子里进行均匀搅拌然后从中抽取20个号签,编号与号签相同的20个人被选出.
方法2:将140人分成20组,每组7人,并将每组7人按1~7编号,在第一组采用抽签法抽出k号(1≤k≤7),其余各组k号也被抽出,20个人被选出.
方法3:按20?140=1?7的比例,从教师中抽出13人,从教辅行政人员中抽出4人,从总务后勤人员中抽出3人.从各类人员中抽取所需人员时,均采用随机数表法,可抽到20人.
A.方法2,方法1,方法3
B.方法2,方法3,方法1
C.方法1,方法2,方法3
D.方法3,方法1,方法2
[答案] C
[分析] 结合简单随机抽样、系统抽样、分层抽样的含义判断.
[解析] 方法1是简单随机抽样,方法2是系统抽样,方法3是分层抽样,故选C.
4.小李晨练所花时间(单位:分钟)的样本数据分别为x,y,30,29,31.已知这组数据的平均数为30,方差为2,则|x-y|的值为( )
A.4 B.3 C.2 D.1
[答案] A
[解析] ∵=30,∴x+y=60,①
∵[(x-30)2+(y-30)2+0+1+1]=2,
∴(x-30)2+(y-30)2=8②
由①②解得或,
∴|x-y|=4.
5.某市为加强教师基础素质建设,开展了“每月多读一本书,提高自身修养”的读书活动.设该市参加读书活动的教师平均每人每年读书的本数为X(单位:本),按读书本数分下列四种情况统计:①0~10本;②11~20本;③21~30本;④30本以上.现有10000名教师参加了此项活动,如图是此次调查中某一项的流程图,其输出的结果为6200,则该市参加活动的教师中平均每年读书本数在0~20本的频率是( )
A.3800 B.6200 C.0.38 D.0.62
[答案] C
[解析] 由流程图知,当S>20时,S=S+1,故输出的S值应是10000名教师中读书本数大于20本的人数,故S=6200,
∴在0~20本之间的频率为=0.38.
6.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组上的直方图的高为h,则|a-b|=( )
A.hm B.
C. D.h+m
[答案] B
[解析] =h,∴|a-b|=组距==.
7.某地2008年第一季度应聘和招聘人数排行榜前5个行业的情况列表如下:
行业名称 计算机 机械 营销 物流 贸易
应聘人数 215830 200250 154676 74570 65280
行业名称 计算机 营销 机械 建筑 化工
招聘人数 124620 102935 89115 76516 70436
若用同一行业中应聘人数与招聘人数比值的大小来衡量该行业的就业情况,则根据表中数据,就业形势一定是( )
A.计算机行业好于化工行业
B.建筑行业好于物流行业
C.机械行业最紧张
D.营销行业比贸易行业紧张
[答案] B
[解析] 表中列出的是应聘人数的前5个行业和招聘人数的前5个行业.从表中可以看出:计算机行业录用率约占50%,而化工行业应聘人数排在贸易行业后面,故一定少于65280,故A错;机械行业招聘比.物流行业应聘人数74570,但招聘人数不详,只知小于70436,由此断定机械行业最紧张显然不合理,故C错;同理可知,由于贸易行业招聘人数不详,也不能断定营销行业一定会比贸易行业紧张,故D错;建筑行业实际招聘人数76516,而应聘人数小于65280,而物流行业招聘人数小于70436,应聘人数74570,由此可断定,建筑行业一定好于物流行业.
8.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( )
A.分层抽样法,系统抽样法
B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法
D.简单随机抽样法,分层抽样法
[答案] B
[解析] 定义法
借助于分层抽样、系统抽样和随机抽样的定义逐一分析.
9.下列说法:①一组数据不可能有两个众数;②一组数据的方差必须是正数;③将一组数据中的每一个数据都加上或减去同一常数后,方差恒不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率,其中错误的个数有( )
A.0个 B.1个 C.2个 D.3个
[答案] C
[解析] 因为一组数据的众数不惟一,所以①不对.一组数据的方差必须是非负数,②不对.根据方差的定义知③正确.根据频率分布直方图的概念知④正确.
10.若数据x1,x2,…,xn的平均数为,方差为s2,则3x1+5,3x2+5,…,3xn+5的平均数和标准差分别为( )
A.,s B.3+5,s
C.3+5,3s D.3+5,
[答案] C
[解析] ∵x1,x2,…,xn的平均数为,
∴3x1+5,3x2+5,…,3xn+5的平均数为3+5.
s′2=[(3x1+5-3-5)2+…+(3xn+5-3-5)2]
=×32[(x1-)2+…+(xn-)2]=9s2.
∴s′=3s.
11.一个容量为200的样本,其数据的分组与各组的频数如下表:
组别 (0,10] (10,20] (20,30] (30,40] (40,50]
频数 15 15 20 30 35
组别 (50,60] (60,70] (70,80] (80,90] (90,100]
频数 25 20 15 15 10
则样本数据落在(20,60]上的频率为( )
A.0.11 B.0.5 C.0.45 D.0.55
[答案] D
[解析] 由表知样本数据落在(20,60]上的频数为20+30+35+25=110,故其频率为=0.55.
12.已知某次期中考试中,甲、乙两组学生的数学成绩如下:
甲:88 100 95 86 95 91 84 74 92 83
乙:93 89 81 77 96 78 77 85 89 86
则下列结论正确的是( )
A.甲>乙,s甲>s乙 B.甲>乙,s甲C.甲<乙,s甲>s乙 D.甲<乙,s甲[答案] A
[解析] 甲=(88+100+…+92+83)=88.8;
乙=(93+89+…+89+86)=85.1,
s甲=
==7.08,
s乙=
==6.41,∴甲>乙,s甲>s乙.
二、填空题(本大题共4个小题,每小题4分,共16分,把正确答案填在题中横线上)
13.有A、B、C三种零件,其中B种零件300个,C种零件200个,采用分层抽样方法抽取一个容量为45的样本,A种零件被抽取20个,C种零件被抽取10个,三种零件总共有________个.
[答案] 900
[解析] 设A种零件x个,则x?200=20?10,∴x=400,故三种零件共有:400+300+200=900个.
14.如图是容量为100的样本的频率分布直方图,试根据图形中的数据填空.
(1)样本数据落在范围[6,10)内的频率为________;
(2)样本数据落在范围[10,14)内的频数为________;
(3)总体在[2,10)内的频率为________.
[答案] 0.32 36 0.40
[解析] (1)频率=×组距=0.08×4=0.32.
(2)频率=0.09×4=0.36,
频数=频率×样本容量=0.36×100=36.
(3)∵样本数据在[2,10)内的频率为
0.02×4+0.32=0.40.
∴由此估计总体在[2,10)内的频率为0.40.
15.若10个数据的平均数是3,标准差是2,则这10个数据的平方和是________.
[答案] 130
[解析] 由于S=2,故S2=4,
由于[(x1-3)2+(x2-3)2+…+(x10-3)2]=4,
故x+x+…+x-6(x1+x2+…+x10)+90=40,
所以x+x+…+x=-50+6×10×3=130.
16.(07·天津)从一堆苹果中任取了20个,并得到它们的质量(单位:克)数据分布表如下:
分组 [90,100) [100,110) [110,120) [120,130) [130,140) [140,150)
频数 1 2 3 10 3 1
则这堆苹果中,质量不小于120克的苹果数约占苹果总数的________%.
[答案] 70
[解析] 质量不小于120克的频数为14,∴频率为=70%.
三、解答题(本大题共6个大题,共74分,解答应写出文字说明,证明过程或演算步骤)
17.(本题满分12分)某学校从高一年级、高二年级、高三年级中采用分层抽样抽一个容量为45人的样本,其中高一年级被抽取20人,高三年级被抽取10人,高二年级共有学生300人,则此学校共有高中学生多少人?
[解析] 设此学校共有高中学生x人,则样本容量与总体容量的比值为.
∴×300=45-20-10,∴x=900
答:此学校共有高中学生900人.
18.(本题满分12分)甲、乙两运动员上赛季的得分如下图所示:
试比较两运动员的得分水平.
[解析] 从茎叶图可以看出,甲运动员的得分大致对称,平均得分、众数及中位数都是30多分.乙运动员的得分除一个51分外,也大致对称,平均得分、众数及中位数都是20多分.因此,甲运动员发挥比较稳定,总体得分情况比乙好.
19.(本题满分12分)抽样调查30个工人的家庭人均月收入,得到如下数据:(单位:元)
404 444 556 430 380 420 500 430 420 384 420 404 424 340 424 412 388 472 358 476 376 396 428 444 366 436 364 438 330 426
(1)取组距为60,起点为320,列出样本的频率分布表;
(2)画出频率分布直方图;
(3)根据频率分布直方图估计人均月收入在[440,500)中的家庭所占的百分比.
[解析] (1)
分组 频数 频率
[320,380) 6 0.20
[380,440) 18 0.60
[440,500) 4 0.13
[500,560) 2 0.07
合计 30 1.00
(2)频率分布直方图为:
(3)人均月收入落在[440,500)中的家庭所占的频率为:0.13=13%.所以估计人均月收入在[440,500)的家庭所占的百分比为13%.
20.(本题满分12分)要从某汽车厂生产的3000辆汽车中随机抽10辆进行测试.请选择合适的抽样方法,写出抽样过程.
[解析] 方法1:本题总体容量较大,样本容量较小,若用抽签法,制签复杂,将号签搅匀也不容易,可用随机数表法.
第一步,将3000辆汽车编号,号码是0001,0002,…,3000;
第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向,比如,选第10行第7个数“3”,向右读;
第三步,从数“3”开始向右读,每次读取4位,凡不在0001~3000中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到:0947,2796,1746,0962,2708,0273,1818,0792,1716,0310;
第四步,以上号码对应的10辆汽车就是要抽取的对象.
方法2:用系统抽样法.
S1 将3000辆汽车编号,号码是0001,0002,0003,…,3000;
S2 将编号按顺序每300个一段分作10段;
S3 在第一段0001,0002,…,0300这300个编号中,用简单随机抽样法抽出一个号码(如0068)作为起始号码;
S4 将编号为0068,0368,0668,0968,1268,1568,1868,2168,2468,2768的个体抽取组成样本.
[点评] (1)当总体容量较大,样本容量不大时,可用随机数表法抽取样本;(2)用随机数表法抽取样本,为了方便,在编号时需统一编号的位数.(3)用系统抽样法抽取样本时,第四步加上间隔的整数倍、样本容量的整数倍,或其它事先约定的规则均可.但必须保证按此规则在每组中,抽到一个编号.
21.(本题满分12分)下面是60名男生每分钟脉搏跳动次数的频率分布表.
分组 频数 频率 频率/组距
[51.5,57.5) 4 0.067 0.011
[57.5,63.5) 6 0.1 0.017
[63.5,69.5) 11 0.183 0.031
[69.5,75.5) 20 0.333 0.056
[75.5,81.5) 11 0.183 0.031
[81.5,87.5) 5 0.083 0.0139
[87.5,93.5] 3 0.05 0.008
(1)作出其频率分布直方图;
(2)根据直方图的各组中值估计总体平均数.
(3)估计每分钟脉搏跳动次数的范围.
[解析] (1)作出频率分布直方图如图.
(2)由组中值估计平均数为:(54.5×4+60.5×6+66.5×11+72.5×20+78.5×11+84.5×5+90.5×3)÷60=72.
(3)由上述样本数据可求得s=8.69,
∴每分钟脉博跳动次数的范围大致为[-s,+s]
即[ 63.28,80.66],取整数即[64,81].
[点评] 依据直方图中各组中值估计总体时,会有偏差,只要样本具有代表性,可以在允许的范围内对总体进行近似估计.
22.(本题满分14分)以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:
房屋面积(m2) 115 110 80 135 105
销售价格(万元) 24.8 21.6 18.4 29.2 22
(1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线;
(3)据(2)的结果估计当房屋面积为150m2时的销售价格.
[解析] (1)数据对应的散点图如下图所示:
(2)=i=109,(xi-)2=1570,
=23.2,(xi-)(yi-)=308.
设所求回归直线方程为=bx+a,则
b==≈0.1962,
a=-b =23.2-109×0.1962≈1.8142.
故所求回归直线方程为=0.1962x+1.8142.
(3)据(2),当x=150m2时,销售价格的估计值为
=0.1962×150+1.8142=31.2442≈31.2(万元).