第2章 统计
章末检测
(时间:120分钟 满分:160分)
一、填空题(本大题共14小题,每小题5分,共70分.)
1.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为________.
解析 分层抽样的原理是按照各部分所占的比例抽取样本.设从高二年级抽取的学生数为n,
则=,得n=8.
答案 8
2.问题:①某小区有800户家庭,其中高收入家庭200户,中等收入家庭480户,低收入家庭120户,为了了解有关家用轿车购买力的某个指标,要从中抽取一个容量为100的样本;②从10名学生中抽取3人参加座谈会.方法:(1)简单随机抽样;(2)分层抽样.则问题与方法的配对是________.
解析 问题①中的总体是由差异明显的几部分组成的,故可采用分层抽样方法;问题②中总体的个体数较少,故可采用简单随机抽样.
答案 ①与(2),②与(1)
3. 若某校高一年级8个班参加合唱比赛的得分为89,87,90,91,92,93,94,96,则这组数据的中位数和平均数分别是(单位:分)________.
解析 将这组数据从小到大排列,得87,89,90,91,92,93,94,96(单位:分).故平均数=×(87+89+90+91+92+93+94+96)=91.5(分),中位数为=91.5(分).
答案 91.5和91.5
4.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为________.
分数
5
4
3
2
1
人数
20
10
30
30
10
解析 ∵==3,
∴s2=[(x1-)2+(x2-)2+…+(xn-)2]
=(20×22+10×12+30×12+10×22)
==?s=.
答案
5.如图所示的是某学校抽取的学生体重的频率分布直方图,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为10,则抽取的学生人数为________.
解析 前3组的频率之和等于1-(0.012 5+0.037 5)×5=0.75,第2小组的频率是0.75×=0.25,设样本容量为n,则=0.25,则n=40.
答案 40
6.如图是一容量为100的样本的重量的频率分布直方图,则由图可估计样本的平均重量为________.
解析 第三组频率为1-0.3-0.5=0.2,
则平均重量为7.5×0.3+12.5×0.5+17.5×0.2=12.
答案 12
7.经问卷调查,某班学生对摄影分别持“喜欢”“不喜欢”和“一般”三种态度.其中持“一般”态度的比持“不喜欢”态度的多12人.按分层抽样方法从全班选出部分学生开摄影座谈会,如果选出了5位持“喜欢”态度的同学,1位持“不喜欢”态度的同学和3位持“一般”态度的同学,那么全班共有学生________人.
解析 设班里持“一般”态度的同学共x人,持“喜欢”态度的同学共y人,则持“不喜欢”态度的同学有(x-12)人.根据分层抽样的基本原理,有解得所以全班共有学生30+18+6=54(人).
答案 54
8.如图所示是某公司(共有员工300人)2014年员工年薪情况的频率分布直方图,由此可知,员工中年薪在1.4万元~1.6万元之间的共有________人.
解析 由所给图形可知员工中年薪在1.4万元~1.6万元之间的频率为1-(0.02+0.08+0.08+0.10+0.10)×2=0.24,所以员工中年薪在1.4万元~1.6万元之间的共有300×0.24=72(人).
答案 72
9.已知甲、乙、丙、丁四名射击手在选拔赛中的平均环数及其标准差s如下表所示,则选送决赛的最佳人选应是________.
甲
乙
丙
丁
7
8
8
7
s
2.5
2.5
2.8
3
解析 平均数反映平均水平大小,标准差表明稳定性.标准差越小,稳定性越好.综合考虑平均数与标准差,最佳人选应是乙.
答案 乙
10.从甲、乙、丙三个厂家生产的同一种产品中各抽取8件产品,对其使用寿命(单位:年)跟踪调查结果如下:
甲:3,4,5,6,8,8,8,10;
乙:4,6,6,6,8,9,12,13;
丙:3,3,4,7,9,10,11,12.
三个厂家在广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数:甲________,乙________,丙________.
解析 甲、乙、丙三个厂家从不同角度描述了一组数据的特征.甲:该组数据8出现的次数最多;乙:该组数据的平均数==8;丙:该组数据的中位数是=8.
答案 众数 平均数 中位数
11.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为________.
解析 前两组中的频数为100×(0.05+0.11)=16.
因为后五组频数和为62,所以前三组频数和为38.
所以第三组频数为38-16=22.又最大频率为0.32,故第四组频数为0.32×100=32.所以a=22+32=54.
答案 54
12.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n等于________.
解析 设第一组至第六组数据的频率分别为2x,3x,4x,6x,4x,x,则2x+3x+4x+6x+4x+x=1,∴x=,所以前三组数据的频率分别为,,,所以前三组数据的频数之和为++=27,解得n=60.
答案 60
13.一次数学测验后某班成绩均在(20,100]区间内,统计后画出的频率分布直方图如图,如分数在(60,70]分数段内有9人,则此班级的总人数为________.
解析 根据频率分布直方图,得分数在(60,70]分数段内的频率为0.015×10=0.15,频数为9,∴样本容量是=60,∴此班级的总人数为60.
答案 60
14.某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a=________;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.
解析 (1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.
(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.
因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.
答案 (1)3 (2)6 000
二、解答题(本大题共6小题,共90分.解答时应写出必要的文字说明、证明过程或演算步骤.)
15.(本小题满分14分)某农场为了从三种不同的西红柿品种中选出高产稳定的西红柿品种,分别在5块试验田上试种,每块试验田均为0.5公顷,产量情况如下表:
品种
产量(kg)
甲
21.5
20.4
22.0
21.2
19.9
乙
21.3
18.9
18.9
21.4
19.8
丙
17.8
23.3
21.4
19.9
20.9
问哪一种西红柿既高产又稳定?
解 因为甲=×(21.5+20.4+22.0+21.2+19.9)=21,
乙=×(21.3+18.9+18.9+21.4+19.8)=20.06,
丙=×(17.8+23.3+21.4+19.9+20.9)=20.66,
所以s甲=≈0.756,
s乙=≈1.104,
s丙=≈1.807.
由于甲>丙>乙,s甲<s乙<s丙,
所以甲种西红柿品种既高产又稳定.
16.(本小题满分14分)从参加环保知识竞赛的学生中抽出60名将其成绩(均为整数)整理后画出频率分布直方图如图所示.观察图形回答下列问题:
(1)[69.5,79.5)这一组的频率、频数分别是多少?
(2)估计这次环保知识竞赛的及格率(60分及60分以上为及格).
解 (1)频率为0.025×10=0.25,频数为60×0.25=15.
(2)由频率分布直方图得(0.015+0.025+0.03+0.005)×10=0.75,所以及格率为75%.
17.(本小题满分14分) 已知甲、乙两人数学成绩分别为甲:65,71,75,76,81,86,88,89,91,94,95,107,110;乙:79,83,86,88,93,98,98,99,101,103,114.
(1)求出这两名同学的数学成绩的平均数、标准差(结果精确到0.1);
(2)比较两名同学的成绩,谈谈看法.
解 (1)甲成绩的平均数
甲=≈86.8.
乙成绩的平均数
乙=(79+83+86+88+93+98+98+99+101+103+114)≈94.7.
甲成绩的标准差
s=(652+712+752+762+812+862+882+892+912+942+952+1072+1102-13×86.82)≈156.53,∴s甲=≈12.5.
乙成绩的标准差
s=(792+832+862+882+932+982+982+992+1012+1032+1142-11×94.72)≈98.64,∴s乙=≈9.9.
(2)由甲=86.8<乙=94.7,且s甲=12.5>s乙=9.9,
故甲的数学成绩不如乙的数学成绩好.
18.(本小题满分16分)某班同学进行了一次数学测试(成绩取整数),将所得的数据整理后画出频率分布直方图如图所示,已知图中从左到右的前三个小组的频率分别是0.1,0.3,0.4,且第一小组的频数是5.
(1)求第四小组的频率和本班学生人数.
(2)在这次测试中,全班成绩的中位数会落在第几个小组内?
(3)若本次测试成绩达到100分为优秀,试估计本班的优秀率是多少?
解 (1)第四小组的频率为1-(0.1+0.3+0.4)=0.2,
∵第一小组的频率为0.1,频数是5,
∴本班学生人数为=50.
(2)依题意知0.3×50=15,0.4×50=20,0.2×50=10,则第二、第三、第四小组的频数分别为15,20,10.
∴全班成绩的中位数在第三小组内.
(3)∵本次测试成绩达到100分的频率为0.2+0.4=0.6,
∴本班的优秀率为0.6×100%=60%.
19.(本小题满分16分)抽样调查30个工人的家庭人均月收入,得到如下数据(单位:元):
404 444 556 430 380 420 500 430 420
384 420 404 424 340 424 412 388 472
358 476 376 396 428 444 366 436 364
438 330 426
(1)取组距为60,起点为320,列出样本的频率分布表;
(2)画出频率分布直方图;
(3)根据频率分布直方图估计家庭人均月收入在[440,500)中的家庭所占的百分比.
解 (1)列表如下:
分组
频数
频率
[320,380)
6
0.20
[380,440)
18
0.60
[440,500)
4
0.13
[500,560]
2
0.07
合计
30
1.00
(2)频率分布直方图如图.
(3)家庭人均月收入落在[440,500)中的家庭所占的频率为0.13,所以估计家庭人均月收入在[440,500)中的家庭所占的百分比为13%.
20.(本小题满分16分)某市4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
(1)完成频率分布表;
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.
请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
解 (1)频率分布表:
分组
频数
频率
[41,51)
2
[51,61)
1
[61,71)
4
[71,81)
6
[81,91)
10
[91,101)
5
[101,111)
2
合计
30
1
(2)频率分布直方图:
(3)(ⅰ)该市一个月中空气污染指数有2天处于优的水平,占当月天数的;有26天处于良的水平,占当月天数的;处于优或良的天数共有28天,占当月天数的.说明该市空气质量基本良好.
(ⅱ)轻微污染有2天,占当月天数的.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的,超过50%.说明该市空气质量有待进一步改善.(上述两条答对一条即可)