第九章 统计 章末综合练习
一、单选题
1.下列关于分位数的说法正确的是 ( )
A.分位数不是中位数
B.总体数据中的任意一个数小于它的可能性一定是
C.它是四分位数
D.它只适用于总体是离散型的数据
2.某校高三年级有男生500人,女生400人,为了解该年级学生的体重状况,从男生中随机抽取25人,从女生中随机抽取20人进行调查.这种抽样方法是( )
A.分层随机抽样 B.抽签法
C.随机数法 D.其他随机抽样
3.已知一个样本容量为7的样本的平均数为5,方差为2,现样本加入新数据4,5,6,此时样本容量为10,若此时平均数为,方差为,则( )
A., B.,
C., D.,
4.甲 乙二人参加某体育项目训练,近期的八次测试得分情况如图,则下列结论正确的是( )
A.甲得分的极差大于乙得分的极差
B.甲得分的75%分位数大于乙得分的75%分位数
C.甲得分的平均数小于乙得分的平均数
D.甲得分的标准差小于乙得分的标准差
5.某校为了解学生学习的情况,采用分层抽样的方法从高一人、高二人、高三人中,抽取人进行问卷调查.已知高二被抽取的人数为人,那么高三被抽取的人数为( )
A. B. C. D.
6.从一群游戏的小孩中随机抽出k人,一人分一个苹果,让他们返回继续游戏,过了一会儿,再从中任取m人,发现其中有n个小孩曾分过苹果,估计参加游戏的小孩的人数为( )
A. B. C. D.
7.某学校在校学生有2000人,为了增强学生的体质,学校举行了跑步和登山比赛,每人都参加且只参加其中一项比赛,高一、高二、高三年级参加跑步的人数分别为a,b,c,且,全校参加登山的人数占总人数的.为了了解学生对本次比赛的满意程度,按分层抽样的方法从中抽取一个容量为200的样本进行调查,则应从高三年级参加跑步的学生中抽取( )
A.15人 B.30人 C.40人 D.45人
8.一组数据由10个数组成,将其中一个数由4改为1,另一个数由6改为9,其余数不变,得到新的10个数,则新的一组数的方差相比原先一组数的方差的增加值为( )
A.2 B.3 C.4 D.5
二、多选题
9.某班级在一次数学竞赛中为全班学生设置了一等奖、二等奖、三等奖以及参与奖,各个奖品的单价分别为等奖18元、二等奖8元、三等奖4元、参与奖2元,获奖人数的分配情况如图所示,则以下说法正确的是( )
A.获得参与奖的人数最多
B.各个奖项中参与奖的总费用最高
C.购买每件奖品费用的平均数为4元
D.购买的三等奖的奖品件数是一、二等奖的奖品件数和的二倍
10.已知数据x1,x2,…,xn的平均数为,标准差为s,则( )
A.数据x12,x22,…,xn2的平均数为2,标准差为s2
B.数据2x1,2x2,…,2xn的平均数为2,标准差为2s
C.数据x1+2,x2+2,…,xn+2的平均数为+2,方差为s2
D.数据2x1-2,2x2-2,…,2xn-2的平均数为2-2,方差为2s2
11.某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人.甲就读于高一,乙就读于高二,学校计划从这两个年级中共抽取235人进行视力调查,下列说法中正确的有( )
A.应该采用分层抽样法抽取
B.高一、高二年级应分别抽取100人和135人
C.乙被抽到的可能性比甲大
D.该问题中的总体是高一、高二年级的全体学生的视力
12.已知一组数据丢失了其中一个,剩下的六个数据分别是,,,,,,若这组数据的平均数与众数的和是中位数的倍,则丢失的数据可能是( )
A. B. C. D.
三、填空题
13.现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的标准差是________.
14.某校高二年级化生史组合只有个班,且每班人,在一次数学测试中,从两个班抽取了名学生的数学成绩进行解析,统计得在该次测试中,两班中各抽取的名学生的平均成绩分别为分和分,则该组合学生的平均成绩约为________分.
15.某地有居民100 000户,其中普通收入家庭99 000户,高收入家庭1 000户.以简单随机抽样方式从普通收入家庭中抽取990户,高收入家庭中抽取100户进行调查.调查发现共有120户家庭拥有2套或2套以上住房,其中普通收入家庭50户,高收入家庭70户,依据这些数据并结合所掌握的统计知识,你认为该地拥有2套或2套以上住房的家庭所占比例的合理估计是______.
16.气象意义上从春季进入夏季的标志为连续5天的日平均温度均不低于22℃.现有甲、乙、丙三地连续5天的日平均温度(均为正整数,单位:℃)的记录数据如下:
①甲地5个数据的中位数为26,众数为22;②乙地5个数据的平均数为26,方差为5.2.则从气象意义上肯定进人夏季的地区是______(填序号).
四、解答题
17.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占37.5%,老年人占20%.登山组的职工占参加活动总人数的三分之一,且该组中,青年人占50%,中年人占30%,老年人占20%.为了解各组不同年龄层次的职工对本次活动的整体满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
18.甲、乙、丙、丁四人参加全省数学竞赛,初赛时四人分别处于第95,第96,第97,第98百分位数处,已知参加初赛的总人数为50000,并且取成绩前1500名进入决赛,试问上述四人中有哪几位可参加决赛?
19.甲、乙、丙三家电子厂商在广告中都声称,他们的某型电子产品在正常情况下的待机时间都是12h,质量检测部门对这三家销售产品的待机时间进行了抽样调查,统计结果(单位:h)如下:
甲:8,9,9,9,9,11,13,16,17,19;
乙:10,10,12,12,12,13,14,16,18,19;
丙:8,8,8,10,11,13,17,19,20,20.
(1)分别求出以上三组数据的平均数、众数、中位数.
(2)这三个厂商的推销广告分别利用了上述哪一种数据来表示待机时间?
(3)如果你是顾客,宜选择哪个厂商的产品?为什么?
20.为了节约用水,制定阶梯水价,同时又不加重居民生活负担,某市物价部门在8月份调查了本市某小区300户居民中的50户居民,得到如下数据:
用水量(单位:) 18 19 20 21 22 23 24 25 26
频数 2 4 4 6 12 10 8 2 2
物价部门制定的阶梯水价实施方案为:
月用水量 水价(单位:元/)
不超过21 3
超过21的部分 4.5
(1)计算这50户居民的用水的平均数;
(2)写出水价的函数关系式,并计算用水量为28时的水费;
(3)物价部门制定水价合理吗?为什么?
21.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效.随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:
服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5
2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4
服用B药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4
1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5
(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?
(2)根据两组数据,除了平均数还有哪个数字特征能评价哪种药的疗效更好?
22.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
(3)样本中不达标的学生人数是多少?
(4)第三组的频数是多少?
试卷第1页,共3页
参考解析
1.C
【解析】由百分位数的意义可知,将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数;分位数是中位数,分位数表示至少有的数据项小于或等于这个值,且至少有的数据项大于或等于这个值,第50百分位数又称第二个四分位数,所以选项A,B,D错误.故选:C
2.A
【解析】从男生500人中抽取25人,从女生400人中抽取20人,抽取的比例相同,因此用的是分层随机抽样.故选:A
3.B
【解析】设这10个数据分别为:,根据题意,,
所以,.故选:B.
4.B
【解析】乙组数据最大值29,最小值5,极差24,甲组最大值小于29,最小值大于5,所以A选项说法错误;
甲得分的75%分位数是20,,乙得分的75%分位数17,所以B选项说法正确;
甲组具体数据不易看出,不能判断C选项;
乙组数据更集中,标准差更小,所以D选项错误.
故选:B
5.C
【解析】由分层抽样可得,可得,
设高三所抽取的人数为,则,解得.故选:C.
6.C
【解析】设总人数为,则,,故选:C.
7.D
【解析】由题意,可知全校参加跑步的人数为,
所以.因为,所以.
因为按分层抽样的方法从中抽取一个容量为200的样本,
所以应从高三年级参加跑步的学生中抽取的人数为.故选:D
8.B
【解析】一个数由4改为1,另一个数由6改为9,故该组数据的平均数不变,
设没有改变的八个数分别为,原先一组数的方差
,
新数据的方差
所以
,故选:B.
9.ACD
【解析】设全班人数为,
A:由图可知,参与奖占全班人数的,故获得参与奖的人数最多,故A正确;
B:一等奖的费用是,二等奖的费用是,
三等奖的费用是,参与奖的费用是,
故三等奖的费用最高,故B错误;
C:平均费用是(元),故C正确;
D:一等奖奖品数为,二等奖奖品数为,三等奖奖品数为,故D正确.
故选:ACD.
10.BC
【解析】取,则,,,故,A错误;
数据的平均数为,标准差为,B正确;
数据的平均数为,方差为,C正确;
数据的平均数为,方差为,D错误.
故选:BC
11.ABD
【解析】易知应采用分层抽样法抽取,A正确;
由题意可得高一年级的人数为,高二年级的人数为,则高一年级应抽取的人数为,高二年级应抽取的人数为,所以高一、高二年级应分别抽取100人和135人,故B正确;
乙被抽到的可能性与甲一样大,故C错误;
该问题中的总体是高一、高二年级的全体学生的视力,故D正确.
故选:ABD.
12.ABD
【解析】设丢失的数据为,则这七个数据的平均数为,众数是.
这组数据的平均数与众数的和是中位数的倍,
若,则中位数为,此时,解得:;
若,则中位数为,此时,解得:;
若,则中位数为,此时,解得:.
综上所述:丢失的数据可能是,,.故选:ABD.
13.【解析】由题意知=4,,
.
14.【解析】由题意可知,样本中名学生的平均成绩为(分),
因此,估计该组合学生的平均分约为分.
15.【解析】该地拥有2套或2套以上住房的家庭估计有(户),则该地拥有2套或2套以上住房的家庭所占比例的合理估计为.
16.【解析】对于①,因为甲地5个数据的众数为22,所以22至少出现2次,
若有一天的日平均温度低于22℃,则中位数不可能是26,所以甲地肯定进入夏季;
对于②,设乙地日平均温度由低到高分别为,
根据方差的定义可得,
,
所以,
若有一天的日平均温度低于22℃,不妨设,
则只有21,25,26,26,26或21,26,26,26,27满足方程式,
而此时不满足平均数为26,故5天的日平均温度均不低于22℃,
所以乙地肯定进入夏季.
故从气象意义上肯定进入夏季地区的是①②.
17.【解析】(1)登山组人数占参加活动总人数的,则游泳组人数占参加活动总人数的,
登山组中,青年人,中年人,老年人占总人数的比例分别为:,,,所以游泳组中,青年人,中年人,老年人占总人数的比例分别为:,,,所以游泳组中,青年人、中年人、老年人分别所占的比例为
(2)由(1)知:游泳组中,青年人、中年人、老年人分别所占的比例为31∶33∶16,游泳组人数占参加活动总人数的,故游泳组中,青年人、中年人、老年人分别应抽取的人数为,,,所以游泳组中,青年人、中年人、老年人分别应抽取的人数为52,55,27.
18.【解析】甲的名次:50000-50000×95%=50000×(1-95%)=50000×0.05=2500(名);
乙的名次:50000-50000×96%=50000×(1-96%)=50000×0.04=2000(名);
丙的名次:50000-50000×97%=50000×(1-97%)=50000×0.03=1500(名);
丁的名次:50000-50000×98%=50000×(1-98%)=50000×0.02=1000(名).
所以丙和丁的成绩在1500名之内,可以参加比赛
答:丙和丁可以参加比赛.
19.【解析】(1)根据平均数的计算公式可知:
甲厂数据的平均数是;
乙厂数据的平均数是;
丙厂数据的平均数是.
甲厂,乙厂,丙厂的众数分别是9,12,8.
甲厂数据的中位数为,乙厂数据的中位数为,丙厂数据的中位数为.
(2)甲厂用平均数作为该电子产品的待机时间,乙厂用众数作为该电子产品的待机时间,丙厂用中位数作为该电子产品的待机时间.
(3)我会选乙厂的产品因为乙厂产品的平均数最大,众数最大,中位数最大,所以待机时间更长些,稳定性也较好
20.【解析】(1)根据上表数据可得户用水平均数为:
(),即这50户居民的用水的平均数为.
(2)设用水量为,水价为元每立方米,由题意可得;
所以当时,(元);
(3)由(1)知,50户居民的月用水平均量为,据此可估计300户居民的月用水量平均约为,超过21,
也可从频率来看,月用水量超过21的居民所占频率为,
所以300户居民中有约的居民用水量超过基础用水量,
故阶梯水价起不到不加重群众负担,节约用水的目的,
因此可知物价部门制定的价格标准不合理.
21.【解析】(1)服用A药的20位患者的日平均增加的睡眠时间的平均数为
,
服用B药的20位患者日平均增加的睡眠时间的平均数为
,
因为,所以A药的疗效更好;
(2)还可以用中位数来评价.
服用A药的20位患者的日平均增加的睡眠时间的中位数为,
服用B药的20位患者的日平均增加的睡眠时间的中位数为,
因为,所以A药的疗效更好.
22.【解析】(1)频率分布直方图以面积的形式反映数据落在各小组内的频率大小,因此第二小组的频率为=0.08.所以样本容量==150.
(2)由直方图可估计该校高一年级学生的达标率为×100%=88%.
(3)由(1)(2)知达标率为88%,样本量为150,不达标的学生频率为1-0.88=0.12.
所以样本中不达标的学生人数为150×0.12=18(人).
(4)第三小组的频率为=0.34.
又因为样本量为150,所以第三组的频数为150×0.34=51.
答案第1页,共2页