专题强化训练(四) 统计
一、选择题
1.为了调查全国人口的寿命,抽查了十一个省(市)的2 500名城镇居民.这2 500名城镇居民的寿命的全体是( )
A.总体 B.个体
C.样本 D.样本容量
2.已知总体容量为106,若用随机数法抽取一个容量为10的样本.下面对总体的编号最方便的是( )
A.1,2,…,106 B.0,1,2,…,105
C.00,01,…,105 D.000,001,…,105
3.某农科所种植的甲、乙两种水稻,连续六年在面积相等的两块稻田中作对比试验,试验得出平均产量是甲=乙=415 kg,方差是s=794,s=958,那么这两种水稻中产量比较稳定的是( )
A.甲 B.乙
C.甲、乙一样稳定 D.无法确定
4.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12]内的频数为( )
A.18 B.36
C.54 D.72
5.从一堆苹果中任取了20个,并得到它们的质量(单位:克)数据分布表如下:
分组 [90,100) [100,110) [110,120) [120,130) [130,140) [140,150)
频数 1 2 3 10 3 1
则这堆苹果中,质量不小于120克的苹果数约占苹果总数的( )
A.30% B.70%
C.60% D.50%
二、填空题
6.下列一组数据的70%分位数是________.
78, 73, 76, 77, 68, 69, 76, 80, 82, 77.
7.某学习小组有男生56人,女生42人,一次测试后,用分层随机抽样的方法从该学习小组全体学生的测试成绩中抽取一个容量为28的样本,样本中男生的平均成绩为84分,女生样本的平均成绩为98分,则所抽取的这28人的平均成绩为________分.
8.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5].样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.
三、解答题
9.某市化工厂三个车间共有工人1 000名,各车间男、女工人数如下表:
第一车间 第二车间 第三车间
女工 173 100 y
男工 177 x z
已知在全厂工人中随机抽取1名,抽到第二车间男工的可能性是0.15.
(1)求x的值;
(2)现用分层随机抽样的方法在全厂抽取50名工人,则应在第三车间抽取多少名工人?
10.为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x、物理成绩y进行分析.下表是该学生7次考试的成绩.
数学 88 83 117 92 108 100 112
物理 94 91 108 96 104 101 106
(1)求数学成绩的中位数.
(2)他的数学成绩与物理成绩哪个更稳定?请给出你的证明.
11.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( )
A.40.6,1.1 B.48.8,4.4
C.81.2,44.4 D.78.8,75.6
12.已知一组正数x1,x2,x3的方差s2=(x+x+x-12),则数据x1+1,x2+1,x3+1的平均数为( )
A.2 B.3
C.4 D.5
13.(一题两空)从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为________.
14.统计局就某地居民的月收入(单位:元)情况调查了10 000人,并根据所得数据画出了样本频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组表示月收入在[2 500,3 000)内.
(1)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层随机抽样的方法抽出100人作进一步分析,则月收入在[4 000,4 500)内的应抽取多少人?
(2)根据频率分布直方图估计样本数据的中位数;
(3)根据频率分布直方图估计样本数据的平均数.
15.某工厂有工人1 000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层随机抽样方法(按A类,B类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(生产能力指一天加工的零件数).
(1)A类工人中和B类工人中各抽查多少工人?
(2)从A类工人中的抽查结果和从B类工人中的抽查结果分别如表1和表2.
表1
生产能力分组 [100,110) [110,120) [120,130) [130,140) [140,150]
人数 4 8 x 5 3
表2
生产能力分组 [110,120) [120,130) [130,140) [140,150]
人数 6 y 36 18
① 先确定x,y,再补全频率分布直方图(如图).就生产能力而言,A类工人中个体间的差异程度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)
② 分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).
A类工人生产能力的频率分布直方图
B类工人生产能力的频率分布直方图
专题强化训练(四) 统计
一、选择题
1.为了调查全国人口的寿命,抽查了十一个省(市)的2 500名城镇居民.这2 500名城镇居民的寿命的全体是( )
A.总体 B.个体
C.样本 D.样本容量
C [被抽查的个体是样本]
2.已知总体容量为106,若用随机数法抽取一个容量为10的样本.下面对总体的编号最方便的是( )
A.1,2,…,106 B.0,1,2,…,105
C.00,01,…,105 D.000,001,…,105
D [由随机数法抽取原则可知选D.]
3.某农科所种植的甲、乙两种水稻,连续六年在面积相等的两块稻田中作对比试验,试验得出平均产量是甲=乙=415 kg,方差是s=794,s=958,那么这两种水稻中产量比较稳定的是( )
A.甲 B.乙
C.甲、乙一样稳定 D.无法确定
A [∵s4.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12]内的频数为( )
A.18 B.36
C.54 D.72
B [易得样本数据在区间[10,12]内的频率为0.18,则样本数据在区间[10,12]内的频数为36.]
5.从一堆苹果中任取了20个,并得到它们的质量(单位:克)数据分布表如下:
分组 [90,100) [100,110) [110,120) [120,130) [130,140) [140,150)
频数 1 2 3 10 3 1
则这堆苹果中,质量不小于120克的苹果数约占苹果总数的( )
A.30% B.70%
C.60% D.50%
B [由数据分布表可知,质量不小于120克的苹果有10+3+1=14(个),占苹果总数的×100%=70%.]
二、填空题
6.下列一组数据的70%分位数是________.
78, 73, 76, 77, 68, 69, 76, 80, 82, 77.
77.5 [把数据按照从小到大的顺序排列可得 68,69,73,76,76,77,77,78,80,82,因为10×70%=7是整数,所以数据的70%分位数是=77.5]
7.某学习小组有男生56人,女生42人,一次测试后,用分层随机抽样的方法从该学习小组全体学生的测试成绩中抽取一个容量为28的样本,样本中男生的平均成绩为84分,女生样本的平均成绩为98分,则所抽取的这28人的平均成绩为________分.
90 [由题意可知样本中男生的人数为56×=16,女生的人数为42×=12,所以所抽取的这28人的平均成绩为×84+×98=90分.]
8.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5].样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.
9 [设样本容量为n,则n×(0.1+0.12)×1=11,所以n=50,故所求的城市数为50×0.18=9.]
三、解答题
9.某市化工厂三个车间共有工人1 000名,各车间男、女工人数如下表:
第一车间 第二车间 第三车间
女工 173 100 y
男工 177 x z
已知在全厂工人中随机抽取1名,抽到第二车间男工的可能性是0.15.
(1)求x的值;
(2)现用分层随机抽样的方法在全厂抽取50名工人,则应在第三车间抽取多少名工人?
[解] (1)依题意有=0.15,解得x=150.
(2)∵第一车间的工人数是173+177=350,第二车间的工人数是100+150=250,
∴第三车间的工人数是1 000-350-250=400. 设应从第三车间抽取m名工人,则有=,解得m=20,∴应在第三车间抽取20名工人.
10.为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x、物理成绩y进行分析.下表是该学生7次考试的成绩.
数学 88 83 117 92 108 100 112
物理 94 91 108 96 104 101 106
(1)求数学成绩的中位数.
(2)他的数学成绩与物理成绩哪个更稳定?请给出你的证明.
[解] (1)把数学成绩按照从小到大的顺序排列可得:
83,88,92,100,108,112,117,所以数学成绩的中位数是100.
(2)=100+=100,
=100+=100,
∴s=[(88-100)2+(83-100)2+(117-100)2+(92-100)2+(108-100)2+(100-100)2+(112-100)2]=142,s=[(94-100)2+(91-100)2+(108-100)2+(96-100)2+(104-100)2+(101-100)2+(106-100)2]=,从而s>s,∴物理成绩更稳定.
11.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( )
A.40.6,1.1 B.48.8,4.4
C.81.2,44.4 D.78.8,75.6
A [设原来数据的平均数和方差分别为和s2,则得]
12.已知一组正数x1,x2,x3的方差s2=(x+x+x-12),则数据x1+1,x2+1,x3+1的平均数为( )
A.2 B.3
C.4 D.5
B [由方差的计算公式可得s2=[(x1-)2+(x2-)2+…+(xn-)2]
=[x+x+…+x-2(x1+x2+…+xn)+n2]
=(x+x+…+x-2n2+n2)
=(x+x+…+x)-2,
∴由题意x1,x2,x3的方差s2=(x+x+x-12),知2=4,
又x1,x2,x3均为正数,故=2.
所以数据x1+1,x2+1,x3+1的平均数是2+1=3.]
13.(一题两空)从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为________.
0.030 3 [∵0.005×10+0.035×10+a×10+0.020×10+0.010×10=1,∴a=0.030.
设身高在[120,130),[130,140),[140,150]三组的学生分别有x,y,z人,则=0.030×10,解得x=30.同理,y=20,z=10.故从[140,150]的学生中选取的人数为×18=3.]
14.统计局就某地居民的月收入(单位:元)情况调查了10 000人,并根据所得数据画出了样本频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组表示月收入在[2 500,3 000)内.
(1)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层随机抽样的方法抽出100人作进一步分析,则月收入在[4 000,4 500)内的应抽取多少人?
(2)根据频率分布直方图估计样本数据的中位数;
(3)根据频率分布直方图估计样本数据的平均数.
[解] (1)因为(0.000 2+0.000 4+0.000 3+0.000 1)×500=0.5,所以a==0.000 5.又0.000 5×500=0.25,所以月收入在[4 000,4 500)内的频率为0.25,所以100人中月收入在[4 000,4 500)内的人数为0.25×100=25.
(2)因为0.000 2×500=0.1,0.000 4×500=0.2,0.000 5×500=0.25,0.1+0.2=0.3<0.5,0.1+0.2+0.25=0.55>0.5,所以中位数在区间[3 500,4 000)内,
所以样本数据的中位数是
3 500+=3 900(元).
(3)样本平均数为(2 750×0.000 2+3 250×0.000 4+3 750×0.000 5+4 250×0.000 5+4 750×0.000 3+5 250×0.000 1)×500=3 900(元).
15.某工厂有工人1 000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层随机抽样方法(按A类,B类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(生产能力指一天加工的零件数).
(1)A类工人中和B类工人中各抽查多少工人?
(2)从A类工人中的抽查结果和从B类工人中的抽查结果分别如表1和表2.
表1
生产能力分组 [100,110) [110,120) [120,130) [130,140) [140,150]
人数 4 8 x 5 3
表2
生产能力分组 [110,120) [120,130) [130,140) [140,150]
人数 6 y 36 18
① 先确定x,y,再补全频率分布直方图(如图).就生产能力而言,A类工人中个体间的差异程度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)
② 分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).
A类工人生产能力的频率分布直方图
B类工人生产能力的频率分布直方图
[解] (1)A类工人中和B类工人中分别抽查25名和75名.
(2)①由4+8+x+5+3=25,得x=5.
由6+y+36+18=75,得y=15.
频率分布直方图如图:
A类工人生产能力的频率分布直方图
B类工人生产能力的频率分布直方图
从图可以判断:B类工人中个体间的差异程度更小.
②A=×105+×115+×125+×135+×145=123,
B=×115+×125+×135+×145=133.8,
=×123+×133.8=131.1.
A类工人生产能力的平均数,B类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1.