2.2.1
用样本的频率分布估计总体分布
同步练习
一、选择题
1.下列关于频率分布直方图的说法正确的是( )
A.直方图的高表示取某数的频率
B.直方图的高表示该组上的个体在样本中出现的频率
C.直方图的高表示取某组上的个体在样本中出现的频数与组距的比值
D.直方图的高表示取该组上的个体在样本中出现的频率与组距的比值
[答案] D
[解析] 要注意频率直方图的特点.在直方图中,纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积.
[点评] 注意区别直方图与条形图.
2.下列说法正确的是( )
A.对于样本数据增加时,频率分布表不能增加变化
B.对于样本数据增加时,茎叶图不能增加变化
C.对于样本数据增加时,频率折线图不会跟着变化
D.对于样本数据增加时,频率分布直方图变化不太大
[答案] D
3.一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为( )
A.10组
B.9组
C.8组
D.7组
[答案] B
[解析] 根据列频率分布表的步骤,==8.9.所以分为9组较为恰当.
4.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示提频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测度成绩不低于60分的学生人数为( )
A.588
B.480
C.450
D.120
[答案] B
[解析] 本题考查频率分布直方图及频数的求法.成绩在[40,60)的频率P1=(0.005+0.015)×10=0.2,则成绩不少于60分的频率P2=1-0.2=0.8,所以可估计成绩不少于60分的学生人数为600×0.8=480,故选B.
5.某学校随机抽取20个班,调查各班中有网购经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )
[答案] A
[解析] 本题考查茎叶图与频率分布直方图.根据茎叶图可作频率分布表,如下:
分组
频数
频率
[0,5)
1
0.05
[5,10)
1
0.05
[10,15)
4
0.2
[15,20)
2
0.1
[20,25)
4
0.2
[25,30)
3
0.15
[30,35)
3
0.15
[35,40]
2
0.1
合计
20
1
再作频率分布直方图,故选A.
6.某校100名学生的数学测试成绩的频率分布直方图如图所示,分数不低于a即为优秀,如果优秀的人数为20,则a的估计值是( )
A.130
B.140
C.133
D.137
[答案] C
[解析] 本题考查频率分布直方图.由已知可以判断a∈(130,140),所以[(140-a)×0.015+0.01×10]×100=20,解得a≈133,故选C.
二、填空题
7.今年5月海淀区教育网开通了网上教学,某校高一年级(8)班班主任为了了解学生上网学习时间,对本班40名学生某天上网学习时间进行了调查,将数据(取整数)整理后,绘制出如图所示频率分布直方图,已知从左到右各个小组的频率分别是0.15,0.25,0.35,0.20,0.05,则根据直方图所提供的信息,这一天上网学习时间在100~119分钟之间的学生人数是________人,如果只用这40名学生这一天上网学习时间作为样本去推断该校高一年级全体学生该天的上网学习时间,这样推断是否合理?________(填“合理”或“不合理”)
[答案] 14 不合理
[解析] 由频数=样本容量×频率=40×0.35=14(人)
因为该样本的选取只在高一(8)班,不具有代表性,所以这样推断不合理.
8.青年歌手大奖赛共有10名选手参赛,并请了7名评委.如图所示的茎叶图是7名评委给参加最后决赛的两位选手甲、乙评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为________、________.
[答案] 84.2分 85分
[解析] 甲的成绩去掉一个最高分92分和一个最低分75分后,甲的剩余数据的平均成绩为84.2分;乙的成绩去掉一个最高分93分和一个最低分79分后,乙的剩余数据的平均成绩为85分.
9.图1是某工厂2010年9月份10个车间产量统计条形图,条形图从左到右表示各车间的产量依次记为A1,A2,…,A10(如A3表示3号车间的产量为950件).图2是统计图1中产量在一定范围内车间个数的一个算法流程图.那么运行该算法流程后输出的结果是________.
[答案] 4
[解析] 通过算法流程图可知,它的功能是统计产量超过950件的车间数,所以通过条形统计图可知产量超过950件的车间数为4个,所以最后输出的结果是4.
三、解答题
10.有关部门从甲、乙两个城市所有的自动售货机中随机抽取了16台,记录了上午8∶00~11∶00之间各自的销售情况(单位:元)
甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;
乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.
试用两种不同的方式分别表示上面的数据,并简要说明各自的优点.
[解析] 方法一:从题目中的数不易直接看出各自的分布情况,为此,我们将以上数据用条形统计图表示.如图:
方法二:茎叶图如图,两竖线中间的数字表示甲、乙销售额的十位数,两边的数字表示甲、乙销售额的个位数.
从方法一可以看出条形统计图能直观地反映数据分布的大致情况,并且能够清晰地表示出各个区间的具体数目;从方法二可以看出,用茎叶图表示有关数据,对数据的记录和表示都带来方便.
11.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8∶00~10∶00间各自的点击量,得如图所示的茎叶图,根据茎叶图回答下列问题.
(1)甲、乙两个网站点击量的极差分别是多少?
(2)甲网站点击量在[10,40]间的频率是多少?
(3)甲、乙两网站哪个更受欢迎?并说明理由.
[解析] (1)甲网站的极差为:73-8=65,乙网站的极差为:71-5=66.
(2)=≈0.286.
(3)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.
12.某电视台为宣传本省,随机对本省内15~65岁的人群抽取了n人,回答问题“本省内著名旅游景点有哪些”统计结果如图表所示.
组号
分组
回答正确的人数
回答正确的人数占本组的频率
第1组
[15,25)
a
0.5
第2组
[25,35)
18
x
第3组
[35,45)
b
0.9
第4组
[45,55)
9
0.36
第5组
[55,65]
3
y
(1)分别求出a、b、x、y的值;
(2)从第2、3、4组回答正确的人中用分层抽样的方法抽取6人,求第2、3、4组每组各抽取多少人?
[解析] (1)由频率表中第4组数据可知,第4组总人数为=25,再结合频率分布直方图可知
n==100,
∴a=100×0.01×10×0.5=5,
b=100×0.03×10×0.9=27,
x==0.9,y==0.2.
(2)第2、3、4组回答正确的共有54人.
∴利用分层抽样在54人中抽取6人,每组分别抽取的人数为:第2组:×6=2(人);第3组:×6=3(人);第4组:×6=1(人).