1.5 用样本估计总体
1.6 统计活动:结婚年龄的变化
课时训练
课时目标1.通过实例体会分布的意义和作用,会作频率分布直方图和频率折线图,会用样本的频率分布估计总体的分布.2.会用样本的数字特征估计总体的数字特征.3.体会样本估计总体的思想、初步了解频率分布的随机性.
1.频率分布直方图中,数据落在各个区间内频率的大小,是该区间所对应的_______.
2.当样本量较大时,样本中落在每个区间内样本数的频率会稳定于______________.
3.我们可以用样本平均数和样本标准差,来分别估计______________________.
一、选择题
1.下列说法不正确的是( )
A.频率分布直方图中每个小矩形的高就是该组的频率
B.频率分布直方图中各个小矩形的面积之和等于1
C.频率分布直方图中各个小矩形的宽一样大
D.频率分布折线图是从所加的左边区间的中点开始,用线段依次连接频率分布直方图的每个小矩形上端中点,直至右边所加区间的中点得到的
2.一个容量为20的样本数据,分组后组距与频数如下表:
组距
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
[60,70)
频数
2
3
4
5
4
2
则样本在[10,50)上的频率为( )
A.0.5
B.0.24
C.0.6
D.0.7
3.100辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[60,70)的汽车大约有( )
A.30辆
B.40辆
C.60辆
D.80辆
4.为了让人们感受丢弃塑料袋对环境造成的影响,某班环保小组的六名同学记录了自己家中一周内丢弃的塑料袋的数量,结果如下(单位:个):33,25,28,26,25,31.如果该班有45名学生,那么根据提供的数据估计本周全班同学各家总共丢弃塑料袋的数量约为( )
A.900个
B.1
080个
C.1
260个
D.1
800个
5.某工厂对一批产品进行了抽样检测.下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )
A.90
B.75
C.60
D.45
题 号
1
2
3
4
5
答 案
二、填空题
6.在样本的频率分布直方图中,共有5个小长方形,已知中间一个小长方形面积是其余4个小长方形面积之和的,且中间一组的频数为10,则这个样本容量是________.
7.某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如下图所示.
已知图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________.
8.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是____________.
9.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.
三、解答题
10.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.
(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.
11.抽查100袋洗衣粉,测得它们的重量如下(单位:g):
494 498 493 505 496 492 485 483 508 511
495 494 483 485 511 493 505 488 501 491
493 509 509 512 484 509 510 495 497 498
504 498 483 510 503 497 502 511 497 500
493 509 510 493 491 497 515 503 515 518
510 514 509 499 493 499 509 492 505 489
494 501 509 498 502 500 508 491 509 509
499 495 493 509 496 509 505 499 486 491
492 496 499 508 485 498 496 495 496 505
499 505 496 501 510 496 487 511 501 496
(1)列出样本的频率分布表:
(2)画出频率分布直方图,频率分布折线图;
(3)估计重量在[494.5,506.5]g的频率以及重量不足500
g的频率.
能力提升
12.在某电脑杂志的一篇文章中,每个句子的字数如下:
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17
在某报纸的一篇文章中,每个句子的字数如下:
27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22
(1)将这两组数据用茎叶图表示;
(2)将这两组数据进行比较分析,你会得到什么结论?
13.某市2010年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,
95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
(1)完成频率分布表.
(2)作出频率分布直方图.
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.
请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
绘制频率分布直方图的具体步骤:①求极差:找出一组数据中的最大值和最小值,最大值与最小值的差是极差(正值).②确定组距与组数:组数与样本容量有关,当样本容量不超过100时,按照数据的多少,常分成5~12组;组距的选择力求“取整”,组数=.③将数据分组:将数据分成互不相交的组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.④列频率分布表:一般分“分组”、“频数累计”、“频数”、“频率”四列,最后一行是合计.注意频数的合计是样本容量,频率的合计是1.⑤绘制频率分布直方图:根据频率分布表绘制频率分布直方图,其中纵轴表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积,即每个矩形的面积=组距×=频率.这样频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小,各小矩形的面积的总和等于1.
答案
知识梳理
1.频率直方图的面积 2.总体在相应区间内取值的概率 3.总体的平均数和标准差
作业设计
1.A 2.D
3.B [时速在[60,70)的汽车的频率为:0.04×(70-60)=0.4,又因汽车的总辆数为100,
所以时速在[60,70)的汽车大约有0.4×100=40(辆).]
4.C [样本的平均数为28,估计总共:45×28=1
260个.]
5.A [∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,
∴样本总数为=120.
∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,
∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.]
6.40
解析 可知中间长方形的面积是所有长方形面积的,即频率为,
∴样本容量为=40.
7.100 0.15
8.45,46
解析 由茎叶图及中位数的概念可知
x甲中=45,x乙中=46.
9.
解析 =h,故|a-b|=组距==.
10.解 (1)以4为组距,列表如下:
分组
频数累计
频数
频率
[41.5,45.5)
2
0.045
5
[45.5,49.5)
正
7
0.159
1
[49.5,53.5)
正
8
0.181
8
[53.5,57.5)
正正正
16
0.363
6
[57.5,61.5)
正
5
0.113
6
[61.5,65.5)
4
0.090
9
[65.5,69.5]
2
0.045
5
合计
44
1.00
(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.
11.解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于=8,要分9组,组数合适,于是决定取组距为4
g,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下:
[482.5,486.5),[486.5,490.5),…,[514.5,518.5).
列出频率分布表:
分组
个数累计
频数
频率
累积频率
[482.5,486.5)
正
8
0.08
0.08
[486.5,490.5)
3
0.03
0.11
[490.5,494.5)
正正正
17
0.17
0.28
[494.5,498.5)
正正正正-
21
0.21
0.49
[498.5,502.5)
正正
14
0.14
0.63
[502.5,506.5)
正
9
0.09
0.72
[506.5,510.5)
正正正
19
0.19
0.91
[510.5,514.5)
正-
6
0.06
0.97
[514.5,518.5]
3
0.03
1.00
合计
100
1.00
(2)频率分布直方图与频率分布折线图如图.
(3)重量在[494.5,506.5]g的频率为:0.21+0.14+0.09=0.44.
设重量不足500
g的频率为b,根据频率分布表,
≈,故b≈0.55.因此重量不足500
g的频率约为0.55.
12.解 (1)
(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.
13.解 (1)频率分布表:
(2)频率分布直方图如图所示.
(3)答对下述两条中的一条即可:
①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的;有26天处于良的水平,占当月天数的;处于优或良的天数为28,占当月天数的.说明该市空气质量基本良好.
②轻微污染有2天,占当月天数的;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的,超过50%;说明该市空气质量有待进一步改善.