2. 2.1 用样本的频率分布估计总体分布
【教学目标】
1. 通过实例体会分布的意义和作用;
2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;
3. 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。
【教学重难点】
教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图
教学难点:w能通过样本的频率分布估计总体的分布
教学过程:
【复习回顾】
说一说简单随机抽样、系统抽样、分层抽样各自的特点、操作步骤和适用的范围。
类 别
共同点
各自特点
联 系
适用范围
简单随机
抽样
(1)抽样过程中每个个体被抽到的可能性相等
(2)每次抽出个体后不再将它放回,即不放回抽样
从总体中逐个抽取
总体个数较少
系统抽样
将总体均分成几部 分,按预先制定的规则在各部分抽取
在起始部分样时采用简随机抽样
总体个数较多
分层抽样
将总体分成几层,分层进行抽取
分层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
【引入】
在统计中,为了考察一个总体的情况,通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况。这种估计大体分为两类,一类是用样本频率分布估计总体分布,一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征。下面我们先通过案例来介绍总体分布的估计。
【新知探究】
我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢 ?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?
为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等。因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况。(见课本表2-1)
分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式
下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律。可以让我们更清楚的看到整个样本数据的频率分布情况。
一、频率分布直方图
频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:
(1)计算一组数据中最大值与最小值的差,即求极差
(2)决定组距与组数,
(3)将数据分组
(4)列频率分布表
(5)画频率分布直方图
以课本制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图。
频率分布直方图的特征:
(1)从频率分布直方图可以清楚的看出数据分布的总体趋势。
(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
思考探究:
(1)在频率分布直方图中,各小长方形的面积表示什么?它们的总和是多少?
(2)同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?
(3)如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-1和频率分布直方图2.2-1,(见课本)你能对制定月用水量标准提出建议吗?
二、频率分布折线图、总体密度曲线
1.频率分布折线图的定义:
连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。
2.总体密度曲线的定义:
在样本频率分布直方图中,随着样本容量的增加,所分组数的增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。(见课本)
思考探究:
(1)对于任何一个总体,它的密度曲线是不是一定存在?为什么?
(2)对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?
答:实际上,尽管有些总体密度曲线是客观存在的,但一般很难想函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确。
三.茎叶图
1.茎叶图的概念:
当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本例子)
2.茎叶图的特征:
(1)用茎叶图表示数据的优点:一是既可以看出样本的分布情况又能看到原始数据;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。
【例题精析】
例1、下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)画出频率分布折线图;
(4)估计身高小于134cm的人数占总人数的百分比.。
分析:根据样本频率分布表、频率分布直方图的一般步骤解题。
解:(1)样本频率分布表如下:
(2、3)其频率分布直方图如下:
(4)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.
变式训练:
为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.
第二小组的频率是多少?样本容量是多少?
若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。
分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1。
解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,
因此第二小组的频率为:
由频率=,得
(2)由图可估计该学校高一学生的达标率
约为
(3)由已知可得各小组的频数依次为6,12,
51,45,27,9,所以前三组的频数之
和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内。
例2、从两个班中各随机的抽取10名学生,他们的数学成绩如下:
甲班:76,74,82,96,66,76,78,72,52,68
乙班:86,84,62,76,78,92,82,74,88,85
画出茎叶图并分析两个班学生的数学学习情况。
解析:
由茎叶图可知,乙班的成绩较好,而且较稳定。
【课堂小结】
1、制作频率分布直方图分几个步骤?各步骤需要注意哪些问题?
2、频率分布直方图和茎叶图相比有什么特点?
答:1、步骤:
(1)计算一组数据中最大值与最小值的差,即求极差
(2)决定组距与组数,(组距是人为决定的)
(3)将数据分组
(4)列频率分布表(必须包括分组、频数、频率三部分)
(5)画频率分布直方图(注意纵坐标表示什么,各小长方形是连在一起的)
3、频率分布直方图无法看到原始数据,而茎叶图能看出原始数据;但频率分布直方图所体现的内容比茎叶图多。
【书面作业】导学案课后练习与提高
【板书设计】
2.2.1 用样本的频率分布估计总体分布
课前预习学案
一、预习目标:在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;
二、预习内容:阅读课本~
三.完成下列问题:
1. 一般用频率分布直方图反映样本的频率分布。其一般步骤有哪些? 频率分布直方图的特征是什么?
2.茎叶图的特征是什么?
课内探究学案
学习目标
1. 通过实例体会分布的意义和作用;
2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;
3. 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。
重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图
难点:能通过样本的频率分布估计总体的分布
学习过程
【复习回顾】
说一说简单随机抽样、系统抽样、分层抽样各自的特点、操作步骤和适用的范围。
类 别
共同点
各自特点
联 系
适用范围
简单随机
抽样
(1)抽样过程中每个个体被抽到的可能性相等
(2)每次抽出个体后不再将它放回,即不放回抽样
从总体中逐个抽取
总体个数较少
系统抽样
将总体均分成几部 分,按预先制定的规则在各部分抽取
在起始部分样时采用简随机抽样
总体个数较多
分层抽样
将总体分成几层,分层进行抽取
分层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
【新知探究】
我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢 ?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?
【自主学习】
一、频率分布直方图
1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:
2.以课本制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图。
3.频率分布直方图的特征:
思考探究:
(1)在频率分布直方图中,各小长方形的面积表示什么?它们的总和是多少?
(2)同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?
(3)如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-1和频率分布直方图2.2-1,(见课本)你能对制定月用水量标准提出建议吗?
二、频率分布折线图、总体密度曲线
1.频率分布折线图的定义:
2.总体密度曲线的定义:
在样本频率分布直方图中,随着样本容量的增加,所分组数的增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。(见课本)
思考探究:
(1)对于任何一个总体,它的密度曲线是不是一定存在?为什么?
(2)对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?
三.茎叶图
1.茎叶图的概念:
当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本例子)
2.茎叶图的特征:
典型例题
例1、下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)画出频率分布折线图;
(4)估计身高小于134cm的人数占总人数的百分比.。
变式训练:
为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.
第二小组的频率是多少?样本容量是多少?
若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。
例2、从两个班中各随机的抽取10名学生,他们的数学成绩如下:
甲班:76,74,82,96,66,76,78,72,52,68
乙班:86,84,62,76,78,92,82,74,88,85
画出茎叶图并分析两个班学生的数学学习情况。
当堂检测
1.为了解一批数据在各个范围内所占的比例大小,将这批数据分组,落在各个小组里的
数据个数叫做 ( )
A、频数 B、样本容量 C、频率 D、频数累计
2.在频率分布直方图中,各个小长方形的面积表示 ( )
A、落在相应各组的数据的频数 B、相应各组的频率
C、该样本所分成的组数 D、该样本的容量
3.列样本频率分布表时,决定组数的正确方法是 ( )
A、任意确定 B、一般分为5—12组
C、由组距和组数决定 D、根据经验法则,灵活掌握
4.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40,0、125,则n的值为( )
A、640 B、320 C、240 D、160
5.为考察某种皮鞋的各种尺码的销售情况,以某天销售40双皮鞋为一个样本,把它按尺码分成5组,第3组的频率为0、25,第1,2,4组的频率分别为6,7,9,若第5组表示的是40—42码的皮鞋,则售出的200双皮鞋中含40—42码的皮鞋为( )
A、50 B、40 C、20 D、30
6.一个容量为20 的样本数据,分组后组距与频数如下:
(10,20],2;(20,30],3;(30,40],4;(40,50],4;(60,70],2。则样本在区间(-,50]上的频率是( )
A、5% B、25% C、50% D、70%
7.将一批数据分成5组列出频率分布表,其中第1组的频率是0、1,第4组与 第5组的频率之和是0、3,那么第2组与第3组的频率之和是 。
反思总结
课后练习与提高
1.从一群学生中收取一个一定容量的样本对他们的学习成绩进行分析,前三组是不超过80分的人,其频数之和为20人,其频率之和(又称累积频率)为0、4,则所抽取的样本的容量是 ( )
A、100 B、80 C、40 D、50
2.下列叙述中正确的是 ( )
A、从频率分布表可以看出样本数据对于平均数的波动大小
B、频数是指落在各个小组内的数据
C、每小组的频数与样本容量之比是这个小组的频率
D、组数是样本平均数除以组距
3.有一个数据为50的样本数据分组,以及各组的频数如下,根据累积频率分布,估计小于30的数据大约占多少( )
[12、5,15、5),3;[15、5,18、5),8;[18、5,21、5),9;[21、5,24、5),11;[24、5,27、5),10;[30、5,33、5),4
A、10% B、92% C、5% D、30%
4.在抽查某产品尺寸的过程中,将其尺寸分成若干组,[a,b]是其中一组,抽查出的个体数在该组上的频率为m,该组上的直方图的高是h,则,[a-b]等于( )
A、hm B、 C、 D、 与m,h无关
5.已知一个样本75,71,73,75,77,79,75,78,80,79,76,74,75,77,76,72,74,75,76,78。在列频率分布表时,如果组距取为2,那么应分成 组,第一组的分点应是 — ,74、5—76、5这组的频数应为 ,频率应为 。
6.在求频率分布时,把数据分为5组,若已知其中的前四组频率分别为0、1,0、3,0、3,0、1,则第五组的频率是 ,这五组的频数之比为 。
7.为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组及频率如下表:
分组
频数
频率
[10、75,10、85)
3
[10、85,10、95)
9
[10、95,11、05)
13
[11、05,11、15)
16
[11、15,11、25)
26
[11、25,11、35)
20
[11、35,11、45)
7
[11、45,11、55)
4
[11、55,11、65)
2
合计
100
完成上面的频率分布表;
根据上表画出频率分布直方图;
根据上表和图,估计数据落在[10、95,11、35)范围内的概率约是多少?
数据小于11、20的概率约是多少?
§2.2.1用样本的频率分布估计总体分布
学习目标
(1) 通过实例体会分布的意义和作用。
(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
(3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。
重点难点
重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
难点:能通过样本的频率分布估计总体的分布
学法指导
通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。
知识链接
简单随机抽样、系统抽样和分层抽样常用方法及其操作步骤。
问题探究
一、情景设置:
在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕
甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50
乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33
请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?
如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布。
二、探究新知:
知识探究(一):频率分布表
问题:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t):
分 组
频数累计
频数
频率
[0,0.5)
[0.5,1)
[1,1.5)
[1.5,2)
[2,2.5)
[2.5,3)
[3,3.5)
[3.5,4)
[4,4.5]
合计
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6
3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4
3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8
3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1
3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3
3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0
2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3
2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4
2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4
2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
思考1:上述100个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么?
思考2:样本数据中的最大值和最小值的差称为极差.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?
思考3:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?
思考4:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?
思考5:上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?
思考6:如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?
思考7:在实际中,取a=3t一定能保证85%以上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?
思考8:对样本数据进行分组,其组数是由哪些因素确定的?
思考9:当样本容量不超过100时,按照数据的多少,常分成5~12组.若以0.1或1.5为组距对上述100个样本数据分组合适吗?
思考10:一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?
知识探究(二):频率分布直方图
为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的频率分布直方图(参考课本67页图2.2-1)表示。
思考1:频率分布直方图中各小长方形的和高度在数量上有何特点?
思考2:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?
思考3:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?
思考4:样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布直方图的作图步骤如何?
思考5:对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,请你以0.1和1为组距画频率分布直方图,然后谈谈你对图的印象?
例 某地区为了了解知识分子的年龄结构,
随机抽样50名,其年龄分别如下:
42,38,29,36,41,43,54,43,34,44,
40,59,39,42,44,50,37,44,45,29,
48,45,53,48,37,28,46,50,37,44,
42,39,51,52,62,47,59,46,45,67,
53,49,65,47,54,63,57,43,46,58.
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)估计年龄在32~52岁的知识分子所占的比例约是多少.
探究(三):频率分布折线图与总体密度曲线
思考1:在城市居民月均用水量样本数据的频率分布直方图中,各组数据的平均值大致是哪些数?
思考2:在频率分布直方图中,依次连接各小长方形上端的中点,就得到一条折线,这条折线称为频率分布折线图. 你认为频率分布折线图能大致反映样本数据的频率分布吗?(参考课本69页图2.2-2,并在学案上画出此图)
思考3:当总体中的个体数很多时(如抽样调查全国城市居民月均用水量),随着样本容量的增加,作图时所分的组数增多,组距减少,你能想象出相应的频率分布折线图会发生什么变化吗?(参考课本69页图2.2-3)
思考4:在上述背景下,相应的频率分布折线图越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.那么图中阴影部分的面积有何实际意义?
思考5:当总体中的个体数比较少或样本数据不密集时,是否存在总体密度曲线?为什么?
思考6:对于一个总体,如果存在总体密度曲线,这条曲线是否惟一?能否通过样本数据准确地画出总体密度曲线?
探究(四):茎叶图
频率分布表、频率分布直方图和折线图的主要作用是表示样本数据的分布情况,此外,我们还可以用茎叶图来表示样本数据的分布情况.
【问题】 某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:
甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;
乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.
助教在比赛中将这些数据记录为如下形式:
思考1:你能理解这个图是如何记录这些数据的吗?你能通过该图说明哪个运动员的发挥更稳定吗?
思考2:在统计中,上图叫做茎叶图,它也是表示样本数据分布情况的一种方法,其中“茎”指的是哪些数,“叶”指的是哪些数?
思考3:对于样本数据:3.1,2.5,2.0,0.8,1.5,1.0,4.3,2.7,3.1,3.5,用茎叶图如何表示?
思考4:一般地,画出一组样本数据的茎叶图的步骤如何?
思考5:用茎叶图表示数据的分布情况是一种好方法,你认为茎叶图有哪些优点?
思考6:比较茎叶图和频率分布表,茎叶图中“茎”和“叶”的数目分别与频率分布表中哪些数目相当?
思考7:对任意一组样本数据,是否都适合用茎叶图表示?为什么?
课件37张PPT。新知自解频率分布数字特征中点光滑曲线茎叶大小次序“叶”解析: 直方图的高表示频率与组距的比值,直方图的面积为频率.
答案: A答案: D解析: 组距为4,(1)0.08×4=0.32,(2)1 000×(0.09×4)=360.
答案: (1)0.32 (2)360课堂探究答案: (1)A答案: A答案: (1)96,92 乙
答案: B
谢谢观看!学业分层测评(十二) 用样本的频率分布估计总体分布
(建议用时:45分钟)
[学业达标]
一、选择题
1.下列命题正确的是( )
A.频率分布直方图中每个小矩形的面积等于相应组的频数
B.频率分布直方图的面积为对应数据的频率
C.频率分布直方图中各小矩形高(平行于纵轴的边)表示频率与组距的比
D.用茎叶图统计某运动员得分:13,51,23,8,26,38,16,33,14,28,39时,茎是指中位数26
【解析】 在频率分布直方图中,横轴表示样本数据;纵轴表示,由于小矩形的面积=组距×=频率,所以各小矩形的面积等于相应各组的频率,因此各小矩形面积之和等于1.
【答案】 C
2.将容量为100的样本数据,按由小到大排列分成8个小组,如下表所示:
组号
1
2
3
4
5
6
7
8
频数
10
13
14
14
15
13
12
9
第3组的频率和累积频率为( )
A.0.14和0.37 B.和
C.0.03和0.06 D.和
【解析】 由表可知,第三小组的频率为=0.14,累积频率为=0.37.
【答案】 A
3.如图2-2-8所示是一容量为100的样本的频率分布直方图,则由图形中的数据可知样本落在[15,20)内的频数为( )
图2-2-8
A.20 B.30
C.40 D.50
【解析】 样本数据落在[15,20)内的频数为100×[1-5×(0.04+0.1)]=30.
【答案】 B
4.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图2-2-9所示),则该样本的中位数、众数、极差分别是( )
图2-2-9
A.46,45,56 B.46,45,53
C.47,45,56 D.45,47,53
【解析】 由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.
【答案】 A
5.某学校组织学生参加英语测试,成绩的频率分布直方图如图2-2-10,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15人,则该班的学生人数是( )
图2-2-10
A.45 B.50
C.55 D.60
【解析】 根据频率分布直方图的特点可知,低于60分的频率是(0.005+0.01)×20=0.3,所以该班的学生人数是=50.
【答案】 B
二、填空题
6.200辆汽车通过某一段公路时的时速的频率分布直方图如图2-2-11所示,时速在[50,60)的汽车大约有______辆.
图2-2-11
【解析】 在[50,60)的频率为0.03×10=0.3,
∴汽车大约有200×0.3=60(辆).
【答案】 60
7.(2016·东营高一检测)从甲、乙两个班中各随机选出15名同学进行随堂测验,成绩的茎叶图如图2-2-12所示,则甲、乙两组的最高成绩分别是________,________,从图中看,________班的平均成绩较高.
图2-2-12
【解析】 由茎叶图可知,甲班的最高分是96,乙班的最高分是92.甲班的成绩集中在60~80之间,乙班成绩集中在70~90之间,故乙班的平均成绩较高.
【答案】 96 92 乙
8.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50度至350度之间,频率分布直方图如图2-2-13所示:
图2-2-13
(1)直方图中x的值为________;
(2)在这些用户中,用电量落在区间[100,250)内的户数为________.
【解析】 由于(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,解得x=0.004 4;数据落在[100,250)内的频率是(0.003 6+0.006 0+0.004 4)×50=0.7,所以月用电量在[100,250)内的用户数为100×0.7=70.
【答案】 (1)0.004 4 (2)70
三、解答题
9.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),实验的观测结果如下:
服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5
2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4
服用B药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4
1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5
(1)分别计算两种药的平均数,从计算结果看,哪种药的疗效更好?
(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好? 【导学号:28750037】
图2-2-14
【解】 (1)设A药观测数据的平均数为,B药观测数据的平均数为.由观测结果可得
=(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,
=(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.
由以上计算结果可得>,因此可看出A药的疗效更好.
(2)由观测结果可绘制茎叶图如图:
从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎“2.”,“3.”上,而B药疗效的试验结果有的叶集中在茎“0.”,“1.”上,由此可看出A药的疗效更好.
10.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图2-2-15),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
图2-2-15
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
【解】 (1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为=0.08.
又因为第二小组的频率=,
所以样本容量===150.
(2)由频率分布直方图可估计,该校高一年级学生的达标率为:
×100%=88%.
[能力提升]
1.如图2-2-16是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知( )
图2-2-16
A.甲运动员的成绩好于乙运动员
B.乙运动员的成绩好于甲运动员
C.甲、乙两名运动员的成绩没有明显的差异
D.甲运动员的最低得分为0分
【解析】 由茎叶图可以看出甲运动员的成绩主要集中在30至40之间,比较稳定,而乙运动员均匀地分布在10至40之间,所以甲运动员成绩较好.故选A.
【答案】 A
2.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图2-2-17所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )
图2-2-17
【解析】 借助已知茎叶图得出各小组的频数,再由频率=求出各小组的频率,进一步求出并得出答案.
法一 由题意知样本容量为20,组距为5.
列表如下:
分组
频数
频率
[0,5)
1
0.01
[5,10)
1
0.01
[10,15)
4
0.04
[15,20)
2
0.02
[20,25)
4
0.04
[25,30)
3
0.03
[30,35)
3
0.03
[35,40]
2
0.02
合计
20
1
观察各选择项的频率分布直方图知选A.
法二 由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、也分别相等,比较四个选项知A正确,故选A.
【答案】 A
图2-2-18
3.某校开展“爱我海西,爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是________.
【解析】 当x≤4时,
=91,
解之得x=1.当x>4时,易证不合题意.
【答案】 1
4.某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图:(如图2-2-19所示)
分组
频数
频率
一组
0≤t<5
0
0
二组
5≤t<10
10
0.10
三组
10≤t<15
10
②
四组
15≤t<20
①
0.50
五组
20≤t≤25
30
0.30
合计
100
1.00
图2-2-19
解答下列问题:
(1)这次抽样的样本容量是多少?
(2)在表中填写出缺失的数据并补全频率分布直方图;
(3)旅客购票用时的平均数可能落在哪一组?
【解】 (1)样本容量是100.
(2)①50 ②0.10 所补频率分布直方图如图中的阴影部分:
(3)设旅客平均购票用时为t min,则有
≤t
<,
即15≤t<20.所以旅客购票用时的平均数可能落在第四组.
课件35张PPT。第二章 §2.2 用样本估计总体2.2.1 用样本的频率分布估计总体分布(一)1.体会分布的意义和作用;
2.学会用频率分布表,画频率分布直方图表示样本数据;
3.能通过频率分布表或频率分布直方图对数据做出总体统计.问题导学题型探究达标检测学习目标知识点一 用样本估计总体答案问题导学 新知探究 点点落实思考 还记得我们抽样的初衷吗?答案 用样本去估计总体,为决策提供依据.(1)用样本的 估计总体的分布.
(2)用样本的 估计总体的数字特征.频率分布数字特征思考 通过抽样获得的原始数据有什么缺点?答案知识点二 数据分析的基本方法答案 因为通过抽样获得的原始数据多而且杂乱,无法直接从中理解它们的含义,并提取信息,也不便于我们用它来传递信息.(1)借助于图形
分析数据的一种基本方法是用图将它们画出来,此方法可以达到两个目的,一是从数据中 信息,二是利用图形 信息.
(2)借助于表格
分析数据的另一种方法是用紧凑的 改变数据的排列方式,此方法是通过改变数据的 ,为我们提供解释数据的新方式.提取传递表格构成形式思考 要做频率分布表,需要对原始数据做哪些工作?答案知识点三 频率分布表与频率分布直方图答案 分组,频数累计,计算频数和频率.再根据频率分布表做频率分布直方图.?频率/组距小长方形的面积1返回类型一 利用原始数据绘制频率分布表例1 从某校高一年级的1 002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表,并估计身高不小于170(cm)的同学所占的百分率.题型探究 重点难点 个个击破解析答案反思与感悟解 (1)在全部数据中找出最大值180与最小值151,它们相差(极差)29,决定组距为3;
(2)将区间[150.5,180.5]分成10组;分别是[150.5,153.5),[153.5,156.5),…,[177.5,180.5);
(3)从第一组[150.5,153.5)开始分别统计各组的频数,再计算各组的频率,列频率分布表;解析答案反思与感悟反思与感悟分组时先找到最大值和最小值,以便于确定分组的起点和终点.组距的选择应力求“取整”.区间端点要不重不漏,以便每个数据进且只进一个组.反思与感悟跟踪训练1 有100名学生,每人只能参加一个运动队,其中参加足球队的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人.
(1)列出学生参加运动队的频率分布表;解析答案解 参加足球队记为1,参加篮球队记为2,参加排球队记为3,参加乒乓球队记为4,得频率分布表如下:(2)画出频率分布条形图.解析答案解 由上表可知频率分布条形图如下:类型二 根据频率分布表绘制频率分布直方图解析答案例2 下表给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).(1)列出样本频率分布表;解 样本频率分布表如下:解析答案(2)画出频率分布直方图;解 其频率分布直方图如下:解析答案反思与感悟(3)估计身高小于134 cm的人数占总人数的百分比.解 由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.反思与感悟跟踪训练2 从某校高三学生中抽取50名参加数学竞赛,成绩分组(单位:分)及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8.
(1)列出样本的频率分布表(含累积频率);解析答案解 频率分布表如下:(2)画出频率分布直方图;解析答案解 频率分布直方图如图所示.(3)估计成绩在[60,90)分的学生比例.解析答案解 成绩在[60,90)分的学生比例,即学生成绩在[60,90)分的频率0.2+0.3+0.24=0.74=74%.所以估计成绩在[60,90)分的学生比例为74%.类型三 频率分布表及频率分布直方图的应用例3 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?解析答案(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?解析答案反思与感悟在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.反思与感悟解析答案跟踪训练3 在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共有100个数据,将数据分组如下表:(1)完成频率分布表,并画出频率分布直方图;解 频率分布表如下:解析答案频率分布直方图如图所示.解析答案返回(2)估计纤度落在[1.38,1.50)内的可能性及纤度小于1.42的可能性各是多少?解 纤度落在[1.38,1.50)的可能性即为纤度落在[1.38,1.50)的频率,即为0.3+0.29+0.10=0.69=69%.
纤度小于1.42的可能性即为纤度小于1.42的频率,即为0.04+0.25+0.30=0.59=59%.1.在用样本的频率分布估计总体的频率分布的过程中,下列说法正确的是( )
A.总体的容量越大,估计越准确
B.总体的容量越小,估计越准确
C.样本的容量越大,估计越准确
D.样本的容量越小,估计越准确C达标检测 12345答案2.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40,0.125,则n的值为( )
A.640 B.320 C.240 D.160B12345解析答案3.在第十六届亚运会中,各个国家和地区金牌获得情况统计如图:12345答案从图中可以看出中国所获得金牌数占全部金牌数的比例约是( )
A.41.7% B.59.8%
C.67.3% D.94.8%A4.在画频率分布直方图时,某组的频数为10,样本容量为50,总体容量为600,则该矩形的面积是( )A12345答案123455.有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15.5],3;(15.5,18.5],8;(18.5,21.5],9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的( )
A.91% B.92% C.95% D.30%A解析答案规律与方法1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.
2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.
3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.返回课件23张PPT。2.2.1 用样本的频率分布估计总体分布(二)第二章 §2.2 用样本估计总体1.了解频率折线图和总体密度曲线的定义;
2.理解茎叶图的概念,会画茎叶图;
3.了解频率分布直方图、频率折线图、茎叶图的各自特征,学会选择不同的方法分析样本的分布,从而作出总体估计.问题导学题型探究达标检测学习目标知识点一 频率分布折线图和总体密度曲线答案问题导学 新知探究 点点落实1.频率分布折线图
连接频率分布直方图中各小长方形 ,就得到频率分布折线图.
2.总体密度曲线
随着样本容量的增加,作图时所分的 增加,组距减小,相应的频率折线图会越来越接近于一条 ,统计中称这条光滑曲线为总体密度曲线,它反映了总体在各个范围内取值的百分比.上端的中点组数光滑曲线思考 茎叶图是表示样本数据分布情况的一种方法,那么“茎”、“叶”分别指的是哪些数?答案知识点二 茎叶图答案 茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.
适用范围:当样本数据较少时,用茎叶图表示数据的效果较好.优点:它不但可以 ,而且可以 ,给数据的记录和表示都带来方便.
缺点:当样本数据 时,枝叶就会很长,茎叶图就显得不太方便.答案保留所有信息随时记录较多返回类型一 茎叶图的画法解析答案反思与感悟例1 某中学甲、乙两名同学最近几次的数学考试成绩情况如下:
甲的得分:95,81,75,89,71,65,76,86,91,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,88,110,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.题型探究 重点难点 个个击破解 甲、乙两人数学成绩的茎叶图如图所示.
从这个茎叶图上可以看出,乙同学的得分情况大致是对称的,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此乙同学发挥比较稳定,总体得分情况比甲同学好.茎叶图和频率分布表极为类似,事实上,茎相当于频率分布表中的分组;茎上叶的数目相当于频率分布表中指定区间组的频率.反思与感悟跟踪训练1 某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:
甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;
乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.
试制作茎叶图来对比描述这些数据.解析答案解 以十位数字为茎,个位数字为叶,制作茎叶图如下:类型二 从茎叶图看分布的特征解析答案反思与感悟例2 甲、乙两位同学在高三的5次月考中数学成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别是x甲,x乙,则下列正确的是( )
A.x甲>x乙;乙比甲成绩稳定
B.x甲>x乙;甲比乙成绩稳定
C.x甲D.x甲A.5 B.4 C.3 D.2解析答案解析 去掉最低分87,去掉最高分94(假设x≤4),则7×91=80×2+9+8+90×5+2+3+2+1+x,
∴x=2,符合题意.
同理可验证x>4不合题意.D类型三 频数分布直方图与茎叶图的比较例3 从甲、乙两个城市所有的自动售货机中随机抽取16台,记录了上午8∶00~11∶00之间各自的销售情况(单位:元)
甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;
乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.
试用纵坐标为频数的频数分布直方图与茎叶图的方式分别表示上面的数据,并简要说明各自的优点.解析答案反思与感悟解析答案解 方法一 用频数分布直方图表示如图:方法二 茎叶图如图,两竖线中间的数字表示甲、乙销售额的十位数,两边的数字表示甲、乙销售额的个位数.反思与感悟从方法一可以看出频数分布直方图能直观地反映数据分布的大致情况,并且能够清晰地表示出各个区间的具体数目;从方法二可以看出,用茎叶图表示有关数据,对数据的记录和表示都带来方便.反思与感悟茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录,但样本容量较大,或者需要比较三组以上的数据时,使用茎叶图就不合适;而频率分布表和频率分布直方图可以处理样本容量很大的数据,但损失了样本的原始数据,而且必须在完成抽样后才能制作.反思与感悟解析答案返回跟踪训练3 试比较例3中用到的频数分布直方图和频率分布直方图的区别.解 首先频数分布直方图的纵坐标为频数,因此其顶点纵坐标是非负整数.
频率分布直方图的纵坐标为频率/组距,因此其每个组段的频率就是对应小长方形的面积,且总面积为1.当样本量n增大并且组距越来越小时,相应的小长方形越来越细,其各小长方形上端的中点的连线构成了一条光滑曲线,而这条光滑曲线下的面积为1,这条光滑曲线称为总体密度曲线.1.如图是总体密度曲线,下列说法正确的是( )
A.组距越大,频率分布折线图越接近于它
B.样本容量越小,频率分布折线图越接近于它
C.阴影部分的面积代表总体在(a,b)内取值的百分比
D.阴影部分的平均高度代表总体在(a,b)内取值的百
分比C达标检测 12345答案2.对一个未知总体,下列方法:①频率分布直方图;②频率分布表;③频率分布折线图;④茎叶图;⑤总体密度曲线
其中可以用来表示样本数据的频率分布的有( )
A.2种 B.3种 C.4种 D.5种C12345答案3.在茎叶图中比40大的数据有( )
A.2个 B.3个
C.4个 D.5个B12345答案4.从茎叶图观察比较甲、乙成绩哪个稳定的问题,下列说法正确的是( )
A.主要看叶,叶越齐越稳定
B.主要看众数,等于众数的数据越多越稳定
C.主要看中位数,中位数越大越稳定
D.主要是看成绩的分布,在中位数附近相对集中,则成绩稳定D12345答案123455.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )
A.91 B.91.5
C.92 D.95答案C规律与方法1.估计总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.
2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录;而频率分布表和频率分布直方图则损失了样本的原始信息,必须在完成抽样后才能制作.返回3.正确利用三种分布的描述方法,都能得到一些有关分布的主要特点(如分布是否具有单峰性、是否具有对称性、样本点落在各分组中的频率等),这些主要特点受样本的随机性的影响比较小,更接近于总体分布相应的特点.
2.2.1 用样本的频率分布估计总体分布
课时目标 1.理解用样本的频率分布估计总体分布的方法.2.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图.3.能够利用图形解决实际问题.
1.用样本估计总体的两种情况
(1)用样本的____________估计总体的分布.
(2)用样本的____________估计总体的数字特征.
2.数据分析的基本方法
(1)借助于图形
分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中____________,二是利用图形________信息.
(2)借助于表格
分析数据的另一方法是用紧凑的________改变数据的排列方式,此法是通过改变数据的____________,为我们提供解释数据的新方式.
3.频率分布直方图
在频率分布直方图中,纵轴表示____________,数据落在各小组内的频率用________________来表示,各小长方形的面积的总和等于____.
4.频率分布折线图和总体密度曲线
(1)频率分布折线图
连接频率分布直方图中各小长方形__________,就得到了频率分布折线图.
(2)总体密度曲线
随着样本容量的增加,作图时所分的____增加,组距减小,相应的频率分布折线图就会越来越接近于一条________,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.
5.茎叶图
(1)适用范围:
当样本数据较少时,用茎叶图表示数据的效果较好.
(2)优点:它不但可以____________,而且可以__________,给数据的记录和表示都带来方便.
(3)缺点:
当样本数据______时,枝叶就会很长,茎叶图就显得不太方便.
一、选择题
1.下列说法不正确的是( )
A.频率分布直方图中每个小矩形的高就是该组的频率
B.频率分布直方图中各个小矩形的面积之和等于1
C.频率分布直方图中各个小矩形的宽一样大
D.频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的
2.一个容量为100的样本,其数据的分组与各组的频数如下:
组别
(0,10]
(10,20]
(20,30]
(30,40]
(40,50]
(50,60]
(60,70]
频数
12
13
24
15
16
13
7
则样本数据落在(10,40]上的频率为( )
A.0.13 B.0.39 C.0.52 D.0.64
3.100辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[60,70)的汽车大约有( )
A.30辆 B.40辆
C.60辆 D.80辆
4.如图是总体密度曲线,下列说法正确的是( )
A.组距越大,频率分布折线图越接近于它
B.样本容量越小,频率分布折线图越接近于它
C.阴影部分的面积代表总体在(a,b)内取值的百分比
D.阴影部分的平均高度代表总体在(a,b)内取值的百分比
5.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为( )
A.20% B.69%
C.31% D.27%
6.某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )
A.90 B.75 C.60 D.45
题 号
1
2
3
4
5
6
答 案
二、填空题
7.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.
8.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________.
9.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.
三、解答题
10.抽查100袋洗衣粉,测得它们的重量如下(单位:g):
494 498 493 505 496 492 485 483 508
511 495 494 483 485 511 493 505 488
501 491 493 509 509 512 484 509 510
495 497 498 504 498 483 510 503 497
502 511 497 500 493 509 510 493 491
497 515 503 515 518 510 514 509 499
493 499 509 492 505 489 494 501 509
498 502 500 508 491 509 509 499 495
493 509 496 509 505 499 486 491 492
496 499 508 485 498 496 495 496 505
499 505 496 501 510 496 487 511 501
496
(1)列出样本的频率分布表:
(2)画出频率分布直方图,频率分布折线图;
(3)估计重量在[494.5,506.5]g的频率以及重量不足500 g的频率.
能力提升
11.在某电脑杂志的一篇文章中,每个句子的字数如下:
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17
在某报纸的一篇文章中,每个句子的字数如下:
27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22
(1)将这两组数据用茎叶图表示;
(2)将这两组数据进行比较分析,你会得到什么结论?
12.某市2010年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,
95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
(1)完成频率分布表.
(2)作出频率分布直方图.
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.
请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
绘制频率分布直方图的具体步骤:①求极差:找出一组数据中的最大值和最小值,最大值与最小值的差是极差(正值).②确定组距与组数:组数与样本容量有关,当样本容量不超过100时,按照数据的多少,常分成5~12组;组距的选择力求“取整”,组数=.③将数据分组:将数据分成互不相交的组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.④列频率分布表:一般分“分组”、“频数累计”、“频数”、“频率”四列,最后一行是合计.注意频数的合计是样本容量,频率的合计是1.⑤绘制频率分布直方图:根据频率分布表绘制频率分布直方图,其中纵轴表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积,即每个矩形的面积=组距×=频率.这样频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小,各小矩形的面积的总和等于1.
答案: 2.2.1 用样本的频率分布估计总体分布
知识梳理
1.(1)频率分布 (2)数字特征 2.(1)提取信息 传递 (2)表格 构成形式 3.频率/组距 小长方形的面积 1 4.(1)上端的中点 (2)组数 光滑曲线
5.(2)保留所有信息 随时记录 (3)较多
作业设计
1.A
2.C [样本数据落在(10,40]上的频数为13+24+15=52,故其频率为=0.52.]
3.B [时速在[60,70)的汽车的频率为:
0.04×(70-60)=0.4,
又因汽车的总辆数为100,
所以时速在[60,70)的汽车大约有0.4×100=40(辆).]
4.C
5.C [由题意,样本中落在[20,+∞)上的频数为5+4+2=11,∴在区间[20,+∞)上的频率为≈0.31.]
6.A [∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,
∴样本总数为=120.
∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,
∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.]
7.60
解析 ∵n·=27,
∴n=60.
8.45,46
解析 由茎叶图及中位数的概念可知
x甲中=45,x乙中=46.
9.
解析 =h,故|a-b|=组距==.
10.解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于=8,要分9组,组数合适,于是决定取组距为4 g,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下:
[482.5,486.5),[486.5,490.5),…,[514.5,518.5).
列出频率分布表:
分组
个数累计
频数
频率
累积频率
[482.5,486.5)
正
8
0.08
0.08
[486.5,490.5)
3
0.03
0.11
[490.5,494.5)
正正正
17
0.17
0.28
[494.5,498.5)
正正正正-
21
0.21
0.49
[498.5,502.5)
正正
14
0.14
0.63
[502.5,506.5)
正
9
0.09
0.72
[506.5,510.5)
正正正
19
0.19
0.91
[510.5,514.5)
正-
6
0.06
0.97
[514.5,518.5]
3
0.03
1.00
合计
100
1.00
(2)频率分布直方图与频率分布折线图如图.
(3)重量在[494.5,506.5]g的频率为:0.21+0.14+0.09=0.44.
设重量不足500 g的频率为b,根据频率分布表,
≈,故b≈0.55.因此重量不足500 g的频率约为0.55.
11.解 (1)
(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.
12.解 (1)频率分布表:
分组
频数
频率
[41,51)
2
[51,61)
1
[61,71)
4
[71,81)
6
[81,91)
10
[91,101)
5
[101,111]
2
(2)频率分布直方图如图所示.
(3)答对下述两条中的一条即可:
①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的;有26天处于良的水平,占当月天数的;处于优或良的天数为28,占当月天数的.说明该市空气质量基本良好.
②轻微污染有2天,占当月天数的;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的,超过50%;说明该市空气质量有待进一步改善.