2.2.1用样本的频率分布估计总体分布
班级:__________姓名:__________设计人:__________日期:__________
课前预习
·
预习案
温馨寄语
从不浪费时间的人,没有工夫抱怨时间不够。——杰弗逊
学习目标
1.理解用样本的频率分布估计总体分布的方法.
2.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图.
3.能够利用图形解决实际问题,通过实例体
( http: / / www.21cnjy.com )会频率分布直方图、频率分布折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地作出总体估计.
学习重点
会列频率分布表,画频率分布直方图、频率折线图和茎叶图
学习难点
能通过样本的频率分布估计总体的分布
自主学习
1.数据分析的基本方法
(1)借助于图形:分析数据的一种基本方法是
( http: / / www.21cnjy.com )用图将它们画出来,此法到两个目的,一是从数据中
信息,二是利用图形
信息.
(2)借助于表格:分析数据的另一方法是用紧
( http: / / www.21cnjy.com )凑的
改变数据的式,此法是通过改变数据的,为我们提供解释数据的
新方式.
2.频率分布表、频率分布直方图
(1)频率分布表的制作过程:
①求极差;
②
;
③将数据分组;
④
;
(2)频率分布直方图
纵轴表示
.数据落在各小组内的频率用小长方形的
表示.各小长方形的面积总和等于
.
3.频率分布折线图与总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的
,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的
( http: / / www.21cnjy.com )
,作图时所分的组数
,组距
,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
4.茎叶图
顾名思义,茎是指
的一列数,叶就是从茎的
生长出来的数,通常中间的数字表示数据的十位数,旁边的数字位数,分别表示两组数据的个位数.
预习评价
1.在用样本频率估计总体分布的过程中,下列说法正确的是
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确
2.在已分组的数据中,每组的频数是指
,每组的频率是指
.
3.频率分布直方图中,小长方形的面积等于
.
4.如图表示8位销售员一个月销售商品数量的茎叶图,则销售数据分别为
(单位百件).
( http: / / www.21cnjy.com )
5.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为
.
知识拓展
·
探究案
合作探究
1.频率分布的概念
我国是世界上严重缺水的国家之一,城
( http: / / www.21cnjy.com )市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准n定为多少比较合理呢?请回答下列问题.
(1)你认为,为了较为合理地确定出这个标准,需要做哪些工作?
(2)如何分析样本数据,才能更好地估计全市居民的用水分布情况呢?
2.频率分布直方图与频率分布表
在频率分布直方图中,各小长方形的面积表示什么?它们的总和是多少?
( http: / / www.21cnjy.com )
3.频率分布直方图与频率分布表
对样本数据进行分组,其组数是由哪些因素确定的?
4.频率分布直方图与频率分布表
一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?
5.频率分布直方图与频率分布表
怎样利用频率分布直方图估计总体的分布?
6.频率分布折线图、总体密度曲线
如何由频率分布直方图得到频率分布折线图?
7.频率分布折线图、总体密度曲线
对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?
8.频率分布折线图、总体密度曲线
当总体中的个体数比较少或样本数据不密集时,是否存在总体密度曲线?为什么?
9.茎叶图
在统计中,下图叫做茎叶图,它也是表示样本数据分布情况的一种方法,其中“茎”指的是哪些数,“叶”指的是哪些数?
( http: / / www.21cnjy.com )
10.茎叶图
茎叶图中,“茎”和“叶”的划分是固定不变的吗?
11.茎叶图
茎叶图中的茎与叶一般是按什么顺序排列的?重复的数据如何处理?
教师点拨
1.频率分布中样本的抽取
用样本频率分布来估计总体分布时,要
( http: / / www.21cnjy.com )使样本很好地反映总体的特征,必须随机抽取样本,如果随机抽取另外一个相同容量的样本,所形成的样本频率分布一般会与前一个样本频率分布有所不同,但是它们都可以近似地估计总体的分布.
2.用作图和列表分析数据
作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.
3.对频率分布直方图的两点说明
(l)从频率分布直方图可以清楚地看出数据分布的总体趋势.
(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
4.频率分布表与频率分布直方图的区别
(1)频率分布表列出的是在各个不同区间内取值的频率.
(2)频率分布直方图是用小长方形面积的大小来表示在各个区间内取值的频率.
5.对频率分布折线图的说明
频率分布折线图是连接频率分布直方图中各长方形上端的中点得到的,相邻两个中点之间是直线连接,分组越多,折线图越来越接近一条平滑曲线.
6.总体密度曲线的图象形式
总体密度曲线可看成是函数的图象,对一些特殊的密度曲线,其函数解析式是可求的.
7.茎叶图表示数据的分布情况的优点
(1)保留了原始数据,没有损失样本信息.
(2)数据可以随时记录、添加或修改.
8.茎叶图的特征
茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰.
交流展示——频率分布表与频率分布直方图
1.在样本频率分布直方图中,某个小长方形的面积是其他小长方形的面积之和的,已知样本容量是80,则该组的频数为
A.20
B.16
C.30
D.35
2.某行业从2013年开始实施绩效工资改革,为了解该行业职工工资收入情况,调查了1
000名该行业的职工,并由所得数据画出了如图所示的频率分布直方图,由图可知中位数为__________元.现要从这l
000人中再用分层抽样的方法抽出100人做进一步调查,则月收入在(元)内应抽出________人.
( http: / / www.21cnjy.com )
变式训练
1.一个容量为n的样本分成若干组,已知某组的频数和频率分别是80和0.125,则n的值为
A.800
B.1
250
C.1
000
D.640
2.对某种电子元件进行寿命跟踪调查,所得样本频率分布直方图如图,由图可知:一批电子元件中,寿命在[100,300)小时的电子元件的数量与寿命在[300,600]小时的电子元件的数量的比大约是
( http: / / www.21cnjy.com )
A.
B.
C.
D.
交流展示——频率分布直方图的应用
为了了解某地区高中生的身体发育状况,抽查了该地区内100名年龄为17~18岁的男生的体重情况,结果如下(单位:kg):
( http: / / www.21cnjy.com )
试根据上述数据画出样本的频率分布直方图.
变式训练
20名学生某次数学考试成绩(单位:分)的频率分布直方图如图所示.
( http: / / www.21cnjy.com )
(1)求频率分布直方图中a的值;
(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;
(3)从成绩在[50,70)的学生中任选2人,求这2人的成绩都在[60,70)中的概率.
交流展示——茎叶图的制作和应用
4.下图是甲、乙两位同学在高三的5次月考中的数学成绩的茎叶图,若甲、乙两人成绩的中位数分别是x甲,x乙,则下列说法正确的是
( http: / / www.21cnjy.com )
A.x甲>x乙;乙比甲成绩稳定
B.x甲C.x甲>x乙;甲比乙成绩稳定
D.x甲5.某校开展“爱我郑州、爱我家乡”摄影比赛,
( http: / / www.21cnjy.com )9位评委为参赛作品A给出的分数如茎叶图所示.记分员算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清.若记分员计算无误,则数字x应该是
.
变式训练
在每年的春节后,某市政府都
( http: / / www.21cnjy.com )会发动公务员参与到植树绿化活动中去.林业管理部门在植树前,为了保证树苗的质量,都会在植树前对树苗进行检测.现从甲、乙两种树苗中各抽测了10株树苗,量出它们的高度如下(单位:厘米):
甲:37
21
31
20
29
19
32
23
25
33
乙:10
30
47
27
46
14
26
10
44
46
(1)画出两组数据的茎叶图,并根据茎叶图对甲、乙两种树苗的高度作比较,写出两个统计结论.
(2)设抽测的10株甲种
( http: / / www.21cnjy.com )树苗高度平均值为`x,将这10株树苗的高度依次输入,按程序框图进行运算,问输出的S大小为多少?并说明S的统计学意义.
( http: / / www.21cnjy.com )
学习小结
1.画频率分布直方图的一般步骤
(1)求极差:计算一组数据中最大值与最小值的差.
(2)决定组距与组数:组数=极差/组距.
(3)将数据分组,列频率分布表.
(4)画频率分布直方图.
2.频率分布直方图的优缺点
优点:频率分布直方图能够很容易地表示大量的数据,非常直观地表明分布形状,使我们能够看到在分布表中看不清楚的一些数据模式.
缺点:用频率分布直方图可以大致估计出总体的分布情况,但不能保留原来的数据信息,在精确要求较高的情况下不适用.
3.绘制频率分布直方图的四个关注点
(l)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数,一般来说,数据越多,分组越多.
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.
4.画茎叶图的一般步骤
第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;
第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;
第三步,将各个数据的叶按大小次序写在茎右(左)侧.
当堂检测
1.有一个容量为200的样本,其频率分
( http: / / www.21cnjy.com )布直方图如图所示,已知样本数据落在区间[10,12]内的频数比样本数据落在区间[8,10)内的频数少40,则m的值等于
( http: / / www.21cnjy.com )
A.0.07
B.0.09
C.0.08
D.0.1
2.将容量为n的样本中的数据分成6组,
( http: / / www.21cnjy.com )绘制频率分布直方图.若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n=____.
3.图所示的“茎叶图”表示的数据中,众数和中位数分别为
,
.
( http: / / www.21cnjy.com )
2.2.1用样本的频率分布估计总体分布
详细答案
课前预习
·
预习案
【自主学习】
1.(1)提取 传递
(2)表格 构成形式
2.(1)②决定组距与组数
④列频率分布表
(2)频率与组距的比值 面积 1
3.(1)中点
(2)增加 增加 减小
4.中间 旁边
【预习评价】
1.C
2.落入该组的数据的个数
落入该组的数据个数与数据总数的比值
3.频率
4.45,45,52,56,57,58,60,63
5.5
知识拓展
·
探究案
【合作探究】
1.(1)为了制定一个较为合理的标
( http: / / www.21cnjy.com )准a,必须先了解全市居民日常用水量的分布情况.比如,月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.
(2)可以把样本数据重新排列,组成表格或者用图形把它们的变化情况画出来的方法,直观地来观察样本数据的特点,即频率分布.
2.根据坐标名称可以得出,面积=频率/组距×组距=频率.即每个长方形的面积代表的是频率.它们的总和为1.
3.对样本数据进行分组,组距的确定没有固
( http: / / www.21cnjy.com )定的标准,组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.
4.第一步,求极差.
第二步,决定组距与组数.
第三步,确定分点,将数据分组.
第四步,列频率分布表.
5.从分布是否具有单峰性(说明在这个
( http: / / www.21cnjy.com )区域的频率大与小的关系),是否具有对称性(说明数据集中在此区域附近),样本点落在各分组中的频率等方面来估计总体分布.
6.连接频率分布直方图中各长方形上端的中点,就得到频率分布折线图.
7.实际上,尽管有些总体密度曲线是客观
( http: / / www.21cnjy.com )存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确.
8.不存在,因为只有样本容量不断增加,相应的频率折线图才接近于总体密度曲线.
9.“茎”指中间的数字,即5,6,7,8,9.其余两边分布的数字为“叶”.
10.不是.可根据样本数据的特点灵活决定.
11.一般茎按从小到大的顺序从上向下列出;而茎的叶按从小到大的顺序同行列出;若是重复的则重复记录,不能遗漏.
【交流展示——频率分布表与频率分布直方图】
1.B
【解析】本题考查样本的频率分布直方图.设该组的频数为x,则其他组的频数之和为4x,由样本容量是80,得x+4x=80,解得x=16,即该组的频数为16,故选B.
2.3
400 25
【解析】设中位数为x,可知(x-3
000)×0.000
5=0.2,x=3
400,由图[3
500,4
000)(元)收入段的频率是0.000
5×500=0.25,故用分层抽样方法抽出100人做进一步调查,在[3
500,4
000)(元)收入段应抽出人数为0.25×100=25.
【变式训练】
1.D
2.C
【解析】寿命在[100,300)小时的频率为,寿命在[300,600]小时的频率为,所以所求比值为.
【交流展示——频率分布直方图的应用】
(1)计算极差,由题中数据可知,最大值是76,最小值是55,所以极差为76-55=21.
(2)决定组距与组数.如果组距定为2,那么21÷2=10.5,可分为11组.
(3)决定分点.根据本题中数据
( http: / / www.21cnjy.com )的特点,第一组的起点可取为54.5,终点可取为56.5,这样所得到的分组是[54.5,56.5),[56.5,58.5),…,[74.5,76.5].
(4)列频率分布表如下:
( http: / / www.21cnjy.com )
(5)绘制频率分布直方图如图所示.
( http: / / www.21cnjy.com )
【变式训练】
(1)由频率分布直方图知组距为10,频率总和为1,可列如下等式:(2a+2a+3a+6a+7a)×10=1
解得a=0.005
.
(2)由图可知落在[50,60)的频率为2a×10=0.1.
由频数=总数×频率,从而得到该范围内的人数为20×0.1=2.
同理落在[60,70)内的人数为20×0.15=3
.
(3)记[50,60)范围内的2人分别
( http: / / www.21cnjy.com )记为A1、A2,[60,70)范围内的3人记为B1、B2、B3,从5人选2人共有情况:A1A2,A1B1,A1B2,A1B3,A2B1,A2B2,A2B3,B1B2,B1B3,B2B3,10种情况,
其中2人成绩都在[60,70)范围内的有3种情况,因此P=.
【解析】本题考查频率分布直方图和古典概型.(1)利用各组频率之和等于1,从而求出a的值;(2)用列举法列出所有基本事件是解题关键.
【交流展示——茎叶图的制作和应用】
4.B
【解析】由茎叶图可知甲、乙两人成绩的中位数
( http: / / www.21cnjy.com )分别是x甲=78分,x乙=88分,所以x甲5.1
【解析】由题意知×(88+89+89+92+93+90+x+92+91+94)=91,解得x=1.
【变式训练】
(1)茎叶图如图所示.
( http: / / www.21cnjy.com )
统计结论:(任意两个即可)
①甲种树苗的平均高度小于乙种
( http: / / www.21cnjy.com )树苗的平均高度;②甲种树苗比乙种树苗长得整齐;③甲种树苗的中位数为27,乙种树苗的中位数为28.5;④甲种树苗的高度基本上是对称的,而且大多数集中在均值附近,乙种树苗的高度分布比较分散.
(2),S=35,S表示10株甲种树苗高度的方差.
【当堂检测】
1.B
【解析】依题意,样本数据落在区间[10,12]内的频率比样本数据落在区间[8,10)内的频率小=0.2,因此(n-m)×2=0.2,所以n-m=0.1,而(m+n+0.02+0.05+0.15)×2=1,于是n+m=0.28,解得m=0.09.
2.60
【解析】因为,
所以n=60.
3.31 26
【解析】茎叶图表示的数据为:12,14,20,23,25,26,30,31,31,41,42,所以众数为31,中位数是26.