课件38张PPT。2.2 总体分布的估计学习目标
1.理解用样本的频率分布估计总体分布的方法;
2.会列频率分布表,会画频率分布直方图,频率折线图,茎叶图,体会它们各自的特点;
3.会用样本的频率分布估计总体频率分布. 课堂互动讲练知能优化训练2.2 总体分布的估计课前自主学案课前自主学案三种抽样的特点及适用范围平均1.频率分布表
(1)定义:频数是某一对象出现的_____,频率指某一对象的_____与_______的比值,它能更好地反映出某一对象出现的___________当总体很大或不便获得总体的频率时,可以用样本的频率分布估计总体的频率分布.根据所抽取样本的大小,分别计算某一事件出现的频率,这些频率的__________ (取值情况),就叫做样本的频率分布.次数频数总次数频繁程度.分布规律为了能直观地显示样本的频率分布情况,通常我们会将样本的容量、样本中出现该事件的_____以及计算所得的__________列在一张表中,这样的表就叫样本频率分布表.频数相应频率2.频率分布直方图
(1)定义:我们用直方图反映___________________,这样的________称为频率分布直方图,简称频率直方图.
(2)作频率分布直方图的步骤
①求全距,即一组数据中最大值和最小值的差.
②决定组距与组数,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚的呈现出来.样本的频率分布规律直方图3.频率分布折线图
如果将频率直方图中各相邻的矩形上底边的中点依次连结起来,就得到频率分布折线图,简称频率分布折线图.
4.总体密度曲线
总体密度曲线是频率分布折线的一条极限曲线.随着样本容量不断增加,分组不断加密,频率分布折线就会越来越光滑,最终形成总体密度曲线.总体密度曲线反映的是总体在各个范围内取值的百分比.实际上,尽管有些总体密度曲线是客观存在的,但只能用样本频率分布对它估计,一般来说,样本容量越大,这种估计就越准确.5.茎叶图
(1)初中统计部分曾学过用平均数、众数和中位数反映总体的水平,用方差考虑稳定程度.我们还有一种简易的方法,就是将这些数据有条理地列出来,从中观察得分的分布情况.这种方法就是茎叶图分析法.
(2)茎叶图的制作
制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.(3)茎叶图的优缺点
用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示.但茎叶图表示三位或三位以上的数据时不够方便.茎叶图如果表示三位数可把这组数据的前两位作为茎,第三位数作为叶.1.将样本的数据进行分组的目的是什么?
提示:从样本中的一个数字中很难直接看出样本所包含的信息,通过分组并计算其频率,目的是通过描述样本数据分布的特征,从而估计总体的分布情况.
2.频率分布直方图以怎样的形式反映了数据落在各个小组内的频率大小?3.茎叶图可以表示三位数吗?
提示:可以,前2位作为茎,最后一位作为叶,茎叶图最好表示两位数.课堂互动讲练频率分布表,频率分布直方图,折线图 为了了解九年级学生中女生的身高(单位:cm)情况,统计了同年级50名女生的身高数据如下:
145.5 149.5 149.6 151.9 153.0 153.5 153.6
154.0 154.1 154.3 154.6 155.0 155.3 155.6
155.7 155.8 156.1 156.2 156.5 157.0 157.1
157.0 157.2 157.3 157.4 157.5 157.5 157.7
157.8 158.0 158.1 158.3 158.5 158.8 158.9
159.0 158.8 159.0 160.8 160.9 161.6 162.8
162.9 163.0 163.0 164.2 164.9 165.1 167.0
169.5
根据样本列出相应的频率分布表,画出相应的频率分布直方图.【思路点拨】 求全距→决定组数和组距→列表→画频率分布直方图.
【解】 通过样本数据可以看出,这组数据的最大值与最小值的差为24,可将其分成6组,组距为4.从第1组[145.5,149.5)开始,将频数累计、各组的频数、各组的频率填入表中,得频率分布表为:频率分布直方图为【名师点评】 绘制频率分布表时的注意事项:
求全距时,根据样本容量的多少,适当确定组数与组距,但尽量取整,然后登记频数,计算频率,列出频率分布表.自我挑战1 观察图形,回答下列问题:(1)这组数据共分几组?
(2)组距是多少?
(3)第几组频率最大?第几组频率最小?哪两组频率相同?
(4)各小组频率之和为多少?
解:(1)这组数据共分6组.
(2)组距为10.
(3)第4组频率最大,第1组频率最小,第2组与第6组频率相同.
(4)各小组频率之和为1.画茎叶图的步骤
(1)将两个数据分为“茎”(高位)和“叶”(低位)两部分.
(2)将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧.
(3)将各个数据的“叶”按大小次序写在其茎右(左)侧. 小明在高三年级上半学期历次考试中数学成绩(总分100)如下:
51 60 62 75 82 83 83 84 86 86 86 87 90 98 99
画出小明数学成绩的茎叶图;
【思路点拨】 茎表示十位数字→叶表示个位数字→茎叶图.【解】 将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出即得茎叶图如下:【思维总结】 在制作茎叶图时,重复出现的数据要重复计算,不能遗漏,特别是“叶”部分,同一数据出现几次,就要在图中体现几次.自我挑战2 如图的茎叶图是甲、乙两名同学自高中以来的数学成绩.中间表示十位或百位数字,两边表示个位数字.回答下面问题:甲 乙(1)写出甲、乙两组数据;
(2)分析两组数据的稳定性.
解:(1)甲的得分:65,71,75,76,81,86,88,89,91,94,95,107,110.
乙的得分:79,83,86,88,93,97,98,98,99,101,102,103,114.
(2)由茎叶图可以看出乙同学的得分情况大致对称,集中在90多分,甲同学的得分也大致对称,集中在80多分,因此乙同学的成绩较好,发挥较甲同学更稳定.总体分布反映了总体在各个范围内取值的概率,利用样本的频率分布可近似地估计总体的分布.利用样本在某一范围内的频率可近似地估计总体在这个范围内的概率.当然,要比较准确地反映出总体分布的情况,必须准确地作出频率分布表或频率分布直方图,充分利用所给数据正确地进行估计. (本题满分14分)美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图;
(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.【规范解答】 (1)以4为组距,列频率分布表如下:5分频率分布直方图的折线图如下:10分
(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.14分【名师点评】 (1)解答本题的过程中,不要将直方图的纵轴标作频率,此处很容易出错.
(2)解决此类问题关键有二:一是认真掌握本节知识所涉及的概念及解题方法;二是加强识图,用图能力的培养.从图形中发现信息,分析信息,问题便可顺利解决.自我挑战3 某地区为了解70~80岁老人的日平均睡眠时间(单位:h),随机选择了50位老人进行调查.下表是这50位老人日睡眠时间的频率分布表.在上述统计数据的分析中,一部分计算见算法流程图(如图),则输出的S的值是________.解析:由流程图可知
S=4.5×0.12+5.5×0.20+6.5×0.40+7.5×0.20+8.5×0.08=6.42.
答案:6.421.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录,而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.2.正确利用三种分布的描述方法,都能得到一些有关分布的主要特点(如分布是否具有单峰性、是否具有对称性、样本点落在各分组中的频率等),这些主要特点受样本的随机性的影响较小,更接近于总体分布相应的特点.频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式.茎叶图和频率分布表极为类似,事实上,茎相当于频率分布表中的分组;茎上叶的数目相当于频率分布表中指定区间组的频数.