课件17张PPT。2.2.1 用样本的频率分布估计总体分布【学习目标】1.理解用样本的频率分布估计总体分布的方法.
2.会列频率分布表,画频率分布直方图、
频率分布折线图 问题提出1.随机抽样有哪几种基本的抽样方法?2.随机抽样是收集数据的方法,如何通
过样本数据所包含的信息,估计总体的
基本特征,即用样本估计总体,是我们
需要进一步学习的内容.简单随机抽样、系统抽样、分层抽样.用样本估计总体的两种情况
(1)用样本的_________估计总体分布.
(2)用样本的_________估计总体数字特征.1.频率分布数字特征提取信息传递信息【课前导学】 数据分析的基本方法
(1)借助于图形
分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中_________ ,二是利用图形_________.
(2)借助于表格
分析数据的另一方法是用紧凑的表格改变数据的排列方式,此法是通过改变数据的构成形式,为我们提供解释数据的新方式.2.作频率分布直方图的步骤
(1)求极差:即一组数据中_______和_______的差;
(2)决定组距与组数:将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.这时应注意:①一般样本容量越大,所分组数_____;②为方便起见,组距的选择应力求“取整”;③当样本容量不超过100时,按照数据的多少,通常分成5~12组.
(3)将数据分组:按组距将数据分组,分组时,各组均为左闭右开区间,最后一组是闭区间.
(4) ______________.一般分四列:分组、频数累计、频数、频率,最后一行是合计.其中频率合计应是样本容量,频率合计是1.
3.最大值最小值越多列频率分布表(5)画频率分布直方图.画图时,应以横轴表示分组,纵轴表示_________.其相应组距上的频率等于该组上的小长方形的面积.频率/组距频率分布折线图与总体密度曲线
(1)连接频率分布直方图中各小长方形上端的_____,就得到频率分布折线图.
(2)在样本频率分布直方图中,当样本容量逐渐增加,作图时所分的组数增加, _____减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.4.中点组距 调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:
171 163 163 166 166 168 168 160 168 165
171 169 167 169 151 168 170 168 160 174
165 168 174 159 167 156 157 164 169 180
176 157 162 161 158 164 163 163 167 161
(1)作出频率分布表;
(2)画出频率分布直方图.【例1】[思路探索] 确定组距与组数是解决“样本中
的个体取不同值较多”这类问题的出发点.【课内探究】第一步: 求极差:(数据组中最大值与最小值的差距) 解(1)最低身高151 cm,最高身高180 cm,它们的差是180-151=29,即极差为29;第二步: 决定组距与组数:(强调取整) 当样本容量不超过100时,按照数据的多少,常分成5-12组.
为方便组距的选择应力求“取整”.
本题如果组距为4, 则所以将数据分成8组较合适. 第三步: 将数据分组:(给出组的界限) [149.5,153.5),[165.5,169.5),[169.5,173.5),[173.5,177.5),[177.5,181.5),8组[161.5,165.5),[157.5,161.5),[153.5,157.5),第四步: 列频率分布表. 组距 = 4 第四步: 列频率分布表. 组距 = 4 (2)第五步: 画出频率分布直方图. 频率分布直方图的特征:
从频率分布直方图可以清楚的看出数据分布的总体趋势.
从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
小长方形的面积=?
小长方形的面积总和=?
身高最多的在哪个区间?请大家阅读第68页,直方图有哪些优点和缺点?思考1:频率分布表与频率分布直方图的区别?频率分布表列出的是在各个不同区间内取值的频率.
频率分布直方图是用小长方形面积的大小来表示在各个区间内取值的频率.思考2:将组距确定为6,作出高三学生的频率分布直方图.思考3:谈谈两种组距下,你对图的印象?同一个样本数据,绘制出来的分布图是唯一的吗?
(同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断 .) 为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组情况与频数如下:
[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;[11.35,11.45),7;[11.45,11.55),4;[11.55,11.65],2
(1)列出频率分布表;
(2)画出频率分布直方图以及频率分布折线图;
(3)据上述图表,估计数据落在[10.95,11.35)范围内的可能性是百分之几;
(4)数据小于11.20的可能性是百分之几.
审题指导 根据画频率分布直方图的步骤先画频率分布直方图,再画折线图.
【例2】[规范解答] (1)频率分布表如下:(2)频率分布直方图及频率分布折线图,如图
(3)由上述图表可知数据落在[10.95,11.35)范围内的频率为 1-(0.03+0.09)-(0.07+0.04+0.02)=0.75=75%,
即数据落在[10.95,11.35)范围内的可能性是75%.
(4)数据小于11.20的可能性即数据小于11.20的频率,设为x,则 (x-0.41)÷(11.20-11.15)
=(0.67-0.41)÷(11.25-11.15),
所以x-0.41=0.13,即x=0.54,
从而估计数据小于11.20的可能性是54%. 几种表示频率分布的方法的优点与不足(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势时不太方便.
(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在频率分布表中看不清楚的数据模式.
(3)频率分布折线图的优点是它反映了数据的变化趋势.如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体密度曲线.小 结画频率分布直方图的步骤:
第一步: 求极差: (数据组中最大值与最小值的差距)
第二步: 决定组距与组数: (强调取整)
第三步: 将数据分组 (给出组的界限)
第四步: 列频率分布表. (包括分组、频数、频率、频率/组距)
第五步: 画频率分布直方图(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率/组距.)