课件34张PPT。第五章 统计[必修3]5.2 用样本估计总体
5.2.1 用样本的频率分布估计总体分布1.用样本估计总体的两种情况
(1)用样本的 估计总体的分布.?
(2)用样本的 估计总体的数字特征.?
2.分析数据的方法
(1)借助于图形
用图将各个数据画出来,作图可以达到两个目的,一是从数据中 ,二是利用图形 .?
(2)借助于表格
用紧凑的表格改变数据的 形式,为我们提供 数据的新方式.?预习探究用样本估计总体知识点一频率分布数字特征提取信息传递信息构成解释预习探究1.频率分布的概念
频率分布是指各个小组数据在样本容量中 的大小.一般用频率分布直方图反映 .?
2.频率分布表
当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映样本的频率分布的表格称为频率分布表.频率分布知识点二所占比例样本的频率分布预习探究3.作频率分布直方图的步骤
(1)求极差(即一组数据中 和 的差).?
(2)决定组距与组数.将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.这时应注意:①一般样本容量越大,所分组数 ;②为方便起见,组距的选择应力求“取整”;③当样本容量不超过100时,按照数据的多少,通常分成 组.?
(3)将数据分组.按 将数据分组,分组时,各组均为左闭右开区间,最后一组是闭区间.?
最大值最小值越多5~12组距预习探究?频数频率1?预习探究[讨论] 为什么要对样本数据进行分组?解:不分组很难看出样本中的数字所包含的信息,分组后,计算出频率,从而估计总体的分布特征.预习探究4.频率分布折线图的定义
连接频率分布直方图中 ,就得到频率分布折线图.如图5-2-1所示.?各小长方形上端的中点图5-2-1预习探究5.总体密度曲线的定义
在样本频率分布直方图中,随着样本容量的增加,作图时所分的 增加,组距减小,相应的频率折线图会越来越接近于一条 ,统计中称这条光滑曲线为总体密度曲线(如图5-2-2),它反映了总体在各个范围内取值的 .?图5-2-2组数光滑曲线百分比预习探究 [讨论] 对于一个总体,如果总体密度曲线客观存在,能否通过样本数据准确地画出总体密度曲线?为什么?解:不能.由于频率分布折线图是随着随机抽取的样本、样本容量和分组情况的变化而变化的,因此不能由样本的频率分布折线图得到准确的总体密度曲线.预习探究1.茎叶图的概念
顾名思义,茎是指 的一列数,叶就是从茎的旁边生长出来的数.当数据是
时,用中间的数字表示 ,即第一个有效数字,旁边的数字表示 ,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物的茎上长出来的叶子,因此,通常把这样的图叫作茎叶图.?茎叶图知识点三中间两位有效数字十位数个位数预习探究2.茎叶图的特征
(1)茎叶图的优点
用茎叶图表示数据有两个优点:一是原始数据信息在图中能够保留,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.
(2)茎叶图的缺点
用茎叶图表示数据的缺点:当样本数据较多时,茎叶图就显得不太方便.因为每一个数据都要在图中占有一定的空间,如果数据很多,枝叶就会很长.另外,茎叶图只方便记录一组或两组的数据,两组以上的数据虽然能够记录,但是没有表示两组记录那么直观、清晰.预习探究[讨论] 某中学高三年级从甲、乙两个班各选出8名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图5-2-3所示,其中甲班学生成绩的平均分是86,乙班学生成绩的中位数是83,求x+y的值.?图5-2-3考点类析例1 (1)对于频率分布直方图,下列说法中正确的是( )
A.小长方形的高表示取某数的频率
B.小长方形的高表示该组个体在样本中出现的频数
C.小长方形的高表示该组个体在样本中出现的频率与组距的比
D.小长方形的高表示该组个体在样本中出现的频数与组距的比
频率分布直方图与茎叶图的概念C[解析] (1)由于在频率分布直方图中各小长方形的面积表示相应各组的频率,这样,小长方形的高就表示该组个体在样本中出现的频率与组距的比.考点一考点类析例1 (2)一个容量为100的样本,其数据的分组与各组的频数如下:
C?则样本数据落在[10,40)上的频率为 ( )
A.0.13 B.0.39 C.0.52 D.0.64考点类析例1 (3)如图5-2-4所示,茎叶图表示某城市一台自动售货机在16天内的销售额(单位:元)情况,图中的数字7表示的意义是这台自动售货机该天的销售额为( )
A.7元 B.70元
C.27元 D.72元
C[解析] (3)茎表示的是十位数字,叶表示的是个位数字,故7表示27.
图5-2-4考点类析频率分布直方图与茎叶图的制作与应用考点二例2 某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分):
48 64 52 86 71 48 64 41 86 79
71 68 82 84 68 64 62 68 81 57
90 52 74 73 56 78 47 66 55 64
56 88 69 40 73 97 68 56 67 59
70 52 79 44 55 69 62 58 32 58
考向一 频率分布直方图根据上面的数据,回答下列问题:
(1)这次测验成绩的最高分和最低分分别是多少?解:(1)这次测验成绩的最低分是32,最高分是97.考点类析
48 64 52 86 71 48 64 41 86 79
71 68 82 84 68 64 62 68 81 57
90 52 74 73 56 78 47 66 55 64
56 88 69 40 73 97 68 56 67 59
70 52 79 44 55 69 62 58 32 58
(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图.
(2)根据题意,列出样本的频率分布表如下:考点类析
(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图.
频率分布直方图如图所示.考点类析
(3)分析频率分布直方图,你能得出什么结论?
(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头低、中间高,左右基本对称,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.考点类析变式 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图(如图5-2-5):
(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率(以频率代替概率);
(2)求频率分布直方图中的a,b的值.
考点类析图5-2-5考点类析?考点类析?考点类析[小结] (1)用样本的频率分布估计总体的分布,是列频率分布表和画频率分布直方图的主要目的,频率分布表比较准确地反映样本的频率分布,而频率分布直方图则能直观地反映样本的频率分布.
(2)频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内取值的可能性.考点类析拓展 图5-2-6是总体的一个样本频率分布直方图,且样本数据在区间[15,18)内的频数为8.
(1)求样本容量.
(2)若数据分组[12,15)对应小矩形的面积为0.06,求:
①样本数据在[12,15)内的频数;
②样本数据在[18,33]内的频率.
图5-2-6考点类析?考点类析例3 某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验.已知两种小麦各种植了25亩,所得亩产量数据(单位:千克)如下:
品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,
430,434,443,445,445, 451,454.
品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,
410,412,415,416, 422,430.
(1)画出茎叶图.
(2)用茎叶图处理现有的数据,有什么优点?考向二 茎叶图考点类析解:(1)茎叶图如图.
(2)样本容量不大,画茎叶图很方便,此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息丢失,而且还可以随时记录新的数据.考点类析[小结] 茎叶图在样本数据较少、较为集中且位数不多时比较适用.由于它较好地保留了原始数据,所以可以帮助我们分析样本数据的大致频率分布.当堂自测[解析] 能反映各数据的变化趋势的统计图是折线图.1.如果想用统计图来反映各数据的变化趋势,比较合适的统计图是( )
A.条形图 B.折线图
C.扇形图 D.其他图形B当堂自测[解析] 由样本估计总体的性质可知C正确.2.用样本频率分布估计总体频率分布的过程中,下列说法中正确的是 ( )
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确C当堂自测?3.从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8,其累计频率为0.4,则这个样本的容量是( )
A.20 B.40 C.70 D.80A当堂自测[解析] 由题图可得,新生儿体重在[2700,3000)内的频率为0.001×300=0.3.4.观察新生儿的体重,其频率分布直方图如图5-2-7所示,则新生儿体重(单位:g)在[2700,3000)内的频率为( )
A.0.1 B.0.2 C.0.3 D.0.4C图5-2-7当堂自测[解析] 由茎叶图知,甲班15名同学成绩的最高分是96,乙班15名同学成绩的的最高分是92.甲班15名同学的成绩集中在60~80分之间,乙班15名同学的成绩集中在70~90分之间,故乙班的平均成绩较高.5.从甲、乙两个班中各随机选出15名同学进行随堂测验,成绩(单位:分)的茎叶图如图5-2-8所示,则从甲、乙两班选出的15名同学成绩中的最高分分别是 , ,从图中看, 班的平均成绩较高.?96图5-2-892乙