9.2.1总体取值规律的估计 课件(共37张PPT)

文档属性

名称 9.2.1总体取值规律的估计 课件(共37张PPT)
格式 pptx
文件大小 3.4MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2022-05-29 08:08:35

图片预览

文档简介

(共37张PPT)
9.2用样本估计总体
9.2.1总体取值规律的估计
1.用样本估计总体的两种情况
通过随机抽样抽取到具有代表性的样本,对样本数据进行列表、制图、计算分析,从数据中找到它所包含的信息和规律,然后对总体进行估计。估计一般分为两种:一种是用样本的频率分布估计总体的分布,另一种是用样本的数字特征(如平均数、标准差等)估计总体的数字特征。
什么是总体分布?
总体分布是指总体取值的分布规律,即某小组数据在总体数据中所占的比例大小.
根据这些数据你能得出用水量其他信息吗
1、求极差(即一组数据中最大值与最小值的差)
知道这组数据的变动范围4.3-0.2=4.1
2、决定组距与组数(将数据分组)
3、 将数据分组(8.2取整,分为9组)
画频率分布直方图的步骤
4、列出频率分布表.
5、画出频率分布直方图。
组距:指每个小组的两个端点的距离,组距
组数:将数据分组,当数据在100个以内时,
按数据多少常分5-12组。
表2-2 100位居民月均用水量的 频率分布表
分组 频数累计 频数 频率
[0 , 0.5)
[0.5 , 1)___________ _______________
[1 , 1.5)_________ _________________
[1.5 , 2)_________ _________________
[2 , 2.5)_________ ________________
[2.5 , 3)_________ ________________
[3 , 3.5)_________ ______________
[3.5 , 4)__________ _______________
[4 , 4.5)_______ __________________
合计__________ ________________
0.02
4
22
25
14
6
4
2
8
15
0.04
0.22
0.25
0.14
0.06
0.04
0.08
0.15
100
1.00
频率分布直方图如下:
月均用水量/t
频率
组距
0.10
0.20
0.30
0.5
1
1.5
2
2.5
3
3.5
4
4.5
小长方形的面积=
小长方形的面积总和=
直方图有那些优点和缺点
2.频率分布表与频率分布直方图
(1)频数与频率
将一批数据按要求分成若干个组,数据分布在各个小组的个数,叫做该组的频数。每组频数除以全体数据总数的商,叫做该组的频率。
(2)样本的频率分布
根据随机所抽样本的大小,分别计算数据分布在各个小组的频率,这些频率的分布规律,就叫做样本的频率分布。将样本的分组情况、数据分布在各个小组的频数以及计算所得的相应频率列在一张表中,叫做样本频率分布表。
(3)频率分布直方图
以横轴表示样本数据,纵轴表示频率与组距的比值,以每个组距为底,以各频率除以组距的商为高,分别画成长方形,这样得到的直方图就是频率分布直方图,
图中每个长方形的面积就等于相应组的频率,

=频率
各组频率的和等于1,因此,各小长方形的面积的和等于1.
从频率分布直方图可以清楚地看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容。
×
组距
频率
组距
练习1.有一个容量为50的样本数据的分组的频数如下:
[12.5, 15.5) 3
[15.5, 18.5) 8
[18.5, 21.5) 9
[21.5, 24.5) 11
[24.5, 27.5) 10
[27.5, 30.5) 5
[30.5, 33.5) 4
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)根据频率分布直方图估计,数据落在[15.5, 24.5)的百分比是多少
解:组距为3
分组 频数 频率 频率/ 组距
[12.5, 15.5) 3
[15.5, 18.5) 8
[18.5, 21.5) 9
[21.5, 24.5) 11
[24.5, 27.5) 10
[27.5, 30.5) 5
[30.5, 33.5) 4
0.06
0.16
0.18
0.22
0.20
0.10
0.08
0.020
0.053
0.060
0.073
0.067
0.033
0.027
频率分布直方图如下:
频率
组距
0.010
0.020
0.030
0.040
0.050
12.5
15.5
0.060
0.070
例2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110次以上(含110次)为达标,试估计该校全体高一学生的达标率是多少?
频率分布直方图如下:
月均用水量/t
频率
组距
0.10
0.20
0.30
0.40
0.50
0.5
1
1.5
2
2.5
3
3.5
4
4.5
连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图
利用样本频率分布对总体分布进行相应估计
(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线。
(2)样本容量越大,这种估计越精确。
(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?
总体密度曲线
频率
组距
月均用水量/t
a
b
(图中阴影部分的面积,表示总体在某个区间 (a, b) 内取值的百分比)。
3.频率分布折线图和总体密度曲线
(1)频数分布折线图:
连接频率分布直方图中各小长方形上端的中点,就得到了频率分布折线图。
(2)总体密度曲线:
随着样本容量的增加,作图时所分的组数也在增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比。
某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:
(1)甲运动员得分
13,51,23,8,26,38,
16,33,14,28,39
(2)乙运动员得分:
49,24,12,31,50,31,
44,36,15,37,25,36,39
茎叶图


0
1
2
3
4
5
2 5
5 4
1 6 1 6 7 9
4 9
0
8
4 6 3
6 8
3 8 9
1
叶就是从茎的旁边生长出来的数,表示得分的个位数。
茎是指中间的一列数,表示得分的十位数
茎是指中间的一列数,叶就是从茎的旁边生长出来的数,茎叶图可用来分析单组数据,也可以对两组数据进行比较。茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况。
从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定。
在样本数据较少时,用茎叶图表示数据的效果较好。它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来方便。但当样本数据较多时,茎叶图就显得不太方便。因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长。
4.茎叶图的概念
例1某中学高二(2)班甲、乙两名同学自上高中以来每场数学考试成绩情况如下:
甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较,说明甲、乙两人谁发挥比较稳定.
解: 甲、乙两人数学成绩的茎叶图如图所示:
解: 甲、乙两人数学成绩的茎叶图如图所示:
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88.因此乙同学发挥比较稳定,总体得分情况比甲同学好.
练习1.某校为了分析学生身体发育的状况,从一次体检中随机抽取了高三男生中20人的数据,将身高(单位:cm)用茎叶图记录如图.由此估计该校高三男生身高在[165,175]的频率为(  )
练习2.甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图所示(单位:分),则甲班、乙班的最高成绩分别是________,从图中看,________班的平均成绩较高.
【答案】96,92 乙
【解析】由茎叶图知甲班的最高成绩为96分,乙班的最高成绩为92分,再根据茎叶图的分布特点知,乙班的成绩分布集中在下面,故乙班的平均成绩较高.
 练习:若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是(  )
A.91.5和91.5
B.91.5和92
C.91和91.5
D.92和92
图形
优点
缺点
频率分布直方图
茎叶图
(1)易表示大量数据
(2)直观地表明分布地情况
(3)无信息损失
丢失一些信息,只能处理样本
随时记录,方便记录和表示
容量较小
小结
1.四种图表的区别与联系
名称 区别
频率分布表 从数量上比较准确地反映样本的频率分布规律
频率分布直方图 反映样本的频率分布情况
频率分布折线图 直观地反映了数据的变化趋势
总体密度曲线 虽客观存在,但要准确画出难度较大,只能用样本频率分布估计.样本容量越大,估计越准确
2.四种图表的优缺点比较
名称 优点 缺点
频率分布表 制作简单,频率数据直观 分析数据分布的总体态势不方便
频率分布直方图 表示数据分布情况非常直观 原有的具体数据信息被抹掉了
频率分布折线图 能反映数据的变化趋势 不能显示原有数据信息
茎叶图 一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况 样本数据较多或数据位数较多时,不方便表示数据