9.2.1 总体取值规律的估计 课件(共25张PPT)

文档属性

名称 9.2.1 总体取值规律的估计 课件(共25张PPT)
格式 pptx
文件大小 2.7MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2023-05-23 18:54:25

图片预览

文档简介

(共25张PPT)
人教A版高中数学必修第二册
9.2 用样本估计总体
9.2.1 总体取值规律的估计
收集数据是为了寻找数据中蕴含的信息。因为实际问题中数据多而杂乱,往往无法直接从原始数据中发现规律,所以需要根据问题的背景特点,选择合适的统计图表对数据进行整理和直接描述。在此基础上,通过数据分析,找出数据中蕴含的信息,就可以用这些信息来解决实际问题了。
引例 我国是世界上严重缺水的国家之一,城市缺水问题较为突出。某市政府为了节约生活用水,计划对居民生活用水费用实施阶梯式水价制度,即确定一户居民月均用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.
如果希望确定一个比较合理的标准,以使大部分居民用水的水费支出不受影响,你认为需要做哪些工作?
为了确定一个较为合理的用水标准,必须先了解在全市所有居民用户中,月用水量在不同范围内的居民所占的比例情况.
①全面调查(普查):时间,经费允许
②抽样调查:
总体:该市的全体居民用户
个体:每户居民用户
调查的变量:居民用户的均用水量.
假设通过随机抽样,获得了100户居民用户的月均用水量数据:(单位:t)
从这组数据我们能发现什么信息呢?
容易发现:这组数据的最小值时1.3t,最大值是28.0t,其它值在1.3t~28.0t之间. 除此之外,很难从随意记录下来的数据中直接看出规律.
为此,我们需要对数据进行整理和分析.
分析数据的基本方法:
1.用图将它们画出来: 提取信息、传递信息.
2.用表格: 用紧凑的表格改变数据的排列形式,提供解释数据的新方式.
初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数.
频数:在统计学中,将样本按照一定的方法分成若干组,每组内含有这个样本的个体的数目叫做频数
什么是频数?什么是频率?如何画频数分布表和频数分布直方图?
频率:样本中某个组的频数和样本容量的比,叫做该数据的频率
身高x 频数 频率
146≤x<150 2 0.0625
150≤x<154 3 0.09375
154≤x<158 6 0.1875
158≤x<162 12 0.375
162≤x<166 7 0.21875
166≤x<170 2 0.0625
频数分布表
频数分布图
因此使用频率分布表和频率分布直方图
在此实际问题中,我们更关心月均用水量在不同范围内的居民用户占全市居民用户的比例
从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律. 它可以使我们看到整个样本数据的频率分布情况.
频率分布是指一个样本的各个小组的数据在各个小范围所占比例的大小,一般用频率分布直方图反映样本的频率分布.
探究 根据上述抽样的100户居民月均用水量,画出频率分布直方图.
(1)求极差:
极差为一组数据中最大值与最小值的差.
这说明样本观测的数据变化范围是26.7
28.0 -1.3=26.7
因此使用频率分布表和频率分布直方图
在引例的实际问题中,我们更关心月均用水量在不同范围内的居民用户占全市居民用户的比例
(2)决定组距与组数:
组距是指每个小组的两个端点之间的距离.
组距与组数的确定没有固定的标准,数据的分组可以是等距的,也可以是不等距的,为方便起见,往往按等距分组.
若取组距为3,则
即可将数据分为9组;
若组距为4,
可以将数据分成7组.
①一般样本容量越大,分组越多;
②样本容量不超过100时,常分成5~12组.
由于组距为3,9个组距的长度超过极差,我们可以使第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值. 例如:可以取区间为[1.2,28.2],按如下方式把样本数据以组距3分成9组:
[1.2,4.2),[4.2,7.2),...,[25.2,28.2]
(3)将数据分组:
通常对组内数据所在区间:左闭右开,最后一组取闭区间.
统计频数,计算各小组的频率,作出频率分布表.
(4)列频率分布表:
频率之和为1
(5)画频率分布直方图:
小长方形的面积=组距× =频率
各小长方形的面积和为1
月平均用水量/t
0.12
0.1
0.08
0.06
0.04
0.02
0
1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
0.077
频率/组距
横轴表示月均用水量
纵轴表示
(1)从频率分布表中可以看出,样本观测数据落在各个小组的比例大小.
例如,月均用水量在区间[4.2,7.2)内的居民用户最多,在区间[1.2,4.2)内的次之,而月均用水量超过16.2的各区间内数据所占比例较小,等等.
(2)从频率分布直方图能直观地表明数据分布的形状和总体趋势.可以看出,数据的分布不对称,图形左边高、右边低,右边有一个较长的“尾巴”。这表明大部分居民用户的月均用水量集中在一个较低值区域,尤其在[1.2,7.2)最为集中,少数用户居民的月均用水量偏多,而且随着月均用水量的增加,居民用户数呈现降低趋势.
有了样本观测数据的频率分布,我们可以用它估计总体的取值规律。根据100户居民用户的月均用水量的频率分布,可以推测该市全体居民用户月均用水量也会有类似的分布,即大部分居民用户月均用水量集中在较低值区域.
需要注意的是,由于样本的随机性,这种估计可能会存在一定误差,但这一误差一般不会影响我们对总体分布情况的大致了解.
这使我们确定用水量标准时,可以定一个合适的值,以达到既不影响大多数居民用户的水费支出,又能节水的目的.
分别以3和27为组数,对数据进行等距分组,画出100户居民月均用水量的频率分布直方图,你发现不同的组数对直方图呈现数据分布规律有什么影响?
组数少、组距大:易看出数据整体的分布特点,无法看出每组内的数据分布情况,损失了较多的原始数据信息;
组数多、组距小:保留较多原始数据信息;但小长方形较多,有时图形会变得不规则,不容易从中看出总体分布特点;直方图会依赖样本数据,稳定性差.
(1)求极差(即一组数据中最大值与最小值的差)
(2)决定组距与组数(将数据分组)
(3)将数据分组
方法小结:画频率分布直方图的一般步骤为:
(4)列出频率分布表.(填写频率/组距一栏)
(5)画出频率分布直方图.
组距:指每个小组的两个端点的距离,
组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组.
D
3. 一个样本的容量为72,分成5组,已知第一、五组的频数都为8,第二、四组频率都为,则第三组的频数为( )
A.16 B.20 C.24 D.36
C
4. 为了解某地高一学生的身体发育情况,抽查了该地区100名年龄在14-15岁的男生体重(kg),得到频率分布直方图如下:
根据上图可得这100名学生中体重在[56.5,64.5]的学生人数是( )
A.20 B.30 C.40 D.50
C
0.08
[56.5,65]
44
[56.5,a]的学生人数是46,a=( )
65.25
1. 从某小区抽取100户居民用户进行月用电量调查,发现他们的用电量都在50~350 kW h之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.
(1) 直方图中x的值为________;
(2) 在被调查的用户中,用电量落在区间[100,250) 内的户数为_____.
70
0.0044
教材197页
解:(1) 通话时长在区间[15,20),[20,30)内的次数分别为9次和12次.
(2) 区间[20,25)和[25,30)内的通话次数都少于区间[15,20)内的通话次数.
2.如图,胡晓统计了他爸爸9月的手机通话明细清单,发现他爸爸该月共通话60次. 胡晓按每次通话时间长短进行分组(每组为左闭右开的区间),画出了频率分布直方图.
(1) 通话时长在区间[15,20),[20,30) 内的次数分别为多少
(2) 区间[20, 30)上的小长方形高度低于[15, 20)上的小长方形的高度,说明什么
解:由已知数据可得极差为69-42=27.
[41.5, 45.5), [45.5, 49.5), ···, [65.5, 69.5].
选取组距为4,由于 故可将数据分为7组,即
列出频率分布表:
根据频率分布表画出频率分布直方图和频率分布折线图如图所示.
频率分布直方图
应用
步骤
1.求极差
2.决定组距与组数
3.将数据分组
4.列频率分布表
5.画频率分布直方图