2021-2022学年高一下学期数学人教A版(2019)必修第二册9.2.1总体取值规律的估计课件(25张ppt)

文档属性

名称 2021-2022学年高一下学期数学人教A版(2019)必修第二册9.2.1总体取值规律的估计课件(25张ppt)
格式 pptx
文件大小 914.2KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2022-02-28 20:49:36

图片预览

文档简介

(共25张PPT)
(第一课时)
9.2.1总体取值规律的估计
收集数据是为了寻找数据中蕴含的信息。因为实际问题中数据多而杂乱,往往无法直接从原始数据中发现规律,所以需要根据问题的背景特点,选择合适的统计图表对数据进行整理和直接描述。在此基础上,通过数据分析,找出数据中蕴含的信息,就可以用这些信息来解决实际问题了。
一、复习回顾、引入主题
二、创设情境,提出问题
问题1:我国是世界上严重缺水的国家之一,城市缺水问题较为突出. 某市政府为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度,即确定一户居民月均用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费,如果希望确定一个比较合理的标准,以使大部分居民用户的水费支出不受影响,你认为需要做哪些工作
每户居民月均用水量标准如果定得太低,会影响很多居民的日常生活;如果标准太高,则不利于节水、为了确定一个较为合理的用水标准,必须先了解在全市所有居民用户中,月用水量在不同范围内的居民用户所占的比例情况.
假设通过随机抽样,获得了100户居民用户的月均用水量数据:(单位:t)
问题2:从这组数据我们能发现什么信息呢?
最小值是1.3t,最大值是28.0t.
由于全市居民用户很多,通常采用抽样调查的方式,通过分析样本观测数据,来估计全市居民用户月均用水量的分布情况。
问题3:为了更深人地挖掘数据蕴含的信息,需要对数据作进一步的整理与分析.在实际问题中,我们更关心什么问题?
月均用水量在不同范围内的居民用户占全市居民用户的比例.
二、类比作图,感受方法
问题4:为了了解数据分布的规律,可利用频率分布表和频率分布直方图来分析. 如何画频率分布表和频率分布直方图?有没有以往的经验?与画频数分布直方图类似,我们可以按照以下步骤制作频率分布表、画频率分布直方图。
此样本观测数据的最小值是1.3t,最大值是28.0t,
极差为28.0-1.3=26.7。这说明样本观测数据的变化范围是26.7t.
1.求极差
极差为一组数据中最大值与最小值的差.
2.决定组距与组数
组数太多或太少,都会影响我们了解数据的分布情况.组距与组数的确定没有固定的标准,常常需要一个尝试和选择的过程.分组时先确定组距,如果我们取所有组距为3,则组数为
即可将数据分为9组
当样本容量不超过100时,常分成5~12组,为了方便起见,
一般取等长组距,并且组距应力求“取整”.
由于组距为3,9个组距的长度超过极差,我们可以使第一组的左端点略小于数据中的最小值1.3,最后一组的右端点略大于数据中的最大值28.例如,可以取区间为[1.2,28.2],按如下方式把样本观测数据以组距3分为9组:
[1.2,4.2),[4.2,7.2),… ,[25.2,28.2].
计算各小组的频率,例如第一小组的频率是
3.将数据分组
4.列频率分布表
4.列频率分布表
5.画频率分布直方图
月平均用水量/t
0.12
0.1
0.08
0.06
0.04
0.02
0
1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
0.077
频率/组距
分组 频率 频率 / 组距
[1.2,4.2) 0.23 0.077
[4.2,7.2) 0.32 0.107
[7.2,10.2) 0.13 0.043
[10.2,13.2) 0.09 0.030
[13.2,16.2) 0.09 0.030
[16.2,19.2) 0.05 0.017
[19.2,22.2) 0.03 0.010
[22.2,25.2) 0.04 0.013
[25.2,28.2] 0.02 0.007
用横轴表示月均用水量,纵轴表示频率与组距的比值,以每个组距为底,以频率除以组距的商为高,分别画出矩形,这样得到的直方图就是频率分布直方图。
月平均用水量/t
0.12
0.1
0.08
0.06
0.04
0.02
0
1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
0.077
频率/组距
探究1:频率分布直方图与频数分布直方图有什么区别
频率分布直方图的优点:把样本数据落在各小组的比例大小直观化,更有利于我们从整体上把握数据分布的特点.
注意:频率直方图纵轴表示频率除以组距,就是小长方形的高,它反映了各组样本观测数据的疏密程度.
合理发问,深化理解
探究2:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积总和为多少?
小长方形的面积=
组距X
组距
频率
=频率
所以各小长方形的面积表示相应各组的频率.
各小长方形的面积总和为1.
月平均用水量/t
0.12
0.1
0.08
0.06
0.04
0.02
0
1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
0.077
频率/组距
频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小。
1).求极差(即一组数据中最大值与最小值的差)
2).决定组距与组数(将数据分组)
3). 将数据分组
方法小结:画频率分布直方图的步骤
4).列出频率分布表.(填写频率/组距一栏)
5).画出频率分布直方图.
组距:指每个小组的两个端点的距离,
组数:将数据分组,当数据在100个以内时,
按数据多少常分5-12组.
月平均用水量/t
0.12
0.1
0.08
0.06
0.04
0.02
0
1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
0.077
频率/组距
(3)从频率分布直方图表得不出原始的数据内容,
把数据表示成直方图后,原有的具体数据信息就被抹掉了.
有了样本观测数据的频率分布,我们可以用它估计总体的取值规律.根据100 户居民用户的月均用水量的频率分布,可以推测该市全体居民用户月均用水量也会有类似的分布,即大部分居民用户月均用水量集中在较低值区域.
这使我们确定用水量标准时,可以定一个合适的值,以达到既不影响大多数居民用户的水费支出,又能节水的目的.
需要注意的是,由于样本的随机性,这种估计可能会存在一定误差,但这一误差一般不会影响我们对总体分布情况的大致了解.
分别以3和27为组数,对数据进行等距分组,画出100户居民用户月均用水量的频率分布直方图.观察图形,你发现不同的组数对于直方图呈现数据分布规律有什么影响?
探究3
从上图可以看出,同一组数据,组数不同,得到的直方图形状也不尽相同.
图(1)中直方图的组数少、组距大,从图中容易看出,数据分布的整体规律是随着月均用水量的增加,居民用户数的频率在降低,而且月均用水量在区间[1.2,10.2)内的居民用户数的频率,远大于在另两个区间[10.2,19.2)和[19.2,28.2)内的频率,这说明大部分居民用户的月均用水量都少于10.2 t.
图(2)中直方图的组数多、组距小,从图中可以看出,数据主要集中在低值区,尤其在区间[5.2,6.2)内最为集中,从总体上看,随着月均用水量的增加,居民用户数的频率呈下降趋势,但存在个别区间频率变大或者缺少的现象.
从上述分析可见,当频率分布直方图的组数少、组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原始数据信息;
当频率分布直方图的组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则,不容易从中看出总体数据的分布特点.
同时,对于同一组数据,因为组距、组数不同而得到不同形状的直方图,会给人以不同的频率分布印象,这种印象有时会影响人们对总体的判断.因此,我们要注意积累数据分组、合理使用图表的经验.
三、例题讲解
例1 某高校调查了200名学生每周的自习时间(单位:小时),制成了
如图所示的频率分布直方图,其中自习时间范围是[17.5,30],
样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),
[27.5,30).根据直方图,a= ,这200名学生中每周的
自习时间不少于22.5小时的人数是_________.
自习时间/小时
频率/组距
O
20
22.5
17.5
25
27.5
30
0.02
0.16
0.10
a
0.04
0.08
140
例2:调查某校高三年级男生的身高,随机抽取40名高三
男生,实测身高数据(单位:cm)如下:
171 163 163 166 166 168 168 160 168 165
171 169 167 169 151 168 170 168 160 174
165 168 174 159 167 156 157 164 169 180
176 157 162 161 158 164 163 163 167 161
(1)作出频率分布表;(2)画出频率分布直方图。
三、例题讲解
解:最低身高151 cm,最高身高180 cm,它们的差是180-151=29,即极差为29;确定组距为4,组数为8,列表如下:
分组 频数 频率
[149.5,153.5) 1 0.025
[153.5,157.5) 3 0.075
[157.5,161.5) 6 0.15
[161.5,165.5) 9 0.225
[165.5,169.5) 14 0.35
[169.5,173.5) 3 0.075
[173.5,177.5) 3 0.075
[177.5,181.5) 1 0.025
合计 40 1
(2)频率分布直方图如图所示.
四、课堂小结
总体取值规律的估计
再会!