(共36张PPT)
我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了减少水资源的浪费,计划在对居民生活用水费实施阶梯式水价制度,即确定一个居民月用水量标准a , 用水量不超过a的部分按平价收费,超过a的部分按议价收费.
如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?为了较为合理地确定出这个标准,你认为需要做哪些工作?
提出问题
第九章 9.2用样本估计总体
9.2.1总体取值规律的估计
学习目标
1.掌握频率分布表的作法以及频率分布直方图的画法.
2.掌握用频率分布直方图估计总体.
3.在问题情境中会用不同的统计图分析样本数据.
4.能从统计图表中获取有价值的信息,估计总体分布的规律.
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.4 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3
5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8
7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
通过随机抽样,我们获得了100位居民某年的月均用水量(单位:t).
第N组的频率=
第N组频数
样本容量
什么是频率呢?
学习新知:频率分布表
什么是频数
各组内的数据的个数叫做频数.
1.求极差(即计算最大值与最小值的差)
2.决定组距和组数
3.将数据分组
组数=
最大值-最小值
组距
[1.2,4.2),[4.2,7.2),[7.2,10.2),…,[25.2,28.2]
组数为9
28.0-1.3=26.7
分组 频数累计 频数
[1.2,4.2)
[4.2,7.2)
[7.2,10.2)
[10.2,13.2)
[13.2,16.2)
[16.2,19.2)
[19.2,22.2)
[22.2,25.2)
[25.2,28.2]
合计
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.4 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3
5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8
7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
分组 频数累计 频数
[1.2,4.2) 正正正正
[4.2,7.2) 正正正正正正
[7.2,10.2) 正正
[10.2,13.2) 正
[13.2,16.2) 正
[16.2,19.2) 正
[19.2,22.2)
[22.2,25.2)
[25.2,28.2]
合计
32
13
9
9
5
3
4
2
100
23
100位居民月均用水量的频率分布表
分组 频数累计 频数 频率
[1.2,4.2) 正正正正
[4.2,7.2) 正正正正正正
[7.2,10.2) 正正
[10.2,13.2) 正
[13.2,16.2) 正
[16.2,19.2) 正
[19.2,22.2)
[22.2,25.2)
[25.2,28.2]
合计
32
13
9
9
5
3
4
2
100
23
0.32
0.13
0.09
0.09
0.05
0.03
0.04
0.02
1.00
0.23
100位居民月均用水量的频率分布表
分组 频数累计 频数 频率
[1.2,4.2) 正正正正
[4.2,7.2) 正正正正正正
[7.2,10.2) 正正
[10.2,13.2) 正
[13.2,16.2) 正
[16.2,19.2) 正
[19.2,22.2)
[22.2,25.2)
[25.2,28.2]
合计
32
13
9
9
5
3
4
2
100
23
0.32
0.13
0.09
0.09
0.05
0.03
0.04
0.02
1.00
0.23
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
0.077
频率/组距
100位居民月均用水量的频率分布直方图
月平均用水量/t
0.12
0.1
0.08
0.06
0.04
0.02
0
1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
0.077
频率/组距
学习新知:频率分布直方图
画
频
率
分
布
直
方
图
的
步
骤
开始
求极差
定组距和组数
数据分组
列频率分布表
画频率分布直方图
结束
思考:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积总和为多少?
小长方形的面积
组距X
组距
频率
=频率
月平均用水量/t
0.12
0.1
0.08
0.06
0.04
0.02
0
1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
0.077
频率/组距
=频率
各小长方形的面积总和为1
你能根据上述频率分布表和频率分布直方图指出居民月均用水量的一些数据特点吗?
月平均用水量/t
0.12
0.1
0.08
0.06
0.04
0.02
0
1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
0.077
频率/组距
应用新知
抽样
估计
总体
样本
通过样本的频率分布估计总体取值情况
统计的重要思想
思考:分别以3和27为组数,对数据进行等距分组,画出100户居民用户月均用水量的频率分布直方图。观察图形,你发现不同的组数对直方图呈现数据分布规律有什么影响?
知识探究
样本分布
频 率 分 布 表
频率分布直方图
准确
直观
总体分布
小结:
1.在抽查产品尺寸的过程中,将其尺寸分成若干组,[a,b)是其中的一组,该组的频率为m,在频率分布直方图中,该组的小长方形的高为h,则|a-b|等于( )
√
练习:
2、从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示,直方图中x的值为______,
(0.0024+0.0036+0.0060+x+0.0024+0.0012)×50=1,
解x=0.0044.
3.某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
练习:
(2)已知样本中分数小于40的学生有5人,
试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,
且样本中分数不小于70的男女生人数相等.
试估计总体中男生和女生人数的比例.
根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,
所以样本中分数小于70的频率为1-0.6=0.4,
所以从总体的400名学生中随机抽取一人,估计其分数小于70的概率约为0.4.
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,
试估计总体中分数在区间[40,50)内的人数;
根据题意可知样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,
样本中分数在区间[40,50)内的人数为100-100×0.9-5=5,
由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×
100=60,
所以样本中分数不小于70的男生人数为
所以样本中的男生人数为30×2=60,
女生人数为100-60=40,
所以样本中男生和女生人数的比例为60∶40=3∶2,
所以估计总体中男生和女生人数的比例约为3∶2.
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
除了频率分布直方图,我们还学习了条形图,扇形图,折线图,频数分布直方图等,它们各自有什么特点?
思考:
例2、已 知某市2015年全年空气质量等级如下表所示:
选择合适的统计图描述数据,并回答下列问题:
(1)分析该市2016年6月的空气质量情况;
(2)比较该市2016年5月和6月的空气质量,哪个月的空气质量较好?
(3)比较该市2016年6月与该市2015年全年的空气质量,2016年6月的空气质量是否好于去年?
例题分析:
2016年5月和6月的空气质量指数如下:
5月 240 80 56 53 92 126 45 87 56 60
191 62 55 58 56 53 89 90 125 124
103 81 89 44 34 53 79 81 62 116 88
6月 63 92 110 122 102 116 81 163 158 76
33 102 65 53 38 55 52 76 99 127
120 80 108 33 35 73 82 90 146
解:(1)作出2016年6月的频数和频率分布表:
例题分析:
用条形统计图和扇形统计图对数据作出直观的描述
例题分析:
用折线图展示空气质量指数随时间的变化情况:
例题分析:
(2)5、6两月复合条形图
例题分析:
(3)2016年6月和2015年全年的空气质量等级的频率分布条形图:
例题分析:
由此,你能得出2016年的空气质量比2015年明显改善了 的结论吗
统计图表 主要应用
扇形图 直观描述各类数据占总数的比例
条形图和直方图 离散型、连续型 直观描述不同类别或分组数据的频数和频率
折线图 描述数据随时间的变化趋势
解决问题的过程中,根据实际问题的特点,选择恰当的统计图对数据进行可视化描述,
通过图形直观地发现样本数据的分布情况,进而估计总体的分布规律.
总结:
1.某商业集团董事长想了解集团旗下五个超市的销售情况,通知五个超市经理把最近一周每天的销售金额统计上报,要求既要反映一周内每天销售金额的多少,又能反映一周内每天销售金额的变化情况和趋势,最好选用的统计图表为
A.频率分布直方图 B.折线统计图
C.扇形统计图 D.统计表
折线统计图的一个显著特点就是能反映统计量的变化趋势,所以既要反映一周内每天销售金额的多少,又能反映一周内每天销售金额的变化情况和趋势,则最好选用的统计图表为折线统计图.
√
2.小吴一星期的总开支分布如图(1)所示,一星期的食品开支如图(2)所示,则小吴一星期的鸡蛋开支占总开支的百分比为
A.1% B.2% C.3% D.5%
√
由题图(1)可知,食品开支占总开支的30%,
3.(多选)汽车的“燃油效率”是指汽车每消耗1 L汽油行驶的里程,如图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况.下列叙述中正确的是
A.消耗1 L汽油,乙车最多可行驶5 km
B.甲车以80 km/h的速度行驶1 h约消耗
8 L汽油
C.以相同速度行驶相同路程,三辆车中,
甲车消耗汽油最多
D.某城市机动车最高限速80 km/h.相同条件下,在该市用丙车比用乙车更
省油
√
√
由题图可知,当乙车速度大于40 km/h时,
乙车每消耗1 L汽油,行驶里程都超过5 km,
A错误;
甲车以80 km/h的速度行驶时,燃油效率约为
10 km/L,则行驶1 h约消耗8 L汽油,B正确;
以相同速度行驶相同路程,燃油效率越高耗油越少,故三辆车中甲车消耗汽油最少,C错误;
在机动车最高限速80 km/h的条件下,丙车比乙车燃油效率更高,所以更省油,D正确.
4.已知某地区中小学生人数和近视情况分别如图(1)和图(2)所示,为了解该地区中小学生的近视形成原因,用按比例分配分层随机抽样的方法抽取了2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为______和_____.
200 20
该地区中小学生总人数为3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×
50%=20.
一
滴
水
,
一
份
责
再 见