课件43张PPT。 探究:我国是世界上严重缺水的国家之一,城市缺水问题较为突出. 某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费. 如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作? 为了确定一个较为合理的标准a,必须先了解
全市居民日常用水量的分布情况,比如月均用水量
在哪个范围的居民最多,他们占全市居民的百分比
是多少?由于住户较多,可采用抽样调查的方式,
通过分析样本数据一来估计全市居民用水量的分布
情况. 假设通过抽样,我们获得了100位居民某年的
月均用水量(单位:t):思考:上面这些数字能告诉我们什么呢?分析:最容易发现的是一个居民月均用水量的最
小值是0.2t,最大值为4.3t,其他在0.2与4.3之
间. 除此之外,很难发现其他信息了. 很难从随
意记录下来的数据中直接看出规律. 为此要对数
据进行整理与分析。 分析数据的一种基本方法是用图将它们画现
来,或者用紧凑的表格改变数据的排列方式. 作
图可以达到两个目的,一是从数据中提取信息,
二是利用图形传递信息. 表格则是通过改变数据
的构成形式,为我们提供解释数据的新方式. 画频率分布表与频率分布直方图的步骤:
(频率分布:是样本数据在各个小组内所占比例
的大小.)(1)求极差(2)确定组距与组数 (3)将数据分组 (4)列频率分布表 (5)画频率分布直方图极差:一组数据中最大值与最小值的差.
4.3-0.2=4.1
这说明样本数据的变化范围是
4.1t (0≤t≤1). 将数据分成互不相交的组,把区间取为左闭
右开区间,最后一组为闭区间.
以组距为0.5将数据分组时,可以分成9组:
[0,0.5),[0.5,1),……,[4,4.5].[问题] 样本在区间[1,2)上的频率为多少?探究:同样一组数据,如果组距不同,横轴、纵
轴的单位不同,得到的图的形状也会不同,不同
的形状给人以不同的印象,这种印象有时会影响
我们对总体的判断,分别以0.1和1为组距重新作
图,然后谈谈你对图的印象.思考:如果当地政府希望使85%以上的居民每月的
用水量不超出标准,根据频率分布表和频率分布直
方图,你能对制定月用水量标准提出建议吗? 分析:月用水量在3 t以上的居民所占的比例为6%
+4%+2%=12%,即大约有12%的居民月用水量在3t以
上,88%的居民月用水量在3t以下. 因此,居民月
用水量标准定为3t是一个可以考虑的标准.想一想:你认为3t这个标准一定能够保证85%以
上的居民用水不超标吗?如果不一定,那么哪些
环节可能会导致结论的差别?频率分布折线图:连接频率分布直方图中各小长
方形上端的中点.思考:(1)上例的样本容量为100,如果增至
1000,其频率分布直方图的情况会有什么变化?
假如增至10000呢?分析:样本容量越大,这种估计越精确。但随
着样本容量的增加,作图时所分的组数增加,
组距减小,相应的频率折线图会越来越接近于
一条光滑曲线. 当样本容量无限增大,组距无
限缩小,那么频率分布直方图就会无限接近于
一条光滑曲线,统计中称这条光滑曲线为总体
密度曲线。(图中阴影部分的面积,表示总体在某个区间
(a, b) 内取值的百分比)总体密度曲线
说明:(1)总体密度曲线反映了总体在各个范围
内取值的百分比,精确地反映了总体的分布规律,
是研究总体分布的工具.
(2)用样本分布直方图去估计相应的总体
分布时,一般样本容量越大,频率分布直方图就会
无限接近总体密度曲线,就越精确地反映了总体的
分布规律,即越精确地反映了总体在各个范围内取
值百分比. 思考:可以由样本的频率分布折线图得到准确的总
体密度曲线吗? 茎叶图
某赛季甲、乙两名篮球运动员每场比赛得分的原始
记录如下:
甲运动员得分:13,51,23,8,26,38,16,33,
14,28,39;
乙运动员得分:49,24,12,31,50,31,44,36,
15,37,25,36,39.用茎叶图列出甲、乙两名运动员的分数:分析:茎是指中间的一列数,叶就是从茎的旁
边生长出来的数。中间的数字表示得分的十位
数,旁边的数字分别表示两个人得分的个位数。
乙运动员的得分基本上是对称的,叶的分布是
“单峰”的,有的叶集中在茎2,3,4上,中位数
是36;甲运动员的得分除一个特殊得分(51分)
外,也大致对称,叶的分布也是“单峰”的,的叶
集中在茎1,2,3上,中位数是26。由此可看出,
乙运动员的成绩更好。另外,从叶在茎上的分布
情况看,乙运动员的得分集中于峰值附近,这说
明乙运动员的发挥更稳定.茎叶图的特征
1.用茎叶图表示数据有两个优点:一是从统计图
上没有原始数据信息的损失,所有数据信息都可
以从茎叶图中得到;二是茎叶图中的数据可以随
时记录,随时添加,方便记录与表示。
2.茎叶图只便于表示两位有效数字的数据,而且
茎叶图只方便记录两组的数据,两个以上的数据
虽然能够记录,但是没有表示两个记录那么直观、
清晰。例1. 对某电子元件进行寿命追踪调查,情况如下:(1)列出频率分布表;(2)画出频率分布直方图;(3)估计元件寿命在100~400h以内的在总体中占
的比例;(4)估计电子元件寿命在400 h以上的在总体中占
的比例.解:(1)样本频率分布表如下:(2)频率分布直方图如下:(3)元件寿命在100h~400h以内的在总体中占的
比例为0.10+0.15+0.40=0.65.
(4)估计电子元件寿命在400h以上的在总体中占
的比例为1-0.65=0.35.[变式] 同学们在你画出的频率分布直方图中,若
从左到右各小正方形的面积之比为2 :3 :8 :4 :3,
第二小组频数为60.
问:(1)第二小组的频率是多少,样本容量是多
少?
(2)若寿命在300h以上(含300h)为合格,
估计合格率为多少?例2. 在育才中学举行的电脑知识竞赛中,将高
一两个班参赛学生的成绩(得分的整数)进行整
理后分成五组,绘制出如下的频率分布图直方图,
已知图中从左到右的第一、第三、第四、第五小
组的频率分别为0.30,0.15,0.10,0.05,第二
小组的频率为40.
(1)求第二小组的频率,并补全这个频率分布直
方图;
(2)求这两个班参赛的学生人数.
分析:根据图中所有长方形的面积之和为1,可求
得第二小组的频率,从而可求出第二小组的“频率
/组距”,从而补全直方图.解:(1)因为各小组的频率之和为1.00,第一、
三、四、五组的频率分别是0.30,0.15,0.10,
0.05,所以第二小组的频率为1.00-(0.30+0.15
+0.10+0.05)=0.40 .
因为第二小组的频率为0.40,所以落在59.5
~69.5的第二组的小长方形的高=频率/组距=0.4
/10=0.04 ,由此可补全直方图(如图中阴影部分). (2)设高一两个班参赛的学生人数为x 人,
因为第二小组的频数为40,频率为0.40,所以40/
x=0.40,得x=100人. 例3. 某中学高一(2) 班甲、乙两名同学自高中
以来每场数学考试成绩情况如下:
甲的得分:95,81,75,91,86,89,71,65,76,
88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,
98,79,101.
画出两人数学成绩的茎叶图,请根据茎叶图对
两人的成绩进行比较.分析:用中间的数字表示两位同学得分的十位数和
百位数.两边的数字分别表示两人每场数学考试成
绩的个位数.解:甲、乙两人数学成绩的茎叶图如下图. 从这个茎叶图上可以看出 乙同学的得分情况是大
致对称的,中位数是98;甲同学的得分情况除一个特殊
得分(110分)外. 也大致对称,中位数是88.因此乙
同学发挥比较稳定,总体得分情况比甲同学好. 1202. 某校为了了解学生的课外阅读情况,随机调查了
50名学生.得到他们在某一天各自课外阅读所用时间
的数据.结果用下面的条形图表示.根据条形图可得
这50名这一天平均每人的课外阅读时间为( )
A. 0.6小时 B. 0.9小时 C. 1.0小时 D. 1.5小时B0.125解答题:
5. 从高三学生中抽取50名同学参加数学竞赛,成
绩的分组及各组的频数如下:
[40,50),2:[50,60),3:[60,70),10:[70,
80),15:[80,90),12:[90,100],8.
(1)列出样本的频率分布表(含累计频率);
(2)画出频率分布直方图;
(3)估计成绩在[60,90]分的学生比例;
(4)估计成绩在85分以下的学生比例.解:(1)样本频率分布表如下.(2)频率分布直方图如下.(3)估计成绩在[60,90]分的学生比例为0.20+
0.30+0.24=0.74.(4)估计成绩在80分以下的学生比例为0.04+0.06
+0.20+0.30=0.60. 为了了解初三学生女生身高情况,某中学对初三
女生身高进行了一次测量,所得数据整理后列出了频率分布表如下:(1)求出表中m、n、M、N所表示的数分别是多少?
(2)画频率分布直方图.