(共25张PPT)
学习目标:
(一)知识与技能要求
能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征,并作出合理的解释
(二)过程与方法要求
在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的基本数字特征估计总体的基本数字特征
(三)情感态度与价值观要求
体会统计对决策的作用,提高学习统计知识的兴趣
重点与难点:
重点:
1、实例理解样本标准差的意义和作用
2、学会计算数据的标准差;
难点:
1、理解样本标准差的意义和作用
2、形成对数据处理过程进行初步评价的意识
众数、中位数、平均数
数字特征之一:
一、众数、中位数、平均数的概念
中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.
众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.
平均数: 一组数据的算术平均数,即
x=
例1: 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:
成绩
(单位:米) 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90
人数 2 3 2 3 4 1 1 1
分别求这些运动员成绩的众数,中位数与平均数
解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.
上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;
这组数据的平均数是
答:17名运动员成绩的众数、中位数、平均数依次是1.75(米)、1.70(米)、1.69(米).
频率
组距
0.1
0.2
0.3
0.4
0.5
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t.如图所示:
二 、众数、中位数、平均数与频率分布直方图的关系
1、众数在样本数据的频率分布直方图中,一般认为是最高矩形的中点的横坐标。
2、在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值应该在哪一个矩形框内及这个矩形框内的大约位置。下图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.03t.
频率
组距
0.1
0.2
0.3
0.4
0.5
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
说明:
2.03这是中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.
3、平均数是频率分布直方图的“重心”.
是直方图的平衡点. n 个样本数据的平均数由公式: 给出
X=
下图显示了居民月均用水量的平均数:
x=1.973
频率
组距
0.1
0.2
0.3
0.4
0.5
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
三 、三种数字特征的优缺点
1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.如上例中众数是2.25t,它告诉我们,月均用水量为2.25t的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少.
2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽视的。
3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此 ,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。
四、众数、中位数、平均数的简单应用
例3 某工厂人员及工资构成如下:
人员 经理 管理人员 高级技工 工人 学徒 合计
周工资 2200 250 220 200 100
人数 1 6 5 10 1 23
合计 2200 1500 1100 2000 100 6900
(1)指出这个问题中周工资的众数、中位数、平均数
(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?
解:众数为200,中位数为220,平均数为300。
因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。
方差 标准差
数字特征之二:
思考:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你应当如何对这次射击作出评价
如果看两人本次射击的平均成绩,由于
两人射击 的平均成绩是一样的.那么两个人的水平就没有什么差异吗
结论:平均数向我们提供了样本数据的重要信息,但是平均有时也会使我们作出对总体的片面判断.因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽的.因此,只有平均数还难以概括样本数据的实际状态.
考察样本数据的分散程度的大小,最常用的统计量是标准差.
用s表示.
一组数据中,各数据与它们的平均数的差的平方的平均数。
方差:
方差公式:
一般步骤:
求平均-再求差-然后平方-最后再平均
样本标准差
五、样本方差、标准差
一个样本中的个体与平均数之间的距离关系可用下图表示:
考虑一个容量为2的样本:
a
显然,标准差越大,则a越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
思考问题答:算出甲,乙两人的的成绩的标准差
由 可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.
例4: 为了考察甲、乙两种小麦的长势,分别从中抽出10株苗,测得苗高如下(单位:cm):
甲: 12 13 14 15 10
16 13 11 15 11
乙: 11 16 17 14 13
19 6 8 10 16
问哪种小麦长得比较整齐
方差越大, 波动越大,越不稳定。
(1)甲、乙两名战士在射击训练中,打靶的次数相同,且射击成绩的平均数也相同,如果甲的射击成绩比较稳定,那么方差的大小关系是: S2甲_________S2乙。
课堂练习:
<
做一做:
(2)小明和小聪最近5次数学测验成绩如下:
小明 76 84 80 87 73
小聪 78 82 79 80 81
哪位同学的数学成绩比较稳定?
乙
小结:
1 . 众数、中位数、平均数的概念
2. 众数、中位数、平均数与频率分布直方图的关系
3. 三种数字特征的优缺点
4、样本的方差和标准差
课后作业:
课本70页 A组2
B组1