第六章 数据的分析
6.2 中位数与众数
回顾(1)
日常生活中,我们常用平均数来描述 一组数据的“集中趋势”。
一般地,对于 n 个数 x1,x2,…,xn,我们把 ( x1+x2+…+xn ) /n 叫做这
n 个数的算术平均数,简称平均数。记为 x 。
在实际问题中,一组数据里的各个数据的“重要程度” 未必相同。因而,在计算这组数据的平均数时,往往给每个数据一个“权 ”。这种情况下计算出来的平均数称为
加权平均数。
回顾(2)
某公司员工的月工资如下:
员工
经理
副经理
职员
A
职员
B
职员
C
职员
D
职员
E
职员
F
杂工G
月工
资/ 元
7000
4400
2400
2000
1900
1800
1800
1800
1200
我公司员工收入很高,月平均工资2700元。
经理
我们好几个人工资是1800元。
职员D
你是怎样看待该公司员工的收入呢 ?
你认为用哪个数据描述员工收入集中趋势更合适?
情景导入
一般地,n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。
一组数据中出现次数最多的数据叫做这组数据的众数。
平均数、中位数、众数都是描述数据集中趋势的统计量。
1.认识中位数和众数,会求一组数据的中位数和众数;
2.会利用中位数、众数分析数据信息做出决策;
3.进一步认识平均数、中位数、众数都是描述数据集中趋势的统计量;
4.了解平均数、中位数、众数在描述数据时的差异.
学习目标
1. 为什么该公司员工收入的平均数比中位数高得多?
分组讨论:
由于正副经理的工资特别高,将平均工资“拉高”了.(计算平均数时,所有数据都参加运算,它能充分利用数据所提供的信息,但容易受极端值的影响)
2.你认为用哪个数据描述该公司员工收入的集中 趋势更合适?
员工
经理
副经理
职员A
职员B
职员C
职员D
职员E
职员F
职员G
月薪 (元)
7000
4400
2400
2000
1900
1800
1800
1800
1200
员工
经理
副经理
职员A
职员B
职员C
职员D
职员E
职员F
职员G
月薪 (元)
7000
4400
2400
2000
1900
1800
1800
1800
1200
1.经理说平均工资有2700元是否欺骗了应聘者?
2.职员C说他的工资1900元居中等水平什么意思?
3.职员D的工资1800元在上表数据中有什么特点?
没有,月平均工资2700元,指所有员工工资的平均数是2700元,说明公司每月将支付工资总计2700×9=24300(元)
1900元恰好居于所有员工工资的“正中间”---称为中位数
1800元出现次数最多,称为众数
基础练习(一)
下面两组数据的众数与中位数分别是多少? (1)5 6 2 3 2
(2)12 16 19 17 13 16
解:将两组数据从大到小进行排序.
(1)2 2 3 5 6 中位数是3
(2)12 13 16 16 17 19 中位数是16
基础练习(二)
数 据
中位数
众数
15,20,20,22,35
?
?
15,20,20,22,35,38
?
?
15,20,20,22,35,35
?
?
3,0,-1,5,5,-3,14
?
?
提问:众数是否唯一?
20
21
21
3
20
20
20和35
5
先排序、看奇偶,再确定中位数。
求中位数的一般步骤:
1、将这一组数据从小到大(或从大到小)排列;
2、若该数据含有奇数个数,位于中间位置的数是中位数;
若该数据含有偶数个数,位于中间两个数的平均数就是中位数。
你知道中间位置如何确定吗?
n 为奇数时,中间位置是第 个
n为偶数时,中间位置是第 , 个
众数是一组数据中出现次数最多的数据,是一组数据中的原数据,而不是相应的次数. 而且往往不是唯一的. 不能充分利用所有的数据信息。
中位数的优点是计算简单,只与其在数据中的位置有关.它不一定与这组数据中的某个数据相等.不能充分利用所有数据的信息.
对于一组数据:3,3,2,3,6,3,10,3,6,3,2,下列说法正确的是( )
A.这组数据的众数是3;
B.这组数据的众数与中位数的数值不等;
C.这组数据的中位数与平均数的数值相等;
D.这组数据的平均数与众数的数值相等。
答案:A
拓展延伸(一)某公司销售部有营销人员15人,销售部为了制定某种商品的月销售定额,统计了这15人某月的销售量如下:
每人销售件数
1800
510
250
210
150
120
人数
1
1
3
5
3
2
求(1)这15位营销人员该月销售量的中位数和众数;
(2)假设销售部负责人把每位营销人员的月销售额定为320件,你认为是否合理,为什么?如不合理,请你制定一个较合理的销售定额,并说明理由.
(1)210件、210件 .
(2)不合理.因为15人中有13人的销售额达不到320件,不能反映营销人员销售件数的集中趋势。把销售额定为210件合适,因为它既是中位数又是众数,是大部分人能达到的销售件数.
教室里,三个同学正在为谁的数学成绩最好而争论,他们五次数学成绩分别是:
小康: 62、 94、 95、 98、 98
小丽: 62、 62、 98、 99、 100
小芳: 40、 62、 85、 99、 99
他们都认为自己的成绩比另外两位同学好,根据你对数据的分析,应该确定哪个同学数学成绩最好呢?
平均数
中位数
众数
小康
89.4
95
98
小丽
84.2
98
62
小芳
77
85
99
分别算出三位同学的平均数、中位数、众数:
怎样比较呢?
小康说他的数学成绩最好,是因为他是他们三人中 最高的人。
小芳说他的数学成绩最好,是因为他是他们三人中 最高的人。
小丽说他的数学成绩最好,是因为他是他们三人中 最高的人。
平均数
中位数
众数
张华是一位校鞋经销部的经理,为了解鞋子的销售情况,随机调查了9位学生的鞋子的尺码,由小到大是:20,21,21,22,22,22,22,23,23。对这组数据的分析中,张华最感兴趣的数据是( )
C
(A)平均数 (B)中位数 (C)众数
拓展延伸(三)
某鞋店在一段时间内销售了一批女鞋40双,其中各种尺码的销售量如下表所示:
尺码(cm)
22
22.5
23
23.5
24
24.5
25
销售量(双)
2
2
7
15
8
5
1
(1)求40双女鞋尺寸的众数.
(2)你能根据上面的数据为这家鞋店提供进货建议吗?
解:(1)23.5cm是这组数据的众数.
(2)由(1)得,尺码23.5cm的鞋销量最大,因此可以建议鞋店多进尺码23.5cm的鞋.
提示:当一组数据有较多的重复数据时,众数往往是人们所关心的一个量.
平均数、中位数及众数都是描述一组数据的集中趋势的统计量,它们有各自的优势,也存在局限性.
平均数
中位数
众数
与排序位置有关,不受极端值影响
与全体数据有关,信息全面可靠
求法简单,不受极端值影响
易受极端值影响,有时计算较繁
该统计量出现多个时,意义不大
只反映部分数据,可靠性较差
课堂小结
统计量
相同点
优点
缺点
求法
个数
不唯一
平均数、中位数和众数的比较
公式
先排序后求数
出现次数最多
唯一
唯一
反映中等水平
反映出现最多的数据
反映平均水平
易受极端
值的影响
不能全面反映数据
有多个众数时没有特别意义
中位数
众数
平均数
都是描述数据集中趋势的统计量