1.4
数据的数字特征
学案
[读教材·填要点]
1.众数、中位数、平均数
(1)众数的定义:
一组数据中重复出现次数最多的数称为这组数的众数,一组数据的众数可以是一个,也可以是多个.
(2)中位数的定义及求法:
把一组数据按从小到大的顺序排列,把处于最中间位置的那个数(或中间两数的平均数)称为这组数据的中位数.
(3)平均数:
①平均数的定义:
如果有n个数x1、x2、…、xn,那么=,叫作这n个数的平均数.
②平均数的分类:
总体平均数:总体中所有个体的平均数叫总体平均数.
样本平均数:样本中所有个体的平均数叫样本平均数.
2.标准差、方差
(1)标准差的求法:
标准差是样本数据到平均数的一种平均距离,一般用s表示.
s=.
(2)方差的求法:
标准差的平方s2叫作方差.
s2=[(x1-)2+(x2-)2+…+(xn-)2].
其中,xn是样本数据,n是样本容量,是样本均值.
(3)方差的简化计算公式:
s2=[(x+x+…+x)-n2]=(x+x+…+x)-2.
3.极差
一组数据的最大值与最小值的差称为这组数据的极差.
4.数字特征的意义
平均数、中位数和众数刻画了一组数据的集中趋势,极差、方差刻画了一组数据的离散程度.
[小问题·大思维]
1.一组数据的众数一定存在吗?若存在,众数是唯一的吗?
提示:不一定.若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数;不是,可以是一个,也可以是多个.
2.如何确定一组数据的中位数?
提示:(1)当数据个数为奇数时,中位数是按从小到大顺序排列的中间位置的那个数.
(2)当数据个数为偶数时,中位数为排列在最中间的两个数的平均值.
[研一题]
[例1] 据报道,某公司的33名职工的月工资(单位:元)如下:
职务
董事长
副董事长
董事
总经理
经理
管理员
职员
人数
1
1
2
1
5
3
20
工资
5
500
5
000
3
500
3
000
2
500
2
000
1
500
(1)求该公司职工月工资的平均数、中位数、众数.
(2)假设副董事长的工资从5
000元提升到20
000元,董事长的工资从5
500元提升到30
000元,那么新的平均数、中位数、众数又是什么?(精确到元)
(3)你认为哪个统计量更能反映这个公司员工的工资水平,结合此问题谈一谈你的看法.
[自主解答] (1)平均数是
=1
500+
≈1
500+591=2
091(元).
中位数是1
500元,众数是1
500元.
(2)新的平均数是′=1500+
≈1
500+1
788=3
288(元).
中位数是1
500元,众数是1
500元.
(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.
[悟一法]
1.众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
2.众数考查各个数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.
3.中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能在所给的数据中,也可能不在所给的数据中.当一组数据中的个别数据变动较大时,可用中位数描述它的某种集中趋势.
[通一类]
1.某公司销售部有销售人员15人,销售部为了制定某种商品的月销售定额,统计了这15人某月的销售量如下:
销售量(件)
1
800
510
250
210
150
120
人数
1
1
3
5
3
2
(1)求这15位销售人员该月销售量的平均数、中位数及众数;
(2)假设销售部负责人把月销售额定为320件,你认为是否合理,为什么?如不合理,请你制定一个较为合理的销售定额.
解:(1)平均数为(1
800×1+510×1+250×3+210×5+150×3+120×2)=320(件),中位数为210件,众数为210件.
(2)不合理,因为15人中有13人的销售量未达到320件,也就是说,虽然320是这一组数据的平均数,但它却不能反映全体销售人员的销售水平.销售额定为210件更合理些,这是由于210既是中位数,又是众数,是大部分人都能达到的定额.
[研一题]
[例2] 甲、乙两机床同时加工直径为100
cm的零件,为了检验质量,各从中抽取6件进行测量,分别记录数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
[自主解答] (1)甲=(99+100+98+100+100+103)=100,
乙=(99+100+102+99+100+100)=100,
s=[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
s=[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)两台机床所加工零件的直径的平均数相同,又s>s,所以乙机床加工零件的质量更稳定.
[悟一法]
在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性就越差;方差越小,数据越集中,质量越稳定.
[通一类]
2.对划艇运动员甲、乙两人在相同的条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:
甲:27 38 30 37 35 31
乙:33 29 38 34 28 36
根据以上数据,试估计两人最大速度的平均数和标准差,并判断他们谁更优秀.
解:甲=×(27+38+30+37+35+31)==33,
s=×[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]=,
s甲=≈3.96,
乙=×(33+29+38+34+28+36)==33,
s=×[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]=,
s乙=≈3.56.
由上知,甲、乙两人最大速度的平均数均为33
m/s,甲的标准差为3.96
m/s,乙的标准差为3.56
m/s,说明甲、乙两人的最大速度的平均值相同,但乙的成绩比甲的成绩更稳定,故乙比甲更优秀.
[研一题]
[例3] 在一次科技知识竞赛中,两组学生的成绩如下表:
分数
50
60
70
80
90
100
人数
甲组
2
5
10
13
14
6
乙组
4
4
16
2
12
12
已经算得两个组的平均分都是80分.请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.
[自主解答] (1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.
(2)甲=(50×2+60×5+70×10+80×13+90×14+100×6)
=×4
000=80(分),
乙=(50×4+60×4+70×16+80×2+90×12+100×12)
=×4
000=80(分).
s=[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172,
s=[4×(50-80)2+4×(60-80)2+16×(70-80)2+2×(80-80)2+12×(90-80)2+12×(100-80)2]=256.
∵s(3)甲、乙两组成绩的中位数、平均数都是80分.其中,甲组成绩在80分以上(包括80分)的有33人,乙组成绩在80分以上(包括80分)的有26人.从这一角度看,甲组的成绩较好.
(4)从成绩统计表看,甲组成绩大于等于90分的有20人,乙组成绩大于等于90分的有24人,∴乙组成绩集中在高分段的人数多.同时,乙组得满分的人数比甲组得满分的人数多6人.从这一角度看,乙组的成绩较好.
[悟一法]
要正确处理此类问题,首先要抓住问题中的关键词语,全方位地进行必要的计算、分析,而不能习惯性地仅从样本方差的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析,如本例的“满分人数”;其次要在恰当地评估后,组织好正确的语言作出结论.
[通一类]
3.甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:
(1)请填写下表:
平均数
中位数
命中9环以上的次数(含9环)
甲
7
乙
(2)从下列三个不同角度对这次测试结果进行分析:
①从平均数和中位数相结合看,谁的成绩好些?
②从平均数和命中9环及9环以上的次数相结合看,谁的成绩好些?
③从折线图中两人射击命中环数的走势看,谁更有潜力?
解:(1)由图可知,甲打靶的成绩为:2,4,6,8,7,7,8,9,9,10;乙打靶的成绩为:9,5,7,8,7,6,8,6,7,7.
甲的平均数是7,中位数是7.5,命中9环及9环以上的次数是3;
乙的平均数是7,中位数是7,命中9环及9环以上的次数是1.
(2)由(1)知,甲、乙的平均数相同.
①甲、乙的平均数相同,甲的中位数比乙的中位数大,所以甲成绩较好.
②甲、乙的平均数相同,甲命中9环及9环以上的次数比乙多,所以甲成绩较好.
③从折线图中看,在后半部分,甲呈上升趋势,而乙呈下降趋势,故甲更有潜力.
一个球队所有队员的身高如下(单位:cm):
178,179,181,182,176,183,176,180,183,175,181,185,180,184,问这个球队的队员平均身高是多少?(精确到1
cm)
[解] 法一:利用平均数的公式计算.
=×(178+179+181+…+180+184)=×2
523≈180.
法二:建立新数据,再利用平均数简化公式计算.
取a=180,将上面各数据同时减去180,得到一组数据:
-2,-1,1,2,-4,3,-4,0,3,-5,1,5,0,4.
′=×(-2-1+1+2-4+3-4+0+3-5+1+5+0+4)=×3=≈0.2,
∴=′+a=0.2+180≈180.
法三:利用加权平均数公式计算.
=×(185×1+184×1+183×2+182×1+181×2+180×2+179×1+178×1+176×2+175×1)=×2
523≈180.
法四:建立新数据,再利用加权平均数公式计算.
′=×[5×1+4×1+3×2+2×1+1×2+0×2+(-1)×1+(-2)×1+(-4)×2+(-5)×1]
=×0.3≈0.2.
∴=′+a=0.2+180≈180.
1.已知一组数据为20,30,40,50,50,60,70,80,其中平均数,中位数和众数大小关系是( )
A.平均数>中位数>众数
B.平均数<中位数<众数
C.中位数<众数<平均数
D.众数=中位数=平均数
解析:可得出这组数据的平均数、中位数和众数均为50.
答案:D
2.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本方差为( )
A.
B.
C.
D.2
解析:∵样本的平均数为1,即×(a+0+1+2+3)=1,∴a=-1,∴样本方差s2=×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.
答案:D
8
9
7
9
3
1
6
4
0
2
3.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )
A.91.5和91.5
B.91.5和92
C.91和91.5
D.92和92
解析:将这组数据从小到大排列,得87,89,90,91,92,93,94,96.故平均数=
=91.5,中位数为=91.5.
答案:A
4.(2012·湖南高考)如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.
(注:方差s2=[(x1-)2+(x2-)2+…+(xn-)2],其中为x1,x2,…,xn的平均数)
解析:该运动员五场比赛中的得分为8,9,10,13,15,平均得分==11,
方差s2=[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.
答案:6.8
5.甲、乙两人在相同条件下练习射击,每人打5发子弹,命中环数如下:
甲
6
8
9
9
8
乙
10
7
7
7
9
则两人射击成绩的稳定程度是________.
解析:∵甲=8,乙=8,
s=1.2,s=1.6,
∴s∴甲稳定性强.
答案:甲比乙稳定
6.某农科所为寻找高产稳定的油菜品种,选了三个不同的油菜品种进行试验,每一品种在五块试验田试种.每块试验田的面积为0.7公顷,产量情况如下表:
品种
各试验田产量(kg)
1
2
3
4
5
1
21.5
20.4
22.0
21.2
19.9
2
21.3
23.6
18.9
21.4
19.8
3
17.
8
23.3
21.4
19.1
20.8
试评定哪一品种既高产又稳定.
解:1=21.0
kg,2=21.0
kg,3=20.48
kg;
s=0.572,s=2.572,s=3.5976,
∴1=2>3,s<s<s.
∴第一个品种既高产又稳定.
一、选择题
1.在某项体育比赛中,七位裁判为一选手打出的分数如下:90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )
A.92,2
B.92,2.8
C.93,2
D.93,2.8
解析:去掉最高分95和最低分89后,剩余数据的平均数为==92,
方差为s2=×[(92-90)2+(92-90)2+(93-92)2+(94-92)2+(93-92)2]=×(4+4+1+4+1)=2.8.
答案:B
2.已知一组数据为-3,5,7,x,11,且这组数据的众数为5,那么数据的中位数是( )
A.7
B.5
C.6
D.11
解析:这组数据的众数为5,则5出现的次数最多,
∴x=5,那么这组数据按从小到大排列为-3,5,5,7,11,则中位数为5.
答案:B
3.如图所示,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB,则( )
A.A>B,sA>sB
B.AsB
C.A>B,sAD.A解析:A中的数据都不大于B中的数据,所以AsB.
答案:B
4.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为m0,平均数为,则( )
A.me=m0=
B.me=m0<
C.meD.m0解析:易知中位数的值me==5.5,众数m0=5,平均数=×(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)≈6,所以m0答案:D
5.(2013·济南高一检测)一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( )
A.57.2 3.6
B.57.2 56.4
C.62.8 63.6
D.62.8 3.6
解析:设该组数据为x1,x2,…,xn,则(x1+x2+…+xn)=2.8,
[(x1-2.8)2+(x2-2.8)2+…+(xn-2.8)2]=3.6,
所以,所得新数据的平均数为[(x1+60)+(x2+60)+…+(xn+60)]=(x1+x2+…+xn)+60=2.8+60=62.8.
所得新数据的方差为[(x1+60-62.8)2+(x2+60-62.8)2+…+(xn+60-62.8)2]
=[(x1-2.8)2+(x2-2.8)2+…+(xn-2.8)2]=3.6.
答案:D
二、填空题
6.一个样本按从小到大的顺序排列为10,12,13,x,17,19,21,24,其中位数为16,则x=________.
解析:由中位数的定义知=16,∴x=15.
答案:15
7.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:
学生
1号
2号
3号
4号
5号
甲班
6
7
7
8
7
乙班
6
7
6
7
9
则以上两组数据的方差中较小的一个为
s2=________.
解析:计算可得两组数据的平均数均为7,
甲班的方差s==;
乙班的方差
s==.
则两组数据的方差中较小的一个为s=.
答案:
甲
乙
6
7
9
9
4
7
6
4
3
2
1
8
0
2
4
9
0
9
1
8.甲、乙两个小组各8名同学的英语口语测试成绩的茎叶图如右图所示,则甲、乙两组的平均数与中位数之差较大的组是________.
解析:由茎叶图可知,甲的平均数和中位数分别是83.625和83.5;乙的平均数和中位数分别是82.25和81.故乙的平均数和中位数之差较大.
答案:乙组
三、解答题
9.为了了解市民的环保意识,某校高一(1)班50名学生在6月5日(世界环境日)这一天调查了各自家庭丢弃旧塑料袋的情况,有关数据如下表:
每户丢弃旧塑料袋个数
2
3
4
5
户数
6
16
15
13
(1)求这50户居民每天丢弃旧塑料袋的平均数、众数和中位数;
(2)求这50户居民每天丢弃旧塑料袋的标准差.
解:(1)平均数=×(2×6+3×16+4×15+5×13)==3.7.
众数是3,中位数是4.
(2)这50户居民每天丢弃旧塑料袋的方差为
s2=×[6×(2-3.7)2+16×(3-3.7)2+15×(4-3.7)2+13×(5-3.7)2]
=×48.5=0.97,
所以标准差s≈0.985.
10.某校甲班、乙班各有49名学生,两班在一次数学测验中的成绩(满分100分)统计如下表:
班级
平均分
众数
中位数
标准差
甲班
79
70
87
19.8
乙班
79
70
79
5.2
(1)请你对下面的一段话给予简要分析:
甲班的小刚回家对妈妈说:“昨天的数学测验,全班平均79分,得70分的人最多,我得了85分,在班里算是上游了!”
(2)请你根据表中数据,对这两个班的测验情况进行简要分析,并提出教学建议.
解:(1)由中位数可知,85分排在第25名之后,从名次上讲,85分不算是上游.但也不能单以名次来判断学习成绩的好坏,小刚得了85分,说明他对这阶段的学习内容掌握较好.
(2)甲班学生成绩的中位数为87分,说明高于或等于87分的学生占一半以上,而平均分为79分,标准差很大,说明低分也多,两极分化严重,建议对学习有困难的同学多给一些帮助;
乙班学生成绩的中位数和平均分均为79分,标准差小,说明学生成绩之间差别较小,成绩很差的学生少,但成绩优异的学生也很少,建议采取措施提高优秀率.