《用样本的数字特征估计总体的数字特征》教案
教学目标
能从样本数据中提取基本的数字特征,并做出合理的解释.
2.会求样本的众数、中位数、平均数.
3.能从频率分布直方图中,求得众数、中位数、平均数.
教学重难点
教学重点:用样本众数,中位数,平均数估计总体的众数,中位数,平均数..
教学难点:用样本的数字特征估计总体的数字特征,统计思维的建立.
教学过程
情境导学
美国NBA在2011——2012年度赛季中,甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:甲运动员得分:12,15,20,25,31,30, 36,36,37,39,44,49;乙运动员得分:8,13,14,16,23,26, 28,38,39,51,31,39.如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就应有相应的数据作为比较依据,即通过样本数字特征对总体的数字特征进行研究.所以今天我们开始学习用样本的数字特征估计总体的数字特征.
探究点一 众数、中位数和平均数
问题 在初中我们学过众数、中位数和平均数的概念,它们都是描述一组数据的集中趋势的特征数,只是描述的角度不同,你还能回忆起众数、中位数和平均数的定义及特点吗?
思考1 众数是如何定义的?有什么特点?举例加以说明.
答 众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.特点:(1)众数是这组数据中出现次数最多的数;(2)众数可以有一个或多个;
如:一组数据为2,2,3,4,4,5,5,6,7,8;众数为2,4,5.
思考2 中位数是如何定义的?有什么特点?举例加以说明.
答 中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
特点:(1)排序后找中位数;(2)中位数只有一个;(3)中位数不一定是这组数据中的数.
如:一组数据为2,2,3,4,4,5,5,6,7,8;中位数为(4+5)=4.5.
思考3 平均数是如何定义的?
答 平均数:一组数据的算术平均数,即=(x1+x2+…+xn)
探究点二 众数、中位数、平均数与频率分布直方图的关系
思考1 如何在样本数据的频率分布直方图中,估计出众数的值?举例加以说明.
答 众数大致的值就是样本数据的频率分布直方图中最高矩形的中点的横坐标.例如,在2.2.1(一)节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数估计是2.25 t.如图所示:
思考2 如何在样本数据的频率分布直方图中,估计出中位数的值?举例加以说明.
答 在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数使得在它左边和右边的直方图的面积应该相等,由此可以估计中位数的值,下图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.02 t.
思考3 如何在样本数据的频率分布直方图中估计出平均数的值?
答 平均数是频率分布直方图的“重心”,是直方图的平衡点,因此,每个小矩形的面积与小矩形底边中点的横坐标的乘积之和为平均数.
思考4 从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?
答 因为样本数据频率分布直方图只是直观地表明分布的形状,从直方图本身得不出原始的数据内容,也就是说频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估计值与数据分组有关,所以估计的值有一定的偏差.
思考5 根据众数、中位数、平均数各自的特点,你能分析它们对反映总体存在的不足之处吗?
答 (1)众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征;
(2)中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点;
(3)由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质.也正因如此,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低.
例1 样本(x1,x2,…,xn)的平均数为,样本(y1,y2,…,ym)的平均数为(≠).若样本(x1,x2,…,xn,y1,y2,…,ym)的平均数=α+(1-α),其中0<α<,则n,m的大小关系为 ( )
A.nm
C.n=m D.不能确定
答案 A
解析 利用两个样本平均数表示总体平均数,从而确定系数α.
=,=,
=,
则==+.
由题意知0<<,∴n反思与感悟 根据样本频率分布直方图,可以分别估计总体的众数、中位数和平均数.
(1)众数:最高矩形下端中点的横坐标;
(2)中位数:直方图面积平分线与横轴交点的横坐标.
(3)平均数:每个小矩形的面积与小矩形底边中点的横坐标的乘积之和.
跟踪训练1 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
成绩(单位:m)
1.50
1.60
1.65
1.70
1.75
1.80
1.85
1.90
人数
2
3
2
3
4
1
1
1
分别求这些运动员成绩的众数、中位数与平均数.
解 在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;这组数据的平均数是=(1.50×2+1.60×3+…+1.90×1)=
≈1.69(m).
答 17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.
探究点三 众数、中位数、平均数的简单应用
例2 某公司的33名职工的月工资(单位:元)如下表:
职业
董事长
副董事长
董事
总经理
经理
管理员
职员
人数
1
1
2
1
5
3
20
工资
5 500
5 000
3 500
3 000
2 500
2 000
1 500
(1)求该公司职工月工资的平均数、中位数、众数.
(2)若董事长、副董事长的工资分别从5 500元、5 000元提升到30 000元、20 000元,那么公司职工新的平均数、中位数和众数又是什么?
(3)你认为哪个统计量更能反映这个公司员工的工资水平?
解 (1)公司职工月工资的平均数为
=
=≈2 091(元).
若把所有数据从大到小排序,则得到:中位数是1 500元,众数是1 500元.
(2)若董事长、副董事长的工资提升后,职工月工资的平均数为
==≈3 288(元).
中位数是1 500元,众数是1 500元.
(3)在这个问题中,中位数和众数都能反映出这个公司员工的工资水平,因为公司少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.
反思与感悟 样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
跟踪训练2 某班甲、乙两名学生的高考备考成绩如下:
甲:512 554 528 549 536 556 534 541 522 538
乙:515 558 521 543 532 559 536 548 527 531
(1)用茎叶图表示两名学生的成绩;
(2)分别求两名学生成绩的中位数和平均分.
解 (1)两学生成绩的茎叶图如图所示.
(2)将甲、乙两学生的成绩从小到大排列为:
甲:512 522 528 534 536 538 541 549 554 556
乙:515 521 527 531 532 536 543 548 558 559
从以上排列可知甲学生成绩的中位数为=537.
乙学生成绩的中位数为=534.
甲学生成绩的平均分为
500+=537,
乙学生成绩的平均分为
500+=537.
例3 某课外活动小组对该市空气含尘调查,下面是一天每隔两小时测得的数据:0.03、0.03、0.04、0.05、0.01、0.03(单位:G/M3)
(1)求出这组数据的众数和中位数?
(2)若国际(国家环保局的标准)是平均值不得超过0.025G/M3;问这一天城市空气是否符合标准?
解 (1)由题意知众数是0.03,中位数为0.03.
(2)这一天数据平均数是0.03,∵0.03>0.025,
∴这一天该城市空气不符合国际标准.
反思与感悟 如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.
跟踪训练3 某工厂人员及工资构成如下:
人员
经理
管理人员
高级技工
工人
学徒
合计
周工资
2 200
250
220
200
100
人数
1
6
5
10
1
23
合计
2 200
1 500
1 100
2 000
100
6 900
(1)指出这个问题中周工资的平均数.
(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?
解 (1)=(2 200+6×250+5×220+10×200+100)=300.
因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.
作业:
练习1,2,3