课件25张PPT。2.2.2 用样本的数字特征
估计总体的数字特征第一课时 统 计
高中数学必修3第二章【背景材料】在第29届北京奥运会上中国体育代表团取得了辉煌的成绩,其中射箭选手张娟娟勇夺中国射箭史上第一枚奥运金牌.我们随机抽取了某射箭选手在北京奥运会上某10箭的比赛成绩如下:
10, 8, 9, 8, 9,
9, 10, 9, 10, 9. 众数、中位数、平均数众数、中位数和平均数的含义:将样本数据按大小顺序排列,位于正中间的数;样本数据中出现次数最多的数;众 数:中位数:平均数:样本数据的总和除以样本容量.10,8,9, 8,9,9, 10,9,10,9. 绘制一个组距为1的频率分布直方图(1)计算极差(2)决定组数与组距(3)决定分点(4)列频率分布表(5)绘制频率分布直方图8,8,9, 9,9,9,9,10,10,10. 众数、中位数和平均数是用样本估计总体最常用的三种数字特征.对一个未知总体,我们常通过图、表提供的信息,用样本的频率分布估计总体的分布. 如何根据样本的频率分布直方图,估计总体的众数、中位数和平均数,就成为一个需要研究的课题. 用样本的数字特征
估计总体的数字特征8,8,9, 9,9,9, 9,10,10,10.探究新知众数、中位数和平均数的数值估计众数为9中点在样本频率分布直方图中,取哪个数据作为总体的众数的估计值比较合理?取最高矩形下端中点的横坐标作为众数.面积平分线中位数为9.1 在样本频率分布直方图中,取哪个数据作为总体的中位数的估计值比较合理? 面积平分线直方图面积竖直平分线与横轴交点的横坐标.10890.20.50.38×0.2+9×0.5 +10×0.3=9.1平均数为9.110,8,9, 8,9,9, 10,9,10,9.=8· +9· +10· 如何根据样本频率分布直方图估计总体的平均数? 每个小矩形的面积与小矩形底边中点的横坐标的乘积之和. a1s1+a2s2+a3s3+ a4s4+a5s5+a6s6 原始射箭成绩样本数据的众数是9,中位数是9,平均数是9.1,这与我们根据频率分布直方图得出的相应数据稍有偏差,你能解释一下原因吗?(1)频率分布直方图损失了一些样本数据,得到的众数、中位数和平均数是一个估计值,且所得估值与数据分组有关.(2)由不同的样本数据得到的众数、中位数和平均数,也会有偏差. 某市政府通过抽样调查,获得了100位居民某年的月均用水量(单位:t)的频率分布直方图如下,图中从左至右九个小矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此估计该市居民 月均用水量的众数、 中位数和平均数分别 是多少?众数是2.25各小矩形面积: 0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.中位数是2.020.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02=2.02. 平均数为2.02面积平分线【背景材料】一个企业中,绝大多数是一线工人,他们的年收入可能是两万元左右,另外有一些经理层次的人,年收入可以达到几十万元.这个企业每年都要到人力市场去招聘工人,应聘者可能会问及企业员工的年“收入水平”问题.众数、中位数和平均数的特征分析问题1:假若你是老板,你对企业员工的年“收入水平”会怎样回答?
问题2:从实际情况来看,你认为用哪种数字特征来反映该企业员工的年“收入水平”相对合理些?
问题3:如果该企业员工年收入是2.5万元的人数最多,你认为一个新来的打工仔的年收入可能会是怎样? 1.企业员工年收入的平均数会比中位数、众数大得多,老板可能以企业员工年收入的平均数来回答“收入水平”.应聘者可能会将老板所说的“收入水平”理解成众数或中位数,从而产生误解. 2.中位数一般不受少数几个极端数据(即排序靠前或靠后的数据)的影响,能大致反映一般员工的收入水平. 3.众数虽然是“中心值”,但它也不受少数极端值的影响,新来的打工仔的年收入可能是一个比较小的极端值. 假设你是一名交通部门的负责人,你打算向市长报告国家对本市26个公路项目投资的平均资金数额,其中一条新公路的建设投资为2000万元,另外25个项目的投资是20~100万元.该26个公路项目的投资金额中,中位数是25万元,平均数是100万元,众数是20万元.你会选择哪一种数字特征来表示国家对每一个项目投资的“平均”金额?你选择这种数字特征的缺点是什么? 众 数(20万元):能反映部分项目的投资金额是20万元,但不能反映极端数据2000万元,又20万元的数量相对较小,会产生项目平均投资金额不大的误解.中位数(25万元):能反映部分项目的投资金额大都在25万元附近,但不能反映极端数据2000万元对平均投资金额的影响,所提供的信息较小.平均数(100万元):能反映所有项目的信息,但由于受到极端数据2000万元的影响,大多数项目投资金额都与平均数相差比较大. 1.根据样本频率分布直方图,可以估计总体的众数、中位数和平均数.每个小矩形的面积与小矩形底边中点的横坐标的乘积之和直方图面积竖直平分线与横轴交点的横坐标最高矩形下端中点的横坐标 2.用样本的众数、中位数和平均数来估计总体的数字特征,各有优点和缺点.受极端数据的影响教大.代表了样本数据更多的信息.只能表达样本数据中的少量信息.容易计算,不受少数几个极端值的影响.《学海》:第6次作业