课件40张PPT。2.2.2 用样本的数字特征估计总体的数字特征一、众数、中位数和平均数
1.众数是如何定义的?有什么特点?举例加以说明.
提示定义:在一组数据中,出现次数最多的数据叫做这组数据的众数.
特点:(1)众数是这组数据中出现次数最多的数;(2)众数可以有一个或多个.如一组数据:2,2,3,4,4,5,5,6,7,8的众数为2,4,5.2.中位数是如何定义的?有什么特点?举例加以说明.
提示定义:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
特点:(1)排序后找中位数;(2)中位数只有一个;(3)中位数不一定是这组数据中的数.如一组数据:2,2,3,4,4,5,5,6,7,8的中位数为
(4+5)=4.5.
3.平均数是如何定义的?
提示定义:如果有n个数x1,x2,x3,…,xn,那么 (x1+x2+…+xn)叫这n个数的平均数.4.做一做1:判断题
(1)一组数据的众数必然有一个. ( )
(2)一组数据的中位数一定存在且是唯一的. ( )
答案:(1)× (2)√二、众数、中位数和平均数的几何意义
1.如何在样本数据的频率分布直方图中,估计出众数的值?你能利用在上一节中调查的100位居民的月均用水量的频率分布直方图加以说明吗?
提示众数大致的值就是样本数据的频率分布直方图中最高矩形的中点的横坐标.从上一节中调查的100位居民的月均用水量的频率分布直方图可以看出,月均用水量的众数估计是2.25 t,如图所示.2.如何在样本数据的频率分布直方图中,估计出中位数的值?你能利用在上一节中调查的100位居民的月均用水量的频率分布直方图加以说明吗?
提示在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值,下图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.02 t.3.如何在样本数据的频率分布直方图中估计出平均数的值?
提示平均数是频率分布直方图的“重心”,是直方图的平衡点,因此,每个小矩形的面积与小矩形底边中点的横坐标的乘积之和即为平均数的估计值.4.根据众数、中位数、平均数各自的特点,你能分析它们对反映总体存在的不足之处吗?
提示(1)众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征;(2)中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点;(3)由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质.也正因如此,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低.5.做一做2:判断题
样本容量越小,样本平均数越接近总体平均数. ( )
答案:×6.做一做3:10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有( )
A.a>b>c B.b>c>a C.c>a>b D.c>b>a
解析:将数据从小到大排列为10,12,14,14,15,15,16,17,17,17,则平均数a= ×(10+12+14×2+15×2+16+17×3)=14.7,中位数b=15,众数c=17,显然a答案:D
7.做一做4:有一组数据,其中10,12,13,15,16出现的频率分别是0.15,0.2,0.3,0.2,0.15,则该组数据的平均数为 .?
解析:该组数据的平均数为10×0.15+12×0.2+13×0.3+15×0.2+16×0.15=13.2.
答案:13.2三、标准差
平均数向我们提供了样本数据的重要信息,但是,平均数有时也会使我们作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,只有平均数还难以概括样本数据的实际状态.如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你应当如何对这次射击作出评价?
1.甲、乙两人本次射击的平均成绩分别为多少环?他们的平均成绩一样吗?2.难道这两个人的水平就没有什么差异了吗?你能作出这两人成绩的频率分布条形图来说明其水平差异在哪里吗?
提示频率分布条形图如下:
从图上可以直观地看出,他们的水平还是有差异的,甲成绩比较分散,乙成绩相对集中.3.对于甲、乙的射击成绩除了画出频率分布条形图比较外,还有没有其他方法来说明两组数据的分散程度?
提示还经常用甲、乙的极差与平均数一起比较说明数据的分散程度.甲的环数极差=10-4=6,乙的环数极差=9-5=4.
它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.
4.如何用数字去刻画这种分散程度呢?
提示考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s表示.5.所谓“平均距离”,其含义如何理解?四、方差
1.人们有时用标准差的平方s2——方差来代替标准差,作为测量样本数据分散程度的工具.你能依据标准差的计算公式写出方差的计算公式吗?
2.现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?
提示通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.3.做一做5:判断题
标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小. ( )
答案:√4.做一做6:在一次歌手大奖赛上,七位评委为歌手打出的分数如下:
9.4 8.4 9.4 9.9 9.6 9.4 9.7
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )
A.9.4,0.484 B.9.4,0.016
C.9.5,0.04 D.9.5,0.016
解析:去掉9.9和8.4得一组数:9.4,9.4,9.6,9.4,9.7,
答案:D探究一探究二探究三思想方法例1 某公司的33名人员的月工资如下:
(1)求该公司人员月工资的平均数、中位数、众数(精确到元);
(2)假设副董事长的工资从20 000元提升到30 000元;董事长的工资从30 000元提升到50 000元,那么新的平均数、中位数、众数又是什么?(精确到元)
(3)你认为哪个统计量更能反映这个公司人员的工资水平?结合此问题谈一谈你的看法.
分析平均数定义→计算平均数→将数据从小到大排列→得中位数、众数→结论众数、中位数、平均数的简单应用 当堂检测探究一探究二探究三思想方法解:(1)平均数是 =(30 000+20 000+15 000×2+10 000+8 000×5+6 000×3+4 500×20)÷33≈7 212(元),
中位数是4 500元,众数是4 500元.
(2)平均数是 '=(50 000+30 000+15 000×2+10 000+8 000×5+6 000×3+4 500×20)÷33≈8 121(元),中位数是4 500元,众数是4 500元.
(3)在这个问题中,中位数和众数均能反映该公司人员的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数偏差较大,所以平均数不能反映这个公司人员的工资水平.当堂检测探究一探究二探究三思想方法反思感悟1.深刻理解和把握平均数、中位数、众数在反映样本数据上的特点,并结合实际情况,灵活应用.
2.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.
3.平均数对极端值敏感,而中位数对极端值不敏感.因此两者结合,可较好地分析总体的情况.当堂检测探究一探究二探究三思想方法变式训练1在如图所示的茎叶图中,若甲组数据的众数为14,则乙组数据的中位数为( )
A.6 B.8 C.10 D.14
解析:∵甲组数据的众数为14,∴x=y=4,
∴乙组数据从小到大依次是2,2,6,14,21,25,
∴乙组数据的中位数为 =10.
答案:C当堂检测探究一探究二探究三思想方法例2甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
分析求平均数→求(xi-x)2→求方差s2平均数与方差的综合应用 当堂检测探究一探究二探究三思想方法当堂检测探究一探究二探究三思想方法反思感悟1.在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差):方差大说明取值分散性大,数值不稳定;方差小说明取值分散性小,数值集中、稳定.
2.关于统计的有关性质及规律
(2)数据x1,x2,…,xn与数据x1+a,x2+a,…,xn+a的方差相等.
(3)若x1,x2,…,xn的方差为s2,那么ax1,ax2,…,axn的方差为a2s2.当堂检测探究一探究二探究三思想方法变式训练2某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2= .?
答案:3.2当堂检测探究一探究二探究三思想方法频率分布直方图与样本的数字特征
例3 已知一组数据:
125 121 123 125 127 129 125 128 130 129
126 124 125 127 126 122 124 125 126 128
(1)填写下面的频率分布表:
当堂检测探究一探究二探究三思想方法(2)作出频率分布直方图;
(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数.解(1) 当堂检测探究一探究二探究三思想方法?当堂检测探究一探究二探究三思想方法反思感悟1.利用频率分布直方图估计众数、中位数和平均数
(1)众数是最高的矩形的上底边的中点的横坐标;
(2)中位数左右两侧直方图的面积相等;
(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
2.利用频率分布直方图求得的众数、中位数、平均数均为近似值,往往与实际数据得出的不一致.但它们能粗略估计其众数、中位数和平均数.当堂检测探究一探究二探究三思想方法变式训练3(1)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为 ( )
A.8 B.15 C.16 D.32
(2)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 .?
(3)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是 .?当堂检测探究一探究二探究三思想方法解析:(1)令yi=2xi-1(i=1,2,3,…,10),则所求的标准差为s=2×8=16.
答案:(1)C (2)90 (3)0.1当堂检测探究一探究二探究三思想方法数形结合思想在用样本估计总体中的应用
典例 参加市数学调研抽测的某校高三学生成绩分布的茎叶图1和频率分布直方图2均受到不同程度的破坏,但可见部分信息如下,据此解答如下问题:
求参加数学抽测的人数n,抽测成绩的中位数及分数分布在[80,90),[90,100]内的人数.当堂检测探究一探究二探究三思想方法【审题视角】 茎叶图和频率分布直方图→分数在[50,60)内的频数与频率→参加数学抽测的人数n→由茎叶图得抽测成绩的中位数→由频率分布直方图得分数在[90,100]内的人数→分数在[80,90)之间的人数
解:由茎叶图可以看出,分数在[50,60)内的频数为2.
由频率分布直方图可以看出,分数在[50,60)内的频率为0.08,由
由茎叶图可知抽测成绩的中位数为73,由频率分布直方图可以看出,分数在[90,100]内的同样有2人.
所以分数在[80,90)之间的人数为25-(2+7+10+2)=4.
所以参加数学抽测人数n为25,中位数为73,分数在[80,90),[90,100]内的人数分别为4,2.当堂检测探究一探究二探究三思想方法方法点睛由茎叶图、频率分布直方图估计样本的数字特征时二者可以相互借用,这对了解样本的信息很重要.当堂检测探究一探究二探究三思想方法变式训练在一次全省科普知识竞赛中,某市3 000名参赛选手的初赛成绩统计如图所示.
(1)求t的值,并估计该市选手在本次竞赛中,成绩在[80,90)内的选手人数;
(2)如果在本次竞赛中该市计划选取1 500人入围决赛,那么进入决赛选手的分数应该如何制定?(结果保留整数)当堂检测探究一探究二探究三思想方法解:(1)依题意,(2t+3t+7t+6t+2t)×10=1,所以t=0.005.
所以成绩在[80,90)内的频率为6×0.005×10=0.3,故所求选手人数为3 000×0.3=900.
(2)要选取1 500人入围决赛,就是要求该组数据的中位数.
因为成绩在前三组的频率为(2+3+7)×0.005×10=0.6>0.5,成绩在前两组的频率为(2+3)×0.005×10=0.25<0.5,所以中位数在区间[70,80)内,所以中位数为
所以进入决赛选手的分数应该制定为77分.当堂检测1.下列选项中,极端数据影响较小的是( )
A.平均数 B.中位数 C.方差 D.极值
答案:B探究一探究二探究三思想方法当堂检测2.一组样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x等于( )
A.21 B.22 C.20 D.23
答案:A3.统计某校1 000名学生的数学会考成绩,得到样本频率分布直方图如图所示,规定不低于60分为及格,不低于80分为优秀,则及格人数是 ?;优秀率为 ?.?解析:不低于60分为及格,则及格的频率为
0.025×10+0.035×10+0.01×20=0.25+0.35+0.2=0.8.
所以及格的人数为1 000×0.8=800.
不低于80分为优秀,则优秀的频率为0.01×20=0.2.
所以优秀率为20%.
答案:800 20%探究一探究二探究三思想方法当堂检测4.对划艇运动员甲、乙在相同的条件下进行了6次测试,测得他们每次的最大速度(单位:m/s)如下:
甲:27,38,30,37,35,31
乙:33,29,38,34,28,36
根据以上数据,试判断他们谁更优秀.探究一探究二探究三思想方法当堂检测探究一探究二探究三思想方法当堂检测