中小学教育资源及组卷应用平台
第二十章 数据的分析
【学习目标】
1. 了解加权平均数的意义和求法,会求实际问题中一组数据的平均数,体会用样本平均数估计总体平均数的思想.21*cnjy*com
2. 了解中位数和众数的意义,掌握它们的求法.进一步理解平均数、中位数和众数所代表的不同的数据特征.
3. 了解极差和方差的意义和求法,体会它们刻画数据波动的不同特征.体会用样本方差估计总体方差的思想,掌握分析数据的思想和方法.
4. 从事收集、整理、描述和 ( http: / / www.21cnjy.com )分析数据得出结论的统计活动,经历数据处理的基本过程,体验统计与生活的联系,感受统计在生活和生产中的作用,养成用数据说话的习惯和实事求是的科学态度.
【考点总结】
要点一、算术平均数和加权平均数
一般地,对于个数,我们把叫做这个数的算术平均数,简称平均数,记作.计算公式为.
特别说明:平均数表示一组数据的“平均水平”,反映了一组数据的集中趋势.
(1)当一组数据较大时,并且这些数据都在某一常数附近上、下波动时,一般选用简化计算公式.其中为新数据的平均数,为取定的接近这组数据的平均数的较“整”的数.【来源:21cnj*y.co*m】
(2)平均数的大小与一组数据里的每个数据均有关系,其中任一数据的变动都会相应引起平均数的变动.所以平均数容易受到个别特殊值的影响.
若个数的权分别是,则叫做这个数的加权平均数.
特别说明:
(1)相同数据的个数叫做权,越大,表示的个数越多,“权”就越重. 数据的权
能够反映数据的相对“重要程度”.
(2)加权平均数实际上是算术平均数的另一种表现形式,是平均数的简便运算.
要点二、中位数和众数
1.中位数的概念:将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是
奇数,则处于中间位置的数称为这组数据的中位数;如果数据的个数是偶数,则中间两个数
据的平均数称为这组数据的中位数.
特别说明:
(1)一组数据的中位数是唯一的;一组数据的中位数不一定出现在这组数据中.
(2)由一组数据的中位数可以知道中位数以上和以下数据各占一半.
2.众数的概念:一组数据中出现次数最多的数据称为这组数据的众数.
特别说明:
(1)一组数据的众数一定出现在这组数据中;一组数据的众数可能不止一个;如果所有数
据出现的次数都一样,那么这组数据就没有众数.
(2)众数是一组数据中出现次数最多的数据而不是数据出现的次数.
要点三、平均数、中位数与众数的联系与区别
联系:平均数、众数、中位数都是用来描述数据集中趋势的量,其中以平均数最为重要.
区别:平均数的大小与每一个数据 ( http: / / www.21cnjy.com )都有关,任何一个数的波动都会引起平均数的波动,当一组数据中有个别数据太高或太低,用平均数来描述整体趋势则不合适,用中位数或众数则较合适.中位数与数据排列位置有关,个别数据的波动对中位数没影响;众数主要研究各数据出现的频数,当一组数据中不少数据多次重复出现时,可用众数来描述.21世纪教育网版权所有
要点四、极差、方差和标准差
用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围,用这种方法得到的差称为极差,极差=最大值-最小值.【版权所有:21教育】
特别说明:极差是最简单的一种度量数据波动情况的量,它受极端值的影响较大.一组数据极差越小,这组数据就越稳定.
方差是反映一组数据的整体波动大小的特征的量.方差的计算公式是:
特别说明:
(1)方差反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小,数
据的波动越小.
(2)一组数据的每一个数都加上(或减去)同一个常数,所得的一组新数据的方差不变.
(3)一组数据的每一个数据都变为原来的倍,则所得的一组新数据的方差变为原来的
倍. 方差的算术平方根叫做这组数据的标准差,用符号表示,即:
;标准差的数量单位与原数据一致.
要点五、极差、方差和标准差的联系与区别
联系:极差与方差、标准差都是表示一组数据离散程度的特征数.
区别:极差表示一组数据波动范围的大小, ( http: / / www.21cnjy.com )它受极端数据的影响较大;方差反映了一组数据与其平均值的离散程度的大小.方差越大,稳定性也越小;反之,则稳定性越好.所以一般情况下只求一组数据的波动范围时用极差,在考虑到这组数据的稳定性时用方差.
要点六、用样本估计总体
在考察总体的平均水平或方差时,往往都是通过抽取样本,用样本的平均水平或方差近似估计得到总体的平均水平或方差.
特别说明:
(1)如果总体数量太多,或者从总体中抽取个体的试验带有破坏性,都应该抽取样本.
取样必须具有尽可能大的代表性.
(2)用样本估计总体时,样本容量越大,样本对总体的估计也越精确.样本容量的确定
既要考虑问题本身的需要,又要考虑实现的可能性所付出的代价.
【例题讲解】
类型一、利用概念求平均数、中位数、众数
例1、为了全面了解学生的 ( http: / / www.21cnjy.com )学习、生活及家庭的基本情况,加强学校、家庭的联系,梅灿中学积极组织全体教师开展“课外访万家活动”,王老师对所在班级的全体学生进行实地家访,了解到每名学生家庭的相关信息,先从中随机抽取15名学生家庭的年收入情况,数据如表:
年收入(单位:万元) 2 2.5 3 4 5 9 13
家庭个数 1 3 5 2 2 1 1
(1)求这15名学生家庭年收入的平均数、中位数、众数;
(2)你认为用(1)中的哪个数据来代表这15名学生家庭年收入的一般水平较为合适?请简要说明理由.
【答案】(1)平均数:4.3万元、中位数:3万元、众数:3万元;(2)众数,理由见详解
【分析】
(1)根据平均数、中位数和众数的定 ( http: / / www.21cnjy.com )义求解即可;
(2)根据在平均数,众数两数中,平均数受到极端值的影响较大,所以众数更能反映家庭年收入的一般水平,即可得出答案.www-2-1-cnjy-com
解:(1)、这15名学生家庭年收入的平均数是:(2+2.5×3+3×5+4×2+5×2+9+13)÷15=4.3万元;
将这15个数据从小到大排列,最中间的数是3,则中位数是3万元;
在这一组数据中3出现次数最多的,故众数是3万元;
(2)、 中位数或众数, ( http: / / www.21cnjy.com )理由:虽然平均数为4.3万元,但年收入达到4.3万元的家庭只有4个,大部分家庭的年收入未达到这一水平,而中位数或众数3万元是大部分家庭可以达到的水平,因此用中位数或众数较为合适.2·1·c·n·j·y
【训练】某学校需招聘一名教师,从专业知识、语言表达、组织协调三个方面对甲、乙、丙三名应聘者进行了三项素质测试,他们各项测试成绩如下表所示:
测试项目 测试成绩/分
甲 乙 丙
专业知识 75 93 90
语言表达 81 79 81
组织协调 84 72 69
(1)如果按三项测试成绩的平均成绩最高确定录用人选,那么谁将被录用?
(2)根据工作需要,学校将三项测试项目得分分别按的比例确定各人的测试成绩,再按得分最高的录用,那么谁将被录用?
【答案】(1)应聘者乙将被录用;(2)应聘者甲将被录用.
【分析】(1)先根据题意求出甲、乙、丙的平均成绩,再进行比较即可;(2)按加权平均数求出甲、乙、丙三人的测试成绩,再进行比较即可.
解:(1)甲的平均成绩是(分)
乙的平均成绩是(分)
丙的平均成绩是(分)
∴应聘者乙将被录用;
(2)根据题意,三人的测试成绩如下:
甲的测试成绩为:(分)
乙的测试成绩为:(分)
丙的测试成绩为:(分)
∴应聘者甲将被录用.
【点拨】本题考查了算术平均数和加权平均数,熟悉相关性质是解题的关键.
类型二、利用三数——平均数、众数、中位数解决问题
例2、某市实行中考改革,需要根据该市中学 ( http: / / www.21cnjy.com )体能的实际情况重新制定中考体育标准.为此,抽取了50名初中毕业的女学生进行“一分钟仰卧起坐”次数测试.测试的情况绘制成表格如下:
(1)求这次抽样测试数据的平均数、众数和中位数;
(2)根据这一样本数据的特点,你认为该市中考女生“一分钟仰卧起坐”项目测试的合格标准应定为多少次较为合适?请简要说明理由;
(3)根据(2)中你认为合格的标准,试估计该市中考女生“一分钟仰卧起坐”项目测试的合格率是多少?
次数 6 12 15 18 20 25 27 30 32 35 36
人数 1 1 7 18 10 5 2 2 1 1 2
【答案】(1)平均数为20.5,众数为 ( http: / / www.21cnjy.com )18,中位数为18;(2)确定18次能保证大多数人达标;理由见解析. (3)可以估计该市中考女生一分钟仰卧起坐项目测试的合格率为82%.21·cn·jy·com
【分析】
(1)根据平均数、众数、中位数的定义求解;
(2)标准的制定应根据众数和中位数的情况确定才有意义;
(3)用样本估计总体.
解:(1)该组数据的平均数为=×(6×1+12×1+15×7+18×18+20×10+25×5+27×2+30×2+32×1+35×1+36×2)=20.5,众数为18,中位数为18.
(2)该市中考女生一分钟仰 ( http: / / www.21cnjy.com )卧起坐项目的合格标准应定为18次较为合适,因为众数及中位数均为18,且50人中达到18次以上的人数有41人,因此确定18次能保证大多数人达标.
(3)根据合格标准定为18次,可以估计该市中考女生一分钟仰卧起坐项目测试的合格率为82%.
【点拨】本题考查数据统计知识在生活中的应用,准确掌握和理解相关概念及其意义是关键,如此题中标准的制定应根据众数和中位数的情况确定才有意义.【出处:21教育名师】
【训练】某中学开展“八荣八耻”演讲比赛活动,九、九班根据初赛成绩各选出名选手参加复赛,两个班各选出的名选手的复赛成绩(满分为分)如下图所示:
( http: / / www.21cnjy.com / )
(1)根据上图填写下表:
平均分(分) 中位数(分) 众数(分)
九班
九班
结合两班复赛成绩的平均数和中位数,分析哪个班级的复赛成绩较好?
(3)如果在每班参加复赛的选手中分别选出人参加决赛,你认为哪个班的实力更强一些,说明理由.
【答案】(1)九班的中位数是85;九班的成绩的众数是;(2)九班的复赛成绩好些;(3)在每班参加复赛的选手中分别选出人参加决赛,九班的实力更强一些;21*cnjy*com
【解析】
【分析】(1)根据条形统计图提供的数据,结合中位数、众数的确定方法填表解答即可;(2)根据表格中的数据可知两班的平均数相同,再比较中位数即可解答;(3)计算九、九 班成绩前两名选手的平均成绩,比较即可解答.
解:九班的成绩按从小到大的顺序排列,第位是,即九班的中位数是;
九班的成绩,出现次数最多的是,则九班的成绩的众数是;
∵两班的平均数相同,九班的中位数高,
∴九班的复赛成绩好些;
∵九班、九班前两名选手的平均分分别为分,分,
∴在每班参加复赛的选手中分别选出人参加决赛,九班的实力更强一些.
【点拨】本题考查了中位数、众数以及平均数的求法,牢记定义并能熟练运用公式是解决问题的关键.
例3、为了普及环保知识,增强环保意识,某 ( http: / / www.21cnjy.com )中学组织了环保知识竞赛活动,初中三年级根据预选成绩选出了3名同学甲、乙、丙参加决赛,决赛要进行十次测试,三名选手的决赛成绩(满分为100分)如下表所示:
决赛成绩(单位:分)
甲 80 86 74 80 80 88 88 89 91 99
乙 85 85 87 97 85 76 88 77 87 88
丙 82 80 78 78 81 96 97 88 89 86
(1)请你填写下表:
平均数 众数 中位数
甲 85.5 87
乙 85.5 85
丙 84
(2)请从以下两个不同的角度对三个同学的决赛成绩进行分析:
①从平均数和众数相结合看,分析哪个同学成绩好些;
②从平均数和中位数相结合看,分析哪个同学成绩好些。
(3)如果在参加决赛的三名选手中选出1人参加市各中学总决赛,你认为哪个同学比较合适?并说明理由.
【答案】(1)平均数:85.5 ( http: / / www.21cnjy.com );众数80,78;中位数86;(2)①乙的成绩好一些,理由见解析;②甲的成绩好一些,理由见解析.(3)应选甲,理由见解析.www.21-cn-jy.com
【解析】
试题分析:(1)平均数的计算方法是求出所 ( http: / / www.21cnjy.com )有数据的和,然后除以数据的总个数.对于中位数,因图中是按从小到大的顺序排列的,所以只要找出最中间的一个数(或最中间的两个数)即可,本题是最中间两个数的平均数.对于众数是出现次数最多的数据;【来源:21·世纪·教育·网】
(2)可由(1)得出的表格,将年级的平均数,众数和中位数进行比较即可得出正确的结论;
(3)都抽取3人参加比赛,因此只需比较年级前三名的成绩及其平均数即可.
试题解析:解:(1)平均数:85.5;众数80,78;中位数86
(2)①∵平均数都相同,乙的众数最高,∴乙的成绩好一些;
②∵平均数都相同,甲的中位数最高,∴甲的成绩好一些.
(3)应选甲,理由是:
①中位数高说明有一半次数的分数在8以上,乙和丙达不到;
②从各次考试成绩可以看出,甲对环保 ( http: / / www.21cnjy.com )知识很了解,成绩从第三次后一直在进步,说明甲平时重视环保知识,并且目前正在收集学习环保知识,他的知识面也越来越广.乙和丙后阶段成绩进步不够突出.
点拨:本题考查的是平均数、众数和中位数;弄清平均数、众数和中位数的定义和它们之间的区别是解题的关键.21·世纪*教育网
【训练】甲、乙两班各选10名选手参加电脑汉字输入速度比赛.各班选手每分钟输入汉字的个数如下表:
输入汉字/个 132 133 134 135 136 137 众数 中位数 平均数
甲班选手/人 1 0 1 5 2 1 135
乙班选手/人 0 1 4 1 2 2
(1)请根据题中信息完成上表;
(2)请你分别从众数、中位数、平均数三个方面,对甲、乙两班选手的比赛成绩进行评价;
(3)如果分别从两个班中各选出3名选手参加电脑汉字输入速度比赛,根据上面的比赛成绩,你认为哪班的成绩会更好些?说明你的理由。2-1-c-n-j-y
【答案】(1)甲班:135,135,乙班:134,134.5,135; (2)评价见解析;(3)乙班好于甲班,理由见解析.
【解析】
试题分析:(1)分别利用中位数和众数的确定方法求出两名选手的众数及中位数;
(2)计算其平均数后结合众数及中位数评价两名选手即可.
(3)可以从优秀学生角度考虑参赛选手.
解:(1)甲班:135,135,乙班:134,134.5,135;
(2)从众数上看:甲班每分钟输入135字的人最多,有5人,乙班每分钟输入134字的人最多,有4人,甲班好于乙班;
从中位数上看;甲班的中位数是135;乙班的中位数是134.5,甲班好于乙班;
从平均数上看:甲、乙两班平均数一样都是135;
(3)甲班每分钟输入136字的有2人 ( http: / / www.21cnjy.com ),每分钟输入137字的有1人,乙班每分钟输入136字的有2人,每分钟输入137字的有2人,如果分别从两班中各选3名选手参加比赛,乙班好于甲班.
类型三、极差、方差与标准差
例4、有甲、乙两个小组参加一项知识竞赛,其中一道满分为10分的题目,两个小组的得分情况如下:
( http: / / www.21cnjy.com / )
请你根据以上信息解决下列问题:
(1)请分别计算两个小组该题的平均得分和方差;
(2)从调查中发现,两个小组该题的得分情况, ( http: / / www.21cnjy.com )大致能够代表他们在该项知识竞赛中的总体得分情况,如果要从两个小组中选择一组参加更上一级比赛,你认为选择哪一组更合适?请简述你的理由.
【答案】(1)甲组平均分为8分,乙组平均分为8分,甲组方差为1.4,乙组方差为1.2;(2)乙组,见解析21cnjy.com
【分析】
(1)利用平均数和方差公式即可求出,
(2)由两个队的平均分都是8分, 方差,可得乙队得分的发挥比较稳定,不容易出差错即可得出结论.
【详解】
解:(1)(分),
,
(分),
;
(2)因为两个队的平均分都是8分,说明在该项知识竞赛中,两个队的平均表现情况相近,
∵,
∴,
∴乙队得分的发挥比较稳定,不容易出差错,
∴要从两个小组中选择一组参加更上一级比赛,应选择乙队.
【点拨】
本题考查平均数的计算与方差的计算,利用方 ( http: / / www.21cnjy.com )差与平均数做决策问题,掌握平均数与方差的计算方法,平均数是反应集中趋势的物理量,而方差反应是离散程度的物理量,二者结合才能做出好的决策.
【训练】某中学九年级学生 ( http: / / www.21cnjy.com )共进行了五次体育模拟测试,已知甲、乙两位同学五次模拟测试成绩的总分相同,小明根据甲同学的五次测试成绩绘制了尚不完整的统计表,并给出了乙同学五次测试成绩的方差的计算过程.21教育名师原创作品
甲同学五次体育模拟测试成绩统计表
次数 第一次 第二次 第三次 第四次 第五次
成绩(分) 35 39 37 40
小明将乙同学五次模拟测试成绩直接代入方差公式,计算过程如下:
根据上述信息,完成下列问题:
(1)的值是______;
(2)根据甲、乙两位同学这五次模拟测试成绩,你认为谁的体育成绩更好?并说明理由;
(3)如果甲再测试1次,第六次模拟测试成绩为38分,与前5次相比,甲6次模拟测试成绩的方差______.(填“变大”“变小”或“不变”)21教育网
【答案】(1)39;(2)乙,理由见解析;(3)变小
【分析】
(1)根据乙同学五次模拟测试成绩的方差公式,可以得出乙同学五次的成绩,再由甲和乙五次成绩之和相等,求出a的值;
(2)由于甲乙两人平均成绩相同,所以成绩的方差越小的成绩越稳定,算出甲成绩的方差与乙比较即可;
(3)因为第六次的成绩刚好等于平均数,所以不影响整体的平均数,但是在计算方差时会导致方差变小.
解:(1)由乙同学五次模拟测试成绩的方差公式,可知乙同学的五次成绩分别是:36、38、37、39、40,乙同学五次成绩之和为190,
∵甲和乙的五次成绩之和相等,
∴,
故答案是:39;
(2),
乙的体育成绩更好.因为,,两人的平均成绩相同,但乙的方差较小,说明乙的成绩更稳定,所以乙的体育成绩更好;
(3)第六次模拟测试成绩为38分,则平均数,不变,
, 会变小,
故答案是:变小.
【点拨】本题考查平均数和方差,解题的关键是掌握平均数和方差的计算方法.
类型四、统计思想
例5、某学校开展了“远离新冠珍爱生命 ( http: / / www.21cnjy.com )”的防“新冠”安全知识竞赛.现从该校七、八年级中各随机抽取10名学生的竞赛成绩(百分制)进行整理、描述和分析(成绩得分用x表示,共分成四组:A.80≤x<85,B.85≤x<90,C.90≤x<95,D.95≤x≤100).下面给出了部分信息:七年级10名学生的竞赛成绩是:80,86,99,96,90,99,100,82,89,99;抽取的八年级10名学生的竞赛成绩没有低于80分的,且在C组中的数据是:94,94,90.
( http: / / www.21cnjy.com / )
根据以上信息,解答下列问题:
(1)直接写出上述图表中a,b,c的值;
(2)计算d的值,并判断七、八年级中哪个年级学生的竞赛成绩更稳定?请说明理由;
(3)该中学七、八年级共2160人参加了此次竞赛活动,估计参加此次竞赛活动获得成绩优秀(x≥95)的学生人数是多少?
【答案】(1)a=40,b=94,c=99;(2)52,八年级的成绩较稳定,见解析;(3)估计参加此次竞赛活动获得成绩优秀的学生有972人
【分析】
(1)根据扇形统计图的制作方法可求出“D组”所占的百分比,即可求出a的值,根据中位数、众数的意义可求出b、c的值;
(2)先求出七年级的方差,再根据方差进行分析得出答案;
(3)求出样本中的优秀率,进而得到总体的优秀率,再求出总体中的优秀人数.
【详解】
解:(1)∵八年级成绩在“C组”的有3人,占3÷10=30%,
∴“D组”所占的百分比为1﹣10%﹣20%﹣30%=40%,
∴a=40,
∵八年级10名同学成绩从小到大排列后,处在中间位置的两个数都是94,
∴中位数是94,即b=94,
∵七年级10名学生成绩出现次数最多的是99,
∴众数是99,即c=99 ,
∴a=40,b=94,c=99;
(2) =52 ,即:d=52,
∵50.4<52,
∴八年级的成绩较稳定;
(3)抽取的10名八年级学生中,成绩优秀的有 10×40%=4(人),
抽取的10名七年级学生中,成绩优秀的有5人,
∴抽取的20名学生中,成绩优秀的共有9人
∴2160×=972(人)
答:估计参加此次竞赛活动获得成绩优秀的学生有972人.
【点拨】本题考查扇形统计图、中位数、众数、平均数、方差以及样本估计总体,掌握平均数、中位数、众数、方差的意义和计算方法是正确解答的关键.
【训练】4月23日是“世界读书日”,向阳 ( http: / / www.21cnjy.com )中学对在校学生课外阅读情况进行了随机问卷调查,共发放100份调查问卷,并全部收回.根据调查问卷,将课外阅读情况整理后,制成表格如下:
月阅读册数(本) 1 2 3 4 5
被调查的学生数(人) 20 50 15 10 5
请你根据以上信息,解答下列问题:
(1)被调查的学生月平均阅读册数为 本;
(2)被调查的学生月阅读册数的中位数是 ;
(3)在平均数、中位数这两个统计量中, 更能反映被调查学生月阅读的一般水平;
(4)若向阳中学共有学生1600人,求四月份该校学生共阅读课外书籍多少本?
解:(1)平均阅读册数为:=2.3(本);
(2)∵共有100名学生,
∴第50和51为同学的阅读量的平均数为中位数:=2;
(3)在平均数、中位数这两个统计量中,中位数更能反映被调查学生月阅读的一般水平;
(4)2.3×1600=3680(本).
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://21世纪教育网(www.21cnjy.com)
" 21世纪教育网(www.21cnjy.com)