(共29张PPT)
第六章 统计
§4 用样本估计总体的数字特征
4.1 样本的数字特征
课标要求 核心素养
1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.
2.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义. 1.会求样本的众数、中位数、平均数、极差、方差和标准差,培养学生数学运算的核心素养.
2.能用样本的数字特征估计总体的数字特征,作出合理解释和决策,培养学生数学分析和数学建模的核心素养.
必备知识 探新知
知识点 样本的数字特征
名称 概念或计算公式 特征或作用
平均数 样本数据的_________ 反映出样本数据中更多的信息,对样本中的极端值敏感
中位数 将样本数据按___________的顺序排列后,“中间”的那个数据 使样本数据被分成的两部分的_____________,不受少数几个极端数据的影响
众数 样本数据中出现次数最_____的数据 体现了样本数据的最大集中点
平均值
从小到大
数据量相等
多
小
【批注】三种数字特征的优缺点
名称 优点 缺点
平均数 代表性较好,是反映数据集中趋势的量.一般情况下,可以反映出更多的关于样本数据全体的信息 任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
中位数 1.不受少数几个极端数据的影响.
2.容易计算,便于利用中间数据的信息 对极端值不敏感
众数 1.体现了样本数据的最大集中点.
2.容易计算 1.只能表达样本数据中很少的一部分信息.
2.无法客观地反映总体的特征
关键能力 攻重难
●题型一 平均数、众数的确定
例1:某公司员工的月工资情况如表所示:
(1)分别计算该公司员工月工资的最值、平均数、和众数;
(2)你认为用哪个数来代表该公司员工的月工资更合理?
月工资/元 8 000 5 000 4 000 2 000 1 000 800 700
员工/人 1 2 5 8 20 12 2
(2)用众数,因为最大值为8 000元且只有一个,无法代表该公司员工的月工资,平均数受到最大值的影响,也无法代表该公司员工的月工资,每月拿1 000元的员工最多,众数代表该公司员工的月工资最合理.
[归纳提升]
归纳提升:
1.把数据从小到大排列,根据定义即可确定最值和众数.
2.平均数的求法
(1)用定义式;
(2)用平均数的性质;
〉对点训练1
某校在一次考试中,甲、乙两班学生的数学成绩统计如下:
选用平均数与众数评估这两个班的成绩.
分数 50 60 70 80 90 100
人数 甲班 1 6 12 11 15 5
乙班 3 5 15 3 13 11
从平均分看成绩较好的是乙班;
甲班众数为90分,乙班众数为70分,从众数看成绩较好的是甲班.
●题型二 中位数的计算
例2:已知一组数据8,6,4,7,11,6,8,9,10,5,则该组数据的中位数是_________.
[归纳提升]
7.5
归纳提升:求中位数的一般步骤
(1)把数据按大小顺序排列.
(2)找出排列后位于中间位置的数据,即为中位数.若中间位置有两个数据,则求出这两个数据的平均数作为中位数.
〉对点训练2
10名工人某天生产同一种零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有( )
A.a>b>c B.b>c>a
C.c>a>b D.c>b>a
●题型三 极差、方差、标准差的计算
例3:已知一组数据:2,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,6,6.
(1)求极差;
(2)求方差;
(3)求标准差.
[解析] (1)最大值为6,最小值为2,极差为4.
(2)可将数据整理为
每一个数都减去4可得
x 2 3 4 5 6
频数 3 4 5 6 2
x-4 -2 -1 0 1 2
频数 3 4 5 6 2
这组数的平均数与方差分别为
[归纳提升]
归纳提升:求方差的基本方法
(2)用性质.
(3)当一组数据重复数据较多时,可先整理出频数表,再计算s2.
〉对点训练3
若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )
A.8 B.15
C.16 D.32
[解析] 样本数据x1,x2,…,x10的标准差s=8,则而样本数据2x1-1,2x2-1,…,2x10-1的标准差s′=2×8=16.故选C.
●易错警示 求中位数时未把数据按从小到大顺序排列
例4:下面是某赛季甲、乙两名篮球队员每场比赛得分情况:
甲:4 14 14 24 25 31 32 35 36 36 39 45 49
乙:8 12 15 18 23 27 25 32 33 34 41
则甲、乙得分的中位数之和是( )
A.56分 B.57分
C.58分 D.59分
[错解] D 因为甲的中位数是32,乙的中位数是27,所以甲、乙得分的中位数之和是59.
[辨析] 本题易忽视求乙得分的中位数时,没有将数据从小到大排列起来,将原始数据中的中间一个数误认为就是乙得分的中位数而导致错误.因此理解样本的数字特征的含义较为重要.
[正解] 由题可知甲得分的中位数为32分,乙得分的数据从小到大排列为:8,12,15,18,23,25,27,32,33,34,41,故乙得分的中位数为25分,因此甲、乙两人得分的中位数之和为57分.故选B.
课堂检测 固双基
1.一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,中位数为22,则x等于( )
A.21 B.22
C.23 D.19
2.已知数据:2,4,4,6,6,6,8,8,8,8,则这10个数的标准差为( )
A.1 B.2
C.3 D.4
3.一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均值约为( )
A.4.55 B.4.5
C.12.5 D.1.64
4.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,求原来数据的平均数和方差.第六章 §4 4.1
素养作业 提技能
A组·基础自测
一、选择题
1.已知数据-3,-2,0,6,6,13,20,35则它的中位数和众数各是( A )
A.6和6 B.3和6
C.6和3 D.9.5和6
[解析] ∵从小到大排列的这8个数,排在中间的两个数都是6,∴中位数是6;∵6出现的次数最多,∴众数是6.故选A.
2.某高校甲、乙两位同学大学四年选修课程的考试成绩等级(选修课的成绩等级分为1,2,3,4,5,共五个等级)的条形图如图所示,则甲成绩等级的中位数与乙成绩等级的众数分别是( C )
A.3,5 B.3,3
C.3.5,5 D.3.5,4
[解析] 由条形图可得,甲同学共有10门选修课,将这10门选修课的成绩等级从低到高排序后,第5,6门的成绩等级分别为3,4,故中位数为=3.5,乙成绩等级的众数为5.故选C.
3.甲、乙、丙、丁四名射手在选拔赛中所得的平均环数及其方差s2如表所示,则选送决赛的最佳人选应是( B )
项目 甲 乙 丙 丁
7 8 8 7
s2 6.3 6.3 7 8.7
A.甲 B.乙
C.丙 D.丁
[解析] 因为乙=丙>甲=丁,且s=s4.16位参加百米半决赛同学的成绩各不相同,按成绩取前8位进入决赛.若小刘在知道了自己的成绩后,要判断他能否进入决赛,则他需要知道其他15位同学成绩的( C )
A.平均数 B.极差
C.中位数 D.方差
[解析] 判断是不是能进入决赛,只需判断是不是前8位,所以只要知道其他15位同学的成绩中是不是有8个高于他,也就是把其他15位同学的成绩排列后看第8个成绩即可,小刘的成绩高于这个成绩就能进入决赛,低于这个成绩就不能进入决赛.第8位的成绩就是这15位同学成绩的中位数.故选C.
5.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB,则( B )
A.A>B,sA>sB B.A<B,sA>sB
C.A>B,sA<sB D.A<B,sA<sB
[解析] A=(2.5+10+5+7.5+2.5+10)=6.25,
B=(15+10+12.5+10+12.5+10)=≈11.67.
s=[(2.5-6.25)2+(10-6.25)2+(5-6.25)2+(7.5-6.25)2+(2.5-6.25)2+(10-6.25)2]≈9.90,
s=≈3.47.
故A<B,sA>sB.故选B.
6.已知一组数据x1,x2,…,xn的平均数为5,方差为4,则数据3x1+7,3x2+7,…,3xn+7的平均数和方差分别为( B )
A.22,42 B.22,36
C.52,36 D.52,19
[解析] 由题意得新数据平均数为3×5+7=22,方差为32×4=36.故选B.
二、填空题
7.一个样本数据按从小到大的顺序排列为:13,14,19,x,23,27,28,31,中位数为23,则x=_23__.
[解析] 由题意知=23,则x=23.
8.若k1,k2,…,k6的方差为3,则2(k1-3),2(k2-3),…,2(k6-3)的方差为_12__.
[解析] 新数据方差为22×3=12.
9.某学员在一次射击测试中射靶10次,命中环数如下:
7,8,7,9,5,4,9,10,7,4.
则:(1)平均命中环数为_7__;
(2)命中环数的标准差为_2__.
[解析] (1)==7.
(2)∵s2=[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴s=2.
三、解答题
10.2023年8月8日,世界大学生运动会在成都成功举行闭幕式.某校抽取100名学生进行了大运会知识竞赛并纪录得分(满分:100分),根据得分将他们的成绩分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组,制成如图所示的频率分布直方图.
(1)求图中a的值;
(2)估计这100人竞赛成绩的平均数(同一组数据用该组数据的中点值代替)及中位数.
[解析] (1)由题意知(0.005+a+0.020+0.030+0.025+0.005)×10=1,
即0.085+a=0.1,a=0.015.
(2)由频率分布直方图可知:
平均数为45×0.05+55×0.15+65×0.20+75×0.30+85×0.25+95×0.05=72,
前3组的频率为0.05+0.15+0.2=0.4,所以中位数为70+×10=70+=.
11.某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:
甲 127 138 130 137 135 131
乙 133 129 138 134 128 136
求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛.
[解析] 设甲、乙两人成绩的平均数分别为甲,乙,
则甲=130+(-3+8+0+7+5+1)=133,
乙=130+(3-1+8+4-2+6)=133,
s=[(-6)2+52+(-3)2+42+22+(-2)2]=,
s=[02+(-4)2+52+12+(-5)2+32]=.
因此,甲与乙的成绩的平均数相同,由于乙的成绩的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适.
B组·素养提升
一、选择题
1.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如表:
学生 1号 2号 3号 4号 5号
甲班 6 7 7 8 7
乙班 6 7 6 7 9
若以上两组数据的方差中较小的一个为s2,则s2等于( A )
A. B.
C. D.2
[解析] 甲=7,s=[(6 -7)2+(7-7)2+(7-7)2+ (8-7)2+(7-7)2]=,乙=7,s=[(6-7)2+(7-7)2+(6-7)2+(7-7)2 +(9-7)2]=,两组数据的方差中较小的一个为s,即s2=.故选A.
2.(多选题)下列说法正确的是( )
A.方差是标准差的平方
B.标准差的大小不会超过极差
C.若一组数据的值大小相等,没有波动变化,则标准差为0
D.标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散
[解析] 标准差越小,表明各个样本数据在样本平均数周围越集中;标准差越大,表明各个样本数据在样本平均数周围越分散.故选ABC.
3.(多选题)在发生公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续7天,每天新增疑似病例不超过5人”.过去7日,甲、乙、丙、丁四地新增疑似病例数据信息如下,则一定符合该标志的是( )
甲地:总体平均数为2,且标准差s≤2;
乙地:中位数为2,极差为c=3;
丙地:总体平均数≤3,且极差c≤3;
丁地:众数为1,且极差c≤4.
A.甲地 B.乙地
C.丙地 D.丁地
[解析] 甲地:若7天新增疑似病例为1,1,1,1,2,2,6,满足平均数为2,标准差s=<2,但不符合该标志,即A错误;乙地:若中位数为2可知7天新增数据的最小值小于等于2,又由极差为c=3可得最大值小于等于5,即不可能有哪天的疑似病例超过5人,符合该标志,即B正确;丙地:由极差c≤3可知,若某天疑似病例超过5人,此时7天新增数据的最小值大于等于3,那么总体平均数≤3就不可能成立,所以每天新增疑似病例不超过5人,符合该标志,即C正确;丁地:因为众数为1,且极差c≤4,所以新增疑似病例的最大值小于等于5,所以符合该标志,即D正确.故选BCD.
4.已知某7个数的平均数为3,方差为s2,现又加入一个新数据3,此时这8个数的平均数为,方差为,则( B )
A.=3,s2=2 B.=3,s2=4
C.=3,s2=28 D.=3,s2=
[解析] 由题意知==3,
由方差公式得=[7s2+(3-3)2],
所以s2=×8×=4.故选B.
二、填空题
5.从一堆苹果中任取5个,称得它们的质量(单位:g)如下:125,124,121,123,127.则该样本的标准差s=_2__g(用数字作答).
[解析] 方法一(定义法):平均数=×(125+124+121+123+127)=124(g).
方差s2=×(12+02 +32+12+32) =4,
所以标准差s=2 g.
方法二(新数据法):将原数据都减去124,得新数据1,0,-3,-1,3,它们的平均数为0,方差为4,故原数据的方差为4,则所求标准差s=2.
6.某学习小组10名同学在一次数学测试中的得分分别为85,78,66,91,67,78,67,87,96,88,则这10名同学成绩的中位数为_81.5__.
[解析] 这组数据按照从小到大排列后为66,67,67,78,78,85,87,88,91,96,
所以这10名同学成绩的中位数为==81.5.
7.某校高一年级开设了丰富多彩的校本课程,现从甲、乙两个班随机抽取了5名学生校本课程的学分,统计如下表.
甲 8 11 14 15 22
乙 6 7 10 23 24
用s,s分别表示甲、乙两班抽取的5名学生学分的方差,则s=_22__,s=_62__,并由此可判断成绩更稳定的班级是_甲__班.
[解析] 根据表中数据,计算甲班的平均数为1=×(8+11+14+15+22)=14,
乙班的平均数为2=×(6+7+10+23+24)=14;
甲班的方差为s=×[(8-14)2+(11-14)2+(14-14)2+(15-14)2+(22-14)2]=22,
乙班的方差为s=×[(6-14)2+(7-14)2+(10-14)2+(23-14)2+(24-14)2]=62,所以s由此可判断成绩更稳定的班级是甲班.
三、解答题
8.一箱方便面共有50袋,用随机抽样方法从中抽取了10袋,并称其质量(单位:g)结果为:60.5,61,60,60,61.5,59.5,59.5,58,60,60.
(1)指出总体、个体、样本、样本容量;
(2)指出样本数据的众数、中位数、平均数;
(3)求样本数据的方差.
[解析] (1)总体是这50袋方便面的质量,个体是这一箱方便面中每一袋方便面的质量,样本是抽取的10袋方便面的质量,样本容量为10.
(2)这组样本数据的众数是60,中位数为60,
平均数为=×(60.5+61+60+60+61.5+59.5+59.5+58+60+60)=60.
(3)样本数据的方差为s2=[(60.5-60)2+(61-60)2+(60-60)2+(60-60)2+(61.5-60)2+(59.5-60)2+(59.5-60)2+(58-60)2+(60-60)2+(60-60)2]=0.8.
9.甲,乙两名射击运动员在相同条件下进行水平测试,各射击10次,命中的环数如下:
甲 8 6 7 8 6 5 9 10 4 7
乙 6 7 7 8 6 7 8 7 9 5
(1)分别计算两组数据的平均数及方差;
(2)现要从甲、乙两人中选拔一人去参加比赛,根据上面的测试成绩,你认为应该派谁去合适?并且说明理由.
[解析] (1)甲的平均数为甲=
×(8+6+7+8+6+5+9+10+4+7)=7,
乙的平均数为乙=×(6+7+7+8+6+7+8+7+9+5)=7,
甲的方差为s=[(8-7)2+(6-7)2+(7-7)2+(8-7)2+(6-7)2+(5-7)2+(9-7)2+(10-7)2+(4-7)2+(7-7)2]=×(1+1+1+1+4+4+9+9)==3,
乙的方差为s=[(6-7)2+(7-7)2+(7-7)2+(8-7)2+(6-7)2+(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2]=×(1+1+1+1+4+4)==1.2.
(2)由于甲=乙,则两人平均数相同,由于s>s,则甲数据不如乙数据稳定,故应选派乙参加比赛.
21世纪教育网(www.21cnjy.com)