(共35张PPT)
5.1 统计
5.1.2 数据的数字特征
第2课时 众数、极差、方差与标准差
◆ 课前预习
◆ 课中探究
◆ 课堂评价
◆ 备课素材
【学习目标】
1.会求一组数据的众数、极差、方差与标准差;
2.理解数字特征的意义,并能解决与之相关的实际问题.
知识点一 众数
一组数据中,某个数据出现的次数称为这个数据的频数,出现次数______的数
据称为这组数据的众数.
最多
知识点二 极差、方差与标准差
1.一组数的极差指的是这组数的________减去________所得的差.
2.如果,, ,的平均数为,则方差可用求和符号表示为
_ ____________.
3.如果,, ,的方差为,且,为常数,则,, ,
的方差为______.
4.方差的____________称为标准差.
最大值
最小值
算术平方根
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)若一组数中,各数据值都相等,则标准差为0,表明数据没有波动,数据
没有离散性,反之也成立.( )
√
(2)甲组数据的每个数据比乙组数据的每个数据都大,那么甲组数据的方差大
于乙组数据的方差.( )
×
[解析] 方差可以衡量一组数据波动的大小,数据大不一定数据的波动大,即不
一定方差大.
探究点一 众数、极差、方差与标准差的计算
例1(1) (多选题)[2024·贵州毕节高一期末] 某士官参加军区射击比赛,打
了6发子弹,报靶数据如下:7,8,9,10,6,8(单位:环),下列说法正确
的有( )
AB
A.这组数据的平均数是8 B.这组数据的极差是4
C.这组数据的 分位数是9 D.这组数据的方差是2
[解析] 对于A,这组数据的平均数是 ,故A正确;
对于B,这组数据的极差是 ,故B正确;
对于C,这组数据从小到大排列为6,7,8,8,9,10,因为,
所以这组数据的 分位数是8,故C错误;
对于D,这组数据的方差是 ,
故D错误.故选 .
(2)一组数据按从小到大的顺序排列为1,4,4,,7,8(其中 ),若该组数据
的中位数是众数的 倍,则该组数据的标准差为_ ___.
[解析] 这组数据的中位数是众数的倍,,解得, 该组数据的
平均数为, 该组数据的方差为
,则
标准差为 .
变式(1) 甲、乙、丙、丁四人各掷骰子5次(骰子出现的点数可能为1,2,3,
4,5,6),并分别记录自己每次掷骰子出现的点数,四人根据统计结果对自己
的试验数据分别进行如下描述,可以判断一定出现6点的描述是( )
D
A.甲:中位数为4,众数为4 B.乙:中位数为3,极差为4
C.丙:平均数为3,方差为2 D.丁:平均数为4, 分位数为2
[解析] 对于A,中位数为4,众数为4,则这5个数可以为4,4,4,4,4,故A不符合题意;
对于B,中位数为3,极差为4,则这5个数可以是1,1,3,4,5,故B不符合题意;
对于C,平均数为3,方差为2,设这5个数分别为,,,, ,则
,
,若取,则 ,则
,所以 ,
,,,所以,,, 这四个数可以为
4,3,3,3或2,3,3,3,这与 矛盾,所以不存在6点,故C不符合
题意;
对于D,按从小到大的顺序设这5个数依次为,,,, ,因为
,所以分位数为5个数中从小到大排列的第2个数,又
分位数为2,所以或, ,因为平均数为4,所以
,则或,若,, 三个数都
不是6,则,这与或矛盾,故,,
三个数中一定会出现6,故D符合题意.故选D.
(2)(多选题)已知数据,, ,的平均数为,方差为 ,中位数为
,极差为.由这组数据得到新数据,, , ,其中
,则( )
ABD
A.新数据的平均数是 B.新数据的方差是
C.新数据的中位数是 D.新数据的极差是
[解析] ,, ,的平均数为 ,所以
,故A正确;
, ,, 的方差为,即 ,所以
,故B正确;
,, ,的中位数为 ,则,, ,的中位数为,故C错误;
,, , 的极差为,则,, ,的极差为,故D正确.故选 .
[素养小结]
计算标准差的五个步骤:
(1)算出样本数据的平均数 .
(2)算出每个样本数据与样本数据平均数的差: .
(3)算出(2)中 的平方.
(4)算出(3)中 个平方数的平均数,即为样本方差.
(5)算出(4)中方差的算术平方根,即为样本标准差.
探究点二 数字特征的应用
例2 某校拟选派一名跳高运动员去参加一项校际比赛,对甲、乙两名跳高运动
员分别进行了8次测试,他们的成绩(单位: )如下.
甲:,,,,,,, ;
乙:,,,,,,, .
经预测,跳高成绩达到 就很可能获得这次校际比赛的冠军,该校为了获
得冠军,可能选哪名运动员参赛?若预测跳高成绩达到 方可获得冠军呢?
解:甲成绩的平均数为
,标准
差为 .
乙成绩的平均数为
,标准
差为 .
显然,甲成绩的平均数大于乙成绩的平均数,而且甲成绩的标准差小于乙成绩
的标准差,说明甲的成绩比乙稳定,所以若跳高成绩达到 就很可能获得
这次校际比赛的冠军,则应派甲参赛.
在这8次测试中甲有3次成绩在及以上,乙有5次成绩在 及以上,虽
然乙成绩的平均数小于甲,成绩的稳定性也不如甲,但是若跳高成绩达到
方可获得冠军,则应派乙参赛.
变式(1) 定义一个同学数学成绩优秀的标准为“连续5次考试成绩均不低于
120分”.现有甲、乙、丙三位同学连续5次数学考试成绩的记录数据(记录数据都
是正整数)
①甲同学:5个数据的中位数为127,众数为120;
②乙同学:5个数据的中位数为125,平均数为127;
③丙同学:5个数据的中位数为131,平均数为128,方差为13.8.
则可以判定数学成绩优秀的同学为( )
C
A.甲、乙 B.乙、丙 C.甲、丙 D.甲、乙、丙
[解析] 甲同学5个数据的中位数为127,众数为120,所以前3个数为120,120,
127,后2个数肯定大于127,故甲同学数学成绩优秀;
乙同学5个数据的中位数为125,平均数为127,则这5个数据可以为118,119,125,128,145,此时乙同学数学成绩不优秀;
丙同学5个数据的中位数为131,平均数为128,方差为 ,设丙同学的另外4个数据分别为,,,,且 ,则
,即 ,所以
,得,所以 ,所以丙同学数学成
绩优秀.所以可以判定数学成绩优秀的同学有甲、丙.故选C.
(2)从甲、乙两人中选拔一人参加射击比赛,对他们的射击水平进行了测试,
两人在相同条件下各射击10次,命中的环数如下.
甲:7 8 6 8 6 5 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
①分别计算甲、乙两人射击命中环数的平均数.
解:由题得,甲射击命中环数的平均数为 ,
乙射击命中环数的平均数为
.
②选派谁去参赛更好?请说明理由.
解:甲射击命中环数的方差为
,
乙射击命中环数的方差为
.
由①知,而 ,所以选派乙去参赛更好.
[素养小结]
刻画数据时,要根据不同的问题选择不同的数字特征.平均数是数据的重心,它是
反映数据集中趋势的一项指标,当需要刻画数据集中程度的时候需要求平均数.方
差与标准差是反映数据离散与波动程度的,当需要刻画数据稳定程度的时候通常
选择方差或标准差.
1.甲、乙、丙、丁四名射手在选拔赛中所得的平均环数及其方差 如下表所示,
则选派参加决赛的最佳人选应是( )
甲 乙 丙 丁
7 8 8 7
6.3 6.3 7 8.7
B
A.甲 B.乙 C.丙 D.丁
[解析] ,且 ,
应选派乙参加决赛.
2.样本数据99,100,98,97,96的标准差为( )
A
A. B.0 C.1 D.2
[解析] 平均数为 ,方差为
,标
准差为 .
3.(多选题)[2024·湖南邵阳高一期末] 如果将一组数据5,4,6,5,4,13,5
依次重复写10次,会得到70个数组成的一组新数据,关于这组新数据的中位数、
众数、极差、方差,下列说法正确的是( )
ABD
A.中位数是5 B.极差是9 C.方差变大 D.众数是5
[解析] 将这组数据按从小到大的顺序排列为4,4,5,5,5,6,13,处于中间
位置的那个数是5,每个数字重复写10次,5依然处于中间位置,由中位数的定
义可知,这组新数据的中位数是5,故A正确;
这组新数据中出现次数最多的数是5,出现了30次,所以众数是5,故D正确;
新数据的最大值与最小值分别是13,4,故极差是9,故B正确;
,原
数据的平均数与新数据的平均数相等,原数据的方差
,
新数据的方差
,
原数据的方差与新数据的方差相等,故C错误.故选 .
4.(多选题)有一组样本数据,,,,,,,其中 是最小
值, 是最大值,则( )
BC
A.,,,,的众数等于,,,,,, 的众数
B.,,,,的中位数等于,,,,,, 的中位数
C.,,,,的方差不大于,,,,,, 的方差
D.,,,,的极差不小于,,,,,, 的极差
[解析] 不妨设 .
对于A,设这组数据为1,2,2,3,4,4,4,此时,,,,,,的众数为4,
,,,, 的众数为2和4,故A错误;
对于B,,,,,,,的中位数为,,,,,的中位数为 ,
故B正确;
对于C,因为是最小值,是最大值,所以,,,, 的波动程
度不大于,,,,,,的波动程度,故C正确;
对于D,因为,,, ,,,的极差为,,,,,的极差
为,且, ,所以,故D错误.故选 .
5.一组样本数据按从小到大的顺序排列为,0,4,, ,14,若这组数据
的平均数与中位数均为5,则其方差为___.
[解析] 数据,0,4,,,14的中位数为5,,, 这组
数据的平均数是, ,故这组数据的方差是
.
1.众数
众数体现数据中最大集中点,但无法客观地反映总体特点.确定众数的关键是统
计各数据出现的频数,频数最大的数据就是众数,当一组数据中有较多数据多
次重复出现时,众数往往更能反映数据的集中趋势.
2.方差和标准差
(1)方差的简化计算公式: ,或写成
,即方差等于原数据平方的平均数减去平均数的
平方.
(2)当一组数据均较大或较小时,将这组数据都同时减去或加上同一个常数后,
所得方差、标准差与原始数据的方差、标准差相同.
(3)标准差和方差的异同:
相同点:标准差和方差都可以描述一组数据围绕平均数波动的大小.
不同点:方差与原始数据的单位不同,且方差可能夸大了偏差程度,标准差则不然.
3.平均数与标准差(方差)这两个数字特征在实际问题中如何应用?
平均数反映的是数据的平均水平,在实际应用中,平均数常被理解为平均水平,
标准差反映的是数据的离散程度的大小,反映了各个样本数据在样本平均数周
围的集中程度.标准差越小,表明各个样本数据在样本平均数的周围越集中;反
之,标准差越大,表明各个样本数据在样本平均数的周围越分散.在实际应用中,
标准差常被理解为稳定性,常常与平均数结合起来解决问题.
例如:要从甲、乙两名射击运动员中选一名参加运动会,如果你是教练,你会
制定怎样的选拔标准?制定怎样的选拔方案?
选拔标准:要先考虑射击运动员射击的平均水平,即平均射击环数,再考虑射
击运动员发挥的稳定性.当射击环数的平均数不相同时,选择平均数较大的运动
员;当射击环数的平均数相同时,选择发挥更稳定(标准差较小)的运动员.
选拔方案:让这两名射击运动员在相同的环境下进行相同次数的射击,并记录
每次射击的环数,然后计算两名运动员射击环数的平均数和方差,再根据选拔
标准进行选择.第2课时 众数、极差、方差与标准差
【课前预习】
知识点一
最多
知识点二
1.最大值 最小值 2. 3.a2s2 4.算术平方根
诊断分析
(1)√ (2)× [解析] (2)方差可以衡量一组数据波动的大小,数据大不一定数据的波动大,即不一定方差大.
【课中探究】
例1 (1)AB (2) [解析] (1)对于A,这组数据的平均数是×(7+8+9+10+6+8)=8,故A正确;对于B,这组数据的极差是10-6=4,故B正确;对于C,这组数据从小到大排列为6,7,8,8,9,10,因为6×40%=2.4,所以这组数据的40%分位数是8,故C错误;对于D,这组数据的方差是×[(-1)2+02+12+22+(-2)2+02]=,故D错误.故选AB.
(2)∵这组数据的中位数是众数的倍,∴=4×,解得x=6,∴该组数据的平均数为×(1+4+4+6+7+8)=5,∴该组数据的方差为×[(1-5)2+(4-5)2+(4-5)2+(6-5)2+(7-5)2+(8-5)2]=,则标准差为.
变式 (1)D (2)ABD [解析] (1)对于A,中位数为4,众数为4,则这5个数可以为4,4,4,4,4,故A不符合题意;对于B,中位数为3,极差为4,则这5个数可以是1,1,3,4,5,故B不符合题意;对于C,平均数为3,方差为2,设这5个数分别为x1,x2,x3,x4,x5,则x1+x2+x3+x4+x5=15,×[++++]=2,若取x1=6,则x2+x3+x4+x5=9,则+++=1,所以≤1,≤1,≤1,≤1,所以x2,x3,x4,x5这四个数可以为4,3,3,3或2,3,3,3,这与x2+x3+x4+x5=9矛盾,所以不存在6点,故C不符合题意;对于D,按从小到大的顺序设这5个数依次为a,b,c,d,e,因为5×25%=1.25,所以25%分位数为5个数中从小到大排列的第2个数,又25%分位数为2,所以a=1或a=2,b=2,因为平均数为4,所以a+b+c+d+e=20,则c+d+e=17或c+d+e=16,若c,d,e三个数都不是6,则c+d+e≤15,这与c+d+e=17或c+d+e=16矛盾,故c,d,e三个数中一定会出现6,故D符合题意.故选D.
(2)x1,x2,…,x60的平均数为a,所以
=2×+1=2a+1,故A正确;x1,x2,…,x60的方差为b,即=b,所以
==4×
=4b,故B正确;x1,x2,…,x60的中位数为c,则2x1+1,2x2+1,…,2x60+1的中位数为2c+1,故C错误;x1,x2,…,x60的极差为d,则2x1+1,2x2+1,…,2x60+1的极差为2d,故D正确.故选ABD.
例2 解:甲成绩的平均数为=×(1.70+1.65+1.68+1.69+1.72+1.73+1.68+1.67)=1.69,标准差为s甲=≈0.024.
乙成绩的平均数为=×(1.60+1.73+1.72+1.61+1.62+1.71+1.70+1.75)=1.68,标准差为s乙=≈0.056.
显然,甲成绩的平均数大于乙成绩的平均数,而且甲成绩的标准差小于乙成绩的标准差,说明甲的成绩比乙稳定,所以若跳高成绩达到1.65 m就很可能获得这次校际比赛的冠军,则应派甲参赛.
在这8次测试中甲有3次成绩在1.70 m及以上,乙有5次成绩在1.70 m及以上,虽然乙成绩的平均数小于甲,成绩的稳定性也不如甲,但是若跳高成绩达到1.70 m方可获得冠军,则应派乙参赛.
变式 (1)C [解析] 甲同学5个数据的中位数为127,众数为120,所以前3个数为120,120,127,后2个数肯定大于127,故甲同学数学成绩优秀;乙同学5个数据的中位数为125,平均数为127,则这5个数据可以为118,119,125,128,145,此时乙同学数学成绩不优秀;丙同学5个数据的中位数为131,平均数为128,方差为13.8,设丙同学的另外4个数据分别为x1,x2,x3,x4,且x1≤x2≤x3≤x4,则[(x1-128)2+(x2-128)2+(x3-128)2+(x4-128)2+(131-128)2]=13.8,即(x1-128)2+(x2-128)2+(x3-128)2+(x4-128)2=60,所以(x1-128)2≤60,得|x1-128|≤7,所以x1≥128-7>120,所以丙同学数学成绩优秀.所以可以判定数学成绩优秀的同学有甲、丙.故选C.
(2)解:①由题得,甲射击命中环数的平均数为==7,
乙射击命中环数的平均数为==7.
②甲射击命中环数的方差为=×[(7-7)2+(8-7)2+(6-7)2+(8-7)2+(6-7)2+(5-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=×(0+1+1+1+1+4+4+9+0+9)=3,
乙射击命中环数的方差为=×[(9-7)2+(5-7)2+(7-7)2+(8-7)2+(7-7)2+(6-7)2+(8-7)2+(6-7)2+(7-7)2+(7-7)2]=×(4+4+0+1+0+1+1+1+0+0)=1.2.
由①知=,而>,所以选派乙去参赛更好.
【课堂评价】
1.B [解析] ∵=>=,且=<<,∴应选派乙参加决赛.
2.A [解析] 平均数为×(99+100+98+97+96)=98,方差为×[(99-98)2+(100-98)2+(98-98)2+(97-98)2+(96-98)2]=2,标准差为.
3.ABD [解析] 将这组数据按从小到大的顺序排列为4,4,5,5,5,6,13,处于中间位置的那个数是5,每个数字重复写10次,5依然处于中间位置,由中位数的定义可知,这组新数据的中位数是5,故A正确;这组新数据中出现次数最多的数是5,出现了30次,所以众数是5,故D正确;新数据的最大值与最小值分别是13,4,故极差是9,故B正确;==6,原数据的平均数与新数据的平均数相等,原数据的方差=×[(5-6)2+(4-6)2+(6-6)2+(5-6)2+(4-6)2+(13-6)2+(5-6)2]=,新数据的方差=×[(5-6)2×10+(4-6)2×10+(6-6)2×10+(5-6)2×10+(4-6)2×10+(13-6)2×10+(5-6)2×10]=,原数据的方差与新数据的方差相等,故C错误.故选ABD.
4.BC [解析] 不妨设x1≤x2≤x3≤x4≤x5≤x6≤x7.对于A,设这组数据为1,2,2,3,4,4,4,此时x1,x2,x3,x4,x5,x6,x7的众数为4,x2,x3,x4,x5,x6的众数为2和4,故A错误;对于B,x1,x2,x3,x4,x5,x6,x7的中位数为x4,x2,x3,x4,x5,x6的中位数为x4,故B正确;对于C,因为x1是最小值,x7是最大值,所以x2,x3,x4,x5,x6的波动程度不大于x1,x2,x3,x4,x5,x6,x7的波动程度,故C正确;对于D,因为x1,x2,x3,x4,x5,x6,x7的极差为x7-x1,x2,x3,x4,x5,x6的极差为x6-x2,且x1≤x2,x6≤x7,所以x7-x1≥x6-x2,故D错误.故选BC.
5. [解析] ∵数据-1,0,4,x,y,14的中位数为5,∴=5,∴x=6,∴这组数据的平均数是=5,∴y=7,故这组数据的方差是×(36+25+1+1+4+81)=.第2课时 众数、极差、方差与标准差
【学习目标】
1.会求一组数据的众数、极差、方差与标准差;
2.理解数字特征的意义,并能解决与之相关的实际问题.
◆ 知识点一 众数
一组数据中,某个数据出现的次数称为这个数据的频数,出现次数 的数据称为这组数据的众数.
◆ 知识点二 极差、方差与标准差
1.一组数的极差指的是这组数的 减去 所得的差.
2.如果x1,x2,…,xn的平均数为,则方差可用求和符号表示为s2= .
3.如果x1,x2,…,xn的方差为s2,且a,b为常数,则ax1+b,ax2+b,…,axn+b的方差为 .
4.方差的 称为标准差.
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)若一组数中,各数据值都相等,则标准差为0,表明数据没有波动,数据没有离散性,反之也成立. ( )
(2)甲组数据的每个数据比乙组数据的每个数据都大,那么甲组数据的方差大于乙组数据的方差.( )
◆ 探究点一 众数、极差、方差与标准差的计算
例1 (1)(多选题)[2024·贵州毕节高一期末] 某士官参加军区射击比赛,打了6发子弹,报靶数据如下:7,8,9,10,6,8(单位:环),下列说法正确的有 ( )
A.这组数据的平均数是8
B.这组数据的极差是4
C.这组数据的40%分位数是9
D.这组数据的方差是2
(2)一组数据按从小到大的顺序排列为1,4,4,x,7,8(其中x≠7),若该组数据的中位数是众数的倍,则该组数据的标准差为 .
变式 (1)甲、乙、丙、丁四人各掷骰子5次(骰子出现的点数可能为1,2,3,4,5,6),并分别记录自己每次掷骰子出现的点数,四人根据统计结果对自己的试验数据分别进行如下描述,可以判断一定出现6点的描述是 ( )
A.甲:中位数为4,众数为4
B.乙:中位数为3,极差为4
C.丙:平均数为3,方差为2
D.丁:平均数为4,25%分位数为2
(2)(多选题)已知数据x1,x2,…,x60的平均数为a,方差为b,中位数为c,极差为d.由这组数据得到新数据y1,y2,…,y60,其中yi=2xi+1(i=1,2,…,60),则 ( )
A.新数据的平均数是2a+1
B.新数据的方差是4b
C.新数据的中位数是2c
D.新数据的极差是2d
[素养小结]
计算标准差的五个步骤:
(1)算出样本数据的平均数.
(2)算出每个样本数据与样本数据平均数的差:xi-(i=1,2,3,…,n).
(3)算出(2)中xi-(i=1,2,3,…,n)的平方.
(4)算出(3)中n个平方数的平均数,即为样本方差.
(5)算出(4)中方差的算术平方根,即为样本标准差.
◆ 探究点二 数字特征的应用
例2 某校拟选派一名跳高运动员去参加一项校际比赛,对甲、乙两名跳高运动员分别进行了8次测试,他们的成绩(单位:m)如下.
甲:1.70,1.65,1.68,1.69,1.72,1.73,1.68,1.67;
乙:1.60,1.73,1.72,1.61,1.62,1.71,1.70,1.75.
经预测,跳高成绩达到1.65 m就很可能获得这次校际比赛的冠军,该校为了获得冠军,可能选哪名运动员参赛 若预测跳高成绩达到1.70 m方可获得冠军呢
变式 (1)定义一个同学数学成绩优秀的标准为“连续5次考试成绩均不低于120分”.现有甲、乙、丙三位同学连续5次数学考试成绩的记录数据(记录数据都是正整数):
①甲同学:5个数据的中位数为127,众数为120;
②乙同学:5个数据的中位数为125,平均数为127;
③丙同学:5个数据的中位数为131,平均数为128,方差为13.8.
则可以判定数学成绩优秀的同学为 ( )
A.甲、乙 B.乙、丙
C.甲、丙 D.甲、乙、丙
(2)从甲、乙两人中选拔一人参加射击比赛,对他们的射击水平进行了测试,两人在相同条件下各射击10次,命中的环数如下.
甲:7 8 6 8 6 5 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
①分别计算甲、乙两人射击命中环数的平均数.
②选派谁去参赛更好 请说明理由.
[素养小结]
刻画数据时,要根据不同的问题选择不同的数字特征.平均数是数据的重心,它是反映数据集中趋势的一项指标,当需要刻画数据集中程度的时候需要求平均数.方差与标准差是反映数据离散与波动程度的,当需要刻画数据稳定程度的时候通常选择方差或标准差.
1.甲、乙、丙、丁四名射手在选拔赛中所得的平均环数及其方差s2如下表所示,则选派参加决赛的最佳人选应是 ( )
甲 乙 丙 丁
7 8 8 7
s2 6.3 6.3 7 8.7
A.甲 B.乙 C.丙 D.丁
2.样本数据99,100,98,97,96的标准差为( )
A. B.0 C.1 D.2
3.(多选题)[2024·湖南邵阳高一期末] 如果将一组数据5,4,6,5,4,13,5依次重复写10次,会得到70个数组成的一组新数据,关于这组新数据的中位数、众数、极差、方差,下列说法正确的是( )
A.中位数是5 B.极差是9
C.方差变大 D.众数是5
4.(多选题)有一组样本数据x1,x2,x3,x4,x5,x6,x7,其中x1是最小值,x7是最大值,则 ( )
A.x2,x3,x4,x5,x6的众数等于x1,x2,x3,x4,x5,x6,x7的众数
B.x2,x3,x4,x5,x6的中位数等于x1,x2,x3,x4,x5,x6,x7的中位数
C.x2,x3,x4,x5,x6的方差不大于x1,x2,x3,x4,x5,x6,x7的方差
D.x2,x3,x4,x5,x6的极差不小于x1,x2,x3,x4,x5,x6,x7的极差
5.一组样本数据按从小到大的顺序排列为-1,0,4,x,y,14,若这组数据的平均数与中位数均为5,则其方差为 . 第2课时 众数、极差、方差与标准差
1.B [解析] 反映一组数据x1,x2,…,xn的稳定程度的是方差或标准差.故选B.
2.B [解析] 这组数据的平均数=×(12+8+10+9+11)=10,所以这组数据的方差s2=×[(12-10)2+(8-10)2+(10-10)2+(9-10)2+(11-10)2]=2.因为这组数据的最大值为12,最小值为8,所以极差为4.
3.D [解析] 将数据按从小到大的顺序排列,可得10,12,14,14,15,15,16,17,17,17,则a=×(15+17+14+10+15+17+17+16+14+12)=14.7,b=×(15+15)=15,c=17,所以c>b>a.故选D.
4.C [解析] 最后确定售价时众数最重要,也最能说明问题.众数是500,意味着每套这种西服人们普遍能接受的价格是500元.故选C.
5.B [解析] 因为78+90=88+80,所以更正前后样本的平均数不发生改变,即=90.又(90-78)2+(90-90)2>(90-88)2+(90-80)2,所以更正后样本的方差变小,即s2<65.故选B.
6.C [解析] 设样本数据x1,x2,…,xn的平均数是,方差是s2,则s2=[(x1-)2+(x2-)2+…+(xn-)2]=0.01,则数据10x1,10x2,…,10xn的平均数是10,方差s'2=[(10x1-10)2+(10x2-10)2+…+(10xn-10)2]=100s2=1.故选C.
7.C [解析] 设正数x1,x2,x3的平均数为,则s2=(++-12)=[(x1-)2+(x2-)2+(x3-)2]=(++-+3)=(++-3),所以3=12,可得=2,所以数据3x1-1,3x2-1,3x3-1的平均数为3·-1=3×2-1=5.故选C.
8.AD [解析] 由数据x1,x2,…,xn的平均数为,可得=(x1+x2+…+xn),其方差s2=[(x1-)2+(x2-)2+…+(xn-)2].对于数据x1,x2,…,xn,,其平均数=(x1+x2+…+xn+)=,其方差=[(x1-)2+(x2-)2+…+(xn-)2+(-)2]=s2.两组数据的平均数相同,方差不相同,故C错误,D正确;易知两组数据的最大值和最小值不变,则两组数据的极差相同,故A正确;两组数据的中位数不一定相同,故B错误.故选AD.
9.AC [解析] 对于A,中位数为2,极差为5,所以最大值不会超过7,故A正确;
对于B,若过去10天体温高于37.3 ℃的人数分别为0,0,0,2,2,2,2,2,2,8,满足平均数为2,众数为2,但有一天体温高于37.3 ℃的人数超过7,故B错误;
对于C,因为平均数为2,标准差为,所以方差s2=(ai-2)2=3,假设有一天体温高于37.3 ℃的人数超过7,设为8,则(8-2)2=36,与s2=3矛盾,故C正确;
对于D,若过去10天体温高于37.3 ℃的人数分别为0,0,0,0,0,0,0,0,1,9,满足平均数为1,方差大于0,但有一天体温高于37.3 ℃的人数超过7,故D错误.故选AC.
10.甲成绩的方差大于乙成绩的方差(或甲成绩的标准差大于乙成绩的标准差) 乙 [解析] 设甲、乙两名学生成绩的平均数分别为,,标准差分别为s甲,s乙,则==74,==74,所以==104,==34,显然<,即s乙
11.6.8 [解析] 由题意得,该组数据的平均数为,众数为5.
当a≤4时,该组数据的中位数为4.5,所以+5=2×4.5,解得a=0,此时该组数据的方差为×(16+9+4+1+0+1+1+1+9+16)=5.8;
当4当a≥5时,该组数据的中位数为5,所以+5=10,解得a=10,此时该组数据的方差为×(16+9+4+1+0+0+0+4+9+25)=6.8.故该组数据方差的最大值为6.8.
12.10.5,10.5 [解析] 由样本数据的中位数为10.5可知=10.5,即a+b=21,可得样本数据的平均数为=10.若要使该组数据的方差最小,只需(a-10)2+(b-10)2最小即可,又b=21-a,故(a-10)2+(b-10)2=2a2-42a+221(7≤a≤10.5),当上式取最小值时a=10.5,此时b=10.5,该组数据的方差最小.
13.解:甲机床的样本数据从小到大排列为98,99,100,100,100,103,则众数为100,中位数为100,
平均数为=100,方差为×[(-2)2+(-1)2+3×02+32]=.
乙机床的样本数据从小到大排列为99,99,100,100,100,102,则众数为100,中位数为100,
平均数为=100,方差为×[2×(-1)2+3×02+22]=1.
故甲机床样本数据的众数、中位数、平均数都为100,方差为,
乙机床样本数据的众数、中位数、平均数都为100,方差为1.
因为乙机床样本数据的方差小于甲机床样本数据的方差,所以乙机床加工零件的质量更稳定.
14.解:(1)设第一阶段、第二阶段得分的平均数分别为E1,E2.
由题可知,第一阶段得分的平均数E1=10+×=10+=,
第二阶段得分的平均数E2=10+×=10+=.
因为E1>E2,所以该选手在第一阶段的发挥状态更好.
(2)由(1)可得=≈10.48,故s2=×=×=,于是s=≈0.31,则-2s≈10.48-2×0.31=9.86,+2s≈10.48+2×0.31=11.10,
故[-2s,+2s]即为[9.86,11.10],
因为9.8<9.86,所以该选手最后一枪在第二阶段的6个数据中不正常.
15.8 [解析] 设样本数据为x1,x2,x3,x4,x5,则平均数=(x1+x2+x3+x4+x5)=5,方差s2=[(x1-5)2+(x2-5)2+(x3-5)2+(x4-5)2+(x5-5)2]=4,则x1+x2+x3+x4+x5=25①,(x1-5)2+(x2-5)2+(x3-5)2+(x4-5)2+(x5-5)2=20②.若样本数据中的最大值为9,不妨设x5=9,则②式可变为(x1-5)2+(x2-5)2+(x3-5)2+(x4-5)2=4,由于样本数据互不相同,所以这是不可能成立的,若样本数据为2,4,5,6,8,代入验证知①②式均成立,此时样本数据中的最大值为8.
16.解:(1)可以用方差来度量每一组评委打分的相似性,方差越小,相似程度越高.
小组A打分的平均数=×(85+91+87+93+88+84+97+94+95+86)=90,
小组A打分的方差=×[(85-90)2+(91-90)2+(87-90)2+(93-90)2+(88-90)2+(84-90)2+(97-90)2+(94-90)2+(95-90)2+(86-90)2]=19;
小组B打分的平均数=×(84+87+92+96+89+95+92+91+94+90)=91,
小组B打分的方差=×[(84-91)2+(87-91)2+(92-91)2+(96-91)2+(89-91)2+(95-91)2+(92-91)2+(91-91)2+(94-91)2+(90-91)2]=12.2;
小组C打分的平均数=×(95+89+95+96+97+93+92+90+89+94)=93,
小组C打分的方差=×[(95-93)2+(89-93)2+(95-93)2+(96-93)2+(97-93)2+(93-93)2+(92-93)2+(90-93)2+(89-93)2+(94-93)2]=7.6.
(2)由于专业评委打分更符合专业规则,相似程度应该更高,即方差更小,因而C组评委更像是由专业人士组成的.第2课时 众数、极差、方差与标准差
一、选择题
1.某公司为评估共享单车的使用情况,选了n座人口大致相同的城市作为实验基地,这n座城市共享单车的使用量(单位:人次/天)分别为x1,x2,…,xn,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是 ( )
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
2.某同学5天上学途中所花费的时间(单位:分钟)分别为12,8,10,9,11,则这组数据的极差、方差分别为 ( )
A.3,4 B.4,2
C.5,9 D.4,3
3.10名工人某天生产同一种零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则 ( )
A.a>b>c B.b>c>a
C.c>a>b D.c>b>a
4.某服装店新购进一批西服,每套的成本为300元,为获得一个合理的定价,该店在零售标签上标价进行试销,一段时间后实际销售情况统计如下表:
每套售价(元) 700 600 500 400
套数 3 5 15 12
最后确定售价时最关心这组数据的 ( )
A.平均数 B.中位数
C.众数 D.极差
5.某次考试后计算出全体学生成绩的平均数为90,方差为65.后来有两位学生反应,自己的成绩被登记错误,一位学生的成绩为88分,记录成78分,另一位学生的成绩为80分,记录成90分,更正后,得到的平均数为,方差为s2,则( )
A.=90,s2>65 B.=90,s2<65
C.>90,s2<65 D.=90,s2=65
6.设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为 ( )
A.0.01 B.0.1 C.1 D.10
7.已知一组正数x1,x2,x3的方差s2=(++-12),则数据3x1-1,3x2-1,3x3-1的平均数为( )
A.1 B.3 C.5 D.7
8.(多选题)[2024·山东烟台高一期末] 已知数据x1,x2,…,xn的平均数为,则数据x1,x2,…,xn, ( )
A.与原数据的极差相同
B.与原数据的中位数相同
C.与原数据的方差相同
D.与原数据的平均数相同
9.(多选题)[2024·四川凉山高一期末] 秋末冬初,人们受冷空气的影响容易遭到各种流行病毒的侵袭,影响到正常的工作以及生活.健康部门认为:某群体若任意连续10天,每天不超过7人体温高于37.3 ℃,则称没有发生群体性发热.已知四个学校在过去10天体温高于37.3 ℃的人数统计数据,能判定该学校没有发生群体性发热的为 ( )
A.甲学校:中位数为2,极差为5
B.乙学校:平均数为2,众数为2
C.丙学校:平均数为2,标准差为
D.丁学校:平均数为1,方差大于0
二、填空题
10.甲、乙两名学生某门课程的5次测试成绩依次分别为60,80,70,90,70和80,65,70,80,75,因为 ,所以学生 的成绩更稳定.
11.已知一组数据为1,2,3,5,a,4,5,5,7,8,若该组数据的平均数与众数之和等于中位数的2倍,则该组数据方差的最大值为 .
12.已知一组样本数据由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且样本数据的中位数为10.5.若要使该组数据的方差最小,则a,b的值分别是 .
三、解答题
13.[2023·辽宁阜新高一期末] 甲、乙两机床同时加工直径为100 mm的零件,为检验质量,从中各抽取6件,测量数据如下:
甲 99 100 98 100 100 103
乙 99 100 102 99 100 100
分别计算甲、乙机床样本数据的众数、中位数、平均数和方差,并判断哪台机床加工零件的质量更稳定.
14.某选手进行射击训练,训练一共分两个阶段进行:第一阶段,前4轮(第1~8枪,每轮2枪);第二阶段,后3轮(第9~14枪,每轮2枪).此次训练成绩如下.
轮数 1 2 3 4 5 6 7
枪数 1 2 3 4 5 6 7 8 9 10 11 12 13 14
得分 10.5 10.4 10.8 10.9 10.2 10.8 10.0 10.6 10.6 10.5 10.7 10.6 10.7 9.8
(1)计算第一阶段和第二阶段得分的平均数,试根据此结果分析该选手在哪个阶段的发挥状态更好.
(2)设第二阶段得分的平均数为,标准差为s,若数据落在[-2s,+2s]内记为正常,否则记为不正常,请根据此结论判断该选手最后一枪在第二阶段6个数据中是否为正常 (参考数据:≈18.79,计算结果精确到0.01)
15.水痘是一种传染性很强的病毒性疾病,容易在春天爆发,武汉疾控中心为了调查某中学高一年级学生注射水痘疫苗的人数,在高一年级随机抽取了5个班级,每个班级抽取的人数互不相同,若把每个班级抽取的人数作为样本数据,已知样本平均数为5,样本方差为4,则样本数据中的最大值为 .
16.在一次文艺比赛中,由10名专业评审、10名媒体评审和10名大众评审各组成一个评委小组,给参赛选手打分.打分均采用100分制,下面是三组评委对选手小明的打分.
小组A 85 91 87 93 88 84 97 94 95 86
小组B 84 87 92 96 89 95 92 91 94 90
小组C 95 89 95 96 97 93 92 90 89 94
(1)选择一个可以度量每一组评委打分相似性的量,并对每组评委的打分计算度量值.
(2)你能依据(1)的度量值判断小组A,B,C中哪一个更像是由专业人士组成的吗