14.4.1 用样本估计总体的集中趋势参数
(教学方式:基本概念课——逐点理清式教学)
[课时目标]
1.会求样本数据的众数、中位数、平均数.
2.理解用样本的数字特征、频率分布直方图估计总体的集中趋势.
逐点清(一) 众数、中位数和平均数
[多维理解]
1.平均数
(1)总体均值:一般地,我们把总体中所有数据的 称为总体的均值,又称总体平均数.它通常可以代表总体的水平.
(2)平均数: 称为这n个数据a1,a2,…,an的平均数,一般记为= .
(3)性质:一般地,若取值为x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均数为 .
2.众数
一般地,我们将一组数据中出现 的那个数据叫作该组数据的众数.
3.中位数
一般地,将一组数据按照从小到大的顺序排成一列,如果数据的个数为奇数,那么排在 的数据就是这组数据的中位数;如果数据的个数为偶数,那么,排在正中间的两个数据的 即为这组数据的中位数.
[微点练明]
1.判断正误(正确的画“√”,错误的画“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势. ( )
(2)样本的平均数是频率分布直方图中最高长方形的中点对应的数据. ( )
(3)若改变一组数据中其中的一个数,则这组数据的平均数、中位数、众数都会发生改变. ( )
2.一组样本数据为19,23,12,14,14,17,10,12,18,14,27,则这组数据的众数和中位数分别为 ( )
A.14,14 B.12,14
C.14,15.5 D.12,15.5
3.(多选)某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个,命中个数如下所示:
甲:20,22,27,8,12,13,37,25,24,26
乙:14,9,13,18,19,20,23,21,21,11
则下面结论正确的是 ( )
A.甲的极差是29 B.乙的众数是21
C.甲的平均数为21.4 D.甲的中位数是24
4.(2024·新课标Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理下表:
亩产量 [900, 950) [950, 1 000) [1 000, 1 050) [1 050, 1 100) [1 100, 1 150) [1 150, 1 200]
频数 6 12 18 30 24 10
根据表中数据,下列结论中正确的是 ( )
A.100块稻田亩产量的中位数小于1 050 kg
B.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200 kg至300 kg之间
D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间
逐点清(二) 频率分布直方图中的众数、中位数、平均数
[多维理解]
1.单峰频率分布直方图中的平均数与中位数
(1)如果直方图的形状是对称的,那么平均数和中位数应该大体上差不多.
(2)如果直方图在右边“拖尾”,那么平均数大于中位数.
(3)如果直方图在左边“拖尾”,那么平均数小于中位数,也就是说,和中位数相比,平均数总是在“长尾巴”那边.
2.频率分布直方图中众数、中位数、平均数的计算
在频率分布直方图中,众数是最高矩形底边中点的横坐标,中位数左边和右边的直方图的面积应该相等,样本平均数的估计值等于频率分布直方图中每个小矩形底边中点的横坐标与小矩形的面积的乘积之和.
[微点练明]
1.某班全体学生参加物理测试成绩(单位:分)的频率分布直方图如图所示,则估计该班物理测试的平均成绩是 ( )
A.70分 B.75分
C.68分 D.66分
2.某校从参加高一年级期末考试的学生中抽出60名,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后画出如图所示的频率分布直方图.观察图中的信息,回答下列问题:
(1)估计这次考试的物理成绩的众数m与中位数n(结果保留一位小数);
(2)估计这次考试的物理成绩的及格率(60分及以上为及格)和平均分.
3.某快递公司招聘快递骑手,该公司提供了两种日工资方案:方案1:规定每日底薪50元,快递骑手每完成一单业务提成3元;方案2:规定每日底薪150元,快递业务的前44单没有提成,从第45单开始,每完成一单业务提成5元,该快递公司记录了每天骑手的人均业务量.现随机抽取100天的数据,将样本数据分为[25,35),[35,45),[45,55),[55,65),[65,75),[75,85),[85,95]七组,整理得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)若仅从人均日收入的角度考虑,请你利用所学的统计学知识为新聘骑手做出日工资方案的选择,并说明理由.(同组中的每个数据用该组区间的中点值代替)
逐点清(三) 平均数、中位数、众数的应用
[典例] 甲、乙、丙三家电子厂商在广告中都声称,他们的某型电子产品在正常情况下的待机时间都是12 h,质量检测部门对这三家销售产品的待机时间进行了抽样调查,统计结果(单位:h)如下:
甲:8,9,9,9,9,11,13,16,17,19;
乙:10,10,12,12,12,13,14,16,18,19;
丙:8,8,8,10,11,13,17,19,20,20.
(1)分别求出以上三组数据的平均数、众数、中位数;
(2)这三个厂商的推销广告分别利用了上述哪一种数据来表示待机时间
(3)如果你是顾客,宜选择哪个厂商的产品 为什么
听课记录:
|思|维|建|模|
利用样本数字特征进行决策时的两个关注点
(1)平均数与每一个数据都有关,可以反映更多的总体信息,但受极端值的影响大;中位数是样本数据所占频率的等分线,不受几个极端值的影响;众数只能体现数据的最大集中点,无法客观反映总体特征.
(2)当平均数大于中位数时,说明数据中存在许多较大的极端值.
[针对训练]
某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):
甲群:13,13,14,15,15,15,15,16,17,17;
乙群:54,3,4,4,5,5,6,6,6,57.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁
其中哪个统计量能较好地反映甲群市民的年龄特征
(2)乙群市民年龄的平均数、中位数和众数各是多少岁
其中哪个统计量能较好地反映乙群市民的年龄特征
14.4.1 用样本估计总体的集中趋势参数
[多维理解] 1.(1)算术平均数
(2)
(3)x1p1+x2p2+…+xnpn 2.次数最多 3.正中间 平均数
[微点练明]
1.(1)√ (2)× (3)×
2.选A 把这组数据按从小到大的顺序排列为10,12,12,14,14,14,17,18,19,23,27,则可知其众数为14,中位数为14.
3.选ABC 把两组数据按从小到大的顺序排列,得甲:8,12,13,20,22,24,25,26,27,37,乙:9,11,13,14,18,19,20,21,21,23,故甲的最大值为37,最小值为8,则极差为29,所以A正确;乙中出现次数最多的数据是21,所以B正确;甲的平均数为=(8+12+13+20+22+24+25+26+27+37)=21.4,所以C正确;甲的中位数为(22+24)=23,所以D不正确.
4.选C 根据频数分布表可知,6+12+18=36<50,所以亩产量的中位数不小于1 050 kg,故A错误;亩产量不低于1 100 kg的频数为24+10=34,所以低于1 100 kg的稻田占比为=66%,故B错误;稻田亩产量的极差最大约为 1 200-900=300,最小约为1 150-950=200,故C正确;由频数分布表可得,100块稻田亩产量的平均值为×(6×925+12×975+18×1 025+30×1 075+24×1 125+10×1 175)=1 067,故D错误.
1.选C 0.005×20×30+0.010×20×50+0.020×20×70+0.015×20×90=68(分).
2.解:(1)众数是频率分布直方图中最高小矩形底边中点的横坐标,所以众数为m=75.0.
前3个小矩形面积和为0.01×10+0.015×10+0.015×10=0.4<0.5,前4个小矩形面积和为0.4+0.03×10=0.7>0.5,所以中位数n=70+≈73.3.
(2)依题意,60及60以上的分数在第三、四、五、六组,频率和为(0.015+0.03+0.025+0.005)×10=0.75,
所以估计这次考试的物理成绩的及格率是75%.
利用组中值估算抽样学生的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.所以估计这次考试物理成绩的平均分是71分.
3.解:(1)由频率分布直方图得(0.005+0.005+a+0.03+a+0.015+0.005)×10=1,解得a=0.02.
(2)由题图,知快递公司人均每日完成快递数量的平均数是30×0.05+40×0.05+50×0.2+60×0.3+70×0.2+80×0.15+90×0.05=62.
方案1日工资为50+62×3=236,
方案2日工资为150+(62-44)×5=240>236.∴骑手应选择方案2.
[典例] 解:(1)根据平均数的计算公式可知,
甲厂数据的平均数是(8+9+9+9+9+11+13+16+17+19)=12;
乙厂数据的平均数是(10+10+12+12+12+13+14+16+18+19)=13.6;
丙厂数据的平均数是(8+8+8+10+11+13+17+19+20+20)=13.4.
甲厂、乙厂、丙厂的众数分别是9,12,8.
甲厂数据的中位数为=10,乙厂数据的中位数为=12.5,丙厂数据的中位数为=12.
(2)甲厂用平均数作为该电子产品的待机时间,乙厂用众数作为该电子产品的待机时间,丙厂用中位数作为该电子产品的待机时间.
(3)我会选乙厂的产品因为乙厂产品的平均数最大,众数最大,中位数最大,所以待机时间更长些,稳定性也较好.
[针对训练]
解:(1)甲群市民年龄的平均数为×(13+13+14+15+15+15+15+16+17+17)=15(岁),
中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.
(2)乙群市民年龄的平均数为(54+3+4+4+5+5+6+6+6+57)=15(岁),
中位数为5.5岁,众数为6岁.
由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.(共47张PPT)
14.4.1
用样本估计总体的集中
趋势参数
(教学方式:基本概念课——逐点理清式教学)
课时目标
1.会求样本数据的众数、中位数、平均数.
2.理解用样本的数字特征、频率分布直方图估计总体的集中趋势.
CONTENTS
目录
1
2
3
逐点清(一) 众数、中位数和平均数
逐点清(二) 频率分布直方图中的
众数、中位数、平均数
逐点清(三) 平均数、中位数、
众数的应用
4
课时跟踪检测
逐点清(一) 众数、中位数和
平均数
01
多维理解
1.平均数
(1)总体均值:一般地,我们把总体中所有数据的______________称为总体的均值,又称总体平均数.它通常可以代表总体的水平.
(2)平均数:_______________称为这n个数据a1,a2,…,an的平均数,一般记为=.
(3)性质:一般地,若取值为x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均数为__________________.
算术平均数
x1p1+x2p2+…+xnpn
2.众数
一般地,我们将一组数据中出现__________的那个数据叫作该组数据的众数.
3.中位数
一般地,将一组数据按照从小到大的顺序排成一列,如果数据的个数为奇数,那么排在_______的数据就是这组数据的中位数;如果数据的个数为偶数,那么,排在正中间的两个数据的_______即为这组数据的中位数.
次数最多
正中间
平均数
微点练明
1.判断正误(正确的画“√”,错误的画“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势. ( )
(2)样本的平均数是频率分布直方图中最高长方形的中点对应的数据. ( )
(3)若改变一组数据中其中的一个数,则这组数据的平均数、中位数、众数都会发生改变. ( )
√
×
√
2.一组样本数据为19,23,12,14,14,17,10,12,18,14,27,则这组数据的众数和中位数分别为 ( )
A.14,14 B.12,14
C.14,15.5 D.12,15.5
解析:把这组数据按从小到大的顺序排列为10,12,12,14,14,14,17,18,
19,23,27,则可知其众数为14,中位数为14.
√
3.(多选)某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个,命中个数如下所示:
甲:20,22,27,8,12,13,37,25,24,26
乙:14,9,13,18,19,20,23,21,21,11
则下面结论正确的是( )
A.甲的极差是29 B.乙的众数是21
C.甲的平均数为21.4 D.甲的中位数是24
√
√
√
解析:把两组数据按从小到大的顺序排列,得甲:8,12,13,20,22,24,25,26,
27,37,乙:9,11,13,14,
18,19,20,21,21,23,故甲的最大值为37,最小值为8,则极差为29,所以A正确;
乙中出现次数最多的数据是21,所以B正确;
甲的平均数为=(8+12+13+20+22+24+25+26+27+37)=21.4,所以C正确;
甲的中位数为(22+24)=23,所以D不正确.
4.(2024·新课标Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理下表:
亩产量 [900, 950) [950, 1 000) [1 000, 1 050) [1 050, 1 100) [1 100, 1 150) [1 150,
1 200]
频数 6 12 18 30 24 10
根据表中数据,下列结论中正确的是 ( )
A.100块稻田亩产量的中位数小于1 050 kg
B.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200 kg至300 kg之间
D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间
√
解析:根据频数分布表可知,6+12+18=36<50,所以亩产量的中位数不小于1 050 kg,故A错误;
亩产量不低于1 100 kg的频数为24+10=34,所以低于1 100 kg的稻田占比为=66%,故B错误;
稻田亩产量的极差最大约为 1 200-900=300,最小约为1 150-950=200,故C正确;
由频数分布表可得,100块稻田亩产量的平均值为×(6×925+12×
975+18×1 025+30×1 075+24×1 125+10×1 175)=1 067,故D错误.
逐点清(二) 频率分布直方图中的
众数、中位数、平均数
02
多维理解
1.单峰频率分布直方图中的平均数与中位数
(1)如果直方图的形状是对称的,那么平均数和中位数应该大体上差不多.
(2)如果直方图在右边“拖尾”,那么平均数大于中位数.
(3)如果直方图在左边“拖尾”,那么平均数小于中位数,也就是说,和中位数相比,平均数总是在“长尾巴”那边.
2.频率分布直方图中众数、中位数、平均数的计算
在频率分布直方图中,众数是最高矩形底边中点的横坐标,中位数左边和右边的直方图的面积应该相等,样本平均数的估计值等于频率分布直方图中每个小矩形底边中点的横坐标与小矩形的面积的乘积之和.
微点练明
1.某班全体学生参加物理测试成绩(单位:分)的频率分布直方图如图所示,则估计该班物理测试的平均成绩是 ( )
A.70分 B.75分 C.68分 D.66分
解析:0.005×20×30+0.010×20×50+0.020×20×70+0.015×20×90=68(分).
√
2.某校从参加高一年级期末考试的学生中抽出60名,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后画出如图所示的频率分布直方图.观察图中的信息,回答下列问题:
(1)估计这次考试的物理成绩的众数m与中位数n(结果保留一位小数);
解:众数是频率分布直方图中最高小矩形底边中点的横坐标,所以众数为m=75.0.
前3个小矩形面积和为0.01×10+0.015×10+0.015×10=0.4<0.5,前4个小矩形面积和为0.4+0.03×10=0.7>0.5,所以中位数n=70+≈73.3.
(2)估计这次考试的物理成绩的及格率(60分及以上为及格)和平均分.
解:依题意,60及60以上的分数在第三、四、五、六组,频率和为(0.015+0.03+0.025+0.005)×10=0.75,所以估计这次考试的物理成绩的及格率是75%.
利用组中值估算抽样学生的平均分为45×0.1+55×0.15+65×0.15+
75×0.3+85×0.25+95×0.05=71.
所以估计这次考试物理成绩的平均分是71分.
3.某快递公司招聘快递骑手,该公司提供了两种日工资方案:方案1:规定每日底薪50元,快递骑手每完成一单业务提成3元;方案2:规定每日底薪150元,快递业务的前44单没有提成,从第45单开始,每完成一单业务提成5元,该快递公司记录了每天骑手的人均业务量.现随机抽取100天的数据,将样本数据分为[25,35),[35,45),[45,55),[55,65),[65,75),[75,85),[85,95]七组,整理得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
解:由频率分布直方图得(0.005+0.005+a+0.03+a+0.015+0.005)×10=1,
解得a=0.02.
(2)若仅从人均日收入的角度考虑,请你利用所学的统计学知识为新聘骑手做出日工资方案的选择,并说明理由.(同组中的每个数据用该组区间的中点值代替)
解:由题图,知快递公司人均每日完成快递数量的平均数是30×0.05+40×
0.05+50×0.2+60×0.3+70×0.2+80×0.15+90×0.05=62.
方案1日工资为50+62×3=236,
方案2日工资为150+(62-44)×5=240>236.
∴骑手应选择方案2.
逐点清(三) 平均数、中位数、
众数的应用
03
[典例] 甲、乙、丙三家电子厂商在广告中都声称,他们的某型电子产品在正常情况下的待机时间都是12 h,质量检测部门对这三家销售产品的待机时间进行了抽样调查,统计结果(单位:h)如下:
甲:8,9,9,9,9,11,13,16,17,19;
乙:10,10,12,12,12,13,14,16,18,19;
丙:8,8,8,10,11,13,17,19,20,20.
(1)分别求出以上三组数据的平均数、众数、中位数;
解:根据平均数的计算公式可知,
甲厂数据的平均数是(8+9+9+9+9+11+13+16+17+19)=12;
乙厂数据的平均数是(10+10+12+12+12+13+14+16+18+19)=13.6;
丙厂数据的平均数是(8+8+8+10+11+13+17+19+20+20)=13.4.
甲厂、乙厂、丙厂的众数分别是9,12,8.
甲厂数据的中位数为=10,乙厂数据的中位数为=12.5,
丙厂数据的中位数为=12.
(2)这三个厂商的推销广告分别利用了上述哪一种数据来表示待机时间
解:甲厂用平均数作为该电子产品的待机时间,乙厂用众数作为该电子产品的待机时间,丙厂用中位数作为该电子产品的待机时间.
(3)如果你是顾客,宜选择哪个厂商的产品 为什么
解:我会选乙厂的产品因为乙厂产品的平均数最大,众数最大,中位数最大,所以待机时间更长些,稳定性也较好.
|思|维|建|模|
利用样本数字特征进行决策时的两个关注点
(1)平均数与每一个数据都有关,可以反映更多的总体信息,但受极端值的影响大;中位数是样本数据所占频率的等分线,不受几个极端值的影响;众数只能体现数据的最大集中点,无法客观反映总体特征.
(2)当平均数大于中位数时,说明数据中存在许多较大的极端值.
针对训练
某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):
甲群:13,13,14,15,15,15,15,16,17,17;
乙群:54,3,4,4,5,5,6,6,6,57.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁
其中哪个统计量能较好地反映甲群市民的年龄特征
解:甲群市民年龄的平均数为×(13+13+14+15+15+15+15+16+17+17)=15(岁),
中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.
(2)乙群市民年龄的平均数、中位数和众数各是多少岁
其中哪个统计量能较好地反映乙群市民的年龄特征
解:乙群市民年龄的平均数为(54+3+4+4+5+5+6+6+6+57)=15(岁),
中位数为5.5岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.
课时跟踪检测
04
1
3
4
5
6
7
8
9
10
11
12
13
2
1.(多选)在一次体育测试中,某班的6名同学的成绩(单位:分)分别为66,83,87,83,77,96.关于这组数据,下列说法正确的是 ( )
A.众数是83 B.中位数是83
C.极差是30 D.平均数是83
解析:由于83出现的次数最多,所以众数是83,故A正确;
把数据按从小到大的顺序排列为66,77,83,83,87,96,中间两个数为83,83,所以中位数是83,故B正确;
极差是96-66=30,故C正确;
平均数为(66+83+87+83+77+96)÷6=82,故D错误.
√
√
√
1
5
6
7
8
9
10
11
12
13
2
3
4
2.如果5个数x1,x2,x3,x4,x5的平均数是7,那么x1+1,x2+1,x3+1,
x4+1,x5+1这5个数的平均数是 ( )
A.5 B.6 C.7 D.8
解析:法一:定义法 依题意x1+x2+…+x5=35,所以(x1+1)+(x2+1)+…+
(x5+1)=40,故所求平均数为=8.
法二:性质法 显然新数据(记为yi)与原有数据的关系为yi=xi+1(i=1,2,3,4,5),故新数据的平均数为+1=8.
√
1
5
6
7
8
9
10
11
12
13
3
4
2
3.某班50名学生的一次安全知识竞赛成绩分布如表所示:(满分10分)
成绩(分) 0 1 2 3 4 5 6 7 8 9 10
人数(人) 0 0 0 1 0 1 3 5 6 19 15
这次安全知识竞赛成绩的众数是 ( )
A.5分 B.6分 C.9分 D.10分
解析:根据众数是一组数据中出现次数最多的数进行判断,由题表中数据可知成绩9分出现了19次,最多,所以众数是9分.故选C.
√
1
5
6
7
8
9
10
11
12
13
3
4
2
4.某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数为 ( )
A.20 B.25 C.22.5 D.22.75
解析:设中位数为x,则0.1+0.2+0.08×(x-20)=0.5,解得x=22.5.
√
1
5
6
7
8
9
10
11
12
13
3
4
2
5.箱子中共有40个网球(质量不完全相同),其平均质量为M,如果把M当成一个网球的质量,与原来的40个网球一起,算出这41个网球的平均质量为N,那么为( )
A. B.1 C. D.2
解析:设40个网球的质量分别为xi(i=1,2,…,40),则M=,
N==M,故=1.
√
1
5
6
7
8
9
10
11
12
13
3
4
2
6.(多选)在某次高中学科竞赛中,4 000名考生的参赛成绩统计如图所示,
60分以下视为不及格,若同一组中的数据用该组区间中点值为代表,
则下列说法正确的是 ( )
A.成绩在[70,80)分的考生人数最多
B.不及格的考生人数为1 000
C.考生竞赛成绩的平均分约为70.5分
D.考生竞赛成绩的中位数为75分
√
√
√
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:由频率分布直方图可得,成绩在[70,80)内的频率最高,因此考生人数最多,故A正确;
由频率分布直方图可得,成绩在[40,60)内的频率为0.25,因此,不及格的人数为4 000×0.25=1 000,故B正确;
由频率分布直方图可得,平均分为45×0.1+55×0.15+65×0.2+75×0.3+
85×0.15+95×0.1=70.5,故C正确;
因为成绩在[40,70)内的频率为0.45,[70,80)内的频率为0.3,所以中位数为70+10×≈71.67,故D错误.
1
5
6
7
8
9
10
11
12
13
3
4
2
7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为me,众数为m0,平均数为,则( )
A.me=m0= B.m0<C.me√
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,
10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即me=5.5,5出现的次数最多,故众数为m0=5,平均数为=×(2×3+3×4+10×5+6×6+3×
7+2×8+2×9+2×10)≈5.97,故m01
5
6
7
8
9
10
11
12
13
3
4
2
8.在一场跳水比赛中,7位裁判给某选手打分从低到高依次为x1,8.1,
8.4,8.5,9.0,9.5,x7(x7≤10),若去掉一个最高分x7和一个最低分x1后的平均分与不去掉的平均分相同,那么最低分x1的值不可能是 ( )
A.7.7 B.7.8
C.7.9 D.8.0
√
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:因为去掉最高分与最低分后平均分为(8.1+8.4+8.5+9.0+9.5)=8.7,
所以(x1+8.1+8.4+8.5+9.0+9.5+x2)=8.7.解得=8.7,由于得分按照从低到高的顺序排列,故x1≤8.1,9.5≤x2≤10,当x1=7.7时,x2=9.7,满足上述条件,故A错误;
当x1=7.8时,x2=9.6,满足上述条件,故B错误;
当x1=7.9时,x2=9.5,满足上述条件,故C错误;
当x1=8.0时,x2=9.4,不满足上述条件,故D正确.
1
5
6
7
8
9
10
11
12
13
3
4
2
9.已知样本数据x1,x2,…,x10,其中x1,x2,x3的平均数为a,而x4,x5,x6,
…,x10的平均数为b,则样本数据的平均数为 .
解析:前3个数据的和为3a,后7个数据的和为7b,样本平均数为10个数据的和除以10.
1
5
6
7
8
9
10
11
12
13
3
4
2
10.已知甲、乙两组数据按从小到大排列后如下所示:
甲:27,m,39;乙:n,32,34,38.
若这两组数据的中位数相同,平均数也相同,则= .
解析:因为两组数据的中位数相同,所以m=(32+34)=33.由于两组数据的平均数相同,所以(27+33+39)=(n+32+34+38).解得n=28,故=.
1
5
6
7
8
9
10
11
12
13
3
4
2
11.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的众数、中位数的估计值分别为 .
解析:∵最高的矩形为第三个矩形,
∴时速的众数的估计值为65.
前两个矩形的面积和为(0.01+0.03)×10=0.4.
∵0.5-0.4=0.1,×10=2.5,
∴中位数的估计值为60+2.5=62.5.
65,62.5
1
5
6
7
8
9
10
11
12
13
3
4
2
12.(12分)某公司的33名职工的季度奖金(单位:元)如下表所示:
人数 1 1 2 1 5 3 20
季度奖金 5 500 5 000 3 500 3 000 2 500 2 000 1 500
(1)求该公司职工季度奖金的平均数、中位数、众数(精确到整数);
解:平均数是=1 500+×(4 000+3 500+2 000×2+1 500+1 000×5+
500×3+0×20)≈1 500+591=2 091(元),
中位数是1 500元,众数是1 500元.
1
5
6
7
8
9
10
11
12
13
3
4
2
(2)假设将表中的5 000元提升到20 000元,5 500元提升到30 000元,求新的平均数、中位数、众数(精确到整数);
解:新的平均数是
'=1 500+×(28 500+18 500+2 000×2+1 500+1 000×5+500×3+
0×20)≈1 500+1 788=3 288(元),中位数是1 500元,众数是1 500元.
1
5
6
7
8
9
10
11
12
13
3
4
2
(3)你认为哪个统计量更能反映该公司员工的季度奖金情况,结合此问题谈一谈你的看法.
解:中位数或众数均能反映该公司员工的季度奖金情况.
因为公司中少数人的季度奖金与大多数人的季度奖金差别较大,导致平均数与中位数、众数偏差较大,所以平均数不能反映该公司员工的季度奖金情况.
1
5
6
7
8
9
10
11
12
13
3
4
2
13.(13分)随着移动互联网的发展,与餐饮美食相关的手机软件层出不穷.现从某市使用A和B两款订餐软件的商家中分别随机抽取100个商家,
对它们的“平均送达时间”进行统计,得到频率分布直方图如下.
(1)试估计该市使用A款订餐软件的商家的“平均送达时间”的众数及平均数;
(同一组中的数据用该组区间的中点值代表)
1
5
6
7
8
9
10
11
12
13
3
4
2
解:依题意得,使用A款订餐软件的商家中“平均送达时间”的众数为55,平均数为15×0.06+25×0.34+35×0.12+45×0.04+55×0.4+65×0.04=40.
(2)如果以“平均送达时间”的平均数作为决策依据,从A和B两款订餐软件中选择一款订餐,你会选择哪款
解:使用B款订餐软件的商家中“平均送达时间”的平均数为15×0.04+25×
0.2+35×0.56+45×0.14+55×0.04+65×0.02=35<40,所以选B款订餐软件.课时跟踪检测(五十二) 用样本估计总体的离散程度参数
(满分90分,A级选填小题每题5分,B级选填小题每题6分)
A级——达标评价
1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 ( )
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
2.某高三学生在连续五次月考中的数学成绩(单位:分)为90,90,93,94,93,则该学生在这五次月考中数学成绩数据的平均数和方差分别为 ( )
A.92,2.8 B.92,2
C.93,2 D.93,2.8
3.(多选)甲、乙两班举行电脑汉字录入比赛,参赛学生每分钟录入汉字的个数经统计计算后填入下表:
班级 参加人数 中位数 方差 平均数
甲 55 149 191 135
乙 55 151 110 135
某同学根据表中数据分析得出的结论正确的是 ( )
A.甲、乙两班学生成绩的平均数相同
B.甲班的成绩波动比乙班的成绩波动大
C.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150为优秀)
D.甲班成绩的众数小于乙班成绩的众数
4.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是 ( )
A.57.2,3.6 B.57.2,56.4
C.62.8,63.6 D.62.8,3.6
5.在高一期中考试中,甲、乙两个班的数学成绩统计如下表:
班级 人数 平均分数 方差
甲 20 2
乙 30 3
其中=,则两个班数学成绩的方差为 ( )
A.3 B.2
C.2.6 D.2.5
6.国家射击队要从甲、乙、丙、丁四名队员中选出一名选手去参加射击比赛,四人的平均成绩和方差如下表:
甲 乙 丙 丁
平均成绩 8.5 8.8 8.8 8
方差s2 3.5 3.5 2.1 8.7
则应派 参赛最为合适.
7.已知总体的各个个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,21,且总体的中位数为10,若要使该总体的方差最小,则ab= .
8.高三学生李丽在一年的五次数学模拟考试中的成绩(单位:分)为x,y,105,109,110.已知该同学五次数学成绩数据的平均数为108,方差为35.2,则|x-y|的值为 .
9.(8分)某超市从一家食品有限公司购进一批茶叶,每罐茶叶的标准质量是125 g,为了解该批茶叶的质量情况,从中随机抽取20罐,称得各罐质量(单位:g)如下:
124.9,124.7,126.2,124.9,124.2,124.9,123.7,121.4,126.4,127.7,121.9,124.4,125.2,123.7,122.7,124.2,
126.2,125.2,122.2,125.4.
求:20罐茶叶的平均质量和标准差s.(精确到0.01)
10.(10分)某教育集团为了办好人民满意的教育,每年底都随机邀请8名学生家长代表对集团内甲、乙两所学校进行人民满意度的民主测评(满意度最高分120分,最低分0分,分数越高说明人民满意度越高,分数越低说明人民满意度越低).去年测评的结果(单位:分)如下
甲校:96,112,97,108,100,103,86,98;
乙校:108,101,94,105,96,93,97,106.
(1)分别计算甲、乙两所学校去年人民满意度测评数据的平均数、中位数;
(2)分别计算甲、乙两所学校去年人民满意度测评数据的方差.
B级——重点培优
11.(多选)某学校共有学生2 000人,其中高一800人,高二、高三各600人,学校对学生在暑假中每天的读书时间做了调查统计,全体学生每天的读书时间的平均数为= 3小时,方差为s2= 2.003,其中高一学生、高二学生每天读书时间的平均数分别为=2.6,=3.2,又已知三个年级学生每天读书时间的方差分别为=1,
=2,=3,则高三学生每天读书时间的平均数可能是 ( )
A.3.2 B.3.3
C.2.7 D.4.5
12.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为和,样本标准差分别为sA和sB,则 ( )
A.>,sA>sB B.<,sA>sB
C.>,sA13.(多选)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则 ( )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
14.(14分)我国是世界上严重缺水的国家之一,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100户居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)用每组区间的中点作为每组用水量的平均值,这9组居民每人的月均用水量前4组的方差都为0.3,
后5组的方差都为0.4,求这100户居民月均用水量的方差.
课时跟踪检测(五十二)
1.选B 标准差能反映一组数据的稳定程度.故选B.
2.选A 该学生在这五次月考中数学成绩数据的平均数为=×(90+90+93+94+93)=92,方差为s2=×[(90-92)2+(90-92)2+(93-92)2+(94-92)2+(93-92)2]=2.8.故选A.
3.选ABC 甲、乙两班学生成绩的平均数都是135,故两班成绩的平均数相同,所以A正确;s=191>110=s,所以甲班成绩不如乙班稳定,即甲班的成绩波动较大,所以B正确;甲、乙两班人数相同,但甲班的中位数为149,乙班的中位数为151,从而易知乙班每分钟输入汉字数不少于150个的人数要多于甲班,所以C正确;由题表看不出两班学生成绩的众数,所以D错误.
4.选D 每一个数据都加上60,所得新数据的平均数增加60,而方差保持不变.
5.选C 由题意可知两个班的数学成绩平均数为=甲=乙,则两个班数学成绩的方差为s2=×[2+(甲-)2]+×[3+(乙-)2]=×2+×3=2.6.
6.解析:由题表可知,丙的平均成绩较高,且发挥比较稳定,应派丙去参赛最合适.
答案:丙
7.解析:由题意得a+b=10×2=20,要使该总体的方差最小,方差化简后即满足(a-10)2+(b-10)2最小,故a=b=10,ab=100.
答案:100
8.解析:由题意得,(x+y+105+109+110)=108, ①
[(x-108)2+(y-108)2+9+1+4]=35.2, ②
由①②解得或
所以|x-y|=18.
答案:18
9.解:=×(124.9+124.7+126.2+124.9+…+125.2+122.2+125.4)=≈124.51,
标准差为s=
=≈1.55.
10.解:(1)甲学校人民满意度的平均数为甲=(96+112+97+108+100+103+86+98)=100,
甲校:86,96,97,98,100,103,108,112,
甲学校人民满意度的中位数为=99;
乙学校人民满意度的平均数为乙=(108+101+94+105+96+93+97+106)=100,
乙校:93,94,96,97,101,105,106,108,
乙学校人民满意度的中位数为=99.
(2)甲学校人民满意度的方差为s=(42+122+32+82+02+32+142+22)=55.25,
乙学校人民满意度的方差为s=(82+12+62+52+42+72+32+62)=29.5.
11.选BC 由题意可得2.003=[1+(3-2.6)2]+[2+(3-3.2)2]+[3+(3-3)2],解得3=3.3或2.7.
12.选B 由题图知,A组的6个数分别为2.5,10,5,7.5,2.5,10;B组的6个数分别为15,10,12.5,10,12.5,10,所以A=×(2.5+10+5+7.5+2.5+10)=,B=×(15+10+12.5+10+12.5+10)=.显然A≈3.15,sB=
≈1.86,显然sA>sB.
13.选BD 取x1=1,x2=x3=x4=x5=2,x6=9,则x2,x3,x4,x5的平均数等于2,标准差为0,x1,x2,…,x6的平均数等于3,标准差为,故A、C均不正确;根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x2,x3,x4,x5的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x1,x2,…,x6的中位数相等,故B正确;根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D正确.故选BD.
14.解:(1)由频率分布直方图可知,月均用水量在[0,0.5)内的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]内的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.
由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=2a×0.5,解得a=0.30.
(2)由题意可知,这9组月均用水量的平均数依次是1=0.25,2=0.75,3=1.25,4=1.75,5=2.25,6=2.75,7=3.25,8=3.75,9=4.25,
这100户居民的月均用水量为=0.04×0.25+0.08×0.75+0.15×1.25+0.21×1.75+0.25×2.25+0.15×2.75+0.06×3.25+0.04×3.75+0.02×4.25=2.03,
则这100户居民月均用水量的方差为
s2=0.04×[0.3+(0.25-2.03)2]+0.08×[0.3+(0.75-2.03)2]+0.15×[0.3+(1.25-2.03)2]+0.21×[0.3+(1.75-2.03)2]+0.25×[0.4+(2.25-2.03)2]+0.15×[0.4+(2.75-2.03)2]+0.06×[0.4+(3.25-2.03)2]+0.04×[0.4+(3.75-2.03)2]+0.02×[0.4+(4.25-2.03)2]=1.113 6.