[A 基础达标]
1.(2019·四川省宜宾市教学质量监测)在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减8后所得的数据,则A、B两样本的下列数字特征对应相同的是( )
A.平均数 B.标准差
C.众数 D.中位数
解析:选B.A样本数据为42,43,46,52,42,50,其平均数为=,众数为42,中位数为=,由题可得,B样本数据为34,35,38,44,34,42,其平均数为=,众数为34,中位数为=,所以A、B两样本的下列数字特征:平均数,众数,中位数都不同.故选B.
2.如图是一次考试成绩的统计图,根据该图可估计,这次考试的平均分数为( )
A.46 B.36
C.56 D.60
解析:选A.根据题中统计图,可估计有4人成绩在[0,20)之间,其考试分数之和为4×10=40;有8人成绩在[20,40)之间,其考试分数之和为8×30=240;有10人成绩在[40,60)之间,其考试分数之和为10×50=500;有6人成绩在[60,80)之间,其考试分数之和为6×70=420;有2人成绩在[80,100)之间,其考试分数之和为2×90=180,由此可知,考生总人数为4+8+10+6+2=30,考试总成绩为40+240+500+420+180=1 380,平均数为=46.
3.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
解析:选C.由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A错;甲、乙的成绩的中位数分别为6,5,B错;甲、乙的成绩的方差分别为×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=,C对;甲、乙的成绩的极差均为4,D错.
4.(2019·河南省信阳高级中学期末考试)某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( )
A.70和50 B.70和67
C.75和50 D.75和67
解析:选B.设更正前甲、乙、……的成绩依次为a1,a2,…,a50,
则a1+a2+…+a50=50×70,即60+90+a3+…+a50=50×70,
(a1-70)2+(a2-70)2+…+(a50-70)2=50×75,
即102+202+(a3-70)2+…+(a50-70)2=50×75,
更正后平均分为=×(80+70+a3+…+a50)=70;
方差为s2=×[(80-70)2+(70-70)2+(a3-70)2+…+(a50-70)2]
=×[100+(a3-70)2+…+(a50-70)2]=×[100+50×75-102-202]=67.
故选B.
5.(2019·江西省上饶市期末统考)甲、乙两人在相同的条件下投篮5轮,每轮甲、乙各投篮10次,投篮命中次数的情况如图所示(实线为甲的折线图,虚线为乙的折线图),则以下说法错误的是( )
A.甲投篮命中次数的众数比乙的小
B.甲投篮命中次数的平均数比乙的小
C.甲投篮命中次数的中位数比乙的大
D.甲投篮命中的成绩比乙的稳定
解析:选B.由折线图可知,甲投篮5轮,命中的次数分别为5,8,6,8,8,
乙投篮5轮,命中的次数分别为3,7,9,5,9,
则甲投篮命中次数的众数为8,乙投篮命中次数的众数为9,所以A正确;
甲投篮命中次数的平均数为7,乙投篮命中次数的平均数为6.6,所以B不正确;
甲投篮命中次数的中位数为8,乙投篮命中次数的中位数为7,所以C正确;
甲投篮命中次数的数据集中在平均数的左右,方差较小,乙投篮命中次数的数据比较分散,方差较大,所以甲的成绩更稳定一些,所以D正确.
故选B.
6.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:
甲
乙
丙
丁
平均环数
8.3
8.8
8.8
8.7
方差s2
3.5
3.6
2.2
5.4
若要从这四人中选择一人去参加该运动会射击项目的比赛,最佳人选是________.(填“甲”“乙”“丙”“丁”中的一个)
解析:分析表格数据可知,乙与丙的平均环数最多,又丙的方差比乙小,说明丙成绩发挥得较为稳定,所以最佳人选为丙.
答案:丙
7.(2019·陕西省西安市长安区第一中学期末考试)一组数据的平均数是28,方差是4,若将这组数据中的每一个数据都加上20,得到一组新数据,则所得新数据的平均数是________,方差是________.
解析:设该组数据为x1,x2,…,xn;则新数据为x1+20,x2+20,…,xn+20;
因为==28,
所以==20+28=48.
因为s2=[(x1-)2+(x2-)2+…+(xn-)2],
所以s′2=[(x1+20-(+20))2+(x2+20-(+20))2+…+(xn+20-(+20))2]=s2=4.
答案:48 4
8.(2019·湖北省华中师范大学第一附属中学期末考试)样本中共有五个个体,其值分别为a,0,1,2,3,若该样本平均数为1,则样本方差为________.
解析:因为样本的平均数为1,所以×(a+0+1+2+3)=1,解得a=-1.
所以样本的方差为
×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.
答案:2
9.甲、乙两种冬小麦实验品种连续5年的平均单位面积产量如下(单位:t/km2):
第1年
第2年
第3年
第4年
第5年
甲
9.8
9.9
10.1
10
10.2
乙
9.4
10.3
10.8
9.7
9.8
若某村要从中引进一种冬小麦大量种植,给出你的建议.
解:由题意得甲=乙=10.
s=×[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]=0.02,
s=×[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244,
甲、乙两种冬小麦的平均产量都等于10,且s<s,所以产量比较稳定的为甲种冬小麦,推荐引进甲种冬小麦大量种植.
10.(2019·高考全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
解:(1)由已知得0.70=a+0.20+0.15,故
a=0.35.
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
[B 能力提升]
11.(2019·湖南省张家界市期末联考)某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9(x,y∈N),已知这组数据的平均数为10,方差为2,则|x-y|的值为( )
A.4 B.3
C.2 D.1
解析:选A.由这组数据的平均数为10,方差为2可得x+y=20,(x-10)2+(y-10)2=8,因为不要直接求出x、y,只要求出|x-y|,设x=10+t,y=10-t,由(x-10)2+(y-10)2=8得t2=4;所以|x-y|=2|t|=4.故选A.
12.某市有15个旅游景点,经计算,黄金周期间各个景点的旅游人数平均为20万,标准差为s,后来经核实,发现甲、乙两处景点统计的人数有误,甲景点实际为20万,被误统计为15万,乙景点实际为18万, 被误统计成23万;更正后重新计算,得到标准差为s1,则s与s1的大小关系为( )
A.s=s1 B.s<s1
C.s>s1 D.不能确定
解析:选C.由已知,两次统计所得的旅游人数总数没有变,即两次统计的各景点旅游人数的平均数是相同的,设为,
则s=
,
s1=
.
若比较s与s1的大小,只需比较(15-)2+(23-)2与(20-)2+(18-)2的大小即可.而(15-)2+(23-)2=754-76+22,(20-)2+(18-)2=724-76+22,所以(15-)2+(23-)2>(20-)2+(18-)2.从而s>s1.
13.五个数1,2,3,4,a的平均数是3,则a=________,这五个数的标准差是________.
解析:由=3,得a=5;
由s2=[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2,得标准差s=.
答案:5
14.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
质量指标
值分组
[75,85)
[85,95)
[95,105)
[105,115)
[115,125]
频数
6
26
38
22
8
(1)根据上表作出这些数据的频率分布直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?
解:(1)产品质量指标的频率分布直方图如图.
(2)质量指标值的样本平均数为80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.
质量指标值的样本方差为s2=(80-100)2×0.06+(90-100)2×0.26+(100-100)2×0.38+(110-100)2×0.22+(120-100)2×0.08=104.
所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.
(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.
[C 拓展探究]
15.为提倡节能减排,同时减轻居民负担,广州市积极推进“一户一表”工程.非一户一表用户电费采用“合表电价”收费标准:0.65元/度.“一户一表”用户电费采用阶梯电价收取,其11月到次年4月起执行非夏季标准如下:
第一档
第二档
第三档
每户每月用电量
(单位:度)
[0,200]
(200,400]
(400,+∞)
电价(单位:元/度)
0.61
0.66
0.91
例如:某用户11月用电410度,采用合表电价收费标准,应交电费410×0.65=266.5(元),若采用阶梯电价收费标准,应交电费200×0.61+(400-200)×0.66+(410-400)×0.91=263.1(元).
为调查阶梯电价是否能取到“减轻居民负担”的效果,随机调查了该市100户居民的11月用电量,工作人员已经将90户的月用电量填在下面的频率分布表中,最后10户的月用电量(单位:度)为88、268、370、140、440、420、520、320、230、380.
组别
月用电量
频数统计
频数
频率
①
[0,100]
②
(100,200]
③
(200,300]
④
(300,400]
⑤
(400,500]
⑥
(500,600]
合计
(1)完成频率分布表,并绘制频率分布直方图;
(2)根据已有信息,试估计全市住户11月的平均用电量(同一组数据用该区间的中点值作代表);
(3)设某用户11月用电量为x度(x∈N),按照合表电价收费标准应交y1元,按照阶梯电价收费标准应交y2元,请用x表示y1和y2,并求当y2≤y1时,x的最大值,同时根据频率分布直方图估计“阶梯电价”能否给不低于75%的用户带来实惠?
解:(1)频率分布表如下:
组别
月用电量
频数统计
频数
频率
①
[0,100]
4
0.04
②
(100,200]
12
0.12
③
(200,300]
24
0.24
④
(300,400]
30
0.30
⑤
(400,500]
26
0.26
⑥
(500,600]
4
0.04
合计
100
1
频率分布直方图如图:
(2)该100户用户11月的平均用电量
=50×0.04+150×0.12+250×0.24+350×0.3+450×0.26+550×0.04=324(度),
所以估计全市住户11月的平均用电量为324度.
(3)y1=0.65x,
y2=.
由y2≤y1得或
或,
解得x≤≈423.1.
因为x∈N,故x的最大值为423.
根据频率分布直方图,x≤423时的频率为0.04+0.12+0.24+0.3+23×0.002 6=0.759 8>0.75,
故估计“阶梯电价”能给不低于75%的用户带来实惠.
课件42张PPT。第九章 统 计第九章 统 计问题导学平均数中位数平均数中位数长尾巴出现次数最多×√×√本部分内容讲解结束按ESC键退出全屏播放9.3 统计案例 公司员工的肥胖情况调查分析
考点
学习目标
核心素养
众数、中位数、平均数、标准差、方差
会求样本的众数、中位数、平均数、标准差、方差
数学抽象
总体集中趋势的估计
会用众数、中位数、平均数估计总体集中趋势
数据分析
总体离散程度的估计
会用标准差、方差估计总体离散程度
数据分析
问题导学
预习教材P203-P213的内容,思考以下问题:
1.平均数、中位数、众数各有什么应用?有什么优缺点?
2.平均数、中位数与频率分布直方图有什么关系?
3.方差和标准差有什么区别和联系?其作用是什么?
1.平均数和中位数的特点
(1)样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变.
(2)中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变.
(3)与中位数相比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.
2.中位数、平均数与频率分布直方图的关系
一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的(图(1)),那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”(图(2)),那么平均数大于中位数;如果直方图在左边“拖尾”(图(3)),那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.
3.众数的特点
众数只利用了出现次数最多的那个值的信息.众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少一部分,对极端值也不敏感.
■名师点拨
一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
?
4.总体方差与总体标准差
如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称S2=__(Yi-)2为总体方差,S=为总体标准差.与总体均值类似,总体方差也可以写成加权的形式.如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=fi(Yi-)2.
5.样本方差与样本标准差
如果一个样本中个体的变量值分别为y1,y2,…yn,样本平均数为,则称s2= (yi-)2为样本方差,s=为样本标准差.
■名师点拨
(1)若x1,x2,x3,…,xn的平均数为,方差为s2那么ax1+b,ax2+b,ax3+b,…,axn+b的平均数为′=a+b;方差s′2=a2s2.
(2)标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.显然,在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.
?
判断(正确的打“√”,错误的打“×”)
(1)数据5,4,4,3,5,2的众数为4.( )
(2)数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半.( )
(3)方差与标准差具有相同的单位.( )
(4)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.( )
解析:(1)中的众数应为4和5;(2)正确;(3)二者单位不一致;(4)正确,平均数也应减去该常数,方差不变.
答案:(1)× (2)√ (3)× (4)√
为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
解析:选B.标准差能反映一组数据的稳定程度.故选B.
下列说法中正确的个数为( )
①数据的极差越小,样本数据分布越集中、稳定;
②数据的平均数越小,样本数据分布越集中、稳定;
③数据的标准差越小,样本数据分布越集中、稳定;
④数据的方差越小,样本数据分布越集中、稳定.
A.1 B.2
C.3 D.4
解析:选C.由数据的极差、标准差、方差的定义可知,它们都可以影响样本数据的分布和稳定性,而数据的平均数则与之无关,故②不正确,①③④正确.
已知五个数据3,5,7,4,6,则该样本的标准差为________.
解析:因为=×(3+5+7+4+6)=5,
所以s= =.
答案:
众数、中位数、平均数的计算及应用
某工厂人员及月工资构成如下:
人员
经理
管理
人员
高级
技工
工人
学徒
合计
月工
资(元)
22 000
2 500
2 200
2 000
1 000
29 700
人数
1
6
5
10
1
23
合计
22 000
15 000
11 000
20 000
1 000
69 000
(1)指出这个表格中的众数、中位数、平均数;
(2)这个表格中,平均数能客观地反映该工厂的月工资水平吗?为什么?
【解】 (1)由表格可知,众数为2 000元.
把23个数据按从小到大(或从大到小)的顺序排列,排在中间的数应是第12个数,其值为2 200,故中位数为2 200元.
平均数为(22 000+15 000+11 000+20 000+1 000)÷23=69 000÷23=3 000(元).
(2)虽然平均数为3 000元/月,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.
(1)如果样本平均数大于样本中位数,说明数据中存在较大的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中的极端数据信息,帮助我们作出决策.
(2)众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各个数据的重心.
(2019·四川省宜宾市教学质量监测)某校高二年级学生身体素质考核成绩(单位:分)的频率分布直方图如图所示:
(1)求频率分布直方图中a的值;
(2)根据频率分布直方图估计成绩的众数和平均数.
解:(1)因为10(2a+3a+6a+7a+2a)=1,
所以a=0.005.
(2)由图可知众数的估计值为75,
平均数的估计值=55×0.1+65×0.15+75×0.35+85×0.3+95×0.1=76.5.
利用频率分布直方图求众数、中位数、平均数
从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.
由于一些数据丢失,试利用频率分布直方图求:
(1)这50名学生成绩的众数与中位数;
(2)这50名学生的平均成绩.
【解】 (1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为75.
由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将所有小矩形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标所对应的成绩即为所求.
因为0.004×10+0.006×10+0.02×10
=0.04+0.06+0.2=0.3,
所以前三个小矩形面积的和为0.3.而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,
所以中位数应位于第四个小矩形内.
设其底边为x,高为0.03,所以令0.03x=0.2,得x≈6.7,
故中位数应约为70+6.7=76.7.
(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,即每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.
所以平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.024×10)+95×(0.016×10)=76.2.
频率分布直方图的数字特征
(1)众数:众数一般用频率分布表中频率最高的一组的组中值来显示,即在样本数据的频率分布直方图中,最高矩形的底边中点的横坐标;
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;
(3)平均数:平均数在频率分布表中等于组中值与对应频率之积的和.
为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则:
(1)这20名工人中一天生产该产品数量在[55,75)的人数是______;
(2)这20名工人中一天生产该产品数量的中位数为______;
(3)这20名工人中一天生产该产品数量的平均数为______;
解析:(1)在[55,75)的人数为(0.040×10+0.025×10)×20=13.
(2)设中位数为x,则0.2+(x-55)×0.04=0.5,x=62.5.
(3)0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64.
答案:(1)13 (2)62.5 (3)64
标准差、方差的计算及应用
甲、乙两机床同时加工直径为100 cm的零件,为检验质量,从中抽取6件测量数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算说明哪台机床加工零件的质量更稳定.
【解】 (1)甲=×(99+100+98+100+100+103)=100,
乙=×(99+100+102+99+100+100)=100,
s=×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
s=×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)由(1)知甲=乙,比较它们的方差,因为s>s,故乙机床加工零件的质量更稳定.
用样本的标准差、方差估计总体的方法
(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.
(2)标准差、方差的取值范围是[0,+∞).
(3)因为标准差与原始数据的单位相同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.
1.样本数为9的四组数据,它们的平均数都是5,条形图如图所示,则标准差最大的一组是( )
A.第一组 B.第二组
C.第三组 D.第四组
解析:选D.法一:第一组中,样本数据都为5,标准差为0;第二组中,样本数据为4,4,4,5,5,5,6,6,6,标准差为;第三组中,样本数据为3,3,4,4,5,6,6,7,7,标准差为;第四组中,样本数据为2,2,2,2,5,8,8,8,8,标准差为2,故标准差最大的一组是第四组.
法二:从四个图形可以直观看出第一组数据没有波动性,第二、三组数据的波动性都比较小,而第四组数据的波动性相对较大,利用标准差的意义可以直观得到答案.
2.(2019·高考全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企
业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的分组
[-0.20,0)
[0,0.20)
[0.20,0.40)
[0.40,0.60)
[0.60,0.80)
企业数
2
24
53
14
7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:≈8.602.
解:(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.
产值负增长的企业频率为=0.02.
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2) =(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,
s2=i(yi-)2
=[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]
=0.029 6,
s==0.02×≈0.17.
所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.
1.一组数据的方差一定是( )
A.正数 B.负数
C.任意实数 D.非负数
解析:选D.方差可为0和正数.
2.对于数据3,3,2,3,6,3,10,3,6,3,2,有下列结论:
①这组数据的众数是3;
②这组数据的众数与中位数的数值不相等;
③这组数据的中位数与平均数的数值相等;
④这组数据的平均数与众数的数值相等.
其中正确的结论的个数为( )
A.1 B.2
C.3 D.4
解析:选A.在这11个数中,数3出现了6次,频率最高,故众数是3;将这11个数按从小到大顺序排列得2,2,3,3,3,3,3,3,6,6,10,中间数据是3,故中位数是3;而平均数==4.故只有①正确.
3.(2019·河北省石家庄市期末考试)某校100名高二学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)图中a的值为________;
(2)根据频率分布直方图,估计这100名学生语文成绩的平均分为________.
解析:(1)依题意,得10×(2×0.005+a+0.03+0.04)=1,
解得a=0.02.
(2)这100名学生语文成绩的平均分为
55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73(分).
答案:(1)0.02 (2)73分
4.甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.
(1)分别求出两人得分的平均数与方差;
(2)根据图和(1)中的计算结果,对两人的训练成绩作出评价.
解:(1)由图可得甲、乙两人五次测试的成绩分别为
甲:10,13,12,14,16;
乙:13,14,12,12,14.
甲==13,
乙==13,
s=×[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
s=×[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
(2)由s>s可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
[A 基础达标]
1.(2019·四川省宜宾市教学质量监测)在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减8后所得的数据,则A、B两样本的下列数字特征对应相同的是( )
A.平均数 B.标准差
C.众数 D.中位数
解析:选B.A样本数据为42,43,46,52,42,50,其平均数为=,众数为42,中位数为=,由题可得,B样本数据为34,35,38,44,34,42,其平均数为=,众数为34,中位数为=,所以A、B两样本的下列数字特征:平均数,众数,中位数都不同.故选B.
2.如图是一次考试成绩的统计图,根据该图可估计,这次考试的平均分数为( )
A.46 B.36
C.56 D.60
解析:选A.根据题中统计图,可估计有4人成绩在[0,20)之间,其考试分数之和为4×10=40;有8人成绩在[20,40)之间,其考试分数之和为8×30=240;有10人成绩在[40,60)之间,其考试分数之和为10×50=500;有6人成绩在[60,80)之间,其考试分数之和为6×70=420;有2人成绩在[80,100)之间,其考试分数之和为2×90=180,由此可知,考生总人数为4+8+10+6+2=30,考试总成绩为40+240+500+420+180=1 380,平均数为=46.
3.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
解析:选C.由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A错;甲、乙的成绩的中位数分别为6,5,B错;甲、乙的成绩的方差分别为×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=,C对;甲、乙的成绩的极差均为4,D错.
4.(2019·河南省信阳高级中学期末考试)某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( )
A.70和50 B.70和67
C.75和50 D.75和67
解析:选B.设更正前甲、乙、……的成绩依次为a1,a2,…,a50,
则a1+a2+…+a50=50×70,即60+90+a3+…+a50=50×70,
(a1-70)2+(a2-70)2+…+(a50-70)2=50×75,
即102+202+(a3-70)2+…+(a50-70)2=50×75,
更正后平均分为=×(80+70+a3+…+a50)=70;
方差为s2=×[(80-70)2+(70-70)2+(a3-70)2+…+(a50-70)2]
=×[100+(a3-70)2+…+(a50-70)2]=×[100+50×75-102-202]=67.
故选B.
5.(2019·江西省上饶市期末统考)甲、乙两人在相同的条件下投篮5轮,每轮甲、乙各投篮10次,投篮命中次数的情况如图所示(实线为甲的折线图,虚线为乙的折线图),则以下说法错误的是( )
A.甲投篮命中次数的众数比乙的小
B.甲投篮命中次数的平均数比乙的小
C.甲投篮命中次数的中位数比乙的大
D.甲投篮命中的成绩比乙的稳定
解析:选B.由折线图可知,甲投篮5轮,命中的次数分别为5,8,6,8,8,
乙投篮5轮,命中的次数分别为3,7,9,5,9,
则甲投篮命中次数的众数为8,乙投篮命中次数的众数为9,所以A正确;
甲投篮命中次数的平均数为7,乙投篮命中次数的平均数为6.6,所以B不正确;
甲投篮命中次数的中位数为8,乙投篮命中次数的中位数为7,所以C正确;
甲投篮命中次数的数据集中在平均数的左右,方差较小,乙投篮命中次数的数据比较分散,方差较大,所以甲的成绩更稳定一些,所以D正确.
故选B.
6.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:
甲
乙
丙
丁
平均环数
8.3
8.8
8.8
8.7
方差s2
3.5
3.6
2.2
5.4
若要从这四人中选择一人去参加该运动会射击项目的比赛,最佳人选是________.(填“甲”“乙”“丙”“丁”中的一个)
解析:分析表格数据可知,乙与丙的平均环数最多,又丙的方差比乙小,说明丙成绩发挥得较为稳定,所以最佳人选为丙.
答案:丙
7.(2019·陕西省西安市长安区第一中学期末考试)一组数据的平均数是28,方差是4,若将这组数据中的每一个数据都加上20,得到一组新数据,则所得新数据的平均数是________,方差是________.
解析:设该组数据为x1,x2,…,xn;则新数据为x1+20,x2+20,…,xn+20;
因为==28,
所以==20+28=48.
因为s2=[(x1-)2+(x2-)2+…+(xn-)2],
所以s′2=[(x1+20-(+20))2+(x2+20-(+20))2+…+(xn+20-(+20))2]=s2=4.
答案:48 4
8.(2019·湖北省华中师范大学第一附属中学期末考试)样本中共有五个个体,其值分别为a,0,1,2,3,若该样本平均数为1,则样本方差为________.
解析:因为样本的平均数为1,所以×(a+0+1+2+3)=1,解得a=-1.
所以样本的方差为
×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.
答案:2
9.甲、乙两种冬小麦实验品种连续5年的平均单位面积产量如下(单位:t/km2):
第1年
第2年
第3年
第4年
第5年
甲
9.8
9.9
10.1
10
10.2
乙
9.4
10.3
10.8
9.7
9.8
若某村要从中引进一种冬小麦大量种植,给出你的建议.
解:由题意得甲=乙=10.
s=×[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]=0.02,
s=×[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244,
甲、乙两种冬小麦的平均产量都等于10,且s<s,所以产量比较稳定的为甲种冬小麦,推荐引进甲种冬小麦大量种植.
10.(2019·高考全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
解:(1)由已知得0.70=a+0.20+0.15,故
a=0.35.
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
[B 能力提升]
11.(2019·湖南省张家界市期末联考)某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9(x,y∈N),已知这组数据的平均数为10,方差为2,则|x-y|的值为( )
A.4 B.3
C.2 D.1
解析:选A.由这组数据的平均数为10,方差为2可得x+y=20,(x-10)2+(y-10)2=8,因为不要直接求出x、y,只要求出|x-y|,设x=10+t,y=10-t,由(x-10)2+(y-10)2=8得t2=4;所以|x-y|=2|t|=4.故选A.
12.某市有15个旅游景点,经计算,黄金周期间各个景点的旅游人数平均为20万,标准差为s,后来经核实,发现甲、乙两处景点统计的人数有误,甲景点实际为20万,被误统计为15万,乙景点实际为18万, 被误统计成23万;更正后重新计算,得到标准差为s1,则s与s1的大小关系为( )
A.s=s1 B.s<s1
C.s>s1 D.不能确定
解析:选C.由已知,两次统计所得的旅游人数总数没有变,即两次统计的各景点旅游人数的平均数是相同的,设为,
则s=
,
s1=
.
若比较s与s1的大小,只需比较(15-)2+(23-)2与(20-)2+(18-)2的大小即可.而(15-)2+(23-)2=754-76+22,(20-)2+(18-)2=724-76+22,所以(15-)2+(23-)2>(20-)2+(18-)2.从而s>s1.
13.五个数1,2,3,4,a的平均数是3,则a=________,这五个数的标准差是________.
解析:由=3,得a=5;
由s2=[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2,得标准差s=.
答案:5
14.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
质量指标
值分组
[75,85)
[85,95)
[95,105)
[105,115)
[115,125]
频数
6
26
38
22
8
(1)根据上表作出这些数据的频率分布直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?
解:(1)产品质量指标的频率分布直方图如图.
(2)质量指标值的样本平均数为80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.
质量指标值的样本方差为s2=(80-100)2×0.06+(90-100)2×0.26+(100-100)2×0.38+(110-100)2×0.22+(120-100)2×0.08=104.
所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.
(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.
[C 拓展探究]
15.为提倡节能减排,同时减轻居民负担,广州市积极推进“一户一表”工程.非一户一表用户电费采用“合表电价”收费标准:0.65元/度.“一户一表”用户电费采用阶梯电价收取,其11月到次年4月起执行非夏季标准如下:
第一档
第二档
第三档
每户每月用电量
(单位:度)
[0,200]
(200,400]
(400,+∞)
电价(单位:元/度)
0.61
0.66
0.91
例如:某用户11月用电410度,采用合表电价收费标准,应交电费410×0.65=266.5(元),若采用阶梯电价收费标准,应交电费200×0.61+(400-200)×0.66+(410-400)×0.91=263.1(元).
为调查阶梯电价是否能取到“减轻居民负担”的效果,随机调查了该市100户居民的11月用电量,工作人员已经将90户的月用电量填在下面的频率分布表中,最后10户的月用电量(单位:度)为88、268、370、140、440、420、520、320、230、380.
组别
月用电量
频数统计
频数
频率
①
[0,100]
②
(100,200]
③
(200,300]
④
(300,400]
⑤
(400,500]
⑥
(500,600]
合计
(1)完成频率分布表,并绘制频率分布直方图;
(2)根据已有信息,试估计全市住户11月的平均用电量(同一组数据用该区间的中点值作代表);
(3)设某用户11月用电量为x度(x∈N),按照合表电价收费标准应交y1元,按照阶梯电价收费标准应交y2元,请用x表示y1和y2,并求当y2≤y1时,x的最大值,同时根据频率分布直方图估计“阶梯电价”能否给不低于75%的用户带来实惠?
解:(1)频率分布表如下:
组别
月用电量
频数统计
频数
频率
①
[0,100]
4
0.04
②
(100,200]
12
0.12
③
(200,300]
24
0.24
④
(300,400]
30
0.30
⑤
(400,500]
26
0.26
⑥
(500,600]
4
0.04
合计
100
1
频率分布直方图如图:
(2)该100户用户11月的平均用电量
=50×0.04+150×0.12+250×0.24+350×0.3+450×0.26+550×0.04=324(度),
所以估计全市住户11月的平均用电量为324度.
(3)y1=0.65x,
y2=.
由y2≤y1得或
或,
解得x≤≈423.1.
因为x∈N,故x的最大值为423.
根据频率分布直方图,x≤423时的频率为0.04+0.12+0.24+0.3+23×0.002 6=0.759 8>0.75,
故估计“阶梯电价”能给不低于75%的用户带来实惠.