(共37张PPT)
第12章 统计学初步
第12章 统计学初步
总体
个体
样本
观测数据
样本容量
抽样
本部分内容讲解结束
按ESC键退出全屏播放
A
第12章
DI
SHI
ER
ZHANG
统计学初步
预习案,自生学习
研读·思考·尝试
[(x1-x)2+(x2-x)2+…+(
探究案·讲练叵动
解惑·探究·突破12.1.1 总体、个体和总体均值
12.1.2 样本与样本均值
12.1.3 方差和标准差
1.通过实例了解总体、个体、总体均值与样本均值. 2.理解样本数据标准差的意义和作用.
3.掌握标准差的计算.
1.相关概念
(1)总体:我们所要调查对象的全体叫作总体.
(2)个体:总体中的每个成员叫作个体.
(3)样本:从总体中抽取一部分个体,称这些个体为样本,也称为观测数据.
(4)样本容量:样本中个体的数目叫作样本容量,简称样本量.
(5)抽样:从总体中抽取样本的工作称为抽样.
(6)样本均值:是样本的平均值,用表示.
2.方差和标准差
(1)总体方差:当y1,y2,…,yN是总体的全部个体,μ是总体均值时,称σ2=
是总体的平均平方误差,简称为总体方差或方差.
(2)样本方差:给定n个观测数据x1,x2,…,xn,用x表示这n个数据的均值.称为这n个数据的样本方差,简称为方差.
(3)标准差:
方差的算术平方根.
如果s2是样本方差,就称s=是样本标准差.
如果σ2是总体方差,就称σ=是总体标准差.
1.判断正误.(对的打“√”,错的打“×”)
(1)数据5,4,4,3,5,2的众数为4.( )
(2)数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半.( )
(3)方差与标准差具有相同的单位.( )
(4)如果一组数据中每个数据减去同一个非零常数,则这组数据的平均数改变,方差不变.( )
解析:(1)中的众数应为4和5;(2)正确;(3)二者单位不一致;(4)正确,平均数也应减去该常数,方差不变.
答案:(1)× (2)√ (3)× (4)√
2.已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是( )
A.平均数>中位数>众数
B.平均数<中位数<众数
C.中位数<众数<平均数
D.众数=中位数=平均数
解析:选D.平均数、中位数、众数皆为50,故选D.
3.已知五个数据3,5,7,4,6,则该样本的标准差为________.
解析:因为=×(3+5+7+4+6)=5,
所以s==.
答案:
众数、中位数、平均数的综合应用[学生用书P29]
高一(3)班有男同学27名,女同学21名,在一次语文测验中,男同学的平均分是82分,中位数是75分,女同学的平均分是80分,中位数是80分.
(1)求这次测验全班平均分(结果保留两位小数);
(2)估计全班成绩在80分以下(含80分)的同学至少有多少人?
(3)分析男同学的平均分与中位数相差较大的主要原因是什么?
【解】 (1)利用平均数计算公式得x=(82×27+80×21)≈81.13(分).
(2)因为男同学的中位数是75,
所以至少有14人得分不超过75分.
又因为女同学的中位数是80,
所以至少有11人得分不超过80分.
所以全班至少有25人得分低于80分(含80分).
(3)男同学的平均分与中位数的差别较大,说明男同学中两极分化现象严重,得分高的和得分低的相差较大.
平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.
[注意] 如果样本平均数大于样本中位数,说明数据中存在较大的极端值.
1.在一次数学测验中,某小组14名学生的成绩与全班的平均分85分的差分别是(单位:分):2,3,-3,-5,12,12,8,-2,-1,4,-10,-2,5,5,那么这个小组的平均分是( )
A.88分
B.87分
C.86分
D.85分
解析:选B.2+3+(-3)+(-5)+12+12+8+(-2)+(-1)+4+(-10)+(-2)+5+5=28(分).
85+=87(分).
方差及标准差的应用[学生用书P29]
甲、乙两机床同时加工直径为100
cm的零件,为检验质量,各从中抽取6件测量,数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
【解】 (1)
甲=(99+100+98+100+100+103)
=100,
乙=(99+100+102+99+100+100)=100.
s=[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
s=[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)由(1)知两台机床所加工零件的直径的平均值相同,
又s>s,所以乙机床加工零件的质量更稳定.
(1)用样本的标准差、方差估计总体的方法
用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.
(2)标准差(方差)的作用
在实际应用中,常常把平均数与标准差结合起来进行决策.在平均数相等的情况下,比较方差或标准差以确定稳定性.
2.从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下:(单位:cm)
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
问:(1)哪种玉米苗长得高?
(2)哪种玉米苗长得齐?
解:(1)甲=(25+41+40+37+22+14+19+39+21+42)=×300=30(cm),
乙=(27+16+44+27+44+16+40+40+16+40)
=×310=31(cm).
所以甲<乙.
即乙种玉米苗长得高.
(2)s=[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]
=(25+121+100+49+64+256+121+81+81+144)
=×1
042=104.2(cm2),
s=[2×(27-31)2+3×(16-31)2+2×(44-31)2+3×(40-31)2]
=×1
288=128.8(cm2).
所以s<s.
即甲种玉米苗长得齐.
有关统计的探究性问题[学生用书P30]
在一次科技知识竞赛中,两组学生的成绩如下表:
分数(分)
50
60
70
80
90
100
人数
甲组
2
5
10
13
14
6
乙组
4
4
16
2
12
12
已经算得两个组的平均分都是80分.请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.
【解】 (1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.
(2)因为2+5+10+13+14+6
=4+4+16+2+12+12=50,
所以s=[2(50-80)2+5(60-80)2+10(70-80)2+13(80-80)2+14(90-80)2+6(100-80)2]=(2×900+5×400+10×100+13×0+14×100+6×400)=172,
s=[4(50-80)2+4(60-80)2+16(70-80)2+2(80-80)2+12(90-80)2+12(100-80)2]=(4×900+4×400+16×100+2×0+12×100+12×400)=256.
因为s所以甲组成绩较乙组成绩稳定,故甲组成绩好些.
(3)甲、乙两组成绩的中位数、平均数都是80分,其中,甲组成绩在80分以上(包含80分)的有33人,乙组成绩在80分以上(包含80分)的有26人,从这一角度看,甲组的成绩较好.
要正确解答这道题,首先要抓住问题中的关键词语,全方位地进行必要的计算、分析,而不能习惯性地仅从样本方差的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析;其次要在恰当地评估后,组织好正确的语言作出结论.
3.已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a、b的取值分别是________,________.
解析:这10个数的中位数为=10.5.
这10个数的平均数为10.
要使总体方差最小,即(a-10)2+(b-10)2最小.
由=10.5得a+b=21,b=21-a,
所以(a-10)2+(b-10)2=(a-10)2+(11-a)2=2a2-42a+221.
当a=-=10.5时,2a2-42a+221最小,此时b=10.5.
答案:10.5 10.5
1.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.
2.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
一组数据中的众数可能不止一个,众数是一组数据中出现的次数最多的数据,而不是该数据出现的次数.一组数据的中位数是唯一的.
1.样本101,98,102,100,99的标准差为( )
A.
B.0
C.1
D.2
解析:选A.样本平均数=100,方差为s2=2,
所以标准差s=,故选A.
2.若40个数据的平方和是56,平均数是,则这组数据的方差是________,标准差是________.
解析:设40个数据为xi(i=1,2,…,40),平均数为x.
则s2=×[(x1-)2+(x2-)2+…+(x40-)2]
=(x+x+…+x-402)
=×(56-40×)
=0.9.
所以s=.
答案:0.9
3.某工厂人员及工资构成如下表:
人员
经理
管理人员
高级技工
工人
学徒
合计
周工资
2
200
250
220
200
100
人数
1
6
5
10
1
23
合计
2
200
1
500
1
100
2
000
100
6
900
(1)指出这个工厂人员周工资的众数、中位数、平均数.
(2)这个问题中,平均数能客观地反映该工厂人员的工资水平吗?为什么?
解:(1)由表格可知:众数为200,中位数为220.
平均数为6
900÷23=300.
(2)虽然平均数为300,但由表格中所列出的数据可知,只有经理在平均数以上,其余人员的工资都在平均数以下,故用平均数不能客观地反映该工厂人员的工资水平.
[A 基础达标]
1.在某项体育比赛中,七位裁判为一选手打出的分数如下:90,89,90,95,93,94,93
去掉一个最高分和一个最低分后,所剩数据的平均值为( )
A.92
B.92.2
C.93.2
D.93
解析:选A.==92.
2.设x是x1,x2,x3,…,xn的平均数,是x1+,x2+,x3+,…,xn+的平均数,则与的关系式是( )
A.=
B.=+
C.=
D.=(+)
解析:选B.
=
=·+
=+.
3.一组数据的方差为s2,将这组数据中的每个数据都扩大3倍,所得的新数据的方差为( )
A.s2
B.s2
C.3s2
D.9s2
解析:选D.每个数据都扩大3倍,
则这组数据的平均数也扩大3倍,
由s2=[(x1-)2+(x2-)2+…+(xn-n)2]知方差扩大9倍.
4.对于数据3,3,2,3,6,3,10,3,6,3,2,有下列结论:
①这组数据的众数是3;
②这组数据的众数与中位数的数值不相等;
③这组数据的中位数与平均数的数值相等;
④这组数据的平均数与众数的数值相等.
其中正确的结论的个数为( )
A.1
B.2
C.3
D.4
解析:选A.在这11个数中,数3出现了6次,频率最高,故众数是3;将这11个数按从小到大顺序排列得2,2,3,3,3,3,3,3,6,6,10,中间数据是3,故中位数是3;而平均数==4.故只有①正确.
5.如图是某市甲、乙两地五月上旬日平均气温的统计图(温度为整数),则甲、乙两地这十天的日平均气温甲,乙,和日平均气温的标准差s甲,s乙的大小关系应为( )
A.甲=乙,s甲<s乙
B.甲=乙,s甲>s乙
C.甲>乙,s甲<s乙
D.甲>乙,s甲>s乙
解析:选B.由折线统计图可得甲、乙两地五月上旬10天的日平均气温,从方差的统计意义是各数据浮动的大小可得乙的标准差比较小.则只需要计算均值即可.
甲==26,
乙==26.
故选B.
6.某教师出了一份共3道题的测试卷,每道题1分,全班得3分、2分、1分、0分的学生所占比例分别为30%、40%、20%、10%.若全班共有30人,则全班同学的平均得分是________分.
解析:全班得3分,2分,1分,0分的学生数分别是30×30%=9,30×40%=12,30×20%=6,30×10%=3,则全班同学的平均分是=1.9.
答案:1.9
7.已知样本数据9,10,11,x,y的平均数是10,标准差是,则xy=________.
解析:因为9+10+11+x+y=50.
1+1+(x-10)2+(y-10)2=10,
所以x+y=20.
x2+y2-20(x+y)=-192,
所以(x+y)2-2xy-20(x+y)=-192,
所以xy=96.
答案:96
8.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.
解析:这组数据的平均数==5.1,则方差s2=
==0.1
答案:0.1
9.假定以下数据是甲、乙两个供货商的交货天数.
甲:10,9,10,10,11,11,9,11,10,10;
乙:8,10,14,7,10,11,10,8,15,12.
估计两个供货商的交货情况,并问哪个供货商的交货时间短一些,哪个供货商的交货时间较具有一致性与可靠性.
解:甲=(10+9+10+10+11+11+9+11+10+10)=10.1(天),
s=[(10-10.1)2+(9-10.1)2+(10-10.1)2+(10-10.1)2+(11-10.1)2+(11-10.1)2+(9-10.1)2+(11-10.1)2+(10-10.1)2+(10-10.1)2]=0.49;
乙=(8+10+14+7+10+11+10+8+15+12)
=10.5(天),
s=[(8-10.5)2+(10-10.5)2+(14-10.5)2+(7-10.5)2+(10-10.5)2+(11-10.5)2+(10-10.5)2+(8-10.5)2+(15-10.5)2+(12-10.5)2]=6.05.
从交货天数的平均数来看,甲供货商的供货天数短一些;从方差来看,甲供货商的交货天数较稳定,因此甲供货商的交货时间较具有一致性与可靠性.
10.某车间20名工人年龄数据如表所示:
年龄(岁)
工人数(人)
19
1
28
3
29
3
30
5
31
4
32
3
40
1
合计
20
(1)求这20名工人年龄的众数与极差;
(2)求这20名工人年龄的方差.
解:(1)这20名工人年龄的众数为30,这20名工人年龄的极差为40-19=21.
(2)这20名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30,
所以这20名工人年龄的方差为:
s2=[(30-19)2+3(30-28)2+3(30-29)2+5(30-30)2+4(30-31)2+3(30-32)2+(30-40)2]=12.6.
[B 能力提升]
11.一个样本a,3,5,7的平均数是b,且a、b是方程x2-5x+4=0的两根,则这个样本的方差是( )
A.3
B.4
C.5
D.6
解析:选C.x2-5x+4=0的两根是1,4.
当a=1时,a,3,5,7的平均数是4;当a=4时,a,3,5,7的平均数不是1.所以a=1,b=4.则方差s2=×[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5.
12.若执行如图所示的程序框图,输入x1=1,x2=2,x3=3,=2则输出的数等于________.
解析:通过程序框图可以看出本题的实质是求数据x1,x2,x3的方差,根据方差公式,得S=[(1-2)2+(2-2)2+(3-2)2]=.
答案:
13.为选派一名学生参加全市实践活动技能竞赛,A、B两位同学在学校实习基地现场进行加工直径为20
mm的零件的测试,他俩各加工的10个零件的相关数据如图所示.(单位:mm)
平均数
方差
完全符合要求个数
A
20
0.026
2
B
20
s
5
根据测试得到的有关数据,试解答下列问题:
(1)考虑平均数与完全符合要求的个数,你认为谁的成绩好些;
(2)计算出s的大小,考虑平均数与方差,说明谁的成绩好些;
(3)考虑图中折线走势及竞赛中加工零件个数远远超过10个的实际情况,你认为派谁去参赛较合适?说明你的理由.
解:(1)因为A、B两位同学成绩的平均数相同,同学B加工零件的完全符合要求个数较多,由此认为B的成绩好些.
(2)因为s=×[5×(20-20)2+3×(19.9-20)2+(20.1-20)2+(20.2-20)2]=0.008,
且s=0.026,
所以s>s.在平均数相同的情况下,B的波动性小,
所以B的成绩好些.
(3)从图中折线图走势可知,尽管A的成绩前面起伏较大,但后来逐渐稳定,误差逐渐减小,而B的稳定性变得越来越差,从竞赛的角度考虑,可选派A去参赛.
14.(选做题)如图是甲、乙两人在一次射击比赛中中靶的情况(击中靶中心的圆面为10环,靶中各数字表示该数字所在圆环被击中所得的环数),每人射击了6次.
(1)请用列表法将甲、乙两人的射击成绩统计出来;
(2)请你用学过的统计知识,对甲、乙两人这次的射击情况进行比较.
解:(1)
环数
6
7
8
9
10
甲命中次数
2
2
2
乙命中次数
1
3
2
(2)
甲=9环,乙=9环,s=,s=1,
因为甲=乙,s<s,
所以甲与乙的平均成绩相同,但甲的发挥比乙稳定.
PAGE
1(共26张PPT)
本部分内容讲解结束
按ESC键退出全屏播放
A
开始
输入x1,x2,x3,x
i=1.S=0
S=S+(x-x)2L=计+
是
i<3
否
S=S
输出S
结束
零件直径:mm
20.3
20.2
20.1
20.0
199
19.8
19.7
二三四五六七八九十件数
B
6|789
6|7879
甲射击的靶
乙射击的靶