9.2 用样本估计总体
9.2.1 总体取值规律的估计
[目标]
1.学会用频率分布直方图表示样本数据;2.能通过频率分布直方图对数据做出总体统计.
[重点]
频率分布直方图的画法.
[难点]
频率分布直方图对数据总体的估计.
要点整合夯基础
知识点
频率分布直方图
[填一填]
1.频率分布直方图的绘制
(1)求极差,即一组数据中的最大值与最小值的差.
(2)决定组距与组数.组距与组数的确定没有固定的标准,一般来说,数据分组的组数与数据的个数有关,数据的个数越多,所分组数越多,当样本量不超过100时,常分为5~12组.
(3)将数据分组.
(4)列频率分布表,计算各小组的频率,作出频率分布表.
(5)画频率分布直方图.其中横轴表示样本数据,纵轴表示频率与组距的比.
2.频率分布直方图的意义
频率分布直方图中,各小长方形的面积表示相应各组的频率,各小长方形的面积的总和等于1.
[答一答]
1.如何确定组距?
提示:组距的选择应力求“取整”,如果极差不利于分组(如不能被组数整除),可适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同).
2.频率分布直方图中长方形的面积有什么含义?
提示:在频率分布直方图中,由于长方形的面积S=组距×=频率,所以各个小长方形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组上的频率的大小.
典例讲练破题型
类型一
频率分布概念的理解
[例1] 一个容量为100的样本,其数据的分组与各组的频数如下:
组别
[0,10)
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
[60,70]
频数
12
13
24
15
16
13
7
则样本数据落在[10,40)上的频率为( )
A.0.13
B.0.39
C.0.52
D.0.64
[分析] 根据落在各组的频数即可计算相应的频率.
[解析] 由题意可知频数在[10,40)的有13+24+15=52(个),所以频率为=0.52.
[答案] C
[变式训练1] 容量为100的某个样本,数据拆分为10组,并填写频率分布表,若前七组频率之和为0.79,而剩下的三组的频率从小到大依次相差0.05,则剩下的三组中频率最大的一组频率为0.12.
解析:设剩下的三组中频率最大的一组的频率为x,则另两组的频率分别为x-0.05,x-0.1,而由频率和为1得0.79+(x-0.05)+(x-0.1)+x=1,解得x=0.12.
类型二
频率分布直方图的绘制
[例2] 为了解中学生的身高情况,对某中学同龄的50名男生的身高进行了测量,结果如下(单位:cm):
175 168 170 176 167 181 162 173 171 177
171 171 174 173 174 175 177 166 163 160
166 166 163 169 174 165 175 165 170 158
174 172 166 172 167 172 175 161 173 167
170 172 165 157 172 173 166 177 169 181
(1)列出频率分布表;
(2)绘制频率分布直方图.
[解] 极差为181-157=24,将样本数据分成7组,组距为4.
(1)列频率分布表如下.
分组
频数
频率
[156.5,160.5)
3
0.06
[160.5,164.5)
4
0.08
[164.5,168.5)
12
0.24
[168.5,172.5)
13
0.26
[172.5,176.5)
13
0.26
[176.5,180.5)
3
0.06
[180.5,184.5)
2
0.04
合计
50
1
(2)绘制频率分布直方图如图.
绘制频率分布直方图应注意的问题
(1)在列出频率分布表后,画频率分布直方图的关键就是确定小长方形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“找一个恰当的单位长度”(没有统一规定),然后以各组的“”来定高.如果我们预先定以“”为1个单位长度,代表“0.1”,则若一个组的为0.2,则该小矩形的高就是“”(占两个单位长度),依此类推.
(2)在频率分布直方图中,各个小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本量,频率之和为1.
[变式训练2] 一个农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):
6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6
5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8
6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5
6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4
6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4
6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6
5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0
5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7
5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0
6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
根据上面的数据列出频率分布表,绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35
cm之间的麦穗所占的百分比.
解:(1)计算极差:7.4-4.0=3.4.
(2)决定组距与组数:
若取组距为0.3,因为≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12.
(3)决定分点:
使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.
(4)列频率分布表如下:
分组
频数
频率
[3.95,4.25)
1
0.01
[4.25,4.55)
1
0.01
[4.55,4.85)
2
0.02
[4.85,5.15)
5
0.05
[5.15,5.45)
11
0.11
[5.45,5.75)
15
0.15
[5.75,6.05)
28
0.28
[6.05,6.35)
13
0.13
[6.35,6.65)
11
0.11
[6.65,6.95)
10
0.10
[6.95,7.25)
2
0.02
[7.25,7.55]
1
0.01
合计
100
1.00
(5)绘制频率分布直方图如图:
从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35
cm之间的麦穗约占41%.
类型三
频率分布直方图的应用
[例3] 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图如下:
组号
分组
频数
1
[0,2)
6
2
[2,4)
8
3
[4,6)
17
4
[6,8)
22
5
[8,10)
25
6
[10,12)
12
7
[12,14)
6
8
[14,16)
2
9
[16,18]
2
合计
100
(1)求频率分布直方图中的a,b的值;
(2)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).
[分析] 由频率分布直方图进行相关计算时,需掌握下列关系式:
(1)×组距=频率.
(2)=频率,此关系式的变形为=样本量,样本量×频率=频数.
[解] (1)课外阅读时间落在[4,6)组内的有17人,频率为0.17,所以a===0.085.课外阅读时间落在[8,10)组内的有25人,频率为0.25,所以b===0.125.
(2)样本中的100名学生该周课外阅读时间的平均数在第4组.
在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本量,频率之和等于1.
[变式训练3] 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2?4?17?15?9?3,第二小组的频数为12.
(1)第二小组的频率是多少?样本量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少?
解:(1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的,因此第二小组的频率为=0.08.
因为第二小组的频率=,
所以样本量===150.
(2)由题中直方图可估计该校全体高一年级学生的达标率约为×100%=88%.
课堂达标练经典
1.从一堆苹果中任取10个,称得它们的质量如下(单位:克):125,120,122,105,130,114,116,95,120,134,则样本数据落在[114.5,124.5)内的频率为( C )
A.0.2
B.0.3
C.0.4
D.0.5
解析:在125,120,122,105,130,114,116,95,120,134这10个数字中,落在[114.5,124.5)内的有116,120,120,122,共4个,∴样本数据在[114.5,124.5)内的频率为0.4.故选C.
2.从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8,其累计频率为0.4,则这个样本量是( A )
A.20
B.40
C.70
D.80
解析:由已知不超过70分的人数为8,累计频率为0.4,则这个样本量n==20.故选A.
3.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为( B )
A.20
B.30
C.40
D.50
解析:样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.
4.一个频数分布表(样本量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,则估计样本在[40,50),[50,60)内的数据个数之和是21.
解析:根据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.
∵样本中数据在[20,60)内的频率为0.6,样本量为50,
∴=0.6,解得x+y=21.
即样本在[40,50),[50,60)内的数据个数之和为21.
5.如图所示是总体的一个样本频率分布直方图,且在[15,18)内的频数为8.
(1)求样本在[15,18)内的频率;
(2)求样本量;
(3)若在[12,15)内的小矩形面积为0.06,求在[18,33)内的频数.
解:由题中样本频率分布直方图可知组距为3.
(1)由题中样本频率分布直方图得样本在[15,18)内的频率等于×3=.
(2)∵样本在[15,18)内频数为8,由(1)可知,样本量为=8×=50.
(3)∵在[12,15)内的小矩形面积为0.06,故样本在[12,15)内的频率为0.06,故样本在[15,33)内的频数为50×(1-0.06)=47,又在[15,18)内频数为8,故在[18,33)内的频数为47-8=39.
——本课须掌握的三大问题
1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.
2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.
3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.
PAGE
-
1
-9.2.2 总体百分位数的估计
[目标]
1.理解百分位数的概念;2.掌握计算百分位数的方法.
[重点]
百分位数的计算.
[难点]
百分位数的理解.
要点整合夯基础
知识点一 百分位数
[填一填]
1.如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.第25百分位数又称第一四分位数或下四分位数;第75百分位数又称第三四分位数或上四分位数.
[答一答]
如何理解分位数的作用?
提示:分位数是用于衡量数据的位置的量度,但它所衡量的,不一定是中心位置.百分位数提供了有关各数据项如何在最小值与最大值之间分布的信息.对于无大量重复的数据,第p百分位数将它分为两个部分.大约有p%的数据项的值比第p百分位数小;而大约有(100-p)%的数据项的值比第p百分位数大.
知识点二 如何计算百分位数
[填一填]
下面的步骤来说明如何计算第p百分位数.
第1步:以递增顺序排列原始数据(即从小到大排列).
第2步:计算
i=np%.
第3步:①若
i
不是整数,将
i
向上取整.大于i的比邻整数即为第p百分位数的位置;
②若i是整数,则第p百分位数是第i项与第(i+1)项数据的平均值.
典例讲练破题型
类型 百分位数的计算
[例] 下表为12名毕业生的起始月薪:
根据表中所给的数据计算第85百分位数.
[解] 将12个数据按从小到大排序:2
710,2
755,2
850,2
880,2
880,2
890,2
920,2
940,2
950,3
050,3
130,
3
325.
计算i=12×85%=10.2,所以所给数据的第85百分位数是第11个数据3
130.
计算百分位数的方法
从小到大排列原始数据;计算i=n×p%;若i不是整数,将i向上取整,大于i的比邻整数即为第p百分位数的位置;若i是整数,则第p百分位数是第i项与第?i+1?项数据的平均值.百分位数表示的是位置数据.
[变式训练] 某车间12名工人一天生产某产品(单位:kg)的数量分别为13.8,13,13.5,15.7,13.6,14.8,14,14.6,15,15.2,15.8,15.4,则所给数据的第25,50,75百分位数分别是13.7,14.7,15.3.
解析:将12个数据按从小到大排序:13,13.5,13.6,13.8,14,14.6,14.8,15,15.2,15.4,15.7,15.8.
由i=12×25%=3,得所给数据的第25百分位数是第3个数据与第4个数据的平均数即=13.7;
由i=12×50%=6,得的给数据的第50百分位数是第6个数据与第7个数据的平均数,即=14.7;
由i=12×75%=9,得所给数据的第75百分位数是第9个数据和第10个数据的平均数,即=15.3.
——本课须掌握的问题
百分数比是属于一种统计量,百分等级是百分位数的逆运算,是相对量数;百分位数是某点下面全部数据的一个百分比.
PAGE
-
1
-9.2.3 总体集中趋势的估计
[目标]
1.会求样本的众数、中位数、平均数;2.会应用相关知识解决实际统计问题.
[重点]
通过数字特征的计算,提升数学运算素养.
[难点]
借助实际统计问题的应用,培养数学建模素养.
要点整合夯基础
知识点 众数、中位数、平均数
[填一填]
1.众数
一组数据中出现次数最多的数.
2.中位数
一组数据按大小顺序排列后,处于中间位置的数.如果个数是偶数,则取中间两个数据的平均数.
3.平均数
一组数据的和除以数据个数所得到的数.
[答一答]
三种数字特征的优缺点?
提示:
典例讲练破题型
类型 众数、中位数、平均数
[例] 某公司的33名职工的月工资(以元为单位)如下表:
职务
董事长
副董事长
董事
总经理
经理
管理员
职员
人数
1
1
2
1
5
3
20
工资
5
500
5
000
3
500
3
000
2
500
2
000
1
500
(1)求该公司职工月工资的平均数、中位数、众数;
(2)假设副董事长的工资从5
000元提升到20
000元,董事长的工资从5
500元提升到30
000元,那么新的平均数、中位数、众数又是多少?(精确到元)
(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.
[分析] 按照众数、中位数、平均数的定义计算即可.
[解] (1)平均数是
=1
500++
≈1
500+591=2
091,中位数是1
500,众数是1
500.
(2)新的平均数是
′=1
500++
≈1
500+1
788=3
288,新的中位数是1
500,新的众数是1
500.
(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.
平均数、众数、中位数都是描述一组数据的特点,但描绘的含义不同.
[变式训练] 某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):
甲群:13,13,14,15,15,15,15,16,17,17;
乙群:54,3,4,4,5,6,6,6,6,56.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?
(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?
解:(1)甲群市民年龄的平均数为
=15,中位数为15,众数为15.
平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.
(2)乙群市民年龄的平均数为
=15,中位数为6,众数为6.
由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.
课堂达标练经典
1.一个样本数据从小到大的顺序排列为12,15,20,x,23,28,30,50,其中,中位数为22,则x=( A )
A.21
B.15
C.22
D.35
解析:因为数据有8个,所以中位数为:=22,所以解得:x=21,故选A.
2.由小到大排列的一组数据x1,x2,x3,x4,x5,其中每个数据都小于-1,那么对于样本1,x1,-x2,x3,-x4,x5的中位数可以表示为( C )
A.(1+x2)
B.(x2+x1)
C.(1+x5)
D.(x3-x4)
解析:∵x13.某班级在一次数学竞赛中为全班同学设置了一等奖、二等奖、三等奖以及参与奖,且奖品的单价分别为:一等奖20元、二等奖10元、三等奖5元、参与奖2元,获奖人数的分配情况如图所示,则以下说法正确的是( D )
A.参与奖总费用最高
B.三等奖的总费用是二等奖总费用的2倍
C.购买奖品的费用的平均数为9.25元
D.购买奖品的费用的中位数为2元
解析:参与奖的百分比为:
1-30%-10%-5%=55%.
设人数为单位1,
一等奖费用:
20×5%=1;
二等奖费用:
10×10%=1;
三等奖费用:
5×30%=1.5;
参与奖费用:
2×55%=1.1.
故购买奖品的费用的平均数为4.6元,参与奖的百分比为55%,故购买奖品的费用的中位数为2元,故选D.
4.对于数据3,3,2,3,6,3,10,3,6,3,2.
①这组数据的众数是3;
②这组数据的众数与中位数的数值不相等;
③这组数据的中位数与平均数的数值相等;
④这组数据的平均数与众数的值相等.
其中正确的结论的个数为( A )
A.1
B.2
C.3
D.4
解析:在这11个数据中,数据3出现了6次,出现次数最多,故众数是3;将这11个数据按从小到大排列得2,2,3,3,3,3,3,3,6,6,10,中间的数据是3,故中位数是3;平均数==4.故选A.
5.某高校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班有50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是85分.
解析:由题意知,该校数学建模兴趣班的平均成绩是
=85.
——本课须掌握的问题
对众数、中位数、平均数的几点说明
(1)如果样本平均数大于样本中位数,说明数据中存在较大的极端值.在实际应用中,样本中位数和样本平均数可以使我们了解样本数据中的极端数据信息,帮助我们作出决策.
(2)众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各个数据的重心.
PAGE
-
1
-9.2.4 总体离散程度的估计
[目标]
1.会求样本的标准差、方差;2.会应用相关知识解决实际统计问题.
[重点]
通过数字特征的计算,提升数学运算素养.
[难点]
借助实际统计问题的应用,培养数学建模素养.
要点整合夯基础
知识点 标准差、方差的概念与计算公式
[填一填]
1.标准差
标准差是样本数据到平均数的平均距离,一般用s表示,s=.
2.方差
标准差的平方s2叫做方差.
s2=·(yi-)2.
其中,yi是样本数据,n是样本量,是样本平均数.
[答一答]
在统计中,计算方差的目的是什么?
提示:方差与标准差描述了一组数据围绕平均数波动的大小,其值越大,数据离散程度越大,当其值为0时,说明样本各数据相等,没有离散性.
典例讲练破题型
类型 方差与标准差
[例] 甲、乙两机床同时加工直径为100
cm的零件,为检验质量,从中抽取6件测量数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算说明哪台机床加工零件的质量更稳定.
[分析] (1)直接利用求x与s2的公式求解.
(2)先比较x的大小,再分析s2的大小并下结论.
[解] (1)甲=(99+100+98+100+100+103)=100,
乙=(99+100+102+99+100+100)=100,
s=[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,s=[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)由(1)知甲=乙,比较它们的方差,
∵s>s,∴乙机床加工零件的质量更稳定.
用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差?方差?分析稳定情况.
[变式训练] 甲、乙、丙、丁四名射手在选拔赛中所得的平均环数及其方差s2如下表所示,则选送决赛的最佳人选应是( B )
甲
乙
丙
丁
7
8
8
7
s2
6.3
6.3
7
8.7
A.甲
B.乙
C.丙
D.丁
解析:∵乙=丙>甲=丁,且s=s课堂达标练经典
1.随机调查某校50个学生的午餐费,结果如下表,这50个学生午餐费的平均值和方差分别是( C )
餐费(元)
3
4
5
人数
10
20
20
A.4,0.6
B.4,
C.4.2,0.56
D.4.2,
解析:根据题意,得这50个学生午餐费的平均值是:
=(3×10+4×20+5×20)=4.2,
方差是:s2=[10×(3-4.2)2+20×(4-4.2)2+20×(5-4.2)2]=0.56,故选C.
2.若样本数据x1,x2,…,x10的方差为2,则数据2x1-1,2x2-1,…,2x10-1的方差为( B )
A.4
B.8
C.16
D.32
解析:因为样本数据x1,x2,…,x10的方差为2,令yi=2xi-1(i=1,2,…,10),所以y1,y2,…,y10的方差为sy=s(2x-1)=4sx=8,故选B.
3.某创业公司共有36名职工,为了了解该公司职工的年龄构成情况,随机采访了9位代表,得到的数据分别为36、36、37、37、40、43、43、44、44,若用样本估计总体,年龄在内的人数占公司人数的百分比是(其中是平均数,s为标准差,结果精确到1%)( C )
A.14%
B.25%
C.56%
D.67%
解析:因为==40,s2=(16+16+9+9+0+9+9+16+16)=,即s=,年龄在内,即内的人数有5人,所以百分比为≈56%,故选C.
4.已知数据x1,x2,x3的中位数为k,众数为m,平均数为n,方差为p,则下列说法中,错误的是( D )
A.数据2x1,2x2,2x3的中位数为2k
B.数据2x1,2x2,2x3的众数为2m
C.数据2x1,2x2,2x3的平均数为2n
D.数据2x1,2x2,2x3的方差为2p
解析:若数据x1,x2,x3的中位数为k,众数为m,平均数为n,则由性质知数据2x1,2x2,2x3的中位数,众数,平均数均变为原来的2倍,故A,B,C正确;则由方差的性质知数据2x1,2x2,2x3的方差为4p,故D错误.故选D.
5.已知数据x1,x2,…,x5,2的平均值为2,方差为1,则数据x1,x2,…,x5相对于原数据( C )
A.一样稳定
B.变得比较稳定
C.变得比较不稳定
D.稳定性不可以判断
解析:∵数据x1,x2,…,x5,2的平均值为2,方差为1,
∴[(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2+(x5-2)2+(2-2)2]=1,即[(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2+(x5-2)2]=1,由题意可得数据x1,x2,…,x5的平均值为2,∴数据x1,x2,…,x5的方差s2=[(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2+(x5-2)2]>1,∴数据x1,x2,…,x5相对于原数据变得比较不稳定.故选C.
——本课须掌握的三大问题
1.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.
2.方差是衡量随机变量或一组数据时离散程度的度量.概率论中方差用来度量随机变量和其均值之间的偏离程度.统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的平均数.
3.方差的特性在于:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本量相同的情况下,方差越大,说明数据的波动越大,越不稳定.
PAGE
-
1
-