9.2.4 总体离散程度的估计
[学习目标]
1.理解方差、标准差的含义,会计算方差和标准差.
2.掌握求分层随机抽样总样本的平均数及方差的方法.
一、方差、标准差
问题 假设一组数据是x1,x2,…,xn,用表示这组数据的平均数.我们可以怎样刻画这组数据的离散程度?
知识梳理
1.假设一组数据是x1,x2,…,xn,用=________表示这组数据的平均数,则称________或为这组数据的方差,称 ________为这组数据的标准差.
2.如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称S2=________为总体方差,S=________为总体标准差.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=________.
3.如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称s2=______为样本方差,s=为样本标准差.
4.方差、标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度______;标准差越小,数据的离散程度________.
例1 甲、乙两机床同时加工直径为100 mm的零件,为检验质量,从中各抽取6件测量,数据为
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
反思感悟 在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度.在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,离散程度越小,数据越集中,越稳定.
跟踪训练1 对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:
甲 27 38 30 37 35 31
乙 33 29 38 34 28 36
(1)分别求出甲、乙两名自行车赛手最大速度的平均数和方差;
(2)比较两个人的成绩,你认为选谁参加比赛比较合适.
二、方差、标准差公式的推广
知识梳理
数据x1,x2,…,xn的方差和标准差分别为s,sx,
数据y1,y2,…,yn的方差和标准差分别为s,sy.
若y1=ax1+b,y2=ax2+b,…,yn=axn+b成立,a,b为常数,则s=________s,sy=________sx.
例2 已知样本数据x1,x2,…,xn的方差为s2=2,则样本数据3x1+2,3x2+2,…,3xn+2的方差为( )
A.2 B.8 C.18 D.20
反思感悟 若数据x1,x2,…,xn的平均数为,方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为m+a,方差为m2s2.
跟踪训练2 若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )
A.8 B.15 C.16 D.32
三、分层随机抽样的方差
知识梳理
假设第一层有m个数,分别为x1,x2,…,xm,平均数为,方差为s2;第二层有n个数,分别为y1,y2,…,yn,平均数为,方差为t2.则=,s2=,=,t2=.
若记样本平均数为,样本方差为b2,则可以算出
==____________,
b2=
=.
例3 某校有高一学生1 000人,其中男女生比例为3∶2,为获得该校高一学生的身高(单位:cm)信息,采用分层随机抽样方法抽取了样本量为50的样本,其中男女生样本量均为25,计算得到男生样本的平均数为172,标准差为3,女生样本的平均数为162,标准差为4.
(1)计算总样本平均数,并估计该校高一全体学生的平均身高;
(2)计算总样本方差.
反思感悟 分层随机抽样的方差
设样本中不同层的平均数分别为1,2,…,n,方差分别为s,s,…,s,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=[s+(i-)2](为总样本平均数).
跟踪训练3 某高校新增设的“人工智能”专业,共招收了两个班,其中甲班30人,乙班40人,在2023年高考中,甲班学生的平均分为665分,方差为131,乙班学生的平均分为658分,方差为208.则该专业所有学生在2023年高考中的方差为________.
四、方差、标准差与统计图表的综合应用
例4 已知甲、乙两名同学在高三的6次数学测试中的成绩统计如图,则下列说法不正确的是( )
A.若甲、乙两组数据的平均数分别为1,2,则1>2
B.若甲、乙两组数据的方差分别为s,s,则s>s
C.甲成绩的极差小于乙成绩的极差
D.甲成绩比乙成绩稳定
反思感悟 统计图中数字特征的求解技巧
根据统计图研究样本数据的数字特征与横坐标和纵坐标的统计意义有关,但一般情况下,整体分布位置较高的平均数大,数据波动性小的方差小.
跟踪训练4 甲、乙、丙三人投掷飞镖,他们的成绩(环数)的频数条形统计图如图所示.则甲、乙、丙三人训练成绩方差s,s,s的大小关系是( )
A.sC.s1.知识清单:
(1)方差、标准差的计算与应用.
(2)分层随机抽样的方差.
2.方法归纳:数据统计、数据分析.
3.常见误区:方差、标准差易混淆.
1.下列数字特征不能反映样本数据的分散程度、波动情况的是( )
A.极差 B.平均数
C.方差 D.标准差
2.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为( )
A.1 B. C. D.2
3.张华和李明两名同学参加数学竞赛的预选赛,他们分别同时进行了5次模拟测试,测试成绩如表(单位:分):
张华 100 80 90 90 90
李明 100 100 70 90 90
如果希望在张华、李明两人中选发挥比较稳定的1人入选,则入选的人应是________.
4.甲、乙两班参加了同一学科的考试,其中甲班50人,乙班40人.甲班的平均成绩为76,方差为96;乙班的平均成绩为85,方差为60.那么甲,乙两班全部学生成绩的方差是________.
9.2.4 总体离散程度的估计
问题 用这组数据与的平均距离来刻画数据的离散程度.
知识梳理
1.
2.
3.
4.越大 越小
例1 解 (1)甲=×(99+100+98+100+100+103)=100,
乙=×(99+100+102+99+100+100)=100.
s=×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
s=×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)两台机床所加工零件的直径的平均数相同,
又s>s,所以乙机床加工零件的质量更稳定.
跟踪训练1 解 (1)甲的平均数
甲=×(27+38+30+37+35+31)=33.
乙的平均数乙=×(33+29+38+34+28+36)=33.
甲的方差s=×[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]=.
乙的方差s=×[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]=.
(2)由(1)知甲和乙的平均数相等,因为s>s,
所以乙更稳定,乙参加比赛比较合适.
知识梳理
a2 |a|
例2 C [设样本数据x1,x2,…,xn的平均数为,样本数据3x1+2,3x2+2,…,3xn+2的平均数为,方差为s,则=
=3+2,
s=[(3x1+2-3-2)2+(3x2+2-3-2)2+…+(3xn+2-3-2)2]=[(x1-)2+(x2-)2+…+(xn-)2]=9s2=9×2=18.]
跟踪训练2 C
知识梳理
例3 解 (1)把男生样本记为x1,x2,…,x25,平均数记为=172,方差记为s=9;
把女生样本记为y1,y2,…,y25,平均数记为=162,方差记为s=16;
把总样本平均数记为,方差记为s2;高一全体学生身高的平均数记为.
根据平均数的定义,总样本平均数为
==
=167;
高一全体学生身高的平均数为
=
==168.
(2)根据方差的定义,总样本方差为
=[25s+25(-)2+25s+25(-)2]
=×[25×9+25×(172-167)2+25×16+25×(162-167)2]=37.5.
所以总样本方差为37.5.
跟踪训练3 187
解析 由题意得甲班学生成绩的平均数1=665,方差s=131,
乙班学生成绩的平均数2=658,方差s=208,
则总体平均数=+=661,
方差s2=×[131+(665-661)2]+×[208+(658-661)2]=187.
例4 B [对于A,由折线图可知,甲同学的平均成绩高于乙同学的平均成绩,A正确;
对于B,由折线图可知,甲同学的成绩较乙同学的成绩更稳定,所以s对于C,由折线图可知,甲成绩的极差小于乙成绩的极差,C正确;
对于D,甲成绩比乙成绩稳定,D正确.]
跟踪训练4 A
随堂演练
1.B 2.B 3.张华 4.100