2.2.2
用样本的数字特征估计总体的数字特征
学案
【学习目标】
1.掌握众数、中位数、平均数、标准差、方差的定义和特征.
2.会求众数、中位数、平均数、标准差、方差,并能用之解决有关问题.
【学习重点】
用样本的数字特征估计总体的数字特征
课前预习案
【知识链接】
甲、乙两名战士在相同条件下各射靶两次,每次命中的环数分别是:
甲:8,6,7,8,6,5,9,10,4,7
乙:6,7,7,8,6,7,8,7,9,5
1.甲、乙两战士命中环数的平均数甲、乙各是多少?
2.由甲,乙能否判断两人的射击水平?
3.观察上述两组数据,你认为哪个人的射击水平更稳定?
【知识梳理】
1.众数
(1)定义:一组数据中出现次数______的数称为这组数据的众数.
(2)特征:一组数据中的众数可能________个,也可能没有,反映了该组数据的__________.
2.中位数
(1)定义:一组数据按从小到大的顺序排成一列,处于______位置的数称为这组数据的中位数.
(2)特征:一组数据中的中位数是______的,反映了该组数据的__________.在频率分布直方图中,中位数左边和右边的直方图的面积______.
3.平均数
(1)定义:一组数据的和与这组数据的个数的商.数据x1,x2,…,xn的平均数为=____________.
(2)特征:平均数对数据有“取齐”的作用,代表该组数据的________.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的______,但平均数受数据中________的影响较大,使平均数在估计总体时可靠性降低.
4.标准差
(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s表示,通常用以下公式来计算
s=______________________________.
(2)特征:标准差描述一组数据围绕________波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较____;标准差较小,数据的离散程度较____.
5.方差
(1)定义:标准差的平方,即
s2=________________________.
(2)特征:与________的作用相同,描述一组数据围绕平均数波动程度的大小.
(3)取值范围:________.
知识拓展:数据组x1,x2,…,xn的平均数为,方差为s2,标准差为s,则数据组ax1+b,ax2+b,…,axn+b(a,b为常数)的平均数为a+b,方差为a2s2,标准差为as.
6.用样本估计总体
现实中的总体所包含的个体数往往很多,总体的平均数、众数、中位数、标准差、方差是不知道的,因此,通常用______的平均数、众数、中位数、标准差、方差来估计.这与上一节用______的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.
小结:
用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数;用样本标准差估计总体标准差.样本容量越大,估计就越精确.
自主小测
1、
数据组8,-1,0,4,,4,3的众数是__________.
2、
数据组-5,7,9,6,-1,0的中位数是__________.
3、10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,则其平均数是__________.
4、
一组数据的单位是m,平均数是,标准差为s,则( )
A.与s的单位都是km
B.与s的单位都是cm
C.与s的单位都是m
D.与s的单位不同
5、
下列刻画一组数据离散程度的是( )
A.平均数
B.方差
C.中位数
D.众数
6、
下列判断正确的是( )
A.样本平均数一定小于总体平均数
B.样本平均数一定大于总体平均数
C.样本平均数一定等于总体平均数
D.样本容量越大,样本平均数越接近总体平均数
7、电池厂从某日生产的电池中抽取10个进行寿命测试,得数据如下(单位:小时):30,35,25,25,30,34,26,25,29,21,则该日生产电池的平均寿命估计为( )
A.27
B.28
C.29
D.30
课上导学案
【例题讲解】
题型一
计算方差(标准差)
【例题1】
从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人成绩的标准差为________.
分数
5
4
3
2
1
人数
20
10
30
30
10
【例题2】
某工厂人员及月工资构成如下:
人员
经理
管理人员
高级技工
工人
学徒
合计
月工资(元)
22
000
2
500
2
200
2
000
1
000
29
700
人数
1
6
5
10
1
23
合计
22
000
15
000
11
000
20
000
1
000
69
000
(1)指出这个问题中的众数、中位数、平均数.
(2)这个问题中,平均数能客观地反映该工厂的月工资水平吗?为什么?
【例题3】
甲、乙两台包装机同时包装质量为200克的糖果,从中各抽出10袋,测得其实际质量分别如下(单位:克):
甲:203 204 202 196 199 201 205 197 202 199
乙:201 200 208 206 210 209 200 193 194 194
(1)分别计算两个样本的平均数与方差.
(2)从计算结果看,哪台包装机包装的10袋糖果的平均质量更接近于200克?哪台包装机包装的10袋糖果的质量比较稳定?
【例题4】
小明是班里的优秀学生,他的历次数学成绩是96,98,95,93分,但最近的一次考试成绩只有45分,原因是他带病参加了考试.期末评价时,怎样给小明评价?
.
【当堂检测】
1.如图,是某篮球运动员在一个赛季的30场比赛中得分的茎叶图,则得分的中位数与众数分别为( )
A.3与3
B.23与3
C.3与23
D.23与23
2.某赛季甲、乙两名篮球运动员各13场比赛的得分情况用茎叶图表示如下:
根据上图,对这两名运动员的成绩进行比较,下列四个结论中,不正确的是( )
A.甲运动员得分的极差大于乙运动员得分的极差
B.甲运动员得分的中位数大于乙运动员得分的中位数
C.甲运动员的得分平均值大于乙运动员的得分平均值
D.甲运动员的成绩比乙运动员的成绩稳定
3.抛硬币20次,抛得正面朝上12次,反面朝上8次.如果抛到正面朝上得3分,抛到反面朝上得1分,则平均得分是__________,得分的方差是__________.
4.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则x2+y2=__________.
5.某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:
甲
127
138
130
137
135
131
乙
133
129
138
134
128
136
求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛.
【问题与收获】
【知识链接】答案
【提示】 甲=7环;乙=7环.
【提示】 由于甲=乙,故无法判断.
【提示】 从数字分布来看,甲命中的环数较分散,乙命中的环数较集中,故乙的射击水平更稳定.
知识梳理答案:1.(1)最多 (2)不止一 集中趋势
2.(1)中间 (2)唯一 集中趋势 相等
3.(1) (2)平均水平 信息 极端值
4.(1) (2)平均数 大 小
5.(1)[(x1-)2+(x2-)2+…+(xn-)2]
(2)标准差 (3)[0,+∞)
B 方差刻画一组数据离散程度的大小.
6.样本 样本
自主小测:1、
4
2、
3 将该组数据按从小到大排列为-5,-1,0,6,7,9,则中位数是=3.
3、
14.7 平均数是(15+17+14+10+15+17+17+16+14+12)=14.7.
4、
C 与s的单位都与数据组中的数据单位相同,是m.
5、
B 方差刻画一组数据离散程度的大小.
6、
D
7、B 这10个数据的平均数是(30+35+25+25+30+34+26+25+29+21)=28,则该日生产的电池的平均寿命估计为28小时.
答案:
【例题1】
这100人的总成绩为5×20+4×10+3×30+2×30+1×10=300,平均成绩为=3,则该100人成绩的标准差为
=.
【例题2】
解:(1)由表格可知,众数为2
000元.
把23个数据按从小到大(或从大到小)的顺序排列,排在中间的数应是第12个数,其值为2
200,故中位数为2
200元.
平均数为(22
000+15
000+11
000+20
000+1
000)÷23=69
000÷23=3
000(元).
(2)虽然平均数为3
000元/月,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.
【例题3】
解:(1)甲=(3+4+2-4-1+1+5-3+2-1)+200=200.8.
乙=(1+0+8+6+10+9+0-7-6-6)+200=201.5.
s=7.96,s=38.05.
(2)∵200<甲<乙,
∴甲台包装机包装的10袋糖果的平均质量更接近于200克.
∵s<s,
∴甲台包装机包装的10袋糖果的质量比较稳定.
【例题4】
正解:小明5次考试成绩,从小到大排列为45,93,95,96,98,中位数是95,应评定为“优秀”.
当堂检测答案:1.D 中位数是指一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数),从茎叶图中可知中位数为23;众数是指一组数据中出现次数最多的数,从茎叶图中可知23出现了3次,次数最多,因此众数也是23,所以选D.
2.D 甲运动员比赛得分的最高分为47,最低分为18,极差为29,乙运动员比赛得分的最高分为33,最低分为17,极差为16,所以A项正确;甲运动员比赛得分的中位数为30,乙运动员比赛得分的中位数为26,所以B项正确;甲运动员的得分平均值=
(18+18+19+20+21+26+30+32+33+35+40+41+47)=,乙运动员的得分平均值=(17+17+19+19+22+25+26+27+29+29+30+32+33)=,甲运动员的得分平均值大于乙运动员的得分平均值,所以C项正确;由茎叶图知甲得分较为分散,乙得分较为集中,故甲的成绩没有乙的成绩稳定.
3.2.2 0.96 总得分为12×3+8×1=44,则平均分是=2.2,方差s2=[(3-2.2)2×12+(1-2.2)2×8]=0.96.
4.208 由平均数为10,得(x+y+10+11+9)×=10,
则x+y=20;
又由于方差为2,则[(x-10)2+(y-10)2+(10-10)2+(11-10)2+(9-10)2]×=2,
整理得x2+y2-20(x+y)=-192,
则x2+y2=20(x+y)-192=20×20-192=208.
5.解:设甲乙两人成绩的平均数分别为,,
则=130+=133,
=130+=133,
==,
==.
因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适.