2.2.2用样本的数字特征估计总体的数字特征
一、教学目标:
知识与技能
(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。
(3)会用样本的基本数字特征估计总体的基本数字特征。
(4)形成对数据处理过程进行初步评价的意识。
过程与方法
在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。
情感态度与价值观
会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系。
二、教学重点与难点
重点:用样本平均数和标准差估计总体的平均数与标准差。
难点:能应用相关知识解决简单的实际问题。
三、教学过程
(一)创设情境,引入新课
在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕
甲运动员﹕7,8,6,8,6,5,8,10,7,4;
乙运动员﹕9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。——用样本的数字特征估计总体的数字特征(板出课题)。
(二)研探新知
1、众数、中位数、平均数
探究:P74
(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?
(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)
初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息。例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见课本第62页)它告诉我们,该市的月均用水量为2.
25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少。
提出问题:原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)
分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差。
提问:那么如何从频率分布直方图中估计中位数呢?
分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数。因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等。由此可以估计出中位数的值为2.02。
思考:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?
(课本75页图2.2-6)显示,大部分居民的月均用水量在中部(2.02t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的。
思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)
2、标准差、方差
(1)标准差
平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断。某地区的统计显示,该地区的中学生的平均身高为176㎝,给我们的印象是该地区的中学生生长发育好,身高较高。但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质。因此,只有平均数难以概括样本数据的实际状态。
例如,在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕
甲运动员﹕7,8,6,8,6,5,8,10,7,4;
乙运动员﹕9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?
我们知道,。
两个人射击的平均成绩是一样的。那么,是否两个人就没有水平差距呢?(观察P78图2.2-8)直观上看,还是有差异的。很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据。
考察样本数据的分散程度的大小,最常用的统计量是标准差。标准差是样本数据到平均数的一种平均距离,一般用s表示。
样本数据的标准差的算法:
、算出样本数据的平均数。
、算出每个样本数据与样本数据平均数的差:
、算出(2)中的平方。
、算出(3)中n个平方数的平均数,即为样本方差。
、算出(4)中平均数的算术平方根,,即为样本标准差。
其计算公式为:
显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小。
提出问题:标准差的取值范围是什么?标准差为0的样本数据有什么特点?
从标准差的定义和计算公式都可以得出:。当时,意味着所有的样本数据都等于样本平均数。
(2).方差
从数学的角度考虑,人们有时用标准差的平方(即方差)来代替标准差,作为测量样本数据分散程度的工具:
在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差。
(三)典例精析
例1:画出下列四组样本数据的直方图,说明他们的异同点。
(1)5,5,5,5,5,5,5,5,5
(2)4,4,4,5,5,5,6,6,6
(3)3,3,4,4,5,6,6,7,7
(4)2,2,2,2,5,8,8,8,8
分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差。
解:四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83。
他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的。
例2:(见课本P80)
分析:
比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值。
(四)课堂练习:P82练习
1.
2.
3 4
(五)课堂小结
1、用样本的数字特征估计总体的数字特征分两类:
(1)用样本平均数估计总体平均数。
(2)用样本标准差估计总体标准差。样本容量越大,估计就越精确。
2、平均数对数据有“取齐”的作用,代表一组数据的平均水平。
3、标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度。
(六)、布置作业:
P84
习题2.2
A组
3、
4、10
四、课后反思2.2.2
用样本的数字特征估计总体的数字特征
基础巩固
一、选择题
1.对于数据3,3,2,3,6,3,10,3,6,3,2.
①这组数据的众数是3;
②这组数据的众数与中位数的数值都不相等;
③这组数据的中位数与平均数的数值相等;
④这组数据的平均数与众数的值相等.
其中正确的结论的个数( )
A.1
B.2
C.3
D.4
[答案] A
[解析] 在这11个数据中,数据3出现了6次,概率最高,故众数是3;将这11个数据按从小到大排列得2,2,3,3,3,3,3,3,6,6,10,中间数据是3,故中位数是3;而平均数==4.
2.(2015·安徽卷)若样本数据x1,x2,……,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )
A.8
B.15
C.16
D.32
[答案] C
[解析] 样本数据x1,x2,……,x10,其标准差=8,则Dx=64,而样本数据2x1-1,2x2-1,……,2x10-1的方差D(2x-1)=22Dx=22×64,其标准差为=16.故选C.
3.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如下图所示,假设得分值的中位数为me,众数为mO,平均值为,则( )
A.me=mO=
B.me=mO<
C.meD.mO[答案] D
[解析] 由图可知,30名学生的得分情况依次为:2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数,即me=5.5,5出现次数最多,故mO=5,==5.97.
于是mO4.为了稳定市场,确保农民增收,某农产品7个月份的每月市场收购价格与其前三个月的市场收购价格有关,并使其与前三个月的市场收购价格之差的平方和最小,下表列出的是该产品今年前6个月的市场收购价格:
月份
1
2
3
4
5
6
价格(元/担)
68
78
67
71
72
70
则前7个月该产品的市场收购价格的方差为( )
A.
B.
C.11
D.
[答案] B
[解析] 设7月份的市场收购价格为x,则y=(x-71)2+(x-72)2+(x-70)2=3x2-426x+15125,则当x=71时,7月份的市场收购价格与前三个月的市场收购价格之差的平方和最小,则7月份的市场收购价格为71.则计算得前7个月该产品的市场收购价格的平均数是71,方差是.
5.(2013·安徽)某班级有50名学生,其中有30名男生和20名女生.随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( )
A.这种抽样方法是一种分层抽样
B.这种抽样方法是一种系统抽样
C.这五名男生成绩的方差大于这五名女生成绩的方差
D.该班男生成绩的平均数小于该班女生成绩的平均数
[答案] C
[分析] 根据抽样方法的概念可判断选项A,B;分别把数据代入方差和平均数的公式可判断选项C,D.
[解析] 若抽样方法是分层抽样,男生、女生应分别抽取6人、4人,所以A错;由题目看不出是系统抽样,所以B错;这五名男生成绩的平均数1==90,
这五名女生成绩的平均数2==91,
故这五名男生成绩的方差为[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8,这五名女生成绩的方差为[(88-91)2×2+(93-91)2×3]=6,所以这五名男生成绩的方差大于这五名女生成绩的方差,但该班男生成绩的平均数不一定小于女生成绩的平均数,所以D错.
6.(2015·山东临沂高一月考)某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45)岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是( )
A.31,6岁
B.32.6岁
C.33.6岁
D.36.6岁
[答案] C
[解析] 根据所给的信息可知,在区间[25,30)上的数据的频率为1-(0.01+0.07+0.06+0.02)×5=0.2.故中位数在第3组,且中位数的估计为30+(35-30)×=33.6(岁).
二、填空题
7.由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)
[答案] 1,1,3,3
[解析] 不妨设x1≤x2≤x3≤x4,
得:x2+x3=4,x1+x2+x3+x4=8 x1+x4=4,
s2=1 (x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2=4
①如果有一个数为0或4;则其余数为2,不合题意; ②只能取|x1-2|=1;得:这组数据为1,1,3,3.
8.阶段考试以后,班长算出了全班40个人数学成绩的平均分为M,如果把M当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均分为N,那么M?N为________.
[答案] 1
[解析] M=,
N===M,
故M?N=1.
三、解答题
9.(2013·新课标全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:
服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2
3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1
2.3 2.4
服用B药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3
1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2
2.7 0.5
(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?
(2)根据两组数据绘制茎叶图,从茎叶图看,哪种药的疗效更好?
[解析] (1)设A药观测数据的平均数为,B药观测数据的平均数为.由观测结果可得
=×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,
=×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.
由以上计算结果可得>,因此可看出A药的疗效更好.
(2)由观测结果可绘制如下茎叶图:
从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上,而B药疗效的试验结果有的叶集中在茎0,1上,由此可看出A药的疗效更好.
[名师点睛] 从平均数上分析,甲、乙中平均数大的效果较好;从茎叶图上分析,要看甲、乙的叶在哪些茎上分布的比率大.如果甲的叶在某茎上分布的比率大,且该茎所对应的数据较大,那么甲的效果就较好.
10.某学校高一(1)班和高一(2)班各有49名学生,两班在一次数学测验中的成绩统计如下:
班级
平均分
众数
中位数
标准差
(1)班
79
70
87
19.8
(2)班
79
70
79
5.2
(1)请你对下面的一段话给予简要分析:
高一(1)班的小刚回家对妈妈说:“昨天的数学测验,全班平均分为79分,得70分的人最多,我得了85分,在班里算上上游了!”
(2)请你根据表中的数据,对这两个班的数学测验情况进行简要分析,并提出建议.
[分析] (1)根据平均数、中位数、众数所反映的情况来分析;(2)结合方差的意义来提出建议.
[解析] (1)由于(1)班49名学生数学测验成绩的中位数是87,则85分排在全班第25名之后,所以从位次上看,不能说85分是上游,成绩应该属于中游.
但也不能以位次来判断学习的好坏,小刚得了85分,说明他对这段的学习内容掌握得较好,从掌握学习的内容上讲,也可以说属于上游.
(2)①班成绩的中位数是87分,说明高于87分(含87)的人数占一半以上,而平均分为79分,标准差又很大,说明低分也多,两极分化严重,建议加强对学习困难的学生的帮助.
②班的中位数和平均数都是79分,标准差又小,说明学生之间差别较小,学习很差的学生少,但学习优异的也很少,建议采取措施提高优秀率.
能力提升
一、选择题
1.某校高一、高二年级各有7个班参加歌咏比赛,他们的得分的茎叶图如图所示,对这组数据分析正确的是( )
A.高一的中位数大,高二的平均数大
B.高一的平均数大,高二的中位数大
C.高一的平均数、中位数都大
D.高二的平均数、中位数都大
[答案] A
[解析] 由茎叶图可以看出,高一的中位数为93,高二的中位数为89,所以高一的中位数大.由计算得,高一的平均数为91,高二的平均数为92,所以高二的平均数大.
2.(2013·重庆)如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )
A.2,5
B.5,5
C.5,8
D.8,8
[答案] C
[分析] 观察茎叶图,由中位数的概念可得x的值,由平均数的计算公式可得y的值.
[解析] 由于甲组的中位数是15,可得x=5,由于乙组数据的平均数为16.8,得y=8.
3.(2013·山东)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
则7个剩余分数的方差为( )
A.
B.
C.36
D.
[答案] B
[分析] 根据茎叶图和平均数的计算公式求出x,然后根据方差的计算公式计算方差
[解析] 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x=91×7,解得x=4.故s2=[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=.
4.(2015·四川省绵阳中学期末检测)在某地区某高传染性病毒流行期间,为了建立指标来显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5”,根据连续7天的新增病例数计算,下列各选项中,一定符合上述指标的是( )
①平均数x≤3;②标准差s≤2;③平均数x≤3且标准差s≤2;④平均数x≤3且极差小于或等于2;⑤众数等于1且极差小于或等于4.
A.①②
B.③④
C.③④⑤
D.④⑤
[解析] 本题考查平均数、标准差、极差、众数的统计意义.假设连续7天新增病例数为0,3,3,3,3,3,6,易知满足平均数x≤3且标准差x≤2,但是不符合指标,所以①②③错误.若极差等于0或1,在平均数x≤3的条件下显然符合指标;若极差等于2,则极小值与极大值的组合可能有:(1)0,2;(2)1,3;(3)2,4;(4)3,5;(5)4,6.在平均数x≤3的条件下,只有(1)(2)(3)成立,且显然符合指标,所以④正确.又易知⑤正确,故选D.
[答案] D
二、填空题
5.某学员在一次射击测试中射靶6次,命中环数如下:
9,5,8,4,6,10
则(1)平均命中环数为________;
(2)命中环数的标准差为________.
[答案] (1)7 (2)
[分析] 直接把数据代入平均数和标准差计算的公式可解.
[解析] (1)由公式知,平均数为(9+5+8+4+6+10)=7.
(2)由标准差公式知,s2=(4+4+1+9+1+9)=.
6.如图是一次考试结果的频数分布直方图,根据该图可估计,这次考试的平均分数为________
[答案] 46
[解析] 根据频数分布直方图,可估计有4人成绩在[0,20)之间,其考试分数之和为4×10=40;有8人成绩在[20,40)之间,其考试分数之和为8×30=240;有10人成绩在[40,60)之间,其考试分数之和为10×50=500;有6人成绩在[60,80)之间,其考试分数之和为6×70=420;有2人成绩在[80,100)之间,其考试分数之和为2×90=180,由此可知,考生总人数为4+8+10+6+2=30,考试总成绩为40+240+500+420+180=1
380,平均数==46.
三、解答题
7.(2014·全国高考卷Ⅰ)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:
质量指标值分组
[75,85)
[85,95)
[95,105)
[105,115)
[115,125]
频数
6
26
38
22
8
(1)在答题卡上作出这些数据的频率分布直方图:
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?
[解析] (1)
(2)质量指标值的样本平均数为
=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.
质量指标值的样本方差为
s2=(-20)2×0.06+(-10)2×0.26+0×0.38+(10)2×0.22+(20)2×0.08=104.
(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品“质量指标值不低于95的产品至少要占全部产品80%”的规定.
8.(2015·广东省惠来高一阶段考试)对某校高三年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图如图所示.
分组
频数
频率
[10,15)
10
0.25
[15,20)
24
n
[20,25)
m
p
[25,30]
2
0.05
合计
M
1
(1)求出表中M,p及图中a的值;
(2)若该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数;
(3)估计这次学生参加社区服务人数的众数、中位数以及平均数.
[解析] (1)由分组[10,15)内的频数是10,频率是0.25,知=0.25,所以M=40.
因为频数之和为40,所以10+24+m+2=40,m=4,p===0.10.
因为a是对应分组[15,20)的频率与组距的商,所以a==0.12.
(2)因为该校高三学生有240人,分组在[10,15)内的频率是0.25,
所以估计该校高三学生参加社区服务的次数在此区间内的人数为60.
(3)估计这次学生参加社区服务人数的众数是=17.5.因为n==0.6,
所以样本中位数是15+≈17.1,
估计这次学生参加社区服务人数的中位数是17.1,
样本平均人数是12.5×0.25+17.5×0.6+22.5×0.1+27.5×0.05=17.25,
估计这次学生参加社区服务人数的平均数是17.25.2.2用样本估计总体(四)
(
)知识回顾
(
)1.如何根据样本频率分布直方图,分别估计总体的众数、中位数和平均数?
(
)(1)众数:最高矩形下端中点的横坐标.
(
)(2)中位数:直方图面积平分线与横轴交点的横坐标.
(
)(3)平均数:每个小矩形的面积与小矩形底边中点的横坐标的乘积之和.
(
)2.
对于样本数据x1,x2,…,xn,其标准差如何计算?
(
)
(
)知识补充
(
)1.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.
(
)2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.
(
)3.对于城市居民月均用水量样本数据,其平均数
,标准差s=0.868.在这100个数据中,落在区间
=[1.105,2.841]外的有28个;落在区间=[0.237,3.709]外的只有4个;落在区间
=[-0.631,4.577]外的有0个.
(
)
一般地,对于一个正态总体,数据落在区间
、
、
(
)内的百分比分别为68.3%、95.4%、99.7%,这个原理在产品质量控制中有着广泛的应用(参考教材P79“阅
(
)读与思考”).
(
)例题分析
(
)例1
画出下列四组样本数据的条形图,说明他们的异同点.
(
)(1)
5,5,5,5,5,5,5,5,5;
(
)(2)
4,4,4,5,5,5,6,6,6;
(
)(3)
3,3,4,4,5,6,6,7,7;
(
)(4)
2,2,2,2,5,8,8,8,8.
(
)
例2
甲、乙两人同时生产内径为25.40mm的一种零件,为了对两人的生产质量进行评比,从他们生产的零件中各随机抽取20件,量得其内径尺寸如下(单位:mm):
(
)甲
:
(
)25.46
25.32
25.45
25.39
25.36
25.34
25.42
25.45
25.38
25.42
25.39
25.43
25.39
25.40
25.44
25.40
25.42
25.35
25.41
25.39
(
)乙:
(
)25.40
25.43
25.44
25.48
25.48
25.47
25.49
25.49
26.36
25.34
25.33
25.43
25.43
25.32
25.47
25.31
25.32
25.32
25.32
25.48
(
)从生产零件内径的尺寸看,谁生产的零件质量较高?
甲生产的零件内径更接近内径标准,且稳定程度较高,故甲生产的零件质量较高.
说明:1.生产质量可以从总体的平均数与标准差两个角度来衡量,但甲、乙两个总体的平均数与标准差都是不知道的,我们就用样本的平均数与标准差估计总体的平均数与标准差.
2.问题中25.40mm是内径的标准值,而不是总体的平均数.
例3
以往招生统计显示,某所大学录取的新生高考总分的中位数基本稳定在550分,若某同学今年高考得了520分,他想报考这所大学还需收集哪些信息?
要点:
(1)查往年录取的新生的平均分数.若平均数小于中位数很多,说明最低录取线较低,可以报考;
(2)查往年录取的新生高考总分的标准差.若标准差较大,说明新生的录取分数较分散,最低录取线可能较低,可以考虑报考.
练习
5、(宁夏理11文12).甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表
甲的成绩
环数
7
8
9
10
频数
5
5
5
5
乙的成绩
环数
7
8
9
10
频数
6
4
4
6
丙的成绩
环数
7
8
9
10
频数
4
6
6
4
分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( B )
A.
B.
C.
D.
课堂小结
1.对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变.如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性.
2.在抽样过程中,抽取的样本是具有随机性的,如从一个包含6个个体的总体中抽取一个容量为3的样本就有20中可能抽样,因此样本的数字特征也有随机性.
用样本的数字特征估计总体的数字特征,是一
种统计思想,没有惟一答案.
3.在实际应用中,调查统计是一个探究性学习过程,需要做一系列工作,我们可以把学到的知识应用到自主研究性课题中去.2.2.2 用样本的数字特征估计总体的数字特征
一、基础过关
1.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为
( )
A.1
B.
C.
D.2
2.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是
( )
A.众数
B.平均数
C.中位数
D.标准差
3.下表是某班50名学生综合能力测试的成绩分布表,则该班成绩的方差为
( )
分数
1
2
3
4
5
人数
5
10
10
20
5
A.
B.1.36
C.2
D.4
4.甲、乙两名学生六次数学测验成绩(百分制)如图所示.
①甲同学成绩的中位数大于乙同学成绩的中位数;②甲同学的平均分比乙同学高;
③甲同学的平均分比乙同学低;
④甲同学成绩的方差小于乙同学成绩的方差.
上面说法正确的是
( )
A.③④
B.①②④
C.②④
D.①③
5.已知样本9,10,11,x,y的平均数是10,方差是4,则xy=________.
6.若a1,a2,…,a20,这20个数据的平均数为x,方差为0.20,则数据a1,a2,…,a20,这21个数据的方差为________.
7.(1)已知一组数据x1,x2,…,xn的方差是a,求另一组数据x1-2,x2-2,…,xn-2的方差;
(2)设一组数据x1,x2,…,xn的标准差为sx,另一组数据3x1+a,3x2+a,…,3xn+a的标准差为sy,求sx与sy的关系.
8.甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:
甲
27
38
30
37
35
31
乙
33
29
38
34
28
36
(1)画出茎叶图,由茎叶图你能获得哪些信息?
(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、极差、方差,并判断选谁参加比赛比较合适?
二、能力提升
9.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A
和
B,样本标准差分别为sA和sB,则
( )
A.A>B,sA>sB
B.AsB
C.A>B,sAD.A10.
如图是2012年某校举行的元旦诗歌朗诵比赛中,七位评委为某位选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为
( )
A.84,4.84
B.84,1.6
C.85,1.6
D.85,0.4
11.由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)
12.甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示:
(1)请填写表:
平均数
方差
中位数
命中9环及9环
以上的次数
甲
乙
(2)请从下列四个不同的角度对这次测试结果进行分析:
①从平均数和方差相结合看(分析谁的成绩更稳定);
②从平均数和中位数相结合看(分析谁的成绩好些);
③从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);
④从折线图上两人射击命中环数的走势看(分析谁更有潜力).
三、探究与拓展
13.师大附中三年级一班40人随机平均分成两组,两组学生一次考试的成绩情况如下表:
统计量
组别
平均成绩
标准差
第一组
90
6
第二组
80
4
求全班的平均成绩和标准差.
2.2.2 用样本的数字特征估计总体的数字特征
1.B 2.D
3.B [平均成绩=(1×5+2×10+3×10+4×20+5×5)=3.2,方差s2=[5×(1-3.2)2+10×(2-3.2)2+10×(3-3.2)2+20×(4-3.2)2+5×(5-3.2)2]=1.36.]
4.A [甲的中位数为81,乙的中位数为87.5,故①错,排除B、D;甲的平均分=
(76+72+80+82+86+90)=81,乙的平均分=(69+78+87+88+92+96)=85,故③真,∴选A.]
5.91
解析 由题意得
即
解得,或.
所以xy=91.
6.0.19
解析 这21个数的平均数仍为20,从而方差为×[20×0.2+(20-20)2]≈0.19.
7.解 (1)设x1,x2,…,xn的平均数为,
则有:a=[(x1-)2+(x2-)2+…+(xn-)2].
∵x1-2,x2-2,…,xn-2的平均数为-2,则这组数据的方差s2=
==a.
(2)设x1,x2,…,xn的平均数为,
则3x1+a,3x2+a,…,3xn+a的平均数为3+a.
sy=
=
=
==3sx,∴sy=3sx.
8.解 (1)画茎叶图,中间数为数据的十位数.
从茎叶图上看,甲、乙的得分情况都是分布均匀的,只是乙更好一些.乙发挥比较稳定,总体情况比甲好.
(2)
甲==33.
乙==33.
s=[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]≈15.67.
s=[(28-33)2+(29-33)2+(33-33)2+(34-33)2+(36-33)2+(38-33)2]≈12.67.
甲的极差为11,乙的极差为10.
综合比较以上数据可知,选乙参加比赛较合适.
9.B [样本A数据均小于或等于10,样本B数据均大于或等于10,故AsB.]
10.C
11.1,1,3,3
解析 假设这组数据按从小到大的顺序排列为x1,x2,x3,x4,
则
∴
又s=
=
==1,
∴(x1-2)2+(x2-2)2=2.
同理可求得(x3-2)2+(x4-2)2=2.
由x1,x2,x3,x4均为正整数,且(x1,x2),(x3,x4)均为圆(x-2)2+(y-2)2=2上的点,分析知x1,x2,x3,x4应为1,1,3,3.
12.解 由折线图,知
甲射击10次中靶环数分别为:
9,5,7,8,7,6,8,6,7,7.
将它们由小到大重排为:5,6,6,7,7,7,7,8,8,9.
乙射击10次中靶环数分别为:
2,4,6,8,7,7,8,9,9,10.
也将它们由小到大重排为:2,4,6,7,7,8,8,9,9,10.
(1)甲=×(5+6×2+7×4+8×2+9)==7(环),
乙=×(2+4+6+7×2+8×2+9×2+10)==7(环),
s=×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]=×(4+2+0+2+4)=1.2,
s=×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2]
=×(25+9+1+0+2+8+9)=5.4.
根据以上的分析与计算填表如下:
平均数
方差
中位数
命中9环及9环以上的次数
甲
7
1.2
7
1
乙
7
5.4
7.5
3
(2)①∵平均数相同,s甲∴甲成绩比乙稳定.
②∵平均数相同,甲的中位数<乙的中位数,
∴乙的成绩比甲好些.
③∵平均数相同,命中9环及9环以上的次数甲比乙少,
∴乙成绩比甲好些.
④甲成绩在平均数上下波动;而乙处于上升势头,从第四次以后就没有比甲少的情况发生,乙较有潜力.
13.解 设第一组20名学生的成绩为xi(i=1,2,…,20),
第二组20名学生的成绩为yi(i=1,2,…,20),
依题意有:=(x1+x2+…+x20)=90,
=(y1+y2+…+y20)=80,故全班平均成绩为:
(x1+x2+…+x20+y1+y2+…+y20)
=(90×20+80×20)=85;
又设第一组学生成绩的标准差为s1,第二组学生成绩的标准差为s2,
则s=(x+x+…+x-202),
s=(y+y+…+y-202)
(此处,=90,=80),又设全班40名学生的标准差为s,平均成绩为(=85),故有
s2=(x+x+…+x+y+y+…+y-402)
=(20s+202+20s+202-402)
=(62+42+902+802-2×852)=51.
s=.
所以全班同学的平均成绩为85分,标准差为.2.2.2 用样本的数字特征估计总体的数字特征
●三维目标
1.知识与技能
(1)能利用频率分布直方图估计总体的众数,中位数,平均数.
(2)结合实际,能选取恰当的样本数字特征,对问题作出合理判断,制定解决问题的有效方法.
2.过程与方法
在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.
3.情感、态度与价值观
通过对有关数据的搜集、整理、分析、判断培养学生“实事求是”的科学态度和严谨的工作作风.
●重点难点
重点:利用频率分布直方图估计总体的众数、中位数、平均数.
难点:(1)从频率分布直方图中计算出中位数;
(2)选取恰当的样本数字特征来估计总体,从而正确的对实际问题做出决策.
●教学建议
1.本节课让学生通过熟知的一组数据的代表-众数、中位数、平均数,并辅以计算器、多媒体手段,通过一定手脑结合的训练,让学生感受在只能得到频率分布直方图的情况下也可以估计总体数字特征.在课堂结构上,建议根据学生的认知水平,采取“仔细观察—分析研究—小组讨论—总结归纳”的方法,使知识的获得与知识的发生过程环环相扣,层层深入,从而顺利完成教学目标.
2.教学方法与手段分析
(1)教学方法:结合本节课的教学内容和学生的认知水平,在教法上,建议采用“问答探究”式的教学方法,层层深入.充分发挥教师的主导作用,让学生真正成为教学活动的主体.
(2)教学手段:通过多媒体辅助教学,充分调动学生参与课堂教学的主动性与积极性.
(3)本节课的教学过程重视学生探究知识的过程,突出了以教师为主导,学生为主体的教学理念.教师通过提供一些可供学生研究的素材,引导学生自己去研究问题,探究问题的结论.
●教学流程
引导学生探究方差及标准差的特征及求法,分组讨论说明方差的实际意义
课标解读
1.会求样本的众数、中位数、平均数、标准差、方差.(重点)2.理解用样本的数字特征来估计总体数字特征的方法.(重点)3.会应用相关知识解决统计实际问题.(难点)
众数、中位数、平均数的概念
1.众数:一组数据中重复出现次数最多的数叫做这组数的众数.
2.中位数:把一组数据按从小到大的顺序排列,把处于最中间位置的那个数称为这组数据的中位数.当数据个数为奇数时,中位数是按从小到大的顺序排列的最中间的那个数;当数据个数为偶数时,中位数是按从小到大的顺序排列的最中间两个数的平均数.
3.平均数:如果有n个数x1,x2,x3,…,xn,那么=(x1+x2+…+xn)叫这n个数的平均数.
标准差、方差
【问题导思】
甲、乙两名战士在相同条件下各射靶两次,每次命中的环数分别是:
甲:8,6,7,8,6,5,9,10,4,7
乙:6,7,7,8,6,7,8,7,9,5
1.甲、乙两战士命中环数的平均数甲、乙各是多少?
【提示】 甲=7环;乙=7环.
2.由甲,乙能否判断两人的射击水平?
【提示】 由于甲=乙,故无法判断.
3.观察上述两组数据,你认为哪个人的射击水平更稳定?
【提示】 从数字分布来看,甲命中的环数较分散,乙命中的环数较集中,故乙的射击水平更稳定.
1.标准差的计算公式
标准差是样本数据到平均数的一种平均距离,一般用s表示,s=
.
2.方差的计算公式
标准差的平方s2叫做方差.
s2=[(x1-)2+(x2-)2+…+(xn-)2].
其中,xi(i=1,2,…,n)是样本数据,n是样本容量,是样本平均数.
众数、中位数、平均数的应用
例题1 某公司的33名人员的月工资如下:
职务
董事长
副董事长
董事
总经理
经理
管理员
职员
人数
1
1
2
1
5
3
20
工资(元)
5
500
5
000
3
500
3
000
2
500
2
000
1
500
(1)求该公司人员月工资的平均数、中位数、众数(精确到元);
(2)假设副董事长的工资从5
000元提升到20
000元;董事长的工资从5
500元提升到30
000元,那么新的平均数、中位数、众数又是什么?(精确到元)
(3)你认为哪个统计量更能反映这个公司人员的工资水平?结合此问题谈一谈你的看法.
【思路探究】 由平均数定义→计算平均数→将数据从小到大排列→得中位数、平均数→结论
【自主解答】 (1)平均数是=(5
500+5
000+3
500×2+3
000+2
500×5+2
000×3+1
500×20)÷33≈2
091(元),中位数是1
500元,众数是1
500元.
(2)平均数是′=(30
000+20
000+3
500×2+3
000+2
500×5+2
000×3+1
500×20)÷33≈3
288(元),中位数是1
500元,众数是1
500元.
(3)在这个问题中,中位数和众数均能反映该公司人员的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司人员的工资水平.
规律方法
1.深刻理解和把握平均数、中位数、众数在反映样本数据上的特点,并结合实际情况,灵活应用.
2.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.
3.平均数对极端值敏感,而中位数对极端值不敏感.因此两者结合,可较好地分析总体的情况.
变式训练
高一(3)班有男同学27名,女同学21名,在一次语文测验中,男同学的平均分是82分,中位数是75分,女同学的平均分是80分,中位数是80分.
(1)求这次测验全班平均分(精确到0.01);
(2)估计全班成绩在80分以下(含80分)的同学至少有多少人?
(3)分析男同学的平均分与中位数相差较大的主要原因是什么?
【解】 (1)利用平均数计算公式得=(82×27+80×21)≈81.13(分).
(2)∵男同学的中位数是75,
∴至少有14名男同学得分不超过75分.
又∵女同学的中位数是80,
∴至少有11名女同学得分不超过80分.
∴全班至少有25人得分低于80分(含80分).
(3)男同学的平均分与中位数的差别较大,说明男同学中两极分化现象严重,得分高的和低的相差较大.
用频率分布表或直方图求数字特征
例题2 已知一组数据:125 121 123 125 127 129 125 128 130 129 126 124 125 127
126 122 124 125 126 128
(1)填写下面的频率分布表:
分组
频数累计
频数
频率
[120.5,122.5)
[122.5,124.5)
[124.5,126.5)
[126.5,128.5)
[128.5,130.5]
合计
(2)作出频率分布直方图;
(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数.
【思路探究】 将数据分组后依次填写分布表.然后画出直方图,最后根据数字特征在直方图中的求法求解.
【自主解答】
(1)
分组
频数累计
频数
频率
[120.5,122.5)
2
0.1
[122.5,124.5)
3
0.15
[124.5,126.5)
8
0.4
[126.5,128.5)
4
0.2
[128.5,130.5]
3
0.15
合计
20
1
(2)
(3)在[124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5,事实上,众数的精确值为125.图中虚线对应的数据是124.5+2×=125.75,事实上中位数为125.5.使用“组中值”求平均数:=121.5×0.1+123.5×0.15+125.5×0.4+127.5×0.2+129.5×0.15=125.8,事实上平均数的精确值为=125.75.
规律方法
1.利用频率分布直方图求数字特征:
(1)众数是最高的矩形的底边的中点.
(2)中位数左右两侧直方图的面积相等.
(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
2.利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.
变式训练
下表是某校学生的睡眠时间抽样的频率分布表(单位:h),试估计该校学生的日平均睡眠时间.
睡眠时间
[6,6.5)
[6.5,7)
[7,7.5)
[7.5,8)
[8,8.5)
[8.5,9]
合计
频数
5
17
33
37
6
2
100
频率
0.05
0.17
0.33
0.37
0.06
0.02
1
【解】 法一 日平均睡眠时间为
=×(6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2)=×739=7.39(h).
法二 求组中值与对应频率之积的和:
=6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h).
所以,估计该校学生的日平均睡眠时间约为7.39
h.
标准差与方差的应用
例题3 甲、乙两机床同时加工直径为100
cm的零件,为检验质量,从中抽取6件测量数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算说明哪台机床加工零件的质量更稳定.
【思路探究】
着
眼
点—)
【自主解答】 (1)甲=[99+100+98+100+100+103]=100,
乙=[99+100+102+99+100+100]=100,
s=[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
s=[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)由(1)知甲=乙,比较它们的方差,∵s>s,故乙机床加工零件的质量更稳定.
规律方法
1.在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差):方差大说明取值分散性大,方差小说明取值分散性小或者取值集中、稳定.
2.关于统计的有关性质及规律:
(1)若x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,…,mxn+a的平均数是m+a.
(2)数据x1,x2,…,xn与数据x1+a,x2+a,…,xn+a的方差相等.
(3)若x1,x2,…,xn的方差为s2,那么ax1,ax2,…,axn的方差为a2s2.
变式训练
对划艇运动员甲、乙在相同的条件下进行了6次测试,测得他们每次的最大速度(m/s)如下:
甲:27,38,30,37,35,31
乙:33,29,38,34,28,36
根据以上数据,试判断他们谁更优秀.
【解】 甲=×(27+38+30+37+35+31)=33,
s=×[(27-33)2+(38-33)2+…+(31-33)2]=×94≈15.7,
乙=×(33+29+38+34+28+36)==33,
s=×[(33-33)2+(29-33)2+…+(36-33)2]=×76≈12.7.
所以甲=乙,s>s.
这说明甲、乙两运动员的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优秀.
巧用分类讨论思想求数字特征
典例 (12分)某班4个小组的人数为10,10,x,8,已知该组数据的中位数与平均数相等,求这组数据的中位数.
【思路点拨】 x的大小未知,可根据x的取值不同分别求中位数.
【规范解答】 该组数据的平均数为(x+28),中位数一定是其中两个数的平均数,由于x不知是多少,所以要分几种情况讨论.
(1)当x≤8时,原数据按从小到大的顺序排列为x,8,10,10,其中位数为×(10+8)=9.若(x+28)=9,则x=8,此时中位数为9.4分
(2)当8(3)当x>10时,原数据按从小到大的顺序排列为8,10,10,x,其中位数为×(10+10)=10.若(x+28)=10,则x=12,此时中位数为10.
综上所述,这组数据的中位数为9或10.12分
启迪思维
当在数据中含有未知数x,求该组数据的中位数时,由于x的取值不同,所以数据由小到大(或由大到小)排列的顺序不同,由于条件的变化,问题的结果有多种情况,不能用同一标准或同一种方法解决,故需分情况讨论,讨论时要做到全面合理,不重不漏.
课堂小结
1.一组数据的中位数是唯一的,求中位数时,必须先将这组数据按从小到大(或从大到小)的顺序排列,如果数据的个数为奇数,那么,最中间的一个数据是这组数据的中位数,如果数据的个数为偶数,那么,最中间两个数据的平均数是这组数据的中位数.
2.利用直方图求数字特征:①众数是最高的矩形的底边的中点.②中位数左右两边直方图的面积应相等.③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
3.样本标准差反映了各样本数据聚集于样本平均值周围的程度,标准差越小,表明各个样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.
基础达标训练
1.一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均值为( )
A.4.55 B.4.5
C.12.5
D.1.64
【解析】 =≈4.55.
【答案】 A
2.一个样本数据按从小到大的顺序排列为:13,14,19,x,23,27,28,31,中位数为22,则x=________.
【解析】 由题意知=22,则x=21.
【答案】 21
3.五个数1,2,3,4,a的平均数是3,则a=________,这组数据的标准差是________.
【解析】 由平均数公式得=3,则a=5,s2=[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2.∴s=.
【答案】 5
4.2012年青年歌手大奖赛民族唱法组中,6位评委现场给每位歌手打分,去掉一个最高分和一个最低分后,其余分数的平均数作为歌手的成绩,已知6位评委给某位歌手的打分是:
9.2 9.5 9.4 9.6 9.8 9.5
求这位歌手的得分及6位评委打分的众数和中位数.
【解】 这位歌手的得分为=(9.5+9.4+9.6+9.5)=9.5分.在这组数据中,9.5出现了2次,出现的次数最多,所以6位评委打分的众数是9.5分,将这组数据按照从小到大的顺序排列后,位于最中间的两个数都是9.5,所以6位评委打分的中位数是9.5分.
课后测试
一、选择题
1.(2013·济南高一检测)某学习小组在某次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各1人,则该小组成绩的平均数、众数、中位数分别是( )
A.85,85,85 B.87,85,86
C.87,85,85
D.87,90,85
【解析】 从小到大排列为75,80,85,85,85,85,90,90,95,100观察可知,众数、中位数分别为85、85,计算得平均数为87.
【答案】 C
2.甲、乙、丙、丁四名射手在选拔赛中所得的平均环数及其方差s2如下表所示,则选送决赛的最佳人选应是( )
甲
乙
丙
丁
7
8
8
7
s2
6.3
6.3
7
8.7
A.甲
B.乙
C.丙
D.丁
【解析】 ∵乙=丙>甲=丁,且s=s<s<s,
∴应选择乙进入决赛.
【答案】 B
3.(2012·山东高考)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是( )
A.众数
B.平均数
C.中位数
D.标准差
【解析】 对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.
【答案】 D
4.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,则由此求出的平均数与实际平均数的差是( )
A.3.5
B.-3
C.3
D.-0.5
【解析】 少输入90,=3,平均数少3,求出的平均数减去实际平均数等于-3.
【答案】 B
5.(2012·安徽高考)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图2-2-9所示,则( )
图2-2-9
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
【解析】 由条形统计图得到相关数据,然后利用平均数、中位数、方差、极差的概念求解.
由条形统计图知:
甲射靶5次的成绩分别为:4,5,6,7,8;
乙射靶5次的成绩分别为:5,5,5,6,9,
所以甲==6;乙==6.
所以甲=乙.故A不正确.
甲的成绩的中位数为6,乙的成绩的中位数为5,故B不正确.
s=[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=×10=2,s=[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=×12=,因为2<,所以s【答案】 C
二、填空题
6.(2013·深圳高一检测)已知样本9,10,11,x,y的平均数是10,标准差为,则xy=________.
【解析】 由平均数得9+10+11+x+y=50,∴x+y=20.
又由(9-10)2+(10-10)2+(11-10)2+(x-10)2+(y-10)2=()2×5=10,得x2+y2-20(x+y)=-192,
(x+y)2-2xy-20(x+y)=-192,∴xy=96.
【答案】 96
7.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为________.
分数
5
4
3
2
1
人数
20
10
30
30
10
【解析】 平均成绩为
=3,
s2=×[20×(5-3)2+10×(4-3)2+30×(3-3)2+30×(2-3)2+10×(1-3)2]=.
∴s=
【答案】
8.(2012·广东高考)由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)
【解析】 利用平均数、中位数、标准差公式分类讨论求解.
假设这组数据按从小到大的顺序排列为x1,x2,x3,x4,
则∴
又s=
=
=
=1,
∴(x1-2)2+(x2-2)2=2.
同理可求得(x3-2)2+(x4-2)2=2.
由x1,x2,x3,x4均为正整数,且(x1,x2),(x3,x4)均为圆(x-2)2+(y-2)2=2上的点,分析知x1,x2,x3,x4应为1,1,3,3.
【答案】 1,1,3,3
三、解答题
9.某公司销售部有销售人员15人,为了制定某种商品的月销售定额,统计了这15人某月的销售量如下:
每人销售件数
1
800
510
250
210
150
120
人数
1
1
3
5
3
2
(1)求这15位销售人员该月销售量的平均数、中位数及众数;
(2)假设销售部负责人把每位销售人员的月销售定额定为320件,你认为是否合理,为什么?如不合理,请你制定一个较合理的销售定额.
【解】 (1)平均数=×(1
800×1+510×1+250×3+210×5+150×3+120×2)=320(件),
中位数为210件,众数为210件.
(2)不合理,因为15人中就有13人的销售额达不到320件,也就是说320虽是这一组数据的平均数但它却不能反映销售人员的一般水平.销售额定为210件要合理些.由于210既是中位数,又是众数,是绝大部分人都能达到的销售额.
10.某篮球队教练要从甲、乙两名运动员中挑选一名运动员,甲、乙两人进行10轮投篮比赛,每轮每人投10次,甲每轮投中的次数分别为9,7,8,7,8,10,7,9,8,7,乙每轮投中的次数分别为7,8,9,8,7,8,9,8,9,7,请你给教练一个人选的建议.
【解】 由已知甲=×(9+7+8+7+8+10+7+9+8+7)=8,
乙=×(7+8+9+8+7+9+8+9+8+7)=8,
s=×[(9-8)2+(7-8)2+(8-8)2+(7-8)2+(8-8)2+(10-8)2+(7-8)2+(9-8)2+(8-8)2+(7-8)2]=1.
s=×[(7-8)2+(8-8)2+(9-8)2+(8-8)2+(7-8)2+(9-8)2+(8-8)2+(9-8)2+(8-8)2+(7-8)2]=.
∵甲=乙,s>s,∴乙运动员发挥稳定,应选乙.
11.为了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图2-2-10,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.
图2-2-10
(1)求第四小组的频率;
(2)问参加这次测试的学生人数是多少?
(3)问在这次测试中学生跳绳次数的中位数落在第几小组内?
【解】 (1)第四小组的频率为1-0.1-0.3-0.4=0.2.
(2)参加这次测试的学生人数为=50.
(3)由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.
∵0.1+0.3=0.4<0.5,
0.1+0.3+0.4=0.8>0.5,
故这次测试中学生跳绳次数的中位数落在第三小组内.
(教师用书独具)
备选例题
某学校高一A班和高一B班各有49名学生,两班在一次数学测验中的成绩统计如下:
班级
平均分
众数
中位数
标准差
A班
79
70
87
19.8
B班
79
70
79
5.2
(1)请你对下面的一段话给予简要分析:
A班的小刚回家对妈妈说:“昨天的数学测验,全班平均分为79分,得70分的人最多,我得了85分,在班里算是上游了!”
(2)请你根据表中的数据,对这两个班的数学测验情况进行简要分析,并提出建议.
【思路探究】 综合考虑四个数字特征对小刚成绩情况进行判断,同时对班级成绩作出分析.
【自主解答】 (1)由于A班49名学生数学测验成绩的中位数是87,则85分排在全班第25名之后,所以从位次上看,不能说85分是上游,成绩应该属于中游.
但也不能以位次来判断学习的好坏,小刚得了85分,说明他对这段的学习内容掌握得较好,从掌握学习的内容上讲,也可以说属于上游.
(2)A班成绩的中位数是87分,说明高于87分(含87)的人数占一半以上,而平均分为79分,标准差又很大,说明低分也多,两极分化严重,建议加强对学习困难的学生的帮助.
B班的中位数和平均数都是79分,标准差又小,说明学生之间差别较小,学习很差的学生少,但学习优异的也很少,建议采取措施提高优秀率.
备选变式
某校在一次考试中,甲、乙两班学生的数学成绩统计如下:
分数
50
60
70
80
90
100
人数
甲班
1
6
12
11
15
5
乙班
3
5
15
3
13
11
选用平均数、众数和中位数评估这两个班的成绩?
【解】 甲班平均数79.6分,乙班平均数80.2分,从平均分看成绩较好的是乙班;甲班众数为90分,乙班众数为70分,从众数看成绩较好的是甲班;甲班的第25个和第26个数据都是80,所以中位数是80分,同理乙班中位数也是80分,但是甲班成绩在中位数以上(含中位数)的学生有31人,占全班学生的62%,同理乙班27人,占全班学生的54%,所以从中位数看成绩较好的是甲班.
如果记90分以上(含90分)为优秀,甲班有20人,优秀率为40%,乙班有24人,优秀率为48%,从优秀率来看成绩较好的是乙班.
可见,一个班学生成绩的评估方法很多,需视要求而定.如果不考虑优秀率的话,显然以中位数去评估比较合适.2.2.2 用样本的数字特征估计总体的数字特征
1.甲、乙两名篮球运动员在某几场比赛中得分的茎叶图如图所示,则甲、乙两人这几场比赛得分的中位数之和是( )
A.63
B.64
C.65
D.66
解析:甲、乙两人在这几场比赛中得分的中位数分别是36和27,则中位数之和是36+27=63.
答案:A
2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有( )
A.a>b>c
B.b>c>a
C.c>a>b
D.c>b>a
解析:a=×(15+17+14+10+15+17+17+16+14+12)=14.7;将10个数由小到大排列为:10,12,14,14,15,15,16,17,17,17,中位数b=15,众数c=17.故选D.
答案:D
3.如图是2014年某校举行的诗歌朗诵比赛中,七位评委为某位选手打出分数的茎叶统计图,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为( )
A.84,4.84
B.84,1.6
C.85,1.6
D.85,0.4
解析:由题意(84+84+86+84+87)=85,
s2=[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]
=(1+1+1+1+4)==1.6.
答案:C
4.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别为( )
A.57.2 3.6
B.57.2 56.4
C.62.8 63.6
D.62.8 3.6
解析:一组数据中的每一个数据都加上60后,新数据的平均数也增加60,即为2.8+60=62.8,而方差保持不变,仍为3.6.
答案:D
5.某班有50名学生,某次数学考试的成绩经计算得到的平均分数是70分,标准差是s,后来发现记录有误,某甲得70分误记为40分,某乙得50分误记为80分,更正后重新计算得标准差为s1,则s与s1之间的大小关系是( )
A.s=s1
B.sC.s>s1
D.不能确定
解析:∵更正前后的平均数均为70,
∴更正前的s2=[(x1-70)2+(x2-70)2+…+(40-70)2+(80-70)2],
更正后的[(x1-70)2+(x2-70)2+…+(70-70)2+(50-70)2],
∴s2>,即s>s1.
答案:C
6.某校从参加高二年级学业水平测试的学生中抽出80名,其数学成绩(均为整数)的频率分布直方图如图所示.则可估计该校学生的平均成绩为 .
答案:72
7.已知某同学五次数学成绩分别是:121,127,123,a,125,若其平均成绩是124,则这组数据的方差是 .
解析:由题意得121+127+123+a+125=5×124,解得a=124,所以这组数据的方差是s2=[(121-124)2+(127-124)2+(123-124)2+(124-124)2+(125-124)2]=4.
答案:4
8.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则x2+y2= .
解析:由平均数为10,得(x+y+10+11+9)×=10,则x+y=20;
又由于方差为2,则[(x-10)2+(y-10)2+(10-10)2+(11-10)2+(9-10)2]×=2,
整理得x2+y2-20(x+y)=-192,
则x2+y2=20(x+y)-192=20×20-192=208.
答案:208
9.对甲、乙两名同学的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:
甲
60
80
70
90
70
乙
80
60
70
80
75
(1)甲、乙的平均成绩谁最好
(2)谁的各门功课发展较平衡
解:(1)(60+80+70+90+70)=74,
(80+60+70+80+75)=73,
故甲的平均成绩较好.
(2)[(60-74)2+(80-74)2+(70-74)2+(90-74)2+(70-74)2]=104,
[(80-73)2+(60-73)2+(70-73)2+(80-73)2+(75-73)2]=56,
由,知乙的各门功课发展较平衡.
10.甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示.
请从下列四个不同的角度对这次测试结果进行分析.
(1)从平均数和方差相结合看;
(2)从平均数和中位数相结合看分析谁的成绩好些;
(3)从平均数和命中9环以上的次数相结合看(分析谁的成绩好些);
(4)从折线图上两人射击命中环数的走势看(分析谁更有潜力).
解:根据各问情况作如下统计表
平均数
方差
中位数
命中9环以上次数
甲
7
1.2
7
1
乙
7
5.4
7.5
3
则(1)∵平均数相同,且,
∴甲比乙优,∴甲稳定些.
(2)∵平均数相同,甲的中位数<乙的中位数,
∴乙的成绩比甲好.
(3)∵平均数相同,且乙命中9环以上次数比甲多,
∴乙的成绩比甲好.
(4)甲的成绩在平均线上下波动;而乙处于上升趋势,从第4次以后就没有比甲少的情况发生,所以说乙有较大潜力.课题:2.2.2用样本的数字特征估计总体的数字特征(2课时)
第
个教案
课型:
新授课
年
月
日
教学目标
知识与技能(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。(3)会用样本的基本数字特征估计总体的基本数字特征。(4)形成对数据处理过程进行初步评价的意识。
过程与方法:在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。
情感、态度与价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系。
教学重点
用样本平均数和标准差估计总体的平均数与标准差
教学难点
能应用相关知识解决简单的实际问题。
教学方法
教学过程:
批
注
活动一:创设情景,揭示课题
(5分钟)问题1:在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。——用样本的数字特征估计总体的数字特征(板出课题)。活动二:步入新知,师生交流(20分钟)
<一>、众数、中位数、平均数〖探究〗:P62(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息。例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见课本第62页)它告诉我们,该市的月均用水量为2.
25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少。〖提问〗:请大家翻回到课本第56页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差。〖提问〗:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数。因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等。由此可以估计出中位数的值为2.02。(图略见课本63页图2.2-6)〖思考〗:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)(课本63页图2.2-6)显示,大部分居民的月均用水量在中部(2.02t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的。〖思考〗:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)<二>、标准差、方差1.标准差平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断。某地区的统计显示,该地区的中学生的平均身高为176㎝,给我们的印象是该地区的中学生生长发育好,身高较高。但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质。因此,只有平均数难以概括样本数据的实际状态。例如,在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?我们知道,。两个人射击的平均成绩是一样的。那么,是否两个人就没有水平差距呢?(观察P66图2.2-8)直观上看,还是有差异的。很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据。考察样本数据的分散程度的大小,最常用的统计量是标准差。标准差是样本数据到平均数的一种平均距离,一般用s表示。样本数据的标准差的算法:、算出样本数据的平均数。、算出每个样本数据与样本数据平均数的差:、算出(2)中的平方。、算出(3)中n个平方数的平均数,即为样本方差。、算出(4)中平均数的算术平方根,,即为样本标准差。其计算公式为:显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小。〖提问〗:标准差的取值范围是什么?标准差为0的样本数据有什么特点?从标准差的定义和计算公式都可以得出:。当时,意味着所有的样本数据都等于样本平均数。(在课堂上,如果条件允许的话,可以给学生简单的介绍一下利用计算机来计算标准差的方法。)2.方差从数学的角度考虑,人们有时用标准差的平方(即方差)来代替标准差,作为测量样本数据分散程度的工具:在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差。活动三:合作学习,探究新知学(18分钟)〖例1〗:画出下列四组样本数据的直方图,说明他们的异同点。(1)5,5,5,5,5,5,5,5,5(2)4,4,4,5,5,5,6,6,6(3)3,3,4,4,5,6,6,7,7(4)2,2,2,2,5,8,8,8,8分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差。解:(图略,可查阅课本P68)四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83。他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的。〖例2〗:(见课本P69)
分析:
比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值。P71
练习
1.
2.
3 4活动四:归纳整理,提高认识(2分钟)用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数。用样本标准差估计总体标准差。样本容量越大,估计就越精确。平均数对数据有“取齐”的作用,代表一组数据的平均水平。标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度。活动五:作业布置1.P72
习题2.2
A组
3、
4、10板书设计:
教学后记:2.2.2 用样本的数字特征估计总体的数字特征
课时目标 1.会求样本的众数、中位数、平均数、标准差、方差.2.理解用样本的数字特征来估计总体数字特征的方法.3.会应用相关知识解决简单的统计实际问题.
1.众数、中位数、平均数
(1)众数的定义:
一组数据中重复出现次数________的数称为这组数的众数.
(2)中位数的定义及求法
把一组数据按从小到大的顺序排列,把处于最______位置的那个数称为这组数据的中位数.
①当数据个数为奇数时,中位数是按从小到大顺序排列的__________那个数.
②当数据个数为偶数时,中位数为排列的最中间的两个数的________.
(3)平均数
①平均数的定义:
如果有n个数x1,x2,…,xn,那么=____________,叫做这n个数的平均数.
②平均数的分类:
总体平均数:________所有个体的平均数叫总体平均数.
样本平均数:________所有个体的平均数叫样本平均数.
2.标准差、方差
(1)标准差的求法:
标准差是样本数据到平均数的一种平均距离,一般用s表示.s=_______________________________________________________________________.
(2)方差的求法:
标准差的平方s2叫做方差.s2=________________________________________.
一、选择题
1.下列说法正确的是( )
A.在两组数据中,平均值较大的一组方差较大
B.平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小
C.方差的求法是求出各个数据与平均值的差的平方后再求和
D.在记录两个人射击环数的两组数据中,方差大的表示射击水平高
2.已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有( )
A.a>b>c
B.a>c>b
C.c>a>b
D.c>b>a
3.甲、乙两位同学都参加了由学校举办的篮球比赛,他们都参加了全部的7场比赛,平均得分均为16分,标准差分别为5.09和3.72,则甲、乙两同学在这次篮球比赛活动中,发挥得更稳定的是( )
A.甲
B.乙
C.甲、乙相同
D.不能确定
4.一组数据的方差为s2,将这组数据中的每个数据都扩大3倍,所得到的一组数据的方差是( )
A.s2
B.s2
C.3s2
D.9s2
5.如图是2010年某校举行的元旦诗歌朗诵比赛中,七位评委为某位选手打出分数的茎叶统计图,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为( )
A.84,4.84
B.84,1.6
C.85,1.6
D.85,0.4
6.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB则( )
A.A>B,sA>sB
B.AsB
C.A>B,sAD.A题 号
1
2
3
4
5
6
答 案
二、填空题
7.已知样本9,10,11,x,y的平均数是10,方差是4,则xy=________.
8.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):
甲
10
8
9
9
9
乙
10
10
7
9
9
如果甲、乙两人只能有1人入选,则入选的应为________.
9.若a1,a2,…,a20,这20个数据的平均数为x,方差为0.20,则数据a1,a2,…,a20,这21个数据的方差为________.
三、解答题
10.甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示:
(1)请填写表:
平均数
方差
中位数
命中9环及9环以上的次数
甲
乙
(2)请从下列四个不同的角度对这次测试结果进行分析:
①从平均数和方差相结合看(分析谁的成绩更稳定);
②从平均数和中位数相结合看(分析谁的成绩好些);
③从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);
④从折线图上两人射击命中环数的走势看(分析谁更有潜力).
能力提升
11.下面是一家快餐店所有工作人员(共7人)一周的工资表:
总经理
大厨
二厨
采购员
杂工
服务员
会计
3
000元
450元
350元
400元
320元
320元
410元
(1)计算所有人员一周的平均工资;
(2)计算出的平均工资能反映一般工作人员一周的收入水平吗?
(3)去掉总经理的工资后,再计算剩余人员的平均工资,这能代表一般工作人员一周的收入水平吗?
12.师大附中三年级一班40人随机平均分成两组,两组学生一次考试的成绩情况如下表:
平均成绩
标准差
第一组
90
6
第二组
80
4
求全班的平均成绩和标准差.
1.平均数、众数、中位数都是描述数据的集中趋势的,其中平均数是最重要的量.
众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使得无法客观地反映总体特征;中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也成为缺点,因为这些极端值有时是不能忽视的.
由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.
2.在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
3.极差、方差、标准差是描述数据的离散程度的,即各数据与其平均数的离散程度.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
答案:
2.2.2 用样本的数字特征估计总体的数字特征
知识梳理
1.(1)最多 (2)中间 ①中间位置的 ②平均数 (3)① ②总体中 样本中
2.(1) (2)[(x1-)2+(x2-)2+…+(xn-)2]
作业设计
1.B [A中平均值和方差是数据的两个特征,不存在这种关系;C中求和后还需取平均数;D中方差越大,射击越不平稳,水平越低.]
2.D [由题意a=(16+18+15+11+16+18+18+17+15+13)==15.7,
中位数为16,众数为18,即b=16,c=18,
∴c>b>a.]
3.B [方差或标准差越小,数据的离散程度越小,表明发挥得越稳定.
∵5.09>3.72,故选B.]
4.D [s=[9x+9x+…+9x-n(3)2]=9·(x+x+…+x-n
2)=9·s2(s为新数据的方差).]
5.C [由题意=(84+84+86+84+87)=85.
s2=[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]=(1+1+1+1+4)==1.6.]
6.B [样本A数据均小于或等于10,样本B数据均大于或等于10,故A又样本B波动范围较小,故sA>sB.]
7.91
解析 由题意得
8.甲
解析 甲=9,=0.4,乙=9,=1.2,故甲的成绩较稳定,选甲.
9.0.19
解析 这21个数的平均数仍为20,从而方差为×[20×0.2+(20-20)2]≈0.19.
10.解 由折线图,知
甲射击10次中靶环数分别为:
9,5,7,8,7,6,8,6,7,7.
将它们由小到大重排为:5,6,6,7,7,7,7,8,8,9.
乙射击10次中靶环数分别为:
2,4,6,8,7,7,8,9,9,10.
也将它们由小到大重排为:2,4,6,7,7,8,8,9,9,10.
(1)甲=×(5+6×2+7×4+8×2+9)=
=7(环),
乙=×(2+4+6+7×2+8×2+9×2+10)=
=7(环),
s=×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]
=×(4+2+0+2+4)
=1.2,
s=×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2]
=×(25+9+1+0+2+8+9)
=5.4.
根据以上的分析与计算填表如下:
平均数
方差
中位数
命中9环及9环以上的次数
甲
7
1.2
7
1
乙
7
5.4
7.5
3
(2)①∵平均数相同,
<,
∴甲成绩比乙稳定.
②∵平均数相同,
甲的中位数<乙的中位数,
∴乙的成绩比甲好些.
③∵平均数相同,命中9环及9环以上的次数甲比乙少,
∴乙成绩比甲好些.
④甲成绩在平均数上下波动;而乙处于上升势头,从第四次以后就没有比甲少的情况发生,乙较有潜力.
11.解 (1)平均工资即为该组数据的平均数
=×(3
000+450+350+400+320+320+410)
=×5
250=750(元).
(2)由于总经理的工资明显偏高,所以该值为极端值,因此由(1)所得的平均工资不能反映一般工作人员一周的收入水平.
(3)除去总经理的工资后,其他工作人员的平均工资为:′=×(450+350+400+320+320+410)
=×2
250=375(元).
这个平均工资能代表一般工作人员一周的收入水平.
12.解 设第一组20名学生的成绩为xi(i=1,2,…,20),
第二组20名学生的成绩为yi(i=1,2,…,20),
依题意有:=(x1+x2+…+x20)=90,
=(y1+y2+…+y20)=80,故全班平均成绩为:
(x1+x2+…+x20+y1+y2+…+y20)
=(90×20+80×20)=85;
又设第一组学生成绩的标准差为s1,第二组学生成绩的标准差为s2,则s=(x+x+…+x-202),
s=(y+y+…+y-202)
(此处,=90,=80),又设全班40名学生的标准差为s,平均成绩为(=85),故有
s2=(x+x+…+x+y+y+…+y-402)
=(20s+202+20s+202-402)
=(62+42+902+802-2×852)=51.
s=.
所以全班同学的平均成绩为85分,标准差为.一、选择题(每小题5分,共20分)
1.已知一组数据为20,30,40,50,50,60,70,80,其中平均数、中位数和众数的大小关系是( )
A.平均数>中位数>众数
B.平均数<中位数<众数
C.中位数<众数<平均数
D.众数=中位数=平均数
解析: 由所给数据知,众数为50,中位数为50,平均数为50,所以众数=中位数=平均数.故选D.
答案: D
2.(2015·青岛高一期中)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示),设甲、乙两组数据的平均数分别为x甲,x乙,中位数分别为m甲,m乙,则( )
A.甲<乙,m甲>m乙
B.甲<乙,m甲<m乙
C.甲>乙,m甲>m乙
D.甲>乙,m甲<m乙
解析: 由题中茎叶图知,甲的平均数为(5+6+8+10+10+14+18+18+22+25+27+30+30+38+41+43)÷16=21.5625,
乙的平均数为(10+12+18+20+22+23+23+27+31+32+34+34+38+42+43+48)÷16=28.5625,
所以甲<乙.
甲的中位数为(18+22)÷2=20,
乙的中位数为(27+31)÷2=29,
所以m甲<m乙.故选B.
答案: B
3.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为( )
分数
5
4
3
2
1
人数
20
10
30
30
10
A.
B.
C.3
D.
解析: 因为==3.
所以s2=[(x1-)2+(x2-)2+…+(xn-)2]=
(20×22+10×12+30×12+10×22)==,
所以s=.故选B.
答案: B
4.(2015·潍坊高一期中)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
则7个剩余分数的方差为( )
A.
B.
C.36
D.
解析: 由题图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x=91×7,解得x=4.故s2=[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=.故选B.
答案: B
二、填空题(每小题5分,共15分)
5.某校从参加高一年级期末考试的学生中抽出60名学生,将其成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后画出如下频率分布直方图.估计这次考试的平均分为________.
解析: 利用组中值估算抽样学生的平均分.
45·f1+55·f2+65·f3+75·f4+85·f5+95·f6=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71,
平均分是71分.
答案: 71分
6.甲、乙两人在相同的条件下练习射击,每人打5发子弹,命中的环数如表:
甲:6,8,9,9,8;
乙:10,7,7,7,9.
则两人的射击成绩较稳定的是________.
解析: 由题意求平均数可得
x甲=x乙=8,s=1.2,s=1.6,
s<s,所以甲稳定.
答案: 甲
7.若40个数据的平方和是56,平均数是,则这组数据的方差是________,标准差是________.
解析: 设这40个数据为x1,x2,…,x40,
则s2=
=eq
\b\lc\[\rc\](\a\vs4\al\co1((x+x+…+x)+40×\b\lc\(\rc\)(\a\vs4\al\co1(\f(\r(2),2)))\s\up12(2)-2×\f(\r(2),2)(x1+x2+…+x40)))
=×
==,
所以s=.
答案:
三、解答题(每小题10分,共20分)
8.如图所示的是甲、乙两人在一次射击比赛中中靶的情况(击中靶中心的圆面为10环,靶中各数字表示该数字所在圆环被击中时所得的环数),每人射击了6次.
(1)请用列表法将甲、乙两人的射击成绩统计出来;
(2)请用学过的统计知识,对甲、乙两人这次的射击情况进行比较.
解析: (1)甲、乙两人的射击成绩统计表如下:
环数
6
7
8
9
10
甲命中次数
0
0
2
2
2
乙命中次数
0
1
0
3
2
(2)
甲=×(8×2+9×2+10×2)=9(环),
乙=×(7×1+9×3+10×2)=9(环),
s=×[(8-9)2×2+(9-9)2×2+(10-9)2×2]=,
s=×[(7-9)2+(9-9)2×3+(10-9)2×2]=1,
因为甲=乙,s所以甲与乙的平均成绩相同,但甲的发挥比乙稳定.
9.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值;
(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;
(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.
分数段
[50,60)
[60,70)
[70,80)
[80,90)
x∶y
1∶1
2∶1
3∶4
4∶5
解析: (1)由频率分布直方图知(0.04+0.03+0.02+2a)×10=1,
所以a=0.005.
(2)55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.
所以平均分为73分.
(3)分别求出语文成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为0.05×100=5,0.4×100=40,0.3×100=30,0.2×100=20.
所以数学成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为:5,20,40,25.所以数学成绩在[50,90)之外的人数有100-(5+20+40+25)=10(人).2.2用样本估计总体(三)
(
)问题提出
(
)1.
对一个未知总体,我们常用样本的频率分布估计总体的分布,其中表示样本数据的频率分布的基本方法有哪些?
(
)频率分布直方图、频率分布表、频率分布折线图、茎叶图
(
)2.
美国NBA在2006——2007年度赛季中,甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:
(
)甲运动员得分:12,15,20,25,31,30,
36,36,37,39,44,49.
(
)乙运动员得分:8,13,14,16,23,26,
28,38,39,51,31,39.
(
)如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征估计总体的数字特征.
(
)知识探究(一):众数、中位数和平均数
(
)思考1:以上两组样本数据如何求它们的众数、中位数和平均数?
(
)思考2:在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么?
(
)
思考3:中位数左右两侧的直方图的面积应有什么关系?
(
)思考4:在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此估计总体的中位数是什么?
(
)0.5-0.04-0.08-0.15-0.22=0.01,0.5×0.01÷0.25=0.02,中位数是2.02.
(
)思考5:平均数是频率分布直方图的“重心”,从直方图估计总体在各组数据内的平均数分别为多少?
(
)0.25,0.75,1.25,1.75,2.25,
2.75,3.25,3.75,4.25.
(
)思考6:将频率分布直方图中每个小矩形的
面积与小矩形底边中点的横坐标之积相加,
就是样本数据的估值平均数.
由此估计总体的平均数是什么?
(
)0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×06+3.75×0.04+4.25×0.02=2.02(t).
(
)平均数是2.02.
(
)思考7:从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?
(
)频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估值与数据分组有关.
(
)注:
在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征.
(
)思考8
(1)一组数据的中位数一般不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?
(
)如:样本数据收集有个别差错不影响中位数;大学毕业生凭工资中位数找单位可能收入较低.
(
)(2)样本数据的平均数大于(或小于)中位数说明什么问题?
(
)平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值.
(
)(3)你怎样理解“我们单位的收入水平比别的单位高”这句话的含义?
(
)这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位数或平均数.
样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.
平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.
知识探究(二):标准差
思考1:在一次射击选拔赛中,甲、乙两名运动员各射击10次,每次命中的环数如下:
甲:7
8
7
9
5
4
9
10
7
4
乙:9
5
7
8
7
6
8
6
7
7
甲、乙两人本次射击的平均成绩分别为多少环?
思考2:甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?
甲的成绩比较分散,极差较大,乙的成绩相对集中,比较稳定.
思考3:对于样本数据x1,x2,…,xn,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?
思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s表示.假设样本数据x1,x2,…,xn的平均数为,则标准差的计算公式是:
那么标准差的取值范围是什么?标准差为0的样本数据有何特点?
s≥0,标准差为0的样本数据都相等.
思考5:对于一个容量为2的样本:x1,x2(x1标准差越大离散程度越大,数据较分散;
标准差越小离散程度越小,数据较集中在平均数周围.
知识迁移
计算甲、乙两名运动员的射击成绩的标准差,比较其射击水平的稳定性.
甲:7
8
7
9
5
4
9
10
7
4
乙:9
5
7
8
7
6
8
6
7
7
课堂小结
用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据.
2.
平均数对数据有“取齐”的作用,代表一组数据的平均水平.
3.
标准差描述一组数据围绕平均数波动的幅度.在实际应用中,我们常综合样本的多个统计数据,对总体进行估计,为解决问题作出决策.
作业:
《习案》作业二十、作业二十一