1.5.2 估计总体的数字特征
1.6
统计活动:结婚年龄的变化
教案
●三维目标
1.知识与技能
(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差.
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.
(3)会用样本的基本数字特征估计总体的基本数字特征.
(4)形成对数据处理过程进行初步评价的意识.
2.过程与方法
在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.
3.情感、态度与价值观
会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.
●重点难点
重点:用样本平均数和标准差估计总体的平均数与标准差.
难点:能应用相关知识解决简单的实际问题.
本节教学设计依据课程标准,在义务教育阶段的基础上,进一步掌握平均数、中位数、众数、极差、方差、标准差的计算、意义和作用.通过具体的实例,让学生理解数字特征的意义,并能选择适当的数字特征来表达数据的信息.
(教师用书独具)
●教学建议
学生已经通过实例,学均数、中位数、众数、极差、方差等,并能解决简单的实际问题.在这个基础上高中阶段还将进一步学习标准差,并在学习中不断地体会它们各自的特点,在具体的问题中根据情况有针对性地选择一些合适的数字特征.
●教学流程
创设问题情境,通过样本的数据对总体的数字特征进行研究 引导学生通过对众数、中位数、平均数的研究将样本数据汇总为一个数值,成为样本数据的“中心点”,通过对标准差、方差的研究描述样本数据的离散程度 通过例1及变式训练,使学生掌握由频率分布直方图求样本平均数、众数和中位数的方法 通过例2及变式训练,使学生掌握由统计数据计算样本标准差、方差的方法 通过例3及变式训练,使学生掌握用标准差或方差估计总体数字特征的方法 归纳整理进行课堂小结,整体把握本节知识 完成当堂双基达标,巩固所学知识并进行反馈、矫正
课标解读
1.会用样本的数字特征估计总体的数字特征(重点).2.体会数字特征的随机性和对实际问题进行判断决策时的应用(难点).3.了解收集数据的方式,体会收集数据的过程.
知识1
样本平均数、样本的方差与标准差
n个样本数据x1,x2,…,xn的平均数
=(x1+x2+…+xn),则有n=x1+x2+…+xn.
设样本的元素为x1,x2,…,xn,样本的平均数为,则样
本的方差s2=[(x1-)2+(x2-)2+…+(xn-)2]
.样本方差的算术平方根即为样本的标准差,即s=.
知识2
统计活动
统计活动的步骤:
(1)明确调查的目的,确定调查的对象.
(2)利用随机抽样抽取样本,收集数据.
(3)整理数据,用表格来表示数据.
(4)分析数据,其方法有两种:一是用统计图表来分析,二是计算数据特征.
(5)作出推断,通过分析数据作出推断.
类型1
由频率分布直方图求样本平均
数、众数和中位数
一个社会调查机构就某地居民的月收入调查了1
000人,并根据所得数据画出样本频率分布直方图(如图1-6-1所示).
图1-6-1
试根据上图,求该地居民月收入的众数、中位数和平均数.
【思路探究】 解答本题可以利用众数、中位数和平均数与频率分布直方图的关系来求.众数可从图中直接求出,中位数、平均数需根据图中信息按定义计算.
【自主解答】 (1)从图中可知,组距为500,[2
000,2
500)和[2
500,3
000)的值一样,故众数是2
500元;
(2)求中位数时,由中位数所在位置,划一直线将整个面积划分为相等的两部分.总的值=0.000
1+0.000
2+0.000
3+0.000
4+0.000
5+0.000
5=0.002.相应一半的值为0.001,[1
000,2
000)的和为0.000
6,故此线在[2
000,2
500)这组距间的=处,其值为2
000+×500=2
400(元).
(3)求平均数时,可用各组中值乘以频率来计算,故平均数为1
250×0.000
2×500+1
750×0.000
4×500+2
250×0.000
5×500+2
750×0.000
5×500+3
250×0.000
3×500+3
750×0.000
1×500=(0.25+0.7+1.125+1.375+0.975+0.375)×500=2
400(元).
1.利用频率分布直方图求样本的数字特征就要清楚它们之间的联系,例如:众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标.对于中位数,由于样本中的个体有50%小于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图面积应该相等,由此可以估计样本的中位数的值.
2.利用直方图求得的众数、中位数和平均数均是其近似值,这是因为直方图只是直观地表明分布的特征,但从直方图本身得不到原始数据的内容,所以由直方图得到的众数、中位数与样本平均数往往与由实际数据得出的不一致,但它们可粗略估计其众数、中位数与样本平均数.
从高三抽出50名学生参加数学竞赛,由成绩得到如图1-6-2的频率分布直方图:
图1-6-2
试利用频率分布直方图求:
(1)这50名学生成绩的众数与中位数;
(2)这50名学生的平均成绩.
【解】 (1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形框的中间值的横坐标即为所求,所以众数应为75.
由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.
∵0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,
∴前三个小矩形面积的和为0.3.
而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,
∴中位数应位于第四个小矩形内.
设其底边为x,高为0.03,
∴令0.03x=0.2得x≈6.7,
故中位数应为70+6.7=76.7≈77.
(2)样本平均数应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可.
∴平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)≈74,
∴众数是75,中位数约为77,平均成绩约为74.
类型2
计算样本的标准差(方差)
某班40人随机平均分成两组,两组学生一次考试的成绩情况见下表:
统计量组别
平均分数
标准差
第一组
90
6
第二组
80
4
求全班的平均成绩和标准差.
【思路探究】 由样本的数字特征(平均数、标准差)计算全班的数字特征(平均数和标准差).
【自主解答】 设第一组20名学生的成绩为
xi(i=1,2,…,20),
第二组20名学生的成绩为yi(i=1,2,…,20).
依题意有:(x1+x2+…+x20)=90,
(y1+y2+…+y20)=80,
故全班平均成绩为:
(x1+x2+…+x20+y1+y2+…+y20)
=(90×20+80×20)=85.
又设第一组学生成绩的标准差为s1,平均数为;
第二组学生成绩的标准差为s2,平均数为,
则s=[(x1-)2+(x2-)2+…+(x20-)2]
=[x+x+…+x+202-2(x1+x2+…+x20)]
=(x+x+…+x-202),
s=[(y1-)2+(y2-)2+…+(y20-)2]
=[y+y+…+y+202-2(y1+y2+…+y20)]
=(y+y+…+y-202).
又设全班40名学生的标准差为s,
平均成绩0=85,
故有s2=(x+x+…+x+y+y+…+y-40)
=(20s+202+20s+202-40)
=(62+902+42+802-2×852)=51,
则s=.
1.本题中计算全班的平均成绩和标准差时用到了整体思想.
2.求样本数据x1,x2,…,xn的标准差的步骤
(1)求平均数;
(2)求方差s2=[(x1-)2+(x2-)2+…+(xn-)2];
(3)s2的算术根,即为标准差s.
3.方差公式的变形
s2=[(x1-)2+(x2-)2+…+(xn-)2]
=[(x+x+…+x)-n2]
=(x+x+…+x)-2.
某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:
学生
1号
2号
3号
4号
5号
甲班
6
7
7
8
7
乙班
6
7
6
7
9
则以上两组数据的方差中较小的一个为s2=________________________________________________________________________.
【解析】 甲==7,
s==.
乙==7,
s==.
【答案】
类型3
估计总体的数字特征
要从甲、乙两名划艇运动员中选拔一名去参加比赛,为此对甲、乙两人在相同的条件下进行了6次测试,测得他们最大速度(m/s)的数据如下:
甲:27,38,30,37,35,31;乙:33,29,38,34,28,36.
这两名划艇运动员谁更优秀?
【思路探究】 通过样本的平均数和方差估计总体的平均数和方差,当总体的平均数相差无几时,总体的方差小的成绩稳定,更优秀.
【自主解答】 甲=(27+38+30+37+35+31)=33,
乙=(33+29+38+34+28+36)=33.
由此估计两人划艇的最大速度的平均数相同.在这种情况下要进一步比较两人成绩的稳定程度.
s=[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]≈15.67,
s=[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]≈12.67.
由此估计甲运动员划艇的最大速度的方差大于乙运动员划艇的最大速度的方差,所以乙的成绩要比甲的成绩稳定一些,即乙比甲更优秀.
1.由于方差是每一个数据与平均数的差的平方和的平均数,故要特别细心.数据上的细小差别即可引起结果的大变化.
2.对两个样本进行评比时,先比较它们的平均值,再比较它们的方差(标准差).
甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2):
品种
第一年
第二年
第三年
第四年
第五年
甲
9.8
9.9
10.1
10
10.2
乙
9.4
10.3
10.8
9.7
9.8
根据这组数据判断应该选择哪一种小麦进行推广.
【解】 甲种冬小麦的平均产量
甲==10,
乙种冬小麦的平均产量
乙==10,
则甲、乙两种冬小麦平均单位面积产量相同.
甲种冬小麦平均单位面积产量的方差为
s=×[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]=0.02,
乙种冬小麦产量的方差为
s=×[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244,
则s=0.02所以甲种小麦的平均单位面积产量比较稳定.
因此选择甲种小麦进行推广.
相关联的两个样本的数据特征搞错
一组数据的方差是s2,将这一组数据中的每一个数都乘以2,得到一组新数据,其方差是( )
A.s2 B.2s2
C.4s2
D.s2
【错解】 B
【错因分析】 因为本题中新数据的每一个数都是原数据的2倍,因而盲目地选B得到方差也是原方差的2倍,事实上,若新样本中的每一个数据是原样本中每个数据的2倍,则新样本的平均数是原样本平均数的2倍,方差为原来的4倍,标准差为原来的2倍.
【防范措施】 正确运用平均数公式和方差公式进行计算、推导和证明,才能得到正确的结论,并由此做出判断.
【正解】 设每一组数据x1,x2,…,xn,则s2=.将每一个数乘以2,则′=2.
所以s′2
=
=4·=4s2.
【答案】 C
1.一种思想
用样本估计总体是统计的基本思想.
2.一种方法
评比两个样本时,先比较它们的平均数,再比较其方差(或标准差).
3.三个特征
利用频率分布直方图估计样本的数字特征:
(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数.
(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.
(3)众数:最高的矩形的中点的横坐标.
1.甲、乙两台机床同时生产一种零件,现要检验它们的运行情况,统计10天中两台机床每天生产次品数分别为甲:0,1,0,2,2,0,3,1,2,4;乙:2,3,1,1,0,2,1,1,0,1,则生产次品数较少的为( )
A.甲 B.乙
C.相同
D.不能比较
【解析】 甲=(0+1+0+2+2+0+3+1+2+4)=1.5,
乙=(2+3+1+1+0+2+1+1+0+1)=1.2.
【答案】 B
2.在样本标准差的计算公式s=
中,数字10和20分别表示样本的( )
A.容量,方差
B.平均数,容量
C.容量,平均数
D.标准差,平均数
【解析】 对照标准差的计算公式
s=
可知:10是样本容量,20是样本平均数.
【答案】 C
3.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1.8,全年比赛进球个数的标准差为0.3.下列说法正确的命题序号为________________________________________________________________________.
①甲队的进球技术比乙队好;②乙队发挥比甲队稳定;
③乙队几乎每场都进球;④甲队的表现时好时坏.
【解析】 据已知的平均数及标准差知①②③④都是正确的命题.
【答案】 ①②③④
4.从1
000个零件中抽取10件,每件长度如下(单位:mm):
22.36 22.35 22.33 22.35 22.37
22.34 22.38 22.36 22.32 22.35
试估计总体的平均数和标准差.
【解】 样本的平均数=(22.36+22.35+…+22.32+22.35)=22.351(mm).
标准差
s=
=0.017(mm).
由此可估计总体(1
000个零件的长度)的平均数为22.351
mm,标准差为0.017
mm.
一、选择题
1.若样本1+x1,1+x2,1+x3,…,1+xn的平均数是10,方差为2,则对于样本2+x1,2+x2,…,2+xn,下列结论正确的是( )
A.平均数为10,方差为2
B.平均数为11,方差为3
C.平均数为11,方差为2
D.平均数为12,方差为4
【解析】 由已知(1+x1+1+x2+…+1+xn)=10,
则(2+x1+2+x2+…+2+xn)
=(1+x1+1+x2+…+1+xn+n)
=(1+x1+1+x2+…+1+xn)+1=10+1=11,
即2+x1,2+x2,…,2+xn的平均数是11.
又∵[(1+x1-10)2+(1+x2-10)2+…+(1+xn-10)2]=2.
∴[(2+x1-11)2+(2+x2-11)2+…+(2+xn-11)2]=2,即2+x1,2+x2,…,2+xn的方差为2.故选C.
【答案】 C
2.甲、乙、丙三位同学分别在10次相同的数学测验中,其数学成绩的方差分别是s甲=3.2,s乙=0.37,s丙=2.5,则数学成绩最稳定的是( )
A.甲 B.乙 C.丙 D.不确定
【解析】 ∵s乙<s甲,s乙<s丙,∴乙同学的数学成绩最稳定.
【答案】 B
3.(2012·湖北高考)容量为20的样本数据,分组后的频数如下表:
分组
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
[60,70)
频数
2
3
4
5
4
2
则样本数据落在区间[10,40)的频率为( )
A.0.35
B.0.45
C.0.55
D.0.65
【解析】 由表知[10,40)的频数为2+3+4=9,
所以样本数据落在区间[10,40)的频率为=0.45.
【答案】 B
4.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图1-6-3所示.根据此图,估计该校2
000名高中男生中体重大于70.5千克的人数为( )
图1-6-3
A.300
B.360
C.420
D.450
【解析】 由图得100名高中男生体重大于70.5千克的频率是(0.04+0.034+0.016)×2=0.18.
故该校2
000名男生中体重大于70.5千克的频率是0.18,人数为2
000×0.18=360.
【答案】 B
5.对“小康县”的经济评价标准:①年人均收入不小于7
000元;②年人均食品支出不大于收入的35%.某县有40万人口,年人均收入如下表所示,年人均食品支出如图1-6-4所示.则该县( )
年人均收入(元)
0
2
000
4
000
6
000
8
000
10
000
12
000
16
000
人数(万人)
6
3
5
5
6
7
5
3
图1-6-4
A.是小康县
B.达到标准①,未达到标准②,不是小康县
C.达到标准②,未达到标准①,不是小康县
D.两个标准都未达到,不是小康县.
【解析】 由图表可知年人均收入为(2
000×3+4
000×5+6
000×5+8
000×6+10
000×7+12
000×5+16
000×3)÷40=7
050(元)>7
000元,达到了标准①;年人均食品支出为(1
400×3+2
000×5+2
400×13+3
000×10+3
600×9)÷40=2
695(元),则年人均食品支出占收入的×100%≈38.2%>35%,未达到标准②.
所以不是小康县.
【答案】 B
二、填空题
6.(2012·山东高考)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5
℃的城市个数为11,则样本中平均气温不低于25.5
℃的城市个数为________.
图1-6-5
【解析】 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.
【答案】 9
7.某学校高一(5)班,在一次数学测验中,全班数学成绩的平均分为91分,其中某生得分为140分,是该班的最高分.若不包括该生的成绩,其他同学在这次测验中的平均分为90分,则该班学生的总人数为______.
【解析】 设该班共有学生n人,每人的数学成绩分别为x1,x2,…,xn,
其中xn=140,
由题意知=91,
=90,
∴90(n-1)+140=91n,
解得n=50.
【答案】 50
8.某医院急救中心关于病人等待急诊的记录如下表:
等待时间(分钟)
[0,5)
[5,10)
[10,15)
[15,20)
[20,25]
频数
4
8
5
2
1
用上述分组资料计算出病人平均等待时间的估计值=________,病人等待时间标准差的估计值s=________________________________________________________________________.
【解析】 病人平均等待时间的估计值=(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5(分钟),s2=[(2.5-9.5)2×4+(7.5-9.5)2×8+(12.5-9.5)2×5+(17.5-9.5)2×2+(22.5-9.5)2×1]=28.5,∴s=≈5.34(分钟).
【答案】 9.5分钟 5.34分钟
三、解答题
9.(2013·安徽高考)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图.
图1-6-6
(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);
(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为1,2,估计1-2的值.
【解】 (1)设甲校高三年级学生总人数为n.
由题意知=0.05,
解得n=600.
样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级这次联考数学成绩的及格率为1-=.
(2)设甲、乙两校样本平均数分别为,.
根据样本茎叶图可知30(-)=30-30
=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92=2+49-53-77+2+92=15.
因此-=0.5.
故1-2的估计值为0.5分.
10.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图1-6-7所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.
图1-6-7
求:(1)成绩的众数、中位数;
(2)平均成绩.
【解】 (1)众数是最高矩形的中间值的横坐标,
∴众数为65.
中位数是数据的中间值.由直方图知中位数应在60~70段内.设其底边为x,高为0.04,∴x·0.04=0.2,
∴x=5.故中位数应为60+5=65.
(2)平均数为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67.
11.为了估计一次性木质筷子的用量,2011年从某县共600家高、中、低档饭店中抽取10家进行调查,得到这些饭店每天消耗的一次性筷子的数据如下(单位:盒):
0.6,3.7,2.2,1.5,2.8,1.7,1.2,2.1,3.2,1.0.
(1)通过对样本数据的计算,估计该县2011年共消耗了多少盒一次性筷子?(每年按350个营业日计算)
(2)2012年又对该县一次性木质筷子的用量以同样的方式做了抽样调查,调查结果是10家饭店平均每家每天使用一次性筷子2.42盒,求该县2012比2011年一次性木质筷子用量增加的百分率;
(3)假如让你统计你所在省一年使用一次性木质筷子所消耗的木材量,如何利用统计知识去做?简要地说明你的做法.
【解】 (1)10家饭店每天共消耗20盒,则估计600家饭店每天共消耗20×60=1
200(盒),
从而可估计2011年(350天)共可消耗一次性筷子1
200×350=420
000(盒).
(2)依题意知,2012年比2011年一次性木筷用量增加值为(2.42-2)×600×350=88
200(盒).
∴从2011年到2012年增加的百分率为=21%.
(3)先采用简单随机抽样的方法抽取若干县(市)(作样本),再从这些县(市)中采用分层抽样的方法抽取若干家饭店,统计一次性木质筷子用量的平均数,从而估计总体平均数,再进一步计算所消耗的木材总量.
(教师用书独具)
某学校高一(1)、(2)两班各有49名学生,两班在一次数学测验中的成绩统计如下:
班级
平均分
众数
中位数
标准差
(1)班
79
70
87
19.8
(2)班
79
70
79
5.2
(1)请你对下面的一段话给予简要分析:
(1)班的小刚回家对妈妈说:“昨天的数学测验,全班平均分79分,得70分的人最多,我得了85分,在班里算是上游了!”
(2)请你根据表中的数据,对这两个班的数学测验情况进行简要分析,并提出建议.
【解】 (1)由于(1)班49名学生数学测验成绩的中位数是87,则85分排在全班第25名之后,所以从位次上看,不能说85分是上游,成绩应该属于中游.但也不能以位次来判断学习的好坏,小刚得了85分,说明他对这段的学习内容掌握得较好,从掌握学习的内容上讲,也可以说属于上游.
(2)(1)班的成绩的中位数是87分,说明不低于87分(含87)的人数占一半以上,而平均分为79分,标准差又很大,说明低分也多,两极分化严重,建议加强对学习困难的学生的帮助.
(2)班的中位数和平均数都是79分,标准差又小,说明学生之间差别较小,学习很差的学生少,但学习优异的也很少,建议采取措施提高优秀率.
为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下表:
天数
151~180
181~210
211~240
241~270
271~300
301~330
331~360
361~390
灯管数
1
11
18
20
25
16
7
2
(1)试估计这种日光灯的平均使用寿命;
(2)若定期更换,可选择多长时间统一更换合适?
【解】 (1)各区间的中点值分别为165,195,225,255,285,315,345,375,由此可算得平均数约为165×1%+195×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天).
(2)将各区间的中点值对于此平均数求方差:
×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2
128.60(天2).
故标准差为≈46(天).
所以估计这种日光灯的平均使用寿命约为268天,标准差约为46天,故可在222天到314天左右统一更换较合适.