用样本估计总体
一、目标与策略
明确学习目标及主要的学习方法是提高学习效率的首要条件,要做到心中有数!
学习目标:
?
在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.
?
通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.
?
正确理解样本数据标准差的意义和作用,学会计算数据的标准差.
?
能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.
?
会用样本的基本数字特征估计总体的基本数字特征.
重点难点:
?
重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.用样本平均数和标准差估计总体的平均数与标准差.
?
难点:能通过样本的频率分布估计总体的分布.能应用相关知识解决简单的实际问题.
学习策略:
?
本课题主要包括两大内容:用样本频率分布估计总体分布、用样本数字特征估计总体数字特征.通过对实际数据的分析,评估现实中的实际问题是数学学科的灵魂,而频率分布直方图、总体密度曲线、茎叶图正是有着这方面的作用,所以在学习过程中要注意理论和实际的结合。
二、学习与应用
(一)简单随机抽样的概念:
一般地,从元素个数为N的总体中
地抽取容量为的样本,如果每一次抽取时总体中的各个个体被抽到的
是
的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本.
(二)系统抽样的概念:
当总体中的个体比较多时,将总体分成
的若干部分,然后按照预先制定的规则,从每一部分中抽取一个
,得到所需要的样本,这样的抽样方法称为系统抽样,也称作
抽样.
(三)分层抽样的概念:
当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个
的几部分,每一部分叫做
,在各层中按层在总体中所占
进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.
知识点一:频率分布的概念
频率分布是指一个样本数据在各个小范围内所占
的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:
(1)计算一组数据中最
值与最
值的差,即求
(2)决定
与
(3)将数据分组
(4)列
分布表
(5)画频率分布直方图
要点诠释:
频率分布直方图的特征:
(1)从频率分布直方图可以清楚的看出数据分布的总体趋势.
(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
知识点二:频率分布折线图、总体密度曲线
(1)频率分布折线图的定义:
连接频率分布直方图中各小长方形上端的
,就得到频率分布折线图.
(2)总体密度曲线的定义:
在样本频率分布直方图中,样本容量
,所分组数
,相应的频率折线图会越来越
于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
要点诠释:
总体密度曲线能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,能够精确的反映一个总体在各个区域内取值的规律.
知识点三:茎叶图
当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.
要点诠释:
茎叶图的特征:
(1)用茎叶图表示数据有两个优点:一是在统计图上没有原始
的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时
,随时
,方便记录与表示.
(2)茎叶图只便于表示
位有效数字的数据,而且茎叶图只方便记录
组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.
知识点四:众数、中位数与平均数
(一)众数
一组数据中出现次数最
的数据叫做众数.如果变量是分类的,用众数是很有必要的.例如班委会要作出一项决定,考察全班同学对它赞成与否就可以用众数.
(二)中位数
将一组数据从
到
依次排列,把中间数据(或中间两数据的
数)叫做中位数.中位数把样本数据分成了相同
的两部分.
(二)平均数
样本数据的算术平均数,即
.
要点诠释:
由于众数仅能刻画某一数据出现的次数较多,中位数对极端值不敏感,而平均数又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准确性.
知识点五:标准差与方差
(一)标准差
样本数据的标准差的算法:
(1)算出样本数据的
.
(2)算出每个样本数据与样本数据
的差:
(3)算出(2)中的
.
(4)算出(3)中n个平方数的
,即为
.
(5)算出(4)中平均数的
,即为
.
其计算公式为:
s=
(二)方差
从数学的角度考虑,人们有时用标准差的平方(即方差)来代替标准差,作为测量样本数据分散程度的工具:
s2=
要点诠释:
在刻画样本数据的
程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.
数据的离散值程度可以用极差、方差或标准差来描述.极差反映了一组数据变化的
;样本方差描述了一组数据围绕
波动的
;样本方差的算术根表示样本的标准差,它也描述了数据对平均数的
程度.
类型一:频率分布表、频率分布直方图
例1.有同一型号的汽车100辆,为了解这种汽车每耗油1L所行路程的情况,现从中随机抽出10辆,在同一条件下进行耗油1L所行路程试验,得到如下样本数据(单位:km):13.7,
12.7,
14.4,
13.8,
13.3,
12.5,
13.5,
13.6,
13.1,
13.4,并分组如下:
分组
频数
频率
合
计
10
1.0
(1)完成上面频率分布表;
(2)根据上表在坐标系中画出频率分布直方图,并根据样本估计总体数据落在中的概率;
(3)根据样本,对总体的期望值进行估计.
思路点拨:统计样本数据在各组的分布情况,用划“正”的方法较快捷.
解析:
总结升华:
.
举一反三:
【变式】下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高
(单位cm)
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)估计身高小于134cm的人数占总人数的百分比.
答案:
类型二:众数、中位数、平均数
例2.为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹的杀伤半径,并列表如下:
(1)在这个问题中,总体、个体、样本和样本容量各是什么?
(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤半径.
思路点拨:本题主要考查总体、个体、样本、样本容量、众数、中位数和平均数的概念.
解析:
总结升华:
(1)
.
(2)
.
举一反三:
【变式】为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.
在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.
答案:
类型三:平均值、方差
例3.皮划艇运动员甲、乙二人在相同的条件下进行了6次测试,测得他们最大速度
(m/s)的数据如下:甲:27,38,30,37,35,31.
乙:33,29,38,34,28,36.根据以上数据,试判断他们谁更优秀.
思路点拨:先分析甲、乙运动员的平均成绩,若平均成绩基本接近,再考虑两运动员的稳定程度.
解析:
总结升华:
.
举一反三:
【变式】某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量,分别记录抽查数据如下:
甲:102,101,99,98,103,98,99;
乙:110,115,90,85,75,115,110.
(1)这种抽样方法是哪一种?
(2)估计甲、乙两个车间产品的平均数与方差,并说明哪个车间产品较稳定?
答案:
类型四:茎叶图
例4.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.
(1)将这两组数据用茎叶图表示;
(2)将这两组数进行比较分析,得到什么结论?
思路点拨:我们要根据电脑杂志、报纸文章把数据分成两类,然后根据众数、中位数进行比较.
解析:
总结升华:
.
举一反三:
【变式1】某赛季甲、乙两名篮球运动员每场比赛得分情况如下:
甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50.
乙的得分:8,13,14,16,23,26,28,33,38,39,51.
试作出两名运动员成绩的茎叶分布图,并对他们的成绩进行比较.
答案:
【变式2】(山东理8)右图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为(
)
A.304.6
B.303.6
C.302.6
D.301.6
答案:
三、总结与测评
要想学习成绩好,总结测评少不了!课后复习是学习不可或缺的环节,它可以帮助我们巩固学习效果,弥补知识缺漏,提高学习能力。
(一)总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去
总体
的分布.
(二)总体的分布分两种情况:当总体中的个体取值很少时,用
图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当
,用各组的频率分布
总体的分布,方法是用频率分布表或频率分布直方图.
(三)在频率分布直方图中,各小长方形的
表示相应的频率,各小长方形的面积和为
,各频数的和等于样本容量,频率=
,这是对频率分布直方图进行分析推理的核心和关键.
(四)关于统计的有关性质及规律:
(1)若的平均数为,那么的平均数为
.
(2)若的方差为s2,那么的方差为
.
(五)为了正确的用样本估计总体,用样本的图、表估计总体的分布,应当做好以下几点:
(1)牢固掌握概念之间、图表之间的区别和联系,及其在实际问题中的应用.
(2)能读懂频率分布表、频率分布直方图、频率分布折线图、总体密度曲线、茎叶图、频率分布扇形图等,会分析图表和处理数据,会解决实际问题,注重能力培养,加大训练力度.
(3)统计离不开数据,计算较繁,应当有意识的培养认真、耐心、细致的学习态度和习惯.
“凡事预则立,不预则废”。科学地预习才能使我们上课听讲更有目的性和针对性。我们要在预习的基础上,认真听讲,做到眼睛看、耳朵听、心里想、手上记。
知识回顾——复习
学习新知识之前,看看你的知识贮备过关了吗?
知识要点——预习和课堂学习
认真阅读、理解教材,尝试把下列知识要点内容补充完整,带着自己预习的疑惑认真听课学习。若有其它补充可填在右栏空白处。
经典例题-自主学习
认真分析、解答下列例题,尝试总结提升各类型题目的规律和技巧,然后完成举一反三。若有其它补充可填在右栏空白处。
90
100
110
120
130
140
150
次数
o
0.004
0.008
0.012
0.016
0.020
0.024
0.028
频率/组距
0.032
0.036
2 9
1
1
5
8
3
0
2
6
3
1
0
2
4
7
总结规律和方法——强化所学
认真回顾总结本部分内容的规律和方法,熟练掌握技能技巧。
11