①了解用样本平均数估计总体平均数
②、掌握全面调查与抽样调查
③、理解分层抽样的步骤
一、随机抽样
像人口普查那样,对每一个调查对象都惊醒调查的方法,称为全面调查,又称普查.在一个调查中,我们把调查对象的全体成为总体,组成总体的每一个调查对象成为个体.
像这样,根据一定目的,从总体中抽取-一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.我们把从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本量.调查样本获得的变量值称为样本的观测数据,简称样本数据.
二、简单的随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n?(1≤n如果抽取是不放回的,且每次抽取时总体内未进人样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.
1、抽签法
(1)概念
先给总体中的N个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌,最后从盒中不放回地逐个抽取号签,知道抽足样本所需要的个数
(2)优缺点
优点:简单易行,当总体较小时,号签搅拌均匀很容易,个体有均等的机会被抽取,从而能保证样本的代表性
缺点:当总体较大时,费时、费力,且号签很难被搅拌均匀,产生的样本代表性差,导致抽样的不公平
2、随机数法
(1)概念
对总体中的N个个体编号,用随机数工具产生编号范围内的整体随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,知道抽足样本所需要的个数,如果生产的随机数有重复,即统一编号被多次抽到,可以剔除重复的编号并产生随机数,直到产生的不同编号个数等于样本所需要的个数
(2)优缺点
优点:简单易行,它很好的解决了抽签法中遇到的当总体个数较多时制签难、号签很难被搅拌均匀的问题
缺点:当总体较大时,需要的样本容量较大时,不太方便
一般地,总体中有N个个体,它们的变量值分别为,,?.,,则称
==
为总体均值,又称总体平均数,如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记?为,,?...,其中;出现的频数:?(i=1,?2,?....k),则总体均值还可以写成加权平均数的形式
=
如果从总体中抽取-一个容量为n的样本,它们的变量值分别?为,,...?,则称
为样本均值,又称样本平均数.在简单随机抽样中,我们常用样本平均数
为样本均值,又称样本平均数.在简单随机抽样中,我们常用样本平均数去估计总体平均数.
三、分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
1.某企业三月中旬生产
,
,
三种产品共3000件,根据分层随机抽样的结果,企业统计员制作了如下的统计表格:
产品类别
产品数量
1300
样本中的数量
130
由于不小心,表格中
,
产品的有关数据已被污染得看不清楚,统计员只记得样本中
产品的数量比样本中
产品的数量多10.根据以上信息,求该企业生产
产品的数量.
【答案】
解:设样本量为
,
则
,
,
在样本中
产品和
产品共有
(件).
设样本中
产品数量为
,则
,
,
该企业生产
产品的数量为
.
【考点】分层抽样方法
【解析】根据题意由分层抽样的定义代入数值计算出结果即可。
2.某企业共有3200名职工,青、老年职工的比例为5∶3∶2,从所有职工中抽取一个样本容易为400的样本,应采用哪些抽样方法更合理?中、青、老年职工应分别抽取多少人?
【答案】
解:∵有明显的层次差别,∴应采用分层抽样.
中、青、老年职工应抽取的人数分别为400×
=200,400×
=120,400×
=80.
【考点】分层抽样方法
【解析】先根据数据特征确定抽样方法,再根据比例求结果
3.16种食品所含的热量值如下:
111?
123?
123?
164?
430?
190?
175?
236
430?
320?
250?
280?
160?
150?
210?
123
(1)求数据的中位数与平均数;
(2)用这两种数字特征中的哪一种来描述这个数据集更合适?
【答案】
(1)解:将数据从小到大排列得:
111,123,123,123,150,160,164,175,190,210,236,250,280,320,430,430.
所以中位数为:
,
平均数为:
;
(2)解:用平均数描述这个数据更合适,理由如下:平均数反映的是总体的一个情况,中位数只是数列从小到大排列得到的最中间的一个数或两个数,所以平均数更能反映总体的一个整体情况.
【考点】众数、中位数、平均数
【解析】(1)根据中位数和平均数的定义计算即可;(2)根据平均数和平均数的优缺点进行选择即可.
4.在2002年春季,一家著名的全国性连锁服装店进行了一项关于当年秋季服装流行色的民意调查,调查者通过向顾客发放饮料,并让顾客通过挑选饮料杯上印着的颜色来对自己喜欢的服装颜色“投票”根据这次调查结果,在某大城市A,服装颜色的众数是红色,而当年全国服装协会发布的是咖啡色
(1)这个结果是否代表A城市的人的想法?
(2)你认为这两种调查的差异是由什么引起的?
.【答案】
解:(1)这个结果只能说明A城市中光顾这家连锁服装店的人,比其他人较少倾向于选择咖啡色,
同时由于光顾连锁店的人是一种方便样本,不能代表A城市其他人的想法;
(2)是由样本的代表性引起的,
因为A城市的调查结果来自于该市光顾这家连锁服装店的人群,这个样本不能很好地代表全国民众的观点.
【考点】收集数据的方法
【解析】(1)这个结果只能代表A城市中光顾这家连锁服装店的人的想法,不能代表A城市其他人的想法;
是由样本的代表性引起的,A城市的调查结果来自于该市光顾这家连锁服装店的人群,不能代表全国民众的观点。
1.构建德智体美劳全面培养的教育体系是我国教育一直以来努力的方向.某中学积极响应党的号召,开展各项有益于德智体美劳全面发展的活动.如图所示的是该校高三(1)、(2)班两个班级在某次活动中的德智体美劳的评价得分对照图(得分越高,说明该项教育越好).下列说法正确的是(???
)
A.?高三(2)班五项评价得分的极差为1.5
B.?除体育外,高三(1)班的各项评价得分均高于高三(2)班对应的得分
C.?高三(1)班五项评价得分的平均数比高三(2)班五项评价得分的平均数要高
D.?各项评价得分中,这两班的体育得分相差最大
2.某班有男生28人,女生16人,用分层抽样的方式从中抽取容量为
的样本,若男生抽取了7人,则
的值为(???
)
A.?10?????????????????????????????????????????B.?11?????????????????????????????????????????C.?12?????????????????????????????????????????D.?14
3.某校学生的男女人数之比为
,按照男女比例通过分层随机抽样的方法抽到一个样本,样本中男生每天运动时间的平均值为100分钟、女生为80分钟.结合此数据,估计该校全体学生每天运动时间的平均值为(???
)
A.?98分钟???????????????????????????????B.?90分钟???????????????????????????????C.?88分钟???????????????????????????????D.?85分钟
4.某公司有员工15名,其中包含经理一名.保洁一名,为了调查该公司员工的工资情况,有两种方案.方案一:调查全部15名员工的工资情况;方案二:收入最高的经理和收入最低的保洁工资不纳入调查范围,只调查其他13名员工的工资.这两种调查方案得到的数据,一定相同的是(???
)
A.?中位数??????????????????????????????????B.?平均数??????????????????????????????????C.?方差??????????????????????????????????D.?极差
参考答案
1.【答案】
C
【解析】
对于A,高三(2)班德智体美劳各项得分依次为9.5,9,9.5,9,8.5,
所以极差为
,A不符合题意;
对于B,两班的德育分相等,B不符合题意;
对于C,高三(1)班的平均数为
,
(2)班的平均数为
,C符合题意;
对于D,两班的体育分相差
,
而两班的劳育得分相差
,
D不符合题意,
2.【答案】
B
【解析】
根据题意可得
,解得
。
3.【答案】
C
【解析】
设样本中男生人数为2a,女生人数为3a,则样本容量为5a,
又男生每天运动时间的平均值为100分钟、女生为80分钟,
所以该校全体学生每天运动时间的平均值为
,
4.【答案】
A
【解析】
由题意,公司15名员工的工资情况组成15个数据,按大小顺序排列,排在中点的数是中位数,取到一个最大值和一个最小值,剩余13个数据按大小顺序排列,排在中间的还是原来的数,所以中位数不变;
平均数是与每一个数据都有关系的量,方差也是与每一个数据都有关系的量,所以会变化;
极差是与最大值和最小值有关系的量,所以也会发生变化.