第九章 §9.1 随机抽样
9.1.2 分层随机抽样 9.1.3 获取数据的途径
学习目标
XUE XI MU BIAO
1.理解分层随机抽样的概念.
2.掌握用分层随机抽样从总体中抽取样本.
3.掌握两种抽样的区别与联系.
4.了解获取数据的一些基本途径.
内
容
索
引
知识梳理
题型探究
随堂演练
课时对点练
1
知识梳理
PART ONE
知识点一 分层随机抽样
一般地,按 变量把总体划分成若干个 ,每个个体
一个子总体,在每个子总体中独立地进行__________
,再把所有子总体中抽取的样本合在一起作为 ,这样的抽样方法称为分层随机抽样.
(1)每一个子总体称为层,在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为 .
一个或多个
子总体
属于且仅属于
简单随机
抽样
总样本
比例分配
.
思考 分层随机抽样的总体具有什么特点?
答案 个体之间差异较大.
知识点二 获取数据的途径
获取数据的基本途径有 、 、
、 等.
通过调查获取数据
通过试验获取数据
通过观察获取数据
通过查询获得数据
思考辨析 判断正误
SI KAO BIAN XI PAN DUAN ZHENG WU
1.简单随机抽样和分层随机抽样都是等可能抽样.( )
2.分层随机抽样是按一定的比例从各层抽取个体组成样本的抽样.
( )
3.在分层随机抽样时,每层可以不等可能抽样.( )
4.通过网络查询的数据是真实的数据.( )
√
√
×
×
2
题型探究
PART TWO
例1 某中学有老年教师20人,中年教师65人,青年教师95人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是
A.抽签法 B.随机数法
C.分层随机抽样 D.其他抽样方法
一、对分层随机抽样概念的理解
√
解析 由于老年教师、中年教师和青年教师的身体情况会有明显的差异,所以要用分层随机抽样.故选C.
反思感悟
使用分层随机抽样的前提
分层随机抽样的使用前提条件是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.
跟踪训练1 分层随机抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体被等可能抽取,必须进行
A.每层等可能抽样
B.每层可以不等可能抽样
C.所有层按同一抽样比等可能抽样
D.所有层抽取个体数量相同
√
解析 保证每个个体等可能的被抽取是两种基本抽样方式的共同特征,为了保证这一点,分层随机抽样时必须在所有层都按同一抽样比等可能抽样.
二、分层随机抽样的应用
例2 某市的3个区共有高中学生20 000人,且3个区的高中学生人数之比为2∶3∶5,现要从所有学生中抽取一个容量为200的样本,调查该市高中学生的视力情况.
(1)试写出抽样过程;
解 ①由于该市高中学生的视力有差异,按3个区分成三层,用分层随机抽样法抽取样本.
②确定每层抽取的个体数,在3个区分别抽取的学生人数之比也是2∶3∶5,
③在各层分别按简单随机抽样抽取样本.
④综合每层抽样,组成容量为200的样本.
(2)若样本中3个区的高中学生的平均视力分别为4.8,4.8,4.6,试估计该市高中学生的平均视力.
所以估计该市高中学生的平均视力为4.7.
反思感悟
在分层随机抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体容量之比.
跟踪训练2 一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?
解 用分层随机抽样来抽取样本,步骤如下:
(1)分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.
(3)在各层分别按随机数法抽取样本.
(4)汇总每层抽样,组成样本.
三、获取数据的途径
例3 (1)为了研究近年我国高等教育发展状况,小明需要获取近年来我国大学生入学人数的相关数据,他获取这些数据的途径最好是
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
√
解析 因为近年来我国大学生入学人数的相关数据有所存储,
所以小明获取这些数据的途径最好是通过查询获得数据.
(2)下列哪些数据一般是通过试验获取的
A.1988年济南市的降雨量
B.2019年新生儿人口数量
C.某学校高一年级同学的数学测试成绩
D.某种特效中成药的配方
√
解析 某种特效中成药的配方的数据一般通过试验获取.
反思感悟
获取数据的基本途径
获取数据的基本途径
适用类型
注意问题
通过调查
获取数据
对于有限总体问题,一般通过抽样调查或普查的方法获取数据
要充分有效地利用背景信息选择或创建更好的抽样方法,并有效避免抽样过程中的人为错误
通过试验
获取数据
没有现存的数据可以查询
严格控制试验环境,通过精心的设计安排试验,以提高数据质量
通过观察
获取数据
自然现象
借助专业测量设备通过长久的持续观察获取数据
通过查询
获得数据
众多专家研究过,其收集的数据有所存储
必须根据问题背景知识“清洗”数据,去伪存真
跟踪训练3 “中国天眼”为500米口径球面射电望远镜(Five?hundred?meter Aperture Spherical radio Telescope,简称FAST),是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是
A.通过调查获取数据
B.通过试验获取数据
C.通过观察获取数据
D.通过查询获得数据
√
解析 “中国天眼”主要是通过观察获取数据.
3
随堂演练
PART THREE
1
2
3
4
5
1.某校高三年级有男生500人,女生400人,为了解该年级学生的体重状况,从男生中随机抽取25人,从女生中随机抽取20人进行调查.这种抽样方法是
A.分层随机抽样 B.抽签法
C.随机数法 D.其他随机抽样
√
解析 从男生500人中抽取25人,从女生400人中抽取20人,抽取的比例相同,因此用的是分层随机抽样.
2.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层随机抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n等于
A.9 B.10 C.12 D.13
√
1
2
3
4
5
1
2
3
4
5
3.(多选)某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人,甲就读于高一,乙就读于高二.学校计划从这两个年级中共抽取235人进行视力调查,下列说法中正确的有
A.应该采用分层随机抽样
B.高一、高二年级应分别抽取100人和135人
C.乙被抽到的可能性比甲大
D.该问题中的总体是高一、高二年级的全体学生的视力
√
√
√
1
2
3
4
5
解析 由于各年级的年龄段不一样,因此应采用分层随机抽样.
因此高一年级1 000人中应抽取100人,
因此只有C不正确,故应选ABD.
1
2
3
4
5
4.为了了解某市2020年高考各高中学校本科上线人数,收集数据进行统计,其中获取数据的途径采用什么样的方法比较合适
A.通过调查获取数据
B.通过试验获取数据
C.通过观察获取数据
D.通过查询获得数据
√
1
2
3
4
5
5.某校高二年级化生史组合只有2个班,且每班50人,在一次数学测试中,从两个班各抽取了20名学生的数学成绩进行分析,统计得在该次测试中,两班中各抽取的20名学生的平均成绩分别为110分和106分,则该组合学生的平均成绩约为________分.
108
所以该组合学生的平均成绩约为108分.
课堂小结
KE TANG XIAO JIE
1.知识清单:
(1)分层随机抽样.
(2)获取数据的途径.
2.方法归纳:数据分析.
3.常见误区:在分层随机抽样中,每个个体被抽到的可能性相等,与层数及分层无关,每一层的抽样一般采用简单随机抽样.
4
课时对点练
PART FOUR
基础巩固
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1.为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是
A.简单随机抽样 B.按性别分层随机抽样
C.按学段分层随机抽样 D.其他抽样方法
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解析 由于小学、初中、高中三个学段的学生视力差异比较大,
因此,应按照学段进行分层随机抽样,
而男女生视力情况差异不大,不能按照性别进行分层随机抽样.
2.要完成下列两项调查:(1)某社区有100户高收入家庭,210户中等收入家庭,90户低收入家庭,从中抽取100户调查有关消费购买力的某项指标;(2)从某中学高二年级的10名体育特长生中抽取3人调查学习情况.应采用的抽样方法分别是
A.(1)用简单随机抽样,(2)用分层随机抽样
B.(1)用分层随机抽样,(2)用其他抽样方法
C.(1)用分层随机抽样,(2)用简单随机抽样
D.(1)(2)都用分层随机抽样
√
解析 (1)中收入差距较大,采用分层随机抽样较合适;
(2)中总体个数较少,采用简单随机抽样较合适.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
3.下列调查所抽取的样本具有代表性的是
A.利用某地七月份的日平均最高气温值估计该地全年的日平均最
高气温
B.在农村调查市民的平均寿命
C.利用一块实验水稻田的产量估计水稻的实际产量
D.为了了解一批洗衣粉的质量情况,从仓库中任意抽取100袋进行
检验
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解析 A项中某地七月份的日平均最高气温值不能代表全年的日平均最高气温;
B项中在农村调查得到的平均寿命不能代表市民的平均寿命;
C项中实验田的产量与水稻的实际产量相差可能较大,只有D项正确.
√
解析 因为在简单随机抽样时每个个体被抽到的可能性相等,
所以选取分层随机抽样方法抽取样本时,总体中每个个体被抽中的可能性仍为 .
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
5.(多选)某公司生产三种型号的轿车,产量分别为1 200辆,6 000辆和2 000辆,为检验该公司的产品质量,公司质监部门要抽取46辆进行检验,则
A.应采用分层随机抽样抽取
B.应采用抽签法抽取
C.三种型号的轿车依次抽取6辆、30辆、10辆
D.这三种型号的轿车,每一辆被抽到的概率都是相等的
√
√
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解析 由于总体按型号分为三个子总体,所以应采用分层随机抽样抽取,A正确;
设三种型号的轿车依次抽取x辆、y辆、z辆,
所以三种型号的轿车依次抽取6辆、30辆、10辆,故C正确;
由分层随机抽样的定义可知D也正确.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
6.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人,现采用分层随机抽样抽取30人,则抽取的高级职称的人数为________.
3
7.为制定本市初中七、八、九年级学生校服的生产计划,有关部门准备对180名初中男生的身高做调查,现有三种调查方案:
①测量少年体校中180名男子篮球、排球队员的身高;
②查阅有关外地180名男生身高的统计资料;
③在本市的市区和郊县各任选三所中学,在这六所学校各年级(1)班中,用抽签的方法分别选出10名男生,然后测量他们的身高.
为了达到估计本市初中这三个年级男生身高分布的目的,则上述调查方案比较合理的是_____.(填序号)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
③
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解析 ①中,少年体校的男子篮球、排球的运动员的身高普遍高于一般情况,因此不能用测量的结果去估计总体的结果;
②中,外地学生的身高也不能准确地反映本地学生身高的实际情况;
而③中的调查方案比较合理,能达到估计本市初中这三个年级男生身高分布的目的.
8.高一和高二两个年级的同学参加了数学竞赛,高一年级有450人,高二年级有350人,通过分层随机抽样的方法抽取了160个样本,得到两年级的竞赛成绩的平均分分别为80分和90分,则
(1)高一、高二抽取的样本量分别为________;
90,70
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
(2)高一和高二数学竞赛的平均分约为________.
84.375
9.某城市有210家百货商店,其中大型商店20家、中型商店40家、小型商店150家,为了掌握各商店的营业情况,计划抽取一个容量为21的样本,按照分层随机抽样的方法抽取时,各种百货商店分别要抽取多少家?写出抽样过程.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
③采用简单随机抽样的方法在各层中分别抽取大型商店2家、中型商店4家、小型商店15家,这样便得到了所要抽取的样本.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
10.某武警大队共有第一、第二、第三三支中队,人数分别为30,30,40.为了检测该大队的射击水平,从整个大队用分层随机抽样共抽取了30人进行射击考核,统计得三个中队参加射击比赛的平均环数分别为8.8,8.5,8.1,试估计该武警大队队员的平均射击水平.
解 该武警大队共有30+30+40=100(人),
所以估计该武警大队队员的平均射击水平为8.43环.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
综合运用
11.为调查德克士各分店的经营状况,某统计机构用分层随机抽样的方法,从A,B,C三个城市中抽取若干家德克士分店组成样本进行深入研究,有关数据见右表:(单位:个)
则样本量为
A.4 B.6 C.10 D.12
城市
德克士数量
抽取数量
A
26
2
B
13
x
C
39
y
√
解析 设所求的样本量为n,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
12.某公司员工对户外运动分别持“喜欢”“不喜欢”和“一般”三种态度,其中持“一般”态度的比持“不喜欢”态度的多12人,按分层随机抽样方法从该公司全体员工中选出部分员工座谈,如果选出的人有6人对户外运动持“喜欢”态度,有1人对户外运动持“不喜欢”态度,有3人对户外运动持“一般”态度,那么这个公司全体员工中对户外运动持“喜欢”态度的人数为
A.36 B.6 C.12 D.18
√
解析 设持“喜欢”“不喜欢”“一般”态度的人数分别为6x,x,3x,
由题意可得3x-x=12,x=6,所以持“喜欢”态度的有6x=36(人).
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
13.(多选)在分层随机抽样中,每个个体等可能地被抽取,下列说法错误的是
A.每层的个体数必须一样多
B.每层抽取的个体数相等
C.每层抽取的个体数可以不一样多,但必须满足ni= (i=1,2,…,k),
其中k是层数,n是样本量,Ni是第i层所包含的个体数,N是总体容量
D.只要抽取的样本量一定,每层抽取的个体数没有限制
√
√
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解析 每层的个体数不一定都一样多,故A错误;
由于每层的容量不一定相等,若每层抽同样多的个体,从总体来看,各层之间的个体被抽取的可能性就不一样了,故B错误;
对于第i层的每个个体,它被抽到的可能性与层数i无关,即对于每个个体来说,被抽入样本的可能性是相同的,故C正确;
每层抽取的个体数是有限制的,故D错误.
14.某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按
的抽样比用分层随机抽样的方法抽取样本,则应抽取高一学生数为___.
8
解析 若设高一学生数为x,
则高二学生数为x+300,高三学生数为2x,
所以有x+x+300+2x=3 500,解得x=800.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
拓广探究
15.(多选)分层随机抽样是将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,组成一个样本的抽样方法.在《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱.欲以钱多少衰出之,问各几何?”其译文为:今有甲持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共100钱,要按照各人带钱多少的比例进行交税,问三人各应付多少税?则下列说法正确的是
√
√
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解析 依题意由分层随机抽样可知,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
16.某市两所高级中学在暑假联合组织全体教师外出旅游,活动分为两条线路:华东五市游和长白山之旅,且每位教师至多参加了其中的一条线路.在参加活动的教师中,高一教师占42.5%,高二教师占47.5%,高三教师占10%.参加华东五市游的教师占参加活动总人数的 ,且该组中,高一教师占50%,高二教师占40%,高三教师占10%.为了了解各条线路不同年级的教师对本次活动的满意程度,现用分层随机抽样的方法从参加活动的全体教师中抽取一个容量为200的样本.试确定:
(1)参加长白山之旅的高一教师、高二教师、高三教师分别所占的比例;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解 设参加华东五市游的人数为x,参加长白山之旅的高一教师、高二教师、高三教师所占的比例分别为a,b,c,
解得a=40%,b=50%,c=10%.
即参加长白山之旅的高一教师、高二教师、高三教师所占的比例分别为40%,50%,10%.
(2)参加长白山之旅的高一教师、高二教师、高三教师分别应抽取的人数.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
本课结束