9.1.2 分层随机抽样
9.1.3 获取数据的途径
课标解读
课标要求
核心素养
1.通过实例,了解分层随机抽样的特点和适用范围.
2.了解分层随机抽样的必要性,掌握各层样本量比例分配的方法.
3.结合具体实例,掌握分层随机抽样的样本均值.
4.知道获取数据的基本途径,包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等.
1.通过对分层随机抽样的应用及获取数据的途径的学习,培养学生数据分析的核心素养.
2.通过学习分层随机抽样中的相关计算,培养学生数学运算的核心素养.
某市为调查中小学生的近视情况,在全市范围内分别抽查了小学生、初中生、高中生三个群体,进而了解中小学生近视的总体情况和三个群体近视情况的差异大小.
问题1:上述问题中样本总体有什么特征?
问题2:若采用简单随机抽样会出现什么结果?
1.分层随机抽样的相关概念
(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行①简单随机抽样,再把所有子总体中抽取的样本②合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)比例分配:在分层随机抽样中,如果每层③样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
2.总体平均数和样本平均数
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n.我们用X1,X2,…,XM表示第1层各个个体的变量值,用x1,x2,…,xm表示第1层样本的各个个体的变量值;用Y1,Y2,…,YN表示第2层各个个体的变量值,用y1,y2,…,yn表示第2层样本的各个个体的变量值,则第1层的总体平均数和样本平均数分别为
==
第2层的总体平均数和样本平均数分别为
==
总体平均数和样本平均数分别为
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此我们可以用
=+
估计总体平均数.
在比例分配的分层随机抽样中,
==,
可得④+=⑤+=.
因此,在比例分配的分层随机抽样中,可以直接用样本平均数估计总体平均数.
思考1:分层随机抽样的总体具有什么特性?
思考2:简单随机抽样和分层随机抽样有什么区别和联系?
3.获取数据的基本途径
获取数据的
基本途径
适用类型
注意问题
通过调查获取数据
对于有限总体问题,我们一般通过抽样调查或普查的方法获取数据
要充分有效地利用背景信息选择或创建更好的抽样方法,并有效避免抽样过程中的人为错误
通过试验获取数据
没有现存的数据可以查询
严格控制试验环境,通过精心的设计安排试验,以提高数据质量
通过观察获取数据
自然现象
要通过长久的持续观察获取数据
通过查询获得数据
众多专家研究过,其收集的数据有所存储
必须根据问题背景知识“清洗”数据,去伪存真
思考3:《中国统计摘要》和《中国统计年鉴》属于哪种获取数据的途径?
思考4:要了解一种新型灯管的寿命,能通过观察获取数据吗?
探究一 对分层随机抽样的理解
例1 某社区有500户家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户.为了调查社会购买力的某项指标,要从中抽取一个容量为100的样本,记作①;某学校高一年级有18名女排运动员,要从中选出4人调查训练情况,记作②.那么完成上述两项调查应分别采用的抽样方法是( )
A.①用简单随机抽样法,②用分层随机抽样法
B.①用分层随机抽样法,②用简单随机抽样法
C.①②都用分层随机抽样法
D.①②都用简单随机抽样法
1-1 某校高三年级有男生500人,女生400人,为了解该年级学生的体重状况,从男生中随机抽取25人,女生中随机抽取20人进行调查.这种抽样方法是( )
A.分层随机抽样
B.抽签法
C.随机数法
D.其他随机抽样
探究二 分层随机抽样的应用
例2 某单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?
2-1 为了保证采用分层随机抽样方法时每个个体等可能地被抽取,必须要求( )
A.每层不等可能抽样
B.每层抽取的个体数相等
C.每层抽取的个体可以不一样多,但必须满足ni=n×(i=1,2,…,k)(其中i是层数,n是抽取的样本容量,Ni是第i层中个体的个数,N是总体的容量)
D.只要抽取的样本容量一定,每层抽取的个体数没有限制
探究三 分层随机抽样中的相关计算
例3 (1)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层随机抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为( )
A.101
B.808
C.1
212
D.2
012
(2)将一个总体分为A,B,C三层,其个体数之比为5∶3∶2.若用分层随机抽样的方法抽取容量为100的样本,则应从C中抽取 个个体.?
3-1 (多选题)在《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱.欲以钱多少衰出之,问各几何?”其译文为:今有甲持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共100钱,要按照各人带钱多少的比例进行交税,问三人各应付多少税?则下列说法正确的是( )
A.甲应付51钱
B.乙应付32钱
C.丙应付16钱
D.三者中甲付的钱最多,丙付的钱最少
探究四 获取数据的途径
例4 粮食安全是每一个国家必须高度关注的问题,在现有条件下,降雨量对粮食生产的影响是非常巨大的,某次降雨之后该地气象台播报说本次降雨量是该地有气象记录以来最多的一次,气象台获取这些数据的途径是( )
A.通过调查获取数据
B.通过试验获取数据
C.通过观察获取数据
D.通过查询获得数据
4-1 下列问题:
①某城市元旦前后的气温;②某种新型电器元件使用寿命的测定;③电视台想知道某一个节目的收视率;④银行在收进储户现金时想知道有没有假钞.
其中通过试验获取数据的是( )
A.①②
B.③④
C.②
D.④
1.分层随机抽样,即将相似的个体归入一层,然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体等可能抽样,必须进行( )
A.同一层内等可能抽样
B.同一层内可以不等可能抽样
C.所有层按同一抽样比等可能抽样
D.所有层抽取的个体数量相同
2.某校选修乒乓球课程的学生中,高一年级有30人,高二年级有40人.现用分层随机抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6人,则在高二年级的学生中应抽取的人数为( )
A.6
B.8
C.10
D.12
3.为了了解某市2020年高考各高中学校本科上线人数,某小组收集数据并进行统计,其中获取数据的途径比较合适的是( )
A.通过调查获取数据
B.通过试验获取数据
C.通过观察获取数据
D.通过查询获得数据
4.某校高二年级化生史组合只有2个班,且每班50人,在一次数学测试中,从两个班各抽取了20名学生的数学成绩进行分析,统计得,在该次测试中,两班中各抽取的20名学生的平均成绩分别为110分和106分,则该组合学生的平均成绩约为 分.?
1.
下列数据一般是通过试验获取的是( )
A.某年济南市的降雨量
B.2019年新生儿人口数量
C.某学校高一年级同学的数学测试成绩
D.某种特效中成药的配方
2.“中国天眼”为500米口径球面射电望远镜(Five
hundred
meter
Aperture
Spherical
Telescope,简称FAST),是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是( )
A.通过调查获取数据
B.通过试验获取数据
C.通过观察获取数据
D.通过查询获得数据
3.甲校有3
600名学生,乙校有5
400名学生,丙校有1
800名学生,为统计三校学生某方面的情况,计划采用分层随机抽样法抽取一个容量为90的样本,则应在甲、乙、丙这三校中分别抽取学生( )
A.30人,30人,30人
B.30人,45人,15人
C.20人,30人,10人
D.30人,50人,10人
4.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层随机抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取 名学生.?
5.为制订本市初中七、八、九年级学生校服的生产计划,有关部门准备对180名初中男生的身高做调查,现有三种调查方案:
①测量少年体校中180名男子篮球、排球队员的身高;
②查阅有关外地180名男生身高的统计资料;
③在本市的市区和郊县各任选三所中学,在这六所学校各年级(1)班中,用抽签的方法分别选出10名男生,然后测量他们的身高.
为了达到估计本市初中这三个年级男生身高数据的目的,则上述调查方案比较合理的是 .(填序号)?
6.某分层随机抽样中,有关数据如下表:
样本量
平均数
第1层
45
4
第2层
35
8
此样本平均数为 .?
7.某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人.教育部门为了了解在职人员对学校机构改革的意见,要从中抽取一个容量为20的样本,请利用分层随机抽样的方法抽取,写出抽样过程.
8.为调查某连锁店各分店的经营状况,某统计机构用分层随机抽样的方法,从A,B,C三个城市中抽取若干家分店组成样本进行深入研究,有关数据见下表:(单位:个)
城市
分店数量
抽取数量
A
26
2
B
13
x
C
39
y
则样本容量为( )
A.4
B.6
C.10
D.12
9.(多选题)某公司生产三种型号的轿车,产量分别为1
200辆,6
000辆和2
000辆.为检验该公司的产品质量,公司质监部门要抽取46辆进行检验,则下列说法正确的是( )
A.应采用分层随机抽样抽取
B.应采用抽签法抽取
C.三种型号的轿车依次抽取6辆、30辆、10辆
D.这三种型号的轿车,每一辆被抽到的可能性都是相等的
10.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本.
方法1:采用简单随机抽样的方法,将零件编号00,01,02,…,99,用抽签法抽取20个.
方法2:采用分层随机抽样的方法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.
对于上述问题,下列说法正确的是 .(填序号)?
①无论采用哪种抽样方法,这100个零件中每一个零件被抽到的可能性都是;
②采用不同的方法,这100个零件中每一个零件被抽到的可能性各不相同;
③在上述两种抽样方法中,方法2抽到的样本比方法1抽到的样本更能反映总体特征;
④在上述抽样方法中,方法1抽到的样本比方法2抽到的样本更能反映总体的特征.
11.某武警大队共有第一、第二、第三三支中队,人数分别为30,30,40.为了检测该大队的射击水平,从整个大队用分层随机抽样共抽取了30人进行射击考核,统计得三个中队参加射击比赛的平均环数分别为8.8,8.5,8.1,试估计该武警大队队员的平均射击水平.
15
/
16