(共32张PPT)分层随机抽样 获取数据的途径
新课程标准解读 核心素养
1.通过实例,了解分层随机抽样的特点和适用范围,了解分层随机抽样的必要性,掌握各层样本量比例分配的方法 数学建模
2.结合具体实例,掌握分层随机抽样的样本均值 数据分析
3.知道获取数据的基本途径,包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等 数学抽象
某校高一新生共900人,其中男生500人,女生400人.学校现想了解高一新生对文史类课程的看法,以便开设相关选修课程,准备从高一新生中抽取45人进行访谈.
[问题] (1)如果直接采用简单随机抽样,会有什么缺点?
(2)采用怎样的抽样方法较好?
知识点一 分层随机抽样
1.定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为.
2.比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
3.平均数的计算公式
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n.我们用X1,X2,…,XM表示第1层各个个体的变量值,用x1,x2,…,xm表示第1层样本的各个个体的变量值;用Y1,Y2,…,YN表示第2层各个个体的变量值,用y1,y2,…,yn表示第2层样本的各个个体的变量值,则第1层的总体平均数和样本平均数分别为
==i,==i.
第2层的总体平均数和样本平均数分别为
==i,==i.
总体平均数和样本平均数分别为
=,=.
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此我们可以用
=+估计总体平均数.
在比例分配的分层随机抽样中,==,可得+=+=.
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数.
1.分层随机抽样的实施步骤
第一步,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体;
第二步,在每个子总体中独立地进行简单随机抽样;
第三步,把所有子总体中抽取的样本合在一起作为总样本.
2.在比例分配的分层随机抽样中需注意两点
(1)抽样比=;
(2)可以直接用样本平均数估计总体平均数.
1.判断正误.(正确的画“√”,错误的画“×”)
(1)在统计实践中选择哪种抽样方法关键是看总体的个体数的大小.( )
(2)分层随机抽样中,个体数量较少的层抽取的样本量较少,这是不公平的.( )
(3)从全班50名同学中抽取5人调查作业完成情况适合用分层随机抽样.( )
答案:(1)× (2)× (3)×
2.某单位有职工160人,其中业务员104人,管理人员32人,后勤服务人员24人,现用比例分配的分层随机抽样法从中抽取一容量为20的样本,则抽取管理人员有( )
A.3人 B.4人
C.7人 D.12人
解析:选B 由=,设抽取管理人员x人,则=,得x=4.故选B.
知识点二 获取数据的基本途径
获取数据的基本途径 适用类型 注意问题
通过调查获取数据 对于有限总体问题,一般通过抽样调查或普查的方法获取数据 要充分有效地利用背景信息选择或创建更好的抽样方法,并有效地避免抽样过程中的人为错误
通过试验获取数据 没有现存的数据可以查询 严格控制试验环境,通过精心的设计安排试验,以提高数据质量
通过观察获取数据 自然现象 借助专业测量设备通过长久的持续观察获取数据
通过查询获得数据 众多专家研究过,其收集的数据有所存储 必须根据问题背景知识“清洗”数据,去伪存真
利用统计报表和年鉴属于哪种获取数据的途径?
提示:属于通过查询获取数据的途径.
1.为了研究近年我国高等教育发展状况,小明需要获取近年来我国大学生入学人数的相关数据,他获取这些数据的途径最好是( )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
答案:D
2.(多选)影响获取数据可靠程度的因素包括( )
A.获取方法设计 B.所用专业测量设备的精度
C.调查人员的认真程度 D.数据的大小
解析:选ABC 数据的大小不影响获取数据的可靠程度,其他三项均影响获取数据的可靠程度.
3.研究下列问题:
①某城市元旦前后的气温;②某种新型电路元件使用寿命的测定;③电视台想知道某一个节目的收视率;④银行在收进储户现金时想知道有没有假钞.
一般通过试验获取数据的是________.
解析:①通过观察获取数制,③④通过调查获取数据,只有②通过试验获取数据.
答案:②
分层随机抽样的概念
[例1] (链接教科书第184页练习4题)下列问题中,最适合用分层随机抽样抽取样本的是( )
A.从10名同学中抽取3人参加座谈会
B.红星中学共有学生1 600名,其中男生840名,防疫站对此校学生进行身体健康调查,抽取一个容量为200的样本
C.从1 000名工人中,抽取100人调查上班途中所用时间
D.从生产流水线上,抽取样本检查产品质量
[解析] A中总体所含个体无差异且个数较少,适合用简单随机抽样;C和D中总体所含个体无差异且个数较多,不适合分层随机抽样;B中总体所含个体差异明显,适合用分层随机抽样.
[答案] B
分层随机抽样的前提和遵循的两条原则
(1)前提:分层随机抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取;
(2)遵循的两条原则:①每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
②每层样本量与每层个体数量的比等于抽样比.
[跟踪训练]
某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适( )
A.抽签法 B.简单随机抽样法
C.分层随机抽样法 D.随机数法
解析:选C 总体由差异明显的三部分构成,应选用分层随机抽样.故选C.
分层随机抽样中的计算问题
[例2] (链接教科书第184页练习3题)(1)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层随机抽样调查,假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为( )
A.101 B.808
C.1 212 D.2 012
(2)将一个总体分为A,B,C三层,其个体数之比为5∶3∶2.若用分层随机抽样方法抽取容量为100的样本,则应从C中抽取________个个体;
(3)分层随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为________.
[解析] (1)因为甲社区有驾驶员96人,并且在甲社区抽取的驾驶员的人数为12人,
所以甲社区抽取驾驶员的比例为=,
所以驾驶员的总人数为(12+21+25+43)÷=808(人).
(2)因为A,B,C三层个体数之比为5∶3∶2,又有总体中每个个体被抽到的概率相等,所以分层随机抽样应从C中抽取100×=20(个)个体.
(3)=×3+×8=6.
[答案] (1)B (2)20 (3)6
进行分层随机抽样的相关计算时,常用到的关系
(1)=;
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比;
(3)如果总体分为2层,两层包含的个体数分别为M,N,两层抽取的样本量分别为m,n,两层的样本平均数分别为,,两层的总体平均数分别为,,总体平均数为,样本平均数为,
则=+,
=+.
[跟踪训练]
有4万个大于70的两位数,从中随机抽取了3 000个数,统计如下表:
数据x 70<x<79 80<x<89 90<x<99
个数 800 1 300 900
平均数 78.1 85 91.9
请根据表格中的信息,估计这4万个数的平均数约为________.
解析:这3 000个数的平均数为×(78.1×800+85×1 300+91.9×900)=85.23.
于是用样本的平均数去估计总体的平均数,则这4万个数的平均数约为85.23.
答案:85.23
分层随机抽样的方案设计
[例3] 在100个产品中,有一等品20个,二等品30个,三等品50个,现要抽取一个容量为30的样本,请说明抽样过程.
[解] 先将产品按等级分成三层:第一层,一等品20个;第二层,二等品30个;第三层,三等品50个.然后确定每一层抽取的个体数,因为抽样比为=,所以应在第一层中抽取产品20×=6(个),在第二层中抽取产品30×=9(个),在第三层中抽取产品50×=15(个).分别给这些产品编号并贴上标签,用抽签法或随机数法在各层中抽取,得到一等品6个,二等品9个,三等品15个,这样就通过分层随机抽样得到了一个容量为30的样本.
设计分层随机抽样方案的思路
在分层随机抽样中,确定抽样比k是抽样的关键.一般地,按抽样比k=(N为总体容量,n为样本量)在各层中抽取个体,就能确保抽样的公平性.注意在每层抽样时,应灵活采用简单随机抽样的方法.
[跟踪训练]
一个地区共有5个乡镇,人口3万人,其人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.
解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层随机抽样的方法.
具体过程如下:
第一步,将3万人分为5层,一个乡镇为一层;
第二步,按照抽样比求得各乡镇应抽取的人数分别为60,40,100,40,60;
第三步,采用简单随机抽样的方法,按照各层抽取的人数抽取各乡镇的样本;
第四步,将300人合到一起,即得到一个样本.
获取数据途径的方法的设计
[例4] 为了缓解城市的交通拥堵情况,某市准备出台限制私家车的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果能很好地反映该市市民的意愿吗?
[解] (1)一个城市的交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益.为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.
(2)调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该城市的所有市民进行随机抽样调查,不要只关注到拥有私家车的市民.
在统计活动中,尤其是大型的统计活动,为避免一些外界因素的干扰,通常需要确定调查的对象、调查的方法与策略,需要精心设计前期的准备工作和收集数据的方法,然后对数据进行分析,得出统计推断.
[跟踪训练]
为了创建“和谐平安”校园,某校决定在开学前将学校的电灯电路使用情况进行检查,以排除安全隐患,获取电灯电路的相关数据应该用什么方法?为什么?
解:由于一个学校的电灯电路数目不算大,属于有限总体问题,所以应该通过调查获取数据,并且对创建“和谐平安”校园来说,必须排除任一潜在或已存在的安全隐患,故必须用普查的方法.
1.某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从中抽取一个样本量为36的样本,则适合的抽样方法是( )
A.抽签法随机抽样
B.随机数法随机抽样
C.直接运用分层随机抽样
D.先从老年人中剔除1人,再用分层随机抽样
解析:选C 因为总体由差异明显的三部分组成,所以考虑用分层随机抽样.故选C.
2.某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层随机抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( )
A.100 B.150
C.200 D.250
解析:选A 抽样比为=,该校总人数为1 500+3 500=5 000,则=,故n=100.
3.某分层随机抽样中,有关数据如下:
样本量 平均数
第1层 45 4
第2层 35 8
此样本的平均数为________.
解析:=×4+×8=5.75.
答案:5.75
4.为预防某种流感病毒爆发,某生物技术公司研制出一种新流感疫苗,为测试该疫苗的有效性,公司将2 000个流感样本分成三组,测试结果如表:
A组 B组 C组
疫苗有效 673 x y
疫苗无效 77 90 z
已知在全体样本中随机抽取1个,抽到B组疫苗有效的可能性是0.33.
(1)求x的值;
(2)现用分层随机抽样的方法在全体样本中抽取360个测试结果,问应在C组抽取多少个?
解:(1)∵在全体样本中随机抽取1个,抽到B组疫苗有效的可能性是0.33,
∴=0.33,解得x=660.
(2)C组样本个数是y+z=2 000-(673+77+660+90)=500,
用分层随机抽样的方法在全体样本中抽取360个测试结果,应在C组抽取的个数为360×=90.
PAGE
9分层随机抽样 获取数据的途径
[A级 基础巩固]
1.某学校有高级教师50人,中级教师125人,初级教师75人,为了解教师学习十九大报告的情况,使用分层随机抽样的方法,从中抽取50人进行调查,则中级教师被抽取的人数为( )
A.10 B.15
C.20 D.25
解析:选D 抽样比为=,则中级教师被抽取的人数为×125=25.
2.苏州市实施的《苏州市生活垃圾分类管理条例》将城市生活垃圾分为“可回收物”“有害垃圾”“厨余垃圾”和“其他垃圾”四大类.某社区为了分析不同年龄段的人群对垃圾分类知识的了解情况,对辖区内的居民进行分层随机抽样调查.已知该社区的青年人、中年人和老年人分别有800人、900人、700人,若在老年人中的抽样人数是35,则在青年人中的抽样人数是( )
A.20 B.40
C.60 D.80
解析:选B 由题可知抽样比为k==,故在青年人中的抽样人数为800×=40.
3.某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层随机抽样的方法从3个分厂生产的电子产品中共抽取100件进行使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的平均使用寿命分别为980 h,1 020 h,1 032 h,则抽取的100件产品的平均使用寿命为( )
A.1 013 h B.1 014 h
C.1 016 h D.1 022 h
解析:选A 法一:由分层随机抽样的知识可知,从第一、二、三分厂抽取的电子产品数量分别为25件,50件,25件,则抽取的100件产品的平均使用寿命为×(980×25+1 020×50+1 032×25)=1 013(h).
法二:因为第一、二、三分厂的产量之比为1∶2∶1,所以可以根据各层抽取数量所占的比例计算抽取的100件产品的平均使用寿命为×980+×1 020+×1 032=1 013 (h).
4.某校有高一学生n名,其中男生数与女生数之比为6∶5,为了解学生的视力情况,现要求按分层随机抽样的方法抽取一个样本量为的样本,若样本中男生比女生多12人,则n=( )
A.990 B.1 320
C.1 430 D.1 560
解析:选B 设该校高一学生中,男生数为6k,女生数为5k,则解得
5.(多选)某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人.甲就读于高一,乙就读于高二.学校计划从这两个年级中共抽取235人进行视力调查,下列说法中正确的有( )
A.应该采用分层随机抽样法
B.高一、高二年级应分别抽取100人和135人
C.乙被抽到的可能性比甲大
D.该问题中的总体是高一、高二年级的全体学生的视力
解析:选ABD 由于各年级的年龄段不一样,因此应采用分层随机抽样法.由于比例为=,因此高一年级1 000人中应抽取100人,高二年级1 350人中应抽取135人,甲、乙被抽到的可能性都是,因此只有C不正确,故选A、B、D.
6.一支田径队有男运动员56人,女运动员42人,用分层随机抽样的方法从全体运动员中抽出一个容量为28的样本,则从中抽取的男运动员的人数为________.
解析:设抽取的男运动员的人数为x,则抽取的女运动员的人数为28-x,
∴=,解得x=16.
答案:16
7.下列试验适合用抽样调查方法获取数据的序号是________.
①考察一片草皮的平均高度;
②检查某食品单位职工的身体状况;
③考察参加某次考试的3万考生的数学答题情况;
④检验一个人的血液中白细胞的含量是否正常.
解析:①该问题用普查的方法很难实现,适合用抽样调查的方法获取数据;②体检,必须了解每个职工的身体状况,不适合用抽样调查的方法获取数据;③3万考生的答题情况用普查的方法获取数据不合适,适合用抽样调查的方法获取数据;④该问题只能用抽样调查的方法获取数据.
答案:①③④
8.某班45名同学都参加了立定跳远和100米跑两项体育学业水平测试,立定跳远和100米跑合格的人数分别为30和35,两项都不合格的人数为5.现从这45名同学中按测试是否合格分层(分成两项都合格、仅立定跳远合格、仅100米跑合格、两项都不合格四种)抽出9人进行复测,那么抽出来复测的同学中两项都合格的人数为________.
解析:设这两项成绩均合格的人数为x,则立定跳远合格但100米跑不合格的人数为30-x, 则30-x+35+5=45,得x=25,
即这两项成绩均合格的有25人,
则抽出来复测的同学中两项都合格的有9×=5(人).
答案:5
9.某班有40名男生,20名女生,已知男女身高有明显不同,现欲调查平均身高,准备抽取,采用比例分配分层随机抽样方法,抽取男生1名,女生1名,你认为这种做法是否妥当?如果让你来调查,你准备怎样做?
解:这种做法不妥当.原因:取样比例数过小,很难准确反映总体情况,况且男、女身高差异较大,抽取人数相同,也不合理.
考虑到本题的情况,可以采用分层随机抽样,可取抽样比为.
男生抽取40×=8(名),女生抽取20×=4(名),各自用抽签法或随机数法抽取组成样本.
10.某高级中学共有学生3 000名,各年级男、女生人数如下表:
高一年级 高二年级 高三年级
女生 487 x y
男生 513 560 z
已知从全校学生中随机抽取1名学生,抽到高二年级女生的几率是0.18.
(1)问高二年级有多少名女生?
(2)现对各年级用分层随机抽样的方法从全校抽取300名学生,问应从高三年级抽取多少名学生?
解:(1)由=0.18得x=540,所以高二年级有540名女生.
(2)高三年级人数为y+z=3 000-(487+513+540+560)=900.
所以×900=90,故应从高三年级抽取90名学生.
[B级 综合运用]
11.(多选)某公司生产三种型号的轿车,产量分别为1 200辆,6 000辆和2 000辆.为检验该公司的产品质量,公司质监部门要抽取46辆进行检验,则下列说法正确的是( )
A.应采用分层随机抽样抽取
B.应采用抽签法抽取
C.三种型号的轿车依次抽取6辆,30辆,10辆
D.这三种型号的轿车,每一辆被抽到的概率都是相等的
解析:选ACD 由于总体按型号分为三个子总体,所以应采用分层随机抽样抽取,A正确;因为总体量较大,故不宜采用抽签法,所以B错误;设三种型号的轿车依次抽取x辆,y辆,z辆,则有
解得所以三种型号的轿车依次抽取6辆,30辆,10辆,故C正确;由分层随机抽样的意义可知D也正确.
12.分层随机抽样是将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,组成一个样本的抽样方法.在《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其译文为:今有甲持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共100钱,要按照各人带多少的比例进行交税,问三人各应付多少税?则下列说法错误的是( )
A.甲应付51钱
B.乙应付32钱
C.丙应会16钱
D.三者中甲付的钱最多,丙付的钱最少
解析:选B 由分层随机抽样可知,抽样比为=,
则甲应付×560=51(钱);
乙应付×350=32(钱);
丙应付×180=16(钱).
13.高一和高二两个年级的同学参加了数学竞赛,高一年级有450人,高二年级有350人,通过分层随机抽样的方法抽取了160个样本,得到两年级的竞赛成绩的平均数分别为80分和90分,则:
(1)高一、高二抽取的样本量分别为________;
(2)高一和高二数学竞赛的平均分约为________.
解析:(1)由题意可得高一年级抽取的样本量为×450=90,高二年级抽取的样本量为×350=70.
(2)高一和高二数学竞赛的平均分约为w=×80+×90=84.375(分).
答案:(1)90,70 (2)84.375分
14.为了对某课题进行研究,分别从A,B,C三所高校中用分层随机抽样法抽取若干名教授组成研究小组,其中高校A有m名教授,高校B有72名教授,高校C有n名教授(其中0(1)若A,B两所高校中共抽取3名教授,B,C两所高校中共抽取5名教授,求m,n;
(2)若高校B中抽取的教授数是高校A和C中抽取的教授总数的,求三所高校的教授的总人数.
解:(1)∵0(2)∵高校B中抽取的教授数是高校A和C中抽取的教授总数的,
∴(m+n)=72,解得m+n=108,
∴三所高校的教授的总人数为m+n+72=180.
[C级 拓展探究]
15.为了考察某校的教学水平,抽取这个学校高三年级的部分学生的本学年考试成绩.为了全面地反映实际情况,采用以下两种方式进行抽样调查(已知该校高三年级共有20个班,且每班学生已按随机方式编好了学号,假定每班的人数相等):
①从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的成绩;
②把学生按成绩分成优秀、良好、普通三个级别,从其中共抽取100名学生进行考察(已知若按成绩分,该校高三优秀生共150人,良好生共600人,普通生共250人).
根据以上的叙述,试回答下面的问题:
(1)上面两种方式中各采用何种抽取样本的方法?
(2)试分别写出用上面两种抽取方式抽取样本的步骤.
解:(1)上面的两种抽取方式中,第一种方式采用的是简单随机抽样;第二种方式采用的是分层随机抽样和简单随机抽样.
(2)用第一种方式抽样的步骤如下:
第一步,在这20个班中用抽签法任意抽取一个班;
第二步,从这个班中按学号用随机数法或抽签法抽取20名学生,考察其考试成绩.
用第二种方式抽样的步骤如下:
第一步,分层.因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应该把全体学生分成三个层次;
第二步,确定各个层次抽取的人数.因为样本量与总体中的个体数之比为100∶1 000=1∶10,所以在各个层次抽取的个体数依次为=15,=60,=25;
第三步,按层次分别抽取.在优秀生中用简单随机抽样的方法抽取15人,在良好生中用简单随机抽样的方法抽取60人,在普通生中用简单随机抽样的方法抽取25人.
PAGE
6