(共39张PPT)
第九章 统计
9.1 随机抽样
9.1.2 分层随机抽样
9.1.3 获取数据的途径
新课程标准解读 学科核心素养
通过实例,了解分层随机抽样的特点和适用范围,了解分层随机抽样的必要性,掌握各层样本量比例分配的方法. 数学建模
结合具体实例,掌握分层随机抽样的样本均值. 数据分析
知道获取数据的基本途径,包括:统计报表和年鉴、社会调查、试验设计、普查和抽查、互联网等. 数学抽象
教材梳理 明要点
某地区有高中生5 400人,初中生10 900人,小学生11 000人.此地区教育部门为了了解本地区中小学生的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查.你认为应当怎样抽取样本?
问题
(1)如果直接采用简单随机抽样,会有什么缺点?
(2)采用怎样的抽样方法较好?
?情境导入
[提示]
[提示]
(1)当总体是由差异明显的几部分组成时采用简单随机抽样会使样本不具有代表性.
(2)用分层随机抽样.分层随机抽样,每层样本量都与层的大小成比例,具有逐个抽取、等可能性等特点.
知识点一 分层随机抽样
1.定义:一般地,按一个或多个变量把总体划分成若干个________,每个个体_______________一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为_____.,
2.比例分配:在分层随机抽样中,如果每层样本量都与层的大小_________,那么称这种样本量的分配方式为比例分配.
?新知初探
子总体
属于且仅属于
层
成比例
3.平均数的计算公式
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n.我们用X1,X2,…,XM表示第1层各个个体的变量值,用x1,x2,…,xm表示第1层样本的各个个体的变量值;用Y1,Y2,…,YN表示第2层各个个体的变量值,用y1,y2,…,yn表示第2层样本的各个个体的变量值,则第1层的总体平均数和样本平均数分别为
第2层的总体平均数和样本平均数分别为
[提醒]
样本平均数
[提醒]
(1)分层随机抽样的实施步骤:第一步,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体;第二步,在每个子总体中独立地进行简单随机抽样;第三步,把所有子总体中抽取的样本合在一起作为总样本;
知识点二 获取数据的基本途径
获取数据的基本途径 适用类型 注意问题
通过调查获取数据 对于有限总体问题,一般通过抽样调查或普查的方法获取数据 要充分有效地利用背景信息选择或创建更好的抽样方法,并有效避免抽样过程中的人为错误
通过试验获取数据 没有现存的数据可以查询 严格控制试验环境,通过精心的设计安排试验,以提高数据质量
通过观察获取数据 自然现象 借助专业测量设备通过长久的持续观察获取数据
通过查询获得数据 众多专家研究过,其收集的数据有所存储 必须根据问题背景知识“清洗”数据,去伪存真
1.判断
(1)在比例分配的分层随机抽样中,每层被抽到的个体数是一样的.( )
(2)比例分配的分层随机抽样中,每个个体被抽到的可能性不一样.( )
【答案】 (1)× (2)×
?预习自测
【解析】 (1)在比例分配的分层随机抽样中,每层被抽到的个体数由每层个体数占总体容量的比例确定,所以每层抽到的个体数不一定一样.
(2)比例分配的分层随机抽样中,每个个体被抽到的可能性是一样的.
2.某校高一、高二、高三共有2 800名学生,为了解暑假学生在家的每天学习情况,计划用分层随机抽样的方法抽取一个容量为56的样本,已知从高二学生中抽取的人数为19人,则该校高二学生人数为________.
【答案】 950
题型探究 提技能
【答案】 B
题型一
分层随机抽样的概念
【解析】 A中总体所含个体无差异且个数较少,适合用简单随机抽样;C和D中总体所含个体无差异且个数较多,不适合分层随机抽样;B中总体所含个体差异明显,适合用分层随机抽样.
[方法总结1]
[方法总结1]
分层随机抽样的前提和遵循的两条原则
(1)前提:分层随机抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取;
(2)遵循的两条原则:①每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;②每层样本量与每层个体数量的比等于抽样比.
1
要完成下列两项调查:(1)某社区有100户高收入家庭,210户中收入家庭,90户低收入家庭,从中抽取100户调查有关消费购买力的某项指标;(2)从某中学高一年级的10名体育特长生中抽取3人调查学习情况,应采用的抽样方法分别是( )
A.(1)用简单随机抽样,(2)用分层随机抽样
B.(1)(2)都用简单随机抽样
C.(1)用分层随机抽样,(2)用简单随机抽样
D.(1)(2)都用分层随机抽样
【答案】 C
【解析】 因为有关消费购买力的某项指标受家庭收入的影响,而社区家庭收入差距明显,所以(1)用分层随机抽样;从10名体育特长生中抽取3人调查学习情况,个体之间差别不大,且总体和样本容量较小,所以(2)用简单随机抽样.故选C.
2.某班级有50名学生,一次数学测试的平均成绩是92分,如果30名男生的平均成绩为90分,那么20名女生的平均成绩为________分.
【答案】 95
题型二
分层随机抽样中的计算问题
[方法总结2]
[方法总结2]
进行分层随机抽样的相关计算时,常用到的关系
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比;
2
分层随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为________.
【答案】 6
3.在100个产品中,有一等品20个,二等品30个,三等品50个,现要抽取一个容量为30的样本,请说明抽样过程.
题型三
分层随机抽样的方案设计
【解析】 先将产品按等级分成三层:第一层,一等品20个;第二层,二等品30个;第三层,三等品50个.
分别给这些产品编号并贴上标签,用抽签法或随机数法在各层中抽取,得到一等品6个,二等品9个,三等品15个,这样就通过分层随机抽样得到了一个容量为30的样本.
[方法总结3]
[方法总结3]
设计分层随机抽样方案的思路
在分层随机抽样中,确定抽样比k是抽样的关键.一般地,按抽样比k=n/N(N为总体容量,n为样本量)在各层中抽取个体,就能确保抽样的公平性.注意在每层抽样时,应灵活采用简单随机抽样的方法.
3
某单位有职工400人,其中不到37岁的有128人,37岁至49岁的有184人,50岁及以上的有88人.为了了解这个单位职工血脂高低情况(血脂高低与年龄有关),从中抽取50名职工进行调查,应该怎样抽取?请写出具体的抽样步骤.
【解析】 用分层随机抽样的方法来抽取样本,步骤如下:
(1)按年龄将职工分成三层:不到37岁的职工,37岁至49岁的职工,50岁及以上的职工;
(3)在各层中分别按简单随机抽样抽取样本;
(4)综合每层抽样,组成样本.
4.为了缓解城市的交通拥堵情况,某市准备出台限制私家车的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果能很好地反映该市市民的意愿吗?
【解析】 一个城市的交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益.为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该城市的所有市民进行随机抽样调查,不要只关注到拥有私家车的市民.
题型四
获取数据途径的方法设计
[方法总结4]
[方法总结4]
在统计活动中,尤其是大型的统计活动,为避免一些外界因素的干扰,通常需要确定调查的对象、调查的方法与策略,需要精心设计前期的准备工作和收集数据的方法,然后对数据进行分析,得出统计推断.
4
为了创建“和谐平安”校园,某校决定在开学前将学校的电灯电路使用情况进行检查,以排除安全隐患,获取电灯电路的相关数据应该用什么方法?为什么?
【解析】 由于一个学校的电灯电路数目不算大,属于有限总体问题,所以应该通过调查获取数据,并且对创建“和谐平安”校园来说,必须排除任一潜在或已存在的安全隐患,故必须用普查的方法.
随堂检测 重反馈
1.某市为了了解职工家庭生活状况,先把职工按所从事的行业分为8类(每类家庭数不完全相同),再对每个行业抽取的职工家庭进行调查,这种抽样方法是( )
A.简单随机抽样 B.随机数法
C.分层随机抽样 D.不属于以上几类抽样
【答案】 C
【解析】 因为职工所从事的行业有明显差异,所以是分层随机抽样.故选C.
2.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层随机抽样的方法从中抽取样本.若样本中的青年职工为14人,则样本容量为( )
A.15 B.20
C.25 D.30
【答案】 D
3.某校开展学生对食堂满意度的调查活动,已知该校高一年级有学生550人,高二年级有学生500人,高三年级有学生450人.现从全校学生中用分层随机抽样的方法抽取60人进行调查,则抽取的高二年级学生人数为( )
A.18 B.20
C.22 D.30
【答案】 B
4.已知甲、乙两地人口之比为2∶3,其中甲地人均年收入为8万元,乙地人均年收入为10万元,则甲、乙两地的人均年收入为________万元.
【答案】 9.2第九章 9.1 9.1.2 9.1.3
课时跟踪检测
A组·基础巩固
1.某校初一有500名学生,为了培养学生良好的阅读习惯,学校要求他们从四大名著中选一本阅读,其中有200人选《三国演义》,125人选《水浒传》,125人选《西游记》,50人选《红楼梦》,若采用分层随机抽样的方法抽取40名学生分享他们的读后感,则选《西游记》的学生抽取的人数为( )
A.5 B.10
C.12 D.15
【答案】 B
【解析】 根据分层随机抽样的方法,可得选《西游记》的学生抽取的人数为40×=10.
2.某公司为了调查消费者对某项服务的真实评价,采用分层随机抽样的方法在甲、乙、丙三个城市共抽取了3 600人进行问卷调查,若在甲、乙、丙三个城市抽取的人数分别为a,b,c,且满足a+c=2b,则乙城市抽取的人数为( )
A.800 B.1 000
C.1 200 D.1 500
【答案】 C
【解析】 因为在甲、乙、丙三个城市抽取的人数分别为a,b,c,且满足a+c=2b,所以乙城市抽取的人数占总抽取的人数的,所以乙城市抽取的人数为3 600×=1 200.故选C.
3.一支田径队有男运动员48人,女运动员36人,用分层随机抽样的方法从全体运动员中抽取一个容量为7的样本,抽出的男运动员平均身高为177.5 cm,抽出的女运动员平均身高为168.4 cm,估计该田径队运动员的平均身高是( )
A.172.95 cm B.173.6 cm
C.172.3 cm D.176 cm
【答案】 B
【解析】 依题意,该田径队运动员的平均身高为177.5×+168.4×=173.6 cm.故选B.
4.为了保证分层随机抽样时每个个体等可能地被抽取,必须要求( )
A.每层的个体数必须一样多
B.每层抽取的个体数相等
C.每层抽取的个体可以不一样多,但必须满足抽取ni=n·(i=1,2,…,k)个个体,其中i是层数,n是抽取的样本容量,Ni是第i层所包含的个体数,N是总体容量
D.只要抽取的样本容量一定,每层抽取的个体数没有限制
【答案】 C
【解析】 每层的个体数不一定都一样多,故A错误;由于每层的容量不一定相等,每层抽同样多的个体,从整个总体来看,各层之间的个体被抽取的可能性显然就不一样了,故B错误;选项C正确;每层抽取的个体数是有限制的,不可能无限大,故D错误.
5.(多选)某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人.甲就读于高一,乙就读于高二,学校计划从这两个年级中共抽取235人进行视力调查,下列说法中正确的有( )
A.应该采用分层随机抽样法抽取
B.高一、高二年级应分别抽取100人和135人
C.乙被抽到的可能性比甲大
D.该问题的总体是高一、高二年级的全体学生
【答案】 AB
【解析】 易知应采用分层随机抽样法抽取,故A正确;由题意可得高一年级的人数为20×50=1 000,高二年级的人数为30×45=1 350,则高一年级应抽取的人数为235×=100,高二年级应抽取的人数为235-100=135,所以高一、高二年级应分别抽取100人和135人,故B正确;乙被抽到的可能性与甲一样大,故C错误;该问题中的总体是高一、高二年级的全体学生的视力,故D错误.故选AB.
6.(多选)某运动队由足球运动员18人,篮球运动员12人,乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n的样本,若采用分层随机抽样的方法,且不用删除个体,则样本量n的取值可能是( )
A.5 B.6
C.20 D.24
【答案】 BD
【解析】 因为运动队有足球运动员18人,篮球运动员12人,乒乓球运动员6人,所以当样本容量为n时,分层随机抽样的抽样比为,则足球运动员为×18=人,篮球运动员为×12=人,乒乓球运动员为×6=人,所以n是6的整数倍,故选BD.
7.某校青年教师、中年教师、老年教师的配置比例为5∶3∶2,为了调查各类教师的薪资状况,现采用分层随机抽样的方法抽取部分教师进行调查.在抽取的样本中,青年教师有30人,则该样本中的老年教师人数为________.
【答案】 12
【解析】 设样本中的老年教师人数为x,则=,故x=12.
8.某车间生产A,B,C三种不同型号的产品,产量之比为5∶k∶3,为检验产品的质量,现用分层随机抽样的方法抽取一个容量为120的样本进行检验,已知B种型号的产品共抽取了24件,则C种型号的产品抽取的件数为________.
【答案】 36
【解析】 由题意,得=,所以k=2,所以C种型号的产品抽取的件数为120×=36.
9.某校要求每名学生只参加某一个兴趣小组,并对高一、高二年级的3个兴趣小组的学生人数进行了统计,结果如下表:
书法组 舞蹈组 乐器组
高一 x 20 30
高二 45 30 10
已知按兴趣小组类别用分层随机抽样的方法,从参加这3个兴趣小组的学生中共抽取了30人,其中书法组被抽取12人,则x=________.
【答案】 15
【解析】 由题设,×30=12,解得x=15.
10.某地区有高中生7 200人,初中生11 800人,小学生12 000人.当地教育部门为了了解本地区中小学生的近视率,采用分层随机抽样的方法,按高中生、初中生、小学生进行分层,得到高中生、初中生、小学生的近视率分别为80%、70%、36%.如果在各层中按比例分配抽取样本量为310的样本,那么在高中生、初中生、小学生中分别抽取了多少人?在这种情况下,请估计该地区全体中小学生的近视率.
【解析】 抽样比为=,
所以在高中生、初中生、小学生中分别抽取了7 200×=72(人),11 800×=118(人),12 000×=120(人).
样本中中小学生的近视率为×80%+×70%+×36%≈59%,
所以估计该地区全体中小学生的近视率为59%.
B组·综合运用
11.某学校在校学生有3 000人,为了增强学生的体质,学校举行了跑步和登山比赛,每人都参加且只参加其中一项比赛,高一、高二、高三年级参加跑步的人数分别为a,b,c,且a∶b∶c=2∶3∶4,全校参加登山的人数占总人数的.为了了解学生对本次比赛的满意程度,按分层随机抽样的方法从中抽取一个容量为300的样本进行调查,则应从高二年级参加跑步的学生中抽取( )
A.15人 B.30人
C.45人 D.60人
【答案】 D
【解析】 由题意,可知全校参加跑步的人数为3 000×=1 800,所以a+b+c=1 800.因为a∶b∶c=2∶3∶4,所以b=1 800×=600.因为按分层随机抽样的方法从中抽取一个容量为300的样本,所以应从高二年级参加跑步的学生中抽取的人数为600×=60.故选D.
12.(多选)某公司生产三种型号的轿车,产量分别为1 200辆,6 000辆和2 000辆.为检验该公司的产品质量,公司质监部门要抽取46辆轿车进行检验,则下列说法正确的是( )
A.应采用分层随机抽样的方法抽取
B.应采用抽签法抽取
C.依次抽取三种型号的轿车6辆、30辆、10辆
D.这三种型号的轿车,每一辆被抽到的可能性都是相等的
【答案】 ACD
【解析】 由于总体按型号分为三个子总体,所以应采用分层随机抽样的方法抽取,故A中说法正确;因为总体容量较大,所以不宜采用抽签法,故B中说法错误;设三种型号的轿车依次被抽取x辆,y辆,z辆,则有解得所以三种型号的轿车依次被抽取6辆、30辆、10辆,故C中说法正确;易知D中说法正确.故选ACD.
13.某企业三月中旬生产A,B,C三种产品共3 000件,根据分层随机抽样的结果,企业统计员制作了如下的统计表:
产品类型 A B C
产品数量/件 1 300
样本量 130
由于不小心,表格中A、C两种产品的有关数据被污染了,统计员只记得A产品的样本量比C产品的样本量多10,根据以上信息,则C产品的数量为________.
【答案】 800
【解析】 易知抽样比为130∶1 300=1∶10,即每10件产品中抽取1件产品,又A产品的样本量比C产品的样本量多10,故C产品的数量是[(3 000-1 300)-100]×=800(件).
14.某校在全校开展党史学习教育活动并进行问卷测试,已知该校高一年级有学生1 200人,高二年级有学生960人,高三年级有学生840人.为了解全校学生问卷测试成绩的情况,按年级进行分层随机抽样得到容量为100的样本.
(1)求在各年级中应分别抽取的人数;
(2)如果高一、高二、高三年级问卷测试成绩的平均分分别为85分,80分,90分,求该校全体学生本次问卷测试成绩的平均分.
【解析】 (1)该校共有学生1 200+960+840=3 000(人),
则高一年级应抽取100×=40(人),
高二年级应抽取100×=32(人),
高三年级应抽取100×=28(人).
(2)全体学生本次问卷测试成绩的平均分为×85+×80+×90=84.8(分).
C组·拓展提升
15.为了对某课题进行研究,分别从A,B,C三所高校中用分层随机抽样法抽取若干名教授组成研究小组,其中高校A有m名教授,高校B有72名教授,高校C有n名教授(其中0<m≤72≤n).
(1)若A,B两所高校中共抽取3名教授,B,C两所高校中共抽取5名教授,求m,n;
(2)若高校B中抽取的教授人数是高校A和C中抽取的教授总人数的,求三所高校教授的总人数.
【解析】 (1)∵0<m≤72≤n,A,B两所高校中共抽取3名教授,B,C两所高校中共抽取5名教授,∴高校B中抽取2名教授,高校A中抽取1名教授,高校C中抽取3名教授,∴==,解得m=36,n=108.
(2)∵高校B中抽取的教授人数是高校A和C中抽取的教授总人数的,
∴(m+n)=72,解得m+n=108,
∴三所高校教授的总人数为m+n+72=180.
21世纪教育网(www.21cnjy.com)