专题 9.1 随机抽样【十大题型】
【人教 A 版(2019)】
【题型 1 简单随机抽样的特征及适用条件】 ........................................................................................................3
【题型 2 抽签法的应用】 ........................................................................................................................................4
【题型 3 随机数法的应用】 ....................................................................................................................................4
【题型 4 简单随机抽样的概率】 ............................................................................................................................6
【题型 5 简单随机抽样估计总体】 ........................................................................................................................6
【题型 6 抽样方法的选取】 ....................................................................................................................................9
【题型 7 抽样比、样本总量、各层总数、总体容量的计算】 ..........................................................................10
【题型 8 分层抽样的概率计算】 ..........................................................................................................................11
【题型 9 普查与抽样】 ..........................................................................................................................................12
【题型 10 总体与样本】 ........................................................................................................................................13
【知识点 1 简单随机抽样】
1.抽样调查的必要性
(1)相关概念
名称 定义
全面调查(普查) 对每一个调查对象都进行调查的方法.
根据一定目的,从总体中抽取一部分个体进行调查,并以
抽样调查
此为依据对总体的情况作出估计和推断的调查方法.
总体 调查对象的全体.
个体 从总体中抽取的那部分个体.
样本 从总体中抽取的那部分个体.
样本量 样本中包含的个体数.
(2)抽样的必要性
普查往往需要花费大量的财力、物力,而抽样调查具有花费少、效率高的特点.另外,在有些调查中,
抽样调查则具有不可替代的作用,比如:
①一些个体具有破坏性.如不可能对所有的炮弹都进行试射检验其是否合格.
②一些检测具有毁损性.如不可能把地里所有的种子都挖出来检验其是否发芽.
2.简单随机抽样
(1)简单随机抽样的概念
一般地,设一个总体含有 N(N 为正整数)个个体,从中逐个抽取 n 个个体作为样本,如果抽
取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随
机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把
这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.
通过简单随机抽样获得的样本称为简单随机样本.
(2)(不放回)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取样本的总体中所含个体的个数是有限的,便于通过样本对总体进
行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单随机抽样中各个个体被抽到的可能性(机会)都相等(与第几次抽取无关),从而保证了
抽样的公平性.
3.两种常见的简单随机抽样方法
(1)抽签法
一般地,抽签法就是把总体中的 N 个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也
可以是卡片、小球等)上作为号签,并将这些号签放在一个不透明的盒,充分搅拌,最后从盒中不放回
地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的数量.
(2)随机数法
先把总体中的 N 个个体编号,用随机数工具产生 1~N 范围内的整数随机数,把产生的随机数作为抽中
的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需要的数量.如果生成的随机数有重
复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本
所需要的数量.
(3)两种抽样方法的优缺点
抽样方法 优点 缺点 适用范围
抽签法 简单易行. 总体量较大时,操作起来 适用于总体中个体数不
比较麻烦. 多的情形.
随机数法 简单易行,它很好地解决 总体量很大,样本量也很 总体量较大,样本量较
了总体量较大时用抽签 大时,利用随机数法抽取 小的情形.
法制签困难的问题. 样本仍不方便.
4.总体平均数与样本平均数
(1)概念
名称 定义
总体均值(总体平 一般地,总体中有 N 个个体,它们的变量值分别为 Y1,Y2,…,YN,则称
均数)
为总体均值,又称总体平均数.
如果总体的 N 个变量值中,不同的值共有 k(k≤N)个,不妨记为 Y1,Y2,…,
Yk,其中 Yi出现的频数为 fi(i=1,2,…,k),则总体均值还可以写成加权平均
数的形式 .
样本均值(样本平 如果从总体中抽取一个容量为 n 的样本,它们的变量值分别为 y1,y2,…,yn,
均数)
则称 为样本均值,又称样本平均数.
说明:(1)在简单随机抽样中,我们常用样本平均数 去估计总体平均数 ;
(2)总体平均数是一个确定的数,样本平均数具有随机性(因为样本具有随机性);
(3)一般情况下,样本量越大,估计越准确.
(2)求和符号∑的性质
① ;
② ,其中 k 为常数.
【题型 1 简单随机抽样的特征及适用条件】
【例 1】(23-24 高二·上海·课堂例题)下列抽样方法中,属于简单随机抽样的是( )
A.某社团为调查本校学生的环保知识水平,向在图书馆某楼层自习的所有学生发放问卷,隔 5 分钟后
回收;
B.某次科普讲座之前,主持人抽取座位尾号为 1 的听众进行提问;
C.一车间主任从堆放的 100 件产品中抽取了摆放在最上面的 10 件产品进行检查;
D.销售部经理将一个放有部门所有员工工号牌的箱子均匀摇晃后,从中抽取 5 个工号牌.
【变式 1-1】(25-26 高一上·全国·课后作业)对于简单随机抽样,下列说法正确的是( )
①它要求被抽取样本的总体的个体数有限;
②它是从总体中逐个进行抽取的,以便在抽样实践中进行操作;
③它分无放回抽样和有放回抽样;
④它是一种等可能抽样,在整个抽样过程中,每个个体被抽到的机会相等,从而保证了这种抽样方法的公
平性.
A.①②③ B.①②④ C.①③④ D.①②③④
【变式 1-2】(2024 高一下·全国·专题练习)在简单随机抽样中,下列关于其中一个个体被抽中的可能性说
法正确的是( )
A.与第几次抽样有关,第一次抽到的可能性更大一些
B.与第几次抽样有关,最后一次抽到的可能性更大一些
C.与第几次抽样无关,每次抽到的可能性都相等
D.与第几次抽样有关,第一次抽到的可能性更小一些
【变式 1-3】(2024 高一下·全国·专题练习)关于简单随机抽样,下列说法正确的是( )
①它要求被抽取样本的总体的个体数有限;②它是从总体中逐个地进行抽取;③不做特殊说明时,它是一
种不放回抽样;④它是一种等可能抽样.
A.①②③④ B.③④ C.①②③ D.①③④
【题型 2 抽签法的应用】
【例 2】(24-25 高一下·全国·课后作业)下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的 5 000 件产品中抽取 600 件进行质量检验
B.从某厂生产的两箱(每箱 18 件)产品中抽取 6 件进行质量检验
C.从甲、乙两厂生产的两箱(每箱 18 件)产品中抽取 6 件进行质量检验
D.从某厂生产的 5 000 件产品中抽取 10 件进行质量检验
【变式 2-1】(2025 高一下·全国·专题练习)某学校数学组要从 11 名数学老师中推选 3 名老师参加市里举
办的教学能手比赛,制作了 11 个形状、大小相同的签,抽签中确保公平性的关键是( )
A.制签 B.搅拌均匀 C.逐一抽取 D.抽取后不放回
【变式 2-2】(24-25 高一上·全国·课后作业)“绿水青山就是金山银山”,为响应党中央的号召,为基层办实
事,省环保局从各县市报送的 28 件环保案例中抽取 7 件作为样本研究,以制定切实可行的方案.试确定抽
取方法并写出操作步骤.
【变式 2-3】(2024 高一下·全国·专题练习)某校举办晚会,共邀请 20 名同学演出,其中从 30 名高一学生
中随机挑选 10 人,从 18 名高二学生中随机挑选 6 人,从 10 名高三学生中随机挑选 4 人.试用抽签法确定
选中的同学,并确定他们的表演顺序.
【题型 3 随机数法的应用】
【例 3】(23-24 高一下·甘肃白银·阶段练习)某总体由编号为01,02,03, ,19,20的20个个体组成,利用下
列随机数表选出5个个体,选法是下列表中第一行第5列开始从左到右依次选2个数字,选出的第5个个体编
号为( )
1818 0792 4544 1716 5809 7983 8619
6216 7650 0310 5523 6405 0526 6238
A.16 B.09 C.19 D.61
【变式 3-1】(23-24 高一下·陕西咸阳·阶段练习)某高校对中文系新生进行体测,利用随机数表对 650 名学
生进行抽样,先将 650 名学生进行编号,001,002, ,649,650.从中抽取 50 个样本,如图提供随机数
表的第 4 行到第 6 行,若从表中第 5 行第 6 列开始向右读取数据,则得到的第 4 个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.007 B.253 C.328 D.860
【变式 3-2】(23-24 高二·上海·课堂例题)某校为了解高二年级学生对于某知识点的掌握情况,在一次数学
考试后,按照 1:30 的比例抽取一组样本试卷进行分析.该校高二年级有 12 个班,共 540 人,每班人数如下
表所示.请利用随机数表法进行抽取,并写出过程.
班级 一班 二班 三班 四班 五班 六班
人数 43 47 47 43 47 43
班级 七班 八班 九班 十班 十一班 十二班
人数 44 47 46 43 47 43
【变式 3-3】(2024 高一下·全国·专题练习)某市质监局要检查某公司某个时间段生产的 500 克袋装牛奶的
质量是否达标,现从 500 袋牛奶中抽取 10 袋进行检验.
(1)利用随机数法抽取样本时,应如何操作?
(2)如果用随机数法生成部分随机数如下所示,据此写出应抽取的袋装牛奶的编号.
162,277,943,949,545,354,821,737,932,354,873,520,964,384,263,491,648,642,
175,331,572,455,068,877,047,447,672,172,065,025,834,216,337,663,013,785,
916,955,567,199,810,507,175,128,673,580,667.
【题型 4 简单随机抽样的概率】
【例 4】(23-24 高一下·天津南开·期末)利用简单随机抽样的方法,从 n 个个体( ≥ 13)中抽取 13 个个
1
体,若从第二次抽取开始时,余下的每个个体被抽到的概率为3,则在整个抽样过程中,每个个体被抽到的
可能性为( )
A 13 B 13.36 .37 C
1 D 13.3 .40
【变式 4-1】(2024 高一下·全国·专题练习)某中学高一年级有 400 人,高二年级有 320 人,高三年级有 280
人,若用随机数法在该中学抽取容量为 n 的样本,每人被抽到的可能性都为 0.2,则 n 等于( )
A.80 B.160 C.200 D.280
【变式 4-2】(23-24 高一下·江苏常州·期末)从某班学号为 1 到 10 的十名学生(其中含学生甲)中抽取 3
名学生参加某项调查,现用抽签法抽取样本(不放回抽取),每次抽取一个号码,共抽 3 次,设甲第一次
被抽到的可能性为 ,第二次被抽到的可能性为 ,则( )
A = 3 = 2. 10, 9 B. =
1 1
10, = 9
C 3 3 1 1. = 10, = 10 D. = 10, = 10
【变式 4-3】(2024·四川成都·模拟预测)用简单随机抽样的方法从含有 10 个个体的总体中抽取一个容量为
3 的样本,其中某一个体 a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( )
A 1 1.10,10 B
3 1
.10,5
C 1 1 3 2.10,9 D.10,9
【题型 5 简单随机抽样估计总体】
【例 5】(23-24 高一下·安徽阜阳·期末)中国古典数学先后经历了三次发展高潮,即两汉时期、魏晋南北
朝时期和宋元时期,并在宋元时期达到顶峰,而南宋时期的数学家秦九韶正是其中的代表人物.作为秦九
韶的集大成之作,《数书九章》一书所承载的数学成就非同一般.可以说,但凡是实际生活中需要运用到
数学知识的地方,《数书九章》一书皆有所涉及,例如“验米夹谷”问题:今有谷 3318 石,抽样取谷一把,
数得 168 粒内有秕谷 22 粒,则粮仓内的秕谷约为( )
A.321 石 B.166 石 C.434 石 D.623 石
【变式 5-1】(24-25 高一·全国·课后作业)为了估计某自然保护区中天鹅的数量,可以使用以下方法:先从
该保护区中捕出一定数量的天鹅,例如 200 只,给每只天鹅做上记号,不影响其存活,然后放回保护区,
经过适当的时间,让其和保护区中其余的天鹅充分混合;再从保护区中捕出一定数量的天鹅,例如 150 只,
查看其中有记号的天鹅,设有 20 只.根据上述数据,估计该自然保护区中天鹅的数量为( )
A.4000 B.3000 C.1500 D.750
【变式 5-2】(24-25 高一·全国·课后作业)为了解某中学生遵守《中华人民共和国交通安全法》的 情况,
调查部门在该校进行了如下的随机调查,向被调查者提出两个问题:
(1)你的学号是奇数吗?(2)在过路口时你是否闯过红灯?
要求被调查者背对着调查人员抛掷一枚硬币,如果出现正面,就回答第一个问题,否则就回答第二个问
题.被调查者不必告诉调查人员自己回答的是哪一个问题,只需回答“是”或“不是”,因为只有调查者本人知
道回答了哪一个问题,所以都如实地做了回答.结果被调查的 800 人(学号从 1 至 800)中有 240 人回答了
“是”.由此估计这 800 人中闯过红灯的人数?
【变式 5-3】(24-25 高一·全国·课后作业)近年来,我国高速铁路发展迅速,到 2016 年底为止,已经运营
的高铁轨道的总长度已达2.2 × 104km,位居世界第一.为了提高营运的效率,铁路部门在安排停靠站台时通
过分班次、间隔站点的方式进行,如京沪高铁 G125 班次 11∶10 从北京始发,开往上海虹桥(据 2017 年 10
月时刻表),停靠站分别为天津南、德州东、济南西、滕州东、蚌埠南、南京南、镇江南、常州北、昆山
南,而 08∶35 从北京始发的 G111 班次,停靠站分别为德州东、济南西、泰安、滁州、南京南、丹阳北、无
锡东,最后停靠终点站上海虹桥.试运用统计研究的方法完成下述任务:
(1)如何确定每天的总班次及具体班次的安排?
(2)在确定各个班次停靠站的数量时应考虑哪些因素?如何实施?
(3)在确定各个班次停靠站时应考虑哪些因素?如何实施?
【知识点 2 分层随机抽样】
1.分层随机抽样
(1)分层随机抽样的必要性
简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比
较“极端”的样本,从而使得估计出现较大的误差,这时候我们可以考虑采取一种新的抽样方法——分层随机
抽样.
(2)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个
子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法
称为分层随机抽样,每一个子总体称为层.
(3)比例分配
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
即
① = ;
② = .
(4)分层随机抽样的步骤
①分层:根据已经掌握的信息,将总体分成互不重叠的层.
②求比:根据总体中的个体数 N 和样本容量 n 计算抽样比 .
③定数:确定第 i 层应该抽取的个体数为 ni=Ni·k(Ni为总体中第 i 层所包含的个体数),使得各 ni之和
为 n.
④抽样:按“定数”步骤中确定的个体数在各层中随机地抽取个体,合在一起便得到容量为 n 的样本.
(5)分层随机抽样的特点
①适用于由差异明显的几部分(即层)组成的总体;
②分成的各层互不重叠;
③各层抽取的比例都等于样本容量在总体中的比例,即 ,其中 n 为样本容量,N 为总体容量;
④分层随机抽样使样本具有较强的代表性,而且在各层抽样时,又可灵活地选用不同的随机抽样方法.
2.分层随机抽样的平均数计算
在分层随机抽样中,如果层数分为 2 层,第 1 层和第 2 层包含的个体数分别为 M 和 N,抽取的样本量
分别为 m 和 n,第 1 层、第 2 层的总体平均数分别为 ,第 1 层、第 2 层的样本平均数分别为 ,
总体平均数为 ,样本平均数为 ,则 .
由于用第 1 层的样本平均数 可以估计第 1 层的总体平均数 ,用第 2 层的样本平均数 可以估计第 2
层的总体平均数 ,因此可以用 估计总体平均数 .
又 = = ,
所以 .
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数 估计总体平均数 .
【题型 6 抽样方法的选取】
【例 6】(24-25 高二上·四川绵阳·期末)①在一次满分为 100 分的测试中,有 12 人的成绩在 90 分以上,
30 人的成绩在 60~80 分,12 人的成绩低于 60 分,现从中抽取 9 人了解有关考试题目难度的情况;②一彩
民选号,从装有 36 个大小、形状都相同的号签的盒子中无放回地抽出 6 个号签.针对这两件事,恰当的抽样
方法分别为( )
A.分层抽样,简单随机抽样 B.简单随机抽样,简单随机抽样
C.简单随机抽样,分层抽样 D.分层抽样,分层抽样
【变式 6-1】(24-25 高一上·江西·期末)为了了解某县中小学生课外阅读时间情况,拟从该县的中小学生中
抽取部分学生进行调查,事先已经了解到该县小学、初中、高中三个学段学生的课外阅读时间存在较大差
异,而男、女生的阅读时间差异不大,则最合理的抽样方法是( )
A.按性别分层随机抽样 B.按学段分层随机抽样
C.抽签法 D.随机数表法
【变式 6-2】(23-24 高二上·上海长宁·期末)①植物根据植株的高度及分枝部位等可以分为乔木、灌木和
草木三大类,某植物园需要对其园中的不同植物的干重(烘干后测定的质量)进行测量;②检测员拟对一
批新生产的 1000 箱牛奶抽取 10 箱进行质量检测;上述两项调查应采用的抽样方法是( )
A.①用简单随机抽样,②用分层随机抽样 B.①用简单随机抽样,②用简单随机抽样
C.①用分层随机抽样,②用简单随机抽样 D.①用分层随机抽样,②用分层随机抽样
【变式 6-3】(23-24 高一下·陕西西安·期末)现要完成下列 3 项抽样调查:
①从 10 盒酸奶中抽取 3 盒进行食品卫生检查;②科技报告厅有 32 排,每排有 40 个座位,有一次报告会恰
好坐满了听众,报告会结束后,为了听取意见,需要请 32 名听众进行座谈;③某中学有高中生 3500 人,
初中生 1500 人,为了解学生的学习情况,拟抽取一个容量为 200 的样本.较为合理的抽样方法分别是
( )
A.①简单随机抽样,②分层抽样,③系统抽样
B.①简单随机抽样,②系统抽样,③分层抽样
C.①系统抽样,②简单随机抽样,③分层抽样
D.①分层抽样,②系统抽样,③简单随机抽样
【题型 7 抽样比、样本总量、各层总数、总体容量的计算】
【例 7】(24-25 高一下·江西赣州·开学考试)为庆祝中国共产党成立100周年,赣州市举办“红歌大传唱”主
题活动,以传承红色革命精神,某高中学校分别有高一、高二、高三学生1200人、1000人、800人,现欲
采用分层随机抽样法组建一个30人的高一、高二、高三学生红歌传唱队,则应抽取高一学生( )
A.6人 B.8人 C.10人 D.12人
【变式 7-1】(23-24 高三上·广西·阶段练习)北京时间 2023 年 10 月 31 日 8 时 11 分,神舟十六号载人飞船
返回舱在东风着陆场成功着陆,载人飞行任务取得圆满成功.某高中学校在有 120 名同学的“航天”社团中随
机抽取 24 名参加一个交流会,若按社团中高一、高二、高三年级的成员人数比例分层随机抽样,则高一年
级抽取 6 人,若按性别比例分层随机抽样,则女生抽取 15 人,则下列结论错误的是( )
A.24 是样本容量
B.120 名社团成员中男生有 50 人
C.高二与高三年级的社团成员共有 90 人
D.高一年级的社团成员中女生最多有 30 人
【变式 7-2】(24-25 高一上·河南南阳·阶段练习)某中学有高中生 1800 人,初中生 1200 人,为了解学生课
外锻炼情况,用分层抽样的方法从学生中抽取一个容量为 的样本.已知从高中生中抽取的人数比从初中生中
抽取的人数多 24,则 = ( )
A.48 B.72 C.60 D.120
【变式 7-3】(24-25 高二下·河南·阶段练习)中国古代数学专著《算法统宗》中有这样的记载:毛诗春秋周
易书,九十四册共无余,毛诗一册三人读,春秋一册四人呼,周易五人读一本.意思为:现有《毛诗》《春
秋》《周易》3种书共94册,若干人读这些书,要求每个人都要读到这3种书,若3人共读一本《毛诗》,4
人共读一本《春秋》,5人共读一本《周易》,则刚好没有剩余.现要用分层抽样的方法从中抽取47册,则要
从《毛诗》中抽取的册数为( )
A.12 B.14 C.18 D.20
【题型 8 分层抽样的概率计算】
【例 8】(24-25 高二上·福建·阶段练习)某地区高中分三类,A 类学校共有学生 2000 人,B 类学校共有学
生 3000 人,C 类学校共有学生 4000 人,若采取分层抽样的方法抽取 900 人,则 A 类学校中的学生甲被抽
到的概率( )
A 9 1 1 1.20 B.2000 C.2 D.10
【变式 8-1】(2025 高三·全国·专题练习)某校要从高一、高二、高三共 2 023 名学生中选取 50 名组成志愿
团,若先用简单随机抽样的方法从 2 023 名学生中剔除 23 名,再从剩下的 2 000 名学生中按分层随机抽样
的方法抽取 50 名,则每名学生入选的可能性( )
A 50 1.都相等且为2023 B.都相等且为40
C.不完全相等 D.均不相等
【变式 8-2】(24-25 高二上·北京昌平·期末)甲、乙两个车间生产同一种产品的合格率分别为90%,80%,
检验员每天都要按照3:2的比例分别从甲、乙两个车间抽取部分产品进行检验.从被抽检的产品中任选一件,
则选到合格品的概率为( )
A.84% B.86% C.88% D.90%
【变式 8-3】(24-25 高三上·江西吉安·期末)垃圾分类,人人有责.北京市从 2020 年 5 月 1 日开始实施《北
京市生活垃圾管理条例》,北京将生活垃圾分为有害垃圾、可回收物、厨余垃圾和其他垃圾四类,并分别
设置了相应的垃圾箱,为调查居民生活垃圾分类投放情况,现随机抽取了某区四类垃圾箱中总计 1000 吨生
活垃圾,数据统计如下(单位:吨):
“有害垃圾”箱 “可回收物”箱 “厨余垃圾”箱 “其他垃圾”箱
有害垃圾 60 5 5 10
可回收物 5 185 10 10
厨余垃圾 10 40 540 10
其他垃圾 5 15 10 80
则下列结论中不正确的是( )
A.厨余垃圾占垃圾总量的 60% B.有害垃圾投放正确的概率为 75%
C.厨余垃圾投放正确的概率为 90% D.生活垃圾投放错误的概率为 15%
【知识点 3 获取数据的途径】
1.获取数据的途径
(1)通过调查获取数据
我们一般通过抽样调查或普查的方法获取数据.
(2)通过试验获取数据
没有现存的数据可以查询时,就需要通过对比试验的方法去获取样本观测数据.
(3)通过观察获取数据
自然现象只能通过长久的持续观察获取数据.
(4)通过查询获得数据
通过收集前人的劳动成果并加以利用,从而减少收集数据的成本.
【题型 9 普查与抽样】
【例 9】(23-24 高一下·天津河西·期末)下列情况适合用抽样调查的是( )
A.调查某化工厂周围 5 个村庄是否受到污染
B.调查某批次汽车的抗撞击能力
C.调查某班学生的身高情况
D.学校招聘,对应聘人员进行面试
【变式 9-1】(23-24 高一上·江西景德镇·期末)下列调查方式中,可用普查的是( )
A.调查某品牌电动车的市场占有率 B.调查 2023 年杭州亚运会的收视率
C.调查某校高三年级的男女同学的比例 D.调查一批玉米种子的发芽率
【变式 9-2】(24-25 高二·上海·课堂例题)下面的调查是普查还是抽样调查?
(1)想知道一锅菜的咸淡,取一点尝尝;
(2)为了解西瓜甜不甜,在西瓜的某个部位切一个三角口子取出一块尝尝;
(3)为了记录某次下雨的降水量,学校气象小组用雨量计对雨水进行了收集和测量;
(4)为了了解九年级一班学生课外健身所用的时间,老师给全班每位同学发放调查表进行调查.
【变式 9-3】(24-25 高一上·全国·课后作业)下列调查中哪些属于普查,哪些属于抽查
(1)为了了解某班级的每名学生穿几号鞋,向全班同学做调查;
(2)为了了解某学校高一年级学生穿几号鞋,向该学校高一年级某班的全体同学做调查;
(3)为了了解某班的同学们每天的睡眠时间,在每个小组中各选取 2 名学生做调查;
(4)为了了解某班的同学们每天的睡眠时间,选取该班中学号为偶数的所有学生做调查.
【题型 10 总体与样本】
【例 10】(23-24 高一下·西藏日喀则·期末)高考结束后,为了分析该校高三年级 1000 名学生的高考成绩,
从中随机抽取了 100 名学生的成绩,就这个问题来说,下列说法中正确的是( )
A.100 名学生是个体
B.样本容量是 100
C.每名学生的成绩是所抽取的一个样本
D.1000 名学生是样本
【变式 10-1】(23-24 高一下·天津河东·期末)为确保食品安全,某市质检部门检查 1000 袋方便面的质量,
抽查总量的2%.在这个问题中,下列说法正确的是( )
A.总体是指这 1000 袋方便面 B.个体是 1 袋方便面
C.样本是按2%抽取的 20 袋方便面 D.样本容量为 20
【变式 10-2】(24-25 高二·上海·课堂例题)为了了解参加运动会的 2000 名运动员的年龄情况,从中抽取
20 名运动员的年龄进行统计分析.就这个问题,分别判断下列说法是否正确,并说明理由.
(1)2000 名运动员是总体;
(2)每名运动员是个体;
(3)所抽取的 20 名运动员是一个样本.
【变式 10-3】(23-24 高二·上海·课堂例题)小王和小张计划调查上海市新生儿的性别情况.小王调查了最
近一个月在 A 医院出生的 320 名新生儿,其中有 156 名女孩,小王由此推断:上海市新生儿男女比例基本
均衡.小张的姐姐在 B 医院待产,她告诉小张最近一周在 B 医院出生的 18 名新生儿中有 13 名女孩,小张
由此推断:上海市新生儿男女比例严重失调,考虑下面的问题:
(1)在上面的统计活动中,总体和样本分别是什么?
(2)你同意小王和小张的推断吗?请说一说你的理由.
(3)你认为是否可以用上面的样本来推断上海市新生儿的男女比例?请说一说你的理由.专题 9.1 随机抽样【十大题型】
【人教 A 版(2019)】
【题型 1 简单随机抽样的特征及适用条件】 ........................................................................................................3
【题型 2 抽签法的应用】 ........................................................................................................................................5
【题型 3 随机数法的应用】 ....................................................................................................................................6
【题型 4 简单随机抽样的概率】 ............................................................................................................................8
【题型 5 简单随机抽样估计总体】 ......................................................................................................................10
【题型 6 抽样方法的选取】 ..................................................................................................................................13
【题型 7 抽样比、样本总量、各层总数、总体容量的计算】 ..........................................................................14
【题型 8 分层抽样的概率计算】 ..........................................................................................................................16
【题型 9 普查与抽样】 ..........................................................................................................................................18
【题型 10 总体与样本】 ........................................................................................................................................19
【知识点 1 简单随机抽样】
1.抽样调查的必要性
(1)相关概念
名称 定义
全面调查(普查) 对每一个调查对象都进行调查的方法.
根据一定目的,从总体中抽取一部分个体进行调查,并以
抽样调查
此为依据对总体的情况作出估计和推断的调查方法.
总体 调查对象的全体.
个体 从总体中抽取的那部分个体.
样本 从总体中抽取的那部分个体.
样本量 样本中包含的个体数.
(2)抽样的必要性
普查往往需要花费大量的财力、物力,而抽样调查具有花费少、效率高的特点.另外,在有些调查中,
抽样调查则具有不可替代的作用,比如:
①一些个体具有破坏性.如不可能对所有的炮弹都进行试射检验其是否合格.
②一些检测具有毁损性.如不可能把地里所有的种子都挖出来检验其是否发芽.
2.简单随机抽样
(1)简单随机抽样的概念
一般地,设一个总体含有 N(N 为正整数)个个体,从中逐个抽取 n 个个体作为样本,如果抽
取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随
机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把
这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.
通过简单随机抽样获得的样本称为简单随机样本.
(2)(不放回)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取样本的总体中所含个体的个数是有限的,便于通过样本对总体进
行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单随机抽样中各个个体被抽到的可能性(机会)都相等(与第几次抽取无关),从而保证了
抽样的公平性.
3.两种常见的简单随机抽样方法
(1)抽签法
一般地,抽签法就是把总体中的 N 个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也
可以是卡片、小球等)上作为号签,并将这些号签放在一个不透明的盒,充分搅拌,最后从盒中不放回
地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的数量.
(2)随机数法
先把总体中的 N 个个体编号,用随机数工具产生 1~N 范围内的整数随机数,把产生的随机数作为抽中
的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需要的数量.如果生成的随机数有重
复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本
所需要的数量.
(3)两种抽样方法的优缺点
抽样方法 优点 缺点 适用范围
抽签法 简单易行. 总体量较大时,操作起来 适用于总体中个体数不
比较麻烦. 多的情形.
随机数法 简单易行,它很好地解决 总体量很大,样本量也很 总体量较大,样本量较
了总体量较大时用抽签 大时,利用随机数法抽取 小的情形.
法制签困难的问题. 样本仍不方便.
4.总体平均数与样本平均数
(1)概念
名称 定义
总体均值(总体平 一般地,总体中有 N 个个体,它们的变量值分别为 Y1,Y2,…,YN,则称
均数)
为总体均值,又称总体平均数.
如果总体的 N 个变量值中,不同的值共有 k(k≤N)个,不妨记为 Y1,Y2,…,
Yk,其中 Yi出现的频数为 fi(i=1,2,…,k),则总体均值还可以写成加权平均
数的形式 .
样本均值(样本平 如果从总体中抽取一个容量为 n 的样本,它们的变量值分别为 y1,y2,…,yn,
均数)
则称 为样本均值,又称样本平均数.
说明:(1)在简单随机抽样中,我们常用样本平均数 去估计总体平均数 ;
(2)总体平均数是一个确定的数,样本平均数具有随机性(因为样本具有随机性);
(3)一般情况下,样本量越大,估计越准确.
(2)求和符号∑的性质
① ;
② ,其中 k 为常数.
【题型 1 简单随机抽样的特征及适用条件】
【例 1】(23-24 高二·上海·课堂例题)下列抽样方法中,属于简单随机抽样的是( )
A.某社团为调查本校学生的环保知识水平,向在图书馆某楼层自习的所有学生发放问卷,隔 5 分钟后
回收;
B.某次科普讲座之前,主持人抽取座位尾号为 1 的听众进行提问;
C.一车间主任从堆放的 100 件产品中抽取了摆放在最上面的 10 件产品进行检查;
D.销售部经理将一个放有部门所有员工工号牌的箱子均匀摇晃后,从中抽取 5 个工号牌.
【解题思路】根据简单随机抽样的特点逐项判断即可.
【解答过程】对于 A 项,人数较多,且图书馆的学生不能代表本校全体学生,故 A 项错误;
对于 B 项,按照相同间隔抽取的方法,是系统抽样,不是简单抽样,故 B 项错误;
对于 C 项,抽取的产品不具有代表性,故 C 项错误;
对于 D 项,符合简单随机抽样的定义,故 D 项正确.
故选:D.
【变式 1-1】(25-26 高一上·全国·课后作业)对于简单随机抽样,下列说法正确的是( )
①它要求被抽取样本的总体的个体数有限;
②它是从总体中逐个进行抽取的,以便在抽样实践中进行操作;
③它分无放回抽样和有放回抽样;
④它是一种等可能抽样,在整个抽样过程中,每个个体被抽到的机会相等,从而保证了这种抽样方法的公
平性.
A.①②③ B.①②④ C.①③④ D.①②③④
【解题思路】由简单随机抽样的特点逐项分析判断.
【解答过程】对于①:简单随机抽样要求样本的总体个数有限,这样才能保证样本能够很好地代表总体,
所以①正确;
对于②:由于总体数量是有限的,所以为了让数据具有代表性需要从总体中逐个地进行抽取,以便在抽取
实践中进行操作,所以②正确;
对于③:简单随机抽样分无放回抽样和有放回抽样,所以③正确;
对于④:在随机抽样的出发点是使每个个体都有相同的机会被抽中,这是基于对样本数据代表性的考虑,
所以④正确.
故选:D.
【变式 1-2】(2024 高一下·全国·专题练习)在简单随机抽样中,下列关于其中一个个体被抽中的可能性说
法正确的是( )
A.与第几次抽样有关,第一次抽到的可能性更大一些
B.与第几次抽样有关,最后一次抽到的可能性更大一些
C.与第几次抽样无关,每次抽到的可能性都相等
D.与第几次抽样有关,第一次抽到的可能性更小一些
【解题思路】根据给定条件,利用简单随机抽样的意义逐项判断即得.
【解答过程】在简单随机抽样中,每个个体每次被抽中的可能性都相等,与第几次抽样无关,A,B,D 错
误,C 正确.
故选:C.
【变式 1-3】(2024 高一下·全国·专题练习)关于简单随机抽样,下列说法正确的是( )
①它要求被抽取样本的总体的个体数有限;②它是从总体中逐个地进行抽取;③不做特殊说明时,它是一
种不放回抽样;④它是一种等可能抽样.
A.①②③④ B.③④ C.①②③ D.①③④
【解题思路】根据简单随机抽样的定义和性质即可得到答案.
【解答过程】根据简单随机抽样的定义和性质知:
①它要求被抽取样本的总体的个数有限,正确;
②它是从总体中逐个地进行抽取,正确;
③不作特殊说明时它是一种不放回抽样,正确;
④它是一种等可能性抽样,正确;
故选:A.
【题型 2 抽签法的应用】
【例 2】(24-25 高一下·全国·课后作业)下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的 5 000 件产品中抽取 600 件进行质量检验
B.从某厂生产的两箱(每箱 18 件)产品中抽取 6 件进行质量检验
C.从甲、乙两厂生产的两箱(每箱 18 件)产品中抽取 6 件进行质量检验
D.从某厂生产的 5 000 件产品中抽取 10 件进行质量检验
【解题思路】根据抽签法适用样本容量少,并且样本需搅拌均匀,进行逐一判断即可.
【解答过程】因为 A,D 中总体的个体数较大,不适合用抽签法;
C 中甲、乙两厂生产的产品质量可能差别较大,
因此未达到搅拌均匀的条件,也不适合用抽签法;
B 中总体容量和样本容量都较小,且同厂生产的产品可视为搅拌均匀了.
故选:B.
【变式 2-1】(2025 高一下·全国·专题练习)某学校数学组要从 11 名数学老师中推选 3 名老师参加市里举
办的教学能手比赛,制作了 11 个形状、大小相同的签,抽签中确保公平性的关键是( )
A.制签 B.搅拌均匀 C.逐一抽取 D.抽取后不放回
【解题思路】确保公平性要保证每个签抽到是等概率的,分析即得解
【解答过程】确保公平性要保证每个签抽到是等概率的,因此抽签法要做到搅拌均匀,才具有公平性.
故选:B.
【变式 2-2】(24-25 高一上·全国·课后作业)“绿水青山就是金山银山”,为响应党中央的号召,为基层办实
事,省环保局从各县市报送的 28 件环保案例中抽取 7 件作为样本研究,以制定切实可行的方案.试确定抽
取方法并写出操作步骤.
【解题思路】由抽签法的适用特征以及抽签法的使用步骤即可求解.
【解答过程】由于总体容量小,样本量也小,可用抽签法,步骤如下:
(1)将 28 件环保案例用随机方式编号,号码是 1,2,3,…,28;
(2)将以上 28 个号码分别写在 28 张相同的小纸条上,制成形状、大小均相同的号签;
(3)把号签放入一个不透明的容器中,充分搅拌均匀;
(4)从容器中无放回地逐个抽取 7 个号签,并记录上面的号码;
(5)找出和所得号码对应的 7 件案例,组成样本.
【变式 2-3】(2024 高一下·全国·专题练习)某校举办晚会,共邀请 20 名同学演出,其中从 30 名高一学生
中随机挑选 10 人,从 18 名高二学生中随机挑选 6 人,从 10 名高三学生中随机挑选 4 人.试用抽签法确定
选中的同学,并确定他们的表演顺序.
【解题思路】第一步,确定参演学生,做号签,抽签,第二步,确定演出顺序,做号签,抽签.
【解答过程】第一步,确定参演学生.
(1)将 30 名高一学生从 01 到 30 编号,然后用相同的纸条做成 30 个号签,在每个号签上分别写上编号,
然后放入一个暗箱中搅匀,从中顺次不放回地抽出 10 个号签,相应编号的学生参加演出;
(2)运用相同的办法分别从 18 名高二学生中抽取 6 人,从 10 名高三学生中抽取 4 人.
第二步,确定演出顺序.
确定了演出人员后,再用相同的纸条做成 20 个号签,上面分别写上 1~20 这 20 个数字,代表演出顺序,不
放回地让每名学生抽一张,各人抽到的号签上的数就是这位学生表演的顺序.
【题型 3 随机数法的应用】
【例 3】(23-24 高一下·甘肃白银·阶段练习)某总体由编号为01,02,03, ,19,20的20个个体组成,利用下
列随机数表选出5个个体,选法是下列表中第一行第5列开始从左到右依次选2个数字,选出的第5个个体编
号为( )
1818 0792 4544 1716 5809 7983 8619
6216 7650 0310 5523 6405 0526 6238
A.16 B.09 C.19 D.61
【解题思路】根据随机数表,依次进行选择即可得出结果.
【解答过程】选取方法是从随机数表第 1 行的第5列数字开始,
从左到右依次选取2两个数字,
则选出来的5个个体编号分别为∶07,17,16,09,19
所以选出来的第5个个体编号为19.
故选:C.
【变式 3-1】(23-24 高一下·陕西咸阳·阶段练习)某高校对中文系新生进行体测,利用随机数表对 650 名学
生进行抽样,先将 650 名学生进行编号,001,002, ,649,650.从中抽取 50 个样本,如图提供随机数
表的第 4 行到第 6 行,若从表中第 5 行第 6 列开始向右读取数据,则得到的第 4 个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.007 B.253 C.328 D.860
【解题思路】按照随机数表提供的数据,三位一组的读数,并取 001 到 650 内的数,重复的只取一次,读
取到第 4 个即可.
【解答过程】从第 5 行第 6 列开始向右读取数据,
第一个数为 253,第二个数是 313,
第三个数是 457,下一个数是 860,不符合要求,
下一个数是 736,不符合要求,下一个是 253,重复,
第四个是 007,故 A 正确.
故选:A.
【变式 3-2】(23-24 高二·上海·课堂例题)某校为了解高二年级学生对于某知识点的掌握情况,在一次数学
考试后,按照 1:30 的比例抽取一组样本试卷进行分析.该校高二年级有 12 个班,共 540 人,每班人数如下
表所示.请利用随机数表法进行抽取,并写出过程.
班级 一班 二班 三班 四班 五班 六班
人数 43 47 47 43 47 43
班级 七班 八班 九班 十班 十一班 十二班
人数 44 47 46 43 47 43
【解题思路】计算出所需抽取人数后,将 540 人编号,而后从随机数表定开始位,然后依次按规则开始选
取编号数,超过或重复的去掉,最后保留所需个数即可.
【解答过程】540 × 130 = 18,即需抽取 18 人,
第一步:将 540 人从一班开始编号为 001,002,003,…,539,540;
第二步,选定随机数表中的某一个数作为开始位;
第三步,从选定的数字开始,按三个数字一组向右读下去,
一行读完时转下一行自左向右继续读,不在 001 至 540 之间的数跳过,
已读过的重复数字去掉,直到取足 18 个数字为止;
以上 18 个数字编号对应学生作为抽取的样本.
【变式 3-3】(2024 高一下·全国·专题练习)某市质监局要检查某公司某个时间段生产的 500 克袋装牛奶的
质量是否达标,现从 500 袋牛奶中抽取 10 袋进行检验.
(1)利用随机数法抽取样本时,应如何操作?
(2)如果用随机数法生成部分随机数如下所示,据此写出应抽取的袋装牛奶的编号.
162,277,943,949,545,354,821,737,932,354,873,520,964,384,263,491,648,642,
175,331,572,455,068,877,047,447,672,172,065,025,834,216,337,663,013,785,
916,955,567,199,810,507,175,128,673,580,667.
【解题思路】(1)根据随机数法抽取样本的原则操作即可;
(2)根据随机数与编号相对应,一次写出即可;
【解答过程】(1)第一步,将 500 袋牛奶编号为 001,002,…,500.
第二步,用随机数工具产生 1~500 范围内的整数随机数.
第三步,把产生的随机数作为抽中的编号,使与编号对应的袋装牛奶进入样本.
第四步,重复上述过程,直到产生 10 个不同编号为止.
(2)应抽取的袋装牛奶的编号为 162,277,354,384,263,491,175,331,455,068.
【题型 4 简单随机抽样的概率】
【例 4】(23-24 高一下·天津南开·期末)利用简单随机抽样的方法,从 n 个个体( ≥ 13)中抽取 13 个个
1
体,若从第二次抽取开始时,余下的每个个体被抽到的概率为3,则在整个抽样过程中,每个个体被抽到的
可能性为( )
A 13 13 1 13.36 B.37 C.3 D.40
【解题思路】根据已知条件,结合简单随机抽样的定义,即可求解.
1
【解答过程】解:从第二次开始抽取时,余下的每个个体被抽到的概率为3,
13 1 1
则 1 = 3,
解得 = 37,
13
故在整个抽样过程中,每个个体被抽到的可能性为37.
故选:B.
【变式 4-1】(2024 高一下·全国·专题练习)某中学高一年级有 400 人,高二年级有 320 人,高三年级有 280
人,若用随机数法在该中学抽取容量为 n 的样本,每人被抽到的可能性都为 0.2,则 n 等于( )
A.80 B.160 C.200 D.280
【解题思路】根据简单随机抽样概率的求解方法,列出方程计算即可.
【解答过程】由题意可知,400+320+280 = 0.2,解得 = 200.
故选:C.
【变式 4-2】(23-24 高一下·江苏常州·期末)从某班学号为 1 到 10 的十名学生(其中含学生甲)中抽取 3
名学生参加某项调查,现用抽签法抽取样本(不放回抽取),每次抽取一个号码,共抽 3 次,设甲第一次
被抽到的可能性为 ,第二次被抽到的可能性为 ,则( )
A = 3 2 1. 10, = 9 B. = 10, =
1
9
C 3 3. = 10, = 10 D. =
1 1
10, = 10
【解题思路】由题意结合简单随机抽样的特征即可确定实数 , 的值.
【解答过程】由简单随机抽样的定义知,每个个体在每次抽取中都有相同的可能性被抽到,
1
因为每次抽取一个号码,所以甲第一次被抽到的可能性为 = 10,
9 1
第二次被抽到的可能性为 = 10 × 9 =
1
10.
1 1 1
即甲同学在每次抽样中被抽到的可能性都是10,所以 = 10, = 10.
故选:D.
【变式 4-3】(2024·四川成都·模拟预测)用简单随机抽样的方法从含有 10 个个体的总体中抽取一个容量为
3 的样本,其中某一个体 a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( )
A 1 1 3 1.10,10 B.10,5
C 1 1 D 3 2.10,9 .10,9
【解题思路】根据简单随机抽样的等可能性,即可判断和选择.
1 9
【解答过程】总体有 10 个个体,从中抽取第一个,若为 ,则其可能性为10,若不为 ,则其可能性为10;
9 1 1
抽取第二个,若其为 ,则第一次一定不是 ,再从 9 个个体中抽取 1 个,且为 ,则其可能性为10 × 9 = 10.
1 1
综上所述,某一个体 a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是10,10.
故选:A.
【题型 5 简单随机抽样估计总体】
【例 5】(23-24 高一下·安徽阜阳·期末)中国古典数学先后经历了三次发展高潮,即两汉时期、魏晋南北
朝时期和宋元时期,并在宋元时期达到顶峰,而南宋时期的数学家秦九韶正是其中的代表人物.作为秦九
韶的集大成之作,《数书九章》一书所承载的数学成就非同一般.可以说,但凡是实际生活中需要运用到
数学知识的地方,《数书九章》一书皆有所涉及,例如“验米夹谷”问题:今有谷 3318 石,抽样取谷一把,
数得 168 粒内有秕谷 22 粒,则粮仓内的秕谷约为( )
A.321 石 B.166 石 C.434 石 D.623 石
【解题思路】根据给定条件,利用样本的数字特征估计总体的相应特征作答.
22
【解答过程】设粮仓内的秕谷有 石,依题意,3318 = 168,解得 = 434.5,
所以粮仓内的秕谷约为 434 石.
故选:C.
【变式 5-1】(24-25 高一·全国·课后作业)为了估计某自然保护区中天鹅的数量,可以使用以下方法:先从
该保护区中捕出一定数量的天鹅,例如 200 只,给每只天鹅做上记号,不影响其存活,然后放回保护区,
经过适当的时间,让其和保护区中其余的天鹅充分混合;再从保护区中捕出一定数量的天鹅,例如 150 只,
查看其中有记号的天鹅,设有 20 只.根据上述数据,估计该自然保护区中天鹅的数量为( )
A.4000 B.3000 C.1500 D.750
【解题思路】根据简单随机抽样估计总体,列出方程即可得解.
200
【解答过程】设该自然保护区中天鹅的数量为 m,则 =
20
150,解得 = 1500.
故选:C.
【变式 5-2】(24-25 高一·全国·课后作业)为了解某中学生遵守《中华人民共和国交通安全法》的 情况,
调查部门在该校进行了如下的随机调查,向被调查者提出两个问题:
(1)你的学号是奇数吗?(2)在过路口时你是否闯过红灯?
要求被调查者背对着调查人员抛掷一枚硬币,如果出现正面,就回答第一个问题,否则就回答第二个问
题.被调查者不必告诉调查人员自己回答的是哪一个问题,只需回答“是”或“不是”,因为只有调查者本人知
道回答了哪一个问题,所以都如实地做了回答.结果被调查的 800 人(学号从 1 至 800)中有 240 人回答了
“是”.由此估计这 800 人中闯过红灯的人数?
【解题思路】在准备的两个问题中每一个问题被问到的概率相同,第一个问题可能被询问 400 次,在被询
问的 400 人中有 200 人学号是奇数,比 200 人多出来的人数就是 400 人中闯过红灯的人数,从而估计出 800
人中有过闯过红灯的人数.
【解答过程】解:要调查 800 名学生,在准备的两个问题中每一个问题被问到的概率相同,
∴第一个问题可能被询问 400 次,
∵在被询问的 400 人中有 200 人学号是奇数,而有 240 人回答了“是”,
∴估计有240 200 = 40个人闯过红灯,即在 400 人中有 40 个人闯过红灯,
∴根据概率的知识来估计这 800 人中有过闯过红灯的人数为 80.
【变式 5-3】(24-25 高一·全国·课后作业)近年来,我国高速铁路发展迅速,到 2016 年底为止,已经运营
的高铁轨道的总长度已达2.2 × 104km,位居世界第一.为了提高营运的效率,铁路部门在安排停靠站台时通
过分班次、间隔站点的方式进行,如京沪高铁 G125 班次 11∶10 从北京始发,开往上海虹桥(据 2017 年 10
月时刻表),停靠站分别为天津南、德州东、济南西、滕州东、蚌埠南、南京南、镇江南、常州北、昆山
南,而 08∶35 从北京始发的 G111 班次,停靠站分别为德州东、济南西、泰安、滁州、南京南、丹阳北、无
锡东,最后停靠终点站上海虹桥.试运用统计研究的方法完成下述任务:
(1)如何确定每天的总班次及具体班次的安排?
(2)在确定各个班次停靠站的数量时应考虑哪些因素?如何实施?
(3)在确定各个班次停靠站时应考虑哪些因素?如何实施?
【解题思路】(1)估算总人数除以载客量得到总班次,具体班次由站台人数分布确定.
(2)确定各个班次停靠站的数量时应考虑时间和人数,抽样调查人数的高峰期,得到方案.
(3)确定各个班次停靠站时应考虑时间和人数分布,抽样调查,估算总数,得到方案.
【解答过程】(1)运用抽样调查的方式,用样本估计总体,得到从北京到上海及沿途乘坐总人数,
除以每列火车的运载量,得到总班次;
具体班次的安排主要是由每个车站的乘坐人数决定,由于是间隔停靠,站台人数和多的站点多安排车次.
(2)在确定各个班次停靠站的数量时应考虑时间和人数,
有的站点人数会跟时间强烈相关,并不是平均分布的,需要在高峰时段多安排车辆;
实施的方式是统计各个站台各个时间段内的人数,估计总人数,绘制图像,制定方案.
(3)在确定各个班次停靠站时应考虑时间和人数分布,
采取抽样调查的方式,统计各个时间段的人数分布,为制定方案提供数据支持.
【知识点 2 分层随机抽样】
1.分层随机抽样
(1)分层随机抽样的必要性
简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比
较“极端”的样本,从而使得估计出现较大的误差,这时候我们可以考虑采取一种新的抽样方法——分层随机
抽样.
(2)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个
子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法
称为分层随机抽样,每一个子总体称为层.
(3)比例分配
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
即
① = ;
② = .
(4)分层随机抽样的步骤
①分层:根据已经掌握的信息,将总体分成互不重叠的层.
②求比:根据总体中的个体数 N 和样本容量 n 计算抽样比 .
③定数:确定第 i 层应该抽取的个体数为 ni=Ni·k(Ni为总体中第 i 层所包含的个体数),使得各 ni之和
为 n.
④抽样:按“定数”步骤中确定的个体数在各层中随机地抽取个体,合在一起便得到容量为 n 的样本.
(5)分层随机抽样的特点
①适用于由差异明显的几部分(即层)组成的总体;
②分成的各层互不重叠;
③各层抽取的比例都等于样本容量在总体中的比例,即 ,其中 n 为样本容量,N 为总体容量;
④分层随机抽样使样本具有较强的代表性,而且在各层抽样时,又可灵活地选用不同的随机抽样方法.
2.分层随机抽样的平均数计算
在分层随机抽样中,如果层数分为 2 层,第 1 层和第 2 层包含的个体数分别为 M 和 N,抽取的样本量
分别为 m 和 n,第 1 层、第 2 层的总体平均数分别为 ,第 1 层、第 2 层的样本平均数分别为 ,
总体平均数为 ,样本平均数为 ,则 .
由于用第 1 层的样本平均数 可以估计第 1 层的总体平均数 ,用第 2 层的样本平均数 可以估计第 2
层的总体平均数 ,因此可以用 估计总体平均数 .
又 = = ,
所以 .
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数 估计总体平均数 .
【题型 6 抽样方法的选取】
【例 6】(24-25 高二上·四川绵阳·期末)①在一次满分为 100 分的测试中,有 12 人的成绩在 90 分以上,
30 人的成绩在 60~80 分,12 人的成绩低于 60 分,现从中抽取 9 人了解有关考试题目难度的情况;②一彩
民选号,从装有 36 个大小、形状都相同的号签的盒子中无放回地抽出 6 个号签.针对这两件事,恰当的抽样
方法分别为( )
A.分层抽样,简单随机抽样 B.简单随机抽样,简单随机抽样
C.简单随机抽样,分层抽样 D.分层抽样,分层抽样
【解题思路】根据分层抽样和简单随机抽样的特点判断即可.
【解答过程】对于①:考试成绩在不同分数段之间的同学有明显的差异,用分层随机抽样比较恰当;
对于②:总体包含的个体较少,用简单随机抽样比较恰当.
故选:A.
【变式 6-1】(24-25 高一上·江西·期末)为了了解某县中小学生课外阅读时间情况,拟从该县的中小学生中
抽取部分学生进行调查,事先已经了解到该县小学、初中、高中三个学段学生的课外阅读时间存在较大差
异,而男、女生的阅读时间差异不大,则最合理的抽样方法是( )
A.按性别分层随机抽样 B.按学段分层随机抽样
C.抽签法 D.随机数表法
【解题思路】由分层抽样的概念即可判断;
【解答过程】因为男、女生的阅读时间差异不大,而小学、初中、高中三个学段学生的课外阅读时间存在
较大差异,故应按照学段分层随机抽样.
故选:B.
【变式 6-2】(23-24 高二上·上海长宁·期末)①植物根据植株的高度及分枝部位等可以分为乔木、灌木和
草木三大类,某植物园需要对其园中的不同植物的干重(烘干后测定的质量)进行测量;②检测员拟对一
批新生产的 1000 箱牛奶抽取 10 箱进行质量检测;上述两项调查应采用的抽样方法是( )
A.①用简单随机抽样,②用分层随机抽样 B.①用简单随机抽样,②用简单随机抽样
C.①用分层随机抽样,②用简单随机抽样 D.①用分层随机抽样,②用分层随机抽样
【解题思路】根据简单随机抽样和分层随机抽样的特点进行判断即可.
【解答过程】①乔木、灌木、草木,分类明显,可以采用分层随机抽样;
②并未有明显分层特点,且样本容量较小,可以采用简单随机抽样;
故选:C.
【变式 6-3】(23-24 高一下·陕西西安·期末)现要完成下列 3 项抽样调查:
①从 10 盒酸奶中抽取 3 盒进行食品卫生检查;②科技报告厅有 32 排,每排有 40 个座位,有一次报告会恰
好坐满了听众,报告会结束后,为了听取意见,需要请 32 名听众进行座谈;③某中学有高中生 3500 人,
初中生 1500 人,为了解学生的学习情况,拟抽取一个容量为 200 的样本.较为合理的抽样方法分别是
( )
A.①简单随机抽样,②分层抽样,③系统抽样
B.①简单随机抽样,②系统抽样,③分层抽样
C.①系统抽样,②简单随机抽样,③分层抽样
D.①分层抽样,②系统抽样,③简单随机抽样
【解题思路】根据简单随机抽样、系统抽样、分层抽样的定义和特点,以及适用范围,判断即可.
【解答过程】对于①,总体中的个体数较少,宜用简单随机抽样;
对于②,总体中的个体数较多,而且容易分成均衡的若干部分,
要选 32 名听众而刚好有 32 排,每排选一人,宜用系统抽样;
对于③,总体中的个体数较多,又是由差异明显的两部分组成,宜用分层抽样.
故选:B.
【题型 7 抽样比、样本总量、各层总数、总体容量的计算】
【例 7】(24-25 高一下·江西赣州·开学考试)为庆祝中国共产党成立100周年,赣州市举办“红歌大传唱”主
题活动,以传承红色革命精神,某高中学校分别有高一、高二、高三学生1200人、1000人、800人,现欲
采用分层随机抽样法组建一个30人的高一、高二、高三学生红歌传唱队,则应抽取高一学生( )
A.6人 B.8人 C.10人 D.12人
【解题思路】借助分层抽样的性质计算即可得.
1200
【解答过程】1200+1000+800 × 30 = 12,故应抽取高一学生12人.
故选:D.
【变式 7-1】(23-24 高三上·广西·阶段练习)北京时间 2023 年 10 月 31 日 8 时 11 分,神舟十六号载人飞船
返回舱在东风着陆场成功着陆,载人飞行任务取得圆满成功.某高中学校在有 120 名同学的“航天”社团中随
机抽取 24 名参加一个交流会,若按社团中高一、高二、高三年级的成员人数比例分层随机抽样,则高一年
级抽取 6 人,若按性别比例分层随机抽样,则女生抽取 15 人,则下列结论错误的是( )
A.24 是样本容量
B.120 名社团成员中男生有 50 人
C.高二与高三年级的社团成员共有 90 人
D.高一年级的社团成员中女生最多有 30 人
【解题思路】利用样本容量的定义结合分层抽样知识解答即可.
【解答过程】对于 A,由样本容量定义知:样本容量为24,A 正确;
15
对于 B, ∵ 女生共有24 × 120 = 75人, ∴ 男生有120 75 = 45人,B 错误;
对于 C 6, ∵ 高一年级的社团成员有24 × 120 = 30人, ∴ 高二高三年级的社团成员共有120 30 = 90人,C 正
确;
对于 D,由 C 知:高一年级的社团成员共30人, ∴ 高一年级的社团成员中女生最多有30人,D正确.
故选:B.
【变式 7-2】(24-25 高一上·河南南阳·阶段练习)某中学有高中生 1800 人,初中生 1200 人,为了解学生课
外锻炼情况,用分层抽样的方法从学生中抽取一个容量为 的样本.已知从高中生中抽取的人数比从初中生中
抽取的人数多 24,则 = ( )
A.48 B.72 C.60 D.120
【解题思路】根据题意,先求出分层抽样的抽样比例 :3000,然后分别求出抽取的高中生和初中生人数,
根据条件即可求解.
【解答过程】由题意可知:分层抽样按照 :3000的比例进行抽取,
3
则高中生抽取的人数为:1800 × 3000 = 5 ;
2
初中生抽取的人数为:1200 × 3000 = 5 ;
3 2
因为从高中生中抽取的人数比从初中生中抽取的人数多 24,则 5 5 = 24,
解得: = 120,
故选:D.
【变式 7-3】(24-25 高二下·河南·阶段练习)中国古代数学专著《算法统宗》中有这样的记载:毛诗春秋周
易书,九十四册共无余,毛诗一册三人读,春秋一册四人呼,周易五人读一本.意思为:现有《毛诗》《春
秋》《周易》3种书共94册,若干人读这些书,要求每个人都要读到这3种书,若3人共读一本《毛诗》,4
人共读一本《春秋》,5人共读一本《周易》,则刚好没有剩余.现要用分层抽样的方法从中抽取47册,则要
从《毛诗》中抽取的册数为( )
A.12 B.14 C.18 D.20
【解题思路】设《毛诗》有 册,《春秋》有 册,《周易》有 册,学生人数为 ,根据已知条件可得出关
于 、 、 、 的方程组,解出这四个未知数的值,再利用分层抽样可求得结果.
【解答过程】设《毛诗》有 册,《春秋》有 册,《周易》有 册,学生人数为 ,
+ + = 94 = 120
= 3 = 40
则 = 4 ,解得 = 30 ,
= 5 = 24
47
因此,用分层抽样的方法从中抽取47册,则要从《毛诗》中抽取的册数为40 × 94 = 20.
故选:D.
【题型 8 分层抽样的概率计算】
【例 8】(24-25 高二上·福建·阶段练习)某地区高中分三类,A 类学校共有学生 2000 人,B 类学校共有学
生 3000 人,C 类学校共有学生 4000 人,若采取分层抽样的方法抽取 900 人,则 A 类学校中的学生甲被抽
到的概率( )
A 9 1 1.20 B.2000 C.2 D
1
.10
【解题思路】利用抽样的性质求解
【解答过程】所有学生数为2000 + 3000 + 4000 = 9000,
900 1
所以所求概率为9000 = 10.
故选:D.
【变式 8-1】(2025 高三·全国·专题练习)某校要从高一、高二、高三共 2 023 名学生中选取 50 名组成志愿
团,若先用简单随机抽样的方法从 2 023 名学生中剔除 23 名,再从剩下的 2 000 名学生中按分层随机抽样
的方法抽取 50 名,则每名学生入选的可能性( )
A 50 1.都相等且为2023 B.都相等且为40
C.不完全相等 D.均不相等
【解题思路】根据简单随机抽样和分层抽样都是等可能抽样得到答案.
【解答过程】根据简单随机抽样及分层随机抽样的定义可得,每个个体被抽到的概率都相等,所以每个个
50
体被抽到的概率都等于2023
故选:A.
【变式 8-2】(24-25 高二上·北京昌平·期末)甲、乙两个车间生产同一种产品的合格率分别为90%,80%,
检验员每天都要按照3:2的比例分别从甲、乙两个车间抽取部分产品进行检验.从被抽检的产品中任选一件,
则选到合格品的概率为( )
A.84% B.86% C.88% D.90%
【解题思路】利用分层抽样的比例,结合题中所给的合格率即可求出结果.
3 2
【解答过程】由已知条件可知,选到合格品的概率为3+2 × 90% + 3+2 × 80% = 86%.
故选:B.
【变式 8-3】(24-25 高三上·江西吉安·期末)垃圾分类,人人有责.北京市从 2020 年 5 月 1 日开始实施《北
京市生活垃圾管理条例》,北京将生活垃圾分为有害垃圾、可回收物、厨余垃圾和其他垃圾四类,并分别
设置了相应的垃圾箱,为调查居民生活垃圾分类投放情况,现随机抽取了某区四类垃圾箱中总计 1000 吨生
活垃圾,数据统计如下(单位:吨):
“有害垃圾”箱 “可回收物”箱 “厨余垃圾”箱 “其他垃圾”箱
有害垃圾 60 5 5 10
可回收物 5 185 10 10
厨余垃圾 10 40 540 10
其他垃圾 5 15 10 80
则下列结论中不正确的是( )
A.厨余垃圾占垃圾总量的 60% B.有害垃圾投放正确的概率为 75%
C.厨余垃圾投放正确的概率为 90% D.生活垃圾投放错误的概率为 15%
【解题思路】根据表中数据计算出厨余垃圾、垃圾总量可判断 A;计算出正确投放有害垃圾的总量和有害
垃圾的总量可判断 B;计算出正确投放厨余垃圾的总量和厨余垃圾的总量可判断 C;先计算出生活垃圾投放
正确的概率再用 1 减去这个值,可得生活垃圾投放错误的概率可判断 D.
【解答过程】厨余垃圾共10 + 40 + 540 + 10 = 600(吨),占垃圾总量的 60%,选项 A 正确;
60
有害垃圾投放正确的概率为60+5+5+10 × 100% = 75%,选项 B 正确;
540
厨余垃圾投放正确的概率为600 × 100% = 90%,选项 C 正确;
60+185+540+80
生活垃圾投放正确的概率为 1000 × 100% = 86.5%,生活垃圾投放错误的概率为 13.5%,选项 D 错
误.
故选:D.
【知识点 3 获取数据的途径】
1.获取数据的途径
(1)通过调查获取数据
我们一般通过抽样调查或普查的方法获取数据.
(2)通过试验获取数据
没有现存的数据可以查询时,就需要通过对比试验的方法去获取样本观测数据.
(3)通过观察获取数据
自然现象只能通过长久的持续观察获取数据.
(4)通过查询获得数据
通过收集前人的劳动成果并加以利用,从而减少收集数据的成本.
【题型 9 普查与抽样】
【例 9】(23-24 高一下·天津河西·期末)下列情况适合用抽样调查的是( )
A.调查某化工厂周围 5 个村庄是否受到污染
B.调查某批次汽车的抗撞击能力
C.调查某班学生的身高情况
D.学校招聘,对应聘人员进行面试
【解题思路】根据抽样调查的直接判断即可.
【解答过程】根据抽样调查的定义可以判断 B 适合抽样调查,根据全面调查的定义可以判断 A、C、D 适合
全面调查.
故选:B.
【变式 9-1】(23-24 高一上·江西景德镇·期末)下列调查方式中,可用普查的是( )
A.调查某品牌电动车的市场占有率 B.调查 2023 年杭州亚运会的收视率
C.调查某校高三年级的男女同学的比例 D.调查一批玉米种子的发芽率
【解题思路】根据普查适合调查对象数目较少的情况来判断即可.
【解答过程】选项 ABD 调查对象的数目较多,适合采用抽查;C 调查对象的数目较少,适合采用普查.
故选:C.
【变式 9-2】(24-25 高二·上海·课堂例题)下面的调查是普查还是抽样调查?
(1)想知道一锅菜的咸淡,取一点尝尝;
(2)为了解西瓜甜不甜,在西瓜的某个部位切一个三角口子取出一块尝尝;
(3)为了记录某次下雨的降水量,学校气象小组用雨量计对雨水进行了收集和测量;
(4)为了了解九年级一班学生课外健身所用的时间,老师给全班每位同学发放调查表进行调查.
【解题思路】根据普查和抽样调查的概念,依次进行判断即可.
【解答过程】(1)想知道一锅菜的咸淡,取一点尝尝,因为是取部分的尝尝,所以是抽样调查;
(2)为了解西瓜甜不甜,在西瓜的某个部位切一个三角口子取出一块尝尝,因为是取西瓜的某个部位尝尝,
所以是抽样调查;
(3)为了记录某次下雨的降水量,学校气象小组用雨量计对雨水进行了收集和测量,因为是收集部分雨水,
所以是抽样调查;
(4)为了了解九年级一班学生课外健身所用的时间,老师给全班每位同学发放调查表进行调查,因为是对
每位同学发放调查表进行调查,所以是普查.
【变式 9-3】(24-25 高一上·全国·课后作业)下列调查中哪些属于普查,哪些属于抽查
(1)为了了解某班级的每名学生穿几号鞋,向全班同学做调查;
(2)为了了解某学校高一年级学生穿几号鞋,向该学校高一年级某班的全体同学做调查;
(3)为了了解某班的同学们每天的睡眠时间,在每个小组中各选取 2 名学生做调查;
(4)为了了解某班的同学们每天的睡眠时间,选取该班中学号为偶数的所有学生做调查.
【解题思路】根据普查和抽查的概念,依次判断即可求解.
【解答过程】(1)因为调查的是班级的每名学生,所以属于普查;
(2)通过该班的全体同学穿几号鞋来了解学校高一年级学生穿几号鞋,这是抽查.
样本是该班的全体同学的鞋号,总体是学校高一年级学生的鞋号;
(3)通过小组的 2 名学生每天的睡眠时间来了解全部学生每天的睡眠时间,这是抽查.
样本分别是每个小组中选取的 2 名学生每天的睡眠时间,总体都是该班同学每天的睡眠时间;
(4)通过学号为偶数的学生的睡眠时间来了解全部学生每天的睡眠时间,这是抽查.
总体都是该班同学每天的睡眠时间. 学号为偶数的所有学生的睡眠时间.
【题型 10 总体与样本】
【例 10】(23-24 高一下·西藏日喀则·期末)高考结束后,为了分析该校高三年级 1000 名学生的高考成绩,
从中随机抽取了 100 名学生的成绩,就这个问题来说,下列说法中正确的是( )
A.100 名学生是个体
B.样本容量是 100
C.每名学生的成绩是所抽取的一个样本
D.1000 名学生是样本
【解题思路】根据有关的概念可得总体、个体、样本这三个概念考查的对象都是学生成绩,而不是学生,
再结合题中选项即可得到答案.
【解答过程】根据有关的概念并且结合题意可得总体、个体、样本这三个概念考查的对象都是学生成绩,
而不是学生,
根据选项可得选项 A、D 表达的对象都是学生,而不是成绩,所以 A、D 都错误.
C 每名学生的成绩是所抽取的一个样本也是错的,应是每名学生的成绩是一个个体.
B:样本的容量是 100 正确.
故选:B.
【变式 10-1】(23-24 高一下·天津河东·期末)为确保食品安全,某市质检部门检查 1000 袋方便面的质量,
抽查总量的2%.在这个问题中,下列说法正确的是( )
A.总体是指这 1000 袋方便面 B.个体是 1 袋方便面
C.样本是按2%抽取的 20 袋方便面 D.样本容量为 20
【解题思路】根据总体,个体,样本,样本的定义逐一判断即可得解.
【解答过程】对于 A,总体是指这 1000 袋方便面的质量,故 A 错误;
对于 B,个体是指 1 袋方便面的质量,故 B 错误;
对于 C,样本是指按照2%抽取的 20 袋方便面的质量,故 C 错误;
对于 D,样本容量为1000 × 2% = 20,故 D 正确.
故选:D.
【变式 10-2】(24-25 高二·上海·课堂例题)为了了解参加运动会的 2000 名运动员的年龄情况,从中抽取
20 名运动员的年龄进行统计分析.就这个问题,分别判断下列说法是否正确,并说明理由.
(1)2000 名运动员是总体;
(2)每名运动员是个体;
(3)所抽取的 20 名运动员是一个样本.
【解题思路】根据总体、个体以及样本的定义逐项分析判断.
【解答过程】(1)错误,理由如下:
总体是指包含所研究的全部个体或数据的集合,所以 2000 名运动员的年龄是总体.
(2)错误,理由如下:
个体是指总体中的每个个体或数据,所以每名运动员的年龄是个体.
(3)错误,理由如下:
样本是指从总体中随机抽取的一部分个体,所以本题 20 名运动员的年龄是一个样本.
【变式 10-3】(23-24 高二·上海·课堂例题)小王和小张计划调查上海市新生儿的性别情况.小王调查了最
近一个月在 A 医院出生的 320 名新生儿,其中有 156 名女孩,小王由此推断:上海市新生儿男女比例基本
均衡.小张的姐姐在 B 医院待产,她告诉小张最近一周在 B 医院出生的 18 名新生儿中有 13 名女孩,小张
由此推断:上海市新生儿男女比例严重失调,考虑下面的问题:
(1)在上面的统计活动中,总体和样本分别是什么?
(2)你同意小王和小张的推断吗?请说一说你的理由.
(3)你认为是否可以用上面的样本来推断上海市新生儿的男女比例?请说一说你的理由.
【解题思路】(1)根据总体和样本定义分别求解;
(2)根据抽样情况判断不全面不能得出推论;
(3)说明不能用上面的样本来推断上海市新生儿的男女比例的理由.
【解答过程】(1)总体是上海市新生儿的性别情况,样本是在 A 医院出生的 320 名新生儿的性别情况;
(2)不同意,根据抽样情况只能说明抽样的情况,判断不全面,不能得出推论;
(3)不能,抽样的不全面不能得出科学的推断.