(人教A版2019必修二)专题9-1 随机抽样 学案(重难点题型精讲)(原卷+解析卷)

文档属性

名称 (人教A版2019必修二)专题9-1 随机抽样 学案(重难点题型精讲)(原卷+解析卷)
格式 zip
文件大小 999.1KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2024-01-21 13:43:43

文档简介

专题9.1 随机抽样(重难点题型精讲)
1.抽样调查的必要性
(1)相关概念
名称 定义
全面调查(普查) 对每一个调查对象都进行调查的方法.
抽样调查 根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法.
总体 调查对象的全体.
个体 从总体中抽取的那部分个体.
样本 从总体中抽取的那部分个体.
样本量 样本中包含的个体数.
(2)抽样的必要性
普查往往需要花费大量的财力、物力,而抽样调查具有花费少、效率高的特点.另外,在有些调查中,抽样调查则具有不可替代的作用,比如:
①一些个体具有破坏性.如不可能对所有的炮弹都进行试射检验其是否合格.
②一些检测具有毁损性.如不可能把地里所有的种子都挖出来检验其是否发芽.
2.简单随机抽样
(1)简单随机抽样的概念
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.
(2)(不放回)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取样本的总体中所含个体的个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单随机抽样中各个个体被抽到的可能性(机会)都相等(与第几次抽取无关),从而保证了抽样的公平性.
3.两种常见的简单随机抽样方法
(1)抽签法
一般地,抽签法就是把总体中的N个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也
可以是卡片、小球等)上作为号签,并将这些号签放在一个不透明的盒,充分搅拌,最后从盒中不放回
地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的数量.
(2)随机数法
先把总体中的N个个体编号,用随机数工具产生1~N范围内的整数随机数,把产生的随机数作为抽中
的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需要的数量.如果生成的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的数量.
(3)两种抽样方法的优缺点
抽样方法 优点 缺点 适用范围
抽签法 简单易行. 总体量较大时,操作起来比较麻烦. 适用于总体中个体数不多的情形.
随机数法 简单易行,它很好地解决了总体量较大时用抽签法制签困难的问题. 总体量很大,样本量也很大时,利用随机数法抽取样本仍不方便. 总体量较大,样本量较小的情形.
4.总体平均数与样本平均数
(1)概念
名称 定义
总体均值(总体平均数) 一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称为总体均值,又称总体平均数.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式.
样本均值(样本平均数) 如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称为样本均值,又称样本平均数.
说明:(1)在简单随机抽样中,我们常用样本平均数去估计总体平均数; (2)总体平均数是一个确定的数,样本平均数具有随机性(因为样本具有随机性); (3)一般情况下,样本量越大,估计越准确.
(2)求和符号的性质
①;
②,其中k为常数.
5.分层随机抽样
(1)分层随机抽样的必要性
简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比
较“极端”的样本,从而使得估计出现较大的误差,这时候我们可以考虑采取一种新的抽样方法——分层随机抽样.
(2)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个
子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(3)比例分配
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.即
①=;
②=.
(4)分层随机抽样的步骤
(5)分层随机抽样的特点
①适用于由差异明显的几部分(即层)组成的总体;
②分成的各层互不重叠;
③各层抽取的比例都等于样本容量在总体中的比例,即,其中n为样本容量,N为总体容量;
④分层随机抽样使样本具有较强的代表性,而且在各层抽样时,又可灵活地选用不同的随机抽样方法.
6.分层随机抽样的平均数计算
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量
分别为m和n,第1层、第2层的总体平均数分别为,,第1层、第2层的样本平均数分别为,,总体平均数为,样本平均数为,则==+.
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用=+估计总体平均数.
又==,
所以+=+=.
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数.
7.获取数据的途径
(1)通过调查获取数据
我们一般通过抽样调查或普查的方法获取数据.
(2)通过试验获取数据
没有现存的数据可以查询时,就需要通过对比试验的方法去获取样本观测数据.
(3)通过观察获取数据
自然现象只能通过长久的持续观察获取数据.
(4)通过查询获得数据
通过收集前人的劳动成果并加以利用,从而减少收集数据的成本.
【题型1 抽样方法的选取】
【方法点拨】
根据几种抽样方法的特点和优缺点,结合具体的样本,选取合适的抽样方法.
【例1】(2023秋·四川绵阳·高二期末)现须完成下列2项抽样调查:①从12瓶饮料中抽取4瓶进行食品卫生检查;②某生活小区共有540名居民,其中年龄不超过30岁的有180人,年龄在超过30岁不超过60岁的有270人,60岁以上的有90人,为了解居民对社区环境绿化方面的意见,拟抽取一个容量为30的样本.较为合理的抽样方法分别为( )
A.①抽签法,②分层随机抽样 B.①随机数法,②分层随机抽样
C.①随机数法,②抽签法 D.①抽签法,②随机数法
【解题思路】根据抽签法以及分层抽样的使用条件,可得答案.
【解答过程】对于①,由于抽取的总体个数与样本个数都不大,则应用抽签法;
对于②,抽取的总体个数较多,且总体有明确的分层,抽取的样本个数较大,则采用分层随机抽样.
故选:A.
【变式1-1】(2023·全国·高一专题练习)某校为了了解高二学生的身高情况,打算在高二年级12个班中抽取3个班,再按每个班男女生比例抽取样本,正确的抽样方法是( )
A.简单随机抽样 B.先用分层抽样,再用随机数表法
C.分层抽样 D.先用抽签法,再用分层抽样
【解题思路】利用抽样方法求解.
【解答过程】解:在高二年级12个班中抽取3个班,这属于简单随机抽样中的抽签法,
按男女生比例抽取样本属于分层抽样,所以是先用抽签法,再用分层抽样.
故选:D.
【变式1-2】(2022秋·上海浦东新·高二期末)现要完成下列项抽样调查:
①从盒饼干中抽取盒进行食品卫生检查;
②某中学共有名教职工,其中一般教师名,行政人员名,后勤人员名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为的样本,较为合理的抽样方法是( )
A.①简单随机抽样,②分层抽样
B.①简单随机抽样,②简单随机抽样
C.①分层抽样,②分层抽样
D.①分层抽样,②简单随机抽样
【解题思路】根据简单随机抽样和分层抽样的特征判断抽样方法.
【解答过程】①总体中的个体数较少,宜用简单随机抽样;
②总体是由差异明显的几部分组成,宜用分层抽样.
故选:A.
【变式1-3】(2022秋·陕西榆林·高二阶段练习)某公司有160名员工,其中研发部120名,销售部16名,客服部24名,为调查他们的收入情况,从中抽取一个容量为20的样本,较为合适的抽样方法是( )
A.简单随机抽样 B.系统抽样
C.分层抽样 D.其他抽样
【解题思路】根据员工明显来自三个不同的部门可以选择适当的抽样方法.
【解答过程】由题意员工来自三个不同的部门,因此采取分层抽样方法较合适.
故选:C.
【题型2 抽签法的应用】
【方法点拨】
一个抽样能否用抽签法,关键看两点:一是制作号签是否方便,二是号签是否容易被搅拌均匀.一般地,当
总体容量和样本容量都较少时可用抽签法,然后按照抽签法的步骤进行抽样即可.
【例2】(2023·全国·高一专题练习)某校高一共有10个班,编号1至10,某项调查要从中抽取三个班作为样本,现用抽签法抽取样本,每次抽取一个号码,共抽3次,设五班第一次抽到的可能性为a,第二次被抽到的可能性为b,则 (  )
A.a=,b= B.a=,b=
C.a=,b= D.a=,b=
【解题思路】由题意结合简单随机抽样的特征即可确定实数a,b的值.
【解答过程】由简单随机抽样的定义知,每个个体在每次抽取中都有相同的可能性被抽到,
故五班在每次抽样中被抽到的可能性都是,
所以,
故选:D.
【变式2-1】(2023·全国·高一专题练习)下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
【解题思路】根据抽签法的特征:个体数以及样本容量较小,且易均匀混合,即可结合选项求解.
【解答过程】选项A中总体中的个体数较大,样本容量也较大,不适合用抽签法;
选项B中总体中的个体数较小,样本容量也较小,且同厂生产的两箱产品可视为搅拌均匀了,可用抽签法;
选项C中甲、乙两厂生产的两箱产品质量可能差别较大,不能满足搅拌均匀的条件,不能用抽签法;
选项D中总体中的个体数较大,不适合用抽签法.
故选:B.
【变式2-2】(2022·高一单元测试)甲、乙、丙三位同学争着去参加一个公益活动.抽签决定谁去.那你认为抽到的概率大的是( ).
A.先抽的概率大些
B.三人的概率相等
C.无法确定谁的概率大
D.以上都不对
【解题思路】根据抽签法,每个个体被抽取的概率相等判断.
【解答过程】∵甲、乙、丙三位选手抽到的概率是,
故选:B.
【变式2-3】(2023·全国·高一专题练习)在对101个人进行一次抽样时,先采用抽签法从中剔除一个人,再在剩余的100中随机抽取10人,那么下列说法正确的是( )
A.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会
B.每个人在整个抽样过程中被抽到的机会均等,因为每个人被剔除的可能性相等,那么,不被剔除的机会也是均等的
C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少
D.每个人被抽到的可能性不相等
【解题思路】根据随机抽样的特征,即可判断出结果.
【解答过程】由于第一次剔除时采用抽签法,对每个人来说可能性相等,然后随机抽取10人对每个人的机会也是均等的,所以总的来说每个人的机会都是均等的,被抽到的可能性都是相等的.
故选:B.
【题型3 随机数法的应用】
【方法点拨】
随机数法的步骤:(1)编号;(2)产生随机数;(3)选号;(4)确定样本.
【例3】(2022·全国·高三专题练习)某工厂为了对40个零件进行抽样调查,将其编号为00,01,…,38,39.现要从中选出5个,利用下面的随机数表,从第一行第3列开始,由左至右依次读取,则选出来的第1个零件编号是( )
A.36 B.16 C.11 D.14
【解题思路】根据随机数表的规则读取编号.
【解答过程】从题中给的随机数表第一行第3列开始从左往右开始读取,重复的数字只读一次,读到的小于40的编号分别为36,33,26,16,11.所以出来的第1个零件编号是36.
故选:A.
【变式3-1】(2022·全国·高一学业考试)总体有编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取3个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第3个个体的编号为( )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
A.08 B.02 C.63 D.14
【解题思路】由随机数表法抽样原理即可求出答案.
【解答过程】根据题意,依次读出的数据为65(舍去),72(舍去),08,02,63(舍去),14,即第三个个体编号为14.
故选:D.
【变式3-2】(2022·全国·高三专题练习)年月日,女排世界杯在日本拉开帷幕,某网络直播平台开通观众留言渠道,为中国女排加油.现该平台欲利用随机数表法从编号为、、…、的号码中选取个幸运号码,选取方法是从下方随机数表第行第列的数字开始,从左往右依次选取个数字,则第个被选中的号码为( )
A. B. C. D.
【解题思路】根据随机数表中的取数原则可得选项.
【解答过程】根据题意及随机数表可得5个被选中的号码依次为16,06 ,09,13 ,23.所以第5个被选中的号码为23.
故选:C.
【变式3-3】(2022春·陕西渭南·高一期末)要考察某公司生产的克袋装牛奶的质量是否达标,现从袋牛奶中抽取袋进行检验,将它们编号为、、、、,利用随机数表抽取样本,从第行第列的数开始,按位数依次向右读取,到行末后接着从下一行第一个数继续.则第三袋牛奶的标号是( )
(下面摘取了某随机数表的第行至第行)
A. B. C. D.
【解题思路】利用随机数表法可得结果.
【解答过程】由随机数表法可知,前三袋牛奶的标号依次为、、,故第三袋牛奶的标号是.
故选:B.
【题型4 样本平均数估计总体平均数】
【方法点拨】
在简单随机抽样中,根据样本平均数和总体平均数之间的关系,进行求解即可.
【例4】(2022·全国·高一专题练习)有4万个不小于70的两位数,从中随机抽取了3000个数据,统计如下:
数据% 70≤x≤79 80≤x≤89 90≤x≤99
个数 800 1300 900
平均数 78.1 85 91.9
请根据表格中的信息,估计这4万个数据的平均数为( )
A.92.16 B.85.23 C.84.73 D.77.97
【解题思路】首先求出这3000个数据的平均数,即可得解;
【解答过程】解:这3000个数据的平均数为.
用样本平均数估计总体平均数,可知这4万个数据的平均数约为.
故选:B.
【变式4-1】(2022·高一课时练习)已知某样本的容量为50,平均数为70.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90,在对错误的数据进行更正后,重新求得的样本平均数为,则( )
A. B. C. D.的大小无法判断
【解题思路】根据样本平均数的定义可知,那么修改前后无变化,从而得到的值.
【解答过程】根据题意,,
知修改前后数据的总和不变,则在对错误的数据进行更正后,重新求得的样本平均数不变,即.
故选:A.
【变式4-2】(2022·上海·高二专题练习)某样本平均数为,总体平均数为,那么( )
A. B. C. D.是的估计值
【解题思路】统计学中利用样本数据估计总体数据,可知样本平均数是总体平均数的估计值.
【解答过程】解:样本平均数为,总体平均数为,
统计学中,利用样本数据估计总体数据,
∴样本平均数是总体平均数的估计值.
故选:D.
【变式4-3】(2022春·河南濮阳·高一期末)为了合理调配电力资源,某市欲了解全市50000户居民的日用电量.若通过简单随机抽样从中抽取了300户进行调查,得到其日用电量的平均数为,则可以推测全市居民用户日用电量的平均数( ).
A.一定为 B.高于 C.低于 D.约为
【解题思路】根据样本平均数和总体平均数的关系来判断即可.
【解答过程】样本平均数是对总体平均数的一种估计,它们之间没有确定的大小关系,
所以ABC均错误,
故选:D.
【题型5 分层随机抽样中的相关运算】
【方法点拨】
在分层随机抽样中,确定抽样比k是抽样的关键.一般地,按抽样比(N为总体容量,n为样本容量)
在各层中抽取个体,就能确保抽样的公平性.注意在每层抽样时,应灵活采用简单随机抽样的方法.
【例5】(2023春·江西·高三开学考试)2021年12月9日15时40分,“天宫课堂”第一课开始,神舟十三号乘组航天员翟志刚、王亚平、叶光富在中国空间站进行太空授课.某中学组织全校学生观看了此次授课,三位太空老师介绍展示了中国空间站的工作生活场景,演示了微重力环境下细胞学实验、物理运动、液体表面张力等现象,并与地面课堂进行了实时交流,极大地激发了学生探索科学的兴趣.为了解同学们对“天宫课堂”这种授课模式的兴趣,此校决定利用分层抽样的方法从高一、高二、高三学生中随机抽取90人进行调查,已知该校学生共有3600人,若抽取的学生中高二年级有30人,则该校高二年级学生共有( )
A.800人 B.1000人 C.1200人 D.1400人
【解题思路】根据题意求出抽样比,再结合抽取的学生中高二年级有30人,即可得出答案.
【解答过程】由题意可得,抽样比为,
所以设高二年级学生共有人,则.
故选:C.
【变式5-1】(2023秋·广西北海·高一统考期末)某中学有高中生1800人,初中生1200人,为了解学生课外锻炼情况,用分层抽样的方法从学生中抽取一个容量为的样本.已知从高中生中抽取的人数比从初中生中抽取的人数多24,则( )
A.48 B.72 C.60 D.120
【解题思路】根据题意,先求出分层抽样的抽样比例,然后分别求出抽取的高中生和初中生人数,根据条件即可求解.
【解答过程】由题意可知:分层抽样按照的比例进行抽取,
则高中生抽取的人数为:;
初中生抽取的人数为:;
因为从高中生中抽取的人数比从初中生中抽取的人数多24,则,
解得:,
故选:.
【变式5-2】(2022春·河南商丘·高一阶段练习)某地区高中分三类,A类学校共有学生2000人,B类学校共有学生3000人,C类学校共有学生4000人,若采取分层抽样的方法抽取900人,则A类学校中的学生甲被抽到的概率( )
A. B. C. D.
【解题思路】利用抽样的性质求解
【解答过程】所有学生数为,
所以所求概率为.
故选:D.
【变式5-3】(2022·高一课时练习)为了庆祝中国共产党成立100周年,某学校组织了一次“学党史、强信念、跟党走”主题竞赛活动.活动要求把该学校教师按年龄分为35岁以下,岁,45岁及其以上三个大组.用分层抽样的方法从三个大组中抽取一个容量为10的样本,组成答题团队,已知岁组中每位教师被抽到的概率为,则该学校共有教师(  )人
A.120 B.180 C.240 D.无法确定
【解题思路】根据抽样过程中每个个体被抽到的概率都相等可得答案.
【解答过程】因为在抽样过程中,每位教师被抽到的概率都相等,
所以该学校共有教师人.
故选:C.
【题型6 分层随机抽样的平均数计算】
【方法点拨】
根据题目条件,结合分层随机抽样的平均数计算方法,进行求解即可.
【例6】(2022·高一课时练习)某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取100件做使用寿命的测试,由所得样品的测试结果计算出一 二 三分厂取出的产品的使用寿命平均值分别为1020小时 980小时 1030小时,则可估计这个企业所生产的该产品的平均使用寿命为( )
A.1015小时 B.1005小时 C.995小时 D.985小时
【解题思路】将各个厂产品的使用寿命平均值乘以对应的产量占比并将结果相加即可得企业生产的该产品的平均使用寿命.
【解答过程】该产品的平均使用寿命为 (小时).
故选:A.
【变式6-1】(2022春·广东肇庆·高一期末)某中学高一年级有女生380人,男生420人,学校想通过抽样的方法估计高一年级全体学生的平均体重.学校从女生和男生中抽取的样本分别为40和80,经计算这40个女生的平均体重为49kg,80个男生的平均体重为57kg,依据以上条件,估计高一年级全体学生的平均体重最合理的计算方法为( )
A. B.
C. D.
【解题思路】利用比例分配的分层随机抽样计算可得答案.
【解答过程】用女生样本的平均体重49kg估计女生总体的平均体重,用男生样本的平均体重57kg估计男生总体的平均体重,按女生和男生在总人数中的比例计算总体的平均体重,所以D选项最合理.
故选:D.
【变式6-2】(2022·高一课时练习)某房地产公司为了解小区业主对户型结构——平层与复式结构的满意度,采取分层随机抽样方式对华润中央公园小区的业主进行问卷调查.20位已购买平层户型的业主满意度平均分为8,30位已购买复式户型的业主满意度平均分为9,用样本平均数估计该小区业主对户型结构满意度的平均分为( )
A.8.4 B.8.5 C.8.6 D.8.7
【解题思路】根据分层抽样各层的均值计算总分值,再计算平均分即可.
【解答过程】估计小区业主对户型结构满意度的平均分为
.
故选:C.
【变式6-3】(2022·全国·高一专题练习)某校有住宿的男生400人,住宿的女生600人,为了解住宿生每天运动时间,通过分层随机抽样的方法抽到100名学生,其中男生、女生每天运动时间的平均值分别为100分钟、80分钟.结合此数据,请你估计该校全体住宿学生每天运动时间的平均值为( )
A.98分钟 B.90分钟 C.88分钟 D.85分钟
【解题思路】由分层抽样的性质可得抽取的男女生人数,进而可得样本中学生每天运动时间的平均值,即可得解.
【解答过程】由分层抽样的性质可得抽取男生人,女生人,
则样本中学生每天运动时间的平均值(分钟),
故可估计该校全体住宿学生每天运动时间的平均值为88分钟.
故选:C.专题9.1 随机抽样(重难点题型精讲)
1.抽样调查的必要性
(1)相关概念
名称 定义
全面调查(普查) 对每一个调查对象都进行调查的方法.
抽样调查 根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法.
总体 调查对象的全体.
个体 从总体中抽取的那部分个体.
样本 从总体中抽取的那部分个体.
样本量 样本中包含的个体数.
(2)抽样的必要性
普查往往需要花费大量的财力、物力,而抽样调查具有花费少、效率高的特点.另外,在有些调查中,抽样调查则具有不可替代的作用,比如:
①一些个体具有破坏性.如不可能对所有的炮弹都进行试射检验其是否合格.
②一些检测具有毁损性.如不可能把地里所有的种子都挖出来检验其是否发芽.
2.简单随机抽样
(1)简单随机抽样的概念
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.
(2)(不放回)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取样本的总体中所含个体的个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单随机抽样中各个个体被抽到的可能性(机会)都相等(与第几次抽取无关),从而保证了抽样的公平性.
3.两种常见的简单随机抽样方法
(1)抽签法
一般地,抽签法就是把总体中的N个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也
可以是卡片、小球等)上作为号签,并将这些号签放在一个不透明的盒,充分搅拌,最后从盒中不放回
地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的数量.
(2)随机数法
先把总体中的N个个体编号,用随机数工具产生1~N范围内的整数随机数,把产生的随机数作为抽中
的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需要的数量.如果生成的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的数量.
(3)两种抽样方法的优缺点
抽样方法 优点 缺点 适用范围
抽签法 简单易行. 总体量较大时,操作起来比较麻烦. 适用于总体中个体数不多的情形.
随机数法 简单易行,它很好地解决了总体量较大时用抽签法制签困难的问题. 总体量很大,样本量也很大时,利用随机数法抽取样本仍不方便. 总体量较大,样本量较小的情形.
4.总体平均数与样本平均数
(1)概念
名称 定义
总体均值(总体平均数) 一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称为总体均值,又称总体平均数.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式.
样本均值(样本平均数) 如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称为样本均值,又称样本平均数.
说明:(1)在简单随机抽样中,我们常用样本平均数去估计总体平均数; (2)总体平均数是一个确定的数,样本平均数具有随机性(因为样本具有随机性); (3)一般情况下,样本量越大,估计越准确.
(2)求和符号的性质
①;
②,其中k为常数.
5.分层随机抽样
(1)分层随机抽样的必要性
简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比
较“极端”的样本,从而使得估计出现较大的误差,这时候我们可以考虑采取一种新的抽样方法——分层随机抽样.
(2)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个
子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(3)比例分配
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.即
①=;
②=.
(4)分层随机抽样的步骤
(5)分层随机抽样的特点
①适用于由差异明显的几部分(即层)组成的总体;
②分成的各层互不重叠;
③各层抽取的比例都等于样本容量在总体中的比例,即,其中n为样本容量,N为总体容量;
④分层随机抽样使样本具有较强的代表性,而且在各层抽样时,又可灵活地选用不同的随机抽样方法.
6.分层随机抽样的平均数计算
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量
分别为m和n,第1层、第2层的总体平均数分别为,,第1层、第2层的样本平均数分别为,,总体平均数为,样本平均数为,则==+.
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用=+估计总体平均数.
又==,
所以+=+=.
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数.
7.获取数据的途径
(1)通过调查获取数据
我们一般通过抽样调查或普查的方法获取数据.
(2)通过试验获取数据
没有现存的数据可以查询时,就需要通过对比试验的方法去获取样本观测数据.
(3)通过观察获取数据
自然现象只能通过长久的持续观察获取数据.
(4)通过查询获得数据
通过收集前人的劳动成果并加以利用,从而减少收集数据的成本.
【题型1 抽样方法的选取】
【方法点拨】
根据几种抽样方法的特点和优缺点,结合具体的样本,选取合适的抽样方法.
【例1】(2023秋·四川绵阳·高二期末)现须完成下列2项抽样调查:①从12瓶饮料中抽取4瓶进行食品卫生检查;②某生活小区共有540名居民,其中年龄不超过30岁的有180人,年龄在超过30岁不超过60岁的有270人,60岁以上的有90人,为了解居民对社区环境绿化方面的意见,拟抽取一个容量为30的样本.较为合理的抽样方法分别为( )
A.①抽签法,②分层随机抽样 B.①随机数法,②分层随机抽样
C.①随机数法,②抽签法 D.①抽签法,②随机数法
【变式1-1】(2023·全国·高一专题练习)某校为了了解高二学生的身高情况,打算在高二年级12个班中抽取3个班,再按每个班男女生比例抽取样本,正确的抽样方法是( )
A.简单随机抽样 B.先用分层抽样,再用随机数表法
C.分层抽样 D.先用抽签法,再用分层抽样
【变式1-2】(2022秋·上海浦东新·高二期末)现要完成下列项抽样调查:
①从盒饼干中抽取盒进行食品卫生检查;
②某中学共有名教职工,其中一般教师名,行政人员名,后勤人员名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为的样本,较为合理的抽样方法是( )
A.①简单随机抽样,②分层抽样
B.①简单随机抽样,②简单随机抽样
C.①分层抽样,②分层抽样
D.①分层抽样,②简单随机抽样
【变式1-3】(2022秋·陕西榆林·高二阶段练习)某公司有160名员工,其中研发部120名,销售部16名,客服部24名,为调查他们的收入情况,从中抽取一个容量为20的样本,较为合适的抽样方法是( )
A.简单随机抽样 B.系统抽样
C.分层抽样 D.其他抽样
【题型2 抽签法的应用】
【方法点拨】
一个抽样能否用抽签法,关键看两点:一是制作号签是否方便,二是号签是否容易被搅拌均匀.一般地,当
总体容量和样本容量都较少时可用抽签法,然后按照抽签法的步骤进行抽样即可.
【例2】(2023·全国·高一专题练习)某校高一共有10个班,编号1至10,某项调查要从中抽取三个班作为样本,现用抽签法抽取样本,每次抽取一个号码,共抽3次,设五班第一次抽到的可能性为a,第二次被抽到的可能性为b,则 (  )
A.a=,b= B.a=,b=
C.a=,b= D.a=,b=
【变式2-1】(2023·全国·高一专题练习)下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
【变式2-2】(2022·高一单元测试)甲、乙、丙三位同学争着去参加一个公益活动.抽签决定谁去.那你认为抽到的概率大的是( ).
A.先抽的概率大些
B.三人的概率相等
C.无法确定谁的概率大
D.以上都不对
【变式2-3】(2023·全国·高一专题练习)在对101个人进行一次抽样时,先采用抽签法从中剔除一个人,再在剩余的100中随机抽取10人,那么下列说法正确的是( )
A.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会
B.每个人在整个抽样过程中被抽到的机会均等,因为每个人被剔除的可能性相等,那么,不被剔除的机会也是均等的
C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少
D.每个人被抽到的可能性不相等
【题型3 随机数法的应用】
【方法点拨】
随机数法的步骤:(1)编号;(2)产生随机数;(3)选号;(4)确定样本.
【例3】(2022·全国·高三专题练习)某工厂为了对40个零件进行抽样调查,将其编号为00,01,…,38,39.现要从中选出5个,利用下面的随机数表,从第一行第3列开始,由左至右依次读取,则选出来的第1个零件编号是( )
A.36 B.16 C.11 D.14
【变式3-1】(2022·全国·高一学业考试)总体有编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取3个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第3个个体的编号为( )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
A.08 B.02 C.63 D.14
【变式3-2】(2022·全国·高三专题练习)年月日,女排世界杯在日本拉开帷幕,某网络直播平台开通观众留言渠道,为中国女排加油.现该平台欲利用随机数表法从编号为、、…、的号码中选取个幸运号码,选取方法是从下方随机数表第行第列的数字开始,从左往右依次选取个数字,则第个被选中的号码为( )
A. B. C. D.
【变式3-3】(2022春·陕西渭南·高一期末)要考察某公司生产的克袋装牛奶的质量是否达标,现从袋牛奶中抽取袋进行检验,将它们编号为、、、、,利用随机数表抽取样本,从第行第列的数开始,按位数依次向右读取,到行末后接着从下一行第一个数继续.则第三袋牛奶的标号是( )
(下面摘取了某随机数表的第行至第行)
A. B. C. D.
【题型4 样本平均数估计总体平均数】
【方法点拨】
在简单随机抽样中,根据样本平均数和总体平均数之间的关系,进行求解即可.
【例4】(2022·全国·高一专题练习)有4万个不小于70的两位数,从中随机抽取了3000个数据,统计如下:
数据% 70≤x≤79 80≤x≤89 90≤x≤99
个数 800 1300 900
平均数 78.1 85 91.9
请根据表格中的信息,估计这4万个数据的平均数为( )
A.92.16 B.85.23 C.84.73 D.77.97
【变式4-1】(2022·高一课时练习)已知某样本的容量为50,平均数为70.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90,在对错误的数据进行更正后,重新求得的样本平均数为,则( )
A. B. C. D.的大小无法判断
【变式4-2】(2022·上海·高二专题练习)某样本平均数为,总体平均数为,那么( )
A. B. C. D.是的估计值
【变式4-3】(2022春·河南濮阳·高一期末)为了合理调配电力资源,某市欲了解全市50000户居民的日用电量.若通过简单随机抽样从中抽取了300户进行调查,得到其日用电量的平均数为,则可以推测全市居民用户日用电量的平均数( ).
A.一定为 B.高于 C.低于 D.约为
【题型5 分层随机抽样中的相关运算】
【方法点拨】
在分层随机抽样中,确定抽样比k是抽样的关键.一般地,按抽样比(N为总体容量,n为样本容量)
在各层中抽取个体,就能确保抽样的公平性.注意在每层抽样时,应灵活采用简单随机抽样的方法.
【例5】(2023春·江西·高三开学考试)2021年12月9日15时40分,“天宫课堂”第一课开始,神舟十三号乘组航天员翟志刚、王亚平、叶光富在中国空间站进行太空授课.某中学组织全校学生观看了此次授课,三位太空老师介绍展示了中国空间站的工作生活场景,演示了微重力环境下细胞学实验、物理运动、液体表面张力等现象,并与地面课堂进行了实时交流,极大地激发了学生探索科学的兴趣.为了解同学们对“天宫课堂”这种授课模式的兴趣,此校决定利用分层抽样的方法从高一、高二、高三学生中随机抽取90人进行调查,已知该校学生共有3600人,若抽取的学生中高二年级有30人,则该校高二年级学生共有( )
A.800人 B.1000人 C.1200人 D.1400人
【变式5-1】(2023秋·广西北海·高一统考期末)某中学有高中生1800人,初中生1200人,为了解学生课外锻炼情况,用分层抽样的方法从学生中抽取一个容量为的样本.已知从高中生中抽取的人数比从初中生中抽取的人数多24,则( )
A.48 B.72 C.60 D.120
【变式5-2】(2022春·河南商丘·高一阶段练习)某地区高中分三类,A类学校共有学生2000人,B类学校共有学生3000人,C类学校共有学生4000人,若采取分层抽样的方法抽取900人,则A类学校中的学生甲被抽到的概率( )
A. B. C. D.
【变式5-3】(2022·高一课时练习)为了庆祝中国共产党成立100周年,某学校组织了一次“学党史、强信念、跟党走”主题竞赛活动.活动要求把该学校教师按年龄分为35岁以下,岁,45岁及其以上三个大组.用分层抽样的方法从三个大组中抽取一个容量为10的样本,组成答题团队,已知岁组中每位教师被抽到的概率为,则该学校共有教师(  )人
A.120 B.180 C.240 D.无法确定
【题型6 分层随机抽样的平均数计算】
【方法点拨】
根据题目条件,结合分层随机抽样的平均数计算方法,进行求解即可.
【例6】(2022·高一课时练习)某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取100件做使用寿命的测试,由所得样品的测试结果计算出一 二 三分厂取出的产品的使用寿命平均值分别为1020小时 980小时 1030小时,则可估计这个企业所生产的该产品的平均使用寿命为( )
A.1015小时 B.1005小时 C.995小时 D.985小时
【变式6-1】(2022春·广东肇庆·高一期末)某中学高一年级有女生380人,男生420人,学校想通过抽样的方法估计高一年级全体学生的平均体重.学校从女生和男生中抽取的样本分别为40和80,经计算这40个女生的平均体重为49kg,80个男生的平均体重为57kg,依据以上条件,估计高一年级全体学生的平均体重最合理的计算方法为( )
A. B.
C. D.
【变式6-2】(2022·高一课时练习)某房地产公司为了解小区业主对户型结构——平层与复式结构的满意度,采取分层随机抽样方式对华润中央公园小区的业主进行问卷调查.20位已购买平层户型的业主满意度平均分为8,30位已购买复式户型的业主满意度平均分为9,用样本平均数估计该小区业主对户型结构满意度的平均分为( )
A.8.4 B.8.5 C.8.6 D.8.7
【变式6-3】(2022·全国·高一专题练习)某校有住宿的男生400人,住宿的女生600人,为了解住宿生每天运动时间,通过分层随机抽样的方法抽到100名学生,其中男生、女生每天运动时间的平均值分别为100分钟、80分钟.结合此数据,请你估计该校全体住宿学生每天运动时间的平均值为( )
A.98分钟 B.90分钟 C.88分钟 D.85分钟