中小学教育资源及组卷应用平台
9.1 随机抽样
【学习要求】
1.了解随机抽样的必要性和重要性,理解随机抽样的目的和基本要求;
2.理解简单随机抽样中的抽签法、随机数法;掌握用样本平均数估计总体平均数的方法;
3.理解分层随机抽样的概念,掌握用分层随机抽样从总体中抽取样本;掌握两种抽样的区别与联系。
4.掌握求分层随机抽样总样本的平均数及方差的方法。
【思维导图】
【知识梳理】
1.统计的相关概念
全面调查(普查)、抽样调查
①全面调查(普查):对每一个调查对象都进行调查的方法,称为全面调查,又称普查;
②总体:调查对象的全体;③个体:组成总体的每一个调查对象;
④抽样调查:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法;⑤样本:从总体中抽取的那部分个体;
⑥样本量:样本中包含的个体数;⑦样本数据:调查样本获得的变量值
2.简单随机抽样
(1)定义:一般地,设一个总体含有(为正整数)个个体,从中逐个抽取()个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样,放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样,通过简单随机抽样获得的样本称为简单随机样本
从总体中,逐个不放回地随机抽取个个体作为样本,一次性批量随机抽取个个体作为样本,两
种方法是等价的.
(2)特点:①有限性:总体中个体数有限;②逐一性:从总体中逐个抽取,这样便于在抽样试验中进行操作;③等可能性:是一种等可能抽样,在整个抽样过程中各个个体被抽取到的可能性相等,从而保证了这种抽样方法的公平性理解.
3.两种常用的简单随机抽样方法
(1)抽签法
①把总体中的个个体编号,把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,将号签放在一个不透明容器中,充分搅拌后,每次从中不放回地抽取一个号签,连续抽取次,使与号签上的编号对应的个体进入样本,就得到一个容量为的样本.
②抽签法的抽样步骤
第一步:将总体中的所有个体编号(编号)
第二步:并把号码写在形状、大小相同的号签上;将号签放在一个不透明容器中,并搅拌均匀(制签)
第三步:每次从中不放回抽取一个号签,直到抽取到足够的样本量(抽取)
③优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.
④缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大,因此,抽签法一般适用于总体中个体数不多的情形.
(2)随机数法:即利用随机试验、信息技术(计算器、电子表格软件、R统计软件等)生成随机数进行抽样.
②随机数法的抽样步骤
第1步:编号:将总体中的每个个体编号;第2步:选号:用随机数工具产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,直到抽足样本所需要的个体数.如果生成的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的个体数;第3步:取样:把选定的号码所对应的个个体作为样本.
(3)抽签法和随机数法的异同点
相同点:都是简单随机抽样,并且要求被抽取样本的总体的个体数有限.
不同点:①在总体容量较小的情况下,抽签法相对于随机数法来说更简单;
②抽签法适用于总体中的个体数相对较少的情况,而随机数法更适用于总体中的个体数较多的情况,这样可以节约大量的人力和制作号签的成本.
4.总体平均数与样本平均数
(1)总体平均数:一般地,总体中有个个体,它们的变量值分别为,,…,
则称为总体均值,又称总体平均数.
(2)加权平均数:如果总体的个变量值中,不同的值共有()个,不妨记为,,…,,其中出现的频数(),则总体均值还可以写成加权平均数的形式:.
(3)样本平均数:如果从总体中抽取一个容量为的样本,它们的变量值分别为,,…,
则称为样本均值,又称样本平均数.
5.分层随机抽样的概念及特点
(1)分层随机抽样的概念
一般地,按一个或多个变量把总体划分为若干个子总体,每个个体属于且仅属于一个子总体,在每个字总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
(2)分层随机抽样的特点
①从分层随机抽样的定义可看出,分层随机抽样适用于总体由差异明显的几个部分组成的情况.
②分层随机抽样是等可能抽样.用分层随机抽样从个体数为的总体中抽取一个容量为的样本时,在整个抽样过程中,每个个体被抽到的可能性相等,都等于.
③分层随机抽样是建立在简单随机抽样的基础之上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表注,更能充分反映总体的情况,在实践中的应用也更广泛.
6.分层随机抽样的步骤
①根据己经掌握的信息,将总体分成互不相交的层;
②根据总体中的个体数和样本量计算抽样比;
③确定第层应该抽取的个体数目(为第层所包含的个体数),使得各之和为;
④在各个层中,按步骤③中确定的数目在各层中随机抽取个体,合在一起得到容量为的样本.
7.简单随机抽样与分层随机抽样的比较
类别 共同点 各自特点 相互联系 适用范围
简单随机抽样 抽样过程中每个个体被抽取的概率是相同的 从总体中逐个抽取 总体中的个体数较少
分层抽样 将总体分成几层,分层进行抽取 各层抽样时采用简单随机抽样或系统 总体由差异明显的几部分组成
8.分层随机抽样的平均数
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为和,抽取的样本量分别为和.我们用表示第1层各个个体的变量值,用表示第1层样本的各个个体的变量值;用表示第2层各个个体的变量值,用表示第2层样本的各个个体的变量值,则第1层的总体平均数和样本平均数分别为
.
第2层的总体平均数和样本平均数分别为.
总体平均数和样本平均数分别为.
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用
.
9.获取数据的途径
在实际统计调查中,一般先要确定调查的目的、对象,即统计调查要解决的问题和需要调查的总体;还要确定好调查的项目,也就是要统计的变量.接下来就开始收集数据,收集数据的基本途径如下:
(1)通过调查获取数据
设计调查问卷:调查问卷一般由一组有目的、有系统、有顺序的题目组成.问题由调查人员根据调查的目的、项目进行设计
设计调查问卷的注意事项:①问题要具体,有针对性,使受调查者能够容易作答.
②语言简单、准确,含义清楚,避免出现有歧义或意思含混的句子
③题目不能出现引导受调查者答题倾向的语句
④设计问题时要注意“如何得到敏感性问题的诚实回答”.
(2)通过试验获取数据:根据调查项目的要求设计一些合适的试验,能够直接地获得样本数据.试验时要注意准备好试验用具(或组织好观测的对象)、指定专门的记录人员等.做试验通常能得到可靠的数据资料,但需花费的人力、物力、时间较多,有时带有破坏性.
(3)通过观察获取数据:对于有些现象,不能用试验或者抽样等方法来获取数据,只能通过长久持续的观察获取,主要是一些自然现象,如地震、降水、大气污染、宇宙射线等.一般地,通过观察自然现象所获取的数据性质比较复杂,其中蕴含着所观察现象的本质信息,需要通过统计学理论和方法来挖掘.
(4)通过查询获得数据:有些数据资料不容易直接调查得到,这时可以通过查阅统计年鉴、图书馆文献等方法获得所需或相关的数据,比如全国历次人口普查的数据都可以在统计年鉴中查阅到;还可以通过互联网上的资源得到数据资料.
【高频考点】
高频考点1 . 统计的相关概念辨析
【方法点拨】根据统计的相关概念逐一辨别即可。
1.下列说法不正确的是( )
A.普查是对所有的对象进行调查
B.样本不一定是从总体中抽取的,没有抽取的个体也可能是样本
C.当调查的对象很少时,普查是很好的调查方式,但当调查的对象很多时,普查要耗费大量的人力、物力和财力
D.普查不是在任何情况下都能实现的
【答案】B
【解析】因为样本必须是从总体中抽取的,没有抽取的个体不是样本,故B的说法不正确.
2.在“世界读书日”前夕,为了了解某地名居民某天的阅读时间,从中抽取了名居民的阅读时间进行统计分析.在这个问题中,名居民的阅读时间的全体是( )
A.总体 B.个体 C.样本的容量 D.从总体中抽取的一个样本
【答案】A
【解析】从5000份中抽取200份,样本的容量是200,抽取的200份是一个样本,
每个居民的阅读时间就是一个个体,5000名居民的阅读时间的全体是总体.所以选A.
3.为了了解某市高三毕业生升学考试中数学成绩的情况,从参加考试的学生中随机地抽查了1 000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是( )
A.总体指的是该市参加升学考试的全体学生 B.个体指的是1 000名学生中的每一名学生
C.样本容量指的是1 000名学生 D.样本是指1 000名学生的数学成绩
【答案】D
【解析】因为是了解学生的数学成绩的情况,
因此样本是指1 000名学生的数学成绩,而不是学生.
4.从总数为的一批零件中抽取一个容量为的样本,若每个零件被抽取的可能性为,则为( )
A. B. C. D.
【答案】A
【解析】由题意可得,解得,故选A.
高频考点2. 简单随机抽样的应用
【方法点拨】
简单随机抽样定义:一般地,设一个总体含有(为正整数)个个体,从中逐个抽取()个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样,放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样,通过简单随机抽样获得的样本称为简单随机样本
从总体中,逐个不放回地随机抽取个个体作为样本,一次性批量随机抽取个个体作为样本,两
种方法是等价的.
特点:①有限性:总体中个体数有限;②逐一性:从总体中逐个抽取,这样便于在抽样试验中进行操作;③等可能性:是一种等可能抽样,在整个抽样过程中各个个体被抽取到的可能性相等,从而保证了这种抽样方法的公平性理解.
1.(2022·河北·高一课时练习)对于简单随机抽样,下列说法中正确的是( )
①它要求被抽取样本的总体的个体数有限;②它是从总体中逐个进行抽取的;
③它是一种不放回抽样;④它是一种等可能抽样,在整个抽样过程中,每个个体被抽到的机会相等.
A.①②③ B.①②④ C.①③④ D.①②③④
【答案】D
【详解】①简单随机抽样要求样本的总体个数有项,这样才能保证样本能够很好地代表总体,所以①正确.②由于总体数量是有限的,所以为了让数据具有代表性需要从总体中逐个地进行抽取,以便在抽取实践中进行操作,所以②正确.③在抽样过程中,为了保证抽取的公平性,样本数据是一种不放回的抽样,所以③正确.④在随机抽样的出发点是使每个个体都有相同的机会被抽中,这是基于对样本数据代表性的考虑,所以④正确.故选:D.
2.下列抽样方法是简单随机抽样的是( )
A.环保局人员取河水进行化验 B.用抽签的方法产生随机数表
C.福利彩票用摇奖机摇奖 D.老师抽取数学成绩最优秀的2名同学代表班级参加数学竞赛
【答案】C
【解析】简单随机抽样要求总体中的个体数有限,每个个体有相同的可能性被抽到.故选C.
3.(2022·山东·高一课时练习)下列抽取样本的方式是简单随机抽样的有( )
①某连队从200名官兵中,挑选出50名最优秀的官兵赶赴某地参加救灾工作;
②箱子中有100支铅笔,从中选10支进行试验,在抽样操作时,从中任意拿出一支检测后再放回箱子;③从50个个体中一次性抽取8个个体作为样本;
④从2000个灯泡中不放回地逐个抽取20个进行质量检查.
A.0个 B.1个 C.2个 D.3个
【答案】B
【详解】对①,某连队从200名官兵中,挑选出50名最优秀的官兵赶赴某地参加救灾工作,不是随机抽取,所以不是简单随机抽样;对②,从中任意拿出一支铅笔检测后再放回箱子,是有放回的抽样,所以不是简单随机抽样;对③,从50个个体中一次性抽取8个个体作为样本,不是逐个抽取,所以不是简单随机抽样;对④,从2000个灯泡中不放回地逐个抽取20个进行质量检查,是简单随机抽样.
故选:B
4.下列抽取样本的方式,不是简单随机抽样的是( )
A.从无限多个个体中抽取100个个体作为样本
B.盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出1个零件进行质量检验后再把它放回盒子里
C.从20件玩具中一次性抽取3件进行质量检验
D.某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛
【答案】ABCD
【解析】A:该抽样方式不是简单随机抽样,原因是简单随机抽样中总体的个数是有限的,而该选项中是无限的;B:该抽样方式不是简单随机抽样,原因是简单随机抽样是不放回地抽取,而该选项中是有放回地抽取;
C:该抽样方式不是简单随机抽样,原因是简单随机抽样是逐个抽取,而该选项中是一次性抽取;
D:该抽样方式不是简单随机抽样,因为个子最高的5名同学是56名同学中特定的,
不存在随机性,不是等可能抽样.故选ABCD.
5.(2022·重庆·高三专题练习)利用简单随机抽样,从个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的概率为( )
A. B. C. D.
【答案】C
【详解】根据题意,,解得n=28.
故在整个抽样过程中每个个体被抽到的概率为.故选:C﹒
高频考点3 . 抽签法的应用
【方法点拨】抽签法的抽样步骤
第一步:将总体中的所有个体编号(编号)
第二步:并把号码写在形状、大小相同的号签上;将号签放在一个不透明容器中,并搅拌均匀(制签)
第三步:每次从中不放回抽取一个号签,直到抽取到足够的样本量(抽取)
优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.
缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大,因此,抽签法一般适用于总体中个体数不多的情形.
1.(2022·广东·高一课时练习)下列抽取样本的方式是否属于简单随机抽样?如果不是,说明理由.
(1)从无限多个个体中抽取100个个体作为样本;
(2)盒子里共有零件80个,从中依次拿出5个零件进行质量检验.
【答案】(1)不是简单随机抽样,理由见解析.(2)是简单随机抽样,理由见解析.
【详解】(1)不是简单随机抽样,因为个体有无限多个;
(2)是简单随机抽样,因为总体中的个体数是80个,从中不放回地抽取了5个样本,且每次抽取时总体内的各个个体被抽到的机会相等.
2.(2022·广西·高一专题练习)某单位拟从40名员工中选1人赠送电影票,可采用下面两种选法:
选法一:将这40名员工按1~40进行编号,并相应地制作号码为1 40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的员工幸运入选;
选法二:将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中摸取一个球,则摸到红球的员工幸运入选.试问:
(1)这两种选法是否都是抽签法,为什么?(2)这两种选法中每名员工被选中的可能性是否相等?
【答案】(1)见解析;(2)这两种选法中每名员工被选中的可能性相等,均为.
【详解】(1)选法一:满足抽签法的特征,是抽签法;选法二:不是抽签法
抽签法要求所有的号签编号互不相同,而选法二中的个白球无法相互区分
(2)这两种选法中每名员工被选中的可能性相等,均为
3.(2022·山西·高一课时练习)某班有名学生,要从中随机地抽出人参加一项活动,请写出利用抽签法抽取该样本的过程.
【答案】过程见解析
【详解】(1)利用抽签法步骤如下:第一步:将这50名学生编号,编号为01,02,03,…,50.
第二步:将50个号码分别写在纸条上,并揉成团,制成号签.
第三步:将得到的号签放在一个不透明的容器中,搅拌均匀.
第四步:从容器中逐一抽取6个号签,并记录上面的号码.
对应上面6个号码的学生就是参加该项活动的学生.
4.(2022·重庆·高一课时练习)某地区选拔运动会志愿者,最后阶段要从35名志愿者中去掉5名,由于每名志愿者都很优秀,决定采取抽签法,请写出用抽签法去掉5人的过程.
【答案】答案见解析
【详解】利用抽签法抽取样本的具体步骤:
①将这35人编号为1,2,3,…,35;②将号码写在形状、大小相同的号签上;
③将号签放在同一箱中,并搅拌均匀;④从箱中每次抽出1个号签,连续抽取5次;
⑤将与号签上的编号一致的人抽出来去掉即可.
5.(2023·黑龙江·高一专题练习)选择合适的抽样方法抽样,写出抽样过程.有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个入样.
【答案】见解析;
【详解】总体中个体数较小,用抽签法.
第一步,将30个篮球,编号为1,2,…,30;
第二步,将以上30个编号分别写在外观、质地等无差别的小纸条上,揉成小球状,制成号签;
第三步,把号签放入一个不透明的盒子中,充分搅拌;
第四步,从盒子中不放回地逐个抽取3个号签,并记录上面的号码;
第五步,找出和所得号码对应的篮球.
高频考点4. 随机数法的应用
【方法点拨】
随机数法的抽样步骤
第1步:编号:将总体中的每个个体编号;第2步:选号:用随机数工具产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,直到抽足样本所需要的个体数.如果生成的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的个体数;第3步:取样:把选定的号码所对应的个个体作为样本.
抽签法和随机数法的异同点
相同点:都是简单随机抽样,并且要求被抽取样本的总体的个体数有限.
不同点:①在总体容量较小的情况下,抽签法相对于随机数法来说更简单;
②抽签法适用于总体中的个体数相对较少的情况,而随机数法更适用于总体中的个体数较多的情况,这样可以节约大量的人力和制作号签的成本.
1.(2022·广西·高一课时练习)假设要从高三年级全体学生450人中随机抽出20人参加一项活动,请分别用抽签法和随机数法抽出人选,写出抽取过程.
【答案】见解析
【详解】
解:抽签法:先把450名同学的学号写在相同小纸片上,揉成小球,放在一个不透明的袋子中,充分搅拌后,再从中逐个抽出20个小球,这样就抽出20人参加活动.
随机数法:第一步,先将450人编号,可以编为1,2,3,…,450;
第二步:利用随机数工具产生1~450范围的整数随机数;
第三步:把产生的随机数作为抽中的编号,使与编号对应的学生进入样本,直到抽足样本所需20人.
2.(2023·河北·高一专题练习)选择合适的抽样方法抽样,写出抽样过程.现有一批电子元件600个,从中抽取6个进行质量检测;
【答案】(1)见解析;
【详解】(1)总体中个体数较大,用随机数法.
第一步,给元件编号为1,2,3,…,99,100,…,600;
第二步,用随机数工具产生1~600范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的电子元件进入样本;
第三步,依次操作,如果生成的随机数有重复,则剔除并重新产生随机数,直到样本量达到6;
第四步,以上这6个号码对应的元件就是要抽取的对象.
3.(2022·山东潍坊·高一期末)国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的末来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第三个号码为( )
随机数表如下:
A.13 B.24 C.33 D.36
【答案】D
【详解】
根据随机数表的读取方法,第2行第4列的数为3,每次从左向右选取两个数字,所以第一组数字为32,作为第一个号码;第二组数字58,舍去;第三组数字65,舍去;第四组数字74,舍去;第五组数字13,作为第二个号码;第六组数字36,作为第三个号码,所以选取的第三个号码为36故选:D
4.(2022·江西·临川一中高二阶段练习)某班有位同学,他们依次编号为01,02,….29,30,现利用下面的随机数表选取5位同学组建“文明校园督查组”.选取方法是从随机数表的第1行的第5列和第6列数字开始,由左到右依次选取两个效字,则选出来的第5位同学的编号为( )
41792 71635 86089 32157 95620 92109 29145
74955 82835 98378 83513 47870 20799 32122
A. B. C. D.
【答案】C
【详解】
从随机数表的第1行的第5列和第6列数字开始,
则取得的数字分别为:27,16,35(舍去),86(舍去),08,93(舍去),21,57(舍去),
95(舍去),62(舍去),09. 最终取得的第五个数字为:09故选:C.
5.(2023·四川省绵阳南山中学高二阶段练习)总体由编号为00,01,02,…,48,49的50个个体组成,利用下面的随机数表选取6个个体,从随机数表第5行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的编号为( )
附:第5行至第8行的随机数表如下:
2635 7900 3370 9160 1620 3882 7757 4950
3211 4919 7306 4916 7677 8733 9974 6732
2748 6198 7164 4148 7086 2888 8519 1620
7477 0111 1630 2404 2979 7991 9683 5125
A.33 B.16 C.38 D.20
【答案】D
【详解】按随机数表法,从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则编号依次为33,16,20,38,49,32,∴选出的第3个个体的编号为20. 故选:D.
高频考点5 . 总体平均数与样本平均数
【方法点拨】(1)总体平均数:一般地,总体中有个个体,它们的变量值分别为,,…,
则称为总体均值,又称总体平均数.
(2)加权平均数:如果总体的个变量值中,不同的值共有()个,不妨记为,,…,,其中出现的频数(),则总体均值还可以写成加权平均数的形式:.
(3)样本平均数:如果从总体中抽取一个容量为的样本,它们的变量值分别为,,…,
则称为样本均值,又称样本平均数.
1.(2022·全国·高一课时练习)有4万个不小于70的两位数,从中随机抽取了3000个数据,统计如下:
请根据表格中的信息,估计这4万个数据的平均数为( )
A.92.16 B.85.23 C.84.73 D.77.97
【答案】B
【详解】这3000个数据的平均数为。用样本平均数估计总体平均数,可知这4万个数据的平均数约为85.23.故选B.
2.某学校抽取100位老师的年龄,得到如下数据
年龄(单位:岁) 32 34 38 40 42 43 45 46 48
频数 2 4 20 20 26 10 8 6 4
则估计这100位老师的样本的平均年龄为( )
A.42岁 B.41岁 C.41.1岁 D.40.1岁
【答案】C
【解析】==41.1(岁),
即这100位老师的样本的平均年龄约为41.1岁.
3.从一个篮球训练营中抽取10名学员进行偷懒比赛,每人投10次,统计出该10名学员篮球投中的次数,4个投中5次,3个投中6次,2个投中7次,1个投中8次,试估计该训练营投篮投中的比例为 .
【答案】0.6
【解析】10名学员投中的平均次数为,所以投中的比例约为.
4.某高校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班有50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是________分.
【答案】85
【解析】由题意得,该校数学建模兴趣班的平均成绩是=85(分).
5.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:
甲 27 38 30 37 35 31
乙 35 29 40 34 30 36
分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数并判断选谁参加比赛比较合适?
【答案】乙参加比赛比较合适
【解析】甲= =33. 乙= =34.
因为甲<乙,故选乙参加比赛较合适.
高频考点6. 分层随机抽样概念的理解及应用
【方法点拨】(1)分层随机抽样的概念:一般地,按一个或多个变量把总体划分为若干个子总体,每个个体属于且仅属于一个子总体,在每个字总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
(2)分层随机抽样的特点
①从分层随机抽样的定义可看出,分层随机抽样适用于总体由差异明显的几个部分组成的情况.
②分层随机抽样是等可能抽样.用分层随机抽样从个体数为的总体中抽取一个容量为的样本时,在整个抽样过程中,每个个体被抽到的可能性相等,都等于.
③分层随机抽样是建立在简单随机抽样的基础之上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表注,更能充分反映总体的情况,在实践中的应用也更广泛.
1.(2022·云南·弥勒高一阶段练习)(1)某小区有800户家庭,其中高收入家庭200户,中等收入家庭480户,低收入家庭120户,为了解有关家用轿车购买力的某个指标,从中抽取一个容量为100的样本;(2)从10名学生中抽取3名参加座谈会.问题和抽样方法配对正确的是( )
A.(1)简单随机抽样法,(2)分层随机抽样法
B.(1)分层随机抽样法,(2)简单随机抽样法
C.(1)简单随机抽样法,(2)简单随机抽样法
D.(1)分层随机抽样法,(2)分层随机抽样法
【答案】B
【详解】解:对于(1),该小区的家庭收入差别显著,故采取分层抽样的方法更适合,
对于(2),由于是从10名学生中抽取3名参加座谈会,故适合简单随机抽样.故选:B
2.(2022·江苏·高三专题练习)现要完成下列两项抽样调查:①从20罐奶粉中抽取4罐进行食品安全卫生检查;②从某社区100户高收入家庭,270户中等收入家庭,80户低收入家庭中选出45户进行消费水平调查.较为合理的抽样方法是( )
A.①简单随机抽样,②简单随机抽样 B.①分层随机抽样,②分层随机抽样
C.①分层随机抽样,②简单随机抽样 D.①简单随机抽样,②分层随机抽样
【答案】D
【详解】①中个体数量较少,且个体间无明显差异,故采用简单随机抽样;②中高收入家庭、中等收入家庭和低收入家庭的消费水平差异明显,故采用分层随机抽样.故选:D.
3.(2022·全国·高一课时练习)为了保证分层随机抽样时每个个体被等可能地抽取,必须要求( )
A.每层等可能抽取 B.每层抽取的个体数相等
C.每层抽取的个体数可以不一样多,但必须满足抽取个个体(其中i是层的序号,k是总层数,n为抽取的样本量,Ni是第i层中的个体数,N是总样本量)
D.只要抽取的样本量一定,每层抽取的个体数没有限制
【答案】C
【详解】分层随机抽样时,在各层中按层中所含个体在总体中所占的比例进行抽样,
A中,虽然每层等可能地抽样,但是没有指明各层中应抽取几个个体,故A不正确;
B中,由于每层的个体数不一定相等,每层抽取同样多的个体数,
显然从总体来看,各层的个体被抽取的可能性就不相等了,因此B也不正确;
C中,对于第i层的每个个体,它被抽到的可能性与层数i无关,
即对于每个个体来说,被抽取为样本的可能性是相同的,故C正确;D显然不正确.故选:C.
4.(2022·全国·)分层随机抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体等可能抽样,必须进行( )
A.每层等可能抽样 B.每层可以不等可能抽样
C.所有层按同一抽样比等可能抽样 D.所有层抽取的个体数量相同
【答案】C
【详解】保证每个个体等可能入样是三种基本抽样方式的共同特征,为了保证这一点,分层随机抽样时必须在所有层都按同一抽样比等可能抽取. 故选:.
5.(2023·全国·高一课时练习)现要完成下列3项抽样调查:
①从15种疫苗中抽取5种检测是否合格.②某中学共有480名教职工,其中一线教师360名,行政人员48名,后勤人员72名.为了解教职工对学校校务公开方面的意见,拟抽取一个容量为20的样本,③在中秋节前,某食品监督局从某品牌的10盒月饼中随机抽取3盒进行食品卫生检查.较为合理的抽样方法是( )
A.①③简单随机抽样,②分层随机抽样 B.①②简单随机抽样,③分层随机抽样
C.②③简单随机抽样,①分层随机抽样 D.①简单随机抽样,②③分层随机抽样
【答案】A
【详解】①③中总体数量较少,且个体没有明显差别,适合用简单随机抽样;②中总体是由有明显差异的几部分组成的,适合用分层随机抽样,故选:A.
高频考点7 . 分层随机抽样中的相关运算
【方法点拨】分层随机抽样的步骤
①根据己经掌握的信息,将总体分成互不相交的层;
②根据总体中的个体数和样本量计算抽样比;
③确定第层应该抽取的个体数目(为第层所包含的个体数),使得各之和为;
④在各个层中,按步骤③中确定的数目在各层中随机抽取个体,合在一起得到容量为的样本.
1.(2022·广西·鹿寨县鹿寨中学高二阶段练习)2022年北京冬季奥运会将在北京和张家口两个城市举行,某校为此举办了主题为“迎冬奥运,冬奥知识竞赛”的活动,已知该学校高一学生有600人,高二学生有650人,高三学生有700人,现采用分层抽样的方法从三个年级抽取39人参加竞赛活动,则高二年级应该抽取( )
A.12人 B.13人 C.14人 D.39人
【答案】B
【详解】高二年级应该抽取人,故选:B.
2.(2022·陕西·西安中学高二期中)2021年9月在西安举行了第十四届全运会,西安中学体育馆承办了男子排球U20的比赛,这是全运会历史上第一次进入一所高中校园.为了让中学生也能在家门口看全运,浓厚校园体育氛围,学校采用分层抽样的方法从高一1200人 高二1450人 高三n人中,抽取80人观看排球决赛,已知高一被抽取的人数为24,那么高三年级人数为( )
A.1250 B.1300 C.1350 D.1400
【答案】C
【详解】利用分层抽样的方法从高一1200人、高二1450人、高三n人中,抽取80人观看排球决赛,
则抽取比例为,又高一被抽取的人数为24,即=,解得n=1350.
故选:C.
3.(2022·浙江宁波·高一期末)某小区有人自愿接种新冠疫苗,其中岁的有人,岁的有人,其余为符合接种条件的其他年龄段的居民.在一项接种疫苗的追踪调查中,要用分层抽样的方法从该小区名接种疫苗的人群中抽取人,则从符合接种条件的其他年龄段的居民中抽取的人数是( )
A. B. C. D.
【答案】C
【详解】解:依题意从其余符合接种条件的其它年龄段的居民中抽取的人数为:.
故选:.
4.(2022·全国·高一课时练习)为践行“绿水青山就是金山银山”的发展理念,某城区对辖区内,,三类行业共200个单位的生态环境治理成效进行了考核评估,考评分数达到80分及其以上的单位被称为“星级”环保单位,未达到80分的单位被称为“非星级”环保单位,现通过分层抽样的方法抽取了这三类行业的20个单位,其考评分数如下:
类行业:85,82,77,78,83,87;
类行业:76,67,80,85,79,81;
类行业:87,89,76,86,75,84,90,82.
则该城区这三类行业中每类行业的单位个数分别为______.
【答案】60,60,80
【详解】
由题意,得抽取的,,三类行业单位个数之比为.由分层抽样的定义,有
类行业的单位个数为,类行业的单位个数为,
类行业的单位个数为,
故该城区,,三类行业中每类行业的单位个数分别为60,60,80.
5.(2022·广西河池·高二阶段练习)某校有高一学生名,其中男生数与女生数之比为,为了解学生的视力情况,现要求按分层抽样的方法抽取一个样本容量为的样本,若样本中男生比女生多人,则_______.
【答案】
【详解】依题意可得,解得.故答案为1320
高频考点8. 分层随机抽样的平均数
【方法点拨】分层随机抽样的平均数:在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为和,抽取的样本量分别为和.我们用表示第1层各个个体的变量值,用表示第1层样本的各个个体的变量值;用表示第2层各个个体的变量值,用表示第2层样本的各个个体的变量值,则第1层的总体平均数和样本平均数分别为.
第2层的总体平均数和样本平均数分别为.
总体平均数和样本平均数分别为.
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用
.
1.(2022·安徽·合肥艺术中学 )某校高一年级共有学生500人,其中男生300人,女生200人,按男女生比例进行分层随机抽样,样本容量为进行身高测量(单位,男生样本30人的身高平均数为,女生样本20人的身高平均数为,则可估计该校高一年级学生的平均身高为__________.
【答案】
【详解】解:平均身高为.故答案为:166.6.
2.(2022·全国·高一课时练习)在考察某高中的学生身高时,采用分层随机抽样的方法,得到了男生身高的平均数为172,女生身高的平均数为162.
(1)如果没有其他信息,怎样估计总体平均数?
(2)如果知道抽取的样本中,男生有20人,女生有15人,怎样估计总体平均数?
【答案】(1)估计总体平均数为,详解见解析;(2)估计总体平均数为,详解见解析
(1)作为估计来说,我们可以选择男生(或女生)样本的平均数作为总体对应值的估计,但这样的选择没有充分利用已有的数据,显然不够好,另外一种估计的方法是取每一层样本平均数作为总体的估计,即估计总体平均数为.
(2)由加权平均数公式代入,得样本的平均数为,
因此估计总体平均数为.
3.(2022·全国·)对某中学高一年级学生身高(单位:cm)的调查中,采用分层随机抽样的方法,抽取了男生23人,其身高的平均数和方差分别为170.6和12.59,抽取了女生27人,其身高的平均数和方差分别为160.6和38.62,你能由这些数据计算出样本的平均数和方差,并估计高一年级全体学生身高的平均数?
【答案】样本的平均数为165.2,方差为51.4862;估计身高的平均数为165.2
【详解】
把样本中23名男生身高的平均数记为,;把样本中27名女生身高的平均数记为,,把样本的平均数记为,则,,
因此样本的平均数为165.2,可估计高一年级全体学生身高的平均数为165.2
4.(2022·全国·)某学校在上报《国家学生体质健康标准》高一年级学生的肺活量单项数据中,采用样本量按比例分配的分层随机抽样方法.如果不知道样本数据,只知道抽取了男生20人,其肺活量平均数,方差为10;抽取了女生30人,其肺活量平均数为,方差为20,估计高一年级全体学生肺活量的平均数.
【答案】平均数为2700ml
【详解】把男生样本记为,其平均数记为,;把女生样本记为,其平均数记为,;把总样本数据的平均数记为,.
由,,根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系,可得总样本平均数为.
据此估计高一年级全体学生肺活量的平均数为,方差为60280.
5.(2022·全国·)高二年级有男生490人,女生510人,张华按男生、女生进行分层,通过分层随机抽样的方法,得到男生、女生的平均身高分别为170.2cm和160.8cm.
(1)如果张华在各层中按比例分配样本,总样本量为100,那么在男生、女生中分别抽取了多少名?在这种情况下,请估计高二年级全体学生的平均身高.
(2)如果张华从男生、女生中抽取的样本量分别为30和70,那么在这种情况下,如何估计高二年级全体学生的平均身高更合理?
【答案】(1)男生49人,女生51人,平均身高165.4cm(2)见解析
【详解】(1)抽取男生人数为,抽取女生人数为.
高二年级全体学生的平均身高估计为(cm).
(2)仍按(1)方式进行估计,即(cm).
【课后训练】
全卷共22题 满分:150分 时间:120分钟
一 选择题:本题共8小题,每小题5分,共40分.每小题给出的四个选项中,只有一项是符合题目要求的.
1.(2023·上海·高三专题练习)下列抽取样本的方式属于简单随机抽样的个数为( )
①从无限多个个体中抽取100个个体作为样本.
②从20件玩具中一次性抽取3件进行质量检验.
③某班有56个同学,指定个子最高的5名同学参加学校组织的篮球赛.
④盒子中共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.
A.0 B.1 C.2 D.3
【答案】A
【详解】解:①从无限多个个体中抽取100个个体作为样本,不满足总体个数为有限个;
②从20件玩具中一次性抽取3件进行质量检验,不满足逐个抽取;
③某班有56个同学,指定个子最高的5名同学参加学校组织的篮球赛,不满足随机抽取;
④盒子中共有80个零件,从中选出5个零件进行质量检验,
在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里,不满足无放回抽取.
综上可得以上均不满足简单随机抽样的定义,故选:A.
2.(2022·高一课时练习)简单随机抽样、分层抽样之间的共同点是在抽样的过程中( )
A.每个个体被抽到的可能性相同
B.把总体分成几部分,按事先预定的规则在各部分中抽取
C.将总体分成几层,按比例分层抽取
D.都可以把抽取到的样品放回后,继续抽取
【答案】A
【详解】由简单随机抽样、分层抽样的特点知:
简单随机抽样、分层抽样之间的共同点是在抽样的过程中
每个个体被抽到的可能性相同,故选:A
3.(2022·江苏·高一专题练习)关于简单随机抽样的特点,有以下几种说法,其中不正确的是 ( )
A.要求总体中的个体数有限 B.从总体中逐个抽取
C.这是一种不放回抽样 D.每个个体被抽到的机会不一样,与先后顺序有关
【答案】D
【详解】简单随机抽样,除具有A、B、C三个特点外,还具有的特点:是等可能抽样,各个个体被抽取的机会相等,与先后顺序无关.选:D
4.(2023秋·山东潍坊·高三统考期中)某公司决定利用随机数表对今年新招聘的800名员工进行抽样调查他们对目前工作的满意程度,先将这800名员工进行编号,编号分别为001,002,…,799,800,从中抽取80名进行调查,下图提供随机数表的第4行到第6行
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 43 77 89 23 45
若从表中第5行第6列开始向右依次读取3个数据,则抽到的第5名员工的编号是( )
A.007 B.253 C.328 D.736
【答案】A
【详解】根据随机数的定义,以及随机数表的读法,前5名员工的编号是:
253,313,457,736,007故选:A
5.(2022春·广西柳州·高一校联考期末)某校有700名高一学生,400名高二学生,400名高三学生,高一数学兴趣小组欲采用按比例分配的分层抽样的方法在全校抽取15名学生进行某项调查,则下列说法正确的是( )
A.高三每一个学生被抽到的概率最大 B.高三每一个学生被抽到的概率最小
C.高一每一个学生被抽到的概率最大 D.每位学生被抽到的概率相等
【答案】D
【详解】由题意知,抽样比例为,
所以15人中,高一要抽7人,高二要4人,高三要4人,故高一每位学生被抽到的概率为,
高二每位学生被抽到的概率为,高三每位学生被抽到的概率为,
在比例分配的分层随机抽样中,每个个体被抽到的概率相等,
故每位学生被抽到的概率相等.故选:D
6.(2022·高一课时练习)为了庆祝中国共产党成立100周年,某学校组织了一次“学党史、强信念、跟党走”主题竞赛活动.活动要求把该学校教师按年龄分为35岁以下,岁,45岁及其以上三个大组.用分层抽样的方法从三个大组中抽取一个容量为10的样本,组成答题团队,已知岁组中每位教师被抽到的概率为,则该学校共有教师( )人
A.120 B.180 C.240 D.无法确定
【答案】C
【详解】因为在抽样过程中,每位教师被抽到的概率都相等,
所以该学校共有教师人.故选:C.
7.(2022春·广东肇庆·高一统考期末)某中学高一年级有女生380人,男生420人,学校想通过抽样的方法估计高一年级全体学生的平均体重.学校从女生和男生中抽取的样本分别为40和80,经计算这40个女生的平均体重为49kg,80个男生的平均体重为57kg,依据以上条件,估计高一年级全体学生的平均体重最合理的计算方法为( )
A. B. C. D.
【答案】D
【详解】用女生样本的平均体重49kg估计女生总体的平均体重,用男生样本的平均体重57kg估计男生总体的平均体重,按女生和男生在总人数中的比例计算总体的平均体重,所以D选项最合理.
故选:D.
8.(2022秋·上海浦东新·高二校考期末)现要完成下列项抽样调查:
①从盒饼干中抽取盒进行食品卫生检查;
②某中学共有名教职工,其中一般教师名,行政人员名,后勤人员名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为的样本,较为合理的抽样方法是( )
A.①简单随机抽样,②分层抽样 B.①简单随机抽样,②简单随机抽样
C.①分层抽样,②分层抽样 D.①分层抽样,②简单随机抽样
【答案】A
【详解】①总体中的个体数较少,宜用简单随机抽样;
②总体是由差异明显的几部分组成,宜用分层抽样. 故选:A.
二 选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.(2022·高一课时练习)下列抽样方法不是简单随机抽样的是( )
A.在机器传送带上抽取30件产品作为样本
B.从平面直角坐标系中抽取5个点作为样本
C.箱子里共有100个零件,今从中选取10个零件进行检验,在抽样操作时,每次任意地拿出1个零件进行质量检验,检验后不再把它放回箱子里,直到抽取10个零件为止
D.某可乐公司从仓库中的1000箱可乐中一次性抽取20箱进行质量检查
【答案】ABD
【详解】A不是,因为传送带上的产品数量不确定;
B不是,因为个体的数量无限;C是,因为满足简单随机抽样的定义;
D不是,因为它不是逐个抽取的.故选:ABD.
10.(2022·湖北·校联考模拟预测)某地区公共部门为了调查本地区中学生的吸烟情况,对随机抽出的编号为1~1000的1000名学生进行了调查.调查中使用了两个问题,问题1:你的编号是否为奇数?问题2:你是否吸烟?被调查者从设计好的随机装置(内有除颜色外完全相同的白球50个,红球50个)中摸出一个小球(摸完放回):摸到白球则如实回答问题1,摸到红球则如实回答问题2,回答“是”的人在一张白纸上画一个“√”,回答“否”的人什么都不用做,由于问题的答案只有“是”和“否”,而且回答的是哪个问题也是别人不知道的,因此被调查者可以毫无顾忌的给出真实的答案.最后统计得出,这1000人中,共有265人回答“是”,则下列表述正确的是( )
A.估计被调查者中约有15人吸烟 B.估计约有15人对问题2的回答为“是”
C.估计该地区约有3%的中学生吸烟 D.估计该地区约有1.5%的中学生吸烟
【答案】BC
【详解】随机抽出的1000名学生中,回答第一个问题的概率是,其编号是奇数的概率也是,所以回答问题1且回答的“是”的学生人数为,
回答问题2且回答的“是”的人数为,
从而估计该地区中学生吸烟人数的百分比为,
估计被调查者中吸烟的人数为. 故选:BC.
11.(2022秋·辽宁沈阳·高一校考阶段练习)某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人.甲就读于高一,乙就读于高二,学校计划从这两个年级中共抽取235人进行视力调查,下列说法中正确的有( )
A.应该采用分层抽样法抽取 B.高一、高二年级应分别抽取100人和135人
C.乙被抽到的可能性比甲大 D.该问题中的总体是高一、高二年级的全体学生的视力
【答案】ABD
【详解】易知应采用分层抽样法抽取,A正确;
由题意可得高一年级的人数为,高二年级的人数为,则高一年级应抽取的人数为,高二年级应抽取的人数为,所以高一、高二年级应分别抽取100人和135人,故B正确;乙被抽到的可能性与甲一样大,故C错误;
该问题中的总体是高一、高二年级的全体学生的视力,故D正确.故选:ABD.
12.(2022秋·全国·高三校联考阶段练习)已知某高中共有学生2040人,其中高一段学生800人,高二段学生600人,为了了解学生的体质健康水平,现从三个段中采取分层抽样的方法,抽取一个容量为51的样本,检测得到高一、高二、高三段的优秀率分别为45%,60%,50%,下列说法正确的是( )
A.体质健康水平不优秀的人数最多的年级段是高一段
B.体质健康水平优秀的人数最少的年级段是高三段
C.高二段抽取了15人
D.估计该校学生体质健康水平的优秀率为49.3%(百分比保留一位小数)
【答案】ABC
【详解】高三人, 高一抽取人;
高二抽取人,C选项正确. 高三抽取人.
高一体质健康水平不优秀的人数为人;
高二体质健康水平不优秀的人数为人;
高三体质健康水平不优秀的人数为人.
所以体质健康水平不优秀的人数最多的年级段是高一段,A选项正确.
高一健康水平优秀的人数为人;高二健康水平优秀的人数为人;
高三健康水平优秀的人数为人.
所以体质健康水平优秀的人数最少的年级段是高三段,B选项正确.
估计该校学生体质健康水平的优秀率为,D选项错误 故选:ABC
三 填空题:本题共4小题,每小题5分,共20分.
13.(2022秋·上海徐汇·高二上海市南洋模范中学校考期末)某校要从高一、高二、高三共2023名学生中选取50名组成志愿团,若先用简单随机抽样的方法从2023名学生中剔除23名,再从剩下的2000名学生中按分层随机抽样的方法抽取50名,则每名学生入选的可能性___________.
【答案】
【详解】先用简单随机抽样的方法从2023名学生中剔除23名,每各个体被抽到的概率相等,
再从剩下的2000名学生中按分层随机抽样的方法抽取50名,则每名学生入选的可能性为
故答案为:
14.(2023秋·北京顺义·高二统考期末)某校高中三个年级共有学生2400人,其中高一年级有学生800人,高二年级有学生700人.为了了解学生参加整本书阅读活动的情况,现采用分层抽样的方法从中抽取容量为240的样本进行调查,那么在高三年级的学生中应抽取的人数为_____________.
【答案】90
【详解】由题意可得高三年级有学生人,抽取容量为240的样本进行调查,
那么在高三年级的学生中应抽取的人数为人.故答案为:.
15.(2022秋·上海长宁·高二统考阶段练习)为了了解某水库里大概有多少条鱼,先打捞出了1000条鱼,在鱼身上标记一个不会掉落的印记后放回水库,过一段时间后再次捕捞了200条鱼,发现其中5条鱼有印记.则这个水库里大概有______条鱼
【答案】40000
【详解】设水库里大概有x条鱼,则,解之得故答案为:40000
16.(2022·高一单元测试)“水能载舟,亦能覆舟”是古代思想家荀子的一句名言,意指事物用之得当则有利,反之必有弊害.对于高中生上学是否应该带手机,有调查者进行了如下的随机调查:调查者向被调查者提出两个问题:(1)你的编号是奇数吗?(2)你上学时是否带手机?学生在被调查时,先背对着调查人员抛掷一枚硬币(保证调查人员看不到硬币的抛掷结果),如果正面向上,就回答第一个问题,否则就回答第二个问题.被调查的学生不必告诉调查人员自己回答的是哪一个问题,只需回答“是”或“不是”,由于只有被调查者本人知道回答了哪一个问题,所以都如实地做了回答.
某次调查活动共有800名高中生(编号从1至800)参与了调查,则回答为“不是”的人数的最大值是______.如果其中共有260人回答为“是”,则由此可以估计这800名学生中,上学带手机的人数约为______.
【答案】 800 120
【详解】解:∵某次调查活动共有800名高中生参与了调查,∴回答为“不是”的人数的最大值是800,
∵掷一枚硬币正面向上和反面向上的概率均为0.5,
∴回答第一个问题和第二个问题的人数大约为400,而学号为奇数和偶数的概率均为0.5,
则回答第一个问题的人中回答“是”的占200人,
∵其中共有260人回答为“是”,∴在回答问题(2)的400人中,回答“是”人数为260-200=60,
∴这800名学生中,上学带手机的人数约为120,故答案为:800;120.
四 解答题:本题共6小题,共70分.解答应写出文字说明 证明过程或演算步骤.
17.(2022·高一课时练习)小王和小张计划调查上海某地铁站的拥挤程度.小王连续一个月每天上午8点至10点在地铁站点观察,并统计人数,这两个小时中平均每小时进站人数为3500人次,由此小王推断该地铁站严重拥挤;小张连续5个周末在地铁站观察进站人数,统计得到平均每小时进站人数为500人次,由此他推断该地铁站不拥挤.你同意小王和小张的推断吗?
【答案】不同意,理由见解析
【详解】不同意小王和小张的推断.因为小王只统计了早高峰的时段,并不能反映出地铁站的整体拥挤情况.小张只统计了周末非高峰的情况,所以也不能反映出地铁站的整体拥挤情况.
18.(2022·高一课时练习)选择合适的抽样方法抽样,写出抽样过程.
(1)现有一批电子元件600个,从中抽取6个进行质量检测;
(2)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个入样.
【答案】(1)见解析;(2)见解析
【详解】(1)总体中个体数较大,用随机数法.
第一步,给元件编号为1,2,3,…,99,100,…,600;
第二步,用随机数工具产生1~600范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的电子元件进入样本;
第三步,依次操作,如果生成的随机数有重复,则剔除并重新产生随机数,直到样本量达到6;
第四步,以上这6个号码对应的元件就是要抽取的对象.
(2)总体中个体数较小,用抽签法.
第一步,将30个篮球,编号为1,2,…,30;
第二步,将以上30个编号分别写在外观、质地等无差别的小纸条上,揉成小球状,制成号签;
第三步,把号签放入一个不透明的盒子中,充分搅拌;
第四步,从盒子中不放回地逐个抽取3个号签,并记录上面的号码;
第五步,找出和所得号码对应的篮球.
19.(2022·高一课时练习)某单位拟从40名员工中选1人赠送电影票,可采用下面两种选法:
选法一:将这40名员工按1至40进行编号,并相应地制作号码为1至40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的员工是幸运人选;
选法二:将39个白球与1个红球(除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中不放回地摸取1个球,则摸到红球的员工是幸运人选.试问:
(1)这两种选法是否都是抽签法,为什么?
(2)这两种选法中每名员工被选中的可能性是否相等?
【答案】(1)选法一是抽签法,选法二不是抽签法;理由见解析 (2)相等
(1)选法一满足抽签法的特征,是抽签法.选法二不是抽签法,因为抽签法要求所有的号签编号互不相同,而选法二中的39个白球无法相互区分;
(2)由于选法一中抽取每个签和选法二中摸到每个球都是等可能的,
因此选法一中抽取1个号签的概率和选法二中摸到红球的概率相等,均为
故这两种选法中每名员工被选中的可能性相等,均为.
20.(2022·高一课时练习)某单位有2000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中的人数情况如表中所示:
管理 技术开发 营销 生产 总计
老年 40 40 40 80 200
中年 80 120 160 240 600
青年 40 160 280 720 1200
总计 160 320 480 1040 2000
(1)若要抽取40人调查身体状况,则应怎样抽样?
(2)若要开一个有25人参与的讨论单位发展与薪金调整方案的座谈会,则应怎样抽取出席人?
【答案】(1)用分层随机抽样法,并按老年4(人),中年12(人),青年24(人)抽取
(2)用分层随机抽样法,并按管理2(人),技术开发4(人),营销6(人),生产13(人)抽取
(1)用分层随机抽样法,并按老年(人),
中年(人),青年(人)抽取.
(2)用分层随机抽样法,并按管理(人),
技术开发(人),营销(人),生产(人)抽取.
21.(2022·高一课时练习)某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占37.5%,老年人占20%.登山组的职工占参加活动总人数的三分之一,且该组中,青年人占50%,中年人占30%,老年人占20%.为了解各组不同年龄层次的职工对本次活动的整体满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
【答案】(1)31∶33∶16;(2)青年人52人,中年人55人,老年人27人.
(1)登山组人数占参加活动总人数的,则游泳组人数占参加活动总人数的,
登山组中,青年人,中年人,老年人占总人数的比例分别为:,,,所以游泳组中,青年人,中年人,老年人占总人数的比例分别为:,,,所以游泳组中,青年人、中年人、老年人分别所占的比例为
(2)由(1)知:游泳组中,青年人、中年人、老年人分别所占的比例为31∶33∶16,游泳组人数占参加活动总人数的,故游泳组中,青年人、中年人、老年人分别应抽取的人数为,,,所以游泳组中,青年人、中年人、老年人分别应抽取的人数为52,55,27.
22.(2022·高一课时练习)某中学举行了体育运动会,同时进行了全校精神文明擂台赛,为了解这次活动在全校师生中产生的影响,分别对全校500名教职工、3000名初中生、4000名高中生进行问卷调查.(1)如果要在所有问卷中抽出120份用于评估,请说明如何抽取才能得到比较客观的评估结论,并写出抽样过程.(2)要从3000份初中生的问卷中抽取一个容量为48的样本,如果采用简单随机抽样,应选什么方法?请说明理由.
【答案】(1)采取分层抽样的方法,过程见解析
(2)采用随机数法,理由见解析
(1)由于总体容量较大,这次活动对教职工、初中生、高中生产生的影响差异较大,故采取分层抽样的方法进行抽样才能得到比较客观的评估结论.
因为样本容量为120,总体容量为,
则抽样比为,,,,
所以在教职工、初中生、高中生中抽取的个体数分别是8,48,64.
分层抽样的步骤如下:
①分层:分为教职工、初中生、高中生,共三层;
②确定每层抽取个体的个数:在教职工、初中生、高中生中抽取的个体数分别是8,48,64;
③各层分别按简单随机抽样的方法抽取样本;
④综合每层抽取的个体,组成样本.
这样便完成了整个抽样过程,就能得到比较客观的评估结论;
(2)简单随机抽样有两种方法:抽签法和随机数法.
若用抽签法,则要做3000个号签,费时费力,因此应采用随机数法抽取样本.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com) 15中小学教育资源及组卷应用平台
9.1 随机抽样
【学习要求】
1.了解随机抽样的必要性和重要性,理解随机抽样的目的和基本要求;
2.理解简单随机抽样中的抽签法、随机数法;掌握用样本平均数估计总体平均数的方法;
3.理解分层随机抽样的概念,掌握用分层随机抽样从总体中抽取样本;掌握两种抽样的区别与联系。
4.掌握求分层随机抽样总样本的平均数及方差的方法。
【思维导图】
【知识梳理】
1.统计的相关概念
全面调查(普查)、抽样调查
①全面调查(普查):对每一个调查对象都进行调查的方法,称为全面调查,又称普查;
②总体:调查对象的全体;③个体:组成总体的每一个调查对象;
④抽样调查:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法;⑤样本:从总体中抽取的那部分个体;
⑥样本量:样本中包含的个体数;⑦样本数据:调查样本获得的变量值
2.简单随机抽样
(1)定义:一般地,设一个总体含有(为正整数)个个体,从中逐个抽取()个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样,放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样,通过简单随机抽样获得的样本称为简单随机样本
从总体中,逐个不放回地随机抽取个个体作为样本,一次性批量随机抽取个个体作为样本,两
种方法是等价的.
(2)特点:①有限性:总体中个体数有限;②逐一性:从总体中逐个抽取,这样便于在抽样试验中进行操作;③等可能性:是一种等可能抽样,在整个抽样过程中各个个体被抽取到的可能性相等,从而保证了这种抽样方法的公平性理解.
3.两种常用的简单随机抽样方法
(1)抽签法
①把总体中的个个体编号,把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,将号签放在一个不透明容器中,充分搅拌后,每次从中不放回地抽取一个号签,连续抽取次,使与号签上的编号对应的个体进入样本,就得到一个容量为的样本.
②抽签法的抽样步骤
第一步:将总体中的所有个体编号(编号)
第二步:并把号码写在形状、大小相同的号签上;将号签放在一个不透明容器中,并搅拌均匀(制签)
第三步:每次从中不放回抽取一个号签,直到抽取到足够的样本量(抽取)
③优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.
④缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大,因此,抽签法一般适用于总体中个体数不多的情形.
(2)随机数法:即利用随机试验、信息技术(计算器、电子表格软件、R统计软件等)生成随机数进行抽样.
②随机数法的抽样步骤
第1步:编号:将总体中的每个个体编号;第2步:选号:用随机数工具产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,直到抽足样本所需要的个体数.如果生成的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的个体数;第3步:取样:把选定的号码所对应的个个体作为样本.
(3)抽签法和随机数法的异同点
相同点:都是简单随机抽样,并且要求被抽取样本的总体的个体数有限.
不同点:①在总体容量较小的情况下,抽签法相对于随机数法来说更简单;
②抽签法适用于总体中的个体数相对较少的情况,而随机数法更适用于总体中的个体数较多的情况,这样可以节约大量的人力和制作号签的成本.
4.总体平均数与样本平均数
(1)总体平均数:一般地,总体中有个个体,它们的变量值分别为,,…,
则称为总体均值,又称总体平均数.
(2)加权平均数:如果总体的个变量值中,不同的值共有()个,不妨记为,,…,,其中出现的频数(),则总体均值还可以写成加权平均数的形式:.
(3)样本平均数:如果从总体中抽取一个容量为的样本,它们的变量值分别为,,…,
则称为样本均值,又称样本平均数.
5.分层随机抽样的概念及特点
(1)分层随机抽样的概念
一般地,按一个或多个变量把总体划分为若干个子总体,每个个体属于且仅属于一个子总体,在每个字总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
(2)分层随机抽样的特点
①从分层随机抽样的定义可看出,分层随机抽样适用于总体由差异明显的几个部分组成的情况.
②分层随机抽样是等可能抽样.用分层随机抽样从个体数为的总体中抽取一个容量为的样本时,在整个抽样过程中,每个个体被抽到的可能性相等,都等于.
③分层随机抽样是建立在简单随机抽样的基础之上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表注,更能充分反映总体的情况,在实践中的应用也更广泛.
6.分层随机抽样的步骤
①根据己经掌握的信息,将总体分成互不相交的层;
②根据总体中的个体数和样本量计算抽样比;
③确定第层应该抽取的个体数目(为第层所包含的个体数),使得各之和为;
④在各个层中,按步骤③中确定的数目在各层中随机抽取个体,合在一起得到容量为的样本.
7.简单随机抽样与分层随机抽样的比较
类别 共同点 各自特点 相互联系 适用范围
简单随机抽样 抽样过程中每个个体被抽取的概率是相同的 从总体中逐个抽取 总体中的个体数较少
分层抽样 将总体分成几层,分层进行抽取 各层抽样时采用简单随机抽样或系统 总体由差异明显的几部分组成
8.分层随机抽样的平均数
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为和,抽取的样本量分别为和.我们用表示第1层各个个体的变量值,用表示第1层样本的各个个体的变量值;用表示第2层各个个体的变量值,用表示第2层样本的各个个体的变量值,则第1层的总体平均数和样本平均数分别为
.
第2层的总体平均数和样本平均数分别为.
总体平均数和样本平均数分别为.
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用
.
9.获取数据的途径
在实际统计调查中,一般先要确定调查的目的、对象,即统计调查要解决的问题和需要调查的总体;还要确定好调查的项目,也就是要统计的变量.接下来就开始收集数据,收集数据的基本途径如下:
(1)通过调查获取数据
设计调查问卷:调查问卷一般由一组有目的、有系统、有顺序的题目组成.问题由调查人员根据调查的目的、项目进行设计
设计调查问卷的注意事项:①问题要具体,有针对性,使受调查者能够容易作答.
②语言简单、准确,含义清楚,避免出现有歧义或意思含混的句子
③题目不能出现引导受调查者答题倾向的语句
④设计问题时要注意“如何得到敏感性问题的诚实回答”.
(2)通过试验获取数据:根据调查项目的要求设计一些合适的试验,能够直接地获得样本数据.试验时要注意准备好试验用具(或组织好观测的对象)、指定专门的记录人员等.做试验通常能得到可靠的数据资料,但需花费的人力、物力、时间较多,有时带有破坏性.
(3)通过观察获取数据:对于有些现象,不能用试验或者抽样等方法来获取数据,只能通过长久持续的观察获取,主要是一些自然现象,如地震、降水、大气污染、宇宙射线等.一般地,通过观察自然现象所获取的数据性质比较复杂,其中蕴含着所观察现象的本质信息,需要通过统计学理论和方法来挖掘.
(4)通过查询获得数据:有些数据资料不容易直接调查得到,这时可以通过查阅统计年鉴、图书馆文献等方法获得所需或相关的数据,比如全国历次人口普查的数据都可以在统计年鉴中查阅到;还可以通过互联网上的资源得到数据资料.
【高频考点】
高频考点1 . 统计的相关概念辨析
【方法点拨】根据统计的相关概念逐一辨别即可。
1.下列说法不正确的是( )
A.普查是对所有的对象进行调查
B.样本不一定是从总体中抽取的,没有抽取的个体也可能是样本
C.当调查的对象很少时,普查是很好的调查方式,但当调查的对象很多时,普查要耗费大量的人力、物力和财力
D.普查不是在任何情况下都能实现的
2.在“世界读书日”前夕,为了了解某地名居民某天的阅读时间,从中抽取了名居民的阅读时间进行统计分析.在这个问题中,名居民的阅读时间的全体是( )
A.总体 B.个体 C.样本的容量 D.从总体中抽取的一个样本
3.为了了解某市高三毕业生升学考试中数学成绩的情况,从参加考试的学生中随机地抽查了1 000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是( )
A.总体指的是该市参加升学考试的全体学生 B.个体指的是1 000名学生中的每一名学生
C.样本容量指的是1 000名学生 D.样本是指1 000名学生的数学成绩4.从总数为的一批零件中抽取一个容量为的样本,若每个零件被抽取的可能性为,则为( )
A. B. C. D.
高频考点2. 简单随机抽样的应用
【方法点拨】
简单随机抽样定义:一般地,设一个总体含有(为正整数)个个体,从中逐个抽取()个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样,放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样,通过简单随机抽样获得的样本称为简单随机样本
从总体中,逐个不放回地随机抽取个个体作为样本,一次性批量随机抽取个个体作为样本,两
种方法是等价的.
特点:①有限性:总体中个体数有限;②逐一性:从总体中逐个抽取,这样便于在抽样试验中进行操作;③等可能性:是一种等可能抽样,在整个抽样过程中各个个体被抽取到的可能性相等,从而保证了这种抽样方法的公平性理解.
1.(2022·河北·高一课时练习)对于简单随机抽样,下列说法中正确的是( )
①它要求被抽取样本的总体的个体数有限;②它是从总体中逐个进行抽取的;
③它是一种不放回抽样;④它是一种等可能抽样,在整个抽样过程中,每个个体被抽到的机会相等.
A.①②③ B.①②④ C.①③④ D.①②③④
2.下列抽样方法是简单随机抽样的是( )
A.环保局人员取河水进行化验 B.用抽签的方法产生随机数表
C.福利彩票用摇奖机摇奖 D.老师抽取数学成绩最优秀的2名同学代表班级参加数学竞赛3.(2022·山东·高一课时练习)下列抽取样本的方式是简单随机抽样的有( )
①某连队从200名官兵中,挑选出50名最优秀的官兵赶赴某地参加救灾工作;
②箱子中有100支铅笔,从中选10支进行试验,在抽样操作时,从中任意拿出一支检测后再放回箱子;③从50个个体中一次性抽取8个个体作为样本;
④从2000个灯泡中不放回地逐个抽取20个进行质量检查.
A.0个 B.1个 C.2个 D.3个
4.下列抽取样本的方式,不是简单随机抽样的是( )
A.从无限多个个体中抽取100个个体作为样本
B.盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出1个零件进行质量检验后再把它放回盒子里
C.从20件玩具中一次性抽取3件进行质量检验
D.某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛
5.(2022·重庆·高三专题练习)利用简单随机抽样,从个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的概率为( )
A. B. C. D.
高频考点3 . 抽签法的应用
【方法点拨】抽签法的抽样步骤
第一步:将总体中的所有个体编号(编号)
第二步:并把号码写在形状、大小相同的号签上;将号签放在一个不透明容器中,并搅拌均匀(制签)
第三步:每次从中不放回抽取一个号签,直到抽取到足够的样本量(抽取)
优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.
缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大,因此,抽签法一般适用于总体中个体数不多的情形.
1.(2022·广东·高一课时练习)下列抽取样本的方式是否属于简单随机抽样?如果不是,说明理由.
(1)从无限多个个体中抽取100个个体作为样本;
(2)盒子里共有零件80个,从中依次拿出5个零件进行质量检验.
2.(2022·广西·高一专题练习)某单位拟从40名员工中选1人赠送电影票,可采用下面两种选法:
选法一:将这40名员工按1~40进行编号,并相应地制作号码为1 40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的员工幸运入选;
选法二:将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中摸取一个球,则摸到红球的员工幸运入选.试问:
(1)这两种选法是否都是抽签法,为什么?(2)这两种选法中每名员工被选中的可能性是否相等?
3.(2022·山西·高一课时练习)某班有名学生,要从中随机地抽出人参加一项活动,请写出利用抽签法抽取该样本的过程.
4.(2022·重庆·高一课时练习)某地区选拔运动会志愿者,最后阶段要从35名志愿者中去掉5名,由于每名志愿者都很优秀,决定采取抽签法,请写出用抽签法去掉5人的过程.
5.(2023·黑龙江·高一专题练习)选择合适的抽样方法抽样,写出抽样过程.有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个入样.
高频考点4. 随机数法的应用
【方法点拨】
随机数法的抽样步骤
第1步:编号:将总体中的每个个体编号;第2步:选号:用随机数工具产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,直到抽足样本所需要的个体数.如果生成的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的个体数;第3步:取样:把选定的号码所对应的个个体作为样本.
抽签法和随机数法的异同点
相同点:都是简单随机抽样,并且要求被抽取样本的总体的个体数有限.
不同点:①在总体容量较小的情况下,抽签法相对于随机数法来说更简单;
②抽签法适用于总体中的个体数相对较少的情况,而随机数法更适用于总体中的个体数较多的情况,这样可以节约大量的人力和制作号签的成本.
1.(2022·广西·高一课时练习)假设要从高三年级全体学生450人中随机抽出20人参加一项活动,请分别用抽签法和随机数法抽出人选,写出抽取过程.
2.(2023·河北·高一专题练习)选择合适的抽样方法抽样,写出抽样过程.现有一批电子元件600个,从中抽取6个进行质量检测;
3.(2022·山东潍坊·高一期末)国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的末来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第三个号码为( )
随机数表如下:
A.13 B.24 C.33 D.36
4.(2022·江西·临川一中高二阶段练习)某班有位同学,他们依次编号为01,02,….29,30,现利用下面的随机数表选取5位同学组建“文明校园督查组”.选取方法是从随机数表的第1行的第5列和第6列数字开始,由左到右依次选取两个效字,则选出来的第5位同学的编号为( )
41792 71635 86089 32157 95620 92109 29145
74955 82835 98378 83513 47870 20799 32122
A. B. C. D.
5.(2023·四川省绵阳南山中学高二阶段练习)总体由编号为00,01,02,…,48,49的50个个体组成,利用下面的随机数表选取6个个体,从随机数表第5行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的编号为( )
附:第5行至第8行的随机数表如下:
2635 7900 3370 9160 1620 3882 7757 4950
3211 4919 7306 4916 7677 8733 9974 6732
2748 6198 7164 4148 7086 2888 8519 1620
7477 0111 1630 2404 2979 7991 9683 5125
A.33 B.16 C.38 D.20
高频考点5 . 总体平均数与样本平均数
【方法点拨】(1)总体平均数:一般地,总体中有个个体,它们的变量值分别为,,…,
则称为总体均值,又称总体平均数.
(2)加权平均数:如果总体的个变量值中,不同的值共有()个,不妨记为,,…,,其中出现的频数(),则总体均值还可以写成加权平均数的形式:.
(3)样本平均数:如果从总体中抽取一个容量为的样本,它们的变量值分别为,,…,
则称为样本均值,又称样本平均数.
1.(2022·全国·高一课时练习)有4万个不小于70的两位数,从中随机抽取了3000个数据,统计如下:
请根据表格中的信息,估计这4万个数据的平均数为( )
A.92.16 B.85.23 C.84.73 D.77.97
2.某学校抽取100位老师的年龄,得到如下数据
年龄(单位:岁) 32 34 38 40 42 43 45 46 48
频数 2 4 20 20 26 10 8 6 4
则估计这100位老师的样本的平均年龄为( )
A.42岁 B.41岁 C.41.1岁 D.40.1岁
3.从一个篮球训练营中抽取10名学员进行偷懒比赛,每人投10次,统计出该10名学员篮球投中的次数,4个投中5次,3个投中6次,2个投中7次,1个投中8次,试估计该训练营投篮投中的比例为 .
4.某高校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班有50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是________分.
5.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:
甲 27 38 30 37 35 31
乙 35 29 40 34 30 36
分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数并判断选谁参加比赛比较合适?
高频考点6. 分层随机抽样概念的理解及应用
【方法点拨】(1)分层随机抽样的概念:一般地,按一个或多个变量把总体划分为若干个子总体,每个个体属于且仅属于一个子总体,在每个字总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
(2)分层随机抽样的特点
①从分层随机抽样的定义可看出,分层随机抽样适用于总体由差异明显的几个部分组成的情况.
②分层随机抽样是等可能抽样.用分层随机抽样从个体数为的总体中抽取一个容量为的样本时,在整个抽样过程中,每个个体被抽到的可能性相等,都等于.
③分层随机抽样是建立在简单随机抽样的基础之上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表注,更能充分反映总体的情况,在实践中的应用也更广泛.
1.(2022·云南·弥勒高一阶段练习)(1)某小区有800户家庭,其中高收入家庭200户,中等收入家庭480户,低收入家庭120户,为了解有关家用轿车购买力的某个指标,从中抽取一个容量为100的样本;(2)从10名学生中抽取3名参加座谈会.问题和抽样方法配对正确的是( )
A.(1)简单随机抽样法,(2)分层随机抽样法
B.(1)分层随机抽样法,(2)简单随机抽样法
C.(1)简单随机抽样法,(2)简单随机抽样法
D.(1)分层随机抽样法,(2)分层随机抽样法
2.(2022·江苏·高三专题练习)现要完成下列两项抽样调查:①从20罐奶粉中抽取4罐进行食品安全卫生检查;②从某社区100户高收入家庭,270户中等收入家庭,80户低收入家庭中选出45户进行消费水平调查.较为合理的抽样方法是( )
A.①简单随机抽样,②简单随机抽样 B.①分层随机抽样,②分层随机抽样
C.①分层随机抽样,②简单随机抽样 D.①简单随机抽样,②分层随机抽样
3.(2022·全国·高一课时练习)为了保证分层随机抽样时每个个体被等可能地抽取,必须要求( )
A.每层等可能抽取 B.每层抽取的个体数相等
C.每层抽取的个体数可以不一样多,但必须满足抽取个个体(其中i是层的序号,k是总层数,n为抽取的样本量,Ni是第i层中的个体数,N是总样本量)
D.只要抽取的样本量一定,每层抽取的个体数没有限制
4.(2022·全国·)分层随机抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体等可能抽样,必须进行( )
A.每层等可能抽样 B.每层可以不等可能抽样
C.所有层按同一抽样比等可能抽样 D.所有层抽取的个体数量相同
5.(2023·全国·高一课时练习)现要完成下列3项抽样调查:
①从15种疫苗中抽取5种检测是否合格.②某中学共有480名教职工,其中一线教师360名,行政人员48名,后勤人员72名.为了解教职工对学校校务公开方面的意见,拟抽取一个容量为20的样本,③在中秋节前,某食品监督局从某品牌的10盒月饼中随机抽取3盒进行食品卫生检查.较为合理的抽样方法是( )
A.①③简单随机抽样,②分层随机抽样 B.①②简单随机抽样,③分层随机抽样
C.②③简单随机抽样,①分层随机抽样 D.①简单随机抽样,②③分层随机抽样
高频考点7 . 分层随机抽样中的相关运算
【方法点拨】分层随机抽样的步骤
①根据己经掌握的信息,将总体分成互不相交的层;
②根据总体中的个体数和样本量计算抽样比;
③确定第层应该抽取的个体数目(为第层所包含的个体数),使得各之和为;
④在各个层中,按步骤③中确定的数目在各层中随机抽取个体,合在一起得到容量为的样本.
1.(2022·广西·鹿寨县鹿寨中学高二阶段练习)2022年北京冬季奥运会将在北京和张家口两个城市举行,某校为此举办了主题为“迎冬奥运,冬奥知识竞赛”的活动,已知该学校高一学生有600人,高二学生有650人,高三学生有700人,现采用分层抽样的方法从三个年级抽取39人参加竞赛活动,则高二年级应该抽取( )
A.12人 B.13人 C.14人 D.39人
2.(2022·陕西·西安中学高二期中)2021年9月在西安举行了第十四届全运会,西安中学体育馆承办了男子排球U20的比赛,这是全运会历史上第一次进入一所高中校园.为了让中学生也能在家门口看全运,浓厚校园体育氛围,学校采用分层抽样的方法从高一1200人 高二1450人 高三n人中,抽取80人观看排球决赛,已知高一被抽取的人数为24,那么高三年级人数为( )
A.1250 B.1300 C.1350 D.1400
3.(2022·浙江宁波·高一期末)某小区有人自愿接种新冠疫苗,其中岁的有人,岁的有人,其余为符合接种条件的其他年龄段的居民.在一项接种疫苗的追踪调查中,要用分层抽样的方法从该小区名接种疫苗的人群中抽取人,则从符合接种条件的其他年龄段的居民中抽取的人数是( )
A. B. C. D.
4.(2022·全国·高一课时练习)为践行“绿水青山就是金山银山”的发展理念,某城区对辖区内,,三类行业共200个单位的生态环境治理成效进行了考核评估,考评分数达到80分及其以上的单位被称为“星级”环保单位,未达到80分的单位被称为“非星级”环保单位,现通过分层抽样的方法抽取了这三类行业的20个单位,其考评分数如下:
类行业:85,82,77,78,83,87;
类行业:76,67,80,85,79,81;
类行业:87,89,76,86,75,84,90,82.
则该城区这三类行业中每类行业的单位个数分别为______.
5.(2022·广西河池·高二阶段练习)某校有高一学生名,其中男生数与女生数之比为,为了解学生的视力情况,现要求按分层抽样的方法抽取一个样本容量为的样本,若样本中男生比女生多人,则_______.
高频考点8. 分层随机抽样的平均数
【方法点拨】分层随机抽样的平均数:在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为和,抽取的样本量分别为和.我们用表示第1层各个个体的变量值,用表示第1层样本的各个个体的变量值;用表示第2层各个个体的变量值,用表示第2层样本的各个个体的变量值,则第1层的总体平均数和样本平均数分别为.
第2层的总体平均数和样本平均数分别为.
总体平均数和样本平均数分别为.
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用
.
1.(2022·安徽·合肥艺术中学 )某校高一年级共有学生500人,其中男生300人,女生200人,按男女生比例进行分层随机抽样,样本容量为进行身高测量(单位,男生样本30人的身高平均数为,女生样本20人的身高平均数为,则可估计该校高一年级学生的平均身高为_______.
2.(2022·全国·高一课时练习)在考察某高中的学生身高时,采用分层随机抽样的方法,得到了男生身高的平均数为172,女生身高的平均数为162.(1)如果没有其他信息,怎样估计总体平均数?
(2)如果知道抽取的样本中,男生有20人,女生有15人,怎样估计总体平均数?
3.(2022·全国·)对某中学高一年级学生身高(单位:cm)的调查中,采用分层随机抽样的方法,抽取了男生23人,其身高的平均数和方差分别为170.6和12.59,抽取了女生27人,其身高的平均数和方差分别为160.6和38.62,你能由这些数据计算出样本的平均数和方差,并估计高一年级全体学生身高的平均数?
4.(2022·全国·)某学校在上报《国家学生体质健康标准》高一年级学生的肺活量单项数据中,采用样本量按比例分配的分层随机抽样方法.如果不知道样本数据,只知道抽取了男生20人,其肺活量平均数,方差为10;抽取了女生30人,其肺活量平均数为,方差为20,估计高一年级全体学生肺活量的平均数.
5.(2022·全国·)高二年级有男生490人,女生510人,张华按男生、女生进行分层,通过分层随机抽样的方法,得到男生、女生的平均身高分别为170.2cm和160.8cm.
(1)如果张华在各层中按比例分配样本,总样本量为100,那么在男生、女生中分别抽取了多少名?在这种情况下,请估计高二年级全体学生的平均身高.
(2)如果张华从男生、女生中抽取的样本量分别为30和70,那么在这种情况下,如何估计高二年级全体学生的平均身高更合理?
【课后训练】
全卷共22题 满分:150分 时间:120分钟
一 选择题:本题共8小题,每小题5分,共40分.每小题给出的四个选项中,只有一项是符合题目要求的.
1.(2023·上海·高三专题练习)下列抽取样本的方式属于简单随机抽样的个数为( )
①从无限多个个体中抽取100个个体作为样本.
②从20件玩具中一次性抽取3件进行质量检验.
③某班有56个同学,指定个子最高的5名同学参加学校组织的篮球赛.
④盒子中共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.
A.0 B.1 C.2 D.3
2.(2022·高一课时练习)简单随机抽样、分层抽样之间的共同点是在抽样的过程中( )
A.每个个体被抽到的可能性相同
B.把总体分成几部分,按事先预定的规则在各部分中抽取
C.将总体分成几层,按比例分层抽取
D.都可以把抽取到的样品放回后,继续抽取
3.(2022·江苏·高一专题练习)关于简单随机抽样的特点,有以下几种说法,其中不正确的是 ( )
A.要求总体中的个体数有限 B.从总体中逐个抽取
C.这是一种不放回抽样 D.每个个体被抽到的机会不一样,与先后顺序有关
4.(2023秋·山东潍坊·高三统考期中)某公司决定利用随机数表对今年新招聘的800名员工进行抽样调查他们对目前工作的满意程度,先将这800名员工进行编号,编号分别为001,002,…,799,800,从中抽取80名进行调查,下图提供随机数表的第4行到第6行
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 43 77 89 23 45
若从表中第5行第6列开始向右依次读取3个数据,则抽到的第5名员工的编号是( )
A.007 B.253 C.328 D.736
5.(2022春·广西柳州·高一校联考期末)某校有700名高一学生,400名高二学生,400名高三学生,高一数学兴趣小组欲采用按比例分配的分层抽样的方法在全校抽取15名学生进行某项调查,则下列说法正确的是( )
A.高三每一个学生被抽到的概率最大 B.高三每一个学生被抽到的概率最小
C.高一每一个学生被抽到的概率最大 D.每位学生被抽到的概率相等
6.(2022·高一课时练习)为了庆祝中国共产党成立100周年,某学校组织了一次“学党史、强信念、跟党走”主题竞赛活动.活动要求把该学校教师按年龄分为35岁以下,岁,45岁及其以上三个大组.用分层抽样的方法从三个大组中抽取一个容量为10的样本,组成答题团队,已知岁组中每位教师被抽到的概率为,则该学校共有教师( )人
A.120 B.180 C.240 D.无法确定
7.(2022春·广东肇庆·高一统考期末)某中学高一年级有女生380人,男生420人,学校想通过抽样的方法估计高一年级全体学生的平均体重.学校从女生和男生中抽取的样本分别为40和80,经计算这40个女生的平均体重为49kg,80个男生的平均体重为57kg,依据以上条件,估计高一年级全体学生的平均体重最合理的计算方法为( )
A. B. C. D.
8.(2022秋·上海浦东新·高二校考期末)现要完成下列项抽样调查:
①从盒饼干中抽取盒进行食品卫生检查;
②某中学共有名教职工,其中一般教师名,行政人员名,后勤人员名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为的样本,较为合理的抽样方法是( )
A.①简单随机抽样,②分层抽样 B.①简单随机抽样,②简单随机抽样
C.①分层抽样,②分层抽样 D.①分层抽样,②简单随机抽样
二 选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.(2022·高一课时练习)下列抽样方法不是简单随机抽样的是( )
A.在机器传送带上抽取30件产品作为样本
B.从平面直角坐标系中抽取5个点作为样本
C.箱子里共有100个零件,今从中选取10个零件进行检验,在抽样操作时,每次任意地拿出1个零件进行质量检验,检验后不再把它放回箱子里,直到抽取10个零件为止
D.某可乐公司从仓库中的1000箱可乐中一次性抽取20箱进行质量检查
10.(2022·湖北·校联考模拟预测)某地区公共部门为了调查本地区中学生的吸烟情况,对随机抽出的编号为1~1000的1000名学生进行了调查.调查中使用了两个问题,问题1:你的编号是否为奇数?问题2:你是否吸烟?被调查者从设计好的随机装置(内有除颜色外完全相同的白球50个,红球50个)中摸出一个小球(摸完放回):摸到白球则如实回答问题1,摸到红球则如实回答问题2,回答“是”的人在一张白纸上画一个“√”,回答“否”的人什么都不用做,由于问题的答案只有“是”和“否”,而且回答的是哪个问题也是别人不知道的,因此被调查者可以毫无顾忌的给出真实的答案.最后统计得出,这1000人中,共有265人回答“是”,则下列表述正确的是( )
A.估计被调查者中约有15人吸烟 B.估计约有15人对问题2的回答为“是”
C.估计该地区约有3%的中学生吸烟 D.估计该地区约有1.5%的中学生吸烟
11.(2022秋·辽宁沈阳·高一校考阶段练习)某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人.甲就读于高一,乙就读于高二,学校计划从这两个年级中共抽取235人进行视力调查,下列说法中正确的有( )
A.应该采用分层抽样法抽取 B.高一、高二年级应分别抽取100人和135人
C.乙被抽到的可能性比甲大 D.该问题中的总体是高一、高二年级的全体学生的视力
12.(2022秋·全国·高三校联考阶段练习)已知某高中共有学生2040人,其中高一段学生800人,高二段学生600人,为了了解学生的体质健康水平,现从三个段中采取分层抽样的方法,抽取一个容量为51的样本,检测得到高一、高二、高三段的优秀率分别为45%,60%,50%,下列说法正确的是( )
A.体质健康水平不优秀的人数最多的年级段是高一段
B.体质健康水平优秀的人数最少的年级段是高三段
C.高二段抽取了15人
D.估计该校学生体质健康水平的优秀率为49.3%(百分比保留一位小数)
三 填空题:本题共4小题,每小题5分,共20分.
13.(2022秋·上海徐汇·高二上海市南洋模范中学校考期末)某校要从高一、高二、高三共2023名学生中选取50名组成志愿团,若先用简单随机抽样的方法从2023名学生中剔除23名,再从剩下的2000名学生中按分层随机抽样的方法抽取50名,则每名学生入选的可能性___________.
14.(2023秋·北京顺义·高二统考期末)某校高中三个年级共有学生2400人,其中高一年级有学生800人,高二年级有学生700人.为了了解学生参加整本书阅读活动的情况,现采用分层抽样的方法从中抽取容量为240的样本进行调查,那么在高三年级的学生中应抽取的人数为_____________.
15.(2022秋·上海长宁·高二统考阶段练习)为了了解某水库里大概有多少条鱼,先打捞出了1000条鱼,在鱼身上标记一个不会掉落的印记后放回水库,过一段时间后再次捕捞了200条鱼,发现其中5条鱼有印记.则这个水库里大概有______条鱼
16.(2022·高一单元测试)“水能载舟,亦能覆舟”是古代思想家荀子的一句名言,意指事物用之得当则有利,反之必有弊害.对于高中生上学是否应该带手机,有调查者进行了如下的随机调查:调查者向被调查者提出两个问题:(1)你的编号是奇数吗?(2)你上学时是否带手机?学生在被调查时,先背对着调查人员抛掷一枚硬币(保证调查人员看不到硬币的抛掷结果),如果正面向上,就回答第一个问题,否则就回答第二个问题.被调查的学生不必告诉调查人员自己回答的是哪一个问题,只需回答“是”或“不是”,由于只有被调查者本人知道回答了哪一个问题,所以都如实地做了回答.
某次调查活动共有800名高中生(编号从1至800)参与了调查,则回答为“不是”的人数的最大值是____.如果其中共有260人回答为“是”,则由此可以估计这800名学生中,上学带手机的人数约为___.
四 解答题:本题共6小题,共70分.解答应写出文字说明 证明过程或演算步骤.
17.(2022·高一课时练习)小王和小张计划调查上海某地铁站的拥挤程度.小王连续一个月每天上午8点至10点在地铁站点观察,并统计人数,这两个小时中平均每小时进站人数为3500人次,由此小王推断该地铁站严重拥挤;小张连续5个周末在地铁站观察进站人数,统计得到平均每小时进站人数为500人次,由此他推断该地铁站不拥挤.你同意小王和小张的推断吗?
18.(2022·高一课时练习)选择合适的抽样方法抽样,写出抽样过程.
(1)现有一批电子元件600个,从中抽取6个进行质量检测;
(2)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个入样.
19.(2022·高一课时练习)某单位拟从40名员工中选1人赠送电影票,可采用下面两种选法:
选法一:将这40名员工按1至40进行编号,并相应地制作号码为1至40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的员工是幸运人选;
选法二:将39个白球与1个红球(除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中不放回地摸取1个球,则摸到红球的员工是幸运人选.试问:
(1)这两种选法是否都是抽签法,为什么?
(2)这两种选法中每名员工被选中的可能性是否相等?
20.(2022·高一课时练习)某单位有2000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中的人数情况如表中所示:
管理 技术开发 营销 生产 总计
老年 40 40 40 80 200
中年 80 120 160 240 600
青年 40 160 280 720 1200
总计 160 320 480 1040 2000
(1)若要抽取40人调查身体状况,则应怎样抽样?
(2)若要开一个有25人参与的讨论单位发展与薪金调整方案的座谈会,则应怎样抽取出席人?
21.(2022·高一课时练习)某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占37.5%,老年人占20%.登山组的职工占参加活动总人数的三分之一,且该组中,青年人占50%,中年人占30%,老年人占20%.为了解各组不同年龄层次的职工对本次活动的整体满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
22.(2022·高一课时练习)某中学举行了体育运动会,同时进行了全校精神文明擂台赛,为了解这次活动在全校师生中产生的影响,分别对全校500名教职工、3000名初中生、4000名高中生进行问卷调查.(1)如果要在所有问卷中抽出120份用于评估,请说明如何抽取才能得到比较客观的评估结论,并写出抽样过程.(2)要从3000份初中生的问卷中抽取一个容量为48的样本,如果采用简单随机抽样,应选什么方法?请说明理由.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com) 15