1.理解简单随机抽样的概念.
2.会用抽签法和随机数法从总体中抽取样本.
3.对于具体的实际问题,能合理地从总体中抽取样本.
2.简单随机抽样的具体实施方法
在总体的N个个体中机会均等地抽取第一个,然后在剩下的(N-1)个个体中机会均等地抽取第二个……最后在剩余的[N-(n-1)]个个体中机会均等地抽取第n个.
用这种抽样方法,每一个个体被抽到的可能性是相等的.
过关自诊
1.判断正误.(正确的画√,错误的画×)
(1)简单随机抽样中总体个数可以是无限个.( )
(2)某班有40名学生,指定个子最高的5名同学参加学校组织的篮球赛,是简单随机抽样.( )
(3)从20个零件中一次性拿出3个来检验是简单随机抽样.( )
×
×
×
2.简单随机抽样有哪些特点
提示简单随机抽样有四个特点:总体有限,逐个抽取,无放回地抽取,等可能抽取.
知识点2 抽签法
1.定义
先把总体中的N(N为正整数)个个体编号,并把编号依次分别写在形状、大小相同的签上(签可以是纸条、卡片或小球等),再将这些号签放在同一个不透明的箱子里搅拌均匀.每次随机地从中抽取一个,然后将箱中余下的号
签搅拌均匀,再进行下一次抽取.如此下去, 直到抽到预先设定的样本容量.
目的是使每个个体抽到的可能性相同
2.抽签法的具体步骤
(1)给总体中的每个个体编号;(2)抽签.
过关自诊
1.判断正误.(正确的画√,错误的画×)
(1)运动员从8个跑道中随机抽取一个跑道是简单随机抽样,可以用抽签法抽取样本.( )
(2)采用抽签法抽取样本时,应将号签放在一个透明的盒里进行抽取样本.( )
√
×
2.抽签法有什么优点和缺点
提示优点:简单易行.当总体的个数不多时,使总体处于“搅拌均匀”的状态比较容易,这时,每个个体都有均等的机会被抽中,从而能够保证样本的代表性.
缺点:仅适用于个体数较少的总体.当总体容量非常大时,费时费力又不方便,况且,如果号签搅拌不均匀,可能导致抽样不公平.
知识点3 随机数法
1.定义
先把总体中的N个个体依次编码为0,1,2,…,N-1,然后利用工具(转盘或摸球、随机数表、科学计算器或计算机)产生0,1,2,…,N-1中的随机数.产生的随机数是几,就选第几号个体,直至选到预先设定的样本容量.
2.利用随机数表进行抽样的具体步骤
(1)给总体中的每个个体编号;
(2)在随机数表中随机抽取某行某列作为抽样的起点,并规定读取方法;
(3)依次从随机数表中抽取样本号码,凡是抽到编号范围内的号码,就是样本的号码,并剔除相同的号码,直到抽满为止.
名师点睛
抽签法与随机数法的异同
共同点:(1)抽签法和随机数法都是简单随机抽样的方法,并且要求被抽取样本的总体的个数有限;(2)抽签法和随机数法都是从总体中逐个地进行抽取,都是不放回抽样.
不同点:(1)抽签法相对于随机数法简单,随机数法较抽签法稍麻烦一点;(2)随机数法更适用于总体中的个数较多的时候,而抽签法适用于总体中的个数相对较少的情况,所以当总体中的个体数较多时,应当选用随机数法,这样可以节约大量的人力和制作号签的成本与精力.
过关自诊
1.判断正误.(正确的画√,错误的画×)
(1)无论是抽签法还是随机数法,每一个个体被抽到的机会都是均等的.( )
(2)利用随机数法抽取样本时,选定的初始数是任意的,但读数的方向只能是从左向右读.( )
√
×
2.随机数法有什么优点和缺点
提示优点:简单易行.很好地解决了用抽签法时,当总体中的个数较多时制签难的问题.
缺点:当总体中的个体数很多,需要的样本容量也很大时,用随机数法抽取样本仍不方便.
3.总体由编号为001,002,003,…,299,300的300个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第3列数字开始由左到右依次选取三个数字,则选出来的第5个个体的编号为( )
7816 6572 0802 6314 0702 4369 9728
0198 3204 9234 4935 8200 3623 4869
A.080 B.263
C.140 D.280
D
重难探究 能力素养全提升
探究点一
简单随机抽样的判断
【例1】 判断下列抽样是不是简单随机抽样 为什么
①从无数个个体中抽取20个个体作为样本;
②从某种型号的30部手机中一次性取出5部手机进行质量检测;
③箱子里共有100个零件,从中选取10个零件进行检验,在抽样操作时,从中任意地拿出一个零件进行质量检测后再把它放回箱子里;
④一彩民选号,从装有36个大小、形状、质地都相同的号签的盒子中无放回地逐个抽出6个号签;
⑤某班有54名同学,指定数学成绩较好的6名同学参加数学竞赛.
解①不是简单随机抽样.因为简单随机抽样要求被抽取样本的总体的个体数是有限的.②不是简单随机抽样.虽然“一次性抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.③不是简单随机抽样.因为简单随机抽样要求是不放回抽样.④是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.⑤不是简单随机抽样.因为指定了数学成绩较好的6名同学参加竞赛,不存在随机性,不是等可能抽样.
规律方法 简单随机抽样的判断方法
判断所给的抽样是否为简单随机抽样的依据是简单随机抽样的四个特征:
上述四个特征,如果有一点不满足,就不是简单随机抽样.
变式训练1
下面抽样方法是简单随机抽样的是( )
A.从平面直角坐标系中抽取5个点作为样本
B.某公司从仓库中的1 000箱可乐中一次性抽取20箱进行质量检查
C.某连队从200名战士中,挑选出50名优秀的战士去参加抢险救灾活动
D.从10部手机中逐个不放回地随机抽取2部进行质量检验(假设10部手机已编好号,对编号随机抽取)
答案 D
解析 A中平面直角坐标系中有无数个点,这与要求总体中的个体数有限不相符,故错误;B中一次性抽取不符合简单随机抽样逐个抽取的特点,故错误;C中挑选50名优秀的战士,不符合简单随机抽样的等可能性,故错误.
探究点二
简单随机抽样的应用
角度1抽签法的应用
【例2】 学校要组织学生参加植树活动,要求每班选派男生10名,女生6名,现高一(1)班有男生32名,女生28名准备被随机选派.试用抽签法确定该班参加植树的同学.
解按照以下步骤进行抽样:
第一步 将32名男生从0到31编号;
第二步 用大小、形状、质地都相同的纸条做成32个号签,在每个号签上写上这些编号;
第三步 将写好的号签放在一个箱子中摇匀,不放回地逐个从中抽取10个号签;
第四步 抽取到的编号对应的男生参加植树活动.
重复上述的方法步骤,从28名女生中随机抽取6名女生参加植树活动.
规律方法 应用抽签法抽样的关注点
(1)利用抽签法抽取样本时,对个体的编号问题可视情况灵活处理,若个体没有编号,应首先编号;若个体已有编号,如考号、学号、序号等,可不必重新编号.
(2)号签一定要大小、形状、质地完全相同.
(3)号签制好后一定要将其搅拌均匀,这样才能保证抽签的随机性、公平性.
变式训练2
某高校将要举办秋季运动会,计划从报名的20名志愿者中选取5人组成志愿小组,请用抽签法设计抽样方案.
解(1)将20名志愿者编号,号码分别是1,2,…,20;
(2)将号码分别写在20张大小、形状、质地都相同的纸条上,揉成团,制成号签;
(3)将所得号签放在一个不透明的袋子中,并搅拌均匀;
(4)从袋子中依次不放回地抽取5个号签,并记录下上面的编号;
(5)所得号码对应的志愿者就是志愿小组的成员.
角度2随机数法的应用
【例3】 要考察某种品牌的850粒种子的发芽率,从中抽取50粒种子进行试验,利用随机数法抽取种子,先将850粒种子按001,002,…,850进行编号,如果从随机数表第3行第6列的数开始向右读,请依次写出最先检验的4粒种子的编号 .(下面抽取了随机数表第1行至第5行)
03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 95
97 74 24 67 62 42 81 14 57 20 42 53 32 37 32 27 07 36 07 51 24 51 79 89 73
16 76 62 27 66 56 50 26 71 07 32 90 79 78 53 13 55 38 58 59 88 97 54 14 10
12 56 85 99 26 96 96 68 27 31 05 03 72 93 15 57 12 10 14 21 88 26 49 81 76
55 59 56 35 64 38 54 82 46 22 31 62 43 09 90 06 18 44 32 53 23 83 01 30 30
答案 227,665,650,267
解析 从随机数表第3行第6列的数2开始向右读第一个小于850的数字是227,第二个数字是665,第三个数字是650,第四个数字是267.
规律方法 利用随机数法抽样的关注点
(1)编号要求位数相同;
(2)第一个数字的抽取是随机的;
(3)读数的方向是任意的,且要事先定好.读数时结合编号的位数读取.
变式探究
(1)本例中利用随机数法抽取样本,若从第4行第5列开始向右读,则最先检验的4颗种子的编号为 .
(2)本例中“850颗种子”改为“1 110颗种子”,
应如何编号
(1) 答案 668,273,105,037
(2)解可将1 110颗种子依次编号为0001,0002,…,1110.
本节要点归纳
1.知识清单:
(1)随机抽样与简单随机抽样的概念;
(2)抽签法及其方案设计;
(3)随机数法及其方案设计.
2.方法归纳:抽签法、随机数法.
3.常见误区:利用随机数表产生随机数;抽样时的编号问题.
学以致用 随堂检测全达标
1.(多选题)关于简单随机抽样的特点有以下几种说法,其中正确的是( )
A.要求总体中的个体数有限
B.从总体中逐个抽取
C.这是一种不放回抽样
D.每个个体被抽到的机会不一样,与先后顺序有关
答案 ABC
解析 简单随机抽样,除具有A,B,C三个特点外,还具有等可能性,每个个体被抽取的机会相等,与先后顺序无关.
2.某学校为了解高一800名新入学同学的数学学,从中随机抽取100名同学的中考数学成绩进行分析,在这个问题中,下列说法正确的是( )
A.800名同学是总体
B.100名同学是样本
C.每名同学是个体
D.样本容量是100
答案 D
解析 据题意,总体是指800名新入学同学的中考数学成绩,样本是指抽取的100名同学的中考数学成绩,个体是指每名同学的中考数学成绩,样本容量是100,故只有D正确.
3.下列抽样试验适合用抽签法的是( )
A.从某厂生产的5 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验
D.从某厂生产的5 000件产品中抽取10件进行质量检验
B
4.假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验.利用随机数法抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第8行第7列的数开始向右读,请你依次写出最先检测的5袋牛奶的编号 .(下面摘取了随机数表第7行至第9行)
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
答案 785,567,199,507,175
5.要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,并写出抽样过程.
解由于总体中的个体数和样本容量都较小,因此可采用抽签法抽取样本.抽样过程如下:
第一步 将30辆汽车进行编号,号码是1,2,3,…,30;
第二步 将号码分别写在大小、形状、质地都相同的纸条上,揉成团,制成号签;
第三步 将全部号签放入一个不透明的袋子中,并搅拌均匀;
第四步 从袋子中依次抽取3个号签,并记录上面的编号;
第五步 所得号码对应的3辆汽车就是要抽取的对象.(共35张PPT)
2.2 分层随机抽样
第六章
课标要求
1.理解分层随机抽样的概念.
2.掌握分层随机抽样的步骤,会利用分层随机抽样从总体中抽取样本.
3.能解决分层随机抽样中的计算问题.
4.能综合运用简单随机抽样与分层随机抽样解决相关问题.
内容索引
01
02
基础落实 必备知识全过关
重难探究 能力素养全提升
03
学以致用 随堂检测全达标
基础落实 必备知识全过关
知识点1 分层随机抽样
1.定义
将总体按其属性特征分成互不交叉的若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的个体,这种抽样方法通常叫作分层随机抽样.
2.特点
(1)分层随机抽样适用于已知总体是由差异明显的几部分组成;
(2)分成的各层互不重叠;
(3)各层抽取的比例都等于样本容量在总体中的比例,即 ,其中n为样本容量,N为总体中的个体数.
(4)各层抽样可以按简单随机抽样进行.
名师点睛
关于分层随机抽样应注意的问题
(1)分层随机抽样中分多少层,如何分层要视具体情况而定,总的原则是每层内样本的差异要小,不
同层之间样本的差异要大,且互不重叠.
(2)每一层抽取的个体数由样本容量乘以这一层的个体数在总体中所占的比例得到.
过关自诊
1.判断正误.(正确的画√,错误的画×)
(1)分层随机抽样中每层抽样的可能性是不相等的.( )
(2)分层随机抽样时,样本是在各层中分别抽取.( )
×
√
2.分层随机抽样中要将总体中层次分明的几部分分层按比例抽取,其中“比例”一词如何理解
3.分层随机抽样有什么优点
提示可从两个方面理解:一是所抽取样本中各层个体数之比与总体中各层个体数之比相同;二是每层所抽个体数与该层个体总数之比等于样本容量与总体中个体数目之比.
提示分层随机抽样时,每个个体被抽到的机会是均等的,而且样本更有较好的代表性.
知识点2 分层随机抽样的步骤
1.分层:根据已经掌握的信息,按某种标准将总体分成互不交叉的若干部分.
2.求比:根据总体中的个数N和样本容量n计算比例K= .
3.定数:确定第i层应该抽取的个体数为ni=Ni×K(Ni是第i层所包含的个体数),使得各层抽取的样本之和等于样本容量n.
4.抽样:按照第三步中确定的应在各层抽取的个体数,分别在各层抽取样本,然后合在一起就得到所需要抽取的容量为n的样本.
过关自诊
1.判断正误.(正确的画√,错误的画×)
(1)在统计实践中选择哪种抽样方法关键是看总体容量的大小.( )
(2)分层随机抽样中,个体数量较少的层抽取的样本量较少,这是不公平的.( )
(3)分层随机抽样中,每层样本的抽取可以用抽签法或随机数法.( )
×
×
√
2.某单位有职工1 500人,其中青年职工700人,中年职工500人,老年职工300人,为了了解该单位职工的身体情况,用分层随机抽样的方法从中抽取样本,若样本中的青年职工为14人,则样本容量为( )
A.14 B.30 C.50 D.70
答案 B
3.某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为120份,180份,240份,x份,因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为 .
答案 120
重难探究 能力素养全提升
探究点一
分层随机抽样的概念
【例1】 (1)下列问题中,最适合用分层随机抽样抽取样本的是( )
A.从10名同学中抽取3人参加座谈会
B.一次数学竞赛中,某班有10人在110分以上,40人在90~100分,12人低于90分,现从中抽取12人了解有关情况
C.从某校1 000名高中一年级学生中,抽取100名调查上学途中所用时间
D.从生产流水线上,抽取样本检查产品质量
(2)分层随机抽样将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体等可能抽样,必须( )
A.每层等可能抽样
B.每层可以不等可能抽样
C.所有层按同一抽样比例等可能抽样
D.所有层抽取的个体数量相同
答案 (1)B (2)C
解析 (1)A中总体的每个个体无明显差异且个数较少,适合用简单随机抽样;C和D中总体个体无明显差异且个数较多,不适合用分层随机抽样;B中总体个体差异明显,适合用分层随机抽样.
(2)保证每个个体等可能的被抽取是简单随机抽样与分层随机抽样的共同特征,为了保证这一点,分层随机抽样时必须在所有层都按同一抽样比例等可能抽取.
规律方法 1.使用分层随机抽样的前提
分层随机抽样的适用前提条件是总体可以分层,层与层之间有明显区别,而层内个体间差异较小.
2.使用分层随机抽样应遵循的两个原则
(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
(2)分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于样本容量与总体中个体数的比.
变式训练1
某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是 .
答案 分层随机抽样
解析 由于被抽取的个体属性有明显的差异,因此宜采用分层随机抽样.
探究点二
分层随机抽样的方案设计
【例2】 一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人,为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取
解因为职工年龄与这项指标有关,故采用分层随机抽样.
步骤如下:
(1)分层.按年龄将职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.
(3)在各层分别按抽签法或随机数法抽取样本.
(4)综合每层抽样,组成样本.
规律方法 应用分层随机抽样的解题策略
变式训练2
某工厂有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人.上级部门为了了解他们对机构改革的意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施操作.
解因机构改革关系到每个人的不同利益,故采用分层随机抽样方法较合适.
∴从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.
副处级以上干部与工人人数都较少,把他们分别按1~10编号和1~20编号,然后采用抽签法分别抽取2人和4人;
对一般干部70人进行00,01,…,69编号,然后用随机数法抽取14人.这样便得到了一个容量为20的样本.
探究点三
抽样方法的综合应用
【例3】 选择合适的抽样方法抽样,写出抽样过程.
(1)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个;
(2)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个;
(3)有甲厂生产的300个篮球,抽取10个.
下面给出的是随机数表中的第8行到第12行
2 7 4 8 6 1 9 8 7 1 6 4 4 1 4 8 7 0 8 6 2 8 8 8 8 5 1 9 1 6 2 0
7 4 7 7 0 1 1 1 1 6 3 0 2 4 0 4 2 9 7 9 7 9 9 1 9 6 8 3 5 1 2 5
5 3 7 9 7 0 7 6 2 6 9 4 2 9 2 7 4 3 9 9 5 5 1 9 8 1 0 6 8 5 0 1
9 2 6 4 4 6 0 7 2 0 2 1 3 9 2 0 7 7 6 6 3 8 1 7 3 2 5 6 1 6 4 0
5 8 5 8 7 7 6 6 3 1 7 0 0 5 0 0 2 5 9 3 0 5 4 5 5 3 7 0 7 8 1 4
解(1)总体个数较小,用简单随机抽样中的抽签法.
①将30个篮球编号,编号为00,01,…,29;
②将以上30个编号分别写在完全一样的小纸条上,揉成小球,制成号签;
③把号签放入一个不透明的袋子中,充分搅拌;
④从袋子中逐个抽取3个号签,并记录上面的号码;
⑤找出和所得号码对应的篮球即可得到样本.
(2)总体由差异明显的两个层次组成,需选用分层随机抽样.
②用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个,这些篮球便组成了我们要抽取的样本.
(3)总体个数较大,样本容量较小,宜用简单随机抽样中的随机数法.
①将300个篮球用随机方式编号,编号为001,002,…,300;
②在随机数表中随机的确定一个数作为开始.如从第8行第1列的数“2”开始,向右读;
③从数“2”向右读,每次读三位,凡不在001~300中的数跳过不读,遇到读到的也跳过不读.依次得到:274,164,207,011,116,297,076,269,068,072,这就是所抽取的10个样本个体的号码.
规律方法 抽样方法的选取
(1)若总体由差异明显的几个层次组成,则选用分层随机抽样;
(2)若总体没有差异明显的层次,则考虑采用简单随机抽样.当总体中个体数较小时宜用抽签法;当总体中个体数较大,样本容量较小时宜用随机数法.
变式训练3
下列问题中,采用怎样的抽样方法较为合理
(1)从10台电冰箱中抽取3台进行质量检查;
(2)某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.
解(1)抽签法,总体中个体数较小,宜用抽签法.(2)分层随机抽样,由于学校各类人员对这一问题的看法可能差异较大,用分层随机抽样.
本节要点归纳
1.知识清单:
(1)分层随机抽样的概念及适用情形;
(2)分层随机抽样中的计算问题;
(3)分层随机抽样的设计与应用.
2.方法归纳:方程思想.
3.常见误区:计算错误导致各层抽样数量错误.
学以致用 随堂检测全达标
1.某班有60名学生,其中男生有40人,现将男、女学生用分层随机抽样法抽取12人观看校演讲总决赛,则该班中被抽取观看校演讲总决赛的女生人数为( )
A.8 B.6 C.4 D.2
答案 C
解析 有60名学生,其中男生有40人,则女生20人,男女生人数之比为2∶1,抽取的12人,女生人数为12× =4.故选C.
2.某次娱乐节目中有A,B,C三个方阵,其人数之比为3∶3∶4,现用分层随机抽样方法抽出一个容量为n的样本,方阵A被抽出人数为12人,则此样本容量n为( )
A.20 B.25 C.30 D.40
答案 D
3.①教育局督学组到校检查工作,临时需在高三20个班抽两个班听课;②某班一次数学测试中有14人在120分以上,35人在90~119分,7人在90分以下,现从中抽出8人研讨进一步改进教与学;③某班春节聚会,要产生两位“幸运者”.上述三种情况,合适的抽样方法分别为( )
A.分层随机抽样,分层随机抽样,简单随机抽样
B.分层随机抽样,简单随机抽样,分层随机抽样
C.简单随机抽样,简单随机抽样,分层随机抽样
D.简单随机抽样,分层随机抽样,简单随机抽样
答案 D
解析 ①20个班抽两个班用简单随机抽样.②由于学生分成了差异比较大的几层,应用分层随机抽样.③由于总体与样本容量较小,应用简单随机抽样.故选D.
4.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是 、 .
答案 分层随机抽样 简单随机抽样
解析 ①对应的总体明显分成互不交叉的四层,即甲、乙、丙、丁四个地区,故用分层随机抽样.②对应的总体容量较少且个体差异较小,故用简单随机抽样.
5.某企业共有3 200名职工,其中青、中、老年职工的比例为3∶5∶2.若从所有职工中抽取一个容量为400的样本,则采用哪种抽样方法更合理 青、中、老年职工应分别抽取多少人
解因为总体由差异明显的三部分(青、中、老年)组成,所以采用分层随机抽样的方法更合理.
因为青、中、老年职工的比例是3∶5∶2,所以应分别抽取(共42张PPT)
4.1 样本的数字特征
4.2 分层随机抽样的均值与方差
4.3 百分位数
第六章
课标要求
1.会求样本的平均数、中位数、众数、百分位数.
2.会求样本的极差、标准差与方差.
3.通过应用相关知识解决实际统计问题,培养数据分析的核心素养.
内容索引
01
02
基础落实 必备知识全过关
重难探究 能力素养全提升
03
学以致用 随堂检测全达标
基础落实 必备知识全过关
知识点1 样本的数字特征
1.众数、中位数、平均数
众数、中位数、平均数刻画了一组数据的集中趋势.
(1)众数
一组数据中,出现次数最多的数据就是众数.若有两个或几个数据出现的次数相等且都最多,则这些数都是这组数据的众数;若一组数据中,每个数据出现的次数都一样,则这组数据没有众数.
(2)中位数
一般地,将一组数据按从小到大的顺序排列后,“中间”的那个数据为这组数据的中位数.
当数据有奇数个时,位于最中间位置的数就是中位数;当数据有偶数个时,位于最中间的两个数的平均数就是中位数.
(3)平均数
一组数据的平均值,数据x1,x2,…,xn的平均数为 = .
名师点睛
众数、中位数、平均数的比较
名称 优点 缺点
众数 (1)体现了样本数据的最大集中点;(2)容易计算 (1)它只能表达样本数据中很少的一部分信息;(2)无法客观地反映总体的特征
中位数 (1)不受少数几个极端数据 (即排序靠前或靠后的数据)的影响;(2)容易计算,便于利用中间数据的信息 对极端值不敏感
平均数 反映出更多的关于样本数据全体的信息 任何一个数据的改变都会引起平均数的改变,数据波动越大,对平均数的影响也越大
2.极差、方差、标准差
极差、方差、标准差刻画了一组数据的 .
(1)极差:数据中 和 的差.
(2)方差:设一组数据为x1,x2,x3,…,xn,其平均数为 ,则方差
s2= ,其单位是原始观测数据单位的 ,方差刻画的是数据偏离平均数的离散程度.
(3)标准差
①定义:它是方差的算术平方根,s= = ,其单位与原始数据的单位 .
②计算方法:先求出方差s2,再求方差的算术平方根,即得标准差s= .
离散程度
最大值
最小值
平方
相同
名师点睛
计算方差、标准差的步骤
计算样本数据x1,x2,…,xn的标准差的算法如下:
第一步:算出样本数据的平均数 ;
第二步:算出每个样本数据与样本平均数的差xi- (i=1,2,…,n);
第三步:算出第二步中xi- (i=1,2,…,n)的平方;
第四步:算出第三步中n个平方数的平均数,即为样本方差;
第五步:算出第四步中平均数的算术平方根,即为样本标准差.
过关自诊
1.判断正误.(正确的画√,错误的画×)
(1)一组数据中,有一半的数据不大于中位数,而另一半则不小于中位数,中位数反映了一组数据的中心的情况.( )
(2)频率分布直方图中,平均数左右两边的面积相等.( )
(3)如果一组数中每个数都减去同一个非零常数,则这组数的平均数改变,方差不变.( )
(4)标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散.( )
√
×
√
×
2.怎样由频率分布直方图估计样本的众数、中位数、平均数
提示(1)在频率分布直方图中,众数是最高的小长方形的中点.(2)在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应相等.(3)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形的底边中点的横坐标之和.
3.平均数与方差有哪些性质
知识点2 分层随机抽样的均值与方差
1.分层随机抽样的平均数
(1)定义:一般地,将样本a1,a2,…,am和样本b1,b2,…,bn合并成一个新样本,则这个新样本的平均数为
w1,w2∈[0,1]
2.分层随机抽样的方差
过关自诊
1.判断正误.(正确的画√,错误的画×)
(1)样本数据分为两层,其中一层的平均数为96,另一层的平均数为98,则样本数据的平均数为 =97.( )
(2)把一个样本分成两层,由每层数据的平均数和方差就能求整个样本数据的平均数和方差.( )
×
×
2.甲、乙两人进行射击比赛,甲射击6次,成绩分别为10,9,8,7,8,6;乙射击4次,成绩分别为9,8,9,10.则甲、乙两人共射击10次的平均成绩和方差分别是多少
知识点3 百分位数
1.一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点:总体数据中的任意一个数小于或等于它的可能性是p.
2.计算一组n个数据的p分位数的一般步骤如下:
第一步,按照从小到大排列原始数据;
第二步,计算i=np;
第三步,若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数.
取值连续不断,不能一一列举
过关自诊
1.判断正误.(正确的画√,错误的画×)
(1)50%分位数就是中位数.( )
(2)百分位数只能是总体数据中的数.( )
√
×
2.对于考试成绩的统计,如果你的成绩处在95%分位数上,以下说法正确的是( )
A.你得了95分
B.你答对了95%的试题
C.至少有95%的参加考试者得到了和你一样的考分或还要低的分数
D.你排名在第95名
答案 C
解析 95%分位数是指把数据从小到大排序,有至少95%的数据小于或等于这个数,至少5%的数据大于或等于这个数,只有C正确.
3.900,920,920,930,930的20%分位数是 .
答案 910
解析 因为5×20%=1,所以该组数据的20%分位数是 =910.
重难探究 能力素养全提升
探究点一
平均数、众数、中位数的求法
【例1】 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示.
成绩/m 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90
人数 2 3 2 3 4 1 1 1
分别求这些运动员成绩的众数、中位数与平均数.(结果精确到0.01)
解在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.题目中表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70.这组数据的平均数是
所以这17名运动员成绩的众数、中位数、平均数依次为1.75,1.70,1.69.
规律方法 中位数、众数、平均数的应用注意事项
求中位数的关键是将数据排序,一般按照从小到大的顺序排列.中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响.中位数可能在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述数据的集中趋势
确定众数的关键是统计各数据出现的频数,频数最大的数据就是众数.当一组数据中有不少数据多次重复出现时,众数往往更能反映数据的集中趋势
平均数与每一个样本数据都有关,受个别极端数据(比其他数据大很多或小很多的数据)的影响较大,因此若在数据中存在少量极端数据,平均数对总体估计的可靠性较差,这时往往用众数或中位数去估计总体.有时也采用剔除最大值与最小值后所得的平均数去估计总体
变式训练1
(1)16位参加百米赛跑半决赛同学的成绩各不相同,按成绩取前8位进入决赛.如果小刘知道了自己的成绩后,要判断能否进入决赛,则其他15位同学成绩的下列数据中,能使他得出结论的是( )
A.平均数 B.极差 C.中位数 D.方差
(2)已知一组数据按从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么该组数据的众数是 ,平均数是 .
答案 (1)C (2)6 5
解析 (1)判断能否进入决赛,只要判断是不是前8位,所以只要知道其他15位同学的成绩中是不是有8位高于他,也就是把其他15位同学的成绩排列后看第8位的成绩即可,小刘的成绩高于这个成绩就能进入决赛,低于这个成绩就不能进入决赛,这个第8位的成绩就是这15位同学成绩的中位数.
探究点二
方差和标准差的计算及应用
【例2】 甲、乙两台机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为:
甲:99,100,98,100,100,103;
乙:99,100,102,99,100,100.
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
规律方法 标准差(方差)的两个作用
(1)标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.
(2)在实际应用中,常常把平均数与标准差结合起来进行决策.在平均值相等的情况下,比较方差或标准差以确定稳定性.
(2)两台机床所加工零件的直径的平均值相同,又 ,所以乙机床加工零件的质量更稳定.
变式训练2
已知样本9,10,11,x,y的平均数是10,标准差是 ,则xy= .
答案 96
解析 由平均数得9+10+11+x+y=50,
所以x+y=20.
又由(9-10)2+(10-10)2+(11-10)2+(x-10)2+(y-10)2=( )2×5=10,
得x2+y2-20(x+y)=-192,
(x+y)2-2xy-20(x+y)=-192,xy=96.
故填96.
探究点三
求百分位数
【例3】 给出下列一组数据:18,19,20,20,21,22,23,31,31,35,求出45%分位数.
解因为数据个数为10,而且10×45%=4.5,因此该组数据的45%分位数为21.
规律方法 计算一组数据的p分位数时,注意区分i=np的值是否为整数.
变式探究
求出本例中的80%分位数.
解因为10×80%=8,所以该组数据的80%分位数为
本节要点归纳
1.知识清单:
(1)众数、中位数、平均数、极差、方差和标准差的意义与计算;
(2)样本数据数字特征的应用;
(3)分层随机抽样的均值与方差;
(4)百分位数.
2.方法归纳:数据分析、统计.
3.常见误区:未对数据排序导致求中位数错误;方差与标准差计算错误;求百分位数时,未排序导致错误.
学以致用 随堂检测全达标
1.(多选题)下列说法中,正确的是( )
A.数据2,4,6,8的中位数是4,6
B.数据1,2,2,3,4,4的众数是2,4
C.一组数据的平均数、众数、中位数有可能是同一个数据
D.8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是
答案 BCD
解析 数据2,4,6,8的中位数为 =5,显然A是错误的,B,C,D都是正确的.
2.若甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和标准差如下表:
选手 甲 乙 丙 丁
平均数 8.5 8.8 8.8 8
标准差s 3.5 3.5 2.1 8.7
则参加奥运会的最佳人选应为( )
A.甲 B.乙 C.丙 D.丁
答案 C
解析 从平均数来看,乙、丙的平均值最大,从标准差来看,丙的标准差最小,因此应选择丙参加比赛.
3.已知一组数据:125,121,123,125,127,129,125,128,130,129,126,124,
125,127,126.则这组数据的25%分位数和80%分位数分别是( )
A.125,128 B.124,128
C.125,129 D.125,128.5
答案 D
解析 把这15个数据按从小到大排序,可得121,123,124,125,125,125,125,126,126,127,127,128,129,129,130,由25%×15=3.75,80%×15=12,可知数据的25%分位数为第4项数据为125,80%分位数为第12项与第13项数据的平均数,即 ×(128+129)=128.5.
4.(2020江苏高考,3)已知一组数据4,2a,3-a,5,6的平均数为4,则a的值是 .
答案 2
解析 由已知,得 ×[4+2a+(3-a)+5+6]=4,
解得a=2.
5.某车间20名工人年龄数据如下表:
年龄/岁 人数
19 1
28 3
29 3
30 5
31 4
32 3
40 1
合计 20
(1)求这20名工人年龄的众数与极差;
(2)求这20名工人年龄的方差s2.
解(1)这20名工人年龄的众数为30,年龄的极差为40-19=21.
(2)这20名工人年龄的平均数为(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30,
所以这20名工人年龄的方差为(共37张PPT)
本章总结提升
第六章
内容索引
01
02
网络构建归纳整合
专题突破素养提升
网络构建归纳整合
专题突破素养提升
专题一
抽样的基本方法
1.抽样方法有:简单随机抽样、分层随机抽样.一般地,当总体是由差异明显的几个层组成时选用分层随机抽样,否则考虑用简单随机抽样.选用简单随机抽样时,当总体容量较小时,采用抽签法;当总体容量较大、样本容量较小时,采用随机数法.
2.抽样方法的选择与分层随机抽样中的计算是常考查的知识点,提升数学抽象和数学运算的核心素养.
【例1】 (1)(2022陕西咸阳期末)某中学组织“党史知识竞赛”活动,已知该校共有高中学生2 700人,用分层抽样的方法从该校高中学生中抽取一个容量为45的样本参加活动,其中高一年级抽取了16人,则该校高一年级学生人数为( )
A.1 680 B.1 020
C.960 D.720
(2)假设要考察某公司生产的袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是 .(下面摘取了随机数表第7行至第9行)
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
答案 (1)C (2)068
所以该校高一年级学生人数为960.
(2)由随机数表可以看出前4个样本的个体的编号是331,572,455,068.于是第4个样本个体的编号是068.
规律方法 应用各种抽样方法抽样时要注意以下问题:
(1)利用抽签法时要注意把号签放在不透明的容器中且搅拌均匀;
(2)利用随机数法时注意编号位数要一致;
(3)在分层随机抽样中,若在某一层抽到的个体数不是整数,应在该层剔除部分个体,使抽取个体数为整数.
变式训练1
(1)下列抽样方法是简单随机抽样的是( )
A.从平面直角坐标系中抽取5个点作为样本
B.某饮料公司从仓库中的1 000箱饮料中一次性抽取20箱进行质量检查
C.某连队从200名战士中,挑选出50名最优秀的战士去参加抢险救灾活动
D.从10个手机中逐个不放回地随机抽取2个进行质量检验(假设10个手机已编好号,对编号随机抽取)
(2)某校为了了解学生学习的情况,采用分层随机抽样的方法从高一1 000人,高二1 200人,高三n人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n=( )
A.860 B.720 C.1 020 D.1 040
答案 (1)D (2)D
解析 (1)选项A中,平面直角坐标系中有无数个点,这与要求总体中的个体数有限不相符,故错误;B中,一次性抽取不符合简单随机抽样逐个抽取的特点,故错误;C中,50名战士是最优秀的,不符合简单随机抽样的等可能性,故错误.
专题二
用样本的频率分布估计总体分布
1.频率分布直方图的构成及特征
2.掌握频率分布直方图的画法及其应用,重点提升数据分析与逻辑推理的核心素养.
【例2】 从某中学参加2021年全国高中数学联赛预赛的500名同学中,随机抽取若干名同学,将他们的成绩制成频率分布表,下面给出了此表中部分数据.
(1)根据表中已知数据,分别计算①,②,③处的数值;
(2)补全在区间[70,140]上的频率分布直方图;
(3)若成绩不低于110分的同学能参加决赛,那么可以估计该校大约有多少学生能参加决赛
分组 频数 频率
[70,80) 0.08
[80,90) 0.10
[90,100) ③
[100,110) 16 ①
[110,120) 0.08
[120,130) ② 0.04
[130,140] 0.02
合计 50
解(1)由表中数据知,随机抽取了50人,所以①为 =0.32,②为50×0.04=2,③为1-0.08-0.1-0.32-0.08-0.04-0.02=0.36.
(2)经计算,频率分布表为
分组 频数 频率
[70,80) 4 0.08 0.008
[80,90) 5 0.10 0.010
[90,100) 18 0.36 0.036
[100,110) 16 0.32 0.032
[110,120) 4 0.08 0.008
[120,130) 2 0.04 0.004
[130,140] 1 0.02 0.002
合计 50 1 0.100
根据频率分布表可补全频率分布直方图:
(3)在随机抽取的50名同学中有4+2+1=7(名)同学成绩不低于110分,可以去参加决赛,
故估计参加预赛的同学中能参加决赛的人数大概为500× =70.
规律方法 与频率分布直方图有关问题的常见类型及解题策略
(1)已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1可求出其他数据.
(2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.
变式训练2
对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名学生,得到这M名学生分别参加社区服务的次数,根据此数据作出了频率分布表和频率分布直方图,如图所示:
分组 频数 频率
[10,15) 10 0.25
[15,20) 24 n
[20,25) m p
[25,30] 2 0.05
合计 M 1.00
(1)求表中M,p及图中a的值;
(2)若该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数.
(2)因为该校高三学生有240人,分组[10,15)的频率是0.25,所以估计该校高三学生参加社区服务的次数在区间[10,15)内的人数为240×0.25=60.
专题三
用样本估计总体的数字特征
1.为了从整体上更好地把握总体规律,我们还可以通过样本数据的众数、中位数、平均数估计总体的集中趋势,通过样本数据的方差或标准差估计总体的离散程度.
2.掌握各个数字特征的意义及应用,重点提升数据分析与数学运算的核心素养.
【例3】 某工厂甲、乙两名工人参加操作技能培训.现分别从他们在培训期间参加的若干次测试成绩中随机抽取8次,数据如下(单位:分):
甲 95 82 88 81 93 79 84 78
乙 83 75 80 80 90 85 92 95
(1)请你分别计算这两组数据的平均数、中位数.
(2)现要从中选派一人参加操作技能比赛,从统计学的角度考虑,你认为选派哪名工人更合适 请说明理由.
①从平均数看,甲、乙均为85分,平均水平相同;
②从中位数看,乙的中位数大于甲,乙的成绩好于甲;
④从数据特点看,获得85分以上(含85分)的次数,甲有3次,而乙有4次,故乙的成绩好些;
⑤从数据的变化趋势看,乙后几次的成绩均高于甲,且呈上升趋势,因此乙更具潜力.
综上分析可知,甲的成绩虽然比乙稳定,但从中位数、获得好成绩的次数及发展势头等方面分析,乙具有明显优势,所以应派乙参赛更有望取得好成绩.
规律方法 用样本的数字特征估计总体的数字特征应注意的问题
(1)中位数用来描述数据的中心位置,众数体现了数据的最大集中点,平均数反映样本数据的总体水平.
(2)标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)较大,数据的离散程度较大;标准差(方差)较小,数据的离散程度较小.
变式训练3
某工厂甲、乙两个车间包装同一种产品,在自动包装传送带上每隔一小时抽一包产品,称其质量(单位:克)是否合格,分别记录抽查数据,获得质量数据如下.
甲:107,111,111,113,114,122
乙:108,109,110,112,115,124
(1)写出甲的众数和乙的中位数;
(2)根据样本数据,计算甲、乙两个车间产品质量的平均数与方差,并说明哪个车间的产品的质量相对稳定.
解(1)甲的众数是111,乙的中位数是111.
专题四
样本的百分位数
1.一般地,当总体是连续变量时,总体的p(02.掌握百分位数的计算及应用,重点提升数据分析与数学运算的核心素养.
【例4】 一家保险公司决定对推销员实行目标管理,即给推销员确定一个具体的销售目标.确定的销售目标是否合适,直接影响到公司的经济效益.如果目标定得过高,多数推销员完不成任务,会使推销员失去信心;如果目标定得太低,将不利于挖掘推销员的工作潜力.下面一组数据是部分推销员的月销售额(单位:千元).
19.58 16.11 16.45 20.45 20.24 21.66
22.45 18.22 12.34 19.35 20.55 17.45
18.78 17.96 19.91 18.12 14.65 14.78
16.78 18.78 18.29 18.51 17.86 19.58
19.21 18.55 16.34 15.54 17.55 14.89
18.94 17.43 17.14 18.02 19.98 17.88
17.32 19.35 15.45 19.58 13.45 21.34
14.00 18.42 23.00 17.52 18.51 17.16
24.56 25.14
请根据这组样本数据提出使65%的职工能够完成销售指标的建议.
解将这50个样本数据按从小到大排序,可得:12.34 13.45 14.00 14.65 14.78 14.89 15.45 15.54 16.11 16.34 16.45 16.78 17.14 17.16 17.32 17.43 17.45 17.52 17.55 17.86 17.88 17.96 18.02 18.12 18.22 18.29 18.42 18.51 18.51 18.55 18.78 18.78 18.94 19.21 19.35 19.35 19.58 19.58 19.58 19.91 19.98 20.24 20.45 20.55 21.34 21.66 22.45 23.00 24.56 25.14
65%的职工能够完成销售指标,那么35%的职工不能完成销售指标.
由50×(1-65%)=17.5可知这组数据的35%分位数为第18项数为17.52.故为使65%的职工能够完成销售指标,该保险公司可将月销售额定为17.52千元.
规律方法 计算一组n个数据的p分位数的一般步骤:
第1步,按从小到大排列原始数据;
第2步,计算i=np;
第3步,若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数.
变式训练4
(2021云南大理检测)某校高一年级学生打算利用周六休息时间做义工,为了了解高一年级学生做义工时长的情况,随机抽取了高一年级100名学生进行调查,将收集到的做义工时间(单位:小时)数据(时间均在[0,6]内)分成6组:[0,1),[1,2),[2,3),[3,4),[4,5),[5,6],制成如下频率分布直方图.已知该时间数据的70%分位数为3.5,则m,n的值分别为( )
A.0.3,0.35 B.0.4,0.25
C.0.35,0.3 D.0.35,0.25
答案 C
解析 由频率分布直方图可得,0.05+0.15+m+n+0.11+0.04=1,即m+n=0.65.①
因为时间数据的70%分位数为3.5,
所以0.05+0.15+m+(3.5-3)n=0.7,即m+0.5n=0.5.②
由①②可得,m=0.35,n=0.3.