第九章 统计
9.1 随机抽样
一、普查与抽查
调查方式 普查 抽查
定义 对每一个调查对象都进行 的方法,称为全面调查,又称普查 根据一定目的,从总体中 个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法
相关概念 总体:在一个调查中,我们把 的全体称为总体. 个体:组成总体的每一个调查对象称为个体 样本:我们把从 中抽取的那部分个体称为样本. 样本量:样本中包含的 称为样本量
【答案】调查 调查对象 抽取一部分 总体 个体数
二、简单随机抽样
1.简单随机抽样的概念
放回简单随机抽样 不放回简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中 抽取n(1≤n如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都 ,我们把这样的抽样方法叫做放回简单随机抽样 如果抽取是不放回的,且每次抽取时总体内_ 被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样
简单随机抽样:放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本
2.抽签法:先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以使卡片、小球等)上作为号签,并将这些小纸片放在一个____的盒里,充分____.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.
3.随机数法
(1)定义:先把总体中的个体编号,用随机数根据产生与总体中个体数量____的整数随机数,把产生的随机数作为抽中的编号,并剔除____的编号,直到抽足样本所需要的个体数.
(2)产生随机数的方法:①用随机试验生成随机数;②用信息技术生成随机数.
4.总体均值和样本均值
(1)总体均值:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称= = = 为总体均值,又称总体平均数.
(2)总体均值加权平均数的形式:如果总体的N个变量值中,不同的值共有k个(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式= .
(3)如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称=
= 为样本均值,又称样本平均数.
在简单随机抽样中,我们常用样本平均数去估计总体平均数.
【答案】1. 逐个 相等 未进入样本的各个个体
2. 不透明 搅拌
3. 相等重复
4.
三、分层抽样的概念
1.定义
一般地,按 把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中 地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
2.适用范围
当总体是由 的几个部分组成时,往往采用分层随机抽样.
3.比例分配
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
【答案】1.一个或多个变量 独立
2.差异明显
四、分层随机抽样的步骤
(1)分层:按某种特征将总体分成若干部分(层)
(2)计算抽样比:抽样比
(3)定数:按抽样比确定每层抽取的个体数
(4)抽样:每层分别按简单随机抽样的方法抽取样本
(5)成样:综合各层抽样,组成样本
五、样本平均数
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层样本的平均数分别为和,则样本的平均数= + = + .
在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数.
【答案】
六、获取数据的途径
获取数据的基本途径有 、 、 、 等.
【答案】通过调查获取数据 通过试验获取数据 通过观察获取数据 通过查询获得数据
一、选择题
1.某班有学生30人,其中男生18人,女生12人,若采用分层抽样的方法从该班学生中随机抽取10人去参加学校举行的消防知识竞赛,则应抽取女生的人数是( )
A.2 B.4 C.6 D.10
【答案】B
【解析】由题设,设应抽取女生的人数是人,则,解得人.
故答案为:B.
2.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是( )
A.众数 B.平均数 C.中位数 D.标准差
【答案】D
【解析】解: A样本数据如下: 82,84,84,86,86,86,88,88,88,88.
B样本数据如下: 84,86, 86,88,88, 88,90,90,90,90.
众数分别为88,90, 不相等,A 错;
平均数分别为86,88,B错;
中位数分别为86,88,不相等,C错,
A样本方差,标准差S=2 ;
B样本方差,标准差S'=2 ;
则D对
故答案为:D
3.体育老师记录了班上10名同学1分钟内的跳绳次数,得到如下数据:88,94,96,98,98,99,100,101,101,116.这组数据的60%分位数是( )
A.98 B.99 C.99.5 D.100
【答案】C
【解析】这组数据的60%分位数是.
故答案为:C
4.某校有高一学生390人,高二学生360人,高三学生345人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取部分学生作为样本.若从高二学生中抽取的人数为24人,则高一学生和高三学生应抽取的人数分别为( )
A.高一学生26人 高三学生23人
B.高一学生28人 高三学生21人
C.高一学生多于24人 高三学生少于24人即可
D.高一 高三学生人数都不限
【答案】A
【解析】设高一学生抽取人,高三学生抽取人,
则有:。
故答案为:A
5.某校有高一年级学生1000名,高二年级学生1200名,高三年级学生1100名,现用分层抽样的方法从该校所有高中生中抽取330名学生,则抽取的高三年级学生人数为( )
A.50 B.70 C.90 D.110
【答案】D
【解析】由题意得抽取的高三年级学生人数为
,
故答案为:D
6.某校为了解学生学习的情况,采用分层抽样的方法从高一2400人、高二20000人、高三人中,抽取180人进行问卷调查.已知高二被抽取的人数为60人,那么高三被抽取的人数为( )
A.72 B.60 C.48 D.84
【答案】C
【解析】由分层抽样可得,可得,
设高三所抽取的人数为,则,解得.
故答案为:C.
二、填空题
7.某小区共有住户2000人,其中老年人600人,中年人1000人,其余为青少年等人群,为了调查该小区的新冠疫苗接种情况,现采用分层抽样的方法从中抽取一个容量为400的样本,则样本中中年人的人数为
【答案】200
【解析】因为某小区共有住户2000人,其中中年人1000人,且样本容量为400,
所以样本中中年人的人数为人。
故答案为:200。
8.假设要考察某公司生产的 袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数法抽取样本时,先将800袋牛奶按000,001, ,799进行编号,若从随机数表第7行第8列的数开始向右读,则得到的第4个的样本个体的编号是 .
(下面摘取了随机数表第7行到第9行)
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
【答案】068
【解析】根据随机数表法最先检测的3袋牛奶编号为:331、572、455、068。
故答案为:068。
三、解答题
9.某市的3个区共有高中学生20 000人,且3个区的高中学生人数之比为2∶3∶5,现要从所有学生中抽取一个容量为200的样本,调查该市高中学生的视力情况,试写出抽样过程.
【答案】解: 其抽样过程如下:(1)由于该市高中学生的视力有差异,按3个区分成三层,用分层抽样来抽取样本.(2)确定每层抽取个体的个数,在3个区分别抽取的学生人数之比也是2∶3∶5,所以抽取的学生人数分别是200× =40;200× =60;200× =100.(3)在各层分别按系统抽样法抽取样本.(4)综合每层抽样,组成容量为200的样本.
【解析】依题可知,需要分成三个层次,然后计算出每个层次应抽取的比例,结合每个层次的人数,即可得出答案。
10.2021年4月30日,马鞍山市采石矶5A级旅游景区揭牌.为了更好的提高景区服务质量,景区管理部门对不同年龄层次的入园游客进行随机调查,收集数据如下:
组别 青少年组 中年组 老年组
调查人数 10 20 10
好评率 0.7 0.6 0.9
假设所有被调查游客的评价相互独立.
(1)求此次调查的好评率.
(2)若从所有评价为好评的被调查游客中随机选择1人,求这人是老年组的概率.
【答案】(1)好评率是
(2)在所有评价为好评的青少年组人数为7人,中年组人数为12人,老年组人数为9人,此人是老年组的概率是 .
【解析】(1)根据平均数的解法直接求解即可;
(2)根据分层抽样直接求解即可.第九章 统计
9.1 随机抽样
一、普查与抽查
调查方式 普查 抽查
定义 对每一个调查对象都进行 的方法,称为全面调查,又称普查 根据一定目的,从总体中 个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法
相关概念 总体:在一个调查中,我们把 的全体称为总体. 个体:组成总体的每一个调查对象称为个体 样本:我们把从 中抽取的那部分个体称为样本. 样本量:样本中包含的 称为样本量
二、简单随机抽样
1.简单随机抽样的概念
放回简单随机抽样 不放回简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中 抽取n(1≤n如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都 ,我们把这样的抽样方法叫做放回简单随机抽样 如果抽取是不放回的,且每次抽取时总体内_ 被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样
简单随机抽样:放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本
2.抽签法:先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以使卡片、小球等)上作为号签,并将这些小纸片放在一个____的盒里,充分____.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.
3.随机数法
(1)定义:先把总体中的个体编号,用随机数根据产生与总体中个体数量____的整数随机数,把产生的随机数作为抽中的编号,并剔除____的编号,直到抽足样本所需要的个体数.
(2)产生随机数的方法:①用随机试验生成随机数;②用信息技术生成随机数.
4.总体均值和样本均值
(1)总体均值:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称= = = 为总体均值,又称总体平均数.
(2)总体均值加权平均数的形式:如果总体的N个变量值中,不同的值共有k个(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式= .
(3)如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称=
= 为样本均值,又称样本平均数.
在简单随机抽样中,我们常用样本平均数去估计总体平均数.
三、分层抽样的概念
1.定义
一般地,按 把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中 地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
2.适用范围
当总体是由 的几个部分组成时,往往采用分层随机抽样.
3.比例分配
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
四、分层随机抽样的步骤
(1)分层:按某种特征将总体分成若干部分(层)
(2)计算抽样比:抽样比
(3)定数:按抽样比确定每层抽取的个体数
(4)抽样:每层分别按简单随机抽样的方法抽取样本
(5)成样:综合各层抽样,组成样本
五、样本平均数
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层样本的平均数分别为和,则样本的平均数= + = + .
在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数.
六、获取数据的途径
获取数据的基本途径有 、 、 、 等.
一、选择题
1.某班有学生30人,其中男生18人,女生12人,若采用分层抽样的方法从该班学生中随机抽取10人去参加学校举行的消防知识竞赛,则应抽取女生的人数是( )
A.2 B.4 C.6 D.10
2.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是( )
A.众数 B.平均数 C.中位数 D.标准差
3.体育老师记录了班上10名同学1分钟内的跳绳次数,得到如下数据:88,94,96,98,98,99,100,101,101,116.这组数据的60%分位数是( )
A.98 B.99 C.99.5 D.100
4.某校有高一学生390人,高二学生360人,高三学生345人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取部分学生作为样本.若从高二学生中抽取的人数为24人,则高一学生和高三学生应抽取的人数分别为( )
A.高一学生26人 高三学生23人
B.高一学生28人 高三学生21人
C.高一学生多于24人 高三学生少于24人即可
D.高一 高三学生人数都不限
5.某校有高一年级学生1000名,高二年级学生1200名,高三年级学生1100名,现用分层抽样的方法从该校所有高中生中抽取330名学生,则抽取的高三年级学生人数为( )
A.50 B.70 C.90 D.110
6.某校为了解学生学习的情况,采用分层抽样的方法从高一2400人、高二20000人、高三人中,抽取180人进行问卷调查.已知高二被抽取的人数为60人,那么高三被抽取的人数为( )
A.72 B.60 C.48 D.84
二、填空题
7.某小区共有住户2000人,其中老年人600人,中年人1000人,其余为青少年等人群,为了调查该小区的新冠疫苗接种情况,现采用分层抽样的方法从中抽取一个容量为400的样本,则样本中中年人的人数为
8.假设要考察某公司生产的 袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数法抽取样本时,先将800袋牛奶按000,001, ,799进行编号,若从随机数表第7行第8列的数开始向右读,则得到的第4个的样本个体的编号是 .
(下面摘取了随机数表第7行到第9行)
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
三、解答题
9.某市的3个区共有高中学生20 000人,且3个区的高中学生人数之比为2∶3∶5,现要从所有学生中抽取一个容量为200的样本,调查该市高中学生的视力情况,试写出抽样过程.
10.2021年4月30日,马鞍山市采石矶5A级旅游景区揭牌.为了更好的提高景区服务质量,景区管理部门对不同年龄层次的入园游客进行随机调查,收集数据如下:
组别 青少年组 中年组 老年组
调查人数 10 20 10
好评率 0.7 0.6 0.9
假设所有被调查游客的评价相互独立.
(1)求此次调查的好评率.
(2)若从所有评价为好评的被调查游客中随机选择1人,求这人是老年组的概率.