(共21张PPT)
简单随机抽样
安徽淮南第四中学
2021.5
考点
学习目标
核心素养
抽样调查
理解全面调查、抽样调查、总体、个体、样本、样本量、样本数据等概念
数学抽象
简单随机抽样
理解简单随机抽样的概念,掌握简单随机抽样的两种方法:抽签法和随机数法
数学抽象、
逻辑推理
1、全国人口共14.1178亿人,男性占51.24%;女性占48.76%。总人口性别比(以女性为100,男性对女性的比例)为105.07,与2010年基本持平,略有降低。出生人口性别比为111.3,较2010年下降6.8。我国人口的性别结构持续改善。
2、我国少儿人口比重回升,人口老龄化程度进一步加深。年龄构成方面,0-14岁人口占17.95%,15-59岁人口占比63.35%,60岁及以上人口占18.7%,65岁及以上人口占13.5%。与2010年相比,0-14岁、15-59岁、60岁及以上人口的比重分别上升1.35个百分点、下降6.79个百分点、上升5.44个百分点。
3、具有大学文化程度的人口为2.1836亿人
客户
A
连续浏览了
5
款电视机,其中
4
款来自国内品牌
S,1
款来自国外品牌
T;4
款为
LED
技术,1
款为
LCD
技术;5
款的价格分别为
4599
元、5199
元、5499
元、5999
元、7999
元;这些行为某种程度上反映了客户
A
对品牌认可度及倾向性,如偏向国产品牌、中等价位的
LED
电视。而客户
B
连续浏览了
6
款电视机,其中
2
款是国外品牌
T,2
款是另一国外品牌
V,2
款是国产品牌
S;4
款为
LED
技术,2
款为
LCD
技术;6
款的价格分别为
5999
元、7999
元、8300
元、9200
元、9999
元、11050
元;类似地,这些行为某种程度上反映了客户
B
对品牌认可度及倾向性,如偏向进口品牌、高价位的
LED
电视等。
在现实生活中,我们经常会接触到各种统计数据,例如,人口总数、经济增长率、就业状况、物价指数、产品的合格率,农作物的产量,商品的销售量,新冠肺炎的治愈率与死亡率、电视台的收视率等.你知道这些数据是怎么来的吗?实际上他们是通过调查获得的.怎样调查呢?是对考察对象进行全面调查吗?
(1)怎样从总体中抽取样本呢?
(2)如何表示样本数据呢?
(3)如何从样本数据中提取基本信息(样本分布、
样本数字特征等),来推断总体的情况呢?
1.全面调查和抽样调查
“为了了解我校300名教职工的注射疫苗情况,从中抽取15名教职工调查”这一问题中的总体是什么?
300名教职工的注射疫苗情况
对每一个调查对象都进行调查的方法,称为全面调查,又称普查。
根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据
对总体的情况做出估计和判断的调查方法,称为抽样调查
总体
调查对象的全体叫做总体。
个体
组成总体的每一个调查对象叫做个体。
每一名教职工的注射疫苗情况叫做个体。
样本
从总体中抽取的那部分个体叫做样本。
样本量
样本中包含的个体数叫做样本量。
相关概念
样本与样本量是两个不同的概念.样本是从总体中抽取的个体组成的集合,是对象;样本量是样本中个体的数目,是一个数.
相比全面调查,抽样调查的优点使其应用越来越广泛,成为最常见的
调查模式。例如买瓜子时抓几颗尝一尝,以判断瓜子的质量,炖肉时
挑一块尝尝,以判断咸淡或生熟程度。
2.简单随机抽样
(1)放回简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n放回
都相等
(2)不放回简单随机抽样
如果抽取是________的,且每次抽取时总体内未进入样本的各个个体被抽到的概率________,我们把这样的抽样方法叫做不放回简单随机抽样.
不放回
都相等
与放回简单随机抽样比较,不放回简单随机抽样的效率更高,
因此,实践中人们更多采用不放回简单随机抽样,除非特殊声明,
本章所称的简单随机抽样,指不放回简单随机抽样.
简单随机抽样的特点
有限性:总体中个体数有限;
逐一性:从总体中逐一抽取,这样便于在抽样试验中进行操作;
等可能性:简单随机抽样是一种等可能抽样,在整个抽样过程中每个个体被抽取到的可能性相等,从而保证了这种抽样方式的公平性.
用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中个体甲在第二次被抽到的可能性为多少?
方法一:在简单随机抽样中,每个个体在每次抽取时被抽到的
可能性均为
,与第几次无关,所以答案是
.
1
10
1
10
方法二:由题意得,甲在第一次不能被抽到,故甲在第二次
被抽到的可能性为
×
=
9
10
1
9
1
10
3.两种常用的简单随机抽样方法
抽签法
一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个不透明的容器中,搅拌均匀后,从中不放回地逐个抽取号签,连续抽取n次,就得到一个容量为n的样本.
抽签法的步骤
编号:给总体中所有的个体编号
制签:将1~N这N个号码写在相同的号签上
搅拌:将号签放在一个不透明的容器中,搅拌均匀
抽签:每次从容器中不放回地抽取一个号签,并记录其
编号,连续抽取n次
取样:从总体中,将与抽到的号签编号一致的个体取出
抽签法的优缺点是什么?
优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.
缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大.
因此,抽签法一般适用于总体中个体数不多的情形。
高一某班有50名同学,现从中抽出8名同学去参加一个座谈会,每位同学的机会均等.请你设计一个抽样方法,并说明其合理性.
解:可以采用抽签法进行选取。
首先,我们可以把50名同学的学号写在小纸条上,揉成小球;
然后,放到一个不透明的袋子中,充分搅拌;
最后从中逐个抽出8个号签,从而抽出8名参加座谈会的学生.
因为这样的抽取方法使得大家的机会是均等的,因此抽取结果也非常合理。
随机数法
随机数法,即利用随机试验,信息技术(计算器、电子表格软件、
R统计软件、手机软件等)生成随机数进行抽样.
随机数的产生
(1)用随机试验生成随机数
2
1
9
0
5
7
8
准备10个大小质地一样的小球,小球上分别
写上数字0,1,2,…9,放在不透明的盒子中,
当编号是两位的时候,有放回抽取2次,抽前充分搅拌,第一次号作为十位数,第二次号作为个位数,这样就得到随机的两位数,在编号内说明被抽中,否则放弃,
(2)用信息技术生成随机数:
①用
生成随机数;
②用
生成随机数;
③用
生成随机数。
计算器
电子表格软件
R软件
随机数法需注意哪些方面?
1、不重复抽样
2、编号要求数位相同
3、第一个数字的抽取是随机的
4、读数的方向是任意的,且是事先规定好的
假设要抽查某种品牌的850颗种子的发芽率,抽取60颗进行实验.利用随机数法抽取种子时,先将850颗种子按001,002,…,850进行编号,如果从随机数表第8行第7列的数字7开始向右读,请你依次写出最先检测的4颗种子的编号为_________.(下面摘取了随机数表第7行至第9行)
第7行:84
42
17
53
31 57
24
55
06
88 77
04
74
47
67 21
76
33
50
25 83
92
12
06
76
第8行:63
01
63
78
59 16
95
55
67
19 98
10
50
71
75 12
86
75
58
07 44
39
52
38
79
第9行:33
21
12
34
29 78
64
56
07
82 52
42
07
44
38 15
51
00
13
42 99
66
02
79
54
随机数法的优缺点是什么?
优点:随机数表数字较多,因此当总体容量较多时,抽取较为便利;
缺点:起始位置及抽取方向是人为确定的,不同的人选取出的样本会有差距。
对比抽签法与随机数法,如何选取合适的方法?
当总体容量较小时,选择抽签法;
当总体容量较大时,选择随机数法。
用简单随机抽样方法抽取样本,样本量是否越大越好?
在重复试验中,试验次数越多,频率越接近概率的可能性越大。与此相似,用简单随机抽样的方法抽取样本,样本量越大,结果越准确。一般来说,样本量大的要比样本量小的好,增加样本量可以较好地提高估计的效果。
但在实际情况中,样本量会导致人力、费用、时间等成本的增加。
因此,抽样调查中样本量的选择要根据实际问题的需要,并不一定是越大越好。
4.总体平均数与样本平均数
(1)总体平均数
①一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称?Y=_______________________=________为总体均值,又称总体平均数.
Y1+Y2+…+YN
N
②如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式?Y=________________.
(2)样本平均数
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称?Y=______________________=________为样本均值,又称样本平均数.在简单随机抽样中,我们常用样本平均数?Y去估计总体平均数?Y.
某公司的各层人员及工资数构成如下:
经理1人,周工资4
000元;高层管理人员3人,周工资均为1
000元;高级技工4人,周工资均为900元;工人6人,周工资均为700元;学徒1人,周工资为500元.计算该公司员工周工资的平均数.
1.某地有200人参加自学考试,为了了解他们的成绩,用简单随机抽样方法从中抽取一个样本,若每个考生被抽到的概率都是0.4,则这个样本的容量是________.
2.为抽查汽车排放尾气的合格率,某环保局在一路口随机抽查,这种抽查是
( )
A.简单随机抽样
B.抽签法
C.随机数法
D.以上都不对
3.高三某班有34位同学,座位号记为01,02,…,34,用随机数法选取5组数作为参加青年志愿者活动的五位同学的座号.选取方法是从随机数表第一行的第6列和第7列数字开始,由左向右依次选取两个数字,则选出来的第4个志愿者的座号为
( )
49 54 43 54 82 17 37 93 23 78 87 35 20
96 43 84 26 34 91 64 57 24 55 06 88 77
04 74 47 67 21 76 33 50 25 83 92 12 06
A.23 B.09 C.16 D.02
4.某总体数量为M,其中带有标记的有N个,现用简单随机抽样的方法从中抽取一个容量为m的样本,则抽取的m个个体中带有标记的个数估计为(
)