9.1.1简单随机抽样(36张PPT)

文档属性

名称 9.1.1简单随机抽样(36张PPT)
格式 ppt
文件大小 3.5MB
资源类型 试卷
版本资源 人教A版(2019)
科目 数学
更新时间 2021-05-07 08:39:26

图片预览

文档简介

09人教A版 必修二
7.1复数的概念
9. 1 随机抽样
9.1.1简单随机抽样
在现实生活中,我们经常会接触到各种统计数据,例如,人口总量、经济增长率、就业状况、物价指数、产品的合格率、商品的销售额、农作物的产量、人均水资源、居民人均年收入、电视台节目的收视率、学生的平均身高等.要正确阅读并理解这些数据,需要具备一些统计学的知识.
统计学是通过收集数据和分析数据来认识未知现象的一门科学.面对一个统计问题,首先要根据实际需求,通过适当的方法获取数据,并选择适当的统计图表对数据进行整理和描述,在此基础上用各种统计方法对数据进行分析,从样本数据中提取需要的信息,推断总体的情况,进而解决相应的实际问题.
那么,对于具体的统计问题,应如何收集数据?如何从所收集的数据中提取信息来认识未知现象?这种认识一定正确吗?应如何正确解释统计的结果?本章我们将在初中学过的统计与概率知识的基础上,通过进一步学习,加深对这些问题的认识,并通过解决问题的实践,进一步学习数据分析的方法.
统计的研究对象是数据,核心是通过数据分析研究和解决问题.因此,首先要设法获取与问题有关的数据,从而为解决问题奠定基础.
例如,准确掌握全国的人口数据,可以为科学制定国民经济和社会发展规划及其他方针政策提供依据.2010年我国进行了第六次人口普查,对全国人口普遍地、逐户逐人地进行一次性调查登记.调查内容包括每位居民的姓名、性别、年龄、民族、受教育程度等.这里,居民为调查对象,而居民的性别、年龄、民族、受教育程度等是要调查的指标.由于不同调查对象的指标值往往不同,它是一个变化的量,所以常把指标称为变量.像人口普查这样,对每一个调查对象都进行调查的方法,称为全面调查(overall survey),又称普查.在一个调查中,我们把调查对象的全体称为总体(population),组成总体的每一个调查对象称为个体(indi-idual).为了强调调查目的,也可以把调查对象的某些指标的全体作为总体,每一个调查对象的相应指标作为个体.
由于人口普查需要花费巨大的财力、物力,因而不宜经常进行.为了及时掌握全国人口变动状况,我国每年还会进行一次人口变动情况的调查.这种调查是抽取一部分居民进行调查,根据抽取的居民情况来推断总体的人口变动情况.像这样,根据-一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查(sampling survey).我们把从总体中抽取的那部分个体称为样本(sample),样本中包含的个体数称为样本量.调查样本获得的变量值称为样本的观测数据,简称样本数据.
随着社会的发展,抽样调查的应用范围越来越广泛.下面我们研究两种基本的抽样方法—简单随机抽样和分层随机抽样.
抽样调查的目的是为了了解总体的情况.例如,抽样调查一批待售袋装牛奶的细菌数是否超标,其目的是要了解整批牛奶的细菌含量超标情况,而不只是局限在抽查到的那几袋牛奶的情况.因此,通过抽样调查了解总体的情况,自然希望抽取的样本数据能很好地反映总体的情况,即样本含有和总体基本相同的信息.
探究
假设口袋中有红色和白色共1000个小球,除颜色外,小球的大小、质地完全相同.你能通过抽样调查的方法估计袋中红球所占的比例吗?
这里袋中所有小球是调查的总体,每一个小球是个体,小球的颜色是所关心的变量.我们可以从袋中随机地摸出一个球,记录颜色后放回,摇匀后再摸出一个球,如此重复n次.根据初中的概率知识可知,随着摸球次数的增加,摸到红球的频率会逐渐稳定于摸到红球的概率,即口袋中红球所占的比例.因此,我们可以通过放回摸球,用频率估计出红球的比例.
在有放回地摸球中,同一个小球有可能被摸中多次,极端情况是每次摸到同一个小球,而被重复摸中的小球只能提供同一个小球的颜色信息,如果我们采用不放回摸球,即从袋中摸出一个球后不再放回袋中,每次摸球都在余下的球中随机摸取,这样就可以避免同一个小球被重复摸中.特别地,当样本量n=1000时,不放回摸球已经把袋中的所有球取出,这就完全了解了袋中红球的比例,而有放回摸球一般还不能对袋中红球的比例作出准确的判断.
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取个n (1≤n从总体中,逐个不放回地随机抽取n个个体作为样本,一次性批量随机抽取n个个体作为样本,两种方法是等价的.
与放回简单随机抽样比较,不放回简单随机抽样的效率更高,因此实践中人们更多采用不放回简单随机抽样.除非特殊声明,本章所称的简单随机抽样指不放回简单随机抽样.
问题1 一家家具厂要为树人中学高一年级制作课桌椅,他们事先想了解全体高一年级学生的平均身高,以便设定可调节课桌椅的标准高度.已知树人中学高一年级有名学生,如果要通过简单随机抽样的方法调查高一年级学生的平均身高,应该怎么抽取样本?
在这个问题中,树人中学全部高一年级的学生构成调查的总体,每一位学生是个体,学生的身高是调查的变量.与“探究”栏目中估计红球的比例类似,我们可以对高一年级进行简单随机抽样,用抽出的样本的平均身高估计高一年级学生的平均身高.实现简单随机抽样的方法有很多,抽签法和随机数法是比较常用的两种方法.
1.抽签法
先给712名学生编号,例如按1~712进行编号.然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的学生进入样本,直到抽足样本所需要的人数.
抽签法简单易行,但当总体较大时,操作起来比较麻烦.因此,抽签法一般适用于总体中个体数不多的情形.
为什么要给学生编号?编号用学号可以吗?
2.随机数法
先给712名学生编号,例如按1~712进行编号.用随机数工具产生1~712范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的学生进入样本.重复上述过程,直到抽足样本所需要的人数.
如果生成的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的人数.
(1)用随机试验生成随机数
准备10个大小、质地一样的小球,小球上分别写上数字0,1,2,…,9,把它们放入一个不透明的袋中.从袋中有放回摸取3次,每次摸取前充分搅拌,并把第一、二、三次摸到的数字分别作为百、十、个位数,这样就生成了一个三位随机数.如果这个三位数在1~712范围内,就代表对应编号的学生被抽中,否则舍弃编号.这样产生的随机数可能会有重复.
(2)用信息技术生成随机数
①用计算器生成随机数
进入计算器的计算模式(不同的计算器型号可能会有不同),调出生成随机数的函数并设置参数,例如RandInt#(1,712),按“一”键即可生成1~712范围内的整数随机数.重复按“=”键,可以生成多个随机数.这样产生的随机数可能会有重复.
②用电子表格软件生成随机数
在电子表格软件的任一单元格中,输入“ = RANDBETWEEN(1, 712)”,即可生成一个1~712范围内的整数随机数.再利用电子表格软件的自动填充功能,可以快速生成大量的随机数(图9.1-1).这样产生的随机数可能会有重复.
图9.1-1
③用R统计软件生成随机数
在R软件的控制台中,输入“ sample (1: 712, 50, replace=F)”,按回车键,就可以得到个范围内的不重复的整数随机数(图9.1-2).
R软件是免费的统计软件,该软件具有比较强大的数据处理、绘图和分析等统计功能,在统计学研究和学习中被广泛使用
随着信息技术的发展,人们越来越多地利用计算器、数学软件、统计软件等工具来生成随机数.尤其是一些统计软件,可以非常方便地按要求生成各种随机数.用信息技术工具产生随机数最大的优点是方便、快捷.
思考
用简单随机抽样方法抽取样本,样本量是否越大越好?
我们知道,在重复试验中,试验次数越多,频率接近概率的可能性越大.与此类似,用简单随机抽样的方法抽取学生,样本量越大,样本中不同身高的比例接近总体中相应身高的比例的可能性也越大,样本的平均身高接近总体的平均身高的可能性也越大.即对于样本的代表性,一般说来,样本量大的会好于样本量小的.尤其是样本量不大时,增加样本量可以较好地提高估计的效果.但是,在实际抽样中,样本量的增大会导致调查的人力、费用、时间等成本的增加.因此,抽样调查中样本量的选择要根据实际问题的需要,并不一定是越大越好.
在简单随机抽样调查中,当样本量和总体一样大时,就是全面调查了.
练习(第177页)
1.在以下调查中,总体、个体各是什么?哪些适合用全面调查?哪些适合用抽样调查?
(1)调查一个班级学生每周的体育锻炼时间;
(2)调查一个地区结核病的发病率;
(3)调查一批炮弹的杀伤半径;
(4)调查一个水库所有鱼中草鱼所占的比例.
请你再举一些不宜用全面调查的例子,并说明理由.
解:(1)总体:这个班级中所有学生每周的体育锻炼时间.个体:调查这个班级的每一个学生每周的体育锻炼时间适合用全面调查.
(2)总体:这个地区调查对象的某些指标的全体.个体:每一个调查对象的相应指标适合用抽样调查.
(3)总体:该批炮弹的杀伤半径.个体:每一枚炮弹的杀伤半径.适合用抽样调查.
练习(第177页)
1.在以下调查中,总体、个体各是什么?哪些适合用全面调查?哪些适合用抽样调查?
(1)调查一个班级学生每周的体育锻炼时间;
(2)调查一个地区结核病的发病率;
(3)调查一批炮弹的杀伤半径;
(4)调查一个水库所有鱼中草鱼所占的比例.
请你再举一些不宜用全面调查的例子,并说明理由.
(4)总体:该水库中鱼的全体.个体:水库中的每一条鱼.适合用抽样调查.
不适合用全面调查的例子:
(1)火柴的质量问题,原因是全面调查具有破坏性;
(2)全国高三毕业生的视力,原因是费时、费力.
2.如图,由均匀材质制成的一个正20面体(每个面都是正三角形),将20个面平分成10组,第1组标上0,第2组标上1,…,第10组标上9.
(1)投掷正20面体,若把朝上一面的数字作为投掷结果,则出现0,1,2,3,……,9是等可能的吗?
(2)三个正20面体分别涂上红、黄、蓝三种颜色,分别代表百位、十位、个位,同时投掷可以产生一个三位数(百位为0的也看作三位数),它是000~999范围内的随机数吗?
(2) 是000~999范围内的随机数.
3.实验室的笼子里共有100只小白鼠,现要从中抽取10只作试验用.下列两种情况是否属于简单随机抽样?请说明理由.
(1)每次不经任何挑选地抓一只,抓满10只为止;
(2)将笼中的100只小白鼠按1~100编号,任意选出编号范围内的10个不重复数字,把相应编号的小白鼠作为试验用的小白鼠.
解:(1)属于简单随机抽样.(2)属于简单随机抽样
理由:(1)(2)都满足简单随机抽样的四个特征:
①有限性;②逐个抽取;③不放回;④等可能性.
……
1
2
3
……
100
……
1
2
3
……
100
5.在抽样调查中,请你说说通过“随机”选择样本的优、缺点.
解:“随机”选择样本的优点是花费少,效率高,缺点是有时随机抽样得到的个体代表性不强
下面是用随机数法从树人中学高一年级学生中抽取的一个容量为50的简单随机样本,他们的身高变量值(单位:cm)如下:
156.0
166.0
157.0
155.0
162.0
168.0
173.0
155.0
157.0
160.0
175.0
177.0
158.0
155.0
161.0
158.0
161.5
166.0
174.0
170.0
162.0
155.0
156.0
158.0
183.0
164.0
173.0
155.5
176.0
171.0
164.5
160.0
149.0
172.0
165.0
176.0
176.0
168.5
171.0
169.0
156.0
171.0
151.0
158.0
156.0
165.0
158.0
175.0
165.0
171.0
由这些样本观测数据,我们可以计算出样本的平均数为164.3.据此,可以估计树人中学高一年级学生的平均身高为164.3cm左右.
上面我们通过简单随机抽样得到部分学生的平均身高,并把样本平均身高作为树人中学高一年级所有学生平均身高的估计值.
∑为求和符号,读音为/s?gm?/,主要用于多项式求和,
很多科学型计算器都具有求平均数的功能.只要输入数据,按相应的键,就可以快速求出平均数.
探究
小明想考察一下简单随机抽样的估计效果.他从树人中学医务室得到了高一年级学生身高的所有数据,计算出整个年级学生的平均身高为165.0cm,然后,小明用简单随机抽样的方法,从这些数据中抽取了样本量为50和100的样本各10个,分别计算出样本平均数,如表9.1-1所示.从小明多次抽样所得的结果中,你有什么发现?
抽样序号
1
2
3
4
5
6
7
8
9
10
样本量为50的平均数
165.2
162.8
164.4
164.4
165.6
164.8
165.3
164.7
165.7
165.0
样本量为100的平均数
164.4
165.0
164.7
164.9
164.6
164.9
165.1
165.2
165.1
165.2
为了更方便地观察数据,以便我们分析样本平均数的特点以及与总体平均数的关系,我们把这20次试验的平均数用图形表示出来,如图9.1-3所示.图中的红线表示树人中学高一年级全体学生身高的平均数.
从试验结果看,不管样本量为50,还是为100,不同样本的平均数往往是不同的.由于样本的选取是随机的,因此样本平均数也具有随机性,这与总体平均数是一个确定的数不同,虽然在所有20个样本平均数中,与总体平均数完全一致的很少,但除了样本量为50的第2个样本外,样本平均数偏离总体平均数都不超过1cm,即大部分样本平均数离总体平均数不远,在总体平均数附近波动.比较样本量为50和样本量为100的样本平均数,还可以发现样本量为100的波动幅度明显小于样本量为50的,这与我们对增加样本量可以提高估计效果的认识是一致的.
总体平均数是总体的一项重要特征.另外,某类个体在总体中所占的比例也是人们关心的一项总体特征,例如全部产品中合格品所占的比例、赞成某项政策的人在整个人群中所占的比例等.
问题2 眼睛是心灵的窗口,保护好视力非常重要.树人中学在“全国爱眼日”前,想通过简单随机抽样的方法,了解一下全校2174名学生中视力不低于5.0的学生所占的比例,你觉得该怎么做?
现在,我们从树人中学所有学生中抽取一个容量为50的简单随机样本,其视力变量取值如下:
1
1
0
1
0
0
1
0
1
1
1
0
0
0
1
1
0
1
0
0
0
1
1
1
0
1
1
0
1
1
1
1
0
1
1
0
1
0
1
0
0
0
1
0
0
1
1
1
0
0
据此,我们估计在树人中学全体学生中,“视力不低于5.0”的比例约为0.54.
简单随机抽样方法简单、直观,用样本平均数估计总体平均数也比较方便.简单随机抽样是一种基本抽样方法,是其他抽样方法的基础.但在实际应用中,简单随机抽样有一定的局限性.例如,当总体很大时,简单随机抽样给所有个体编号等准备工作非常费事,甚至难以做到;抽中的个体往往很分散,要找到样本中的个体并实施调查会遇到很多困难;简单随机抽样没有利用其他辅助信息,估计效率不是很高;等等.因此,在规模较大的调查中,直接采用简单随机抽样的并不多,一般是把简单随机抽样和其他抽样方法组合使用.
练习(第180页)
1.为了合理调配电力资源,某市欲了解全市50000户居民的日用电量.若通过简单随机抽样从中抽取了300户进行调查,得到其日用电量的平均数为5.5kW·h,则可以推测全市居民用户日用电量的平均数( )
A .一定为5.5kW·h B .高于5.5kW·h
C .低于5.5kW·h D .约为5.5kW·h
D
2.在学生身高的调查中,小明和小华分别独立进行了简单随机抽样调查.小明调查的样本平均数为166.4,样本量为100;小华调查的样本平均数为164.7,样本量为200.你更愿意把哪个值作为总体平均数的估计?是不是你选的值一定比另一个更接近总体平均数?说说你的理由.
解:更愿意把164.7作为总体平均数的估计,
不一定,因为增加样本量可以提高估计效果,但所选的值不一定比另一个更接近总体平均数,因为样本的平均数具有随机性.
3.找一组数据作为总体,自行设定样本量,进行多次简单随机抽样.观察样本量对估计总体平均数的影响,并试着解释其中的原因.