(共25张PPT)
1.1 直接获取与间接获取数据
1.2 普查和抽查 1.3 总体和样本
激趣诱思
知识点拨
“九五”期间关于抽查方法的研究与应用在我国开展得如火如荼.例如,交通部建立了统计抽查系统,交通运输的大量统计数据已基本由抽查方法获得.并且许多行业对本部门关心的问题进行抽查,不少部门就公众关注的热点问题开展公众调查,有的报刊还定期刊登公众调查的调查报告.我国90年代初成立了不少市场调查公司,经过几年的大浪淘沙,现在全国生存下来的公司经营状况不错.网上调查、电话调查在我国也健康发展.有关抽样调查的理论,如非抽样误差控制的研究也得到统计界的广泛重视.抽样调查在生产、生活中的作用非常大,这一节课我们就先学习一下这些知识.
激趣诱思
知识点拨
一、直接获取与间接获取数据
1.直接获取:是指通过社会调查或观察、试验等途径获取数据.直接获取的数据称为直接数据或一手数据.
2.间接获取:是指借助各种媒介,包括报纸杂志、统计报表和年鉴、广播、电视或互联网等获取数据.间接获取的数据称为间接数据或二手数据.
名师点析1.在直接获取数据时,应注意数据来源的广泛性、代表性、均衡性.
2.如果需要获取的数据较多,可考虑间接获取数据,恰当地运用间接数据往往能够节约大量的时间和费用.
激趣诱思
知识点拨
微思考
使用间接数据时应注意什么问题?
提示:(1)对下载的数据进行多方的核实,确保数据的真实性、准确性.(2)引用间接数据要注明数据来源,尊重他人的劳动成果,保护他人的知识产权.
激趣诱思
知识点拨
二、普查和抽查
1.普查:是为了掌握调查对象的整体情况,对全体调查对象进行研究的一种调查方式.
2.抽查:是从全体调查对象中,按照一定的方法抽取一部分对象作为代表进行调查分析,并以此推断全体调查对象的状况,这种抽取一部分对象的调查方式叫作抽样调查,简称抽查.
名师点析1.普查的目的是为了详细地了解某些与国计民生有关的基本数据.
2.普查的种类:目前,我国所进行的普查主要有:人口普查、农业普查、工业普查、第三产业普查、基本单位普查等.
3.抽查的主要优点:迅速、及时、节约人力、物力和财力.
4.抽查是由部分推及全体,其结果具有不确定性.
激趣诱思
知识点拨
微思考1
普查的优点和缺点分别是什么?
?
?
微思考2
普查与抽查的适用范围各是什么?
提示:普查的优点在于所取得的资料全面、系统;缺点是会耗费大量的人力、物力和财力.
提示:普查适用于总体容量不大,或者要获取翔实、系统和全面信息的统计调查;抽查适用于大批量或破坏性的检验及不必要的普查等的统计调查.
激趣诱思
知识点拨
三、总体和样本
1.总体:调查对象的全体称为总体.
2.样本与抽样:从总体中抽取的部分称为样本,其过程称为抽样.
3.样本容量:样本中个体的数目称为样本容量,简称样本量.
4.总体的分布:总体中各类数据的百分比.
名师点析在抽样调查时,要尽可能地使得样本分布与总体分布相同.
激趣诱思
知识点拨
微练习
为了了解一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是( )
A.总体
B.个体
C.总体的一个样本
D.样本容量
答案:C
解析:研究对象是这批零件的长度,总体是这一批零件的长度,个体是每个零件的长度,样本是抽取的200个零件的长度,样本容量是200.
探究一
探究二
探究三
素养形成
当堂检测
普查与抽查的选用
例1(1)在某传染病严重流行期间,学校、车站、机场等公共场所设有体温监测仪,检查这些公共场所的所有人员的体温,这是对这些公共场所人员的普查还是抽查?为什么要采取这种调查方式?
(2)有关部门对某品牌某一批号的婴幼儿奶粉进行质量检查,应采用哪种调查方法?并说明其合理性.
解:(1)普查.这种调查方式虽然耗费大量的人力、物力、财力,但对于防止传染病的蔓延非常有效,可以准确查出并隔离疑似传染病人.
(2)应采用抽查的方法.因为这是破坏性的检查,不可能进行普查,而且是从同一批产品中随机抽取,所以对抽取的部分产品进行检查所得到的结果基本能代表全体产品的情况.
探究一
探究二
探究三
素养形成
当堂检测
反思感悟
普查与抽查的选取原则
对生活中实际问题的调查,往往需要选用合适的调查方式,这要根据调查对象的特点、普查的特点、抽查的特点来确定.一般若需要调查所有对象,则选用普查的方式;若调查具有破坏性或无法实现,则选用抽查的方法.
探究一
探究二
探究三
素养形成
当堂检测
变式训练1指出下列问题适合用普查还是抽查.
(1)某学校为了掌握全体教师的身体健康状况,请一家医院对全体教师进行体检;
(2)某渔民想知道他的鱼塘所养的鱼的成长状况;
(3)银行在收进储户现金时检验有没有假钞;
(4)英语老师在课堂上用10分钟的时间了解班里同学记单词和短语的情况.
解:(1)普查.
(2)抽查.
(3)普查.
(4)抽查.
探究一
探究二
探究三
素养形成
当堂检测
抽查的有关概念
例2(1)抽查在抽取调查对象时( )
A.按一定的方法抽取
B.随便抽取
C.全部抽取
D.根据个人的喜好抽取
(2)为了了解参加运动会的2
000名运动员的年龄情况,从中抽取20名运动员.在这个问题中,总体是 ,样本是 .?
答案:
(1)
A
(2)2
000名运动员的年龄 20名运动员的年龄
解析:
(1)抽查必须是从调查对象中按照一定的方法抽取一部分.
(2)总体指的是调查对象的全体,所以在本题中总体是指2
000名运动员的年龄.样本是指总体中被抽出的一部分,所以本题的样本是20名运动员的年龄.
探究一
探究二
探究三
素养形成
当堂检测
反思感悟对抽查有关概念的理解与判断
(1)总体与样本:分别指调查对象的全体和被抽取的一部分.这里的调查对象不是指对象本身,而是指对象的某项指标.
(2)样本容量:指样本中个体的数目.
(3)注意区分清楚样本与样本容量的概念,样本是指研究的对象的一部分;而样本容量是一个数字.
探究一
探究二
探究三
素养形成
当堂检测
延伸探究把本例(2)中条件“运动员的年龄情况”变为“运动员的身高情况”,其他不变,结果如何?
解:总体是2
000名运动员的身高,样本是20名运动员的身高.
探究一
探究二
探究三
素养形成
当堂检测
抽查中的公平性与代表性
例3为了缓解城市的交通拥堵情况,某城市准备出台限制私家车的政策,为此要进行民意调查,某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果会怎样?
解:由于要出台限制私家车的政策,抽查的市民又是拥有私家车的市民,因此调查结果倾向于反对出台限制私家车的政策.
如果要调查出市民对政策的真实意见,需要对市民的各个群体进行抽查,还需要对一些社会团体(比如公交公司、消防、医院等)的运营状况进行调查,这样才能比较真实地反映出社会的实际情况,了解市民的心声.
探究一
探究二
探究三
素养形成
当堂检测
反思感悟
抽查应遵循的原则
(1)在抽样时必须做到抽样的随机性,即为了使抽取的样本能够很好地反映总体,必须排除人为主观因素的影响,使收集到的样本与总体分布的情况基本吻合.
(2)抽样的过程必须科学、合理,使所有个体被抽到的可能性相等,即按随机原则抽取样本,同时可以按照一定的可能性来保证将抽样误差控制在规定的范围内.
探究一
探究二
探究三
素养形成
当堂检测
变式训练2为调查某小区平均每户居民的月用水量,下面是2名同学设计的方案:
学生甲:我把这个小区用水量调查表放在互联网上,只要登录网站的人就可以看到这张表,他们填的表可以很快地反馈到我的电脑中,这样就可以很快估算出小区平均每户居民的月用水量;
学生乙:我给我们居民小区的每一个住户发一张用水量调查表,大概需要一周左右的时间就可以统计出小区平均每户居民的月用水量.
请你分析上述2名学生设计的调查方案,他们能够准确地获得平均每户居民的月用水量吗?为什么?
探究一
探究二
探究三
素养形成
当堂检测
解:学生甲的方案得到的样本不能够反映不上网的居民的用水情况,它是一种方便样本,所得到的样本代表性差,不能准确地获得平均每户居民的月用水量.学生乙的方案实际上是普查,花费的人力、物力更多一些,但是只要统计过程不出错,就可以准确地得到平均每户居民的月用水量.
探究一
探究二
探究三
素养形成
当堂检测
普查方案的设计
典例
高一新生入学后,某班主任想全面了解班内48名同学的家庭状况,以便于班级的管理工作,请你帮助班主任设计一个调查方案.
解:由于该班有48名同学,人数不是太多,而且为了班级工作的需要,班主任应全面地了解班内每名同学的家庭状况,因此应采取普查的方式进行调查.可采用表格的形式,表格中包括家庭居住地、家庭成员、父母工作状况、父母联系方式、户籍所在地等,将表格发放给每一名学生,学生填写后,全部收回,然后班主任进行统计,这样就可以了解每一名学生的家庭状况了.(答案不唯一,合理即可)
探究一
探究二
探究三
素养形成
当堂检测
方法点睛1.若想要调查在特定阶段、特定情形下总体的相关情况,且总体数量不是很大的时候,一般采用普查的方法.
2.对总体进行普查时,可通过设计表格、调查问卷等形式,获得总体中每个对象的相关信息,然后进行整体分析,了解情况.
探究一
探究二
探究三
素养形成
当堂检测
1.下列调查必须采用普查的是( )
A.调查某品牌电视机的市场占有率
B.调查某电视连续剧在全国的收视率
C.调查高一(1)班的同学的视力
D.调查某型号炮弹的射击误差
答案:C
答案:B
2.对于下列调查:①对某厂家生产的某批次保温杯的保温效果进行调查;②全国人口普查;③高考体检;④对某市中学生的身高进行调查,其中适宜用抽查的是( )
A.①②
B.①④
C.②③
D.③④
探究一
探究二
探究三
素养形成
当堂检测
3.一名交警在高速路上随机观测了6辆车的行驶速度,然后作出了一份报告,调查结果如下表:
(1)交警采取的调查方式是 .?
(2)这次调查的样本是 ,个体是 .?
答案:
(1)抽查 (2)6辆车的行驶速度 每一辆车的行驶速度
探究一
探究二
探究三
素养形成
当堂检测
4.下列调查属于抽查的是 .(填序号)?
①为了了解高一(4)班每个学生的体重情况,对全班同学进行调查;
②为了了解人们对2019年春节联欢晚会的收视情况,对部分电视观众进行调查;
③某乳业公司对其当天生产的液态奶制品进行质量检验;
④医生检验某地居民的血液中血糖指标.
答案:②③④
探究一
探究二
探究三
素养形成
当堂检测
5.某校有高中学生900人,校医务室想对全体高中学生的身高情况做一次调查,为了不影响正常教学活动,准备抽取50名学生作为调查对象.校医务室从高一年级中抽取50名学生的身高来估计全校高中学生的身高,你认为这样的调查结果是否可信?
解:不可信.因为学生的身高会随着年龄的增长而增高,校医务室想了解全校高中学生的身高情况,在抽样时应当关注高中各年级学生的身高,并且还要分性别进行抽查.如果只抽取高一年级的学生,结果一定是片面的,所以调查结果不可信.(共33张PPT)
§2 抽样的基本方法
2.1 简单随机抽样
激趣诱思
知识点拨
为了判断西瓜是否成熟,可在西瓜上挖下一小块先尝尝.一小块西瓜能表明整个西瓜的味道怎样,与此类似,为了了解政府部门、工厂、学校、商品等整体的某个特征,通常都是从总体中抽取样本,再通过样本对总体进行统计、预测结果、估计产品质量.
激趣诱思
知识点拨
一、简单随机抽样
1.定义
一般地,从N(N为正整数)个不同个体构成的总体中,逐个不放回地抽取n(1≤n2.简单随机抽样的具体实施方法
在总体的N个个体中机会均等地抽取第一个,然后在剩下的(N-1)个个体中机会均等地抽取第二个……最后在剩余的[N-(n-1)]个个体中机会均等地抽取第n个.
用这种抽样方法,每一个个体被抽到的可能性是相等的.
激趣诱思
知识点拨
微思考
简单随机抽样有哪些特点?
提示:简单随机抽样有四个特点:总体有限,逐个抽取,无放回地抽取,等可能抽取.
激趣诱思
知识点拨
二、抽签法
1.定义
先把总体中的N(N为正整数)个个体编号,并把编号依次分别写在形状、大小相同的签上(签可以是纸条、卡片或小球等),再将这些号签放在同一个不透明的箱子里搅拌均匀.每次随机地从中抽取一个,然后将箱中余下的号签搅拌均匀,再进行下一次抽取.如此下去,直到抽到预先设定的样本容量.
2.抽签法的基本步骤
(1)给总体中的每个个体编号;(2)抽签.
激趣诱思
知识点拨
微思考
抽签法有什么优点和缺点?
提示:优点:简单易行.当总体的个数不多时,使总体处于“搅拌均匀”的状态比较容易,这时,每个个体都有均等的机会被抽中,从而能够保证样本的代表性.
缺点:仅适用于个体数较少的总体.当总体容量非常大时,费时费力又不方便,况且,如果号签搅拌不均匀,可能导致抽样不公平.
激趣诱思
知识点拨
三、随机数法
1.定义
先把总体中的N个个体依次编码为0,1,2,…,N-1,然后利用工具(转盘或摸球、随机数表、科学计算器或计算机)产生0,1,2,…,N-1中的随机数.产生的随机数是几,就选第几号个体,直至选到预先设定的样本容量.
2.利用随机数表进行抽样的具体步骤
(1)给总体中的每个个体编号;
(2)在随机数表中随机抽取某行某列作为抽样的起点,并规定读取方法;
(3)依次从随机数表中抽取样本号码,凡是抽到编号范围内的号码,就是样本的号码,并剔除相同的号码,直到抽满为止.
激趣诱思
知识点拨
名师点析抽签法与随机数法的异同
共同点:(1)抽签法和随机数法都是简单随机抽样的方法,并且要求被抽取样本的总体的个数有限;(2)抽签法和随机数法都是从总体中逐个地进行抽取,都是不放回抽样.
不同点:(1)抽签法相对于随机数法简单,随机数法较抽签法稍麻烦一点;(2)随机数法更适用于总体中的个数较多的时候,而抽签法适用于总体中的个数相对较少的情况,所以当总体中的个体数较多时,应当选用随机数法,这样可以节约大量的人力和制作号签的成本与精力.
激趣诱思
知识点拨
微思考
随机数法有什么优点和缺点?
提示:优点:简单易行.很好地解决了用抽签法当总体中的个数较多时制签难的问题.
缺点:当总体中的个体数很多,需要的样本容量也很大时,用随机数法抽取样本仍不方便.
激趣诱思
知识点拨
微练习
总体由编号为001,002,003,…,299,300的300个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第3,4,5列数字开始由左到右依次选取三个数字,则选出来的第5个个体的编号为( )
7816657208026314070243699728
0198320492344935820036234869
69387481
A.080 B.263 C.140 D.280
答案:D
探究一
探究二
探究三
素养形成
当堂检测
简单随机抽样的判断
例1判断下列抽样是不是简单随机抽样?为什么?
①从无数个个体中抽取20个个体作为样本;
②从某种型号的30部手机中一次性取出5部手机进行质量检测;
③箱子里共有100个零件,从中选取10个零件进行检验,在抽样操作时,从中任意地拿出一个零件进行质量检测后再把它放回箱子里;
④一彩民选号,从装有36个大小、形状、质地都相同的号签的盒子中无放回地逐个抽出6个号签;
⑤某班有54名同学,指定数学成绩较好的6名同学参加数学竞赛.
探究一
探究二
探究三
素养形成
当堂检测
解:①不是简单随机抽样.因为简单随机抽样要求被抽取样本的总体的个体数是有限的.②不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.③不是简单随机抽样.因为简单随机抽样要求是不放回抽样.④是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.⑤不是简单随机抽样.因为指定了数学成绩较好的6名同学参加竞赛,不存在随机性,不是等可能抽样.
探究一
探究二
探究三
素养形成
当堂检测
反思感悟
简单随机抽样的判断方法
判断一个抽样是不是简单随机抽样的关键点,一是看总体的个数是否有限,二是看抽取过程是不是逐个、不放回、等可能抽样.
探究一
探究二
探究三
素养形成
当堂检测
变式训练1下面抽样方法是简单随机抽样的是( )
A.从平面直角坐标系中抽取5个点作为样本
B.某公司从仓库中的1
000箱可乐中一次性抽取20箱进行质量检查
C.某连队从200名战士中,挑选出50名最优秀的战士去参加抢险救灾活动
D.从10部手机中逐个不放回地随机抽取2部进行质量检验(假设10部手机已编好号,对编号随机抽取)
答案:D
解析:A中平面直角坐标系中有无数个点,这与要求总体中的个体数有限不相符,故错误;B中一次性抽取不符合简单随机抽样逐个抽取的特点,故错误;C中挑选50名最优秀的战士,不符合简单随机抽样的等可能性,故错误.
探究一
探究二
探究三
素养形成
当堂检测
抽签法的应用
例2学校要组织学生参加植树活动,要求每班选派男生10名,女生6名,现高一(1)班有男生32名,女生28名准备被随机选派.试用抽签法确定该班参加植树的同学.
分析按照抽签法的步骤进行:编号→制签→搅拌均匀→抽签→确定样本.
探究一
探究二
探究三
素养形成
当堂检测
解:按照以下步骤进行抽样:
第一步 将32名男生从0到31编号;
第二步 用大小、形状、质地都相同的纸条做成32个号签,在每个号签上写上这些编号;
第三步 将写好的号签放在一个箱子中摇匀,不放回地逐个从中抽取10个号签;
第四步 抽取到的编号对应的男生参加植树活动.
重复上述的方法步骤,从28名女生中随机抽取6名女生参加植树活动.
探究一
探究二
探究三
素养形成
当堂检测
反思感悟
应用抽签法抽样的关注点
1.利用抽签法抽取样本时,对个体的编号问题可视情况灵活处理,若个体没有编号,应首先编号;若个体已有编号,如考号、学号、序号等,可不必重新编号.
2.号签一定要大小、形状、质地完全相同.
3.号签制好后一定要将其搅拌均匀,这样才能保证抽签的随机性、公平性.
探究一
探究二
探究三
素养形成
当堂检测
变式训练22022年第24届冬季奥林匹克运动会将在北京市和张家口市联合举行,这是中国历史上第一次举办冬季奥运会.组委会计划从某高校报名的20名志愿者中选取5人组成奥运志愿小组,请用抽签法设计抽样方案.
分析总体的容量为20,抽取的样本容量为5,容量都较小,所以可用抽签法抽取样本.
探究一
探究二
探究三
素养形成
当堂检测
解:(1)将20名志愿者编号,号码分别是1,2,…,20;
(2)将号码分别写在20张大小、形状都相同的纸条上,揉成团,制成号签;
(3)将所得号签放在一个不透明的袋子中,并搅拌均匀;
(4)从袋子中依次不放回地抽取5个号签,并记录下上面的编号;
(5)所得号码对应的志愿者就是志愿小组的成员.
探究一
探究二
探究三
素养形成
当堂检测
随机数法的应用
例3要考察某种品牌的850粒种子的发芽率,从中抽取50粒种子进行试验,利用随机数表法抽取种子,先将850粒种子按001,002,…,850进行编号,如果从随机数表第3行第6列的数开始向右读,请依次写出最先检验的4粒种子的编号 .(下面抽取了随机数表第1行至第5行)?
探究一
探究二
探究三
素养形成
当堂检测
03
47
43
73
86 36
96
47
36
61 46
98
63
71
62 33
26
16
80
45 60
11
14
10
95
97
74
24
67
62 42
81
14
57
20 42
53
32
37
32 27
07
36
07
51 24
51
79
89
73
16
76
62
27
66 56
50
26
71
07 32
90
79
78
53 13
55
38
58
59 88
97
54
14
10
12
56
85
99
26 96
96
68
27
31 05
03
72
93
15 57
12
10
14
21 88
26
49
81
76
55
59
56
35
64 38
54
82
46
22 31
62
43
09
90 06
18
44
32
53 23
83
01
30
30
分析已知N=850,n=50,用随机数法抽样时编号001,002,…,850,抽取前4个编号,对应的种子组成样本.
探究一
探究二
探究三
素养形成
当堂检测
答案:227,665,650,267
解析:从随机数表第3行第6列的数2开始向右读第一个小于850的数字是227,第二个数字是665,第三个数字是650,第四个数字是267,符合题意.
探究一
探究二
探究三
素养形成
当堂检测
反思感悟利用随机数法抽样的关注点
(1)编号要求位数相同;
(2)第一个数字的抽取是随机的;
(3)读数的方向是任意的,且要事先定好.读数时结合编号的位数读取.
探究一
探究二
探究三
素养形成
当堂检测
延伸探究现有120辆汽车,用随机数法抽取10辆汽车,甲、乙、丙、丁四位同学分别对这120台汽车编号如下:
甲:001,002,003,…,120
乙:01,02,03,…,120
丙:1,2,3,…,120
丁:000,001,002,…,119.
其中编号正确的是 .?
答案:甲、丁
解析:使用随机数法抽样对个体编号时,要求编号的位数相同,故甲、丁同学编号正确.
探究一
探究二
探究三
素养形成
当堂检测
抽样方法的综合应用
典例
一个学生在一次竞赛中要回答的8道题是这样产生的:从15道物理题中随机抽3道;从20道化学题中随机抽3道;从12道生物题中随机抽2道.使用合适的方法确定这个学生所要回答的三门学科的题的序号(物理题的编号为1~15,化学题的编号为16~35,生物题的编号为36~47).
探究一
探究二
探究三
素养形成
当堂检测
解:方法一(抽签法)
第一步:将试题的编号1~47分别写在一张纸条上,将纸条揉成团制成号签,并将物理,化学,生物题的号签分别放在一个不透明的袋子中,搅匀.
第二步:从装有物理题的袋子中逐个抽取3个号签,从装有化学题的袋子中逐个抽取3个号签,从装有生物题的袋子中逐个抽取2个号签,并记录所得号签上的编号,这便是所要回答的问题的序号.
探究一
探究二
探究三
素养形成
当堂检测
方法点睛本题在用抽签法解答时需将三类题的号签分开,分别抽取;用随机数法解答时则可以将三类题的序号同时抽取,只要把握每类的抽取个数即可.
方法二:(随机数法)
第一步:将物理题的序号对应改成01,02,…,15,其余两科题的序号不变.
第二步:在教材中6-2的随机数表中随机抽取某一行某一列.例如选出第3行第4列的数6,向右读.
第三步:从选定的数6开始向右读,每次读取两位,凡不在01~47中的数跳过去不读,前面读过的也跳过去不读.
第四步:对应第三步找出所要回答问题的序号.如物理题的序号为:14,12,01;化学题的序号为:32,24,31;生物题的序号为:41,42.
探究一
探究二
探究三
素养形成
当堂检测
1.某学校为了解高一800名新入学同学的数学学,从中随机抽取100名同学的中考数学成绩进行分析,在这个问题中,下列说法正确的是( )
A.800名同学是总体
B.100名同学是样本
C.每名同学是个体
D.样本容量是100
答案:D
解析:据题意,总体是指800名新入学同学的中考数学成绩,样本是指抽取的100名同学的中考数学成绩,个体是指每名同学的中考数学成绩,样本容量是100,故只有D正确.
探究一
探究二
探究三
素养形成
当堂检测
答案:D
2.下列抽样方法是简单随机抽样的是( )
A.妈妈从小贩的菜筐里挑了5根黄瓜
B.一人从寺庙的签桶里一次性求了3支签
C.从湖里捞出20尾鱼苗研究生长情况
D.某运动员从8条跑道中随机抽取一条跑道试跑
探究一
探究二
探究三
素养形成
当堂检测
3.假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验.利用随机数法抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第8行第7列的数开始向右读,请你依次写出最先检测的5袋牛奶的编号 .(下面摘取了随机数表第7行至第9行)?
答案:785,567,199,507,175
探究一
探究二
探究三
素养形成
当堂检测
4.要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,并写出抽样过程.
解:由于总体容量和样本容量都较小,因此可采用抽签法抽取样本.抽样过程如下:
第一步 将30辆汽车进行编号,号码是1,2,3,…,30;
第二步 将号码分别写在大小、形状、质地都相同的纸条上,揉成团,制成号签;
第三步 将全部号签放入一个不透明的袋子中,并搅拌均匀;
第四步 从袋子中依次抽取3个号签,并记录上面的编号;
第五步 所得号码对应的3辆汽车就是要抽取的对象.(共28张PPT)
2.2 分层随机抽样
激趣诱思
知识点拨
某电视台在互联网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12
000人,其中持各种态度的人数分别为:很喜欢4
800人,喜欢3
600人,一般1
800人,不喜欢1
800人.电视台为进一步了解观众的具体想法和意见,打算从这12
000人中抽取60人进行更为详细的调查,应采取什么样的抽样方法呢?
激趣诱思
知识点拨
一、分层随机抽样
1.定义
将总体按其属性特征分成互不交叉的若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的个体,这种抽样方法通常叫作分层随机抽样.
2.特点
(1)分层随机抽样适用于已知总体是由差异明显的几部分组成;
(2)分成的各层互不重叠;
(3)各层抽取的比例都等于样本容量在总体中的比例,即
,其中n为样本容量,N为总体容量中的个体数.
激趣诱思
知识点拨
名师点析关于分层随机抽样应注意的问题
(1)分层随机抽样中分多少层,如何分层要视具体情况而定,总的原则是每层内样本的差异要小,不同层之间样本的差异要大,且互不重叠.
(2)每一层抽取的个体数由样本容量乘以这一层的个体数在总体中所占的比例得到.
(3)各层抽样可以按简单随机抽样进行.
激趣诱思
知识点拨
微思考1
分层随机抽样中要将总体中层次分明的几部分分层按比例抽取,其中“比例”一词如何理解?
?
?
微思考2
分层随机抽样有什么优点?
提示:可从两个方面理解:一是所抽取样本中各层个体数之比与总体中各层个体数之比相同;二是每层所抽个体数与该层个体总数之比等于样本容量与总体容量之比.
提示:分层随机抽样时,每个个体被抽到的机会是均等的,而且样本更有较好的代表性.
激趣诱思
知识点拨
二、分层随机抽样的步骤
1.分层:根据已经掌握的信息,按某种标准将总体分成互不交叉的若干部分.
2.求比:根据总体中的个数N和样本容量n计算抽样比K=
.
3.定数:确定第i层应该抽取的个体数为ni=Ni-K(Ni是第i层所包含的个体数),使得各层抽取的样本之和等于样本容量n.
4.抽样:按照第三步中确定的应在各层抽取的个体数,分别在各层抽取样本,然后合在一起就得到所需要抽取的容量为n的样本.
激趣诱思
知识点拨
解:由于一级、二级、三级产品的数量之比为24∶36∶60=2∶3∶5,所以应分别从一级、二级、三级产品中抽
微练习
设有120件产品,其中一级品有24件,二级品有36件,三级品有60件,用分层抽样的方法从中抽取一个容量为20的样本,则在每一级产品中应各抽取多少件?
探究一
探究二
探究三
素养形成
当堂检测
分层随机抽样的概念
例1(1)下列问题中,最适合用分层随机抽样抽取样本的是( )
A.从10名同学中抽取3人参加座谈会
B.一次数学竞赛中,某班有10人在110分以上,40人在90~100分,12人低于90分,现从中抽取12人了解有关情况
C.从某校1
000名高中一年级学生中,抽取100名调查上学途中所用时间
D.从生产流水线上,抽取样本检查产品质量
(2)分层随机抽样将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体等可能抽样,必须进行( )
A.每层等可能抽样
B.每层可以不等可能抽样
C.所有层按同一抽样比例等可能抽样
D.所有层抽取的个体数量相同
探究一
探究二
探究三
素养形成
当堂检测
答案:
(1)
B (2)C
解析:(1)A中总体个体无明显差异且个数较少,适合用简单随机抽样;C和D中总体个体无明显差异且个数较多,不适合用分层随机抽样;B中总体个体差异明显,适合用分层随机抽样.
(2)保证每个个体等可能的被抽取是简单随机抽样与分层随机抽样的共同特征,为了保证这一点,分层随机抽样时必须在所有层都按同一抽样比等可能抽取.
探究一
探究二
探究三
素养形成
当堂检测
反思感悟1.使用分层随机抽样的前提
分层随机抽样的适用前提条件是总体可以分层,层与层之间有明显区别,而层内个体间差异较小.
2.使用分层随机抽样应遵循的原则
(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
(2)分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于样本容量与总体中个体数的比.
探究一
探究二
探究三
素养形成
当堂检测
变式训练1某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是 .?
答案:分层随机抽样
解析:由于被抽取的个体属性有明显的差异,因此宜采用分层随机抽样.
探究一
探究二
探究三
素养形成
当堂检测
分层随机抽样的方案设计
例2一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人,为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?
分析观察特征,确定抽样方法→分层求比例,确定各层样本数→从各层中抽取样本
探究一
探究二
探究三
素养形成
当堂检测
解:因为职工年龄与这项指标有关,故采用分层随机抽样.
步骤如下:
(1)分层.按年龄将职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.
(3)在各层分别按抽签法或随机数法抽取样本.
(4)综合每层抽样,组成样本.
探究一
探究二
探究三
素养形成
当堂检测
反思感悟应用分层随机抽样的解题策略
1.在分层随机抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即ni∶Ni=n∶N.
2.分层后,可采用简单随机抽样取出各层中的个体,一定要注意按比例抽取.当抽样比不是整数时,可在该层随机剔除部分个体.
探究一
探究二
探究三
素养形成
当堂检测
变式训练2某工厂有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人.上级部门为了了解他们对机构改革的意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施操作.
解:因机构改革关系到每个人的不同利益,故采用分层抽样方法较合适.
∴从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.
副处级以上干部与工人人数都较少,把他们分别按1~10编号和1~20编号,然后采用抽签法分别抽取2人和4人;
对一般干部70人进行00,01,…,69编号,然后用随机数法抽取14人.这样便得到了一个容量为20的样本.
探究一
探究二
探究三
素养形成
当堂检测
抽样方法的综合应用
例3选择合适的抽样方法抽样,写出抽样过程.
(1)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个;
(2)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个;
(3)有甲厂生产的300个篮球,抽取10个.
下面给出的是随机数表中的第8行到第12行
2
7
4
8 6
1
9
8 7
1
6
4 4
1
4
8 7
0
8
6 2
8
8
8 8
5
1
9 1
6
2
0
7
4
7
7 0
1
1
1 1
6
3
0 2
4
0
4 2
9
7
9 7
9
9
1 9
6
8
3 5
1
2
5
5
3
7
9 7
0
7
6 2
6
9
4 2
9
2
7 4
3
9
9 5
5
1
9 8
1
0
6 8
5
0
1
9
2
6
4 4
6
0
7 2
0
2
1 3
9
2
0 7
7
6
6 3
8
1
7 3
2
5
6 1
6
4
0
5
8
5
8 7
7
6
6 3
1
7
0 0
5
0
0 2
5
9
3 0
5
4
5 5
3
7
0 7
8
1
4
分析应结合两种抽样方法的使用范围和实际情况灵活使用各种抽样方法解决问题.
探究一
探究二
探究三
素养形成
当堂检测
解:(1)总体容量较小,用抽签法.
①将30个篮球编号,编号为00,01,…,29;
②将以上30个编号分别写在完全一样的小纸条上,揉成小球,制成号签;
③把号签放入一个不透明的袋子中,充分搅拌;
④从袋子中逐个抽取3个号签,并记录上面的号码;
⑤找出和所得号码对应的篮球即可得到样本.
(2)总体由差异明显的两个层次组成,需选用分层随机抽样.
②用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个,这些篮球便组成了我们要抽取的样本.
探究一
探究二
探究三
素养形成
当堂检测
(3)总体容量较大,样本容量较小,宜用随机数法.
①将300个篮球用随机方式编号,编号为001,002,…,300;
②在随机数表中随机地确定一个数作为开始,如第8行第29列的数“9”开始.任选一个方向作为读数方向,比如向右读;
③从数“9”开始向右读,每次读三位,凡不在001~300中的数跳过去不读,遇到已经读过的数也跳过去不读,依次得到10个号码,这就是所要抽取的10个样本个体的号码.
探究一
探究二
探究三
素养形成
当堂检测
反思感悟抽样方法的选取
1.若总体由差异明显的几个层次组成,则选用分层随机抽样;
2.若总体没有差异明显的层次,则考虑采用简单随机抽样.当总体中个体数较小时宜用抽签法;当总体中个体数较大,样本容量较小时宜用随机数法.
探究一
探究二
探究三
素养形成
当堂检测
变式训练3下列问题中,采用怎样的抽样方法较为合理?
(1)从10台电冰箱中抽取3台进行质量检查;
(2)某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.
解:(1)抽签法,总体中个体数较小,宜用抽签法.(2)分层随机抽样,由于学校各类人员对这一问题的看法可能差异较大,用分层随机抽样.
探究一
探究二
探究三
素养形成
当堂检测
分层随机抽样的有关样本计算
典例
某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层随机抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是( )
A.4
B.5
C.6
D.7
答案:C
探究一
探究二
探究三
素养形成
当堂检测
方法点睛解决分层随机抽样中的容量问题,关键是求出抽样比,即样本中个体数与总体容量的比.由分层随机抽样的特点可知:
,这是求解分层随机抽样中有关容量问题的依据.
探究一
探究二
探究三
素养形成
当堂检测
1.某班有60名学生,其中男生有40人,现将男、女学生用分层随机抽样法抽取12人观看校演讲总决赛,则该班中被抽取观看校演讲总决赛的女生人数为( )
A.8
B.6
C.4
D.2
答案:C
解析:某班有60名学生,其中男生有40人,则女生20人,男女生人数之比为2∶1,抽取的12人,女生人数为12×
=4人.故选C.
探究一
探究二
探究三
素养形成
当堂检测
2.某次娱乐节目中有A,B,C三个方阵,其人数之比为3∶3∶4,现用分层随机抽样方法抽出一个容量为n的样本,方阵A被抽出人数为12人,则此样本容量n为( )
A.20
B.25
C.30
D.40
答案:D
解析:因为A,B,C三个方阵,其人数之比为3∶3∶4,现用分层随机抽样方法抽出一个容量为n的样本,则A方阵抽取的人数占样本容量
探究一
探究二
探究三
素养形成
当堂检测
3.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为(1);在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为(2).则完成(1)、(2)这两项调查宜采用的抽样方法依次是 、 .?
答案:分层随机抽样 简单随机抽样
解析:
①对应的总体明显分成互不交叉的四层,即甲,乙,丙,丁四个地区,故用分层随机抽样.
②对应的总体容量较少,故用简单随机抽样.
探究一
探究二
探究三
素养形成
当堂检测
4.(2020重庆高三月考)脱贫攻坚是一项历史性工程,精准脱贫是习近平总书记给扶贫工作的一剂良方.重庆市贫困人口分布相对集中,截至目前,渝东北地区贫困户占全市贫困户48%,渝东南地区贫困户占全市贫困户32%,为精准了解重庆市贫困户现状,“脱贫攻坚”课题组拟深入到其中25户贫困户家中调研,若按地区采用分层随机抽样的方法分配被调研的贫困户,课题组应到其他地区(除渝东南和渝东北地区外)调研的贫困户的户数是 .?
答案:5
解析:渝东南和渝东北地区贫困户占全市的48%+32%=80%,故其他地区贫困户占全市的20%.故课题组应到其他地区(除渝东南和渝东北地区外)调研的贫困户的户数是25×20%=5.
探究一
探究二
探究三
素养形成
当堂检测
5.某企业共有3
200名职工,其中青、中、老年职工的比例为3∶5∶2.若从所有职工中抽取一个容量为400的样本,则采用哪种抽样方法更合理?青、中、老年职工应分别抽取多少人?
解:因为总体由差异明显的三部分(青、中、老年)组成,所以采用分层随机抽样的方法更合理.
因为青、中、老年职工的比例是3∶5∶2,所以应分别抽取:(共40张PPT)
3.1 从频数到频率
3.2 频率分布直方图
激趣诱思
知识点拨
我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望85%以上的居民的日常生活不受影响,那么标准a定为多少比较合理?你认为较为合理地确定出这个标准,需要做哪些工作?
激趣诱思
知识点拨
一、频率分布表与频率分布直方图
1.基本概念
激趣诱思
知识点拨
2.频率分布表和频率分布直方图的意义
从一个总体得到一个包含大量数据的样本时,我们很难从一个个数据中直接看出样本所含的信息.如果把这些数据整理成频率分布表或频率分布直方图,就可以比较清楚地看出样本数据的频率分布,从而估计总体的分布情况.用样本估计总体,是研究统计问题的一个基本思想方法,而对于总体分布,我们总是用样本频率分布对它进行估计.
3.频率分布表与频率分布直方图的制作步骤
(1)频率分布是指从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.
(2)一般用频率分布直方图反映样本的频率分布.
激趣诱思
知识点拨
(3)画频率分布直方图的一般步骤为:
第一步,求极差.
第二步,确定组距和组数.为了方便起见,组距的选择应力求“取整”,极差、组距、组数有如下关系:
([x]表示不大于x的最大整数)
第三步,分组.通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.
第四步,列频率分布表.统计各组数据的频数,计算频率,填入表格中,完成频率分布表.
第五步,依据频率分布表画频率分布直方图.画图时,以横轴表示样本数据,纵轴(小长方形的高)表示频率与组距的比值.
激趣诱思
知识点拨
名师点析频率分布直方图的特征
总体分布情况可以通过样本频率分布情况来估计,样本频率分布是总体分布的一种近似表示,频率分布表和频率分布直方图有以下特征:(1)从频率分布直方图可以清楚地看出数据分布的总体趋势.(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.(3)频率分布表和频率分布直方图由样本决定,因此它们会随样本的变化而变化.(4)若固定分组数,随着样本容量的增加,频率分布表中各个频率会稳定在某一个值的附近,从而频率分布直方图中的各个小长方形的高度也会稳定在特定的值上.
激趣诱思
知识点拨
微拓展
绘制频率分布直方图应注意什么问题?
提示:①各组频率的和等于1,因此各个小长方形面积的总和等于1.②频率分布直方图比频率分布表更直观、形象地反映了样本的分布规律.③在直角坐标平面内画频率分布直方图时,横轴上是样本
激趣诱思
知识点拨
④同样一组数据,如果组距不同,横轴、纵轴单位长度不同,得到的频率分布直方图的形状也会不同,不同的形状给人们的印象也不同,这种印象有时会影响我们对总体的判断.⑤同一个总体,由于抽样的随机性,因此随机抽取另外一个同样容量的样本,所形成的样本频率分布直方图一般会与前一个样本频率分布直方图有所不同,但它们都可以用来估计总体的分布.而随着样本容量的增加,频率分布表中各个频率会稳定在某个值的附近,从而频率分布直方图中的各个矩形的高度也会稳定在特定的值上.
激趣诱思
知识点拨
微思考
频率分布表与频率分布直方图各有什么特点?
提示:频率分布表反映具体数据在各个不同区间的取值频率,但不直观,数据的总体态势不明显.频率分布直方图能直观地表明数据分布的形状态势,但失去了原始数据.
激趣诱思
知识点拨
二、频率折线图
在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
名师点析频率折线图的优点是它反映了数据的变化趋势,随着样本容量的不断增加,分组的不断加密,频率折线就会越来越光滑,最终形成一条光滑的曲线.
激趣诱思
知识点拨
微拓展
总体密度曲线的特征.
提示:(1)在样本频率分布直方图中,随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计学中称这条光滑曲线为总体密度曲线,如图所示.
(2)总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,图中阴影部分的面积,就是总体在区间(a,b)内取值的百分比.
探究一
探究二
探究三
素养形成
当堂检测
频数与频率的有关计算
例1已知一个容量是40的样本,把它分成六组,第一组到第四组的频数分别是5,6,7,10,第五组的频率是0.2,那么第六组的频数是 ,频率是 .?
答案:4 0.1
探究一
探究二
探究三
素养形成
当堂检测
反思感悟频数与频率的求解策略
对于频数与频率的问题,首先要明确几个等量关系,即各组的频数之和等于样本容量,各组的频率之和为1,频率=
.在解题过程中,要明确频数、频率以及样本容量之间的关系,弄清已知、未知,选择合适的公式进行解题.
探究一
探究二
探究三
素养形成
当堂检测
变式训练1一个容量为20的样本数据,分组后组距与频数如下表:
则样本数据在区间(0,50)上的频率为 .?
答案:0.7
解析:区间(0,50)包括四部分的数据,在这四部分上的数据的频数和是2+3+4+5=14,样本容量为20,所以样本数据在区间(0,50)上的频
探究一
探究二
探究三
素养形成
当堂检测
画频率分布直方图、折线图
例2某省为了了解和掌握2020年高考考生的实际答卷情况,随机地取出了100名考生的数学成绩,数据如下:(单位:分)
135981021109912111096100103
1259711711311092102109104112
1051248713197102123104104128
10912311110310592114108104102
12912697100115111106117104109
1118911012180120121104108118
12999909912112310711191100
991011169710210810195107101
1021081179911810611997126108
12311998121101113102103104108
探究一
探究二
探究三
素养形成
当堂检测
(1)列出频率分布表;
(2)画出频率分布直方图和折线图;
(3)估计该省考生数学成绩在[100,120)分之间的比例.
分析先求极差.根据极差与数据个数确定组距、组数,然后按频率分布直方图的画法绘制图形.
(1)频率分布表如下:
探究一
探究二
探究三
素养形成
当堂检测
探究一
探究二
探究三
素养形成
当堂检测
(2)根据频率分布表中的有关信息画出频率分布直方图及折线图,如图所示.
(3)从频率分布表中可知,这100名考生的数学成绩在[100,120)分之间的频率为0.24+0.15+0.12+0.09=0.60,据此估计该省考生数学成绩在[100,120)分之间的比例为60%.(0.60=60%)
探究一
探究二
探究三
素养形成
当堂检测
反思感悟组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响对数据分布情况的了解,若样本容量不超过120个时,按照数据的多少常分为5组~12组,一般样本容量越大,所分组数越多.
探究一
探究二
探究三
素养形成
当堂检测
延伸探究本例条件不变,制成频率分布直方图时分组如下,[80,85),[85,90),[90,95),[95,100),[100,105),[105,110),[110,115),[115,120),[120,125),[125,130),[130,135].若90分或90分以上为及格,请计算该省考生数学成绩的及格率.
探究一
探究二
探究三
素养形成
当堂检测
解:列出频率分布表如下
由表可得,及格(即90分或90分以上)的频率为0.04+0.14+0.24+
0.15+0.12+0.09+0.11+0.06+0.02=0.97.故及格率为97%.
探究一
探究二
探究三
素养形成
当堂检测
频率分布直方图的应用
例3某校在5月份开展了科技月活动.在活动中某班举行了小制作评比,规定作品上交的时间为5月1日到31日,逾期不得参加评比.评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:
(1)本次活动共有多少件作品参加评比?
(2)哪组上交的作品数最多,有多少件?
(3)经过评比,第四组和第六组分别有10
件、2件作品获奖,问这两组哪组获奖率
较高?
探究一
探究二
探究三
素养形成
当堂检测
分析(1)根据条件:从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,计算参加评比的作品总数;(2)根据频率分布直方图判断哪组上交的作品最多,再由本组的频率计算频数;(3)先分别由第四组和第六组的频率计算该组的频数,再计算获奖率.
探究一
探究二
探究三
素养形成
当堂检测
解:(1)设从左到右各长方形的高分别为2x,3x,4x,6x,4x,x.设参加评比的作品总数为a件,
满足(2x+3x+4x+6x+4x+x)×5=1.解得a=60(件).
(2)由频率分布直方图可以看出第四组上交的作品数量最多,共有6×x×5×a=18(件).
(3)第四组和第六组上交的作品数分别为:18件,x×5×a=3(件),则它
探究一
探究二
探究三
素养形成
当堂检测
反思感悟1.频率分布直方图的性质
相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小;
(2)在频率分布直方图中,各小矩形的面积之和等于1;
2.频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内取值的可能性.
探究一
探究二
探究三
素养形成
当堂检测
变式训练2为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图如图所示,图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110或110以上为达标,试估计该校全体高一学生的达标率是多少?
探究一
探究二
探究三
素养形成
当堂检测
解:(1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为
探究一
探究二
探究三
素养形成
当堂检测
利用频率分布直方图进行计算
典例
某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:[13,14),[14,15),[15,16),
[16,17),[17,18),[18,19].如图所示的是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则x和y分别为( )
A.0.9,35
B.0.9,45
C.0.1,35
D.0.1,45
探究一
探究二
探究三
素养形成
当堂检测
答案:A
解析:从频率分布直方图可以看出
x=1-(0.06+0.04)=0.9,y=50×(0.36+0.34)=35.
探究一
探究二
探究三
素养形成
当堂检测
1.一个容量为20的样本数据,分组及各组的频数如下
则样本在区间[20,60)上的频率是( )
A.0.5
B.0.6
C.
0.7
D.
0.8
答案:D
探究一
探究二
探究三
素养形成
当堂检测
2.一个容量为32的样本,已知某组数据的频率为0.125,则该组数据的频数为( )
A.2
B.
4
C.
6
D.
8
答案:B
解析:0.125×32=4.
探究一
探究二
探究三
素养形成
当堂检测
3.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为( )
A.20
B.
30
C.
40
D.
50
答案:B
解析:样本数据落在[15,20]内的频数为:100×[1-5×(0.04+0.10)]
=30.
探究一
探究二
探究三
素养形成
当堂检测
4.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图如图所示.由图中数据可知a= .若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数为 .?
探究一
探究二
探究三
素养形成
当堂检测
答案:0.030 3
解析:∵0.005×10+0.035×10+a×10+0.020×10+0.010×10=1,
∴a=0.030,设身高在[120,130),[130,140),[140,150]三组的分别有x,y,z人.
探究一
探究二
探究三
素养形成
当堂检测
5.公交车的数量太多容易造成资源的浪费,太少又难以满足乘客的需求.为此,公交公司在某站台随机调查了80名乘客,他们的候车时间如下所示(单位:min):
探究一
探究二
探究三
素养形成
当堂检测
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率折线图;
(2)候车时间不低于15分钟比例是多少?你能为公交公司提出什么建议?
探究一
探究二
探究三
素养形成
当堂检测
解:(1)该数据中最大值为34,最小值为1,两者之差为33,故取组距为5,分为7组.
探究一
探究二
探究三
素养形成
当堂检测
频率分布直方图如下图所示:
频率折线图如下图所示:
探究一
探究二
探究三
素养形成
当堂检测
(2)候车时间不低于15分钟的百分比为0.275+0.125+0.100+0.037
5=0.537
5=53.75%,
公交公司可以适当增加公交车的数量.(共39张PPT)
4.1 样本的数字特征
4.2 分层随机抽样的均值与方差
4.3 百分位数
激趣诱思
知识点拨
应届毕业生王刚想找一份年薪8万元的工作.有一位招聘员告诉王刚:“我们公司50名员工中,最高年收入达到了100万元,他们平均年收入是10万元,加盟我们公司吧.”
根据以上信息,能否判断王刚可以成为此公司的一名高收入者?如果招聘员继续告诉王刚:“员工年收入的变化范围是从7万元到100万元.”这个信息是否可以促使王刚做出决定?
激趣诱思
知识点拨
一、样本的数字特征
1.众数、中位数、平均数
众数、中位数、平均数刻画了一组数据的 .?
(1)众数
一组数据中,出现次数最多的数据就是众数.若有两个或几个数据出现的次数相等且都最多,则这些数都是这组数据的众数;若一组数据中,每个数据出现的次数都一样,则这组数据没有众数.
(2)中位数
一般地,将一组数据按从小到大的顺序排列后,“中间”的那个数据为这组数据的中位数.
提示:当数据有奇数个时,位于最中间位置的数就是中位数;当数据有偶数个时,位于最中间的两个数的平均数就是中位数.
集中趋势
激趣诱思
知识点拨
(3)平均数
一组数据的平均值,数据x1,x2,…,xn的平均数为
名师点析众数、中位数、平均数的比较
激趣诱思
知识点拨
2.极差、方差、标准差
极差、方差、标准差刻画了一组数据的 .?
(1)极差:把一组数据中 .?
(2)方差:设一组数据为x1,x2,x3,…,xn,其平均数为
,则方差s2=
,其单位是原始观测数据单位的 ,方差刻画的是数据偏离平均数的离散程度.?
离散程度
最大值与最小值的差
平方
激趣诱思
知识点拨
(3)标准差
①定义:它是方差的正的平方根,
=
,其单位与原始测量单位 .?
②计算方法:先求出方差s2,再求方差的算术平方根,即得标准差
相同
激趣诱思
知识点拨
名师点析计算方差、标准差的步骤
计算样本数据x1,x2,…,xn的标准差的算法如下:
第一步:算出样本数据的平均数
;
第二步:算出每个样本数据与样本平均数的差xi-
(i=1,2,…,n);
第三步:算出第二步中xi-
(i=1,2,…,n)的平方;
第四步:算出第三步中n个平方数的平均数,即为样本方差;
第五步:算出第四步中平均数的算术平方根,即为样本标准差.
激趣诱思
知识点拨
微练习1
已知一组数据10,30,50,50,60,70,80.其中平均数、中位数和众数的大小关系是( )
A.平均数>中位数>众数
B.平均数<中位数<众数
C.中位数<众数<平均数
D.众数=中位数=平均数
答案:D
解析:由所给数据可得平均数为50,中位数为50,众数为50,因此众数=中位数=平均数.
激趣诱思
知识点拨
微拓展1
怎样由频率分布直方图估计样本的众数、中位数、平均数.
提示:(1)在频率分布直方图中,众数是最高的小长方形的中点.(2)在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应相等.平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形的底边中点的横坐标之和.
激趣诱思
知识点拨
微练习2
从一堆苹果中任取5个,称得它们的质量如下(单位:克):
125 124 121 123 127
则该样本的标准差s= ?(克)(用数字作答).?
答案:
2
激趣诱思
知识点拨
微拓展2
平均数与方差有哪些性质?
激趣诱思
知识点拨
二、分层随机抽样的均值与方差
1.分层随机抽样的平均数
(1)定义:一般地,将样本a1,a2,…,am和样本b1,b2,…,bn合并成一个新样本,则这个新样本的平均数为
激趣诱思
知识点拨
激趣诱思
知识点拨
微练习
甲、乙两人进行射击比赛,甲射击6次,成绩分别为10,9,8,7,8,6;乙射击4次,成绩分别为9,8,7,10.则甲、乙两人共射击10次的平均成绩和方差分别是多少?
激趣诱思
知识点拨
三、百分位数
p分位数:一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点:总体数据中任意一个小于或等于它的可能性是p.
名师点析直观地说,一组数p%分位数指的是,将这组数按照从小到大的顺序排列后,处于p%位置的数.
激趣诱思
知识点拨
微练习
求数据11,17,19,21,22,24,24,30,30,32中的60%分位数.
探究一
探究二
探究三
素养形成
当堂检测
平均数、众数、中位数的求法
例1在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示.
分别求这些运动员成绩的众数、中位数与平均数.(结果精确到0.01)
探究一
探究二
探究三
素养形成
当堂检测
解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.题目中表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70.这组数据的平均数是
探究一
探究二
探究三
素养形成
当堂检测
反思感悟中位数、众数、平均数的应用要点
中位数、众数反映了一组数据的“中等水平”“多数水平”,平均数反映了数据的平均水平,我们需根据实际需要选择使用.
(1)求中位数的关键是将数据排序,一般按照从小到大的顺序排列.中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响.中位数可能在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述数据的集中趋势.
(2)确定众数的关键是统计各数据出现的频数,频数最大的数据就是众数.当一组数据中有不少数据多次重复出现时,众数往往更能反映数据的集中趋势.
(3)平均数与每一个样本数据都有关,受个别极端数据(比其他数据大很多或小很多的数据)的影响较大,因此若在数据中存在少量极端数据,平均数对总体估计的可靠性较差,这时往往用众数或中位数去估计总体.有时也采用剔除最大值与最小值后所得的平均数去估计总体.
探究一
探究二
探究三
素养形成
当堂检测
变式训练1(1)16位参加百米赛跑半决赛同学的成绩各不相同,按成绩取前8位进入决赛.如果小刘知道了自己的成绩后,要判断能否进入决赛,则其他15位同学成绩的下列数据中,能使他得出结论的是( )
A.平均数
B.极差
C.中位数
D.方差
(2)已知一组数据按从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么该组数据的众数是 ,平均数是 .?
探究一
探究二
探究三
素养形成
当堂检测
答案:
(1)
C
(2)6 5
解析:
(1)判断能否进入决赛,只要判断是不是前8位,所以只要知道其他15位同学的成绩中是不是有8位高于他,也就是把其他15位同学的成绩排列后看第8位的成绩即可,小刘的成绩高于这个成绩就能进入决赛,低于这个成绩就不能进入决赛,这个第8位的成绩就是这15位同学成绩的中位数.
探究一
探究二
探究三
素养形成
当堂检测
方差和标准差的计算及应用
例2甲、乙两台机床同时加工直径为100
cm的零件,为检验质量,各从中抽取6件测量,数据为:
甲:99,100,98,100,100,103;
乙:99,100,102,99,100,100.
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
探究一
探究二
探究三
素养形成
当堂检测
探究一
探究二
探究三
素养形成
当堂检测
反思感悟标准差(方差)的两个作用
(1)标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.
(2)在实际应用中,常常把平均数与标准差结合起来进行决策.在平均值相等的情况下,比较方差或标准差以确定稳定性.
探究一
探究二
探究三
素养形成
当堂检测
变式训练2(1)在某项体育比赛中,七位裁判为一选手打出的分数为:90,89,90,95,93,94,93,去掉一个最高分和一个最低分后,剩下数据的平均值和方差分别为( )
A.92,2
B.92,2.8
C.93,2
D.93,2.8
(2)已知样本9,10,11,x,y的平均数是10,标准差是
,则xy= .?
探究一
探究二
探究三
素养形成
当堂检测
答案:
(1)
B
(2)96
解析:去掉最高分95和最低分89后,
x2+y2-20(x+y)=-192,
(x+y)2-2xy-20(x+y)=-192,xy=96.故填96.
探究一
探究二
探究三
素养形成
当堂检测
求百分位数
例3给出下列一组数据:18,19,20,20,21,22,23,31,31,35,求出45%分位数.
解:因为数据个数为10,而且10×45%=4.5,因此该组数据的45%分位数为x5=21.
探究一
探究二
探究三
素养形成
当堂检测
反思感悟p(p∈(0,1))分位数的确定方法
设一组数据按照从小到大排列后为x1,x2,…,xn,计算i=np%的值,如果i不是整数,设i0为大于i的最小整数,取
为p分位数;如果i是整数,取
为p分位数.
探究一
探究二
探究三
素养形成
当堂检测
延伸探究求出本例中80%的分位数.
探究一
探究二
探究三
素养形成
当堂检测
样本的数字特征的意义及综合应用
典例
(1)据了解,某公司的33名职工月工资(单位:元)如下.
该公司职工月工资的平均数为 (结果精确到1),中位数为 ,在这两个统计量中, 更能反映这个公司员工的工资水平.?
探究一
探究二
探究三
素养形成
当堂检测
(2)某高中从参加学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
则这次数学测试的众数是 ,中位数是 (结果精确到0.1).?
探究一
探究二
探究三
素养形成
当堂检测
解析:(1)把工资数据由小到大排列,得到中位数为4
000元.
≈5
333(元).
所以中位数更能反映该公司员工的工资水平,平均数受少数人工资额的影响较大,不能反映这个公司员工的工资水平.
设中位数为x,前三个矩形面积之和为0.4,第四个矩形面积为0.3,因此中位数位于第四个矩形内,由0.1=0.03(x-70),得x≈73.3.
答案:(1)5
333 4
000 中位数 (2)75 73.3
探究一
探究二
探究三
素养形成
当堂检测
方法点睛1.因为平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质,也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于全体样本数据的信息.但平均数受数据的极端值的影响较大,使平均数在估计总体时可靠性降低.
2.利用频率分布直方图估计数字特征:
(1)众数的估计值是最高的矩形的底边的中点;
(2)中位数的估计值左右两侧直方图的面积相等;
(3)平均数的估计值等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
探究一
探究二
探究三
素养形成
当堂检测
答案:C
解析:依题意可得
探究一
探究二
探究三
素养形成
当堂检测
2.若甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和标准差如下表:
则参加奥运会的最佳人选应为( )
A.甲
B.乙
C.丙
D.丁
答案:C
解析:从平均数来看,乙、丙的平均值最大,从标准差来看,丙的标准差最小,因此,应选择丙参加比赛.
探究一
探究二
探究三
素养形成
当堂检测
3.已知一组数据x1,x2,…,xn的方差是a,则另一组数据x1-2,x2-2,…,xn-2的方差是 .?
答案:a
解析:将一组数据同时加上或减去一个数,所得新数据的方差与原数据的方差相等.
探究一
探究二
探究三
素养形成
当堂检测
4.某车间20名工人年龄数据如下表:
(1)求这20名工人年龄的众数与极差;
(2)求这20名工人年龄的方差s2.
探究一
探究二
探究三
素养形成
当堂检测
解:(1)这20名工人年龄的众数为30;这20名工人年龄的极差为
40-19=21.
(2)这20名工人年龄的平均数为(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;
所以这20名工人年龄的方差为(共14张PPT)
章末整合
例1假设要检查某企业生产的袋装牛奶的质量是否达标,现从500袋牛奶中抽取60袋进行检验,利用随机数法抽取样本时,先将500袋牛奶按000,001,…,499进行编号,使用随机数表中各个5位数组的后3位,选定第7行第5组数开始,取出047作为抽取的代号(从左向右读取数字),随后抽到的5袋牛奶的号码分别是(下面摘取了某随机数表第7行至第9行) .?
84421753315724550688770474476721763
35025839212067663016478591695556719
98105071851286735807443952387933211
答案:
025,016,105,185,395
由已知读取号码的初始值为第7行第5组数中的后3位,第一个号码为047.
凡不在000~499中的数跳过去不取,前面已经取过的也跳过去不取,从而随后抽到的5袋牛奶的编号为025,016,105,185,395.
方法技巧随机抽样的解题策略
1.随机抽样有简单随机抽样和分层随机抽样两种.其共同点是在抽样过程中每个个体被抽到的机会相等,当总体中的个体数较少并且个体之间的差异不明显时,常采用简单随机抽样;当已知总体由差异明显的几部分组成时,常采用分层随机抽样.其中简单随机抽样是最简单、最基本的抽样方法.分层随机抽样时要用到简单随机抽样.
2.应用各种抽样方法抽样时要注意以下问题:
(1)利用抽签法时要注意把号签放在不透明的容器中且搅拌均匀;
(2)利用随机数法时注意编号位数要一致;
(3)在分层随机抽样中,若在某一层抽到的个体数不是整数,应在该层剔除部分个体,使抽取个体数为整数.
变式训练1一个单位有职工500人,其中不到35岁的有125人,35岁到49岁的有280人,50岁及其以上的有95人,为了了解与身体状况有关的某项指标,要从所有职工中抽取100名职工作为样本,若职工年龄与这项指标有关,应该怎样抽取?
解:用分层抽样来抽取样本,步骤是:
(1)分层,按年龄将500名职工分成三层,不到35岁的职工;35岁到49岁的职工;50岁及其以上的职工.
(3)在各层分别按抽签法或随机数法抽取样本.
(4)综合每层抽样,组成样本.
专题二 用样本的频率分布估计总体分布?
例2如下表所示给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料.(单位:cm)
(1)列出样本的频率分布表(结果精确到0.01);
(2)画出频率分布直方图;
(3)估计身高低于134
cm的人数占总人数的比值(结果精确到0.01).
解:(1)样本的频率分布表.
名师点评统计图表的应用
统计图表主要包括:频率分布表、频率分布直方图、频率分布折线图等.通过这些统计图表给出的相应统计信息可以估计总体.
(2)画出频率分布直方图,如下图所示.
变式训练2为了了解某校高一学生的视力情况,随机抽查了该校100名高一学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为( )
A.64
B.54
C.48
D.27
答案:B
解析:[4.7,4.8)之间频率为0.32,[4.6,4.7)之间频率为
1-(0.62+0.05+0.11)=1-0.78=0.22,∴a=(0.22+0.32)×100=54.
专题三 用样本的数字特征估计总体的数字特征?
例3为了了解市民的环保意识,某校高一(1)班50名学生在6月5日(世界环境日)这一天调查了各自家庭丢弃旧塑料袋的情况,有关数据如下表:
(1)求这50户居民每天丢弃旧塑料袋的平均数、众数和中位数;
(2)求这50户居民每天丢弃旧塑料袋的方差.
方法规律样本的数字特征的应用
样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括平均数、众数、中位数;另一类是反映样本数据的波动大小,包括样本极差、方差及标准差.通常,在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,质量越稳定.
变式训练3某校甲班、乙班各有49名学生,两班在一次数学测验中的成绩(满分100分)统计如下表:
(1)请你对下面的一段话给予简要分析:
甲班的小刚回家对妈妈说:“昨天的数学测验,全班平均79分,得70分的人最多,我得了85分,在班里算是上游了!”
(2)请你根据表中数据,对这两个班的测验情况进行简要分析,并提出教学建议.
解:(1)由中位数可知,85分排在第25名之后,从名次上讲,85分不算是上游.但也不能单以名次来判断学习成绩的好坏,小刚得了85分,说明他对本阶段的学习内容掌握较好.
(2)甲班学生成绩的中位数为87分,说明高于或等于87分的学生占一半以上,而平均分为79分,标准差很大,说明低分也多,两极分化严重,建议对学习有困难的同学多给一些帮助;
乙班学生成绩的中位数和平均分均为79分,标准差小,说明学生成绩之间差别较小,成绩很差的学生少,但成绩优异的学生也很少,建议采取措施提高优秀率.