课件47张PPT。2.1.1 简单随机抽样1.理解简单随机抽样的概念.
2.熟练掌握最常见的两种简单随机抽样方法——抽签法(抓阄法)和随机数法.
3.会恰当选用两种简单随机抽样方法从实际问题的总体中抽取样本. 1.本节重点是正确理解简单随机抽样的概念,会描述抽签法及随机数法的步骤,能灵活应用相关知识从总体中抽取样本.
2.本节难点是抽签法及随机数法的步骤.1.简单随机抽样
(1)定义:一般地,设一个总体含有N个个体,从中逐个
_______地抽取n个个体作为样本(n≤N),每次抽取时总体内
的各个个体被抽到的机会_______的抽样方法.
(2)方法:_______和_________.不放回都相等抽签法随机数法2.抽签法与随机数法的定义
(1)抽签法:把总体中的N个个体_____,把_____写在号签上,
将号签放在一个容器中,搅拌均匀后,每次从中抽取_____号
签,连续抽取n次,就得到一个容量为n的样本.
(2)随机数法:随机抽样中,另一个经常被采用的方法是随
机数法,即利用_________、___________或_______产生的随
机数进行抽样.编号号码一个随机数表随机数骰子计算机1.设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),利用简单随机抽样抽取的每个个体入样的可能性为多少?
提示:
2.你认为抽签法有什么优点?当总体中的个体数很多时,用抽签法方便吗?
提示:优点是操作简便易行.当总体个数较多时,工作量大,很难做到“搅拌均匀”.3.用随机数表法进行抽样有以下几个步骤:①将总体中的个体编号;②获取样本号码;③选定开始的数字,这些步骤的先后顺序应为_________.
【解析】∵用随机数表法进行抽样,包含这样的步骤:
①将总体中的个体编号;②选定开始的数字,按照一定的方向读数;③获取样本号码,
∴把题目条件中所给的三项排序为:①③②.
答案:①③②4.某中学为了了解高一学生的年龄情况,从所有的1 800名高一学生中抽出100名调查,则样本是_______.
【解析】样本是指从总体中抽取的一部分个体,故本题中的样本是抽出的100名同学的年龄.
答案:抽出的100名同学的年龄1.对总体、个体、样本、样本容量的认识
总体:统计中所考察对象的全体叫总体.
个体:总体中的每一个考察对象叫个体.
样本:从总体中抽取的一部分个体叫样本.
样本容量:样本的个体的数目叫做样本容量.2.简单随机抽样的理解
简单随机抽样,也叫纯随机抽样,就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位,其特点是:
(1)它要求被抽取样本的总体的个数有限,这样便于通过随机抽取的样本对总体进行分析;
(2)它是从总体中逐个抽取,这样便于在抽样实践中进行操作;(3)它是一种不放回抽样,由于抽样实践中多采用不放回抽
样,使其具有较广泛的实用性,而且由于所抽取的样本中没有
被重复抽取的个体,便于进行有关的分析和计算;
(4)它是一种等机会抽样,不仅每次从总体中抽取一个个体
时,各个个体被抽到的机会相等,而且在整个抽样的过程中,
各个个体被抽取的机会也相等,从而保证了这种抽样方法的
公平性.
简单随机抽样是其他各种抽样形式的基础,通常只是在总体
单位之间差异程度较小和数目较少时,才采用这种方法. 简单随机抽样的概念理解
【技法点拨】
简单随机抽样的判断方法
判断所给抽样是不是简单随机抽样,关键是看它们是否符合简单随机抽样的四个特点,即总体的个数有限;逐个抽取;不放回抽取;等可能抽样. 【典例训练】1.下列问题中,最适合用简单随机抽样方法抽样的是( )
(A)某电影院有32排座位,每排有40个座位,座位号是1~40,有一次报告会坐满了观众,报告会结束以后听取观众的意见,要留下32名观众进行座谈
(B)从10台冰箱中抽取3台进行质量检验(C)某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人.教育部门为了解大家对学校机构改革的意见,要从中抽取容量为20的样本
(D) 某乡农田有山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩,现抽取农田480 亩估计全乡农田平均产量 2.下列抽取样本的方式是否属于简单随机抽样?说明理由.
(1)从无限多个个体中抽取100个个体作为样本;
(2)盒子中共有80个零件,从中选出5个零件进行质量检验,在进行操作时,从中任意抽出一个零件进行质量检验后把它放回盒子里;
(3)某班45名同学,指定个子最高的5人参加某活动;
(4)从20个零件中一次性抽出3个进行质量检测.【解析】1.选B.简单随机抽样适合总体中的个体数较少,操作简便易行.故选B.
2.(1)不是简单随机抽样,由于被抽取的样本的总体个数是无限的;
(2)不是简单随机抽样,由于它是放回抽样;
(3)不是简单随机抽样,因为不是等可能性抽样;
(4)不是简单随机抽样,因为不是逐个抽样.【思考】在随机抽样中个体是逐个被抽取的,那么先后抽取的个体公平吗?解决题2的易错点是什么?
提示:(1)公平,因为每个个体被抽到的可能性相等.
(2)解决题2的易错点是不能准确地把握简单随机抽样的特点导致判断错误.【变式训练】下列抽样方法是简单随机抽样的是( )
(A)在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位是2 709的为三等奖
(B)某车间包装一种产品,在自动包装传送带上,每隔30分钟抽一包产品,称其重量是否合格(C)从8台电脑中逐个不放回地随机抽取2台,进行质量检验,假设8台电脑已编好号,对编号随机抽取
(D)从20个零件中一次性抽出3个进行质量检查
【解析】选C.由简单随机抽样的特点可以知道,C是简单随机抽样. 抽签法的应用
【技法点拨】
抽签法的一般步骤
(1)给总体中的所有个体编号(号码可以从1到N);
(2)将1~N这N个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作);
(3)将号签放在一个不透明的容器里,搅拌均匀;(4)从容器中每次抽取一个号签,并记录其编号,连续抽取n次;
(5)从总体中将与抽到的号签的编号一致的个体取出组成一个样本.【典例训练】
1.上海某中学从40名学生中选1人作为上海男篮啦啦队的成员,采用下面两种选法,则是抽签法的是___.
选法一:将这40名学生从1 40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选;
选法二:将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为啦啦队成员.2.某车间工人加工一种轴100个,为了了解这种轴的直径,要从中抽取10个轴在同一条件下测量,用抽签法设计一个抽样方案.
【解析】1.选法一满足抽签法的特征,是抽签法;选法二不是抽签法,因为抽签法要求所有的号签编号互不相同,而选法二中39个白球无法相互区分.这两种选法相同之处在于每名学生被选中的可能性都相等,均为
答案:选法一2.解题流程【思考】抽签法中如何确保抽样的公平性?
提示:放在暗箱中搅拌均匀可确保每个个体被抽到的机会都相等.【变式训练】某校高一年级有43名足球运动员,要从中抽出5人抽查学习负担情况.用抽签法设计一个抽样方案.
【解题指南】根据抽签法的基本步骤求解.
【解析】第一步:编号,把43名运动员编号为1~43;
第二步:制签,做好大小、形状相同的号签,分别写上这43个数;
第三步:搅拌,将这些号签放在暗箱中,进行均匀搅拌;
第四步:抽签入样,每次从中抽取一个,连续抽取5次,从而得到容量为5的入选样本. 随机数法的应用
【技法点拨】
随机数表法抽样的步骤【典例训练】
1.要考察某种品牌的850颗种子的发芽率,从中抽取50颗种子进行实验,利用随机数表法抽取种子,先将850颗种子按001,002,…,850进行编号,如果从随机数表第3行第6列的数开始向右读,请依次写出最先检验的4颗种子的编号________.
(下面抽取了随机数表第1行至第5行.)2.现有一批零件,其编号为600,601,602,…,999.利用原有的编号从中抽取一个容量为10的样本进行质量检查,若用随机数表法,怎样设计方案?
【解析】1.从随机数表第3行第6列的数2开始向右读第一个小于850的数字是227,第二个数字665,第三个数字650,第四个数字267,符合题意.
答案:227,665,650,2672.第一步,在随机数表中任选一数字作为开始数字,任选一方向作为读数方向.比如:选第7行第6个数“7”,向右读.
第二步,从“7”开始向右每次读取三位,凡在600~999中的数保留,否则跳过去不读,依次得753,724,688,770,721,763,676,630,785,916.
第三步,以上号码对应的10个零件就是要抽取的对象.(答案不唯一)【互动探究】题1利用随机数表抽取样本,从第4行第5列开始向右读,则最先检验的4颗种子的编号为_______,______,_______,_______.
【解析】从第4行第5列向右开始读依次为:668,273,105,037
答案:668 273 105 037【想一想】随机数表法怎样保证抽样的公平性?应用随机数表法编号时的注意点是什么?
提示:(1)随机数表中每个位置上出现0,1,2,…,9这10个数的机会相同,我们把各位置上出现的数称为随机数,随机数表的这一随机性确保了抽取中每个个体被抽到的机会都相等.这样随机数表法就保证了抽样的公平.
(2)应用随机数表法时,对个体新编号码位数要相等,当问题所给位数不相等时,以位数较多的为准,在位数
较少的数前凑0,凑齐位数.【变式训练】从30个足球中抽取10个进行质量检测,说明利用随机数表法抽取这个样本的步骤及公平性.
【解析】第一步:首先将30个足球编号:00,01,02,…,29,
第二步:在随机数表中随机地选一个数作为开始.
第三步:从选定的数字向右读,得到二位数字,将它取出,把大于29的去掉,按照这种方法继续向右读,取出的二位数若与前面相同,则去掉,依次下去,就得到一个具有10个数据的样本.其公平性在于:第一,随机数表中每一个位置上出现的哪一个数都是等可能的,
第二,从30个个体中抽到哪一个个体的号码也是机会均等的,
基于以上两点,利用随机数表抽取样本保证了各个个体被抽到的机会是等可能的. 【易错误区】 随机抽样的易错点
【典例】某校期中考试后,为分析该校高二年级2 000名学生的学习成绩,从中随机抽取了200名学生的成绩单,下面说法正确的是( )
(A)2 000名学生是总体
(B)每个学生是个体
(C)200名学生的成绩是一个个体
(D)样本容量是200【解题指导】【解析】选D.根据有关的概念并且结合题意可得:此题的总体、个体、样本这三个概念考察的对象都是学生成绩①,而不是学生,并且一个个体是指一名学生的成绩②,而选项A,B表达的对象都是学生,不是成绩,选项C未将个体和样本理解透彻,所以A,B,C三项都错误.【阅卷人点拨】通过阅卷后分析,对解答本题的常见错误及解题启示总结如下:(注:此处的①②见解析过程)【即时训练】为了了解某校高三期中考学生成绩,用简单随机抽样的方法从中抽取了100名学生的成绩进行统计分析,在这个问题中,100被称为( )
(A)总体
(B)个体
(C)从总体中抽取的一个样本
(D)样本容量
【解析】选D.总体指的是某校高三期中考学生成绩,100名学生的成绩是样本,其中100为样本容量.1.现从80件产品中随机抽出20件进行质量检验,下列说法正确的是( )
(A)80件产品是总体 (B)20件产品是样本
(C)样本容量是80 (D)样本容量是20
【解析】选D.根据总体,样本和样本容量的关系可知D是正确的.2.在简单随机抽样中,某一个个体被抽到的可能性( )
(A)与第几次有关,第一次可能性最大
(B)与第几次有关,第一次可能性最小
(C)与第几次无关,与抽取的第几个样本有关
(D)与第几次无关,每次可能性相等
【解析】选D.∵在简单随机抽样中,每个个体被抽到的可能性都相等,与第几次无关,∴选项D正确.3.抽签法中确保样本代表性的关键是( )
(A)制签 (B)搅拌均匀
(C)逐一抽取 (D)抽取不放回
【解析】选A.逐一抽取、抽取不放回是简单随机抽样的特点,但不是确保代表性的关键.搅拌均匀是确保抽签法的公平性,因此,确保样本代表性的关键是制签.4.从100袋奶粉中抽取5袋进行检验,样本容量为__________.
【解析】从100袋奶粉中抽取5袋进行检验,这个样本容量为5.
答案:55.从60件产品中抽取10件进行检查,写出抽取样本的过程.
【解析】第一步,将60件产品编号01,02,…,60;
第二步,在随机数表中任取一数作为开始,如从第一行第一列开始;
第三步,从03开始向右读,依次选出03,47,43,36,46,33,26,16,45,60共10个对应编号的产品当作样本.课件55张PPT。2.1.2 系统抽样1.正确理解系统抽样的概念,掌握系统抽样的一般步骤.
2.通过对解决实际问题的过程的研究学会抽取样本的系统抽样方法,体会系统抽样与简单随机抽样的关系. 1.本节重点是正确理解系统抽样的概念.
2.本节难点是能够灵活应用系统抽样的方法解决统计问题.系统抽样
(1)定义:要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先规定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法. (2)步骤(l+k)(l+2k)加上间隔k简单随机抽样分段间隔k编号1.系统抽样如何提高样本的代表性?
提示:系统抽样所得样本的代表性和具体的编号有关,因此在系统抽样中就要提高编号的质量.例如,不要让编号呈现周期性.2.下列抽样中是系统抽样的是________(填序号).
①从标有1~15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样.
②工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔5分钟抽一件产品检验.
③搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止.④电影院调查观众的某一指标,请每排(每排人数相等)座位号为14的观众留下来座谈.
【解析】由系统抽样的概念可知,①②④是系统抽样.③不是,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的规则入样.
答案:①②④3.在一次有奖明信片的100 000个有机会中奖的号码(编号00000~99999)中,邮政部门按照随机抽取的方式确定后两位为37的号码为中奖号码,这是运用_______的抽样方法来确定中奖号码.写出这1 000个中奖号码中的前5个和最后5个依次是____________.【解析】由题意可知,选用的是系统抽样.根据系统抽样的原理可知:这几个数依次是:00037,00137,00237,00337,00437, 99537,99637,99737,99837,99937
答案:系统抽样 00037,00137,00237,00337,00437
99537,99637,99737,99837,99937系统抽样的理解
(1)系统抽样中,将总体中的个体均分后的第一段进行抽样时,采用简单随机抽样.
(2)系统抽样每次抽样时,总体中各个个体被抽取的概率也是相等的.
(3)如总体的个体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.
(4)整个抽样过程中每个个体被抽到的概率仍然相等. 系统抽样的基本概念
【技法点拨】
解决系统抽样问题的关注点
(1)当总体容量N较大时,采用系统抽样.
(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为 .(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.【典例训练】
1.人们打桥牌时,将洗好的扑克牌(52张)随机确定一张为起始牌,这时,开始按次序搬牌,对每一家来说,都是从52张总体中抽取一个13张的样本.则这种抽样方法是__________.
2.从2 012个编号中抽取20个号码入样,若采取系统抽样的方法,则抽样的间隔为__________.【解析】1.简单随机抽样的实质是逐个地从总体中随机抽取.而这里只是随机确定了起始张,这时其他各张虽然是逐张起牌的,其实各张在谁手里已被确定.
所以不是简单随机抽样,据其等距起牌的特点应将其定位为系统抽样.
答案:系统抽样2.若采用系统抽样的方法,2 012不能被20整除,故先利用简单随机抽样剔除12个,然后将2 000个数进行编号,将其平均分成20组,故每组100个数,则抽样的间隔为100.
答案:100【思考】(1)简单随机抽样,系统抽样有什么共同特点?
(2)解决题2的关键是什么?
提示:(1)两种抽样方法的共同点就是抽样过程中每个个体被抽取的机会相同.
(2)解决题2关键是剔除12个个体并合理分组.【变式训练】系统抽样又称为等距抽样,从N个个体中抽取n个
个体为样本,抽样距为 (取整数部分),从第一段
1,2,…,k个号码中随机抽取一个号码i0,则i0+k,…,i0+(n-1)k
号码均被抽取构成样本,所以每个个体被抽到的可能性是( )
(A)相等的 (B)不相等的
(C)与i0有关 (D)与编号有关【解析】选A.系统抽样对每个个体来说都是公平的,因此,每个个体被抽取的可能性是相等的. 系统抽样的设计
【技法点拨】
系统抽样的步骤
(1)编号(在保证编号的随机性的前提下,可以直接利用个体所带有的号码).
(2)分段(确定分段间隔k,注意剔除部分个体时要保证剔除的随机性和客观性). (3)确定起始个体编号l(在第1段采用简单随机抽样来确定).
(4)按照事先确定的规则抽取样本(通常是将l加上k,得到第2
个编号l+k,再将l+k加上k,得到第3个编号l+2k,这样继续下去,
直到获取整个样本).【典例训练】
1.某初级中学领导采用系统抽样方法,从该校预备年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号,求得间隔数 即每16人抽取一个人.在1~16中随机抽取一个数,如果抽到的是7,则从33~48这16个数中应取的数是________.
2.某装订厂平均每小时大约装订图书360册,要求检验员每小时抽取40册图书,检验其质量状况,请你设计一个抽样方案.【解析】1.∵采用系统抽样方法,每16人抽取一个人,
1~16中随机抽取一个数抽到的是7,
∴在第k组抽到的是7+16(k-1),
∴从33~48这16个数中应取的数是7+16×2=39.
答案:392.第一步:把这些图书分成40个组,由于 所以每个小组有9册书,
第二步:书进行编号,编号分别为0,1,…,359;
第三步:从第一组(编号为0,1,…,8)的书中用简单随机抽样的方法,抽取1册书.比如说,其编号为k;
第四步:按顺序抽取编号分别为下面的数字的图书:k,k+9,k+18,k+27,…,k+39×9.这样总共就
抽取了40个样本.【互动探究】把题2中的“360册”改为“362册”,其他不变
应怎么设计?
【解析】第一步:把这些图书分成40个组,由于 的商是9,余
数是2,所以每个小组有9册书,还剩2册书,这时抽样间距就是9;
第二步:先用简单随机抽样的方法从这些书中抽取2册,不进行
检验;第三步:将剩下的书进行编号,编号分别为0,1,…,359;
第四步:从第一组(编号为0,1,…,8)的书中用简单随机抽样的方法,抽取1册书.比如说,其编号为k;
第五步:按顺序抽取编号分别为下面的数字的图书:
k,k+9,k+18,k+27,…,k+39×9.这样总共就抽取了40个样本.【想一想】用系统抽样抽取样本,当 不是整数时,剔除多余
的个体会不会影响抽样的公平性呢?
提示:不会影响抽样的公平性,因为使用简单的随机抽样剔除
的多余的个体中每个个体被抽到并剔除都是等可能的,这样就
确保了抽样的公平性.【变式训练】某校高中三年级的295名学生已经编号为1,2,
…,295,为了了解学生的学习情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.
【解题指南】先求出样本容量,再按照系统抽样的基本步骤来写.
【解析】按照1∶5的比例,应该抽取的样本容量295÷5=59,
第一步:利用这295名学生已有编号1,2,…,295,作为抽样的编号;第二步:由 得,分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,第59组是编号为291~295的5名学生;
第三步:采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k≤5);
第四步:那么抽取的学生编号为k+5L(L=0,1,2,…,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,…,288,293. 简单随机抽样和系统抽样的综合应用
【技法点拨】
系统抽样与简单随机抽样的对比
(1)总体容量较大,抽取样本较多时,系统抽样比简单随机抽样更易实施,可节约成本.
(2)系统抽样所得到的样本的代表性和个体的编号有关,而简单随机抽样所得到的样本的代表性与个体编号无关.
(3)系统抽样的实质是简单的随机抽样.
(4)系统抽样比简单随机抽样应用更广泛.【典例训练】
1.下列说法错误的个数是( )
①总体的个体数不多时宜用简单随机抽样法;
②在总体均分后的每一部分进行抽样时,采用的是简单随机抽样;
③百货商场的抓奖活动是抽签法;
④整个系统抽样过程中,每个个体被抽取的机会相等.
(A)1 (B)2 (C)3 (D)42.下面给出某村委会调查本村各户收入情况做的抽样,阅读并回答问题.本村人口数:1 200,户数300,每户平均人口数4人;应抽户数:30;
抽样间隔: =40;
确定随机数字:取一张人民币,后两位数为12;
确定第一样本户:编号12的户为第一样本户;
确定第二样本户:12+40=52,52号为第二样本户
……(1)该村委会采用了何种抽样方法?
(2)抽样过程存在哪些问题,试修改.
(3)何处是用简单随机抽样?
【解析】1.选A.①③④是正确的,②不正确.系统抽样分组后,在第一组中采用简单随机抽样,其他组加分组间隔,不再用简单随机抽样.2.(1)系统抽样.
(2)本题是对某村各户进行抽样,而不是对某村人口抽样.抽样间隔: 其他步骤相应改为确定随机数字:取一张人民币,末位数为2.(假设)确定第一样本户:编号02的住户为第一样本户;确定第二样本户:2+10=12,12号为第二样本户.
(3)确定随机数字:取一张人民币,其末位数为2.【总结】系统抽样在第一组抽取个体时的抽样方法和解决题2的关键.
提示:(1)系统抽样时在第一组抽取个体时就是利用简单随机抽样.
(2)解决题2的关键是熟悉系统抽样的特点.【变式训练】在120个零件中,一级品24个,二级品36个,三级品60个,用系统抽样的方法从中抽取容量为20的样本,则每个个体被抽到的可能性为_________.
【解析】由系统抽样的概念可知,总体中的每个个体被抽到的可能性都相等,都等于
答案: 系统抽样的应用
【技法点拨】
系统抽样与简单随机抽样的比较
从对总体的代表性看,系统抽样不如简单随机抽样中所有个体都有相互独立的被选机会那样有较强的代表性,但从抽取个体在总体中分布的均匀程度来看,系统抽样的个体比简单随机抽样的个体在总体中的分布更均匀.【典例训练】1.某质检人员从编号为1~100的100件产品中,依次抽出号码为3,7,13,17,23,27,…,93,97的产品进行检验,则这样的抽样方法是( )
(A)简单随机抽样
(B)系统抽样
(C)抽签法
(D)以上都不对2.某车间有189名职工,现在要按1∶21的比例从职工中选出质量检查员,采用哪种抽样方法较好?写出过程.
【解析】1.选B.从编号依次为1到100的产品中抽取20件进行检验,先将编号为1~100的100件产品分成10组,每组抽两件,第一组:3,7;下面依次抽出号码为13,17,23,27,…,93,97的产品进行检验采用的是系统抽样.故选B.2.采用系统抽样法较好.步骤如下:
第一步,将189名在岗职工随机的编号为1,2,3,…,189;
第二步,由于样本容量与总体容量的比是1∶21,所以我们将总体平均分成9个部分,其中每一部分包含21个个体;
第三步,在第一部分,即1号到21号用简单随机抽样,抽取一个号码.比如是11;
第四步,以11作为起始数,然后顺次抽取32,53,74,…,179,这些号所对应的9名职工选为质量检查员.【易错误区】 系统抽样的易错点
【典例】从2 009名学生中选取50名学生参加数学竞赛,若采用下面方法选取:先用简单随机抽样从2 009人中剔除9人,剩下的2 000人再按系统抽样的方法抽取50人,则在2 009人中,每个人入选的机会( )
(A)都相等,且为 (B)不全相等
(C)均不相等 (D)都相等,且为【解题指导】 【解析】选A.∵在系统抽样中,若所给的总体个数不能被样本容量整除,则要先剔除几个个体,本题要先剔除9人①,然后再分组,
在剔除过程中,每个个体被剔除的机会相等,
∴每个个体被抽到包括两个过程,一是不被剔除,二是被选中,这两个过程是相互独立的,所以,每个人入选的机会都相等,且为 ②.【阅卷人点拨】通过阅卷后分析,对解答本题的常见错误及解题启示总结如下:(注:此处的①②见解析过程)【即时训练】为了调查某产品的销售情况,销售部门从下属的92家销售连锁店中抽取30家了解情况,若用系统抽样方法,则抽样间隔和随机剔除的个数分别为( )
(A)3,2 (B)2,3
(C)2,30 (D)30,2【解析】选A.∵92÷30不是整数,
∴必须先剔除部分个体.
∵92÷30=3……2,
∴剔除2个即可,间隔为3.1.系统抽样适用的总体应是( )
(A)容量较少的总体
(B)总体容量较多
(C)个体数较多但均衡的总体
(D)任何总体
【解析】选C.系统抽样适用的总体应是个体数较多但均衡的总体.2.为了解1 200名学生对学校教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k为
( )
(A)40 (B)30 (C)20 (D)12
【解析】选A. 3.某商场想通过检查发票及销售记录的2%来快速估计每月的销售金额.采用如下方法:从某本50张发票存根中随机抽取一张,如15号,然后按顺序往后依次抽出65号,115号,165号……发票上的销售金额组成一个调查样本.这种抽样的方法是( )
(A)抽签法 (B)随机数表法
(C)系统抽样法 (D)其他方式的抽样【解析】选C.题干所述抽样方法是将发票平均分成若干组,每组50张,从第一组中抽出15号,以后各组抽取15+50(n-1)(n∈N*)号,符合系统抽样的特点.4.一个总体中有100个个体,随机编号0,1,2,…,99.依编号顺序平均分成10个组,组号依次为1,2,3,…,10,现用系统抽样方法抽取一个容量为10的样本,规定如果在第一组随机抽取的号码为t,则在第k组中抽取的号码个位数字与t+k的个位数字相同,若t=7,则在第8组中抽取的号码应该是____.
【解析】∵k=8,t=7,t+k=15,
∴在第8组中抽取的号码是75.
答案:755.已知某商场新进3 000袋奶粉,为检查其三聚氰胺是否超标,现采用系统抽样的方法从中抽取150袋检查,若第一组抽出的号码是11,则第61组抽出的号码为___________.
【解析】3 000袋奶粉,用系统抽样的方法从中抽取150袋,每组中有20袋,
第一组抽出的号码是11,则第61组抽出的号码为11+60×20=
1 211.
答案:1 2116.某公司有1 000名职工,从中抽取10人参加培训,试用系统
抽样进行具体实施.
【解析】第一步:将每个职工随机编号为:0001,0002,
0003,…,1000.
第二步:分段,取间隔 将总体分为10组,每组100
名职工.
第三步:从第一组0001号至0100号中随机抽取一个号i0.
第四步:按编号将i0,i0+100,i0+200,…,i0+900共10个号码选
出. 这10个号码所对应职工即组成样本.课件61张PPT。2.1.3 分层抽样1.理解分层抽样的概念.
2.掌握分层抽样的一般步骤.
3.区分简单随机抽样、系统抽样和分层抽样,并选择适当的方法进行抽样. 1.本节重点是正确理解分层抽样的定义和步骤.
2.本节难点是灵活应用分层抽样抽取样本,并恰当地选择三种抽样方法解决现实生活中的抽样问题.分层抽样的有关概念
(1)一般地,在抽样时,将总体分成_________的层,然后按
照一定的_____,从各层独立地抽取一定数量的个体,将各层取
出的个体合在一起作为样本,这种抽样方法称为分层抽样.
(2)每个个体被抽中的可能性_____.互不交叉比例相同1.分层抽样的总体具有什么特性?
提示:分层抽样的总体由差异明显的几部分构成,也就是说当已知总体由差异明显的几部分组成时,为了使样本充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样.2.一个班共有54人,其中男女比5∶4,若抽取9人参加教改调查
会,则每个男同学被抽取的可能性为_____,每个女同学被抽
取的可能性为______.
【解析】男女每人被抽取的可能性是相同的,因为男同学共有
(人),女同学共有 (人).所以每个
男同学被抽取的可能性为 每个女同学被抽取的可能性
为
答案:3.为调查某班学生的平均身高,从50名学生中抽取5名,抽样方法是_______,如果男生的身高和女生的身高有显著不同(男生30人,女生20人),抽样方法是______.
【解析】根据总体特点选择恰当的抽样方法.
答案:简单随机抽样 分层抽样4.一个工厂有若干车间,今采用分层抽样的方法从全厂某天的2 048件产品中抽取一个容量为128的样本进行质量检查.若一车间这一天生产256件产品,则从该车间抽取的产品件数为__
__________.
【解析】设应抽取x件,
则 ∴x=16.
答案:16简单随机抽样、系统抽样、分层抽样的比较 分层抽样的概念
【技法点拨】
分层抽样的前提和遵循的两条原则
(1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取.(2)遵循的两条原则:
①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.【典例训练】
1.下列问题中,最适合用分层抽样抽取样本的是( )
(A)从10名同学中抽取3人参加座谈会
(B)某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本
(C)从1 000名工人中,抽取100名调查上班途中所用时间
(D)从生产流水线上,抽取样本检查产品质量2.分层抽样又称为类型抽样,即将相似的个体归入一类(层),然后每层各抽若干个个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行( )
(A)每层内等可能抽样
(B)每层内不等可能抽样
(C)所有层用同一抽样比
(D)所有层抽同样多样本容量【解析】1.选B.A中总体个体无明显差异且个数较少,适合用简单随机抽样;C和D中总体个体无明显差异且个数较多,适合用系统抽样;B中总体个体差异明显,适合用分层抽样.
2.选C.由分层抽样的定义和特点可知,所有层用同一个抽样比,等可能抽样.
【想一想】解答题2的关键是什么?
提示:关键是理解分层抽样的实质是保证每个个体等可能入样. 【变式训练】某初级中学有学生270人,其中七年级108人,八、九年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案.使用简单随机抽样和分层抽样时,将学生按七、八、九年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,60,90,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270.
其中可能是分层抽样得到,而不可能是由系统抽样得到的一组号码为( )
(A)①② (B)②③ (C)①③ (D)①④【解析】选B.先考虑哪种情况为分层抽样,分层抽样需按年级分三层,七年级抽取4人,八、九年级各抽3人,也即1到108号抽4人,109到189号抽3人,190到270号抽3人.可判断①②③可能是分层抽样.再判断①②③中哪几个是系统抽样,系统抽样需把1到270号分成均匀的10部分.每部分按事先约定好的方法抽取1个,则①为系统抽样.故选B. 分层抽样的设计
【技法点拨】
分层抽样的操作步骤
第一步,计算样本容量与总体的个体数之比.
第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数.
第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体.
第四步,将各层抽取的个体合在一起,就得到所取样本. 【典例训练】
1.将一个总体分为A,B,C三层,其个体数之比为5∶3∶2.若用分层抽样方法抽取容量为100的样本,则应从C中抽取______个个体.
2.一个地区共有5个乡镇,人口3万人,其人口比例为3∶2∶ 5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.【解析】1.∵A,B,C三层个体数之比为5∶3∶2,
又有总体中每个个体被抽到的概率相等,
∴分层抽样应从C中抽取
答案:202.因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法.
具体过程如下:
(1)将3万人分为5层,其中一个乡镇为一层.
(2)按照样本容量的比例求得各乡镇应抽取的人数分别为60人、40人、100人、40人、60 人.
(3)按照各层抽取的人数随机抽取各乡镇应抽取的样本.
(4)将300人合到一起,即得到一个样本.【互动探究】若把题1个体数之比改为2∶3∶4,现用分层抽样方法抽出一个容量为n的样本,其中A层中的个体数为16,那么此样本容量为n=________.
【解析】由于A层中的样本数为16,A层中的个体所占的比例为
故样本容量
答案:72【思考】如何保证分层抽样的公平性?
提示:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,各层之间的样本差异要大且互不重叠.
(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样.
(3)在每层抽样时,应采用简单随机抽样或系
统抽样的方法进行抽样.【变式训练】某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解他们对政府机构的改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,并写出具体实施抽取的步骤.【解题指南】根据副处级干部,一般干部和工人对政府机构改革的意见有明显差异,这是三类不同的人群,因此应采用分层抽样,按照 的比例进行分层抽取.
【解析】用分层抽样方法抽取.
具体实施抽取步骤如下:
①∵20∶100=1∶5,
∴从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.②因副处级以上干部与工人的人数较少,将他们分别按1~10和1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人采用先对其按00,01,02,…,69编号,然后用随机数表法抽取14人.
③将抽取的2人,4人,14人汇合在一起就得到了容量为20的样本. 抽样方法的综合应用
【技法点拨】
抽样方法的选取方法
(1)若总体由差异明显的几个层次组成,则选用分层抽样.
(2)若总体没有差异明显的层次,则考虑采用简单随机抽样或系统抽样.
当总体容量较小时宜用抽签法;当总体容量较大,样本容量较小时宜用随机数表法;当总体容量较大,样本容量也较大时宜用系统抽样(3)采用系统抽样时,当总体容量N能被样本容量n整除时,抽样间隔为 当总体容量不能被样本容量整除时,先用简单随机抽样剔除多余个体,抽样间隔为【典例训练】
1.(2012·浏阳高一检测)①学校为了了解高一学生的情况,从每班抽2人进行座谈;②一次数学竞赛中,某班有10人的成绩在110分以上,10人的成绩在100~110分,30人的成绩在
90~100分,12人的成绩低于90分,现在从中抽取12人了解有关情况;③运动会服务人员为参加400 m决赛的6名同学安排跑道.就这三件事,合适的抽样方法为( )(A)分层抽样,分层抽样,简单随机抽样
(B)系统抽样,系统抽样,简单随机抽样
(C)分层抽样,简单随机抽样,简单随机抽样
(D)系统抽样,分层抽样,简单随机抽样2.为了考察某学校的教学水平,将抽取这个学校高三年级的部分学生本学年的考试成绩进行考察,为了全面反映实际情况,采取以下三种方式进行抽查(已知该学校高三年级共有20个教学班,并且每个班内的学生按随机方式编好了学号,假定该校每班学生人数都相同):
①从全年级20个班中任意抽取一个班,再从该班任意抽取20人,考察他们的学习成绩;②每个班都抽取1人,共计20人,考察这20个学生的成绩;
③把学生按成绩分成优秀、良好、普通三个级别,从中共抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人).
根据上面的叙述,回答下列问题:
(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?
(2)上面三种抽取方式中各自采用何种抽样方法?
(3)试分别写出上面三种抽取方式各自抽取样本的步骤.【解析】1.选D.系统抽样适合总体中个体数量比较大的情况.分层抽样适合总体由差异明显的几层组成的.总体中个体数比较少的时候,选用简单随机抽样.2.(1)三种抽取方式中,其总体都是高三全体学生本学年的考试成绩,个体都是指高三年级每个学生本学年的考试成绩.第一种抽取方式中,样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第二种抽取方式中,样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第三种抽取方式中,样本为所抽取的100名学生本学年的考试成绩,样本容量为100.(2)三种抽取方式中,第一种方式采用的是简单随机抽样法;第二种方式采用的是系统抽样法和简单随机抽样法;第三种方式采用的是分层抽样法和简单随机抽样法.(3)第一种方式抽样的步骤如下:
第一步:在这20个班中用抽签法任意抽取一个班;
第二步:从这个班中按学号用随机数法或抽签法抽取20名学生,考察其考试成绩.第二种方式抽样的步骤如下:
各个班的学生按1,2,3,…编号;
第一步:在第一个班中,用简单随机抽样法任意抽取某一学生,记其编号为a;
第二步:在其余的19个班中,选取编号为a的学生,共计20人.第三种方式抽样的步骤如下:
第一步:分层.若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,总体由差异明显的三部分组成,所以在抽取样本时,应把全体学生分成三个层次.
第二步:确定各个层次抽取的人数.因为样本容量与总体个体数的比为100∶1 000=1∶10,
所以在每个层次抽取的个体数依次为
即15,60,25.第三步:按层次分别抽取.在优秀生中用简单随机抽样法抽取15人;在良好生中用简单随机抽样法抽取60人;在普通生中用简单随机抽样法抽取25人.【思考】解决题1的关键点以及题2中易发生何种失误?
提示:(1)解决题1的关键点是弄清各种抽样的适用条件.
(2)在解答题2中易对采用哪种抽样方式判断失误.【变式训练】某批零件共160个,其中一级品有48个,二级品有64个,三级品有32个,等外品有16个.从中抽取一个容量为20的样本.试简要叙述用简单随机抽样、系统抽样、分层抽样法进行抽样都是等可能抽样.
【解析】(1)简单随机抽样法:可采用抽签法,将160个零件按1~160编号,相应地制作1~160号的160个号签,从中随机抽20个即可.每个个体被抽到的概率为 即每个个体被抽到的可能性相同.(2)系统抽样法:将160个零件按1~160编号,按编号顺序分成20组,每组8个.先在第一组用抽签法抽得k号(1≤k≤8),则在其余组中分别抽得第k+8n(n=1,2,3,…,19)号,每个个体被抽到的概率为 即每个个体被抽到的可能性相同.(3)分层抽样法:按比例 分别在一级品、二级品、
三级品、等外品中抽取
每个个体被抽到的概率分别为
即都是 每个个体被抽到的可能性相同.
综上所述,无论采取哪种抽样,总体中每个个体被抽到的概率
都是 分层抽样的应用
【技法点拨】
分层抽样的简单应用
(1)分层抽样法的应用主要包括如何进行分层、分几层、每层应抽取多少个体等.
(2)分层抽样时,每个个体被抽到的机会是均等的.由于分层抽样充分利用了已知信息,使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着非常广泛的应用.【典例训练】
1.某校500名学生中,O型血有200人,A型血有125人,B型血有125人,AB型血有50人.为了研究血型与色弱的关系,需从中抽取一个容量为20的样本.按照分层抽样方法抽取样本,各种血型的人所抽的数目分别为_________.2.某中学高中学生有900名,学校要从中选出9名同学作为国庆60周年庆祝活动的志愿者.已知高一有400名学生,高二有300名学生,高三有200名学生.为了保证每名同学都有参与的资格,学校采用分层抽样的方法抽取,求高一、高二、高三分别抽取学生的人数.【解析】1.
故O型血抽8人,A型血抽5人,B型血抽5人,AB型
血抽2人.
答案:8,5,5,2
2.样本容量与总体容量的比为: 所以在高一年级应
抽取 在高二年级应抽取 (人),
在高三年级应抽取 (人),即高一、高
二、高三分别抽取学生的人数为4人、3人、2人. 【易错误区】 抽样方法中考虑不全致误
【典例】某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本,如果采用系统抽样和分层抽样方法抽取,不用剔除个体;如果样本容量增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求得样本容量为_______.【解题指导】【解析】总体容量N=36人.
当样本容量为n时,系统抽样间隔为 ,所以n是 36的约
数;
分层抽样的抽样比为 求得工程师、技术员、技工的抽样
人数分别为 所以n应是6的倍数,
所以n=6或12或18或36①.
当样本容量为n+1时,总体中先剔除1人时还有35人,系统抽样间
隔为 所以n只能是6.
答案:6 【阅卷人点拨】通过阅卷后分析,对解答本题的常见错误及解题启示总结如下:(注:此处的①②见解析过程)【即时训练】今年“3·15”,某报社做了一次关于“什么是新时代的雷锋精神?”的调查,在A,B,C,D四个单位回收的问卷数依次成等差数列,共回收1 000份.因报道需要,再从回收的问卷中按单位分层抽取容量为150的样本.若在B单位抽取30份,则在D单位抽取的问卷是_________份.【解析】因为A,B,C,D四个单位回收的问卷数依次成等差数列,故四个单位抽取容量也成等差数列,设公差为d,则A,B,C,D四个单位抽取容量分别为:30-d,30,30+d,30+2d,所以30-d+30+30+d+30+2d=150,d=15,所以在D单位抽取的问卷是60份.
答案:601.一个年级有12个班,每个班的同学从1至50排学号,为了交流学习经验,要求每班学号为14的同学留下进行交流,这里运用的是( )
(A)分层抽样 (B)抽签抽样
(C)随机抽样 (D)系统抽样
【解析】选D.依据概念,区分各种抽样方法.2.某单位有职工160人,其中业务员104人,管理人员32人,后勤服务人员24人,现用分层抽样法从中抽取一容量为20的样本,则抽取管理人员( )
(A)3人 (B)4人 (C)7人 (D)12人
【解析】选B.由 设取管理人员x人,则 得x=4.3.某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取一个容量为45的样本,那么高一、高二、高三各年级抽取人数分别为( )
(A)15,5,25 (B)15,15,15
(C)10,5,30 (D)15,10,20
【解析】选D.设高一、高二、高三各年级分别抽取的人数为x,y,z,由 可直接求出.4.一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工________人.
【解析】∵单位共有职工200人,
取一个容量为25的样本,
∴依题意知抽取超过45岁的职工人数为 (人).
答案:105.对某单位1 000名职工进行某项专门调查,调查的项目与职工任职年限有关,人事部门提供了如下资料:试利用上述资料,设计一个抽样比为 的抽样方法.
【解析】因为抽样比为 ,
故只需从1 000人中抽取1 000× =100(人).
故从任职5年以下的抽取300× =30(人),
任职5年~10年的抽取500× =50(人),
任职10年以上的抽取200× =20(人).课件69张PPT。2.2.1 用样本的频率分布估计总体分布1.理解用样本的频率分布估计总体分布的思想方法.
2.会列频率分布表,会画频率分布直方图、频率分布折线图和茎叶图. 1.本课重点是学会列频率分布表,画频率分布直方图、频率分布折线图和茎叶图.体会它们各自的特点;
2.本课难点是理解用样本频率分布估计总体分布的意义与作用.1.用样本估计总体的两种情况
(1)用样本的_________估计总体的分布.
(2)用样本的_________估计总体的数字特征.频率分布数字特征2.频率分布直方图的画法3.频率分布折线图和总体密度曲线光滑曲线中点4.茎叶图的概念
茎是指_____________,叶就是从茎的旁边生长出来的数.茎叶
图可用来分析单组数据,也可以对两组数据进行比较.茎叶图不
仅能够保留原始数据,而且能够展示数据的分布情况.中间的一列数1.如何对样本数据进行分组?
提示:对样本数据进行分组,一般样本容量越大,所分组数越多.
2.在频率分布直方图中,各小长方形的面积表示什么?它们的总和是多少?
提示:各小长方形的面积表示样本中落在该组内的数据的频率;总和等于1.3.一个容量为40的样本数据,分组后,组距与频数如下:[5,10)5个;[10,15)12个;[15,20)7个;[20,25)5个;[25,30)7个;[30,35]4个.则样本在区间[20,+∞)上的频率为_______.
【解析】在区间[20,+∞)上的频数为5+7+4=16,故所求频率为
答案:0.44.200辆汽车通过某一段公路时的时速频率分布直方图如图所示,则时速在[50,60)内的汽车大约有_______辆.
【解析】时速在[50,60)内的频率为0.3,所以时速在[50,60)内的汽车大约有200×0.3=60(辆).
答案:601.频率分布与总体分布
频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律.我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.2.频率分布表和频率分布直方图
两者是对相同数据的两种不同表达方式.用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.3.用茎叶图表示数据分布情况的优点及应用
(1)优点:
①保留了原始数据,没有损失样本信息;
②数据可以随时记录、添加或修改.
(2)应用:从茎叶图中可以观察出样本数据的平均水平,也可以判断样本数据的分散程度. 频率分布直方图的画法
【技法点拨】
频率分布直方图的特征
(1)从频率分布直方图可以清楚地看出数据分布的总体趋势.
(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.【典例训练】
1.在用样本估计总体分布的过程中,下列说法正确的是( )
(A)总体容量越大,估计越精确
(B)总体容量越小,估计越精确
(C)样本容量越大,估计越精确
(D)样本容量越小,估计越精确2.为了了解一大片经济林的生长情况,随机测量其中的100株的底部周长,得到如下数据表(长度单位:cm).(1)列出频率分布表;
(2)绘制频率分布直方图;
(3)估计该片经济林中底部周长小于100 cm的树木约占多少?周长不小于120 cm的树木约占多少?【解析】1.选C.样本容量越大,所涉及的数据越多,反映的信息越接近实际情况,即估计越精确.
2.(1)从表中可以看出,这组数据的最大值为135,最小值为80,故极差为55,可将其分为11组,组距为5.
从第一组[80,85)开始,将各组的频数、频率和 填入表中. (2)绘制频率分布直方图: (3)从频率分布表可以看出,该样本中
小于100的频率为
0.01+0.02+0.04+0.14=0.21,
不小于120的频率为
0.11+0.06+0.02=0.19,
故可估计该片经济林中底部周长小于100 cm的树木约占21%,周长不小于120 cm的树木约占19%.【归纳】绘制频率分布直方图的注意事项.
提示:(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.
(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.【变式训练】有一个容量为50的样本,数据分组及各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5],4.
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)画出数据频率分布折线图.【解析】(1)频率分布表为(2)频率分布直方图为(3)数据频率分布折线图为 茎叶图的画法及应用
【技法点拨】
茎叶图的画法步骤
(1)将所有两位数的十位数字(或三位数的百位与十位数字)作为“茎”,茎按从小到大顺序排列,茎相同者共用一个茎,再画上竖线作为分界线.
(2)在分界线的另一侧对应茎处,记录下“叶”——个位数字.【典例训练】
1.为了解某校教师使用多媒体进行教学
的情况,采用简单随机抽样的方法,从
该校200名教师中抽取20名,调查了他
们上学期使用多媒体进行教学的次数,
结果用茎叶图表示如图:据此可估计该
校上学期200名教师中,使用多媒体进行教学次数在[15,25)内的人数为_________.2.从两个班中各随机抽取10名学生,他们的数学成绩如下:
甲班:76,74,82,96,66,76,78,72,52,68
乙班:86,84,62,76,78,92,82,74,88,85
画出茎叶图并分析两个班学生的数学学习情况.【解析】1.在抽取的20名教师中,在[15,25)内的人数为6人,据此可估计该校上学期200名教师中,使用多媒体进行教学次数在[15,25)内的人数为60.
答案:602.茎叶图如下:
由茎叶图可知,乙班的数学成绩较好,而且较稳定.【思考】若所给学生的成绩是150分满分,即有123,142等,如何画茎叶图?
提示:可把茎确定为5,6,7,8,9,10,11,12,13,14,15,叶相应去写.【变式训练】如图是2012年青年歌手大奖赛中七位评委为甲、乙两名选手打出的分数的茎叶图
(图中m为数字0~9中的一个),
去掉一个最高分和一个最低分后,
甲、乙两名选手得分的平均数分
别为a1,a2,则一定有( )
(A)a1>a2 (B)a2>a1
(C)a1=a2 (D)a1,a2的大小与m的值有关【解析】选B.根据茎叶图可知,去掉一个最高分和一个最低分后,甲的平均分为 乙的平均分为
故a2>a1. 频率分布直方图的应用
【技法点拨】
频率分布直方图的性质
(1)每个小矩形的面积表示样本数据落在该组内的频率.
(2)所有小矩形的面积和等于1.
(3)利用一组的频数和频率,可以求样本容量. 【典例训练】
1.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在[2 700,3 000)的频率为________.2.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?【解析】1.根据频率分布直方图中小矩形的面积表示样本数据落在该区间内的频率,可得所求频率为0.001×300=0.3.
答案:0.3
2.(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,
因此第二小组的频率为:
又因为频率=
所以样本容量=
(2)由图可估计该学校高一学生的达标率约为【互动探究】试求题2样本中不达标的学生人数.
【解析】样本容量为150,不达标的学生频率为1-0.88=0.12.所以,样本中不达标的学生有150×0.12=18(人).【归纳】应用频率分布直方图时的易错点.
提示:应用频率分布直方图时易把图中纵轴表示的 误以为频率.【变式训练】(2012·聊城高一检测)如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下,观察图形,回答下列问题.(1)[79.5,89.5)这一组的频数、频率分别是多少?
(2)[59.5,99.5)这一组的频率是多少?
(3)估计这次环保知识竞赛的及格率(60分及以上为及格).
【解析】(1)频率为0.025×10=0.25,频数为60×0.25=15.
(2)0.015×10+0.03×10+0.025×10+0.005×10=0.75.
(3)60分及以上的频率为0.015× ×10+
0.03×10+0.025×10+0.005×10=0.742 5.
故这次环保知识竞赛的及格率约为74.25%. 频率分布直方图的综合应用
【技法点拨】
对频率分布直方图的理解
(1)同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也不同,不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断.
(2)频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.【典例训练】1.为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为( )(A)64 (B)54 (C)48 (D)272.如图是某市有关部门根据该市干部的月收入情况,进行抽样调
查后画出的样本频率分布直方图.已知图中第一组的频数为
4 000,请根据该图提供的信息解答下列问题:图中每组包括左
端点,不包括右端点,如第一组表示收入在[1 000,1 500),
最后一组左、右端点都包含.(1)求样本中月收入在[2 500,3 500)的人数.
(2)为了分析干部的收入与年龄、职业等方面的关系,必须从样本的各组中按月收入再用分层抽样方法抽出100人进行分析,则月收入在[1 500,2 000)的这段应抽多少人?
【解析】1.选B.由题意和直方图知,第一小组和第二小组的人数为(0.5+1.1)×0.1×100=16(人),第三小组的人数为100-16-62=22(人),则第四小组的人数为(a-22)人,
解得a=54.2.(1)∵月收入在[1 000,1 500)的频率为0.000 8×500 =0.4,且有4 000人,
∴样本的容量
月收入在[1 500,2 000)的频率为0.000 4×500=0.2;
月收入在[2 000,2 500)的频率为0.000 3×500=0.15;
月收入在[3 500,4 000]的频率为0.000 1×500=0.05.
∴月收入在[2 500,3 500)的频率为
1-(0.4+0.2+0.15+0.05)=0.2.∴样本中月收入在[2 500,3 500)的人数为0.2×10 000=
2 000.
(2)∵月收入在[1 500,2 000)的人数为0.2×10 000=
2 000,
∴再从10 000人中用分层抽样方法抽出100人,则月收入在
[1 500,2 000)的这段应抽取 (人). 【易错误区】求解频率分布直方图问题时的常见错误
【典例】(2011·湖北高考)有一个容量为200的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( )(A)18 (B)36 (C)54 (D)72 【解题指导】 【解析】选B.设样本数据落在区间[10,12)内的频率为2x,则(0.02+0.05+x+0.15+0.19)×2=1①,得x=0.09,所以样本数据落在区间[10,12)内的频数为0.09×2×200=36.【阅卷人点拨】通过阅卷后分析,对解答本题的常见错误及解题启示总结如下:(注:此处的①见解析过程)【即时训练】某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;…,第六组,成绩大于等于18秒且小于等于19秒.如图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为( )(A)0.9,35 (B)0.9,45
(C)0.1,35 (D)0.1,45【解析】选A.由频率分布直方图可得成绩小于17秒的学生人数占全班总人数的百分比为(0.02+0.18+0.34+0.36)×1=0.9,
成绩大于等于15秒且小于17秒的学生人数为(0.34+0.36)×1×50=35. 1.在100个人中,有40个学生,21个干部,29个工人,10个农民,则0.29是工人的( )
(A)频数 (B)频率
(C)累计频率 (D)累计频数
【解析】选B. 表示频率.2.一个容量为20的样本数据,分组情况与相应频数如表,
则样本在区间(-∞,50)上的频率为( )
(A)0.5 (B)0.25 (C)0.6 (D)0.7
【解析】选D.所求频率为3.某赛季甲、乙两名篮球运动员各13场比赛得分情况用茎叶图表示如下:根据上图,对这两名运动员的成绩进行比较,下列四个结论中,不正确的是( )
(A)甲运动员得分的极差大于乙运动员得分的极差
(B)甲运动员得分的中位数大于乙运动员得分的中位数
(C)甲运动员的得分平均值大于乙运动员的得分平均值
(D)甲运动员的成绩比乙运动员的成绩稳定
【解析】选D.容量相同的样本数据,甲的分散在4个茎上,而乙只在3个茎上,应该是乙的比甲的稳定.4.有一个容量为45的样本数据,分组后各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5],4.由此估计,小于27.5的数据约为总体的______.
【解析】小于27.5的数据约为总体的百分比为
答案:91%5.为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行分层抽样调查,测得身高情况的统计图如图:(1)估计该校男生的人数;
(2)估计该校学生身高在170~185 cm的概率.
【解析】(1)样本中男生人数为40,由分层抽样比例为10%估计该校男生人数为400.
(2)由统计图知,样本中身高在170 cm~185 cm的学生有14+13+4+3+1=35(人),样本容量为70,所以样本中学生身高在170 cm~185 cm的频率为 故由此估计该校学生身高在170 cm~185 cm的概率为0.5.课件57张PPT。2.2.2 用样本的数字特征估计
总体的数字特征 1.能从样本数据中提取基本的数字特征(如平均数、众数、中位数),并进行合理的解释.
2.正确理解样本数据标准差的意义和作用,学会计算数据的标准差.
3.会用样本的基本数字特征估计总体的基本数字特征. 1.本课重点是用样本平均数和标准差估计总体的平均数与标准差.
2.本课难点是能应用相关知识解决简单的实际问题. 1.众数、中位数、平均数的概念
(1)众数:一组数据中_____________的数.
(2)中位数:一组数据按大小顺序排列后,处于_____位置的
数.如果个数是偶数,则取_____两个的平均数.
(3)平均数:一组数据的___除以数据个数所得到的数.
2.标准差与方差的概念
标准差是样本数据到平均数的一种_________,一般用s表示,
即样本数据x1,x2,…,xn的标准差 出现次数最多中间中间和平均距离
S=________________________________,
方差
S2=________________________________.1.在某项体育比赛中,七位裁判为一选手打出的分数如下:90 89 90 95 93 94 93计算平均分时,一般要去掉一个最高分和一个最低分,其目的是什么?
提示:消除极端值的影响.2.对数字特征的理解中,下列说法正确的是_______.
①数据5,4,4,3,5,2的众数为4;
②数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半;
③方差与标准差具有相同的单位;
④如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.
【解析】①中的众数应为4和5;②正确;③不正确;④正确,平均数也应减去该常数,方差不变.
答案:②④3.若M个数的平均数是X,N个数的平均数是Y,则M+N个数的平均数是______.
【解析】M个数的和为MX,N个数的和为NY,则M+N个数的和为
MX+NY,所以其平均数为
答案:4.已知五个数据3,5,7,4,6,则该样本的标准差为______.
【解析】
答案:1.众数、中位数、平均数的特点
(1)众数:①众数容易计算;②众数只能表示样本数据中的很少一部分信息;③众数可以反映一组数据的多数水平.
(2)中位数:①中位数易计算,能较好地表现数据信息;②中位数不受少数极端数据的影响;③中位数通常用来描述分类变量的中心位置.
(3)平均数:平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大. 2.对方差与标准差概念的理解
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
(2)标准差、方差的取值范围:[0,+∞).
标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性. (3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差. 众数、中位数、平均数的计算
【技法点拨】
利用样本数字特征进行决策时的两个关注点
(1)平均数与每一个数据都有关,可以反映更多的总体信息,但受极端值的影响大;中位数是样本数据所占频率的等分线,不受几个极端值的影响;众数只能体现数据的最大集中点,无法客观反映总体特征. (2)当平均数大于中位数时,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值. 【典例训练】
1.10名工人某天生产同一零件,生产的件数是15,17,14,10,
15,17,17,16,14,12,设其平均数为a,中位数为b,众数为
c,则有( )
(A)a>b>c (B)b>c>a
(C)c>a>b (D)c>b>a
2.某房间中10个人的平均身高为1.74米,身高为1.85米的第11个人进入房间后,这11个人的平均身高是_______. 3.下面是某快餐店所有工作人员一周的收入表:
(1)计算所有人员的周平均收入;
(2)这个平均收入能反映打工人员的周收入的一般水平吗?为什么?
(3)去掉老板的收入后,再计算平均收入,这能代表打工人员的周收入的水平吗? 【解析】1.选D.平均数
中位数b=15,众数c=17.∴c>b>a.
2.原来的10个人的身高之和为17.4米,所以,这11个人的平
均身高为 即这11个人的平均身高为1.75米.
答案:1.75米
3.(1)周平均收入
=750(元). (2)这个平均收入不能反映打工人员的周收入水平,可以看出打工人员的收入都低于平均收入,因为老板收入特别高,这是一个异常值,对平均收入产生了较大的影响,并且他不是打工人员.
(3)去掉老板的收入后的周平均收入 (450+350+400+
320+320+410)=375(元).这能代表打工人员的周收入水平. 【思考】在题3中,为什么(3)中去掉老板的收入后,再计算平均收入,能代表打工人员的周收入的水平?
提示:因为老板收入是个特殊数据,对平均值产生很大的影响,因此从统计分析的某一角度进行分析时,应剔除. 【变式训练】(2012·黄冈模拟)如图是某赛季甲、乙两名篮球运动员每场比赛得分茎叶图,则在这几场比赛得分中甲的中位数与乙的众数之和是( )
(A)50 (B)41 (C)51 (D)61.5【解析】选C.甲的中位数是 =27,乙的众数是24,所以甲的中位数与乙的众数之和是51. 标准差(方差)的计算及应用
【技法点拨】
1.计算标准差的五个步骤
(1)算出样本数据的平均数 .
(2)算出每个样本数据与样本数据平均数的差:
(3)算出(2)中的xi- (i=1,2,3,…,n)平方.
(4)算出(3)中n个平方数的平均数,即为样本方差. (5)算出(4)中方差的算术平方根,即为样本标准差.
2.标准差(方差)的两个作用
(1)标准差(方差)较大,数据的离散程度较大;标准差(方差)较小,数据的离散程度较小.
(2)在实际应用中,常常把平均数与标准差结合起来进行决策.在平均值相等的情况下,比较方差或标准差以确定稳定性. 【典例训练】
1.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
(A)甲地:总体均值为3,中位数为4
(B)乙地:总体均值为1,总体方差大于0
(C)丙地:中位数为2,众数为3
(D)丁地:总体均值为2,总体方差为3 2.(2012·菏泽高一检测)从甲、乙两名学生中选拔一人参加射击比赛,对他们的射击水平进行了测试,两人在相同条件下各射击10次,命中的环数如下:
(1)计算甲、乙两人射击命中环数的平均数与方差.
(2)比较两人成绩,决定应该选哪一人参赛. 【解析】1.选D.根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项A中,中位数为4,可能存在大于7的数;同理,在选项C中也有可能;选项B中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项D中,根据方差公式,如果有大于7的数存在,那么方差不会为3,故答案选D. 2.(1)
(2)
∴应该选派乙参赛. 【想一想】在实际决策中,是否一定采用方差小的一种方案?
提示:当平均数差异较大时,不必考虑方差;在体育比赛中,若两人平均水平都比对手稍差,则应选派方差大的,以期超水平发挥. 【变式训练】(2012·东北三校联考)甲、乙两位同学在高三的5次月考中数学成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别是x甲,x乙,则下列叙述正确的是( ) (A)x甲>x乙;乙比甲成绩稳定
(B)x甲>x乙;甲比乙成绩稳定
(C)x甲(D)x甲【解析】选C.由题意可知
又由方差公式可得
因为 故乙的成绩波动较小,乙的成绩比甲稳定.
【误区警示】方差越小越稳定,而在计算方差时务必要计算准确无误. 各数字特征的综合应用
【技法点拨】
用频率分布直方图估计众数、中位数、平均数
(1)众数:取最高小长方形底边中点的横坐标作为众数.
(2)中位数:在频率分布直方图中,把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标称为中位数.
(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 【典例训练】
1.某校为了了解学生的课外阅读情况,随机抽查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( ) (A)0.6 h (B)0.9 h (C)1.0 h (D)1.5 h 2.从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.
由于一些数据丢失,试利用频率分布直方图求:
(1)这50名学生成绩的众数与中位数;
(2)这50名学生的平均成绩.【解析】1.选
2.(1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小矩形框的中间值的横坐标即为所求,所以众数应为75.
在频率分布直方图中,中位数的左右两边频数应相等,即频率也相等,从而小矩形的面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.∵0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,∴前三个小矩形面积的和为0.3.
而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,
∴中位数应位于第四个小矩形内,
设其底边为x,高为0.03,∴令0.03x=0.2,得x≈6.7,
故中位数应为70+6.7=76.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可.
∴平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.024×10)+95×(0.016×10)=76.2.
综上,(1)众数是75,中位数约为76.7;(2)平均成绩为76.2. 【归纳】频率分布直方图中中位数的求法.
(1)利用小矩形的面积和初步判断中位数所在的区间.
(2)利用中位数左右两边的小矩形的面积和相等,列出关于中位数的方程,如题2的第(1)问.
(3)解方程,求出中位数. 【变式训练】为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则 (1)这20名工人中一天生产该产品数量在[55,75)的人数是_______.
(2)这20名工人中一天生产该产品数量的中位数为________.
(3)这20名工人中一天生产该产品数量的平均数为________.
【解析】(1)(0.040×10+0.025×10)×20=13.
(2)设中位数为x,则0.2+(x-55)×0.04=0.5,x=62.5.
(3)0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64.
答案:(1)13 (2)62.5 (3)64 【易错误区】估计总体数字特征时的易错点
【典例】(2012·吉林模拟)在教学调查中,甲、乙、丙三个班的数学测试成绩分布如图,假设三个班的平均分都是75分,s1,s2,s3分别表示甲、乙、丙三个班数学测试成绩的标准差,则有:( )
(A)s3>s1>s2 (B)s2>s1>s3
(C)s1>s2>s3 (D)s3>s2>s1
【解题指导】 【解析】选D.所给图是成绩分布图①,平均分是75分,在图1中,集中在75分附近的数据最多,图3中从50分到100分均匀分布,所有成绩不集中在任何一个数据附近②,图2介于两者之间.由标准差的意义可得s3>s2>s1,故选D.【阅卷人点拨】通过阅卷后分析,对解答本题的常见错误及解题启示总结如下:(注:此处的①②见解析过程) 【即时训练】(福建师大附中高一检测)甲、乙两位运动员5
场比赛的得分情况如茎叶图所示,记甲、乙两人的平均得分分
别为 则下列判断正确的是( )
(A) 甲比乙成绩稳定
(B) 乙比甲成绩稳定
(C) 甲比乙成绩稳定
(D) 乙比甲成绩稳定 【解析】选D.甲的平均得分
方差
乙的平均得分
方差
乙比甲成绩稳定. 1.某同学使用计算器求30个数据的平均数时,错将其中一个
数据105输入为15,那么由此求出的平均数与实际平均数的
差是( )
(A)3.5 (B)-3 (C)3 (D)-0.5
【解析】选B.错将数据105输入为15,则平均数少
即与实际平均数的差是-3. 2.一位同学种了甲、乙两种树苗各1株,分别观察了9次、10次后,得到树苗高度的数据的茎叶图如图(单位:厘米),则甲、乙两种树苗高度的数据的中位数之和是( )
(A)44 (B)54 (C)50 (D)52【解析】选D.根据茎叶图可得,甲树苗9次得到的树苗高度分
别为19,20,21,23,24,31,32,33,37;乙树苗10次得到的树苗高
度分别为10,10,14,24,26,30,44,46,46,47,则甲树苗高度的
中位数为24,乙树苗高度的中位数为 因此24+28=
52.3.某射手在一次训练中五次射击的成绩分别为9.4,9.4,9.4,
9.6,9.7,则该射手五次射击的成绩的方差是( )
(A)0.127 (B)0.016 (C)0.08 (D)0.216
【解析】选4.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是_______. 【解析】数据从小到大排列后可得其中位数为
平均数为
答案:91.5,91.55.下面是某校学生日睡眠时间的抽样频率分布表(单位:h),
试估计该学生的日平均睡眠时间. 【解析】方法一:总睡眠时间约为
6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=
739(h).
故平均睡眠时间约为7.39 h.
方法二:求每组中值与对应频率之积的和
6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h).
答:估计该校学生的日平均睡眠时间约为7.39 h. 课件66张PPT。2.3.1 变量之间的相关关系
2.3.2 两个变量的线性相关1.会作散点图,并对变量间的正相关或负相关关系作出直观判断.
2.了解最小二乘法的含义,知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
3.会用线性回归方程进行预测. 1.本课重点是理解变量间的相关关系.
2.本课难点是回归直线方程的求解方法. 1.相关关系
自变量取值一定时,因变量的取值带有一定_____性的两个变量
之间的关系,叫做相关关系.
2.散点图的含义及应用
将各数据在平面直角坐标系中的对应点画出来,得到表示两个
变量的一组数据的图形,这样的图形叫做_____图,利用散点
图,可以判断两个变量是否相关,相关时是正相关还是负相关. 随机散点对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图1;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图2.由这两个散点图可以判断. 变量x与y_______,变量u与v_______.
3.回归直线与回归直线方程的系数
如果散点图中点的分布从整体上看大致在一条直线附近,我们
称这两个变量之间具有_________关系,这条直线叫做回归直线.
回归直线方程为 其中负相关正相关线性相关1.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄
的回归模型为 =7.19x+73.93,那么这个孩子10岁时的身高
是否一定是145.83 cm?
提示:不一定.用回归模型 =7.19x+73.93,只能预测,其
结果不一定是个确定值. 2.在下列各图中,每个图的两个变量具有相关关系的图是____.
【解析】图(1)是函数关系,图(2)和图(3)是相关关系,图(4)没有相关关系.
答案:(2)(3) 3.对于线性回归方程 下列说法中正确的有_____个.
①直线必经过点
②x增加一个单位时,y平均增加 个单位
③样本数据中x=0时,可能有y=
④样本数据中x=0时,一定有y=
【解析】根据回归直线方程的意义,①②都正确.而③④中,样本数据x=0时,y的值可能为 ,也可能不是 ,故③正确,④错误.
答案:3 1.相关关系与函数关系的异同点
2.求回归方程的注意点
对于任意一组样本数据,利用公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程. 相关关系的判断
【技法点拨】
两个变量是否相关的两种判断方法
(1)根据实际经验:借助积累的经验进行分析判断.
(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断. 【典例训练】
1.下列关系中,带有随机性相关关系的是_______.
①正方形的边长与面积之间的关系
②水稻产量与施肥量之间的关系
③人的身高与年龄之间的关系
④降雪量与交通事故的发生率之间的关系 2.现随机抽取某校10名学生在入学考试中的数学成绩x与入学后的第一次数学成绩y,数据如下:
问这10名学生的两次数学考试成绩是否具有相关关系? 【解析】1.①正方形的边长与面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系,因此填②④.
答案:②④ 2.两次数学考试成绩散点图如图所示,
由散点图可以看出两个变量的对应点集中在一条直线的周围,且y随x的变大而变大,具有正相关关系.因此,这10名学生的两次数学考试成绩具有相关关系. 【想一想】人的身高与年龄之间一定没有相关性吗?
提示:在一定年龄段,比如18岁之前,人的身高与年龄之间可以看作具有正相关的关系. 【变式训练】在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如下表:
根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系. 【解析】以x轴表示身高,y轴表示体重,可得到相应的散点图如图所示:
由散点图可知,两者之间具有相关关系,且为正相关关系. 【误区警示】散点图中的点并不一定是严格的均在一条直线上,那样的散点图呈现的就是函数关系了. 线性回归方程的应用及求法
【技法点拨】
求线性回归方程的步骤
(1)计算平均数
(2)计算xi与yi的积,求
(3)计算
(4)将结果代入公式 求 .
(5)用 求 .
(6)写出回归方程. 1.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )
(A) =-10x+200 (B) =10x+200
(C) =-10x-200 (D) =10x-200 【典例训练】2.给出施化肥量对水稻产量影响的试验数据:
已知x与y成线性相关,求出回归直线方程.
【解析】1.选A.∵商品销售量y(件)与销售价格x(元/件)负相关,∴a<0,排除B,D.
又∵x=0时,y>0,∴选A. 2.对表中的数据进行具体计算,列成以下表格:
故可得到
=399.3-4.75×30≈257.
从而得到回归直线方程是 =4.75x+257. 【想一想】在求回归直线方程的系数时,如何减少出错的可能?
提示:通过列表,逐一求系数公式中的各个数据,可以有效地减少出错的可能. 【变式训练】某连锁经营公司所属5个零售店某月的销售额和利润额资料如下表:
(1)画出销售额和利润额的散点图;
(2)若销售额和利润额具有相关关系,计算利润额y对销售额x的回归直线方程. 【解析】(1)散点图如下:
(2)数据如下表:
可以求得 =0.5, =0.4,
线性回归方程为 =0.5x+0.4. 利用线性回归方程对总体进行估计
【技法点拨】
回归分析的三个步骤
(1)判断两个变量是否线性相关:可以利用经验,也可以画散点图.
(2)求线性回归方程,注意运算的正确性.
(3)根据回归直线进行预测估计:估计值不是实际值,两者会有一定的误差. 【典例训练】
1.(2011·广东高考)某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_______cm.2.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据: (1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的
回归方程y= x+ ;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)【解析】1.设父亲的身高为x cm,儿子的身高为y cm,则根据
上述数据可得到如下表格:
上表中的最后一组(182,?)是预测数据,
线性回归方程 =x+3,所以当x=182时, =185,
即他孙子的预测身高为185 cm.
答案:185 2.(1)散点图如图所示:
(2)
故线性回归方程为(3)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35(吨标准煤),
故能耗减少了90-70.35=19.65(吨标准煤).
【互动探究】题2(3)中,实际能耗一定减少了19.65(吨标准煤)吗?
【解析】不一定.利用回归直线方程估计,只是一个近似值,受其他因素影响,估计值与实际值会有一定的差距. 【归纳】进行回归分析的关键.
提示:回归分析应用于实践,关键是回归模型的建立.比如题1中把父子身高分别作为两个变量,建立线性相关关系是解答本题的切入点. 【变式训练】某农科所对冬季昼夜温差与某反季节大豆种子发芽多少之间的关系进行分析研究,他们记录了12月1日至5日的昼夜温差与每天100颗种子的发芽数,数据如下表:该农科所确定的研究方案是:先从5组数据中选取2组,用剩
下的3组数据求回归方程,再用被选取的两组数据进行检验.
(1)若先选取的是12月1日和5日的数据,请根据2日至4日的
三组数据,求y关于x的回归方程
(2)若由回归方程得到的估计数据与检验数据的误差均不超
过2颗,则认为得到的回归方程是可靠的,试判断(1)中所
得的回归方程是否可靠?说明理由. 【解析】(1)由已知数据,求得
由公式 求得
再由公式 得, =-3,
所以y关于x的回归方程为
(2)当x=10时
同样,当x=8时 所以,(1)中得到的回归方程是可靠的. 【规范解答】线性相关关系的判断及线性回归方程的求解
【典例】(12分)假设关于某设备使用年限x(年)和所支出的维修费用y(万元)有如下统计资料:(1)请画出上表数据的散点图,判断它们是否具有线性相关关系;若线性相关,用最小二乘法求出y关于x的线性回归方程;
(2)试根据(1)求出的线性回归方程,预测使用年限为10年时,维修费用是多少? 【解题指导】【规范解答】(1)散点图①如图所示: 由散点图可知,两变量之间具有相关关系,且为线性相关关系………………………………………………………………4分下面用最小二乘法求线性回归方程:
列表,计算 设所求回归方程为: 则由上表可得
…………………8分
…………………………………10分
∴回归方程为
(2)把x=10代入(1)中所求的线性回归方程得:
y=1.23×10+0.08=12.38,……………………………………11分
即使用年限为10年时,维修费用约是12.38万元③.
…………………………………………………………………12分【阅卷人点拨】通过阅卷后分析,对解答本题的失分警示和解题启示总结如下:(注:此处的①②③见规范解答过程)
【规范训练】(12分)以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:
(1)画出数据对应的散点图;
(2)求回归方程,并在散点图中加上回归直线;
(3)试预测90 m2的房屋,销售价格约为多少?(精确到0.01) 【解题设问】画出散点图的作用是什么?_____________________.
【规范答题】(1)根据表中所列数据可得散点图如下:
…………………3分
由图可见两者之间是线性相关的.…………………………4分判断数据是否线性相关(2)列表,计算:
……………………………………………………………6分 故可求得:
……………………………………………………………8分
所以,回归方程为 =0.196 2x+1.814 2,回归直线如(1)中
图……………………………………………………10分
(3)把x=90代入上述回归方程
即y=0.196 2×90+1.814 2≈19.47(万元),即这种90 m2的房
屋,销售价格约为19.47万元.…………………………12分1.对于给定的两个变量的统计数据,下列说法正确的是( )
(A)都可以分析出两个变量的关系
(B)都可以用一条直线近似地表示两者的关系
(C)都可以作出散点图
(D)都可以用确定的表达式表示两者的关系
【解析】选C.给出一组样本数据,总可以作出相应的散点图,
但不一定能分析出两个变量的关系,更不一定符合线性相关或有函数关系.2.某市居民2007~2011年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:根据统计资料,居民家庭年平均收入的中位数是__________,家庭年平均收入与年平均支出有________关系.
【解析】收入数据按大小排列为11.5,12.1,13,13.3,15,所以中位数为13.从数据变化情况看出,两个变量是正相关的.
答案:13 正相关 3.某五星级大饭店的入住率x(%)与每天每间客房的价格y(元)关系如下:
则y关于x的回归直线方程是_________.
【解析】根据回归方程的参数公式计算可得.
答案:4.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)
(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点
(xi,yi)(i=1,2,…,n)都在直线 上,则这组样本
数据的样本相关系数为________.
【解析】样本相关系数越接近1,相关性越强,现在所有的样本
点都在直线 上,样本的相关系数应为1.
答案:1 5.洛阳天弘公司某产品的广告费与销售收入资料如下(单位:百万元): (1)画出散点图,并指出两变量是正相关还是负相关; (2)求线性回归方程.参考公式:【解析】(1)散点图如图所示:
由图可知销售收入与广告费为正相关.(2)设广告费为x,销售收入为y,则