课件41张PPT。第2章 统 计第2章 统 计2.1 抽样方法
?
2.1.1 简单随机抽样重点难点 重点:正确理解简单随机抽样的概念,掌握抽签法及随机数表法的步骤.
难点:灵活应用相关知识从总体中抽取样本.1.总体与样本
(1)总体:统计中所有考察对象的全体叫做总体.
(2)个体:总体中的每一个考察对象叫做个体.
(3)样本:从总体中抽取的一部分个体叫做样本.
(4)样本容量:样本中个体的数目叫做样本容量.2.简单随机抽样
(1)定义:一般地,从个体数为N的总体中
__________________________________作为样本,如果每个个体都有相同的机会被取到,那么这样的抽样方法称为简单随机抽样.
(2)分类:①抽签法;②随机数表法.逐个不放回地取出n个个体(n(1)随机数表:由数字组成的数表,其中的每个数都是用______________产生的(称为“随机数”),这样的表称为随机数表.
(2)随机数表法:只要按一定的规则到随机数表中选取号码的抽样方法.随机方法4.抽签法的步骤
(1)将总体中的N个个体编号(号码可以从1到N);
(2)将这N个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作);
(3)将号签放在同一箱中,并搅拌均匀;
(4)从箱中每次抽出1个号签,并记录其编号,连续抽取k次;
(5)将总体中与抽到的号签的编号相一致的k个个体取出.这样就得到一个容量为k的样本.对个体编号时,可以利用已有的编号,如从全体学生中抽取样本时,利用学生的学号作为编号.
5.随机数表法的步骤
(1)对总体中的个体编号(每个号码位数一致);
(2)在随机数表中______________作为开始;任选一个数(3)从选定的数开始按一定的方向读下去,若得到的号码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过;如此继续下去,直到取满为止;
(4)根据选定的号码抽取样本.做一做
1.关于简单随机抽样的特点,有以下几种说法,其中不正确的是________.
①要求总体的个数有限;
②从总体中逐个抽取;
③它是一种不放回抽样;
④每个个体被抽到的机会不一样,与先后有关.
解析:由简单随机抽样的特点可知④不对.
答案:④2.判断下列说法是否正确.(标注“√”或“×”)
①因为利用随机数表法抽样,开始数是人为约定的,所以抽样不公平( )
②利用随机数表法抽样,读数时都必须由左向右读( )
③随机数表中的数都是两位数( )
④在随机数表中,可任选一个数作为开始( )解析:①不对,开始数是随机选定的,抽样不失公平性.
②不对,读数可任选方向.
③不对,随机数表中的数看成几位都可以.
④由随机数表法抽样定义知,④正确.
答案:①× ②× ③× ④√ 题型一 简单随机抽样的概念
下面抽取样本的方式是简单随机抽样
吗?为什么?
(1)从无限多个个体中抽取50个个体作为样本;(2)箱子里共有100个零件,从中选取10个零件进行检验,每次任取一个零件进行检验后,再把它放回箱子里;
(3)从50个个体中,一次性抽取5个个体作为样本;
(4)某班45名同学指定个子最高的5名同学参加学校组织的某项活动.【解】 (1)不是简单随机抽样,不符合“总体个数是有限的”这一特点.
(2)不是简单随机抽样,不符合“不放回”这一特点.
(3)不是简单随机抽样,不符合“逐个抽取”这一特点.
(4)不是简单随机抽样,不符合“等可能
性”,因为五名同学是指定的,而不是随机抽取的.【规律小结】 (1)简单随机抽样有4个特点:①不放回;②总体数量有限;③逐个抽取;④等可能性.
(2)“一次性”抽取和“逐个”抽取不影响个体被抽到的可能性,但一次性抽取不符合简单随机抽样的意义.1.下列抽样方法是简单随机抽样的是________(填序号).
①坛子中有一个大球,4个小球,从中摸出一个球,搅拌均匀后,随机取出一个球;
②在校园里随意选三名同学进行调查;
③在剧院里为抽取三名观众调查,将所有座号写在同样的纸片上,放入箱子搅匀后逐个抽取,共取三张;
④买彩票时随手写几组号.解析:①不是.因为球的大小不同,造成不公平.
②④不是,因为随意选取,随手写出并不说明对每个个体机会均等.
③符合随机抽样的定义,是简单随机抽样.
答案:③题型二 抽签法
学校举办元旦晚会,需要从每班选10名男生,8名女生参加合唱节目,某班有男生32名,女生28名,试用抽签法确定该班参加合唱的同学.【解】 第一步:将32名男生从1到32进行编号.
第二步:用相同的纸条制成32个号签,在每个号签上写上这些编号.
第三步:将写好的号签放在一个不透明的容器内摇匀,不放回地从中逐个抽出10个号签.
第四步:相应编号的男生参加合唱.
第五步:用相同的办法从28名女生中选出8名参加合唱.【名师点评】 利用抽签法抽样本时编号
问题可视情况而定,若已有编号如考号、学号、标签号码等,可不必重新编号,号码签要求是大小、形状完全相同而且一定要搅拌均匀,从中逐一不放回地抽取.2.某校有学生120人,为调查某种情况,打算抽取一个样本容量为30的样本,请你用抽签法完成,写出抽样过程.解:第一步:将120人从1到120进行编号.
第二步:再用相同的纸条制成120个号签,在每个号签上写上这些编号.
第三步:将纸片揉成大小一样的球,放进一个不透明的箱子里,并搅拌均匀.
第四步:从箱子里取纸球,每次取一个,共取30个纸球.
第五步:打开纸球,按纸片上标的号码,对应学生的号码,抽取出30名学生.题型三 随机数表法
(本题满分14分)从个体总数N=500的总体中抽取一个容量为n=10的样本,使用随机数表法进行抽取,要取三位数,写出你抽得的样本,并写出抽选过程(起点在第几行第几列,具体方法).(借助于课本附录的随机数表)【解】 第一步:将总体中的个体编号(三位数)为000,001,002,…,499;
(3分)
名师微博
注意编号位数要相同.第二步:在随机数表中随机地确定一个数作为开始,如第6行第13列的数5开始;
(7分)
第三步:从数5开始向右读下去,每次读三位,凡不在000~499中的数跳过去,遇到已经读过的数也跳过去,便可依次得到354,378,384,263,491,442,175,331,455,068.(12分)名师微博
注意在随机数表中读取数时,满足条件的数取出,不在范围内的以及已经读取过的数要跳过去.
这10个号码就是所需抽取的10个样本个体的号码.
(14分)【思维升华】 在用随机数表法抽样时,有时会遇到以下问题:要求用题中所给的编号抽取样本,但所给编号位数不一致,这时,可用以下方法进行调整.
(1)在数位前添加“0”,凑齐位数,如1,2,…,100,可调整为001,002,…,100;
(2)把原来的号码加上100的倍数,如1,2,3,
…,100每数加上100可调整为101,102,…,200.3.有一批机器,编号为1,2,3,…,112,请用随机数表法抽取10台样本,写出抽样方法.
解:各机器的编号位数不一致,用随机数表直接读数不方便,需将编号进行调整,即抽样方法为:
法一:第一步:将原来的编号调整为001,002,003,…,112.第二步:在随机数表中任选一数作为开始,任选一方向作为读数方向,比如,选第9行第7个数“3”向右读.
第三步:从“3”开始,向右读,每次读取三位,凡不在001~112中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到074,100,094,052,080,003,105,107,083,092.
第四步:对应原来编号74,100,94,52,80,3,105,107,83,92的机器就是要抽取的对象.法二:第一步:将原来的编号调整为101,102,103,…,212.
第二步:在随机数表中任选一数作为开始,任选一方向作为读数方向,比如选第9行第7个数“3”向右读.第三步:从“3”开始,向右读,每次读取三
位,凡不在101~212中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到155,134,174,180,165,196,206,105,160,201.
第四步:对应原来编号55,34,74,80,65,96,106,5,60,101的机器就是要抽取的对象.某医学研究所,要在A市对20岁以上的成年人今后5年内糖尿病的发病率及发病原因进行调查.调查采用简单随机抽样的方法进行.A市共有30个小区,每个小区20岁以上的成年人大约有1万人.请你帮他们拟定一个详尽的调查方案.(样本容量为20人)解:分两步进行:
第一步:在30个小区内抽取一个小区,把30个小区编号为1~30号,在30张小纸片(大小相同)上分别写上数字1,2,3,…,30,然后把小纸片揉成大小一样的纸球,放入一个小纸箱内,搅拌均匀,从中取出一个.由取出的纸片上的数字确定出一个小区.第二步:将这个小区20岁以上的人按户口薄上的姓名登记编号,假设该小区有1万人则编号为0000,0001,0002,…,9999,然后在随机数表中选定一个起始数,并约定读取方向,把在0000~9999间的四位数选出20个,即可对号找到20位被调查者.方法技巧
1.简单随机抽样分为抽签法和随机数表法.两种方法的优点都是简单易行.抽签法的缺点是适用于个体数较少的总体.随机数表法的缺点是当总体中的个体数很多时,用随机数表法抽取样本不方便.2.抽签法与随机数表法的区别与联系
区别:抽签法适合于个体数较少的总体,随机数表法适合于个体数目较多的总体,抽样的过程要借助于随机数表.
用随机数表法时编号的位数要相同,而抽签法不要求编号的位数相同.
联系:抽签法和随机数表法都是最简单、最基本的抽样方法,并且要求被抽取样本的总体的个数有限.失误防范
利用随机数表法应注意以下三点:
(1)编号的位数要相同,如例3编号时易编为1,2,
3,…,499,500,这样的编号是不能用随机数表法的.
(2)在随机数表中读取时,满足条件的数取出,不在范围内的数跳过,已经读过的数也要跳过去.
(3)要按事先约定的读取方向读取,直到所需的数全部取到为止,不能改变读取方向读数.课件30张PPT。2.1.2 系统抽样第2章 统 计重点难点 重点:正确理解系统抽样的概
念,掌握系统抽样的一般步骤.
难点:灵活应用系统抽样的方法解决统计问题.1.系统抽样
将总体_______分成几个部分,
然后按照____________,从每个部分中抽取一个______作为样本,这样的抽样方法称为系统抽样.
2.一般地,假设要从容量为N的总体中抽取容量为n的样本,我们可以按下列步骤进行系统抽样:平均一定的规则个体编号个体编号l(4)按照一定的规则抽取样本,通常将编号为
l,l+k,l+2k,…,__________的个体抽出.
3.当总体中个体个数较少时,常采用_______抽样;当总体中个体个数较多时,常采用_____抽样.
4.系统抽样的特点
(1)用于总体的个体数______的情况;l+(n-1)k简单随机系统较多逐个不放回均等解析:①说法不正确.因为剔除多余个体是用简单随机抽样法进行的,对每一个个体机会都一样,所以不能说机会不均等.
②说法不正确.虽然除第一段外,后面的样本是通过l+(n-1)k计算抽取的,但由于l的确定是随机的,是用简单随机抽样法确定的,从而l+(n-1)k的确定也是随机的,是公平的.
答案:①× ②×题型一 系统抽样的概念
四人在打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时开始按次序起牌,对任何一家来说,都是从52张总体中抽取13张样本,问这样的抽样方法是简单随机抽样还是系统抽样?为什么?【思路点拨】 解决此类问题应分析这样的抽样方法具备哪种抽样的特点.
【解】 不是简单随机抽样,是系统抽样.
简单随机抽样的实质是逐个地从总体中随机抽取,而这里只是随机地确定了起始牌,这时其他各张虽然是逐张起牌的,但其实各张在谁手里已被确定了,所以不是简单随机抽样,根据其“等距”起牌的特点,应将其归纳为系统抽样.【名师点评】 逐张随机抽取与随机确定一张为起始牌不是一回事.本题的关键只要抓住“等距”的特点就不难确定是属于哪类抽样.1.对下面的问题,请判断对错,说明理由.
在系统抽样中,第一段抽样确定l后,其余各段只能是l+(n-1)k,不会是其他个体.
解:这种说法不对.第一段抽样确定l后,其余各段的样本可按情况规定抽取.只要保证每段都能抽到样本即可.题型二 抽样方法的选择
下列抽样试验中,最适宜用系统抽样法的是________.
①某市的4个区共有2000名学生,用4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样;②从某厂生产的2000个电子元件中随机抽取5个入样;
③从某厂生产的2000个电子元件中随机抽取200个入样;
④从某厂生产的20个电子元件中随机抽取5个入样.【解析】 系统抽样适合个体较多但均衡的总体.
【答案】 ③
【规律小结】 选择抽样方法时应考虑以下几种情况:
(1)当总体容量较小,样本容量也较小时,可采用抽签法.
(2)当总体容量较大,样本容量较小时,可采用随机数表法.
(3)当总体容量较大,样本容量也较大时,适合用系统抽样.2.在1000个有机会中奖的号码中抽取100个号,宜采用的抽样方法是________.
解析:由于总体容量较大,样本容量也较
大,故宜采用系统抽样法.
答案:系统抽样题型三 系统抽样的应用
(本题满分14分)某校有118名教师,为了支援西部的教育事业,现要从中随机抽出16名教师组成暑假西部讲师团.请用系统抽样法选出讲师团成员.
【思路点拨】 要用系统抽样方法抽样,必须先求样本容量,即抽取的教师数,再确定分的段数.名师微博
确定起始号l.再取l+k,l+2k,…,是关键.
【名师点评】 系统抽样时,一定要严格按照系统抽样的操作步骤进行,同时还要注意在剔除个体及第一段抽取样本的过程中,应选择适当的简单随机抽样方法,以便抽样过程更简便.3.某校高中二年级有253名学生,为了了解他们的视力情况,准备按1∶5的比例抽取一个样本,试用系统抽样方法进行抽取,并写出过程.解:(1)先把这253名学生编号000,001,…,252.
(2)用随机数表法任取出3个号,从总体中剔除与这三个号对应的学生.
(3)把余下的250名学生重新编号001,002,003,…,250.
(4)分段.取分段间隔k=5,将总体均分成50段.每段含5名学生.(5)以第一段即1~5号中随机抽取一个号作为起始号,如l.
(6)从后面各段中依次取出l+5,l+10,
l+15,…,l+245这49个号.
这样就按1∶5的比例抽取了一个样本容量为50的样本.课件43张PPT。2.1.3 分层抽样第2章 统 计重点难点 重点:正确理解分层抽样的定
义,灵活应用分层抽样抽取样本.
难点:正确选择抽样方法解决现实生活中的抽样问题.1.分层抽样的概念
一般地,当总体由__________的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体______________分成层次比较分明的几部分,然后按各部分在总体中___________实施抽样,这种抽样方法叫分层抽样,所分成的各个部分称为“层”.差异明显按不同的特点所占的比2.分层抽样的步骤
(1)将总体按____________分层;
(2)计算各层的_______与总体的个体数的比;
(3)按各层个体数占总体的个体数的_____确定各层应抽取的样本容量;
(4)在每一层进行抽样(可用简单随机抽样或系统抽样).一定标准个体数比做一做
某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查销售情况,需从600个销售点中抽取100个调查,记这项调查为(1),在丙地区有20个特大型销售点,要从中抽取7个调查,记这项调查为(2),则完成(1)、(2)这两项调查宜采用的抽样方法分别是什么方法?解:调查(1),因为个体间差异大,应采用分层抽样.调查(2),个体数较少且无明显差异可采用抽签法.故调查(1)用分层抽样法,调查(2)用抽签法. 题型一 分层抽样的概念
判断下列对分层抽样的说法是否正确,并说明理由.
(1)因为抽样在不同层内进行,所以不同层的个体被抽到的可能性不一样;(2)分层后,为确保公平性,在每层都应用同一抽样方法;
(3)所有层用同一抽样比,等可能抽样;
(4)所有层抽同样多容量的样本,等可能抽样.
【解】 判断依据是分层抽样的定义及操作步骤.(1)不正确.因为不同层内抽取的样本数是由该层个体数与总体数的比乘以样本容量得到的,所以每层抽取的样本数与该层个体总数比是一样的.所以对总体中每个个体而言,被抽取的可能性是一样的.
(2)不正确.在每层可根据不同情况采用不同的抽样方法.
(3)正确.由分层抽样定义和操作步骤可知.
(4)不正确.每层抽取的样本数不一定相同.与该层个体数占总体数的比有关.【规律小结】 对于分层抽样的概念要从如何分层,每层确定样本数,每层采用何种抽样方法,及抽样是否具有公平性等方面彻底理解.只有彻底理解了概念才能避免操作中的错误.1.某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意
见,要从中抽取20人,用哪种方法最合适?
解:由于总体是由差异明显的三部分组成,故用分层抽样最合适.题型二 分层抽样的应用
某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人,教育部门为了了解学校机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,并写出抽样过程.2.某中学共有教职工300人,分为教务人
员、管理人员、后勤服务人员三部分,其组成比为8∶1∶1,现用分层抽样法从中抽取容量为20的样本,写出抽样的过程.题型三 抽样方法的选择
(本题满分16分)选择合适的抽样方法抽样,并写出抽样过程.
(1)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个入样.
(2)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个入样.
(3)有甲厂生产的300个篮球,抽取10个入样.
(4)有甲厂生产的300个篮球,抽取30个入样.【思路点拨】 结合三种抽样方法的适用范围,根据实际情况灵活选取适当的方法进行抽样.第二步 用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个,这些篮球便组成了我们要抽取的样本.(4分)
名师微博
每层抽取样本时用的是简单随机抽样.
(2)总体容量较小,用抽签法.
第一步 将30个篮球用随机方式编号,编号为1,2,…,30;第二步 将以上30个编号分别写在大小形状相同的小纸条上,揉成小球,制成号签;
第三步 把号签放入一个不透明的袋子中,充分搅匀;
第四步 从袋子中逐个不放回抽取3个号签,并记录上面的号码;
第五步 找出和所得号码对应的篮球,这些篮球便组成了我们要抽取的样本.
(8分)名师微博
注意抽签法是不放回逐个抽取.
(3)总体容量较大,样本容量较小宜用随机数表法.
(9分)
第一步 将300个篮球用随机方式编号,编号为001,002,…,300;
第二步 在随机数表中随机的确定一个数作为开始,如第8行第29列的数“7”开始,任选一个方向作为读数方向,比如向右读;第三步 从数“7”开始向右读,每次读三位,凡不在001~300中的数跳过去不读,遇到已经读过的数也跳过去不读,便可依次得到286,211,234,297,207,013,027,086,284,281这10个号码,这就是所要抽取的10个样本个体的号码,找出和所得号码对应的篮球便组成我们要抽取的样本.(12分)
(4)总体容量较大,样本容量也较大宜用系统抽样法.(13分)
第一步 将300个篮球用随机方式编号,编号为000,001,002,…,299,并分成30段.
名师微博
系统抽样分段是关键.1.在120个零件中,一级品24个,二级品36个,三级品60个,从中抽取容量为20的样
本,按照三种抽样方法抽取,分别计算总体中每个个体被抽到的可能性.解:统计不当的原因,其中之一是选取了不适当的样本作为统计调查的基础,如果抽样时使用了不适当的方法,往往得到错误的结论.失败的原因:
①抽样方法不正确.样本不是从总体(全体美国公民)中随机地抽取.1936年,美国有私人电话和参加俱乐部的家庭,都是比较富裕的家庭.1929~1933年的世界经济危机,使美国经济遭受沉重打击.“罗斯福新政”动用行政手段干预市场经
济,损害了部分富人的利益,“喝了富人的血”,但广大的美国人民从中得到了好处.所以,从这部分富人中抽取的样本严重偏离了总体,导致样本不具有代表性.
②样本容量相对太小也是导致估计出现偏差的一个原因,因为样本容量越大,估计才越准确,发出的信不少,但回信率太低.
方法技巧
1.三种抽样方法的比较:2.分层抽样与简单随机抽样和系统抽样的关系:分层抽样按比例在各层抽取样本时,采用简单随机抽样或系统抽样.失误防范
用分层抽样进行抽样时,需注意以下几点:
(1)必须先判断所考察的总体中的个体是否具有明显差异,若是,则应用分层抽样;若不是,则应用简单随机抽样或系统抽样.如例3的变式训练,易有下面的错解:
由于总体的个体数相对较多,因此可采取系统抽样法.
过程如下:①用随机方式将总体中的个体编号1,2,…,30000;②把总体分成300段,每段100人;③在第一段中用简单随机抽样确定起始个体编号i;④将i,i+100,i+200,…,i+29900分别抽出,从而获得整个样本.
(2)为获取各层入样数目,需先正确计算出抽样比k,若k与某层个体数的积不是整数,则可四舍五入取整.课件53张PPT。2.2 总体分布的估计第2章 统 计重点难点 重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.
难点:能通过样本的频率分布估计总体的分布.1.频率分布表
(1)定义:频数是某一对象出现的______,频率指某一对象的_____与________的比值,它能更好地反映出某一对象出现的_________.当总体很大或不便获得总体的频率时,可以用样本的频率分布估计总体的频率分布.次数频数总次数频繁程度根据所抽取样本的大小,分别计算某一事件出现的频率,这些频率的__________ (取值情况),就叫做样本的频率分布.
为了能直观地显示样本的频率分布情况,通常我们会将样本的容量、样本中出现该事件的______以及计算所得的__________列在一张表中,这样的表就叫样本频率分布表.
(2)编制频率分布表的步骤如下:分布规律频数相应频率(1)定义:
我们用直方图反映_____________________,这样的__________称为频率分布直方图,简称频率直方图.
(2)作频率分布直方图的步骤
①求全距,即一组数据中最大值和最小值的差.
②决定组距与组数,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚的呈现出来.样本的频率分布规律直方图做一做
1.判断下列关于频率分布直方图的说法是否正确.(标注“√”或“×”)
①直方图的高表示取某数的频率( )
②直方图的高表示该组上的个体在样本中出现的频数与组距的比值( )③直方图的高表示该组上的个体在样本中出现的频率( )
④直方图的高表示该组上的个体在样本中出现频率与组距的比值( )
解析:频率分布直方图的高表示该组上的个体在样本中出现的频率与组距的比值.
答案:①× ②× ③× ④√3.频率分布折线图
如果将频率分布直方图中各相邻的矩形的上底边的______顺次连结起来,就得到频率分布折线图,简称频率折线图.
4.总体分布的密度曲线
如果将样本容量取得________,分组的组距取得__________,那么相应的频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线.中点足够大足够小5.茎叶图
(1)将样本数据有______地列出来,从中观察样本分布情况的图称为茎叶图.
(2)茎叶图刻画数据的优点是所有的_______都可以从这张茎叶图中得到,方便______和表示.缺点是当样本数据_______时,茎叶图的效果就不是很好.条理信息记录很多想一想
2.用茎叶图如何表示三位数的数据?
提示:茎表示前两位数,叶表示最后一位数.题型一 频率分布表、频率分布直方图、折线图
下表给出了某校500名12岁男孩的身高(单位:cm)资料:(1)列出样本的频率分布表;
(2)绘制频率分布直方图和频率分布折线图.【解】 (1)频率分布表如下:(2)频率分布直方图和频率分布折线图如图所示:1.一个农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度(单位:cm)如下:
6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6
5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8
6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4
6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4
6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6
5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.05.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7
5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0
6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
根据上面的数据列出频率分布表、绘制出频率分布直方图,并估计长度在5.75~6.05 cm之间的麦穗在这批麦穗中所占的百分比.(3)决定分点:
使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是:3.95~4.25,4.25~4.55,4.55~4.85,
…,7.25~7.55.
(4)列频率分布表:(5)绘制频率分布直方图:从表中看到,样本数据落在5.75~6.05之间的频率是0.28,于是可以估计,在这块试验田里,长度在5.75~6.05 cm之间的麦穗约占28%.题型二 茎叶图
下面一组数据是某生产车间30名工人某日加工零件的个数.请设计适当的茎叶图表示这组数据,并根据此茎叶图说明一下这个车间此日的生产情况.134 112 117 126 128 124 122 116 113 107
116 132 127 128 126 121 120 118 108 110
133 130 124 116 117 123 122 120 112 112【解】 以百位和十位两位数字为茎,作出茎叶图,如图所示:由茎叶图可以看出,该生产车间的工人在这一天加工零件数大多都在110到130之间,其分布较集中,且基本上呈对称的形式,说明日生产情况稳定.
【名师点评】 (1)选择适当的位数作茎和叶是制作茎叶图的关键.
(2)绘制茎叶图时,注意对重复出现的数据要重复记录,不可遗漏.2.如图所示,是某班学生的父母年龄的茎叶图,试比较这些同学的父亲和母亲的年龄的情况.解:由茎叶图可知,父亲年龄分布主要集中在40~60之间,平均年龄约为48岁;而母亲的年龄分布大致呈对称分布,平均年龄约为45岁,可见父亲的平均年龄要比母亲的平均年龄大.题型三 用样本的频率分布估计总体分布
(本题满分14分)(2012·吉林高一检测)某社区为了选拔若干名某活动的义务宣传员,从社区300名志愿者中随机抽取了50名进行该活动有关知识的测试,成绩(均为整数)按分数段分成六组:第一组[40,50),第二组[50,60),…,第六组[90,100],第二组的人数比第一组多4人,如图是按上述分组方法得到的频率分布直方图的一部分.规定成绩不低于66分的志愿者入选为义务宣传员.
(1)求第二组、第三组的频率并补充完整频率分布直方图;
(2)由所抽取志愿者的成绩分布,估计该社区有多少志愿者可以入选为义务宣传员.
【思路点拨】【解】 (1)二、三两组的人数和为50-(0.004+0.044+0.012+0.008)×10×50=16,
第一组人数为0.004×10×50=2,(2分)
名师微博
频率分布直方图中小矩形的面积即为各组的频率.【名师点评】 利用样本的频率分布可近似地估计总体的分布,当然,要比较准确地反映出总体分布的情况,必须准确地作出频率分布表或频率分布直方图,充分利用所给数据正确地进行估计.3.从高三学生中抽取50名同学参加数学竞赛,成绩(单位:分)的分组及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表(含累计频率);
(2)绘制频率分布直方图;
(3)估计成绩在[60,90)分的学生比例;
(4)估计成绩在85分以下的学生比例.解:(1)频率分布表如下:(2)频率分布直方图如图所示:1.将容量为100的样本数据,从小到大排
列,分成8个组,如表:
则第5组数据的频率是________.答案:0.152.甲、乙两个学习小组在一次测验中的得分如下:
甲:53 56 64 69 71 72 72 73 74 75 75 76
78 81 83 90
乙:48 54 57 58 64 65 66 66 68 69 70 71
72 75 80 91
试比较这两组学生的学习成绩.解:画出两组得分的茎叶图,为便于对比分析,可将茎放在中间共用,叶分列左、右两侧,如图所示.从茎叶图可以看出,甲组的学生得分大致对称,平均分、众数及中位数都是70多分. 乙组的学生得分也大致对称,平均分、众数及中位数都是60多分,所以,甲组学生的成绩比乙组学生的成绩要好.方法技巧
1.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录,而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.2.正确利用三种分布的描述方法,都能得到一些有关分布的主要特点(如分布是否具有单峰性、是否具有对称性、样本点落在各分组中的频率等),这些主要特点受样本的随机性的影响较小,更接近于总体分布相应的特点.频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式.茎叶图和频率分布表极为类似,事实上,茎相当于频率分布表中的分组;茎上叶的数目相当于频率分布表中指定区间组的频数.失误防范
1.由于在初中制作频率直方分布图是将纵轴作为频率,而频率分布直方图是用矩形的面积表示频率,故易错将直方图的纵轴(小矩形的
高)作为频率,如例3计算时易犯这样的错误.
2.在绘制茎叶图时,“左叶”中数字一般按从大到小排列,“右叶”中的数字则按从小到大排列:即叶的数据一般按大小顺序从小到大(或从大到小)排列;在绘制茎叶图时,易忽视这一要求而出错,如例2易犯这样的错误.课件49张PPT。2.3 总体特征数的估计
?
2.3.1 平均数及其估计第2章 统 计重点难点 重点:用样本平均数估计总体的平均数.
难点:应用相关知识解决简单的实际问题.做一做
1.数a,b,c的平均数是多少?2.加权平均数
一般地,若取值为x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均数为
_______________________________________.想一想
2.一组观察值3,4,6出现的次数分别为4,3,2,则样本平均值是多少?题型一 平均数的计算
某班45名同学的年龄(单位:岁)如下:14 15 14 16 15 17 16 15 16 16 15 15
17 13 14 15 16 16 15 14 15 15 14 15
16 17 16 15 15 15 16 15 13 16 15 15
17 14 15 16 16 15 14 15 15
求全班的平均年龄.1.某校在一次学生身体素质调查中,在甲、乙两班中随机抽10名男生检测100 m短跑,测得成绩如下(单位:s):求甲、乙两班10名同学的平均成绩,试估计甲、乙两班男生的短跑水平.题型二 众数、中位数、平均数的应用
在2012年青年歌手大奖赛民族唱法组中,6位评委现场给每位歌手打分,然后去掉一个最高分和一个最低分,其余分数的平均数作为歌手的成绩,已知6位评委给某位歌手的打分是:9.2,9.5,9.4,9.6,9.8,9.5,
求这位歌手的得分及6位评委打分的平均数、众数和中位数.【名师点评】 理解并掌握平均数、众数和中位数的概念,平均数、众数和中位数可能相同,也可能不同.注意某几个数据的平均数就是这些数的算术平均数,样本平均数代表了数据更多的信息,在实际问题中,计算时应按照实际要求进行计算.2.已知一组数据为a,a,b,c,d,b,c,
c,且a<b<c<d,则这组数据的众数为________,中位数为________,平均数为________.题型三 频率分布与数字特征的综合应用
(本题满分14分)某校从参加高一年级期末考试的学生中抽出60名学生,将其成绩(均为整数)分成六段[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]后,画出如图部分频率分布直方图.观察图形,回答下列问题:
(1)求第四小组的频率,并补全这个频率分布直方图;
(2)估计这次考试的及格率(60分及以上为及格);
(3)估计这次考试的平均分.【解】 (1)因为各组的频率和为1,所以第四组的频率f4=1-(0.025+0.015×2+0.01+0.005)×10=0.3.
(2分)
名师微博
直方图中小矩形的面积即为各组的频率.频率分布直方图如图所示:(6分)
(2)依题意,60分及以上的分数所在的第三、四、五、六组的频率和为(0.015+0.03+0.025+0.005)×10=0.75.
所以估计这次考试的及格率为75%.(10分)
?(3)平均分为
45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
(14分)名师微博
这里采用组中值估计平均数,你知道吗?
【名师点评】 (1)当条件给出某几个范围内的数据的频数或频率时,可用组中值求近似平均数.
(2)对连续型分布的有关问题,可用组中值法求样本数据的平均数,这种方法求得的平均值只是一个估计值.3.下面是60名男生每分钟脉搏跳动的次数:
72 70 66 74 81 70 74 53 57 62 58 92
72 67 62 91 73 64 65 80 78 67 75 80
83 61 72 72 69 70 76 74 65 84 79 80
76 72 68 65 82 79 71 86 77 69 72 56
70 62 76 56 86 63 73 70 75 73 89 64(1)作出上述数据的频率分布直方图;
(2)根据直方图的各组中值估计总体平均数,并将所得结果与实际的总体平均数相比较计算误差.频率分布直方图如图所示:(2)由直方图的各组中值估计平均数为:
(54.5×4+60.5×6+66.5×11+72.5×20+78.5×11+84.5×5+90.5×3)÷60=72,
实际的总体平均数为71.97,
误差约为72-71.97=0.03.1.为了解高一年级6个班期中考试数学成绩的总体情况,年级组对各班情况作了一个调查,情况如下:求这次考试中全年级所有同学数学成绩的平均分(取整数).解:本题可看成六个小组:
一班总分:60×120=7200(分),
二班总分:64×123=7872(分),
三班总分:58×118=6844(分),
四班总分:61×130=7930(分),
五班总分:62×117=7254(分),
六班总分:55×132=7260(分),2.据报道,某公司的33名职工的月工资
(单位:元)如下:
(1)求该公司职工月工资的平均数、中位数、众数;
(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000,那么新的平均数、中位数、众数又是什么?(精确到1元)
(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.方法技巧
1.众数通常是样本数据的频率分布直方图中最高矩形的中点的横坐标.
2.在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值,但是有偏差.中位数可能出现在所给数据中,也可能不在所给数据中.
3.平均数是频率分布直方图的“重心”,是频率分布直方图的平衡点,平均数的求解方法有:定义法,加减常数法,加权平均数法等,如例1及其变式训练的求解.课件43张PPT。2.3.2 方差与标准差第2章 统 计重点难点 重点:用样本方差、标准差估计总体的方差、标准差.
难点:能应用相关知识解决简单的实际问题.1.极差
一组数据的________与_______的_____.
2.方差与标准差最大值最小值差样本方差样本标准差相同平方做一做
1.数据5,7,7,8,10,11的标准差是________.答案:23.方差和标准差的意义
方差和标准差都是用来描述
______________________________,常用来比较两组数据的波动大小,我们所研究的仅是这两组数据的个数相等,平均数相等或比较接近时的情况.
方差较大的波动较大,方差较小的波动较小.一组数据波动情况的特征数想一想
2.甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:则参加奥运会的最佳人选应为哪个人?
提示:成绩最好的为乙、丙,而表现最为
稳定的为丙,故参加奥运会的最佳人选应为丙.?题型一 方差与标准差的计算
已知一个样本为1,3,2,5,x,它的平均数是3,则这个样本的标准差是多少?1.(2011·高考北京卷节选)以下茎叶图记录了甲、乙两组各四名同学的植树棵数,乙组记录中有一个数据模糊,无法确认,在图中以X表示.如果X=8,求乙组同学植树棵数的平均数和方差.题型二 平均数与方差的性质及应用
某校从甲、乙两名优秀选手中选拔1名选手参加全市中学生田径百米比赛,该校预先对这两名选手测试了8次,测试成绩如下表:(1)比较甲、乙两人测试成绩的平均数;
(2)比较甲、乙两人测试成绩的方差.
【解】 已知的两组数据分别减去12,得两组新数据:
甲:0.1,0.2,1,0.5,1.1,0.5,0.4,0.2;
乙:0,0.4,0.8,1,0.2,0.8,0.3,0.5.题型三 平均数与方差的综合应用
(本题满分14分)从甲、乙两种玉米苗中各抽10株,分别测得它们的株高(单位:cm)如下:
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
问:(1)哪种玉米的苗长得高?
(2)哪种玉米的苗长得齐?【思路点拨】 本题主要考查利用平均数和标准差、方差分析数据的特征.看哪种玉米的苗长得高,只要比较甲、乙两种玉米苗的均高即可;要比较哪种玉米的苗长得整齐,只要看两种玉米的株高的方差即可,因为方差体现一组数据波动大小的特征.名师微博
正确运算是本题的关键.【名师点评】 方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小,我们所研究的仅是这两组数据的个数相等,平均数相等或比较接近时的情况.方差、标准差越大,数据的离散程度越大;方差、标准差越小,数据的离散程度越小.2.为了解A,B两种轮胎的性能,某汽车制造厂分别从这两种轮胎中随机抽取了8个进行测试,下面列出了每一个轮胎行驶的最远里程数(单位:1000 km):
轮胎A 96,112,97,108,100,103,86,98
轮胎B 108,101,94,105,96,93,97,106(1)分别计算A,B两种轮胎行驶的最远里程的平均数、中位数;
(2)分别计算A,B两种轮胎行驶的最远里程的极差、标准差;
(3)根据以上数据你认为哪种型号的轮胎性能更加稳定?在一批棉花中抽测了60根棉花的纤维长度(单位:mm),分组与频数如下:[25,65),10;[65,105),2;[105,145),4;[145,185),3;[185,225),3;[225,265),7;[265,305),8;[305,345),10;[345,385),13.试估计这批棉花的纤维的平均长度及标准差.方法技巧
1.样本平均数是刻画一组数据集中趋势最常用的统计量,描述了样本数据的平均水平.样本方差和标准差是刻画数据的离散程度的量,方差越大,离散程度越大.2.数据的离散程度可以通过极差、方差或标准差来描述.极差反映了一组数据的变化的最大幅度,它对一组数据中的极端值非常敏感.方差则反映了一组数据围绕平均数波动的大小.为了得到以样本数据的单位表示的波动幅度,通常用标准差——样本方差的算术平方根来描述.课件44张PPT。2.4 线性回归方程第2章 统 计重点难点 重点:散点图的画法,回归直线方程的求解方法.
难点:回归直线方程的求解方法,回归直线方程在现实生活与生产中的应用.1.变量间常见关系
(1)函数关系:变量之间的关系可以用______表示,是一种__________关系.
(2)相关关系:变量之间有______________,但不能完全用________来表达.函数确定性一定的联系函数做一做
1.有下列关系:
①人的年龄与其拥有的财富之间的关系;
②曲线上的点与该点的坐标之间的关系;
③苹果的产量与气候之间的关系;
④森林中的同一树木,其横截面直径与高度之间的关系;⑤学生与其学号之间的关系.
其中有相关关系的是________.(填序号)
解析:其中②⑤为确定性关系,不是相关关系.
答案:①③④2.散点图
为了刻画两个变量之间的__________,常建立_____________________,将表中数据构成的________所表示的点在____________标出,称这样的图为散点图.相关关系平面直角坐标系数对坐标系内想一想
2.散点图只描述具有相关关系的两个变量所对应点的图形吗?
提示:不是.两个变量统计数据所对应的点的图形都是散点图.3.回归直线方程
(1)线性相关关系
如果散点图中点的分布从整体上看大致在________________,我们用直线___________拟合散点图中的这些点,像这样能用直线方程_____________近似表示的______________叫做线性相关关系.一条直线附近相关关系(2)线性回归方程
设有n对观察数据如下:当a,b使Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2取得__________时,就称方程_____________为拟合这n对数据的线性回归方程,该方程所表示的直线称为_________.最小值回归直线(3)用回归直线进行数据拟合的一般步骤为:
①作出散点图,判断_____是否在__________附近.
②如果散点在一条直线附近,那么用公式
散点一条直线题型一 相关关系的判断
下列各题中的两个变量:
①正方体的体积与棱长;
②自由落体运动的物体的下落距离与时间;③人的身高与体重;
④球的体积与表面积;
⑤家庭的收入与支出.
其中具有相关关系的是________.【答案】 ③⑤
【思维升华】 (1)两变量间主要有两种关系:一是确定的函数关系,另一种是不确定的相关关系.同时要注意,两变量间也可能无相关关系,数学中只有统计部分研究不确定的相关关系.
(2)函数关系与相关关系的区别的关键是“确定性”还是“随机性”.1.下列两个变量之间的关系中,①角度和它的余弦值;②正方形的边长和面积;③正n边形的边数和其内角度数之和;④人的年龄和身高.不是函数关系的是________(填序号).解析:选项①②③都是函数关系,可以写出它们的函数表达式:f(θ)=cosθ,g(a)=a2,h(n)=nπ-2π,④不是函数关系,对于相同年龄的人群中,仍可以有不同身高的人.
答案:④题型二 散点图的画法及应用
以下是在某城市搜集到的不同楼盘房屋的售价y(单位:万元)与房屋面积x(单位:m2)的数据:(1)画出数据对应的散点图;
(2)判断房屋售价与房屋面积之间是否具有相关关系?【解】 (1)数据对应的散点图如图所示:(2)观察散点图可以判断,房屋的售价与房屋面积之间具有相关关系.
【名师点评】 判断变量间有无相关关系,一种常用的简便可行的方法就是绘制散点图.解:(1)散点图如下:
(2)由图知,所有数据点接近直线排列,
因此,认为y与x有线性相关关系.题型三 回归直线方程的求法及应用
(本题满分14分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小平方法求出y关于x的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)名师微博
这是求线性回归方程的关键.名师微博
回归方程的应用,你理解吗?【名师点评】 解决此类问题首先根据所给数据画出散点图,根据散点图判断两个变量之间是否具有相关关系,如果两个变量之间不具有相关关系,或者说,它们之间的关系不显著,即使求得了线性回归方程也是毫无意义的,而且用其估计和预测的结果也是不可信的.某饮料店的日销售收入y(单位:百元)与当天平均气温x(单位:度)之间有下列数据:答案:①方法技巧
1.相关关系与函数关系的异同点:2.最小二乘法:实际上,求回归直线方程的关键是如何用数学的方法来刻画“从整体上看各点与此直线的距离最小”,即最贴近已知的数据点,最能代表变量x与y之间的关系.
3.利用回归直线对总体进行估计:课件46张PPT。本 章 优 化 总 结第2章 统 计专题一 抽样方法的选取及应用
抽样方法分为简单随机抽样、系统抽样和分层抽样,其中简单随机抽样又分为抽签法和随机数表法,是最基本的抽样方法,系统抽样和分层抽样一般都可转化为简单随机抽样.三种抽样方法的共同特点是在抽样的过程
中,每个个体被抽到的可能性是相同的,体现了这些抽样方法的客观性和公平性. 当总体的个数较少时,常采用简单随机抽样;当总体的个数较多、且个体差异不明显时,常采用系统抽样;当总体是由差异明显的几部分组成时,常采用分层抽样. 某工厂有2013名工人,从中抽取20人参加体检,试分别采用简单随机抽样和系统抽样方法给出抽样过程.
【分析】本题已明确要求用两种方法抽样,即严格按照两种抽样方法的步骤进行即可.【解】 (1)简单随机抽样:
第一步,将每一个人编一个号由0001至2013.
第二步,将号码分别写在大小相同的号签上.
第三步,将号签放入一个不透明的大容器中,并均匀搅拌.
第四步,依次抽取20个号签.
具有这20个编号的人组成一个样本.(2)系统抽样:
因为2013=20×100+13,为了保证“等距”分段,应先剔除13人.
第一步,将2013人用随机方式编号.
第二步,从总体中剔除13人(剔除方法可用随机数表法),将剩下的2000人用随机方式编
号,编号分别为0001,0002,…,2000,并均分成100段.第三段,在第1段0001,0002,…,0100这100个编号中用简单随机抽样抽出1个号(如0003)作为起始号码.
第四步,将编号为0003,0103,0203,…,1903的个体抽出,组成样本.【点评】 (1)在系统抽样和分层抽样中要把总体分成几个互不重叠的部分,常常会出现总体个数与样本容量不能整除的情况,此时需用简单随机抽样法从总体中剔除部分个体,以保证每个个体入样的可能性不发生变化.
(2)如果总体中的个体有明显的差异,则只能用分层抽样,否则抽取的样本可能不具有代表性.专题二 用样本的频率分布估计总体分布
用样本的分布规律来估计总体的分布,这是统计的基本思想.样本的频率分布表、频率分布直方图和折线图、茎叶图是必须熟练掌握的,在此基础上,可以由频率分布折线图反映的数据变化趋势来近似得出总体分布的密度曲线,以此来估计总体的分布情况. 为了解某校高一年级学生的体能情况,抽取部分学生进行一分钟跳绳测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多
少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?【分析】 (1)在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.
(2)达标率是一个百分数,注意要乘以100%.【点评】 (1)频率反映了样本落在某一区间的可能性大小.
(2)频率分布直方图中,用面积表示频率.
(3)在频率分布直方图中,所有小长方形的面积之和等于1.专题三 用样本的数字特征估计总体的数字特征
总体的平均数与标准差往往通过样本的平均数、标准差来估计.一般地,样本容量越
大,对总体的估计越准确.
(1)从数字特征上描述一组数据的情况
平均数、众数、中位数描述其集中趋势,方差、极差和标准差描述其波动大小,也可以说方差、标准差和极差反映各个数据与其平均数的离散程度.(2)方差和标准差的运用
一组数据的方差或标准差越大,说明这组数据波动越大,方差的单位是原数据的单位的平方,标准差的单位与原单位相同. 甲、乙两名运动员在相同条件下各射靶10次,进行射击水平测试,每次命中的环数分别是:
甲:8 6 7 8 6 5 9 10 4 7
乙:6 7 7 8 6 7 8 7 9 5
(1)分别计算以上两组数据的平均数;
(2)分别求出两组数据的方差;
(3)根据计算结果估计一下两名运动员的射击情
况,你认为应该选拔哪位运动员参加射击比赛?(2)根据方差的计算公式,把已知数据都减去7
得:
甲:1 -1 0 1 -1 -2 2 3 -3 0
乙:-1 0 0 1 -1 0 1 0 2 -2
把上述数据平方后得:
甲:1 1 0 1 1 4 4 9 9 0
乙:1 0 0 1 1 0 1 0 4 4专题四 线性回归方程及应用
对两个变量进行研究,通常是先作出两个变量之间的散点图,根据散点图直观判断两个变量是否具有线性相关关系,如果是,就可以应用最小平方法求线性回归方程,由于样本反映总体,所以可以利用所求的线性回归方程,对这两个变量确定的总体进行估计,即根据一个变量的取值,预测另一个变量的结果;散点图和求线性回归方程是重点,要熟练掌握.(1)作出推销金额y与工作年限x的散点图,并求y与x之间的相关系数r(精确到小数点后两位);
(2)判断y与x之间的相关性;若是线性相关关
系,求年推销金额y关于工作年限x的线性回归方程;
(3)若第6名推销员的工作年限为11年,试估计他的年推销金额.【分析】 ①作散点图,观察y与x之间的关
系;②根据相关系数公式计算r,并判断y与x的相关性;③根据最小平方法的系数计算公式求b,a,写出线性回归方程;④根据线性回归方程进行预测.【解】 (1)根据表中数据可以作出推销金额y与工作年限x的散点图,如图所示:
答案:(1.5,4)
2.一组数据中的每一个数据都乘以2,再都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是________.答案:40.6,1.13.从一个养鱼池中捕得m条鱼,作上记号后再放入池中,数日后又捕得n条鱼,其中k条有记号,则估计池中有________条鱼.