【金版学案】2014-2015高中数学苏教版必修3配套课件:第2章统计(打包9份)

文档属性

名称 【金版学案】2014-2015高中数学苏教版必修3配套课件:第2章统计(打包9份)
格式 zip
文件大小 3.8MB
资源类型 教案
版本资源 苏教版
科目 数学
更新时间 2014-12-25 09:38:52

文档简介

课件33张PPT。数学·必修3(苏教版)第2章 统  计
2.1 抽样方法
2.1.1 简单随机抽样情景切入
在进行抽样时,如何做才能满足抽样的随机性和每个个体被抽取机会的均等性呢?下面首先介绍一种最简单、最基本的抽样方法——简单随机抽样. 栏目链接自 主学 习1.一般地,我们把所考查对象的全体叫________,组成总体的每一个________称为个体,从总体中抽取的一部分个体叫________,样本中所含个体的数目叫________.
2.一般地,从元素个数为N的总体中________地抽取容量为n的样本,如果每一次抽取时总体中的各个个体被抽到的可能性________,这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做______________.最常用的简单随机抽样的方法有________和_____________两种.总体研究对象样本样本容量不放回相同简单随机样本抽签法随机数表法 栏目链接自 主学 习3.用简单随机抽样的方法从个体数为N的总体中抽取一个容量为n的样本时,在整个抽样过程中每个个体被抽到的可能性相等,即等于________.
4.用随机数表法从全班60人(男生24人)抽选20人参加社会实践活动,男生甲被抽到的可能性是________., 栏目链接 栏目链接一、抽签法要 点导 航 1.抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n(n≤N)次,记下号签上的号码,就得到一个容量为n的样本.
2.抽签法简单易行,当总体中的个体数不多时,使总体处于“搅拌均匀”的状态比较容易,这时每个个体有均等的机会被抽中,从而能够保证样本的代表性.但是,当总体中的个体数较多时,将总体“搅拌均匀”就比较困难, 栏目链接要 点导 航会导致抽样的不公平.
3.一般地,用抽签法从容量为N的总体中抽取一个容量为n的样本的步骤为:①将总体中的N个个体编号(号码可以从1到N);②将这N个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作);③将号签放在同一箱中,并搅拌均匀;④从容器中每次抽出一个号签,连续抽取n次;⑤将总体中与抽到的号签的编号相一致的n个个体取出. 栏目链接要 点导 航 1.用抽签法抽取样本时,编号的过程有时可以省略(如用已有编号),但制签的过程就难以省去了,而且,制签也比较麻烦.简化制签过程的一个有效办法就是制作一个表,其中的每个数都是用随机方法产生的,这样的表称为随机数表,于是,我们只需按一定的规则到随机数表中选取号码就可以.这种抽样方法叫随机数表法.二、随机数表法 栏目链接要 点导 航 2.用随机数表法抽取样本的步骤是:①将总体中的个体进行编号(每个号码位数一致);②在随机数表中任选一个数作为开始;③从选定的数开始按一定的方向读下去,得到的号码若不在编号中,则跳过,若在编号中,则取出;如果得到的号码前面已经取出,也跳过去,如此继续下去,直到取满为止;④根据选定的号码抽取样本. 栏目链接要 点导 航 3.在用随机数表法抽样时会遇到以下问题:要求用题中所给的编号抽取样本,但所给编号位数不一致.这时,可以用以下方法进行调整:①在位数少的数前添加“0”,凑齐位数,如1,2,…,100可调整为001,002,…,100.②把原来的号码加上10的倍数,如1,2,…,100,每个数加10的倍数可调整为101,102,…,200.③把个体重新编号,按新编号抽取完以后,再对应找出原来的号码. 栏目链接要 点导 航 1.一般地,从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.
2.当总体中的个体较少时,常用简单随机抽样.它的特点如下:①它要求被抽取样本的总体中的个体数有限.这样,便于通过随机抽取的样本对总体进行分析.②它是从总体中逐个地进行抽取.这样,便于在抽样实践中进行操作.三、简单随机抽样的概念 栏目链接要 点导 航 ③它是一种不放回抽样.由于抽样实践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算.④它是一种机会均等的抽样.不仅每次从总体中抽取一个个体时,各个个体被抽取的机会相等,而且在整个抽样过程中,各个个体被抽取的机会也相等,从而保证了这种抽样方法的公平性. 栏目链接要 点导 航 本知识点易错之处:①简单随机抽样定义中的有关概念,如个体、样本、样本容量等易混淆.
②简单随机抽样的特点之四在计算时易出错. 栏目链接典 例剖 析 例1现有关单位要了解新课改体制下的高考及学生的适应情况,决定在课改省市的重点中学进行抽样调查.假设要从某中学的高三年级全体同学450人中随机抽出20人.请用抽签法抽出人选,写出抽取过程. 由于总体数量不大,抽取样本数量小,故可采用抽签法. 栏目链接 抽签法:先把450名同学的学号写在小纸片上,揉成小球,放到一个不透明袋子中,充分搅拌后,再从中逐个抽出20个小球,这样就抽出20人参加活动. 使用抽签法应注意:①个体数不多;②样本容量较小. 栏目链接典 例剖 析变式训练 1.为了解2014年世界杯后各国家队的训练情况,现从32个参赛中选取8个队进行调查,请用抽签法设计抽样方案. 栏目链接典 例剖 析 (1)将32个队编号,分别为1,2,…,32;(2)将这32个号码分别写在相同的32个乒乓球上;(3)将这32个乒乓球放入一个容器中,均匀搅拌,拿出1个乒乓球,记录号码,重复以上过程,直到拿出8个乒乓球.(4)这8个乒乓球的号码就是选出的8个队的号码. 栏目链接典 例剖 析 例2 有一批机器,编号为1,2,3,…,112,为调查机器的质量问题,打算抽取10台入样,问此样本若采用简单随机抽样方法将如何获得? 由题目可获取以下主要信息:①要从编号为1,2,3,…,112的112台机器中抽取10台;②每台机器被抽取的可能性相同.
解答本题可采用抽签法和随机数表法. 栏目链接典 例剖 析 解法一:把机器都编上号码001,002,003,…,112,如用抽签法,则把号码写在112个形状、大小相同的号签上,并放在同一个箱子里,进行均匀搅拌,抽签时,每次从中抽出1个号签,连续抽取10次,就得到一个容量为10的样本.
解法二:第一步 将原来的编号调整为001,002,003,…,
112;
第二步 在随机数表中任选一数作为开始,任选一方向作为读数方向.比如:选第9行第5个数“1”,向右读; 栏目链接典 例剖 析第三步 从“1”开始,向右读,每次读取三位,凡不在001~112中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到078,001,096,097,067,031,055,052,014,109;
第四步 对应原来编号078,001,096,097,067,031,055,052,014,109的机器便是要抽取的对象.(此随机数表见教材附录). 栏目链接典 例剖 析 (1)一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否易搅匀,一般地,当总体容量和样本容量都较小时可用抽签法.
(2)随机数表中共随机出现0,1,2,…,9十个数字,也就是说,在表中的每个位置上出现各个数字的机会都是相等的.在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或每四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去. 栏目链接典 例剖 析变式训练 2.现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检验,如何用随机数表法设计抽样方案? 栏目链接典 例剖 析 S1 将元件的编号调整为010,011,…,099,100,…,600.
S2 在随机数表中任选一个数作为开始,任选一个方向作为读数方向.比如,选第1行第7个数,向右读.
S3 从选定的数开始,向右读,每次读取三位,凡不在010~600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到162,332,560,111,410,246.
S4 以上号码对应的6个元件就是要抽取的对象.(此随机数表见教材附录) 栏目链接典 例剖 析 例3下列问题中,最适合用简单随机方法抽样的是(  )
A.某电影院有32排座位,每排有40个座位,座位号是1~40.有一次报告会坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈
B.从10台冰箱中抽出3台进行质量检查 栏目链接典 例剖 析 C.某学校有在编人员160人.其中行政人员16人,教师112人,后勤人员32人.教育部门为了解学校机构改革意见,要从中抽取一个容量为20的样本
D.某乡农田有山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩,现抽取农田480亩估计全乡农田平均产量 栏目链接典 例剖 析 根据简单随机抽样的特点进行判断.A的总体容量较大,用简单随机抽样法比较麻烦;B的总体容量较小,用简单随机抽样法比较方便;C项,由于学校各类人员对这一问题的看法可能差异很大,不宜采用简单随机抽样法;D的总体容量较大,且各类田地的产量差别很大,也不宜采用简单随机抽样法.B 栏目链接典 例剖 析 解答本题时,应关注两个方面的问题:
(1)抽出的样本必须准确地反映总体特征;
(2)操作起来比较方便.
个体和总体未必是有形的实物,具体问题应依据研究的对象来确定何为个体、总体. 栏目链接典 例剖 析变式训练 3.下面的抽样方法是简单随机抽样吗?为什么?
(1)某班45名同学,指定个子最高的5名同学参加学校组织的某项活动.
(2)从20个零件中一次性抽出3个进行质量检验.
(3)一儿童从玩具箱中的20件玩具中随意拿出一件来玩,玩后放回再拿下一件,连续玩了5件. 栏目链接典 例剖 析 (1)不是简单随机抽样.因为这不是等可能抽样.
(2)不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.
(3)不是简单随机抽样.因为这是有放回抽样. 栏目链接课件29张PPT。数学·必修3(苏教版)第2章 统  计    
2.1 抽样方法
2.1.2 系统抽样 情景切入
实际抽样中往往要考察容量很大的总体,例如某省农村家庭的年平均收入状况,某电视机厂生产的某种型号的电视机的质量是否合格.这时样本容量越大越能更好地反映总体特征,但工作量也随之增大.当总体元素个数很大时,样本容量就不宜太小,采用简单随机抽样,就显得费事.这时,我们采取新的抽样方法——系统抽样.1.理解系统抽样的概念,系统抽样和简单随机抽样的关系.
2.掌握系统抽样的一般步骤,会用系统抽样在总体中抽取样本. 栏目链接自 主学 习1.系统抽样被称为________,它按照时间或空间________抽取样本,即将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分_______________,得到所需要的样本.系统抽样与简单随机抽样的联系在于:对将总体均分的每一部分进行抽样时,采用的是________.
2.用系统抽样从a1,a2,…,a2 015中抽取5个作为样本,样本容量为______,间隔为______., 栏目链接等距抽样等距间隔抽取一个个体简单随机抽样5403 栏目链接一、系统抽样要 点导 航 栏目链接要 点导 航 3.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样.
4.由于抽样的间隔相等,因此系统抽样也被称作等距抽样.在进行大规模的抽样调查时,系统抽样比简单随机抽样要方便.
5.在系统抽样中,如果总体中的个体数正好能被样本容量整除,则可用它们的比值作为进行系统抽样的间隔.如果不能被整除,则可 栏目链接要 点导 航 用简单随机抽样的方法从总体中剔除若干个个体,其个数为总体中的个体数除以样本容量所得的余数.然后再编号、分段、确定第1段的起始号,继而确定整个样本.在上述过程中,因为总体中的每个个体被剔除的机会相等,也就是每个个体不被剔除的机会相等,所以在整个抽样过程中每个个体被抽到的机会仍然相等. 栏目链接要 点导 航二、系统抽样的步骤 栏目链接要 点导 航 栏目链接要 点导 航 栏目链接要 点导 航 (2)系统抽样与简单随机抽样的区别与联系: 栏目链接要 点导 航 面对实际问题,能准确地选择一种合理的抽样方法,对初学者来说至关重要.可采用以下原则:①当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法(也可用随机数表法);②当总体容量较大,样本容量较小时可用随机数表法;③当总体容量较大,样本容量也较大时也可用系统抽样法. 栏目链接 栏目链接典 例剖 析 例1为了解1 200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k为________.40 栏目链接典 例剖 析变式训练 1.某工厂生产的产品,用速度恒定的传送带将产品送入包装车间之前,质检员每隔3分钟从传送带上的特定位置取一件产品进行检测,这种抽样方法是________. 栏目链接系统抽样典 例剖 析 例2 某单位有在岗职工共624人,为了调查工人用于上班途中的时间,决定抽取68名工人进行调查.如何采用系统抽样方法完成这一抽样? 栏目链接典 例剖 析 ∵624=68×9+12,
∴为保证“等距”分段,应先剔除12人.
S1 将624名职工用随机方式编号;
S2 从总体中剔除12人(剔除方法可用随机数表法),将剩下的612名职工重新编号(分别为000,001,002,…,611),并分成68段;
S3 在第一段000,001,002,…,008这九个编号中用简单随机抽样法抽出一个(如003)作为起始号码;
S4 将编号为003,012,021,…,606的个体抽出,组成样本. 栏目链接典 例剖 析 栏目链接典 例剖 析变式训练 2.某校高中三年级有学生962名,为了了解学生的某些情况,按1∶8的比例抽取一个样本,用系统抽样方法进行抽取,并写出过程. 栏目链接典 例剖 析 栏目链接典 例剖 析 例3某制罐厂每小时生产易拉罐10 000个,每天生产时间为12小时,为了保证产品的合格率,每隔一段时间要抽取一个易拉罐送检,工厂规定每天共抽取1 200个进行检测,请你设计一个抽样方案.若工厂规定每天共抽取980个进行检测呢? 因为总体容量较大,样本容量也较大,可用系统抽样法抽样. 栏目链接典 例剖 析 栏目链接典 例剖 析 系统抽样分组时,对多余个体的剔除不影响抽样的公平性. 栏目链接典 例剖 析变式训练 3.从已编号的1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射试验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选5枚导弹的编号可能是(  )
A.5,10,15,20,25  B.3,13,23,33,43
C.1,2,3,4,5 D.2,4,6,16,32 栏目链接典 例剖 析 栏目链接B课件24张PPT。数学·必修3(苏教版)第2章 统  计    
2.1 抽样方法
2.1.3 分层抽样情景切入
当总体由有明显差别的几部分组成时,为了使抽取的样本能更好地反映总体的情况,应当分别兼顾这几个部分,采取新的抽样方法——分层抽样.1.理解分层抽样的概念,能区分简单随机抽样、系统抽样和分层抽样,并能选择适当的方法进行抽样.
2.掌握分层抽样的步骤. 栏目链接自 主学 习1.当总体中的几部分个体有______________________时,常将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做____,在各层中按层在总体中所占的______进行__________抽样或________抽样,这种抽样方法叫做分层抽样.分层抽样时,每一个个体被抽到的可能性都是________的.
2.放回抽样:
________________________________________________________________________;明显的差异且易于区别层比例简单随机相等系统在抽样中,如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样  栏目链接自 主学 习不放回抽样:
________________________________________________________________________.
3.分层抽样时每个层次抽取的个体数量是按____ _______________________________进行抽取的.,在抽样中,如果每次抽出个体后不再将它放回总体,
称这样的抽样为不放回抽样各组个体数量在总体上的比例 栏目链接 栏目链接一、分层抽样的概念要 点导 航 1.分层抽样的前提条件:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体在总体上所占比例抽取.分层抽样要求对总体的内容有一定的了解,明确分层的界限和数目,只要分层恰当,一般说来抽样结果就比简单随机抽样更能反映总体情况.
2.分层抽样的公平性:分层抽样是将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽取一部分个体,得到所需 栏目链接要 点导 航 栏目链接要 点导 航 3.分层抽样的优点:使样本具有较强的代表性,而且在各层抽样时,又可灵活地选用不同的抽样法.
注意 分层标准要一致,层与层之间互不重叠,分层抽取时采用简单随机抽样或系统抽样. 栏目链接要 点导 航二、分层抽样的步骤 栏目链接要 点导 航本知识点易错之处:利用抽样比计算各层所抽取的个体数时,容易出错,理解且解决的关键是认真阅读知识点一中的“分层抽样的公平性”. 栏目链接 栏目链接典 例剖 析 例1某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适________.分层抽样总体由差异明显的三部分组成,应选用分层抽样.分层抽样 栏目链接典 例剖 析 认真分析题意,根据总体特征选择正确的抽样方法.
注意三种抽样方法的联系与区别,抓住三种抽样的共同和不同之处. 栏目链接典 例剖 析 例2 某学校共有教师490人,其中不到40岁的有140人,40岁及40岁以上的有350人.为了解普通话在该校教师中的推广普及情况,用分层抽样的方法,从全体教师中抽取一个样本容量为70人的样本进行普通话水平测试,其中在40岁及40岁以上的教师中应抽取的人数是________. 栏目链接典 例剖 析50人 根据题意,保证每名教师被抽取的几率都相等. 栏目链接典 例剖 析变式训练 1.某学校有在编人员160人,其中行政人员有16人,教师有112人,后勤人员有32人,教育部门为了了解学校机构改变意见,要从中抽取一个容量为20的样本.试确定用何种方法抽取,并写出抽样过程. 栏目链接典 例剖 析 栏目链接典 例剖 析 例3某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数见下表:电视台为进一步了解观众的具体想法和意见,打算从中抽取60人进行更为详细的调查,应当怎样进行抽样? 栏目链接典 例剖 析 因为总体中人数较多,所以不宜采用简单随机抽样.又由于持不同态度的人数差异较大,故也不宜用系统抽样法,而以分层抽样法为妥. 栏目链接典 例剖 析 此题宜采取分层抽样法获取样本,这是因为此题情景符合分层抽样的特点:适用于总体由差异明显的几部分组成的情况. 栏目链接典 例剖 析变式训练 2.某校有高一学生400人,高二学生302人,高三学生250人,现在按年级分层抽样,从所有学生中抽取一个容量为190人的样本.则应该从所有学生中剔除________人,从高一,高二,高三年级中分别抽取的人数是______________.280、60、50 栏目链接课件29张PPT。数学·必修3(苏教版)第2章 统  计    
2.2 总体分布的估计
2.2.1 频率分布表情景切入
用随机抽样的方法在总体中抽取样本,我们就得到一组数据.然后,对这组数据进行概括和整理,想了解总体的什么特性,就画出与之相应的统计图(或列统计表).但是,当一个总体容量很大,从总体得到一个包含大量数据的样本时,我们很难从一个数字中直接看出样本所包含的信息.如果把这些数据形成频数分布或频率分布,就可以比较清楚地看出样本数据的特征.
把大量的数据进行概括和整理的过程,有两个问题:概括的方向和整理的速度.把数据形成频数分布是概括的方向之一,整理的速度快与慢是技术性的,你是否想到用计算机编程解决呢?1.了解频率分布的意义和作用.
2.掌握频率分布表的编制及其应用. 栏目链接自 主学 习1.频数是指落在各个小组内数据的________,频率是指________与______________的比值.
2.反映________频率分布的表格称为频率分布表.
3.编制频率分布表的步骤:(1)求全距,决定________和________,(2)分组,通常对组内数值所在区间取_______________,最后一组取________,(3)登记频数,计算________,列出________.个数频数数据总个数总体组数组距左闭右开区间闭区间频率频率分布表 栏目链接自 主学 习4.全距也叫________,它实际上是所取的全部样本数据中__ ________ ______的差.,极差最大值与最小值 栏目链接 栏目链接一、频率分布表要 点导 航 一般地,当总体很大或者不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.
注意 (1)用样本估计总体,是研究统计问题的一个基本思想方法,由于总体分布通常不易知道,我们往往是用样本的频率分布去估计总体分布,因此不能认为样本的分布状态就是总体的分布状态,这里可能会有误差,一般地,样本容量越大,这种估计就越精确. 栏目链接要 点导 航(2)初中已经学习过频率分布表,它介绍了抛掷硬币的试验,由于这个试验比较简单,它的结果只有两种,因此频率分布表比较简单,我们现在所研究的是比较复杂的频率分布表. 栏目链接要 点导 航二、频率分布表的编制 栏目链接要 点导 航 (2)“组距”的大小由所分的组数来确定,这根据实际需要来确定.组数分得过多或过少,都不利于制作频率分布表,更主要的是不利于通过样本的分布状态估计总体,所以应选择合适的组数.
(3)如果取全距时不利于分组(如不能被组数整除),可以适当地增大全距,如在左右两端各增加适当的范围(尽量使两端增加的量相同). 栏目链接要 点导 航(4)除最后边的区间是闭区间外,其他区间都是左闭右开区间.一般称区间的左端点为下组限,右端点为上组限,本书均采用下组限在内而上组限不在内的分组方法. 栏目链接 栏目链接典 例剖 析 例1连续抛掷一个骰子120次,得到1,2,3,4,5,6点的次数各为18,19,21,22,20,20.
列出样本的频率分布表. 栏目链接典 例剖 析 栏目链接典 例剖 析变式训练 1.从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分):
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表(含累计频率);
(2)估计成绩在[60,90)分的学生比例;
(3)估计成绩在85分以下的学生比例. 栏目链接典 例剖 析(1)频率分布表如下: 栏目链接典 例剖 析 栏目链接典 例剖 析 例2 为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5~18岁的男生的体重情况,结果如下(单位:kg): 栏目链接典 例剖 析 栏目链接典 例剖 析 试根据上述数据画出样本的频率分布表,并对相应的总体分布作出估计.. 确定组距与组数是解决“总体中的个体取不同值较多”这类问题的出发点. 按照下列步骤获得样本的频率分布.
(1)找最大值与最小值的差:
在上述数据中,最大值是76,最小值是55,它们的差(又称为全距)是76-55=21.
(2)确定组距与组数: 栏目链接典 例剖 析如果将组距定为2,那么由21÷2=10.5,组数为11,这个组数适合,于是组距为2,组数为11.
(3)决定分点:
根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,由于规定分组的区间是“左闭右开”的,这样所得到的分组是[54.5,56.5),[56.5,58.5),…,[74.5,76.5].
(4)列频率分布表如下: 栏目链接典 例剖 析 栏目链接典 例剖 析(续上表) 栏目链接典 例剖 析 合理、科学地确定组距和组数,才能准确地制表,这是用样本的频率分布估计总体分布的基本功.
列出频率分布表,就可以从“频数”栏目知道数据落在各个小组的个数,也可以从每一组的频率,知道数据落在各个小组的比例大小. 栏目链接典 例剖 析变式训练 2.为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件.
(1)作出样本的频率分布表;
(2)根据上述结果,估计此产品为二级品或三级品的百分比约是多少? 栏目链接典 例剖 析(1)样品的频率分布表为: 栏目链接课件35张PPT。数学·必修3(苏教版)第2章 统  计    
2.2 总体分布的估计
2.2.2 频率分布直方图与折线图 当我们把样本从总体中抽出来后,可以通过频率分布表对样本进行分析,频率分布直方图和折线图也可以对样本进行分析,而且频率分布直方图更能直观地体现数据的分布规律.1.了解频率分布直方图与折线图的特征.
2.掌握频率分布直方图与折线图的画法及其应用. 栏目链接自 主学 习1.作频率分布直方图的步骤为:(1)计算全距,即___ ___________________________;(2)__________;(3)__________;(4)列____________________;(5)绘制______________________.
2.频率分布直方图中,______________=组距×=频率,即以________的形式反映了数据落在各小组内的________的大小,各小长方形的面积之和等于________.一组数据的最大值与最小值的差决定组数与组距决定分点频率分布表频率分布直方图小长方形面积面积 频率1 栏目链接自 主学 习3.连接频率分布直方图中各小长方形上端的中点,就得到_______________.一般地,当总体中的个体数较多时,抽样时样本容量就不能太小,随着样本容量的增加,作图时所分的________也在增加,相应的频率分布折线图会越来越接近于一条光滑曲线,这条光滑曲线就叫做______________,它反映了一个总体____ ________ ____的规律.,频率分布折线图组数总体密度曲线在各个区域内取值 栏目链接 栏目链接一、频率分布直方图要 点导 航 频率分布直方图:利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图,简称频率直方图.
(1)频率分布直方图的绘制方法与步骤.
S1 先制作频率分布表,然后作直角坐标系.
S2 把横轴分成若干段,每一段对应一个组的组距.
S3 在上面标出的各点中,分别以相邻两点为端点的线段为底作 栏目链接要 点导 航 栏目链接要 点导 航 注意 同样一组数据,如果组距不同,横轴、纵轴单位不同,得到的图的形状也会不同.不同的形状给人的印象也不同,这种印象有时会影响我们对总体的判断;同一个总体,由于抽样的随机性,如果随机抽取另外一个容量相同的样本所形成的样本频率分布一般会与前一个样本频率分布有所不同.但是,它们都可以近似地看作总体的分布.
(2)频率分布直方图的特点:从频率分布直方图可以清楚地看出数据分布的总体态势,但是从直方图本身得不出 栏目链接要 点导 航所以,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
注意 (1)为方便起见,组距的选择应力求“取整”,如果极差不利于分组(如不能被组数整除),要适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同).
(2)组距和组数的确定没有固定的标准,常常需要一个尝试和选择的过程,将数据分组时,组数应力求合适,以使数据的分布规律能较 栏目链接要 点导 航 栏目链接要 点导 航二、频率分布折线图 1.频率分布折线图:把频率分布直方图各个长方形上边中点用线连接起来,就得到频率分布折线图.为了方便看图,一般习惯把频率分布折线图画成与横轴相连,所以横轴上的左右两端点没有实际的意义.如下图所示的频率分布折线图. 栏目链接要 点导 航 2.总体密度曲线:样本容量越大,所分组数越多,频率分布直方图中表示的频率分布就越接近于总体在各个小组内所取值的个数与总数比值的大小.设想如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上越来越接近于总体的分布,它可以用一条光滑曲线y=f(x)来描绘,这条光滑曲线就叫做总体密度曲线.
3.频率分布与总体分布:(1)总体密度曲线反映了一个总体在各个区域内取值的规律,它能给我们提供 栏目链接要 点导 航更加精细的信息.总体在某一区间取值的百分比就是该区间与该曲线所夹的曲边梯形的面积.
(2)总体密度曲线通常都是由样本的频率分布估计出来的.这是因为:①并非所有的总体都存在密度曲线,如一些离散型总体;②尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样被准确地画出来,我们只能用它进行估计.一般说来,样本容量越大,这种估计就越精确. 栏目链接 栏目链接典 例剖 析 例1下表给出了某校120名12岁男孩的身高资料(单位:cm): 栏目链接典 例剖 析(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)求身高小于142 cm的人数占总人数的百分比.
分析:先列出频率分布表,画出直方图,然后估计身高小于142 cm人数占总人数的百分比. 栏目链接典 例剖 析(1)频率分布表如下: 栏目链接典 例剖 析 栏目链接典 例剖 析(2)频率分布直方图如下图所示: 栏目链接典 例剖 析 频率分布表中的前两列数据题目已经给出,即分组与每组所对应的频数.根据这些数,我们可求每组所对应的频率,频率等于每组的频数与男孩总数之商,画频率分布直方图,还需要一组数据,即频率/组距.频率分布直方图的纵轴上的数据,可先标出最大值,为好计算也可标出比最大的频率/组距还大一点的数,然后再依次平分即可,不要从最小开始标,那样可能会要不断地接纵轴或画的纵轴太长需擦去,致使整个图象比例不协调. 栏目链接典 例剖 析变式训练 1.(2014·南宁模拟)在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如下图所示).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题: 栏目链接典 例剖 析 (1)本次活动共有多少件产品参加评比?
(2)哪组上交的作品数最多?有多少件?
(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组中哪组获奖率较高? 栏目链接典 例剖 析 栏目链接典 例剖 析 栏目链接典 例剖 析 例3已知50个数据的分组以及各组的频数如下:
153.5~155.5 2  161.5~163.5 10
155.5~157.5 7 163.5~165.5 6
157.5~159.5 9 165.5~167.5 4
159.5~161.5 11 167.5~169.5 1
(1)列出频率分布表;
(2)画出频率分布直方图和频率分布折线图. 栏目链接典 例剖 析此题按照频率分布直方图的绘制步骤解决即可.(1)频率分布表如下: 栏目链接典 例剖 析 栏目链接典 例剖 析 连接频率分布直方图的各个小长方形上边中点就得到频率分布折线图.(2)频率分布直方图和频率分布折线图如下图所示. 栏目链接典 例剖 析变式训练 2.为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组如下:
[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;[11.35,11.45),7;[11.45,11.55),4;[11.55,11.65],2.
(1)列出频率分布表; 栏目链接典 例剖 析(2)画出频率分布直方图以及频率分布折线图;
(3)根据上述图表,估计数据落在[10.95,11.35)范围内的可能性是多大? 栏目链接典 例剖 析(1)频率分布表如下: 栏目链接典 例剖 析(2)频率分布直方图及频率分布折线图如图. (3)由上述图表可知,数据落在[10.95,11.35)范围内的频率为0.13+0.16+0.26+0.20=0.75=75%,即数据落在[10.95,11.35)范围内的可能性是75%. 栏目链接课件24张PPT。数学·必修3(苏教版)第2章 统  计    
2.2 总体分布的估计
2.2.3 茎 叶 图情景切入
除了前面讲过的几种图、表能帮助我们理解样本数据外,统计中还有一种被用来表示数据的图,它是一种将样本数据有条理地一一列出来,从中观察样本分布情况的图..了解茎叶图的特征
.掌握茎叶图的画法及应用 栏目链接自 主学 习1.统计中还有一种被用来表示数据的图叫茎叶图.制作茎叶图的方法:将所有两位数的十位数字作为________,个位数字作为叶,茎按______________从上向下列出,其茎的叶一般按______________________的顺序同行列出.
2.当数据是三位有效数字时,以________为茎,________为叶画茎叶图.,茎从小到大的顺序从大到小(或从小到大)前两位数末位数 栏目链接 栏目链接茎叶图要 点导 航将数据有条理地列出来,从中观察数据的分布情况,这种方法就是画出数据的茎叶图.制作茎叶图的思路是将数组的数按位数进行比较,将数大小基本不变或变化不大的位作为一个主杆(茎),将变化大的位的数作为分枝(叶),列在主杆的后面,这样就可以清楚地看到每个主杆后面有几个数,每个数具体是多少.
茎叶图中的茎是“叶”的上一级单位,右边的是数组中的变化位,它是按照一定的间隔将数组中的每个变化 栏目链接要 点导 航的数一一列出来,像一条枝上抽出的叶子一样,所以人们形象地叫它茎叶图.
茎叶图既可以分析单组数据,也可以对两组数据进行比较.
茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录与表示.但茎叶图表示三位数以上的数据时不够方便,一般要通过专业的软件来帮助处理. 栏目链接要 点导 航 注意 (1)茎叶图可以展示未分组的原始数据,这与频率分布表以及频率分布直方图不同.
(2)茎叶图由“茎”和“叶”两部分组成,绘制茎叶图的关键是设计好树茎,通常是以该组数据的高位数值作为树茎,树茎一经确定,树叶就自然地长在相应的树茎上了. 栏目链接 栏目链接典 例剖 析 例1下面一组数据是某生产车间30名工人某日加工零件的个数,请设计适当的茎叶图表示这组数据,并由图出发说明一下这个车间此日的生产情况.
134 112 117 126 128 124 122 116 113 107 116 132 127 128 126 121 120 118 108 110 133 130 124 116 117 123 122 120 112 112 栏目链接典 例剖 析 对于三位数的情况,以前两位数为茎,个位数为叶,可以作出相应的茎叶图,从而可据图分析数据的特征.茎叶图如下图:
百位 十位 个位 栏目链接典 例剖 析 该生产车间的工人加工零件数大多都在110到130之间,且分布较对称、集中,说明此车间日生产情况稳定. 茎叶图中当所给的数据超过两位数时,常以个位数为叶,其余的十位数、百位数等为茎. 栏目链接典 例剖 析变式训练 1.有关部门从甲、乙两个城市所有的自动售货机中分别随机抽取了16台,记录上午8:00~11:00间各自的销售情况如下(单位:元):
甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;
乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.
你能用适当的统计图表示上面的数据吗? 栏目链接典 例剖 析 如图所示的茎叶图中,中间的数字表示甲、乙两城市自动售货机销售额的十位数,两边的数字分别表示它们的个位数.
     甲      乙 栏目链接典 例剖 析 例2在某电脑杂志的一篇文章中,每个句子中所含的字的个数如下:
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.
在某报纸的一篇文章中,每个句子中所含的字的个数如下:
27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22. 栏目链接典 例剖 析(1)将这两组数据用茎叶图表示.
(2)将这两组数据进行比较分析,得到什么结论? 作茎叶图先确定中间数取数据的哪几位,填写数据时边读边填,无需按大小排列.
比较时从数据分布的对称性、中位数、稳定性等几个方面来比较. 栏目链接典 例剖 析(1)茎叶图如下图所示.
     电脑杂志    报纸文章 栏目链接典 例剖 析(2)如上图,电脑杂志上每个句子的字数大多集中在10~30之间,中位数为22.5;而报纸上每个句子的字数大多集中在20~40之间,中位数为27.5.可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少,说明电脑杂志作为科普读物需要通俗易懂、简明. 栏目链接典 例剖 析 茎叶图在样本数据较少,较为集中且位数不多时比较适用.由于它较好地保留了原始数据,所以可以帮助分析样本数据的大致频率分布,还可以用来分析样本数据的一些数字特征. 栏目链接典 例剖 析变式训练 2.某赛季甲、乙两名篮球运动员各场比赛得分情况如下:
甲的得分:12 15 24 25 31 31 36 36 37 39 44 49 50
乙的得分:8 13 14 16 23 26 28 33 38 39 51
试作出两名运动员成绩的茎叶分布图,并对他们的成绩进行比较. 栏目链接典 例剖 析两人得分的茎叶图如下:
   甲        乙 栏目链接典 例剖 析 从这个茎叶图可以看出,甲运动员的得分大致对称,平均得分、众数及中位数都是30多分;乙运动员的得分除一个51分外,也大致对称,平均得分、众数及中位数都是20多分,因此甲运动员发挥得比乙运动员稳定,总体得分情况比乙好. 栏目链接课件24张PPT。数学·必修3(苏教版)第2章 统  计    
2.3 总体特征数的估计
2.3.1 平均数及其估计情景切入
我们已经学习了用图、表来组织、概括样本数据,并且学习了如何通过图、表所提供的信息,用样本的频率分布估计总体的分布.但是,在很多情况下,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,如平均数、方差等.1.理解众数、中位数、平均数的意义.
2.掌握平均数的计算方法并能用样本平均数估计总体平均数. 栏目链接自 主学 习1.在一组数据中,出现次数________的数据叫做这组数据的众数;将一组数据按从小到大的顺序依次排列,把处在________位置的一个数据(或中间两个数据的平均数)叫做这组数据的________;如果有n个数x1,x2,x3,…,xn,那么x=______________叫做这n个数的平均数.
2.在频率分布直方图中,中位数左边和右边直方图的面积________.,最多中间中位数相等 栏目链接 栏目链接众数、中位数、平均数要 点导 航 1.众数是样本观测值中出现次数最多的数,在频率分布直方图中它是最高的矩形的中点.样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息.通常用于描述分类变量的中心位置.
2.将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数.中位数不受几个极端数据(即排序靠前或靠后的数据) 栏目链接要 点导 航的影响,容易计算.它仅利用了数据中排在中间的数据的信息.当样本数据质量比较差,即存在“一些错误数据”(如数据的录入错误或测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值.
3.平均数是频率分布直方图的“重心”.由于平均数与样本的每一个数据都有关,所以任何一个样本数据的改变都会引起平均数的改变.因此,平均数可以反映出更多的关于数据全体的信息.一般情况下,一组数据的平均值可以反映出这组数据的一般情况,比如某班一次考试 栏目链接要 点导 航成绩的平均分可以反映出该班学生该科的学习水平.但特殊情况下,平均值可能受某几个极端值的影响,而偏离一般情况.
4.众数、中位数、平均数的区别与联系:(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动.(3)众数考查各数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,众数往往更能反映问题.(4)中位数仅与数据的 栏目链接要 点导 航排列位置有关,某些数据的变动对中位数没有影响.中位数可能出现在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.(5)实际问题中求得的平均数、众数和中位数应带上单位. 栏目链接 栏目链接典 例剖 析 例1有容量为100的样本,数据分组及各组的频数、频率如下.
[12.5,14.5),6,0.06;[14.5,16.5),16,0.16;[16.5,18.5),18,0.18;[18.5,20.5),22,0.22;[20.5,22.5),20,0.20;[22.5,24.5),10,0.10;[24.5,26.5],8,0.08.试估计总体的平均数. 栏目链接典 例剖 析 由于每组的数据是一个范围,所以可以用组中值近似地表示平均数. 解法一:总体的平均数约为
×(13.5×6+15.5×16+17.5×18+19.5×22+21.5×20+23.5×10+25.5×8)=19.42.
故总体的平均数约为19.42.
解法二:求组中值与对应频率积的和. 栏目链接典 例剖 析 13.5×0.06+15.5×0.16+17.5×0.18+19.5×0.22+21.5×0.20+23.5×0.10+25.5×0.08=19.42.
故总体的平均数约为19.42. 当条件给出某几个范围内的数据的频率或频数时,可用组中值求近似平均数. 栏目链接典 例剖 析变式训练 1.为了了解某班学生每周做家务劳动的时间,某综合实践活动小组对该班50名学生进行了调查,有关数据如下表:根据上表中的数据,回答下列问题:
(1)该班学生每周做家务劳动的平均时间是多少小时?
(2)这组数组的中位数、众数分别是多少? 栏目链接典 例剖 析 栏目链接典 例剖 析 例2为了估计一次性筷子的用量,2010年某县从600家高、中、低档饭店中抽取10家,得到这些饭店每天消耗的一次性筷子的数据如下(单位:盒);0.6,3.7,2.2,1.5,2.8,1.7,1.2,2.1,3.2,1.0.
(1)通过对样本数据的计算,估计该县2010年共消耗了多少盒一次性筷子(每年按350个营业日计算). 栏目链接典 例剖 析 (2)2012年又对该县一次性木质筷子的用量以同样的方式做了抽样调查,调查结果是10家饭店平均每天使用一次性筷子2.42盒,求该县2011年、2012年这两年一次性筷子用量平均每年增加的百分率.
(3)假如让你统计你所在省一年使用一次性筷子所消耗的木材量,如何利用统计知识去做?简要说明你的做法. 栏目链接典 例剖 析 根据样本平均数估算总体平均数,进一步确定总体的数目. 栏目链接典 例剖 析 (2)由于2010年一次性筷子用量是平均每天2盒,而2012年用量是平均每天2.42盒,设平均每年增长的百分率为x,依题意有2.42=2×(1+x)2,解得x=10%,所以该县2011年、2012年这两年一次性筷子的用量平均每年增长10%.
(3)先采用简单随机抽样的方法抽取若干县(市)(作样本),再从这些县(市)中采用分层抽样的方法抽取若干家饭店,统计一次性木质筷子的用量计算平均数,从而估计总体平均数,再进一步计算所消耗的木材总量. 栏目链接典 例剖 析 统计学的一个重要思想就是利用样本的信息来推断总体的有关信息,这样才能体会学习统计知识的作用和价值,我们要善于通过对表面随机现象进行统计分析,来揭示事物的内在规律. 栏目链接典 例剖 析变式训练 2.某校在一次学生身体素质调查中,在甲、乙两班中随机抽10名男生测验100 m短跑,测得成绩如下(单位:s):问哪个班里男生100 m短跑平均水平高一些? 栏目链接典 例剖 析 栏目链接课件27张PPT。数学·必修3(苏教版)第2章 统  计    
2.3 总体特征数的估计
2.3.2 方差与标准差情景切入
前面我们学习了通过对样本数据的平均数的分析处理,对总体的水平有了初步的了解,但当两组数据的平均数相同时,是不是它们的总体水平就相同呢?答案是否定的.这一节课我们就来看一下,还有哪些方法可以对总体的分布状态进行比较分析.1.理解方差,标准差的定义.
2.掌握方差,标准差的计算公式,并能用样本的方差与标准差估计总体的方差与标准差. 栏目链接自 主学 习1.数据的离散程度可以用极差、________或________来描述.样本方差描述了一组数据围绕平均数________的大小.一般地,样本的标准差用s表示,s=_____ ________ ____ ________ ____ ___,标准差的平方叫________,用s2表示,s2=__ ____ __ ________ _ ________ ____ _ ________ _____.
2.一般地,样本的数字特征是指________、________、________.,方差标准差  波动方差平均数方差 标准差 栏目链接 栏目链接标准差与方差要 点导 航 栏目链接要 点导 航 栏目链接要 点导 航 注意 (1)方差与极差的区别:一组数据的最大值与最小值的差称为极差.极差的大小反映了该组数据集中与分散的程度,但两组数据集中差异程度不大时,不宜得出结论.
(2)概念的理解:①标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小;②标准差、方差的取值范围:[0,+∞);标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据 栏目链接要 点导 航没有离散性;③因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差. 栏目链接 栏目链接典 例剖 析 例1为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的100只日光灯在必须换掉前的使用天数如下表: 栏目链接典 例剖 析(1)试估计这种日光灯的平均寿命.
(2)若定期更换,可选择多长时间统一更换合适? 总体的平均数与标准差往往很难求,甚至是不可求的,通常的做法就是用样本的平均数与标准差去估计总体的平均数与标准差,只要样本的代表性好,这种做法就是合理的. 栏目链接典 例剖 析 (1)各组中值分别为165,195,225,255,285,315,345,375,由此可算得平均数为165×1%+195×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天).
(2)将(1)组中值对于此平均数求方差: 栏目链接典 例剖 析 (1)在刻画样本数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差. 栏目链接典 例剖 析
(2)平均数和标准差是工业生产中监测产品质量的重要指标,当样本的平均数或标准差超过了规定界限的时候,说明这批产品的质量可能距生产要求有较大的偏离,应该进行检查,找出原因,从而及时解决问题. 栏目链接典 例剖 析变式训练 栏目链接典 例剖 析 栏目链接典 例剖 析 栏目链接典 例剖 析 例2从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm):
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?题型二 用样本平均数、方差(标准差)估计总体 栏目链接典 例剖 析 看哪种玉米的苗长得高,只要比较甲、乙两种玉米的均高即可;要比较哪种玉米的苗长得整齐,只要看两种玉米苗高的方差即可,因为方差是体现一组数据波动大小的特征数. 栏目链接典 例剖 析 栏目链接典 例剖 析 特别要注意本题两问中说法的不同,这就意味着计算方式不一样.平均数和方差是样本的两个重要数字特征,方差越大,表明数据越分散;相反地,方差越小,数据越集中. 栏目链接典 例剖 析变式训练 2.甲、乙两台机床同时生产一种零件,在10天中,两台机床每天生产出的次品数分别是:分别计算出两个样本的平均数与方差.从计算结果看,哪台机床10天生产中出次品的平均数较小?出次品的波动较小? 栏目链接典 例剖 析 栏目链接典 例剖 析∵x乙∴乙机床10天生产中出次品的平均数较小,
又∵s乙2∴乙机床出次品的波动较小. 栏目链接课件40张PPT。数学·必修3(苏教版)第2章 统  计    
2.4 线性回归方程情景切入
在实际问题中我们常常会遇到多个变量同处于一个过程之中,它们互相联系、互相制约.有的变量间有完全确定的函数关系,而有一些变量,它们之间也有一定的关系,然而这种关系并不完全确定,例如正常人的血压与年龄有一定关系,但它们之间的关系就不能用一个确定的函数关系式表达出来.这些变量,其实是随机变量(或至少其中有一个是随机变量),它们之间的关系我们常称为相关关系.为了深入了解事物的本质,往往也需要我们去寻找这些变量间的数量关系.回归分析就是寻找这类不完全确定的变量间的数学关系式并进行统计推断的一种方法,在这种关系中最简单的是线性回归.1.了解相关关系的概念.
2.了解最小二乘法的思想,并能根据给出的线性回归方程系数公式求线性回归方程. 栏目链接自 主学 习1.相关关系是指自变量取值一定时,因变量的取值____ ____________________的两个变量之间的关系.
2.如果一个变量的值由小变大时,另一个变量的值也是由小变大,这种关系称为________;反之,如果一个变量的值由小变大时,另一个变量的值由大变小,这种关系称为________.
3.线性回归方程是________________,其中b=_____________,a=________.带有一定的随机性正相关负相关y-bx 栏目链接自 主学 习4.线性回归方程 =bx+a必过交点________., 栏目链接 栏目链接一、变量之间的相关关系要 点导 航 相关关系:(1)变量与变量之间的关系常见的有两类:一类是确定性的函数关系,如匀速直线运动中时间t与路程s的关系.另一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达.如人的体重y与身高x有关,但不能用一个函数来严格地表示身高与体重之间的关系. 栏目链接要 点导 航 (2)相关关系与函数关系的异同点.相同点:两者都是指两个变量之间的关系.不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系;函数关系是两个非随机变量间的关系,而相关关系是非随机变量与随机变量间的关系;②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. 栏目链接要 点导 航 散点图:将n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图.
散点图形象地反映了各对数据的密切程度.二、散点图及作用 栏目链接要 点导 航 1.线性相关关系.
能用直线方程y=bx+a近似表示的相关关系,叫做线性相关关系.如果散点图中,各点集中在一条直线附近,则称这两个量具有线性相关关系.
2.线性回归方程和回归直线.
一般地,设有(x,y)的n对观察数据如下三、线性回归方程 栏目链接要 点导 航 栏目链接要 点导 航 注意 (1)用此法推导出的直线方程表示的直线上各点与对应的散点的坐标差的平方和最小,这种方法叫做最小平方法,利用的是二次函数的最值问题.
(2)由不具有线性相关关系的两个变量推出的回归方程没有意义.
(3)求线性回归方程的步骤.
①作出散点图,判断散点是否在一条直线附近;
②如果散点在一条直线附近,用公式求出a、b,并写出线性回归方程. 栏目链接 栏目链接典 例剖 析 例1下列两个变量之间的关系哪个不是函数关系(  )
A.角度和它的余弦值
B.正方形的边长和面积
C.正n边形的边数和顶点角度之和
D.人的年龄和身高D 栏目链接典 例剖 析 由函数关系与相关关系的概念即知. 函数关系是确定性的,而相关关系是随机性的. 栏目链接典 例剖 析变式训练1.工人月工资(元)与劳动生产率(千元)变化的回归方程为y^=80x+50,则下列判断正确的是(  )
A.劳动生产率为1 000元时,工资为130元
B.劳动生产率提高1 000元时,工资提高80元
C.劳动生产率提高1 000元时,工资提高130元
D.当月工资为210元时,劳动生产率为2 000元B 栏目链接典 例剖 析 例2(2014·珠海调研)如图所示的四个散点图中,两个变量具有相关关系的是________. 栏目链接典 例剖 析观察散点图的特征. 由图可知①是一次函数关系,不是相关关系;②中的所有点在一条直线附近波动,是线性相关的;③中的点杂乱无章,没有什么关系,是不相关的;④中的所有点在某条曲线附近波动,是非线性相关的,即两个变量具有相关关系的是②④. 栏目链接②④典 例剖 析 散点图直观地描述了两个变量之间有没有相关关系,由散点图判断相关关系有两种情况,若所有的点看上去都在一条直线附近波动,则两个变量是线性相关的;若所有的点看上去都在某条曲线附近波动,则两个变量是非线性相关的,这两种情况都说明两个变量间具有相关关系. 栏目链接典 例剖 析变式训练 2.在关于人体的脂肪含量(百分比)和年龄关系的研究中,得到如下一组数据:判断它们是否有相关关系.若有,作一拟合直线. 栏目链接典 例剖 析 以年龄作为x轴,y轴表示脂肪含量,可得相应散点图如下图.由散点图可见,两者之间具有相关关系. 栏目链接典 例剖 析 例3以家庭为单位,某种商品年需求量与该商品价格之间的一组调查数据如下表:(1)画出散点图;
(2)如果变量x、y有线性关系,求出回归直线方程. 栏目链接典 例剖 析 对于给定一组调查数据,可以借助一些有效的手段进行处理.
(1)画出散点图,如下图所示. 栏目链接典 例剖 析 栏目链接典 例剖 析因此所求的回归直线方程是y^=-0.825 9x+4.495 1. 对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a、b的计算公式,算出a、b.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误. 栏目链接典 例剖 析变式训练 3.某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:(1)画出散点图;
(2)求回归直线方程. 栏目链接典 例剖 析 (1)散点图如下图. (2)列出下表,并用科学计算器进行有关计算. 栏目链接典 例剖 析 栏目链接典 例剖 析 栏目链接典 例剖 析 例3高二(2)班学生每周用于数学学习的时间x(单位:h)与数学成绩y(单位:分)之间有如下数据:某同学每周用于数学学习的时间为18 h,试预测该生数学成绩. 栏目链接典 例剖 析 两个有相关关系的变量间的关系可以用线性回归方程来表示,而对总体的预测可由回归直线方程帮助解决. 因为学习时间与学习成绩具有相关关系,可以列出下表,并用科学计算器进行计算. 栏目链接典 例剖 析 栏目链接典 例剖 析 栏目链接典 例剖 析 本题数据表中,自变量x的取值没有按从小到大排列,这更接近实际,对结论没有任何影响.从表中看出:同样是每周用16 h学数学,一位同学成绩是64分,另一位却是68分,这正反映了y与x只有相关关系,没有函数关系. 栏目链接典 例剖 析变式训练 4.(2014·上饶调考)下表是某地搜集到的新房屋的销售价格y (单位:万元)和房屋的面积x(单位:m2)的数据;(1)画出散点图;
(2)求回归方程;
(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格. 栏目链接典 例剖 析 (1)散点图如图所示. 栏目链接典 例剖 析 栏目链接