2018年高中数学新人教A版必修3第二章统计课件(8份)

文档属性

名称 2018年高中数学新人教A版必修3第二章统计课件(8份)
格式 zip
文件大小 33.7MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2018-08-24 15:27:28

文档简介

课件19张PPT。2.1 随机抽样
?2.1.1 简单随机抽样学习目标
1.理解并掌握简单随机抽样的概念、特点和步骤.
2.掌握简单随机抽样的两种方法. 课堂互动讲练知能优化训练2.1.1课前自主学案简单随机抽样课前自主学案在初中我们已学过一些统计知识.
1.总体:我们所要考察对象的全体叫做_____,其中每一个考察对象叫做________.
2.样本:从总体中抽出的若干个个体组成的集合叫做总体的一个_______,样本中个体的数量叫做_______________.总体个体样本样本容量1.简单随机抽样的定义
一般地,设一个总体有N个个体,从中逐个__________地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会_________,就把这种抽样方法叫做简单随机抽样.
2.简单随机抽样的分类不放回都相等抽签法随机数法1.利用随机数表读数时,开始位置和读数方向可以任意选择吗?
提示:可以,但是通常要在抽样前确定好.
2.袋中有6个质地同样的小球,用简单随机抽样方法,不放回地抽取2个小球,在第一次抽取和第二次抽取时,每个小球被抽到的机会各是多少?
课堂互动讲练简单随机抽样主要有四个特点:(1)总体个数有限;(2)逐个抽取;(3)不放回;(4)公平性:每个个体被抽到的可能性相同. 下面的抽样方法是简单随机抽样吗,为什么?
(1)火箭队共有15名球员,指定个子最高的2名球员参加球迷见面会;
(2)从20个零件中一次性抽出3个进行质量检验;
(3)一儿童从玩具箱中的20件玩具中随意拿出一件来玩,玩后放回再拿出一件,连续玩了5件.
【思路点拨】 抓住本题中的几个关键词“指定”“一次性”“放回”等与简单随机抽样特点对照.【解】 (1)不是简单随机抽样.因为这不是等可能抽样;
(2)不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取;
(3)不是简单随机抽样.因为这是有放回抽样.
【思维总结】 要判断所给的抽样方法是否是简单随机抽样,关键是看它们是否符合简单随机抽样的四个特点.一般地,抽签法就是把总体的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本. 某班有50名学生,要从中随机地抽出6人参加一项活动,请用抽签法进行抽选,并写出过程.
【思路点拨】  按照抽签法的步骤进行抽选.
【解】 利用抽签法步骤如下:
第一步:将这50名学生编号,编号为01,02,03,…,50.
第二步:将50个号码分别写在相同纸条上,并揉成团,制成号签.
第三步:将得到的号签放在一个不透明的容器中,搅拌均匀.
第四步:从容器中逐步抽取6个号签,并记录上面的号码.
对应上面6个号码的学生就是参加该项活动的学生.【思维总结】 一个抽样能否用抽签法,关键看两点:一是制签是否方便,二是号签是否容易被搅匀,在适用此法时,一定要注意“放入不透明容器,并充分搅匀”.
对于总体容量不大,即易编号时,可采用这种方法.
即:编号—选起始数—读数—取数. 某个车间工人已加工一种轴100件,为了了解这种轴的直径,要从中抽出10件在同一条件下测量,用随机数表法抽取这10件.
【解】 按随机数表法的过程抽取样本:
将100个轴进行编号00,01,…,99,据课本上的随机数表,如从第21行第1个数开始选取10个:68,34,30,13,70,55,74,77,40,44,接着测量这10个编号对应的轴的直径.
【思维总结】 在随机数表中遇到大于99的数或者重复数字隔过去,继续往下读.方法技巧1.抽签法制作号签时要求大小、形状完全相同.
2.随机数表法的编号要求位数相同,且第一个数字的抽取是随机的,开始读数的方向是任意的.失误防范1.抽签法抽取样本前,把号签要搅拌均匀,且逐一不放回抽取.
2.在编号时,对于两位数的编号,一般是将起始号编为00,而不是01,它的好处在于它可使100个个体都可用两位数字号码表示,否则将会出现三位数字号码100,这样确定的起始号便于我们使用随机数表.(如例3)课件27张PPT。2.1.2 系统抽样学习目标
1.掌握系统抽样的使用条件和操作步骤.
2.会用系统抽样法进行抽样. 课堂互动讲练知能优化训练2.1.2课前自主学案系统抽样课前自主学案1.简单随机抽样方法有________和_________.
2.某工厂为检验生产线上的牛奶并施行质量控制,需要实时监控生产线的工作是否正常.于是采用在生产线上每隔30分钟准时抽取___包牛奶进行检验,这种抽样方法也是科学的.抽签法随机数法11.系统抽样的概念
将总体分成______的几个部分,然后按照预先定出的规则,从每一部分中抽取一些个体,得到所需要的样本,这样的抽样方法叫做系统抽样.
2.系统抽样的步骤
假设要从容量为N的总体中抽取容量为n的样本,步骤为:
(1)先将总体的N个个体________.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;均衡编号简单随机抽样间隔kk1.用系统抽样从103个人中抽取10个人,怎样确定分段间隔?2.从1003名学生成绩中,按系统抽样抽取50名学生的成绩时,需先剔除3个个体,这样每个个体被抽取的可能性就不相等了,你认为正确吗?课堂互动讲练系统抽样的实质是“等距抽样”(即在抽样过程中,抽样的间隔相等),要取多少个个体就将总体分成多少组,每组中取一个. 下列问题中,最适合用系统抽样法抽样的是(  )
A.从全班48名学生中随机抽取8人参加一项活动
B.一个城市有210家百货商店,其中大型商店20家,中型商店40家,小型商店150家.为了掌握各商店的营业情况,要从中抽取一个容量为21的样本
C.从参加模拟考试的1200名高中生中随机抽取100人分析试题作答情况
D.从参加期末考试的2400名高中生中随机抽取10人了解某些情况【思路点拨】 本题需要从总体容量和样本容量两个方面加以衡量,从而选择出最适合用系统抽样法的选项.
【解析】 A总体容量较小,样本容量也较小,可采用抽签法;B总体中的个体有明显的层次,不适宜用系统抽样法;C总体容量较大,样本容量也较大,可用系统抽样法;D总体容量较大,样本容量较小,可用随机数表法.故选C.【答案】 C
【思维总结】 简单随机抽样是从总体中逐个抽取,适用于总体容量较小的情况;而系统抽样将总体分成几部分,按事先确定的规则在各部分抽取个体,适用于总体容量较大的情况.系统抽样的操作步骤可简单概括为:编号→分段→在第一段中确定起始号码→加间隔数抽取样本. 某校高中二年级有253名学生,为了了解他们的视力情况,准备按1∶5的比例抽取一个样本,试用系统抽样方法进行抽取,并写出过程.【解】 (1)先把这253名学生编号000,001,…,252.
(2)用随机数表法任取出3个号,从总体中剔除与这三个号对应的学生.
(3)把余下的250名学生重新编号1,2,3,…,250.
(4)分段.取分段间隔k=5,将总体均分成50段.每段含5名学生.
(5)以第一段即1~5号中随机抽取一个号作为起始号,如l.
(6)从后面各段中依次取出l+5,l+10,l+15,…,l+245这49个号.
这样就按1∶5的比例抽取了一个样本容量为50的样本.【思维总结】 当总体容量不能被样本容量整除时,可以先从总体中随机剔除几个个体.但要注意的是剔除过程必须是随机的,也就是总体中的每个个体被剔除的机会均等.剔除几个个体后使总体中剩余的个体数能被样本容量整除.互动探究 把题中“按1∶5的比列抽取一个样本”改为按“1∶7的比例抽取一个样本”,试用系统抽样方法进行抽取,并写出过程.
解:(1)先把这253名学生编号000,001,…,252.
(2)用随机数表法任取一个号,从总体中剔除这个号对应的学生.(3)把余下的252名学生重新编号1,2,3,…,252.
(4)分段,取分段间隔k=7,将总体均分成36段,每段含有7名学生.
(5)在第一段即1~7号中随机抽取一个号作为起始号,如l.
(6)从后面各段依次取出l+7、l+2×7,l+3×7,…,l+35×7这35个号.
这样就按1∶7的比例抽取了一个样本容量为36的样本.选择抽样方法的规则:
(1)当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法.
(2)当总体容量较大,样本容量较小时,可采用随机数法.
(3)当总体容量较大,样本容量也较大时,适合用系统抽样法. 某工厂有工人1021人,其中高级工程师20人,现抽取普通工人40人,高级工程师4人组成代表队去参加某项活动,应怎样抽样?
【思路点拨】 普通工人总体容量和样本容量都较大,可采用系统抽样,高级工程师总体容量和样本容量都较小,可用抽签法.(4)将编号为0003,0028,0053,…,0978的个体抽出.
(5)将20名高级工程师用随机方式编号为1,2,…,20.
(6)将这20个号码分别写在大小、形状相同的小纸条上,揉成小球,制成号签.
(7)将得到的号签放入一个不透明的容器中,充分搅拌均匀.
(8)从容器中逐个抽取4个号签,并记录上面的编号.
(9)从总体中将与所抽号签的编号相一致的个体取出.
以上得到的个体便是代表队成员.【思维总结】 当问题比较复杂时,可以考虑在一个问题中交叉使用多种方法,而对实际问题,准确合理地选择抽样方法,对初学者来说是至关重要的.方法技巧1.系统抽样与简单随机抽样一样,每个个体被抽到的可能性相等,从而说明系统抽样是等可能性抽样.它是公平的.
2.系统抽样是建立在简单随机抽样的基础之上的.当将总体均分后对每一部分进行抽样时,采用的是简单随机抽样.失误防范1.抽样前必须使总体分成几个均衡的部分.并保证每个个体按事先规定的概率入样.
2.如果编号的个体特征随编号的变化呈现一定的周期性,可在允许的条件下,从不同的编号开始等距抽样,多得几个不同的样本再进行分析.课件29张PPT。2.1.3 分层抽样学习目标
1.了解分层抽样的概念,比较三种抽样方法.
2.利用分层抽样从总体中抽取样本. 课堂互动讲练知能优化训练2.1.3课前自主学案分层抽样课前自主学案1.系统抽样是将总体分成均衡的几部分,然后按照预先定出的规则,从每一部分中抽取_____
______,得到所需要的样本.其关键是确定分段间隔.
2.为了了解某地参加计算机水平测试的5008名学生的成绩,从中抽取了200名学生的成绩进行统计分析,运用系统抽样方法抽取样本时,每组的容量为_______.一个个体251.分层抽样的概念
在抽样时,将总体分成互不交叉的层,然后按照______________,从各层________抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种______________.
2.分层抽样的适用条件
当总体是由_____________的几部分组成时,往往选用分层抽样的方法.一定的比例独立地分层抽样差异明显1.如何对样本分层?课堂互动讲练当总体具有明显的差异性时,为使样本更具有代表性,宜采用分层抽样法进行抽样. 下列问题中,最适合用分层抽样抽取样本的是(  )
A.从10名同学中抽取3人参加座谈会
B.某社区有500个家庭,其中高收入的家庭125户,中等收入的家庭280户,低收入的家庭95户,为了了解生活购买力的某项指标,要从中抽取一个容量为100户的样本
C.从1000名工人中,抽取100人调查上班途中所用时间
D.从生产流水线上,抽取样本检查产品质量【思路点拨】 从总体的特征分析,看其符合什么抽样方法的特点.
【解析】 A中总体个体无差异且个数较少,适合用简单随机抽样;C和D中总体个体无差异且个数较多,适合用系统抽样;B中总体个体差异明显,适合用分层抽样.
【答案】 B
【思维总结】 抽样时,要从总体和样本容量及个体差异和现实环境上考虑其抽样方法.首先根据抽样的特征进行适当地分层,按照抽样比确定出各层入样数,在每层中灵活选取抽样方法. 某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解他们对政府机构的改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,并写出具体实施抽取的步骤.
【思路点拨】 由于机构改革关系到各种人的利益,故采用分层抽样的方法比较合理.②因副处级以上干部与工人的人数较少,将他们分别按1~10和1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人采用先对其按00,01,02,…,69编号,然后用随机数表法抽取14人.
③将2人,4人,14人的编号汇合在一起就取得了容量为20的样本.【思维总结】 分层抽样的应用非常广泛.分层抽样的关键是求出各层抽样的比例,然后按比例抽取.分层后,可采用抽签法或随机数法从各层抽取个体.变式训练 某校共有教师302名,其中老年教师30名,中年教师150名,青年教师122名.为调查他们对新课程改革的看法,从中抽取一个60人的样本.请写出抽样过程.抽取样本要根据样本容量的多少,及有无明显的差异等信息特征来确定采用的抽样方法.简单随机抽样是基本的抽样方法,可穿插在其它抽样方法中使用. 为了考察某学校教学水平,将抽取这个学校高三年级的部分学生本学年的考试成绩进行考察,为了全面反映实际情况,采取以下三种方式进行抽查(已知该学校高三年级共有20个教学班,并且每个班内的学生按随机方式编好了学号,假定该校每班学生人数都相同):
①从全年级20个班中任意抽取一个班,再从该班任意抽取20人,考察他们的学习成绩;
②每个班都抽取1人,共计20人,考察这20个学生的成绩;③把学生按成绩分成优秀、良好、普通三个级别,从其中共抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人).
根据上面的叙述,回答下列问题:
(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?
(2)上面三种抽取方式中各自采用何种抽样方法?
(3)试分别写出上面三种抽取方式各自抽取样本的步骤.【思路点拨】 根据三种抽样方式的定义和性质进行判断.
【解】 (1)上面三种抽取方式中,其总体都是高三全体学生本年度的考试成绩,个体都是指高三年级每个学生本年度的考试成绩.第一种抽取方式中,样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第二种抽取方式中,样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第三种抽取方式中,样本为所抽取的100名学生本年度的考试成绩,样本容量为100.(2)上面三种抽取方式中,第一种方式采用的是简单随机抽样法;第二种方式采用的是系统抽样法和简单随机抽样法;第三种方式采用的是分层抽样法和简单随机抽样法.
(3)第一种方式抽样的步骤如下:
第一步:在这20个班中用抽签法任意抽取一个班;
第二步:从这个班中按学号用随机数法或抽签法抽取20名学生,考察其考试成绩.
第二种方式抽样的步骤如下:第一步:在第一个班中,用简单随机抽样法任意抽取某一学生,记其学号为a;
第二步:在其余的19个班中,选取学号为a的学生,共计20人.
第三种方式抽样的步骤如下:
第一步:分层.若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,总体由差异明显的三部分组成,所以在抽取样本时,应把全体学生分成三个层次.
第二步:确定各个层次抽取的人数.因为样本容量与总体个体数的比为100∶1000=1∶10,【思维总结】 简单随机抽样、系统抽样、分层抽样的共同特点是在抽样过程中每一个个体被抽取的机会相等,体现了这些抽样方法的客观性和公平性.其中简单随机抽样是最简单和最基本的抽样方法,在进行系统抽样和分层抽样时都要用到简单随机抽样方法.抽样方法经常交叉起来应用,对于个体数量很大的总体,可采用系统抽样,系统中的每一均衡部分,又可采用简单随机抽样.方法技巧2.探究抽样方法的选取
(1)若总体由差异明显的几个层次组成,则选用分层抽样.
(2)若总体没有差异明显的层次,则考虑采用简单随机抽样或系统抽样.
(3)当总体容量较小时宜用抽签法;当总体容量较大,样本容量较小时宜用随机数表法;当总体容量较大,样本容量也较大时宜用系统抽样.失误防范分层后,各层的个体较多时,可采用系统抽样或简单随机抽样取出各层中的个体,一定要注意按比例抽取.课件31张PPT。2.2 用样本估计总体
?2.2.1 用样本的频率分布估计总体分布学习目标
1.会列频率分布表,画频率分布直方图、频率折线图、茎叶图.
2.能根据实际问题的需求合理地选取样本. 课堂互动讲练知能优化训练2.2.1课前自主学案用样本的频率分布估计总体分布课前自主学案1.为估计总体所抽的样本必须有很好的代表性.
抽样的方法有_____________、系统抽样和_____________.
2.初中学统计知识时,画频数分布直方图的步骤是:①计算最大值与最小值的差;②_______
_________;③列频数分布表;④____________
________.简单随机抽样分层抽样决定组距和组数画频数分布直方图1.频率分布
样本中所有数据(或者数据组)的_____和________的比,就是该数据的频率.所有数据(或者数据组)的频率的分布,可以用频率分布表、频率分布直方图、频率分布折线图、茎叶图等来表示.
2.频率分布直方图
在频率分布直方图中,纵轴表示_________,数据落在各小组内的频率用____________________表示,各小长方形面积的总和等于____.频数样本容量频率/组距各小长方形的面积13.频率分布折线图与总体密度曲线
连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着_____
______的增加,作图时所分的______也在增加,相应的频率分布折线图就会越来越接近于一条____________,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.样本容量组数光滑曲线4.茎叶图的特点
当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来了方便.1.什么是总体分布?
提示:总体分布是指总体取值的分布规律,即某小组数据在总体数据中所占的比例大小.
2.在一组测量长度的数据(单位:cm)中最小数据为15.2,最大数据为20.3,如果组距为1,那么画频率分布直方图时,可分为几组较好?第一组数据及最后一组数据,如何限定区间?
提示:因为20.3-15.2=5.1,可分为6组,第一组可限定为(15.1,16.1),最后一组为(20.1,21.1).课堂互动讲练频率分布表是反映总体频率分布的表格,一般内容有数据的分组、频率的统计、频数和频率等内容.根据这个表格,就可以在坐标系中画频率分布直方图. 从高三学生中抽取50名学生参加数学竞赛,成绩的分组及各组的频率如下(单位:分):
[40,50),2;[50,60),3;[60,70),10;
[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)估计成绩在[60,90)分的学生比例.
【思路点拨】 组距为10,直方图的高度依次为0.004,0.006,0.02,0.03,0.024和0.016.【解】 (1)频率分布表如下(2)频率分布直方图如图所示.(3)成绩在[60,90)的学生比例即学生成绩在[60,90)的频率,0.2+0.3+0.24=74%.
【思维总结】 利用样本在某一范围内的频率,近似地估计总体在这一范围内的频率.一般地,频率分布表除最下边的区间是闭区间外,其他区间均为左闭右开区间.茎叶图是一种既能保留原始数据又能展示数据分布情况的表与图的结合. 某中学高二(2)班甲、乙两名同学自上高中以来每场数学考试成绩情况如下:
甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较,说明甲、乙两人谁发挥比较稳定.【思路点拨】 用中间的数字表示两位同学得分的十位数和百位数,两边的数字分别表示两人每场数学考试成绩的个位数.作茎叶图先确定中间数取数据的哪几位,填写数据时边读边填.比较时从数据分布的对称性、中位数、稳定性等方面来比较.【解】 甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88.因此乙同学发挥比较稳定,总体得分情况比甲同学好.【思维总结】 绘制茎叶图的关键是分清茎和叶.一般地说,如果数据是整数(至少为两位数)的,除个位数字以外的其它数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”.解题时要根据数据特点合理选择茎和叶.变式训练 (2010年高考福建卷)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是(  )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92列频率分布表和画出频率分布直方图的最终目的是通过样本分布估计总体分布.在估计时,只需要求出相应的样本分布中的有关数据即可推知总体分布的情况. 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110次以上(含110次)为达标,试估计该校全体高一学生的达标率是多少?
【思路点拨】 根据各小长方形面积之和为1,求频率.由第二小组频数求得样本容量,得达标率.【思维总结】 频率分布直方图也反映了各个范围内取值的可能性,利用样本在这一范围内的频率,可近似估计总体在这一范围内的可能性.方法技巧2.茎叶图的制作步骤
(1)将数据分为“茎”、“叶”两部分;
(2)将最大“茎”与最小“茎”之间的数字按大小顺序排成一列,茎相同者共用一个茎,再画上竖线作为分界线;
(3)将各个数据的“叶”在分界线的一侧对应茎处同行列出.失误防范1.频率分布直方图中的纵轴不是频率,而是频率/组距.
2.因为小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.课件28张PPT。2.2.2 用样本的数字特征估计总体的数字特征学习目标
会用样本的基本数字特征估计总体的基本数字特征. 课堂互动讲练知能优化训练2.2.2课前自主学案用样本的数字特征估计总体的数字特征课前自主学案1.用样本的频率分布估计总体分布,就是根据样本的频率分布表、_________________、__________________及茎叶图来估计总体分布.
2.初中学过的众数、中位数、平均数,其定义分别是
(1)在一组数据中______________的数据叫做这组数据的众数.频率分布直方图频率分布折线图出现次数最多最中间位置1.众数、中位数、平均数与频率分布直方图的关系
(1)众数在样本数据的频率分布直方图中,就是最高矩形的中点的____________.
(2)在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该_________,由此可以估计中位数的值.横坐标相等(3)平均数是频率分布直方图的“重心”.等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
2.标准差及方差
考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s表示.标准差的平方s2叫做方差,也为测量样本数据分散程度的工具.下列一组数:1、5、6、6、8、8、9、10、12、15,其众数、中位数、平均数、方差各是多少?若去掉1和15,这些数有什么变化?说明什么问题?
提示:原数据的众数是6和8,中位数是8,平均数为8,方差为13.6.去掉1和15后,众数、中位数、平均数都没变化,而方差为4.75,说明方差更能体现数据的稳定性,方差越小数据变化越稳定.课堂互动讲练众数体现了样本数据的最大集中点;中位数是样本数据所占频率的等分线;平均数与每一个样本数据有关. 某工厂人员及工资构成如下表:(1)指出这个工厂人员周工资的众数、中位数、平均数;
(2)这个问题中,平均数能客观地反映该工厂人员的工资水平吗?为什么?
【思路点拨】 本题着眼于众数、中位数、平均数各自的特点,以及其适用对象.【解】 (1)由表格可知:众数为200,中位数为220.
平均数为(2200+250×6+220×5+200×10+100)÷23=(2200+1500+1100+2000+100)÷23
=6900÷23=300.
(2)虽然平均数为300,但由表格中所列出的数据可知,只有经理在平均数以上,其余人员的工资都在平均数以下,故用平均数不能客观地反映该工厂的工资水平.
【思维总结】 极端值影响平均数,故平均数有时不能代表事实情况.根据直方图的分布特征:矩形的最高点、对称性及“重心”估计众数、中位数和平均数.上图是某班学生在一次数学考试中的成绩的频率分布直方图.根据直方图估计其成绩的(1)众数;(2)中位数;(3)平均数.【思路点拨】 矩形最高意思其中的频数最多,可求众数,分别计算每个小矩形的面积来估计中位数的位置,通过矩形宽的中点求平均数.【思维总结】 要先找清每个小矩形的高、宽及其意义,就可求相应的样本数字.
变式训练1 根据频率分布直方图(如图)估计(1)众数;(2)中位数;(3)平均数.方差、标准差是样本数据到平均数的一种平均距离,表示各个样本数据在样本平均数的周围分散程度. 甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.【思维总结】 本题易出现判断甲机床质量更稳定的错误,其原因是对方差的概念理解错误.互动探究2 在本例中,甲机床所加工的6个零件的数据全都加10,那么所得新数据的平均数及方差分别是多少?方法技巧1.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.(如例1)
2.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(如例3)失误防范1.一组数据中的众数可能不止一个,众数是一组数据中出现的次数最多的数据,而不是该数据出现的次数.一组数据的中位数是惟一的.(如问题探究)
2.利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.
(如例2)课件35张PPT。2.3 变量间的相关关系
?2.3.1 变量之间的相关关系
?2.3.2 两个变量的线性相关学习目标
1.了解相关关系的概念.
2.了解回归分析的概念、散点图及回归直线. 课堂互动讲练知能优化训练2.3.2课前自主学案两个变量的线性相关课前自主学案1.样本的数字特征主要有_______、_______、_______、_______及_________.
2.在现实生活中两个变量之间的函数关系是一种_____的关系.平均数众数中位数方差标准差确定1.相关关系:与函数关系不同,相关关系是一种_________性关系.
2.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为______;点散布在从左上角到右下角的区域内,两个变量的相关关系为___________.非确定正相关负相关3.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,我们就称这两个变量之间具有______________,这条直线叫做___________.线性相关关系回归直线最小二乘法1.如果样本的数据形成的点均匀分布于一个圆内,数据之间还能线性相关吗?
提示:不能,这样的点不具有线性相关关系.
2.画散点图时,坐标系中的横、纵坐标的长度单位必须相同吗?
提示:可以不同,应考虑数据分布的特征.课堂互动讲练判断两个变量之间有无相关关系,一种常用的简便可行的方法是绘制散点图,根据散点图很容易看出两个变量之间是否具有相关关系,是不是线性相关关系,是正相关还是负相关,相关关系强还是弱. 观察两相关变量得如下数据:画出散点图,判断它们是否有线性相关关系.
【思路点拨】 建系→描点→观察→结论.【解】 由数据可得相应的散点图(如图所示):
由散点图可知,两者之间不具有线性相关关系.【思维总结】 以x为自变量,考查因变量y的变化趋势,从而作出判断.据最小二乘法思想的公式,用待定系数法求出a、b,从而确定回归直线方程. 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:【解】 (1)散点图如图所示:互动探究1 如果把本题中的y的值:2.5及4.5分别改为2和5,如何求回归直线方程. 2011年元旦前夕,某市统计局统计了该市2010年10户家庭的年收入和年饮食支出的统计资料如下表:【解】 (1)散点图如图:由散点图可知,年收入越高,年饮食支出越高,图中点的趋势表明两个变量间也确实存在着线性相关关系.变式训练2 某调查机构为了了解某地区的家庭收入水平与消费支出的相关情况,抽查了多个家庭,根据调查资料得到以下数据:每户平均年收入为88000元,每户平均年消费支出为50000元,支出对于收入的回归系数为0.6.
(1)求支出对于收入的回归方程;
(2)平均年收入每增加100元,则平均年消费支出约增加多少元?
(3)若某家庭年消费支出为80000元,试估计该家庭的年收入为多少元?方法技巧1.两个变量x和y相关关系的确定方法:
(1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;
(2)表格、关系式法:结合表格或关系式进行判断;
(3)经验法:借助积累的经验进行分析判断.(如例1)
2.回归分析是寻找相关关系中非确定性关系的某种确定性.(如例3)失误防范1.利用散点图判定两个变量是否具有线性相关关系,注意不要受个别点的位置的影响.
2.求回归直线方程,关键在于正确地求出系数a,b,由于a,b的计算量大,计算时要仔细,避免计算失误.课件35张PPT。本章优化总结 专题探究精讲章末综合检测本章优化总结知识体系网络知识体系网络专题探究精讲三种抽样方法应用原则
1.当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法;
2.当总体容量较大,样本容量较小时,可用随机数表法;
3.当总体容量较大,样本容量也较大时,可用系统抽样法;
4.当总体由有明显差异的几部分构成时,采用分层抽样法. 一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆.
(1)求z的值;
(2)B类,C类轿车各应抽取多少?
(3)在C类轿车中,按型号分层抽样,应各抽取多少?
【思路点拨】 按类分层或者是按型号分层,抽样比是相同的.利用样本的频率分布表和频率分布直方图对总体情况作出估计,有时也利用频率分布折线图和茎叶图对总体估计.
1.用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,作频率分布表与频率分布直方图时要注意其方法步骤.
2.茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到,二是便于记录和表示,但数据较多时不方便. (2010年高考辽宁卷改编)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)
表1:注射药物A后皮肤疱疹面积的频数分布表表2:注射药物B后皮肤疱疹面积的频数分布表完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小.
注射药物A后皮肤疱疹面积的频率分布直方图注射药物B后皮肤疱疹面积的频率分布直方图可以看出注射药物A后的疱疹面积的中位数在65至70之间,而注射药物B后的疱疹面积的中位数在70至75之间,所以注射药物A后疱疹面积的中位数小于注射药物B后疱疹面积的中位数.
【思维总结】 在直方图中,利用中位数两侧的面积相等来估计中位数.样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本波动大小的,包括方差及标准差.我们常通过样本的数字特征估计总体的数字特征. 甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如下图所示.(1)填写下表:(2)请从四个不同的角度对这次测试进行分析:
①从平均数和方差结合分析偏离程度;
②从平均数和中位数结合分析谁的成绩好些;
③从平均数和命中9环以上的次数相结合看谁的成绩好些;
④从折线图上两人射击命中环数及走势分析谁更有潜力.
【思路点拨】 从图中分析出甲的射击环数依次为
9,5,7,8,7,6,8,6,7,7;乙的射击环数依次为2,4,6,8,7,7,8,9,9,10.分别计算中位数、平均数及方差并分析.②甲、乙的平均水平相同,而乙的中位数比甲大,可预见乙射靶环数的优秀次数比甲多.
③甲、乙的平均水平相同,而乙命中9环以上
(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.
④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.【思维总结】 任何一个数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质,平均数可以反映出更多的关于样本数据全体的信息.
极差、标准差和方差都是用来描述一组数据波动情况(即数据的离散程度)的特征数,常用来比较两组数据的波动大小.除了函数关系这种确定性的关系外,还有大量因变量的取值带有一定随机性的两个变量之间的关系——相关关系.应用回归直线方程可分析具有线性相关的两个变量之间的关系. 假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料:(1)作出散点图,判断y对x是否成线性相关,若线性相关,求线性回归方程=bx+a的回归系数a,b;
(2)估计使用年限为10年时的维修费用.
?
【思路点拨】 作出散点图,观察两变量是否线性相关,若相关,利用公式求出a,b.【解】 (1)作出散点图,如图所示,由散点图可知y对x是线性相关的.制表【思维总结】 知道x与y呈线性相关关系,无需进行相关性检测,否则,应首先进行相关性检验,如果本身两个变量不具备相关关系,或者说,它们之间相关关系不显著,即使求出回归直线方程也是毫无意义,而且用其估计和预测的量也是不可信的.课件3张PPT。课标领航
本章概述1.三种抽样方法:简单随机抽样、系统抽样、分层抽样.
2.用样本的频率分布估计总体的频率分布及用样本的特征数估计总体的特征数的方法.?第2章 统 计3.线性回归方程的建立.
本章重点是理解随机抽样的必要性和重要性,学会运用简单随机抽样、分层抽样和系统抽样方法;学会列频率分布表,画频率分布直方图、频率分布折线图及茎叶图,并用来估计总体.本章难点是统计思想、回归思想的建立,对总体分布的估计.学习本章时,既要充分掌握各种统计方法、原理及思想,又要大量地参加实践活动,实地考察统计;既要大胆地猜想,又要细心、耐心地计算;同时要借助于科学计算工具,作出精确的图表,尽量减少误差.学法指导