新课标人教版A必修3第二章统计课件集

文档属性

名称 新课标人教版A必修3第二章统计课件集
格式 rar
文件大小 2.3MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2008-09-07 11:28:00

文档简介

课件27张PPT。用样本的频率分布估计总体分布2000年全国主要城市中缺水情况排在前10位的城市探究:我国是世界上严重缺水的国
家之一,城市缺水问题较为突出。 例 某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a ,用水量不超过a的部分按平价收费,超过a的部分按议价收费。 ①如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢? ②为了较合理地确定这个标准,你认为需要做
哪些工作? 思考:由上表,大家可以得到什么信息? 通过抽样,我们获得了100位居民某年的月平均用水量(单位:t) ,如下表: 1.求极差(即一组数据中最大值与最小值的差) 2.决定组距与组数组数= 4.3 - 0.2 = 4.13.将数据分组[0,0.5 ),[0.5,1 ),…,[4,4.5] 将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。
 频率:每组数据的个数除以全体数据个数的商叫做该组的频率。4.列频率分布表100位居民月平均用水量的频率分布表5.画频率分布直方图小长方形的面积组距×频率=探究:
同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以1和0.1为组距重新作图,然后谈谈你对图的印象。 一、求极差,即数据中最大值与最小值的差二、决定组距与组数 :组距=极差/组数三、分组,通常对组内数值所在区间,
  取左闭右开区间 , 最后一组取闭区间四、登记频数,计算频率,列出频率分布表画一组数据的频率分布直方图,可以按以下的步骤进行:五、画出频率分布直方图(纵轴表示频率/组距)如果当地政府希望85%以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量提出建议吗?你认为3吨这个标准一定能够保证85%以上的居民用水量不超过标准吗?100位居民月平均用水量的频率分布表练 习1.有一个容量为50的样本数据的分组的频数如下:[12.5, 15.5) 3[15.5, 18.5) 8[18.5, 21.5) 9[21.5, 24.5) 11[24.5, 27.5) 10[27.5, 30.5) 5[30.5, 33.5) 4(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在[15.5, 24.5)的百分比是多少? 解:组距为3 分组 频数 频率[12.5, 15.5) 3[15.5, 18.5) 8[18.5, 21.5) 9[21.5, 24.5) 11[24.5, 27.5) 10[27.5, 30.5) 5[30.5, 33.5) 40.06
0.16
0.18
0.22
0.20
0.10
0.080.020
0.053
0.060
0.073
0.067
0.033
0.027频率/ 组距合计 50 1频率分布直方图如下:频率/组距
0.0100.0200.0300.0400.05012.515.50.0600.070一、求极差,即数据中最大值与最小值的差二、决定组距与组数 :组距=极差/组数三、分组,通常对组内数值所在区间,
  取左闭右开区间 , 最后一组取闭区间四、登记频数,计算频率,列出频率分布表画一组数据的频率分布直方图,可以按以下的步骤进行:五、画出频率分布直方图(纵轴表示频率/组距)例2、为了了解一大片经济林的生长情况,随机测量其中的100株的底部周长,得到如下数据表(长度单位:cm): (1)编制频率分布表;(2)绘制频率分布直方图;
(3)估计该片经济林中底部周长小于100cm的树木 约占多               少,周长不小于120cm的树木约占多少。解:
(1)从表中可以看出:
这组数据的最大值为135,最小值为80,
故极差为55,
可将其分为11组,组距为5。
从第1组[80,85)开始,
将各组的频数、频率和 频率/组距 填入表中例2、对某电子元件进行寿命跟踪调查,情况如下:
1)、列出频率分布表
2)、估计电子元件寿命在100h~400h以内的频率
3)、估计电子元件寿命在400h以上频率
课堂练习: 1、为检测某种产品的质量,抽取了一个容量为30的样本, 检测结果为一级品5件,二级品8件,三级品13件,次品4件.
(1) 列出样本的频率分布表;
(2)根据上述结果,估计此种产品为二级品或三级品的概率约是多少. (2)此种产品为二级品或三级品的概率约为0.27+0.43=0.7.
2.有一个容量为50的样本,数据的分组及其频数如下所示, 请将其制成频率直方图.
频率分布表如下:0.060.160.180.220.200.100.081.00频数3.已知样本10, 8, 6, 10, 8,13,11,10,12,7,8,9,12,9,
11,12,9,10,11,11, 那么频率为0.2范围的是 ( )A. 5.5~7.5 B. 7.5~9.5 C. 9.5~11.5 D. 11.5~13.5D4.一个容量为100的样本,数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格.课堂小结编制频率分布直方图的步骤:①找最大值与最小值。②决定组距与组数③决定分点④登记频数,计算频率,列表,画直方图说明:(1)确定分点时,使分点比数据多一位小数,并且把第1小组的起点稍微再小一点.例:已知一个样本,填写下面的频率分布表
 7.0 6.6 6.8 7.0 7.2 7.4 7.0 7.3 7.5 7.4
 7.3 7.1 7.0 6.9 6.7 7.1 7.2 7.0 6.9 7.1
小结:思考 :
如果当地政府希望使 85% 以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量标准提出建议吗? 频率分布直方图应用1.求极差2.决定组距与组数3.将数据分组4.列频率分布表5.画频率分布直方图课件12张PPT。一、求极差,即数据中最大值与最小值的差二、决定组距与组数 :组数=极差/组距三、分组,通常对组内数值所在区间,
  取左闭右开区间 , 最后一组取闭区间四、登记频数,计算频率,列出频率分布表五、画出频率分布直方图(纵轴表示频率/组距)复习回顾画频率分布直方图的步骤:连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.画茎叶图的步骤:(1)将每个数据分为茎(高位)和叶(低位)两部分;(2)将最小茎和最大茎之间的数按大小次序排成一列, 写在一侧;(3)将各个数据的叶按大小次序写在其茎的另一侧.练习: 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:分别求这些运动员成绩的众数,中位数与平均数 用样本的数字特征估计总体的数字特征中位数 众数 平均数众数、中位数、平均数的概念中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. 众数:在一组数据中,出现次数最多的数据叫做这组数据的众数. 平均数: 一组数据的算术平均数,即
x=二、众数、中位数、平均数与频率分布直方图的关系例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出众数、中位数、平均数为多少?0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。众数众数众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.特点:0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)2.02这个中位数的估计值,与样本的中位数值2.0不一样,为什么??因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致. 左边和右边的直方图的面积应该相等,由此可以估计中位数的值。中位数:2、中位数不受少数几个极端值的影响1、中位数易计算,能较好地表现数据信息3、常用于计算数据质量较差时特点:0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点横坐标之和平均数3、平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。1、平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变2、平均数可以反映出更多的关于样本数据全体的信息特点:众数、中位数、平均数的简单应用例 某工厂人员及工资构成如下:(1)指出这个问题中周工资的众数、中位数、平均数(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么? 分析:众数为200,中位数为220,平均数为300。
因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。三种数字特征的优缺点1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.2、中位数它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此 ,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。课件12张PPT。2.2.2 用样本的数字特征估计总体的数字特征目标导学1、通过实例理解样本数据标准差的意义,会计算样本平均数和标准差。
2、体会用样本估计总体的思想,会用样本的基本数字特征(平均数、标准差)估计总体的基本数字特征。主体自学看书: P76~77  平均数向我们提供了样本数据的重要信息,但是平均有时也会使我们作出对总体的片面判断.因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽的.因此,只有平均数还难以概括样本数据的实际状态. 如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:7 8 7 9 5 4 9 10 7 4乙:9 5 7 8 7 6 8  6  7  7如果你是教练,你应当如何对这次射击作出评价?如果看两人本次射击的平均成绩,由于 两人射击 的平均成绩是一样的.那么两个人的水平就没有什么差异吗?
2.标准差45678910环数频率0.10.20.3(甲)456789100.10.20.30.4环数频率(乙)直观上看,还是有差异的.如:甲成绩比较分散,乙成绩
相对集中(如图示).因此,我们还需要从另外的角度来考察这两组数据.例如:在作统计图,表时提到过的极差.
甲的环数极差=10-4=6
乙的环数极差=9-5=4.
它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.考察样本数据的分散程度的大小,最常用的统计量是标准差.
标准差是样本平均数的一种平均距离,一般用s表示.所谓“平均距离”,其含义可作如下理解:由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差.一个样本中的个体与平均数之间的距离关系可用下图表示:考虑一个容量为2的样本:显然,标准差越大,则a越大,数据的离散程度越大;标准差越小,数据的离散程度越小.用计算器可算出甲,乙两人的的成绩的标准差由 可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.上面两组数据的离散程度与标准差之间的关系可用图直观地表示出来.例题1:画出下列四组样本数据的直方图,说明它们的异同点.解:四组样本数据的直方图是:0.10.20.30.40.50.60.70.80.91.012345678四组数据的平均数都是5.0,标准差分别是0.00,0.82,
1.49,2.83.虽然它们有相同的平均数,但是它们有不同的标准差,说明数据的分散程度是不一样的.标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中,平均数标准差s=0.868 ,所以例2 甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm)甲 25.46, 25.32, 25.45, 25.39, 25.36
25.34, 25.42, 25.45, 25.38, 25.42
25.39, 25.43, 25.39, 25.40, 25.44
25.40, 25.42, 25.35, 25.41, 25.39乙 25.40, 25.43, 25.44, 25.48, 25.48
25.47, 25.49, 25.49, 25.36, 25.34
25.33, 25.43, 25.43, 25.32, 25.47
25.31, 25.32, 25.32, 25.32, 25.48 从生产的零件内径的尺寸看,谁生产的质量较高?分析:每一个工人生产的所有零件的内径尺寸组成一个总体,
由于零件的生产标准已经给出(内径25.40mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.00mm的差异在时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样比较两人的生产质量只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样体数据,然后比较这两个样本的平均数,标准差,以此作为两个总体之间的估计值.解:用计算器计算可得: 从样本平均数看,甲生产的零件内径比乙生产的更接近内径标准(25.40mm),但是差异很小;从样本标准差看,由于从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与我们抽取的内径(样本数据)直接相关.显然,我们可以从这名工人生产的零件中获取许多样本(为什么?).这样,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数,标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样本的的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.这也正是我们在前面讲随机抽样时反复强调样本代表性的理由.在实际操作中,为了减少错误的发生,条件许可时,通常采取适当增加样本容量的方法.当然,关键还是要改进抽样方法,提高样本的代表性.课件8张PPT。用样本的数字特征估计总体的数字特征0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。众数众数 左边和右边的直方图的面积应该相等,由此可以估计中位数的值。中位数: 是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点横坐标之和平均数中位数练习:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:7 8 7 9 5 4 9 10 7 4乙:9 5 7 8 7 6 8  6  7 7如果你是教练,你应当如何对这次射击作出评价?如果看两人本次射击的平均成绩,由于 两人射击 的平均成绩是一样的.那么两个人的水平就没有什么差异吗?
考察样本数据的分散程度的大小,所谓“平均距离”,其含义可作如下理解:标准差是样本数据到平均数的一种平均距离, 一般用s表示.标准差由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差.例题1:画出下列四组样本数据的条形图,说明它们的异同点.标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中, 平均数标准差s=0.868 ,一般地,样本数据落在区间[x-ns,x+ns]内例2 甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm)25.46, 25.32, 25.45, 25.39, 25.36 25.34, 25.42, 25.45, 25.38, 25.42 25.39, 25.43, 25.39, 25.40, 25.44 25.40, 25.42, 25.35, 25.41, 25.3925.40, 25.43, 25.44, 25.48, 25.48 25.47, 25.49, 25.49, 25.36, 25.34 25.33, 25.43, 25.43, 25.32, 25.47 25.31, 25.32, 25.32, 25.32, 25.48 从生产的零件内径的尺寸看,谁生产的质量较高?甲乙课件19张PPT。复习回顾 简单随机抽样、系统抽样的特点是什么?简单随机抽样:①总体的个体数有限; ②逐个不放回抽取;③等可能抽样;系统抽样:
①编号,分段,定起始号,抽取;②等可能抽样;
③总体容量较大。
④总体容量较小。问题: 某校小礼堂举行心理讲座,有500人参加听课,坐满小礼堂,现从中选取25名同学了解有关情况,选取怎样的抽样方式更为合适. 分析:宜采用系统抽样的方法,请写出具体的操作步骤。2 把第一段的1~20号写成标签,用抽签的方法从中抽出第一个号码.设这个号码为x3 号码为 x 、 x+10、 x+20、…… 、x +490作为样本 1 把500人的座位号按从小到大的顺序平均分成25段, 每段为20 某地区有高中生2400人,初中生10900人,小学生11000人,教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?分层抽样 一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。分层抽样分层抽样的实施步骤:(2)确定各层应该抽取的个体数。根据总体中的个体数N与样本容量n确定抽样比:(3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。(1) 根据已有信息,将总体分成互不相交的层;注意:对于不能取整的数,求其近似值。注意:1、分层抽样适用于总体由差异明显的几部分组成的情况,每一部分称为层,在每一层中实行简单随机抽样。2、分层抽样中分多少层,要视具体情况而定。总的原则是:层内样本的差异要小,而层与层之间的差异尽可能地大,否则将失去分层的意义。1、某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为( )
A.15,5,25 B.15,15,15
C.10,5,30 D 15,10,20练习:2、一个地区共有5个乡镇,人口15万人,其中人口比例为3:2:5:2:3,现从15万人中抽取一个1500人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法. 具体过程如下
(1)将15万人分为5层,其中一个乡镇为一层.
(2)按照样本容量的比例求得各乡镇应抽取的人数分别为300人、200人、500人、200人、300 人. (3)按照各层抽取的人数系统抽取各乡镇应抽取的样本.
(4)将1500人组到一起,即得到一个样本。 1、下列问题中,采用怎样的抽样方法比较合理:
①从10台冰箱中抽取3台进行质量检查;
②某电影院有32排座位,每排有40个座位,座位号为1~ 40。 有一次报告会坐满了听众,会议结束后为听取意见,留下座位号为18的32名听众进行座谈; ③某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名。为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本。 ③分层抽样 ②系统抽样 ①简单随机抽样反馈练习 2、(2004年全国高考湖南卷)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和销后服务等情况,记这项调查为②.则完成①、②这两项调查采用的抽样方法依次是( )A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法 D.简单随机抽档法,分层抽样法B简单随机抽样 系统抽 样 分

抽 样 (1)抽样过程中每个个体被抽到的可能性相等
(2)每次抽出个体后不再将它放回,即不放回抽样 从总体中逐个抽取 将总体均分成几部分,按预先制定的规则在各部分抽取 将总体分成几层,分层进行抽取 在起始部分样时采用简随机抽样 分层抽样时采用简单随机抽样或系统抽样 总体个数较少 总体个数较多 总体由差异明显的几部分组成 比较简单随机抽样、系统抽样、分层抽样的优点、缺点及适用范围2、某校有老师200人,男学生1200人,女学生1000人,现用分层抽样的方法从所有师生中抽取一个容量为n的样本,已知女学生中抽取的人数为80,则n=1921、某单位有职工160人,其中业务员有104人,管理人员32人,后勤24人,现用分层抽样从中抽取一容量为20的样本,则抽取管理人员( )人
A、3 B、4 C、7 D、12B3、某大学数学系共有本科生5000人,其中一、二、三、四年级的学生比为4:3:2:1,用分层抽样的方法抽取一个容量为200人的样本,则应抽取三年级的学生为( )人。
A、80 B、40 C、60 D、20B
4.(2004年全国高考天津卷)某工厂生产A、B、C三种不同型号的产品,产品数量之比为2:3:5,现用分层抽样方法抽取一个容量为n的样本,样本中A型产品有16种,那么此样本容量n=_______.801、为了解初一学生的身体发育情况,打算在初一年级10个 班的某两个班按男女生比例抽取样本,正确的抽样方法是( )
A、随机抽样
B 、分层抽样
C、先用简单随机抽样,再用分层抽样
D 、先用分层抽样,再用简单随机抽样C练 习2、(2005年湖南高考题)某工厂生产了某种产品
16800件,它们来自甲、乙、丙三条生产线。为检
查产品的质量,决定采用分层抽样法进行抽样。已
知甲、乙、丙三条生产线抽取的个数成等差数列,
则乙生产了_______件产品。
56003、某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是 ( )
A.简单随机抽样 B.系统抽样 C.分层抽样
D.先从老人中剔除1人,然后再分层抽样
4、某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为 人,A型血应抽取的人数为 人,B型血应抽取的人数为 人,AB型血应抽取的人数为 人。
D 8552 【课堂小结】
1、分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:
(1)、分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,各层之间的样本差异要大,且互不重叠。
(2)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。 2、分层抽样的优点是:使样本具有较强的代表性,
并且抽样过程中可综合选用各种抽样方法,因此
分层抽样是一种实用、操作性强、应用比较广泛
的抽样方法。 2、某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,每个学生被抽到的可能性均为0.2,若该校取一个容量为n的样本,则n=_____.360 3、某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为____人 8 5、某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本;如果采用系统抽样和分层抽样方法抽取,不用剔除个体;如果样本容量增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求得样本容量为___.分析:总体容量N=36(人)当样本容量为n时,系统抽样间隔为36/n∈N.分层抽样的抽样比为n/36,求得工程师、技术员、技工的人数分别为n/6,n/3,n/2,所以n应是6的倍数,36的约数,即n=6,12,18.当样本容量为n+1时,总体中先剔除1人还有时35人,系统抽样间隔为35/(n+1)∈N,所以n只能是6.6 温州地区有高中生2400人,初中生10900人,小学生11000人,教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?你认为哪些因素影响学生视力?抽样要考虑和因素?年级课件7张PPT。变量之间的相关关系思考? 有些教师常说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题” 按照这种说法,似乎学生的物理成绩与数学成绩之间也存在着某种关系。你如何认识它们之间存在的关系?物理成绩 数学成绩 学习兴趣 学习时间 其他因素这两个变量之间的有不确定的关系结论:变量之间除了函数关系外,还有 。相关关系函数关系是一种确定的关系;相关关系与函数关系的异同点:均是指两个变量的关系.(1)商品销售收入与广告支出经费之间的关系 (2)粮食产量与施肥量之间的关系 (3)人体内脂肪含量与年龄之间的关系问题:举一两个现实生活中的问题,问题所涉及的变量 之间存在一定的相关关系。例:相关关系是一种非确定关系.相同点:不同点:1、两个变量之间产生相关关系的原
因是受许多不确定的随机因素的影响;2、需要通过收集大量的数据(有时通过调查,有时通过实验),在对数据进行统计分析的基础上,发现其中的规律,才能对变量之间的关系作出判断是否存在相关关系。课堂练习:第85页练习1、2小结:探究一根据上述数据,人体的脂肪含量和年龄之间有怎样的关系?在一次对人体的脂肪含量和年龄关系的?下面我们以年龄为横轴,脂肪含量为纵轴建立直角坐标系,作出各个点。通过统计图、表,可以使我们对两个变量之间的关系有一个直观上的印象和判断。 下面我们以年龄为横轴,脂肪含量为纵轴建立直角坐标系,作出各个点,如图:称该图为散点图。正相关:
从左下角到右上角负相关:
从左上角到右下角 两个变量成负相关时,散点图有什么
特点?请举一些生活中的变量成正相关或负相关的例子。 “名师出高徒”可以理解为教师的水平越高,学生的水平也越高。那么,教师的水平与学生的水平成什么相关关系?思考?你能举出更多的描述生活中两个变量的相关关系的成语吗?课件7张PPT。变量之间的相关关系思考? 有些教师常说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题” 按照这种说法,似乎学生的物理成绩与数学成绩之间也存在着某种关系。你如何认识它们之间存在的关系?物理成绩 数学成绩 学习兴趣 学习时间 其他因素这两个变量之间的有不确定的关系结论:变量之间除了函数关系外,还有 。相关关系函数关系是一种确定的关系;相关关系与函数关系的异同点:均是指两个变量的关系.(3)人体内脂肪含量与年龄之间的关系问题:举一两个现实生活中的问题,问题所涉及的变量之间存在一定的相关关系。例:相关关系是一种非确定关系.相同点:不同点:(1)商品销售收入与广告支出经费之间的关系(2)粮食产量与施肥量之间的关系1、两个变量之间产生相关关系的原
因是受许多不确定的随机因素的影响;2、需要通过收集大量的数据(有时通过调查,有时通过实验),在对数据进行统计分析的基础上,发现其中的规律,才能对变量之间的关系作出判断。课堂练习:第85页练习1、2小结:探究一根据上述数据,人体的脂肪含量和年龄之间有怎样的关系?在一次对人体的脂肪含量和年龄关系的?下面我们以年龄为横轴,脂肪含量为纵轴建立直角坐标系,作出各个点。通过统计图、表,可以使我们对两个变量之间的关系有一个直观上的印象和判断。 下面我们以年龄为横轴,脂肪含量为纵轴建立直角坐标系,作出各个点,如图:称该图为散点图。正相关:
从左下角到右上角负相关:
从左上角到右下角请举一些生活中的变量成正相关或负相关的例子。思考?课件15张PPT。用样本的频率分布
估计总体分布2一、求极差,即数据中最大值与最小值的差二、决定组距与组数 :组距=极差/组数三、分组,通常对组内数值所在区间,
  取左闭右开区间 , 最后一组取闭区间四、登记频数,计算频率,列出频率分布表五、画出频率分布直方图(纵轴表示频率/组距)复习回顾画频率分布直方图的步骤:频率分布表和频率分布直方图的特性:(1)分组的变化可以引起频率分布表和频率分布直方图的结构变化;坐标系单位长度的变化只能引起频率分布直方图形状沿坐标轴方向上的拉伸变化.(3)随机性:(4)规律性:(2)频率=小长方形的面积频率分布直方图的优缺点:优点:能够很容易表示大量数据,非常直观的表明分布形状,使我们能够看到在分布表中看不清楚的一些数据模式。
缺点:虽可以大致估计出总体的分布情况,但不能保留原来的数据信息,在精确度要求较高的情况下不适用。频率分布直方图如下:连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图利用样本频分布对总体分布进行相应估计(3)当样本容量增大时,组数增加,组距减少,那么频率分布直方图就会变成怎么样的图形?(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?——总体密度曲线月均用水量/tab (图中阴影部分的面积,表示总体在某个区间 (a, b) 内取值的百分比)。 总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.接近于一条光滑曲线注意:1.不是任意总体都有密度曲线,当总体个数比较少或者数据的分布过于离散不连续时,总体密度曲线都是不存在的
2.总体密度曲线与总体分布相互唯一确定,如果总体分布已知,就可以得到密度曲线。
3.在总体情况未知的情况下,可通过样本频率折线近似估计得到密度曲线,样本容量越大,估计越精确。但是不能通过样本数据准确地画出总体密度曲线。茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:甲运动员得分:
13,51,23,8,26,38,16,33,14,28,39乙运动员得分:
49,24,12,31,50,31,44,36,15,37,25,36,39茎叶图甲乙0
1
2
3
4
5
2 5
5 4
1 6 1 6 7 9
4 9
08
4 6 3
6 8
3 8 9

1 叶就是从茎的旁边生长出来的数,表示得分的个位数。 茎是指中间的一列数,表示得分的十位数注意:在制作茎叶图时,重复出现的数据要重复记录,不能遗漏,特别是“叶”部分;同一数据出现几次,就要在图中体现几次.画茎叶图的步骤:(1)将每个数据分为茎(高位)和叶(低位)两部分;(2)将最小茎和最大茎之间的数按大小次序排成一列, 写在一侧;(3)将各个数据的叶按大小次序写在其茎的另一侧.用茎叶图表示数据有两个突出的优点:
(1)所有的信息都可以从这个茎叶图上得到;
(2)茎叶图便于记录和表示.用茎叶图表示数据的缺点: (1)其分析是粗略的,对差异不大的两组数据不易分析;(2)当样本数据较多时,茎叶图就显得不太方便。1.有两个班级,每班各自按学号随机选出10名学生,测验铅球成绩,以考察体育达标程度,测验成绩如下:单位(米)
甲 9.12 7.88 8.42 6.94 5.20 7.22
7.96 8.06 6.69 4.92
乙 8.80 8.45 7.34 7.06 6.71 8.38
9.80 8.68 6.83 5.86
两个班相比较,哪个班整体实力强一些? 2.有一个容量为50的样本,其数据的茎叶图表示如下:
?
?
?
?
?
将其分成7组并要求:
(1)列出样本的频率分布表;
(2)画出频率分布直方图以及密度曲线 1
2
3
34566678888999
0000112222233334455566667778889
01123
1.为了了解各自受欢迎的程度,甲、乙两个网站分别随机选取了14天,记录下上午8:00-10:00间各自的点击量:
甲:73,24,58,72,64,38,66,
70,20,41,55,67, 8,25;
乙:12,37,21, 5,54,42,61,
45,19, 6,19,36,42,14.
你能用茎叶图表示上面的数据吗?你认为甲、乙两个网站哪个更受欢迎?课件8张PPT。引入: 在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次名意测试.调查兰顿和罗斯福中谁当选下一届总统.为了了解共众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年电话和汽车只有少数富人拥有).通过分析收回的调查表,显示兰顿非常受欢迎,于是在杂志上预测兰顿将在选举中获胜. 实际选举结果正好相反,最后罗斯福在选举中获胜,其数据如下:你认为预测结果出错的原因是什么??简单随机抽样1.我们把所要考察的对象的全体叫做总体.2.其中每一个考察对象叫做个体.3.从总体中所抽取的一部分个体叫做总体的一个样本.4.样本中个体的数目叫做样本的容量.预备知识:探
究假设你作为一名食品卫生工作人员,要对某食品内的一批小包装饼干进行卫生达标检验,你准备怎样做?做法:从中抽取一定数量的饼干作为检验的样本.那么,怎样获取样本呢?简单随机抽样: 一般地,设一个总体中含有N个个体,从中逐个不放回地抽取n个个体作为样本,如果每次抽取时总体内的各个个体被抽到的机会都相等,这种抽样方法就叫做简单随机抽样.简单随机抽样方法:抽签法和随机数法高二(5)班有47人,现在要从中抽出8名学生去参加座谈会,请同学们设计一种方法,选出这8名同学,每名学生的机会均等.抽签法的步骤:1、把总体中的N个个体编号;2、 把号码写在号签上,将号签放在一个容器中搅拌均匀;3、每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。你认为抽签法有什么优点与缺点?思考:优点:简单易行.适用范围:总体个数不多时.假设我们要考察某公司生产的500g袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,怎样抽取样本?随机数表法:步骤:(1)将总体中个体编号;
(2)选定开始的数字;
(3)获取样本的号码.思考练习:2、假设要从高二年级全体同学400中随机抽出50人参加一项活动,请同学们分别用抽签法和随机数法抽出人选,并写出抽取过程.1、在一次游戏中,获奖者可以从50件不同奖品中随机抽取确定,请用抽签法,确定获奖者的奖品.抽签法 2.简单随机抽样方法:随机数表法注:随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素.小结1.简单随机抽样的概念 一般地,设一个总体中含有N个个体,从中逐个不放回地抽取n个个体作为样本,如果每次抽取时总体内的各个个体被抽到的机会都相等,这种抽样方法就叫做简单随机抽样.课件13张PPT。系统抽样和 分层抽样课堂练习
1.为了了解全校390名高一学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是( )
A.总体是390
B.个体是每一个学生
C.样本是40名学生
D.样本容量是40注意以下四点: (1)它要求被抽取样本的总体的个体数有限; (2)它是从总体中逐个进行抽取; (3)它是一种不放回抽样;(4)它是一种等概率抽样。一般地,设一个总体中含有N个个体,从中逐个不放回地抽取n个个体作为样本,如果每次抽取时总体内的各个个体被抽到的机会都相等,这种抽样方法就叫做简单随机抽样.1、简单随机抽样简单随机抽样方法:抽签法和随机数法 例 学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名学生进行调查. 除了用简单随机抽样获取样本外,你能否设计其他抽样样本的方法? 我们按照这样的方法来抽样:首先将这500名学生从1开始进行编号,然后按号码顺序以一定的间隔进
行抽取.由于这个间隔可以定为10,即从号码为1~10的第一个间隔中随机地抽取一个号码,假如抽到的是6
号,然后从第6号开始,每隔10个号码抽取一个,得到
6,16,26,36,…496这样,我们就得到一个容量为50的样本.这种抽样方法我们叫做系统抽样.1.概念
当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样.系统抽样2.操作步骤:
(1)编号
(2)确定分段间隔,对编号进行分段
(3)确定起始个体编号 l
(4)抽取样本l,l+k,l+2k,…,l+(n-1)k 练习:1、设某校共有118名教师,为了支援西部的教育事业,现要从中随机地抽出16名教师组成暑期西部讲师团.请用系统抽样法选出讲师团成员.2、有人说,我可以借用居民身份证(18位)来进行中央电视台春节联欢晚会的收视率调查:在1~999中抽取一个随机数,比如这个数是632,那么身份证后三位数是632的观众就是我要调查的对象.请问:这样所获得的样本有代表性吗?为什么?系统抽样与简单随机抽样比较,有何优、缺点?1、系统抽样比简单随机抽样更容易实施;2、系统抽样的效果会受个体编号的影响,而简单随机抽样的效果不受个体编号的影响; 3、系统抽样比简单随机抽样的应用范围广。 假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?你认为哪些因素影响学生视力?抽样要考虑和因素?年级 一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。系统抽样分层抽样的实施步骤:(2)确定各层应该抽取的个体数。根据总体中的个体数N与样本容量n确定抽样比:k=(3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。(1) 根据已有信息,将总体分成互不相交的层;注意:对于不能取整的数,求其近似值。1、某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为( )
A.15,5,25 B.15,15,15
C.10,5,30 D 15,10,202、为了了解某市800个企业的管理情况拟取40个企业作为样本.这800个企业中有中外合资企业160家,私营企业320家,国有企业240家,其他性质企业80家,如何抽取?练习:3、一个单位的职工有500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?4、某市的3个区共有高中学生20000人,且3个区的高中学生人数之比为2:3:5,现要用分层抽样方法从所有学生中抽取一个容量为200的样本,写出抽样过程.简单随机抽样 系统抽 样 分

抽 样 (1)抽样过程中每个个体被抽到的可能性相等
(2)每次抽出个体后不再将它放回,即不放回抽样 从总体中逐个抽取 将总体均分成几部分,按预先制定的规则在各部分抽取 将总体分成几层,分层进行抽取 在起始部分样时采用简随机抽样 分层抽样时采用简单随机抽样或系统抽样 总体个数较少 总体个数较多 总体由差异明显的几部分组成 比较简单随机抽样、系统抽样、分层抽样的优点、缺点及适用范围