课件13张PPT。分层抽样 假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?你认为哪些因素影响学生视力?抽样要考虑的因素?一、分层抽样的定义。 一般地,当总体由差异明显的几部分组成时,为了使样本更客观地反映总体的情况,常将总体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比进行抽样 ,这种抽样的方法叫分层抽样。应用分层抽样应遵循以下要求:
(1)分层:将相似的个体归人一类,即为一层,
分层要求每层的各个个体互不交叉,即遵循不重复、
不遗漏的原则。
(2)分层抽样为保证每个个体等可能入样,需
遵循在各层中进行简单随机抽样,每层样本数量与
每层个体数量的比与这层个体数量与总体容量的比
相等。二、分层抽样的步骤:(1)分层:将总体按某种特征分成若干部分。
(2)确定比例:计算各层的个体数与总体的个体数的比。
(3)确定各层应抽取的样本容量。
(4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样,组成样本。练习:某校高一、高二和高三年级分别有学生
1000,800,700名,为了了解全校学生的
视力情况,从中抽取容量为100的样本,怎样
抽取较为合理? 例2:一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。解:因为疾病与地理位置和水土均有关系,所以不同乡镇的
发病情况差异明显,因而采用分层抽样的方法,具体过程如下:
(1)将3万人分为5层,其中一个乡镇为一层。
(2)按照样本容量的比例随机抽取各乡镇应抽取的样本。
300×3/15=60(人),300×5/15=100(人), 300×2/15=40(人),300×3/15=60(人),
因此各乡镇抽取人数分别为60人、40人、100人、
40人、60 人。
(3)将300人组到一起,即得到一个样本。课堂练习1、某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为 人,A型血应抽取的人数为 人,B型血应抽取的人数
为 人,AB型血应抽取的人数为 人。
82552、某中学高一年级有学生600人,高二年级有
学生450人,高三年级有学生750人,若该校取
一个容量为n的样本,每个学生被抽到的可能性
均为0.2, 则n=_________
360 三种抽样方法的比较从总体中
逐个抽取将总体均分成几部分,按事先确定的规则在各部分抽取将总体分成几层,分层进行抽取在起始部分抽样时采用简单随机抽样各层抽样时采用简单随机抽样或系统抽样总体中的个体数较少总体中的个体数较多总体由差异明显的几部分组成
共同点:(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样
应用举例1 填空: 为了了解某地区参加数学竞赛的1005名学生的数学成绩,打算从中抽取一个容量为50的样本,现用系统抽样的方法,需要用 方法先从总体中剔除 个个体,然后按编号顺序每间隔_____个号码抽取一个.
简单随机抽样520请归纳系统抽样方法的步骤:1 编号;2 确定组距k;3 在第一组用简单随机抽样方法确定第一个编号x;4 编号为 x 、 x+k、 x+2k、…… 、x +(n-1)k作为样本. 应用举例 2 某校小礼堂举行心理讲座,有500人参加听课,坐满小礼堂,现从中选取25名同学了解有关情况,选取怎样的抽样方式更为合适. 分析:宜采用系统抽样的方法,请写出具体的操作步骤。2 把第一组的1~20号写成标签,用抽签的方法从中 抽出第一个号码.设这个号码为x3 号码为 x 、 x+20、 x+40、…… 、x +480作为样本 1 把500人的座位号按从小到大的顺序平均分成25组, 组距为20应用举例 3 某科研单位有科研人员160人,其中具有高级以上职称的24人,中级职称48人,其余均为初级以下职称,现要抽取一个容量为20的样本,试确定抽样方法,并写出抽样过程.宜采用分层抽样的抽取方法(1)按总体与样本容量确定抽取的比例。 (2)由分层情况,确定各层抽取的样本数。(4)对于不能取整的数,求其近似值。 (3)各层的抽取数之和应等于样本容量。4.下列问题中,采用怎样的抽样方法较为合理?
(1)从10台电冰箱中抽取3台进行质量检查;
(2)某电影院有32排座位,每排有40个座位 ,座位号为
1至40。有一次报告会坐满了听众,报告会结束后为听
取意见,需留下32名听众进行座谈;
(3)某学校有160名教职工,其中教师120名,行政人员
16名,后勤人员24名,为了了解教职工对学校在校务
公开方面的意见,拟抽取一个容量为20的样本。 5 某公司在甲乙丙丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售情况,需从这600个销售点抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点中抽取7个调查其销售收入售后服务等情况,记这项调查为②,则完成这两项调查采用的方法依次是( )
A.分层抽样,系统抽样
B.分层抽样,简单随机抽样
C.系统抽样,分层抽样
D.简单随机抽样,分层抽样B1、分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:
(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。
(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。
(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。
2、分层抽样的优点是:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法。
课件33张PPT。复习回顾1、什么是简单随机抽样?什么样的总体适宜简单随机抽样? 2、什么是系统抽样?什么样的总体适宜系统抽样? 3、什么是分层抽样?什么样的总体适宜分层抽样?抽样是统计的第一步,接下来就要对样本进行分析§2.2.1频率分布表江苏如东马塘中学 张伟锋问题情境 如下样本是随机抽取近年来北京地区7月25日至8月24日的日最高气温
问题:怎样通过上表中的数据,分析比较两时间段内的高温( )状况? 分析上面两样本的高温天数的频率用下表表示: 由此可得:近年来北京地区7月25日至8月10日的高温天气的频率明显高于8月8日至8月24日.频率分布表:
一般地:当总体很大或不便获取时,用样本的频率分布去估计总体频率分布;把反映总体频率分布的表格称为频率分布表.数学运用 例1.从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表.频率分布表 解:(1)在全部数据中找出最大值180与最小值151,它们相差(极差)29,确定全距为30,决定组距为3;(2)将区间 分成10组;分
别是 ,…,(3)从第一组 开始分别统计各组的频数,再计算各组的频率,列频率分布表:频率分布表 一般地编制频率分布表的步骤如下: (1)求全距,决定组数和组距;全距是指整个 取值区间的长度,组距是指分成的区间的长度; (2)分组,通常对组内的数值所在的区间取左 闭右开区间,最后一组取闭区间; (3)登记频数,计算频率,列出频率分布表.例2.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm) 频率分布表 (1)列出样本频率分布表﹔
(2)估计身高小于134cm的人数占总人数的百分比。分析:根据列样本频率分布表的一般步骤解题。
解:(1)样本频率分布表如下:(2)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=
0.19,所以我们估计身高小于134cm的人数占总人数的19%.2.练习:
(1)课本第53页 练习第1、2题.(2)列出情境中近年来北京地区7月25日至8月10日的气温的样本频率分布表.(3)有一个容量为45的样本数据,分组后各组的频数如下: 由此估计,不大于27.5的数据约为总体的 ( ) A.91% B.92% C.95% D.30% A(4)从一个养鱼池中捕得m条
鱼,做上记号后放入池中, 数日
后又捕得n条鱼,其中k条有记
号,估计池中有鱼多少条?回顾小结 :总体分布的频率、频数的概念; 编制频率分布表的一般步骤。问题情境 (1)列频率分布表的一般步骤
是什么?
(2)能否根据频率分布表来绘
制频率直方图?求全距,定组数,列表什么叫频率分布直方图?频率分别直方图(1)建构数学 1.频数条形图 例1.下表是某学校一个星期中收
交来的失物件数,请将5天中收交
来的失物数用条形图表示.解: 象这样表示每一天频数的柱形图
叫频数条形图. 频率分布表 2.频率分布直方图解:(1)根据频率分布表,作直角坐标系,
以横轴表示身高,纵轴表示频率/组距;
(2)在横轴上标上表示的点;
(3)在上面各点中,分别以连接相邻两点的
线段为底作矩形,高等于该组的频率/组距.
频率分布直方图如图: 一般地, 作频率分布直方图的方法为:
把横轴分成若干段,每一段对应一个组
的组距,以此线段为底作矩形,高等于
该组的频率/组距, 这样得到一系列矩形,
每一个矩形的面积恰好是该组上的频率,
这些矩形构成了频率分布直方图. 频率分布直方图的特征:
(1)从频率分布直方图可以清楚的
看出数据分布的总体趋势.
(2)从频率分布直方图得不出原始
的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.频率分布直方图(2)1.频率分布折线图
在频率分布直方图中,取相邻矩形上底边的中点顺次连结起来,就得到频率分布折线图(简称频率折线图)例2的频率折线图如图:
密度曲线
如果样本容量取得足够大,分组的组距取
得足够小,则相应的频率折线图将趋于一
条光滑的曲线,称这条光滑的曲线为总体
的密度曲线.
例4.为了了解一大片经济林生长情
况,随机测量其中的100株的底部 周
长,得到如下数据表(单位:cm)(1)编制频率分布表;
(2)绘制频率分布直方图;
(3)估计该片经济林中底部周长小
于100cm的树木约占多少? 周长不
小于120cm的树木约占多少? 解(1)这组数据最大值为135,最小
值为80,全距为55,可将其分为11组,
组距为5.频率分布表如下: (2)直方图如图:再见课件22张PPT。总体特征数的估计情境一: 某农场种植了甲、乙两种玉米苗,从中各抽取了10株,分别测得它们的株高如下(单位:厘米): 甲: 25 41 40 37 22 14 19 39 21 42 乙: 27 16 44 27 44 16 40 40 16 40分析:欲比较哪种玉米苗长得高,可以比较一下它们的平均高 !反映了总体的
某种特征总体特征数3031总体特征数:通常把能反映总体某种特征的量称为总体特征数如何反映总体的特征数?用样本的特征数估计总体的特征数! 平均数及其估计情境二: 在利用单摆检验重力加速度的实验中,全班同学在相同的条件下进行测试,得到下列数据(单位:m/s2)9.62 9.54 9.78 9.94 10.01 9.66 9.88 9.68 10.329.76 9.45 9.99 9.81 9.56 9.78 9.72 9.93 9.949.65 9.79 9.42 9.68 9.70 9.84 9.90怎样利用这些数据对重力加速度进行估计?平均数为什么呢?问题转化为:实验结果测得一组数据为用 作为重力加速度“最理想的”近似值,依据是什么呢?算术平均数= 处理实验数据的原则是使这个近似值与实验数据之间的离差(偏差)最小、设近似值为x,则它与n个实验值 ai(i=1,2,3,…,n)的离差分别为 x-a1,x-a2,…,x-an平均数最能代表一个样本数据的集中趋势,也就是说它与样本数据的离差最小。称为这n个数的 平均数或者均值例1 某校高一年级的甲乙两个班级(均为50人)的数学成绩如下(总分150),试确定这次考试中,哪个班的数学成绩更好一些 .甲班 乙班 甲班均分 乙班均分 思考某公司内部结构以及工资分布:求该公司的平均工资?加权平均值(用频率计算平均值)则其加权平均数为其中例2 高一(1)班学生年龄统计:(班级共有43人)其中有20人18岁,13人17岁,7人16岁,,3人15岁,求该班级的平均年龄。分析在班级年龄序列中18出现了20次, 17出现了13次,16出现了7次,15出现了3次解:“加权平均数”例3:由下表计算学生日睡眠时间例4:由某单位年收入表试估计该单位职工
的平均年输入方差与标准差情境一: 某农场种植了甲、乙两种玉米苗,从中各抽取了10株,分别测得它们的株高如下: 甲: 31 32 35 37 33 30 32 31 30 29 乙: 53 16 54 13 66 16 13 11 16 62问:哪种玉米苗长得高?哪种玉米苗长得齐?怎么办呢?甲37(最大值)29(最小值)8乙66(最大值)11(最小值)55极 差 甲: 31 32 35 37 33 30 32 31 30 29 乙: 53 16 54 13 66 16 13 11 16 62极差:一组数据的最大值与最小值的差极差越大,数据越分散,越不稳定极差越小,数据越集中,越稳定极差体现了数据的离散程度设一组样本数据 ,其平均数为 ,则称s2为这个样本的方差,称为这个样本的标准差,分别称为样本方差、样本标准差它的算术平方根样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。 例1:从高一(1)班的一次数学测验抽取一小组 成绩如下(保留整数):85 90 80 80 85 75 100 计算这组样本数据的极差、方差和标准差.例2.甲、乙两种水稻试验品种连续5年的平均
单位面积产量如下(单位:t/hm2),试根据
这组数据估计哪一种水稻品种的产量比较稳定。
例3.为了保护学生的视力,教室内的日光灯在
使用一段时间后必须更换。已知某校使用的100
只日光灯在必须换掉前的使用天数如下,试估计
这种日光灯的平均使用寿命和标准差。
1、在一次歌手大奖赛上,七位评委为歌手打出的分数
如下:
9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分
和一个最低分后,所剩数据的平均值和方差分别为
_________________; 9.5,0.016 课本P68练习1、2小结2、极差是体现数据离散程度1、(算术)平均数3、方差、标准差是体现稳定性课件10张PPT。随机抽样习题课复习回顾1 你学过哪几种随机抽样方法?简单随机抽样系统抽样分层抽样抽签法随机数法2 三种抽样方法的比较从总体中
逐个抽取将总体均分成几部分,按事先确定的规则在各部分抽取将总体分成几层,分层进行抽取在起始部分抽样时采用简单随机抽样各层抽样时采用简单随机抽样或系统抽样总体中的个体数较少总体中的个体数较多总体由差异明显的几部分组成
应用举例例1 填空: 为了了解某地区参加数学竞赛的1005名学生的数学成绩,打算从中抽取一个容量为50的样本,现用系统抽样的方法,需要用 方法先从总体中剔除 个个体,然后按编号顺序每间隔_____个号码抽取一个.
简单随机抽样520请归纳系统抽样方法的步骤:1 编号;2 确定组距k;3 在第一组用简单随机抽样方法确定第一个编号x;4 编号为 x 、 x+k、 x+2k、…… 、x +(n-1)k作为样本. 应用举例 例2 某校小礼堂举行心理讲座,有500人参加听课,坐满小礼堂,现从中选取25名同学了解有关情况,选取怎样的抽样方式更为合适. 分析:宜采用系统抽样的方法,请写出具体的操作步骤。2 把第一组的1~20号写成标签,用抽签的方法从中 抽出第一个号码.设这个号码为x3 号码为 x 、 x+10、 x+20、…… 、x +490作为样本 1 把500人的座位号按从小到大的顺序平均分成25组, 组距为20应用举例 例3 某科研单位有科研人员160人,其中具有高级以上职称的24人,中级职称48人,其余均为初级以下职称,现要抽取一个容量为20的样本,试确定抽样方法,并写出抽样过程.宜采用分层抽样的抽取方法(1)按总体与样本容量确定抽取的比例。 (2)由分层情况,确定各层抽取的样本数。(4)对于不能取整的数,求其近似值。 (3)各层的抽取数之和应等于样本容量。例3.下列问题中,采用怎样的抽样方法较为合理?
(1)从10台电冰箱中抽取3台进行质量检查;
(2)某电影院有32排座位,每排有40个座位 ,座位号为
1至40。有一次报告会坐满了听众,报告会结束后为听
取意见,需留下32名听众进行座谈;
(3)某学校有160名教职工,其中教师120名,行政人员
16名,后勤人员24名,为了了解教职工对学校在校务
公开方面的意见,拟抽取一个容量为20的样本。练 习 1. 某公司在甲乙丙丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售情况,需从这600个销售点抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点中抽取7个调查其销售收入售后服务等情况,记这项调查为②,则完成这两项调查采用的方法依次是( )
A.分层抽样,系统抽样 B.分层抽样,简单随机抽样
C.系统抽样,分层抽样 D.简单随机抽样,分层抽样B练 习 2. 南京市的某3个区共有高中学生20000人,且3个区的高中学生人数之比为2:3:5,现在要用分层抽样的方法从所有学生中抽取一个容量为200的样本,写出据体的抽样方法与操作步骤。小 结 1 抽样时如何能保证抽取的样本代表性? 2 简单随机抽样是最基本的抽样方法,其它的抽样方法要用到简单随机抽样课件19张PPT。简单随机抽样抽 样方法 江苏如东马塘中学 张伟锋——统计的基本思想方法: 用样本估计总体,即通常
不直接去研究总体,而是通过
从总体中抽取一个样本,根据
样本的情况去估计总体的相应
情况.关于“总体和样本” 总体通常是指我们需要考
虑的对象的全体.其中每一个考
察对象叫做个体. 样本就是从总体中抽取的一
个“部分”. 样本中个体的个数叫做样本
的容量. 如:电灯泡厂要检查一批灯泡的使用期限,其方法是给灯泡连续通电,直到灯泡不亮为止。显然,工厂不能这样一一检查每个灯泡,而只能从中抽取一部分灯泡(比如80个)进行检查,然后用这部分灯泡的使用期限,去估计这批灯泡的使用期限。 我们是把这批灯泡中每个灯泡的使用期限的全体看成是总体。 其中每一个灯泡的使用期限就是个体; 被抽取进行检查的80个灯泡的每个灯泡的使用期限的集体,就叫做总体的一个样本。 为了了解高一(1)班50名同学的视力情况,从中抽取10名同学进行检查。(2)如何抽取呢?请问: 实 例 一 (1)此例中总体、个体、样本、样本容量分别是什么? 开始抽签法50名同学从1到50编号制作1到50个号签将50个号签搅拌均匀随机从中抽出10个签对号码一致的学生检查结束抽签法的一般步骤:(1)将总体中的N个个体编号;(2)将这N个号码写在形状、大小相 同的号签上;(3)将号签放在同一箱中,并搅拌均匀;(4)从箱中每次抽出1个号签,连续抽出n次;(5)将总体中与抽到的号签编号一致的K个个体取出。(总体个数N,样本容量n)抽签法的一般步骤:(1)将总体中的N个个体编号;(2)将这N个号码写在形状、大小相 同的号签上;(3)将号签放在同一箱中,并搅拌均匀;(4)从箱中每次抽出1个号签,连续抽出n次;(5)将总体中与抽到的号签编号一致的k个个体取出。(总体个数N,样本容量n)开始编号制签搅匀抽签取出个体结束随机数表法随机数表: 制作一个表,其中的每个数都是用随机方法产生的(随机数)。 先将总体中的所有个体(共有N个)编号,然后在随机数表内任选一个数作为开始,再从选定的起始数,沿任意方向取数(不在号码范围内的数、重复出现的数必须去掉),最后根据所得号码抽取总体中相应的个体,得到总体的一个样本.步 骤:编号、选数、取号、抽取.简单随机抽样 一般地,设一个总体的个体数为N,如果通过逐个不放回抽取的方法从中抽取n个个体作为样本,且每个体被抽到的概率相等,就称这样的抽样方法为简单随机抽样。简单随机抽样的特点:它是一种不放回抽样;它是逐个地进行抽取;它是一种等概率抽样.它的总体个数有限的;有限性逐个性不回性等率性 下列抽取样本的方式是否属于简单随机抽样?说明道理。(1)从无限多个个体中抽取100个个体作样本;(2)盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里。想一想:什么样的总体适宜简单随机抽样? 适用范围:总体的个体数不多时。请问:应该怎样抽样? 实 例 二 为了了解高一年级1000名同学的视力情况,从中抽取100名同学进行检查。(1)随机将这1000名学生编号为1,2,3,……,1000;(2)将总体按编号顺序平均分成100部分,每部分包含10个个体;(3)在第一部分的个体编号1,2,……,10中,利用简单随机抽样抽取一个号码,比如 3;(4)以 3为起始号,每间隔10抽取一个号码,这样就得到一个容量为100的样本:3,13,23,33,……,973, 983, 993。 方 法: 将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为等距抽样)。 解:(1)随机将这1003个个体进行编号1,2,3,……1003。
(2)利用简单随机抽样,先从总体中剔除3个个体(可以随机数表法),剩下的个体数1000能被100整除,然后按系统抽样的方法进行。问题:如果个体总数不能被样本容量整除时该怎么办?阶段小结系统抽样的步骤:①采用随机的方式将总体中的 N 个体编号。③在第一段用简单随机抽样确定起始的个体编号l;④按照事先确定的规则抽取样本(通常是将l加上间隔k,得到第2个编号l+k,第3个编号l+2k,这样继续下去,直到获取整个样本)。 知识?方法?思想随机数表法抽样方法抽签法系统抽样小结提高简单随机抽样 为了了解全校2500同学的视力情况,其中高一、高二和高三年级分别有学生1000,800和700名,从中抽取100名同学进行检查。请问:怎样抽样较为合理? 实例三执教:李月兰
二004年3月20日
高一(1)班
谢谢大家!
课件13张PPT。有甲、乙两种钢筋, 现从中各抽取一
个标本(如表)检查它们的抗拉强度
(单位:kg/mm2).问题:哪种钢筋的质量较好?问题情景通过计算发现,两个样本的平均数均为125
那它们有没有什么差异呢? 由图可以看出,乙样本的最小值100低于
甲样本的最小值110, 最大值145高于甲样
本的最大值135,这说明乙种钢筋没有甲种
钢筋的抗拉强度稳定.极差:一组数据的最大值与最小值的差极差越大,数据越分散,越不稳定极差越小,数据越集中,越稳定极差体现了数据的离散程度运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论。
考察样本数据的分散程度的大小, 最常用的统计量是方差和标准差。 方差与标准差建构数学 因为方差与原始数据的单位不同,且
平方后可能夸大了离差的程度,我们
将方差的算术平方根称为这组数据的
标准差.标准差:
标准差也可以刻画数据的稳定程度.
方差和标准差的意义:
描述一个样本和总体的波动大小的特征数,
标准差大说明波动大. 例1:根据下列三组样本数据,说明它们的异同点
(1)5 5 5 5 5 5 5 5 5
(2)4 4 4 5 5 5 6 6 6
(3)3 3 4 4 5 6 6 7 7数学运用 例1.甲、乙两种水稻试验品种连续5
年的平均单位面积产量如下(单位:
t/hm2),试根据这组数据估计哪一种
水稻品种的产量比较稳定。例2.为了保护学生的视力,教室内的
日光灯在使用一段时间后必须更换. 已
知某校使用的100只日光灯在必须换掉
前的使用天数如下, 试估计这种日光灯
的平均使用寿命和标准差。练习:
(1)在一次歌手大奖赛上,七位评委为
歌手打出的分数如下:9.4,8.4,9.4,
9.9,9.6,9.4,9.7,去掉一个最高分和
一个最低分后,所剩数据的平均值和方
差分别为____________; 9.5,0.016AB课本第68页练习第1、2、3、4题 课件17张PPT。频率分布直方图与折线图一、求极差,即数据中最大值与最小值的差二、决定组距与组数 :组距=极差/组数三、分组,通常对组内数值所在区间,
取左闭右开区间 , 最后一组取闭区间四、登记频数,计算频率,列出频率分布表画一组数据的频率分布直方图,可以按以下的步骤进行:五、画出频率分布直方图(纵轴表示频率/组距)1.已知样本10, 8, 6, 10, 8,13,11,10,12,7,8,9,12,9,
11,12,9,10,11,11, 那么频率为0.2范围的是 ( )A. 5.5~7.5 B. 7.5~9.5 C. 9.5~11.5 D. 11.5~13.5D练习:2.一个容量为100的样本,数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格.0.060.0680.14160.160.210.51180.180.160.85100.9550.05例1、为了了解一大片经济林的生长情况,随机测量其中的100株的底部周长,得到如下数据表(长度单位:cm): (1)编制频率分布表;(2)绘制频率分布直方图;
(3)估计该片经济林中底部周长小于100cm的树木 约占多 少,周长不小于120cm的树木约占多少。解:
(1)从表中可以看出:
这组数据的最大值为135,最小值为80,
故极差为55,
可将其分为11组,组距为5。
从第1组[80,85)开始,
将各组的频数、频率和 频率/组距 填入表中连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图对比频率分布表数据详实、具体,清晰明了,便于查阅频率直方图形象直观,对比效果强烈频率折线图能反应发展变化的趋势利用样本频率分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线。(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?总体密度曲线身高/cmab (图中阴影部分的面积,表示总体在某个区间 (a, b) 内取值的百分比)。 用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。 总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线茎叶图知识回忆初中统计部分曾学过用平均数、众数、中位数反映总体的集中水平
1、众 数:在一组数据中,出现次数最多的数据叫做这组数据的众数;
2、中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数 如:12,15,24,25,31,31,36,36,37,39,44,49,50所有的十位数: 作为树枝的茎
所有的个位数: 作为树枝的叶
1 枝节上的叶为____________
2 枝节上的叶为_____________
3 枝节上的叶为 _____________
4 枝节上的叶为______________
5 枝节上的叶为______________ 茎叶图2,54,51,1,6,6,7,94,90例题分析:1、甲、乙两篮球运动员上赛季每场比赛得分如下,试比较这两位运动员的得分水平。
甲:12,15,24,25,31,31,36,36,
37,39,44,49,50
乙:8,13,14,16,23,26,28,33,
38,39,51用茎叶图刻画数据有两个优点:一是所有的信息都可以从这张茎叶图中得到,二是茎叶图便于记录和表示.但当数据很多时,茎叶图的效果就不是很好了.P58练习1,2课件14张PPT。相传古印度国王舍罕要褒奖他聪明能干的宰相
达依尔(国际象棋的发明者),问他需要什么,
达依尔说:“国王,只要在国际象棋的棋盘第一
格子放一粒麦子,第二格子放两粒麦子,第三
格子放四粒麦子,以后按比例每一格加一倍,一直
放到第64格,我就感激不尽,其他什么也不要。”
国王想:“这有多少,还不容易”。让人扛来一袋
小麦,但不到一会儿全没了,再扛一袋很快又没了,
结果全印度的粮食都用完了也不够,国王很奇怪,
怎么也算不清这笔帐。一个国际象棋棋盘一共能
放多少小麦粒?
试用伪代码表示算法。 【探究】:四星评估小组为了了解高一年级学生对教师教学的意见,打算从高一17个班(每班50人)共850名学生中抽取85名进行调查,用简单随机抽样获取样本方便吗? 你能否设计其他抽取样本的方法?系统抽样一.系统抽样的定义:
将总体平均分成几部分,然后按照一定的规则,从每一部分抽取一个个体作为样本,这种抽样的方法叫做系统抽样。【说明】由系统抽样的定义可知系统抽样有以下特证:
(1)当总体容量N较大时,采用系统抽样。
(2)将总体平均分成几部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,
(3)一定的规则通常指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号。二、从容量为N的总体中抽取容量为n的样本,用系统抽样的一般步骤为:
(1)将总体中的N个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;
(2)将编号按间隔k分段(k∈N).
(3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。
(4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本.练习:我校有800名学生参加英语单词竞赛,
为了解考试成绩,现打算从中抽取一个
容量为40的样本,如何抽取?804〖说明〗(1)分段间隔的确定: (2)从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想。思考:1下列抽样中不是系统抽样的是 ( )
A、从标有1~15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样;
B、工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验;
C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止;
D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈。C 2、从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( )
A.5,10,15,20,25
B、3,13,23,33,43
C、1, 2, 3, 4, 5
D、2, 4, 6, 16,32B3:从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为 ( )
A.99 B、99.5
C.100 D、100.5
C4:某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是 抽样方法。系统5:从2004名学生中选取50名组成参观团,若采用下面的方法选取:先用简单随机抽样从2004人中剔除4人,剩下的2000个再按系统抽样的方法进行,则每人入选的机会( )
A.不全相等 B.均不相等
C.都相等 D.无法确定C系统抽样088,188,288,388,488,588,688,788,888,9886、在1000个有机会中奖的号码(编号为000~999)中,在公证部门的监督下,按随机抽取的方法确定最后两位数为88的号码为中奖号码,这是运用那种抽样方法确定中奖号码的?依次写出这10个中奖号码。637※(2004年福建省高考卷)一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号分别为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是______.m×k62若第7组中抽取的号码是60,则m=______.3两种抽样方法比较 系统抽样与简单随机抽样比较,有何优、缺点?
点评:(1)系统抽样比简单随机抽样更容易实施,可节约抽样成本;
(2)系统抽样比简单随机抽样的应用范围更广.
(3)系统抽样的效果会受个体编号的影响,而简单随机抽样的效果不受个体编号的影响;系统抽样所得样本的代表性和具体的编号有关,而简单随机抽样所得样本的代表性与个体的编号无关.如果编号的个体特征随编号的变化呈现一定的周期性,可能会使系统抽样的代表性很差.例如学号按照男生单号女生双号的方法编排,那么,用系统抽样的方法抽取的样本就可能会是全部男生或全部女生.
课件19张PPT。回顾旧知平均数
方差
标准差离差线性回归方程 江苏如东马塘中学 张伟锋思考下列问题:两个变量之间的常见关系有几种? (1)确定性的函数关系,变量之间的 关系可以用函数表示。(2)相关关系,变量之间有一定的联系,
但不能完全用函数来表示。1、球的体积和球的半径具有( )
A 函数关系 B 相关关系
C 不确定关系 D 无任何关系2、下列两个变量之间的关系不是
函数关系的是 ( )
A 角的度数和正弦值
B 速度一定时,距离和时间的关系
C 正方体的棱长和体积
D 日照时间和水稻的亩产量AD练: 某小卖部为了了解热茶销售量与气温
之间的关系,随机统计并制作了某6天
卖出热茶的杯数与当天气温的对照表:如果某天的气温是-50C,你能根据这些
数据预测这天小卖部卖出热茶的杯数吗?实例探究 为了了解热茶销量与
气温的大致关系,我们
以横坐标x表示气温,
纵坐标y表示热茶销量,
建立直角坐标系.将表
中数据构成的6个数对
表示的点在坐标系内
标出,得到下图。你发现这些点有什么规律?今后我们称这样的图为散点图(scatterplot).答:都分布在同一条直线的附近。 建构数学 所以,我们用类似于估计平均数时的
思想,考虑离差的平方和 当x=-5时,热茶销量约为66杯2.三点(3,10),(7,20),(11,24)的
线性回归方程是 ( )D11.69阅读课本P73例1EXCEL作散点图利用线性回归方程解题步骤:1、先画出所给数据对应的散点图;2、观察散点,如果在一条直线附近,则说明所给量具有线性相关关系3、根据公式求出线性回归方程,并解决其他问题。(1)如果x=3,e=1,分别求两个模型中
y的值;(2)分别说明以上两个模型是确定性
模型还是随机模型.模型1:y=6+4x;模型2:y=6+4x+e.解 (1)模型1:y=6+4x=6+4×3=18;模型2:y=6+4x+e=6+4×3+1=19.C线性相关与线性回归方程小结1、变量间相关关系的散点图
2、如何利用“最小二乘法”思想求直线的回 归方程
3、学会用回归思想考察现实生活中变量之间的相关关系
作业:P75习题2.4第1、2题课件10张PPT。频率分布表抽样是统计的第一步,接下来就要对样本进行分析 国际奥委会2003年6月29日决定,2008年北京奥运会的举办日期将比原定日期推迟两周,改在8月8日至8月24日举行,原因是7月末8月初北京地区的气温高于8月中下旬.请问:这一结论是如何得到的呢?情境创设如下样本是随机抽取近年来北京地区7月25日至8月24日的日最高气温
问题:怎样通过上表中的数据,分析比较两时间段内的高温( )状况? 情境创设分析上面两样本的高温天数的频率用下表表示: 由此可得:近年来北京地区7月25日至8月10日的高温天气的频率明显高于8月8日至8月24日.频率分布表:
一般地:当总体很大或不便获取时,用样本的频率分布去估计总体频率分布;把反映总体频率分布的表格称为频率分布表.例1.从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表.一般地编制频率分布表的步骤如下:(1)求全距,决定组数和组距;全距是指整个取值区间的长度,组距是指分成的区间的长度;(2)分组,通常对组内的数值所在的区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.频率分布表 例2.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm) 频率分布表 (1)列出样本频率分布表﹔
(2)估计身高小于134cm的人数占总人数的百分比。分析:根据列样本频率分布表的一般步骤解题。
解:(1)样本频率分布表如下:(2)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=
0.19,所以我们估计身高小于134cm的人数占总人数的19%.回顾小结 :总体分布的频率、频数的概念; 编制频率分布表的一般步骤。课件40张PPT。必修3复习-统计江苏如东马塘中学 张伟锋统计知识点:
1、抽样方法。
(1)简单随机抽样(2)系统抽样(3)分层抽样
2、样本分布估计总体分布
(1)频率分布表 (2)直方图
(3)折线图 (4)散点图 (5)茎叶图
3、样本特征数估计总体特征数
(1)平均数(2)方差 (3)众数 (4)中位数
4、线性回归方程。总体:在统计中,所有考察对象的全体。
个体:总体中的每一个考察对象。
样本:从总体中抽取的一部分个体叫做
这个总体的一个样本。
样本容量:样本中个体的数目。总体、个体、样本、样本容量1.统计的的基本思想是:
用样本的某个量去估计总体的某个量
抽取样本要求:总体中每个个体被抽取的机会相等(1)简单随机抽样
(2)系统抽样
(3)分层抽样1、抽签法步骤(1)先将总体中的所有个体(共有N个)编号(号码可从1到N)
(2)把号码写在形状、大小相同的号签上,号签可用小球、卡片、纸条等制作
(3)将这些号签放在同一个箱子里,进行均匀搅拌
(4)抽签时,每次从中抽出一个号签,连续抽取n次
(5)抽出样本2、随机数表法步骤(1)将总体中的个体编号(编号时位数要一样);
(2)选定开始的数字;
(3)按照一定的规则读取号码;
(4)取出样本系统抽样步骤:1.编号,随机剔除多余个体,重新编号
2.分段 (段数等于样本容量)
间隔长度 k=N/n
3.抽取第一个个体编号为i
4.依预定的规则抽取余下的 个体编号为i+k, i+2k, …分层抽样步骤:1.将总体按一定标准分层;
2.计算各层的个体数与总体的个体数的比;
3.按比例确定各层应抽取的样本数目
4.在每一层进行抽样 (可用简单随机抽样或系统抽样)分析样本,估计总体(1)分析样本的分布情况(2)分析样本的特征数公式(1)分析样本的分布情况样本的频率分布表样本的频率分布直方图样本的茎叶图频率分布:是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。频率分布直方图的特征:
(1)从频率分布直方图可以清楚的看出数据分布的总体趋势。
(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。 样本的频率分布表(1)找全距
(2)分组
(3)找频数,计算频率,列表样本的频率分布直方图 作样本频率分布直方图的步骤:(1)求极差;(2)决定组距与组数; (组数=极差/组距) (3)将数据分组;(4)列频率分布表(分组,频数,频率);(5)画频率分布直方图。作频率分布直方图的方法:把横轴分成若干段,每一线段对应一个组的组距,然后以此线段为底作一矩形,它的高等于该组的频率/组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率,这些矩形就构成了频率分布直方图。(1)列出样本频率分布表﹔
(2)一画出频率分布直方图;
(3)估计身高小于134cm的人数占总人数的百分比.。例1:下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm) 分析:根据样本频率分布表、频率分布直方图的一般步骤解题。解:(1)样本频率分布表如下:(2)其频率分布直方图如下 (3)由样本频率分布表可知身高小于134cm 的男孩
出现的频率为0.04+0.07+0.08=0.19,
所以我们估计身高小于134cm的人数占总人数的19%. 茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本例子) 2.茎叶图的特征: (1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方
便记录两组的数据,两个以上的数据虽然能够记录,但是没有表
示两个记录那么直观,清晰。3. 制作茎叶图的方法:将所有两位数的十位数字作为“茎”,个位数字作为叶,茎相同者共用一个茎,茎按从小到大 的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。
注意:相同的得分要重复记录,不能遗漏。
1.在一次有奖明信片的100 000个有机会中奖的号码(编 号00000—99999)中,邮政部门按照随机抽取的方式确 定后两位是23的作为中奖号码,这是运用了________ 抽样方法.课 堂 热 身系统2.某单位有500名职工,其中不到35岁的有125人,35 岁~49岁的有280人,50岁以上的有95人.为了了解该单 位职工与身体状况有关的某项指标,要从中抽取一个 容量为100的样本,应该用___________抽样法.分层3.某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取1个容量为100户的样本,记做①;某学校高一年级有12名女排运动员,要从中选出3个调查学习负担情况,记做②.那么完成上述2项调查应采用的抽样方法是( )
(A)①用简单随机抽样法,②用系统抽样法
(B)①用分层抽样法,②用简单随机抽样法
(C)①用系统抽样法,②用分层抽样法
(D)①用分层抽样法,②用系统抽样法B4.某公司生产三种型号的轿车,产量分别为1200辆, 6000辆和2000辆.为检验该公司的产品质量,现用分层 抽样的方法抽取46辆舒畅行检验,这三种型号的轿车 依次应抽取______________辆.6、 30 、 106.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一容量为3的样本,则某特定个体被抽到的概率是( )
A. B. C. D.
7.分层抽样适用的范围是 ( )
A.总体中个数较少
B.总体中个数较多
C.总体中由差异明显的几部分组
D.以上均可以 8.从甲、乙两班分别任意抽出10名学生进行英语口语测验,其测验成绩的方差分别为S12= 13.2,S22=26.26,则( ).
A.甲班10名学生的成绩比乙班10名学生的成绩整齐
B.乙班10名学生的成绩比甲班10名学生的成绩整齐
C.甲、乙两班10名学生的成绩一样整齐
D.不能比较甲、乙两班10名学生成绩的整齐程度9.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输人为15,那么由此求出的平均数与实际平均数的差是( ).
A.3.5 B.-3 C.3 D.-0.5B10.如果一组数中每个数减去同一个非零常数,则这一组数的( ).
A.平均数不变,方差不变
B.平均数改变,方差改变
C.平均数不变,方差改变
D.平均数改变,方差不变D 11.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则有( ).
A.a>b>c B.b>c>a C.c>a>b D.c>b>a12.有一个容量为100的样本,数据的分组及各组的频数如下:
[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5),8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)估计数据小于30.5的概率.13.如图,是某单位职工年龄(取正整数)的频数分布图,根据图形提供的信息,回答下列问题(直接写出答案)
注:每组可含最低值,不含最高值
(1)该单位职工共有多少人?
(2)不小于38岁但小于44岁的职工人数占职工总人数的百分比是多少?
(3)如果42岁的职工有4人,那么年龄在42岁以上的职工有几人?(1)该单位有职工50人
(2)38--44岁之间的职工人数占职工
总人数的60%
(3)年龄在42岁以上的职工有15人14. 如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:
(1)79.5---89.5这一组的频数、频率分别是多少?
(2)估计这次环保知识竞赛的及格率(60分及以上为及格)(1)频率为:0.025×10=0.25,
频数:60×0.25=15
(2)0.015×10+0.025×10
+0.03×10+0.005×10=0.7515.为了解某地初三年级男生的身高情况,从其中的一个学校选取容量为60的样本(60名男生的身高),分组情况如下:
(1)求出表中a,m的值.
(2)画出频率分布直方图和频率折线图