江苏省兴化市楚水实验学校必修3《统计》全部课件(08版)

文档属性

名称 江苏省兴化市楚水实验学校必修3《统计》全部课件(08版)
格式 rar
文件大小 1.8MB
资源类型 教案
版本资源 苏教版
科目 数学
更新时间 2008-10-22 11:55:00

文档简介

课件24张PPT。统计的基本思想方法: 用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.统计的核心问题: 如何根据样本的情况对总体的情况作出一种推断. 这里包括两类问题:一类是如何从总体中抽取样本? 另一类是如何根据对样本的整理、计算、分析, 对总体的情况作出推断.楚水实验学校高二数学备课组总体分布的估计(1) 用样本的有关情况去估计总体的相应情况,
这种估计大体分为两类,一类是用样本频率分
布估计总体分布,一类是用样本的某种数字特
征(例如平均数、方差等)去估计总体的相应
数字特征。 整体介绍:  国际奥委会2003年6月29日决定,2008年北京奥运会举办的日期比原定日期推迟两周,改在8月8日至8月24日举行.原因是7月末8月初北京地区得气温高于8月中下旬.
  下表是随机抽取的近年来北京地区7月25日至8月24日的日最高气温,得到如下样本(单位:oC)怎样通过上表中的数据,分析比较两时间段的高温(≥33℃)状况呢?问题引入:知识新授:1.频数与频率 频数是指一组数据中,某范围内的数据出现的次数;把频数除以数据的总个数,就得到频率.2.频率分布表 当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.
说明:样本频率分布与总体频率分布  有什么关系?
通过样本的频数分布、频率分布可以
估计总体的频率分布.频率分布表:3.频率分布条形图① 各长方形长条的宽度要相同.
②相邻长条的间距要适当.
③长方形长条的高度表示取各值的频率.一幅图胜过一千字引例 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm).试作出该样本的频率分布表. 这个例子与前面问题是不同的,这里的总体可以在一个实数区间取值,称为连续型总体.样本的频率分布表示形式有:
频率分布表和频率分布直方图S1 计算数据中最大值与最小值的差(极差),确定全距.
S2 根据全距,决定组数和组距.
S3 分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间,且使分点比数据多一位小数.
S4 登记频数,计算频率,列出频率分布表.算法:1.频率分布表S1 计算数据中最大值与最小值的差(极差),确定全距.极差=180-151=29;全距=30;取值区间[150.5,180.5]; 组距和组数与数据的数量有关.一般数据较多,分的组数也多;数据较少,分的组数也少.当数据个数在50以内,分5~8组;当数据个数在50~100之间,分8~12组.应当注意的是如果组内没有数据出现,就应当放宽组距,保证每个组内都有数据,且每个数据只属于确定的一组.在决定组数时,往往不是一次就能成功的,要有一个观察、尝试的过程,一般分点比已知数据多一位小数,并且第一组的起点要稍稍减小.只有合理地确定组距与组数,才能使数据分布的规律性比较明显地呈现出来; S2 根据全距,决定组数和组距.组数=10;组距=3;S3 分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间,且使分点比数据多一位小数.488112219147430.040.080.080.110.220.190.140.070.040.03412203153728693971001001练习 :1.一个容量为32的样本,已知某组样本的频率为0.125,那么该组样本的频数为( )
A.2 B.4 C.6 D.82.为了分析一次数学考试的情况,全班抽了50人,将分数分为5组.第一组到第三组的频数分别是10,23,1,第四组的频率是0.08,那么落在第五组的频数是____,频率是_____,全年级800人中分数落在第五组的约有_____人. B120.241923.一个容量为20的样本数据,分组后组距与频数如下:(10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4;(60,70),2。则样本在区间(10,50]上的频率为( )
A.5% B.25% C.50% D.70% 4.已知样本10,8,6,10,8,13,11,10,12,7,8,9,11,9,11,12,9,10,11,12,那么频率为0.2的范围是( )
A.5.5-----7.5 B.7.5--------9.5
C.9.5-----11.5 D.11.5-------13.5DDS1 作出频率分布表,然后作直角坐标系,以横轴表示数据,纵
轴表示“频率/组距”;
S2 把横轴分为若干段,每一线段对应一个组的组距,
S3 以此线段为底作一矩形,它的高等于该组的频率/组距,这样得
出一系列的矩形,每个矩形的面积恰好是该组上的频率.
这些矩形就构成了频率分布直方图. 所有矩形的面积和为1 .算法:2.频率分布直方图177.5身高/cm150.5153.5156.5159.5162.5165.5168.5171.5174.5180.50.020.040.060.08频率分布的条形图和频率分布直方图的区别 两者是不同的概念;横轴:两者表示内容相同.思考:
频率分布条形图和频率分布直方图是两个相同的概念吗? 有什么区别?纵轴:两者表示的内容不相同.频率分布条形图的纵轴(长方形的高)表示频率; 频率分布直方图的纵轴(长方形的高)表示频率与组距的比值.其相应组距上的频率等于该组距上长方形的面积.
2.一个容量为100的样本,数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格.0.060.0680.140.16160.210.510.18180.160.85100.950.055课堂小结编制频率分布直方图的步骤:①找最大值与最小值。②决定组距与组数③决定分点④登记频数,计算频率,列表,画直方图说明:(1)确定分点时,使分点比数据多一位小数,并且把第1小组的起点稍微再小一点.一、求极差,即数据中最大值与最小值的差二、决定组距与组数 :组距=极差/组数三、分组,通常对组内数值所在区间,
  取左闭右开区间 , 最后一组取闭区间四、登记频数,计算频率,列出频率分布表画一组数据的频率分布直方图,可以按以下的步骤进行:五、画出频率分布直方图(纵轴表示频率/组距)频率分布直方图应用1.求极差2.决定组距与组数3.将数据分组4.列频率分布表5.画频率分布直方图课后作业:课本 P59 习题2.2
No.1、2、3.课件21张PPT。楚水实验学校高二数学备课组总体分布的估计(2)复习回顾:1.频数与频率 频数是指一组数据中,某范围内的数据出现的次数;把频数除以数据的总个数,就得到频率.2.频率分布表 当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.S1 作出频率分布表,然后作直角坐标系,以横轴表示数据,纵
轴表示“频率/组距”;
S2 把横轴分为若干段,每一线段对应一个组的组距,
S3 以此线段为底作一矩形,它的高等于该组的频率/组距,这样得
出一系列的矩形,每个矩形的面积恰好是该组上的频率.
这些矩形就构成了频率分布直方图. 所有矩形的面积和为1 .算法:3.频率分布直方图 我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么a定为多少比较合理?问题引入: 例1:某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a , 用水量不超过a的部分按平价收费,超过a的部分按议价收费。 ①如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢? ②为了较合理地确定这个标准,你认为需要做
哪些工作?假设通过抽样,我们获得了100位居民的月均用水量(单位:t)极差=4.3-0.2=4.1;极差=4.3-0.2=4.1;如果取区间[0.15,4.35],则全距为4.2;
分10组,组距为0.42因此分9组,全距为4.5,取区间[0,4.5]为了方便起见,组距尽可能“取整”,因此定为0.5!画频率分布直方图同样一组数据,如果组距不同,横轴、纵轴单位不同,得到的图的性状也会不同.不同的形状给人不同的印象,这种印象会影响我们对总体的判断.从图中我们可以看到,月均用水量在区间[2,2.5)内的居民最多,在[1.5,2)内次之,大部分居民的月均用水量都在[1,3)之间. 直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到分布表中看不清楚的数据模式,但是直观图也丢失了一些信息,例如,原始数据不能在图中表示出了.频率分布折线图 如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率折线图.频率折线图的优点是它反映了数据的变化趋势.如果将样本容量取得足够大,分组的组距取得足够小,则这条折线将趋于一条曲线,我们称这一曲线为总体分布的密度曲线.总体密度曲线总体在区间 内取值的概率 某篮球运动员在某赛季各场比赛的得分情况如下:
12,15,24,25,31,31,36,36,37,39,44,49,501
2
3
4
5←叶:表示个位数字茎:表示十位数字→茎叶图2545166794901从这张图可以粗略地看出,该运动员平均得分及中位数、众数都在20到40之间,且分布较对称,集中程度高,说明其发挥比较稳定.茎叶图的画法:
  将所有的两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.
茎叶图的优缺点:
  优点是所有的信息都可以从茎叶图中得到,便于记录和表示.但茎叶图表示三位或三位以上的数据时不够方便.   某医院的发热门诊部对一天接待的16名病人的体温进行了测量,得到以下数据:
  37.5,38.0,39.2,38.5,39.5,37.8,39.1,38.2,37.6,39.2,38.1,39.5,37.8,38.5,38.7,39.3
  请作出当天病人体温的茎叶图,并计算出病人的平均体温.课堂小结:1.频率分布直方图2.频率分布折线图——总体分布的密度曲线总体密度曲线总体在区间 内取值的概率3.茎叶图1
2
3
4
5←叶:表示个位数字茎:表示十位数字→将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从小到大(或从大到小)的顺序同行列出.25
45
116679
49
0课后作业:课本 P59 习题2.2
No.4、7、8、9.课件22张PPT。楚水实验学校高二数学备课组总体特征数的估计(1)某校高一(1)班同学在老师的布置下,用单摆进行测试,以检验重力加速度.全班同学两人一组,在相同条件下进行测试,得到下列实验数据(单位:m/s2):
9.62  9.5  9.78  9.94  10.01 9.66 9.88 9.68 10.32 9.76  9.45  9.99 9.81 9.56 9.78 9.72  9.93  9.94 9.65 9.79 9.42 9.68 9.70 9.84 9.90怎样用这些数据对重力加速度进行估计?问题引入:知识新授:一、众数、中位数、平均数的概念 一般地,n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数的中位数(median). 一组数据中出现次数最多的那个数据叫做这组数的众数(mode). 算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数. 用这些特征数据对总体进行估计的优缺点是什么? 练习: 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:分别求这些运动员成绩的众数,中位数与平均数  解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.
  上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70; 这组数据的平均数是 答:17名运动员成绩的众数、中位数、平均数依次是1.75(米)、1.70(米)、1.69(米). 用这些特征数据对总体进行估计的优缺点是什么?平均数、中位数、众数都是描述数据的“集中趋势”的“特征数”,它们各自特点如下:
用平均数作为一组数据的代表,比较可靠和稳定,它与这组数据中的每一个数都有关系.对这些数据所包含的信息的反映最为充分,因而应用最为广泛,特别是在进行统计推断时有重要作用,但计算较繁琐,并且易受极端数据的影响.
用众数作为一组数据的代表,可靠性较差,但众数不受极端数据的影响,并且求法简便,当一组数据中个别数据变动较大时,适宜选择众数来表示这组数据的“集中趋势”.
用中位数作为一组数据的代表,可靠性也较差,但中位数也不受极端数据的影响,也可选择中位数来表示这组数据的“集中趋势”. 任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具备的性质,也正是这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.二 、众数、中位数、平均数与频率分布直方图的关系 1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。
例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t.如图所示:频率分布直方图如下: 2、在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数。
因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。下图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.03t. 频率分布直方图如下:说明:
2.03这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致. 3、平均数是频率分布直方图的“重心”.
是直方图的平衡点.
n 个样本数据的平均数公式:频率分布直方图如下:三、众数、中位数、平均数的简单应用例1 某工厂人员及工资构成如下:(1)指出这个问题中周工资的众数、中位数、平均数(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?(加权平均数) 分析:众数为200,中位数为220,平均数为300。
因平均数为300,由表格中所列出的数据可见,只有经理的周工资在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。 例2例3.下面是某校学生日睡眠时间的抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间.例4.小明班数学平均分是78分,小明考了80分,老师却说他是倒数几名,你觉得这可能吗? 课堂小结:一、众数、中位数、平均数的概念 一般地,n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数的中位数(median). 一组数据中出现次数最多的那个数据叫做这组数的众数(mode). 算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数. 二 、众数、中位数、平均数与频率分布直方图的关系1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。2、在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数。3、平均数是频率分布直方图的“重心”.是频率分布直方图的平衡点. 课后作业:课本 P68 习题2.3
No.1、2.课件17张PPT。楚水实验学校高二数学备课组总体特征数的估计(2)复习回顾:一、众数、中位数、平均数的概念 一般地,n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数的中位数(median). 一组数据中出现次数最多的那个数据叫做这组数的众数(mode). 算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数. (加权平均数) 练习:1.甲在一次射击比赛中的得分如下: ( 单位:环).7,8,6,8,6,5,9,10,7,8,则他命中的平均数是____,众数是____,中位数是 .2.某次数学试卷得分抽样中得到:90分的有3个人,80分的有10人,70分的有5人,60分的有2人,则这次抽样的众数,中位数和平均数分别为_______.80,75,77。87.57.4问题引入: 有两位射击运动员在一次射击测试中各射靶十次,每次命中的环数如下:
甲 7 8 7 9 5 4 9 10 7 4
乙 9 5 7 8 7 6 8 6 7 7 如果你是教练,你应当如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择? 两人射击 的平均成绩是一样的. 那么两个人的水平就没有什么差异吗?45678910环数频率0.10.20.3(甲)456789100.10.20.30.4环数频率(乙)发现什么?为此,我们还需要从另外一个角度去考察
这2组数据!  直观上看,还是有差异的.如:甲成绩比较分散,乙成绩相对集中(如图示).因此,我们还需要从另外的角度来考察这两组数据.例如:在作统计图,表时提到过的极差.
甲的环数极差=10-4=6
乙的环数极差=9-5=4.
它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.知识新授:  考察样本数据的分散程度的大小,最常用的统计量是标准差.
标准差是样本平均数的一种平均距离,一般用s表示.所谓“平均距离”,其含义可作如下理解: 方差、标准差是样本数据到平均数的一种平均距离。它用来描述样本数据的分散程度。在实际应用中,标准差常被理解为稳定性。1、方差(标准差的平方)公式为:2、标准差公式为:在刻画样本数据分散程度上,两者是一致的!标准差 方差、标准差是样本数据到平均数的一种平均距离。它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。规律:标准差越大,
则a越大,数据的
离散程度越大;反
之,数据的离散程
度越小。
数学应用:例1、已知有一个样本的数据为1,2,3,4,5,求平均数,方差,标准差。例2 甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm)甲 25.46, 25.32, 25.45, 25.39, 25.36
25.34, 25.42, 25.45, 25.38, 25.42
25.39, 25.43, 25.39, 25.40, 25.44
25.40, 25.42, 25.35, 25.41, 25.39乙 25.40, 25.43, 25.44, 25.48, 25.48
25.47, 25.49, 25.49, 25.36, 25.34
25.33, 25.43, 25.43, 25.32, 25.47
25.31, 25.32, 25.32, 25.32, 25.48 从生产的零件内径的尺寸看,谁生产的质量较高?解:用计算器计算可得:例3 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差.注:样本数据中在[268-46×2,268+46×2]外的只有3个,也就是说,区间 几乎包含了所有的数据.性质归纳:课堂小结:1、平均距离:2、方差(标准差的平方)公式为:3、标准差公式为: 方差、标准差是样本数据到平均数的一种平均距离。它用来描述样本数据的分散程度。在实际应用中,标准差常被理解为稳定性。课后作业:课本 P68 习题2.3
No.3、4、6、7.课件19张PPT。 统计学的研究对象是客观事物的数量特征和数量关系,它是关于数据的搜集、整理、归纳和分析的方法和科学. 人们要认识客观事物,就必须通过试验和调查来搜集有关数据,并加以整理、归纳和分析,以便对客观事物规律性的数量表现作出统计上的解释.这既是统计活动的过程,也是人们对客观世界的认识过程. 为了使统计活动能有效进行,需要建立科学的统计理论和方法.
本章就是研究如何科学地抽取样本,获取数据,并根据数据样本的分析对总体进行估计的方法.楚水实验学校高二数学备课组抽样方法(1) 问题 1. 2008高考考试中,某地有考生有2万名,如果为了了解这些考生数学的主观题的得分情况,我们应该怎样做? 问题2. 今有某灯泡厂生产的灯泡10000只,怎样才能了解到这批灯泡的使用寿命呢? 普查抽样调查全面、准确,但可行性差;样本要具有代表性、广泛性等特点. 所要解决的问题是如何根据样本来推断总体-样本估计总体的思想. 总体:所要考察对象的全体. 个体:总体中的每一个考察对象. 样本:从总体中抽取的一部分个体叫做这个总体的一个样本. 样本容量:样本中个体的数目. 问题3:对本班同学对看足球比赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查.方案:将全班同学按学号编号,制作相应的卡片号签,放入同一个箱子里均匀搅拌,从中抽出15个号签,就相应的15名学生对看足球比赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查.抽签法抽签法的一般步骤:(1)将总体中所有个体编号(对已经有编号的个体,
可以省略编号的过程);
(2)制作与个体编号相同的号签;
(3)将号签放在一个箱子中搅匀;
(4)按要求随机抽取号签,并记录;
(5)将编号与号签一致的个体抽出.抽签法的适用范围: 抽签法简单易行,适用于总体中个体数不多的情形. 抽签法的制签比较麻烦,如何简化制签过程?随机数表法 制作一个表,其中每个数都是用随机方法产生的,这样的表称为随机数表.如何用随机数表来抽取样本?问题4.为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,如何抽样? 第一步,先将40件产品编号,可以编为00,01,02,,38,39. 第二步,在附录1随机数表中任选一个数作为开始.由于需要编号,如果总体中的个体数太多,采用随机表法进行抽样就显得不太方便了所谓编号,实际上是编数字号码.不要编号成:0,1,2,…,39为了保证所选定数字的随机性,应在面对随机数表之前就指出开始数字的纵横位置 第三步,获取样本号码.16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28例如选取第8行第9列开始.问题4.为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,如何抽样?6行:7行:8行:9行:10行:16191012073938332134注:当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等.
在上面每两位、每两位地读数过程中,得到一串两位数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码.由于随机数表中每个位置上出现哪一个数字是等概率的,每次读到哪一个两位数字号码,即从总体中抽到哪一个个体的号码也是等概率的.因而利用随机数表抽取样本保证了各个个体被抽取的概率相等.问题3:对本班同学对看足球比赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查.练习:用随机表法,求解问题3.注意以下四点: (1)它要求被抽取样本的总体的个体数有限; (2)它是从总体中逐个进行抽取; (3)它是一种不放回抽样;(4)它是一种等概率抽样. 一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样. 问题 1. 2008高考考试中,某地有考生有2万名,如果为了了解这些考生数学的主观题的得分情况,我们应该怎样做? 问题2. 今有某灯泡厂生产的灯泡10000只,怎样才能了解到这批灯泡的使用寿命呢? 总体的个数较多,采用简单随机抽样较为费事. 问题5:为了了解高一年级15个班的同学(每班50名)的视力情况,从这15个班中抽取一个容量为75的样本进行检查,应如何抽取样本?方案:通常将各班同学平均分成5组,再在第一组用抽签法确定一个学号的学生,按每组逐次加10的原则抽取5名代表,
例:抽取学号为02,12,22,32,42等5位代表. 将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为等距抽样). 问题6 :为了了解参加某种知识竞赛的1000名学生的成绩,应采用什么样的抽样方法恰当?解:抽样过程如下:
(1)随机将这1000名学生编号为1,2,3,……,1000(比如可以利用准考证号);
(2)将总体按编号顺序平均分成50部分,每部分包含20个个体.
(3)在第一部分的个体编号1,2,……,20中,利用简单随机抽样抽取一个号码,比如是18;
(4)以18为起始号,每间隔20抽取一个号码,这样就得到一个容量为50的样本:18,38,58,……,978,998. 如果问题6中,学生人数是1003,如何进行系统抽样?解:(1)随机将这1003个个体进行编号1,2,3,……1003;
(2)利用简单随机抽样,先从总体中剔除3个个体(可以随机数表法),将剩下的个体重新编号然后按系统抽样的方法进行.系统抽样的步骤:(1)采用随机的方式将总体中的个体编号。为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等;
(2)整个的编号分段(即分成几个部分),要确定分段的间隔k.当N/n(N为总体中的个体的个数,n为样本容量)是整数时,k=N/n;当N/n不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数N'能被n整除,这时k=N'/n;
(3)在第一段用简单随机抽样确定起始的个体编号;
(4)按照事先确定的规则抽取样本(通常是将l加上间隔k,得到第2个编号l+k,第3个编号l+2k,这样继续下去,直到获取整个样本).(1)系统抽样称为等距抽样;
(2)注意当N/n不是整数时,要去掉一些个体,可以再用随机数表的方法抽出剔除的个体;
(3)系统抽样适用于总体容量较大的情况;
(4)系统抽样是等可能抽样.注意以下4点: 课件14张PPT。楚水实验学校高二数学备课组抽样方法(2)抽签法的一般步骤:(1)将总体中所有个体编号(对已经有编号的个体,
可以省略编号的过程);
(2)制作与个体编号相同的号签;
(3)将号签放在一个箱子中搅匀;
(4)按要求随机抽取号签,并记录;
(5)将编号与号签一致的个体抽出.抽签法的适用范围: 抽签法简单易行,适用于总体中个体数不多的情形.知识回顾:随机数表法的一般步骤:(1)将总体中所有个体编号(每个号码位数一致);
(2)在随机数表中任选一个数作为开始;
(3)从选定的数开始按一定的方向读下去,若得到的号码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止;
(4)根据选定的号码抽取样本.随机数表法的适用范围: 随机数表法简单易行,适用于总体中个体数不多的情形.注意以下四点: (1)它要求被抽取样本的总体的个体数有限; (2)它是从总体中逐个进行抽取; (3)它是一种不放回抽样;(4)它是一种等概率抽样. 一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.抽签法随机数表法系统抽样的步骤:(1)采用随机的方式将总体中的个体编号。为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等;
(2)整个的编号分段(即分成几个部分),要确定分段的间隔k.当N/n(N为总体中的个体的个数,n为样本容量)是整数时,k=N/n;当N/n不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数N'能被n整除,这时k=N'/n;
(3)在第一段用简单随机抽样确定起始的个体编号;
(4)按照事先确定的规则抽取样本(通常是将l加上间隔k,得到第2个编号l+k,第3个编号l+2k,这样继续下去,直到获取整个样本). 将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为等距抽样).分层抽样 当总体由差异明显的几部分组成时,为了使样本充分地反映总体的情况,常将总体分成互不交叉的层,然后按照各层所占的比例从各层独立的抽取
一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法称之为
分层抽样。分层抽样的实施步骤: (2)根据总体中的个体数N与样本容量n确定抽样比:k= (3)确定各层应该抽取的个体数。各层的抽取数之和应等于样本容量。对于不能取整的数,求其近似值。 (4)按(3)中确定的数目在各层中随机抽取个体,合在一起得到容量为n的样本.(1) 根据已有信息,将总体分成互不相交的层; (1)分层抽样适用于总体由差异明显的几部分组成的情况,每一部分称为层,在每一层中实行简单随机抽样。这种方法较充分地利用了总体己有信息,是一种实用、操作性强的方法。而且更具代表性。 (2)分层抽样的一个重要问题是总体如何分层,分多少层,这要视具体情况而定。总的原则是:层内样本的差异要小,而层与层之间的差异尽可能地大,否则将失去分层的意义。注: 一个电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下所示:
很喜爱 喜爱 一般 不喜爱
2400 4200 3800 1600
打算从中抽取60人进行详细调查,如何抽取?
练习三种抽样方法的比较 例 下列问题中,采用怎样的抽样方法较为合理?
⑴ 从10台冰箱中抽取3台进行质量检测;
⑵ 某电影院有32排座位,每排有40个座位,座号为1~40.有一次报告会坐满了听众,报告会结束以后为听取意见,需留下32名听众进行座谈;
⑶ 某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20 的样本.思考:
某城市的两所中学分别对自己所在学校12~14岁学生的身高进行了抽样统计,发现这两所学校12~14岁学生的平均身高竟相差19 cm,这可能吗?他们在抽样过程中可能出现了哪些问题?练习:
课本 P47 练习No.1—4.作业:
课本P49 习题2.1 No.1、2、3.课件16张PPT。 有些教师常说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题” 按照这种说法,似乎学生的物理成绩与数学成绩之间也存在着某种关系。你如何认识它们之间存在的关系?物理成绩这两个变量之间的有不确定的关系结论:变量之间除了函数关系外,还有 。相关关系问题引入:楚水实验学校高二数学备课组线性回归方程(1)函数关系是一种确定的关系;相关关系与函数关系的异同点:均是指两个变量的关系.问题:举一两个现实生活中的问题,问题所涉及的变量之间存在一定的相关关系。相关关系是一种非确定关系.相同点:不同点:探究一根据上述数据,人体的脂肪含量和年龄之间有怎样的关系?在一次对人体的脂肪含量和年龄关系的?通过统计图、表,可以使我们对两个变量之间的关系有一个直观上的印象和判断。 下面我们以年龄为横轴,脂肪含量为纵轴建立直角坐标系,作出各个点,如图:称该图为散点图。5个学生的数学和物理成绩如下表:画出散点图,解:数学成绩有一个同学家开了一个小卖部,他为了研究气温对热饮销销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:摄氏温度 26 18 13 10 4 -1 热饮杯数 20 24 34 38 50 64 为了了解热饮销量与气温的大致关系,我们以气温为横轴,热饮销量为纵轴,建立直角坐标系,散点图气温与热饮杯数成负相关,即气温越高, 卖出去的热饮杯数越少。我们再观察刚才两个散点图还有什么特征:这些点大致分布在一条直线附近,
像这样如果散点图中的点分布从整体上看大致在
一条直线附近我们就称这两个变量之间具有线性
相关关系,这条直线叫做回归直线,
这条直线的方程叫做回归方程 那么,我们该怎样来求出这个回归方程?请同学们展开讨论,能得出哪些具体的方案?. 方案1、先画出一条直线,测量出各点与它的距离,再移动直线,到达一个使距离的和最小时,测出它的斜率和截距,得回归方程。如
图 . 方案2、在图中选两点作直线,使直线两侧 的点的个数基本相同。 方案3、如果多取几对点,确定多条直线,再求出这些直线的斜率和截距的平均值作为回归直线的斜率和截距。而得回归方程。 如图: 我们还可以找到
更多的方法,但
这些方法都可行
吗?科学吗?
准确吗?怎样的
方法是最好的?20253035404550556065年龄脂肪含量0510152025303540我们把由一个变量的变化
去推测另一个变量的方法
称为回归方法。我们上面给出的几种方案可靠性都不是很强,人们经过长期的实践与研究,已经找到了计算回归方程的斜率与截距的一般公式: 以上公式的推导较复杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫最小二乘法。求解线性回归问题的步骤:
1.列表( ),画散点图.
2.计算:
3.代入公式求a,b
4.列出直线方程课后作业:课本 P76 习题2.4
No.1、2.课件13张PPT。楚水实验学校高二数学备课组线性回归方程(2)相关关系—两个变量的关系可能是确定的也可能是不确定的,当自变量取值一定,因变量的取值带有一定的随机性时,两个变量之间的关系称为相关关系.(非确定性关系)
函数关系---函数关系指的是自变量和因变量之间的关系是相互唯一确定的.知识回顾:函数关系是一种确定的关系;相关关系与函数关系的异同点:均是指两个变量的关系.相关关系是一种非确定关系.相同点:不同点: 像这样如果散点图中的点分布从整体上看大致在一条直线附近我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,
这条直线的方程叫做回归方程. 以上公式的推导较复杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫最小二乘法.例1.已知两个变量x和y具有线性相关关系,且5次试验的观测数据如下:
那么变量y关于x的回归方程是______
解:列表(设回归方程为y=bx+a)
计算得:x=140 y=65.6
求解线性回归问题的步骤:
1.列表( ),画散点图.
2.计算:
3.代入公式求a,b
4.列出直线方程练习:求三点(3,10),(7,20),(11,24)的线性回归方程.解(1)作出散点图: 就是两个线性关系,它们相关程度也有区别,此时描述它们相关程度的r定义为:这个数值r称为 与x的样本相关系数,简称相关系数.当r >0时, 与x正相关;当r <0时, 与x负相关.可以证明|r|≤1.|r|越接近1,线性相关程度越高;|r|越接近于0,线性相关程度越低.超级链接复习小结:(1)求线性回归方程的步骤:
1.列表( )
2.计算:
3.代入公式求a,b
4.列出直线方程复习小结:(2)计算线性回归方程的斜率与截距公式:(3)回归直线的线性回归方程:课后作业:课本 P76 习题2.4
No.3.