本资料来自于资源最齐全的21世纪教育网www.21cnjy.com
北师大版高中数学必修3第一章 《统计》全部教案
第一课时 §1。1 统计活动:随机选取数字
一、教学目标
1、知识与技能:(1)使学生认识统计活动所要研究的问题,如何分析数据资料;(2)明确为什么要随机选取数字,随机选取数字的困难性,精心设计调查方案的重要性。
2、情感、态度与价值观:让学生体会学习统计,参与统计活动的使用价值,提高学生参与意识以及理论与实际相结合的能力。
二、教学重点、难点与关键
1、重点、难点:随机选取数字把握的困难性及其原因; 2、关键:通过对具体是;事例的分析来说明对随机选取数字的困难性。
三、教学方法:讨论探究法
四、教学过程
(一)创设情景,引入新课
在日常生活中常遇到如下一些问题
(1)学校国庆节期间要举行一次大型的文艺汇演,限于演出场所的原因,每个班只有3张票,如何进行分配呢?
(2)某工厂要检验一批产品质量,决定从这批产品中任意抽取10个进行检验,以判断产品的质量如何?
(3)为了评选本年度先进学生代表,学校对候选人进行量化,让全体学生去评选你是如何看待和参与呢?你认为人为因素的干扰大吗?真正作到公平、公正难度大吗?
上面一些生活中的事例看似简单,但要真正作到“随机”,“任意”都困难很大,为什么呢,本节课将通过具体事例认真地研究这个问题。
(二)统计活动及其对选取数据的分析
例: 北京市某中学通过对343名学生做了下面一项统计活动,调查的过程如下
(1)调查者事先做好问卷;(2)给每个被调查者发放问卷,并进行回收;(3)对所有的调查数据进行汇总。
数据 1 2 3 4 5 6 7 8 9 10
统计结果: 正正 正正 ▔ 正正 正正
正正 正正 正 正正 正正 正 正正
正正 正正 正正 正 正正 正正 正正 正正 正 正正 正正 正正 正正 正正
正正 正正 正正 正 正正 正正 正正 正正 正ˉ 正正 正
人数 21 24 29 25 45 45 54 35 46 19
根据上面的数据回答下面问题:
(1)计算出选择各个数的百分比(用四舍五入方法保留到百分数的整数位).
(2)用下面的统计图表示上面的数据时,你觉得哪种统计图最合适?说明理由.
(3)请你分析这些数据的集中趋势与离散程度.
(4)从上面的数据能否看出,选哪些数的人少些,由此你能得到什么结论?
解:(1)计算出选择各个数的百分比(要求学生用计数器算出后汇总)
数字 1 2 3 4 5 6 7 8 9 10
人数/人 21 24 29 25 45 45 54 35 46 19
百分比/% 6 7 8 7 13 13 16 10 14 6
(2)数据汇总后呈现往往用统计图.统计图有三种形式:条形统计图,折线统计图,扇形统计图,它们各有特点(让学生交流后汇总)
本题所所关心的问题是选择各个数的人占总人数的百分比情况,因此选择扇形统计图比较合适,它能够比较清楚地表示百分比的情况。
(3)分析数据的集中趋势,离散程度往往以平均数,众数,方差,中位数等方面进行分析(请大家回顾一下平均数,众数,方差,中位数有关概念,并用计数器计算)
平均数 .
众数为7.
方差为
(4)从扇形统计图上可以看出,选1,2,3,4,10的人比较少,选其它数字的人较多。而随机选取这些数的理想状态,应当是选择到每个数的人数基本相当,且方差很小.由此,我们可以看出,由于个人偏好,人很难达到随机地选择数.
(三)如何做到随机性
从上面的分析可以看出,对随机性把握困难较大,主要原因是在选择处理时往往受到各种各样的主观因素的干扰,如何避免出现干扰,做到随机性就成为统计活动中必须注意解决的问题.
(1)对统计方案进行仔细地设计,避免一些外界因素干扰,要确定调查对象,调查方案与策略,精心设计调查问卷.做好统计的前期工作,收集数据方法.
(2)对采集到的数据要进行分析(汇总与呈现)做出统计判断.
(四)、课堂小结
1、统计活动中,要做到随机性,困难很大.主要原因是主观因素的干扰.
2、要做到随机性必须仔细地设计调查方案及做好统计的前期工作.
3、采集到的数据要进行汇总、呈现与分析.往往用条形统计图,折线统计图,扇形统计图呈现;分析数据往往用平均数,众数,方差,中位数分析,方差越小,统计准确性越高。
(五)、练习:P6练习题
(六)、作业: P7 2
五、教后反思:
第二课时 §1。2从普查到抽样
一、 教学目标:1.了解普查的意义.2.结合具体的实际问题情境,理解随机抽样的必要性和重要性.
二、重难点:结合具体的实际问题情境,理解随机抽样的必要性和重要性.
三、教学方法:阅读材料、思考与交流
四、教学过程
(一)、普查
1、【问题提出】 P7
通过我国第五次人口普查的有关数据,让学生体会到统计对政府决策的重要作用――统计数据可以提供大量的信息,为国家的宏观决策提供有关的支持.教科书通过对人口普查的有关新闻报道,让学生体会人口普查的规模是何等的宏大与艰辛.
教科书提出了三个有代表性的问题.第一个问题主要是针对人口普查的作用,人口普查可以了解一个国家人口全面情况,比如,人口总数、男女性别比、受教育状况、增长趋势等.人口普查是对国家的政府决策实行情况的一个检验,比如,国家计划生育政策,经济发展战略,国家“普及九年义务教育”政策,人民群众的生活水平等.第二个问题是针对普查本身存在的问题提出的,以加深学生对于普查的理解.学生可能有一个误解,普查就是100%的准确,其实不然,即使是最周全的调查方案,在实际执行时都会产生一个误差.教科书通过这个问题,目的是让学生理解在人口普查中出现漏登是正常情况,调查方案的设计是尽可能让这个误差降低到最小.同时,也要让学生理解人口普查的工作,即使出现漏登现象,人口普查的数据对国家的宏观决策依然具有重要的作用.第三个问题是针对人口普查工作的艰辛而提出的,让学生体会人口普查数据得来不易,要尊重人口普查人员的劳动,对人口普查工作要大力支持.
2、【阅读材料】 P8
“阅读材料”是课堂阅读,目的是让学生了解普查工作的特点和重要性,以及我国目前主要的一些普查工作.进而,总结出普查的主要不足之处,这是从一个方面说明了抽样调查的必要性.
普查是指一个国家或一个地区专门组织的一次性大规模的全面调查,目的是为了详细地了解某项重要的国情、国力.
普查主要有两个特点:(1)所取得的资料更加全面、系统;(2)主要调查在特定时段的社会经济现象总体的数量.
普查是一项非常艰巨的工作,它要对所有的对象进行调查.当普查的对象很少时,普查无疑是一项非常好的调查方式.
(二)、抽样调查
【例1和其后的“思考交流”】 P8~9
紧接着,教科书通过例1和“思考交流”的两个问题,让学生了解普查有时候难以实现.这主要有两个方面的原因,其一,被调查对象的量大;其二,普查对被调查对象本身具有一定的破坏性.这从另一个方面说明了抽样调查的必要性.然后,教科书通过抽象概括总结出抽样调查的两个主要优点.
【例2和其后的“思考交流”】 P9~10
主要是讨论在抽样调查时,什么样的样本才具有代表性.在抽样时,如果抽样不当,那么调查的结果可能会出现与实际情况不符,甚至是错误的结果,导致对决策的误导.在抽样调查时,一定要保证随机性原则,尽可能地避免人为因素的干扰;并且要保证每个个体以一定的概率被抽取到;同时,还要注意到要尽可能地控制抽样调查中的误差.
由于检验对象的量很大,或检验对检验对象具有破坏性时,通常情况下,所以采用普查的方法有时是行不通的.通常情况下,从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此调查对象的某项指标做出推断,这就是抽样调查.其中,调查对象的全体称为总体,被抽取的一部分称为样本.
抽样调查的优点:抽样调查与普查相比,有很多优点,最突出的有两点: (1)迅速、及时;(2)节约人力、物力和财力.
例1为了考察某地10 000名高一学生的体重情况,从中抽出了200名学生做调查.这里统计的总体、个体、样本、总体容量、样本容量各指什么?为什么我们一般要从总体中抽取一个样本,通过样本来研究总体?
解:统计的总体是指该地10 000名学生的体重;个体是指这10 000名学生中每一名学生的体重;样本指这10 000名学生中抽出的200名学生的体重;总体容量为10 000;样本容量为200.若对每一个个体逐一进行“调查”,有时费时、费力,有时根本无法实现,一个行之有效的办法就是在每一个个体被抽取的机会均等的前提下从总体中抽取部分个体,进行抽样调查.
例2 为了制定某市高一、高二、高三三个年级学生校服的生产计划,有关部门准备对180名初中男生的身高作调查,现有三种调查方案:
A.测量少年体校中180名男子篮球、排球队员的身高;
B.查阅有关外地180名男生身高的统计资料;
C.在本市的市区和郊县各任选一所完全中学,两所初级中学,在这六所学校有关年级的小班中,用抽签的方法分别选出10名男生,然后测量他们的身高.
为了达到估计本市初中这三个年级男生身高分布的目的,你认为采用上述哪一种调查方案比较合理,为什么?
解: 选C方案.理由:方案C采取了随机抽样的方法,随机样本比较具有代表性、普遍性,可以被用来估计总体.
例3 中央电视台希望在春节联欢晚会播出后一周内获得当年春节联欢晚会的收视率.下面三名同学为电视台设计的调查方案.
甲同学:我把这张《春节联欢晚会收视率调查表》放在互联网上,只要上网登录该网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快统计收视率了.
乙同学:我给我们居民小区的每一份住户发一个是否在除夕那天晚上看过中央电视台春节联欢晚会的调查表,只要一两天就可以统计出收视率.
丙同学:我在电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们是否收看了中央电视台春节联欢晚会,我不出家门就可以统计出中央电视台春节联欢晚会的收视率.
请问:上述三名同学设计的调查方案能够获得比较准确的收视率吗?为什么?
解: 综上所述,这三种调查方案都有一定的片面性,不能得到比较准确的收视率.
(三)、课堂小结:1、普查是一项非常艰巨的工作,它要对所有的对象进行调查.当普查的对象很少时,普查无疑是一项非常好的调查方式.普查主要有两个特点:(1)所取得的资料更加全面、系统;(2)主要调查在特定时段的社会经济现象总体的数量.2、通常情况下,从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此调查对象的某项指标做出推断,这就是抽样调查.其中,调查对象的全体称为总体,被抽取的一部分称为样本.抽样调查的优点:抽样调查与普查相比,有很多优点,最突出的有两点: (1)迅速、及时;(2)节约人力、物力和财力。
(四)、作业: P10练习题; P10【习题1―2】
五、教后反思:
第三课时 §1。3抽样方法(一)
——简单随机抽样
一、教学目标:
1、知识与技能:正确理解随机抽样的概念,掌握抽签法、随机数表法的一般步骤;
2、过程与方法:(1)能够从现实生活或其他学科中提出具有一定价值的统计问题;(2)在解决统计问题的过程中,学会用简单随机抽样的方法从总体中抽取样本。
3、情感态度与价值观:通过对现实生活和其他学科中统计问题的提出,体会数学知识与现实世界及各学科知识之间的联系,认识数学的重要性。
二、重点与难点:正确理解简单随机抽样的概念,掌握抽签法及随机数法的步骤,并能灵活应用相关知识从总体中抽取样本。
三、教学方法:观察、思考、交流、讨论、概括。
四、教学过程
(一)创设情景,揭示课题
假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?
显然,你只能从中抽取一定数量的饼干作为检验的样本。(为什么?)那么,应当怎样获取样本呢?
(二)、探究新知
1、简单随机抽样的概念:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。
【小结】简单随机抽样必须具备下列特点:(1)简单随机抽样要求被抽取的样本的总体个数N是有限的。(2)简单随机样本数n小于等于样本总体的个数N。(3)简单随机样本是从总体中逐个抽取的。(4)简单随机抽样是一种不放回的抽样。(5)简单随机抽样的每个个体入样的可能性均为n/N。
思考?下列抽样的方式是否属于简单随机抽样?为什么?(1)从无限多个个体中抽取50个个体作为样本。(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子。
2、、抽签法和随机数法
(1)、抽签法的定义:一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
【小结】抽签法的一般步骤:(1)将总体的个体编号。(2)连续抽签获取样本号码。
思考?你认为抽签法有什么优点和缺点:当总体中的个体数很多时,用抽签法方便吗?
(2)、随机数法的定义:利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法,这里仅介绍随机数表法。
怎样利用随机数表产生样本呢?下面通过例子来说明,假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,可以按照下面的步骤进行。
第一步,先将800袋牛奶编号,可以编为000,001,…,799。
第二步,在随机数表中任选一个数,例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行)。
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38
57 60 86 32 44 09 47 27 96 54 49 17 46 09 62
87 35 20 96 43 84 26 34 91 64
21 76 33 50 25 83 92 12 06 76
12 86 73 58 07 44 39 52 38 79
15 51 00 13 42 99 66 02 79 54
90 52 84 77 27 08 02 73 43 28
第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉,按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本。
【小结】随机数表法的步骤:(1)将总体的个体编号。(2)在随机数表中选择开始数字。(3)读数获取样本号码。
(三)、例题精析
例1:人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?
[分析] 简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样。
例2:某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?
[分析] 简单随机抽样一般采用两种方法:抽签法和随机数表法。
解法1:(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号签对应的轴的直径。
解法2:(随机数表法)将100件轴编号为00,01,…99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本。
(四)、课堂练习P13练习题
(五)、课堂小结 1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法。2、抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。3、简单随机抽样每个个体入样的可能性都相等,均为n/N,但是这里一定要将每个个体入样的可能性、第n次每个个体入样的可能性、特定的个体在第n次被抽到的可能性这三种情况区分开业,避免在解题中出现错误。
(六)、作业布置:
1、为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是
A.总体是240 B、个体是每一个学生
C、样本是40名学生 D、样本容量是40
2、为了正确所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是 ( )
A、总体 B、个体是每一个学生
C、总体的一个样本 D、样本容量
3、一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是 。
4、从3名男生、2名女生中随机抽取2人,检查数学成绩,则抽到的均为女生的可能性是 。
五、教后反思:
第四课时 §1。3抽样方法(二)
——系统抽样
一、教学目标
1、知识与技能:(1)正确理解系统抽样的概念;(2)掌握系统抽样的一般步骤;(3)正确理解系统抽样与简单随机抽样的关系;
2、过程与方法:通过对实际问题的探究,归纳应用数学知识解决实际问题的方法,理解分类讨论的数学方法,
3、情感态度与价值观:通过数学活动,感受数学对实际生活的需要,体会现实世界和数学知识的联系。
二、重点与难点:正确理解系统抽样的概念,能够灵活应用系统抽样的方法解决统计问题。
三、教学方法:观察、思考、交流、讨论、概括。
四、教学过程
(一)、创设情境
某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法?
(二)、探究新知
1、系统抽样的定义:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。
【小结】由系统抽样的定义可知系统抽样有以下特证:(1)当总体容量N较大时,采用系统抽样。
(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k=[].(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号。
思考?(1)你能举几个系统抽样的例子吗?
(2)下列抽样中不是系统抽样的是 ( )
A、从标有1~15号的15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样
B工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验
C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止
D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈
点拨:(2)c不是系统抽样,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样。
2、系统抽样的一般步骤:(1)采用随机抽样的方法将总体中的N个个编号。(2)将整体按编号进行分段,确定分段间隔k(k∈N,L≤k).(3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。(4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。
【小结】从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想。
(三)、例题精析
例1、某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。
[分析]按1:5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号。
解:按照1:5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,59组是编号为291~295的5名学生。采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k≤5),那么抽取的学生编号为k+5L(L=0,1,2,……,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,……,288,293。
例2、从忆编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是
A.5,10,15,20,25 B、3,13,23,33,43
C.1,2,3,4,5 D、2,4,6,16,32
[分析]用系统抽样的方法抽取至的导弹编号应该k,k+d,k+2d,k+3d,k+4d,其中d=50/5=10,k是1到10中用简单随机抽样方法得到的数,因此只有选项B满足要求,故选B。
(四)、课堂练习P49 练习1. 2. 3
(五)、课堂小结:1、在抽样过程中,当总体中个体较多时,可采用系统抽样的方法进行抽样,系统抽样的步骤为:(1)采用随机的方法将总体中个体编号;(2)将整体编号进行分段,确定分段间隔k(k∈N);(3)在第一段内采用简单随机抽样的方法确定起始个体编号L;(4)按照事先预定的规则抽取样本。2、在确定分段间隔k时应注意:分段间隔k为整数,当不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。
(六)、作业:
1、从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为 ( )
A.99 B、99,5
C.100 D、100,5
2、从学号为0~50的高一某班50名学生中随机选取5名同学参加数学测试,采用系统抽样的方法,则所选5名学生的学号可能是 ( )
A.1,2,3,4,5 B、5,16,27,38,49
C.2, 4, 6, 8, 10 D、4,13,22,31,40
3、采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体人样的可能性为 ( )
A.8 B.8,3
C.8.5 D.9
4、某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是 抽样方法。
5、某单位的在岗工作为624人,为了调查工作上班时,从家到单位的路上平均所用的时间,决定抽取10%的工作调查这一情况,如何采用系统抽样的方法完成这一抽样?
五、教后反思:
第五课时 §1。3抽样方法(三)
——分层抽样
一、教学目标:1、知识与技能:(1)正确理解分层抽样的概念;(2)掌握分层抽样的一般步骤;(3)区分简单随机抽样、系统抽样和分层抽样,并选择适当正确的方法进行抽样。2、过程与方法:通过对现实生活中实际问题进行分层抽样,感知应用数学知识解决实际问题的方法。3、情感态度与价值观:通过对统计学知识的研究,感知数学知识中“估计与“精确”性的矛盾统一,培养学生的辩证唯物主义的世界观与价值观。
二、重点与难点:正确理解分层抽样的定义,灵活应用分层抽样抽取样本,并恰当的选择三种抽样方法解决现实生活中的抽样问题。
三、教学方法:观察、思考、交流、讨论、概括。
四、教学过程
(一)、创设情景
假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?
(二)、探究新知
1、分层抽样的定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。【说明】分层抽样又称类型抽样,应用分层抽样应遵循以下要求:(1)分层:将相似的个体归人一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。
2、分层抽样的步骤:(1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。(3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。
【说明】(1)分层需遵循不重复、不遗漏的原则。(2)抽取比例由每层个体占总体的比例确定。(3)各层抽样按简单随机抽样进行。
探究交流:(1)分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行 ( )。A、每层等可能抽样; B、每层不等可能抽样; C、所有层按同一抽样比等可能抽样
(2)如果采用分层抽样,从个体数为N的总体中抽取一个容量为n样本,那么每个个体被抽到的可能性为( )。 A. B. C. D.
点拨:(1)保证每个个体等可能入样是简单随机抽样、系统抽样、分层抽共同的特征,为了保证这一点,分层时用同一抽样比是必不可少的,故此选C。
(2)根据每个个体都等可能入样,所以其可能性本容量与总体容量比,故此题选C。
知识点2 简单随机抽样、系统抽样、分层抽样的比较
类 别 共同点 各自特点 联 系 适 用范 围
简 单随 机抽 样 (1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样 从总体中逐个抽取 总体个数较少
将总体均分成几部 分,按预先制定的规则在各部分抽取 在起始部分样时采用简随机抽样 总体个数较多
系 统抽 样
将总体分成几层,分层进行抽取 分层抽样时采用简单随机抽样或系统抽样 总体由差异明显的几部分组成
分 层抽 样
(三)、例选精析
例1、某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为( )。
A.15,5,25 B.15,15,15 C.10,5,30 D15,10,20
[分析]因为300:200:400=3:2:4,于是将45分成3:2:4的三部分。设三部分各抽取的个体数分别为3x,2x,4x,由3x+2x+4x=45,得x=5,故高一、高二、高三各年级抽取的人数分别为15,10,20,故选D。
例2、一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。[分析]采用分层抽样的方法。
解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:(1)将3万人分为5层,其中一个乡镇为一层。(2)按照样本容量的比例随机抽取各乡镇应抽取的样本。300×3/15=60(人),300×2/15=100(人),300×2/15=40(人),300×2/15=60(人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60 人。(3)将300人组到一起,即得到一个样本。
(四)、课堂练习P52 练习1. 2. 3
(五)、课堂小结:1、分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:(1)、分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。
2、分层抽样的优点是:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法。
(六)、作业:1、某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是 ( )
A.简单随机抽样 B.系统抽样 C.分层抽样 D.先从老人中剔除1人,然后再分层抽样
2、某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为 人,A型血应抽取的人数为 人,B型血应抽取的人数为 人,AB型血应抽取的人数为 人。
3、某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,每个学生被抽到的可能性均为0.2,若该校取一个容量为n的样本,则n= 。
4、对某单位1000名职工进行某项专门调查,调查的项目与职工任职年限有关,人事部门提供了如下资料:
任职年限 5年以下 5年至10年 10年以上
人数 300 500 200
试利用上述资料设计一个抽样比为1/10的抽样方法。
五、教后反思:
第六课时 §1。4统计图表
一、教学目标:1、使学生学会对所收集到的数据进行统计表示; 2、学会用多种方法来表示数据。
二、教学重难点:重点:数据的表示。难点:选择一种适当数据表示方法。
三、教学方法: 以启发学生自主动手为主。
四、教学过程
(一)、知识导向
本节课是中初步学会了收集数据、分类整理、填写简单的统计表和制作简单的统计图(条形统计图、折线统计图和扇形统计图)。另外,从统计图中提取信息的能力是需要训练的,教师应引导学生观察数据的变化发展趋势、注意变化发展的速度、留心那些在重复实验过程中发生频数为最小与最大的对象。对于各种表示方法,教师组织讨论时不必评判出哪一个最好,重要的是分析每一种方案的长处与不足,如果一些一些学生特别看中某一方案的长处而并怎么在意它它的短处,那么他们一定要坚持这一方案也是可以接受的。
统计图是统计学中一个非常重要的知识,能否画出一个准确的统计图对学生在实际中的应用是很重要的。
(二)、新课拆析
1、知识设疑:(引例)解放以来,我国的国内生活总值(GDP)一直呈递增趋势,1952年只有679亿元,1962年上升到1149.3亿元,1970年上升到2252.7亿元,1980年上升到4516.8亿元,1990年上升到18547.9亿元,2000年上升到89404亿元。
对于上例中,为了让这些数据更有次序,使得使用这些数据的人员能更方便去使用,我们要求:
(1)设计一张统计表,简明地表达这一段文字;(2)再设计一张折线统计图,直观地表明这种递增趋势;(3)从上述两张图表中,你能得出哪些结论?说说你的理由。
注意数据是不明显性,作为使用者难以明确数据间的关系。
2、知识形成:从上例中,我们可以作出:
统计表:
年份 1952 1962 1870 1980 1990 2000
国内生产总值(亿元 679 1149.3 2252.7 4517.8 18547.9 89404
折线图:
从上表与上图中,可以发现:
(1)国内生产总值总体上呈现增长的趋势;
(2)增长的趋势有快有慢。
应让学生从统计表中找到统计图的优点,发现统计图的对于数据统计的必要性。至于各种统计图都有其本身的特点与优点,哪一种更好,应依据不同情况的使用。对于数据表示中的“折线图”中两点之间的连线是没有意义的,画上连线只是为了便。
3、例题讲解:
在2000年第27年届悉尼奥林匹克运动会上,中国体育代表团取得了很好的成绩(如下表)
奥运奖牌榜(第27届)
代表队 金牌 银牌 铜牌 合计
美国 39 25 33 97
俄罗斯 32 28 28 88
中国 28 16 15 59
澳大利亚 16 25 17 58
德国 14 17 26 57
其他 172 略 略 略
(1)中国体育健儿在该届奥运会上共夺得多少枚奖牌?其获得的金牌数在总金牌数中占多大的比例?
(2)从所获奖牌总数情况看,和最近几届奥运会相比,中国体育健儿在本届奥运会上的成绩如何?
后面的例子,可引导各个学习小组去独立探讨常见的统计图的画法。
(引表) 中国奥运奖牌回眸
届数 金牌 银牌 铜牌 总计
第23届 15 8 9 32
第24届 5 11 12 28
第25届 16 22 16 54
第26届 16 22 12 50
第27届 28 16 15 59
思考:要比较客观地评价一个代表队在一届奥运会上的表现是很困难的,有人建议比较奖牌总数,有人建议比较金牌总数,有人建议比较金牌和银牌的总数等等,你比较赞同哪一个方案?
(三)、巩固练习:P195 自我阅读画统计图的资料
(四)、知识小结:本节课学习了用统计来直观来表示数据,并从统计图中发现数据间的联系。学会用计算机画出统计图。
(五)、作业:P196 1、2
(六)、每日预习:1、你能找到课本中错误统计图表中的错误吗?2、你能自己设计出一个小调查。
五、教后反思:
第七课时 §1.5数据的数字特征
一、教学背景分析:在义务教育阶段,学生已经通过实例,学均数、中位数、众数、极差、方差等,并能解决简单的实际问题。(由于义务教育阶段《大纲》中对统计部分的要求与《标准》的要求相差较大,若是承接现行《大纲》的话,建议先补充《标准》中第三学段相应部分的内容。)在这个基础上高中阶段还将进一步学习标准差,并在学习中不断地体会它们各自的特点,在具体的问题中根据情况有针对性地选择一些合适的数字特征。
二、教学目标:1、能结合具体情境理解不同数字特征的意义,并能根据问题的需要选择适当的数字特征来表达数据的信息,培养学生解决问题的能力。2、通过实例理解数据标准差的意义和作用,学会计算数据的标准差,提高学生的运算能力。
三、教学重、难点
教学重点:平均数、中位数、众数、极差、方差、标准差的计算、意义和作用。
教学难点:根据问题的需要选择适当的数字特征来表达数据的信息。
四、设计思路
1、教法构想:本节教学设计依据课程标准,在义务教育阶段的基础上,进一步掌握平均数、中位数、众数、极差、方差、标准差的计算、意义和作用。通过具体的实例,让学生理解数字特征的意义,并能选择适当的数字特征来表达数据的信息。
2、学法指导:学生自主探究,交流合作,教师归纳总结相结合。
五、教学实施
(一)、 导入新课
提出问题:小明开设了一个生产玩具的小工厂,管理人员由小明、他的弟弟和六个亲戚组成。工作人员由五个领工和十个工人组成。工厂经营的很顺利,需增加一个新工人,小亮需要一份工作,应征而来与小明交谈。小明说:“我们这里报酬不错,平均薪金是每周300元。你在学徒期每周75元,不过很快就可以加工资了。”小亮工作几天后找到小明说:“你欺骗了我,我已经找其他工人核对过了,没有一个人的工资超过每周100元,平均工资怎么可能是一周300元呢?”小名说:“小亮啊,不要激动,平均工资是300元,你看,这是一张工资表。”工资表如下:
人 员 小明 小明弟 亲戚 领工 工人
周工资 2400 1000 250 200 100
人 数 1 1 6 5 10
合 计 2400 1000 1500 1000 1000
这到底是怎么了?(学生思考交流)。教师点出课题:数据的数字特征
(二)、推进新课
Ⅰ、新知探究
提出问题:1、什么叫平均数?有什么意义?2、什么叫中位数?有什么意义?3、什么叫众数?有什么意义?4、什么叫极差?有什么意义?5、什么叫方差?有什么意义?6、什么叫标准差?有什么意义?
讨论结果:1、一组数据的和与这组数据的个数的商称为这组数据的平均数。数据的平均数为。平均数对数据有“取齐”的作用,代表该组数据的平均水平。
2、一组数据按从小到大的顺序排成一列,处于中间位置的数称为这组数据的中位数。一组数据的中位数是唯一的,反映了数据的集中趋势。
3、一组数据中出现次数最多的数称为这组数据的众数。一组数据中的众数可能不止一个,也可能没有,反映了数据的集中趋势。
4、一组数据的最大值与最小值的差称为这组数据的极差,表示该组数据之间的差异情况。
5、方差是样本数据到平均数的平均距离,一般用表示,通常用公式来计算。反映了数据的离散程度。方差越大,数据的离散程度越大。方差越小数据的离散程度越小。
6、标准差等于方差的正的平方根,即,与方差的作用相同,描述一组数据围绕平均数的波动程度的大小。
Ⅱ、应用示例
例1 某公司员工的月工资情况如表所示:
月工资/元 8000 5000 4000 2000 1000 800 700 600 500
员工/人 1 2 4 6 12 8 20 5 2
(1)、分别计算该公司员工月工资的平均数、中位数、和众数。
(2)、公司经理会选取上面哪个数来代表该公司员工的月工资情况?税务官呢?工会领导呢?
解:(1)经计算可以得出:该公司员工月工资的平均数为1373元,中位数为800元,众数为700元。(2)、公司经理为了显示本公司员工的收入高,采用平均数;而税务官希望取中位数,以便知道目前的所得税率对该公司的多数员工是否有利;工会领导则主张用众数,因为每月拿700元的员工最多。
点评:平均数是将所有的数据都考虑进去得到的度量,它是反映数据平均水平最常用的统计量;中位数将观测数据分成相同数目的两部分,其中一部分都比这个数小而另一部分都比这个数大,对于非对称的数据集,中位数更实际地描述了数据的中心;当变量是分类变量时,众数往往经常被使用。
变式训练:1、下表是某班40名学生参加“环保知识竞赛”的得分统计表:
分数 0 1 2 3 4 5
人数 4 7 10 x 8 y
请参照这个表解答下列问题:(1)用含x,y的式子表示该班参加“环保知识竞赛”的班平均分;(2)若该班这次竞赛的平均分为分,求的值。
解:(1);(2)依题意,有解得
例2 甲、乙两台机床同时生产直径是40mm的零件。为了检验产品质量,从两台机床生产的产品中各抽取10件进行测量,结果如下表所示
甲 40.0 39.8 40.1 40.2 39.9 40.0 40.2 39.8 40.2 39.8
乙 40.0 40.0 39.9 40.0 39.9 40.1 40.1 40.1 40.0 39.9
分别计算上面从甲、乙两台机床抽取的10件产品直径的标准差。
解:从数据容易得到甲、乙两台机床生产的这10件产品直径的平均值。
我们分别计算它们直径的标准差:
由上面的计算可以看出:甲、乙两台机床生产的产品直径的平均值相同,而甲机床生产的产品直径的标准差为0.161mm,比乙机床的标准差0.077mm大,说明乙机床生产的零件更标准些,即乙机床的生产过程更稳定一些。
点评:对数据数字特征内容的评价,应当更多地关注对其本身意义的理解和在新情境中的应用,而不是记忆和使用的熟练程度。
Ⅲ、知能训练
1、 下列说法正确的是(D )
A.甲、乙两班期末考试数学平均成绩相同,这表明这两个班数学学习情况一样。
B.期末考试数学成绩的方差甲班比乙班小,这表明甲班的数学学习情况比乙班好。
C.期末考试数学平均成绩甲、乙两班相同,方差甲班比乙班大,则数学学习甲班比乙班好。
D.期末考试数学平均成绩甲、乙两班相同,方差甲班比乙班小,则数学学习甲班比乙班好。
2、(2007海南高考,理11)甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:
甲的成绩:
环数 7 8 9 10
频数 5 5 5 5
乙的成绩:
环数 7 8 9 10
频数 6 4 4 6
丙的成绩:
环数 7 8 9 10
频数 4 6 6 4
分别表示甲、乙、丙三名射箭运动员这次测试成绩的标准差,则有(C)
A. B. C. D.
3、某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是 -3
Ⅳ、拓展提升
甲、乙两种玉米苗各抽10株,分别测得它们的株高如下(单位:cm)
甲 25 41 40 37 22 14 19 39 21 42
乙 27 16 44 27 44 16 40 40 16 40
问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?
解:(1), ,即乙种玉米的苗长得高。
(2)即甲种玉米的苗长得齐。
(三)、课堂小结: 本节课通过具体实例探讨和学均数、中位数、众数、极差、方差、标准差的计算、意义和作用,让学生体会所学内容与现实世界的密切联系。
(四)、作业: 课本30—31页 习题1—4 1、2。
六、设计体会(教后反思)
统计的学习,本质上是统计活动的学习,而不是概念和公式的学习。因此在本节教学设计中所采用的数据和问题情境尽可能来源于实际,充分挖掘学生生活中与数据有关的素材,使他们体会所学内容与现实世界的密切联系。另外,在教学活动中,还要特别加强小组活动的组织与教学,并在活动的过程中引导学生逐步体会统计的作用和基本思想。
第八课时 §1.6用样本的频率分布估计总体分布(一)
一、教学目标:1、知识与技能:(1) 通过实例体会分布的意义和作用。(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图。(3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。2、过程与方法:通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。3、情感态度与价值观:通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。
二、重点与难点:重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
难点:能通过样本的频率分布估计总体的分布。
三、教学方法:探究归纳,思考交流
四、教学设想
(一)、创设情境
在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50;乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?
如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板出课题)。
(二)、探究新知〖探究〗:P55
我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢 ?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)
为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等。因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况。(如课本P56)
分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式。
下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律。可以让我们更清楚的看到整个样本数据的频率分布情况。
1、频率分布的概念:频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:计算一组数据中最大值与最小值的差,即求极差(1)决定组距与组数;⑵将数据分组;⑶列频率分布表;⑷画频率分布直方图。
以课本P56制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图。(让学生自己动手作图)
频率分布直方图的特征:⑴从频率分布直方图可以清楚的看出数据分布的总体趋势。⑵从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
〖探究〗:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?(把学生分成两大组进行,分别作出两种组距的图,然后组织同学们对所作图不同的看法进行交流……)
接下来请同学们思考下面这个问题:〖思考〗:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,(见课本P57)你能对制定月用水量标准提出建议吗?(让学生仔细观察表和图)
2、频率分布折线图、总体密度曲线
(1).频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。
(2).总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。(见课本P60)
〖思考〗:1.对于任何一个总体,它的密度曲线是不是一定存在?为什么?2.对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?
实际上,尽管有些总体密度曲线是饿、客观存在的,但一般很难想函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确.
3、茎叶图
(1).茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本P61例子)
(2).茎叶图的特征:①用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。②茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。
(三)、例题精析:〖例1〗:下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)
(1)列出样本频率分布表;(2)一画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.。分析:根据样本频率分布表、频率分布直方图的一般步骤解题。
解:(1)样本频率分布表如下:
(2)其频率分布直方图如下:
(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.
〖例2〗:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.
(1) 第二小组的频率是多少?样本容量是多少?
(2) 若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
(3) 在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。
分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1。
解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:又因为频率=
所以
(2)由图可估计该学校高一学生的达标率约为
(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内。
(四)课堂精练:P61 练习 1. 2. 3
(五)、课堂小结:1、总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。2、总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。
(六)作业:1.P72 习题2.2 A组 1、 2
五、教后反思:
第九课时 §1.6用样本的数字特征估计总体的数字特征(二)
一、教学目标:
1、知识与技能:(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。(3)会用样本的基本数字特征估计总体的基本数字特征。(4)形成对数据处理过程进行初步评价的意识。
2、过程与方法:在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。
3、情感态度与价值观:会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系。
二、重点与难点
重点:用样本平均数和标准差估计总体的平均数与标准差。难点:能应用相关知识解决简单的实际问题。
三、教学方法:探究归纳,思考交流
四、教学过程
(一)、创设情境
在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下:甲运动员:7,8,6,8,6,5,8,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。——用样本的数字特征估计总体的数字特征(板出课题)。
(二)、探究新知
<一>、众数、中位数、平均数
〖探究〗:P62(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?
(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)
初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息。例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见课本第62页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少。
〖提问〗:请大家翻回到课本第56页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)
分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差。
〖提问〗:那么如何从频率分布直方图中估计中位数呢?
分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数。因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等。由此可以估计出中位数的值为2.02。(图略见课本63页图2.2-6)
〖思考〗:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)
(课本63页图2.2-6)显示,大部分居民的月均用水量在中部(2.02t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的。
〖思考〗:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)
<二>、标准差、方差
1.标准差
平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断。某地区的统计显示,该地区的中学生的平均身高为176㎝,给我们的印象是该地区的中学生生长发育好,身高较高。但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质。因此,只有平均数难以概括样本数据的实际状态。
例如,在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?
我们知道,。两个人射击的平均成绩是一样的。那么,是否两个人就没有水平差距呢?(观察P66图2.2-8)直观上看,还是有差异的。很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据。
考察样本数据的分散程度的大小,最常用的统计量是标准差。标准差是样本数据到平均数的一种平均距离,一般用s表示。
样本数据的标准差的算法:⑴算出样本数据的平均数。⑵、算出每个样本数据与样本数据平均数的差:⑶算出(2)中的平方。⑷、算出(3)中n个平方数的平均数,即为样本方差。⑸、算出(4)中平均数的算术平方根,,即为样本标准差。
其计算公式为:
显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小。
〖提问〗:标准差的取值范围是什么?标准差为0的样本数据有什么特点?
从标准差的定义和计算公式都可以得出:。当时,意味着所有的样本数据都等于样本平均数。
(在课堂上,如果条件允许的话,可以给学生简单的介绍一下利用计算机来计算标准差的方法。)
2.方差:从数学的角度考虑,人们有时用标准差的平方(即方差)来代替标准差,作为测量样本数据分散程度的工具:
在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差。
(三)、例题精析
〖例1〗:画出下列四组样本数据的直方图,说明他们的异同点。
(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6
(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8
分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差。
解:(图略,可查阅课本P68)
四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83。
他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的。
〖例2〗:(见课本P69)
分析: 比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值。
(四)、课堂精练:P71 练习 1. 2. 3 4
(五)、课堂小结:1、用样本的数字特征估计总体的数字特征分两类:①用样本平均数估计总体平均数。②用样本标准差估计总体标准差。样本容量越大,估计就越精确。2、平均数对数据有“取齐”的作用,代表一组数据的平均水平。3、标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度。
(六)、作业:1.P72 习题2.2 A组 3、 4、10
五、教后反思:
第十课时 §1.7统计活动:结婚年龄的变化
一、教学目标
1.让学生经历“收集数据―整理数据―分析数据―作出推断”的统计活动,体验统计活动的全过程.
2.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析,为合理的决策提供一些依据;认识统计的作用,体会统计思维与确定性思维的差异.
3.形成对数据处理过程进行初步评价的意识.
二、教学重难点:统计活动的过程
三、教学过程
(一)、问题提出:
(二)、动手实践 P49
我们可以按照如下的步骤来进行这个统计活动.
1.确定调查对象
全班同学的父母辈和祖父母辈. 调查目的:随着年代推移结婚年龄如何变化.
2.收集数据
每位同学收集自己父母辈和祖父母辈的初次结婚年龄(例如,调查自己的父亲、母亲、祖父、祖母的初婚年龄),按照以下方式记录下来(如下表).
父 辈 母 辈 祖父辈 祖母辈
初次结婚年龄/岁
收集数据方法:问卷调查法.
3.整理数据
数据处理方法:利用计算机处理数据.
(1)先将本小组成员收集到的数据按下表汇总.
第_____小组
初次结婚年龄/岁成 员21世纪教育网 父 辈 母 辈 祖父辈 祖母辈
小组成员1
小组成员2
小组成员n
(2)再把班上所有同学的数据按照小组进行汇总,得到下表.
初次结婚年龄/岁成 员 父 辈 母 辈 祖父辈 祖母辈
第1小组21世纪教育网 [来源:21世纪教育网] 21世纪教育网[来源:21世纪教育网]
第2小组
第m小组
4.分析数据
(1)将上面的数据用折线图、频率直方图分别表示出来.同学们之间可进行交流、讨论,确定出比较合适的统计图.
(2)分别估计父辈、母辈、祖父辈、祖母辈的初次结婚年龄的平均数与标准差,并进行比较,以利于数据的分析. 根据前面学过的知识,求平均数与标准差.
(三)、练习: P50,为下一课时分析数据做准备,要求每一位学生调查对象的初婚年龄不要集中在某一年,最好是最近5年内的每一年都有.
(四)、思考交流 P50,在上一课时活动的基础上,以问题的形式总结统计活动的基本步骤.教师可以鼓励学生先回顾上一课时统计活动的过程,并结合该活动尽可能地用自己的方式来回答,在此基础上让他们充分交流,并引导学生共同得出结论.
(五)、动手实践 P51
通过上一课时的统计活动,我们已经得出了结论:随着时代的发展,人们初次结婚的年龄确实是在增大.但是这个结论是通过调查父母辈和祖父母辈初次结婚的年龄得到的,它反映的只是较长一个时间段,人们初婚年龄的变化趋势.
请根据你们全班同学课前收集的数据,分析在最近的5年内,人们初次结婚的年龄是否随着时代的发展面逐渐增长 你可以上网上查阅与此相关的信息和统计数据。
(六)、课堂小结:统计活动的全过程:
说明:1.收集数据的方法:统计调查法;2.整数数据的方法:表格法;3.描述数据的方法:统计图法。
(七)作业:习题1―7 P52
这里关键是要让学生理解:从调查的问题出发,如何确定调查对象、如何收集数据、如何利用数据帮助作出决策.
四、教学反思:
第十一课时 §1.8相关关系
一、 教学目标:1. 通过收集现实问题中两个变量的数据作出散点图,利用散点图直观认识变量间的相关关系.2. 经历用不同的估算方法来描述两个变量线性相关的过程.
二、重难点:利用散点图直观认识两个变量之间的线性相关关系
三、教学方法:动手操作,师生合作交流
四、教学过程
(一)、创设情境 导入新课
1、相关关系的理解
师:我们曾经研究过两个变量之间的函数关系:一个自变量对应着唯一的一个函数值,这两者之间是一种确定关系。生活中的任何两个变量之间是不是只有确定关系呢? 让学生举例,教师总结 如:
生:不是。师:能否举出反例? 比如,年龄与身高。 生:身高与体重
生:教师水平与学生成绩。生:网速与下载文件所需时间
师:不妨以教师水平与学生成绩为例,学生成绩与教师水平有关吗?
生:有,一般来说,教师水平越高,学生成绩越好
师:即“名师出高徒”,名师一定出高徒吗? 生:不一定。
师:即学生成绩与教师水平之间存在着某种联系,但又不是必然联系,对于学生成绩与教师水平之间的这种不确定关系,我们称之为相关关系。这就是我们这节课要共同探讨的内容 变量间的相关关系。(板书)
生活中还有很多描述相关关系的成语,如:“虎父无犬子”,“瑞雪兆丰年”
【设计意图:通过学生熟悉的函数关系,引导学生关注生活中两个变量之间还存在的相关关系。让学生体会研究变量之间相关关系的重要性。感受数学来源于生活。】
(二)、初步探索,直观感知
1、根据样本数据利用电子表格作出散点图,直观感知变量之间的相关关系
师:在研究相关关系前,同学们先回忆一下:函数的表示方法有哪些?
生:列表,画图象,求解析式。
师:下面我们就用这些方法来研究相关关系。请同学们看这样一组数据:
探究: 在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据: 根据上述数据,人体的脂肪含量与年龄之间有怎样的关系?
年龄 23 27 39 41 45 49 50 53 54 56 57 58 60 61
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2 29.6 30.2 31.4 30.8 33.5 35.2 34.6
生:随着年龄增长,脂肪含量在增加 师:有没有更直观的方式?生:画图
师生:用x轴表示年龄,y轴表示脂肪。一组样本数据就对应着一个点。由于数据比较多,我们借用电子表格来作图,请大家注意观察。
教师演示作图方法,学生观察
年龄 脂肪
23 9.5
27 17.8
39 21.2
41 25.9
45 27.5
49 26.3
50 28.2
53 29.6
54 30.2
56 31.4
57 30.8
58 33.5
60 35.2
61 34.6
师:这个图跟我们所学过的函数图象有区别,它叫作散点图。
2、判断正、负相关、线性相关 学生观察,比较,讨论。
师:请同学们观察这4幅图,看有什么特点?
生:图1呈上升趋势,图2呈下降趋势。
师生:这就像函数中的增函数和减函数。即一个变量从小到大,另一个变量也从小到大,或从大到小。对于图1中的两个变量的相关关系,我们称它为正相关。图2中的两个变量的相关关系,称为负相关。师:我们还可以判断出:年龄与身高是正相关,网速与下载文件所需时间是负相关。
生:后面两个图很乱,前面两个图中点的分布呈条状。
师:从数学的角度来解释:即图1、2中的点的分布从整体上看大致在一条直线附近。我们称图1、2中的两个变量具有线性相关关系。这条直线叫做回归直线。图3、4中的两个变量是非线性相关关系
师:这节课我们重点研究线性相关关系。(板书)
设计意图 :数形结合,扫清了学生的思维障碍,体现数学的简约美。
(三)、循序渐进、延伸拓展
1、找回归直线
师:下面我们再来看一下年龄与脂肪的散点图,从整体上看,它们是线性相关的。
如果可以求出回归直线的方程,我们就可以清楚地了解年龄与体内脂肪含量的相关性。这条直线可以作为两个变量具有线性相关关系的代表。同学们能否画出这条直线?请完成数学实验1、画出回归直线。(学生在计算机上用电子表格画回归直线)
数学实验1: 画出回归直线
教师展示学生画图情况,学生说明理由
学生方案一 学生方案二
学生方案三
生总结: 第二种方法好,因为所有的点离这条直线最近。
师:即,从整体上看,各点与此直线的距离和最小。
(四)、例题探析
例1: 在下列两个变量的关系中,哪些是相关关系?
①正方形边长与面积之间的关系;②作文水平与课外阅读量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系. 【 答案:②③④】
例2、 以下是某地搜集到的新房屋的销售价格和房屋的面积的数据:
房屋面积(平方米) 61 70 115 110 80 135 105
销售价格(万元) 12.2 15.3 24.8 21.6 18.4 29.2 22
画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关。
(五)、小结与作业
1.对于两个变量之间的关系,有函数关系和相关关系两种,其中函数关系是一种确定性关系,相关关系是一种非确定性关系.
2.散点图能直观反映两个相关变量之间的大致变化趋势,利用计算机作散点图是简单可行的办法.
3.一般情况下两个变量之间的相关关系成正相关或负相关,类似于函数的单调性.
作业:P85练习:1,2 . 第84页,习题2-3A第1(1)、2(1)题,
五、教后反思:
第十二课时 §1.9最小二乘法
一、教学目标:经历用不同估算方法描述两个变量线性相关的过程。知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
二、教学重难点:重点:了解最小二乘法的思想并利用此思想借助电子表格求出回归方程。
教学内容的难点:对最小二乘法的数学思想和回归方程的理解
教学实施过程中的难点:根据给出的线性回归方程的系数公式建立线性回归方程。
三、教学方法:动手操作,合作交流。
四、教学过程:
(一)、利用最小二乘法推导回归系数公式。
回顾上节课:师:我们现在来求距离和。怎么求?
生:利用点到直线的距离公式
师生共同:只要求出使距离和最小的、b即可。但是,我们知道点到直线的距离公式计算复杂。怎么办呢?以样本数据点A为例, 可以看出:
在△ABC中,(教师动画演示)
按照一对一的关系,直角边AC越小,斜边AB越小,
当AC无限小时,AB跟AC可近似看作相等。
求麻烦,不妨求生: 师:它表示自变量x取值一定时,纵坐标的偏差。假设我们已经得到两个具有线性相关关系的变量的一组数据:……。当自变量取(=1,2,……,n)时,可以得到(=1,2,……,n),它与实际收集到的之间的偏差是
(=1,2,……,n)
这样用n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。总的偏差为,偏差有正有负,易抵消,所以采用绝对值,由于带绝对值计算不方便所以换成平方,现在的问题就归结为:当,b取什么值时Q最小。
将上式展开、再合并,就可以得到可以求出Q取最小值时
(其中,)推导过程用到偏差的平方,由于平方又叫二乘方,所以这种使“偏差的和”最小的方法叫“最小二乘法”。
设计意图:培养学生的动手操作能力,最小二乘法的思想是本节课的教学难点,先让学生动手操作画回归直线,教师动画演示,进一步演绎推理来分解难点、突破难点
(二)、直线回归方程的应用
(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系
(2)利用回归方程进行预测;把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计,即可得到个体Y值的容许区间。
(3)利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控制的目标。如已经得到了空气中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度。
应用直线回归的注意事项:(1)做回归分析要有实际意义;(2)回归分析前,最好先作出散点图;(3)回归直线不要外延。
(四)、实例分析:
某调查者从调查中获知某公司近年来科研费用支出()与公司所获得利润()的统计资料如下表:
科研费用支出()与利润()统计表 单位:万元
年份 科研费用支出 利润
199819992000200120022003 5114532 314030342520
合计 30 180
要求估计利润()对科研费用支出()的线性回归模型。
解:设线性回归模型直线方程为:因为: 根据资料列表计算如下表:
年份
199819992000200120022003 5114532 314030342520 1554401201707540 25121162594 06-10-2-3 11004-5-10 0361049 060001030
合计 30 180 1000 200 0 0 50 100
现利用公式(Ⅰ)、(Ⅱ)、(Ⅲ)求解参数的估计值:
所以:利润()对科研费用支出()的线性回归模型直线方程为:
求直线回归方程,相关系数和作图,这些EXCEL可以方便地做到。仍以上题的数据为例。于 EXCEL表 中的空白区,选用"插入"菜单命令中的"图表",选中 XY散 点图类型,在弹出的图表向导中按向导的要求一步一步地 操作,如有错误可以返回去重来或在以后修改。适当修饰 图的大小、纵横比例、字体大小、和图符的大小等,使图 美观,最后得到图1,图中有直线称为趋势线,还有直线方程和相关系数。图中的每一个部份如坐标、标题、图例 等都可以分别修饰,这里主要介绍趋势线和直线方程。
图1散点图
鼠标右键点击图中的数据点,出现一个对话框,选 " 添加趋势线" ,图中自动画上一条直线,再以鼠标右击此线,出现趋势线格式对话框,选择线条的粗细和颜色,在选项中选取显示公式和显示R 平方值,确定后即在图中显示回归方程和相关系数。
(五)、课堂练习:第83页,练习A,练习B
(六)、小结:经历用不同估算方法描述两个变量线性相关的过程。知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
(七)、课后作业:第84页,习题2-3A第1、2题,
五、教后反思:
第十三课时必修3第一章统计复习与小结
一、教学目标: 1通过小结与复习,梳理本章知识内容,强化知识间的内在联系,提高综合运用知识解决问题的能力. 2.通过例题的讲解、讨论和进一步的训练,提高学生灵活运用本章知识解决问题的能力
二、教学重点:统计知识的梳理和知识之间的内在联系;教学难点:用知识解决实际问题
三、教学方法:探析归纳,讲练结合
四、教学过程
(一)知识点归纳与例题分类探析
1、抽样方法:(1)简单随机抽样(2)系统抽样(3)分层抽样
2、样本分布估计总体分:(1)扇形图; (2)条形图;(3)折线图;(4)茎叶图;(5)频率分布表;(6)直方图; (7)散点图。
3、样本特征数估计总体特征数 :(1)平均数 (2)方差 (3)众数 (4)中位数
4、线性回归方程。
5、总体、个体、样本、样本容量
总体:在统计中,所有考察对象的全体。个体:总体中的每一个考察对象。样本:从总体中抽取的一部分个体叫做这个总体的一个样本。样本容量:样本中个体的数目。
6、统计的基本思想是:用样本的某个量去估计总体的某个量。
7、总体中每个个体被抽取的机会相等。(1)简单随机抽样 (抽签法、随机数法)(2)系统抽样(3)分层抽样
(1)、抽签法步骤①先将总体中的所有个体(共有N个) 编号(号码可从0到N-1)。②把号码写在形状、大小相同的号签上,号签可用小球、卡片、纸条等制作。③将这些号签放在同一个容器中,搅拌均匀。④抽签时,每次从中抽出一个号签,连续抽取n次。⑤抽出样本。
(2)、随机数表法步骤①将总体中的个体编号(编号时位数要一样);②选定开始的数字;③按照一定的规则读取号码;④取出样本
(3).系统抽样步骤:① 编号,随机剔除多余个体,重新编号;② 分段 (段数等于样本容量)样本距 k=N/n;③ 抽取第一个个体编号为i (i<=k)④依预定的规则抽取余下的 个体编号为i+k, i+2k, …。
(4).分层抽样步骤:① 将总体按一定标准分层;② 计算各层的个体数与总体的个体数的比;抽样比k=n/N;③ 按比例确定各层应抽取的样本数目;④ 在每一层进行抽样(可用简单随机抽样或系统抽样)。
例1、某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。
[分析]按1:5分段,每段5人,共分59段,每段 抽取一人,关键是确定第1段的编号。
解:按照1:5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,59组是编号为291~295的5名学生。采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k≤5),那么抽取的学生编号为k+5L(L=0,1,2,……,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,……,288,293。
例2、一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。
解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:(1)将3万人分为5层,其中一个乡镇为一层。
(2)按照样本容量的比例随机抽取各乡镇应抽取的样本。
300×(3/15)=60(人),300×(2/15)=40(人),300×(5/15)=100(人) ,300×(2/15)=40(人),300×(3/15)=60(人), 因此各乡镇抽取人数分别为60人、40人、100人、40人、60 人。
(3)将300人组到一起,即得到一个样本。
类别 抽样方式 使用范围 共同点 相互联系
简单随机抽样 从总体中逐个抽取 总体中个体数较少时 抽样过程中每个个体被抽取的可能性相同
系统抽样 分段按规则抽取 总体中个体数较多时 在第一段中采用简单随机抽样
分层抽样 分层按各层比例抽取 总体中个体差异明显时 各层中抽样时采用前两种方式
分析样本,估计总体
几个公式
分析样本的分布情况可用样本的频率分布表、样本的频率分布直方图、样本的茎叶图。
频率分布:是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。
频率分布直方图的特征:(1)从频率分布直方图可以清楚的看出数据分布的总体趋势。(2)从频率分布直方图得不出原始的数据内容,每个小矩形的面积等于此项的概率,所有面积和为1.
做样本频率分布直方图的步骤:
(1)决定组距与组数; (组数=极差/组距);(2)将数据分组;(3)列频率分布表(分组,频数,频率);(4)画频率分布直方图。
做频率分布直方图的方法:把横轴分成若干段,每一线段对应一个组的组距,然后以此线段为底作一矩形,它的高等于该组的频率/组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率,这些矩形就构成了频率分布直方图。
例3、下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)
(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比。
分析:根据样本频率分布表、频率分布直方图的一般步骤解题。
解:(1)样本频率分布表如下:
(2)其频率分布直方图如下
(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19, 所以我们估计身高小于134cm的人数占总人数的19%.
茎叶图:1.茎叶图的概念:用中间的数字表示十位数,两边的数字表示个位数,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。
2.茎叶图的特征: (1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加。(2)茎叶图只便于表示量比较少的数据,而且茎叶图只方便记录两组的数据。注意:相同的得分要重复记录,不能遗漏。
变量间的相互关系:1、相关关系(1)概念:两个变量之间是不确定的随机关系,但两个变量之间又有关系,称为相关关系。(2)相关关系与函数关系的异同点。相同点:两者均是指两个变量间的关系。不同点:函数关系是一种确定关系,是一种因果系;相关关系是一种非确定的关系,也不一定是因果关系(但可能是伴随关系)。(3)相关关系的分析方向。在收集大量数据的基础上,利用统计分析,发现规律,对它们的关系作出判断。
2、回归直线方程(1)回归直线:观察散点图的特征,如果各点大致分布在一条直线的附近,就称两个变量之间具有线性相关的关系,这条直线叫做回归直线。(2)最小二乘法求线性回归方程的步骤:1.列表、计算 2.代入公式求a,b。3.写出直线方程。(3)利用回归直线对总体进行估计
(二)、练习:
1、某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取1个容量为100户的样本,记做①;某学校高一年级有12名女排运动员,要从中选出3个调查学习负担情况,记做②.那么完成上述2项调查应采用的抽样方法是( ) 答案B
(A)①用简单随机抽样法,②用系统抽样法 (B)①用分层抽样法,②用简单随机抽样法
(C)①用系统抽样法,②用分层抽样法 (D)①用分层抽样法,②用系统抽样法
2、某公司生产三种型号的轿车,产量分别为1200辆,6000辆和2000辆.为检验该公司的产品质量,现用分层抽样的方法抽取46辆舒畅行检验,这三种型号的轿车依次应抽取___辆.答案:6、 30 、 10
3.从甲、乙两班分别任意抽出10名学生进行英语口语测验,其测验成绩的方差分别为S12= 13.2,S22=26.26,则( ).A.甲班10名学生的成绩比乙班10名学生的成绩整齐
B.乙班10名学生的成绩比甲班10名学生的成绩整齐C.甲、乙两班10名学生的成绩一样整齐
D.不能比较甲、乙两班10名学生成绩的整齐程度
4.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则有( ).答案:D
A.a>b>c B.b>c>a C.c>a>b D.c>b>a
5. 如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:
(1)79.5---89.5这一组的频数、频率分别是多少?
(2)估计这次环保知识竞赛的及格率(60分及以上为及格)
解:(1)频率为:0.025×10=0.25, 频数为:60×0.25=15
(2)0.015×10+0.025×10+0.03×10+0.005×10=0.75
(三)、小结 :统计.这一部分内容,可以看成是初中“统计初步”和高中必修课“概率”这两章内容的深入和扩展,它属于统计的基础知识,从总的方面来看,研究了两个基本问题:一是如何从总体中抽取样本;二是如何对抽取的样本进行计算与分析,并据此对总体的相应情况作出判断.要领会思想方法的实质,这样才能达到事半功倍的效果
(四)、课后作业:复习题一A组7、8 B组3、5
五、教学反思:
122
126
130
134
138
142
146
150
158
154
身高(cm)
o
0.01
0.02
0.03
0.04
0.05
0.06
0.07
频率/组距
90
100
110
120
130
140
150
次数
o
0.004
0.008
0.012
0.016
0.020
0.024
0.028
频率/组距
0.032
0.036
0
10
20
30
40
50
60
70
80
90
100
40
50
60
70
80
90
110
0
0.2
0.4
0.6
0.8
1
1.2
-0.2
0
0.2
0.4
0.6
0.8
1
1.2
样本数据:
平均数:
标准差:
122
126
130
134
138
142
146
150
158
154
身高(cm)
o
0.01
0.02
0.03
0.04
0.05
0.06
0.07
频率/组距
21世纪教育网 -- 中国最大型、最专业的中小学教育资源门户网站。 版权所有@21世纪教育网