课件21张PPT。第二章 统计 2.1随机抽样 2.1.1简单随机抽样 例如,为了了解一批计算器的使用寿命,我们能将它们逐一测试吗?很明显,这既不可能,也没必要,实践中,由于所考察的总体中的个体数往往很多,而且许多考察带有破坏性,因此,我们通常只考察总体中的一个样本,通过样本来了解总体的情况,于是,如何设计抽样方法,使从总体中抽取的样本能够真正代表总体,是我们需要研究的课题. 那么,
(1)怎样从总体中抽取样本呢?
(2)如何表示样本数据呢?
(3)如何从样本数据中提取基本信息
(样本分布、样本数字特征等),来
推断总体的情况呢?
简 单 随 机 抽 样这些正是本章要研究解决的问题。统计学:统计的基本思想: 用样本估计总体,即当总体容量很大或检测过程具有一定的破坏性时,通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况。 是研究如何搜集、整理、归纳和分析数据的学科,它可以为人们制定决策提供依据。 简 单 随 机 抽 样回顾(初中知识):总体、个体、样本、样本容量
的概念.总体:所要考察对象的全体。 个体:总体中的每一个考察对象。 样本:从总体中抽取的一部分个体叫做这个总
体的一个样本。 样本容量:样本中个体的数目。 简 单 随 机 抽 样 在高考阅卷过程中,为了统计每一道试题的得分情况,如平均得分、得分分布情况等,如果将所有考生的每题的得分情况都统计出来,再进行计算,结果是非常准确的,但也是十分烦琐的,那么如何了解各题的得分情况呢? 通常,在考生有这么多的情况下,我们只从中抽取部分考生 (比如说1000名) ,统计他们的得分情况,用他们的得分情况去估计所有考生的得分情况。联
系
生
活样本 总体估计思 考:样本一定能准确地反应总体吗? 简 单 随 机 抽 样 在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意测验,调查兰顿 和罗斯福中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(在1936年电话和汽车只有少数富人拥有),通过分析收回的调查表,显示兰顿非常受欢迎。于是此杂志预测兰顿将在选举中获胜。 实际选举结果正好相反,最后罗斯福在选举中获
胜。其数据如下: 简 单 随 机 抽 样思 考问题:
如何科学地抽取样本?
使得样本能比较准确地反映总体搅拌均匀
使得每个个体被抽取的机会均等
合理、公平 简 单 随 机 抽 样 现从我校高一(2)班40名同学中选取10名参加全市文艺汇演,为保证选取的公平性,你打算如何操作?抽签决定实 例 一 简 单 随 机 抽 样开始抽签法40名同学从1到40编号制作编号为1到40的号签(共40个)将40个号签搅拌均匀随机从中逐一抽出10个号签与所抽取号码一致的学生即被选中结束 简 单 随 机 抽 样抽签法的一般步骤:(1)将总体中的N个个体编号;(2)将这N个号码写在形状、 大小相 同的号签上;(3)将号签放在同一箱中,并搅拌均匀;(4)从箱中每次抽出1个号签,连续抽出n次;(5)将总体中与抽到的号签编号一致的n个个体取出。(总体个数N,样本容量n) 简 单 随 机 抽 样简单随机抽样的概念 设一个总体含有N个个体 ,从中逐个不放回地抽取n个个体作为样本 (n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,这种抽样方法叫做简单随机抽样。抽签法(抓阄法)—— 是一种常见的简单随机抽样方法注意以下四点: (1)它要求被抽取样本的总体的个体数有限; (2)它是从总体中逐个进行抽取; (3)它是一种不放回抽样;(4)它是一种等概率抽样 (每个个体入样的概率 n/N)。 简 单 随 机 抽 样C 简 单 随 机 抽 样及时检测一:
下列抽取样本的方式是属于简单随机抽样的是( )
①从无限多个个体中抽取100个个体作样本;
②盒子里有80个零件,从中选出5个零件进行质量检验,
在抽样操作时,从中任意拿出一个零件进行质量检验
后,再把它放回盒子里;
③从8台电脑中不放回的随机抽取2台进行质量检验
(假设8台电脑已编好号,对编号随机抽取)
A.① B.② C.③ D.以上都不对 用抽签法抽取样本时,编号的过程有时可以省
略(如果已有编号),但制签的过程就难以省去了,
而且制签也比较麻烦,有简化制签的方法吗? 简化制签过程的一个有效方法就是制作一个表
,其中的每个数都是用随机方法产生的,这样的表
称为随机数表,于是,我们只需要按一定的规则到
随机数表中选取号码就可以了,这种抽样方法叫做
随机数表法 简 单 随 机 抽 样及时检测二:
要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,若用抽签法抽取,请写出其过程。随机数表法随机数表: 制作一个表(由数字0,1,2,...,9组成),表中各个位置上的数都是随机产生的(随机数)即每个数字在表中各个位置上出现的机会都是一样。 简 单 随 机 抽 样随机数表教材103页 简 单 随 机 抽 样范例:
要考察某公司生产的500克袋装牛奶的质量
是否达标,现从800袋牛奶中抽取60袋进行检验,
用随机数表法抽取的过程如下 简 单 随 机 抽 样第一步,先将800袋牛奶编号,可以编为000,001,…,799第二步,在随机数表中任选一个数,例如选出第8行第7
列的数7.(为了便于说明,下面摘取了附表1的第6行至第10行)第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个 三位数 785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉,按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本. 简 单 随 机 抽 样 随机数表法随机数表: 表由数字0,1,2,...,9组成,表中各个位置上的数都是随机产生的(随机数)即每个数字在表中各个位置上出现的机会都是一样。第一步、先将总体中的所有个体(共有N个)编号,
第二步、然后在随机数表内任选一个数作为开始,
第三步、再从选定的起始数,沿任意方向取数(不在
号码范围内的数、重复出现的数必须去掉),第四步、最后根据所得号码抽取总体中相应的个体,
得到总体的一个样本.步 骤:编号、选数(起始数)、取数、抽取. 简 单 随 机 抽 样 P57 练习 第2题课堂练习 简 单 随 机 抽 样抽签法 2.最常用的简单随机抽样随机数表法 一般地, 设一个总体含有N个个体 ,从中逐个不放回地抽取n个个体作为样本 (n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,这种抽样方法叫做简单随机抽样。课堂小结1.简单随机抽样的概念 简 单 随 机 抽 样课件14张PPT。2.1.2 系统抽样随机抽样(二)抽签法 2.简单随机抽样的方法:随机数法复习回顾1.简单随机抽样的概念特点是:有限性,逐个性,不回性,等率性 一般地,设一个总体的个体数为N,如果通过逐个不放回抽取的方法从中抽取n个个体作为样本,且每个体被抽到的概率相等,就称这样的抽样方法为简单随机抽样。思考 为了对某市13000名高一学生数学期末考试答卷进行分析,拟从中抽取130名学生的答卷作为样本,请你设计一个合理的抽取方案。抽签法13000试卷从1到13000编号制作1到13000个号签将13000个号签搅拌均匀随机从中抽出130个签取出对应号码的试卷编号制签搅匀抽签取出个体教材103页随机数表法为了对某市13000名高一学生数学期末考试答卷进行分析,拟从中抽取130名学生的答卷作为样本,请你设计一个合理的抽取方案。(2)由于总体数与样本容量比为 =100,将总体平均分成130部分,每一部分含100个个体. (4)从该号码起,每隔100个号码取一个号码,就得到一个
容量为130的样本. (如6,106,206,…,12906)(3)在第1部分中用简单随机抽样抽取一个号码(如6号).(1)将13000名高一学生数学期末考试答卷编号为1,2,3,…, 13000.系统抽样13004我来做:也称为:等距抽样为了对某市13004名高一学生数学期末考试答卷进行分析,拟从中抽取130名学生的答卷作为样本,请你设计一个合理的抽取方案。(3)由于总体数与样本容量比为 =100,将总体平均分成130部分,每一部分含100个个体. (5)从该号码起,每隔100个号码取一个号码,就得到一个
容量为130的样本.(如k,100+k,200+k,…,12900+k)(4)在第1部分中用简单随机抽样抽取一个号码(如k号).(2)将余下的13000名高一学生数学期末考试答卷重新编号
为1,2,3,…, 13000.系统抽样下页(1)先从13004份答卷中,用简单随机抽样抽取4份,
将其剔除。系统抽样的步骤:(1)先将总体的N个个体编号。(2)确定分段间隔k,当N/n(n是样本容 量)是整数时,取k= N/n;(3)在第1段用简单随机抽样确定第一个个体编号m(m≤k)(4)按照一定的规则抽取样本。通常是将m加上间隔k得到第二个个体编号(m+k),再加k得到第3个个体编号,依次进行下去,直到获得整个样本。有时可直接利用个体自身所带的号码,如学号、考号、门牌号思考:当N/n不是整数时,如何进行系统抽样?当N/n不是整数时,令k=[N/n],那先从总体中用简单随机抽样的方法剔除N-nk个个体,再将其余的进行编号并均分成n段(可知每段间隔数为K)。注:[x] 称为取整函数,表示不超过x 的最大整数。 课堂练习1、为了了解1200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段间隔k为( )A、40B、30C、20D、122、下列抽样试验中,最适宜系统抽样的是( )A、从某厂生产的2000个电子元件中随机抽取5个入样B、从某厂生产的2000个电子元件中随机抽取200个入样C、从某厂生产的20个电子元件中随机抽取5个入样AB3:为了了解一次知识竞赛的1252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目是( )A、2 B、4 C、52 D、252A4、工厂生产的产品,用传送带将成品送入包装车间之
前,检查人员从传送带上每隔5分钟抽一件产品检
查,这种抽样方法为 系统抽样系统抽样的特点(1)适用于总体容量较大的情况;(2)剔除多余个体及第一段抽样都用简单随机抽样,
因而与简单随机抽样有密切联系;(3)是等可能抽样,每个个体被抽到的可能性都是n/N;(4)是不放回的抽样。系统抽样(等距抽样)的概念 将总体分成均衡的几部分,然后按照预先定出的
规则,从每一个部分抽取一个个体,得到所需样本的
抽样方法叫做系统抽样。知识归纳合理选择抽样方法表法总体容量样本容量较大较大很大较大下页练习:要从1002个学生中选取一个容量为20的样本,试用系统抽样的方法给出抽样过程。课件25张PPT。2.1.3
分层抽样复习回顾 已经学过的两种抽样方法?◆简单随机抽样:①抽签法; ②随机数表法;适用范围:总体中个体较少。◆系统抽样:适用范围:总体中个体较多。{{问题情景:思考:(2)如果在2500名学生中随机抽取100名学生,有无不足之处?(1)总体、个体、样本、样本容量分别是什么?
某校小学六年级、初中三年级和高中三年级分别有1000,800和700名同学,为了了解全校毕业班学生的视力情况,从以上三个年级中抽取容量为100的样本,你认为应当怎样抽取样本较为合理? 问题情景:思考:(4)三个年级同学有较大差别,应如何提高样本的代表性? 应考虑他们在样本中所占的比例。(5)如何确定各年级所要抽取的人数? 计算每一部分占总体个体数的比例,在各年级中按比例分配样本,得各年级所要抽取的个体数。
某校小学六年级、初中三年级和高中三年级分别有1000,800和700名同学,为了了解全校毕业班学生的视力情况,从以上三个年级中抽取容量为100的样本,你认为应当怎样抽取样本较为合理? 问题情景:然后分别在各年级(层)运用系统抽样方法抽取.解:
某校小学六年级、初中三年级和高中三年级分别有1000,800和700名同学,为了了解全校毕业班学生的视力情况,从以上三个年级中抽取容量为100的样本,你认为应当怎样抽取样本较为合理? 新课讲解:一、分层抽样的定义 一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法称为分层抽样。(1) 当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法. (2)每个个体被抽中的可能性相同(3)每一层抽取的数=该层个体数×要点分析:样本容量×分层抽样的具体步骤是什么? 步骤1:根据已经掌握的信息,将总体分成互不相交的层
步骤2:根据总体的个体数N和样本容量n计算抽样比k=n:N步骤3:确定每一层应抽取的个体数目,并使每一层应抽取的个体数目之和为样本容量n步骤4:按步骤3确定的数目在各层中随机抽取个体,合在一起得到容量为n样本分层求比定数抽样分层抽样法的应用练习1、 某高中共有900 人,其中高一年级300 人,高二年级200 人,高三年级400 人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为( )
A.15,5,25 B.15,15,15
C.10,5,30 D.15,10,20D900练习3、某校共有师生1600人,其中教师100人,现用分层抽样的方法,从所有师生中抽取一个容量为80的样本,则抽取的学生数为 。75练习4、某学校有老师 200人,男学生1200人,女学生1000人,先用分层抽样的方法从全体师生中抽取一个容量为n的样本,已知女学生一共抽取了80人,则n的值为练习5、已知某校的初中学生人数、高中学生人数、教师人数之比为20:15:2,现在用分层抽样的方法从所有师生中抽取一个容量为N的样本进行调查,若应从高中学生中抽取60人,则N= 分层抽样与简单随机抽样、系统抽样的比较 B简单随机抽样 系统抽 样 分
层
抽 样 (1)抽样过程中每个个体被抽到的可能性相等
(2)每次抽出个体后不再将它放回,即不放回抽样 从总体中逐个抽取 将总体均分成几部分,按预先制定的规则在各部分抽取 将总体分成几层,分层进行抽取 在起始部分样时采用简随机抽样 分层抽样时采用简单随机抽样或系统抽样 总体个数较少 总体个数较多 总体由差异明显的几部分组成 比较简单随机抽样、系统抽样、分层抽样的优点、缺点及适用范围B1、下列问题中,采用怎样的抽样方法比较合理:
①从10台冰箱中抽取3台进行质量检查;
②某电影院有32排座位,每排有40个座位,座位号为1~ 40。 有一次报告会坐满了听众,会议结束后为听取意见,留下座位号为18的32名听众进行座谈; 综合练习③某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名。为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本。综合练习 2、(高考题)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和销后服务等情况,记这项调查为②.则完成①、②这两项调查采用的抽样方法依次是( )A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法 D.简单随机抽档法,分层抽样法B 3:某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270
关于上述样本的下列结论中,正确的是 ( )
A.②、③都不能为系统抽样 B.②、④都不能为分层抽样
C.①、④都可能为系统抽样 D.①、③都可能为分层抽样
D课堂总结◆分层抽样
适用范围(个体差异明显)
优点(样本的代表性强)
步骤(计算方法)<考试的重点>
◆分层抽样和简单随机抽样、系统抽样
的比较分析简单随机抽样 系统抽 样 分
层
抽 样 (1)抽样过程中每个个体被抽到的可能性相等
(2)每次抽出个体后不再将它放回,即不放回抽样 从总体中逐个抽取 将总体均分成几部分,按预先制定的规则在各部分抽取 将总体分成几层,分层进行抽取 在起始部分样时采用简随机抽样 分层抽样时采用简单随机抽样或系统抽样 总体个数较少 总体个数较多 总体由差异明显的几部分组成 比较简单随机抽样、系统抽样、分层抽样的优点、缺点及适用范围课件23张PPT。2.2.1 用样本的频率分布估计总体分布1、用样本去估计总体,是研究统计问题的一个基本思想2、前面我们学过的抽样方法有:简单随机抽样、系统抽样、分层抽样。要注意这几种抽样方法的联系与区别。 3、 初中时我们学习过样本的频率分布,包括频数、频率的概念,频数分布表和频数分布直方图的制作。频率分布 样本中所有数据(或数据组)的频数和
样本容量的比,叫做该数据的频率。频率分布的表示形式有:①样本频率分布表
②样本频率分布图
样本频率分布条形图
样本频率分布直方图
③样本频率分布折线图 所有数据(或数据组)的频数的分布变化规律叫做样本的频率分布。1、抛掷硬币的大量重复试验的结果:样本容量为72 088频率分布条形图频率分布表: 注意:
① 各长方形长条的宽度要相同。②相邻长条的间距要适当。 结论:当试验次数
无限增大时,两种试验
结果的频率大致相等。③长方形长条的高度
表示取各值的频率。 归纳1:当总体中的个体所取的不同数值较少
时,其随机变量是离散型。则样本的频率分布表
示形式有:(2)频率分布条形图(1)样本频率分布表 例1. 为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件.
(1) 列出样本的频率分布表;
(2) 画出表示样本频率分布的条形图;
(3)根据上述结果,估计此种产品为二级品或三级品的概率约是多少. (3)此种产品为二级品或三级品的概率约为
0.27+0.43=0.7. 知识探究(一):频率分布表【问题】 我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t):3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6
3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4
3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8
3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1
3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3
3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0
2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3
2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4
2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4
2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2显然:这个例子与前面抛掷硬币的问题是不同的,这里的总体可以在一个实数区间取值,称为连续型总体。样本的频率分布表示形式有:
频率分布表和频率分布直方图1.极差:样本数据中的最大值和最小值的差称为极差2.确定组距,组数:.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组? 0.2~4.3(4.3-0.2)÷0.5=8.2 3 将数据分组,决定分点:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?
4 画频率分布表:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?[0,0.5),[0.5,1),[1,1.5),
…,[4,4.5]. 分 组 频数累计 频数 频率
[0,0.5) 4 0.04
[0.5,1) 正 8 0.08
[1,1.5) 正 正 正 15 0.15
[1.5,2) 正 正 正 正 22 0.22
[2,2.5) 正 正 正 正 正 25 0.25
[2.5,3) 正 正 14 0.14
[3,3.5) 正 一 6 0.06
[3.5,4) 4 0.04
[4,4.5] 2 0.02
合计 100 1.00知识探究(二):频率分布直方图 5 画频率分布直方图 为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示: 上图称为频率分布直方图,其中横轴表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的宽度和高度在数量上有何特点?宽度:组距2 图形的意义 图形的意义:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?各小长方形的面积=频率各小长方形的面积之和=13 分析例题:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性等.思考:对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以1为组距画频率分布直方图吗? 与分组数(或组距)及坐标系的单位长度有关.1、求极差(即一组数据中最大值与最小值的差)
知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)3、 将数据分组(8.2取整,分为9组)画频率分布直方图的步骤4、列出频率分布表.(填写频率/组距一栏)5、画出频率分布直方图。频率分布的条形图和频率分布直方图的区别 两者是不同的概念;横轴:两者表示内容相同思考:
频率分布条形图和频率分布直方图是两个相同的概念吗? 有什么区别?纵轴:两者表示的内容不相同频率分布条形图的纵轴(长方形的高)表示频率 频率分布直方图的纵轴(长方形的高)表示
频率与组距的比值,其相应组距上的频率等于该组距上长方形的面积。理论迁移 例 某地区为了了解知识分子的年龄结构,
随机抽样50名,其年龄分别如下:
42,38,29,36,41,43,54,43,34,44,
40,59,39,42,44,50,37,44,45,29,
48,45,53,48,37,28,46,50,37,44,
42,39,51,52,62,47,59,46,45,67,
53,49,65,47,54,63,57,43,46,58.
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)估计年龄在32~52岁的知识分子所占的比例约是多少.(1)极差为67-28=39,取组距为5,分为8组. 分 组 频数 频率
[27,32) 3 0.06
[32,37) 3 0.06
[37,42) 9 0.18
[42,47) 16 0.32
[47,52) 7 0.14
[52,57) 5 0.10
[57,62) 4 0.08
[62,67) 3 0.06
合 计 50 1.00样本频率分布表:(2)样本频率分布直方图:(3)因为0.06+0.18+0.32+0.14=0.7,
故年龄在32~52岁的知识分子约占70%.〖例2〗:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.
第二小组的频率是多少?样本容量是多少?
若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?课件14张PPT。2.2.1 用样本的频率分布估计总体分布(第2课时)频率分布直方图如下:连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图利用样本频分布对总体分布进行相应估计(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?总体密度曲线月均用水量/tab (图中阴影部分的面积,表示总体在某个区间 (a, b) 内取值的百分比)。 当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线——总体密度曲线.总体密度曲线 用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。 总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线茎 叶 图 某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:(1)甲运动员得分:
13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39(2)乙运动员得分: 49,24,12,31,50,31,44,36,15,37,25,36,39注:中间的数字表示得分的十位数字。
旁边的数字分别表示两个人得分的个位数。茎叶图 当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有的信息,而且 可以随时记录,给数据的记录和表示都方便。练习:某中学高一(2)班甲,乙两名同学自高中以来每场数学考试成绩情况如下:
甲的得分:95,81,75,91,86,89,71,65,76,88,94
乙的得分:83,86,93,99,88,96,98,98,79,85,97
画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较。 小 结
图形 优点 缺点
频率分布 1)易表示大量数据 丢失一些
直方图
2)直观地表明分布地 情况 信息
1)无信息损失 只能处理样本
茎叶图
2)随时记录方便记录和表示 容量较小数据课堂小结表示样本分布的方法:
(1)频率分布表
(2)频率分布图(包括直方图和条形图)
(3)频率分布折线图
(4)茎叶图1.频率分布表 表示样本的分布的方法:2.频率分布直方图样本频率分布中,当样本容量无限增大,组距无限缩小样本频率分布直方图接近于一条光滑曲线——总体密度曲线,反映了总体分布。3.频率分布折线图 1.总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。
2.总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。课件14张PPT。2.2.2用样本的数字特征估计总体的数字特征第1课时【复习引入】1、频率分布直方图2、频率分布折线图3、总体密度曲线4、茎叶图 我们学习了用图、表来组织数据,以及通过
图、表提供的的信息,用样本的频率分布估计总
体的分布 . 为了更好的把握总体的规律,还需要通过样本的数据对总体的数字特征进行研究。探究1:某学校高一甲班和高一乙班各有49名学生,两班
在一次数学测试中的成绩统计如下:【探究新知】(1)请你对下面的一段话给予简要分析:
甲班的小刚对妈妈说:“昨天的数学测验,全班平均分79
分,得70分的人最多,我得了85分,在班里算是上游了!”
(2)请你根据表中的数据,对这两个班的数学测验情况进行简要
分析,并提出建议.解:(1)甲班49名学生数学成绩的中位数是87,则85分排在全班第25名之后,从位次上看应该属于中游.但也不能以位次来判断学习的好坏,小刚得了85分,说明他对这段的学习内容掌握较好,从掌握学习的内容上讲,也可以说属于上游;
(2)甲班成绩的中位数是87分,说明高于87分的人数占一半以上,而平均分为79分,标准差又很大,说明低分也多,两极分化严重,建议加强对学习困难的学生的帮助.
乙班的中位数和平均数都是79分,标准差又小,说明学生之间差别较小,学习很差的学生少,但学生优异的也少,建议采取措施提高优秀率.1、 众数、中位数、平均数练习:平均数中位数众数探究2:
下图是城市居民月均用水量样本数据的频率分布
直方图,如何从频率分布直方图中估计众数、中位数、
平均数? (1)你认为众数应在哪个小矩形内?
由此估计总体的众数是什么? (2)直方图中,从左至右各个小矩形的面积分别是:
0.04, 0.08, 0.15, 0.22, 0.25, 0.14, 0.06, 0.04, 0.02.
中位数左右两侧的直方图的面积有什么关系?由此
估计总体的中位数是什么? 0.5-0.04-0.08-0.15-0.22=0.01,
0.01÷0.5=0.02,
中位数是2.02. (3)平均数是频率分布直方图的“重心”,
由此估计总体平均数为多少?平均数的估值 = 频率分布直方图中每个小矩形的面积
乘以小矩形底边中点的横坐标之和 0.25×0.04+0.75×0.08
+1.25×0.15+1.75×0.22
+2.25×0.25+2.75×0.14
+3.25×0.06+3.75×0.04
+4.25×0.02=2.02(t). (4)从居民月均用水量样本数据可知,该样本
的众数是2.3,中位数是2.0,平均数是
1.973,这与我们从样本频率分布直方图得
出的结论有偏差,你能解释一下原因吗? 这是因为样本数据的频率分布直方图,只是直
观地表明分布的形状,损失了一些样本数据,得到
的是一个估计值,且所得估计值与数据分组有关 .
因此,在只有样本频率分布直方图的情况下,我们
可以按上述方法估计众数、中位数和平均数,并由
此估计总体特征.用频率分布直方图估计众数、中位数、平均数【小结】(1)众数:最高的矩形的底边的中点的横坐标.
(2)中位数:左右两侧直方图的面积相等.
(3)平均数:每个小矩形的面积乘以小矩形底边
中点的横坐标之和.注:利用直方图求众数、中位数、平均数均为估计值,
与实际数据可能不一致.练习:
某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行
整理后分成五组绘制成如图所示的频率分布直方图,已知图中
从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、
0.15、0.10、0.05. 求高一参赛学生的成绩的众数、中位数、平均
成绩.众数为65,
中位数为65,
平均成绩约为67.【知识归纳】1、 众数、中位数、平均数2、用频率分布直方图估计众数、中位数、平均数(1)众数:最高的矩形的底边的中点的横坐标.
(2)中位数:左右两侧直方图的面积相等.
(3)平均数:每个小矩形的面积乘以小矩形底边
中点的横坐标之和.3、 标准差、方差课件13张PPT。2.2.2用样本的数字特征估计总体的数字特征第2课时探究3:
在一次射击选拔赛中,甲、乙两名运动员各
射击10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你如何对这次射击作出评价?【探究新知】 两人射击的平均成绩是一样的,那么两个人的水平就没有
什么差异吗? 作出两人成绩的频率分布条形图,可以看出
还是有差异的环数 甲的成绩比较分散,极差较大,乙的成绩
相对集中,比较稳定. 甲的环数极差=10- 4=6 ,乙的环数极差=9-5=4.
它们在一定程度上表明了样本数据的分散程度,
与平均数一起,可以给我们许多关于样本数据的信息.
显然,极差对极端值非常敏感,注意到这一点,我们
可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略. 因此,我们还需要从另外的角度来考察这两组数据. 例如:在作统计图表时提到过的极差. 考察样本数据的分散程度的大小,最常用的统计量
是标准差.标准差是样本数据到平均数的一种平均距
离,一般用S表示. 由于上式含有绝对值,运算不太方便,因此,通
常改用如下公式来计算标准差.所谓“平均距离”,其含义可作如下理解:3、标准差与方差【探究新知】 假设样本数据x1,x2,…,xn的平均数为 ,
则标准差的计算公式是:(1)标准差:(2)方差用来描述样本数据的离散程度. 特别的,一个容量为2的样本:x1,x2( x1< x2 ),
则 , 例1:画出下列四组样本数据的条形图,
说明它们的异同点.
(1) 5,5,5,5,5,5,5,5,5;
(2) 4,4,4,5,5,5,6,6,6;
(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8;【典例剖析】标准差的取值范围是
标准差越大离散程度越大,数据较分散;
标准差越小离散程度越小,数据较集中在平均数周围;S=0,标准差为0的样本数据都相等. 练习:
(1)校园歌手大赛中,七位裁判为一选手打出的分数如下:
89 90 95 93 94 93
去掉一个最高分和一个最低分,所剩数据的平均值和方差
分别为( )A. 92, 2 B. 92, 2.8 C. 93, 2 D. 93, 2.8B(3)若样本1+X1,1+X2,1+X3,…,1+Xn的平均数是10,
方差为2,则对于样本2+X1, 2+X2,……2+Xn,下
列结论正确的是( )
A.平均数为10,方差为2 B.平均数为11,方差为3
C.平均数为11,方差为2 D.平均数为12,方差为4C(2)某学生在一次考试中,语文、数学、英语三门学科的平均成
绩是80分,物理、化学两门学科的平均成绩为85分,则该
学生这五门学科的平均成绩是_____分.82 (4)若X1,X2,X3,…,X20,这20个数据的平均数为 X ,
方差为0.20,则X1,X2,X3,…,X20,X 这21个数据
的方差约为_________. 4/21作业P82 习题2.2A组6课件13张PPT。2.3变量间的相关关系必修③ 第二章 统计1.标准差2.方差:练习:随机抽查了某商场5天的营业执额(单位:万元):64,61,68,70,82,则这组数据的极差是______,标准差是_________,方差是_______.21522.3.1变量之间的相关关系在学校里,老师对学生经常这样说:”如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系,这种说法有没有根据呢?1、变量之间除了函数关系外,还有相关关系。
例:(1)商品销售收入与广告支出经费之间的关系
(2)粮食产量与施肥量之间的关系
(3)人体内脂肪含量与年龄之间的关系一、变量之间的相关关系不同点:函数关系是一种确定的关系;而
相关关系是一种非确定关系.相关关系与函数关系的异同点:相同点:均是指两个变量的关系.2、两个变量之间产生相关关系的原因是受许多不确
定的随机因素的影响。3、需要通过样本来判断变量之间是否存在相关关系一、变量之间的相关关系2.3.2两个变量的线性相关在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:根据上述数据,人体的脂肪含量与年龄之间有怎样的关系?二.两个变量的线性相关1、散点图2、正相关3、负相关 两个变量成负相关时,散点图有什么特点?请举一些生活中的变量成负相关的例子。 表示具有相关关系的两个变量的一组数据的图形,叫做散点图. 三.回归直线2、回归直线 如果散点图中点的分布从总体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系。1、变量间的线性相关上述直线称为回归直线。三.回归直线3、如何求回归直线的方程探究二 实际上,求回归直线的关键是如何用数学的方法来刻画”从整体上看,各点到此直线的距离最小”.这样的方法叫做最小二乘法.问题归结为:a,b取什么值时Q最小,即总体和最小.下面是计算回归方程的斜率和截距的一般公式.根据最小二乘法和上述公式可以求回归方程.回归直线方程:1.变量之间除了函数关系外,还有相关关系,相关关系是一种非确定关系.2.散点图:表示具有相关关系的两个变量的一组数据的图形,叫做散点图. 3.正相关与负相关.4.回归直线:如果散点图中点的分布从总体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线就叫回归直线。5.回归直线方程: