(共34张PPT)
第九章 统计
9.1 随机抽样
9.1.1 简单随机抽样
妈妈:“儿子,帮妈妈买盒火柴去.”
妈妈:“这次注意点,上次你买的火柴好多划不着.” 儿子高兴地跑回来.
孩子:“妈妈,这次的火柴全划得着,我每根都试过了.”
笑过之后,谈谈你的看法.
这个调查具有破坏性,不能每根都试,不能展开全面调查.
小笑话
我国土地沙漠化问题非常严重,全国沙漠化土地面积已超过174 000平方千米,并以每年3 400平方千米的速度扩张.
你知道这些数据是怎么来的吗?
通过调查获得的.
怎么调查?
统计
在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意测验.调查兰顿(当时任堪萨斯州州长)和罗斯福(当时的总统)中谁将当选下一届总统.为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年电话和汽车只有少数富人拥有).通过分析收回的调查表,显示兰顿非常受欢迎,于是此杂志预测兰顿将在选举中获胜.
实际上选举结果正好相反,最后罗斯福在选举中获胜,其数据如下:
38%
57%
兰顿
62%
43%
罗斯福
选举结果
预测结果
候选人
[问题]: 你认为预测结果出错的原因是什么?
原因是:用于统计推断的样本来自少数富人,只能代表富人的观点,不能代表全体选民的观点(样本不具有代表性).
体会课堂探究的乐趣,
汲取新知识的营养,
让我们一起 吧!
进
走
课
堂
思考:假设你作为食品卫生工作人员,要对校园食品店的一批小包装饼干进行卫生达标检验,你打算怎么做?
微课1 简单随机抽样的含义
这种抽样方法就是简单随机抽样.
那么简单随机抽样的含义是什么?
只能抽取一定数量的饼干作为检验的样本.其抽样方法是:将这批小包装饼干放在一个麻袋中搅拌均匀,然后逐个不放回地抽取若干包。
简单随机抽样的含义:
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n思考:根据你的理解,简单随机抽样有哪些主要特点?
(1)总体的个体数有限.
(2)样本的抽取是逐个进行的,每次只抽取一个个体.
(3)每个个体被抽到的机会都相等,抽样具有公平性.
利用简单随机抽样时,如何进行操作呢?
【即时训练】
思考1:假设要在我们班选派5个人去参加某项活动,为了体现选派的公平性,你有什么办法确定具体人选
微课2 简单随机抽样的方法
抽签法
思考2:用抽签法(抓阄法)确定人选,具体如何操作?
用小纸条把每个同学的学号写下来放在盒子里,并搅拌均匀,然后从中随机逐个抽出5个学号,被抽到学号的同学即为参加活动的人选.
思考3:一般地,抽签法的操作步骤如何?
(1)将总体中的N个个体编号;
(2)将这N个号码写在形状、大小相同的号签上;
(3)将号签放在同一箱中,并搅拌均匀;
(4)从箱中每次抽出1个号签,连续抽出n次;
(5)将总体中与抽到的号签编号一致的n个个体取出.
(总体个数N,样本容量n)
思考4:你认为抽签法有哪些优点和缺点?
优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.
缺点:当总体个数较多时很难搅拌均匀,产生的样本的代表性很可能受影响.
除了抽签法,还有其他的简单随机抽样方法吗?
随机数法
用随机数工具产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需的个数.
产生随机数的工具有哪些?
产生随机数的工具
①用随机试验生成随机数;
②用信息技术生成随机数;
③用计算器生成随机数;
④用电子表格软件生成随机数;
⑤用R统计软件生成随机数.
思考:假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数抽取样本时应如何操作?
第一步:将800袋牛奶编号为000,001,002,…,799.
第二步:准备10个大小、质地一样的小球,小球上分别写上数字0,1,2,3,4,5,6,7,8,9,把它们放入一个不透明的袋中;
第三步:从袋中有放回的摸取3次,每次摸取前充分搅拌,并把第一、二、三次摸到的数字分别作为百、十、个位数,这样就生成一个三位随机数;
第四步:如果这个三位数在000~799范围内,就代表对应编号的产品被抽中,如果编号有重复就剔除编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的个数.
思考:一般地,利用随机数法从含有N个个体的总体中抽取一个容量为n的样本,其抽样步骤如何?
第一步:将总体中的所有个体编号.
第二步:生成随机数
第三步:记录样本编号.
第四步:抽取样本.
用随机数法进行抽样有以下几个步骤:
①将总体中的个体编号 ②获取样本号码
③选定开始的数字 ④选定读数的方向
⑤抽取样本.这些步骤的先后顺序应为( )
A.①②③④⑤ B.①③④②⑤
C.③②⑤①④ D.⑤④③①②
B
【即时训练】
方案一:通过互联网调查.
方案二:通过居民小区调查.
方案三:通过电话调查.
上述三种调查方案能获得比较准确的收视率吗?为什么?
不能. 这三种方案都有一定的片面性,不能得到比较准确的收视率.
例 为调查央视春节联欢晚会的收视率,有如下三种调查方案:
某大学为了支援我国西部教育事业,决定从2021年应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数法设计抽样方案.
【变式练习】
解:抽签法
第一步:将18名志愿者编号,编号为1,2,3,…,18;
第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签;
第三步:将18个号签放入一个不透明的盒子里,充分搅匀;
第四步:从盒子中逐个抽取6个号签,并记录上面的编号;
第五步:所得号码对应的志愿者,就是志愿小组的成员.
随机数法
第一步:将18名志愿者编号,编号为01,02,03,…,18;
第二步:准备10个大小、质地一样的小球,小球上分别写上数字0,1,2,3,4,5,6,7,8,9,把它们放入一个不透明的袋中;
第三步:从袋中有放回的摸取2次,每次摸取前充分搅拌,并把第一、二次摸到的数字分别作为十、个位数,这样就生成一个两位随机数;
第四步:如果这个两位数在01~18范围内,就代表对应编号的产品被抽中,如果编号有重复就剔除编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的个数,找出号码与编号对应的志愿者,就是志愿小组的成员.
1.一个抽样试验能否用抽签法,关键看两点:
一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
【总结提升】
2.利用随机数法抽取样本的步骤
(1)编号:将每个个体编号,各号数的位数相同.
(2)生成随机数:利用随机数工具生成随机数
(3)抽取样本:找出随机数与编号对应的个体
1.某中学进行了该学年期末统一考试,该校为了了
解高一年级1 000名学生的考试成绩,从中随机抽取
了100名学生的成绩单,就这个问题来说,下面说法
正确的是( )
A.1 000名学生是总体
B.每个学生是个体
C.1 000名学生的成绩是一个个体
D.样本的容量是100
D
解:1 000名学生的成绩是总体,其容量是1 000,100名学生的成绩组成样本,其容量是100.
B
3.下列抽取样本的方式属于简单随机抽样的是( )
(1)从无限多个个体中抽取100个个体作样本;
(2)盒子里有80个零件,从中选出5个零件进行质量检验,
在抽样操作时,从中任意拿出一个零件进行质量检验后,
再把它放回盒子里;
(3)从8台电脑中不放回的随机抽取2台进行质量检验(假设8
台电脑已编好号,对编号随机抽取)
(4)某班有56名同学,指定个子最高的5名同学参加学校组织
的篮球赛。
A.(1) B.(2) C.(3) D.(4)
C
5.某市为了了解本市13 850名高中毕业生的数学
毕业会考的情况,要从中抽取500名进行数据分析,
那么这次考察的总体数为 ,样本容量是
____.
13 850
500
易错提醒
核心知识
方法总结
核心素养
简单随机抽样
(1)总体有限
(2)逐个抽取
(3)放回抽样或不放回抽样
(4)概率相等
简单随机抽样的判断
在用随机数法抽样时,当产生重复编号时要重新生成
数学抽象:在抽样的过程中培养数学抽象的核心素养
概念
分类
抽签法
随机数法
总体均值
样本均值
奔向理想人生的征途是漫长的,但是只要坚强不屈地向前奋进,理想就一定会实现.(共42张PPT)
第九章 统 计
9.1 随 机 抽 样
9.1.1 简单随机抽样
基础预习初探
1.简单随机抽样
(1)要知道一批牛奶是否达标,为什么不采用逐一检测的方法?
提示:因为检测具有破坏性,且耗时费力.
(2)假设你作为一名食品卫生工作人员,要对某食品店内的一批小包饼干进行卫生达标检验,得到样本饼干的第一步应该做什么?
提示:将饼干放入一个不透明的袋子中,搅拌均匀.
(3)在问题(2)的基础上,若想得到样本饼干,则应如何摸取?
提示:从中不放回地摸取并且每次只摸一个.
(4)在上述抽样过程中,某一包饼干第一次被抽到与第二次被抽到的机会相等吗?
提示:相等.
2.简单随机抽样的方法
(1)某班为了从班内50人中选派5人去参加某项活动,为了体现选派的公平性,你有什么办法确定具体人选?
提示:利用抽签法.
(2)当总体中个数较多时,怎样抽取较有代表性的样本?
提示:利用随机数法.
3.思考:什么是总体均值?如何估计总体均值?
提示:总体均值就是总体平均数.可以通过抽取样本,求出样本平均值来估计总体均值.
【概念生成】
1.全面调查和抽样调查
调查方式 普查 抽查
定义 对每一个调查对象都进行调查的方法,称为全面调查,又称普查 根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法
相关概念 总体:在一个调查中,把调查对象的全体称为总体
个体:组成总体的每一个调查对象称为个体 样本:把从总体中抽取的那部分个体称为样本
样本量:样本中包含的个体的数量称为样本量
2.简单随机抽样的概念
(1)放回简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中_____抽取n(1≤n<N)个个
体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概
率都_____,把这样的抽样方法叫做放回简单随机抽样.
逐个
相等
(2)不放回简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中_____抽取n(1≤n<N)个个
体作为样本,如果抽取是不放回的,且每次抽取时总体内___________________
___被抽到的概率都相等,把这样的抽样方法叫做不放回简单随机抽样.
(3)概念
放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机
抽样获得的样本称为简单随机样本.
逐个
未进入样本的各个个
体
(4)特点
①总体个数有限,②逐个抽取,③不放回,④等可能抽样.
3.抽签法
先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也
可以是卡片、小球等)上作为号签,并将这些小纸片放在一个_______的盒里,充
分搅拌.最后从盒中不放回地抽取号签,使与号签上的编号对应的个体进入样
本,直到抽足样本所需要的个体数.
不透明
4.随机数法
(1)定义:先把总体中的个体编号,用随机数工具产生总体范围内的整数随机数,把产生的随机数作为抽中的编号,并剔除重复的编号,直到抽足样本所需要的个体数.
(2)产生随机数的方法:①用随机试验生成随机数,②用信息技术生成随机数.
5.总体均值和样本均值
(1)总体均值:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,
YN,则 =______________=________为总体均值,又称总体平均数.
(2)总体均值加权平均数的形式:如果总体的N个变量值中,不同的值共有
k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),
则总体均值还可以写成加权平均数的形式 =_________.
(3)样本均值:如果从总体中抽取一个容量为n的样本,它们的变量值分别为
y1,y2,…,yn,则称 =____________=______为样本均值,又称样本平均数.
核心互动探究
课堂素养达标(共25张PPT)
1、简单随机抽样的概念:
2、简单随机抽样的特点:
3、简单随机抽样的常用方法:
③机会均等抽样.
①总体个数有限;
②逐个进行抽取;
①抽签法;
②随机数表法.
设一个总体含有有限个个体,并记其个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的机会相等,就称这样的抽样为简单随机抽样.
温故知新
设计抽样方法时,核心是如何使抽取的样本具有代表性.因此,应充分利用对总体的了解.当已知总体由差异明显的几部分组成时,如何才能使样本能更充分地反映总体的情况?
1.理解分层抽样的基本思想和适用情形.
2.掌握分层抽样的实施步骤.
1.数学抽象:分层抽样的相关概念;
2.数据分析:分层抽样的应用;
3.数学运算:分层抽样中各层样本容量的计算.
体会课堂探究的乐趣,
汲取新知识的营养,
让我们一起 吧!
进
走
课
堂
微课1 分层抽样的概念及特点
在对树人中学高一年级学生身高的调查中, 采取简单随机抽样的方式抽取了50名学生。
1.抽样调查最核心的问题是什么?
2.会不会出现样本中 50 个个体大部分来自高个子或矮个子的情形?
3.为什么会出现这种“极端样本”?
4.如何避免这种“极端样本”?
样本代表性
会
抽样结果的随机性个体差异较大
分组抽样,减少组内差距
思考: 在树人中学高一年级的 712 名学生中, 男生有 326 名、女生有 386 名。样本量在男生、女生中应如何分配?
分层抽样
每一层抽取的样本数=
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样(stratified random sampling),每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
×总样本量
【即时训练】
2.分层抽样的步骤:
(1)将总体按一定的标准分层;
(2)总体与样本容量确定抽取的比例;
(3) 确定各层抽取的样本数;
(5)综合每层抽样,组成样本.
(4)在每一层进行抽样
(可用简单随机抽样);
开始
分层
计算比例
定每层抽取容量
抽样
组样
结束
微课2:分层随机抽样的平均数
思考:在分层随机抽样中如何估计总体平均数呢?
第1层的总体平均数和样本平均数为:
第2层的总体平均数和样本平均数为:
总体平均数和样本平均数为:
由于用第一层的样本平均数 可以估计第1层的总体平均数 ,第二层的样本平均数 可以估计第2层的总体平均数 ,因此我们可以用
估计总体平均数
在比例分配的分层随机中抽样中
可得
例1.在树人中学高一年级的 712 名学生,男生有 326 名、女生有 386 名,分别抽取的男生23名男生、27名女生样本数据如下
173.0 174.0 166.0 172.0 170.0 165.0 165.0 168.0 164.0 173.0
172.0 173.0 175.0 168.0 170.0 172.0 176.0 175.0 168.0 173.0
167.0 170.0 175.0
163.0 164.0 161.0 157.0 162.0 165.0 168.0 155.0 164.0 162.5
154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0
172.0 162.5 158.0 155.5 157.0 163.0 172.0
样本女生平均身高=161.0,样本男生平均身高=170.6.估计高一年级全体学生的身高是多少.
解:由于样本女生平均身高=160.6,样本男生平均身高=170.6.
则高一年级全体学生的平均身高:
即估计树人中学高一年级学生的平均身高 在165.40左右
【变式练习】 高一年级有男生490人,女生510人,张华按照男生女生进行分层,抽取样本量为100.得到男生女生平均身高分别为170.2cm和160.8cm。在这种情况下,请估计高一年级全体学生的平均身高。
解:由公式
可得高一年级全体学生的平均身高为165.4
分层随机抽样
分层抽样的特点: (1)总体由差异明显的几部分组成; (2) 每层按比例确定抽取个数; (3)在每层采用简单随机抽样
分层要准确,对于不能取整的数,求其近似值.
数学运算:通过分层随机抽样的过程,培养数学运算的核心素养
方法总结
核心知识
易错提醒
核心素养
分层抽样的步骤: (1)分层; (2)定抽样比;(3)定各层抽取的数目: (4)抽取个体
层
分层随机抽样的概念
比例分配
D
A
B
当你每天醒来,口袋里便装着24小时的时间,
这是属于你自己最宝贵的财产.(共27张PPT)
9.1.2 分层随机抽样
基础预习初探
1.分层随机抽样的使用条件与抽取方法
假设某地区有高中生2 400人,初中生10 900人,小学生11 000人,此地区教育部门为了了解本地区中小学生的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查.据此回答下列问题:
(1)对于上述问题中,高中生、初中生、小学生的视力是否有明显的差异?
提示:有明显的差异.
(2)你认为如何从高中生、初中生、小学生中抽样更具有代表性?
提示:按照1∶100的比例,分别从高中生、初中生、小学生中抽取相应数量的个体.
2.分层随机抽样与简单随机抽样有什么优势?
提示:分层随机抽样使得样本更具有代表性,更能准确地反映总体的特征.
【概念生成】
1.分层随机抽样的实施步骤
(1)将总体按一定的标准_____;
(2)计算各层的_____________________的比;
(3)按各层个体数占总体的个体数的比确定各层应抽取的_________;
(4)在每一层进行抽样组成样本.
分层
个体数与总体的个体数
样本容量
核心互动探究
课堂素养达标
前提:可分层,层与层之间区别明显
(1)分层
(2)计算各层个体与总体个体数之比
分层随机抽样
实施步骤:
(3)确定各层样本容量
应用:实际案例中的计算
50岁以上
20%
40岁以下
50%
30%
40~50岁(共42张PPT)
9.2.3 总体集中趋势的估计9.2.4 总体离散程度的估计
藏宝图只能够标出宝藏所在的具体位置及路线图,但真正探索宝藏的秘密还有很多工作要做,统计图表能够把所有的信息都表述出来吗 还有哪些关键性的特征是我们迫切需要的呢 杂乱无章的数据仅用统计图表来分析显然是不全面的,不同的数字特征往往具有不同的意义和作用,本节介绍数据的数字特征,根据不同问题的需要选择适当的数字特征来表达数据的信息.
1.结合实例,能用样本估计总体的集中趋势参数(众数、中位数、平均数)
及离散程度参数(标准差、方差、极差) .
2.会求样本数据的众数、中位数、平均数、标准差、方差、极差 .
3.理解集中趋势、离散程度参数的统计含义.
1.数学运算:求样本数据的众数、中位数、平均数、方差、标准差;
2. 数据分析:频率分布直方图中的众数、中位数、平均数,
. 用样本平均数和样本标准差估计总体
体会课堂探究的乐趣,
汲取新知识的营养,
让我们一起 吧!
进
走
课
堂
微课1 平均数、中位数、众数
思考: 利用9.2.1节中100户居民用户的月均用水量的调查数据,能否计算样本数据的平均数和中位数,并据此估计全市居民用户月均用水量的平均数和中位数.
思考1:该市某小区有2000户,你能估计该小区的月用水总量吗?
思考2:小明用统计软件计算了100户居民用水量的平均数和中位数,但在录入数据不小心把一个数据7.7录成了77.请计算录入数据的平均数和中位数.
中位数没有变化,还是6.6t
思考3:并与真实的样本平均数和中位数作比较。哪个量的值变化更大?你能解释其中的原因吗?
平均数由原来的8.79t变为9.483t,中位数没有变化.这是因为样本平均数与每一个样本数据有关,样本中的任何一个数据的改变会引起平均数的改变;但中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变,因此,与中位数较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.
微课2:中位数和平均数的大小与数据分布形态的关系
思考:平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在下图的三种分布形态中,平均数和中位数的大小存在什么关系
(1) 单峰,直方图形状对称:
(2) 右边“拖尾”:
(3) 左边“拖尾”:
结论:和中位数相比,平均数总是在“长尾巴”那边.
例1:某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格,据统计,高一年级女生需要不同规格校服的频数如下表所示,
校服规格 155 160 165 170 175 合计
频数 39 64 167 90 26 386
如果用一个量来代表该校高一年级女生所需校服的规格,那么在中位数、平均数和众数中,哪个量比较合适?试讨论用上表中的数据估计全国高一年级女生校服规格的合理性.
分析:虽然校服规格是用数字表示的,但它们事实上是几种不同的
类别,对于这样的分类数据,用众数作为这组数据的代表比较
合适.
解:为了更直观地观察数据的特征,我们用条形图来表示表中的数据(下图)可以发现,选择校服规格为“165”的女生的频数最高,所以用众数165作为该校高一年级女生校服的规格比较合适.
由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.
微课3:由频率分布直方图估计平均数、中位数、众数
思考:样本的平均数、中位数和众数可以分别作为总体的平均数、中位数和众数的估计,但在某些情况下我们无法获知原始的样本数据,例如,我们在报纸、网络上获得的往往是已经整理好的统计表或统计图,这时该如何估计样本的平均数、中位数和众数?
在频率分布直方图中,我们无法知道每个组内的数据是如何分布的,此时,通常假设它们在组内均匀分布,这样就可以获得样本的平均数、中位数和众数的近似估计,进而估计总体的平均数、中位数和众数.
例2 你能以下图居民用水的频率分布直方图提供的信息,估计出样本的平均数、中位数和众数吗
1.由频率分布直方图估计平均数
2.由频率分布直方图估计中位数
取最高矩形下端中点的横坐标5.7作为众数.
3.由频率分布直方图估计众数
类题通法(知频率分布直方图中求平均数、中位数、众数)
(1)众 数:频率分布直方图中,最高矩形的底边中点的横坐标.
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个
面积相等的部分的分界线与x轴交点的横坐标称为中位数.
(3)平均数:平均数在频率分布直方图中等于每个小矩形底边中点的横
坐标与小矩形的面积的乘积之和.
变式训练 如图为学生身高频率分布直方图.
(1)如何在样本数据的频率分布直方图中估计出众数的值
(2)如何在样本数据的频率分布直方图中估计出中位数的值
(3)如何在样本数据的频率分布直方图中估计出平均数的值
(4)从样本数据可知,该样本的众数是166 cm,172 cm,中位数是171 cm,平均数是170.1 cm,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗
解:(1)众数大致的值就是样本数据的频率分布直方图中最高小长方形的中点的横坐标.由直方图可估计学生身高众数应为174.5 cm.
(2)在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数使得在它左边和右边的直方图的面积相等,由此可以估计中位数的值,如图,由于0.08+0.22=0.3,0.08+0.22+0.22=0.52,所以中位数落在区间[167,172)内.
设中位数是x,由0.08+0.22+(x-167)× =0.5,解得x≈171.55.所以学生身高的中位数约为171.55 cm.
(3)平均数是频率分布直方图的“重心”,是频率分布直方图的平衡点,因此,每个小长方形的面积与小长方形底边中点的横坐标的乘积之和为平均数.由159.5×0.08+164.5×0.22+169.5×0.22+174.5×0.36+179.5×0.12=170.6,得学生身高的平均数为170.6 cm.
(4)因为样本数据频率分布直方图只是直观地表明分布的形状,从直方图本身得不出原始的数据内容,也就是说频率分布直方图损失了一些样本数据的信息,得到的是一个估计值,且所得估计值与数据分组有关,所以估计的值有一定的偏差.
微课4: 方差、标准差
思考:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你应当如何对这次射击作出评价
计算 平均数、方差
思考1:甲、乙两人本次射击的平均成绩分别为多少环
他们的平均成绩一样吗
提示:经计算得
(7+8+7+9+5+4+9+10+7+4)=7,
同理可得 他们的平均成绩一样.
.
=7
思考2:难道这两个人的水平就没有什么差异了吗 你能作出这两人成绩的频率分布条形图来说明其水平差异在哪里吗
提示:频率分布条形图如下:
从图上可以直观地看出,他们的水平还是有差异的,甲成绩比较分散,乙成绩相对集中.
思考:如何度量数据的离散程度?
一种简单的度量数据离散程度的方法就是用极差,根据甲、乙运动员的10次射击成绩,可以得到
甲命中环数的极差=10-4=6 乙命中环数的极差=9-5=4.
这种方法有什么不足?
极差在一定程度上刻画了数据的离散程度,但因为极差只使用了数据中最大、最小两个值的信息,对其他数据的取值情况没有涉及,所以极差所含的信息量很少.
是否还有更合适的方法?
思考:对于样本数据x1,x2,…,xn,用 表示这组数据的平均数设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?
为了避免式中含有绝对值,通常改用平方来代替,即
方差
对于样本数据x1,x2,…,xn,用 表示这组数据的平均数,称下式为这组数据的方差(variance).
有时为了计算方差的方便,我们还把方差写成
由于方差的单位是原始数据的单位的平方,与原始数据不一致.为了使二者单位一致,我们对方差开平方,取它的算术平方根,即
我们称上式为这组数据的标准差(standard deviation).
思考3:现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢
提示:通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.
例3 在对树人中学高一年级学生身高的调查中,采用样本量比例分
配的分层随机抽样,如果不知道样本数据,只知道抽取了男生
23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,
其平均数和方差分别为160.6和38.62.你能由这些数据计算出
总样本的方差,并对高一年级全体学生身高方差作出估计吗
解:把男生样本记为x1,x2,…,x23,其平均数记为 ,方差记为 ;把女生样本记为y1,y2,...y27,其平均数记为 ,方差记为 ;把总样本数据的平均数记为 ,方差记为 .根据方差的定义,总样本方差为
男生23人,其平均数和方差分别为170.6和12.59,
女生27人,其平均数和方差分别为160.6和38.62
把已知的男生、女生样本平均数和方差的取值代入,可得
并据此估计高一年级学生身高的总体方差为51.4862.
(1)中位数不受少数极端值的影响
(2)众数无法客观地反映总体的特征(3)平均数受极端值的影响较大
数
字
特
征
(1)数学抽象:通过样本的数字
特征,培养数学抽象的核心素养
(2)数学运算:通过数字特征的计算,培养数学运算的核心素养
(3)数据分析:利用样本的数字特征的分析数据、预测问题
利用频率分布直方图求数字特征的方法
(1)众数是最高的矩形的底边的中点的横坐标.
(2)中位数左右两侧直方图的面积相等。
(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和。
中位数
众数
频率分布直方图中的数字特征
平均数
标准差:
方差:
集中
离散
易错提醒
核心知识
核心素养
方法总结
总体集中趋势的估计
总体离散程度的估计
1.一组样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,
其中位数为22,则x等于( )
A.21 B.22 C.20 D.23
解析:根据题意知,中位数22= ,则x=21.
A
A
D
D
4
6.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,
则:(1)这20名工人中一天生产该产品的数量在[55,75)的人数是________;
(2)这20名工人中一天生产该产品的数量的中位数为_______;
(3)这20名工人中一天生产该产品的数量的平均数为______.
即使一次次的跌倒,我们依然成长.跌倒只是我们成长道路上的一个小小的插曲.(共49张PPT)
9.2.3 总体集中趋势的估计
9.2.4 总体离散程度的估计
基础预习初探
(2)在频率分布直方图中,中位数应出现在哪个位置?
提示:在频率分布直方图中,中位数左边和右边直方图的面积应该相等.
(3)在频率分布直方图中,平均数是如何估计的?
提示:在频率分布直方图中,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
2.通过预习教材,回答下列问题:
(1)如何考查样本数据的分散程度?
提示:最常用的统计量是样本数据的方差与标准差.
(2)样本数据的分散程度是计算样本数据的什么值?
提示:样本数据的分散程度是样本数据到平均数的平均距离.
【概念生成】
1.对众数、中位数、平均数的理解
(1)众数:在一组数据中,出现次数_____的数据叫做这一组数据的众数.
(2)中位数:将一组数据按_____依次排列,把处在_______位置的一个数据(或
两个数据的平均数)叫做这组数据的中位数.
(3)平均数:假设样本数据是x1,x2,…,xn, 表示这组数据的平均数,
则 =_______________.
最多
大小
最中间
2.对标准差、方差的理解
(1)标准差:
标准差是样本数据到平均数的一种_________,一般用s表示,
s=_______________________________.
(2)方差:
标准差的平方s2叫做方差.
s2=__________________________________.
平均距离
3.方差的意义
方差刻画了数据的_________或_________,方差越大,数据的离散程度越___;
方差越小,数据的离散程度越___.
离散程度
波动幅度
大
小
核心互动探究
课堂素养达标