(共25张PPT)
第六章
统计
§1获取数据的途径
浙江
辽宁
广东
福建
江苏
山东
河北
天津
上海
0
5
10
15
20
25
17
14
6
3
27
2
1
海南
2
2001我国部分沿海省(直辖市)赤潮发生的次数统计图
2
4
1.了解获取数据的方法:直接获取与间接获取.2.从实际生活中了解普查的概念和普查的特点.3.结合实例理解抽样调查的特点,并会用相关的方法解决生活中的一些简单问题.4.理解统计的相关概念.
1.通过对总体、样本等概念的学习,培养数学抽象素养.
2.通过学习获取数据的途径,培养数据分析素养.
体会课堂探究的乐趣,
汲取新知识的营养,
让我们一起
吧!
进
走
课
堂
探究点1
直接获取数据与间接获取数据
探究点2
普查和抽查
C
【即时训练】
探究点3
总体和样本
B
【即时训练】
B
C
A
奔向理想人生的征途是漫长的,但是只要坚强不屈地向前奋进,理想就一定会实现.
高考赘源网
高考资源
边的高考专家!】
认统计法
第六次人口普查登记我国大陆总人口为
1339724852人
与2000年相比增加7390万人,年均增长057
男性人口
女性人口
像
60岁以老人
占总人口的13.26%
占总人口的
占总人口的
比2000年上升293个百分点
51.27
48.73%6
2000年2010年
居住在城镇的人口为66557万人,居住在乡村的
人口为67415万人
乡村人口
城镇人國
流动人为26139万人
总人圆的
点总人圆的
比200车增加11700万人
4968
增长8103
20000年
情境思考
′课标要求
′素养目标
探究导学
课堂小结
训练评价(共24张PPT)
§2
抽样的基本方法
2.1
简单随机抽样
妈妈:“儿子,帮妈妈买盒火柴去.”
妈妈:“这次注意点,上次你买的火柴好多划不着.”
儿子高兴地跑回来.
孩子:“妈妈,这次的火柴全划得着,我每根都试过了.”
笑过之后,谈谈你的看法.
这个调查具有破坏性,不能每根都试,不能展开全面调查.
小笑话
为了判断西瓜是否成熟,可在西瓜上挖下一小块先尝尝.一小块西瓜能表明整个西瓜的味道怎样,与此类似,为了了解政府部门、工厂、学校、商品等整体的某个特征,通常都是从总体中抽取样本,再通过样本对总体进行统计、预测结果、估计产品质量.
候选人
预测结果
(%)
选举结果
(%)
Landon
57
38
Roosevelt
43
62
在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意测验,调查兰顿
和罗斯福中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(在1936年电话和汽车只有少数富人拥有),通过分析收回的调查表,显示兰顿非常受欢迎。于是此杂志预测兰顿将在选举中获胜。
实际选举结果正好相反,最后罗斯福在选举中获胜。其数据如下:
[问题]:
你认为预测结果出错的原因是什么?
原因是:用于统计推断的样本来自少数富人,只能代表富人的观点,不能代表全体选民的观点(样本不具有代表性).
总体:所要考察对象的全体.
个体:总体中的每一个考察对象.
样本:从总体中抽取的一部分个体叫做这个总体的一个样本.
样本容量:样本中个体的数目.
总体、个体、样本、样本容量的概念:
统计的基本思想:
用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.
1.通过实例,了解简单随机抽样的含义及其解决问题的过程.2.掌握两种简单随机抽样的方法:抽签法和随机数法.3.在简单的实际情境中,能根据实际问题的特点,选择恰当的抽样方法解决问题.
1.通过对简单随机抽样概念的学习,培养数学抽象素养.
2借助简单随机抽样过程的实施,培养数据分析素养.
体会课堂探究的乐趣,
汲取新知识的营养,
让我们一起
吧!
进
走
课
堂
探究点1
随机抽样
在统计活动中,首先要从实际问题中明确统计的调查对象,即总体,并将总体量化成某个数值后,人们就可以收集样本数据,整理、分析数据,对总体进行估计.
本节主要介绍的统计过程中,抽样的方法在获取数据的时候,首先应关注样本,如何能更好地代表总体.
随机抽样:在抽样调查中,每个个体被抽到的可能性均相同的抽样方法.
比较典型的抽样方法,有简单随机抽样和分层抽样.
探究点2
简单随机抽样
思考:某班有40名学生,从中随机抽取3人作为代表去参加某项测试,应该怎样抽样?
这个问题,总体可以看做全班同学的学号,可以把全班学生的学号依次分别写在40张同样大小的纸条上,同样的方式折叠后放进同一个不透明的容器中,搅拌均匀,然后逐张不放回地从中抽取三张,这样的方式可以保证每名同学被抽到的可能性是一样的,像这样的抽样就属于简单随机抽样.
一般地,从N(N为正整数)个不同个体构成的总体中,逐个不放回的抽取n(
简单随机抽样,通常采用抽签法和随机数法.
注意以下几点:
(1)简单随机抽样要求被抽取样本的总体的个体数N是有限的;
(3)简单随机样本是从总体中逐个抽取的;
(4)简单随机抽样是一种不放回的抽样;
(5)简单随机抽样的每个个体入样的可能性均为
简单随机抽样
(2)简单随机样本数n小于或等于样本总体的个数
N
;
抽签法:先把总体中的N(N为正整数)个个体编号,并把编号依次分别写在形状大小相同的签上(签可以是纸条、卡片和小球等),再将这些号签放在同一个不透明的箱子里,搅拌均匀,每次随机地从中抽取一个,然后将箱中剩下的号签搅拌均匀,再进行下一次抽取,如此下去,直到抽到预先设定的样本容量.
抽签法的具体步骤:1.给总体中的每个个体编号;
2.抽签.
随机数法:先把总体中的N个个体依次编码为0,1,2?N-1,然后利用工具(转盘或摸球、随机数表、科学计算器或计算机)产生0,1,2,?N-1中的随机数,产生的随机数是几就选第几号个体,直至选到预先设定的样本容量.
利用转盘产生随机数是比较简单的,就是先将转盘分成N(N为正整数)等份,分别标上整数0,1,2?N-1,再转动转盘指针指向几就取第几号个体,(重复数字不计)
利用摸球产生随机数也是一样的,就是先将N(N为正整数)个形状、大小、质地完全相同的球,分别标上整数0,1,2?N-1,再放入一个不透明的容器中进行摸球摸到几号球就抽取相应标号的个体,然后将余下的球搅拌均匀,准备下一次摸球.
用随机数表产生随机数是一个常用的方法,在上面的摸球实验中取N=10,每摸出一个球就将球的号码按行,列的方式依次写在一个空白表中,这样就形成了一个随机数表.
利用随机数表进行抽样的具体步骤:
1.给总体中的每个个体编号;
2.在随机数表中随机抽取某行某列作为抽样的起点,并规定读取方法;3.依次从随机数表中抽取样本号码,凡是抽到的编号范围内的号码就是样本的号码,并剔除相同的号码,直至抽满为止.
例1
在由80个个体组成的总体中,利用随机数表随机的选取10个个体组成样本.
解
具体做法如下:
1.将总体中的每个个体进行编号:00,01,02,?79;
2.在随机数表中随机的抽取某行某列,如从第三行,第五列开始横向依次读取两个数字;
3.根据上述原则得到34,13,28,41,42,41,24,24,19,85,93,13,23,22,83,03?,其中41,24,13重复出现,85,93,83超过79,这样选取的10个样本编号为:34,13,28,41,42,24,19,23,22.03.
概念
抽样方法
方法
步骤
特点
方法
步骤
特点
抽
签
法
随机数法
简单随机抽样
简便易行
抽签法
2.简单随机抽样操作办法:
随机数表法
1.简单随机抽样的概念
样本中个体的个数n称为样本容量
注:随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素。
一般地,从N(N为正整数)个不同个体构成的总体中,逐个不放回的抽取n(
D
B
B
120
奔向理想人生的征途是漫长的,但是只要坚强不屈地向前奋进,理想就一定会实现.(共27张PPT)
2.2分层随机抽样
简单随机抽样的特点是什么?
简单随机抽样:
①逐个不放回抽取;
②等可能入样;
③总体容量较小.
设计抽样方法时,核心是如何使抽取的样本具有代表性.因此,应充分利用对总体的了解.当已知总体由差异明显的几部分组成时,如何才能使样本能更充分地反映总体的情况?
1.正确理解分层抽样的概念.2.掌握分层抽样的一般步骤.3.
并会选择适当正确的方法进行抽样.
1.通过对分层随机抽样概念的学习,培养数学抽象素养.
2.借助分层随机抽样过程的实施,培养数据分析素养.
体会课堂探究的乐趣,
汲取新知识的营养,
让我们一起
吧!
进
走
课
堂
例2
某学校开展学生对教师认可满意程度的调查活动,首先通过问卷对全体学生进行普查,然后根据普查结果抽取一部分学生进行访谈.
下面是该学校在普查中对某位教师任教的所有班级(4个班级)的满意度调查结果:
探究点1
分层随机抽样
你认为哪名同学的调查更合理?
同学乙从1号班级、2号班级中抽取一部分同学进行访谈.
同学丙从1号班级、3号班级中抽取一部分同学进行访谈.
同学丁从3号班级、4号班级中抽取一部分同学进行访谈.
现在,想从这4个班级中选取一部分学生进行访谈,有4名同学是这样操作的:
同学甲从2号班级、4号班级中抽取一部分学生进行访谈.
在这个调查中,总体是该教师任教班级每名同学对其任教的满意度,从普查结果来看,总体的分布呈现满意度“高高低低”的现象,因此,在选取访谈学生的抽样时,既不能只选择两个满意度高的班级,也不能只选择两个满意度低的班级,而是要让样本的分布与总体的分布近似相同,也就是说说同学甲和同学丙的抽样更合理一些.
例3
某市有大、中、小型的商店共1500家,且这三种类型的商店的数量之比为1:5:9,要调查全市商店的每日零售额情况,要求抽取30家商店进行调查,应当采用怎样的抽样方法?
在这个问题中,调查的总体是1500家商店的每日零售额,而且在总体中大、中、小型商店的比例是已知的.
在随机抽样过程中,抽取的样本中三种类型商店的比例,应与总体中三种类型商店的比例相同,因此,抽取的30家商店样本应按照1:5:9的比例从大、中、小型商店中抽取,使样本比较好的代表总体的特征.
如果总体是由差异明显的几类个体构成,并且知道每一类个体在总体中所占的百分比,那么按照这个比例抽取每一类个体,样本就能很好地反映总体的规律,也会提高对总体推断的准确性.
将总体按其属性特征分成互不交叉的若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的个体,这种抽样方法通常叫做分层随机抽样.
1.应用分层抽样应遵循以下要求:
(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则.
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与样本容量与总体容量的比相等.
2.分层抽样的步骤:
(1)将总体按一定的标准分层;
(2)总体与样本容量确定抽取的比例;
(3)
确定各层抽取的样本数;
(5)综合每层抽样,组成样本.
(4)在每一层进行抽样
(可用简单随机抽样);
开始
分层
计算比例
定每层抽取容量
抽样
组样
结束
3.简单随机抽样、分层抽样的比较
类别
共同点
各自特点
联
系
适
用
范
围
简单
随机
抽样
分层
抽样
(1)抽样过程中每个个体被抽到的可能性相等
(2)每次抽出个体后不再将它放回,即不放回抽样
从总体中逐个抽取
将总体分成几层,分层进行抽取
各层抽样时采用简单随机抽样或系统抽样
总体中个体较少
总体由差异明显的几部分组成?
是系统抽样和分层抽样的基础
例4
某农田分布在山地、丘陵、平原、洼地不同的地形上,要对这个地区的农作物产量进行调查,应当如何抽样?
解
因为不同类型农田的产量有较大差异,所以应当采用分层随机抽样的方法,对于不同类型的农田及占总数的比例抽取样本.
例5
某公司有1000名员工,其中50名属于高收入者,150名属于中等收入者,800名属于低等收入者,要对该公司员工的具体收入情况进行调查,欲抽取100名员工,应当怎样抽样比较合理?
解
可以采用分层随机抽样的方法,按照该公司员工的收入水平分成三层:高收入者、中等收入者、低收入者.
高收入者为50名,占所有员工的比例为
,
在所抽取的100名员工中,高收入者所占的比例为5%,
即100×5%=5,所以应抽取5名高收入者比较合理,同理,抽取15名中等收入者,80名低收入者,再对他们的具体收入情况分别进行调查.
【变式练习】
某高中有高一学生400人,高二学生300人,高三学生
500人,现用分层抽样的方法在这三个年级中抽取120
人进行体能测试,则从高三抽取的人数应为
(
)
A.40
B.48
C.50
D.80
C
分层抽样是一种实用性、操作性强,应用比较广泛的抽样方法,但必须保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.
【总结提升】
分层抽样
定义
步骤
1.分层:将总体分成互不相交的层
2.求比:根据总体容量N和样本容量n
计算抽样比k=n:N
3.定数:确定每一层应抽取的个体数目
4.抽样:在各层中随机抽取个体,
合在一起得到容量为n的样本
B
900
3.某校高一年级900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________.
【解析】设应抽取的男生人数为x,依题意,女生400名,男生人数为900-400=500,样本容量为45,则
解得x=25,所以应抽取的男生为25名.
答案:25
25
4.某农场在三种地上种玉米,其中平地210亩,河
沟地120亩,山坡地180亩,估计产量时要从中抽取
17亩作为样本,则平地、河沟地、山坡地应抽取的
亩数分别是________.
7,4,6
5.一个电视台在网上就观众对其某一节目的喜爱程度进行调查,参加调查的总人数为12
000人,其中持各种态度的人数如下表所示:
电视台为了了解观众的具体想法和意见,打算从中抽选出60人进行更为详细的调查,为此要进行分层抽样.那么在分层抽样时,每类人中各应抽选出多少人?
很
喜
爱
喜
爱
一
般
不
喜
爱
2435
4567
3926
1072
解:
样本容量与总体的个体数的比为
60:12000=1:200
所以分层抽样时各类人中应抽出的人数分别为:
即近似为
12,
23,
20,
5
当你每天醒来,口袋里便装着24小时的时间,这是属于你自己最宝贵的财产.(共32张PPT)
§3
用样本估计总体分布
我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望85%以上的居民的日常生活不受影响,那么标准a定为多少比较合理?你认为较为合理地确定出这个标准,需要做哪些工作?
前面已经介绍了收集数据的一些方法.一旦数据被收集上来,就希望从中找出需要的信息.通过样本数据的特征,估计总体的相应特征,以便帮助人们做出恰当的判断或决策.
1.掌握利用频数和频率估计样本和总体的特征.2.理解频数与频率的区别和联系.3.学会用频率分布表,画频率分布直方图表示样本数据.4.能通过频率分布表或频率分布直方图对数据做出总体统计.
1.通过对统计图表的识图和读图,培养直观想象素养.2.通过利用频数和频率估计总体分布,培养数据分析素养.3.通过对频率分布直方图画法的学习,培养数据分析素养.4.通过与频率分布直方图有关的计算,培养数学运算素养.
体会课堂探究的乐趣,
汲取新知识的营养,
让我们一起
吧!
进
走
课
堂
探究点1
频数与频率
1.频数:指一组数据中个别数据重复出现的次数或一组数据在某个确定的范围内出现的数据的个数.
2.频率:是频数与数据组中所含数据的个数的比.
3.频数与频率的联系:频数具体地反映了数据分布的情况,频率反映了不同的数据或在不同的范围内出现的数据在整个数据组中所占的比例.它们都反映了一组数据的分布情况.
4.频数与频率的关系:
①各试验结果的频数之和等于试验的总次数.
②各试验结果的频率之和等于1.
在一定程度上,频率的大小反映了事件发生的可能性的大小.频率大,发生的可能性就大;反之频率小,发生的可能性小.
情景1
某工厂生产一批产品,经调查只有十个不合格品.
情景2
某工厂生产一批产品,经调查产品不合格率为1%.
上面哪种情景能更好地反映工厂的生产情况?
“生产了100个产品有10个不合格”与“生产了10
000个产品有10个不合格”,这两种情况虽然都是10个不合格品,但是工厂生产产品的数量却大不相同,因此只知道某个指标的频数是不够的,需要用频率来刻画,频率表示频数与总数的比值能更好地反映样本和总体的相应特征.
例1
下表是某两名篮球运动员的中国男子篮球职业联赛(CBA)某个赛季的得分情况统计:根据这些数据分析,两名运动员的得分水平.
【解析】由上面的数据可以看出,两名运动员的参赛场次相同,每场出场平均时间甲少于乙;甲的均得分和总得分均高于乙.
从投篮命中率、三分球命中率和罚球命中率来看,甲均高于乙,可以认为运动员甲的各项命中率较高.
例2
下面给出了2012年-2016年我国普通高等学校和高中新生录取人数及其相应的录取比例,请根据图中的数据说明频数与频率的不同之处.
解
从2012年-2016年,普通高等学校新生录取人数及其相应的录取比例都在逐年递增;高中新生录取人数基本呈逐年下降趋势,其相应的录取比例基本呈逐年上升趋势.
从频数来看,高中录取新生,2013年822.70万人,2014年是796.60万人,较上一年,减少了26.10万人.但是从这两年的频率来看,2013年-2014年的频率却增长了3.67%.这说明只从频数一个角度分析实际问题是远远不够的.
频率反映了相对总数而言的相对强度其所携带的总体信息远超过频数,在实际问题中,如果总体容量比较小,频数也可以较客观地反映,总体分布,当总体容量较大时,频率就更能客观地反映总体的分布.
在统计中,经常要用样本数据的频率去估计总体中相应的频率,即对总体分布进行估计.
探究点2
频率分布直方图
为了解本市居民的生活成本,同学甲利用假期对所在的社区进行“家庭数”和“家庭每月日常消费额”的调查.他们把调查得到的消费额按大小进行分组,并计算出每组数据在整个数据中占的百分比--频率,结果如下表.
根据上表可以画出右边的图,图中每一个小矩形的底边长是该组的组距,每一个小矩形的高是该组的频率与组距的比,从而每个小矩形的面积等于该组的频率,即每一个小矩形的面积=组距×
=频率.
我们把这样的图叫做频率分布直方图
1
例3
1895年在英国伦敦有106块男性头盖骨被挖掘出土,经考证,这些头盖骨的主人死于1665年-1666年的大瘟疫,人类学家分别测量了这些头盖骨的宽度,数据如下(单位:mm)
请你估计在1665年-1666年英国男性头盖骨宽度的分布情况.
146
141
139
140
145
141
142
131
142
140
144
140
138
139
147
139
141
137
141
132
140
140
141
143
134
146
134
142
133
149
140
140
143
143
149
136
141
143
143
141
138
135
138
144
135
145
143
137
142
146
140
148
140
140
139
139
139
138
146
153
148
152
143
140
141
145
148
139
136
141
140
139
158
135
132
148
142
145
145
121
129
143
148
138
149
146
141
142
144
136
153
148
144
138
150
148
138
145
145
142
143
143
148
141
145
141
解
这里总体是1665年-1666年的英国男性头盖骨的宽度,我们要通过上面挖掘出土得到的样本信息,估计总体的分布情况,因为总体分布是指总体中每类(组)个体所占的比例(百分比),所以我们需要将样本中每类(组)个体所占的比例整理表达出来.
首先将数据排序(可以借助Excel软件)得到宽度的最大值是
158
mm,最小值是121mm,为了更深入地挖掘数据蕴含的信息,得到总体分布信息,我们按照如下步骤处理数据.
1.计算极差:158-121=37
mm,这说明样本观测数据的变化范围是37mm.
2.确定组距与组数:合适的组距和组数对发现数据分布规律有重要意义,组数过少会将很多分布的信息丢失,组数过多则可能会出现很多空档,无法反映实际的分布,当数据在120个以内时,通常按照数据的多少分成5组
至12组,在实际操作中,一般要求各组的组距相等,分组时,可以先确
定组距,也可以先确定组数,若取所有的组距是5mm,则
.
即可以将数据分为8组,这说明这个组距是比较合适的.
3.分组:由于组距为5mm,8个组距的总长度超过极差,因此可以使第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值,所以本例中的106个数据可按如下方式分成8组.
4.列表:统计各组的信息如下表
5.画频率分布直方图:根据上表画出频率分布直方图
从上图可以得到头盖骨的宽度落在各个宽度区间内的频率(例如,宽度在[140,145)的头盖骨所占的频率为43.4%)每个宽度区间内的频率值就是该宽度区间所对应的频率分布直方图的面积,图中所有小矩形的面积之和,就是头盖骨的宽度落在各个宽度区间内的频率之和,这个和等于1.
探究点3
频率折线图
通常,在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,如图,我们称之为频率折线图.
有时也用它来估计总体的分布情况.一般地样品容量越大,用样本的频率分布去估计总体的分布就越精确,随着样本容量的增大,所划分的区间数也可以随之增多,而每一个区间的长度则会相应随之减少,相应的频率折线图就会越来越接近一条光滑的曲线.
【总结提升】
总体分布
样本的频率分布
估计
频率分布表
频率分布直方图
D
2.将样本容量为100的数据按从大到小的顺序分为8组如下表:
9
12
13
15
14
14
13
10
频数
8
7
6
5
4
3
2
1
组号
则第三组的频率为(
)
A.0.14
B.1/14
C.0.03
D.3/14
A
即使一次次的跌倒,我们依然成长.跌倒只是我们成长道路上的一个小小的插曲.(共29张PPT)
§4用样本估计总体的数字特征
4.1样本的数字特征
1.对一个未知总体,我们常用样本的频率分布来估计总体的分布,其中表示样本数据的频率分布的基本方法有哪些?
图、表、总体数据的数字特征
2.下图是某赛季东、西部球队数据,那么如何比较东
部赛区与西部赛区的优劣呢?
如果要求我们根据上面的数据,估计、比较某赛季东部赛区与西部赛区的优劣,就得有相应的数据作为比较依据,即通过样本的数字特征进行研究,用样本的数字特征来估计总体的数字特征.
1.会求样本的众数、中位数、平均数、方差、标准差.2.能用样本的数字特征估计总体的数字特征,并作出合理解释和决策.
1.通过对数据特征数的计算,培养数学运算素养.
2.通过利用数据的特征数估计总体分布,培养数据分析素养.
体会课堂探究的乐趣,
汲取新知识的营养,
让我们一起
吧!
进
走
课
堂
探究点1
样本的数字特征
通常,人们利用样本的数字特征来估计总体的数字特征.例如,用样本的平均数来估计总体的平均数,用样本的方差来估计总体的方差.
在统计问题中,当我们抽取了样本(数据)后,根据初中已经学过的知识,可以计算这组数据的平均数、中位数、
众数、极差、方差等,它们从不同角度反映了数据的数字特征.
平均数:是指这组数据的平均值.平均数是最常用的量,但有时候数据中个别数据特别大和特别小时,用中位数会更合理.
中位数:一般地,将这组数据按从小到大的顺序排列后,中间的那个数据(如果中间是两个数据,就取他们的平均数)为这组数据的中位数.它使数据被分成的两部分数据量是一样的.
众数:是指这组数据中出现次数最多的数据.
极差:是数据中最大值和最小值的差,它计算简单,但没有充分
利用其他数据.
方差:一般用s2表示.假设样本数据x1,x2,…,xn的平均数为
,
则方差的计算公式是:
标准差:最常用的统计量是标准差,一般用s表示.假设样本数据
x1,x2,…,xn的平均数为
,则标准差的计算公式是:
极差和方差都是刻画数据的离散程度,方差刻画的是数据偏离平均数的离散程度,由于方差的单位是原始数据单位的平方,而刻画离散程度的一种理想度量应当具有与原始数据相同的单位,为此,计算方差的算术平方根,称之为标准差.
根据前7场的比赛结果,能否预测谁将获得最后的胜利?
分析:
可以分别计算出5名运动员前七场比赛积分的平均数和标准差,作为判断各运动员比赛的成绩及稳定情况的依据,结果如下表
可以看出,李丽珊的平均得分及得分标准差都比其他运动员的小,也就是说,在前七场的比赛过程中,他的成绩最为优异,而且表现最为稳定.
尽管此时还有4场比赛没有进行,但可以假定每位运动员在各自的11场比赛中发挥的水平大致相同,实际情况也确实如此,因而可以把前七场比赛的成绩作为总体的一组样本,并由此估计每位运动员最后比赛的成绩,所以有足够的理由相信李丽珊在后面的四场比赛中会继续保持优异而稳定的成绩,获得最后的冠军.
而结果是:李丽珊正是凭借着自己优异而稳定的表现,成为了中国香港首位奥运金牌得主.
现要从两名运动员中选拔一人参加比赛,根据两名运动员的运动成绩,如何进行选拔?
分析:要从两名运动员中选拔一人参加比赛,首先应该根据不同的要求和状况确定选拔的标准,然后再根据标准和运动员的成绩进行决策.
情景一
如果十次射击成绩中前九次都是个人独自进行训练的成绩,最后一次是教练在场的射击成绩.
标准1
以两名运动员的最后一次射击成绩作为评价标准,显然应选择乙参加比赛.
情景二
如果这10次射击成绩是大型比赛选拔赛中的射击成绩,作为教练员,你可能怎样制定选拔标准?
标准2
以两名运动员10次射击成绩的众数作为评价标准,选择众数较高者参加比赛,甲射击成绩的众数是9环,乙射击成绩的众数是10环,据此选择乙参加比赛.
标准3
以中位数作为评价标准,选择中位数较高者参加比赛,甲的中位数是9环,乙的中位数是8.5环,据此选择甲参加比赛.
标准4
以两名运动员10次射击成绩的平均数作为评价标准,选择平均数较高者参赛,甲射击成绩的平均数是8.5环,乙射击成绩的平均数是8.6环,据此选择乙参加比赛.
情境3
该运动队的成绩已经超过其他同水平运动队,只要维持目前状态就能取得冠军,因此,教练员需要选择一名运动水平相对稳定的队员参赛.分别按照数据的极差、标准差的大小可以出标准.
标准5
用标准差作为评价标准,标准差越小,成绩越稳定,甲射击成绩的标准差等于0.92环,乙射击成绩的标准差等于1.28环,据此选择甲参加比赛.
根据问题的实际背景,利用数据的数字特征,可以帮助人们进行决策,从而真正的发挥数据分析的作用.值得注意的是,在这里不同的标准没有对和错的问题,也不存在所谓唯一解的问题,而是根据需要来选择好的决策,至于决策的好坏,是根据提出的标准而定的.
甲、乙两名运动员,后者发挥极不稳定,有时成绩好,有冲击金牌的可能,但有时又会很差,可能拿不到名次,前者没有冲击金牌的能力,但他成绩也极为稳定,如果让他参加比赛,保证能得到一块铜牌。在这种情况下,如果运动队,要先保奖牌,那么甲参加应该是更好的选择,反之,如果运动员已经得到了不少银牌和铜牌,最想要的是拿到一块金牌,这时候可能就应该让乙参加比赛.
1.众数:一组数据出现次数最多的数叫众数,众数反映一组数据的多数水平;
2.中位数:一组数据中间的数(起到分水岭的作用),中位数反映一组数据的中间水平;
3.平均数:反映一组数据的平均水平;
4.方差:反映一组数据偏离平均数的程度,用来衡量一批数据的波动大小.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.
5.标准差:是方差的算术平方根,意义在于反映一组数据的离散程度.
D
D
D
进步是从看到自己的落后开始的;高明是从解剖自己的弱点开始的.(共29张PPT)
4.2分层随机抽样的均值与方差
4.3百分位数
应届毕业生王刚想找一份年薪8万元的工作.有一位招聘员告诉王刚:“我们公司50名员工中,最高年收入达到了100万元,他们平均年收入是10万元,加盟我们公司吧.”
根据以上信息,能否判断王刚可以成为此公司的一名高收入者?如果招聘员继续告诉王刚:“员工年收入的变化范围是从7万元到100万元.”这个信息是否可以促使王刚做出决定?
如果经过分层随机抽样得到的样本中的每一个数据,就可以算出样本平均数和样本方差,但是如果不知道样本中的每一个数据,只知道分层抽样中的各层的平均数和方差,以及各层所占的比例(权重),那么如何计算样本的平均数和方差?
1.结合具体实例,掌握分层随机抽样的样本均值和样本方差.2.结合实例,能用样本估计百分位数,理解百分位数的统计含义.
1.通过计算分层随机抽样的样本的均值和方差,培养数学运算素养.
2.通过学习分层随机抽样的样本均值和样本方差的意义,培养数据分析素养.
体会课堂探究的乐趣,
汲取新知识的营养,
让我们一起
吧!
进
走
课
堂
探究点1
分层随机抽样的均值与方差
思考:
某学校高一年级,如果只知道甲班和乙班的数学平均成绩和方差,以及甲班和乙班的人数,而缺少每名同学的成绩,如何计算整个高一年级数学的平均成绩和方差呢?
例4
某公司的高收入员工月平均工资是11
000元,中等收入员工月平均工资是6
500元,低收入员工月平均工资是2
900元,能否认为该公司员工的月平均工资是
(元)?这样计算平均数的方法合理吗?
解
在这个问题中,如果该公司有1000名员工,其中50名属于高收入者,150名属于中等收入者,800名属于低收入者,那么由于每一类员工所占比例不同,特别是高收入者很少,他们的月平均工资对该公司员工的月平均工资影响较小.因此,上述计算方法显然是不合理.
【解析】好评率是由好评人数除以总评价人数得到的.98%的好评率意味着如果有100个人评价,那么其中98人给了好评.
设在网站A评价该餐馆的人数为n1,其中给出好评的人数为m1,在网站B评价该餐馆的人数为n2,其中给出好评的人数为m2,由题目条件,
98%,
85%.
例5
甲、乙两位同学相约晚上在某餐馆吃饭,他们分别在A,B两个网站查看同一家餐馆的好评率,甲在网站A查到好评率98%,而乙在网站B查到好评率是85%,综合考虑这两个网站的信息,应该如何得到这家餐馆的总好评率?
综合A,B两个网站的信息,这家餐馆的好评率应该为
,
化简得
,
其中
分别是各自的权重,总好评率等于相应的好评率与其权重乘积的和.
所以除非再知道A,B两个网站评价人数的比例关系,否则并不能求出总好评率,由以上分析可知,当且仅当n1=n2时,总好评率等于
91.5%.
分层随机抽样的平均数
(1)定义:一般地,将样本a1,a2,…,am和样本b1,b2,…,bn合并成一个新样本,则这个新样本的平均数为
探究点2
分层随机抽样的方差
例6
甲、乙两班参加了同一学科的考试,其中甲班50人,乙班40人.甲班的平均成绩为80.5分,方差为500;乙班的平均成绩为85分,方差为360.那么甲、乙两班全部90名同学的平均成绩和方差分别是多少?
解
设甲班50名同学的成绩分别为a1,a2,?,a50,那么甲班的平均成绩、权重和方差分别是
设乙班40名同学的成绩分别为b1,b2,?,b40,那么乙班的平均成绩、权重和方差分别是
如果不知道a1,a2,?,a50和b1,b2,?,b40,只知道甲、乙两班的平均成绩、方差及权重
,那么根据前面的分析,全部90名学生的平均成绩应为
而全部90名学生的方差为
探究点3
百分位数
当总体是长度,质量,时间等连续变量,使人们常常会考虑总体与样本的另一种数字特征--百分位数.
中位数:总体的中位数,有这样的特点:总体数据中的任一个数小于或等于它的可能性是50%,因此也称中位数为50%分位数.
例如,表中记录了某地区一年内的月降水量
把这组数据由小到大排序,得
46
48
51
53
53
56
56
56
58
64
66
71
根据上述步骤可以得出该地区的月降水量的三个百分位数
例7
对于本章“3.2频率分布直方图”中的头盖骨问题,分别求5%,25%,50%,75%和95%的分位数.
解
因为该样本共有106个数据,所以,106×5%=5.3,106×25%=26.5,106×50%=53,106×75%=79.5,106×95%=100.7.
将所有数据由小到大排列后,第6个数据是133,从而得到5%分位数为133mm,同理,25%,50%,75%和95%分位数分别为139mm,
141mm,145mm和149mm.
【即时训练】
A
D
A
追赶时间的人,生活就会宠爱他;放弃时间的人,生活就会冷落他.