(共36张PPT)
9.1.1 简单随机抽样
课程 标准 1.了解全面调查与抽样调查的异同.
2.理解抽样调查的目的和基本要求.
3.掌握简单随机抽样中的抽签法、随机数法的一般步骤.
4.了解总体均值、样本均值的定义和求解公式.
1
基础落实·必备知识全过关
2
重难探究·能力素养全提升
01
基础落实·必备知识全过关
知识点1 全面调查、抽样调查及抽样方法
1.全面调查和抽样调查
调查 方式 全面调查 抽样调查
定义 对每一个调查对象都进行调查的方法,称为全 面调查,又称普查 根据一定目的,从总体中抽取一部分个
体进行调查,并以此为依据对总体的情
况作出估计和推断的调查方法,称为抽
样调查
调查 方式 全面调查 抽样调查
相关 概念 总体:在一个调查中,把调查对象的全体称为 总体(也可以把调查对象的某些指标的全体 作为总体) 个体:组成总体的每一个调查对象称为个体 (也可以把每一个调查对象的相应指标作为 个体) 样本:把从总体中抽取的那部分个体称
为样本
样本容量:样本中包含的个体数称为样
本容量,简称样本量
续表
2.两种基本的抽样方法
过关自诊
1.判断正误.(正确的画 ,错误的画 )
(1)调查我市冷饮市场雪糕质量适宜采用全面调查的方式. ( )
×
(2)调查我市中学生的身体素质适宜采用抽样调查的方式. ( )
√
2.抽样调查的优点有哪些
提示 抽样调查由于只抽取一部分个体进行调查,因此具有花费少、效率高的特点.在总体的调查中,如果经费、时间等方面受限,或者调查具有破坏性,那么抽样调查是比较合适的调查方法.
知识点2 简单随机抽样
一般地,设一个总体含有 ( 为正整数)个个体,从中______抽取 个个
体作为样本.
逐个
说明:(1)通过简单随机抽样获得的样本称为简单随机样本.
(2)除非特殊声明,本章中所称的简单随机抽样指不放回简单随机抽样,这是因为
与放回简单随机抽样相比,不放回简单随机抽样的效率更高,因此实践中人们更多采用不
放回简单随机抽样.
过关自诊
1.判断正误.(正确的画 ,错误的画 )
(1)在进行不放回抽样时,总体内未进入样本的各个个体被抽到的概率都相等. ( )
√
(2)从总体中,逐个不放回随机抽取 个个体作为样本和一次性批量随机抽取 个个体
作为样本,这两种方法是等价的. ( )
√
2.下列抽样的方式属于简单随机抽样的个数为( )
①将500个个体编号,把号签放在一个不透明的容器内搅拌均匀,从中逐个抽取50个作为
样本;
②某班有55个同学指定个子最高的5名同学参加学校组织的篮球赛;
③福利彩票用摇奖机摇奖.
B
A.1 B.2 C.3 D.0
[解析] ②不是等可能抽取,故不是简单随机抽样,①③是简单随机抽样.
知识点3 抽签法和随机数法
1.抽签法
先给个体编号,然后把所有编号写在外观、 质地等无差别的小纸片(也可以是卡
片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌.最后从盒
中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要
的人数.
抽签法简单易行,但当总体较大时,操作起来比较麻烦.因此,抽签法一般适用于总体
中个体数不多的情形.
2.随机数法
先给个体编号,用随机数工具产生编号范围内的整数随机数,把产生的随机数作为抽
中的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需要的人数.
如果生成的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生
随机数,直到产生的不同编号个数等于样本所需要的人数.
名师点睛
抽签法与随机数法的异同
共同点:(1)抽签法和随机数法都是简单随机抽样的方法,并且要求被抽取样本的
总体的个体数有限;(2)抽签法和随机数法都是不放回抽样.
不同点:(1)抽签法相对于随机数法简单;(2)随机数法更适用于总体中的个体数
较多的时候,而抽签法适用于总体中的个体数相对较少的情况.
过关自诊
1.判断正误.(正确的画 ,错误的画 )
(1)抽签法和随机数法都是不放回抽样. ( )
√
(2)抽签法抽签时,先抽签的人占便宜. ( )
×
(3)生成随机数的方式多种多样,可以用随机试验生成随机数,也可用计算器、数学软
件、统计软件生成随机数. ( )
√
(4)在使用随机数法时,各个个体的编号位数要相同. ( )
√
2.采用抽签法抽取样本时,为什么将编号写在形状、大小相同的号签上,并且将号签放在同一个箱子里搅拌均匀?
提示 为了使每个号签被抽取的可能性相等,保证抽样的公平性.
知识点4 总体均值、样本均值
1.一般地,总体中有 个个体,它们的变量值分别为 , , , ,则称
_______为总体均值,又称总体平均数,如果总体的 个变量值中,不同
的值共有 个,不妨记为 , , , ,其中 出现的频数 ,则总
体均值还可以写成加权平均数的形式 _ ________.
2.如果从总体中抽取一个容量为 的样本,它们的变量值分别为 , , , ,则称
_______为样本均值,又称样本平均数,在简单随机抽样中,我们常用样
本平均数 去估计总体平均数 .
过关自诊
1.判断正误.(正确的画 ,错误的画 )
(1)由于样本的选取是随机的,因此样本平均数也是具有随机性. ( )
√
(2)在样本平均数绘制的图形中,样本量大的一般偏离总体平均数更小. ( )
√
2.最近学校进行了一次质量检测,某学生的语文、英语、数学成绩分别是92分,93分,97分,
那么他这三科的平均分是多少?如果3个数据变为100个数据呢?再变为 个数据呢?
你能求它们的平均数吗?
提示 (1)三科平均分为 (分).
(2)若将3个数据改为100个数据,设这100个数据分别为 , , , , ,则其平均
数为 .
(3)若将3个数据改为 个数据,设这 个数据分别为 , , , , ,
则其平均数为 .
02
重难探究·能力素养全提升
探究点一 简单随机抽样的选择与判断
【例1】 下列问题中,最适合用简单随机抽样方法抽取样本的是( )
B
A.某电影院有32排座位,每排有40个座位,座位号是 .有一次报告会坐满了听众,报
告会结束以后为听取意见,要留下32名听众进行座谈
B.从10台冰箱中抽出3台进行质量检查
C.某学校有在编人员160人.其中行政人员16人,教师112人,后勤人员32人.教育部门为了
了解他们对学校机构改革的意见,要从中抽取一个容量为20的样本
D.某乡农田有山地8 000公顷,丘陵12 000公顷,平地24 000公顷,洼地4 000公顷,现抽取
农田480公顷,估计全乡农田每公顷的平均产量
[解析] 根据简单随机抽样的特点进行判断 项中的总体容量较大,用简单随机抽样法比较麻烦;B项中的总体容量较小,用简单随机抽样法比较方便;C项中,由于学校各类人员对这一问题的看法可能差异较大,不宜采用简单随机抽样法;D项中,总体容量较大,且各类农田的产量差别很大,也不宜采用简单随机抽样法.
规律方法 简单随机抽样要注意:
(1)总体中的个体性质相似,无明显层次;
(2)总体容量较小,尤其样本容量较小;
(3)抽出的个体带有随机性,个体间一般无固定间距;
(4)每个个体入样的可能性均为 .
变式训练1(1) 在简单随机抽样中,某一个体被抽到的可能性( )
B
A.与第几次抽样有关,第一次抽到的可能性大一些
B.与第几次抽样无关,每次抽到的可能性都相等
C.与第几次抽样有关,最后一次抽到的可能性要大些
D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不一定
[解析] 在简单随机抽样中,每一个个体被抽到的可能性都相等,与第几次抽样无关,故A,C,D不正确,B正确.
(2)下列抽取样本的方式属于不放回简单随机抽样的是( )
①从无限个个体中抽取100个个体作样本;②盒子里有80个零件,从中选出5个零件进行质
量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;③从8
台电脑中不放回地随机抽取2台进行质量检验(假设8台电脑已编好号,对编号逐个随机
抽取).
C
A.① B.② C.③ D.以上都不对
[解析] ①不是不放回简单随机抽样,由于被抽取样本的总体的个体数是无限的,而不是有限的.②是放回简单随机抽样.③是不放回简单随机抽样.
探究点二 简单随机抽样等可能性应用
【例2】 一个布袋中有10个同样质地的小球,从中不放回地依次抽取3个小球,则某一特
定小球被抽到的可能性是_ __,第三次抽取时,剩余每个小球被抽到的可能性是__.
[解析] 因为简单随机抽样过程中每个个体被抽到的可能性均为 ,所以第一个空填 .
因为本题中的抽样是不放回抽样,所以第一次抽取时,每个小球被抽到的可能性为 ,第
二次抽取时,剩余9个小球,每个小球被抽到的可能性为 ,第三次抽取时,剩余8个小球,每
个小球被抽到的可能性为 .
规律方法 简单随机抽样,每次抽取时,总体中各个个体被抽到的可能性相同,在整个抽样
过程中各个个体被抽到的机会也都相等.
探究点三 简单随机抽样的方法
角度1.抽签法的应用
【例3】 要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,并写出抽样过程.
解 应使用抽签法.
第一步,将30辆汽车编号,号码是01,02,03, ,30;
第二步,将 这30个编号写在大小、形状都相同的号签上;
第三步,将写好的号签放入一个不透明的容器中,并搅拌均匀;
第四步,从容器中不放回地每次抽取一个号签,连续抽取3次,并记录上面的编号;
第五步,所得号码对应的3辆汽车就是要抽取的对象.
规律方法 1.一个抽样试验能否用抽签法,关键看两点:
(1)制签方便;
(2)个体之间差异不明显.
2.应用抽签法时应注意以下几点:
(1)编号时,如果已有编号可不必重新编号;
(2)号签要求大小、形状完全相同;
(3)号签要搅拌均匀;
(4)要逐一不放回的抽取.
变式训练2 某城市共有36个大型居民小区,要从中抽取7个调查了解居民小区的物业管理状况.请写出用抽签法抽取样本的过程.
解 第一步,将36个居民小区进行编号,分别为01,02,03, ,36.
第二步,将36个号码分别写在相同的纸片上,揉成团,制成号签.
第三步,将号签放入一个不透明的盒子里,充分搅匀,依次抽取7个号签,并记录上面的号码.
第四步,与这7个号码对应的居民小区就是要抽取的样本.
角度2.随机数法的应用
【例4】 某车间工人加工了一批零件共40件,为了了解这批零件的质量情况,要从中抽取10件进行检验,下面给出了计算器生成的随机数,利用给出的数据如何采用随机数法抽取样本 写出抽样步骤.
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28
解 第一步,先将40件零件编号,可以编为00,01,02, ,38,39.
第二步,在随机数中任选一个数作为开始,例如从随机数中的第3行第9列的数5开始.
第三步,从选定的数5开始向右读下去,得到一个两位数字号码59,由于 ,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34.至此,10个样本号码已经取满,于是,所要抽取的样本号码是16,19,10,12,07,39,38,33,21,34.与这10个号码对应的零件即是抽取的样本个体.
规律方法 利用随机数法进行抽样的注意点
变式训练3 要考察某种品牌的850粒种子的发芽率,从中抽取50粒种子进行试验,利用随
机数表法抽取种子,先将850粒种子按001,002, ,850进行编号,如果从计算器生成的随
机数第3行第6列的数开始向右读,请依次写出最先检验的4粒种子的编号:_____________
___.(下面抽取了随机数第1行至第5行)
03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 95
97 74 24 67 62 42 81 14 57 20 42 53 32 37 32 27 07 36 07 51 24 51 79 89 73
16 76 62 27 66 56 50 26 71 07 32 90 79 78 53 13 55 38 58 59 88 97 54 14 10
12 56 85 99 26 96 96 68 27 31 05 03 72 93 15 57 12 10 14 21 88 26 49 81 76
55 59 56 35 64 38 54 82 46 22 31 62 43 09 90 06 18 44 32 53 23 83 01 30 30
227,665,650,267
[解析] 从随机数第3行第6列的数2开始向右读第一个小于850的数字是227,第二个数字是665,第三个数字是650,第四个数字是267,符合题意.
本节要点归纳
1.知识清单:
(1)全面调查和抽样调查.
(2)简单随机抽样.
(3)抽签法、随机数法.
(4)用样本平均数估计总体平均数.
2.方法归纳:数据分析.
3.常见误区:要注意在简单随机抽样中,每个个体被抽取的可能性是相等的.(共33张PPT)
9.1.2 分层随机抽样 9.1.3 获取数据的途径
课程 标准 1.了解分层随机抽样的概念.
2.掌握分层随机抽样的一般步骤和相关的数据计算.
3.理解简单随机抽样与分层随机抽样的异同.
4.了解数据的随机性及数据获取的基本途径.
1
基础落实·必备知识全过关
2
重难探究·能力素养全提升
01
基础落实·必备知识全过关
知识点1 分层随机抽样
1.分层随机抽样的定义
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个
子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一
起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为____.在分层随机
抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为________
___.
层
比例分配
2.分层随机抽样中重要的关系式
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为 和 ,抽
取的样本量分别为 和 .我们用 , , , 表示第1层各个个体的变量值,用 ,
, , 表示第1层样本的各个个体的变量值;用 , , , 表示第2层各个个体的
变量值,用 , , , 表示第2层样本的各个个体的变量值,则第1层的总体平均数和
样本平均数分别为 , .
第2层的总体平均数和样本平均数分别为 ,
.
总体平均数和样本平均数分别为 , .
由于用第1层的样本平均数 可以估计第1层的总体平均数 ,用第2层的样本平均
数 可以估计第2层的总体平均数 ,因此我们可以用 估计总体
平均数 .
在比例分配的分层随机抽样中, ,可得
.
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数 估计总体平均
数 .
过关自诊
1.判断正误.(正确的画 ,错误的画 )
(1)分层随机抽样中,个体数量较少的层抽取的样本量较少,这是不公平的. ( )
×
(2)从全班50名同学中抽取5人调查作业完成情况适合用分层随机抽样. ( )
×
2.分层随机抽样的适用条件是什么
提示 在总体中存在着明显的层次,不同层次个体之间差异较大,层内个体间差异较小.
知识点2 获取数据的途径
获取数据的基本途径 适用类型 注意问题
通过调查获取数据 对于有限总体问题, 一般通过抽样调查或 普查的方法获取数据 要充分有效地利用背景信息选择或创建更好的抽
样方法,并有效地避免抽样过程中的人为错误
通过试验获取数据 没有现存的数据可以 查询 严格控制试验环境,通过精心的设计安排试验,以
提高数据质量
通过观察获取数据 自然现象 借助专业测量设备通过长久的持续观察获取数据
通过查询获得数据 众多专家研究过,其 收集的数据有所存储 必须根据问题背景知识“清洗”数据,去伪存真,
为进一步的数据分析奠定基础
过关自诊
1.判断正误.(正确的画 ,错误的画 )
(1)要了解某年级同学每天参加体育锻炼的时间,可以采用调查的方式获取数据. ( )
√
(2)农科院获取小麦新品种的产量可以通过查询获取数据. ( )
×
2.如图是国家对某沙漠地区植树面积计划的统计图.
(1)图中的树高表示什么?从图中能获得哪些信息?
提示 树高表示计划植树亩数,从图上看,计划植树面积一年比一年多.
(2)各年份约种树多少万亩?
提示 2015年种树约50万亩,2016年种树约75万亩,2017年种树约100万亩,2018年种树约150万亩,2019年种树约200万亩.
(3)若每人每年平均植树10亩,在各时间段需要多少人?
提示 2015年需5万人,2016年需7.5万人,2017年需10万人,2018年需15万人,2019年需20万人.
02
重难探究·能力素养全提升
探究点一 对分层随机抽样概念的理解
【例1】(1) 某校有1 700名高一学生,1 400名高二学生,1 100名高三学生.高一数学
兴趣小组欲采用分层随机抽样的方法在全校抽取42名学生进行某项调查,则下列说法正
确的是( )
D
A.高一学生被抽到的可能性最大 B.高三学生被抽到的可能性最大
C.高三学生被抽到的可能性最小 D.每名学生被抽到的可能性相等
[解析] 在分层随机抽样中,每个个体被抽到的可能性相等.故每名学生被抽到的可能性相等,故选D.
(2)①从10台电冰箱中抽取3台进行质量检查;
②某社区有1 200户家庭,其中高收入家庭420户,中等收入家庭470户,低收入家庭310户,为了调查该社区购买力的某项指标,要从所有家庭中抽取一个容量为120的样本.
上述问题中,各自宜采用什么抽样方法?
解 ①采用抽签法,因为总体容量较小,宜采用抽签法.
②采用分层随机抽样,因为购买力与收入有关,社区中家庭收入层次明显,宜采用分层随机抽样.
规律方法 分层随机抽样的一个前提和遵循的两个原则
(1)前提:分层随机抽样的适用前提条件是总体可以分层,层与层之间有明显区别,
而层内个体间差异较小.
(2)遵循的两个原则:
①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不
重复、不遗漏的原则;
②分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每
层样本量与每层的大小成比例.
变式训练1(1) 某校高三年级有男生500人,女生400人,为了解该年级学生的健康状况,
从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是( )
D
A.简单随机抽样 B.抽签法 C.随机数法 D.分层随机抽样
[解析] 从男生500人中任意抽取25人,从女生400人中任意抽取20人,每层的样本量与层的大小成比例,因此用的是分层随机抽样.
(2)为了保证分层随机抽样时,每个个体等可能地被抽取,必须要求( )
C
A.每层的个体数必须一样多
B.每层抽取的个体数相等
C.每层抽取的个体可以不一样多,但必须满足 ,其中 是层数,
是样本容量, 是第 层所包含的个体数, 是总体容量
D.只要抽取的样本量一定,每层抽取的个体数没有限制
[解析] 每层的个体数不一定都一样多,故A错误;由于每层的容量不一定相等,每层抽同
样多的个体,从总体来看,各层之间的个体被抽取的可能性就不一样了,故B错误;对于第
层的每个个体,它被抽到的可能性与层数 无关,即对于每个个体来说,被抽入样本的可能
性是相同的,故C正确;每层抽取的个体数是有限制的,故D错误.
探究点二 分层随机抽样的应用
【例2】 某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人.教育部门为了了解在职人员对学校机构改革的意见,要从中抽取一个容量为20的样本,请利用分层随机抽样的方法抽取,写出抽样过程.
解 抽样过程如下:第一步,确定抽样比,样本量与总体的个体数的比为 .
第二步,确定分别从三类人员中抽取的人数,从行政人员中抽取 (人);
从教师中抽取 (人);从后勤人员中抽取 (人).
第三步,采用简单随机抽样的方法,抽取行政人员2人,教师14人,后勤人员4人.
第四步,把抽取的个体组合在一起构成所需样本.
规律方法 分层随机抽样的步骤
变式训练2 一个单位有职工800人,其中具有高级职称的有160人,具有中级职称的有320
人,具有初级职称的有200人,其他人员有120人.为了解职工收入情况,决定采用分层随机
抽样的方法,从中抽取容量为40的样本,则从上述各层中依次抽取的人数分别是( )
D
A.12,24,15,9 B.9,12,12,7 C.8,15,12,5 D.8,16,10,6
[解析] 由题意知有各种职称的人数和其他人员的人数之比为
,
所以抽取的具有高、中、初级职称的人数和其他人员的人数分别为 ,
, , .
探究点三 分层随机抽样中的相关计算问题
【例3】 交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对
甲、乙、丙、丁四个社区做分层随机抽样调查.假设四个社区驾驶员的总人数为 ,其中
甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,4
3,则这四个社区驾驶员的总人数 为( )
B
A.101 B.808 C.1 212 D.2 012
[解析] 由分层随机抽样的概念知 ,
即 ,解得 .
规律方法 1.一个总体中有 个个体,用分层随机抽样的方法从中抽取一个容量为 的样
本,若第 层的个体数为 ,则第 层被抽取的个体数 .等式中含有四个量,已知
其中任意三个量,就能求出第四个量.
2.在分层随机抽样中,注意以下关系:
(1) ;
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.
变式探究 若将本例中“甲社区有驾驶员96人”改为“甲、乙社区驾驶员共99人”,则 的值
是什么?
解 由分层随机抽样的概念知 ,
即 ,解得 .
变式训练3 某校高二有创新班学生400人,实验班学生800人,为调查总体学生数学成绩的
平均值,按比例分配进行分层随机抽样,从创新班抽出20人,从实验班抽出40人,通过计算
创新班平均成绩为125分,实验班平均成绩为95分,则高二总体数学成绩平均值为( )
D
A.110 B.125 C.95 D.105
探究点四 获取数据途径的选择
【例4】 “中国天眼”为500米口径球面射电望远镜,是具有
我国自主知识产权、世界最大单口径、最灵敏的射电望
远镜.建造“中国天眼”的目的是( )
C
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
[解析] 建造“中国天眼”的目的主要是通过观察获取数据.
规律方法 选择获取数据的途径的依据
选择获取数据的途径的依据主要是根据所要研究问题的类型,以及获取数据的难易
程度.有的数据可以有多种获取途径,有的数据只能通过一种途径获取,选择合适的方法
和途径能够更好地提高数据的可靠性.
变式训练4 下列哪些数据一般是通过试验获取的( )
D
A.2021年济南市的降雨量 B.2022年新生儿人口数量
C.某学校高一年级同学的数学测试成绩 D.某种特效中成药的配方
[解析] 某种特效中成药的配方的数据一般通过试验获得.
探究点五 数据的获取与调查方案的设计
【例5】 为调查小区平均每户居民的月用水量,下面是三名学生设计的方案:
学生甲:我把这张《月用水量调查表》放在互联网上,只要是上网登录该网站的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,就可以很快估算出小区平均每户居民的月用水量.
学生乙:我给我们居民小区的每一个住户发一张《月用水量调查表》,只要一两天就可以统计出小区平均每户居民的月用水量.
学生丙:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给这些住户打电话,问一下他们的月用水量,然后就可以估算出小区平均每户居民的月用水量.
请你分析上述三名学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有何建议?
解 学生甲的方法得到的样本不能够反映不上网的居民的情况,它所得到的样本代表性差,不能准确地获得平均每户居民的月用水量.
学生乙的方法实际上是普查,花费的人力、物力更多一些,但是如果统计过程不出错,可以准确地得到平均每户居民的月用水量.
学生丙的方法是随机抽样.如果该小区的每户居民都装有电话,建议用随机抽样方法获得数据,即用学生丙的方法,既节省人力、物力,又可以得到比较精确的结果.
规律方法 分析各个方案是否合理,要从各方案中所得的样本是否具有代表性及获取样
本的工作量大小两个方面来考虑.
本节要点归纳
1.知识清单:
(1)分层随机抽样的定义.
(2)分层随机抽样的应用及相关运算.
(3)获取数据的途径及调查方案的设计.
2.方法归纳:数据处理.
3.常见误区:注意在分层随机抽样中,每个个体被抽到的可能性相同.(共49张PPT)
9.2.1 总体取值规律的估计
9.2.2 总体百分位数的估计
课程 标准
1
基础落实·必备知识全过关
2
重难探究·能力素养全提升
01
基础落实·必备知识全过关
知识点1 频率分布表与频率分布直方图
1.频率分布表
为了能直观地显示样本的频率分布情况,通常将分组、频数累计、频数、频率列在
一张表中,这张表叫做频率分布表.
2.频率分布直方图
为了将频率分布表中的结果直观形象地表现出来,常画出频率分布直方图.画图时,
应以横轴表示分组、纵轴表示各组 <
m> ,以各个组距为底,以 为高,画成小长方形,
各小长方形的面积表示相应各组的频率,这样得到的直方图就是频率分布直方图.
名师点睛
列出一组样本数据的频率分布表的基本步骤:第一步,求极差.第二步,决定组距与组
数.第三步,将数据分组.第四步,列频率分布表.
过关自诊
1.判断正误.(正确的画 ,错误的画 )
(1)频率分布直方图中的纵轴表示频率. ( )
×
(2)频率分布直方图中每个小长方形的面积等于相应组的频率. ( )
√
2.什么叫频数与频率?
提示 将一批数据按要求分为若干个组,各组内数据的个数叫做该组的频数.每组数据的频数除以样本容量得到的商叫做该组数据的频率.频率反映各个小组数据在样本中所占比例的大小.
知识点2 扇形图、条形图和直方图、折线图
统计图表 主要应用
扇形图 直观描述各类数据占总数的比例
条形图和直方图 直观描述不同类别或分组数据的频数和频率
折线图 描述数据随时间的变化趋势
过关自诊
1.判断正误.(正确的画 ,错误的画 )
(1)扇形统计图表示的是比例,条形统计图不是表示比例. ( )
×
(2)折线图主要用于描述数据随时间的变化趋势. ( )
√
(3)在解决问题的过程中,要根据实际问题的特点,选择恰当的统计图对数据进行可视
化描述. ( )
√
2.把过期的药品随意丢弃,会造成对土壤和水体的污染,
危害人们的健康.针对如何处理过期药品的问题,有关机
构随机对若干家庭进行调查,调查结果如图,其中对过期
药品处理不正确的家庭达到( )
D
A. B. C. D.
[解析] .
知识点3 第 百分位数
1.第 百分位数的定义
一般地,一组数据的第 百分位数是这样一个值,它使得这组数据中至少有 的数
据小于或等于这个值,且至少有 的数据大于或等于这个值.
2.计算一组 个数据的第 百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算 ________.
第3步,若 不是整数,而大于 的比邻整数为 ,则第 百分位数为第 项数据;若 是整
数,则第 百分位数为第 项与第 项数据的平均数.
过关自诊
1.判断正误.(正确的画 ,错误的画 )
(1)任何一组数据的第50百分位数与中位数的值是相同的. ( )
√
(2)第25百分位数也可以称为第一四分位数或上四分位数. ( )
×
(3)若一组样本数据的第10百分位数是23,则在这组数据中有 的数据大于23. ( )
×
2.一位班级人数为50的班主任老师说“ 的同学能够考取本科院校”,这里的“ ”是
百分位数吗?
提示 不是.这里的 是指能够考取本科院校的同学占同学总数的百分比.
02
重难探究·能力素养全提升
探究点一 频率分布直方图
角度1.频率分布直方图的绘制
【例1】 某省为了了解和掌握某年高考考生的实际答卷情况,随机地取出了100名考生
的数学成绩,数据如下:(单位:分)
135
125
105
109
129
111
129
99
102
123
解 100个数据中,最大值为135,最小值为80,极差为 .
取组距为5,则组数为 .
(1)列出频率分布表;
解 频率分布表如下:
分组 频数累计 频数 频率 频率/组距
1 0.01 0.002
2 0.02 0.004
4 0.04 0.008
14 0.14 0.028
24 0.24 0.048
15 0.15 0.030
分组 频数累计 频数 频率 频率/组距
12 0.12 0.024
9 0.09 0.018
11 0.11 0.022
6 0.06 0.012
2 0.02 0.004
合计 100 1.00 0.200
注:表中加上“频率/组距”一列,这是为画频率分布直方图准备的,因为它是频率分布直方图的纵坐标.
续表
(2)画出频率分布直方图和折线图;
解 根据频率分布表中的有关信息画出频率分布直方图及折线图,如图所示.
(3)估计该省考生数学成绩在 分的比例.
解 从频率分布表中可知,这100名考生的数学成绩在 分的频率为
,据此估计该省考生数学成绩在 分的比例为
.
规律方法 绘制频率分布直方图的关注点
(1)在列频率分布表时,极差、组距、组数有如下关系:
①若 为整数,则 组数;
②若 不为整数,则 的整数部分 组数.
(2)组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分
布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况,若样本容量
不超过100,按照数据的多少常分为 组,一般样本容量越大,所分组数越多.
变式训练1 为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组情况与频数如下:
,3; ,9; ,13; ,16; ,26; ,20; ,7; ,4; ,2.
(1)列出频率分布表;
解 频率分布表如下:
分组 频数 频率
3 0.03
9 0.09
13 0.13
16 0.16
26 0.26
分组 频数 频率
20 0.20
7 0.07
4 0.04
2 0.02
合计 100 1.00
续表
(2)画出频率分布直方图以及频率分布折线图;
解 频率分布直方图及频率分布折线图如图:
(3)根据上述图表,估计数据落在 范围内的可能性是百分之几;
解 由上述图表可知数据落在 范围内的频率为
,即数据落在 范围内的可能性是
.
(4)估计数据小于11.20的可能性是百分之几.
解 数据小于11.20的可能性即数据小于11.20的频率,设为 ,则
,所以 ,
即 ,从而估计数据小于11.20的可能性是 .
角度2.频率分布直方图的应用
【例2】 “水是生命之源”,但是据科学统计,可用淡水资
源仅占地球储水总量的 ,全世界近 人口受到
水荒的威胁.某市为了鼓励居民节约用水,计划调整居民
生活用水收费方案,拟确定一个合理的月用水量标准
(单位: ):一位居民的月用水量不超过 的部分按平
价收费,超出 的部分按议价收费.为了了解居民用水情况,通过随机抽样,获得了某年100
位居民每人的月均用水量(单位: ),将数据按照 , , , 分成9组,
制成了如图所示的频率分布直方图.
(1)若该市有60万居民,估计全市居民中月均用水量不低于 的人数,并说明理由;
解 由题图可知,月均用水量不低于 的人数所占百分比为
,
所以估计全市居民中月均用水量不低于 的人数为 (万).
(2)若该市政府希望使 的居民每月的用水不按议价收费,估计 的值,并说明理由.
解 估计 的值为2.8.理由如下:由(1)可知,月均用水量小于 的居民人数所占百分比
为 ,
即 的居民月均用水量小于 ,
则 ,
所以 的居民月均用水量小于 ,故 ,
所以 .
故估计 的值为2.8.
规律方法 频率分布直方图中相关计算的求解策略
(1)因为小长方形的面积 组距 频率,所以各小长方形的面积表示相应
各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大
小.
(2)在频率分布直方图中,各小长方形的面积之和等于1.
(3) 样本量.
(4)在频率分布直方图中,各长方形的面积之比等于频率之比,各长方形的高度之
比也等于频率之比.
变式训练2 [2023北京月考] 某部门计划对某路
段进行限速,为调查限速 是否合理,对通
过该路段的300辆汽车的车速进行检测,将所得数
据按 , , , 分组,绘
制成如图所示的频率分布直方图.则 ______;
这300辆汽车中车速低于限速 的汽车有
_____辆.
0.025
180
[解析] 由 ,解得 .
这300辆汽车中车速低于限速 的汽车有
(辆).
探究点二 对扇形图、条形图、折线图的识读
角度1.扇形图
【例3】 如图是A,B两所学校艺术节期间收到的各类艺术作品的情况的统计图:
(1)从图中能否看出哪所学校收到的水粉画作品数量多?为什么?
解 不能.因为两所学校收到艺术作品的总数不知道.
(2)已知A学校收到的剪纸作品比B学校的多20件,收到的书法作品比B学校的少100件,请问这两所学校收到艺术作品的总数分别是多少件?
解 设A学校收到艺术作品的总数为 件,B学校收到艺术作品的总数为 件,
则 解得
即A学校收到艺术作品的总数为500件,B学校收到艺术作品的总数为600件.
规律方法 1.绘制扇形图时,第一步计算各部分所占百分比以及对应圆心角的度数;第
二步在圆中按照上述圆心角画出各个扇形并恰当标注.
2.扇形图表示总体的各部分之间的百分比关系,但不同总量下的扇形图,其不同的百
分比不可以作为比较的依据.
角度2.条形图
【例4】 为了丰富校园文化生活,某校计划在午间校园广播台播放某栏目的部分内容.为了了解学生的喜好,抽取若干名学生进行问卷调查(每人只选一项内容),整理调查结果,绘制统计图如图所示.
请根据统计图提供的信息回答以下问题:
(1)求抽取的学生人数;
解 从统计图上可以看出,
喜欢收听A的男生有20人,女生有10人;
喜欢收听B的男生有30人,女生有15人;
喜欢收听C的男生有30人,女生有38人;
喜欢收听D的男生有64人,女生有42人;
喜欢收听 的男生有6人,女生有45人.
所以抽取的学生数为 (人).
(2)若该校有3 000名学生,估计喜欢收听D的学生人数;
解 喜欢收听D的男生有64人,女生有42人,共有106人,占所抽取总人数的比例为 ,由于该
校有3 000 名学生,因此可以估计喜欢收听D的学生有 (人).
(3)估计该校喜欢收听 的女学生人数占全校学生人数的百分比.
解 该校喜欢收听 的女学生人数占全校学生人数的比例为 .
规律方法 在条形图中,各个矩形图的高度必须以数据为准,它直观反映了各部分在总体
中所占比重的大小.
变式训练3 (多选题)学校为了了解本校学生上学的交通方式,在全校范围内进行了随
机调查,将学生上学的交通方式归为四类方式: 结伴步行, 自行乘车, 家人接
送,D—其他方式,并把收集的数据整理分别绘制成柱形图和扇形图,下面的柱形图和扇形
图只给出了部分统计信息,则根据图中信息,下列说法正确的是( )
学生上学交通方式柱形图
学生上学交通方式扇形图
A.扇形图中D的占比最小
B.柱形图中A和C一样高
C.无法计算扇形图中A的占比
D.估计该校学生上学交通方式为A或C的人数占学生总人数的一半
√
√
√
[解析] 对于B,因为D的人数为18,且D占比为 ,所以总人数为 ,所以A组人
数为 ,
所以柱形图中A和C一样高,故B正确,则扇形图中A与C比例相同,为 ,B占比为
,故A正确,C错误.
对于D,A或C的人数和为60,总人数为120,占学生总人数的一半,故D正确.
故选 .
角度3.折线图
【例5】 小明同学因发热而住院,下图是根据护士为他测量的体温所绘制的体温折线图.
根据图中的信息,回答以下问题:
(1)护士每几小时给小明测量一次体温?
解 根据横轴表示的意义,可知护士每6小时给小明测量一次体温.
(2)近三天来,小明的最高体温、最低体温分别是多少?
解 从折线图中的最高点和最低点对应的纵轴意义,可知最高体温是39.5摄氏度,最低体温是36.8摄氏度.
(3)从体温看,小明的病情是在恶化还是在好转?
解 从图中可知小明的体温已经下降,并趋于稳定,因此病情在好转.
(4)如果连续36小时体温不超过37.2摄氏度的话,可认为基本康复,那么小明最快什么时间出院?
解 9月8日18时小明的体温是37摄氏度,其后的体温未超过37.2摄氏度,自9月8日18时起计算,连续36小时后对应的时间为9月10日凌晨6时,因此小明最快可以在9月10日凌晨6时出院.
规律方法 1.绘制折线图时,第一步,确定横轴、纵轴表示的意义;第二步,确定一个单位
长度表示一定的数量,根据数量的多少描出各点;第三步,用直线段顺次连接即可.
2.在折线图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,
可分析数据间相对增长、下降的幅度.
变式训练4 甲、乙两个城市某年4月中旬每
天的最高气温统计图如图所示,则这9天里,
气温比较稳定的是____城市(填“甲”或
“乙”).
甲
[解析] 从折线图可以很清楚地看到乙城市的气温变化较大,而甲城市气温相对来说较稳定,变化基本不大.
探究点三 总体百分位数的应用
【例6】 有一样本的数据为 , , , , , , , ,
, , ,求这组数据的第50百分位数和第75百分位数.
解 ,
第50百分位数是第6项的值3 520.
,
第75百分位数是第9项的值,即 这组数据的第50百分位数和第75百分位数分
别为 , .
变式训练5 为了了解一片经济林的生长情况,随
机抽测了其中60株树木的底部周长(单位:
),所得数据均在区间 上,其频率分
布直方图如图所示,你能估计一下60株树木的第
50百分位数和第75百分位数吗?
解 由题意知分别落在各区间上的频数为
在 上有 ,
在 上有 ,
在 上有 ,
在 上有 ,
在 上有 .
从以上数据可知第50百分位数一定落在区间 上,
;
第75百分位数一定落在区间 上,
.
综上可知,第50百分位数和第75百分位数分别估计为 , .
本节要点归纳
1.知识清单:
(1)频率分布直方图的绘制与应用.
(2)扇形图、条形图、折线图的识读.
(3)总体百分位数的应用.
2.方法归纳:图形识别、数据分析.
3.常见误区:(1)不清楚频率分布直方图的纵轴表示的量.
(2)求百分位数时,应先将数据从小到大排列.(共43张PPT)
9.2.3 总体集中趋势的估计
9.2.4 总体离散程度的估计
课程 标准 1.掌握众数、中位数、平均数、标准差、方差的定义和特征及其在刻画数据中各自的
作用.
2.理解平均数和中位数在频率分布直方图中的关系.
3.理解标准差、方差公式的基本性质.
4.通过具体实际问题不断体会集中趋势、离散程度是如何刻画的,以及它们之间的内在
联系.
1
基础落实·必备知识全过关
2
重难探究·能力素养全提升
01
基础落实·必备知识全过关
知识点1 众数、中位数、平均数
1.众数
(1)定义:一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数
据)称为这组数据的众数.
(2)特征:一组数据中的众数可能不止一个,也可能没有,反映了该组数据的集中趋势.
2.中位数
(1)定义:一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一
个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)
称为这组数据的中位数.
(2)特征:一组数据中的中位数是唯一的,反映了该组数据的集中趋势.在频率分布
直方图中,中位数左边和右边的直方图的面积相等.
3.平均数
(1)定义:一组数据的和与这组数据的个数的商.数据 , , , 的平均数为
.
(2)特征:平均数对数据有“取齐”的作用,代表该组数据的平均水平,任何一个数据的改
变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较
起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中极端值的影
响较大,使平均数在估计总体时的可靠性降低.
(3)若 , , , 的平均数是 ,则 , , , 的平均数是
_ _______.
名师点睛
三种数字特征的优缺点
名称 优点 缺点
众数 (1)体现了样本数据的最大集中点; (2)容易得到 (1)它只能表达样本数据中很少的一部
分信息;(2)无法客观地反映总体特征
中位数 (1)不受少数几个极端数据,即排序靠前 或靠后的几个数据的影响;(2)容易得 到,便于利用中间数据的信息 对极端值不敏感
平均数 能反映出更多关于样本数据全体的信息 任何一个数据的改变都会引起平均数的
改变,数据越“离群”,对平均数的影响越大
过关自诊
1.判断正误.(正确的画 ,错误的画×)
(1)一组数据的众数可以是1个或几个,也可以没有. ( )
√
(2)一组数据的中位数可能不存在. ( )
×
(3)样本量越小,样本平均数越接近总体平均数. ( )
×
2.一组样本数据为:19,23,12,14,14,17,10,12,18,14,27,则这组数据的众数和中位数分别为
( )
A
A.14,14 B.12,14 C.14, D.12,
[解析] 把这组数据按从小到大排列为10,12,12,14,14,14,17,18,19,23,27,则可知其众数为
14,中位数为14.
3.有一组数据,其中10,12,13,15,16出现的频率分别是 , , , , ,则该组数据
的平均数为_____.
13.2
[解析] 该组数据的平均数为 .
知识点2 探索图表中的中位数与平均数数值规律
平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在下图的三种分布形态中,平均数和中位数的大小存在什么关系?
一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的(图1),
那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”(图2),那么平均数
______中位数;如果直方图在左边“拖尾”(图3),那么平均数______中位数.也就是说,和
中位数相比,平均数总是在“长尾巴”那边.
大于
小于
名师点睛
1.平均数是频率分布直方图的“重心”,是直方图的平衡点,因此,每个小矩形的面积与
小矩形底边中点的横坐标的乘积之和即为平均数的估计值.
2.根据中位数的意义,在样本中,有 的个体小于或等于中位数,也有 的个体大
于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
过关自诊
1.判断正误.(正确的画 ,错误的画×)
(1)平均数、中位数和众数从不同的角度描述了一组数据的集中趋势. ( )
√
(2)样本的平均数是频率分布直方图中最高长方形的中点对应的数据. ( )
×
(3)若改变一组数据中其中一个数,则这组数据的平均数、中位数和众数一定都会发
生改变. ( )
×
2. 是表示空气质量的指数, 指数值越小,表明空气质量越好,当 指数值不大于
100时称空气质量为“优良”.如图是某地4月1日到12日 指数值的统计数据,图中点
表示4月1日的 指数值为201,则下列叙述不正确的是( )
C
A.这12天中有6天空气质量为“优良” B.这12天中空气质量最好的是4月9日
C.这12天的 指数值的中位数是90 D.从4日到9日,空气质量越来越好
[解析] 这12天中,空气质量为“优良”的有95,85,77,67,72,92,共6天,故A正确;这12天中空
气质量最好的是4月9日, 指数值为67,故B正确;这12天的 指数值的中位数是
,故C不正确;从4日到9日, 指数值越来越小,表示空气质量越来越好,故
D正确.故选C.
知识点3 方差、标准差
1.假设一组数据是 , , , ,用 表示这组数据的平均数.我们用每个数据与平均数
的差的绝对值作为“距离”,即 作为 到 的“距离”.可以得到这组
数据 , , , 到 的“平均距离”为_ ___________.为了避免式中含有绝对值,通常
改用平方来代替,即 ,我们称此式为这组数据的方差.
由于方差的单位是原始数据的单位的平方,与原始数据不一致.为了使二者单位一致,
我们对方差开平方,取它的算术平方根,即 ,我们称此式为这组数据的
________.
标准差
2.如果总体中所有个体的变量值分别为 , , , ,总体平均数为 ,则称
_ ______________________为总体方差, 为总体标准差.与总体均值类似,总体方
差也可以写成加权的形式.如果总体的 个变量值中,不同的值共有 个,不妨记
为 , , , ,其中 出现的频数为 ,则总体方差为
_ __________________.
3.如果一个样本中个体的变量值分别为 , , , ,样本平均数为 ,则称
_ ____________________为样本方差, 为样本标准差.
4.方差的重要结论
(1)若 , , , 的方差是 ,则 , , , 的方差是______.
(2)方差的简化公式: ,
即方差等于原数据平方的平均数减去平均数的平方.
名师点睛
1.样本标准差反映了各样本数据聚集于样本平均数周围的程度,标准差越小,表明各
个样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数
的周围越分散.
2.若样本数据都相等,则 .
3.当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数
字特征,而样本数据的离散程度,就由标准差来衡量.
4.数据的离散程度可以通过极差、方差或标准差来描述.极差反映了一组数据变化
的最大幅度,它对一组数据中的极端值非常敏感;方差则反映了一组数据围绕平均数波动
的大小.
过关自诊
1.判断正误.(正确的画 ,错误的画×)
(1)若一组数据的值大小相等,没有波动变化,则标准差为0. ( )
√
(2)标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个
样本数据在样本平均数周围越分散. ( )
×
2.现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?
提示 通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.
02
重难探究·能力素养全提升
探究点一 平均数、众数、中位数的求法
【例1】 对于数据3,3,2,3,6,3,10,3,6,3,2,有下列结论:
①这组数据的众数是3;
②这组数据的众数与中位数的数值不相等;
③这组数据的中位数与平均数的数值相等;
④这组数据的平均数与众数的数值相等.
其中正确结论的个数为( )
A
A.1 B.2 C.3 D.4
[解析] 在这一组数据中,3出现次数最多,有6次,故众数是3;将数据按从小到大顺序排列后,最中间的数据是3,故中位数是3;平均数 ,故只有①正确.
规律方法 平均数、众数、中位数的求解策略
(1)求平均数时要注意数据的个数,不要重计或漏计.
(2)求中位数时一定要先对数据按大小排序,若最中间有两个数据,则中位数是这
两数据的平均数.
(3)若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫
众数;若一组数据中每个数据出现的次数一样多,则没有众数.
变式训练1 从某中学高三年级甲、乙两个班各选出7名学生参加数学竞赛,他们取得的
成绩(满分100分)如下,成绩已按大小排序:
甲:
乙:
其中甲班学生成绩的平均分和乙班学生成绩的中位数都是85,则 的值为( )
D
A.152 B.168 C.190 D.170
[解析] 由数据知,乙班成绩的中位数是 .
又甲班学生成绩的平均分为85,即 ,解得
, .故选D.
探究点二 方差和标准差的计算及应用
【例2】 甲、乙两机床同时加工直径为 的零件,为检验质量,从中抽取6件测量数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
解 ,
,
,
.
(2)根据计算说明哪台机床加工零件的质量更稳定.
解 由(1)知 ,比较它们的方差,
,故乙机床加工零件的质量更稳定.
【例3】 甲、乙两支田径队的体检结果为:甲队队员体重的平均数为 ,方差为200,
乙队队员体重的平均数为 ,方差为300,又已知甲、乙两队的队员人数之比为 ,
那么甲、乙两队全部队员的平均体重和方差分别是多少?
解 由题意可知 ,甲队队员在所有队员中所占权重为 ,
,乙队队员在所有队员中所占权重为 ,
则甲、乙两队全部队员的平均体重为 ,甲、乙两队全部队
员的体重的方差为 .
规律方法 方差的计算与性质的应用
(1)在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散
程度(即方差或标准差),方差大说明取值分散性大,方差小说明取值分散性小或者取值
集中、稳定.
(2)计算分层随机抽样的方差 的步骤:
①确定 , , , ;
②确定 ;
③应用公式 ,计算 .
变式训练2 某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:
甲 127 138 130 137 135 131
乙 133 129 138 134 128 136
求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一人参加数学竞赛.
解 ,
,
,
.
甲与乙的平均数相同,因为乙的方差较小,所以乙的成绩比甲的成绩稳定,选乙参加数学
竞赛比较合适.
探究点三 频率分布直方图(折线图)中的“隐藏”的数据信息
【例4】 如图为学生身高频率分布直方图.
(1)如何在样本数据的频率分布直方图中估计出众数的值?
解 众数大致的值就是样本数据的频率分布直方图中最高小长方形的中点的横坐标.由直方图可估计学生身高众数应为174.5.
(2)如何在样本数据的频率分布直方图中估计出中位数的值?
解 在样本中,有 的个体小于或等于中位数,也有
的个体大于或等于中位数,因此,在频率分布直
方图中,中位数使得在它左边和右边的直方图的面积
相等,由此可以估计中位数的值,如图,由于
, ,所以
中位数落在区间 内.如图.
设中位数是 ,由 ,解得 .所以学生身高的
中位数约为171.55 .
(3)如何在样本数据的频率分布直方图中估计出平均数的值?
解 平均数是频率分布直方图的“重心”,是频率分布直方图的平衡点,因此,每个小长方形
的面积与小长方形底边中点的横坐标的乘积之和为平均数.由
,得
学生身高的平均数为170.6.
(4)从样本数据可知,该样本的众数是166,172,中位数是171,平均数是 ,这与我们
从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?
解 因为样本数据频率分布直方图只是直观地表明分布的形状,从直方图本身得不出原始的数据内容,也就是说频率分布直方图损失了一些样本数据的信息,得到的是一个估计值,且所得估计值与数据分组有关,所以估计的值有一定的偏差.
规律方法 1.利用直方图或折线图求得的众数、中位数、平均数均为近似值,往往与实际
数据得出的不一致.但它们能粗略估计其众数、中位数和平均数.
2.利用频率分布直方图求数字特征的近似值:
(1)众数是最高小长方形的底边中点的横坐标;
(2)中位数使得在它左、右两侧直方图的面积相等;
(3)平均数等于每个小长方形的面积乘小长方形底边中点的横坐标之和.
变式训练3 甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示.
请从下列四个不同的角度对这次测试结果进行分析.
解 根据各问情况作如下统计表.
类别 平均数 方差 中位数 命中9环及9环以上次数
甲 7 1.2 7 1
乙 7 5.4 7.5 3
则
(1)从平均数和方差相结合看(分析谁的成绩好些);
解 平均数相同,且 ,
甲稳定些.
甲的成绩比乙好.
(2)从平均数和中位数相结合看(分析谁的成绩好些);
解 平均数相同,甲的中位数 乙的中位数,
乙的成绩比甲好.
(3)从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);
解 平均数相同,且乙命中9环及9环以上次数比甲多,
乙的成绩比甲好.
(4)从折线图上两人射击命中环数的走势看(分析谁更有潜力).
解 甲的成绩在平均线上下波动;而乙处于上升趋势,从第四次以后就没有比甲少的情况发生,
乙更有潜力.
本节要点归纳
1.知识清单:
(1)平均数、众数、中位数的求法.
(2)方差和标准差的计算及应用.
(3)利用频率分布直方图(折线图)估计样本的数据特征.
2.方法归纳:数据分析.
3.常见误区:(1)平均数与中位数易混淆.
(2)方差与标准差易混淆.(共35张PPT)
本章总结提升
1
知识网络·整合构建
2
专题突破·素养提升
01
知识网络·整合构建
02
专题突破·素养提升
专题一 抽样方法及应用
1.两种抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;当
总体容量较大,样本容量较小时,可采用随机数法;当总体中个体差异较显著时,可采用分
层随机抽样.
2.掌握两种抽样方法,提升数据分析的核心素养.
【例1】(1) 某校高一年级1 000名学生的血型情况如图所示.某课外兴趣小组为了研
究血型与饮食之间的关系,决定采用分层随机抽样的方法从中抽取一个容量为50的样本,
则从高一年级A型血的学生中应抽取的人数是( )
A
[图中数据:A型 ,B型 , 型 , 型
A.11 B.22 C.110 D.220
[解析] 根据分层随机抽样的定义可得,从高一年级A型血的学生中应抽取的人数是 .故选A.
(2)假设要检查某企业生产的袋装牛奶的质量是否达标,现从500袋牛奶中抽取60袋进
行检验,利用随机数法抽取样本时,先将500袋牛奶按000,001, ,499进行编号,使用随机
数表中各个5位数组的后3位,选定第7行第5组数开始,取出047作为抽取的第一袋(从左
向右读取数字),随后抽到的5袋牛奶的号码分别是(下面摘取了某随机数表第7行至第
9行)___________________.
84421 75331 57245 50688 77047 44767 21763
35025 83921 20676 63016 47859 16955 56719
98105 07185 12867 35807 44395 23879 33211
025,016,105,185,395
[解析] 由已知读取号码的初始值为第7行第5组数中的后3位,第一个号码为047.
凡不在 中的数跳过去不取,前面已经取过的也跳过去不取,从而随后抽到的5
袋牛奶的编号为025,016,105,185,395.
规律方法 随机抽样的特征及关注点
(1)随机抽样有简单随机抽样和分层随机抽样两种.其共同点是在抽样过程中每
个个体被抽到的机会相等,当总体中的个体数较少时,常采用简单随机抽样;当已知总体
由差异明显的几部分组成时,常采用分层随机抽样.其中简单随机抽样是最简单、最基本
的抽样方法.分层随机抽样时一般要用到简单随机抽样.
(2)应用各种抽样方法抽样时要注意以下问题:
①利用抽签法时要注意把号签放在不透明的容器中且搅拌均匀;
②利用随机数法时注意编号位数要一致;
③在分层随机抽样中,若在某一层按比例应该抽取的个体数不是整数,应在该层剔除
部分个体,使抽取个体数为整数.
变式训练1(1) 某品牌白酒公司在甲、乙、丙三个地区分别有30个、120个、180个代
理商.公司为了调查白酒销售的情况,需从这330个代理商中抽取一个容量为11的样本,记
这项调查为①;在甲地区有10个特大型超市代理销售该品牌的白酒,要从中抽取7个调查
其销售收入和售后服务情况,记这项调查为②.则完成①②这两项调查宜采用的抽样方法
依次是__________________________.
分层随机抽样,简单随机抽样
[解析] 由于甲、乙、丙三个地区有明显差异,所以在完成①时,需用分层随机抽样.在甲地区有10个特大型超市代理销售该品牌的白酒,没有显著差异,所以完成②宜采用简单随机抽样.
(2)某频道推出一档以“赏中华诗词,寻文化基因,品生活之美”为宗旨的文化类演播室益智竞赛节目,该节目邀请全国各个年龄段、各个领域的诗词爱好者共同参与诗词知识比拼.“百人团”由一百多位来自全国各地的不同年龄段的选手组成,按照年龄分组统计如下表:
分组/岁
频数 18 54 36
若用分层随机抽样的方法从“百人团”中抽取6人参加挑战,则从年龄组 ,
, 中抽取的挑战者的人数分别为_________.
1,3,2
[解析] “百人团”的总人数为 ,则用分层随机抽样的方法抽取的挑
战者的年龄在 的人数为 ,年龄在 的人数为 ,年龄
在 的人数为 .
所以从年龄组 , , 中抽取的挑战者的人数分别为1,3,2.
专题二 用样本的频率分布估计总体分布
1.根据样本容量的大小,我们可以选择利用样本的频率分布表、频率分布直方图对
总体情况作出估计.
2.掌握频率分布直方图的绘制及应用,提升数据分析和数学运算的核心素养.
【例2】 如下表所示给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料.
(单位: )
区间界限
人数 5 8 10 22 33
区间界限
人数 20 11 6 5
(1)列出样本的频率分布表;
解 样本的频率分布表:
分组 频数 频率
5 0.04
8 0.07
10 0.08
22 0.18
33 0.28
分组 频数 频率
20 0.17
11 0.09
6 0.05
5 0.04
合计 120 1.00
续表
(2)画出频率分布直方图;
解 画出频率分布直方图,如图所示:
(3)估计身高低于 的人数占总人数的百分比.
解 因为样本中身高低于 的人数的频率为 ,所以估计身高低于
的人数占总人数的 .
规律方法 统计图表及应用
总体分布中相应的统计图表主要包括:频率分布表、频率分布直方图、折线图等.通
过这些统计图表给出的相应统计信息可以估计总体.
变式训练2 为了了解某地高中学生的体能状况,抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图如图.为提高本地学生的身体素质,教育主管部门要求,每分钟跳绳不超过120次的学生,需要增加平时体育锻炼的时间.
(1)求 的值;
解 ,
解得 .
(2)若该地区有6 000名高中学生,估计其中需要增加平时体育锻炼时间的人数.
解 该地区有6 000名高中学生,每分钟跳绳不超过120次的学生所占频率为
,
估计其中需要增加平时体育锻炼时间的人数为 .
专题三 用样本的数字特征估计总体的数字特征
1.为了从整体上更好地把握总体规律,我们可以通过样本数据的众数、中位数、平
均数估计总体的集中趋势,通过样本数据的方差或标准差估计总体的离散程度.
2.掌握样本数据的众数、中位数、平均数及方差的计算方法,提升数据分析和数学
运算的核心素养.
【例3】 对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度
(单位: )的数据如下:
甲 27 38 30 37 35 31
乙 33 29 38 34 28 36
分别求出甲、乙两名自行车赛手最大速度数据的平均数、极差、方差,并判断选谁参加比赛比较合适.
解 ,
,
,
,
甲的极差为11,乙的极差为10.
由甲、乙的平均数相等,乙的方差较小,知选乙参加比赛比较合适.
规律方法 样本的数字特征及应用
样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括平均数、众数、
中位数;另一类是反映样本数据离散程度的,包括样本方差及标准差.通常,在实际问题中,
仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,
在平均数相同的情况下,方差越大,离散程度越大,数据波动幅度越大;方差越小,离散程度
越小,数据波动幅度越小.
变式训练3 某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,
得到这些企业第一季度相对于前一年第一季度产值增长率 的频数分布表.
企业数 2 24 53 14 7
(1)分别估计这类企业中产值增长率不低于 的企业比例、产值负增长的企业比例;
解 根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于 的企业
频率为 .
产值负增长的企业频率为 .
用样本频率分布估计总体分布得这类企业中产值增长率不低于 的企业比例为
,产值负增长的企业比例为 .
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间
的中点值为代表).(精确到 )
附: .
解 ,
,
.
所以,这类企业产值增长率的平均数与标准差的估计值分别为 , .
专题四 总体百分位数的应用
1.一般地,一组数据的第 百分位数是这样一个值,它使得这组数据中至少有 的
数据小于或等于这个值,且至少有 的数据大于或等于这个值.
2.掌握百分位数的计算及应用,重点提升数据分析与数学运算的核心素养.
【例4】 我国是世界上严重缺水的国家之一,
某市为了制定合理的节水方案,对家庭用水情
况进行了调查,通过抽样,获得了某年100个家庭
的月均用水量(单位: ),将数据按照 ,
, , , 分成5组,制成了如图
所示的频率分布直方图.
(1)假设同组中的每个数据都用该组区间的中点值代替,求全市家庭月均用水量平均
数的估计值(精确到 );
解 因为
,
因此全市家庭月均用水量的平均数估计值为 .
(2)求全市家庭月均用水量的 分位数的估计值(精确到 ).
解 频率分布直方图中,用水量低于 的频率为 ,用水量低于 的频率
为 ,故全市家庭月均用水量的 分位数的估计值为
.
规律方法 百分位数是用于衡量数据的位置的量度,但它所衡量的,不一定是中心位置.百
分位数提供了有关各数据项如何在最小值与最大值之间分布的信息.对于无大量重复的
数据,第 百分位数将它分为两个部分.至少有 的数据项的值小于或等于第 百分位
数;而至少有 的数据项的值大于或等于第 百分位数.对第 百分位数,严格
的定义如下:第 百分位数是这样一个值,它使得至少有 的数据项小于或等于这个值,
且至少有 的数据项大于或等于这个值.
变式训练4(1) 某产品售后服务中心随机选取了10个工作日,分别记录了每个工作日
接到的客户服务电话的数量(单位:次):
63 38 25 42 56 48 53 39 28 47
则上述数据的第50百分位数为_____.
44.5
(2)某地教育部门为了调查考生在数学考试中的有关信息,从上次参加考试的10 000名考生中用分层随机抽样的方法抽取500名,并根据这500名考生的数学成绩画出样本的频率分布直方图(如图),估计这10 000名考生中数学成绩的第80百分位数是多少
解 考生中成绩在130分以下的频率为 ,
考生中成绩在140分以下的频率为 , 成绩的第80百分位数一定在 之间.
由 .
估计考生成绩的第80百分位数为134分.