(共87张PPT)
第六章 统计
4.2 分层随机抽样的均值和方差
4.3 百分位数
1.分层随机抽样的均值
设样本中不同层的平均数和相应权重分别为x1,
x2,…,xm和1,2,…,@n,则这个样本的平均数
为心1元1十2x2十…十nxw.为了简化表示,引进
求和符号,记作w1x1十2x2十…十nxn=
=1
);℃i·
2.分层随机抽样的方差
设样本巾不同层的平均数分别为x1,x2,…,xn,方
差分别为s,s,…s,相应的权重分别为 1,心2,
…,wn,则这个样本的方差为s2=∑:[s号十(x;一
=1
x)2],其中x为样本平均数.
3.百分位数
(1)定义:一般地,当总体是连续变量时,给定一个百
分数卫∈(0,1),总体的p分位数有这样的特点:总
体数据中的任意一个数小于或等于它的可能性
是p.
(2)常用的百分位数:
(3)计算一组n个数据的p分位数的一般步骠如下:
第1步,按照从小到大排列原始数据;
第2步,计算i=np;
第3步,若i不是整数,大于i的最小整数为),则p
分位数为第)项数据;若是整数,则卫分位数为第
项与第(i十1)项数据的平均数.
自我测评
思考辨析(正确的打“、/”,错误的打“×”)
(1)若一组样本数据各不相等,则75%分位数大于
25%分位数.
(
(2)计算分层随机抽样的均值与方差时,必须已知各
层的权重.
(3)若一组样本数据的10%分位数是23,则在这组
数据中有10%的数据大于23.
(
[答案](1)/
(2)/
(3)×
知识点1>
求分层随机抽样背景下的样本平
均数、方差
兴趣探究
[思考]
甲班和乙班各有学生20人、40人,甲班
的数学成绩的平均数为80分,方差为2,乙班的数学成
绩的平均数为82分,方差为4,那么甲班和乙班这60
80+82
人的数学成绩的平均分是
81分吗?方差是
2
知识归纳
1.分层随机抽样的平均数的计算方法
(1)第i层的权重:、第i层的个体数x,,样本容
量n,三者满足:=心,已知其中2个可求另外1个.
n
(2)在利用公式x=心1x1十2x2十·十mxn求
分层随机抽样的平均数时,要清楚公式中各符号的含
义,避免代入数据时出现失误,同时要仔细运算,按照
要求保留有效小数.(共106张PPT)
第六章 统计
3 用样本估计总体分布
课标要点
核心素养
1.掌握利用频数和频率估计样本和总体的特征,
1.通过对统计图表的识图和读图,培养直观想象
2.理解频数与频率的区别和联系
素养.
3.学会用频率分布表,画频率分布直方图表示样本2.通过对频率分布直方图画法的学习,培养数据分
数据
析素养
4.能通过频率分布表或频率分布直方图对数据做出总
3.通过与频率分布直方图有关的计算,培养数学运
体统计
算素养,
1.从频数到频率
(1)频率表示频数与总数的比值
(2)频率反映了相对总数而言的相对强度,其所携带
的总体信息远超过频数.在实际问题中,如果总体容
量比较小,频数也可以较客观地反映总体分布;当总
体容量较大时,频率就更能客观地反映总体分布.
2.频率分布表、频率分布直方图的制作步骤及意义
求极差
即一组数据中最大值与最小值的差
极差
若k∈Z,则组数为k,
决定组距
组数k仁组距’
与组数
若k庄Z,则组数为不小于k的最小
整数
将数据
各组均为左闭右开区间,最后一组
分组
是闭区间
一般分四列:分组、频数累计、频
列频率
数、频率,最后一行是合计,其中
分布表
频数合计应是样本容量,频率合计
应是1
在频率分布直方图中,纵轴表示
频率
,数据落在各小组内的频率
组距
方图
用各小长方形的面积来表示,各小
长方形的面积的总和等于1
3.频率折线图
在频率分布直方图中,按照分组原则,再在左边和右
边各加一个区间,从所加的左边区间的中点开始,用
线段依次连接各个矩形的顶端中点,直至右边所加
区间的中点,就可以得到一条折线,我们称之为频率
折线图.
[温馨提示]表示频率分布的几种方法的优,点与
不足
优点
不足
表示数量较
分析数据分布的
频率分布表
确切
总体态势不方便
频率分布
表示数据分布
原有的具体数据
直方图
情况非常直观
信息被抹掉了
频率分布
能反映数据的
不能显示原有数
折线图
变化趋势
据信息
自我测评
思考辨析(正确的打“/”,错误的打“×”)
(1)频率分布直方图中的纵轴表示频率.
(2)频率分布直方图中每个小长方形的面积等于相
应组的频率
(
)
(3)直方图的高表示取某组上的个体在样本中出现
的频数与组距的比值.
(
)
(4)频率分布直方图中所有小长方形的面积和等
于1.
[答案]
(1)X
(2)/
(3)×
(4)(共68张PPT)
第六章 统计
第六章 素养检测
一、单项选择题:本题共8小题,每小题5分,共40分,
在每小题给出的四个选项中,只有一项是符合题目
要求的.
1.某学校高一、高二年级共有1800人,现按照分层随
机抽样的方法,抽取90人作为样本进行某项调查.
若样本中高一年级学生有42人,则该校高一年级学
生共有
A.420人
B.480
C.840
D.960人
[解析]
由题意需要从1800人中抽取90人,所以
90
1
抽样比为
.又样本中高一年级学生有42
800
201
人,所以该校高一年级学生共有42×20=840(人).
故选C
[答案]
2.我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开
仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一
把,数得254粒内夹谷28粒,则这批米内夹谷约为(
A.134石
B.169石
C.338石
D.1365石
[解析]根据样本估计总体,可得这批米内夹谷约
3.某学习小组在一次数学测验中,得100分的有1人,
得95分的有1人,得90分的有2人,得85分的有4
人,得80分和75分的各有1人,则该小组数学成绩
的平均数、众数、中位数分别是
(
A.85,85,85
B.87,85,86
C.87,85,85
D.87,85,90
[解析]因为得85分的人数最多,为4人,所以众
数为85,中位数为85,平均数为
0100+95+90X2
+85×4十80十75)=87.故选C.
[答案]
4.某商场在五一促销活动中,对5月1日9时至14时
的销售额进行统计,其频率分布直方图如图所示,已
知9时至10时的销售额为2.5万元,则11时到12
时的销售额为
频率
大
组距
0.40
0.35
0.30
8:
0.05
O
1011121314时间
[解析]设11时至12时的销售额为x万元,由于
频率分布直方图中各小组的组距相同,故各小矩形
的高度之比等于频率之比,也等于销售额之比,所以
9时至10时的销售额与11时至12时的销售额的比
0.10
-2.5
欧以有一解行x0.改跳
0.40
4
[答案]
C
5.在发生某公共卫生事件期间,有专业机构认为该事
件在一段时间内没有发生大规模群体感染的标志为
“连续10天,每天新增疑似病例不超过7人”.根据
过去10天甲、乙、丙、丁四地新增疑似病例数据,一
定符合该标志的是
A.甲地:总体均值为3,中位数为4
B.乙地:总体均值为1,总体方差大于0
C.丙地:中位数为2,众数为3
D.丁地:总体均值为2,总体方差为3(共25张PPT)
第六章 统计
本章整合提升
普查
直接获取
抽查
获取数据的途径
间接获取
总体和样本
抽签法
简单随机抽样
随机数法
抽样的基本方法
分层随机抽样
统
频数
频率
计
用样本估计总体分布
画法
频率分布直方图
应用
计算
样本的数字特征
众数、中位数、平均数、方差
用样本估计总
应用
体的数字特征
分层随机抽样的均值和方差
百分位数
专题1>
随机抽样方法及其应用
【典例探究1】
(1)由编号为01,02,…,20的20
个个体组成.利用下面的随机数表选取5个个体,选取
方法从随数表第1行的第5列和第6列数字开始由
左到右一次选取两个数字,则选出来的第5个个体的
编号为
7816
6572
0802
6314
0702
4369
9728
0198
3204
92344935
8200
3623
4869
6938
7481
A.08
B.07
C.02
D.01
(2)某学校的高一、高二、高三3个年级共有430
名学生,其中高一年级学生160名,高二年级学生180
名,为了解学生身体状沉,现采用分层抽样方法进行调
查,在抽取的样本中高二学生有32人,则该样本中高
三学生人数为
[解析]
(1)从随机数表第1行的第5列和第6
列数字开始由左到右一次选取两个数字开始向右读,
第一个数为65,不符合条件,第二个数为72,不符合条
件,第三个数为08,符合条件,所以符合条件依次为
02,14,07,01,故第5个数为01.故选D.
(2)高三年级学生人数为430一160一180=90,设高三
方法技巧:随机抽样方法有简单随机抽样和比例分配
的分层随机抽样两种.
简单随
特
范
机抽样
逐个抽取
围
总体中个体较少
每个
个体
共
被抽
到的
分层随机抽样
特分层,按
范总体由差异明显
相等
点
比例抽取
的几部分组成
方法技巧:平均数与方差都是重要的数字特征,是对
总体的一种简明的描述,它们所反映的情况有着重要
的实际意义,平均数、中位数、众数描述其集中趋势
方差和标准差描述其波动大小.
专题2频率分布直方图及其应用
【典例探究2】下表给出了某校500名12岁男孩
中用随机抽样得出的120人的身高资料(单位:cm):
区间界限
[122,126)
[126,130)
[130,134)
[134,138)
[138,142)
人数
5
8
10
22
33
区间界限
[142,146)
[146,150)
「150,154)
[154,158
人数
20
11
6
5(共66张PPT)
第六章 统计
1 获取数据的途径
1.直接获取与间接获取数据
(1)直接获取是指通过社会调查或观察、试验等途径
获取数据.直接获取的数据称为直接数据或一手
数据;
(2)间接获取是指借助各种媒介,包括报纸杂志、统
计报表和年鉴、广播、电视或互联网等获取数据.间
接获取的数据称为间接数据或二手数据.
2.普查与抽查
(1)普查是为了掌握调查对象的整体情况,对全体调
查对象进行研究的一种调查方式;
(2)从全体调查对象中,按照一定的方法抽取一部分
对象作为代表进行调查分析,并以此推断全体调查
对象的状况.这种抽取一部分对象的调查方式叫作
抽样调查,简称抽查
3.总体
一般地,当问题明确后,调查对象的范围也就随之确
定,调查对象的全体称为总体.
4.样本和样本容量
在进行抽样调查时,从总体中抽取的部分称为样本,
其过程称为抽样,样本中个体的数目称为样本容量,
简称样本量.
5.总体的分布:总体中各类数据的百分比.
自我测评
思考辨析(正确的打“/”,错误的打“×”)
(1)检验一批钢材的抗拉强度时可以用普查的方式
进行调查.
(
(2)样本不一定是从总体中抽取的,没有抽取的个体
也可能是样本.
(
[答案](1)×
(2)×
知识点1>
普查和抽查的选用问题
兴趣探究
[思考]为了准确地调查我国某一时期的全国总
人口、各民族人口、城乡人口、各种受教育程度的人口、
流动人口等多方面的情沉况,需要用什么的方法进行
调查.
知识归纳
1.判断是否采用普查获取有关信息的方法
(1)分析调查对象的性质,判断是否必须了解每一
个个体的相关信息;
(2)确定总体个数,依此来判断采取普查是否
可行.
2.根据调查问题的特点设计抽样调查的不同方
案,应遵循以下原则:
(1)要考虑如何合理地获取样本,以确保其典型
性、代表性.即抽取的部分个体具有广泛的代表性,能
很好地代表总体;
(2)要考虑如何保证调查内容的真实性.
[提醒]一般若需要调查所有对象,则选用普查
的方式;若调查具有破坏性或无法实现,则选用抽查的
方法
考向例题
【例1】
你认为下列调查用普查还是用抽样调
查?并说明理由:
(1)调查某种绿豆的发芽率;
(2)调查《新闻联播》在某省的收视率;
(3)调查某批飞机零件的合格率;
(4)调查全国观众对中央电视台《春节联欢晚会》
的满意程度.(共81张PPT)
第六章 统计
2.2 分层随机抽样
分层随机抽样
将总体按其属性特征分成互不交叉的若干类型(有
时称作层),然后在每个类型中按照所占比例随机抽
取一定的个体,这种抽样方法通常叫作分层随机
抽样.
自我测评
思考辨析(正确的打“/”,错误的打“×”)
(1)分层抽样实际上是按比例抽样.
(2)分层抽样中每个个体被抽到的可能性不一样.(
)
(3)简单随机抽样、分层抽样之间的共同点是抽样过
程中每个个体被抽取的机会相同.
[答案](1)/(2)×
(3)/
知识点1>
分层随机抽样
兴趣探究
[思考]抽样调查最核心的问题是样本的代表
性.简单随机抽样是使总体中每一个个体都有相等的
机会被抽中,但因为抽样的随机性,有可能会出现比较
“极端”的样本.例如,在对树人中学高一年级学生身高
的调查中,可能出现样本中50个个体大部分来自高个
子或矮个子的情形.这种“极端”样本的平均数会大幅
度地偏离总体平均数,从而使得估计出现较大的误差,
能否利用总体中的一些额外信息对抽样方法进行改
进呢?
[答案]
我们可以利用性别和身高的这种关系,
把高一年级学生分成男生和女生两个身高有明显差异
的群体,对两个群体分别进行简单随机抽样,然后汇总
作为总体的一个样本.由于在男生和女生两个群体中
都抽取了相应的个体,这样就能有效地避免“极端”样
本.也就是说要进行分层抽样.
知识归纳
分层随机抽样遵循的两条原则:①按一个或多个
变量把总体划分成若干个子总体,每个个体属于且仅
属于一个子总体,即遵循不重复、不遗漏的原则;②在
每个子总体中独立地进行简单随机抽样,即各层中遵
循等概率抽样的原则
考向例题
考向一分层抽样的概念
【例1】
(1)下列问题中,最适合用分层抽样抽取
样本的是
A.从10名同学中抽取3人参加座谈会
B.一次数学竞赛中,某班有10人在110分以上,
40人在90~100分,12人低于90分,现从中抽取12
人了解有关情况
C.从1000名工人中,抽取100名调查上班途中
所用时间
D.从生产流水线上,抽取样本检查产品质量
(2)分层抽样又称类型抽样,即将相似的个体归入
一类(层),然后每类抽取若干个个体构成样本,所以分
层抽样为保证每个个体等可能抽样,必须进行(
A.每层等可能抽样
B.每层可以不等可能抽样
C.所有层按同一抽样比等可能抽样
D.所有层抽个体数量相同(共110张PPT)
第六章 统计
4.1 样本的数字特征
1.众数、中位数和平均数的定义
(1)众数:一组数据中出现次数最多的数.
(2)中位数:一组数据按大小顺序排列后,处于中间
位置的数.如果个数是偶数,则取中间两个数据的平
均数.
(3)平均数:一组数据的和除以数据个数所得到的数.
2.众数、中位数和平均数的比较
名称
优点
缺点
与中位数相比,平
任何一个数据的改
均数反映出样本数
变都会引起平均数
平均数
据中更多的信息,
的改变.数据越“离
对样本中的极端值
群”,对平均数的影
更加敏感
响越大
不受少数几个极端
数据(即排序靠前
中位数
对极端值不敏感
或靠后的数据)的
影响
众数只能传递数据
体现了样本数据的
中的信息的很少一
众数
最大集中点
部分,对极端值不
敏感
3.众数、中位数、平均数与频率分布直方图的关系
(1)平均数:在频率分布直方图中,样本平均数可以
用每个小矩形底边中点的横坐标与小矩形的面积的
乘积之和近似代替.
(2)中位数:在频率分布直方图中,中位数左边和右
边的直方图的面积应该相等
(3)众数:众数是最高小矩形底边的中点所对应的
数据.
[温馨提示]1.一组数据按大小顺序排列后,如
果有奇数个数据,处于中间位置的数是中位数;如果有
偶数个数据,则取中间两个数据的平均数是中位数.
2.一组数据的众数可能有一个,也可能有多个,中位
数只有唯一一个.中位数反映了该组数据的集中趋势.
4.极差、方差和标准差
(1)极差:数据中最大值和最小值的差.
(2)方差:方差刻画的是数据偏离平均数的离散
程度
(3)标准差:方差的算术平方根s=√s2
(x1一x)2十(x2一x)2十…十(xm-x)2
,称之为
m
标准差.
5.标准差的意义
标准差刻画了数据的离散程度或波动幅度,标准差
越大,数据的离散程度越大;标准差越小,数据的离
散程度越小.
自我测评
思考辨析(正确的打“/”,错误的打“×”)
(1)一组数据的众数可以是1个或几个,也可以没
有.
(
(2)一组数据的中位数可能不存在.
(3)样本量越小,样本平均数越接近总体平均数.
((共75张PPT)
第六章 统计
2.1 简单随机抽样
(1)抽签法
先把总体中的个体编号,然后把所有编号写在外观、
质地等无差别的小纸片(也可以使卡片、小球等)上
作为号签,并将这些小纸片放在一个不透明的盒里,
充分搅拌.最后从盒中不放回地逐个抽取号签,使与
号签上的编号对应的个体进入样本,直到抽足样本
所需要的个体数
(2)随机数法
(1)定义:先把总体中的个体编号,用随机数根据产
生与总体中个体数量相等的整数随机数,把产生的
随机数作为抽中的编号,并剔除重复的编号,直到抽
足样本所需要的个体数.
(2)产生随机数的方法:①用随机试验生成随机数,
②用信息技术生成随机数.
[温馨提示](1)简单随机抽样中各个个体被抽
到的机会都相等,从而保证了抽样的公平性.
(2)本章中所称的简单随机抽样指不放回简单随
机抽样,这是因为与放回简单随机抽样相比,不放回简
单随机抽样的效率更高,因此实践中人们更多采用不
放回简单随机抽样.
自我测评
思考辨析(正确的打“、/”,错误的打“×”)
(1)使用随机数表时,开始的位置和方向可以任意选
择
(2)抽签法和随机数法都是简单随机抽样.
(3)无论是抽签法还是随机数法,每一个个体被抽到
的机会都是均等的.
[答案](1)
(2)
(3)/
知识点1
简单随机抽样
兴趣探究
[思考]从含有甲、乙的9件产品中随机抽取一
件,总体内的各个个体被抽到的机会相同吗?为什么?
甲被抽到的机会是多少?
[答案]总体内的各个个体被抽到的机会相同,
因为是从9件产品中随机抽取一件,这9件产品每件
产品被抽到的机会都是
。,甲也是
知识归纳
简单随机抽样必须具备下列特点
(1)被抽取样本的总体中的个体数V是有限的;
(2)抽取的样本是从总体中逐个抽取的;
(3)简单随机抽样是一种等可能的抽样
如果几个特征有一个不满足,就不是简单随机
抽样.
考向例题
考向
简单随机抽样的判断
【例1】下面的抽样方法是简单随机抽样吗?为
什么?
(1)从无数个个体中抽取50个个体作为样本;
(2)仓库中有1万支奥运火炬,从中一次性抽取
100支火炬进行质量检查;
(3)某连队从200名党员官兵中,挑选出50名优
秀的官兵赶赴灾区开展救灾工作;