第九章 统计(章末小结) 课件(共22张PPT)

文档属性

名称 第九章 统计(章末小结) 课件(共22张PPT)
格式 pptx
文件大小 651.3KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2023-05-29 10:21:52

图片预览

文档简介

(共22张PPT)
章末小结
必修第二册 第九章《统计》
知识网络
知识梳理——1.统计的相关概念
名称 定义
普查 对每一个调查对象都进行调查
总体 所要调查对象的全体
个体 总体中的每一个调查对象
抽样调查 从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断
样本 从总体中抽取的那部分个体
样本量 样本中包含的个体数
样本数据 调查样本获得的变量值称为样本的观测数据
知识梳理——2.简单随机抽样的定义和方法
知识梳理——2.1简单随机抽样的定义
简单随机抽样 (通过简单随机抽样获得的样本称为简单随机样本)
前提 设总体含有N个(N为正整数)个体,从中逐个抽取n(1≤n≤N)个个体作为样本
分类 放回简单随机抽样 不放回简单随机抽样
定义 抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等 抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率是相等的
特点 个体独立,便于理论研究 个体不独立,但调查效率更高
除非特殊说明,本章所称的简单随机抽样指不放回简单随机抽样。
知识梳理——2.2简单随机抽样的特点
简单随机抽样的特点:
①总体个数N是有限的.
②从总体中逐个抽取.
③每个个体被抽到的可能性相同,均为n/N,抽样具有公平性;
④每个个体恰好在第k次被抽到的可能性均为1/N(1≤k≤n).
知识梳理——2.3简单随机抽样的方法
抽签法的特点:简单易行, 但当总体较大时,操作起来比较麻烦. 一般适用于总体容量和样本量不多的情形.
1.抽签法的含义:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.
2.随机数法的含义:随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.
随机数法的特点:方便快捷,取到相同编号时要剔除.
随机数法一般适用于总体容量较大,但样本量不大的情形.
知识梳理——2.4简单随机抽样的平均数
概念 总体均值(总体平均数) 样本均值(样本平均数)
条件 总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN 从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yN
公式
知识梳理——3.1分层抽样的定义
定义:按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
适用情况:总体由差异明显的几部分组成.
知识梳理——3.2分层抽样的步骤
(1)分层 根据已经掌握的信息,将总体分成互不相交的层;

(3)定数 确定每一层应抽取的个体数目,并使每一层应抽取的个体数目之和为样本容量n;
(4)抽样 按步骤3确定的数目在各层中随机抽取个体,合在一起得到容量为n的样本.
知识梳理——3.3分层抽样的平均数
在按比例分配的分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n.
知识梳理——4.获取数据的途径
1、通过调查获取数据:简单随机抽样、分层随机抽样、系统抽样、整群抽样、不等概率抽样、自适应抽样、两阶段抽样
2、通过试验获取数据:没有现存的数据可查询,需通过对比试验获取样本观测数据,且需严格控制试验环境
3、通过观察获取数据:不能人为控制的自然现象,需借助专业策略设备,通过长久的持续的观察获取数据
4、通过查询获取数据:查询“二手数据”,如国家统计局公布的数据或出版的资料、专家的学术论文等
知识梳理——5.1频率分布直方图的作法和要点
1.求极差(一组数据中的最大值与最小值的差).
2.决定组距与组数
3.将数据分组(确定分点,左闭右开最后闭)
4.列出频率分布表(分组,频数,频率)
5.列出频率分布直方图(纵轴为频率/组距)
知识梳理——5.2各类统计图表的特点
不同的统计图在表示数据的特点不同,适用的数据类型上也不同.
扇形图主要用于直观描述各类数据占总数的比例(离散型数据)
条形图主要用于直观描述不同类别或分组数据的频数;
直方图主要用于直观描述不同分组数据的频率;(连续型数据)
折线图主要用于描述数据随时间的变化趋势 (离散型数据)
要根据实际问题的特点,选择恰当的统计图对数据进行可视化描述,以使我们通过图形直观地发现样本数据的分布情况,进而估计总体的分布规律。
知识梳理——5.3总体百分位数的估计
一组数据的第 p百分位数:能使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值的数.
计算一组n个数据的第p百分位数的步骤:
第1步:按从小到大排列原始数据;
第2步:计算i=n×p%;
第3步:①若i不是整数,则第p百分位数为第j项数据( j为大于i的比邻整数);
②若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
在实际应用中,常用的分位数还有第25百分位数,第50百分位数(中位数),第75百分位数.
这3个分位数把一组由小到大排列的数据分成四等份,故称为四分位数.
其中,第25百分位数称为第一四分位数或下四分位数等,
第75百分位数也称为第三四分位数或上四分位数等.
第1百分位数
第5百分位数
第95百分位数
第99百分位数
p%
(100-p)%
a
25%
50%
75%
知识梳理——5.4总体集中趋势的估计
数据 平均数 标准差 方差
x1,…,xn s s2
ax1+b,…,axn+b a+b |a|s a2s2
(2)中位数:一组数据按大小依次排列后处在最中间位置的数(或最中间两个数据的平均数).
(1)众数:一组数据中出现次数最多的数.
(3)平均数:一组数据的算术平均数.
知识梳理——5.4总体集中趋势的估计
用频率分布直方图估计众数、中位数、平均数
众数:最高矩形中点的横坐标
特点:反映样本数据的最大集合点忽视了其他数据,无法客观的反映总体特征
中位数:中位数左右两边的直方图面积相等
特点:不受少数几个极端值的影响
平均数:直方图的“重心”,各组组中值与频率乘积之和
特点:和每一个样本数据都有关,可以反映更多的关于样本数据的信息离平均数越远的数据对平均数影响越大(可靠性低)
知识梳理——5.5总体离散趋势的估计
则这组数据的方差为
①为了计算方便,还可把方差写成
注:s≥0;s=0时表示这组数据的每个数据都是相等的.
设一组数据是x1, x2, …, xn,
②这组数据的标准差为
标准差刻画了数据的离散程度或波动幅度:
标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
思想:用样本标准差估计总体标准差
知识梳理——5.5总体离散趋势的估计
分层随机抽样的方差计算:
设样本容量为,平均数为,其中两层的个体数量分别为,,
两层的平均数分别为,,方差分别为,,
则这个样本的方差为:.
方法提炼——数形结合
已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1可求出其他数据.
已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.
方法提炼——方程思想
(1)依据各层总数与样本数之比,确定抽样比.
(2)求某一层的样本数或总体个数时,可先求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数.
(3)求各层的样本数,可先求出各层的抽样比,再求出各层样本数.
(4)在频率分布直方图中,利用中位数两边图形面积相等,可列方程解决问题.
END