中小学教育资源及组卷应用平台
2020-2021学年高一数学下学期期末专项复习(人教A版必修三)
知识梳理
第二章 统计
知识点一 统计的基本概念
(1)总体:一般把所考察对象的某一数值指标的全体构成的集合看成总体.
(2)个体:构成总体的每一个元素作为个体.
(3)样本:从总体中抽出若干个个体所组成的集合叫样本.
(4)样本容量:样本中个体的数目叫样本容量.
知识点二 简单随机抽样
1.设一个总体含有N个_???????????????é??_个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
2.简单随机抽样的四个特点
①它要求被抽取样本的总体的个数有限,这样便于通过随机抽取的样本对总体进行分析.
②它是从总体中逐个抽取,这样便于在抽样实践中进行操作.
③它是一种不放_????????·?????±???_抽样实践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算.【版权所有:21教育】
④它是一种等机会抽样_??????????????????_总体中抽取一个个体时,各个个体被抽到的机会相等,而且在整个抽样的过程中,各个个体被抽取的机会也相等,从而保证了这种抽样方法的公平性.
3.常用方法--抽签法和随机数法
(1)抽签法:把总体中的N个个体_?????·????????·???_写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.
(2)随机数法:随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.21教育名师原创作品
(3)利用随机数法抽取个体时的注意事项
①定起点:事先应确定以表中的哪个数(哪行哪列)作为起点.
②定方向:读数的方向(向左、向右、向上或向下都可以).
③读数规则:读数时结合_?????·?????????è??_行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,如果出现重复则跳过,直到取满所需的样本个体数.2-1-c-n-j-y
知识点三 分层抽样
1.分层抽样的定义
当总体是由差异明显的几个_é?¨???????????????_在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.【来源:21cnj*y.co*m】
分层抽样尽量利用了调查者对调查对_è±?(??????)???_先所掌握的各种信息,并充分考虑了保持样本结构与总体结构的一致性,这对提高样本的代表性是非常重要的.21*cnjy*com
2.分层抽样的实施步骤
第一步,按某种特征将总体分成若干部分(层).
第二步,计算抽样比.抽样比=.
第三步,各层抽取的个体数=各层总的个体数×抽样比.
第四步,依各层抽取的个体数,按简单随机抽样从各层抽取样本.
第五步,综合每层抽样,组成样本.
知识点四 系统抽样
1.系统抽样的概念:当_?????????????????°_较多时,可将总体分成均衡的几个部分,然后按照预先制定的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样的方法叫作系统抽样.
2.系统抽样的步骤
假设要从容量为N的总体中抽取容量为n的样本.
(1)先将总体的N个个体编号.
(2)确定分段间隔k,对_?????·è??è????????_,当是整数时,取k=,当不是整数时,随机从总体中剔除余数,再取k=(N′为从总体中剔除余数后的总数).21教育网
(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k).
(4)按照一_??????è§??????????_样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.【来源:21·世纪·教育·网】
知识点五 三种抽样方法的比较
简单随机抽样、分层抽样、系统抽的比较如下表所示:
类别 共同点 各自特点 相互联系 适用范围
简单随机抽样 (1)抽样过程中每个个体被抽到的可能性相等;
(2)每次抽出个体后不再将它放回,即不放回抽样 从总体中逐个抽取
总体中的个体数较少
分层抽样
将总体分成几层,在各层中按同一抽样比抽取 在各层抽样时,采用简单随机抽样 总体由差异明显的几部分组成
系统抽样
将总体分成均衡的几个部分,然后按照预先制定的规则在各部分抽取 在起始部分抽样时采用随机抽样 总体中的个体较多
知识点六
1.数据分析的基本方法
(1)借助于图形
分析数据的一种基本方法是用图将它们画出来,此方法可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.21世纪教育网版权所有
(2)借助于表格
分析数据的另一种方法是用紧凑的表格改变数据的排列方式,此方法是通过改变数据的构成形式,为我们提供解释数据的新方式.21·cn·jy·com
2.样本的数字特征:(1)众数、中位数、平均数
数字特征 定义与求法 优点与缺点
众数 一组数据中出现次数最多的数 通常用于描述出现次数最多的数,显然它对其他数据信息的忽视使得无法客观地反映总体特征
中位数 把一组数据按大小顺序排列,处在最中间位置的一个数据(或两个数据的平均数) 中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点
平 均
数 如果有n个数据x1,x2,…,xn,那么这n个数的平均数=(x1+x2+…+xn) 平均数和每一个数据有关,可以反映样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时可靠性降低
(2)标准差、方差
①标准差:样本数据到平均数的一种平均距离,一般用s表示,
s=.
②方差:标准差的平方s2
s2=[(x1-)2+(x2-)2+…+(xn-)2],其中xi(i=1,2,3,…,n)是样本数据,n是样本容量,是样本平均数.www.21-cn-jy.com
3.[知识拓展]
1.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.www-2-1-cnjy-com
(2)数据x1,x2,…,xn的方差为s2.
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2.
众数:一组数据出现次数最多的数叫众数,众数反映一组数据的多数水平;
中位数:一组数据中间的数(起到分水岭的作用),中位数反映一组数据的中间水平;
平均数:反映一组数据的平均水平;
方差:反映一组数据偏离平均数_????¨?????????¨???_衡量一批数据的波动大小(即这批数据偏离平均数的大小).在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.
标准差是方差的算术平方根,意义在于反映一组数据的离散程度.
知识点七 常用统计图表
1.(1)频率分布表的画法:
第一步:求极差,决定组数和组距,组距=;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:反映样本频率分布的直方图.
横轴表示样本数据,纵轴表示,每个小矩形的面积表示样本落在该组内的频率.
①用样本估计总体是统计的基_????????????è?????_用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,而直方图比较直观.
②频率分布表中的频数之和等于_??·??????é????????_组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.
(3)频率分布折线图和总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
②总体密度曲线:_é???????·??????é??_的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
2.茎叶图的画法:
第一步:将每个数据分为茎(高位)和叶(低位)两部分;
第二步:将各个数据的茎按大小次序排成一列;
第三步:将各个数据的叶依次写在其茎的右(左)侧.
由茎叶图可以清晰地看到数据_??????????????????_这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示.缺点是当样本容量较大时,作图较烦琐.利用茎叶图对样本进行估计时,要注意区分茎与叶,茎是指中间的一列数,叶是从茎的旁边生长出来的数.21cnjy.com
知识点八 变量间的相关关系
1.两个变量的线性相关
(1)正相关:在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.2·1·c·n·j·y
(2)负相关:在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.
(3)线性相关关系、回归直线:
如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.21*cnjy*com
2.回归方程
(1)最小二乘法:求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.
(2)回归方程:方程=是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中,是待定参数.【出处:21教育名师】
3.回归分析:
(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.
(2)样本点的中心:对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中(,)称为样本点的中心.21·世纪*教育网
(3)相关系数:
当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两_??????é??????????§_相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.
_21?????????è?????(www.21cnjy.com)_