课件13张PPT。第二章 统 计
复 习知识结构1、求极差(即一组数据中最大值与最小值的差)
知道这组数据的变动范围2、决定组距与组数(组数取整)3、 将数据分组1.画频率分布直方图的步骤4、列出频率分布表.(填写频率/组距一栏)5、画出频率分布直方图(高度=频率/组距)。组距:指每个小组的两个端点的距离
组数:将数据分组,当数据在100个以内时,
按数据多少常分5-12组。2.2 用样本估计总体2.2.1用样本的频率分布估计总体分布说明:小长方形面积=频率,所有小正方形面积=12.连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图3.当样本容量无限增大,组距无限缩小,那么频率分布折线图就会无限接近于一条光滑曲线——总体密度曲线。4.茎叶图(适用于样本数据较少时)1.某企业有职工150人,其中高级职称15人,中级职称45人,一般职员90人,现要用分层抽样法抽取30人进行调查,则从各职称中抽取的人数分别为___________3,9,18(一)抽样方法:2.对于简单随机抽样,下列说法正确的为( )
(1)它要求被抽取样本的总体的个数是有限的,以便对其中各个个体被抽取的概率进行分析;
(2)它是从总体中逐个地进行抽取,以便在抽取实践中进行操作;
(3)它是一种不放回抽样;
(4)它是一种等概率抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的概率相等,而且在整个抽样过程中,各个个体被抽取的概率也相等,从而保证了这种抽样方法的公平性。A.(1)(2)(3) B.(1)(2)(4) C(1)(2)(3) D(1)(2)(3)(4)D3.某公司在甲乙丙丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为(1);在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为(2)。则完成(1)(2)这两项调查宜采用的抽样方法依次是( )
A.分层抽样法,系统抽样 B.分层抽样法,简单随机抽样
C.系统抽样法,分层抽样法 D.简单随机抽样 ,分层抽样法B已知200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速在【60,70)内的汽车大约有____________辆。6080(二)频率分布直方图:(三)关于茎叶图甲、乙两个班级各随机选出15名同学进行测试,成绩(单位:分)的茎叶图如图所示:甲乙648579,4,162,5,978,7,6,4,2,12,5,7,8,9 7,4,41,4,4,7,98692则甲、乙两班的最高成绩各是 _________ 分,从图中看,_______班的平均成绩较高96,92乙四. 用样本的数字特征估计总体的数字特征1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。2.在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。3.平均数在频率分布直方图中是每个小矩形对应的频率乘以小矩形底边中点的横坐标之和.(一)众数、中位数、平均数注意:1.平均数表明了频率分布直方图的重心所在。2.标准差、方差表明了总体的离散程度。(五).标准差标准差考察样本数据的分散程度的大小计算标准差公式方差:标准差的平方标准差越大,样本数据越分散
标准差越小,样本数据越集中某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量,分别记录抽查数据如下:
甲:102 101 99 98 103 98 99
乙:110 115 90 85 75 115 110(1)这种抽样方法是哪一种?
(2)估计甲、乙两车间的平均值与方差,并说明哪个车间的产品稳定?课件21张PPT。第二章 统计 单元复习知识结构统计用样本估计总体随机抽样简单随机抽样系统抽样分层抽样变量间的相关关系用样本的频率分
布估计总体分布用样本的数字特征估计总体数字特征知识梳理1. 简单随机抽样(1)思想:设一个总体有N个个体, 从中逐个不放回地抽取n个个体作为样本, 如果每次抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样.抽签法:
第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.
第二步,将号签放在一个容器中,并搅拌均匀.
第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.(2)方法:随机数表法:
第一步,将总体中的所有个体编号.
第二步,在随机数表中任选一个数作为起始数.
第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.2. 系统抽样(1)思想:将总体分成均衡的n个部分,再按照预先定出的规则,从每一部分中抽取1个个体,即得到容量为n的样本.(2)步骤:
第一步,将总体的N个个体编号.
第二步,对编号分成n段,确定分段间隔k.
第三步,在第1段用简单随机抽样确定起始个体编号L.
第四步,按照L+k,L+2k,L+3k…规则抽取样本.3. 分层抽样(1)思想:若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本.(2)步骤:
第一步,计算样本容量与总体的个体数之比.
第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数.
第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体.
第四步,将各层抽取的个体合在一起,就得到所取样本.4. 频率分布表(1)含义:表示样本数据分布规律的表格.(2)作法:
第一步,求极差.
第二步,决定组距与组数.
第三步,确定分点,将数据分组.
第四步,统计频数,计算频率,制成表格.5. 频率分布直方图(1)含义:表示样本数据分布规律的图形.(2)作法:
第一步,画平面直角坐标系.
第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.
第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.6. 频率分布折线图 在频率分布直方图中,依次连接各小长方形上端中点得到的一条折线,称为频率分布折线图.7. 总体密度曲线 当总体中的个体数很多时,随着样本容量的增加,所分的组数增多,组距减少,相应的频率分布折线图越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.8. 茎叶图作法:
第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;
第二步,将最小的茎和最大的茎之间的数按大小次序排成一列;
第三步,将各个数据的叶按大小次序写在茎右(左)侧.9. 众数、中位数和平均数众数:频率分布直方图最高矩形下端中点的横坐标.中位数:频率分布直方图面积平分线的横坐标.平均数:频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的总和.10. 标准差11. 相关关系 自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.12. 散点图 在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图. 如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.13. 回归直线14. 回归方程巩固练习 1. 为了了解某地参加计算机水平测试的5000名学生的成绩,从中抽取了200名学生的成绩进行统计分析,在这个问题中,5000名学生成绩的全体是 ( )
A. 总体 B. 个体
C. 从总体中抽取的一个样本 D. 样本的容量
2.某学校高三年级有男生500人,女
生400人,为了解该年级学生的健康
情况,从男生中任意抽取25人,从女
生中任意抽取20人进行调查.这种抽样方法是( )
(A)简单随机抽样法 (B)抽签法
(C)随机数表法 (D)分层抽样法3.已知一个线性回归方程为 y=-2x+5,当变量x增加一个单位时,
y的变化规律是( )
A 增加2个单位 B 增加5个单位
C 减少2个单位 D 减少5个单位4. 已知某人5次上班途中所花时间的平均数为10分钟,方差为2分钟,有三次上班途中所花时间分别为9分钟,10分钟和11分钟,求另两次上班途中所花的时间.8分钟,12分钟5. 对某种新品电子元件进行寿命终极度实验,实验数据如下:
试估计总体寿命的平均数.150×0.1 + 250×0.15 + 350×0.4 + 450×0.2 + 550×0.15=365(h) 6. 为了了解某地区高中学生的身体发育情况,抽查了该地区100名年龄在17.5~18岁的男生体重(单位:kg),得到频率分布直方图如下: 求这100名学生中体重在56.5~64.5范围内的人数.407. 某商场为了调查旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得数据整理后,画出频率分布直方图如下:已知图中从左到右前3个小矩形的面积之比为1︰2︰3,第二小组的频数为10.(1)求样本容量的值;
(2)估计购鞋尺寸在37.5~43.5内的顾客所占百分比约是多少?4080%