(共21张PPT)
第二章 统计 单元复习
知识结构
统计
用样本估计总体
随机抽样
简单随机抽样
系统抽样
分层抽样
变量间的相关关系
用样本的频率分
布估计总体分布
用样本的数字特征估计总体数字特征
线性回归分析
知识梳理
1. 简单随机抽样
(1)思想:设一个总体有N个个体, 从中逐个不放回地抽取n个个体作为样本, 如果每次抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样.
抽签法:
第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.
第二步,将号签放在一个容器中,并搅拌均匀.
第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.
(2)方法:
随机数表法:
第一步,将总体中的所有个体编号.
第二步,在随机数表中任选一个数作为起始数.
第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.
2. 系统抽样
(1)思想:将总体分成均衡的n个部分,再按照预先定出的规则,从每一部分中抽取1个个体,即得到容量为n的样本.
(2)步骤:
第一步,将总体的N个个体编号.
第二步,对编号分成n段,确定分段间隔k.
第三步,在第1段用简单随机抽样确定起始个体编号L.
第四步,按照L+k,L+2k,L+3k…规则抽取样本.
3. 分层抽样
(1)思想:若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本.
(2)步骤:
第一步,计算样本容量与总体的个体数之比.
第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数.
第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体.
第四步,将各层抽取的个体合在一起,就得到所取样本.
4. 频率分布表
(1)含义:表示样本数据分布规律的表格.
(2)作法:
第一步,求极差.
第二步,决定组距与组数.
第三步,确定分点,将数据分组.
第四步,统计频数,计算频率,制成表格.
5. 频率分布直方图
(1)含义:表示样本数据分布规律的图形.
(2)作法:
第一步,画平面直角坐标系.
第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.
第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.
6. 频率分布折线图
在频率分布直方图中,依次连接各小长方形上端中点得到的一条折线,称为频率分布折线图.
7. 总体密度曲线
当总体中的个体数很多时,随着样本容量的增加,所分的组数增多,组距减少,相应的频率分布折线图越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
8. 茎叶图
作法:
第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;
第二步,将最小的茎和最大的茎之间的数按大小次序排成一列;
第三步,将各个数据的叶按大小次序写在茎右(左)侧.
9. 众数、中位数和平均数
众数:频率分布直方图最高矩形下端中点的横坐标.
中位数:频率分布直方图面积平分线的横坐标.
平均数:频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的总和.
10. 标准差
11. 相关关系
自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.
12. 散点图
在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.
如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
13. 回归直线
14. 回归方程
巩固练习
1. 为了了解某地参加计算机水平测试的5000名学生的成绩,从中抽取了200名学生的成绩进行统计分析,在这个问题中,5000名学生成绩的全体是 ( )
A. 总体 B. 个体
C. 从总体中抽取的一个样本 D. 样本的容量
2.某学校高三年级有男生500人,女
生400人,为了解该年级学生的健康
情况,从男生中任意抽取25人,从女
生中任意抽取20人进行调查.这种抽 样方法是( )
(A)简单随机抽样法 (B)抽签法
(C)随机数表法 (D)分层抽样法
3.已知一个线性回归方程为
y=-2x+5,当变量x增加一个单位时,
y的变化规律是( )
A 增加2个单位 B 增加5个单位
C 减少2个单位 D 减少5个单位
4. 已知某人5次上班途中所花时间的平均数为10分钟,方差为2分钟,有三次上班途中所花时间分别为9分钟,10分钟和11分钟,求另两次上班途中所花的时间.
8分钟,12分钟
5. 对某种新品电子元件进行寿命终极度实验,实验数据如下:
试估计总体寿命的平均数.
30
40
80
30
20
个 数
500~600
400~500
300~400
200~300
100~200
寿命(h)
150×0.1 + 250×0.15 + 350×0.4 + 450×0.2 + 550×0.15=365(h)
6. 为了了解某地区高中学生的身体发育情况,抽查了该地区100名年龄在17.5~18岁的男生体重(单位:kg),得到频率分布直方图如下:
54.5 56.5 58.5 60.5 62.5 64.5 66.5 68.5 70.5 72.5
体重/kg
频率
组距
0.03
0.05
0.07
求这100名学生中体重在56.5~64.5范围内的人数.
40
7. 某商场为了调查旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得数据整理后,画出频率分布直方图如下:
35.5 37.5 39.5 41.5 43.5 45.5
尺寸
频率
组距
0.0375
0.0875
已知图中从左到右前3个小矩形的面积之比为1︰2︰3,第二小组的频数为10.
(1)求样本容量的值;
(2)估计购鞋尺寸在37.5~43.5内的顾客所占百分比约是多少?
40
80%