课件19张PPT。第二章 统计 单元复习知识结构统计用样本估计总体随机抽样简单随机抽样系统抽样分层抽样变量间的相关关系用样本的频率
布估计总体分布用样本的数字特征估计总体数字特征知识梳理1. 简单随机抽样(1)思想:设一个总体有N个个体, 从中逐个不放回地抽取n个个体作为样本, 如果每次抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样.抽签法:
第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.
第二步,将号签放在一个容器中,并搅拌均匀.
第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.(2)步骤:随机数表法:
第一步,将总体中的所有个体编号.
第二步,在随机数表中任选一个数作为起始数.
第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.2. 系统抽样(1)思想:将总体分成均衡的n个部分,再按照预先定出的规则,从每一部分中抽取1个个体,即得到容量为n的样本.(2)步骤:
第一步,将总体的N个个体编号.
第二步,确定分段间隔k,对编号进行分段.
第三步,在第1段用简单随机抽样确定起始个体编号.
第四步,按照一定的规则抽取样本.3. 分层抽样(1)思想:若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本.(2)步骤:
第一步,计算样本容量与总体的个体数之比.
第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数.
第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体.
第四步,将各层抽取的个体合在一起,就得到所取样本.4. 频率分布表(1)含义:表示样本数据分布规律的表格.(2)作法:
第一步,求极差.
第二步,决定组距与组数.
第三步,确定分点,将数据分组.
第四步,统计频数,计算频率,制成表格.5. 频率分布直方图(1)含义:表示样本数据分布规律的图形.(2)作法:
第一步,画平面直角坐标系.
第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.
第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.6. 频率分布折线图 在频率分布直方图中,依次连接各小长方形上端中点得到的一条折线,称为频率分布折线图.7. 总体密度曲线 当总体中的个体数很多时,随着样本容量的增加,所分的组数增多,组距减少,相应的频率分布折线图越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.8. 茎叶图作法:
第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;
第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;
第三步,将各个数据的叶按大小次序写在茎右(左)侧.9. 众数、中位数和平均数众数:频率分布直方图最高矩形下端中点的横坐标.中位数:频率分布直方图面积平分线的横坐标.平均数:频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的总和.10. 标准差11. 相关关系 自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.12. 散点图 在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图. 如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.13. 回归直线14. 回归方程巩固练习例1 为了了解某地参加计算机水平测试的5000名学生的成绩,从中抽取了200名学生的成绩进行统计分析,在这个问题中,5000名学生成绩的全体是 ( )
A. 总体 B. 个体
C. 从总体中抽取的一个样本 D. 样本的容量A 例2 在2002年春季,一家著名的全国性连锁服装店,进行了一项关于当年秋季服装流行色的民意调查.调查者通过向顾客发放饮料,并让顾客通过挑选饮料杯上印着的颜色来对自己喜欢的服装颜色“投票”.根据这次调查,在某大城市A,服装颜色的众数是红色,而当年全国服装协会发布的是咖啡色.
(1)这个结果是否代表A城市的人的想法?
(2)你认为这两种调查的差异是由什么原因引起的?(1)这个结果只能说明A城市中光顾这家连锁服装店的人,比其他人较少倾向于选择咖啡色,同时由于光顾连锁店的人是一种方便样本,不能代表A城市其他人的想法.(2)是由样本的代表性引起的.因为A城市的调查结果来自于该市光顾这家连锁服装店的人群,这个样本不能很好地代表全国民众的观点. 例3 某初级中学有学生270人,其中七年级108人,八、九年级各81人,现要利用抽样方法抽取10人参加某项调查.使用分层抽样时,将学生按七、八、九年级依次统一编号为1,2,…,270;使用系统抽样时,将学生随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽到的号码有下列四种情况:
① 7,34,61,88,115,142,169,196,223,250;
② 5,9,100,107,111,121,180,195,200,265;
③ 11,38,65,92,119,146,173,200,227,254;
④ 30,57,84,111,138,165,192,219,246,270.
那么下列判断正确的是 ( )
A. ②③都不能为系统抽样 B. ②④都不能为分层抽样
C. ①④都可能为系统抽样 D. ①③都可能为分层抽样D
作业:
P100复习参考题A组:4,6,7.课件9张PPT。第二章 统计 单元复习 例1 为了了解某地区高中学生的身体发育情况,抽查了该地区100名年龄在17.5~18岁的男生体重(单位:kg),得到频率分布直方图如下: 求这100名学生中体重在56.5~64.5范围内的人数.40 例2 某商场为了调查旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得数据整理后,画出频率分布直方图如下:已知图中从左到右前3个小矩形的面积之比为1︰2︰3,第二小组的频数为10.(1)求样本容量的值;
(2)估计购鞋尺寸在37.5~43.5内的顾客所占百分比约是多少?4080% 例3 已知某人5次上班途中所花时间的平均数为10分钟,方差为2分钟,有三次上班途中所花时间分别为9分钟,10分钟和11分钟,求另两次上班途中所花的时间.8分钟,12分钟 例4 某工厂甲、乙两个车间包装同一种产品,在自动包装传送带上,每隔30秒抽一包产品,称其重量是否合格,7次抽查数据记录如下:
甲车间:102,101,99,103,98,99,98;
乙车间:110,115,90,85,75,115,110.
试根据统计原理比较甲、乙两个车间的产品包装质量.甲车间的产品包装质量较稳定. 例5 对某种新品电子元件进行寿命终极度实验,实验数据如下:
试估计总体寿命的平均数.150×0.1 + 250×0.15 + 350×0.4 + 450×0.2 + 550×0.15=365(h) 例6 某工厂经过技术改造后,生产某种产品的产量x吨与相应的生产能耗y吨标准煤有如下几组样本数据:
(1)样本数据是否具有线性相关关系?若是,求出其回归方程;
(2)预测生产100吨产品的生产能耗约需多少吨标准煤?0.7×100+0.35=70.35(吨) 作业:
P101复习参考题
A组:8(1)(2)(3).
B组:1,2.