(共28张PPT)
第5章 用样本推断总体
5.2 统计的简单应用
频数 :
频率:
每个数据出现的次数。
每个数据的次数与总次数的比值。
频率=
频数之和等于总次数。
频率之和等于1。
一般地,一组数据中,每个数据出现的次数称为此数据的频数,而每个数据出现的次数与总次数的比值称为此数据的频率。
1. 频数、频率的概念
知识回顾
2. 绘制频数分布表的步骤:
1、算极值
2、定组数 (5-12组)
3、定组距
4、定分点
5、列频数分布表
在日常生活中, 我们经常遇到各种各样的“率”: 一个国家的森林覆盖率、一个省的婴儿出生率、一个电视栏目的收视率、一种产品的合格率等等. 那么这些“率”到底能够说明什么呢?
从统计的观点看, 一个“率” 就是总体中具有某些特性的个体在总体中所占的百分比.
当要考察的总体所含个体数量较多时,“率” 的计算就比较复杂,有什么方法来对“率” 作出合理的估计吗?
获取新知
在实践中,我们常常通过简单随机抽样,用样本的“率” 去估计总体相应的“率”. 例如工厂为了估计一批产品的合格率, 常常从该批产品中随机抽取一部分进行检查,通过对样本进行分析,从而推断出这批产品的合格率。
可以通过简单随机抽样,先计算出样本的“率” ,再用样本的“率”去估计总体相应的“率”.
例1 某工厂生产了一批产品,从中随机抽取1000件来检查,发现有10件次品. 试估计这批产品的次品率.
解:由于是随机抽取,即总体中每一件产品都有相同的机会被抽取,因此,随机抽取的1000件产品组成了一个简单随机样本,因而可以用这个样本的次品率 作为对这批产品的次品率的估计,从而这批产品的次品率为1%.
例题讲解
某地为提倡节约用水, 准备实行“阶梯水价计费”方式,用户月用水量不超出基本月用水量的部分享受基本价格,超出基本月用水量的部分实行加价收费. 为更好地决策,自来水公司随机抽取了部分用户的月用水量数据,并将这些数据绘制成了 如图所示的统计图(每组数据包括右端点但不包括左端点).
如果自来水公司将基本月
用水量定为每户每月12 t,
那么该地20 万用户中约有
多少用户能够全部享受基
本价格?
获取新知
问题1:从这幅用户的月用水量频数直方图,你能知道总共随机抽取了多少用户来绘制统计图吗?
答:可以从统计图得知,总共有10+20+36+25+9=100(户)被随机抽取绘制了统计图。
问题2:随机抽取的用户中有多少用户每月用水量在基本月用水量以下?
答:由于将基本月用水量定为每户每月12 t,而被抽取的100户用户中,有10 + 20 + 36=66(户)没有超出基本月用水量。
在被抽取的100户用户中,有66户没有超出基本月用水量,因此被随机抽取的用户中有66%的用户能够全部享受基本价格.
由于这100户用户是随机抽取的,因此这100户的月用水量就构成了一个简单随机样本,从而可以用这个样本中的能够全部享受基本价格的用户比例去估计总体相应的比例.因此,估计在该地20万用户中约有20×66%=13.2(万户)的用户能够全部享受基本价格.
问题3:被抽取的用户中,能够全部享受基本价格的用户的“率”是多少
问题4:该地20 万用户中约有多少用户能够全部享受基本价格?
例2 下表给出了某校500 名12 岁男孩中用随机抽样得出的100 人的身高h的分组数据(单位:cm):
(1) 列出样本频率分布表﹔
(2) 估计该校500名12岁男孩中身高小于134cm的人数.
例题讲解
解 (1) 根据题意, 可得如下样本频率分布表.
(2) 由表可知,身高小于134 cm 的男孩出现的频率为0.04 + 0.07 +0.08 = 0.19 .又随机抽取的这100名男孩的身高组成了一个简单随机样本,因而可以用这个样本的频率0.19作为该校500名12岁男孩相应频率的估计.
因此,估计该校500名12岁男孩中身高小于134 cm的人数约为500 × 0.19 = 95(人).
李奶奶在小区开了一家便利店,供应A,B, C,D,E5个品种的食物.由于不同品种的食物的保质期不同,因此, 有些品种因滞销而变质,造成浪费,有些品种因脱销而给居民购买带来不便. 面对这种情况,李奶奶很着急.请你想办法帮助李奶奶解决这一问题.
随机抽取几天中这5个品种食物的销售情况,再根据结果提出合理建议.
分析这个问题的时候都有哪几个具体步骤呢?
获取新知
(1) 调查和收集资料.
随机统计两周中5个品种食物的每天销售量(结果如下表):
问题:需要统计多长时间内5种食物的销售量才具有参考意义呢?
(2)分周统计每个品种的销售情况.
(3) 分析统计结果.
问题:根据上述每个品种的周销售情况,你有什么发现?各个品种的销售稳定吗?
从上面的统计表中可以发现每个品种每周的销售量虽然有时多,有时少,但变化不大. 这说明这个小区的需求量是很稳定的,但不同品种的销售量有很大区别,故只需按适当的比例进货,就能既不会因滞销造成浪费,也不会因脱销而给居民带来不便.
因为309.5:257.5:292:190:149.5≈30:25:30:20:15
=6:5:6:4:3 ,
于是,可以建议李奶奶按6:5:6:4:3 的比例购进A、B、C、D、E这5种食物。
(4) 确定进货方案.
按照适当的比例购进商品时,需考虑销售量时有波动的影响,因此应先计算各品种的周平均销量(结果如下表).
确定样本容量
根据上述问题的讨论,总结一下,利用样本来推断总体的过程是怎样的?
总体
简单随机样本
分析数据
整理数据
推断
想一想
通过科学调查,在取得真实可靠的数据后,我们可以运用正确的统计方法来推断总体,除此之外,还可以利用已有的统计数据来对事物在未来一段时间内的发展趋势做出判断和预测,为正确的决策提供服务.
归纳总结
下表是2006—2011年全国城镇居民人均可支配收入(单位:元)统计表:
(1) 根据上表数据,以年份为横坐标,以人均可支配收入为纵坐标, 建立直角坐标系,并在该坐标系中描出坐标(年份,人均可支配收入);
(2) 试用直线表示全国城镇居民人均可支配收入在近几年内的发展趋势.
按上述要求建立直角坐标系后,描出这些数据,可得图如下:
由于这些点“紧靠” 在上图所示的直线 的两旁,因此我们可以认为这条直线 近似地表示出了这几年全国城镇居民人均可支配收入的发展趋势.从而,由此图我们可以预测: 在近几年内全国城镇居民人均可支配收入将是逐年递增的.
由此可以看出:
根据已有的资料确定的一条直线,可以用来预测事物在未来一段时间内的发展趋势.
归纳总结
1. 某市教育局为了解该市5 万名九年级学生的身体素质情况,随机抽取了1000 名九年级学生进行检测. 已知被检测学生的身体素质达标率为95%,请据此估计该市九年级学生中身体素质达标的学生人数.
解:由于是随机抽取,即总体中每一名九年级学生都有相同的机会被抽取,因此,随机抽取的1000名学生组成了一个简单随机样本.
因而可以用这个样本身体素质达标率95%去估计全市50000名学生身体素质的达标率,从而该市九年级学生中身体素质达标的学生人数为
(人)。
随堂演练
2. 为了让学生了解环保知识,增强环保意识,某市在中学生中举举行了一次“环保知识竞赛”,共有19000 名中学生参加了这次竞赛.为了解本次竞赛成绩情况,从中随机抽取了500名学生的成绩x(得分均为整数,满分为100分)进行统计后得到下表.请根据表格解答下列问题:
(1) 补全表格;
(2) 假设成绩在71 分至90 分
之间(含71 分,90 分)的学生
为二等奖,请据此估计该市获得
二等奖的学生人数.
解: (1)
(2) 成绩在71分到90分之间的学生的频率为0.52,这些学生可获得二等奖,由于这500名学生的成绩是随机抽取的,因此用这500名学生中获得二等奖的学生的频率去估计19000名中学生获二等奖的学生的频率,获得二等奖的学生人数为 :
.
分组 频数 频率
51≤x<61 40 0.08
61≤x<71 80 0.16
71≤x<81 100 0.2
81≤x<91 160 0.32
91≤x<101 120 0.24
合计 500 1
3. 某工厂需要A,B,C三种原料用于生产,为了合理进料以维持正常生产,工厂随机统计了两周中每天原料消耗(单位:t)的情况:
试根据上述资料确定每次进料时A,B,C三种原料的进料比例,以使工厂尽量少发生原料过多囤积或短缺的现象.
解:分周统计每种原料的消耗量:
A B C
第一周 194 102 97
第二周 188 96 105
两周消耗量之差 6 6 8
从上面的统计表中,可以发现每种原料每周的消耗量变化并不大,说明原料的消耗量是比较稳定的,但不同原料的消耗量有很大区别,因此需要按照适当的比例进原料,以使工厂尽量少发生原料过多囤积或短缺的现象.
各原料的日平均消耗量:
原料 A B C
日平均消耗量 27.29 14.14 14.43
因为27.29:14.14:14.43≈2:1:1,因此可以按照2:1:1这个比例确定A、B、C三种原料的进料比例。
4. 下表是我国2006—2010年第一产业在国民生产总值中的比例数据:
(1) 请根据表中数据, 建立直角坐标系, 并描出坐标(年份, 第一产业在国民生产总值中的比例);
(2) 试用直线表示第一产业在我国国民生产总值中的比例在近几年内的发展趋势.
解:从趋势上看,第一产业在我国国民生产总值中的比例是逐年下降的。
样本平均数
总体在未来一段
时间的发展水平
简单随
机样本
总体平均值
总
体
预测
随机
抽样
估
计
样本方差
样本的某种“率”
样本的频数、频率分布
总体方差
总体相应的“率”
总体的频数、频率分布
总体在未来一段
时间的发展趋势
控制
课堂小结