课件21张PPT。用样本推断总体第5章总体平均数与方差的估计5.1 某农科院在某地区选择了自然条件相同的两个试验区,在种植面积相同的条件下,用相同的管理技术试种了两个品种的水稻, 如何确定哪个品种的水稻在该地区更有推广价值呢?这个问题看似很庞大,但如果找到好的方法,会很容易解决。我们可以在本节课的最后再来回答这个问题。有同学说,可以在两个实验区分别检查一下这两种水稻,那么具体要怎么检查呢?阅读下面的报道,回答问题.从上述报道可见, 北京市统计局进行2012 年度人口调查采用的是什么调查方式?实际上,在研究某个总体时,一般用数据表示总体中每个个体的某种数量特性,所有这些数据组成一个总体,而样本则是从总体中抽取的部分数据.从报道中可以看出,北京统计局进行人口调查是采用的 抽样调查的方法。实际生活中还有哪些情况也需要使用上述抽样调查的方法?从总体中抽取样本,然后通过对样本的分析,去推断总体的情况,这是统计的基本思想. 用样本平均数、样本方差分别去估计总体平均数、总体方差就是这一思想的一个体现. 样本蕴含着总体的许多信息,这使得我们有可能通过样本的某些特性去推断总体的相应特性.(1)如何估计某城市所有家庭一年内平均丢弃的塑料袋个数?可以从某城市所有家庭中随机抽取一部分家庭,统计他们在一年内丢弃的塑料袋个数, 然后求出它们的平均值,再用这个平均值去估计该城市所有家庭一年内平均丢弃的塑料袋个数.(2)在检查甲、乙两种棉花的纤维长度时,如何估计哪种棉花的纤维长度比较整齐?
总之,可以进行简单随机抽样,然后用样本去推断总体.可以从甲、乙两种棉花中各抽取一定量的棉花,分别统计它们的纤维长度的方差, 再用这两个方差分别去估计这两种棉花纤维长度的整齐性,方差小的棉花品种整齐性较好. 某农科院在某地区选择了自然条件相同的两个试验区,用相同的管理技术试种甲、乙两个品种的水稻各100 亩. 如何确定哪个品种的水稻在该地区更有推广价值呢? 为了选择合适的稻种,我们需要关心这两种水稻的平均产量及产量的稳定性(即方差). 于是,待水稻成熟后,各自从这100 亩水稻随机抽取10 亩水稻,记录它们的亩产量(样本),数据如下表所示:
这10亩甲、乙品种的水稻的平均产量分别为:由于这10亩水稻是简单随机抽取的,因此可以分别用这10亩水稻的平均产量去估计这两种水稻大面积种植后的平均产量.因此我们可以估计种植乙种水稻的产量要比种植甲种水稻的产量稳定.
从而我们可以得出:在该地区,种植乙种水稻更有推广价值.
问题:从平均产量这一角度我们能确定哪种水稻更具推广价值吗?怎样来考虑水稻产量的稳定性呢?由于简单随机样本客观地反映了实际情况,能够代表总体,因此我们可用简单随机样本的平均数与方差分别去估计总体的平均数与方差. 例:一台机床生产一种直径为40mm 的圆柱形零件,在正常生产时,生产的零件的直径的方差应不超过0.01.如果
超过0.01,则机床应检修调整.下表是某日8:30—9:30及10:00—11:00 两个时段中各随机抽取10个零件量出的直径的数值(单位:mm):试判断在这两个时段内机床生产是否正常.在10:00—11:00这段时间内生产的零件中,随机抽取的10个零件的直径的平均数 、方差 分别为:
由于随机抽取的8:30—9:30这段时间内生产的10个零件的直径的方差为0.03,远远超过0.01 的界限,因此我们可以推断在这段时间内该机床生产不正常.
类似地,我们可以推断在10:00—11:00这段时间内该机床生产正常.1、小明为了估计自己从起床至到达教室所需的平均时间, 他随机记录了自己20天每天从起床至到达教室所需的时间, 得到下表:试据此估计小明从起床至到达教室所需的平均时间.解:这20天小明从起床至到达教室所需的时间的平均数为因此可估计小明从起床至到达教室所需的平均时间为49.15分钟。2、甲、乙两台包装机同时包装质量为200g的糖果,从中随机抽取10袋,测得其实际质量(单位:g)分别如下:试根据以上数据判断哪台包装机包装糖果的质量比较稳定.解:甲包装机包装的糖果中抽取10袋糖果的实际质量的平均数和方差分别为:而乙包装机包装的糖果中抽取10袋糖果的实际质量的平均数和方差分别为:例 (2012内蒙古呼和浩特)为了解我市3路公共汽车的运营情况,公交部门随机统计了某天3路公共汽车每个运行班次的载客量,得到如下频数分布直方图.如果以各组的组中值代表各组实际数据,请分析统计数据完成下列问题.
(1)找出这天载客量的中位数,说明这个中位数的意义;
(2)估计3路公共汽车平均每班的载客量大约是多少?
(3)计算这天载客量在平均载客量
以上班次占总班次的百分数.
(注:一个小组的组中值是指
这个小组的两个端点数的平均数) 解:(1)80人,估计3路公共汽车每天大约有一半的班次的载客量超过80人。解析:
(1)从图上可看出中位数是80,估计3路公共汽车每天大约有一半的班次的载客量超过80人。(2)求出平均数,可代表3路公共汽车平均每班的载客量大约是多少。(3)找出在平均载客量以上的班次,算出这些人数的和,然后除以总人数即可。1. 如何用样本平均数、样本方差去估计总体平均数、总体方差?答:以最开始对如何确定哪个品种的水稻在该地区更有推广价值这个问题为例,可以分别在两个实验区随机抽取一些水稻,统计出评价水稻质量的指标作为一个样本,再计算出样本的平均数和方差,进而估计出两个实验区不同品种水稻的平均数和方差,从而判断出哪个品种的水稻更具推广价值。答:首先选择随机样本,计算样本的平均数和方差,用来估计总体的样本和方差。在大多数情况下, 当样本容量足够大时, 用简单随机样本的统计量去对总体作出相应的估计是合理的.这样我们就完成了用样本推断总体的过程。2. 用样本推断总体的过程是怎样的?
结 束单位:北京五中分校
姓名:曹自由
课件32张PPT。用样本推断总体第5章 统计的简单应用5.2在日常生活中, 我们经常遇到各种各样的“率”: 一个国家的森林覆盖率、一个省的婴儿出生率、一个电视栏目的收视率、一种产品的合格率等等. 那么这些“率”到底能够说明什么呢? 从统计的观点看, 一个“率” 就是总体中具有某些特性的个体在总体中所占的百分比. 当要考察的总体所含个体数量较多时,“率” 的计算就比较复杂,有什么方法来对“率” 作出合理的估计吗?
在实践中,我们常常通过简单随机抽样,用样本的“率” 去估计总体相应的“率”. 例如工厂为了估计一批产品的合格率, 常常从该批产品中随机抽取一部分进行检查,通过对样本进行分析,从而推断出这批产品的合格率。例1 某工厂生产了一批产品,从中随机抽取1000件来检查,发现有10件次品. 试估计这批产品的次品率. 某地为提倡节约用水, 准备实行“阶梯水价计费”
方式,用户月用水量不超出基本月用水量的部分享受基
本价格,超出基本月用水量的部分实行加价收费. 为更好
地决策,自来水公司随机抽取了部分用户的月用水量数据,并将这些数据绘制成了 所示的统计图(每组数据包括右端点但不包括左端点).
如果自来水公司将基本月
用水量定为每户每月12 t,
那么该地20 万用户中约有
多少用户能够全部享受
基本价格?问题1:从这幅用户的月用水量频数直方图,你能知道总共随机抽取了多少用户来绘制统计图吗?答:可以从统计图得知,总共有10+20+36+25+9=100(户)被随机抽取绘制了统计图。问题2:随机抽取的用户中有多少用户每月用水量在基本月用水量以下?答:由于将基本月用水量定为每户每月12 t,而被抽取的100户用户中,有66户(10 + 20 + 36)没有超出基本月用水量。问题3:被抽取的用户中,能够全部享受基本价格的用户的“率”是多少?问题4:该地20 万用户中约有多少用户能够全部享受基本价格?例2 下表给出了某校500 名12 岁男孩中用随机抽样得出的100 人的身高h的分组数据(单位:cm):(1) 列出样本频率分布表﹔
(2) 估计该校500名12岁男孩中身高小于134cm的人数.解 (1) 根据题意, 可得如下样本频率分布表.(2) 由上表可知,身高小于134 cm 的男孩出现的频率为0.04 + 0.07 +0.08 = 0.19 .又随机抽取的这100名男孩的身高组成了一个简单随机样本,因而可以用这个样本的频率0.19作为该校500名12岁男孩相应频率的估计.
因此,估计该校500名12岁男孩中身高小于134 cm的人数约为500 × 0.19 = 95(人).1. 某市教育局为了解该市5 万名九年级学生的身体素质情况,随机抽取了1000 名九年级学生进行检测. 已知被检测学生的身体素质达标率为95%,请据此估计该市九年级学生中身体素质达标的学生人数.解:由于是随机抽取,即总体中每一名九年级学生都有相同的机会被抽取,因此,随机抽取的1000名学生组成了一个简单随机样本.2. 为了让学生了解环保知识,增强环保意识,某市在中学生中举举行了一次“环保知识竞赛”,共有19000 名中学生参加了这次竞赛.为了解本次竞赛成绩情况,从中随机抽取了500名学生的成绩x(得分均为整数,满分为100分)进行统计后得到下表.请根据表格解答下列问题:
(1) 补全表格;
(2) 假设成绩在71 分至90 分
之间(含71 分,90 分)的学生
为二等奖,请据此估计该市获得
二等奖的学生人数.
解: (1) 李奶奶在小区开了一家便利店,供应A,B, C,D,E5个品种的食物.由于不同品种的食物的保质期不同,因此, 有些品种因滞销而变质,造成浪费,有些品种因脱销而给居民带来不便. 面对这种情况,李奶奶很着急.请你想办法帮助李奶奶解决这一问题.(1) 调查和收集资料.随机统计两周中5个品种食物的每天销售量(结果如下表):问题:需要统计多长时间内5种食物的销售量才具有参考意义呢?(2)分周统计每个品种的销售情况.(3) 分析统计结果.问题:根据上述每个品种的周销售情况,你有什么发现?各个品种的销售稳定吗? 从上面的统计表中可以发现每个品种每周的销售量虽然有时多,有时少,但变化不大. 这说明这个小区的需求量是很稳定的,但不同品种的销售量有很大区别,故只需按适当的比例进货,就能既不会因滞销造成浪费,也不会因脱销而给居民带来不便.因为309.5:257.5:292:190:149.5≈30:25:30:20:15
=6:5:6:4:3 ,
于是,可以建议李奶奶按6:5:6:4:3 的比例购进A、B、C、D、E这5种食物。(4) 确定进货方案.
按照适当的比例购进商品时,需考虑销售量时有波动的影响,因此应先计算各品种的周平均销量(结果如下表).
根据上面一题的讨论,总结一下,利用样本来推断总体的过程是怎样的?总体简单随机样本分析数据整理数据推断确定样本容量 通过科学调查,在取得真实可靠的数据后,我们可以运用正确的统计方法来推断总体,除此之外,还可以利用已有的统计数据来对事物在未来一段时间内的发展趋势做出判断和预测,为正确的决策提供服务.下表是2006—2011年全国城镇居民人均可支配收入(单位:元)统计表:(1) 根据上表数据,以年份为横坐标,以人均可支配收入为纵坐标, 建立直角坐标系,并在该坐标系中描出坐标(年份,人均可支配收入);
(2) 试用直线表示全国城镇居民人均可支配收入在近几年内的发展趋势.按上述要求建立直角坐标系后,描出这些数据,可得图如下:由此可以看出:根据已有的资料(在近几年内的数据)确定的一条直线,可以用来预测事物在未来一段时间内的发展趋势.1. 用样本推断总体是统计中的一种重要思想.在抽样调查时,由于我们只抽取部分数据组成样本,而总体平均数和总体方差是未知的,因此我们希望寻找一个好的抽取样本的方法,使得样本能够代表总体,能客观地反映实际情况. 一般情况下,我们可以采用简单随机抽样的方法得到简单随机样本,然后用简单随机样本的样本平均数、样本方差分别去估计总体平均数、总体方差. 在大多数情况下,当样本容量够大时,这种估计是比较合理的.2. 在现实生活中,有许多数据是与时间有关的,因此这些数据会呈现一定的发展趋势,这启发我们用一条直线来表示发展趋势. 通过分析趋势图我们可以感受随机现象的变化趋势,感悟一些随机现象的规律性.
1. 某工厂需要A,B,C三种原料用于生产,为了合理进料以维持正常生产,工厂随机统计了两周中每天原料消耗(单位:t)的情况:试根据上述资料确定每次进料时A,B,C 三种原料的进料比例,以使工厂尽量少发生原料过多囤积或短缺的现象.
解:(1)分周统计每种
原料的消耗量:(2)从上面的统计表中,可以发现每种原料每周的消耗量变化并不大,说明原料的消耗量是比较稳定的,但不同原料的消耗量有很大区别,因此需要按照适当的比例进原料,以使工厂尽量少发生原料过多囤积或短缺的现象.(3)各原料的日平均消耗量:因为27.29:14.14:14.43≈2:1:1,因此可以按照2:1:1这个比例确定
A、B、C三种原料的进料比例。2. 下表是我国2006—2010年第一产业在国民生产总值中的比例数据:(1) 请根据表中数据, 建立直角坐标系, 并描出坐标(年份, 第一产业在国民生产总值中的比例);
(2) 试用直线表示第一产业在我国国民生产总值中的比例在近几年内的发展趋势.解:从趋势上看,第一产业在我国国民生产总值中的比例是逐年下降的。例 (2012北京)以下是根据北京市国民经济和社会发展统计公报中的相关数据绘制统计图的一部分. 请根据以上信息解答下列问题:
(1)2008年北京市私人轿车拥有是多少万辆(结果保留三个有效数字)?
(2)补全条形统计图;如果按照小明的统计数据,请你通过计算估计,2010年北京市仅排量为1.6L的这类私人轿车(假设每辆车平均一行行驶1万千米)的碳排放总量约为多少万吨?(3)汽车数量增多除造成交通拥堵外,还增加了碳排放量,为了了解汽车碳排放量的情况,小明同学通过网络了解到汽车的碳排放量与汽车排量有关.如:一辆排量为1.6L的轿车,如果一年行驶1万千米,这一年,它碳排放量约为2.7吨.于是他调查了他所居住小区的150辆私人轿车,不同排量的轿车数量如下表所示.解:(1)146×(1+19%)=173.74≈174(万辆),
所以2008年北京市私人轿车拥有量约是174万辆。(2)补全条形统计图如下: ,
所以估计2010年北京市仅排量为1.6L的这类私人轿车的碳排放总量约为372.6万吨。(3) 1. 用样本推断总体的过程是怎样的?答:可以采用简单随机抽样的方法得到简单随机样本,然后用简单随机样本的样本平均数、样本方差分别去估计总体平均数、总体方差. 在大多数情况下, 当样本容量够大时, 这种估计是比较合理的.
答:比如我们需要总结全国居民拥有个人轿车的数量发展趋势,可以在查到近5年市民拥有个人轿车数量的统计数据,然后根据数据在以时间为横坐标,轿车数量为纵坐标的平面直角坐标系中描出坐标,再用一条直线来表示发展趋势,通过分析这个趋势图可以预测未来居民拥有轿车数量的变化趋势。2. 如何通过样本来预测总体在未来一段时间内的发展趋势?样本平均数总体在未来一段
时间的发展水平简单随
机样本总体平均值总
体预测随机
抽样估计样本方差样本的某种“率”样本的频数、频率分布总体方差总体相应的“率”总体的频数、频率分布总体在未来一段
时间的发展趋势控制3、如何用样本推断总体?结 束单位:北京五中分校
姓名:曹自由