(新教材)高中数学人教B版必修第二册 5.1.4 用样本估计总体(35张PPT课件+学案)

文档属性

名称 (新教材)高中数学人教B版必修第二册 5.1.4 用样本估计总体(35张PPT课件+学案)
格式 zip
文件大小 3.7MB
资源类型 教案
版本资源 人教B版(2019)
科目 数学
更新时间 2019-12-10 17:26:45

文档简介

5.1.4 用样本估计总体
课标要求
素养要求
1.能用样本的数字特征估计总体的数字特征.
2.能用样本的分布估计总体的分布.
通过用样本估计总体,提升学生的数据分析、数学运算和逻辑推理素养.
教材知识探究
中国体育彩票的种类有:超级大乐透、排列3、排列5、七星彩、地方体彩、足球彩票、竞彩、顶呱刮等等.
体育彩票市场曾创造了无数的神话,相当一部分中奖者在谈及自己的中奖经历时都表示他们能够中奖,是经过长期研究体育彩票的走势及中奖号码分布特点后(即作出频率分布表),精心选号的结果.所以说彩民之所以能中大奖是因为他们“推测”的方法是科学的,“推测”的结果是比较可靠的.那么他们是如何“推测”的呢?
问题1 “推测”彩票是估计哪些方面?
问题2 他们是如何处理中奖数据的?
提示 1.他们把中奖号码绘制成图、表等进行观察,分析中奖号码的分布、走势,以此去推测、估计下次的中奖号码.
其主要是利用中奖号码的分布去估计下期中奖号码的分布.
2.绘成图、表进行分析.
1.用样本的数字特征估计总体的数字特征
(1)一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.
(2)估计一般是有误差的.但是,大数定律可以保证,当样本的容量越来越大时,估计的误差很小的可能性将越来越大.
(3)在容许一定误差存在的前提下,可以用样本的数字特征去估计总体的数字特征,这样就能节省人力和物力等.
另外,有时候总体的数字特征不可能获得,此时只能用样本的数字特征去估计总体的数字特征.
(4)一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.
2.用样本的分布来估计总体的分布
(1)如果样本的容量恰当,抽样方法又合理的话 ,样本的分布与总体分布会差不多,特别地,每一组的频率与总体对应的频率相差不会太大.
(2)分布的估计一般也有误差.如果总体在每一个分组的频率记为π1,π2,…,πn,样本在每一组对应的频率记为p1,p2,…,pn,一般来说,
 (πi-pi)2=[(π1-p1)2+(π2-p2)2+…+(πn-pn)2]
不等于零.同样,大数定律可以保证,当样本的容量越来越大时,上式很小的可能性将越来越大.
(3)如果容许有一定误差,则可以用样本的分布去估计总体的分布,而且,在总体的分布不可能获得时,只能用样本的分布去估计总体的分布.
教材拓展补遗
[微判断]
用样本频率分布估计总体频率分布的过程中,判断下列说法的正误.
(1)总体容量越大,估计越精确.(×)
(2)总体容量越小,估计越精确.(×)
(3)样本容量越大,估计越精确.(√)
(4)样本容量越小,估计越精确.(×)
提示 (3)由样本估计总体的性质可得,只有(3)正确.
[微训练]
1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是(  )
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
解析 标准差和方差都能反映一组数据的稳定程度.
答案 B
2.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为(  )
A.588 B.480
C.450 D.120
解析 ∵少于60分的学生人数为600×(0.05+0.15)=120,∴不少于60分的学生人数为600-120=480.
答案 B
[微思考]
在考察某中学的学生身高时,如果采用分层抽样的方法,得到了男生身高的平均数为170,方差为16;女生身高的平均数为165,方差为25.
(1)如果没有其他信息,能否计算样本的平均数与方差?
(2)若不能,还需了解到什么信息?
提示 (1)不能.
(2)样本中男、女生的人数或比例.
题型一 用样本的特征数估计总体的特征数

【例1】 甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
解 (1)甲=(99+100+98+100+100+103)=100,
乙=(99+100+102+99+100+100)=100.
s=[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
s=[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)两台机床所加工零件的直径的平均值相同,
又s>s,所以乙机床加工零件的质量更稳定.
规律方法 (1)利用样本的原始数据求得的样本数字特征是准确值,可用以估计总体.
(2)此类问题需计算样本的平均值和方差来估计总体.
【训练1】 为了快速了解某学校学生体重(单位:kg)的大致情况,随机抽取了10名学生称重,得到的数据整理成茎叶图如图所示.估计这个学校学生体重的平均数和方差.
解 将样本中的每一个数都减去50,可得
-5,-1,-3,-1,-4,-4,1,8,9,10,
这组数的平均数为
=1,
方差为=30.4.
因此可估计这个学校学生体重的平均数为51,方差为30.4.
题型二 用样本的分布估计总体的分布
【例2】 我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.
解 (1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.
由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.
(2)由(1)可知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.
由以上样本的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.
(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,
而前5组的频率之和为:0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3,
由0.3×(x-2.5)=0.85-0.73,
所以x=2.9,
所以估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
规律方法 (1)由于频率分布表、频率分布直方图丢失了样本的原始数据,以此求得数字特征都是样本数字特征的估计值.
(2)可用样本的分布估计总体的分布.
【训练2】 某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图所示的频率分布直方图:
(1)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(2)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
解 (1)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,
分数在区间[40,50)内的人数为100-100×0.9-5=5.
所以总体中分数在区间[40,50)内的人数估计为400×=20.
(2)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,
所以样本中分数不小于70的男生人数为60×=30.
所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.
所以根据分层随机抽样原理,总体中男生和女生人数的比例估计为3∶2.
一、素养落地
1.通过学习用样本估计总体,提升学生的数据分析、数学运算和逻辑推理素养.
2.利用样本原始数据(柱形图、扇形图、茎叶图)求得的样本数字特征都是真实值,而不是估计值.利用频率分布表、频率分布直方图得到的样本数字特征均为估计值,它们都可用以估计总体.
3.在分层抽样时,如果总体分为k层,而且第j层抽取的样本量为nj,第j层的样本均值为j,样本方差为s,j=1,2,…,k.记n=nj,则所有数据的样本均值和方差分别为
= (njj),s2=[njs+nj(j-)2].
二、素养训练
1.要了解全市高一学生在某一身高范围所占比例的大小,需知道相应样本的(  )
A.平均数 B.方差
C.众数 D.频率分布
解析 频率分布直方图显示样本在某一范围所占的比例大小,故选D.
答案 D
2.如图是一组样本数据的频率分布直方图,则依据图形中的数据,可以估计总体的平均数与中位数分别是(  )
A.12.5,12.5 B.13,13
C.13.5,12.5 D.13.5,13
解析 第1组的频率为0.04×5=0.2,第2组的频率为0.1×5=0.5, 则第3组的频率为1-0.2-0.5=0.3,估计总体平均数为7.5×0.2+12.5×0.5+17.5×0.3=13.由题意知,中位数在第2组内,设为10+x,则有0.1x=0.3,解得x=3,从而中位数是13.
答案 B
3.甲、乙两种冬小麦连续5年的平均单位面积产量如下(单位:t/km2):
品种
第1年
第2年
第3年
第4年
第5年

9.8
9.9
10.1
10
10.2

9.4
10.3
10.8
9.7
9.8
其中产量比较稳定的冬小麦品种是________.
解析 甲=×(9.8+9.9+10.1+10+10.2)=10(t/km2).
乙=×(9.4+10.3+10.8+9.7+9.8)=10(t/km2),
即甲、乙两种冬小麦的平均产量都为10 t/km2.其方差分别为s=×(0.04+0.01+0.01+0+0.04)=0.02,s=×(0.36+0.09+0.64+0.09+0.04)=0.244,
即s答案 甲
4.甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.
(1)分别求出两人得分的平均数与方差;
(2)根据图形和(1)中计算结果,对两人的训练成绩作出评价.
解 (1)由图可得甲、乙两人五次测试的成绩分别为
甲:10,13,12,14,16;
乙:13,14,12,12,14.
甲==13,
乙==13,
s=×[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
s=×[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
(2)由s>s可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
三、审题答题
示范(二) 频率分布直方图中的数字特征问题
【典型示例】 (12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用
水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
[0.6,0.7)
频数
1
3
2
4
9
26
5
使用了节水龙头50天的日用水量频数分布表
日用
水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
频数
1
5
13
10
16
5
(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图①;
(2)估计该家庭使用节水龙头后,日用水量小于0.35__m3的频率②;
(3)估计该家庭使用节水龙头后,一年能节省多少水③?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)
审题答题
看到①想到画频率分布直方图的步骤.
看到②想到各小矩形的面积即为数据落在各小矩形内的频率.
看到③想到一天平均能节约多少水.
满分示范
解 (1)
4分
(2)根据以上数据,该家庭使用节水龙头后50天的日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,
因此该家庭使用节水龙头后日用水量小于0.35 m3的频率的估计值为0.48.8分
(3)该家庭未使用节水龙头50天的日用水量的平均数为
1=(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.10分
该家庭使用了节水龙头后50天的日用水量的平均数为
2=(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.
估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).12分
满分心得
解题的关键是理解频率分布直方图的意义,即各小矩形的面积表示的是数据落在相应区间上的频率.

基础达标
一、选择题
1.有一个容量为66的样本, 数据的分组及各组的频数如下:
[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9
[23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12
[35.5,39.5) 7 [39.5,43.5) 3
则总体中大于或等于31.5的数据约占(  )
A. B.
C. D.
解析 由题意知样本的容量为66,而落在[31.5,43.5)内的样本数为12+7+3=22,故总体中大于或等于31.5的数据约占=.
答案 B
2.某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机抽取24名笔试者的成绩,如表所示.
分数段
[60,65)
[65,70)
[70,75)
[75,80)
[80,85)
[85,90)
人数
2
3
4
9
5
1
据此估计允许参加面试的分数线大约是(  )
A.90 B.85
C.80 D.75
解析 设24人中按笔试成绩有x人进入面试,=,∴x=6.∴面试分数线为80分.
答案 C
3.设矩形的长为a,宽为b,其比满足b∶a=≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取的两个批次的初加工矩形的宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是(  )
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次的总体平均数与标准值接近程度相同
D.两个批次的总体平均数与标准值接近程度不能确定
解析 甲==0.617,
乙==0.613,
∴甲与0.618更接近.
答案 A
4.为了解某地区1 500名高三男生的身体发育情况,抽查了该地区100名年龄为17~18岁的高三男生体重(kg),得到频率分布直方图如图.根据图示,估计该地区高三男生中体重在[56.5,64.5)kg的学生人数是(  )
A.390 B.510
C.600 D.660
解析 由题意得,体重在[56.5,64.5)kg的学生频率为(0.03+0.05+0.05+0.07)×2=0.4,其人数为1 500×0.4=600.
答案 C
5.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.估计这次测试数学成绩的平均分为(  )
A.50 B.60
C.72 D.80
解析 利用组中值估算学生的平均分:
45f1+55f2+65f3+75f4+85f5+95f6
=45×0.05+55×0.15+65×0.2+75×0.3+85×0.25+95×0.05=72.
答案 C
二、填空题
6.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.
解析 普遍家庭中拥有3套或3套以上住房的大约为
99 000×=5 000(户),
高收入家庭中拥有3套或3套以上住房的大约为
1 000×=700(户).
所以该地拥有3套或3套以上住房的家庭共约有
5 000+700=5 700(户).
故×100%=5.7%.
答案 5.7%
7.某果园有苹果树100棵,为了估计该果园的苹果总产量,小王先按长势把苹果树分成了A,B,C三个级别,其中A级30棵,B级60棵,C级10棵,然后从A,B,C三个级别的苹果树中分别随机抽取了3棵、6棵、1棵,测出其产量,制成了如下统计表.小李看了这个统计表后马上正确估计出了该果园的苹果总产量,那么小李的估计值是________kg.
苹果树长势
A级
B级
C级
随机抽取棵数
3
6
1
所抽取果树的平均产量/kg
80
75
70
解析 由题中表格各等级苹果树的平均产量可估算果园的苹果总产量为(80×3+75×6+70×1)×10=7 600(kg).
答案 7 600
8.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
解析 因为频率分布直方图中各小长方形的面积之和为1,所以10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.由图可知身高在[120,150]内的学生人数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为10,所以从身高在[140,150]内的学生中选取的人数为×10=3.
答案 0.030 3
三、解答题
9.某校医务室抽查了高一10位同学的体重(单位:kg)如下:74,71,72,68,76,73,67,70,65,74.
(1)求这10个学生体重数据的平均数、中位数、方差、标准差;
(2)估计高一所有学生体重数据的平均数、中位数、方差、标准差.
解 (1)这10个学生体重数据的平均数为
=×(74+71+72+68+76+73+67+70+65+74)=71.
这10个学生体重数据从小到大依次为65,67,68,70,71,72,73,74,74,76,位于中间的两个数是71,72,
∴这10个学生体重数据的中位数为=71.5.
这10个学生体重数据的方差为
s2=×[(74-71)2+(71-71)2+(72-71)2+(68-71)2+(76-71)2+(73-71)2+(67-71)2+(70-71)2+(65-71)2+(74-71)2]=11.
这10个学生体重数据的标准差为s==.
(2)由样本估计总体得高一所有学生体重数据的平均数为71,中位数为71.5,方差为11,标准差为.
10.为了了解高一年级学生的体能情况,某校随机抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少?
解 (1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的,
因此第二小组的频率为=0.08.
因为第二小组的频率=,
所以样本容量===150.
(2)由直方图可估计该校全体高一年级学生的达标率约为×100%=88%.
能力提升
11.如图是某班学生在一次数学考试中的成绩的频率分布直方图.根据直方图估计其成绩的众数是________,中位数是________,平均数是________.
解析 由频率分布直方图可知,其众数为=75.
设中位数为x,由图知0.01×10+0.02×10+(x-70)×0.03=0.5,所以x=.
平均数为(55×0.01+65×0.02+75×0.03+85×0.025+95×0.015)×10=76.5.
答案 75  76.5
12.某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.
(1)若n=19,求y与x的函数解析式;
(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;
(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?
解 (1)当x≤19时,y=3 800;
当x>19时,y=3 800+500(x-19)=500x-5 700.
所以y与x的函数解析式为
y=(x∈N).
(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.
(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为
×(3 800×70+4 300×20+4 800×10)=4 000.
若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为
×(4 000×90+4 500×10)=4 050.
比较两个平均数可知,购买1台机器的同时应购买19个易损零件.
创新猜想
13.(开放题)一组数据的平均数、众数和方差都是2,则这组数可以是________(只列一组即可).
解析 如2,4,0,2,检验符合要求.
答案 2,4,0,2(答案不唯一)
14.某工厂有工人1 000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层随机抽样方法(按A类,B类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(生产能力指一天加工的零件数).
(1)A类工人中和B类工人中各抽查多少工人?
(2)从A类工人中的抽查结果和从B类工人中的抽查结果分别如表1和表2.
表1
生产能力分组
[100,110)
[110,120]
[120,130)
[130,140)
[140,150]
人数
4
8
x
5
3
表2
生产能力分组
[110,120)
[120,130)
[130,140)
[140,150]
人数
6
y
36
18
①先确定x,y,再补全频率分布直方图(如图).就生产能力而言,A类工人中个体间的差异程度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)
②分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).
A类工人生产能力的频率分布直方图
B类工人生产能力的频率分布直方图
解 (1)A类工人中和B类工人中分别抽查25名和75名.
(2)①由4+8+x+5+3=25,得x=5.
由6+y+36+18=75,得y=15.
频率分布直方图如图:
A类工人生产能力的频率分布直方图
B类工人生产能力的频率分布直方图
从图可以判断:B类工人中个体间的差异程度更小.
②A=×105+×115+×125+×135+×145=123,
B=×115+×125+×135+×145
=133.8,
=×123+×133.8=131.1.
A类工人生产能力的平均数、B类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1.
课件35张PPT。5.1.4 用样本估计总体教材知识探究中国体育彩票的种类有:超级大乐透、排列3、排列5、七星彩、
地方体彩、足球彩票、竞彩、顶呱刮等等.
体育彩票市场曾创造了无数的神话,相当一部分中奖者在谈及
自己的中奖经历时都表示他们能够中奖,是经过长期研究体育彩票的走势及中奖号码分布特点后(即作出频率分布表),精心选号的结果.所以说彩民之所以能中大奖是因为他们“推测”的方法是科学的,“推测”的结果是比较可靠的.那么他们是如何“推测”的呢?问题1 “推测”彩票是估计哪些方面?
问题2 他们是如何处理中奖数据的?
提示 1.他们把中奖号码绘制成图、表等进行观察,分析中奖号码的分布、走势,以此去推测、估计下次的中奖号码.
其主要是利用中奖号码的分布去估计下期中奖号码的分布.
2.绘成图、表进行分析.1.用样本的数字特征估计总体的数字特征
(1)一般情况下,如果样本的容量 ,抽样方法又 的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.
(2)估计一般是有误差的.但是,大数定律可以保证,当样本的容量 时,估计的误差很小的可能性将越来越大.
(3)在容许一定误差存在的前提下,可以用 的数字特征去估计总体的数字特征,这样就能节省人力和物力等.
另外,有时候总体的数字特征不可能获得,此时只能用样本的数字特征去估计总体的数字特征.
(4)一般来说,在估计总体的数字特征时,只需直接算出 对应的数字特征即可.恰当合理越来越大样本样本总体大总体教材拓展补遗
[微判断]
用样本频率分布估计总体频率分布的过程中,判断下列说法的正误.
(1)总体容量越大,估计越精确.( )
(2)总体容量越小,估计越精确.( )
(3)样本容量越大,估计越精确.( )
(4)样本容量越小,估计越精确.( )
提示 (3)由样本估计总体的性质可得,只有(3)正确.××√×[微训练]
1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是(  )
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
解析 标准差和方差都能反映一组数据的稳定程度.
答案 B2.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为(  )A.588 B.480 C.450 D.120
解析 ∵少于60分的学生人数为600×(0.05+0.15)=120,∴不少于60分的学生人数为600-120=480.
答案 B[微思考]
在考察某中学的学生身高时,如果采用分层抽样的方法,得到了男生身高的平均数为170,方差为16;女生身高的平均数为165,方差为25.
(1)如果没有其他信息,能否计算样本的平均数与方差?
(2)若不能,还需了解到什么信息?
提示 (1)不能.
(2)样本中男、女生的人数或比例.题型一 【例1】 甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.用样本的特征数估计总体的特征数规律方法 (1)利用样本的原始数据求得的样本数字特征是准确值,可用以估计总体.
(2)此类问题需计算样本的平均值和方差来估计总体.【训练1】 为了快速了解某学校学生体重(单位:kg)的大致情况,随机抽取了10名学生称重,得到的数据整理成茎叶图如图所示.估计这个学校学生体重的平均数和方差.解 将样本中的每一个数都减去50,可得
-5,-1,-3,-1,-4,-4,1,8,9,10,
这组数的平均数为因此可估计这个学校学生体重的平均数为51,方差为30.4.题型二 用样本的分布估计总体的分布
【例2】 我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.
解 (1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.
由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1)可知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.
由以上样本的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为
300 000×0.12=36 000.
(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,
而前5组的频率之和为:0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3,
由0.3×(x-2.5)=0.85-0.73,
所以x=2.9,
所以估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.规律方法 (1)由于频率分布表、频率分布直方图丢失了样本的原始数据,以此求得数字特征都是样本数字特征的估计值.
(2)可用样本的分布估计总体的分布.【训练2】 某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图所示的频率分布直方图:(1)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(2)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解 (1)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,
分数在区间[40,50)内的人数为100-100×0.9-5=5.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.
所以根据分层随机抽样原理,总体中男生和女生人数的比例估计为3∶2.二、素养训练
1.要了解全市高一学生在某一身高范围所占比例的大小,需知道相应样本的(  )
A.平均数 B.方差
C.众数 D.频率分布
解析 频率分布直方图显示样本在某一范围所占的比例大小,故选D.
答案 D2.如图是一组样本数据的频率分布直方图,则依据图形中
的数据,可以估计总体的平均数与中位数分别是(  )
A.12.5,12.5 B.13,13
C.13.5,12.5 D.13.5,13
解析 第1组的频率为0.04×5=0.2,第2组的频率为0.1×5=0.5, 则第3组的频率为1-0.2-0.5=0.3,估计总体平均数为7.5×0.2+12.5×0.5+17.5×0.3=13.由题意知,中位数在第2组内,设为10+x,则有0.1x=0.3,解得x=3,从而中位数是13.
答案 B3.甲、乙两种冬小麦连续5年的平均单位面积产量如下(单位:t/km2):其中产量比较稳定的冬小麦品种是________.答案 甲4.甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.(1)分别求出两人得分的平均数与方差;
(2)根据图形和(1)中计算结果,对两人的训练成绩作出评价.解 (1)由图可得甲、乙两人五次测试的成绩分别为
甲:10,13,12,14,16;
乙:13,14,12,12,14.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.三、审题答题
示范(二) 频率分布直方图中的数字特征问题
【典型示例】 (12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在下图中 使用了节水龙头50天的日用水量数据的作出 频率分布直方图①;审题答题
看到①想到画频率分布直方图的步骤.(2)估计该家庭使用节水龙头后,看到②想到各小矩形的面积即为数据落在各小矩形内的频率.日用水量小于0.35 m3的频率②;(3)估计该家庭使用节水龙头后,一年能节省多少水③? (一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)看到③想到一天平均能节约多少水.满分示范
解 (1)4分(2)根据以上数据,该家庭使用节水龙头后50天的日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,
因此该家庭使用节水龙头后日用水量小于0.35 m3的频率的估计值为0.48.8分
(3)该家庭未使用节水龙头50天的日用水量的平均数为该家庭使用了节水龙头后50天的日用水量的平均数为估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).12分满分心得
解题的关键是理解频率分布直方图的意义,即各小矩形的面积表示的是数据落在相应区间上的频率.