数学人教A版(2019)必修第二册 9.2用样本估计总体(课件)(共157张PPT)

文档属性

名称 数学人教A版(2019)必修第二册 9.2用样本估计总体(课件)(共157张PPT)
格式 pptx
文件大小 2.8MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2021-09-07 16:05:02

图片预览

文档简介

(共157张PPT)
用样本估计总体
9.2.1 总体取值规律的估计
9.2.2 总体百分位数的估计 
1.频率分布直方图的画法
【思考】
用图、表整理数据有哪些好处?
提示:用表格整理数据是通过改变数据的组织方式,为数据的解释提供新方式。用图表示数据不仅有利于从数据中提取信息,还可以利用图形传递信息。
2.总体取值规律的估计
(1)从频率分布表可看出,样本观测数据落在各个小组的比例大小,例如哪组最多,哪组最少,集中在较高值或较低值等。
(2)从
可看出,样本的观测数据分布对称情况,左右高低情况,数据集中情况,从左到右的变化趋势等。
频率分布直方图
【思考】
频率分布直方图的组数对数据分析有何影响?
提示:当组数少、组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原始数据信息;当组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则,不容易看出总体数据的分布特点。
3.其他统计图表
不同的统计图在表示数据上有不同的特点。
(1)
主要用于直观描述各类数据占总数的比例。
(2)

主要用于直观描述不同类别或分组数据的频数和频率。
(3)
主要用于描述数据随时间的变化趋势。
不同的统计图适用的数据类型也不同。条形图适用于描述离散型的数据,直方图适用描述连续型数据。
扇形图
条形图
直方图
折线图
【思考】
选择恰当的统计图表分析样本数据有何好处?
提示:选择恰当的统计图对数据进行可视化描述,能通过图形直观地发现样本数据的分布情况,进而估计总体的分布规律。
4.总体百分位数的估计
一组数据的第p百分位数是这样一个值,它使得这组数据中至少有
的数据小于或等于这个值,且至少有
的数据大于或等于这个值。
可以通过下面的步骤计算一组n个数据的第p百分位数:
p%
(100-p)%
第1步,按从小到大排列原始数据。
第2步,计算i=n×p%。
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数。
5.
,把一组由小到大排列后的数据分成四等份,因此称为四分位数。其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数。
第25,50,75百分位数
【思考】
第25百分位数和第75百分位数有何异同?
提示:第25百分位数是第一四分位数,第75百分位数是第三四分位数。
【素养小测】
1.思维辨析(对的打“√”,错的打“×”)
(1)决定组距和组数时,组数越多越好。(  )
(2)频率分布直方图的纵坐标是频率。(  )
(3)频率分布直方图中各小矩形的面积之和可以不为1。(  )
提示:(1)×。应根据数据的多少合理确定组数,不是说组数越多越好。
(2)×。频率分布直方图的纵坐标是频率/组距。
(3)×。各小矩形的面积之和一定为1。
2.100辆汽车通过某一段公路时的时速的频率分布直方
图如图所示,则时速在[60,70)的汽车大约有(  )
                  
A.30辆
B.40辆
C.60辆
D.80辆
【解析】选B。0.04×10×100=40(辆)。
3.一个容量为200的样本的频率分布直方图如图所示,则样本数据落在[5,9)内的频率和频数分别为_____。?
【解析】由图可知,落在[5,9)内的频率为0.05×
(9-5)=0.2,频数为200×0.2=40。
答案:0.2,40
类型一 频率分布直方图的画法
【典例】为了了解学校高一年级男生的身高情况,选取一个容量为60的样本(60名男生的身高),分组情况如下(单位:cm):
(1)求出表中a,m的值。
(2)画出频率分布直方图。
分组
[147.5,
155.5)
[155.5,
163.5)
[163.5,
171.5)
[171.5,
179.5]
频数
6
21
27
m
频率
a
0.1
【思维·引】
(1)利用频数和等于60求m值,进而求a。
(2)根据题中数据及表格数据画频率分布直方图。
【解析】(1)由题意得:6+21+27+m=60,所以m=6。
a=
=0.45,所以a=0.45。
(2)作出频率分布直方图如图所示。
【内化·悟】
画频率分布直方图的关键是什么?
提示:确定组距。
【类题·通】
绘制频率分布直方图的注意事项
(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照。
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多。
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点。
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数。
(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率。
提醒:每个小长方形的面积=组距×
=频率。
【习练·破】
已知某池塘养殖着鲤鱼和鲫鱼,为了估计这两种鱼的数量,养殖者从池塘中捕出这两种鱼各1000条,给每条鱼做上不影响其存活的标记,然后放回池塘,待完全混合后,再每次从池塘中随机地捕出1000条鱼,记录下其中有记号的鱼的数目,立即放回池塘中。这样的记录做了10次,并将记录获取的数据制作成如图所示的茎叶图。
(1)根据茎叶图计算有记号的鲤鱼和鲫鱼数目的平均数,并估计池塘中的鲤鱼和鲫鱼的数量;
(2)为了估计池塘中鱼的总质量,现按照(1)中的比例对100条鱼进行称重,根据称重鱼的质量介于[0,4.5](单位:千克)之间,将测量结果按如下方式分成九组:第一组[0,0.5),第二组[0.5,1),…,第九组[4,4.5]。如图是按上述分组方法得到的频率分布直方图的一部分。
①估计池塘中鱼的质量在3千克以上(含3千克)的条数;
②若第三组鱼的条数比第二组多7条、第四组鱼的条数比第三组多7条,请将频率分布直方图补充完整;
③在②的条件下估计池塘中鱼的质量的众数及池塘中鱼的总质量。
【解析】(1)根据茎叶图可知,鲤鱼与鲫鱼的平均数目分别为80,20。由题意知,池塘中鱼的总数目为1000÷
=20000(条),则估计鲤鱼数目为20000×
=16000(条),鲫鱼数目为
20000-16000=4000(条)。
(2)①根据题意,结合直方图可知,池塘中鱼的质量在3千克以上(含3千克)的条数约为
20000×(0.12+0.08+0.04)×0.5=2400。
②设第二组鱼的条数为x,则第三、四组鱼的条数分别为x+7,x+14,则有x+x+7+x+14=100×[1-(0.08+
0.50+0.28+0.12+0.08+0.04)×0.5],解得x=8,
故第二、三、四组的频率分别为0.08,0.15,0.22,它们
在频率分布直方图中的小矩形的高度分别为0.16,0.30,
0.44,据此可将频率分布直方图补充完整(如图所示)。
③众数为2.25千克,平均数为0.25×0.04+0.75×0.08
+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+
3.25×0.06+3.75×0.04+4.25×0.02=2.02(千克),
所以鱼的总质量为2.02×20000=40
400(千克)。
类型二 频率分布直方图的应用
【典例】某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩(总分为100分)分成6组加以统计,6组的分数分别是[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],得到如图所示的频率分布直方图。已知高一年级学生中不及格(低于60分)的人数
比优秀(不低于90分)的人数多60人,则高一年级共有学生(  )
A.300人
B.600人
C.200人
D.700人
【思维·引】设出总人数,利用频率分布直方图分别表示出不及格、优秀的人数,相减等于60即可。
【解析】选B。设高一年级共有学生n人,
则n×(0.005+0.015)×10-n×0.010×10=60,
解得n=600。
【内化·悟】
利用频率分布直方图进行计算的依据是什么?
提示:
×组距=频率。
【类题·通】
由频率分布直方图进行相关计算时,需掌握下列关系式。
(1)
×组距=频率。
(2)
=频率,此关系式的变形为:
=样本量,
样本量×频率=频数。
【习练·破】
为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12。
(1)第二小组的频率是多少?样本量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
【解析】(1)频率分布直方图是以面积的形式反映数据落在各小组内的频率大小的,
因此第二小组的频率为
=0.08。
又因为第二小组的频率=

所以样本量=
=150。
(2)由频率分布直方图可估计,该校高一年级学生的达标率为:
×100%=88%。
【加练·固】
为调查我校学生的用电情况,学校后勤部门组织抽取了100间学生宿舍某月用电量调查,发现每间宿舍用电量都在50度到350度之间,其频率分布直方图如图所示。
(1)为降低能源损耗,节约用电,学校规定:每间宿舍每月用电量不超过200度时,按每度0.5元收取费用;超过200度,超过部分按每度1元收取费用。以t表示某宿舍的用电量(单位:度),以y表示该宿舍的用电费用(单位:元),求y与t的函数关系式。
(2)求图中月用电量在(200,250]度的宿舍有多少间。
【解析】(1)根据题意,得:
当0≤t≤200时,用电费用为y=0.5t;
当t>200时,用电费用为
y=200×0.5+(t-200)×1=t-100;
综上:宿舍的用电费用为
y=
(2)因为月用电量在(200,250]度的频率为
50x=1-(0.0060+0.0036+0.0024+0.0024+0.0012)×50=1-0.0156×50=0.22,所以月用电量在(200,250]度的宿舍有100×0.22=22(间)。
类型三 其他统计图
【典例】某校高一某班的某次数学测试成绩(满分为
100分)如下
56,58,62,63,63,65,66,68,69,71,72,72,73,74,75,
76,77,78,79,95,98
其中[80,90)内的成绩缺失。
频率分布直方图也受到了不同程度的破坏,但可见部分如图,据此解答下列问题:
(1)求分数在[50,60)内的频率及全班人数。
(2)求分数在[80,90)之间的频数,并计算频率分布直方图中[80,90)间的矩形的高。
【思维·引】(1)由题意可得分数在[50,60)内的频数,由频率分布直方图,可得分数在[50,60)内的频率,进而根据频率=
解得全班人数。
(2)分数在[80,90)之间的频数,可由全班人数减去之外的频数。频率分布直方图中矩形的高为
,求出[80,90)这组的频率,然后除以组距。
【解析】(1)分数在[50,60)的频率为0.008×10=0.08。
由题意知,分数在[50,60)之间的频数为2,所以全班人
数为
=25。
(2)分数在[80,90)之间的频数为25-2-7-10-2=4,频率
分布直方图中[80,90)间的矩形的高为
÷10=0.016。
【类题·通】条形统计图、扇形统计图和折线统计图的区别与联系
统计图
区别
联系
条形统计图
(1)直观反映数据分布的大致情况
(2)清晰地表示各个区间的具体数目
(3)会丢失数据的部分信息
在同一
组数据
的不同
统计图
表中,
计算出
相应组
的频数、
频率应
该相等。
扇形统计图
(1)清楚地看出数据分布的总体趋势及各部分所占总体的百分比
(2)丢失了原来的具体数据
折线统计图
(1)表示数据的多少和数量增减变化情况
(2)制作类似于函数图象的画法,侧重体现数据的变化规律
【习练·破】(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图。
根据该折线图,下列结论错误的是
(  )
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月份
D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳
【解析】选A。由题图可知,2014年8月到9月的月接待游客量在减少,则A选项错误,故选A。
类型四 百分位数
【典例】某经销商从外地一水殖厂购进一批小龙虾,并
随机抽取40只进行统计,按重量分类统计结果如图:
(1)估计这批小龙虾重量的第10百分位数与第90百分位数。
(2)该经销商将这批小龙虾分成三个等级,如表:
试估计这批小龙虾划为几等品比较合理?
等级
三等品
二等品
一等品
重量(克)
[5,25)
[25,45)
[45,55]
【思维·引】第(1)问,将数据按从小到大排列,即自左到右,分别求出第10百分位数与第90百分位数,第(2)问用样本估计总体。
【解析】(1)因为40×10%=4,所以第10百分位数为第4项与第5项的平均数,在[5,15)范围内约为
=10,因为40×90%=36,所以第90百分位数为第36项与第37项的平均数,在[35,55]范围内,约为
=45,所以估计这批小龙虾重量的第10百分位数为10,第90百分位数为45。
(2)由(1)知,将这批小龙虾重量集中在[10,45]范围内,所以划为二等品比较合理。
【内化·悟】
计算第p百分位数的关键是什么?
提示:计算i=n×p%并分析不同情况下即i为整数或非整数时第p百分位数的计算。
【类题·通】
计算一组n个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据。
第2步,计算i=n×p%。
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数。
【习练·破】
贵阳轨道交通1号线2018年12月1日开通运营,某机车某时刻从下麦西站驶往贵阳北站的过程中,10个车站上车的人数统计如下:
70,60,60,50,60,40,40,30,30,10,则这组数据的第25百分位数、第50百分位数的和为(  )          
A.70
B.65
C.75
D.90
【解析】选C。数据70,60,60,60,50,40,40,30,30,10是从大到小排列的,因为10×25%=2.5,按从小到大排列后,第25百分位数是第3项,即30;易知,第50百分位数是
=45,所以第25百分位数、第50百分位数的和为75。
【加练·固】为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机各选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:
分别求甲、乙两厂样本轮胎宽度的第10百分位数与第90百分位数,根据两厂的轮胎宽度的波动情况(波动越小,轮胎质量越好),判断这两个工厂哪个厂的轮胎相对更好?
【解析】甲厂这批轮胎宽度的数据为
195,194,196,193,194,197,196,195,193,197,
从小到大排列为
193,193,194,194,195,195,196,196,197,197,
又因为10×10%=1,10×90%=9,
所以第10百分位数为第1项与第2项的平均数,即193;第90百分位数为第9项与第10项的平均数,即197。
同理,乙厂这批轮胎宽度的数据从小到大排列为
192,192,193,193,194,195,195,195,195,196。
第10百分位数为192,第90百分位数为195.5。
因为197-193=4,195.5-192=3.5,乙厂的波动更小,用样本估计总体,所以乙厂的轮胎相对更好。
9.2.3 总体集中趋势的估计
9.2.4 总体离散程度的估计
1.众数、中位数、平均数定义
(1)众数:一组数据中出现次数
的数。
(2)中位数:把一组数据按
的顺序排列,处在
位置的数(或中间两个数的
)。
最多
从小到大(或从大到小)
中间
平均数
(3)平均数:如果n个数为x1,x2,…,xn,
那么
(x1+x2+…+xn)。
【思考】
哪些量能刻画总体取值的特征?
提示:平均数、中位数、众数等,都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势。
2.总体集中趋势的估计
(1)

都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关。
平均数
中位数
(2)对一个
的频率分布直方图来说,如果直方图的形状是对称的,那么平均数和中位数应该大体上差不多;如果直方图在
,那么平均数大于中位数;如果直方图在
,那么平均数小于中位数。也就是说,和中位数相比,平均数总是在“长尾巴”那边。
单峰
右边“拖尾”
左边“拖尾”
(3)对
(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用

数值型数据
众数
【思考】
平均数、中位数、众数对极端值的敏感性如何?
提示:因为样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变。但中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变。所以平均数比中位数更敏感。
众数只利用了出现次数最多的那个值的信息,只能传递数据中信息的很少一部分,对极端值不敏感。
3.在频率分布直方图中估计平均数、中位数、众数
(1)样本平均数可以用每个小矩形底边中点的

的乘积之和近似代替。
(2)
左边和右边的直方图的面积应该相等。
(3)
对应区间中点,作为众数的估计值。
横坐标
小矩形的面积
中位数
频数最大的组
【思考】
在频率分布直方图中得到的特征量平均数、中位数、众数是样本数据的特征量吗?
提示:在频率分布直方图中得到的特征量是样本数据特征量的估计值,近似值,不是精确值。在频率分布直方图中估计样本的特征量,进而用样本估计总体,估计总体的特征量。
4.总体离散程度的估计
(1)极差
一种简单的度量
的方法是极差。极差越大,波动范围越大。
数据离散程度
(2)平均距离
假设一组数据是x1,x2,…,xn,用
表示这组数据的平
均数。我们用
的绝对值作为“距离”,即|xi-
|(i=1,2,…,n)作为xi到
的“距离”
可以得到这组数据x1,x2,…,xn到
的“平均距离”为
每个数据与平均数的差
(3)方差、标准差
绝对值改用平方来代替,即
=

我们称为这组数据的方差。取它的算术平方根,

,我们称为这组数据的标准差。
(4)总体方差、总体标准差
如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为
,则称S2=
为总体方差,S=
为总体标准差。
如果总体的N个变量值中,不同的值共有k(k≤N)个,不
妨记为Y1,Y2,…,Yk,其中Yi出现的频率为fi(i=1,2,
…,k),则总体方差为___________________。
(5)样本方差、样本标准差
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为
,则称______________为样本方差,
s=
为样本标准差。
【思考】
(1)标准差与数据的离散程度有何关系?
提示:标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小。
(2)估计总体的离散程度有哪些方法?
提示:平均数,极差,平均距离,总体方差,总体标准差,样本方差,样本标准差等等。一般地,我们用样本标准差估计总体标准差。在随机抽样中,样本标准差依赖于样本的选取,具有随机性。
【素养小测】
1.思维辨析(对的打“√”,错的打“×”)
(1)中位数一定是数据按从小到大顺序排列后正中间的数。(  )
(2)利用频率分布直方图计算出的样本的平均数、中位数、众数是样本的真实数据。(  )
(3)标准差越大,样本数据越集中。(  )
提示:(1)×。也可能是中间两个数的平均数。
(2)×。是估计值,不是真实数据。
(3)×。标准差越大,样本数据越分散。
2.一组数据为1,1,3,3,则这组数据的众数和中位数分别是(  )          
A.1或3,2
B.3,2
C.1或3,1或3
D.3,3
【解析】选A。数据1,1,3,3中,1和3都出现了2次,出现的次数最多,则众数是1或3;最中间的两个数是1与3,则中位数是2。
3.甲、乙两名射击运动员,在一次连续10次的射击中,他们所射中环数的平均数一样,但方差不同,正确评价他们的水平是
(  )
A.因为他们所射中环数的平均数一样,所以他们水平相同
B.虽然射中环数的平均数一样,但方差较大的,潜力较大,更有发展前途
C.虽然射中环数的平均数一样,但方差较小的,发挥较稳定,更有发展前途
D.虽然射中环数的平均数一样,但方差较小的,发挥较不稳定,忽高忽低
【解析】选C。由平均数、方差的意义可知选C。
类型一 众数、平均数、中位数的计算
【典例】1.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60m;从南方抽取了200个男孩,平均身高为1.50m。由此可推断我国13岁男孩的平均身高为(  )
A.1.57m
B.1.56m
C.1.55m
D.1.54m
2.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是(  )
A.85,85,85
B.87,85,86
C.87,85,85
D.87,85,90
【思维·引】
1.求出500个男孩总的身高,除以500可得答案。
2.分别找出甲,乙两组数据的中位数。
【解析】1.选B。因为从北方抽取了300个男孩,平均身高1.60m,从南方抽取了200个男孩,平均身高为1.50m,所以这500个13岁男孩的平均身高是
=1.56,所以由此可推断我国13岁男孩的平均身高为1.56m。
2.选C。从小到大列出所有数学成绩:75,80,85,85,85,85,90,90,95,100,观察知众数和中位数均为85,计算得平均数为87。
【类题·通】
平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算。
提醒:如果样本平均数大于样本中位数,说明数据中存在较大的极端值。
【习练·破】
已知一组数据按从小到大排列为-8,-1,4,x,10,13且这组数的中位数是7,那么这组数据中的众数是(  )
A.7
B.6
C.4
D.10
【解析】选D。因为共有六个数,因此,当按从小到大的顺序排列后,中位数等于最中间两数的平均数,因此,x=10。所以众数为10。
【加练·固】
一个样本数据按从小到大的顺序排列为:13,14,19,x,23,27,28,31,中位数为22,则x=________。?
【解析】由题意知
=22,则x=21。
答案:21
类型二 总体集中趋势的估计
【典例】1.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05。
(1)估计高一参赛学生的成绩的众数、中位数。
(2)估计高一参赛学生的平均成绩。
2.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频率分布表。
A地区用户满意度评分的频率分布直方图
B地区用户满意度评分的频率分布表
满意度
评分分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
2
8
14
10
6
(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)。
B地区用户满意度评分的频率分布直方图
(2)根据用户满意度评分,将用户和满意度分为三个等级:
估计哪个地区用户的满意度等级为不满意的概率大?说明理由。
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
【思维·引】
1.分析频率分布直方图和众数、中位数、平均数概念求解。
2.结合题中数据作出B地区的频率分布直方图再求解。
【解析】
1.(1)由图可知众数为65,因为第一个小矩形
的面积为0.3,所以设中位数为60+x,则0.3+x×0.04=0.5,得x=5,所以估计中位数为60+5=65。
(2)由已知,平均成绩为
55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,所以估计平均成绩为67。
2.(1)作出频率分布直方图如图:
通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散。
(2)A地区用户的满意度等级为不满意的概率大。理由:
记CA表示事件:“A地区用户的满意度等级为不满意”;
CB表示事件:“B地区用户的满意度等级为不满意”。
由直方图得P(CA)的估计值为
(0.01+0.02+0.03)×10=0.6,
P(CB)的估计值为(0.005+0.02)×10=0.25。
所以A地区用户的满意度等级为不满意的概率大。
【内化·悟】
如何用频率分布直方图估计众数、中位数、平均数?
提示:(1)众数:取最高小长方形底边中点的横坐标作为众数。
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标作为中位数。
(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。
【类题·通】
1.频率分布直方图的性质
(1)小长方形的面积=组距×
=频率。
(2)各小长方形的面积之和等于1。
(3)小长方形的高=
,所有小长方形的高的和为

2.要理解并记准频率分布直方图与众数、中位数及平均数的关系。
【习练·破】
某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示。
(1)求这次测试数学成绩的众数。
(2)求这次测试数学成绩的中位数。
(3)求这次测试数学成绩的平均分。
【解析】(1)由图知众数为
=75。
(2)由图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,所以中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3。
(3)由图知这次数学成绩的平均分为:
×0.005×10+
×0.015×10+
×0.02
×10+
×0.03×10+
×0.025×10+
×0.005×10=72。
【加练·固】
某市对市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费。
【解析】(1)如题图所示,用水量在[0.5,3)的频率的和为:(0.2+0.3+0.4+0.5+0.3)×0.5=0.85。
用水量小于等于3立方米的频率为0.85,又w为整数,
故为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3。
(2)当w=3时,该市居民该月的人均水费估计为:
(0.2×1+0.3×1.5+0.4×2+0.5×2.5+0.3×3)×0.5×
4+0.1×0.5×3×3×4+[0.1×(3.5-3)+0.1×(4-3)+
0.1×(4.5-3)]×0.5×10=7.2+1.8+1.5=10.5(元)。
即该市居民该月的人均水费估计为10.5元。
类型三 总体离散程度的估计
【典例】1.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田。这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是(  )
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
2.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为
,方差为s2,则
(  )   
      
A.
=4,s2<2
B.
=4,s2>2
C.
>4,s2<2
D.
>4,s2>2
3.从甲、乙两种玉米的苗中各抽10株,分别测它们的株高如下:(单位:cm)
甲:25 41 40 37 22 14 19 39 21 42;
乙:27 16 44 27 44 16 40 40 16 40。
问:(1)哪种玉米的苗长得高?
(2)哪种玉米的苗长得齐?
【思维·引】
1.根据平均数、标准差及中位数的概念判断。
2.结合平均数、方差的计算公式计算。
3.用平均数确定玉米苗的高度,用标准差确定哪种玉米的苗长得齐。
【解析】1.选B。评估这种农作物亩产量稳定程度的指
标是标准差。
2.选A。因为某7个数的平均数为4,所以这7个数的和为
4×7=28,因为加入一个新数据4,所以
=4。
又因为这7个数的方差为2,且加入一个新数据4,
所以这8个数的方差s2=
<2。
3.(1)
(25+41+40+37+22+14+19+39+21+42)=
×300=30(cm),
(27+16+44+27+44+16+40+40+16+40)=
×310=31(cm)。
所以
<
,即乙种玉米的苗长得高。
(2)
[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=
(25+121+100+49+64+256+121+81+81+144)=
×1
042=104.2(cm2),
[2×(27-31)2+3×(16-31)2+2×(44-31)2+3×
(40-31)2]=
×1
288=128.8(cm2)。
所以
<
,即甲种玉米的苗长得齐。
【类题·通】
平均数及方差的作用
(1)平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定。
(2)在随机抽样中,往往用样本的离散程度估计总体的离散程度。
【习练·破】
甲、乙两机床同时加工直径为100cm的零件,为检验质
量,各从中抽取6件测量,数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差。
(2)根据计算结果判断哪台机床加工零件的质量更稳定。
【解析】
(1)
(99+100+98+100+100+103)=100,
(99+100+102+99+100+100)=100。
[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=

[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1。
(2)两台机床所加工零件的直径的平均值相同,

>
,所以乙机床加工零件的质量更稳定。
【加练·固】
甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如表(单位:环):
如果甲、乙两人中只有1人入选,则入选的最佳人选应是________。?

10
8
9
9
9

10
10
7
9
9
【解析】因为
=9,
=
×[(9-10)2+(9-8)2+
(9-9)2+(9-9)2+(9-9)2]=

×[(9-10)2+
(9-10)2+(9-7)2+(9-9)2+(9-9)2]=

所以甲更稳定。
答案:甲