2020_2021学年新教材高中数学第九章统计9.2用样本估计总体同步课件(2份打包)新人教A版必修第二册

文档属性

名称 2020_2021学年新教材高中数学第九章统计9.2用样本估计总体同步课件(2份打包)新人教A版必修第二册
格式 zip
文件大小 3.0MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2021-04-24 21:46:47

文档简介

(共57张PPT)
9.2 用样本估计总体
9.2.1 总体取值规律的估计
9.2.2 总体百分位数的估计
必备知识·自主学习
1.频率分布直方图的画法
导思
1.怎样制作样本数据的频率分布表,画频率分布直方图?
2.如何求n个数据的第p百分位数?
(1)本质:频率分布表与频率分布直方图是对纷杂的样本数据整理和表示的一种方法,目的是可以清晰地得到样本数据的频率分布,从而估计总体分布.
(2)应用:①数据频数、频率的计算;②估计总体分布.
【思考】
(1)用图、表整理数据有哪些好处?
提示:用表格整理数据是通过改变数据的组织方式,为数据的解释提供新方式.用图表示数据不仅有利于从数据中提取信息,还可以利用图形传递信息.
(2)同一组数据,如果组距不同,得到的频率分布直方图会相同吗?
提示:对于同一组数据,不同的组距决定不同的组数,得到的频率分布直方图也会不同.
2.总体取值规律的估计
(1)从频率分布表可以看出,样本观测数据落在各个小组的比例大小,例如哪组最多,哪组最少.
(2)从频率分布直方图可以看出,样本的观测数据分布对称情况,左右高低情况,数据集中情况,从左到右的变化趋势等.
【思考】
频率分布直方图的组数对数据分析有何影响?
提示:当组数少、组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原始数据信息;当组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则,不容易看出总体数据的分布特点.
3.其他统计图表
不同的统计图在表示数据上有不同的特点.
(1)扇形图主要用于直观描述各类数据占总数的_____.
(2)条形图和直方图主要用于直观描述不同类别或分组数据的_____和_____.
(3)折线图主要用于描述数据随时间的_________.
不同的统计图适用的数据类型也不同.条形图适用于描述离散型的数据,直方图
适用描述连续型数据.
比例
频数
频率
变化趋势
4.百分位数
(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至
少有___的数据小于或等于这个值,且至少有_________的数据大于或等于这个
值.
(2)计算一组n个数据的第p百分位数的步骤:
第1步,按_________排列原始数据.
第2步,计算i=______.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第__项数据;若i
是整数,则第p百分位数为第__项与第______项数据的平均数.
p%
(100-p)%
从小到大
n×p%
j
i
(i+1)
【思考】
如何理解第25,50,75百分位数?
提示:第25,50,75百分位数把一组由小到大排列后的数据恰好分成四等份,因此称为四分位数.第25百分位数也叫第一四分位数或下四分位数,第50百分位数即中位数,第75百分位数也叫第三四分位数或上四分位数.
【基础小测】
1.辨析记忆(对的打“√”,错的打“×”)
(1)决定组距和组数时,组数越多越好.
(  )
(2)频率分布直方图的纵坐标是频率.
(  )
(3)频率分布直方图中各小矩形的面积之和可以不为1.
(  )
(4)一组数据的第25百分位数与第75百分位数相同.
(  )
提示:(1)×.应根据数据的多少合理确定组数,不是说组数越多越好.
(2)×.频率分布直方图的纵坐标是频率/组距.
(3)×.各小矩形的面积之和一定为1.
(4)×.不同,第25百分位数是第一四分位数,第75百分位数是第三四分位数.
2.100辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速在[60,70)km的汽车大约有
(  )
                  
A.30辆
B.40辆
C.60辆
D.80辆
【解析】选B.0.04×10×100=40(辆).
3.(教材二次开发:例题改编)下列四个图中,用来表示不同品种的奶牛的平均产奶量最为合适的是
(  )
【解析】选D.用统计图表示不同品种的奶牛的平均产奶量,即从图中可以比较各种数量的多少,因此“最为合适”的统计图是条形统计图.注意B选项中的图不是规范的统计图.
关键能力·合作学习
类型一 频率分布表、频率分布直方图(直观想象)
 角度1 频率分布表、频率分布直方图的画法?
【典例】某高校在2019年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下:
组号
分组
频数
频率
第1组
[160,165)
5
0.05
第2组
[165,170)

0.35
第3组
[170,175)
30

第4组
[175,180)
20
0.20
第5组
[180,185]
10
0.10
合计
100
1.00
(1)请先求出频率分布表中①②处应填写的数据,并完成如图所示的频率分布直方图;
(2)为了选拔出最优秀的学生,高校决定在笔试成绩高的第3,4,5组中用分层随机抽样的方法抽取6名学生进入第二轮面试,求第3,4,5组每组各应抽取多少名学生进入第二轮面试.
【思路导引】(1)利用频率=
计算,根据频率分布表中的数据画频率分布直方图.
(2)利用分层随机抽样的方法按比例分配进行抽取.
【解析】(1)由题意可知,第2组的频数为0.35×100=35,第3组的频率为
=0.30,故①处填35,②处填0.30.
频率分布直方图如图所示.
(2)因为第3,4,5组共有60名学生,所以利用分层随机抽样在60名学生中抽取6名
学生,抽样比为
故第3组应抽取30×
=3(名)学生,第4组应抽取20×
=2(名)学生,第5组应抽取10×
=1(名)学生,所以第3,4,5组应抽取的学生
人数分别为3,2,1.
 角度2 频率分布直方图的应用?
【典例】某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),
[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图所示.
(1)求直方图中x的值.
(2)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层随机抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?
【思路导引】(1)利用各组频率之和为1计算x值.
(2)先计算四组的频数,再按比例分配抽取样本.
【解析】(1)x=[1-(0.002+0.009
5+0.011+0.012
5+0.005+0.002
5)×20]
÷20=0.007
5.
(2)由频率分布直方图知,月平均用电量为[220,240),[240,260),
[260,280),
[280,300]的共有[(0.012
5+0.007
5+0.005+0.002
5)×20]×100=55(户),其
中在[220,240)中的有0.0125×20×100=25(户),因此,在所抽取的11户居民中,
月平均用电量在[220,240)的用户中应抽取
×11=5(户).
【解题策略】
1.绘制频率分布直方图的注意事项
(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确
定各个小组内数据的个数.
(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.
2.频率分布直方图的应用中的计算问题
(1)小长方形的面积=组距×
=频率.
(2)各小长方形的面积之和等于1.
(3)
=频率,此关系式的变形为
=样本量,样本量×频率=频数.
【题组训练】
1.为了解学生在课外活动方面的支出情况,抽取了n个学生进行调查,结果显示这些学生的支出金额(单位:元)都在[10,50],其中支出金额在[30,50]的学生有117人,频率分布直方图如图所示,则n=
(  )
                  
A.180
B.160
C.150
D.200
【解析】选A.[30,50]对应的频率为1-(0.01+0.025)×10=0.65,
所以n=
=180.
2.某厂对一批产品进行抽样检测,如图是抽检产品净重(单位:克)的频率分布直方图,样本数据分组为[76,78),[78,80),…,[84,86].若这批产品有120个,估计其中净重大于或等于78克且小于84克的产品的个数是
(  )
A.12
B.18
C.25
D.90
【解析】选D.净重大于或等于78克且小于84克的频率为(0.100+0.150+
0.125)×2=0.75,所以在该范围内的产品个数为120×0.75=90.
3.为了了解学校高一年级男生的身高情况,选取一个容量为60的样本(60名男生的身高),分组情况如表(单位:cm):
分组
[147.5,
155.5)
[155.5,
163.5)
[163.5,
171.5)
[171.5,
179.5]
频数
6
21
27
m
频率
a
0.1
(1)求出表中a,m的值.
(2)画出频率分布直方图.
【解析】(1)由题意得:6+21+27+m=60,所以m=6.
a=
=0.45.
(2)画出频率分布直方图如图所示.
【补偿训练】
  为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
【解析】(1)频率分布直方图是以面积的形式反映数据落在各小组内的频率大
小的,因此第二小组的频率为
=0.08.
又因为第二小组的频率=
,
所以样本量=
=150.
(2)由频率分布直方图可估计,该校高一年级学生的达标率为:
×100%=88%.
类型二 其他统计图(直观想象)
【题组训练】
1.经过中央电视台《魅力中国城》栏目的三轮角逐,黔东南州以三轮竞演总分排名第一成为“最具人气魅力城市”.如图统计了黔东南州从2012年到2019年的旅游总人数(万人次)的变化情况,从一个侧面展示了大美黔东南的魅力所在.根据这个图表,在下列给出的黔东南州从2012年到2019年的旅游总人数的四个判断中,错误的是
(  )
A.旅游总人数逐年增加
B.2019年旅游总人数超过2017、2018两年的旅游总人数的和
C.2012年到2015年旅游总人数增长较慢
D.从2016年起旅游总人数增长加快
【解析】选B.从题干图表中看出,旅游总人数逐年增加是正确的;2012年到2015年旅游总人数增长较慢,是正确的;从2016年起旅游总人数增长加快是正确的;其中选项B明显错误.
2.某教育局为了解“跑团”每月跑步的平均路程,收集并整理了2019年1月至2019年11月期间“跑团”每月跑步的平均路程(单位:千米)的数据,绘制了如图所示的折线图.
根据折线图,下列结论正确的是
(  )
A.月跑步平均路程的中位数为6月份对应的路程
B.月跑步平均路程逐月增加
C.月跑步平均路程高峰期大致在8,9月份
D.1月至5月的月跑步平均路程相对于6月至11月,波动性更小,变化比较平稳
【解析】选D.由题干折线图知,月跑步平均路程的中位数为5月份对应的路程;月跑步平均路程不是逐月增加的;月跑步平均路程高峰期大致在10月份,故A,B,C错.
3.如图是2019年各级学校每10万人口中平均在校生的人数扇形统计图,则下列结论正确的是
(  )
A.2019年有6%的高中生升入高等学校
B.2019年全国高等学校在校生6
000人
C.2019年各级学校10万人口中平均在校生人数在高等学校学生中占6%
D.2019年高等学校的学生比高中阶段的学生多
【解析】选C.由扇形统计图可以看出,2019年各级学校每10万人口中平均在校生的人数所占的百分比分别为幼儿园占8%,高等学校占6%,高中阶段占12%,初中阶段占26%,小学占48%,A项中应是高等学校在校学生.B项中6
000人应是平均数,D项显然错误.
【解题策略】
条形图、折线图、扇形图分别要关注的问题
(1)在条形统计图中,各个矩形图的宽度没有严格要求,但高度必须以数据为准,它直观反映了各部分在总体中所占比重的大小.实际问题中,我们需根据需要进行分组,横轴上的分组越细,对数据的刻画(描述)就越精确.
(2)在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.
(3)扇形统计图表示总体的各部分之间的百分比关系,但不同总量下的扇形统计图,其不同的百分比不可以作为比较的依据.
【补偿训练】
  已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生近视的形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为
(  )
                  
A.100,10
B.100,20
C.200,10
D.200,20
【解析】选D.由题得样本容量为(3
500+2
000+4
500)×2%=10
000×2%=200,
抽取的高中生人数为2
000×2%=40,则近视人数为40×0.5=20.
类型三 百分位数(数据分析)
【典例】1.贵阳轨道交通1号线2018年12月1日全线试运营,某机车某时刻从下
麦西站驶往贵阳北站的过程中,10个车站上车的人数统计如下:70,60,60,50,
60,40,40,30,30,10,则这组数据的第25百分位数、第50百分位数的和为(  )                  
A.70
B.65
C.75
D.90
2.某经销商从外地一水殖厂购进一批小龙虾,并随机抽取40只进行统计,按重量分类统计结果如图:
(1)估计这批小龙虾质量的第10百分位数与第90百分位数.
(2)该经销商将这批小龙虾分成三个等级,如表:
等级
三等品
二等品
一等品
重量/克
[5,25)
[25,45)
[45,55]
试估计这批小龙虾划为几等品比较合理?
【思路导引】1.将数据从小到大排列,确定第25百分位数,第50百分位数.
2.第(1)问,将数据按从小到大排列,即自左到右,分别求出第10百分位数与第90百分位数,第(2)问用样本估计总体.
【解析】1.选C.数据70,60,60,60,50,40,40,30,30,10是从大到小排列的,因为
10×25%=2.5,按从小到大排列后,第25百分位数是第3项,即30;易知,第50百分
位数是
=45,所以第25百分位数、第50百分位数的和为75.
2.(1)因为40×10%=4,所以第10百分位数为第4项与第5项的平均数,在[5,15)范
围内约为
=10,因为40×90%=36,所以第90百分位数为第36项与第37项的
平均数,在[35,55]范围内,约为
=45,所以估计这批小龙虾重量的第10百
分位数为10,第90百分位数为45.
(2)由(1)知,将这批小龙虾重量集中在[10,45]范围内,所以划为二等品比较合
理.
【解题策略】
1.求百分位数的注意事项
(1)求百分位数时,一定要将数据按照从小到大的顺序排列.
(2)计算i=n×p%后要弄清i是整数还是非整数.
2.利用频率分布直方图求百分位数
百分位数对应左侧小矩形的面积之和.首先确定在哪个区间,然后从左到右计算左侧所有的小矩形的面积和,百分位数所在区间需按照对应比例计算面积.
【跟踪训练】
求1,2,3,4,5,6,7,8,9,10的25%分位数,75%分位数,90%分位数.
【解析】因为数据个数为10,而且10×25%=2.5,10×75%=7.5,10×90%=9.
所以该组数据的25%分位数为3,75%分位数为8,90%分位数为
=9.5.
总体取值规律的估计
总体百分位数的估计
绘制频率分布直方图的注意事项
(1)计算极差当数据很多时,可选一个数当参照.
(2)数据越多,分组越多。
(3)将数据分组决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点。
(4)画频率分布直方图时,纵坐标表示频率与组距的比值,.
频率分布表
频率分布直方图
百分位数
核心知识
方法总结
易错提醒
核心素养
直观想象:在绘制频率分布直方图时体现的是直观想象的核心素养
第p百分位数
四分位数
其他统计图
扇形图
折线图
条形图
计算百分位数的步骤::
将原始数据排列→计算i=n×p%→若i不是整数,而大于i的比邻整数为j,则取与i相邻的第j
项数据;若i是整数,则取第i项与第(i+1)项数据的平均数.
课堂检测·素养达标
1.一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为
(  )                  
A.10组
B.9组
C.8组
D.7组
【解析】选B.极差为140-51=89,而组距为10,故应将样本数据分为9组.
2.观察新生儿的体重(单位:g),其频率分布直方图如图所示,则新生儿体重在
[2
700,3
000)的频率为
(  )
A.0.1
B.0.2
C.0.3
D.0.4
【解析】选C.由题图可得,新生儿体重在[2
700,3
000)的频率为0.001
×300=0.3.
3.观察如图所示的统计图,下列结论正确的是
(  )
A.甲校女生比乙校女生多
B.乙校男生比甲校男生少
C.乙校女生比甲校男生少
D.甲、乙两校女生人数无法比较
【解析】选D.图中数据只是百分比,甲、乙两个学校的学生总数不知道,因此男生与女生的具体人数也无法得知.
4.(教材二次开发:练习改编)某棉纺厂为了了解一批棉花的质量,从中随机抽
测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标).所得数
据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,约有
    根棉花纤维的长度小于20
mm.?
【解析】由题意知,棉花纤维的长度小于20
mm的频率为(0.01+0.01+
0.04)×5=0.3,故抽测的100根中,棉花纤维的长度小于20
mm的约有0.3×100=30(根).
答案:30
5.90,92,92,93,93,94,95,96,99,100的80%分位数为    .?
【解析】10×80%=8,80%分位数为
=97.5.
答案:97.5(共56张PPT)
9.2.3 总体集中趋势的估计
9.2.4 总体离散程度的估计
必备知识·自主学习
1.总体集中趋势参数
(1)众数、中位数、平均数的概念与特征
导思
1.样本数据集中趋势参数有哪些?它们有何统计含义?
2.如何描述样本数据的离散程度?
数字
参数
定义与求法
优点与缺点
众数
一组数据中重复出
现次数_____的数
众数通常用于描述变量的值出现次数
最多的数.但显然它对其他数据信息的
忽视使得无法客观地反映总体特征
最多
数字
参数
定义与求法
优点与缺点
中位数
把一组数据按从小到大
(或从大到小)排列,处在
_______位置的一个数据
(或两个数据的_______)
中位数等分样本数据所占频率,它
不受少数几个极端值的影响,这在
某些情况下是优点,但它对极端值
的不敏感有时也会成为缺点
平均数
如果有n个数据x1,x2,…,
xn,那么这n个数据的平均

平均数和每一个数据都有关,可以
反映样本数据全体的信息,但平均
数受数据中的极端值的影响较大,
使平均数在估计总体时可靠性降低
最中间
平均数
(2)众数、中位数、平均数在频率分布直方图中的估计
众数:取最高的小矩形底边中点的_______;
中位数:把频率分布直方图划分为左右两个_____相等的部分,分界线与x轴交点的横坐标;
平均数:每个小矩形的面积与小矩形底边中点的横坐标的乘积之和.
横坐标
面积
【思考】
由频率分布直方图中得到的众数、中位数、平均数有何特点?
提示:都是估计值.
2.总体集中趋势的估计
(1)平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.
(2)单峰频率分布直方图的平均数与中位数
形状
关系
对称
平均数与中位数差不多
右边“拖尾”
平均数大于中位数
左边“拖尾”
平均数小于中位数
平均数总是在“长尾巴”那边
(3)对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平
均数、中位数;对分类型数据(如校服规格、性别、产品质量等级等)集中趋势
的描述,可以用_____.
众数
【思考】
平均数、中位数、众数对极端值的敏感性如何?
提示:因为样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变.但中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变.所以平均数比中位数更敏感.
众数只利用了出现次数最多的那个值的信息,只能传递数据中信息的很少一部分,对极端值不敏感.
3.总体离散程度的估计
(1)极差
一种简单的度量_____________的方法就是用极差.极差越大,波动范围越大.
(2)平均距离
假设一组数据是x1,x2,…,xn,用
表示这组数据的平均数.①距离:每个数据
与_______的差的绝对值,表示:|xi-
|(i=1,2,…,n).
②平均距离:
数据离散程度
平均数
(3)方差、标准差
①方差:
=
.
②标准差:
.
(4)总体方差、总体标准差
如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为
,则总体方
差:S2=
____________,总体标准差:S=_____.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中
Yi出现的频率为fi(i=1,2,…,k),则总体方差为S2=______________.
(5)样本方差、样本标准差
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为
,则样本
方差:s2=___________,样本标准差:s=____.
【思考】
标准差、方差与数据离散程度有何关系?
提示:标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.在刻画数据的分散程度上,方差和标准差是一样的.
【基础小测】
1.辨析记忆(对的打“√”,错的打“×”)
(1)中位数一定是样本数据中的某个数.
(  )
(2)在一组样本数据中,众数一定是唯一的.
(  )
(3)方差越大,数据的稳定性越强.
(  )
(4)在两组数据中,平均值较大的一组方差较大.
(  )
提示:(1)×.当样本数据有偶数个时,中位数是大小排列后中间两数的平均值.
(2)×.在一组样本数据中,众数可能不止一个.
(3)×.方差越小,数据的稳定性越强.
(4)×.一组数据的平均值与方差没有必然联系.
2.(教材二次开发:例题改编)一组数据为1,1,3,3,则这组数据的众数和中位数分别是
(  )                  
A.1或3,2
B.3,2
C.1或3,1或3
D.3,3
【解析】选A.数据1,1,3,3中,1和3都出现了2次,出现的次数最多,则众数是1或3;最中间的两个数是1与3,则中位数是2.
3.王老师从星期一到星期五收到的信件数分别是10,6,8,5,6,则该组数据的
方差s2=    .?
【解析】王老师收到信件的平均数为7,根据方差的计算公式可得s2=
[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=3.2.
答案:3.2
关键能力·合作学习
类型一 众数、中位数、平均数(数据分析)
 角度1 众数、中位数、平均数的计算?
【典例】已知一组数据按从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么这组数据的众数是    ,平均数是    .?
【思路导引】先根据中位数的计算方法求出数据中x的值,再求数据的众数与平均数.
【解析】因为中位数为5,所以
=5,即x=6.
所以该组数据为-1,0,4,6,6,15,
所以该组数据的众数为6,
平均数为
=5.
答案:6 5
【变式探究】
 本例若改为:若第一组数据7,4,3,m的平均数是5;第二组数据18,9,7,m,n的平均数为10,求第二组数据的中位数.
【解析】由题意,得
解得
所以第二组数据为6,7,9,10,18,其中位数为9.
 角度2 众数、中位数、平均数的应用?
【典例】个体户李某经营一家快餐店,下面是快餐店所有工作人员8月份的工资表:
老板李某
30
000元
大厨老张
4
500元
二厨小马
3
500元
采购员小王
4
000元
杂工李阿姨
3
200元
服务生小明
3
200元
会计小何
4
100元
(1)计算所有工作人员8月份的平均工资.
(2)由(1)计算出的平均工资能否反映打工人员这个月收入的一般水平?为什么?
(3)去掉李某的工资后,再计算平均工资,这能代表打工人员当月的收入水平吗?
(4)根据以上计算,以统计的观点,你对(3)的结果有什么看法?
【解析】(1)所有工作人员8月份的平均工资是
=
×(30
000+4
500+
3
500+4
000+3
200+3
200+4
100)=7
500(元).
(2)计算出的平均工资不能反映打工人员当月收入的一般水平,可以看出,打工
人员的工资都低于平均工资,因为这7个值中有一个极端值——李某的工资特别
高,所以他的工资对平均工资的影响较大,同时他也不是打工人员.
(3)去掉李某工资后的平均工资
=
×(4
500+3
500+4
000+3
200+3
200+
4
100)=3
750(元),该平均工资能代表打工人员当月收入的一般水平.
(4)从本题的计算可以看出,个别特殊值对平均数有很大的影响,因此在选择样
本时,样本中尽量不用特殊数据.
(答案不唯一,合理即可)
【解题策略】
众数、中位数、平均数的特点
众数、中位数及平均数都是描述一组数据集中趋势的量,它们各有优缺点.
(1)平均数的大小与一组数据里每个数的大小均有关系,任何一个数据的变动都会引起平均数的变动,可反映更多的总体信息;但受数据中的极端值的影响较大,妨碍了对总体估计的可靠性,因此用平均数估计总体有时不可靠.
(2)众数、中位数不受少数几个极端值的影响,这在某些情况下是一个优点,当一组数据中个别数据较大时,可用中位数描述其集中趋势;当一组数据中有不少数据重复出现时,其众数往往更能反映问题.但它们对极端值的不敏感有时也会成为缺点.
【题组训练】
1.在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
成绩/m
1.50
1.60
1.65
1.70
1.75
1.80
1.85
1.90
人数
2
3
2
3
4
1
1
1
分别求这些运动员成绩的众数、中位数与平均数.
【解析】在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是
1.75.题中表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据
1.70是最中间的一个数据,即这组数据的中位数是1.70;这组数据的平均数是
=
×(1.50×2+1.60×3+…+1.90×1)=
≈1.69(m).
所以17名运动员成绩的众数、中位数、平均数依次为1.75
m,1.70
m,1.69
m.
2.某市有甲、乙、丙三家日光灯厂,三家广告中都称其产品的使用寿命为8年,但是他们的产品质量有区别,为了调查事实,现从甲、乙、丙三个厂家生产的同一种产品中,各抽取8件产品,对其使用寿命进行跟踪调查,其结果如下(单位:年):
甲:3,4,5,6,8,8,8,10
乙:4,6,6,6,8,9,12,13
丙:3,3,4,7,9,10,11,12
根据调查结果,你能得到什么启示?
【解析】三个厂家是从不同角度来宣传自己的产品.其中甲:众数为8年,乙:平均数为8年,丙:中位数为8年.
类型二 总体集中趋势的估计(数据分析)
【典例】2019年春天,山东某地区遭遇严重干旱,某乡计划向上级申请支援,为上报需水量,乡长事先抽样调查了100户村民的月均用水量,得到这100户村民月均用水量的频率分布表如表:(月均用水量的单位:吨)
用水量分组
频数
频率
[0.5,2.5)
12
[2.5,4.5)
[4.5,6.5)
40
[6.5,8.5)
0.18
[8.5,10.5]
6
合计
100
1.00
(1)请完成该频率分布表,并画出相对应的频率分布直方图.
(2)估计样本的中位数是多少.
(3)已知上级将按每户月均用水量向该乡调水,若该乡共有1
200户,请估计上级支援该乡的月调水量是多少吨?
【思路导引】(1)由
=频率完成频率分布表,再画出频率分布直方图.
(2)计算前几组频率和,确定中位数所在范围,再根据面积确定中位数.
(3)计算出样本中每户的月均用水量,再估计1
200户的需求量.
【解析】(1)频率分布表与相应的频率分布直方图如下:
用水量分组
频数
频率
[0.5,2.5)
12
0.12
[2.5,4.5)
24
0.24
[4.5,6.5)
40
0.40
[6.5,8.5)
18
0.18
[8.5,10.5]
6
0.06
合计
100
1.00
(2)设中位数为x,因为月均用水量在[0.5,4.5)内的频率是0.12+0.24=0.36,
月均用水量在[0.5,6.5)内的频率是0.12+0.24+0.40=0.76,所以x∈[4.5,6.5),
则(x-4.5)×0.2=0.5-0.36,解得x=5.2.
所以中位数是5.2.
(3)该乡每户月均用水量估计为1.5×0.12+3.5×0.24+5.5×0.40+7.5
×0.18+9.5×0.06=5.14,5.14×1
200=6
168,
所以上级支援该乡的月调水量是6
168吨.
【解题策略】
要理解并记准频率分布直方图与众数、中位数及平均数的关系.
【跟踪训练】
某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:
(1)高一参赛学生成绩的众数、中位数.
(2)高一参赛学生的平均成绩.
【解析】(1)由题图可知参赛学生成绩的众数为65分,
又第一个小矩形的面积为0.3,第二个小矩形的面积为0.4,0.3+0.4>0.5,
所以设中位数为60+x,
则0.3+x×0.04=0.5,得x=5,
所以参赛学生成绩的中位数为60+5=65(分).
(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67(分),所以参赛学生的平均成绩约为67分.
类型三 总体离散程度的估计(数据分析)
【典例】某工厂甲、乙两名工人参加操作技能培训,他们在培训期间参加的8次
测试成绩记录如下:
甲:95 82 88 81 93 79 84 78
乙:83 92 80 95 90 80 85 75
(1)试比较哪个工人的成绩较好.
(2)甲、乙成绩位于
-s与
+s之间的有多少?
【思路导引】(1)比较平均数与方差确定成绩的好坏;
(2)计算出区间端点,进而确定区间内数据的个数.
【解析】(1)
=
×(95+82+88+81+93+79+84+78)=85,
=
×(83+92+80+95+90+80+85+75)=85.
=
×[(95-85)2+(82-85)2+(88-85)2+(81-85)2+(93-85)2+(79-85)2+
(84-85)2+(78-85)2]=35.5,
=
×[(83-85)2+(92-85)2+(80-85)2+(95-85)2+(90-85)2+(80-85)2+
(85-85)2+(75-85)2]=41.
因为
=
,
<
,所以甲的成绩较稳定.
综上可知,甲的成绩较好.
(2)因为s甲=
≈5.96,
-s甲=79.04,
+s甲=90.96,
所以甲位于
-s与
+s之间的数据有4个.
又s乙=
≈6.4,
-s乙=78.6,
+s乙=91.4,
所以乙的成绩位于
-s与
+s之间的有5个.
【解题策略】
平均数及方差、标准差的作用
(1)平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
(2)在随机抽样中,往往用样本的离散程度估计总体的离散程度.
【跟踪训练】
 从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm):
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
问:(1)哪种玉米苗长得高?
(2)哪种玉米苗长得齐?
【解析】(1)因为
=
×(25+41+40+37+22+14+19+39+21+42)=
×300=30(cm),
=
×(27+16+44+27+44+16+40+40+16+40)=
×310=31(cm).
所以
<
,即乙种玉米苗长得高.
(2)
=
×[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+
(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]
=
×(25+121+100+49+64+256+121+81+81+144)=
×1
042=104.2,
=
×[(2×272+3×162+3×402+2×442)-10×312]=
×1
288=128.8,
所以
<
,即甲种玉米苗长得齐.
【补偿训练】
  甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如表(单位:环):

10
8
9
9
9

10
10
7
9
9
如果甲、乙两人中只有1人入选,则入选的最佳人选应是    .?
【解析】因为
=
=9,
=
×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+
(9-9)2]=
,
=
×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=
>
,
所以甲更稳定.
答案:甲
(1)中位数不受少数极端值的影响
(2)众数无法客观地反映总体的特征(3)平均数受极端值的影响较大
数字
特征
(1)数学抽象:通过样本的数字
特征,培养数学抽象的核心素养
(2)数学运算:通过数字特征的计算,培养数学运算的核心素养
(3)数据分析:利用样本的数字特征的分析数据、预测问题
利用频率分布直方图求数字特征的方法
(1)众数是最高的矩形的底边的中点的横坐标.
(2)中位数左右两侧直方图的面积相等。
(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和。
中位数
众数
频率分布直方图中的数字特征
平均数
标准差:
方差:
集中
离散
易错提醒
核心知识
核心素养
方法总结
总体集中趋势的估计
总体离散程度的估计
课堂检测·素养达标
1.某校举行歌咏比赛,规定各个评委评分的平均数作为该班节目的实际得分.对于某班的演出,评委的评分分别为:9.70,9.68,9.75,9.72,9.65,则这个班节目的实际得分是
(  )                  
A.9.66
B.9.70
C.9.65
D.9.67
【解析】选B.
=
×(9.65+9.70+9.68+9.75+9.72)=9.70.
2.下列选项中,能反映一组数据的离散程度的是
(  )
A.平均数
B.中位数
C.方差
D.众数
【解析】选C.由方差的定义,知方差反映了一组数据的离散程度.
3.(教材二次开发:练习改编)样本数据2,4,6,8,10的标准差为
(  )
A.40
B.8
C.2
D.2
【解析】选D.
=
×(2+4+6+8+10)=6,则标准差为
4.下列说法中,不正确的是
(  )
A.数据2,4,6,8的中位数是4,6
B.数据1,2,2,3,4,4的众数是2,4
C.一组数据的平均数、众数、中位数有可能是同一个数
D.8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是
【解析】选A.数据2,4,6,8的中位数为
=5,显然A错误,B,C,D都正确.
5.某校为了了解高三学生在一次模拟考试中对数学的掌握情况,从高三年级中随机抽查了100名学生的数学成绩,并制成了频率分布直方图,从图中可以知道这100名学生成绩的中位数为    .?
【解析】根据频率分布直方图可知,
0.006×10+0.02×10=0.26<0.5,0.26+0.03×10=0.56>0.5
所以中位数在[100,110)内,可设为x,
则(x-100)×0.03+0.26=0.5,解得x=108.
答案:108