人教版高中数学必修第二册 第九章 统计 课件(3份打包)

文档属性

名称 人教版高中数学必修第二册 第九章 统计 课件(3份打包)
格式 zip
文件大小 5.0MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2023-08-17 10:19:37

文档简介

(共11张PPT)
统计案例
公司员工的肥胖情况调查分析
一、背景导入
近年来,我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.目前,国际上常用身体质量指数(Body Mass Index,缩写BMT)来衡量人体胖瘦程度以及是否健康,其计算公式是
中国成人的BMI数值标准为:BMI<18.5为偏瘦;18.5≤BMI<23.9为正常;24≤BMI<27.9为偏胖;BMI≥28为肥胖。
二、数据调查
为了解某公司员工的身体肥胖情况,研究人员从公司员工体检数据中,采用比例分配的分层随机抽样方法抽取了90名男员工、50名女员工的身高和体重数据,计算得到他们的BMI值如下:
三、合作探究
根据上面的数据,写一份该公司员工肥胖情况的统计分析报告.要求:
1.选择合适的图表展示数据;
2.比较男、女员工在肥胖状况上的差异;
3.分析公司员工胖瘦程度的整体情况;
4.提出控制体重的建议.
四、统计分析报告的主要组成部分
1.标题
2.前言
简单交代调查的目的、方法、范围等背景情况,使读者了解调查的基本情况。
3.主体
展示数据分析的全过程:首先要明确所关心的问题是什么,说明数据蕴含的信息;根据数据分析的需要,说明如何选择合适的图表描述和表达数据;从样本数据中提取能刻画其特征的量,如均值、方差等,用于比较男、女员工在肥胖状况上的差异;通过样本估计总体的统计规律,分析公司员工胖瘦程度的整体情况.
4.结尾
对主体部分的内容进行概括,结合控制体重的一般方法(可以查阅有关文献),提出控制公司员工体重的建议.
谢 谢(共157张PPT)
用样本估计总体
9.2.1 总体取值规律的估计
9.2.2 总体百分位数的估计 
1.频率分布直方图的画法
【思考】
用图、表整理数据有哪些好处?
提示:用表格整理数据是通过改变数据的组织方式,为数据的解释提供新方式。用图表示数据不仅有利于从数据中提取信息,还可以利用图形传递信息。
2.总体取值规律的估计
(1)从频率分布表可看出,样本观测数据落在各个小组的比例大小,例如哪组最多,哪组最少,集中在较高值或较低值等。
(2)从 可看出,样本的观测数据分布对称情况,左右高低情况,数据集中情况,从左到右的变化趋势等。
频率分布直方图
【思考】
频率分布直方图的组数对数据分析有何影响?
提示:当组数少、组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原始数据信息;当组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则,不容易看出总体数据的分布特点。
3.其他统计图表
不同的统计图在表示数据上有不同的特点。
(1) 主要用于直观描述各类数据占总数的比例。
(2) 和 主要用于直观描述不同类别或分组数据的频数和频率。
(3) 主要用于描述数据随时间的变化趋势。
不同的统计图适用的数据类型也不同。条形图适用于描述离散型的数据,直方图适用描述连续型数据。
扇形图
条形图
直方图
折线图
【思考】
选择恰当的统计图表分析样本数据有何好处?
提示:选择恰当的统计图对数据进行可视化描述,能通过图形直观地发现样本数据的分布情况,进而估计总体的分布规律。
4.总体百分位数的估计
一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 的数据小于或等于这个值,且至少有 的数据大于或等于这个值。
可以通过下面的步骤计算一组n个数据的第p百分位数:
p%
(100-p)%
第1步,按从小到大排列原始数据。
第2步,计算i=n×p%。
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数。
5. ,把一组由小到大排列后的数据分成四等份,因此称为四分位数。其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数。
第25,50,75百分位数
【思考】
第25百分位数和第75百分位数有何异同?
提示:第25百分位数是第一四分位数,第75百分位数是第三四分位数。
【素养小测】
1.思维辨析(对的打“√”,错的打“×”)
(1)决定组距和组数时,组数越多越好。(  )
(2)频率分布直方图的纵坐标是频率。(  )
(3)频率分布直方图中各小矩形的面积之和可以不为1。(  )
提示:(1)×。应根据数据的多少合理确定组数,不是说组数越多越好。
(2)×。频率分布直方图的纵坐标是频率/组距。
(3)×。各小矩形的面积之和一定为1。
2.100辆汽车通过某一段公路时的时速的频率分布直方
图如图所示,则时速在[60,70)的汽车大约有(  )
                  
A.30辆 B.40辆 C.60辆 D.80辆
【解析】选B。0.04×10×100=40(辆)。
3.一个容量为200的样本的频率分布直方图如图所示,则样本数据落在[5,9)内的频率和频数分别为_____。
【解析】由图可知,落在[5,9)内的频率为0.05×
(9-5)=0.2,频数为200×0.2=40。
答案:0.2,40
类型一 频率分布直方图的画法
【典例】为了了解学校高一年级男生的身高情况,选取一个容量为60的样本(60名男生的身高),分组情况如下(单位:cm):
(1)求出表中a,m的值。
(2)画出频率分布直方图。
分组 [147.5, 155.5) [155.5, 163.5) [163.5, 171.5) [171.5,
179.5]
频数 6 21 27 m
频率 a 0.1
【思维·引】
(1)利用频数和等于60求m值,进而求a。
(2)根据题中数据及表格数据画频率分布直方图。
【解析】(1)由题意得:6+21+27+m=60,所以m=6。
a= =0.45,所以a=0.45。
(2)作出频率分布直方图如图所示。
【内化·悟】
画频率分布直方图的关键是什么?
提示:确定组距。
【类题·通】
绘制频率分布直方图的注意事项
(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照。
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多。
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点。
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数。
(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率。
提醒:每个小长方形的面积=组距× =频率。
【习练·破】
已知某池塘养殖着鲤鱼和鲫鱼,为了估计这两种鱼的数量,养殖者从池塘中捕出这两种鱼各1000条,给每条鱼做上不影响其存活的标记,然后放回池塘,待完全混合后,再每次从池塘中随机地捕出1000条鱼,记录下其中有记号的鱼的数目,立即放回池塘中。这样的记录做了10次,并将记录获取的数据制作成如图所示的茎叶图。
(1)根据茎叶图计算有记号的鲤鱼和鲫鱼数目的平均数,并估计池塘中的鲤鱼和鲫鱼的数量;
(2)为了估计池塘中鱼的总质量,现按照(1)中的比例对100条鱼进行称重,根据称重鱼的质量介于[0,4.5](单位:千克)之间,将测量结果按如下方式分成九组:第一组[0,0.5),第二组[0.5,1),…,第九组[4,4.5]。如图是按上述分组方法得到的频率分布直方图的一部分。
①估计池塘中鱼的质量在3千克以上(含3千克)的条数;
②若第三组鱼的条数比第二组多7条、第四组鱼的条数比第三组多7条,请将频率分布直方图补充完整;
③在②的条件下估计池塘中鱼的质量的众数及池塘中鱼的总质量。
【解析】(1)根据茎叶图可知,鲤鱼与鲫鱼的平均数目分别为80,20。由题意知,池塘中鱼的总数目为1000÷ =20000(条),则估计鲤鱼数目为20000× =16000(条),鲫鱼数目为
20000-16000=4000(条)。
(2)①根据题意,结合直方图可知,池塘中鱼的质量在3千克以上(含3千克)的条数约为
20000×(0.12+0.08+0.04)×0.5=2400。
②设第二组鱼的条数为x,则第三、四组鱼的条数分别为x+7,x+14,则有x+x+7+x+14=100×[1-(0.08+
0.50+0.28+0.12+0.08+0.04)×0.5],解得x=8,
故第二、三、四组的频率分别为0.08,0.15,0.22,它们
在频率分布直方图中的小矩形的高度分别为0.16,0.30,
0.44,据此可将频率分布直方图补充完整(如图所示)。
③众数为2.25千克,平均数为0.25×0.04+0.75×0.08
+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+
3.25×0.06+3.75×0.04+4.25×0.02=2.02(千克),
所以鱼的总质量为2.02×20000=40 400(千克)。
类型二 频率分布直方图的应用
【典例】某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩(总分为100分)分成6组加以统计,6组的分数分别是[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],得到如图所示的频率分布直方图。已知高一年级学生中不及格(低于60分)的人数
比优秀(不低于90分)的人数多60人,则高一年级共有学生(  )
A.300人 B.600人 C.200人 D.700人
【思维·引】设出总人数,利用频率分布直方图分别表示出不及格、优秀的人数,相减等于60即可。
【解析】选B。设高一年级共有学生n人,
则n×(0.005+0.015)×10-n×0.010×10=60,
解得n=600。
【内化·悟】
利用频率分布直方图进行计算的依据是什么?
提示: ×组距=频率。
【类题·通】
由频率分布直方图进行相关计算时,需掌握下列关系式。
(1) ×组距=频率。
(2) =频率,此关系式的变形为: =样本量,
样本量×频率=频数。
【习练·破】
为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12。
(1)第二小组的频率是多少?样本量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
【解析】(1)频率分布直方图是以面积的形式反映数据落在各小组内的频率大小的,
因此第二小组的频率为 =0.08。
又因为第二小组的频率= ,
所以样本量= =150。
(2)由频率分布直方图可估计,该校高一年级学生的达标率为: ×100%=88%。
【加练·固】
为调查我校学生的用电情况,学校后勤部门组织抽取了100间学生宿舍某月用电量调查,发现每间宿舍用电量都在50度到350度之间,其频率分布直方图如图所示。
(1)为降低能源损耗,节约用电,学校规定:每间宿舍每月用电量不超过200度时,按每度0.5元收取费用;超过200度,超过部分按每度1元收取费用。以t表示某宿舍的用电量(单位:度),以y表示该宿舍的用电费用(单位:元),求y与t的函数关系式。
(2)求图中月用电量在(200,250]度的宿舍有多少间。
【解析】(1)根据题意,得:
当0≤t≤200时,用电费用为y=0.5t;
当t>200时,用电费用为
y=200×0.5+(t-200)×1=t-100;
综上:宿舍的用电费用为
y=
(2)因为月用电量在(200,250]度的频率为
50x=1-(0.0060+0.0036+0.0024+0.0024+0.0012)×50=1-0.0156×50=0.22,所以月用电量在(200,250]度的宿舍有100×0.22=22(间)。
类型三 其他统计图
【典例】某校高一某班的某次数学测试成绩(满分为
100分)如下
56,58,62,63,63,65,66,68,69,71,72,72,73,74,75,
76,77,78,79,95,98
其中[80,90)内的成绩缺失。
频率分布直方图也受到了不同程度的破坏,但可见部分如图,据此解答下列问题:
(1)求分数在[50,60)内的频率及全班人数。
(2)求分数在[80,90)之间的频数,并计算频率分布直方图中[80,90)间的矩形的高。
【思维·引】(1)由题意可得分数在[50,60)内的频数,由频率分布直方图,可得分数在[50,60)内的频率,进而根据频率= 解得全班人数。
(2)分数在[80,90)之间的频数,可由全班人数减去之外的频数。频率分布直方图中矩形的高为 ,求出[80,90)这组的频率,然后除以组距。
【解析】(1)分数在[50,60)的频率为0.008×10=0.08。
由题意知,分数在[50,60)之间的频数为2,所以全班人
数为 =25。
(2)分数在[80,90)之间的频数为25-2-7-10-2=4,频率
分布直方图中[80,90)间的矩形的高为 ÷10=0.016。
【类题·通】条形统计图、扇形统计图和折线统计图的区别与联系
统计图 区别 联系
条形统计图 (1)直观反映数据分布的大致情况 (2)清晰地表示各个区间的具体数目 (3)会丢失数据的部分信息 在同一
组数据
的不同
统计图
表中,
计算出
相应组
的频数、
频率应
该相等。
扇形统计图 (1)清楚地看出数据分布的总体趋势及各部分所占总体的百分比 (2)丢失了原来的具体数据 折线统计图 (1)表示数据的多少和数量增减变化情况 (2)制作类似于函数图象的画法,侧重体现数据的变化规律 【习练·破】(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图。
根据该折线图,下列结论错误的是 (  )
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月份
D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳
【解析】选A。由题图可知,2014年8月到9月的月接待游客量在减少,则A选项错误,故选A。
类型四 百分位数
【典例】某经销商从外地一水殖厂购进一批小龙虾,并
随机抽取40只进行统计,按重量分类统计结果如图:
(1)估计这批小龙虾重量的第10百分位数与第90百分位数。
(2)该经销商将这批小龙虾分成三个等级,如表:
试估计这批小龙虾划为几等品比较合理?
等级 三等品 二等品 一等品
重量(克) [5,25) [25,45) [45,55]
【思维·引】第(1)问,将数据按从小到大排列,即自左到右,分别求出第10百分位数与第90百分位数,第(2)问用样本估计总体。
【解析】(1)因为40×10%=4,所以第10百分位数为第4项与第5项的平均数,在[5,15)范围内约为 =10,因为40×90%=36,所以第90百分位数为第36项与第37项的平均数,在[35,55]范围内,约为 =45,所以估计这批小龙虾重量的第10百分位数为10,第90百分位数为45。
(2)由(1)知,将这批小龙虾重量集中在[10,45]范围内,所以划为二等品比较合理。
【内化·悟】
计算第p百分位数的关键是什么?
提示:计算i=n×p%并分析不同情况下即i为整数或非整数时第p百分位数的计算。
【类题·通】
计算一组n个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据。
第2步,计算i=n×p%。
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数。
【习练·破】
贵阳轨道交通1号线2018年12月1日开通运营,某机车某时刻从下麦西站驶往贵阳北站的过程中,10个车站上车的人数统计如下:
70,60,60,50,60,40,40,30,30,10,则这组数据的第25百分位数、第50百分位数的和为(  )          
A.70 B.65 C.75 D.90
【解析】选C。数据70,60,60,60,50,40,40,30,30,10是从大到小排列的,因为10×25%=2.5,按从小到大排列后,第25百分位数是第3项,即30;易知,第50百分位数是 =45,所以第25百分位数、第50百分位数的和为75。
【加练·固】为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机各选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:
分别求甲、乙两厂样本轮胎宽度的第10百分位数与第90百分位数,根据两厂的轮胎宽度的波动情况(波动越小,轮胎质量越好),判断这两个工厂哪个厂的轮胎相对更好?
【解析】甲厂这批轮胎宽度的数据为
195,194,196,193,194,197,196,195,193,197,
从小到大排列为
193,193,194,194,195,195,196,196,197,197,
又因为10×10%=1,10×90%=9,
所以第10百分位数为第1项与第2项的平均数,即193;第90百分位数为第9项与第10项的平均数,即197。
同理,乙厂这批轮胎宽度的数据从小到大排列为
192,192,193,193,194,195,195,195,195,196。
第10百分位数为192,第90百分位数为195.5。
因为197-193=4,195.5-192=3.5,乙厂的波动更小,用样本估计总体,所以乙厂的轮胎相对更好。
9.2.3 总体集中趋势的估计
9.2.4 总体离散程度的估计
1.众数、中位数、平均数定义
(1)众数:一组数据中出现次数 的数。
(2)中位数:把一组数据按 的顺序排列,处在 位置的数(或中间两个数的 )。
最多
从小到大(或从大到小)
中间
平均数
(3)平均数:如果n个数为x1,x2,…,xn,
那么 (x1+x2+…+xn)。
【思考】
哪些量能刻画总体取值的特征?
提示:平均数、中位数、众数等,都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势。
2.总体集中趋势的估计
(1) 和 都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关。
平均数
中位数
(2)对一个 的频率分布直方图来说,如果直方图的形状是对称的,那么平均数和中位数应该大体上差不多;如果直方图在 ,那么平均数大于中位数;如果直方图在 ,那么平均数小于中位数。也就是说,和中位数相比,平均数总是在“长尾巴”那边。
单峰
右边“拖尾”
左边“拖尾”
(3)对 (如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用 。
数值型数据
众数
【思考】
平均数、中位数、众数对极端值的敏感性如何?
提示:因为样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变。但中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变。所以平均数比中位数更敏感。
众数只利用了出现次数最多的那个值的信息,只能传递数据中信息的很少一部分,对极端值不敏感。
3.在频率分布直方图中估计平均数、中位数、众数
(1)样本平均数可以用每个小矩形底边中点的 与
的乘积之和近似代替。
(2) 左边和右边的直方图的面积应该相等。
(3) 对应区间中点,作为众数的估计值。
横坐标
小矩形的面积
中位数
频数最大的组
【思考】
在频率分布直方图中得到的特征量平均数、中位数、众数是样本数据的特征量吗?
提示:在频率分布直方图中得到的特征量是样本数据特征量的估计值,近似值,不是精确值。在频率分布直方图中估计样本的特征量,进而用样本估计总体,估计总体的特征量。
4.总体离散程度的估计
(1)极差
一种简单的度量 的方法是极差。极差越大,波动范围越大。
数据离散程度
(2)平均距离
假设一组数据是x1,x2,…,xn,用 表示这组数据的平
均数。我们用 的绝对值作为“距离”,即|xi- |(i=1,2,…,n)作为xi到 的“距离” 可以得到这组数据x1,x2,…,xn到 的“平均距离”为
每个数据与平均数的差
(3)方差、标准差
绝对值改用平方来代替,即 = ,
我们称为这组数据的方差。取它的算术平方根,
即 ,我们称为这组数据的标准差。
(4)总体方差、总体标准差
如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为 ,则称S2= 为总体方差,S=
为总体标准差。
如果总体的N个变量值中,不同的值共有k(k≤N)个,不
妨记为Y1,Y2,…,Yk,其中Yi出现的频率为fi(i=1,2,
…,k),则总体方差为___________________。
(5)样本方差、样本标准差
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为 ,则称______________为样本方差,
s= 为样本标准差。
【思考】
(1)标准差与数据的离散程度有何关系?
提示:标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小。
(2)估计总体的离散程度有哪些方法?
提示:平均数,极差,平均距离,总体方差,总体标准差,样本方差,样本标准差等等。一般地,我们用样本标准差估计总体标准差。在随机抽样中,样本标准差依赖于样本的选取,具有随机性。
【素养小测】
1.思维辨析(对的打“√”,错的打“×”)
(1)中位数一定是数据按从小到大顺序排列后正中间的数。(  )
(2)利用频率分布直方图计算出的样本的平均数、中位数、众数是样本的真实数据。(  )
(3)标准差越大,样本数据越集中。(  )
提示:(1)×。也可能是中间两个数的平均数。
(2)×。是估计值,不是真实数据。
(3)×。标准差越大,样本数据越分散。
2.一组数据为1,1,3,3,则这组数据的众数和中位数分别是(  )          
A.1或3,2 B.3,2
C.1或3,1或3 D.3,3
【解析】选A。数据1,1,3,3中,1和3都出现了2次,出现的次数最多,则众数是1或3;最中间的两个数是1与3,则中位数是2。
3.甲、乙两名射击运动员,在一次连续10次的射击中,他们所射中环数的平均数一样,但方差不同,正确评价他们的水平是 (  )
A.因为他们所射中环数的平均数一样,所以他们水平相同
B.虽然射中环数的平均数一样,但方差较大的,潜力较大,更有发展前途
C.虽然射中环数的平均数一样,但方差较小的,发挥较稳定,更有发展前途
D.虽然射中环数的平均数一样,但方差较小的,发挥较不稳定,忽高忽低
【解析】选C。由平均数、方差的意义可知选C。
类型一 众数、平均数、中位数的计算
【典例】1.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60m;从南方抽取了200个男孩,平均身高为1.50m。由此可推断我国13岁男孩的平均身高为(  )
A.1.57m B.1.56m C.1.55m D.1.54m
2.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是(  )
A.85,85,85 B.87,85,86
C.87,85,85 D.87,85,90
【思维·引】
1.求出500个男孩总的身高,除以500可得答案。
2.分别找出甲,乙两组数据的中位数。
【解析】1.选B。因为从北方抽取了300个男孩,平均身高1.60m,从南方抽取了200个男孩,平均身高为1.50m,所以这500个13岁男孩的平均身高是
=1.56,所以由此可推断我国13岁男孩的平均身高为1.56m。
2.选C。从小到大列出所有数学成绩:75,80,85,85,85,85,90,90,95,100,观察知众数和中位数均为85,计算得平均数为87。
【类题·通】
平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算。
提醒:如果样本平均数大于样本中位数,说明数据中存在较大的极端值。
【习练·破】
已知一组数据按从小到大排列为-8,-1,4,x,10,13且这组数的中位数是7,那么这组数据中的众数是(  )
A.7 B.6 C.4 D.10
【解析】选D。因为共有六个数,因此,当按从小到大的顺序排列后,中位数等于最中间两数的平均数,因此,x=10。所以众数为10。
【加练·固】
一个样本数据按从小到大的顺序排列为:13,14,19,x,23,27,28,31,中位数为22,则x=________。
【解析】由题意知 =22,则x=21。
答案:21
类型二 总体集中趋势的估计
【典例】1.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05。
(1)估计高一参赛学生的成绩的众数、中位数。
(2)估计高一参赛学生的平均成绩。
2.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频率分布表。
A地区用户满意度评分的频率分布直方图
B地区用户满意度评分的频率分布表
满意度 评分分组 [50,60) [60,70) [70,80) [80,90) [90,100]
频数 2 8 14 10 6
(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)。
B地区用户满意度评分的频率分布直方图
(2)根据用户满意度评分,将用户和满意度分为三个等级:
估计哪个地区用户的满意度等级为不满意的概率大?说明理由。
满意度评分 低于70分 70分到89分 不低于90分
满意度等级 不满意 满意 非常满意
【思维·引】
1.分析频率分布直方图和众数、中位数、平均数概念求解。
2.结合题中数据作出B地区的频率分布直方图再求解。
【解析】
1.(1)由图可知众数为65,因为第一个小矩形
的面积为0.3,所以设中位数为60+x,则0.3+x×0.04=0.5,得x=5,所以估计中位数为60+5=65。
(2)由已知,平均成绩为
55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,所以估计平均成绩为67。
2.(1)作出频率分布直方图如图:
通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散。
(2)A地区用户的满意度等级为不满意的概率大。理由:
记CA表示事件:“A地区用户的满意度等级为不满意”;
CB表示事件:“B地区用户的满意度等级为不满意”。
由直方图得P(CA)的估计值为
(0.01+0.02+0.03)×10=0.6,
P(CB)的估计值为(0.005+0.02)×10=0.25。
所以A地区用户的满意度等级为不满意的概率大。
【内化·悟】
如何用频率分布直方图估计众数、中位数、平均数?
提示:(1)众数:取最高小长方形底边中点的横坐标作为众数。
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标作为中位数。
(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。
【类题·通】
1.频率分布直方图的性质
(1)小长方形的面积=组距× =频率。
(2)各小长方形的面积之和等于1。
(3)小长方形的高= ,所有小长方形的高的和为 。
2.要理解并记准频率分布直方图与众数、中位数及平均数的关系。
【习练·破】
某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示。
(1)求这次测试数学成绩的众数。
(2)求这次测试数学成绩的中位数。
(3)求这次测试数学成绩的平均分。
【解析】(1)由图知众数为 =75。
(2)由图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,所以中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3。
(3)由图知这次数学成绩的平均分为:
×0.005×10+ ×0.015×10+ ×0.02
×10+ ×0.03×10+ ×0.025×10+
×0.005×10=72。
【加练·固】
某市对市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费。
【解析】(1)如题图所示,用水量在[0.5,3)的频率的和为:(0.2+0.3+0.4+0.5+0.3)×0.5=0.85。
用水量小于等于3立方米的频率为0.85,又w为整数,
故为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3。
(2)当w=3时,该市居民该月的人均水费估计为:
(0.2×1+0.3×1.5+0.4×2+0.5×2.5+0.3×3)×0.5×
4+0.1×0.5×3×3×4+[0.1×(3.5-3)+0.1×(4-3)+
0.1×(4.5-3)]×0.5×10=7.2+1.8+1.5=10.5(元)。
即该市居民该月的人均水费估计为10.5元。
类型三 总体离散程度的估计
【典例】1.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田。这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是(  )
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
2.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为 ,方差为s2,则 (  )          
A. =4,s2<2 B. =4,s2>2
C. >4,s2<2 D. >4,s2>2
3.从甲、乙两种玉米的苗中各抽10株,分别测它们的株高如下:(单位:cm)
甲:25 41 40 37 22 14 19 39 21 42;
乙:27 16 44 27 44 16 40 40 16 40。
问:(1)哪种玉米的苗长得高?
(2)哪种玉米的苗长得齐?
【思维·引】
1.根据平均数、标准差及中位数的概念判断。
2.结合平均数、方差的计算公式计算。
3.用平均数确定玉米苗的高度,用标准差确定哪种玉米的苗长得齐。
【解析】1.选B。评估这种农作物亩产量稳定程度的指
标是标准差。
2.选A。因为某7个数的平均数为4,所以这7个数的和为
4×7=28,因为加入一个新数据4,所以 =4。
又因为这7个数的方差为2,且加入一个新数据4,
所以这8个数的方差s2= <2。
3.(1) (25+41+40+37+22+14+19+39+21+42)=
×300=30(cm),
(27+16+44+27+44+16+40+40+16+40)=
×310=31(cm)。
所以 < ,即乙种玉米的苗长得高。
(2) [(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=
(25+121+100+49+64+256+121+81+81+144)=
×1 042=104.2(cm2),
[2×(27-31)2+3×(16-31)2+2×(44-31)2+3×
(40-31)2]= ×1 288=128.8(cm2)。
所以 < ,即甲种玉米的苗长得齐。
【类题·通】
平均数及方差的作用
(1)平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定。
(2)在随机抽样中,往往用样本的离散程度估计总体的离散程度。
【习练·破】
甲、乙两机床同时加工直径为100cm的零件,为检验质
量,各从中抽取6件测量,数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差。
(2)根据计算结果判断哪台机床加工零件的质量更稳定。
【解析】
(1) (99+100+98+100+100+103)=100,
(99+100+102+99+100+100)=100。
[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]= , [(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1。
(2)两台机床所加工零件的直径的平均值相同,
又 > ,所以乙机床加工零件的质量更稳定。
【加练·固】
甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如表(单位:环):
如果甲、乙两人中只有1人入选,则入选的最佳人选应是________。
甲 10 8 9 9 9
乙 10 10 7 9 9
【解析】因为 =9, = ×[(9-10)2+(9-8)2+
(9-9)2+(9-9)2+(9-9)2]= , ×[(9-10)2+
(9-10)2+(9-7)2+(9-9)2+(9-9)2]= ,
所以甲更稳定。
答案:甲
谢 谢(共113张PPT)
随机抽样
9.1.1 简单随机抽样 
1.统计的相关概念
(1)普查
像人口普查这样,对每一个调查对象都进行调查的方法,称为全面调查,又称普查。
(2)总体、个体
在一个调查中,我们把调查对象的全体称为总体。组成总体的每一个调查对象称为个体。为了强调调查目的,也可以把调查对象的某些指标的全体作为总体,每一个调查对象的相应指标作为个体。
(3)抽样调查
根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为 。
抽样调查
(4)样本、样本量
我们把从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本量。
【思考】
抽样调查有什么优点?
提示:相对全面调查而言,抽样调查由于只抽取一部分个体进行调查,因此具有花费少、效率高的特点。在有些调查中,抽样调查则具有不可替代的作用。
2.简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n【思考】
在抽取样本时,“逐个不放回地随机抽取n个个体”,与“一次性批量随机抽取n个个体”等价吗?
提示:从总体中,逐个不放回地随机抽取n个个体作为样本,一次性批量随机抽取n个个体作为样本,两种方法是等价的。
3.简单随机抽样的方法
(1)抽签法:
把总体中的N个个体编号,把编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,将这些小纸片放在一个不透明的盒里,充分搅拌,最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需的个数。
(2)随机数法:
用随机数工具产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本。重复上述过程,直到抽足样本所需的个数。
①用随机试验生成随机数;
②用信息技术生成随机数;
③用计算器生成随机数;
④用电子表格软件生成随机数;
⑤用R统计软件生成随机数。
【思考】
(1)最常用的简单随机抽样方法有哪些?
提示:抽签法和随机数法。
(2)你认为抽签法有什么优点和缺点?
提示:抽签法的优点是简单易行,当总体中个体数不多时较为方便,缺点是当总体中个体数较多时不宜采用。
4.总体均值
一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称
为总体均值,又称总体平均数。
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式
5.样本均值
如果从总体中抽取一个容量为n的样本,它们的变量值
分别为y1,y2,…,yn,则称
为 ,又称样本平均数。
样本均值
【思考】
总体均值与样本均值有何区别与联系?
提示:(1)区别:当总体中个体较多时,总体均值不易计算,样本均值比较方便计算。总体均值是一个确定的数,样本均值具有随机性。
(2)联系:在简单随机抽样中,我们常用样本均值估计总体均值。
【素养小测】
1.思维辨析(对的打“√”,错的打“×”)
(1)在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取有关,第一次抽到的可能性最大。(  )
(2)抽签法中,先抽的人抽中的可能性大。 (  )
(3)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况。(  )
(4)在使用随机数法时,各个个体的编号位数要相同。(  )
提示:(1)×。在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取无关,每一次抽到的可能性相同。
(2)×。抽签法中,每个人抽中的可能性相同。
(3)√。
(4)√。
2.某重点中学在进行了一次模拟考试,为了解全年级
1000名学生的考试成绩,从中随机抽取了100名学生的成绩单,下面说法不正确的是(  )
A.1000名学生是总体
B.每个学生是个体
C.1000名学生的成绩是一个个体
D.样本量是100
【解析】选C。1000名学生或1000名学生的成绩是统计中的总体,每个学生或每个学生的成绩是个体,被抽取的100名学生的成绩是一个样本,其样本量是100。
3.一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为________。
【解析】概率为
答案:
类型一 简单随机抽样的概念
【典例】下列抽样方法是简单随机抽样的有________。
(1)从无限多个个体中抽取100个个体作为样本。
(2)从20个零件中一次性抽取3个进行质量检验。
(3)从班上50名同学中选数学成绩最好的2名同学参加数学竞赛。
(4)某班45名同学,指定个子最高的5名同学参加学校组织的某项活动。
(5)中国福利彩票30选7,得到7个彩票中奖号码。
【思维·引】按简单随机抽样的概念判断。
【解析】(1)不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的。
(2)是简单随机抽样,因为一次性抽取3个个体,等价于逐个抽取个体3次。
(3)不是简单随机抽样,因为每个个体被抽取的可能性不相等。
(4)不是简单随机抽样,不符合“等可能性”,因为5名同学是指定的,而不是随机抽取的。
(5)是,它属于简单随机抽样中的随机数法。
答案:(2)(5)
【内化·悟】
判断简单随机抽样的关键是什么?
提示:(1)样本总体个数是否有限;
(2)抽取n个个体作为样本;
(3)每个个体入样的可能性均为 。
【类题·通】
1.放回简单随机抽样的特点
(1)被抽取的样本的总体个数N是有限的。
(2)逐个抽取n个个体作为样本。
(3)抽取是放回的。
(4)每个个体入样的可能性均为 。
2.不放回简单随机抽样的特点
(1)被抽取的样本的总体个数N是有限的。
(2)逐个抽取n个,或一次性抽取n个个体作为样本。
(3)抽取是不放回的。
(4)每个个体入样的可能性均为 。
【习练·破】
下列抽样中是不放回简单随机抽样的是________。
①从100个号签中一次取出5个作为样本
②某连队从200名党员官兵中,挑选出50名最优秀的官兵参加救灾工作
③一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地逐个抽出6个号签
④从某班56名(30名男生,26名女生)学生中随机抽取2名男生,2名女生参加乒乓球混双比赛
⑤将一枚质地均匀的骰子掷两次,分别记录向上的点数
【解析】①是不放回简单随机抽样;②④不满足等可能抽样,所以不是简单随机抽样;③是不放回简单随机抽样;⑤是放回简单随机抽样。
答案:①③
类型二 抽签法的应用
【典例】学校举办元旦晚会,需要从每班选10名男生,8名女生参加合唱节目,某班有男生32名,女生28名,试用抽签法确定该班参加合唱的同学。
【思维·引】采用抽签法设计抽样方法,一定按步骤进行,即:编号、制签、搅匀、抽签、确定样本。
注意抽签法的特点:逐个不放回地抽取。
【解析】第一步,将32名男生从00到31进行编号;
第二步,用相同的纸条制成32个号签,在每个号签上写上这些编号;
第三步,将写好的号签放在一个容器内摇匀,不放回地逐个从中抽出10个号签;
第四步,抽到的相应编号的男生参加合唱;
第五步,用相同的办法从28名女生中选出8名,则此8名女生参加合唱。
【内化·悟】
抽签法应用的关键是什么?
提示:将总体中所有个体编号,将号签搅拌均匀。
【类题·通】
抽签法的一般步骤
【习练·破】
下列抽样中,用抽签法方便的是(  )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每厂各一箱,每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
【解析】选B。根据抽签法的特点可知,B选项用抽签法比较方便。
【加练·固】
某卫生单位为了支援抗震救灾,要在18名志愿者中选取6人组成医疗小组去参加救治工作,请用抽签法设计抽样方案。
【解析】方案如下:
第一步,将18名志愿者编号,号码为01,02,03,…,18。
第二步,将号码分别写在相同的纸条上,揉成团,制成号签。
第三步,将得到的号签放到一个不透明的盒子中,充分搅匀。
第四步,从盒子中依次取出6个号签,并记录上面的编号。
第五步,与所得号码对应的志愿者就是医疗小组成员。
类型三 随机数法的应用
【典例】设某校共有100名教师,为了支援西部教育事业,现要从中随机抽出12名教师组成暑期西部讲师团,请写出利用随机数法抽取该样本的步骤。
【思维·引】用随机试验生成随机数,方便易行。条件允许也可以用信息技术生成随机数。
【解析】步骤如下:第一步,将100名教师进行编号:00,01,02,…,99。
第二步,准备10个大小、质地一样的小球,小球上分别写上数字0,1,2,…,9,把它们放入一个不透明的袋子中。
第三步,从袋子中有放回摸取2次,每次摸取前充分搅拌,并把第1,2次摸到球的数字分别作为十位、个位,这样就生成了一个两位随机数。如果这个数在00~99之间,就记录下来,否则舍弃,如果有重复舍去,直到得到12个不同编号。
第四步,与这12个编号对应的教师组成样本。
【内化·悟】
随机数法的关键是什么?
提示:将样本编号,生成随机数,抽取样本。
【类题·通】
随机数法解题步骤
第一步,编号。
第二步,生成随机数。
第三步,记录样本编号。
第四步,抽取样本。
【习练·破】
要从高一年级全体学生450人中随机抽出20人作为校运动会志愿者,请用随机数法抽出人选,写出抽取过程。
【解析】第一步,先将450人编号,可以编为000,001,002,…,449;
第二步,准备10个大小、质地一样的小球,小球上分别写上数字0,1,2,…,9,把它们放入一个不透明的袋子中。
第三步,从袋子中有放回摸取3次,每次摸取前充分搅拌,并把第1,2,3次摸到球的数字分别作为百位、十位、个位,这样就生成了一个三位随机数。如果这个数在000~449之间,就记录下来,否则舍弃,如果有重复舍去,直到得到20个不同编号。
第四步,与这20个编号对应的学生组成样本。
【加练·固】
现有一批零件,其编号为600,601,602,…,999。利用原有的编号从中抽取一个容量为10的样本进行质量检查,若用随机数法,怎样设计方案?
【解析】第一步,利用原有的编号。
第二步,准备10个大小、质地一样的小球,小球上分别写上数字0,1,2,…,9,把它们放入一个不透明的袋子中。
第三步,从袋子中有放回摸取3次,每次摸取前充分搅拌,并把第1、2、3次摸到球的数字分别作为百位、十位、个位,这样就生成了一个三位随机数。如果这个数在600~999之间,就记录下来,否则舍弃,如果有重复舍去,直到得到10个不同编号。
第四步,与这10个编号对应的零件组成样本。
9.1.2 分层随机抽样
分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为
,每一个子总体称为 。
分层随机抽样

在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配。在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数。
【思考】
(1)哪种情况下适合选用分层随机抽样?
提示:在个体之间差异较大的情形下,只要选取的分层变量合适,使得各层间差异明显、层内差异不大,分层随机抽样的效果一般会好于简单随机抽样。
(2)简单随机抽样与分层随机抽样有何异同?
提示:
简单随机抽样 分层随机抽样
方法 要点 随机→“搅拌均匀”→抽取 分层→比例→抽取
共同 点 ①抽样过程中每个个体被抽到的机会均相等; ②均为不放回抽样 简单随机抽样 分层随机抽样
不同 点 从总体中逐个随机抽取 将总体分成不交叉的若干层,各层中按比例抽取
相互 联系 各层的抽样可采用简单随机抽样
适用 范围 总体中的个体总数较少 总体由差异明显的几个部分组成
【素养小测】
1.思维辨析(对的打“√”,错的打“×”)
(1)在统计实践中选择哪种抽样方法关键是看总体容量的大小。(  )
(2)分层随机抽样有时也需要剔除若干个个体,对这些个体来说是不公平的。(  )
(3)从全班50名同学中抽取5人调查作业完成情况适合用分层随机抽样。(  )
提示:(1)×。在统计实践中选择哪种抽样方法除看总体和样本量大小外,还要依据总体的构成情况。
(2)×。根据抽样的意义,对每个个体都是公平的。
(3)×。适合用简单随机抽样。
2.某集团有老年职工270人,中年职工540人,青年职工810人。为了更好地调查他们的健康情况,需从所有职工中抽取一个容量为36的样本,应采用的抽样方法是________________。
【解析】由于健康情况与年龄密切相关,不同年龄的人群其健康情况会有明显的差异,因此采用分层随机抽样的方法较合适。
答案:分层随机抽样
3.简单随机抽样、分层随机抽样之间的共同点是
________。(填序号)
①都是从总体中逐个抽取。
②将总体分成几部分,按事先确定的规则在各部分抽取。
③抽样过程中每个个体被抽到的可能性是相等的。
④将总体分成几层,然后分层按比例抽取。
答案:③
类型一 分层随机抽样的概念
【典例】1.下列问题中,最适合用分层随机抽样方法抽样的是(  )
A.某电影院有32排座位,每排有40个座位,座位号是1~40。有一次报告会坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈
B.从10台冰箱中抽出3台进行质量检查
C.某乡农田有山地8000亩,丘陵12000亩,平地24000亩,洼地4000亩,现抽取农田480亩估计全乡农田平均产量
D.从50个零件中抽取5个做质量检验
2.分层随机抽样又称为类型抽样,即将相似的个体归入一类(层),然后每类(层)各抽若干个个体构成样本,所以分层随机抽样为保证每个个体等可能入样,必须进行(  )
A.每层内等可能抽样
B.每层内不等可能抽样
C.所有层用同一抽样比
D.所有层抽同样多的样本量
【思维·引】根据分层随机抽样的特点和适用情况进行判断即可。
【解析】1.选C。A的总体容量较大,且个体的差异性不明显;
B的总体容量较小,用简单随机抽样法比较方便;
C的总体容量较大,且各类田地的产量差别很大,宜采用分层随机抽样方法;D与B类似。
2.选C。由分层随机抽样的定义和特点可知,所有层用同一个抽样比,等可能抽样。
【内化·悟】
辨别分层随机抽样问题的关键是什么?
提示:总体可以分层且层与层之间有明显区别。
【类题·通】分层随机抽样的前提和遵循的两条原则
(1)前提:分层随机抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取。
(2)遵循的两条原则:
①每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
②每层样本量与每层个体数量的比等于抽样比。
提醒:要明确分层随机抽样的前提,是用来判断是否是分层随机抽样的依据。
【习练·破】
某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是________。
【解析】了解学生的健康情况,男、女生抽取比例相同,因此应用了分层随机抽样法。
答案:分层随机抽样
【加练·固】
某书法社团有男生30名,女生20名,从中抽取一个5人的样本,恰好抽到了2名男生和3名女生。
①该抽样可能是随机抽样;
②该抽样不可能是分层随机抽样;
③男生被抽到的概率大于女生被抽到的概率。
其中说法正确的为(  )
A.①②   B.②③   C.①   D.②
【解析】选A。该抽样可能是随机抽样,故①正确;若是分层随机抽样,则抽到的是3名男生、2名女生,所以该抽样不可能是分层随机抽样,故②正确;该抽样男生被抽到的概率为 ,女生被抽到的概率为 ,女生被抽到的概率大于男生被抽到概率,故③错误。
类型二 分层随机抽样的应用
角度1 用样本平均数估计总体平均数
【典例】假设某公司的33名职工的月工资(单位:元)如表:
职务 董事长 副董事长 董事 总经理 经理 管理员 职员
人数 1 1 2 1 5 3 20
工资 5500 5000 3500 3000 2500 2000 1500
样本中职工月工资的平均数是________,估计该公司职工月工资的平均数是________。(精确到元)
【思维·引】求解样本中职工月工资的平均数。
【解析】样本中职工月工资平均数是 ×(5500+
5000+3500×2+3000+2500×5+2000×3+1500×20)
≈2091,估计该公司职工月工资的平均数是2091。
答案:2091 2091
【素养·探】
★用样本平均数估计总体平均数,体现了数据分析的核心素养。
某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4。
则平均命中环数为________;估计该学员射击一次命中环数为________。
【解析】
用样本估计总体,估计环数最可能为7。
答案:7 7
角度2 比例分配的应用
【典例】1.某校老年、中年和青年教师的人数如表所示,采用分层随机抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为(  )
A.90 B.100 C.180 D.300
类别 人数
老年教师 900
中年教师 1800
青年教师 1600
合计 4300
2.某高中共有学生1000名,其中高一年级共有学生380人,高二年级男生有180人。高二年级女生占全校学生总数的19%。现采用分层随机抽样(按年级分层)在全校抽取100人,则应在高三年级中抽取的人数等于________。
【思维·引】
1.按各层的抽样比例相等,列出等式求解即可。
2.先算出高二年级女生人数,再算出高三年级人数,最后根据各层的抽样比例相等,列出等式求解。
【解析】1.选C。设该样本中的老年教师人数为x,由已
知及分层随机抽样的特点得 ,故x=180。
2.由已知,高二年级女生有1000×0.19=190(人),则高
二年级共有学生180+190=370(人),所以高三年级共有学生1000-370-380=250(人),则采用分层随机抽样(按年级分层)在全校抽取100人,应在高三年级中抽取的人数为 ×100=25。
答案:25
【内化·悟】
求解分层随机抽样问题的关键是什么?
提示:分析总体分成的各个层以及各个层中抽取的个体数量。
【类题·通】
分层随机抽样的操作步骤
第一步,计算样本量与总体量之比。
第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数。
第三步,用简单随机抽样在各层中抽取相应数量的个体。
第四步,将各层抽取的个体合在一起,就得到所取样本。
【习练·破】
1.(2019·全国卷Ⅲ)《西游记》《三国演义》《水浒
传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著。某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为(  )
A.0.5 B.0.6 C.0.7 D.0.8
【解析】选C。由题意知阅读过《红楼梦》而没有阅读过《西游记》的学生人数为80-60=20,所以阅读过
《西游记》的学生人数为90-20=70,故所求的估计值
为 =0.7。
【加练·固】
一个总体分为A,B,C三层,其个体数之比为5∶3∶2。若用分层随机抽样方法抽取容量为100的样本,则应从C中抽取________个个体。
【解析】因为A,B,C三层个体数之比为5∶3∶2,又总体中每个个体被抽到的概率相等,所以用分层随机抽样应从C中抽取100× =20。
答案:20
2.已知某单位有职工120人,其中男职工90人,现采用分层随机抽样的方法(按男、女分层)抽取一个样本,若已知样本中有27名男职工,则样本量为________。
【解析】分层随机抽样中抽样比一定相同,设样本量为
n,由题意得, ,解得n=36。
答案:36
类型三 抽样方法的综合应用
【典例】在下列问题中,各采用什么抽样方法抽取样本较为合适?
(1)从8台彩电中抽取2台进行质量检验。
(2)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点。公司为了调查产品销售的情况,需从这600个销售点中抽取一个样本量为100的样本。
【思维·引】总体容量较小,宜采用抽签法;总体容量较大且总体中的个体无明显差异,而样本量较小,宜用随机数法。总体是由差异明显的几个部分组成,宜用分层随机抽样法。
【解析】(1)总体容量为8,样本量为2,因此选择抽签法进行样本的抽取。
(2)总体由差异明显的四部分组成,因此可采用分层随机抽样法。
【内化·悟】
抽样方法选取的关键是什么?
提示:根据总体容量大小,个体有无明显差异判断抽样方法。
【类题·通】
抽样方法的选取
(1)若总体由差异明显的几个层次组成,则选用分层随机抽样。
(2)若总体没有差异明显的层次,则考虑采用简单随机抽样。
【习练·破】
某企业共有3200名职工,其中中、青、老年职工的比例为5∶3∶2。
(1)若从所有职工中抽取一个容量为400的样本,应采用哪种抽样方法更合理?中、青、老年职工应分别抽取多少人?
(2)若从青年职工中抽取120人,试求所抽取的样本量。
【解析】(1)由于中、青、老年职工有明显的差异,
采用分层随机抽样更合理。
按照比例抽取中、青、老年职工的人数分别为:
×400=200, ×400=120, ×400=80,
因此应抽取的中、青、老年职工分别为200人、120人、
80人。
(2)由已知得青年职工共有 ×3 200=960(人)。
设抽取的样本量为n,则有 ×960=120,
所以n=400,因此所抽取的样本量为400。
【加练·固】
在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本。
方法一:采用简单随机抽样的方法,将零件编号为00,01,…,99,用抽签法抽取20个;
方法二:采用分层随机抽样的方法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个。
对于上述问题,下列说法中正确的有________。(填序号)
①不论采用哪种抽样方法,这100个零件中每个零件被
抽到的概率都是 ;
②采用上述两种抽样方法,这100个零件中每个零件被
抽到的概率各不相同;
③在上述两种抽样方法中,方法二抽到的样本比方法一抽到的样本更能反映总体的特征。
【解析】根据抽样方法的定义知,两种方法都是等可能抽样。对于明显分层的总体,方法二抽到的样本更能准确地反映总体特征,故①③正确。
答案:①③
谢 谢