2020_2021学年高中数学第二章统计课件(6份打包)新人教A版必修3

文档属性

名称 2020_2021学年高中数学第二章统计课件(6份打包)新人教A版必修3
格式 zip
文件大小 5.8MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2021-03-12 17:27:10

文档简介

(共57张PPT)
2.3 变量间的相关关系
2.3.1 变量之间的相关关系
2.3.2 两个变量的线性相关
必备知识·自主学习
1.变量间的相关关系
(1)相关关系
如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的随机性,那么这两个变量之间的关系叫做相关关系.
导思
1.什么是相关关系?
2.如何求线性回归方程?
(2)散点图
将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中得到的图形叫做散点图.
(3)正相关与负相关
正相关:散点图中的点散布在从左下角到右上角的区域.
负相关:散点图中的点散布在从左上角到右下角的区域.
【思考】
(1)与函数关系比较相关关系有何特征?
提示:相关关系带有随机性,不具备函数关系的确定性.
(2)你能举例说明你对正相关与负相关的理解吗?
提示:随自变量的变大(或变小),因变量也随之变大(或变小),这种带有随机性的相关关系,我们称为正相关.例如,人年龄由小变大时,体内脂肪含量也由少变多.
随自变量的变大(或变小),因变量却随之变小(或变大),这种带有随机性的相关关系,我们称为负相关.例如,汽车越重,每消耗1
L汽油所行驶的平均路程就越短.
2.回归直线方程
(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称
这两个变量之间具有线性相关关系,这条直线叫做_________.
(2)回归方程:回归直线的方程,简称回归方程.
(3)回归方程的推导过程:
①假设已经得到两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),
…,(xn,yn).
回归直线
②设所求回归方程为
,其中

是待定参数.
③由最小二乘法得
其中:
是回归方程的斜率,
是截距.
【思考】
(1)具有相关关系的两个变量之间一定存在回归直线吗?
提示:具有线性相关关系的两个变量才有回归直线.
(2)对于同一总体中的数据,利用最小二乘法求出的回归方程是确定不变的吗?
提示:同一总体中,不同的样本数据对应不同的回归方程,同一样本的回归方程是确定的.
【基础小测】
1.辨析记忆(对的打“√”,错的打“×”)
(1)两个变量要么具有确定的函数关系,要么具有线性相关关系.
(  )
(2)回归直线一定至少过散点图中的一个点.
(  )
(3)由回归直线方程求出的
值都是准确值.
(  )
(4)选取一组数据中的部分点得到的回归方程与由整组数据得到的回归方程是同一个方程.
(  )
【提示】(1)×.两个变量可能具有非线性相关关系,也可能没有相关关系.
(2)×.回归直线可能不过散点图中的任何一个点.
(3)×.由回归直线方程求出的
值是预测值.
(4)×.不同样本数据所对应的回归方程不同.
2.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归
直线方程,分别得到以下四个结论:
①y与x负相关且
=2.347x-6.423;
②y与x负相关且
=-3.476x+5.648;
③y与x正相关且
=5.437x+8.493;
④y与x正相关且
=-4.326x-4.578.
其中一定不正确的结论的序号是
(  )      
      
      
A.①②
B.②③
C.③④
D.①④
【解析】选D.①
=2.347x-6.423的斜率大于0,y与x正相关;

=-3.476x+5.648的斜率小于0,y与x负相关;

=5.437x+8.493的斜率大于0,y与x正相关;

=-4.326x-4.578的斜率小于0,y与x负相关.
3.(教材二次开发:例题改编)过(3,10),(7,20),(11,24)三点的回归方程

(  )
A.
=1.75+5.75x
B.
=-1.75+5.75x
C.
=5.75+1.75x
D.
=5.75-1.75x
【解析】选C.
=7,
=18,回归方程一定过点(

),代入A,B,C,D选
项可知.
关键能力·合作学习
类型一 相关关系及其判断(数学抽象、直观想象)
【题组训练】
1.下列变量之间的关系不是相关关系的是
(  )
A.二次函数y=ax2+bx+c中,a,c是已知常数,取b为自变量,因变量是判别式Δ=b2-4ac
B.光照时间和果树亩产量
C.降雪量和交通事故发生率
D.每亩田施肥量和粮食亩产量
2.观察下列关于两个变量x和y的三个散点图,它们从左到右对应的关系依次

(  )
A.正相关、负相关、不相关
B.负相关、不相关、正相关
C.负相关、正相关、不相关
D.正相关、不相关、负相关
3.以下是在某地搜集到的不同楼盘房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:
房屋面积x/m2
115
110
80
135
105
销售价格y/万元
49.6
43.2
38.8
58.4
44
(1)画出数据对应的散点图;
(2)判断房屋的销售价格和房屋面积之间是否具有相关关系,如果有相关关系,是正相关还是负相关?
【解析】1.选A.在A中,若b确定,则a,b,c都是常数,Δ=b2-4ac也就唯一确定了,因此,这两者之间是确定性的函数关系;一般来说,光照时间越长,果树亩产量越高;降雪量越大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所以B,C,D是相关关系.
2.选D.由第一个图可知整体呈上升趋势,x与y正相关,第二个图中的点杂乱无章,不具有相关性,第三个图整体呈下降趋势,x与y负相关.
3.(1)数据对应的散点图如图所示.
(2)通过数据对应的散点图可以判断,房屋的销售价格和房屋面积之间具有相关关系,并且是正相关.
【解题策略】
1.相关关系是两个变量间一种不完全确定的关系.它不一定是因果关系,也可能是伴随关系.
2.判断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果图上发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
【补偿训练】
某个男孩的年龄与身高的统计数据如表所示.
年龄x(岁)
1
2
3
4
5
6
身高y(cm)
78
87
98
108
115
120
判断y与x是否具有线性相关关系.
【解析】散点图如图所示.
由图知所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.
类型二 求回归直线方程(数学运算、数学建模)
【典例】某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:
(1)画出散点图;
(2)求回归方程.
x
2
4
5
6
8
y
30
40
60
50
70
【解题策略】
求回归直线方程的一般步骤
(1)收集样本数据,设为(xi,yi)(i=1,2,…,n).
(2)作出散点图,确定x,y具有线性相关关系.
(3)把数据制成表格.
(4)计算



(5)代入公式计算
,公式为
(6)写出回归直线方程
=
x+
.
【跟踪训练】
已知变量x,y有如下对应数据:
(1)作出散点图.
(2)用最小二乘法求关于x,y的回归直线方程.
x
1
2
3
4
y
1
3
4
5
【解析】(1)散点图如图所示.
(2)
=1+6+12+20=39.
=1+4+9+16=30,
所以
=
x为所求的回归直线方程.
类型三 回归直线方程的应用(数学运算,数学建模)
 角度1 利用回归直线方程求值?
【典例】对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,
…,8),其线性回归方程是
=
x+
,且x1+x2+x3+…+x8=2(y1+y2+y3+
…+y8)=6,则实数
的值是
(  )
【思路导引】利用回归直线方程必过样本点的中心求解.
【解析】选B.依题意可知样本点的中心为


=
×
+
,解得
=
.
【拓展延伸】
相关关系的强弱
(1)若相应于变量x的取值xi,变量y的观测值为yi(1≤i≤n),称r=

为变量x与y的相关系数,通常用r来衡量x,
y之间的线性关系的强弱.
(2)r的范围为-1≤r≤1,|r|越接近于1,x与y的相关程度越大,|r|越接近于0,二者的相关程度越小,当|r|=1时,所有数据点都在一条直线上.
当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关.
【拓展训练】
变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则
(  )      
      
      
A.r2B.0C.r2<0D.r2=r1
【解析】选C.对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0.
 角度2 利用回归直线方程对总体进行估计?
【典例】下表提供了某厂节能降耗技术改进后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图.
(2)请根据上表提供的数据,用最小二乘法求出回归方程
=
.
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
【思路导引】(1)以产量为横坐标,以生产能耗对应的测量值为纵坐标,
在平面直角坐标系内画散点图.
(2)应用计算公式求得线性相关系数

的值.
(3)实际上就是求当x=100时,对应的
的值.
【解析】(1)散点图,如图所示:
(2)由题意得
=3×2.5+4×3+5×4+6×4.5=66.5,
=4.5,
=3.5,
=32+42+52+62=86,
所以
=0.7,
=
-
=3.5-0.7×4.5=0.35,
故线性回归方程为
=0.7x+0.35.
(3)根据回归方程的预测,现在生产100吨产品消耗的标准煤为0.7×100+0.35=70.35(吨),
故能耗减少了90-70.35=19.65(吨标准煤).
【解题策略】
(1)只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.
(2)根据回归直线进行预测时估计值不是实际值,两者会有一定的误差.
【题组训练】
已知某产品连续4个月的广告费用为xi(i=1,2,3,4)千元,销售额为yi(i=1,
2,3,4)万元,经过对这些数据的处理,得到如下数据信息:①x1+x2+x3+x4
=18,y1+y2+y3+y4=14;②广告费用x和销售额y之间具有较强的线性相关关系;
③回归直线方程
=
x+
中的
=0.8(用最小二乘法求得),那么,当广告费
用为6千元时,可预测销售额约为
(  )
A.3.5万元
B.4.7万元
C.4.9万元
D.6.5万元
【解析】选B.依题意得
=4.5,
=3.5,
因为
=
-

所以
=3.5-0.8×4.5=-0.1.
当x=6时,
=0.8×6-0.1=4.7.
课堂检测·素养达标
1.下列各图中所示的两个变量具有线性相关关系的是
(  )
      
      
      
A.(1)(2)
B.(1)(3)
C.(2)(3)
D.(2)
【解析】选D.(1)为函数关系;(2)为线性相关关系.(3)为非线性相关关系.
(4)中,因为点分布得比较分散,没有规律,所以两变量之间无相关关系.
2.有人收集了春节期间平均气温x与某取暖商品销售额y的有关数据如表:
平均气温/℃
-2
-3
-5
-6
销售额/万元
20
23
27
30
则该商品销售额与平均气温有
(  )
A.确定性关系
B.正相关关系
C.负相关关系
D.函数关系
【解析】选C.由表中数据可知:y随x的减小而增大,是负相关关系.
3.已知一个回归直线方程为
=1.5x+45,x∈{1,7,5,13,19},

=______.?
【解析】因为
=
(1+7+5+13+19)=9,
且回归直线过样本点的中心(

),
所以
=1.5×9+45=58.5.
答案:58.5
4.(教材二次开发:练习改编)小学生身高y与年龄x之间的线性回归直线方程为
=8.8x+65,预测一名10岁的小学生的身高为______.?
【解析】当x=10时,
=8.8×10+65=153.
答案:153
5.如图是我国2013年至2019年生活垃圾无害化处理量(单位:亿吨)的折线图:
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2021年我国生活垃圾无
害化处理量.
参考数据:
参考公式:相关系数r=
回归方程
=
+
t中斜率和截距的最小二乘估计公式分别为
【解析】(1)由折线图中数据和附注中参考数据得
因为y与t的相关系数近似于0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.
(2)由
≈1.331及(1)得
≈0.103.
=
-
≈1.331-0.103×4≈0.92.所以y关于t的回归方程为
=0.92+0.10t.将2021年对应的t=9代入回归方程得
=0.92+0.10×9
=1.82.
所以预测2021年我国生活垃圾无害化处理量约为1.82亿吨.(共53张PPT)
2.2.2 用样本的数字特征
估计总体的数字特征
必备知识·自主学习
1.众数、中位数、平均数
(1)众数:在一组数据中,出现次数最多的数叫做_____.
(2)中位数:把一组数据按_____________________的顺序排列,处在_____位
置的数(或中间两个数的_______).
(3)平均数:如果n个数为x1,x2,…,xn,那么
=________________.
导思
1.如何定义平均数、中位数、众数和方差的概念?
2.如何计算一组数据的平均数、中位数、众数和方差?
众数
从小到大(或从大到小)
中间
平均数
【思考】
(1)在一组数据中,一定存在众数且众数只有一个,对吗?
提示:不对.如果有两个或两个以上数据出现的最多且出现的次数相等,那么这些数据都是这组数据的众数;如果一组数据中,所有数据出现的次数都相等,那么认为这组数据没有众数.
(2)一组数据的中位数是唯一的吗?
提示:是的.
(3)当一组数据中的某个数据变化时,平均数会随之变化吗?
提示:由平均数的计算公式可以发现,任何一个数据发生变化,都会影响平均数的结果.
2.标准差、方差
(1)标准差是样本数据到平均数的一种平均距离,一般用s表示,
s=
.
(2)标准差的平方s2叫做方差.
s2=
.
【思考】
 在方差、标准差计算公式中,xi(i=1,2,…,n)、n、
分别表示什么?
提示:xi(i=1,2,…,n)是样本数据,n是样本容量,
是样本平均数.
【基础小测】
1.辨析记忆(对的打“√”,错的打“×”)
(1)中位数一定是数据按从小到大顺序排列后正中间的数.
(  )
(2)利用频率分布直方图计算出的样本的平均数、中位数、众数是样本的真实数据.
(  )
(3)标准差越大,样本数据越集中.
(  )
提示:(1)×.也可能是中间两个数的平均数.
(2)×.是估计值,不是真实数据.
(3)×.标准差越大,样本数据越分散.
2.已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是
(  )
A.平均数>中位数>众数
B.平均数<中位数<众数
C.中位数<众数<平均数
D.众数=中位数=平均数
【解析】选D.众数为50,平均数
=
(20+30+40+50+50+60+70+80)=50,
中位数为
(50+50)=50.
3.(教材二次开发:例题改编)已知一组数据4.7,4.8,5.1,5.4,5.5,则该
组数据的方差是______.?
【解析】这组数据的平均数
=
(4.7+4.8+5.1+5.4+5.5)=5.1,
故s2=
[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.
答案:0.1
关键能力·合作学习
类型一 众数、中位数、平均数(数据分析、数学运算)
【题组训练】
1.某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个,命中个数的茎叶图如图,则下面结论中错误的是
(  )
      
      
      
A.甲的极差是29
B.乙的众数是21
C.甲罚球命中率比乙高
D.甲的中位数是24
2.已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有
(  )
A.a>b>c
B.a>c>b
C.c>a>b
D.c>b>a
3.某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):
甲群 13,13,14,15,15,15,15,16,17,17;
乙群 54,3,4,4,5,5,6,6,6,57.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?
(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?
【解析】1.选D.由茎叶图知,甲的最大值为37,最小值为8,所以甲的极差为
29,故A正确;乙的数据中出现次数最多的是21,所以B正确,甲的命中个数集
中在20,而乙的命中个数集中在10和20,所以甲罚球命中率大,故C正确;甲
中间的两个数为22,24,所以甲的中位数为
(22+24)=23,故D不正确.故结论
中错误的只有D.
2.选D.由题意得a=
(16+18+15+11+16+18+18+17+15+13)=
=15.7,中位数
为16,众数为18,则b=16,c=18,所以c>b>a.
3.(1)甲群市民年龄的平均数为
=15(岁),
中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好
地反映甲群市民的年龄特征.
(2)乙群市民年龄的平均数为
=15(岁),中位数
为5.5岁,众数为6岁.
由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄
特征,而平均数的可靠性较差.
【解题策略】
三种数字特征的比较
名称
优点
缺点
众数
①体现了样本数据的最大集中点;
②容易计算
①它只能表达样本数据中很少的一部分信息;
②无法客观地反映总体的特征
中位数
①不受少数几个极端数据(即排序靠前或靠后的数据)的影响;
②容易计算,便于利用中间数据的信息
对极端值不敏感
名称
优点
缺点
平均数
代表性较好,是反映数据集中趋势的量.一般情况下,可以反映出更多的关于样本数据全体的信息
任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
【补偿训练】
为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高
1.60
m;从南方抽取了200个男孩,平均身高为1.50
m.由此可推断我国13岁男孩的平均身高为
(  )      
      
      
A.1.57
m
B.1.56
m
C.1.55
m
D.1.54
m
【解析】选B.因为从北方抽取了300个男孩,平均身高1.60
m,从南方抽取了
200个男孩,平均身高1.50
m,
所以这500个13岁男孩的平均身高是
=1.56,所以由此可推断
我国13岁男孩的平均身高为1.56
m.
类型二 方差、标准差的计算与应用(数据分析、数学运算)
【典例】甲、乙两机床同时加工直径为100
cm的零件,为检验质量,各从中抽取6件测量,数据为
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
步骤
内容
理解
题意
条件:甲,乙两个机床加工的零件数据.
结论:(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
思路
探求
(1)利用公式计算;
(2)根据方差的大小作出判断.
步骤
内容
书写
表达
(1)
(99+100+98+100+100+103)=100,
(99+100+102+99+100+100)=100.
[(99-100)2+(100-100)2+(98-100)2+(100-100)2+
(100-100)2+(103-100)2]=

[(99-100)2+(100-100)2+(102-100)2+(99-100)2
+(100-100)2+(100-100)2]=1.
(2)两台机床所加工零件的直径的平均值相同,又

所以乙机床加工零件的质量更稳定.
步骤
内容
题后
反思
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小,标准差的大小不会超过极差.
(2)标准差、方差的取值范围:[0,+∞).
标准差、方差为0时,样本各数据相等,说明数据没有波动幅度,数据没有离散性.
【解题策略】
1.用样本的标准差、方差估计总体的方法
用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.
2.标准差(方差)的作用
在实际应用中,常常把平均数与标准差结合起来进行决策.在平均数相等的情况下,比较方差或标准差以确定稳定性.
【跟踪训练】
如图所示茎叶图是甲、乙两组各5名学生的数学竞赛成绩(70分~99分),若甲、乙两组的平均成绩一样,则a=______;甲、乙两组成绩中相对整齐的是______.?
【解析】由茎叶图知75+88+89+98+(90+a)=76+85+89+98+97,解得a=5,平均成
绩均为89,甲的方差为
=62.8,乙的方差
=66,由于
<
,因此甲组
成绩相对整齐.
答案:5 甲组
【补偿训练】
五个数1,2,3,4,a的平均数是3,则这五个数的标准差是______.?
【解析】由
=3,得a=5;
由s2=
[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2,得标准差s=
.
答案:
类型三 频率分布直方图与数字特征的综合问题(数据分析、数学运算)
 角度1 利用频率分布直方图计算众数、中位数?
【典例】某中学举行电脑知识竞赛,现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成如图所示的频率分布直方图.已知图中从左到右的第一、第二、第三、第四、第五小组的频率分别是0.30,0.40,0.15,0.10,0.05,则参赛的选手成绩的众数和中位数可能是
(  )
A.65,65
B.70,65
C.65,50
D.70,50
【思路导引】根据频率分布直方图中众数、中位数的求解方法计算.
【解析】选A.众数为第二组中间值65.设中位数为x,
则0.03×10+(x-60)×0.04=0.5,解得x=65.
【变式探究】
本题主要考查利用频率分布直方图估计样本的数字特征,突出考查了数据分析的核心素养.
本题若把频率分布直方图换为如图,试估计原数据的众数与中位数.
【解析】由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为75.
由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将所有小矩形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标所对应的成绩即为所求.
因为0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,
所以前三个小矩形面积的和为0.3.而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,
所以中位数应位于第四个小矩形内.
设其底边为x,高为0.03,
所以令0.03x=0.2得x≈6.7,
故中位数应约为70+6.7=76.7.
角度2 利用频率分布直方图计算平均数?
【典例】样本容量为100的频率分布直方图如图所示,根据样本频率分布直方图,则平均数为______.?
【思路导引】利用频率分布直方图求平均数.
【解析】平均数
=10×0.06+12×0.2+14×0.4+16×0.24+18×0.1=14.24.
答案:14.24
【解题策略】
1.众数、中位数、平均数与频率分布表、频率分布直方图的关系
(1)众数:众数一般用频率分布表中频率最高的一小组的组中值来表示,即在样本数据的频率分布直方图中,最高矩形的底边中点的横坐标.
(2)中位数:在频率分布表中,中位数是累计频率(样本数据小于某一数值的频率叫做该数值点的累计频率)为0.5时所对应的样本数据的值,而在样本中有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此在频率分布直方图中中位数左边和右边的直方图的面积应该相等.
2.加权平均数
一般地,若取值为x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均数为
=x1p1+x2p2+x3p3+…+xnpn(其中p1+p2+…+pn=1).像这样运用频率计算的平均值
称为加权平均数.
【题组训练】
1.从高三年级抽出50名学生参加数学竞赛,由成绩得到如图所示的频率分布直方图.
由于一些数据丢失,试利用频率分布直方图估计:
(1)这50名学生成绩的众数与中位数;
(2)这50名学生的平均成绩.
【解析】(1)最高矩形的高是0.03,其底边中点是
=75,
则这50名学生成绩的众数估计是75分.
频率分布直方图中,从左到右前3个和前4个矩形的面积和分别是(0.004+0.006+0.02)×10=0.3<0.5,(0.004+0.006+0.02+0.03)×
10=0.6>0.5,设中位数是m,则70则0.3+(m-70)×0.03=0.5,解得m≈76.7(分),即这50名学生成绩的中位数
约是76.7分.
(2)每个小矩形的面积乘以其底边中点的横坐标的和为0.004×10×
+0.006×10×
+0.02×10×
+0.03×10×
+0.021×10×
+0.016×10×
=73.65.
即这50名学生的平均成绩约是73.65分.
2.今年西南一地区遭遇严重干旱,某乡计划向上级申请支援,为上报需水量,乡长事先抽样调查了100户村民的月均用水量,得到这100户村民月均用水量的频率分布表如表所示:(月均用水量的单位:吨)
月均用水量分组
频数
频率
[0.5,2.5)
12
[2.5,4.5)
[4.5,6.5)
40
[6.5,8.5)
0.18
[8.5,10.5]
6
合计
100
1
(1)请完成该频率分布表,并画出相对应的频率分布直方图和频率分布折线图.
(2)估计样本的中位数是多少?
(3)已知上级将按每户月均用水量向该乡调水,若该乡共有1
200户,请估计上级支援该乡的月调水量是多少吨?
【解析】(1)频率分布表与相应的频率分布直方图和频率分布折线图如下:
月均用水量分组
频数
频率
[0.5,2.5)
12
0.12
[2.5,4.5)
24
0.24
[4.5,6.5)
40
0.40
[6.5,8.5)
18
0.18
[8.5,10.5]
6
0.06
合计
100
1
(2)设中位数为x,因为月均用水量在[0.5,4.5)内的频率是(0.06+0.12)×2=0.36,月均用水量在[0.5,6.5)内的频率是(0.06+0.12+0.20)×2=0.76,
所以x∈[4.5,6.5),
则(x-4.5)×0.20
=
0.5
-
0.36,解得
x=5.2.
故样本的中位数是5.2.
(3)该乡每户月均用水量估计为
1.5×0.12+3.5×0.24+5.5×0.40+7.5×0.18+9.5×0.06=5.14(吨).
5.14×1
200=6
168(吨).
所以估计上级支援该乡的月调水量是6
168吨.
课堂检测·素养达标
1.在如图所示的茎叶图表示的数据中,众数和中位数分别是(  )
      
      
      
A.23和26
B.31与26
C.24与30
D.26与30
【解析】选B.由茎叶图可知,众数为31,中位数为26.
2.下列说法中,不正确的是
(  )
A.数据2,4,6,8的中位数是4,6
B.数据1,2,2,3,4,4的众数是2,4
C.一组数据的平均数、众数、中位数有可能是同一个数据
D.8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是
【解析】选A.数据2,4,6,8的中位数为
=5,显然A是错误的,B,C,
D都是正确的.
3.甲、乙、丙、丁四名射手在选拔赛中所得的平均环数
及其方差s2如表所
示,则选送决赛的最佳人选应是
(  )




7
8
8
7
s2
6.3
6.3
7
8.7
A.甲
B.乙
C.丙
D.丁
【解析】选B.因为
所以应选择乙进入
决赛.
4.下列数字特征一定会在原始数据中出现的是
(  )
A.众数
B.中位数
C.平均数
D.都不会
【解析】选A.众数是在一组数据中出现次数最多的数,所以一定会在原始数据中出现.
5.(教材二次开发:练习改编)已知一个样本中的数据为1,2,3,4,5,则
该样本的标准差为
(  )
A.1
B.
C.
D.2
【解析】选B.因为样本容量n=5,
所以
=
(1+2+3+4+5)=3,
所以s=(共48张PPT)
2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体分布
必备知识·自主学习
1.频率分布的概念
频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布
直方图反映样本的频率分布,其一般步骤为:
(1)计算一组数据中最大值与最小值的差,即求极差.
(2)决定___________
(3)将数据分组
(4)列___________
(5)画_______________
导思
1.频率分布的概念是如何定义的?
2.什么是频率分布直方图?
组距与组数
频率分布表
频率分布直方图
【思考】
(1)同样一组数据,如果组距不同,得到的频率分布直方图形状相同吗?如何选择组距与组数?
提示:不相同.组距的选择力求“取整”,数据分组与样本容量有关,样本容量越大,分组越多,当样本容量不超过100时,常分5至12组.
(2)与频率分布表比较,频率分布直方图有何特征?
提示:从频率分布直方图可以清楚地看出数据分布的总体趋势.
2.频率分布折线图、总体密度曲线
(1)频率分布折线图
连接频率分布直方图中_____________________,就得到频率分布折线图.
(2)总体密度曲线
在样本频率分布直方图中,相应的频率分布折线图会越来越接近于一条光滑曲
线,统计中称这条光滑曲线为_____________.它能够精确地反映出总体在各个
范围内取值的百分比,它能给我们提供更加精细的信息.
各小长方形上端的中点
总体密度曲线
【思考】
对于任何一个总体,它的密度曲线是不是一定存在?是否可以被非常准确地画出来?为什么?
提示:实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确.
3.茎叶图
(1)茎叶图
当数据是_____________时,用中间的数字表示十位数,即第一个有效数字,
旁边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,旁边
部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.
两位有效数字
(2)用茎叶图表示数据有两个优点:
一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.
【思考】
(1)茎叶图只能表示两位有效数字的一组数据吗?
提示:茎叶图最适合表示两位有效数字的数据.多于两位的也可以用茎叶图表示.
(2)茎叶图的缺点是什么?
提示:当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长.
【基础小测】
1.辨析记忆(对的打“√”,错的打“×”)
(1)频率分布直方图的纵轴表示频率.
(  )
(2)茎叶图不能增加数据.
(  )
(3)当样本容量很大时,频率分布直方图更能直观地反映数据分布的大致情况,此时不宜用茎叶图.
(  )
提示:(1)×.频率分布直方图的纵轴表示频率/组距.
(2)×.茎叶图可以随时增加数据.
(3)√.当样本数据较多时,绘制茎叶图很不方便.
2.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出(单位:元)在[50,60]内的学生有30人,则n的值为
(  )
      
      
      
A.100
B.1
000
C.90
D.900
【解析】选A.由题意可知,前三组的频率之和为(0.01+0.024+0.036)×10=0.7,
所以支出在[50,60]内的频率为1-0.7=0.3,
所以n=
=100.
3.(教材二次开发:例题改编)如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为
(  )
A.20
B.30
C.40
D.50
【解析】选B.样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.
关键能力·合作学习
类型一 频率分布直方图、折线图的画法(数据分析、直观想象)
【典例】下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm).
区间界限
[122,126)
[126,130)
[130,134)
人数
5
8
10
区间界限
[134,138)
[138,142)
[142,146)
人数
22
33
20
区间界限
[146,150)
[150,154)
[154,158]
人数
11
6
5
(1)列出样本频率分布表.
(2)画出频率分布直方图和折线图.
(3)估计身高小于134
cm的人数占总人数的百分比.
【思路导引】根据样本频率分布表、频率分布直方图和折线图的一般步骤解题.
【解析】(1)样本频率分布表如表:
分组
频数
频率
[122,126)
5
0.04
[126,130)
8
0.07
[130,134)
10
0.08
[134,138)
22
0.18
[138,142)
33
0.28
[142,146)
20
0.17
[146,150)
11
0.09
[150,154)
6
0.05
[154,158]
5
0.04
合计
120
1
(2)频率分布直方图和折线图如图所示:
(3)由样本频率分布表可知身高小于134
cm的男孩出现的频率为0.04+0.07
+0.08=0.19,所以我们估计身高小于134
cm的人数占总人数的19%.
【解题策略】
绘制频率分布直方图的注意事项
(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.
(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.
【跟踪训练】
有一容量为200的样本,数据的分组以及各组的频数如下:
[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20],17.
(1)列出样本的频率分布表.
(2)画出频率分布直方图和频率分布折线图.
【解析】(1)频率分布表如表:
分组
频数
频率
[-20,-15)
7
0.035
[-15,-10)
11
0.055
[-10,-5)
15
0.075
[-5,0)
40
0.2
[0,5)
49
0.245
[5,10)
41
0.205
[10,15)
20
0.1
[15,20]
17
0.085
合计
200
1.00
(2)频率分布直方图和频率分布折线图如图所示:
【补偿训练】
为了了解学校高一年级男生的身高情况,选取一个容量为60的样本(60名男生的身高),分组情况如下(单位:cm):
分组
[147.5,
155.5)
[155.5,
163.5)
[163.5,
171.5)
[171.5,
179.5]
频数
6
21
27
m
频率
a
0.1
(1)求出表中a,m的值;
(2)画出频率分布直方图.
【解析】(1)由题意得:6+21+27+m=60,
所以m=6.a=
=0.45.
(2)作出频率分布直方图如图所示:
类型二 频率分布直方图的应用(数据分析、直观想象)
【典例】从某小区抽取100户居民进行月用电量调查,发现其用电量都在50度至350度之间,频率分布直方图如图所示.
(1)求直方图中x的值;
(2)在这些用户中,求用电量落在区间[100,250)内的户数.
【思路导引】根据频率分布直方图的性质特征计算.
【解析】(1)由频率分布直方图知[200,250)小组的频率为1-(0.002
4+
0.003
6+0.006
0+0.002
4+0.001
2)×50=0.22,于是x=
=0.004
4.
(2)因为数据落在[100,250)内的频率为(0.003
6+0.006
0+0.004
4)
×50=0.7,
所以所求户数为0.7×100=70.
【解题策略】
频率分布直方图的性质
小长方形的面积=组距×
=频率,这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
【跟踪训练】
为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄在17~18岁的男生体重(kg),将他们的体重按[54.5,56.5),[56.5,58.5),…,[74.5,76.5]分组,得到的频率分布直方图如图所示.由图可知这100名学生中体重在[56.5,64.5)的学生人数是
(  )
A.20
B.30
C.40
D.50
【解析】选C.由频率分布直方图可得体重在[56.5,64.5)的学生的频率为(0.03+0.05+0.05+0.07)×2=0.4,则这100名学生中体重在[56.5,64.5)的学生人数为100×0.4=40.
类型三 茎叶图的画法及应用(数学抽象、直观想象)
【典例】某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:
甲:95,81,75,91,86,89,71,65,76,88,94,110,107;
乙:83,86,93,99,88,103,98,114,98,79,78,106,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
【思路导引】用中间的数字表示两位同学得分的十位数字和百位数字,两边的数字分别表示两人每次数学考试成绩的个位数字.
画出茎叶图,由图可以分析两人的成绩.
【解析】甲、乙两人数学成绩的茎叶图如图所示.
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,叶主要集中在8,9,10的茎上;甲同学的得分情况也是大致对称,叶主要集中在7,8,9的茎上.乙同学的成绩总体情况比甲同学好.
【解题策略】
(1)茎叶图在样本数据较少,较为集中且位数不多时比较适用.
(2)若所给数字为小数,则常把整数部分作为“茎”,小数部分作为“叶”.
(3)应用茎叶图对两组数据进行比较时,要从数据分布的对称性,平均数等方面来比较.
【跟踪训练】
如图是2020年某市青年歌手大奖赛中七位评委为甲、乙两名选手打出的分数的茎叶图(图中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则一定有
(  )
A.a1>a2
B.a2>a1
C.a1=a2
D.a1,a2的大小与m的值有关
【解析】选B.根据茎叶图可知,去掉一个最高分和一个最低分后,甲的平均分
为a1=80+
=84,乙的平均分为a2=80+
=85,故a2>a1.
【补偿训练】
如图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知(  )
A.甲运动员的成绩好于乙运动员
B.乙运动员的成绩好于甲运动员
C.甲、乙两名运动员的成绩没有明显的差异
D.甲运动员的最低得分为0分
【解析】选A.由茎叶图可以看出甲运动员的成绩主要集中在30至40之间,比较稳定,而乙运动员的成绩均匀地分布在10至40之间,所以甲运动员成绩较好.
课堂检测·素养达标
1.下列关于频率分布直方图的说法正确的是
(  )
A.直方图的高表示取某数的频率
B.直方图的高表示该组上的个体在样本中出现的频率
C.直方图的高表示取某组上的个体在样本中出现的频数与组距的比值
D.直方图的高表示取该组上的个体在样本中出现的频率与组距的比值
【解析】选D.要注意频率分布直方图的特点.在直方图中,纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积.
2.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为(  )
      
      
      
A.0.2
B.0.4
C.0.5
D.0.6
【解析】选B.因为数据总个数n=10,又落在区间[22,30)内的数据个数为4,
所以所求的频率为
=0.4.
3.(教材二次开发:练习改编)某班计划开展一些课外活动,全班有40名学生报名参加,他们就乒乓球、足球、跳绳、羽毛球4项活动的参加人数做了统计,绘制了条形统计图(如图所示),那么参加羽毛球活动的人数的频率是______.?
【解析】因为参加羽毛球活动的人数是4,所以频率是
=0.1.
答案:0.1
4.小波一星期的总开支分布如图①所示,一星期的食品开支如图②所示,则小波一星期的鸡蛋开支占总开支的百分比为
(  )
A.30%
B.10%
C.3%
D.不能确定
【解析】选C.由题图②知,小波一星期的食品开支为30+40+100+80+50
=300(元).
由题图①知,小波一星期的总开支为300÷30%=1
000(元).则小波一星期的鸡
蛋开支占总开支的百分比为
×100%=3%.(共47张PPT)
2.1.3 分



必备知识·自主学习
1.分层抽样
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法是一种分层抽样.
导思
1.什么是分层抽样?分层抽样有什么特点?
2.如何设计分层抽样的步骤?
【思考】
在什么情况下适用分层抽样?
提示:当总体是由差异明显的几部分组成时,往往选用分层抽样的方法.
2.分层抽样的实施步骤
第一步,按某种特征将总体分成若干部分(层).
第二步,计算抽样比.抽样比=
.
第三步,各层抽取的个体数=各层总的个体数×抽样比.
第四步,依各层抽取的个体数,按简单随机抽样或系统抽样从各层抽取样本.
第五步,综合每层抽样,组成样本.
【思考】
(1)怎样确定分层抽样中各层入样的个体数?
提示:在实际操作时,应先计算出抽样比=
,可得各层入样数的百分
比,再按抽样比确定每层需要抽取的个体数:抽样比×该层个体数目=
×该层个体数目.
(2)计算各层所抽个体的个数时,如果算出的个数值不是整数怎么办?
提示:可四舍五入取整,也可先将该层等可能地剔除多余个体.
3.简单随机抽样、系统抽样、分层抽样的联系和区别
类别
简单随机抽样
系统抽样
分层抽样
各自
特点
从总体中逐个抽取
将总体均分成几个部分,按事先确定的规则在各部分抽取
将总体分成几层,分层进行抽取
相互
联系
——
在起始部分采用简单随机抽样
在各层抽样时采用简单随机抽样或系统抽样
适用
范围
总体中的个体数较少
总体中的个体数较多
总体由存在明显差异的几部分组成
共同

①抽样过程中每个个体被抽到的可能性相等;
②每次抽出个体后不再放回,即不放回抽样
【思考】
分层抽样公平吗?
提示:公平分层抽样中,每个个体被抽到的可能性是相同的,与层数、分层无
关.
如果总体的个数为N,样本容量为n,Ni为第i层的个体数,则第i层抽取的个体
数ni=n·
,每个个体被抽到的可能性是
【基础小测】
1.辨析记忆(对的打“√”,错的打“×”)
(1)系统抽样时,将总体分成均等的几部分,每部分抽取一个,符合分层抽样,故系统抽样就是一种特殊的分层抽样.
(  )
(2)在分层抽样时,每层可以不等可能抽样.
(  )
(3)在分层抽样的过程中,每个个体被抽到的可能性是相同的,与层数及分层有关.
(  )
提示:(1)×.因为分层抽样是从各层独立地抽取个体,而系统抽样各段上抽取时是按事先定好的规则进行的,各层编号有联系,不是独立的,故系统抽样不同于分层抽样.
(2)×.分层抽样时,每层仍然要等可能抽样.
(3)×.与层数及分层无关.
2.为了保证分层抽样时每个个体被等可能地抽取,必须要求(  )
A.每层因所含个体数不同而不等可能抽取
B.每层抽取的个体数相等
C.按每层所含个体在总体中所占的比例抽样
D.只要抽取的样本容量一定,每层抽取的个体数没有限制
【解析】选C.因为分层抽样为等比例抽样,所以选项A不正确,分层抽样时,
每层抽样个数与各层的比例有关,所以选项B错误,选项C正确,选项D错误.
3.(教材二次开发:例题改编)某单位有职工160人,其中业务员104人,管理人员32人,后勤服务人员24人,现用分层抽样法从中抽取一容量为20的样本,则抽取管理人员有
(  )
A.3人    B.4人    C.7人    D.12人
【解析】选B.由
设管理人员x人,则
得x=4.
4.在抽样过程中,每次抽取的个体不再放回总体的为不放回抽样,那么分层抽样、系统抽样、简单随机抽样三种抽样中,为不放回抽样的有______个.?
【解析】依据三种抽样方法的定义及特点可知:三种抽样方法均为不放回抽样.
答案:三
关键能力·合作学习
类型一 分层抽样的概念(数学抽象、逻辑推理)
【题组训练】
1.为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查.事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.在下面的抽样方法中,最合理的抽样方法是
(  )      
      
      
A.简单随机抽样
B.按性别分层抽样
C.按年龄段分层抽样
D.系统抽样
2.某中学有老年教师20人,中年教师65人,青年教师95人.为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是
(  )
A.抽签法
B.系统抽样
C.分层抽样
D.随机数法
3.为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是
(  )
A.简单随机抽样
B.按性别分层抽样
C.按学段分层抽样
D.系统抽样
【解析】1.选C.因为不同年龄段人员的“微信健步走”活动情况有较大差异.而男女对此活动差异不大,所以按年龄段分层抽样最合理.
2.选C.教师各部分之间有明显的差异,所以适合分层抽样.
3.选C.我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,而事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.了解某地区中小学生的视力情况,按学段分层抽样,这种方式具有代表性,比较合理.
【解题策略】
1.使用分层抽样的前提
分层抽样的适用前提条件是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.
2.使用分层抽样应遵循的原则
(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则.
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
【补偿训练】
某校有在校高中生共1
600人,其中高一学生520人,高二学生500人,高三学生580人.如果想通过抽查其中的80人来调查学生的消费情况,考虑到学生的年级高低消费情况有明显差别,而同一年级内消费情况差异较小,问:应采用怎样的抽样方法?高三学生中应抽查多少人?
【解析】因为不同年级的学生消费情况有明显差别,所以应采用分层抽样.
因为520∶500∶580=26∶25∶29.
所以将80分成26∶25∶29的三部分.
设三部分各抽取的个体数分别为26x,25x,29x,
由26x+25x+29x=80得x=1,
所以高三学生中应抽查29人.
类型二 分层抽样的设计及应用(数学抽象、逻辑推理)      
      
      
【典例】一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人,为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本,则从上述各层中依次抽取的人数分别是(  )
A.12,24,15,9
B.9,12,12,7
C.8,15,12,5
D.8,16,10,6
【思路导引】由于具有高级职称的160人,具有中级职称的320人,具有初级职
称的200人,其余人员120人,适合分层抽样.
【解析】选D.抽样比例为
故各层中依次抽取的人数为160×
=8(人),320×
=16(人),200×
=10(人),120×
=6(人).
【解题策略】
利用分层抽样抽取样本的操作步骤
(1)将总体按一定标准进行分层.
(2)计算各层的个体数与总体的个体数的比.
(3)按各层的个体数占总体的比确定各层应抽取的样本容量.
(4)在每一层进行抽样(可用简单随机抽样或系统抽样).
(5)最后将每一层抽取的样本汇总合成样本.
【跟踪训练】
1.将A,B,C三种性质的个体按1∶2∶4的比例进行分层抽样调查,若抽取的样
本容量为21,则A,B,C三种性质的个体分别抽取
(  )
A.12,6,3
B.12,3,6
C.3,6,12
D.3,12,6
【解析】选C.由分层抽样的概念,知A,B,C三种性质的个体应分别抽取21×
=3,21×
=6,21×
=12.
2.为了调查城市PM2.5的情况,按地域把48个城市分成大型、中型、小型三
组,相应的城市数分别为8,16,24.若用分层抽样的方法抽取12个城市,则应
抽取的中型城市数为
(  )
A.3    B.4    C.5    D.6
【解析】选B.根据分层抽样的特点可知,抽样比例为
则应抽取的中型
城市数为16×
=4.
类型三 抽样方法的选择(数学抽象、逻辑推理)
【题组训练】
1.①教育局督学组到某校检查工作,临时需在每班各抽调两位同学参加座谈;②某班数学期中考试有14人在120分以上,35人在90~119分,7人不及格,现从中抽出8人研讨进一步改进教与学;③某班春节聚会,要产生两位“幸运者”.就这三件事,合适的抽样方法分别为
(  )
A.分层抽样,分层抽样,简单随机抽样
B.系统抽样,系统抽样,简单随机抽样
C.分层抽样,简单随机抽样,简单随机抽样
D.系统抽样,分层抽样,简单随机抽样
2.为了了解某校的教学水平,抽查了这个学校高三年级部分学生的本学年考试成绩.为了全面地反映实际情况,采取以下三种方式进行(已知该校高三年级共有14个教学班,并且每个班内的学生都已经按随机方式编好了学号,假定该校每班人数都相同).
①从全年级14个班中任意抽取一个班,再从该班中任意抽取14人,了解他们的学习成绩;
②每个班都抽取1人,共计14人,了解这14名学生的成绩;
③把该校高三年级的学生按成绩分成优秀、良好、普通三个级别,从中抽取100名学生进行了解(已知若按成绩分,该校高三学生中优秀学生有105名,良好学生有420名,普通学生有175名).
根据上面的叙述,试回答下列问题:
(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?
(2)上面三种抽取方式各自采用何种抽取样本的方法?
【思路导引】根据各抽样方法的特征、适用范围判断.
【解析】1.选D.①每班各抽两人需用系统抽样.②由于学生分成了差异比较大的几层,应用分层抽样.③由于总体与样本容量较小,应用简单随机抽样.
2.(1)这三种抽取方式中,其总体都是指该校高三全体学生本年度的考试成绩,个体都是指高三年级每个学生本年度的考试成绩.其中第一种抽取方式中样本为所抽取的14名学生本年度的考试成绩,样本容量为14;第二种抽取方式中样本为所抽取的14名学生本年度的考试成绩,样本容量为14;第三种抽取方式中样本为所抽取的100名学生本年度的考试成绩,样本容量为100.
(2)上面三种抽取方式中,第一种方式采用的方法是简单随机抽样法;第二种方式采用的方法是系统抽样法和简单随机抽样法;第三种方式采用的方法是分层抽样法和简单随机抽样法.
【解题策略】
抽样方法的选取
(1)若总体由差异明显的几个层次组成,则选用分层抽样.
(2)若总体没有差异明显的层次,则考虑采用简单随机抽样或系统抽样.当总体容量较小时宜用抽签法;当总体容量较大,样本容量较小时宜用随机数表法;当总体容量较大,样本容量也较大时宜用系统抽样.
(3)采用系统抽样时,当总体容量N能被样本容量n整除时,抽样间隔为k=

当总体容量不能被样本容量整除时,先用简单随机抽样剔除多余个体,抽样间
隔为k=
,其中
表示不大于
的整数.
【跟踪训练】
1.某社区有500户家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户.为了调查社会购买力的某项指标,要从中抽取一个容量为100的样本,记作①;某学校高一年级有18名女排运动员,要从中选出4人调查训练情况,记作②.那么完成上述两项调查应分别采用的抽样方法是
(  )
A.①用简单随机抽样法,②用系统抽样法
B.①用分层抽样法,②用简单随机抽样法
C.①用系统抽样法,②用分层抽样法
D.①用分层抽样法,②用系统抽样法
【解析】选B.①因家庭收入不同其社会购买力也不同,宜用分层抽样的方法.②因总体个数较少,宜用简单随机抽样法.
2.下列问题中,采用怎样的抽样方法较为合理?为什么?
(1)某学校有500名学生,其中有200人为O型血,125人为A型血,50人为AB型血.为了研究血型与色弱的关系,拟抽取一个容量为20的样本.
(2)体育彩票000
001~100
000编号中,凡彩票号码最后三位数为345的中一等奖.
【解析】
题号
判断
原因分析
(1)
分层抽样
由于研究血型与色弱的关系,所以应用分层抽样
(2)
系统抽样
总体容量大,样本容量较大,等距抽取,用系统抽样
课堂检测·素养达标
1.某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是
(  )      
      
      
A.抽签法
B.随机数表法
C.系统抽样法
D.分层抽样法
【解析】选D.由于是调查男、女学生在学习兴趣与业余爱好方面是否存在差异,因此用分层抽样方法.
2.(教材二次开发:练习改编)甲校有3
600名学生,乙校有5
400名学生,丙校有1
800名学生,为统计三校学生某方面的情况,计划采用分层抽样法抽取一个容量为90的样本,应在这三校分别抽取学生
(  )
A.30人、30人、30人  
B.30人、45人、15人
C.20人、30人、40人
D.30人、50人、10人
【解析】选B.根据各校人数比例有3
600∶5
400∶1
800=2∶3∶1,由于样本容量为90,不难求出甲校应抽取30人、乙校应抽取45人、丙校应抽取15人.
3.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区有10个特大型销售点,要从中抽取7个销售点调查其销售收入和售后服务等情况,记这项调查为②,则完成①②这两项调查宜采用的抽样方法依次为
(  )
A.分层抽样法,系统抽样法
B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法
D.简单随机抽样法,分层抽样法
【解析】选B.由调查①可知个体差异明显,故宜用分层抽样;调查②中个体较少,故宜用简单随机抽样.
4.《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其意为:“今有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱”,则丙应出______钱(结果保留整数).?
【解析】因为依照钱的多少按比例出钱,所以丙应该出的钱为
×100=
×100≈17.
答案:17
5.某班有40名男生,20名女生,已知男女身高有明显不同,现欲调查平均身
高,准备抽取
,采用分层抽样方法,抽取男生1名,女生1名,你认为这种
做法是否妥当?如果让你来调查,你准备怎样做?
【解析】这种做法不妥当.原因:取样比例
过小,很难准确反映总体情况,
况且男、女身高差异较大,抽取人数相同,也不合理.
考虑到本题的情况,可以采用分层抽样,可抽取
.
男生抽取40×
=8(名),女生抽取20×
=4(名),各自用抽签法或随机数表法
抽取组成样本.(共46张PPT)
2.1.2 系



必备知识·自主学习
1.系统抽样的概念
一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法就是系统抽样.
导思
1.什么是系统抽样?在什么情况下适用系统抽样?
2.如何进行系统抽样?
【思考】
(1)当总体中的个数较多时,为什么不宜用简单随机抽样.
提示:因为个体较多,采用简单随机抽样如制作号签等工作会耗费大量的人力、物力和时间,而且不容易做到“搅拌均匀”,从而使样本的代表性不强.
(2)系统抽样有什么特征?与简单随机抽样有什么区别?
提示:(1)系统抽样的主要特征有三个:①总体已知且数量较大;②抽样必须等距;③每个个体入样的机会均等.不满足任何一条就不是系统抽样.
(2)系统抽样有别于简单随机抽样的一个显著特点是总体中的个体的数量,一般来说,简单随机抽样,总体中个体较少;系统抽样,总体中个体较多.
2.系统抽样应用的解题依据
(1)等可能性:由于整个抽样过程中每个个体被抽到的机会相等,故可依此确定某范围上的要抽取的样本容量.
(2)编号的等间隔性:
①常见的系统抽样的样本号码特征较为明显:将号码从小到大排列,任意相邻两项之间的差是一个定值(间隔数);
②按照题设规定的规则抽取样本.
【思考】
(1)用系统抽样抽取样本时,每段各取一个号码,其中第一段的个体编号怎样抽取?
提示:使用简单随机抽样方法抽取.
(2)用系统抽样抽取样本时,当
不是整数时,随机剔除了多余的个体,这样还公平吗?
提示:因为剔除多余个体是用简单随机抽样的方法进行的,每一个个体被剔除的机会都一样,所以是公平的.
(3)用系统抽样抽取样本时,第1段是随机取出的号码,其余各段都是由计算式算出来的,并没有抽签,这样公平吗?
提示:虽然除第1段外,后面的样本都是通过计算抽取的,但由于第1段号码确定是随机的,故后面各段号码的确定均是随机的,是公平的.
【基础小测】
1.辨析记忆(对的打“√”,错的打“×”)
(1)总体个数较多时可以用系统抽样.
(  )
(2)系统抽样的过程中,每个个体被抽到的概率不相等.
(  )
(3)用系统抽样从N个个体中抽取一个容量为n的样本,要平均分成n段,每段
各有
个号码.
(  )
提示:(1)√.当总体中个体较少时,易采用简单随机抽样;当个体较多时,易
采用系统抽样.
(2)×.采用系统抽样时,必须保证每个个体被抽到的概率均等.
(3)×.如果总体中的个体数N正好能被样本容量n整除,则每段中含有
个个
体;如果总体中的个体数N不能被样本容量n整除,则需要利用简单随机抽样先
从总体中剔除部分个体,再分组.
2.系统抽样适用的总体应是
(  )      
      
      
A.容量较小的总体
 
B.容量较大的总体
C.个体数较多但均衡的总体
 
D.任何总体
【解析】选C.根据系统抽样的概念,只能是个体数较多且个体之间均衡的总体才能使用系统抽样.
3.(教材二次开发:练习改编)有20个同学,编号为1~20,现在从中抽取4人的作文卷进行调查,用系统抽样方法确定所抽的编号为
(  )
A.5,10,15,20  
B.2,6,10,14
C.2,4,6,8
D.5,8,11,14
【解析】选A.将20分成4个组,每组5个号,间隔等距离为5.
4.在10
000个有机会中奖的号码(编号为0
000~9
999)中,有关部门按照随机抽样的方式确定后两位数字是68的号码为中奖号码.这是运用哪种抽样方法来确定中奖号码的
(  )
A.抽签法
B.系统抽样法
C.随机数表法
D.其他抽样方法
【解析】选B.由题意,中奖号码分别为0068,0168,0268,…,9968.显然这是将10
000个中奖号码平均分成100组,从第一组抽0068号,其余号码是在此基础上加100的整数倍得到的,是系统抽样.
关键能力·合作学习
类型一 系统抽样的概念(数学抽象、逻辑推理)
【题组训练】
1.下列抽样中,最适宜用系统抽样的是
(  )
A.某市的4个区共有2
000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200名入样
B.从某厂生产的2
000个电子元件中随机抽取5个入样
C.从某厂生产的2
000个电子元件中随机抽取200个入样
D.从某厂生产的20个电子元件中随机抽取5个入样
2.某商场欲通过检查部分发票及销售记录来快速估计每月的销售金额,采用
如下方法:从某本发票的存根中随机抽一张,如15号,然后按顺序将65号,
115号,165号,…,发票上的销售金额组成一个调查样本.这种抽取样本的方
法是
(  )
A.抽签法      
B.随机数法
C.系统抽样法
D.以上都不对
3.为了解1
200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k=_____.?
【解析】1.选C.根据系统抽样的定义和特点判断,A项中的总体有明显的层次
区别,不适宜用系统抽样;B项中样本容量很小,适合随机数表法;D项中总体
容量较小,适合抽签法.
2.选C.上述抽样方法是将发票平均分成若干组,每组50张,从第一组抽出了15
号,以后各组抽15+50n(n∈N
)号,符合系统抽样的特点.
3.根据样本容量为30,将1
200名学生分为30段,每段人数即间隔k=
=40.
答案:40
【解题策略】
判断一种抽样是否是系统抽样,首先看是否在抽样前知道总体是由什么构成的,抽样方法能否保证每个个体按事先规定的可能性入样,再看是否将总体分成几个均衡的部分,并在第一个部分中进行简单随机抽样.
【补偿训练】
1.现用系统抽样抽取了一个容量为30的样本,其总体中含有300个个体,则总体中的个体编号后,分成的组数是
(  )                 
A.300
B.30
C.10
D.不确定
【解析】选B.因为样本容量为30,依据系统抽样每组可抽取一个,所以共有30组.
2.某中学从已编号(1~60)的60个班级中,随机抽取6个班级进行卫生检查,用系统抽样方法确定所选的6个班级的编号可能是
(  )
A.6,16,26,36,46,56
B.3,10,17,24,31,38
C.4,11,18,25,32,39
D.5,14,23,32,39,50
【解析】选A.需要把总体分为6段,即1~10,11~20,21~30,31~40,41~50,51~60,既符合间隔为10又符合每一段取一号的只有A项.
3.下列抽样中不是系统抽样的是
(  )
A.从标有1~15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5,i+10(超过15则从1再数起)号入样
B.工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔十分钟抽一件产品检验
C.进行某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止
D.电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈
【解析】选C.C不是系统抽样,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样.
类型二 系统抽样的方案设计(数学抽象、逻辑推理)
【典例】某企业对新招的504名员工进行岗前培训,为了了解员工的培训情况,试用系统抽样的方法按照下列要求抽取员工,请你写出具体步骤.
(1)从中抽取8名员工,了解基本理论的掌握情况.
(2)从中抽取50名员工,了解实际操作的掌握情况.
【思路导引】当总体容量恰好整除样本容量时,直接分组、抽样;当总体容量不能整除样本容量时,需要先利用简单随机抽样从总体中剔除部分个体.
【解析】(1)第一步,将504名员工随机编号,依次为001,002,003,…,503,504,将其等距分成8段,每一段有63个个体;
第二步,在第一段(001~063)中用简单随机抽样方法随机抽取一个号码作为起始号码,比如26号;
第三步,起始号+间隔的整数倍,确定各个个体:将编号为26,26+63,26+63×2,…,26+63×7的个体抽出组成样本.
(2)第一步,用随机方式给每个个体编号:001,002,003,…,503,504;
第二步,利用随机数表法剔除4个个体,比如剔除编号为004,135,069,
308的4个个体,然后再对余下的500名员工重新编号,分别为001,002,003,…,499,500,并等距分成50段,每段10个个体;
第三步,在第一段001,002,003,…,010中用简单随机抽样方法抽出一个
号码(如006)作为起始号码;
第四步,起始号+间隔的整数倍,确定各个个体,将编号为006,016,026,…,486,496的个体抽出组成样本.
【解题策略】
系统抽样的步骤
(1)编号(在保证编号的随机性的前提下,可以直接利用个体所带有的号码).
(2)分段(确定分段间隔k,注意剔除部分个体时要保证剔除的随机性和客观性).
(3)确定起始个体编号l(在第1段采用简单随机抽样来确定).
(4)按照事先确定的规则抽取样本(通常是将l加上k,得到第2个个体编号l+k,
再将l+k加上k,得到第3个个体编号l+2k,这样继续下去,直到获取整个样本).
【跟踪训练】
1.采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为(  )      
      
      
A.7
B.9
C.10
D.15
【解析】选C.从960人中用系统抽样的方法抽取32人,则抽样间隔为k=
=30.
因为第一组号码为9,则第二组号码为9+1×30=39,…,第n组号码为
9+(n-1)×30=30n-21.由451≤30n-21≤750,得15
≤n≤25

所以n=16,17,…,25,共有25-16+1=10(人).
2.某单位有200名职工,现要从中抽取40名职工作为样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是______.?
【解析】由系统抽样的知识可知,将总体分成均等的若干部分是将总体分段,且分段间隔为5.因为第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.
答案:37
类型三 系统抽样的综合应用(数学抽象、逻辑推理)
【题组训练】
1.从2
020名学生中选50人组成参观团,先用简单随机抽样方法剔除20人,再将其余2
000人从0到1
999编号,按系统抽样方法选取,若第一组采用抽签法抽到的号码是30,则最后一组人选的号码是
(  )      
      
      
A.1
990
B.1
991
C.1
989
D.1
988
2.某工厂有一线职工650人,管理人员25人,现从一线职工中抽取25人,从管理人员中抽取2人到外单位进行参观学习,在这个抽样过程中,最适合的抽样方法为
(  )
A.随机数法 抽签法
B.随机数法
C.系统抽样法 抽签法
D.抽签法
3.下面给出某村委会调查本村各户收入情况做的抽样,阅读并回答问题.本村人口数1
200,户数300,每户平均人口数4人;应抽户数30;
抽样间隔:
=40;
确定随机数字:取一张人民币,后两位数为12;
确定第一样本户:编号12的户为第一样本户;
确定第二样本户:12+40=52,52号为第二样本户;

(1)该村委会采用了何种抽样方法?
(2)抽样过程存在哪些问题,试修改.
(3)何处是用简单随机抽样?
【解析】1.选A.样本间隔为2
000÷50=40
,若第一组采用抽签法抽到的号码是30,则最后一组入选的号码是30+49×40=1
990.
2.选C.一线职工650人,从中抽取25人,总体容量和样本容量都比较大,宜采用系统抽样法;从25名管理人员中,抽取2人,宜采用抽签法.
3.(1)系统抽样.
(2)本题是对某村各户进行抽样,而不是对某村人口抽样.抽样间隔
=10,
其他步骤相应改为确定随机数字:取一张人民币,末位数为2(假设).确定第一
样本户:编号02的住户为第一样本户;确定第二样本户:2+10=12,12号为第
二样本户;……
(3)确定随机数字:取一张人民币,其末位数为2.
【解题策略】
系统抽样与简单随机抽样的对比
(1)总体容量较大,抽取样本较多时,系统抽样比简单随机抽样更易实施,可节约成本.
(2)系统抽样所得到的样本的代表性和个体的编号有关,而简单随机抽样所得到的样本的代表性与个体编号无关.
(3)系统抽样的实质是简单随机抽样.
(4)系统抽样比简单随机抽样应用更广泛.
【补偿训练】
已知标有1~20号的小球20个,若我们的目的是估计总体号码的平均值,即20个小球号码的平均数.试验者从中抽取4个小球,以这4个小球号码的平均数估计总体号码的平均值,按下面方法抽样(按小号到大号排序):
(1)以编号2为起点,系统抽样抽取4个球,则这4个球的编号的平均值为_____.?
(2)以编号3为起点,系统抽样抽取4个球,则这4个球的编号的平均值为_____.?
【解析】20个小球分4组,每组5个.
(1)若以2号为起点,则另外三个球的编号依次为7,12,17,4球编号平均值为
=9.5.
(2)若以3号为起点,则另外三个球的编号依次为8,13,18,4球编号平均值为
=10.5.
答案:(1)9.5 (2)10.5
课堂检测·素养达标
1.从某牛奶生产线上每隔30分钟抽取一袋牛奶进行检验,该抽样方法记为①;从某中学的30名数学爱好者中抽取3人了解学业负担情况,该抽样方法记为②.则
(  )
A.①是系统抽样,②是简单随机抽样
B.①是简单随机抽样,②是简单随机抽样
C.①是简单随机抽样,②是系统抽样
D.①是系统抽样,②是系统抽样
【解析】选A.由两种抽样的特征可得①为系统抽样,②为简单随机抽样.
2.某会议室有50排座位,每排有30个座位.一次报告会坐满了听众.会后留下座号为15的所有听众50人进行座谈.这是运用了
(  )
A.抽签法
B.随机数表法
C.系统抽样
D.有放回抽样
【解析】选C.从第1排到第50排每取一个人的间隔人数是相同的,符合系统抽样的定义.
3.总体容量为524,若采用系统抽样,下列的抽取间隔不需要剔除个体的

(  )
A.3
B.4
C.5
D.6
【解析】选B.因为
=131,所以当间隔为4时,不需要剔除个体.
4.(教材二次开发:练习改编)高一某班有学生56人,学生编号依次为1,2,
3,…,56.现用系统抽样的方法抽取一个容量为4的样本,已知编号为6,34,
48的同学都在样本中,那么样本中另一位同学的编号应该是______.?
【解析】由于系统抽样的样本中个体编号是等距的,且间距为
=14,
所以样本编号应为6,20,34,48.
答案:20
5.从2
003名学生中抽取一个容量为40的样本,应如何抽取?
【解析】(1)编号.先将2
003名学生按0001到2003编号,
(2)利用随机数表法从中剔除3名学生,再对剩余的2
000名学生重新从0001到2000编号,
(3)按编号顺序分成40组,每组50人,先在第一组中用抽签法抽出某一号,如0006,依次在其他组抽取0056,0106,…,1956,这样就得到了一个容量为40的样本.(共47张PPT)
第二章 统计
2.1 随



2.1.1 简单随机抽样
必备知识·自主学习
导思
1.什么是简单随机抽样?它有什么特点?
2.简单随机抽样有哪两种具体方法?其步骤是什么?
1.简单随机抽样的概念
一般地,设一个总体含有N个个体,从中逐个_________抽取n个个体作为样本
(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都_____,就把这种
抽样方法叫做简单随机抽样.
不放回地
相等
【思考】简单随机抽样有哪些特点?
提示:(1)有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.
(2)逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
(3)不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
(4)等可能性:简单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平.
2.抽签法(抓阄法)
(1)抽签法(抓阄法)的定义:
一般地,抽签法就是把总体中的N个个体_____,把号码写在号签上,将号签放
在一个容器中,_________后,每次从中抽取一个号签,连续抽取n次,就得到
一个容量为n的样本.
编号
搅拌均匀
(2)抽签法的步骤如下
①编号.将N个个体编号(号码可以从1~N,也可以使用已有的号码).
②写签.将1~N这N个号码写到大小、形状相同的号签上.
③搅拌均匀.将写好的号签放入一个不透明的容器中,搅拌均匀.
④抽签.从容器中每次抽取一个号签,连续抽取n次,并记录其编号.
⑤确定样本.从总体中找出与号签上的号码对应的个体,组成样本.
【思考】
(1)抽签法的优点、缺点?
提示:优点是容易操作.缺点是仅适用于个体数较少的总体,当总体容量较大时,费时费力又不方便,况且,如果号签搅拌不均匀,可能导致抽样不公平.
(2)抽签法怎样做才能保证抽样的公平?
提示:搅拌均匀、逐一抽取.
3.随机数法
随机数法,即利用_________、随机数骰子或计算机产生的随机数进行抽样.这
里仅介绍随机数表法.
(1)随机数表:
随机数表由数字0,1,2,…,9组成,并且每个数字在表中各个位置出现的机
会都是一样的(随机数表不是唯一的,只要符合各个位置出现各个数字的可能
性相同的要求,就可以构成随机数表).
随机数表
(2)随机数表法的步骤
①编号:将各个个体编号.
②选定初始值(数):为了保证所选数字的随机性,在查看随机数表前就指出开始数字的横、纵位置.
③选号:从选定的数字开始按照一定的方向读下去,得到的号码若不在编号中或已被选用,则跳过,直到选满n个为止.
④确定样本:按步骤③选出的号码从总体中找出与其对应的个体,组成样本.
【思考】
(1)随机数表法抽样在什么情况下使用?它相比抽签法的优势体现在哪里?
提示:当总体中个体数较多时适合用随机数表法,与抽签法相比,可以节约大量的人力和制号签的成本.
(2)随机数表法和抽签法都要对个体进行编号,它们的编号方法有何不同?
提示:抽签法和随机数表法对个体的编号是不同的,抽签法可以利用个体已有的编号,如学生的学籍号、产品的记数编号等,也可以重新编号,例如总体个数为100,编号可以为1,2,3,…,100.随机数表法编号要看总体的个数,且所编号码数位必须相同,如总体数为100,通常为00,01,…,99.总体数大于100小于1
000,从000开始编起,然后是001,002,….
【基础小测】
1.辨析记忆(对的打“√”,错的打“×”)
(1)简单随机抽样就是随便抽取样本.
(  )
(2)在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取有关,第一次抽到的可能性最小.
(  )
(3)有同学说:“随机数表只有一张,并且读数时只能按照从左向右的顺序读取,否则产生的随机样本就不同了,对总体的估计就不准确了”.
(  )
提示:(1)×.简单随机抽样是抽样的一种,并不是随便抽取样本.
(2)×.在简单随机抽样中,每个个体被抽到的可能性相等,与第几次抽取无关.
(3)×.随机数表的产生是随机的,读数的顺序也是随机的,不同的样本对总体的估计相差并不大.
2.新华中学为了了解全校302名高一学生的身高情况,从中抽取30名学生进行测量,下列说法正确的是
(  )   
A.总体是302名学生
B.个体是每1名学生
C.样本是30名学生
D.样本容量是30
【解析】选D.该抽样是研究学生的身高,故总体、个体、样本数据均为学生身高,而不是学生.
3.某班50名学生中有30名男生,20名女生,用简单随机抽样抽取1名学生参加
某项活动,则抽到女生的可能性为
(  )
A.0.4
B.0.5
C.0.6
D.
【解析】选A.在简单随机抽样中,每个个体被抽到的机会相等,即
=0.4.
关键能力·合作学习
类型一 简单随机抽样的概念及其应用(数学抽象)
【题组训练】
1.在简单随机抽样中,某一个个体被抽中的可能性
(  )
A.与第几次抽样有关,第一次抽中的可能性要大些
B.与第几次抽样无关,每次抽中的可能性都相等
C.与第几次抽样有关,最后一次抽中的可能性要大些
D.每个个体被抽中的可能性无法确定
2.下面抽样方法是简单随机抽样的是
(  )
A.从平面直角坐标系中抽取5个点作为样本
B.可口可乐公司从仓库中的1
000瓶可乐中一次性抽取20瓶进行质量检查
C.某连队从200名战士中,挑选出50名最优秀的战士去参加抢险救灾活动
D.从10个手机中不放回地随机抽取2个进行质量检验(假设10个手机已编好号,对编号随机抽取)
3.从总数为N的一批零件中抽取一个容量为30的样本,若每个零件被抽到的可能性为25%,则N=______.?
4.某市环保部门有全市各县(市、区)报送的空气质量材料15份,为了了解全市的空气质量,要从中抽取一个容量为5的样本,试确定用何种方法抽取,请写出具体操作过程.
【解析】1.选B.在简单随机抽样中,每一个个体被抽中的可能性都相等,与第
几次抽样无关.
2.选D.A中平面直角坐标系中有无数个点,这与要求总体中的个体数有限不相
符,故错误;B中一次性抽取不符合简单随机抽样逐个抽取的特点,故错误;C
中50名战士是最优秀的,不符合简单随机抽样的等可能性,故错误.
3.依题意得
×100%=25%,所以N=120.
答案:120
4.总体容量小,样本容量也小,可用抽签法.
步骤如下:(1)将15份材料用随机方式编号,号码是1,2,3,…,15;
(2)将以上15个号码分别写在15张相同的小纸条上,揉成小球,制成号签;
(3)把号签放入一个不透明的容器中,充分搅拌均匀;
(4)从容器中不放回地逐个抽取5个号签,并记录上面的号码;
(5)找出和所抽号码对应的5份材料,组成样本.
【解题策略】
简单随机抽样的判断策略
判断一个抽样能否用简单随机抽样,关键是看它是否满足四个特点:①总体的个体数目有限;②从总体中逐个进行抽取;③是不放回抽样;④是等可能抽样.
【补偿训练】
在“世界读书日”前夕,为了了解某地5
000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析,则在这个问题中,5
000名居民的阅读时间的全体是
(  )
A.总体
B.个体
C.样本容量
D.从总体中抽取的一个样本
【解析】选A.由题目条件可知,5
000名居民的阅读时间的全体是总体,其中1名居民的阅读时间是个体,从5
000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.
类型二 抽签法及其应用(数学抽象)
【题组训练】
1.抽签法中确保样本代表性的关键是
(  )
A.制签
B.搅拌均匀
C.逐一抽取
D.抽取不放回
2.下列抽样中,适合用抽签法的有
(  )
A.从某厂生产的3
000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两工厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3
000件产品中抽取10件进行质量检验
3.齐鲁风采“七乐彩”的中奖号码是从分别标有1,2,…,30的三十个小球中逐个不放回地摇出7个小球来按规则确定中奖情况,这种从30个号码中选7个号码的抽样方法是______.?
4.某班有40名同学,随机抽取其中10名同学参加某项活动,请写出采用抽签法抽取的过程.
【解析】1.选B.逐一抽取、抽取不放回是简单随机抽样的特点,但不是确保代表性的关键,制签也不是确保代表性的关键.
2.选B.A,D两项总体容量较大,不适合用抽签法;对C项甲、乙两厂生产的产品质量可能差异明显.
3.三十个小球相当于号签,搅拌均匀后逐个不放回地抽取,是抽签法.
答案:抽签法
4.第一步,对这40名学生进行编号,可以编为1,2,3,…,40.
第二步,将号码写在形状、大小相同的号签上.
第三步,将号签放在同一不透明的箱中,并搅拌均匀.
第四步,从箱中每次抽取1个号签,连续抽取10次.
第五步,将与号签上的号码对应的同学抽出即得样本.
【解题策略】
(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.一般地,当样本容量和总体容量较小时,可用抽签法.
(2)应用抽签法时应注意以下几点:
①编号时,如果已有编号可不必重新编号;
②号签要求大小、形状完全相同;
③号签要均匀搅拌;
④要逐一不放回地抽取.
【补偿训练】
1.采用抽签法从含有3个个体的总体{1,3,8}中抽取一个容量为2的样本,则所有可能的样本是______.?
【解析】从含有3个个体的总体中任取2个即可组成样本,
所以所有可能的样本为{1,3},{1,8},{3,8}.
答案:{1,3},{1,8},{3,8}
2.某校高一年级有43名足球运动员,要从中抽出5人抽查学习负担情况.用抽签法设计一个抽样方案.
【解析】第一步:编号,把43名运动员编号为1~43;
第二步:制签,做好大小、形状相同的号签,分别写上这43个数;
第三步:搅拌,将这些号签放在暗箱中,进行均匀搅拌;
第四步:抽签入样,每次从中抽取一个,连续抽取5次(不放回抽取),从而得到容量为5的入选样本.
类型三 随机数表法及其应用(数学抽象)                   
【典例】为了检验某种药品的副作用,从编号为1,2,3,…,120的服药者中用随机数表法抽取10人作为样本,写出抽样过程.
【思路导引】
可按随机数表法的抽样步骤,逐步求解即可.
【解析】第一步,将120名服药者重新进行编号,分别为001,002,003,…,120;
第二步,在随机数表(教材P103)中任选一数作为初始数,如选第9行第7列的数3;
第三步,从选定的数3开始向右读,每次读取三位,凡不在001~120中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到074,100,094,052,080,003,105,107,083,092;
第四步,以上这10个号码所对应的服药者即是要抽取的对象.
【解题策略】
利用随机数表抽样的两个关键
1.确定起始位置
利用随机数表法抽取个体时,关键是先确定以表中的哪个数(哪行哪列)作为起点,以哪个方向作为读数的方向.
2.确定规则与编码
确定读数方向后再确定读数规则,一般地,编号为两位,则两位、两位地读取;编号为三位,则三位、三位地读取.
【跟踪训练】
1.设某总体是由分段为01,02,…,19,20的20个个体组成.利用下面的随机数表选取4个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第4个个体的分段是_____.?
7816
6572
0802
6314
0702
4369
9728
1098
3204
9234
4935
8200
3623
4869
6938
7491
【解析】从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字中小于20的分段依次为08,02,14,07,则第4个个体的分段为07.
答案:07
2.一个总体共有60个个体,其编号为00,01,02,…,59,现从中抽取一个容量为10的样本,请从随机数表的第8行第11列的数字开始,向右读,到最后一列后再从下一行左边开始继续向右读,依次获取样本号码,直到取满样本为止,则获得的样本号码是____________________________.?
附表:(第8行~第10行)
63
01
63
78
59 16
95
55
67
19 98
10
50
71
75
12
86
73
58
07 44
39
52
38
79(第8行)
33
21
12
34
29 78
64
56
07
82 52
42
07
44
38
15
51
00
13
42 99
66
02
79
54(第9行)
57
60
86
32
44 09
47
27
96
54 49
17
46
09
62
90
52
84
77
27 08
02
73
43
28(第10行)
【解析】第8行第11列的数字为1,由此开始,依次抽取号码,第一个号码为16,可取出;第二个号码为95>59,舍去.按照这个规则抽取号码,抽取的10个样本号码为16,55,19,10,50,12,58,07,44,39.
答案:16,55,19,10,50,12,58,07,44,39
课堂检测·素养达标
1.某校有40个班,每班50人,要求每班随机选派3人参加“学生代表大会”.在这个问题中样本容量是
(  )
A.40
B.50
C.120
D.150
【解析】选C.由于样本容量即样本的个数,抽取的样本的个数为40×3=120.
2.关于简单随机抽样的特点,有以下几种说法,其中不正确的是
(  )
A.要求总体中的个体数有限
B.从总体中逐个抽取
C.这是一种不放回抽样
D.每个个体被抽到的机会不一样,与先后顺序有关
【解析】选D.简单随机抽样,除具有A,B,C三个特点外,还具有:是等可能抽样,各个个体被抽取的机会相等,与先后顺序无关.
3.(教材二次开发:练习改编)某班有34位同学,座位号记为01,02,…,34,用如图的随机数表选取5组数作为参加青年志愿者活动的五位同学的座位号.选取方法是从随机数表第一行的第6列和第7列数字开始,由左到右依次选取两个数字,则选出来的第4个志愿者的座位号是
(  )
49 54 43 54 82 17 37 93 23 78 87 35 20
96 43 84 26 34 91 64 57 24 55 06 88 77
04 74 47 67 21 76 33 50 25 83 92 12 06
A.23
B.09
C.02
D.16
【解析】选D.从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字中小于34的分段依次为21,32,09,16,17其中第4个为16.
4.为了检验某种产品的质量,决定从1
001件产品中抽取10件进行检查,用随机数表法抽取样本的过程中,所编的号码的位数最少是________位.?
【解析】由于所编号码的位数和读数的位数要一致,因此所编号码的位数最少是四位.从0000到1000,或者是从0001到1001等.
答案:四
5.某班从40名学生中选1人作为市男篮啦啦队的成员,采用下面两种选法,则是抽签法的序号为_____.
?
(1)将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选;
(2)将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为啦啦队成员.
【解析】(1)满足抽签法的特征,是抽签法;
(2)不是抽签法,因为抽签法中所有的号签编号是互不相同的,而其中39个白球无法相互区分.
答案:(1)