9.1 随机抽样-【新教材】2020-2021学年人教A版(2019)高中数学必修第二册讲义

文档属性

名称 9.1 随机抽样-【新教材】2020-2021学年人教A版(2019)高中数学必修第二册讲义
格式 docx
文件大小 121.7KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2021-05-23 21:45:30

图片预览

文档简介

了解用样本平均数估计总体平均数
2、掌握全面调查与抽样调查
3、理解分层抽样的步骤
一、随机抽样
像人口普查那样,对每一个调查对象都惊醒调查的方法,称为全面调查,又称普查.在一个调查中,我们把调查对象的全体成为总体,组成总体的每一个调查对象成为个体.
像这样,根据一定目的,从总体中抽取-一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.我们把从总体中抽?取的那部分个体称为样本,?样本中包含的个体数称为样本量.调查样本获得的变量值称为样本的观测数据,简称样本数据.
二、简单的随机抽样
一般地,设一个总体含有N?(N为正整数)个个体,从中逐个抽取n?(1≤n如果抽取是不放回的,且每次抽取时总体内未进人样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.
1、抽签法
(1)概念
先给总体中的N个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌,最后从盒中不放回地逐个抽取号签,知道抽足样本所需要的个数
(2)优缺点
优点:简单易行,当总体较小时,号签搅拌均匀很容易,个体有均等的机会被抽取,从而能保证样本的代表性
缺点:当总体较大时,费时、费力,且号签很难被搅拌均匀,产生的样本代表性差,导致抽样的不公平
2、随机数法
(1)概念
对总体中的N个个体编号,用随机数工具产生编号范围内的整体随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,知道抽足样本所需要的个数,如果生产的随机数有重复,即统一编号被多次抽到,可以剔除重复的编号并产生随机数,直到产生的不同编号个数等于样本所需要的个数
(2)优缺点
优点:简单易行,它很好的解决了抽签法中遇到的当总体个数较多时制签难、号签很难被搅拌均匀的问题
缺点:当总体较大时,需要的样本容量较大时,不太方便
一般地,总体中有N个个体,它们的变量值分别为,,?.,,则称
==
为总体均值,又称总体平均数,如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记?为,,?...,其中;出现的频数:?(i=1,?2,?....k),则总体均值还可以写成加权平均数的形式
=
如果从总体中抽取-一个容量为n的样本,它们的变量值分别?为,,...?,则称
为样本均值,又称样本平均数.在简单随机抽样中,我们常用样本平均数
为样本均值,又称样本平均数.在简单随机抽样中,我们常用样本平均数去估计总体平均数.
三、分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
1.某学校共有1000名学生参加知识竞赛,其中男生400人,为了解该校学生在知识竞赛中的情况,采取分层抽样随机抽取了100名学生进行调查,分数分布在
分之间,根据调查的结果绘制的学生分数频率分布直方图如图所示:
将分数不低于750分的学生称为“高分选手”.
(参考公式:
,期中

0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
(1)求
的值,并估计该校学生分数的平均数、中位数和众数(同一组中的数据用该组区间的中点值作代表);
(2)现采用分层抽样的方式从分数落在

内的两组学生中抽取10人,再从这10人中随机抽取3人,记被抽取的3名学生中属于“高分选手”的学生人数为随机变量
,求
的分布列及数学期望;
(3)若样本中属于“高分选手”的女生有10人,完成下列
列联表,并判断是否有97.5%%的把握认为该校学生属于“高分选手”与“性别”有关?
?
属于“高分选手”
不属于“高分选手”
合计
男生
?
?
?
女生
?
?
?
合计
?
?
?
【答案】
(1)解:由题意知

解得

样本平均数为

中位数650,众数600
(2)解:由题意,从
中抽取7人,从
中抽取3人,
随机变量
的所有可能取值有0,1,2,3.

所以随机变量
的分布列为:
0
1
2
3
随机变量
的数学期望
(3)解:由题可知,样本中男生40人,女姓60人,属于“高分选手”的25人,其中女姓10人;得出以下
列联表;
?
属于“高分选手”
不属于“高分选手”
合计
男生
15
25
40
女生
10
50
60
合计
25
75
100

所以有97.5%%的把握认为该校学生属于“高分选手”与性别有关
【考点】众数、中位数、平均数
【解析】(1)
由已知条件结合平均数、中位数以及众数的公式代入数值计算出结果即可。
(2)由题意,从[550,
650
)中抽取7人,从[750
,
850
)中抽取3人,随机变量X服从超几何分布,确定X的取值,求对应概率即可得到分布列,求出期望即可;
(3)由题可知,样本中男生40人,女生60人属于“高消费群”的25人,其中女生10人,列出列联表计算出K2=5.024查临界值表判断即可.
2.某家水果店的店长为了解本店苹果的日销售情况,记录了近期连续120天苹果的日销售量(单位:
),并绘制频率分布直方图如下:
(1)请根据频率分布直方图估计该水果店苹果日销售量的众数和平均数;(同一组中的数据以这组数据所在区间中点的值作代表)
(2)一次进货太多,水果会变得不新鲜;进货太少,又不能满足顾客的需求.店长希望每天的苹果尽量新鲜,又能80%地满足顾客的需求(在10天中,大约有8天可以满足顾客的需求).请问每天应该进多少千克苹果?(精确到整数位)
.【答案】
(1)解:如图示:区间
频率最大,所以众数为85,
平均数为:
(2)解:日销售量[60,90)的频率为
,日销量[60,100)的频率为

故所求的量位于


故每天应该进98千克苹果
【考点】频率分布直方图,众数、中位数、平均数,随机抽样和样本估计总体的实际应用
【解析】(1)利用已知条件结合频率分布直方图估计出众数和平均数。
(2)利用已知条件结合频率分布直方图中各小组的矩形的面积等于各小组的频率,得出日销售量[60,90)的频率为
,日销量[60,100)的频率为
,故所求的量位于

得出每天应该进的苹果的重量。
3.为了树立和践行绿水青山就是金山银山的理念,加强环境的治理和生态的修复,某市在其辖区内某一个县的27个行政村中各随机选择农田土壤样本一份,对样本中的铅、锦、铭等重金属的含量进行了检测,并按照国家土壤重金属污染评价级标准(清洁、尚清洁、轻度污染、中度污染、重度污染)进行分级,绘制了如图所示的条形图
(1)从轻度污染以上(包括轻度污染)的行政村中按分层抽样的方法抽取6个,求在轻度、中度、重度污染的行政村中分别抽取的个数;
(2)规定:轻度污染记污染度为1,中度污染记污染度为2,重度污染记污染度为3.从(1)中抽取的6个行政村中任选3个,污染度的得分之和记为X

求X的数学期望.
【答案】
(1)解:轻度污染以上(包括轻度污染)的行政村共
个,
所以从轻度污染的行政村中抽取
个,从中度污染的行政村中抽取
个,从重度污染的行政村中抽取

(2)解:X的所有可能取值为3,4,5,6,7.





所以X的分布列为
X
3
4
5
6
7
P
所以
【考点】分层抽样方法,离散型随机变量及其分布列,离散型随机变量的期望与方差
【解析】(1)由分层抽样的定义代入数值计算出结果即可。
(2)根据题意即可得出X的取值,再由概率的公式求出对应的X的概率由此得到X的分布列,结合数学期望公式计算出答案即可。
4.一机构随机调查了某小区100人的月收入情况,将所得数据按





(单位:元)分成六组,并且作出如图所示的频率分布直方图.
(1)根据频率分布直方图估计样本数据的中位数;
(2)根据题目分组情况,按分层抽样的方法在


三组中抽取6人,再从这6人中抽取2人,求至少有一人收入在
的概率.
【答案】
(1)解:设数据在
内的概率为m,由频率分布直方图得,
?
易知中位数在

设中位数为
,则

解得

(2)解:收入在


这三组的人数分别为10,15,5,
所以按分层抽样的方法在各组抽取的人数分别2,3,1.
记收入在
的2人分别为

,收入在
的3人分别为


,收入在
的1人为

通过列举法可得从这6人中抽取2人的取法有














,共15种,
其中至少有一人收入在
的取法有











,共12种,
所以至少有一人收在
概率为

【考点】频率分布直方图,众数、中位数、平均数,列举法计算基本事件数及事件发生的概率
【解析】(1)
设数据在??内的概率为m,由频率分布直方图得,

即可求出中位数;
(2)通过列举法求出概率。
?
1.中国数学奥林匹克由中国数学会主办,是全国中学生级别最高、规模最大、最具影响力的数学竞赛.某重点高中为参加中国数学奥林匹克做准备,对该校数学集训队进行一次选拔赛,所得分数的茎叶图如图所示,则该集训队考试成绩的众数与中位数分别为(???

A.?85,75???????????????????????????????B.?85,76???????????????????????????????C.?74,76???????????????????????????????D.?75,77
2.在如图所示的茎叶图中,若甲组数据的众数为16,则乙组数据的平均数为(???

A.?12??????????????????????????????????????????B.?10??????????????????????????????????????????C.?8??????????????????????????????????????????D.?6
3.原油作为“工业血液”?“黑色黄金”,其价格的波动牵动着整个化工产业甚至世界经济.小李在某段时间内共加油两次,这段时间燃油价格有升有降,现小李有两种加油方案:第一种方案是每次加油40升,第二种方案是每次加油200元,则下列说法正确的是(???

A.?第一种方案更划算????????????????B.?第二种方案更划算????????????????C.?两种方案一样????????????????D.?无法确定
4.艺术体操比赛共有7位评委分别给出某选手的原始评分,评定该选手的成绩时,
从7个原始评分中去掉1个最高分、1个最低分,得到5个有效评分.5个有效评分与7个原始评分相比,不变的数字特征是(?
??)
A.?中位数??????????????????????????????????B.?平均数??????????????????????????????????C.?方差??????????????????????????????????D.?极差
参考答案
1【答案】
B
【解析】
解:由茎叶图知,出现的数据最多的是
,故众数为

由于数据总数为14个,故中位数为第七个和第八个数据的平均数,即:
2.【答案】
A
【解析】
由题意,甲组数据的众数为16,得

所以乙组数据的平均数为

3.【答案】
B
【解析】
设小李这两次加油的油价分别为

升?

升,则:
方案一:两次加油平均价格为

方案二:两次加油平均价格为

故无论油价如何起伏,方案二比方案一更划算.
4.【答案】
A
【解析】
从7个原始评分去掉1个最高分、1个最低分,得到5个有效评分,
其平均数、极差、方差都可能会发生改变,
不变的数字特征数中位数.