6.4.2分层随机抽样的均值与方差、6.4.3百分位数学案-2025-2026学年高一上学期数学北师大版必修第一册

文档属性

名称 6.4.2分层随机抽样的均值与方差、6.4.3百分位数学案-2025-2026学年高一上学期数学北师大版必修第一册
格式 docx
文件大小 577.2KB
资源类型 教案
版本资源 北师大版(2019)
科目 数学
更新时间 2025-08-31 22:49:59

图片预览

文档简介

6.4.2 分层随机抽样的均值与方差、6.4.3百分位数
一、学习目标
1.通过实例,了解分层随机抽样的均值和方差的计算。
2.理解样本数据的方差与标准差的意义和作用,能从样本数据中计算出方差和标准差,并给出合理的解释.
3.理解百分位数的概念及统计意义,掌握求百分位数的基本步骤,能用样本估计百分位数.
二、学习重难点
重点
1.分层随机抽样的特点和适用范围
2.总体百分位数的估计.
难点
1.分层随机抽样的样本均值、方差的计算.
2.理解百分位数的统计意义.
三、知识梳理
1.分层随机抽样的平均数:一般地,将样本a1,a2,…,am和样本b1,b2,…,bn合并成一个新样本,则这个新样本的平均数为
于是,当已知上述两层构成的新样本中每层的平均数分别为 和 时,可得这个新样本的平均数为 .记 ,则这个新样本的平均数为______________,其中 称为___________.更一般地,设样本中不同层的平均数和相应权重分别为 和 ,则这个样本的平均数为 .为了简化表示,引进求和符号,记作 __________________________.
2.分层随机抽样的方差:设样本中不同层的平均数分别为 ,方差分别为 ,相应的权重分别为 ,则这个样本的方差为 __________________________________,其中 为这个样本的平均数.
3.百分位数:一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点:总体数据中的任意一个数小于或等于它的可能性是________.25%,50%,75%分位数是三个常用的百分位数.把总体数据按照从小到大排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是.因此这三个百分位数也称为总体的___________.其他常用的百分位数有1%,5%,10%,90%,95%,99%.总体的p分位数通常是未知的,人们用样本的p分位数来估计它,样本容量越大,估计越准确.
四、应用举例
例1.将一个总体分为A,B,C三层,其个体数之比为5∶3∶2.若用分层随机抽样方法抽取容量为100的样本,则应从C中抽取________个个体.若A,B,C三层的样本的平均数分别为15,30,20,则样本的平均数为________.
解析: 20 20.5 
由题意可知样本的平均数为
=5+3+2(5)×15+5+3+2(3)×30+5+3+2(2)×20=20.5
例2. 在对树人中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62.你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差作出估计吗?
解:把男生样本记为,其平均数记为,方差记为;把女生样本记为,其平均数记为,方差记为;把总样本数据的平均数记为,方差记为.
根据方差的定义,总样本方差为
.
由,可得.
同理可得.
因此,
. ①
由,根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系,可得总样本平均数为.
把已知的男生、女生样本平均数和方差的取值代入①,可得
.
总样本的方差为51.4862,据此估计高一年级学生身高的总体方差为51.4862.
例3.根据树人中学高一年级27名女生的身高样本数据,估计第25,50,75百分位数.
163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0
162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0
155.0 148.0 172.0 162.5 158.0 155.5 157.0 163.0 172.0
解:把27名女生的样本数据按从小到大排序,可得
148.0 149.0 154.0 154.0 155.0 155.0 155.5 157.0 157.0
158.0 158.0 159.0 161.0 161.0 162.0 162.5 162.5 163.0
163.0 164.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0
由,,,可知样本数据的第25,50,75百分位数为第7,14,21项数据,分别为155.5,161,164.据此可以估计树人中学高一年级女生的第25,50,75百分位数分别约为155.5,161,164.
例4. 根据下表,估计月均用水量的样本数据的80%和95%分位数.
解:由表可知,月均用水量在13.2 t以下的居民用户所占比例

在16.2 t以下的居民用户所占的比例为.
因此,80%分位数一定位于内.
由,
可以估计月均用水量的样本数据的80%分位数约为14.2,
类似地,由,
可以估计月均用水量的样本数据的95%分位数约为22.95.
五、课堂训练
1.某班成立了A、B两个数学兴趣小组,A组10人,B组30人,经过一周的补习后进行了一次测试,在该测试中,A组平均成绩为130分,方差115,B组平均成绩为110分,方差为215,则在这次测试中,全班学生的平均成绩和方差为( )
A.115分,105 B.115分,265 C.120分,105 D.120分,265
2.某班50名学生骑自行车和骑电动车到校所需时间统计如下:
到校方式 人数 平均用时/分钟 方差
骑自行车 20 30 36
骑电动车 30 20 16
则这50名学生到校时间的方差为( )
A.48 B.46 C.28 D.24
3.已知甲,乙两支篮球队各6名队员某场比赛的得分数据(单位:分)从小到大排列如下:甲队:7,12,12,20,,31;乙队:8,9,,19,25,28.这两组数据的中位数相等,且平均值也相等,则的值为( )
A.3 B.4 C.5 D.6
4.有一组样本数据为33,66,99,101,134,167,其方差为.现准备再添加一个新数据,当时,其与原有的6个数据构成的新样本的方差记为,当时,其与原有的6个数据构成的新样本的方差记为,则( )
A. B. C. D.
5.某地区为了解最近11天该地区的空气质量,调查了该地区过去11天的浓度(单位:),数据依次为53,56,69,70,72,79,65,80,45,41,.已知这组数据的极差为40,则这组数据的分位数为( )
A.71 B.75.5 C.79 D.72
6.为调查某地区中学生的每天睡眠时间,采用分层随机抽样的方法抽取初中生800人,其每天睡眠时间的平均数为9小时,方差为1,抽取高中生1200人,其每天睡眠时间的平均数为8小时,方差为0.5,则估计该地区中学生每天睡眠时间的方差为( )
A.0.96 B.0.94 C.0.79 D.0.75
7.(多选)甲、乙两名篮球运动员连续5场比赛的得分如图所示,则( )
A.甲得分的极差大于乙得分的极差 B.甲得分的平均数大于乙得分的平均数
C.甲得分的中位数大于乙得分的中位数 D.甲得分的方差大于乙得分的方差
8.(多选)某市2022年4月1日至10日的最低温度,分别为-5,-7,-10,-5,-3,-1,-3,-3,-4,-7(单位为℃),则关于该市这10天的日最低气温,下列说法正确的有( )
A.众数为-3℃ B.中位数为-5℃
C.最低气温的平均数为-4.8℃ D.最低气温的极差为9℃
9.已知一组数据6,7,8,8,9,10,则该组数据的方差是 .
10.某校为调查高三年级的体育成绩情况,随机调查了高三一班10名学生,体育成绩平均分是90,方差是3;高三二班15名学生,体育成绩平均分是85,方差是5,则这25名学生体育成绩的方差为________.
六、课后练习
1.已知一组统计数据,,…,满足:,,则这组数据的标准差等于( )
A. B.3 C.6 D.9
2.现有甲、乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为3,方差为5,乙组数据的平均数为5,方差为3.若将这两组数据混合成一组,则新的一组数据的方差为( )
A. B.4 C. D.5
3.在一组样本数据中,1,2,3,4出现的频率分别为,,,,且,则下面四种情形中,对应样本的方差最大的一组是( )
A., B.,
C., D.,
4.对“小康县”的经济评价标准:①年人均收入不低于7000元;②年人均食品支出不高于年人均收入的35%.某县有40万人,年人均收入如下表所示,年人均食品支出如图所示,则该县( )
年人均收入/元 0 2000 4000 6000 8000 10000 12000 16000
人数/万人 6 3 5 5 6 7 5 3
A.是小康县
B.达到标准①,未达到标准②,不是小康县
C.达到标准②,未达到标准①,不是小康县
D.两个标准都未达到,不是小康县
5.某校高一年级开设了校本课程,现从甲、乙两班各随机抽取了5名学生校本课程的学分,统计如表,,分别表示甲,乙两班抽取的5名学生学分的标准差,则( )
甲 8 11 14 15 22
乙 6 7 10 23 24
A. B. C. D.,的大小不能确定
6.某中学高二1班共有50名同学,其中男生30名,女生20名,采用按比例分层随机抽样方法,从全班学生中抽取20人测量其身高(单位:cm).已知在抽取的样本中,男生的平均身高为,女生的平均身高为,由此估计该班全体学生的平均身高约为( )
A. B. C. D.
7.(多选)为了加深师生对党史的了解,激发广大师生知史爱党、知史爱国的热情,某校举办了“学党史、育文化”的党史知识竞赛,并将1000名师生的竞赛成绩(满分100分,成绩取整数)整理成如图所示的频率分布直方图,则下列说法正确的是( )
A.a的值为0.005 B.估计成绩低于60分的有25人
C.估计这组数据的众数为75 D.估计这组数据的分位数为86
8.(多选)某学校高一年级有学生900人,其中男生500人,女生400人,为了获得该校高一全体学生的身高信息,现采用分层随机抽样的方法抽取容量为180的样本,经计算得男生样本数据的均值为170,方差为19,女生样本数据的均值为161,方差为28,则下列说法中正确的是( )
A.样本中男生有100人 B.抽取的样本数据的方差为43
C.抽取的样本数据的均值为166 D.抽取的样本数据的均值为165.5
9.一个样本容量为7的样本的平均数为5,方差为2.现样本加入新数据4,5,6,此时样本容量为10,方差为____.
10.为了了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60m;从南方抽取了200个男孩,平均身高1.50m,由此可推断我国13岁男孩的平均身高为_____________.
答案及解析
三、自主预习、知识梳理
1.;权重;.
2.
3.p;四分位数
五、课堂练习
1.答案:B
解析:依题意,,,,,
所以全班学生的平均成绩(分);
全班学生成绩的方差为
.
故选:B
2.答案:A
解析:由已知可得,骑自行车平均用时(单位:分钟),方差,
骑电动车平均用时(单位:分钟),方差,骑自行车人数占总数的,骑电动车人数占总数的.
故这50名学生到校所需时间的平均数,方差.
故选A.
3.答案:A
解析:甲队的中位数是,乙队的中位数是,解得;所以乙队的平均数为,
甲队的平均数为,解得;
所以.
故选:A.
4.答案:C
解析:数据波动越大,方差越大.原样本数据的平均数为100,添加新数据后,新样本数据更集中,.添加新数据后,新样本数据波动更大,.
5.答案:C
解析:因为这组数据的极差为40,最小值为41,所以m应为最大值,为,将这组数据从小到大排列为41,45,53,56,65,69,70,72,79,80,81,
因为,所以这组数据的分位数为79,故选C.
6.答案:B
解析:估计该地区中学生每天睡眠时间的平均数为(小时),
估计该地区中学生每天睡眠时间的方差为.故选B.
7.答案:BC
解析:甲5场比赛得分由低到高分别为15,16,18,21,30,
乙5场比赛得分由低到高分别为4,10,16,22,38,
则甲的极差为,乙的极差为,
故甲得分的极差小于乙得分的极差,故A错误;
甲的平均数,乙的平均数,
则甲得分的平均数大于乙得分的平均数,故B正确;
甲的中位数为18,乙的中位数为16,
则甲得分的中位数大于乙得分的中位数,故C正确;
甲的方差,
乙的方差,
故甲得分的方差小于乙得分的方差,故D错误.
故选:BC
8.答案:ACD
解析:将这10个数据按从小到大排列为-10,-7,-7,-5,-5,-4,-3,-3,-3,-1,其中-3出现3次,故A正确;
中位数为第5,6个数据的平均数为-4.5,B错误;
平均数为,故C正确;
极差是.故选ACD.
9.答案:
解析:由题意,该组数据的平均数为,
所以该组数据的方差是.
10.答案:10.2
解析:由题意可知:这25名学生体育成绩的平均数为,
所以这25名学生体育成绩的方差为.
故答案为:10.2.
六、课后练习
1.答案:B
解析:设这组数据的平均数为,则,所以方差,所以标准差.故选B.
2.答案:D
解析:设甲组数据分别为、、、,乙组数据分别为、、、,
甲组数据的平均数为,可得,方差为,可得,
乙组数据的平均数为,可得,方差为,可得,
混合后,新数据的平均数为,
方差为
.
故选:D.
3.答案:B
解析:对于A选项,该组数据的平均数为,
方差为;
对于B选项,该组数据的平均数为,方差为;
对于C选项,该组数据的平均数为,方差为;
对于D选项,该组数据的平均数为,方差为.
因此,B选项这一组的方差最大.故选B.
4.答案:B
解析:由题中图表可知,年人均收入为(元),达到了标准①;年人均食品支出为(元),则年人均食品支出占年人均收入的,未达到标准②.所以不是小康县.
5.答案:B
解析:根据表中数据,计算甲班5名学生学分的平均数为

乙班5名学生学分的平均数为

甲班5名学生学分的方差为

乙班5名学生学分的方差为

,即.故选B.
6.答案:D
解析:因为抽样比例为,则样本中男生有人,
女生有人,
所以样本的平均身高为,
由此估计该班全体学生的平均身高约为.
故选:D
7.答案:ACD
解析:对于A,由,得,故A正确;
对于B,估计成绩低于60分的有(人),故B错误;
对于C,估计这组数据的众数为75,故C正确;
对于D,设这组数据的分位数为m,则,解得,故D正确.故选ACD.
8.答案:ABC
解析:样本中男生有(人),故A正确;抽取的样本数据的均值为,故C正确,D错误;
抽取的样本数据的方差为.故B正确.
故选ABC.
9.答案:
解析:设这个样本容量为7的样本数据分别为,,,,
则,
所以,,
所以.
当加入新数据4,5,6后,平均数,
方差.
故答案为:
10.答案:1.56m
解析:根据平均数的计算公式,我国13岁男孩的平均身高为:米.
故答案为:1.56m.