(共70张PPT)
4.2 分层随机抽样的均值与方差
4.3 百分位数
第六章 §4 用样本估计总体的数字特征
学习目标
1.结合具体实例,会求分层随机抽样的样本均值和样本方差,培养数学运算的核心素养.
2.结合实例,能用样本估计百分位数,理解百分位数的统计含义,会求样本数据的p分位数,提升数学运算、数据分析的核心素养.
任务一 分层随机抽样的平均数
问题导思
新知构建
求分层抽样的平均数的步骤为:(1)求样本中不同层的平均数;(2)应用分层随机抽样的平均数公式计算.
微提醒
典例
1
规律方法
对点练1.(1)已知总体划分为3层,按比例用分层随机抽样法抽样,各层的样本量及样本平均数如下表:
估计总体平均数为
A.73 B.74
C.76 D.80
√
分层 样本量 样本平均数
第一层 10 55
第二层 30 75
第三层 10 90
(2)某学校高一年级在校人数为600人,其中男生350人,女生250人,为了解学生身高发展情况,按分层随机抽样的方法抽出的男生身高为一个样本,其样本平均数为172 cm,抽出的女生身高为一个样本,其样本平均数为160 cm,则该校高一学生的平均身高的估计值为
A.162 cm B.167 cm
C.164 cm D.169 cm
√
返回
任务二 分层随机抽样的方差
问题导思
新知构建
求分层随机抽样的方差的步骤:(1)求样本中不同层的平均数;(2)求样本中不同层的方差;(3)应用分层随机抽样的方差公式计算.
微提醒
典例
2
利用样本中不同层的平均数与方差,可以计算这个样本的平均数与方差,所得结果与直接计算所得的平均数与方差相同.
规律方法
抽取次序 1 2 3 4 5 6 7 8 9 10
身高 155 158 156 157 160 161 159 162 169 163
返回
抽取次序 1 2 3 4 5 6 7 8 9 10
身高 155 158 156 157 160 161 159 162 169 163
任务三 百分位数
问题3.我们在根据某种统计结果下结论时,经常要用到某个百分数,例如我们经常说,这次数学考试有90%的同学在85分以上,再例如:去年冬天我们市的雾霾天气已经减少到5%以下,那么这里的90%和5%在统计学中是什么意思呢?
提示:“这次数学考试有90%的同学在85分以上”的意思是说高于85分的同学占整个班级人数的90%;“去年冬天我们市的雾霾天气已经减少到5%以下”的意思是去年冬天雾霾天气占整个冬天天数的比例不到5%.
问题导思
1.百分位数
新知构建
p分
位数 一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点:总体数据中的任意一个数____________它的可能性是p
四分
位数
小于或等于
25%
50%
75%
从小到大
2.计算一组n个数据的p分位数的一般步骤
第一步:按照__________排列原始数据;
第二步:计算i=____;
第三步:若i不是整数,大于i的最小整数为j,则p分位数为_______数据;若i是整数,则p分位数为第i项与第(i+1)项数据的________.
从小到大
np
第j项
平均数
百分位数不一定是数据中的数;中位数相当于50%分位数.
微提醒
典例
3
(2)请你找出珍珠质量较小的前15%的珍珠质量;
解:因为共有12个数据,所以12×15%=1.8,则15%分位数是第2个数据为7.9 g.
即珍珠质量较小的前15%的珍珠有2个,它们的质量分别为7.8 g,7.9 g.
(3)若用25%,50%,95%分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.
解:由(1)可知样本数据的25%分位数是8.15 g,50%分位数为8.5 g,95%分位数是9.9 g,
所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于或等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.
求百分位数时的注意点
1.一定要将数据按照从小到大的顺序排列.
2.一定要确定i=np的结果是否为整数.
规律方法
对点练3.(1)第33届夏季奥林匹克运动会于2024年7月26日至8月11日在法国巴黎举行,金牌榜前10名的国家的金牌数依次为40,40,20,18,16,15,14,13,12,12,则这10个数的60%分位数是
A.14.5 B.15
C.16 D.17
√
(2)有一组数据,按从小到大排列为1,2,6,8,9,m,这组数据的40%分位数等于他们的平均数,则m为
A.9 B.10
C.11 D.12
√
返回
任务四 分层随机抽样的均值与方差的综合应用
典例
4
利用样本中不同层的平均数与方差,可以计算这个样本的平均数与方差,所得结果与直接计算所得的平均数与方差相同.
规律方法
对点练4.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100]得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值及样本成绩的第75百分位数;
解:由每组小矩形的面积之和为1,得0.05+0.1+0.2
+10a+0.25+0.1=1,解得a=0.030,
成绩在[40,80)内的频率为0.05+0.1+0.2+0.3=0.65,
在[40,90)内的频率为0.05+0.1+0.2+0.3+0.25=0.9,
显然第75百分位数m∈[80,90),由0.65+(m-80)×0.025=0.75,解得m=84,
所以第75百分位数为84.
返回
课堂小结
任务
再现 1.分层随机抽样的平均数与方差.2.百分位数
方法
提炼 转化的思想方法
易错
警示 求百分位数时,未排序导致错误
随堂评价
1.已知一组数据为-1,1,4,4,2,6,则该组数据的第50百分位数是
A.1 B.2
C.3 D.4
√
2.某单位共有员工100人,其中年轻人有20人,平均年薪为5万元,中年人有80人,平均年薪为8万元,则该单位员工的平均年薪为
A.8万元 B.7.4万元
C.6.5万元 D.5万元
√
3.为了了解某班学生数学成绩,利用分层随机抽样抽取了一个10人的样本,统计如下:
则可估计全班学生数学的平均分和方差分别为
A.77.5,5 B.77.5,11 C.78,5 D.78,11
√
学生数 平均分 方差
男生 6 80 7
女生 4 75 2
4.某次体检中,甲班学生体重检测数据的平均数是55 kg,方差为16;乙班学生体重检测数据的平均数是60 kg,方差为21.又甲、乙两班人数之比为3∶2,则甲、乙两班全部学生体重的方差为_______.
24
返回
课时分层评价
1.已知一组数据:2,5,7,x,10的平均数为6,则该组数据的第60百分位数为
A.5.5 B.6
C.6.5 D.7
√
2.某学校的高一、高二及高三年级分别有学生1 000人、800人、1 200人,用分层抽样的方法从全体学生中抽取一个容量为30人的样本,抽出的高一、高二及高三年级学生的平均身高为165 cm、168 cm、171 cm,估计该校学生的平均身高是
A.166.4 cm B.168.2 cm C.169.1 cm D.170.0 cm
√
3.我国智慧港口的建设飞速发展,作为智能化搬运设备的AGV(自动化导引运输车)作用越发凸显.经统计,某港口某次运输中,有27台AGV的停车误差为2厘米,有45台AGV的停车误差为1厘米,有11台AGV没有停车误差,则该港口本次运输中所有AGV的平均停车误差约为
A.1.17厘米 B.1.18厘米
C.1.19厘米 D.1.20厘米
√
4.某公司为了调查员工的健康状况,由于女员工所占比重大,按性别分层,用按比例分配的分层随机抽样的方法抽取样本,若样本中有女员工39人,男员工21人,女员工的平均体重为50 kg,标准差为6,男员工的平均体重为70 kg,标准差为4.则所抽取的所有员工的体重的方差为
A.29 B.120
C.100 D.112
√
√
√
√
6.(多选题)甲、乙两支田径队的体检结果为:甲队体重的平均数为60 kg,方差为200,乙队体重的平均数为70 kg,方差为300,又已知甲、乙两队的队员人数之比为1∶4,则下列说法正确的是
A.甲、乙两队全部队员的平均体重是68 kg
B.甲、乙两队全部队员的平均体重是65 kg
C.甲、乙两队全部队员的方差是296
D.甲、乙两队全部队员的方差是306
√
√
7.(开放题)为科普航天知识,某校组织学生参与航天知识竞答活动,某班8位同学成绩如下:7,6,8,9,8,7,10,m,若去掉m,该组数据的第25百分位数保持不变,则整数m(1≤m≤10)的值可以是_________________
(写出一个满足条件的m值即可).
7位同学成绩如下:6,7,7,8,8,9,10,其第25百分位数为第二个数据,为7,要使第25百分位数保持不变,m不小于7就可以.故答案为7(8,9,10均可).
7(8,9,10均可)
8.第九届亚冬会期间,某班组织全班学生开展有关亚冬会知识的竞赛活动.已知该班男生30人,女生20人,按照分层抽样的方法从该班共抽取10人,进行一轮答题.相关统计情况如下:男生答对题目的平均数为10,方差为1;女生答对题目的平均数为15,方差为0.5,则这10人答对题目的方差为______.
6.8
3
10.(10分)随机抽取某4S店20位员工今年的销售业绩,统计如下所示(单位:辆):
26 34 28 32 35 38 22 39 23 25
28 30 24 38 33 33 22 34 21 27
(1)若需要有10%的优秀员工,应将标准设定在多少?
解:将20个样本数据从小到大进行排序如下所示(单位:辆):
21 22 22 23 24 25 26 27 28 28
30 32 33 33 34 34 35 38 38 39
由于20×90%=18是整数,所以样本数据的90%分位数为样本中第18和19两个数的平均数,故为38.
因此,可以规定如下:若需要有10%的优秀员工,应将标准设定在38辆.
(2)若要给至少80%的员工年度考评评级为通过,应将标准设定在多少?
解:由于20×20%=4是整数,所以样本数据的20%分位数为样本中第4和5两个数的平均数,故为23.5.
因此,可以规定如下:若要给至少80%的员工年度考评评级为通过,应将标准设定在23辆或22辆或21辆.
11.国家射击运动员甲在某次训练中的5次射击成绩(单位:环)为9,6,m,10,8,其中m为整数,若这5次射击成绩的第40百分位数为8,则m=
A.6 B.7
C.8 D.9
√
12.(多选题)现有甲、乙两组数据,甲组数据为x1,x2,…,x16;乙组数据为3x1-9,3x2-9,…,3x16-9,若甲组数据的平均数为m,标准差为n,极差为a,第60百分位数为b,则下列说法一定正确的是
A.乙组数据的平均数为3m-9
B.乙组数据的极差为3a
C.乙组数据的第60百分位数为3b-9
D.乙组数据的标准差为n
√
√
√
不妨设甲组数据从小到大排列为x1,x2,…,x16,则乙组数据从小到大排列为3x1-9,3x2-9,…,3x16-9,因为甲组数据的平均数为m,标准差为n,极差为a,第60百分位数为b,则a=x16-x1,又16×60%=9.6,所以b=x10,所以乙组数据的平均数为3m-9,故A正确;乙组数据的极差为3x16-9-(3x1-9)=3(x16-x1)=3a,故B正确;乙组数据的第60百分位数为3x10-9=3b-9,故C正确;乙组数据的标准差为3n,故D错误.故选ABC.
13.某校高一年级抽样的30名女生的身高(cm)数据从小到大排序如下:
148 149 154 154 155 155 155 157 157 158 158 159 160 161 161 162 162 162 162 163 163 163 164 164 165 165 170 171 172 172
经计算,原来这组数据的第80百分位数为164.5.现将其去掉最后一个数据172,则剩余数据的第80百分位数________(选填“变大”“变小”或“不变”).
变小
原来30个数据的第80百分位数为164.5,去掉最后一个数据172,还有29个数据,因为29×80%=23.2,所以剩余数据的第80百分位数为第24个数据,即为164,因为164<164.5,所以剩余数据的第80百分位数变小.
14.(10分)某地区有小学生9 000人,初中生8 600人,高中生4 400人,教育局组织“防溺水”网络知识问答,现用分层抽样的方法从中抽取220名学生,对其成绩进行统计分析,得到如下图所示的频率分布直方图.
(1)根据频率分布直方图,估计该地区所有学生知识问答成绩的平均数和众数;
解:一至六组的频率分别为0.10,0.15,0.15,0.30,0.25,0.05,
平均数=45×0.10+55×0.15+65×0.15+75×0.30+85×0.25+95×0.05=71,
由图可知,众数为75.
以样本估计总体,该地区所有学生知识问答成绩的平均数为71分,众数为75分.
(2)成绩位列前10%的学生平台会生成“防溺水达人”优秀证书,试估计获得“防溺水达人”的成绩至少为多少分;
解:前4组的频率之和为0.10+0.15+0.15+0.30=0.70<0.90,
前5组的频率之和为0.70+0.25=0.95>0.90,
第90%分位数落在第5组,设为x,则0.70+(x-80)×0.025=0.90,解得x=88.
“防溺水达人”的成绩至少为88分.
15.(5分)已知一组数据34,36,39,41,44,45,x,50的第65 百分位数是45,那么实数 x的取值范围是
A.[45,+∞) B.(45,+∞)
C.(45,50) D.[45,50]
√
因为8×65%=5.2,所以这组数据的第65百分位数是第6项数据45,则x≥45.故选A.
16.(15分)某校举行了“喜迎国庆,强国有我”知识竞赛,全校共60名学生参赛,比赛结束后,将这60名学生的比赛成绩(单位:分)进行整理,按[50,60),[60,70),[70,80),[80,90),[90,100]分成5组,并绘制成如图所示的频率分布直方图.
(1)求a,并估计样本的80%分位数;
解:由频率分布直方图,得10×(0.005+0.025+0.035+
0.020+a)=1,解得a=0.015;
成绩落在[50,80)的频率为10×(0.005+0.025+0.035)=
0.65,
成绩落在[50,90)的频率为0.65+10×0.020=0.85,
因此80%分位数m∈[80,90),则0.65+(m-80)×0.020=0.8,解得m=87.5,
所以a=0.015,80%分位数为87.5.
返回4.2 分层随机抽样的均值与方差
4.3 百分位数
学习目标 1.结合具体实例,会求分层随机抽样的样本均值和样本方差,培养数学运算的核心素养. 2.结合实例,能用样本估计百分位数,理解百分位数的统计含义,会求样本数据的p分位数,提升数学运算、数据分析的核心素养.
任务一 分层随机抽样的平均数
问题1.某公司的高收入员工月平均工资是11 000元,中等收入员工月平均工资是6 500元,低收入员工月平均工资是2 900元.能否认为该公司员工的月平均工资收入是=6 800(元)?这样计算平均数的方法合理吗?
提示:不能.由于每一类员工所占的比例不同,特别是高收入者很少时,他们的月平均工资对该公司员工的月平均工资影响较小,因此上述计算方法显然不合理.
1.定义:一般地,将样本a1,a2,…,am和样本b1,b2,…,bn合并成一个新样本,则这个新样本的平均数为=·+·.
若已知上述两层构成的新样本中每层的平均数分别为和,则这个新样本的平均数为+.
记w1=,w2=,则这个新样本的平均数为w1+w2,其中w1,w2称为权重.
2.一般地,设样本中不同层的平均数和相应权重分别为,,…,和w1,w2,…,wn,则这个样本的平均数为w1+w2+…+wn.记作wi=w1+w2+…+wn.
[微提醒] 求分层抽样的平均数的步骤为:(1)求样本中不同层的平均数;(2)应用分层随机抽样的平均数公式计算.
(链教材P172例5)甲、乙两位同学相约晚上在某餐馆吃饭.他们分别在A,B两个网站查看同一家餐馆的好评率.甲在网站A查到的好评率是98%,而乙在网站B查到的好评率是85%.综合考虑这两个网站的信息,由以上所给条件,能否得到这家餐馆的总好评率?
解:不能.理由如下:好评率是由好评人数除以总评价人数得到的,98%的好评率意味着如果有100人评价,那么其中98人给了好评.
设在网站A评价该餐馆的人数为n1,其中给出好评的人数为m1;在网站B评价该餐馆的人数为n2,其中给出好评的人数为m2.
由题目条件,=98%,=85%.
综合A,B两个网站的信息,这家餐馆的总好评率应为,化简得=0.98·+0.85·.
其中,分别是各自的权重,总好评率等于相应的好评率与其权重乘积的和.
所以除非再知道A,B两个网站评价人数的比例关系,否则不能求出总好评率.
分层随机抽样的平均数的计算方法
1.第i层的权重wi,第i层的个体数xi,样本容量n,三者满足wi=,已知其中2个可求另外1个.
2.在利用公式求分层随机抽样的平均数时,要清楚公式中各符号的含义.
对点练1.(1)已知总体划分为3层,按比例用分层随机抽样法抽样,各层的样本量及样本平均数如下表:
分层 样本量 样本平均数
第一层 10 55
第二层 30 75
第三层 10 90
估计总体平均数为( )
A.73 B.74
C.76 D.80
(2)某学校高一年级在校人数为600人,其中男生350人,女生250人,为了解学生身高发展情况,按分层随机抽样的方法抽出的男生身高为一个样本,其样本平均数为172 cm,抽出的女生身高为一个样本,其样本平均数为160 cm,则该校高一学生的平均身高的估计值为( )
A.162 cm B.167 cm
C.164 cm D.169 cm
答案:(1)B (2)B
解析:(1)根据题意,估计总体平均数为=74.故选B.
(2)由题意可知,=172,=160,且M=350,N=250,所以样本平均数=+=×172+×160=167(cm),故该校高一学生的平均身高的估计值为167 cm.故选B.
任务二 分层随机抽样的方差
问题2.某中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62.你能由这些数据计算出总样本的方差,并对高一年级全体学生身高的总体方差作出估计吗?
提示:把男生样本记为x1,x2,…,x23,其平均数记为,方差记为;把女生样本记为y1,y2,…,y27,其平均数记为,方差记为;把总样本数据的平均数记为,方差记为s2,则=×170.6+×160.6=165.2,根据方差的定义,总样本方差为s2=[(xi-)2+(yj-)2]=[(xi-+-)2+(yj-+-)2].
由(xi-)=xi-23=0,可得2(xi-)(-)=2(-(xi-)=0.
同理可得2(yj-)(-)=0.因此,s2=[(xi-)2+-)2+(yj-)2+-)2]={23[+(-)2]+27[+(-)2]}.①;把已知男生、女生样本平均数和方差的取值及的值代入①,可得s2={23×[12.59+(170.6-165.2)2]+27×[38.62+(160.6-165.2)2]}=51.486 2.
故总样本的方差为51.486 2,据此估计高一年级全体学生身高的总体方差为51.486 2.
分层随机抽样的方差
设样本中不同层的平均数分别为,,…,,方差分别为,,…,,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=wi[+(-)2],其中为这个样本的平均数.
[微提醒] 求分层随机抽样的方差的步骤:(1)求样本中不同层的平均数;(2)求样本中不同层的方差;(3)应用分层随机抽样的方差公式计算.
(链教材P173例6)在对某高中1 500名高二年级学生的百米成绩的调查中,采用按学生性别比例分配的分层随机抽样抽取100人,已知这1 500名高二年级学生中男生有900人,且抽取的样本中男生成绩的平均数和方差分别为13.2秒和13.36,女生成绩的平均数和方差分别为15.2秒和17.56.
(1)求抽取的总样本的平均数;
(2)试估计高二年级全体学生的百米成绩的方差.
解:(1)样本中男生的人数为900×=60;女生的人数为100-60=40.
所以总样本的平均数为==14.
(2)记总样本的方差为s2,
则s2={60×[13.36+(13.2-14)2]+40×[17.56+(15.2-14)2]}=16.
所以估计高二年级全体学生的百米成绩的方差为16.
利用样本中不同层的平均数与方差,可以计算这个样本的平均数与方差,所得结果与直接计算所得的平均数与方差相同.
对点练2.某校高一年级有男生200人,女生100人.为了解该校全体高一学生的身高信息,按性别比例进行分层随机抽样,抽取总样本量为30的样本,并观测样本的指标值(单位:cm),计算得男生样本的身高平均数为169,方差为39.下表是抽取的女生样本的数据:
抽取次序 1 2 3 4 5 6 7 8 9 10
身高 155 158 156 157 160 161 159 162 169 163
记抽取的第i个女生的身高为xi(i=1,2,3,…,10),样本平均数=160,方差=15.
(1)若用女生样本的身高频率分布情况代替该校高一女生总体的身高频率分布情况,试估计该校高一女生身高在[160,165]范围内的人数;
(2)用总样本平均数和标准差分别估计该校高一学生总体身高的平均数μ和标准差σ,求μ,σ的值.
解:(1)因女生样本中,身高在[160,165]范围内的占比为=,
故该校高一女生身高在[160,165]范围内的人数估计为100×=40.
(2)记总样本的平均数为,标准差为S,
由题意得,男生样本(20人)的身高平均数为=169,方差为=39,
女生样本(10人)的身高平均数为=160,方差=15,
则==166,
S2=[39+(169-166)2]+[15+(160-166)2]=×48+×51=49,
故μ≈166,σ≈=7.
任务三 百分位数
问题3.我们在根据某种统计结果下结论时,经常要用到某个百分数,例如我们经常说,这次数学考试有90%的同学在85分以上,再例如:去年冬天我们市的雾霾天气已经减少到5%以下,那么这里的90%和5%在统计学中是什么意思呢?
提示:“这次数学考试有90%的同学在85分以上”的意思是说高于85分的同学占整个班级人数的90%;“去年冬天我们市的雾霾天气已经减少到5%以下”的意思是去年冬天雾霾天气占整个冬天天数的比例不到5%.
1.百分位数
p分 位数 一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点:总体数据中的任意一个数小于或等于它的可能性是p
四分 位数 25%,50%,75%分位数是三个常用的百分位数.把总体数据按照从小到大排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是.因此这三个百分位数也称为总体的四分位数
2.计算一组n个数据的p分位数的一般步骤
第一步:按照从小到大排列原始数据;
第二步:计算i=np;
第三步:若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数.
[微提醒] 百分位数不一定是数据中的数;中位数相当于50%分位数.
(链教材P177例7)从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的25%,75%,95%分位数;
(2)请你找出珍珠质量较小的前15%的珍珠质量;
(3)若用25%,50%,95%分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.
解:(1)将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,
则25%分位数是=8.15 g,
75%分位数是=8.75 g,
95%分位数是第12个数据为9.9 g.
(2)因为共有12个数据,所以12×15%=1.8,则15%分位数是第2个数据为7.9 g.
即珍珠质量较小的前15%的珍珠有2个,它们的质量分别为7.8 g,7.9 g.
(3)由(1)可知样本数据的25%分位数是8.15 g,50%分位数为8.5 g,95%分位数是9.9 g,
所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于或等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.
求百分位数时的注意点
1.一定要将数据按照从小到大的顺序排列.
2.一定要确定i=np的结果是否为整数.
对点练3.(1)第33届夏季奥林匹克运动会于2024年7月26日至8月11日在法国巴黎举行,金牌榜前10名的国家的金牌数依次为40,40,20,18,16,15,14,13,12,12,则这10个数的60%分位数是( )
A.14.5 B.15
C.16 D.17
(2)有一组数据,按从小到大排列为1,2,6,8,9,m,这组数据的40%分位数等于他们的平均数,则m为( )
A.9 B.10
C.11 D.12
答案:(1)D (2)B
解析:(1)将这10个数据从小到大排列得:12,12,13,14,15,16,18,20,40,40,因为10×60%=6,所以这10个数的60%分位数是=17.故选D.
(2)因为该组数据共6个,且6×40%=2.4,所以这组数据的40%分位数为从小到大第3个数,即6,则6=,解得m=10.故选B.
任务四 分层随机抽样的均值与方差的综合应用
已知总体划分为2层,通过分层随机抽样,第i层抽取的样本量、样本均值和样本方差分别为ni,,,i=1,2.记总样本数据的均值为,总样本数据的方差为s2.
(1)写出与s2的计算公式(直接写出结果,不需证明);
(2)某学校有高中学生500人,其中男生300人,女生200人.现采用分层随机抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的均值为172.5,方差为16,女生样本的均值为162.5,方差为30.
(ⅰ)如果已知男、女样本量按比例分配,试计算出总样本的均值与方差;
(ⅱ)如果已知男、女的样本量都是50,试计算出总样本的均值与方差,此时将它们分别作为总体的均值与方差的估计合适吗?请说明理由.
解:(1)依题意可得=+,
s2=[+(-)2]+[+(-)2].
(2)(ⅰ)男、女的样本量按比例分配,
则总样本的均值为×172.5+×162.5=168.5(cm),
总样本的方差为×[16+(172.5-168.5)2]+×[30+(162.5-168.5)2]=45.6.
(ⅱ)男、女的样本量都是50,
总样本的均值为×172.5+×162.5=167.5(cm),
总样本的方差为×[16+(172.5-167.5)2]+×[30+(162.5-167.5)2]=48,
不能作为总体均值和方差的估计,因为分层抽样中未按比例抽样,总体中每个个体被抽到的可能性不完全相同,因而样本的代表性差.
利用样本中不同层的平均数与方差,可以计算这个样本的平均数与方差,所得结果与直接计算所得的平均数与方差相同.
对点练4.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100]得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值及样本成绩的第75百分位数;
(2)求样本成绩的众数,中位数和平均数;
(3)已知落在[50,60)的平均成绩是54,方差是7,落在[60,70)的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差s2.
解:(1)由每组小矩形的面积之和为1,得0.05+0.1+0.2+10a+0.25+0.1=1,解得a=0.030,
成绩在[40,80)内的频率为0.05+0.1+0.2+0.3=0.65,在[40,90)内的频率为0.05+0.1+0.2+0.3+0.25=0.9,
显然第75百分位数m∈[80,90),由0.65+(m-80)×0.025=0.75,解得m=84,
所以第75百分位数为84.
(2)由=75,得样本成绩的众数为75,
成绩落在[40,70)内的频率为0.05+0.1+0.2=0.35,
成绩落在[40,80)内的频率为0.05+0.1+0.2+0.3=0.65,
故中位数在[70,80)内,由70+×10=75,得样本成绩的中位数为75,
由45×0.05+55×0.1+65×0.2+75×0.3+85×0.25+95×0.1=74,
得样本成绩的平均数为74.
(3)由频率分布直方图知,成绩在[50,60)的市民人数为100×0.1=10,成绩在[60,70)的市民人数为100×0.2=20,
所以==62,
总方差为s2={10×[7+(54-62)2]+20×[4+(66-62)2]}=37.
任务 再现 1.分层随机抽样的平均数与方差.2.百分位数
方法 提炼 转化的思想方法
易错 警示 求百分位数时,未排序导致错误
1.已知一组数据为-1,1,4,4,2,6,则该组数据的第50百分位数是( )
A.1 B.2
C.3 D.4
答案:C
解析:将数据按照从小到大顺序排序为:-1,1,2,4,4,6,因为6×50%=3,所以这组数据的第50百分位数是第3,4两项的平均数,即=3.故选C.
2.某单位共有员工100人,其中年轻人有20人,平均年薪为5万元,中年人有80人,平均年薪为8万元,则该单位员工的平均年薪为( )
A.8万元 B.7.4万元
C.6.5万元 D.5万元
答案:B
解析:由题意可知×5+×8=7.4(万元).故选B.
3.为了了解某班学生数学成绩,利用分层随机抽样抽取了一个10人的样本,统计如下:
学生数 平均分 方差
男生 6 80 7
女生 4 75 2
则可估计全班学生数学的平均分和方差分别为( )
A.77.5,5 B.77.5,11
C.78,5 D.78,11
答案:D
解析:可估计全班学生数学的平均分为80×+75×=78,方差为[7+(80-78)2]+[2+(75-78)2]=11.故选D.
4.某次体检中,甲班学生体重检测数据的平均数是55 kg,方差为16;乙班学生体重检测数据的平均数是60 kg,方差为21.又甲、乙两班人数之比为3∶2,则甲、乙两班全部学生体重的方差为 .
答案:24
解析:甲、乙两班全部学生的平均体重为=×55+×60=57;甲、乙两班全部学生的体重方差为s2=×[16+(55-57)2]+×[21+(60-57)2]=24.
课时分层评价41 分层随机抽样的均值与方差 百分位数
(时间:40分钟 满分:100分)
(1—9题,每小题5分,共45分)
1.已知一组数据:2,5,7,x,10的平均数为6,则该组数据的第60百分位数为( )
A.5.5 B.6
C.6.5 D.7
答案:C
解析:因为=6 x=6.所以数据为2,5,6,7,10.又因为5×60%=3,所以这组数据的第60百分位数为=6.5.故选C.
2.某学校的高一、高二及高三年级分别有学生1 000人、800人、1 200人,用分层抽样的方法从全体学生中抽取一个容量为30人的样本,抽出的高一、高二及高三年级学生的平均身高为165 cm、168 cm、171 cm,估计该校学生的平均身高是( )
A.166.4 cm B.168.2 cm
C.169.1 cm D.170.0 cm
答案:B
解析:因为高一、高二及高三年级分别有学生1 000人、800人、1 200人,用分层抽样的方法从全体学生中抽取一个容量为30人的样本,则高一、高二及高三年级分别抽10人,8人,12人,抽出的高一、高二及高三年级学生的平均身高为165 cm、168 cm、171 cm,所以该校学生的平均身高为=168.2(cm).故选B.
3.我国智慧港口的建设飞速发展,作为智能化搬运设备的AGV(自动化导引运输车)作用越发凸显.经统计,某港口某次运输中,有27台AGV的停车误差为2厘米,有45台AGV的停车误差为1厘米,有11台AGV没有停车误差,则该港口本次运输中所有AGV的平均停车误差约为( )
A.1.17厘米 B.1.18厘米
C.1.19厘米 D.1.20厘米
答案:C
解析:由题意知,该港口本次运输中所有AGV的平均停车误差为=≈1.19厘米.故选C.
4.某公司为了调查员工的健康状况,由于女员工所占比重大,按性别分层,用按比例分配的分层随机抽样的方法抽取样本,若样本中有女员工39人,男员工21人,女员工的平均体重为50 kg,标准差为6,男员工的平均体重为70 kg,标准差为4.则所抽取的所有员工的体重的方差为( )
A.29 B.120
C.100 D.112
答案:B
解析:根据题意,样本中所有员工的体重的平均值为×50+×70=57,则样本中所有员工的体重的方差s2=×[62+(50-57)2]+×[42+(70-57)2]=120.故选B.
5.(多选题)已知样本数据7,3,5,3,10,8,则这组数据的( )
A.众数为3 B.平均数为6.5
C.75百分位数为8 D.方差为
答案:ACD
解析:把数据从小到大排列,得到3,3,5,7,8,10,对于A,观察得数据3出现的次数最多,所以众数为3,故A正确;对于B,平均数为==6,故B错误;对于C,因为一共有6个数据,且6×75%=4.5,所以第75百分位数为第5个数,故第75百分位数为8,故C正确;对于D,方差为[(3-6)2+(3-6)2+(5-6)2+(7-6)2+(8-6)2+(10-6)2]=(9+9+1+1+4+16)=×40=,故D正确.故选ACD.
6.(多选题)甲、乙两支田径队的体检结果为:甲队体重的平均数为60 kg,方差为200,乙队体重的平均数为70 kg,方差为300,又已知甲、乙两队的队员人数之比为1∶4,则下列说法正确的是( )
A.甲、乙两队全部队员的平均体重是68 kg
B.甲、乙两队全部队员的平均体重是65 kg
C.甲、乙两队全部队员的方差是296
D.甲、乙两队全部队员的方差是306
答案:AC
解析:根据题意可知,甲、乙两队的队员在所有队员中所占权重分别为,;又甲队体重的平均数为60 kg,乙队体重的平均数为70 kg,所以甲、乙两队全部队员的平均体重是×60+×70=68 kg,即可得A正确,B错误;甲、乙两队全部队员的方差是s2=[200+(60-68)2]+[300+(70-68)2]=296,可知C正确,D错误.故选AC.
7.(开放题)为科普航天知识,某校组织学生参与航天知识竞答活动,某班8位同学成绩如下:7,6,8,9,8,7,10,m,若去掉m,该组数据的第25百分位数保持不变,则整数m(1≤m≤10)的值可以是 (写出一个满足条件的m值即可).
答案:7(8,9,10均可)
解析:7位同学成绩如下:6,7,7,8,8,9,10,其第25百分位数为第二个数据,为7,要使第25百分位数保持不变,m不小于7就可以.故答案为7(8,9,10均可).
8.第九届亚冬会期间,某班组织全班学生开展有关亚冬会知识的竞赛活动.已知该班男生30人,女生20人,按照分层抽样的方法从该班共抽取10人,进行一轮答题.相关统计情况如下:男生答对题目的平均数为10,方差为1;女生答对题目的平均数为15,方差为0.5,则这10人答对题目的方差为 .
答案:6.8
解析:男生30人,女生20人,则抽取的时候分层比为3∶2.则10个人中男女分别抽取了6人和4人.这10人答对题目的平均数为×(6×10+4×15)=12.所以这10人答对题目的方差为×[1+(10-12)2]+×[0.5+(15-12)2]=6.8.
9.某学校共有学生2 000人,其中高一800人,高二、高三各600人,学校对学生在暑假中每天的读书时间做了调查统计,全体学生每天的读书时间的平均数为=3小时,方差为s2=2.003,其中高一、高二、高三学生每天读书时间的平均数分别为=2.6小时,=3.2小时,=3.3小时,又已知高一、高二年级学生每天读书时间的方差分别为=1,=2,则高三学生每天读书时间的方差= .
答案:3
解析:因为s2=w1[+(-)2]+w2[+(-)2]+w3[+(-)2],所以2.003=0.4×[1+(2.6-3)2]+0.3×[2+(3.2-3)2]+0.3×[+(3.3-3)2],所以0.3×(+0.09)=0.927,解得=3.
10.(10分)随机抽取某4S店20位员工今年的销售业绩,统计如下所示(单位:辆):
26 34 28 32 35 38 22 39 23 25
28 30 24 38 33 33 22 34 21 27
(1)若需要有10%的优秀员工,应将标准设定在多少?
(2)若要给至少80%的员工年度考评评级为通过,应将标准设定在多少?
解:(1)将20个样本数据从小到大进行排序如下所示(单位:辆):
21 22 22 23 24 25 26 27 28 28
30 32 33 33 34 34 35 38 38 39
由于20×90%=18是整数,所以样本数据的90%分位数为样本中第18和19两个数的平均数,故为38.
因此,可以规定如下:若需要有10%的优秀员工,应将标准设定在38辆.
(2)由于20×20%=4是整数,所以样本数据的20%分位数为样本中第4和5两个数的平均数,故为23.5.
因此,可以规定如下:若要给至少80%的员工年度考评评级为通过,应将标准设定在23辆或22辆或21辆.
(11—13题,每小题5分,共15分)
11.国家射击运动员甲在某次训练中的5次射击成绩(单位:环)为9,6,m,10,8,其中m为整数,若这5次射击成绩的第40百分位数为8,则m=( )
A.6 B.7
C.8 D.9
答案:C
解析:由5×40%=2,将成绩从小到大排列,得第40百分位数是第二个成绩和第三个成绩的平均数,所以=8,解得m=8.故选C.
12.(多选题)现有甲、乙两组数据,甲组数据为x1,x2,…,x16;乙组数据为3x1-9,3x2-9,…,3x16-9,若甲组数据的平均数为m,标准差为n,极差为a,第60百分位数为b,则下列说法一定正确的是( )
A.乙组数据的平均数为3m-9
B.乙组数据的极差为3a
C.乙组数据的第60百分位数为3b-9
D.乙组数据的标准差为n
答案:ABC
解析:不妨设甲组数据从小到大排列为x1,x2,…,x16,则乙组数据从小到大排列为3x1-9,3x2-9,…,3x16-9,因为甲组数据的平均数为m,标准差为n,极差为a,第60百分位数为b,则a=x16-x1,又16×60%=9.6,所以b=x10,所以乙组数据的平均数为3m-9,故A正确;乙组数据的极差为3x16-9-(3x1-9)=3(x16-x1)=3a,故B正确;乙组数据的第60百分位数为3x10-9=3b-9,故C正确;乙组数据的标准差为3n,故D错误.故选ABC.
13.某校高一年级抽样的30名女生的身高(cm)数据从小到大排序如下:
148 149 154 154 155 155 155 157 157 158 158 159 160 161 161 162 162 162 162 163 163 163 164 164 165 165 170 171 172 172
经计算,原来这组数据的第80百分位数为164.5.现将其去掉最后一个数据172,则剩余数据的第80百分位数 (选填“变大”“变小”或“不变”).
答案:变小
解析:原来30个数据的第80百分位数为164.5,去掉最后一个数据172,还有29个数据,因为29×80%=23.2,所以剩余数据的第80百分位数为第24个数据,即为164,因为164<164.5,所以剩余数据的第80百分位数变小.
14.(10分)某地区有小学生9 000人,初中生8 600人,高中生4 400人,教育局组织“防溺水”网络知识问答,现用分层抽样的方法从中抽取220名学生,对其成绩进行统计分析,得到如下图所示的频率分布直方图.
(1)根据频率分布直方图,估计该地区所有学生知识问答成绩的平均数和众数;
(2)成绩位列前10%的学生平台会生成“防溺水达人”优秀证书,试估计获得“防溺水达人”的成绩至少为多少分;
(3)已知落在[60,70)内的平均成绩为67,方差是9,落在[60,80)内的平均成绩是73,方差是29,求落在[70,80)内的平均成绩和方差.
解:(1)一至六组的频率分别为0.10,0.15,0.15,0.30,0.25,0.05,
平均数=45×0.10+55×0.15+65×0.15+75×0.30+85×0.25+95×0.05=71,
由图可知,众数为75.
以样本估计总体,该地区所有学生知识问答成绩的平均数为71分,众数为75分.
(2)前4组的频率之和为0.10+0.15+0.15+0.30=0.70<0.90,
前5组的频率之和为0.70+0.25=0.95>0.90,
第90%分位数落在第5组,设为x,则0.70+(x-80)×0.025=0.90,解得x=88.
“防溺水达人”的成绩至少为88分.
(3)[60,70)的频率为0.15,[70,80)的频率为0.30,
所以[60,70)的频率与[60,80)的频率之比为=,
[70,80)的频率与[60,80)的频率之比为=,
设落在[70,80)内的平均成绩和方差分别为,,
由题意知73=×67+,解得=76,
所以29=×[9+(67-73)2]+×[+(76-73)2],解得=12,
所以落在[70,80)内的平均成绩为76,方差为12.
15.(5分)已知一组数据34,36,39,41,44,45,x,50的第65 百分位数是45,那么实数 x的取值范围是( )
A.[45,+∞) B.(45,+∞)
C.(45,50) D.[45,50]
答案:A
解析:因为8×65%=5.2,所以这组数据的第65百分位数是第6项数据45,则x≥45.故选A.
16.(15分)某校举行了“喜迎国庆,强国有我”知识竞赛,全校共60名学生参赛,比赛结束后,将这60名学生的比赛成绩(单位:分)进行整理,按[50,60),[60,70),[70,80),[80,90),[90,100]分成5组,并绘制成如图所示的频率分布直方图.
(1)求a,并估计样本的80%分位数;
(2)若每组数据均以中间值作代表,估计样本的平均数;
(3)按分层随机抽样的方法,从[80,90)与[90,100]内的学生中抽14人,求[90,100]内被抽取到的学生人数.
解:(1)由频率分布直方图,得10×(0.005+0.025+0.035+0.020+a)=1,解得a=0.015;
成绩落在[50,80)的频率为10×(0.005+0.025+0.035)=0.65,
成绩落在[50,90)的频率为0.65+10×0.020=0.85,
因此80%分位数m∈[80,90),则0.65+(m-80)×0.020=0.8,解得m=87.5,
所以a=0.015,80%分位数为87.5.
(2)平均数=10×(0.005×55+0.025×65+0.035×75+0.020×85+0.015×95)=76.5.
(3)由频率分布直方图知,成绩落在[80,90)与[90,100]的频率分别为0.2与0.15,
所以[90,100]内抽取的人数为14×=6.
21世纪教育网(www.21cnjy.com)