9.2.2 总体百分位数的估计-【新教材】人教A版(2019)高中数学必修第二册同步练习(含解析)
学校:___________姓名:___________班级:___________学号:___________
一.选择题
已知100个数据的第75百分位数是9.3,则下列说法正确的是(? ? ? ?)
A. 这100个数据中一定有75个数小于或等于9.3
B. 把这100个数据从小到大排列后,9.3是第75个数据
C. 把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D. 把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数
数据3.2,3.4,3.8,4.2,4.3,4.5,x,6.6的第65百分位数是4.5,则实数x的取值范围是(? )
A. [4.5,+∞) B. [4.5,6.6) C. (4.5,+∞) D. (4.5,6.6]
互不相等的5个正整数从小到大排序为a1,a2,a3,a4,a5,若它们的和为18,且其70%分位数是30%分位数的2倍,则a5的值为(? )
A. 6 B. 7 C. 8 D. 9
甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则(????)
A. 甲的成绩的平均数小于乙的成绩的平均数
B. 甲的成绩的中位数等于乙的成绩的中位数
C. 甲的成绩的第80百分位数等于乙的成绩的第80百分位数
D. 甲的成绩的极差大于乙的成绩的极差
某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,第50百分位数为b,则有(? )
A. a=13.7,b=15.5 B. a=14,b=15
C. a=12,b=15.5 D. a=14.7,b=15
“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高.现随机抽取10位北京市民,他们的幸福感指数为3,4,5,5,6,7,7,8,9,10.则这组数据的75%分位数是(? ? ?)
A. 7 B. 7.5 C. 8 D. 8.5
某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花的纤维长度(棉花的纤维长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示.估计棉花的纤维长度的样本数据的80%分位数是(? ? ? )
A. 28?mm B. 28.5?mm C. 29?mm D. 29.5?mm
某班有n名学生,他们都参加了某次高三复习检测考试,第i个学生的某科成绩记为Xi(i=1,2,3,…,n),设Pi=该科成绩不超过Xi的该班人数÷n,定义Pi为第i个学生的该科成绩的百分位.现对该班的甲、乙两名同学的该次检测成绩作对比分析,若甲、乙两名同学的各科成绩的百分位如图所示,则以下分析不正确的是? (??? )
甲同学的语文、数学、英语、综合的总分高于乙同学
B. 甲同学的语文、数学、英语成绩都好于乙同学
C. 甲同学的各科成绩都居该班上游(百分位大于66%)
D. 乙同学的语文分数不一定比数学分数高
二.填空题
高一(10)班数学兴趣小组8名同学的数学竞赛成绩(单位:分)分别为80,68,90,70,88,96,89,98,则该组数学成绩的15%和50%分位数分别为??????????.
若一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x=??????????.
某单位招聘技术人员,对于笔试成绩达不到75%分位数的不得进入面试环节,现知道18名应聘者的笔试成绩如下:46,48,50,53,55,55,58,60,60,62,65,65,68,70,72,75,76,78.那么进入面试的有??????????人.
图是某市2021年4月1日至4月7日每天最高、最低气温的折线统计图,这7天的日最高气温的第10百分位数为??????????℃,日最低气温的第80百分位数为??????????℃.
为了解中学生课外阅读情况,现从某中学随机抽取200名学生,收集了他们2020一年内的课外阅读量(单位:本)等数据,图是根据数据绘制的统计图表的一部分.
下面有四个推断:
①这200名学生阅读量的平均数可能是26本;
②这200名学生阅读量的75%分位数在区间[30,40)内;
③这200名学生中的初中生阅读量的中位数一定在区间[20,30)内;
④这200名学生中的初中生阅读量的25%分位数可能在区间[20,30)内.
所有合理推断的序号是??????????.
某组数据的中位数是2019,那么它的第50百分位数是??????????.
已知30个数据的第60百分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是??????????.
三.解答题
某网络营销部门随机抽查了某市200名网友在2020年11月11日的网购金额,所得数据如下表:
网购金额(单位:千元)
人数
频率
(0,1]
16
0.08
(1,2]
24
0.12
(2,3]
x
p
(3,4]
y
q
(4,5]
16
0.08
(5,6]
14
0.07
合计
200
1.00
已知网购金额不超过3千元与超过3千元的人数比恰为3:2.
(1)试确定x,y,p,q的值,并补全频率分布直方图(如图).
(2)估计网购金额的25%分位数(结果保留3位有效数字).
为了了解居民的用电情况,某市供电局抽查了该市若干户居民的月均用电量(单位:kW·?),并将样本数据分组为[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300],其频率分布直方图如图所示.
(1)若样本中月均用电量在[240,260)内的居民有30户,求样本量;
(2)求样本中月均用电量的中位数;
(3)在月均用电量为[220,240),[240,260),[260,280),[280,300]的四组居民中,用比例分配的分层随机抽样的方法抽取22户居民,则月均用电量在[260,280)内的居民应抽取多少户?
某地统计局调查了10000名居民的月收入,并根据所得数据绘制了样本的频率分布直方图,如图所示.
(1)求居民月收入在[3000,3500)内的频率.
(2)根据频率分布直方图求出样本数据的中位数.
(3)为了分析居民的月收入与年龄、职业等方面的关系,必须按月收入再从这10000人中用比例分配的分层随机抽样的方法抽出100人做进一步分析,则应从月收入在[2500,3000)内的居民中抽取多少人?
某大学艺术专业400名学生参加某次测评,根据男、女学生的人数比例,使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图所示的频率分布直方图:
(1)估计400名学生中分数小于70的人数;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)根据该大学规定,把15%的学生划定为不及格,利用(2)中的数据,确定本次测试的及格分数线.
答案和解析
1.【答案】C
【解析】
【分析】
本题考查用样本估计百分位数,由100×75%=75为整数,可得第75个数据和第76个数据的平均数为第75百分位数,据此即可求解.
【解答】
解:因为100×75%=75为整数,
所以第75个数据和第76个数据的平均数为第75百分位数,即9.3,
故选C.
2.【答案】A
【解析】
【分析】
本题考查百分位数,属于基础题.
由8×65%=5.2,可得这组数据的第65百分位数是第6项数据,然后进行求解即可.
【解答】
解:因为8×65%=5.2,
所以这组数据的第65百分位数是第6项数据,
又第65百分位数是4.5,
所以x≥4.5,
故选A.
3.【答案】C
【解析】
【分析】
本题考查用样本估计百分位数,属于中档题.
由5×70%=3.5可得这组数据的70%分位数为a4,同理可知这组数据的30%分位数为a2,据题意有a4=2a2,结合题意分情况讨论,然后求解即可.
【解答】
解:因为5×70%=3.5,
所以这组数据的70%分位数为a4,
同理可知这组数据的30%分位数为a2,
据题意有a4=2a2,
若a1=2,a2=3,则这5个数为2,3,a3,6,a5,
由a5>6且a5∈ N??,知a1+?a2+?a3+?a4+?a5>18,不满足题意,所以a1=1.
若a2=3,则这5个数为1,3,a3,6,a5,由3
6,a3,a5∈ N??,
知a1+?a2+?a3+?a4+?a5>18,不满足题意,所以a2=2,
则这5个数为1,2,a3,4,a5,由2知a3=3,由1+2+3+4+?a5=18,知a5=8.
故选C.
4.【答案】C
【解析】
【分析】
本题考查了平均数、中位数、百分位数和极差,属于基础题.
根据题意直接算出.甲、乙的成绩的平均数、中位数、极差、百分位数,即可求解.
【解答】
解:由图可得,x甲=4+5+6+7+85=6,x乙=3×5+6+95=6,A选项错误;
甲的成绩的中位数为6,乙的成绩的中位数为5,B选项错误;
5×80%=4,所以甲的成绩的第80百分位数为7+82=7.5,乙的成绩的第80百分位数为6+92=7.5,C选项正确;
甲的成绩的极差为4,乙的成绩的极差也为4,D选项错误.
故选C.
5.【答案】D
【解析】
【分析】
本题主要考查了平均数、百分位数,属于基础题.
利用平均数的定义,第50百分位数即为中位数,中位数的定义:中位数要把数据按从小到大的顺序排列,位于最中间的一个数或两个数的平均数为中位数,进行确定.
【解答】
解:把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,
其平均数a=110×(10+12+14+14+15+15+16+17+17+17)=14.7,
第50百分位数为b=15+152=15.
故选D.
6.【答案】C
【解析】
【分析】
本题考查了百分位数的定义与计算问题,是基础题.
根据一组数据的百分位数定义,求出即可.
【解答】
解:数据3,4,5,5,6,7,7,8,9,10共10个,
且10×75%=7.5,所以分位数是第8个数,为8.
故选:C.
7.【答案】C
【解析】
【分析】
本题考查了频率分布直方图的相关知识,直方图中的各个矩形的面积代表了频率,考查百分位数的求法,属于中档题.
先求出80%分位数一定位于[25,30)内,再利用百分位数的求法求解即可.
【解答】
解:棉花的纤维长度在25?mm以下的频率为(0.01+0.01+0.04+0.06)×5=0.6=60%,
在30?mm以下的频率为60%+25%=85%,
因此,80%分位数一定位于[25,30)内,
由25+5×0.80?0.600.85?0.60=29,
可以估计棉花的纤维长度的样本数据的80%分位数是29?mm.
故选C.
8.【答案】A
【解析】
【分析】
本题考查柱形图,考查百分位数的应用,属于基础题.
根据已知的信息结合条形图逐一判断即可.?
【解答】
解:由于(不超过成绩Xi的该科该班人数)÷n为第i个学生的该科成绩的百分位,条形图中甲同学的语文、数学、英语的百分位高于乙同学,
说明不超过甲同学的语文、数学、英语成绩的该班人数多于不超过乙同学的语文、数学、英语成绩的该班人数,所以甲同学的语文、数学、英语总分高于乙同学,但综合低于乙同学
故A.甲同学的语文、数学、英语、综合总分高于乙同学错误;
B.甲同学的语文、数学、英语成绩都好于乙同学,正确;
C.甲同学的各科成绩都居该班的上等水平,正确;
乙同学的语文、数学成绩不能比较,
D.乙同学的语文分数不一定比数学分数高,正确;
故选A.
9.【答案】70,88.5
【解析】
【分析】
本题考查用样本估计百分位数,属于基础题.
根据题意把数据排序,再分别求解数学成绩的15%和50%分位数即可.
【解答】
解:把数据按照从小到大的顺序排列为68,70,80,88,89,90,96,98,
因为8×15%=1.2,
所以该组数学成绩的15%分位数为70.
因为8×50%=4,
所以该数学成绩的50%分位数为88+892=88.5.
故答案为70,88.8
10.【答案】21
【解析】
【分析】
本题主要考查了中位数,属于基础题.
把给出的此组数据中的数按从小到大(或从大到小)的顺序排列,由于数据个数是8,8是偶数,所以处于中间的两个数的平均数就是此组数据的中位数,再根据中位数是22,建立等式关系可求出所求.
【解答】
解:按从小到大的顺序排列:13、14、19、x、23、27、28、31,
∴该组数据的中位数是x+232=22,
即x=22×2?23=21,
故答案为:21.
11.【答案】5
【解析】
【分析】
本题考查百分位数,属于基础题.
由题意计算百分位数,易得答案.
【解答】
解:由题意可得i=18×75%=13.5,
所以75%分位数是70,有5人达到这个要求,
所以有5人进入面试.
故答案为5.
12.【答案】24 ;16
【解析】
【分析】
本题主要考查数据的整理分析和折线图的认识,属于中档题.
关键是要读懂题目中最高气温的第10百分位数和最低气温的第80百分位数的含义.
【解答】
解:由折线图可知,把日最高气温按照从小到大排序,
得24,24.5,24.5,25,26,26,27,
因为7×10%=0.7,所以这7天日最高气温的第10百分位数是第1个数据,
为24℃.把日最低气温按照从小到大排序,得12,12,13,14,15,16,17,
因为7×80%=5.6,所以这7天日最低气温的第80百分位数是第6个数据,为16℃.
故答案为:24,16.
13.【答案】②③④
【解析】
【分析】
本题考查频率分布直方图和样本的数据特征,属于较难题.
利用已知图表,结合平均数、百分位数、中位数逐个判断即可.
【解答】
解:在①中,由学生类别阅读量中男生和女生的人均阅读量知,
这200名学生的平均阅读量在区间(24.5,25.5)内,故错误;
在②中,200×75%=150,
阅读量在[0,30)内的人数为7+8+31+29+25+26=126,在[30,40)内的人数为62,
所以这200名学生阅读量的75%分位数在区间[30,40)内,故正确;
在③中,设阅读量在区间[0,10)内的初中生人数为x,
则x∈[0,15],x∈ N,当x=0时,初中生总人数为116,1162=58,
此时区间[0,20)内有25人,区间[20,30)内有36人,
所以中位数在[20,30)内,
当x=15时,初中生总人数为131,1312=65.5,
区间[0,20)内有15+25=40(人),区间[20,30)内有36人,
所以中位数在[20,30)内,同理可得当x∈[1,14],x∈ N??时,中位数都在[20,30)内,
所以这200名学生中的初中生阅读量的中位数一定在区间[20,30)内,故正确;
在④中,设在区间[0,10)内的初中生人数为x,
则x∈[0,15],x∈ N,当x=0时,初中生总人数为116,116×25%=29,
此时区间[0,20)内有25人,区间[20,30)内有36人,
所以25%分位数在区间[20,30)内,当x=15时,
初中生总人数为131,131×25%=32.75,区间[0,20)内有40人,
所以25%分位数在区间[0,20)内,
所以这200名学生中的初中生阅读量的25%分位数可能在区间[20,30)内,故正确.
故答案为②③④.
14.【答案】2019
【解析】
【分析】
本题考查百分位数,属于基础题.
由总体百分位数相关定义知,第50百分位数就相当于中位数.故而结合已知容易得到结果.
【解答】
解:因为某组数据的中位数是2019,
第50百分位数就相当于中位数,
所以它的第50百分位数是2019.
故答案为2019.
15.【答案】8.6
【解析】
【分析】
本题考查了用样本估计百分位数,属于基础题.
由30×60%=18,可得30个数据的60%分位数为第18个和第19个数据的平均数,可得结果.
【解答】
解:将这30个数据从小到大排列后依次编号为a1,a2,?,a30,
由30×60%=18,
所以30个数据的60%分位数为a18+a192=8.2,
又a18=7.8,
所以a19=8.2×2?7.8=8.6,
故答案为8.6.
16.【答案】解:(1)根据题意有16+24+x+y+16+14=200,16+24+xy+16+14=32,解得x=80,y=50,
所以p=0.4,q=0.25.?
补全频率分布直方图如图所示.
(2)由(1)可知,网购金额不高于2千元的频率为0.08+0.12=0.2,
网购金额不高于3千元的频率为0.2+0.4=0.6,所以网购金额的25%分位数在(2,3]内,
故网购金额的25%分位数约为2+0.25?0.20.6?0.2×1=2.125(千元).
【解析】本题考查了频率分布直方图以及百分位数求解,属于中档题.
(1)由网友和为200,网购金额不超过3千元与超过3千元的人数比恰为3:2列方程组求解x,y的值,则p,q可求,进一步补全频率分布直方图;
(2)根据频率分布直方图估计网购金额的25%分位数.
17.【答案】解:(1)由(0.0020+0.0095+0.0110+0.0125+x+0.0050+0.0025)×20=1,
解得x=0.0075,
∴月平均用电量在[240,260)的频率为0.0075×20=0.15,
设样本容量为N,则0.15N=30,
解得N=200;
(2)∵(0.0020+0.0095+0.0110)×20=0.45<0.5,
∴月平均用电量的中位数[220,240)内,
设中位数a,则0.45+0.0125×(a?220)=0.5,
解得a=224,
∴中位数为224.
(3)月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组频率分别为:
0.25,0.15,0.1,0.05,
∴月平均用电量在[260,280)的用户中应抽取22×0.10.25+0.15+0.1+0.05=4(户).
【解析】本题主要考查样本容量、中位数的求法,考查频率分布直方图、分层抽样等基础知识,考查运算求解能力,是基础题.
(1)由频率分布直方图的性质能求出月平均用电量在[240,260)的频率,设样本容量为N,则0.15N=30,由此能求出N的值.
(2)由(0.0020+0.0095+0.0110)×20=0.45<0.5,得月平均用电量的中位数[220,240)内,由此能求出中位数.
(3)月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组频率分别为0.25,0.15,0.1,0.05,由此能求出月平均用电量在[260,280)的用户中应抽取的户数.
18.【答案】解:(1)由频率分布直方图可知,
居民月收入在[3000,3500)内的频率为0.0003×500=0.15;
(2)由频率分布直方图可知,
0.0002×(1500?1000)=0.1,0.0004×(2000?1500)=0.2,
0.0005×(2500?2000)=0.25
∵0.1+0.2+0.25=0.55>0.5
∴样本数据的中位数2000+0.5?(0.1+0.2)0.0005=2400;
数据的平均数为各小矩形底边中点的横坐标乘以对应小矩形面积的和
∴x=1250×0.1+1750×0.2+2250×0.25+2750×0.25+3250×0.15+3750×0.05=2400
故样本的平均数为2400
(3)居民月收入在[2500,3000]的频率为0.0005×(3000?2500)=0.25,
∴10000人中月收入在[2500,3000]的人数为0.25×10000=2500(人),
再从10000人用分层抽样方法抽出100人,
∴月收入在[2500,3000]的这段应抽取100×250010000=25人.
【解析】本题考查频率分布直方图及分层抽样的方法,求解此类题的关键是熟练掌握频率分布直方图的结构及分层抽样的规则,本题属于统计中的基本题型,是这几年高考的热点,在高考的试卷上出现的频率相当高,应对此类题做题的规律好好理解掌握.频率分布直方图中小长方形的面积=组距×频率组距=频率,各个矩形面积之和等于1,能根据直方图求频率,属于常规题型.
(1)利用频率分布直方图,小矩形的面积即为频率,从而可得答案;
(2)根据频率直方图,先确定中位数的位置,再由公式计算出中位数,数据的平均数为各小矩形底边中点的横坐标乘以对应小矩形面积的和;
(3)利用频率分布直方图和分层抽样的方法即可确定抽取的人数.
19.【答案】解:(1)根据频率分布直方图可知,
样本中分数不小于70的频率为(0.02+0.04)×10=0.6,
所以样本中分数小于70的频率为1?0.6=0.4.?
所以400名学生中分数小于70的人数为400×0.4=160.
(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,
分数在区间[40,50)内的人数为100?100×0.9?5=5.?
所以总体中分数在区间[40,50)内的人数约为400×5100=20.
(3)设样本中分数的第15百分位数为x,
由(2)可知,分数小于50的频率为5+5100=0.1,
分数小于60的频率为0.1+0.1=0.2,
所以x∈[50,60),则0.1+(x?50)×0.01=0.15,解得x=55,
所以本次考试的及格分数线为55.
【解析】本题主要考查的是频率分布直方图及其应用.
(1)求出分数小于70的频率,利用频率估计概率即可;
(2)求出总体中分数在区间[40,50)内的频率,再利用频率求人数即可;
(3)设样本中分数的第15百分位数为x,由题意得到所以x∈[50,60),则0.1+(x?50)×0.01=0.15,求解即可.