中小学教育资源及组卷应用平台
专题12 统计归类
【题型一】 总体百分位
【典例分析】
气象意义上从春季进入夏季的标志为“连续5天,每天的日均气温都不低于”.已知甲,乙,丙,丁四个地区某连续5天日均气温的数据特征如下:
甲地 中位数为,平均数为.
乙地 第60百分位数为,众数为.
丙地 最高气温为,平均数为,标准差为.
丁地 下四分位数为,上四分位数为,极差为.
则可以肯定进入夏季的地区是( )
A.甲地 B.乙地 C.丙地 D.丁地
【答案】C
【分析】根据中位数,平均数,百分位数及极差的定义举出反例即可判断甲乙丁三地,根据标准差利用反证法即可判断丙地.
【详解】对于甲地,中位数为,平均数为,
若天气温的数据为,则甲地没有进入夏季;
对于乙地,第60百分位数为,众数为,
,则第60百分位数为第三个数与第四个数的平均数,
若天气温的数据为,则乙地没有进入夏季;
对于丙地,最高气温为,平均数为,标准差为,
设前面四个数据为,
则,
故,
所以,
若,则,这与矛盾,
所以,所以丙地肯定进入夏季;
对于丁地,下四分位数为,上四分位数为,极差为,
由,
得下四分位数为按从小到大排列得第个数据,上四分位数为按从小到大排列得第个数据,
若天气温的数据为,则丁地没有进入夏季.
故选:C.
【提分秘籍】 基本规律 总体百分位数 ①第百分位数的定义:一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值. ②计算一组个数据的第百分位数的步骤:第步,按从小到大排列原始数据;第步,计算;第步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数. ③四分位数:常用的分位数有第百分位数、第百分位数、第百分位数,这三个分位数把一组由小到大排列后的数据分成四等分 ,因此称为四分位数. 其中第百分位数也称为第一四分位数或下四分位数等,第百分位数也称为第三四分位数或上四分位数等.
【变式训练】
1.已知按从小到大顺序排列的两组数据:甲组:;乙组:,若这两组数据的第30百分位数 第50百分位数都分别对应相等,则等于( )
A. B. C. D.
【答案】A
【分析】根据百分位数的定义,求出的值即可得答案.
【详解】因为,
甲组:第30百分位数为,第50百分位数为,
乙组:第30百分位数为,第50百分位数为,
由已知得:,,解得,所以故选:A
2.某地区为了解最近11天该地区的空气质量,调查了该地区过去11天的浓度(单位:),数据依次为53,56,69,70,72,79,65,80,45,41,.已知这组数据的极差为40,则这组数据的第m百分位数为( )
A.71 B.75.5 C.79 D.72
【答案】C
【分析】根据极差求得m的值,计算,根据百分位数的含义即可确定答案.
【详解】由题意得,数据的极差为40,因为数据中最小值为41,
故m应为最大值,为81,
则 ,
将数据53,56,69,70,72,79,65,80,45,41,81,
从小大大排列为:41,45, 53,56,65,69,70,72,79, 80, 81,故这组数据的第m百分位数为79,故选:C
3.日前,十九大代表、奥运冠军——魏秋月老师在升旗仪式上为耀华师生上了一堂生动的体育思政课,并为耀华排球社的同学们带来了魏秋月名师工作室团队的专业技术指导.其间对同学们垫排球的手势技术动作进行了特别指导.之后排球社的同学为训练动作组织了垫排球比赛,以下为排球社50位同学的垫球个数所做的频率分布直方图,所有同学垫球数都在5-40之间.估计垫球数的样本数据的75%分位数是( )
A.25 B.26 C.27 D.28
【答案】D
【分析】根据频率分布直方图,结合分位数计算公式即可求解
【详解】垫球数在的人数为,占总数的;
垫球数在的人数为,占总数的;
垫球数在的人数为,占总数的;
垫球数在的人数为,占总数的;
垫球数在的人数为,占总数的;
垫球数在的人数为,占总数的;
垫球数在的人数为,占总数的,
因为75%分位数位于内,由,
所以估计垫球数的样本数据的75%分位数是28.故选:D
【题型二】 分层抽样
【典例分析】
为了研究某种病毒与血型之间的关系,决定从被感染的人群中抽取样本进行调查,这些感染人群中O型血、A型血、B型血、AB型血的人数比为4:3:3:2,现用比例分配的分层随机抽样方法抽取一个样本量为的样本,已知样本中O型血的人数比AB型血的人数多20,则( )
A.100 B.120 C.200 D.240
【答案】B
【分析】由题知,再解方程即可得答案.
【详解】解:因为感染人群中O型血、A型血、B型血、AB型血的人数比为4:3:3:2,
所以,抽取样本量为的样本中,O型血的人数为, AB型血的人数为,
所以,,解得 故选:B
【提分秘籍】 基本规律 分层随机抽样 (1)定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行 简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样_,每一个子总体称为层. 在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配. (2)适用范围:总体可以分层,且层与层之间有明显区别,而层内个体差异较小. (3)平均数的计算:各层抽样比乘以各层平均数的和.
【变式训练】
1.某学校在校学生有2000人,为了增强学生的体质,学校举行了跑步和登山比赛,每人都参加且只参加其中一项比赛,高一、高二、高三年级参加跑步的人数分别为a,b,c,且,全校参加登山的人数占总人数的.为了了解学生对本次比赛的满意程度,按分层抽样的方法从中抽取一个容量为200的样本进行调查,则应从高三年级参加跑步的学生中抽取( )
A.15人 B.30人 C.40人 D.45人
【答案】D
【分析】由题知全校参加跑步的人数为,再根据分层抽样的方法求解即可得答案.
【详解】解:由题意,可知全校参加跑步的人数为,
所以.因为,所以.
因为按分层抽样的方法从中抽取一个容量为200的样本,
所以应从高三年级参加跑步的学生中抽取的人数为.
故选:D
2.已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取4%的学生进行调查,则样本容量和抽取的高中生近视人数分别为
A.400,40 B.200,10 C.400,80 D.200,20
【答案】A
【分析】由扇形图能得到总数,利用抽样比较能求出样本容量;由分层抽样和条形图能求出抽取的高中生近视人数.
【详解】用分层抽样的方法抽取的学生进行调查,
样本容量为:,
抽取的高中生近视人数为:,
故选A.
3.从编号为01,02,,49,50的50个个体中利用下面的随机数表选取5个个体,选取方法从随机数表第1行第5列的数开始由左到右依次抽取,则选出来的第5个个体的编号为( )
7816 6572 0812 1463 0782 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
A.14 B.07 C.32 D.43
【答案】D
【分析】根据随机数表的取法,从第1行第5列的数开始两个两个的读数,不大于50的保留,大于50的去掉,重复的不选取,保留到第5个即得
【详解】解:由题意知选定的第一个数为65(第1行的第5列和第6列),按由左到右选取两位数(大于50的跳过,重复的不选取),
前5个个体编号为08,12,14,07,43,故选出来的第5个个体的编号为43,
故选:D.
【题型三】 直方图的平均数
【典例分析】
少年强则国强,少年智则国智.党和政府一直重视青少年的健康成长,出台了一系列政策和行动计划,提高学生身体素质.为了加强对学生的营养健康监测,某校在3000名学生中,抽查了100名学生的体重数据情况.根据所得数据绘制样本的频率分布直方图如图所示,则下列结论正确的是( )
A.样本的众数为65 B.样本的第80百分位数为72.5
C.样本的平均值为67.5 D.该校学生中低于的学生大约为1000人
【答案】B
【分析】根据众数,百分位数,平均数的定义判断A,B,C,再求低于的学生的频率,由此估计总体中体重低于的学生的人数,判断D.
【详解】由频率分布直方图可得众数为,A错误;
平均数为,C错误;
因为体重位于的频率分别为,
因为,
所以第80百分位数位于区间内,设第80百分位数为,
则,
所以,即样本的第80百分位数为72.5,B正确;
样本中低于的学生的频率为,
所以该校学生中低于的学生大约为,D错误;
故选:B.
【提分秘籍】 基本规律 总体取值规律的估计 ①画频率分布直方图的五个步骤:求极差_、决定组距与组数、将数据分组、列频率分布表、画频率分布直方图. ②频率分布直方图的特点:各个小长方形的面积表示相应各组的频率;各小长方形的面积的总和等于. ③频率分布直方中,最高的小长方形底边中点的横坐标即是众数;中位数左边和右边的小长方形的面积和是相等的;平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
【变式训练】
1.某市为了解全市12000名高一学生的的体能素质情况,在全市高一学生中随机抽取了1000名学生进行体能测试,并将这1000名的体能测试成绩整理成如下频率分布直方图.根据此频率分布直方图,下列结论中正确的是( )
A.图中的值为0.020;
B.同一组中的数据用该组区间的中点值做代表,则这1000名学生的平均成绩约为80.5;
C.估计样本数据的75%分位数为88;
D.由样本数据可估计全市高一学生体测成绩优异(80分及以上)的人数约为5000人.
【答案】B
【分析】A.根据频率和为1,计算的值;B.根据平均数公式,判断B;C.根据百分位数公式,判断C;计算体测成绩在内的频率,再结合总人数,即可判断D.
【详解】A.由频率分布直方图可知,,
得:,故A错误;
B.,故B正确;
C.设百分位数,易得,
则,
解得:,故C错误;
D.则体测成绩在的频率为,
估计全市高一学生体测成绩优异(80分及以上)的人数约为人,故D错误.
故选:B.
2.某中学全体学生参加了数学竞赛,随机抽取了400名学生进行成绩统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示,下列说法正确的是( )
A.直方图中x的值为0.035
B.在被抽取的学生中,成绩在区间的学生数为30人
C.估计全校学生的平均成绩为83分
D.估计全校学生成绩的样本数据的80%分位数约为95分
【答案】D
【分析】利用频率分布直方图的性质求解.
【详解】对于A:根据学生的成绩都在50分到100分之间的频率和为1,可得
10(0.005+0.01+0.015+x+0.040)=1,解得x=0.03,故A错误;
对于B:在被抽取的学生中,成绩在区间的学生数为100.015400=60人,
故B错误;
对于C:估计全校学生的平均成绩为550.05+650.1+750.15+850.3+950.4=84分;
故C错误.
对于D:全校学生成绩的样本数据的80%分位数约为分.
故D正确.
故选:D.
3.某次考试后,甲 乙两班的数学老师分别统计了各自班级的数学成绩(百分制,均位于内),并将所得数据分为6组:,[90,100],整理得到如图所示的频率分布直方图,则下列说法正确的是( )
A.乙班数学成绩的平均分的估计值高于甲班数学成绩的平均分的估计值(同一组中的数据用该组区间的中点值代替)
B.乙班数学成绩的最高分高于甲班数学成绩的最高分
C.甲班数学成绩的及格率低于乙班数学成绩的及格率(成绩不低于60分为及格)
D.甲班数学成绩不低于80分的人数多于乙班数学成绩不低于80分的人数
【答案】C
【分析】由频率分布直方图的平均数公式以及频率求法对各个选项进行分析即可得到答案.
【详解】A.甲班数学成绩的平均分为,
乙班数学成绩的平均分为
,错误;
B.由频率分布直方图无法得到哪个班的最高分高,错误;
C.甲班数学成绩的及格率,乙班数学成绩的及格率,故甲班的低,正确;
D.甲乙两个班各班的总人数不知,故不能确定,错误;
故选:C
【题型四】 中位数
【典例分析】
某公司为了解用户对其产品的满意度,从使用该产品的用户中随机调查了100个用户,根据用户对产品的满意度评分,得到如图所示的用户满意度评分的频率分布直方图.若用户满意度评分的中位数、众数、平均数分别为a,b,c,则( )
A. B. C. D.
【答案】B
【分析】根据众数,平均数,中位数的概念和公式,带入数字,求出后比较大小即可.
【详解】解:由频率分布直方图可知众数为65,即,
由表可知,组距为10,
所以平均数为:,
故,记中位数为,
则有:,
解得:,即,所以.故选:B.
【提分秘籍】 基本规律 中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等 中位数:一组数据按大小顺序排列后,处于中间位置的数.如果个数是偶数,则取中间两个数据的平均数
【变式训练】
1.某市居民月均用水量的频率分布直方图如图所示:
其众数,中位数,平均数的估计值分为,则下列结论正确的是( )
A. B. C. D.
【答案】A
【分析】根据频率直方图计算众数,中位数,平均数的估计值,再比较它们的大小即可.
【详解】由直方图知,众数,
中位数在上,则,解得,
平均数.
∴.故选:A.
2.平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据的分布形态有关.如图所示的统计图,记这组数据的众数为,中位数为,平均数为,则( )
A. B.
C. D.
【答案】B
【分析】根据众数、中位数、平均数的概念,由统计图,可直接得出结果.
【详解】由统计图可得,众数为;
共有个数据,处在中间位置的两个数据为,所以中位数为;
平均数,
所以.故选:B.
3.2017年3月2日至16日,全国两会在北京召开,甲、乙两市近5年与会代表名额数统计如图所示,设甲、乙的数据平均数分别为,中位数分别为y1,y2,则( )
A.,y1>y2 B.,y1=y2
C.,y1=y2 D.,y1<y2
【答案】B
【分析】分别计算甲、乙的平均数和中位数,由此得出选项.
【详解】,故选B.
【点睛】本小题主要考查茎叶图的识别,考查平均数和中位数的计算,属于基础题,直接计算求得相应的结果,再进行比较即可.
【题型五】 增加新数据求平均数
【典例分析】
一个样本的数据在60左右波动,各个数据都减去60后得到一组新数据,算得其平均数是6,则这个样本的平均数是( )
A.6.6 B.6 C.66 D.60
【答案】C
【分析】利用新老数据平均数的关系可求原来数据的平均数.
【详解】设原来的一组数据是,
则每一个数据都减去得到新数据且求得新数据的平均数是,
所以,即,
所以,故样本的平均数是.
故选:C
【提分秘籍】 基本规律 (1)总体方差和标准差:如果总体中所有个体的变量值分别为,总体的平均数为,则称_为总体方差,_为总体标准差. (2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有个,不妨记为,其中出现的频数为,则总体方差为_.
【变式训练】
1.若一组数据的平均数为3,则的平均数为( )
A.3 B.6 C.5 D.2
【答案】B
【分析】根据平均数的和差倍分性质计算即可.
【详解】根据题意可知.
对于,
其平均数为.
故选B.
2.已知一组数据的平均数是1,那么另一组数据的平均数为( )
A.4 B.3 C.2 D.1
【答案】C
【分析】根据平均数公式计算可得;
【详解】解:因为一组数据的平均数是1,所以
即,所以,即一组数据的平均数为;
故选:C
3.设一组样本数据的平均值为2,则数据的平均值为( )
A.11 B.12 C.13 D.14
【答案】C
【分析】利用平均数公式求解即可.
【详解】因为,
所以,
,故选:C.
【题型六】 方差直接算
【典例分析】
样本中共有5个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本的标准差为( )
A. B. C.2 D.
【答案】D
【分析】根据平均数、方差的运算公式求解.
【详解】因为样本a,0,1,2,3的平均数为1,则,解得a=-1,
则样本的方差,
故标准差为.
故选:D.
【提分秘籍】 基本规律 数据的方差为_=,标准差为.
【变式训练】
1.中央电视台的国学知识竞赛节目《中国诗词大会》火爆荧屏,如图的茎叶图是两位选手在个人追逐赛中的比赛得分,则下列说法正确的是( )
甲 乙
9 5 1
5 4 3
8 2 3 0 4
6 4 2 0 5 7 8
4 2 1 1 2
A.甲的平均分大于乙的平均分 B.甲的平均分等于乙的中位数
C.甲的方差大于乙的方差 D.甲的中位数大于乙的中位数
【答案】C
【分析】根据茎叶图得到甲和乙的得分,再根据平均数、中位数和方差公式计算后,比较可得答案.
【详解】由茎叶图可知,甲选手的得分为:11,12,14,24,26,32,38,45,59,
乙选手的得分为:12,20,25,27,28,30,34,43,51,
所以甲的平均分为:,
乙的平均得分为:,
甲的中位数为:26,
乙的中位数为:28,
甲的方差为:
,
乙得方差为:
,
所以甲的平均分小于乙的平均分,故A不正确;
甲的平均分大于乙的中位数,故B不正确;
甲的方差大于乙的方差,故C正确;
甲的中位数小于乙的中位数,故D不正确.
故选:C
2.为了解某班学生每周购买零食的支出情况,利用分层随机抽样的方法抽取了15人进行调查,调查结果如下表,则估算全班学生每周购买零食的支出的方差是( )
人数 平均支出/元 方差
男生 9 40 6
女生 6 35 4
A.10.3 B.11.2 C.12 D.13.4
【答案】B
【分析】根据平均数和方差公式,直接计算求值.
【详解】估算全班学生每周购买零食的支出的平均数,
方差.
故选:B.
3.某特长班有男生和女生各10人,统计他们的身高, 其数据(单位:cm)如下面的茎叶图所示,则下列结论不正确的是( )
A.女生身高的极差为12 B.男生身高的均值较大
C.女生身高的中位数为166 D.男生身高的方差较小
【答案】D
【分析】对选项A,极差就是样本中的最大值减去最小值;对选项B,可直接计算出均值;对选项C,中位数就是按顺序排列的一组数据中居于中间位置的数;方差用来计算每一个变量(观察值)与总体均数之间的差异,根据茎叶图可以明显看出男生身高的方差较大.
【详解】对选项A,女生身高的极差为173-161=12,故选项A正确;
对选项B,男生身高的均值为:
女生身高的均值为: ,故选项B正确;
对选项C,女生身高的中位数为 ,故选项C正确;
对选项D,根据茎叶图可以明显看出男生的身高更离散,而女生的身高更加集中,故男生身高的方差较大,故选项D错误;
故选:D
【题型七】 数据加减后新方差
【典例分析】
已知一组数据,,…,,c是非零常数,则对于数据,,…,,以下说法中正确的是( )
A.平均数与方差都不变 B.平均数变了,方差不变
C.平均数不变,方差变了 D.平均数与方差都变了
【答案】B
【分析】根据平均数与方差的定义直接计算,逐项检验即可得到答案.
【详解】设的平均数为,即,
则其方差为:,
所以的平均数为:,
的方差为:
,
所以平均数变了,方差不变.
故选:B.
【变式训练】
1.若,,…,的方差为2,则,,…,的方差是( )
A.18 B.7 C.6 D.2
【答案】A
【分析】设,,…,的平均数为,写出方差的表示式,同样地表示出所求的方差,利用两式的整体关系求解.
【详解】解:设,,…,的平均数为,方差
又易知,,…,的平均数为.
且,
所以其方差.
故选:A.
2.设数据,,,……,的平均数为,方差为5,数据,,,……,的平均数为8,方差为,则、的值分别是( )
A., B., C., D.,
【答案】D
【分析】根据平均数和方差的性质直接求解即可.
【详解】因为数据,,,……,的平均数为,数据,,,……,的平均数为8,
,解得,
数据,,,……,的方差为5,数据,,,……,的方差为,
故选:D
3.若数据的平均数为2,方差为3,则下列说法不正确的是( )
A.数据,,…,的平均数为20 B.
C.数据,,…,的标准差为 D.
【答案】A
【分析】根据题意,根据数据的平均数和方差的性质依次分析各选项,即得答案.
【详解】对于A,若数据的平均数为2,则数据,,,的平均数为,A错误;
对于B,数据的平均数为2,则 , B正确;
对于C,数据,,,的方差为,故标准差为,C正确;
对于D,由于,
数据的平均数为2,方差为3,则有,
变形可得,D正确.故选:A
【题型八】调整数据求方差
【典例分析】
对全班45名同学的数学成绩进行统计,得到平均数为80,方差为25,现发现数据收集时有两个错误,其中一个95分记录成了75分,另一个60分记录成了80分.纠正数据后重新计算,得到平均数为,方差为,则( )
A., B.,
C., D.,
【答案】C
【分析】根据数据纠正前后的数据总和不变,波动性变大,结合平均数、方差的意义分析,可得结果.
【详解】因为,所以纠正数据前后的数据总和不变,故平均数不变;
但是,在对错误的数据进行纠正后,显然数据的波动性变大,故方差变大.
故选:C.
【变式训练】
1.为庆祝中国共产党成立100周年,深入推进党史学习教育,某中学党支部组织学校初、高中两个学部的党员参加了全省教育系统的党史知识竞赛活动,其中初中部20名党员竞赛成绩的平均分为a,方差为2;高中部50名党员竞赛成绩的平均分为b,方差为.若a=b,则该学校全体参赛党员竞赛成绩的方差为( )
A. B. C. D.
【答案】D
【分析】设初中部20名党员、高中部50名党员竞赛成绩分别为,,得,,然后利用方差的计算公式可得答案.
【详解】设初中部20名党员竞赛成绩分别为,
高中部50名党员竞赛成绩的平均分,根据题意得
则,
,
所以,
,由于,
所以该学校全体参赛党员竞赛成绩的平均分为,
则该学校全体参赛党员竞赛成绩的方差为
.
故选:D.
2.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为,则( )
A., B.,
C., D.,
【答案】D
【分析】利用平均数和方差公式计算即得解.
【详解】解:设7个数为,
则,
,
所以,
所以,
则这个数的平均数为,
方差为.
故选:D.
3.已知一个容量为的样本数据的平均值为90,方差为10,若去掉其中5个为90的样本数据,剩余样本数据的平均值为,方差为,则下列结论正确的是( )
A., B.,
C., D.,
【答案】A
【分析】根据题意,其平均值不变,,再根据方差公式即可得答案.
【详解】由题意可知,个样本数据之和为,
去掉5个相同的样本数据90后,个样本数据之和为,
所以,排除选项C;
因为样本数据中有5个相同的数据90,且,
不妨设去掉的5个相同的样本数据90都排在最后,
则,
所以,即.故选:A
【题型九】方差与标准差求参数
【典例分析】
某校举行校园歌手大赛,5名参赛选手的得分分别是9,8.7,9.3,x,y.已知这5名参赛选手的得分的平均数为9,方差为0.1,则( )
A.0.5 B.0.6 C.0.7 D.0.8
【答案】D
【分析】先由平均数和方差分别得到和的值,再整体代入计算的值即可.
【详解】因为平均数为,
所以.
因为方差为
所以,
所以,
又因为,
所以,
所以,
所以.
故选:D.
【变式训练】
1.已知样本的平均数是9,方差是2,则( )
A.41 B.71 C.55 D.45
【答案】B
【分析】根据平均数与方差的定义,列出方程,求出与的值,即可得出的值.
【详解】的平均数是9,
,即①;又方差是2,
,即②;由①②联立,
解得:或;
故选:B.
2.已知样本的平均数是10,方差是4,则_____;
【答案】91
【分析】根据平均数是10,方差是4,利用相应公式求得x,y即可.
【详解】因为样本的平均数是10,方差是4,
所以,
,
则 ,
解得 或 ,
所以,
故答案为:91
3.某企业生产甲 乙两种产品,现从一批产品中随机抽取两种产品各5件进行检测,检测量结果如下:
甲 7 7 9
乙 6
由于表格被污损,数据a,b看不清,统计员只记得甲 乙两种产品检测数据的平均数和方差都相等,则__________.
【答案】
【分析】求出均值可得,再由方差相等可得,解方程组即可求解.
【详解】,可得 ①,
,
则,
可得 ②,
由①②可得 ,所以 ,
故答案为: .
【题型十】 方差中的最值
【典例分析】
已知一组数据、、、、的平均数为,方差为.若、、、、的平均数比方差大,则的最大值为( )
A. B. C. D.
【答案】B
【分析】设新数据的平均数为,方差为,可得,,由题意得出得出,由得出,将代入,利用二次函数的基本性质可求得的最大值.
【详解】由题意可得,,
设新数据的平均数为,方差为,
则,
,
由题意知,即,可得,
,,
,,,
因此,的最大值为.
故选:B.
【变式训练】
1.设样本数据、、、的平均数为,标准差为,若数据、、、的平均数比标准差大,则的最小值为( )
A. B. C. D.
【答案】D
【分析】由平均数、方差公式结合题意得出,其中,利用二次函数的基本性质可求得的最小值.
【详解】由已知条件可得,,
则数据、、、的平均数为,
方差为
,
由已知可得,所以,,其中,
,
故选:D.
2.设a,b,c是正整数,且,当数据a,b,c的方差最小时,的值为( )
A.221或222 B.222或223 C.223或224 D.224或225
【答案】C
【分析】计算,要使方差最小,取,,根据二次函数性质得到答案.
【详解】设,,
要使方差最小,故三个数据应该尽量靠近,故,,
,
对应二次函数对称轴为,故或时,方差最小,
此时或.
故选:C
3.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本数据平均数为6,样本方差为4,且样本数据互不相同,则样本数据中的最大值为( )
A.8 B.9 C.10 D.11
【答案】B
【分析】设出样本数据,列出方程组,先排除D选项,再假设最大值为10,得到,由于样本数据互不相同,排除10,假设最大值为9,通过令得到正确答案.
【详解】设样本数据为,其中,
由题意得:①,
②,
由于,故样本数据中最大值不是11,
若样本数据中最大值为10,不妨设,代入②中得:③,
由于样本数据互不相同,故③不成立,
若样本数据中最大值为9,不妨令,此时有,,
不妨令满足要求,故样本数据中最大值为9.
故选:B
培优第一阶——基础过关练
1.近年来,随着双碳目标、空调新国标的制定,节能变频空调的需求不断增多,下图为2017-2022中国节能变频空调产量,根据该图,下列说法错误的是( )
A.2017-2022中国节能变频空调年产量逐年增加
B.2017-2022中国节能变频空调年产量的中位数6833.2万台
C.2022年中国节能变频空调产量比上一年增长超过14%
D.2017-2022中国节能变频空调年平均产量超过7500台
【答案】B
【分析】根据图表,中位数的计算,增长率以及平均数的计算,即可逐一判断.
【详解】根据图表显然看出,
2017-2022中国节能变频空调年产量逐年增加,A正确;
因2017-2022共六年,
则2017-2022中国节能变频空调年产量的中位数为,B错;
因,解得,
则2022年中国节能变频空调产量比上一年增长超过14%,C正确;
2017-2022中国节能变频空调年平均产量为:.D正确.
故选:B
2.某射击运动员连续射击5次,命中的环数(环数为整数)形成的一组数据中,中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为( )
A. B. C.8 D.
【答案】B
【分析】首先分析数据的情况,再根据平均数公式计算可得.
【详解】依题意这组数据一共有个数,中位数为,则从小到大排列的前面有个数,后面也有个数,
又唯一的众数为,则有两个,其余数字均只出现一次,则最大数字为,
又极差为,所以最小数字为,
所以这组数据为、、、、,
所以平均数为.
故选:B
3.某校举行知识竞赛,对全校参赛的1000名学生的得分情况进行了统计,把得分数据按,,,,分成5组,得到如图所示的频率分布直方图,则下列说法不正确的是( )
A.图中的x值为0.020 B.得分在的人数为400
C.这组数据的极差为50 D.这组数据的平均数的估计值为77
【答案】C
【分析】根据频率分布直方图中所有长方形的面积和为1,以及极值、频数以及平均数的计算,对每个选项进行逐一分析,即可判断和选择.
【详解】对于A,由,可解得,故选项A正确;
对于B,得分在80分及以上的人数的频率为,
故人数为,故选项B正确;
对于C,频率分布直方图无法看出这组数据的最大值和最小值,故选项C不正确;
对于D,这组数据的平均数的估计值为:,故选项D正确.
故选:C.
4.样本中共有5个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本的标准差为( )
A. B. C.2 D.
【答案】D
【分析】根据平均数、方差的运算公式求解.
【详解】因为样本a,0,1,2,3的平均数为1,则,解得a=-1,
则样本的方差,
故标准差为.
故选:D.
5.如图所示的茎叶图记录了甲、乙两支篮球队各6名队员某场比赛的得分数据(单位:分).若这两组数据的中位数相等,且平均值也相等,则和的值分别为( )
A.2和3 B.0和2 C.0和3 D.2和4
【答案】C
【分析】分别计算中位数和平均值,根据已知条件列方程求解即可.
【详解】,
,
故.①
甲的中位数为:,
故乙的中位数,②
所以由①②得,.
故选:C.
6.甲、乙两人进行射击比赛,分别对同一目标各射击10次,其成绩(环数)如下:
甲的环数 7 7 10 6 10 8 7 9 7 9
乙的环数 7 8 8 9 8 7 7 9 8 9
下列说法正确的是( )
A.甲的平均数大于乙的平均数 B.甲的中位数等于乙的中位数
C.甲、乙的众数都是7 D.乙的成绩更稳定
【答案】D
【分析】求出甲乙的平均数、中位数和众数,即可判断选项ABC,求出方差判断选项D.
【详解】计算得甲、乙的平均数都是8,故A错误;
甲从小到大进行排序:6,7,7,7,7,8,9,9,10,10,
乙从小到大进行排序,7,7,7,8,8,8,8,9,9,9,
所以甲的中位数是7.5,而乙的中位数是8,故B错误;
乙的众数是8,故C错误;
甲的方差为,
乙的方差为,
所以乙的方差小,所以乙的成绩更稳定,故D正确.
故选:D
7.如图,一组数据,,,…,,的平均数为,方差为,去除,这两个数据后,平均数为,方差为,则( )
A., B.,
C., D.,
【答案】D
【分析】根据平均数的定义可得,根据,,结合平均数定义求,再结合方差的意义判断的大小关系,由此判断正确选项.
【详解】由题意,得,则,
又,,
故,
∵,是波动幅度最大的两个点的值,
则去除,这两个数据后,整体波动性减小,
故.
故选:D.
8.现有甲 乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为3,方差为5,乙组数据满足如下条件时,若将这两组数据混合成一组,则关于新的一组数据说法错误的是( )
A.若乙组数据的平均数为3,则新的一组数据平均数为3
B.若乙组数据的方差为5,则新的一组数据方差为5
C.若乙组数据的平均数为3,方差为5,则新的一组数据方差为5
D.若乙组数据的平均数为5,方差为3,则新的一组数据方差为5
【答案】B
【分析】根据分层样本的平均数公式和方差公式分别计算两组数据的总体的平均数或方差即可判断.
【详解】设甲组数据的平均数为,方差为,
乙组数据的平均数为,方差为,
混合后的新数据的平均数为,方差为,
则,,
对于A,新的一组数据平均数,A正确;
对于B,由于不能确定乙组数据的平均数,故由公式可知无法确定新的一组数据方差,B错误;
对于C,因为乙组数据的平均数为3,方差为5,即,,
所以,
所以,C正确;
对于D,因为乙组数据的平均数为5,方差为3,即,,
所以,
所以,D正确;
故选:B.
培优第二阶——能力提升练
1.如图为国家统计局公布的2017~2022年全国城镇居民人均可支配收入及人均消费支出统计图,则( )
A.2017~2022年全国城镇居民人均可支配收入及人均消费支出均呈增长趋势
B.2017~2022年全国城镇居民人均消费支出的中位数为27535
C.2017~2022年全国城镇居民人均可支配收入的极差大于人均消费支出的极差
D.2022年全国城镇居民人均消费支出占人均可支配收入的比例大于80%
【答案】BC
【分析】根据图表逐项进行判断即可求解.
【详解】对于,由图知年全国城镇居民人均可支配收入呈增长趋势,但人均消费支出2020年比2019年少,所以A不正确;
对于B,由图可知年全国城镇居民人均消费支出的中位数为,所以B正确;
对于C,年全国城镇居民人均可支配收入的极差为,人均消费支出的极差为,所以C正确;
对于D,2022年全国城镇居民人均消费支出占人均可支配收入的比例为,小于,所以D不正确.
故选:BC.
2.现有甲、乙、丙三位篮球运动员连续5场篮球比赛得分情况的记录数据,已知三位球员得分情况的数据满足以下条件:
甲球员:5个数据的中位数是26,众数是24;
乙球员;5个数据的中位数是29,平均数是26;
丙球员:5个数据有1个是32,平均数是26,方差是9.6;
根据以上统计数据,下列统计结论一定正确的是( )
A.甲球员连续5场比赛得分都不低于24分
B.乙球员连续5场比赛得分都不低于24分
C.丙球员连续5场比赛得分都不低于24分
D.丙球员连续5场比赛得分的第60百分位数大于24
【答案】AD
【分析】根据中位数,众数的定义判断A,结合中位数,平均数的定义举反例判断B,根据平均数和方差的定义,百分位数的定义,分析丙球员的得分判断CD.
【详解】设甲球员的5场篮球比赛得分按从小到大排列为,
则,,且至少出现次,
故,A正确;
设乙球员的5场篮球比赛得分按从小到大排列为,
则,,
取,可得其满足条件,但有2场得分低于24,B错误;
设丙球员的5场篮球比赛得分按从小到大排列为,
由已知,
所以,
若,则,
所以,矛盾,
所以,,
因为的平均数为,所以,
取,满足要求,但有一场得分低于24分,C错误;
因为,所以丙球员连续5场比赛得分的第60百分位数为,
若,则,故,矛盾,
所以,所以丙球员连续5场比赛得分的第60百分位数大于24,D 正确;
故选:AD.
3.2021年7月24日,中共中央办公厅、国务院办公厅印发《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》.同年8月,国务院教育督导委员会办公室印发专门通知,拟对各省“双减”工作落实进度每半月通报一次.某市教育局为了解“双减”在初中各校的落实情况,随机抽取2000名学生,调查他们课后作业在“双减”前、后的时长,并根据调查结果,绘制如下两个频率分布直方图,图1,图2分别是“双减”前和“双减”后的频率分布直方图.下列说法正确的是( )
A.“双减”后完成课后作业时长更均衡
B.“双减”前估计50%以上的学生作业时长超过小时
C.“双减”后50%以上的学生完成课后作业时长不超过小时
D.“双减”后完成课后作业平均时长比“双减”前完成课后作业平均比时长少约为1小时
【答案】ACD
【分析】根据频率分布直方图的特点即可判断A;根据频率分布直方图求出对应的频率即可判断B,C;根据频率分布直方图求“双减”后完成作业的平均时长,再结合平均数的性质即可判断D.
【详解】对于A,图1与图2相比较,图1更“矮胖”,图2更瘦高,故图2的方差更小,数据也更均衡,故A正确;
对于B,“双减”前学习时长在的频率为,故B错误;
对于C,“双减”后学习时长在的频率为,故C正确;
对于D,设“双减”前学习时长的平均数为,“双减”后学习时长的平均数为,
则
,故D正确.
故选:ACD.
4.已知互不相同的9个样本数据,若去掉其中最大和最小的数据,则剩下的7个数据与原9个数据相比,下列数字特征中不变的是( )
A.中位数 B.平均数
C.方差 D.第40百分位数
【答案】AD
【分析】根据中位数,平均数,方差及百分位数的定义,举例说明即可.
【详解】设这个数分别为,
且,
则中位数为,
去掉最大和最小的数据,得,中位数为,
故中位数一定不变;
由,得的第40百分位数为,
由,得的第40百分位数为,
故第40百分位数不变,
设这个数分别,
则平均数为,
去掉最大和最小的数据为,
此时平均数为,所以此时平均数改变了;
设这个数分别,
则平均数为,
方差为
,
去掉最大和最小的数据为,
则平均数为,
方差为,
所以此时方差都改变了.
故选:AD.
5.有三个男生的平均身高为170cm,方差为30;有七个女生的平均身高为160cm,方差为40,则这10人身高的方差为______.
【答案】58
【分析】根据男女生权重计算出10人的平均身高,该根据男女生权重和方差公式计算出新的方差.
【详解】由题意知,男生的平均身高、权重和方差分别为,,;
女生的平均身高、权重和方差分别为,,;
则,
.
故答案为:58.
6.已知有8个样本数据分别为4,7,8,11,13,15,20,22,则估计该组数据的总体的第三四分位数为______.
【答案】17.5/
【分析】根据第三四分位数的计算方法计算即可.
【详解】由题意,数据的总体的第三四分位数即第75百分位数,又样本数据有8个,
所以第三四分位数为.
故答案为:17.5.
7.在分层抽样时,如果将总体分为k层,第j层抽取的样本量为,第j层的样本平均数为,样本方差为,,.记,则所有数据的样本方差为________.
【答案】
【分析】在分层抽样中先计算第层抽取的样本均值,再计算总体k层的样本均值,即可得出;同理,计算第j层抽取的样本方差,进行一系列整理得到,再计算总体k层的样本方差,由此得答案.
【详解】解:.
∴样本均值为.
又.
计算总体
又.
.
.
故答案为:
【点睛】本题主要考查用分层抽样的方法求样本的均值和方差,属于中档题.
8.在一组数据0,3,5,7,10中加入一个整数a得到一组新数据,这组新数据与原数据相比平均数不增大且方差减小,则a的一个取值为___________.
【答案】2(答案不唯一,中任取一个都正确)
【分析】根据平均数,方差的计算公式计算即可.
【详解】解:由题意得,原数据的平均数
原数据的方差为
新数据的平均数,解得,
新数据的方差为
,
将代入得,,
解得:,
,,所以,
故答案为:2(答案不唯一,中任取一个都正确)
培优第三阶——培优拔尖练
1.设是正整数,且,当数据的方差最小时,的值为__________.
【答案】253或254
【分析】设,根据数据的方差为可化简为,推出要取到最小值,需最小切最小值为11,即可结合二次函数性质确定此时的值,求得答案.
【详解】设,则数据的方差为
,
显然且,
故要取到最小值,需最小,最小值为,
设,则,
则,
当或时,取到最小值,
即或时,取到最小值,
故当数据的方差最小时,即或,
的值为253或254,
故答案为:253或254
2.已知样本容量为5的样本的平均数为3,方差为,在此基础上获得新数据9,把新数据加入原样本得到样本容量为6的新样本,则该新样本的方差为______.
【答案】8
【分析】根据均值公式与方差公式计算.
【详解】记原来的数据为,新增数据为,
由题意,,
,
则,
,
所以新方差为.
故答案为:8.
3.已知总体的各个个体的值由小到大依次为,且总体的中位数为12,若要使该总体的标准差最小,则a=____.
【答案】12
【分析】根据中位数的定义可得,再根据标准差的定义分析其取最小值时的取值即可.
【详解】由中位数为12可得,
所以,
所以总体的平均数为,
要使该总体的标准差最小,
需要最小,
而,
所以时总体的标准差最小.
故答案为:12.
4.若样本数据的标准差为10,则数据的方差为_________.
【答案】900
【分析】设的平均数为,标准差为,则有,则数据的标准差,进而可得答案.
【详解】解:设的平均数为,标准差为,
则,
设的平均数为,标准差为,
则有,
所以,
所以.
故答案为:
5.某学校共有教师490人,其中不到40岁的有350人,40岁及以上的有140人,为了了解普通话在该校教师中的推广普及情况,用分层随机抽样的方法,从全体教师中抽取一个容量为70人的样本进行普通话水平测试,其中在不到40岁的教师中应抽取的人数是______.
【答案】50
【分析】根据要抽取的人数和全体教师的总数,求比值得到每个个体被抽到的概率,用不到40岁的教师的人数乘以被抽到的概率,得到结果.
【详解】依题意得,从全体教师中抽取一个容量为70人的样本进行普通话水平测试,
学校共有教师490人,
所以每个个体被抽到的概率是,
所以不到40岁的教师中应抽取的人数为,
古答案为:50.
6.某学校有男生400人,女生600人.为了调查该校全体学生每天睡眠时间,采用分层抽样的方法抽取样本,计算得男生每天睡眠时间均值为7.5小时,方差为1,女生每天睡眠时间为7小时,方差为0.5.若男、女样本量按比例分配,则可估计总体方差为__________.
【答案】
【分析】先求出总体的均值,再根据分层抽样的性质可求出总体的方差.
【详解】由题意,总体的均值为,
根据分层抽样的性质,则总体的方差为.
故答案为:0.76.
7.已知样本:、、、、,该样本的平均数为7,样本的方差为4,且样本的数据互不相同,则样本数据中的最大值是__________.
【答案】10
【分析】:利用图像先推算出最大数为11,再根据样本的数据互不相同,排除最大数为11,再推算最大数为10时,存在这样的5个数,最后得出答案.
【详解】:由题意,、、、、 ,该样本的平均数为7,则.样本的方差为4,则.如图,表示1,2,3,4,5个点分别位于7的上下两侧,那么,所以,
设,那么,必然存在样本数据相等,不满足题意.
设,那么,不妨设,,,,且满足.所以在最大值为10时存在5个数都为整数满足题意.
【点睛】:本题主要考查了平均数的求法以及方差的求法,可以把平均数看作中位数,依次推导数字的大小,题目要求每个数都为整数,且各不相同,所以解题时可以采用排除法从大到小分类讨论. ‘’
8.已知a,b,c,d,e为5个实数,若a,b,c,d、a,b,c,e、a,b,d,e的方差均为1,则b,c,d,e方差的最大值是________.
【答案】
【分析】先证明一个引理:当“是常数”时,,从而问题可转化为已知的方差均为,求的方差的最大值,分类讨论后可求方差的最大值.
【详解】解:先证明一个引理:当“是常数”时,.
证明:因为.
设,由引理可得原题即:
已知的方差均为,求的方差的最大值.
由题设可得:,
方程组里的前两个等式相减可得,
故,同理.
若互异,则,相减得,前后矛盾!里至少有两个相等.
(1)若,
则问题转化为由求的最大值.
而即,
故,故.
(2)若,则,即.
将代入三个方差等式化简均得:
将代入的表达式得:
当时,.
设. 将之代入得:
,
可得,故.
(3)若“”(由对称性知,“”与“”相同),则
当时,.
故设. 将之代入得:
,
可得,故.
综上,所求方差最大值是.
故答案为:.
【点睛】思路点睛:对于多变量的方差问题的讨论,应根据方差的性质将复杂方程转化为简单方程来处理,注意判别式法在范围计算中的应用.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)中小学教育资源及组卷应用平台
专题12 统计归类
【题型一】 总体百分位
【典例分析】
气象意义上从春季进入夏季的标志为“连续5天,每天的日均气温都不低于”.已知甲,乙,丙,丁四个地区某连续5天日均气温的数据特征如下:
甲地 中位数为,平均数为.
乙地 第60百分位数为,众数为.
丙地 最高气温为,平均数为,标准差为.
丁地 下四分位数为,上四分位数为,极差为.
则可以肯定进入夏季的地区是( )
A.甲地 B.乙地 C.丙地 D.丁地
【提分秘籍】基本规律总体百分位数①第百分位数的定义:一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值. ②计算一组个数据的第百分位数的步骤:第步,按从小到大排列原始数据;第步,计算;第步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数. ③四分位数:常用的分位数有第百分位数、第百分位数、第百分位数,这三个分位数把一组由小到大排列后的数据分成四等分 ,因此称为四分位数. 其中第百分位数也称为第一四分位数或下四分位数等,第百分位数也称为第三四分位数或上四分位数等.
【变式训练】
1.已知按从小到大顺序排列的两组数据:甲组:;乙组:,若这两组数据的第30百分位数 第50百分位数都分别对应相等,则等于( )
A. B. C. D.
2.某地区为了解最近11天该地区的空气质量,调查了该地区过去11天的浓度(单位:),数据依次为53,56,69,70,72,79,65,80,45,41,.已知这组数据的极差为40,则这组数据的第m百分位数为( )
A.71 B.75.5 C.79 D.72
3.日前,十九大代表、奥运冠军——魏秋月老师在升旗仪式上为耀华师生上了一堂生动的体育思政课,并为耀华排球社的同学们带来了魏秋月名师工作室团队的专业技术指导.其间对同学们垫排球的手势技术动作进行了特别指导.之后排球社的同学为训练动作组织了垫排球比赛,以下为排球社50位同学的垫球个数所做的频率分布直方图,所有同学垫球数都在5-40之间.估计垫球数的样本数据的75%分位数是( )
A.25 B.26 C.27 D.28
【题型二】 分层抽样
【典例分析】
为了研究某种病毒与血型之间的关系,决定从被感染的人群中抽取样本进行调查,这些感染人群中O型血、A型血、B型血、AB型血的人数比为4:3:3:2,现用比例分配的分层随机抽样方法抽取一个样本量为的样本,已知样本中O型血的人数比AB型血的人数多20,则( )
A.100 B.120 C.200 D.240
【提分秘籍】基本规律分层随机抽样(1)定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行 简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样_,每一个子总体称为层. 在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配. (2)适用范围:总体可以分层,且层与层之间有明显区别,而层内个体差异较小. (3)平均数的计算:各层抽样比乘以各层平均数的和.
【变式训练】
1.某学校在校学生有2000人,为了增强学生的体质,学校举行了跑步和登山比赛,每人都参加且只参加其中一项比赛,高一、高二、高三年级参加跑步的人数分别为a,b,c,且,全校参加登山的人数占总人数的.为了了解学生对本次比赛的满意程度,按分层抽样的方法从中抽取一个容量为200的样本进行调查,则应从高三年级参加跑步的学生中抽取( )
A.15人 B.30人 C.40人 D.45人
2.已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取4%的学生进行调查,则样本容量和抽取的高中生近视人数分别为
A.400,40 B.200,10 C.400,80 D.200,20
3.从编号为01,02,,49,50的50个个体中利用下面的随机数表选取5个个体,选取方法从随机数表第1行第5列的数开始由左到右依次抽取,则选出来的第5个个体的编号为( )
7816 6572 0812 1463 0782 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
A.14 B.07 C.32 D.43
【题型三】 直方图的平均数
【典例分析】
少年强则国强,少年智则国智.党和政府一直重视青少年的健康成长,出台了一系列政策和行动计划,提高学生身体素质.为了加强对学生的营养健康监测,某校在3000名学生中,抽查了100名学生的体重数据情况.根据所得数据绘制样本的频率分布直方图如图所示,则下列结论正确的是( )
A.样本的众数为65 B.样本的第80百分位数为72.5
C.样本的平均值为67.5 D.该校学生中低于的学生大约为1000人
【提分秘籍】基本规律总体取值规律的估计①画频率分布直方图的五个步骤:求极差_、决定组距与组数、将数据分组、列频率分布表、画频率分布直方图. ②频率分布直方图的特点:各个小长方形的面积表示相应各组的频率;各小长方形的面积的总和等于. ③频率分布直方中,最高的小长方形底边中点的横坐标即是众数;中位数左边和右边的小长方形的面积和是相等的;平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
【变式训练】
1.某市为了解全市12000名高一学生的的体能素质情况,在全市高一学生中随机抽取了1000名学生进行体能测试,并将这1000名的体能测试成绩整理成如下频率分布直方图.根据此频率分布直方图,下列结论中正确的是( )
A.图中的值为0.020;
B.同一组中的数据用该组区间的中点值做代表,则这1000名学生的平均成绩约为80.5;
C.估计样本数据的75%分位数为88;
D.由样本数据可估计全市高一学生体测成绩优异(80分及以上)的人数约为5000人.
2.某中学全体学生参加了数学竞赛,随机抽取了400名学生进行成绩统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示,下列说法正确的是( )
A.直方图中x的值为0.035
B.在被抽取的学生中,成绩在区间的学生数为30人
C.估计全校学生的平均成绩为83分
D.估计全校学生成绩的样本数据的80%分位数约为95分
3.某次考试后,甲 乙两班的数学老师分别统计了各自班级的数学成绩(百分制,均位于内),并将所得数据分为6组:,[90,100],整理得到如图所示的频率分布直方图,则下列说法正确的是( )
A.乙班数学成绩的平均分的估计值高于甲班数学成绩的平均分的估计值(同一组中的数据用该组区间的中点值代替)
B.乙班数学成绩的最高分高于甲班数学成绩的最高分
C.甲班数学成绩的及格率低于乙班数学成绩的及格率(成绩不低于60分为及格)
D.甲班数学成绩不低于80分的人数多于乙班数学成绩不低于80分的人数
【题型四】 中位数
【典例分析】
某公司为了解用户对其产品的满意度,从使用该产品的用户中随机调查了100个用户,根据用户对产品的满意度评分,得到如图所示的用户满意度评分的频率分布直方图.若用户满意度评分的中位数、众数、平均数分别为a,b,c,则( )
A. B. C. D.
【提分秘籍】基本规律中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等中位数:一组数据按大小顺序排列后,处于中间位置的数.如果个数是偶数,则取中间两个数据的平均数
【变式训练】
1.某市居民月均用水量的频率分布直方图如图所示:
其众数,中位数,平均数的估计值分为,则下列结论正确的是( )
A. B. C. D.
2.平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据的分布形态有关.如图所示的统计图,记这组数据的众数为,中位数为,平均数为,则( )
A. B.
C. D.
3.2017年3月2日至16日,全国两会在北京召开,甲、乙两市近5年与会代表名额数统计如图所示,设甲、乙的数据平均数分别为,中位数分别为y1,y2,则( )
A.,y1>y2 B.,y1=y2
C.,y1=y2 D.,y1<y2
【题型五】 增加新数据求平均数
【典例分析】
一个样本的数据在60左右波动,各个数据都减去60后得到一组新数据,算得其平均数是6,则这个样本的平均数是( )
A.6.6 B.6 C.66 D.60
【提分秘籍】基本规律(1)总体方差和标准差:如果总体中所有个体的变量值分别为,总体的平均数为,则称_为总体方差,_为总体标准差.(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有个,不妨记为,其中出现的频数为,则总体方差为_.
【变式训练】
1.若一组数据的平均数为3,则的平均数为( )
A.3 B.6 C.5 D.2
2.已知一组数据的平均数是1,那么另一组数据的平均数为( )
A.4 B.3 C.2 D.1
3.设一组样本数据的平均值为2,则数据的平均值为( )
A.11 B.12 C.13 D.14
【题型六】 方差直接算
【典例分析】
样本中共有5个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本的标准差为( )
A. B. C.2 D.
【提分秘籍】基本规律数据的方差为_=,标准差为.
【变式训练】
1.中央电视台的国学知识竞赛节目《中国诗词大会》火爆荧屏,如图的茎叶图是两位选手在个人追逐赛中的比赛得分,则下列说法正确的是( )
甲 乙
9 5 1
5 4 3
8 2 3 0 4
6 4 2 0 5 7 8
4 2 1 1 2
A.甲的平均分大于乙的平均分 B.甲的平均分等于乙的中位数
C.甲的方差大于乙的方差 D.甲的中位数大于乙的中位数
2.为了解某班学生每周购买零食的支出情况,利用分层随机抽样的方法抽取了15人进行调查,调查结果如下表,则估算全班学生每周购买零食的支出的方差是( )
人数 平均支出/元 方差
男生 9 40 6
女生 6 35 4
A.10.3 B.11.2 C.12 D.13.4
3.某特长班有男生和女生各10人,统计他们的身高, 其数据(单位:cm)如下面的茎叶图所示,则下列结论不正确的是( )
A.女生身高的极差为12 B.男生身高的均值较大
C.女生身高的中位数为166 D.男生身高的方差较小
【题型七】 数据加减后新方差
【典例分析】
已知一组数据,,…,,c是非零常数,则对于数据,,…,,以下说法中正确的是( )
A.平均数与方差都不变 B.平均数变了,方差不变
C.平均数不变,方差变了 D.平均数与方差都变了
【变式训练】
1.若,,…,的方差为2,则,,…,的方差是( )
A.18 B.7 C.6 D.2
2.设数据,,,……,的平均数为,方差为5,数据,,,……,的平均数为8,方差为,则、的值分别是( )
A., B., C., D.,
3.若数据的平均数为2,方差为3,则下列说法不正确的是( )
A.数据,,…,的平均数为20 B.
C.数据,,…,的标准差为 D.
【题型八】调整数据求方差
【典例分析】
对全班45名同学的数学成绩进行统计,得到平均数为80,方差为25,现发现数据收集时有两个错误,其中一个95分记录成了75分,另一个60分记录成了80分.纠正数据后重新计算,得到平均数为,方差为,则( )
A., B.,
C., D.,
【变式训练】
1.为庆祝中国共产党成立100周年,深入推进党史学习教育,某中学党支部组织学校初、高中两个学部的党员参加了全省教育系统的党史知识竞赛活动,其中初中部20名党员竞赛成绩的平均分为a,方差为2;高中部50名党员竞赛成绩的平均分为b,方差为.若a=b,则该学校全体参赛党员竞赛成绩的方差为( )
A. B. C. D.
2.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为,则( )
A., B.,
C., D.,
3.已知一个容量为的样本数据的平均值为90,方差为10,若去掉其中5个为90的样本数据,剩余样本数据的平均值为,方差为,则下列结论正确的是( )
A., B.,
C., D.,
【题型九】方差与标准差求参数
【典例分析】
某校举行校园歌手大赛,5名参赛选手的得分分别是9,8.7,9.3,x,y.已知这5名参赛选手的得分的平均数为9,方差为0.1,则( )
A.0.5 B.0.6 C.0.7 D.0.8
【变式训练】
1.已知样本的平均数是9,方差是2,则( )
A.41 B.71 C.55 D.45
2.已知样本的平均数是10,方差是4,则_____;
3.某企业生产甲 乙两种产品,现从一批产品中随机抽取两种产品各5件进行检测,检测量结果如下:
甲 7 7 9
乙 6
由于表格被污损,数据a,b看不清,统计员只记得甲 乙两种产品检测数据的平均数和方差都相等,则__________.
【题型十】 方差中的最值
【典例分析】
已知一组数据、、、、的平均数为,方差为.若、、、、的平均数比方差大,则的最大值为( )
A. B. C. D.
【变式训练】
1.设样本数据、、、的平均数为,标准差为,若数据、、、的平均数比标准差大,则的最小值为( )
A. B. C. D.
2.设a,b,c是正整数,且,当数据a,b,c的方差最小时,的值为( )
A.221或222 B.222或223 C.223或224 D.224或225
3.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本数据平均数为6,样本方差为4,且样本数据互不相同,则样本数据中的最大值为( )
A.8 B.9 C.10 D.11
培优第一阶——基础过关练
1.近年来,随着双碳目标、空调新国标的制定,节能变频空调的需求不断增多,下图为2017-2022中国节能变频空调产量,根据该图,下列说法错误的是( )
A.2017-2022中国节能变频空调年产量逐年增加
B.2017-2022中国节能变频空调年产量的中位数6833.2万台
C.2022年中国节能变频空调产量比上一年增长超过14%
D.2017-2022中国节能变频空调年平均产量超过7500台
2.某射击运动员连续射击5次,命中的环数(环数为整数)形成的一组数据中,中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为( )
A. B. C.8 D.
3.某校举行知识竞赛,对全校参赛的1000名学生的得分情况进行了统计,把得分数据按,,,,分成5组,得到如图所示的频率分布直方图,则下列说法不正确的是( )
A.图中的x值为0.020 B.得分在的人数为400
C.这组数据的极差为50 D.这组数据的平均数的估计值为77
4.样本中共有5个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本的标准差为( )
A. B. C.2 D.
5.如图所示的茎叶图记录了甲、乙两支篮球队各6名队员某场比赛的得分数据(单位:分).若这两组数据的中位数相等,且平均值也相等,则和的值分别为( )
A.2和3 B.0和2 C.0和3 D.2和4
6.甲、乙两人进行射击比赛,分别对同一目标各射击10次,其成绩(环数)如下:
甲的环数 7 7 10 6 10 8 7 9 7 9
乙的环数 7 8 8 9 8 7 7 9 8 9
下列说法正确的是( )
A.甲的平均数大于乙的平均数 B.甲的中位数等于乙的中位数
C.甲、乙的众数都是7 D.乙的成绩更稳定
7.如图,一组数据,,,…,,的平均数为,方差为,去除,这两个数据后,平均数为,方差为,则( )
A., B.,
C., D.,
8.现有甲 乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为3,方差为5,乙组数据满足如下条件时,若将这两组数据混合成一组,则关于新的一组数据说法错误的是( )
A.若乙组数据的平均数为3,则新的一组数据平均数为3
B.若乙组数据的方差为5,则新的一组数据方差为5
C.若乙组数据的平均数为3,方差为5,则新的一组数据方差为5
D.若乙组数据的平均数为5,方差为3,则新的一组数据方差为5
培优第二阶——能力提升练
1.如图为国家统计局公布的2017~2022年全国城镇居民人均可支配收入及人均消费支出统计图,则( )
A.2017~2022年全国城镇居民人均可支配收入及人均消费支出均呈增长趋势
B.2017~2022年全国城镇居民人均消费支出的中位数为27535
C.2017~2022年全国城镇居民人均可支配收入的极差大于人均消费支出的极差
D.2022年全国城镇居民人均消费支出占人均可支配收入的比例大于80%
2.现有甲、乙、丙三位篮球运动员连续5场篮球比赛得分情况的记录数据,已知三位球员得分情况的数据满足以下条件:
甲球员:5个数据的中位数是26,众数是24;
乙球员;5个数据的中位数是29,平均数是26;
丙球员:5个数据有1个是32,平均数是26,方差是9.6;
根据以上统计数据,下列统计结论一定正确的是( )
A.甲球员连续5场比赛得分都不低于24分
B.乙球员连续5场比赛得分都不低于24分
C.丙球员连续5场比赛得分都不低于24分
D.丙球员连续5场比赛得分的第60百分位数大于24
3.2021年7月24日,中共中央办公厅、国务院办公厅印发《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》.同年8月,国务院教育督导委员会办公室印发专门通知,拟对各省“双减”工作落实进度每半月通报一次.某市教育局为了解“双减”在初中各校的落实情况,随机抽取2000名学生,调查他们课后作业在“双减”前、后的时长,并根据调查结果,绘制如下两个频率分布直方图,图1,图2分别是“双减”前和“双减”后的频率分布直方图.下列说法正确的是( )
A.“双减”后完成课后作业时长更均衡
B.“双减”前估计50%以上的学生作业时长超过小时
C.“双减”后50%以上的学生完成课后作业时长不超过小时
D.“双减”后完成课后作业平均时长比“双减”前完成课后作业平均比时长少约为1小时
4.已知互不相同的9个样本数据,若去掉其中最大和最小的数据,则剩下的7个数据与原9个数据相比,下列数字特征中不变的是( )
A.中位数 B.平均数
C.方差 D.第40百分位数
5.有三个男生的平均身高为170cm,方差为30;有七个女生的平均身高为160cm,方差为40,则这10人身高的方差为______.
6.已知有8个样本数据分别为4,7,8,11,13,15,20,22,则估计该组数据的总体的第三四分位数为______.
7.在分层抽样时,如果将总体分为k层,第j层抽取的样本量为,第j层的样本平均数为,样本方差为,,.记,则所有数据的样本方差为________.
8.在一组数据0,3,5,7,10中加入一个整数a得到一组新数据,这组新数据与原数据相比平均数不增大且方差减小,则a的一个取值为___________.
培优第三阶——培优拔尖练
1.设是正整数,且,当数据的方差最小时,的值为__________.
2.已知样本容量为5的样本的平均数为3,方差为,在此基础上获得新数据9,把新数据加入原样本得到样本容量为6的新样本,则该新样本的方差为______.
3.已知总体的各个个体的值由小到大依次为,且总体的中位数为12,若要使该总体的标准差最小,则a=____.
4.若样本数据的标准差为10,则数据的方差为_________.
5.某学校共有教师490人,其中不到40岁的有350人,40岁及以上的有140人,为了了解普通话在该校教师中的推广普及情况,用分层随机抽样的方法,从全体教师中抽取一个容量为70人的样本进行普通话水平测试,其中在不到40岁的教师中应抽取的人数是______.
6.某学校有男生400人,女生600人.为了调查该校全体学生每天睡眠时间,采用分层抽样的方法抽取样本,计算得男生每天睡眠时间均值为7.5小时,方差为1,女生每天睡眠时间为7小时,方差为0.5.若男、女样本量按比例分配,则可估计总体方差为__________.
7.已知样本:、、、、,该样本的平均数为7,样本的方差为4,且样本的数据互不相同,则样本数据中的最大值是__________.
8.已知a,b,c,d,e为5个实数,若a,b,c,d、a,b,c,e、a,b,d,e的方差均为1,则b,c,d,e方差的最大值是________.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://21世纪教育网(www.21cnjy.com)
" 21世纪教育网(www.21cnjy.com)