第九章 统计(知识归纳+题型突破)(13题型清单)(含答案)2024-2025学年高一数学单元速记·巧练(人教A版2019必修第二册)

文档属性

名称 第九章 统计(知识归纳+题型突破)(13题型清单)(含答案)2024-2025学年高一数学单元速记·巧练(人教A版2019必修第二册)
格式 zip
文件大小 4.0MB
资源类型 试卷
版本资源 人教A版(2019)
科目 数学
更新时间 2025-08-28 10:55:19

文档简介

中小学教育资源及组卷应用平台
第九章 统计(13题型清单)
1.简单随机抽样
(1)定义:一般地,设一个总体含有N(N为正整数)个个体,从中逐个不放回地抽取n()个个体作为样本,如果每次抽取时各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样方法有两种:随机数法和抽签法.
2.分层抽样
(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.
(2)应用范围:总体是由差异明显的几个部分组成的.
(3)分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,抽样比 .
3.频率分布表与频率分布直方图
频率分布表与频率分布直方图的绘制步骤如下:
(1)求极差,即求一组数据中最大值与最小值的差;
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表,落在各小组内的数据的个数叫做频数,每小组的频数与样本容量的比值叫做这一小组的频率,计算各小组的频率,列出频率分布表;
(5)画频率分布直方图,依据频率分布表画出频率分布直方图,其中纵坐标(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组上的小长方形的面积,即每个小长方形的面积.
各个小长方形面积的总和等于1.
4.用样本的数字特征估计总体的数字特征
数字特征 样本数据 频率分布直方图
众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标
中位数 将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分为左右两个面积相等的部分,分界线与x轴交点的横坐标
平均数 样本数据的算术平均数 每个小长方形的面积乘小长方形底边中点的横坐标之和
方差和标准差反映了数据波动程度的大小.
方差:;
标准差:.
5.百分位数
(1)把100个样本数据按从小到大排序,得到第p个和第p+1个数据分别为.可以发现,区间内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数,并称此数为这组数据的第p百分位数,或p%分位数.
(2)一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(3)四分位数
常用的分位数有第25百分位数,第50百分位数(即中位数),第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
题型一 随机数表法
例题1:(24-25高一上·河南南阳·阶段练习)某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,……,699,700.从中抽取70个样本,若从下图提供随机数表中第1行第6列开始向右读取数据,则得到的第4个样本编号是 .
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
【答案】007
【知识点】随机数表法
【分析】直接由随机数表依次读取数据即可.
【详解】从表中第1行第6列开始向右读取数据,依次为253,313,457,860(舍去),
736(舍去),253(舍去),007,
故得到的第4个样本编号是007.
故答案为:007
例题2:(24-25高一上·河南南阳·阶段练习)某车间的质检员利用随机数表对生产的60个零件进行抽样测试,先将60个零件进行编号,编号分别为01,02,…,60,从中选取5个个体组成样本,下面提供随机数表的第1行到第2行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第1行第7列开始向右依次读取数据,则得到的第5个样本编号是 .
【答案】09
【知识点】随机数表法
【分析】由随机数表法直接求解即可.
【详解】从随机数表第1行的第7列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,
符合条件的前5个编号是37,14,05,11,09,所以选出来的第5个样本编号为09.
故答案为:09.
例题3:(23-24高二下·云南昭通·期中)某学校为了了解学生的学习情况,从每班随机抽取了5名学生进行调查.若(1)班有50名学生,对所有学生按01到50进行编号,请从下面的随机数表的第2行第6列的数开始,依次向右,到行末后转至下一行的行首,逐个取样,直到取足样本为止,则抽取的样本的编号是 .
【答案】
【知识点】随机数表法
【分析】利用随机数表法进行求解即可.
【详解】由编号为01到50,从随机数表的第2行第6列的数开始,依次向右,到行末后转至下一行的行首,逐个取样,分别取得,
故答案为:.
巩固训练
1.(24-25高一上·江西南昌·阶段练习)在新冠病毒防疫期间,市场监管局为监管某工厂的口罩生产质量,随机调取这个工厂生产的600个口罩,利用随机数表进行抽样测试,先将600个口罩进行编号,编号分别为001,002,…,599,600,再从中抽取60个样本.以下是随机数表的其中三行:
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 54 36 34 8 53 59 94 83 75 22 53 55 78 32 45 77 89 2
若从表中这三行中的第3行第6列开始向右依次读取数据,则得到的第3个样本编号为 .
【答案】348
【知识点】随机数表法
【分析】按照题中规则在随机数表中依次取数,不大于600且不重复的数据留下,其他去掉,即得结果.
【详解】根据题意,依次获取的样本编号为:
436,535,348,…故第3个样本编号是348.
故答案为:348.
2.(23-24高二上·陕西咸阳·开学考试)省农科站要检测某品牌种子的发芽率,计划采用随机数表法从该品牌800粒种子中抽取60粒进行检测,现将这800粒种子编号如下001,002,…,800,若从随机数表第8行第7列的数7开始向右读,则所抽取的第4粒种子的编号是 .(如下是随机数表第8行至第9行)
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 0 13 42 99 66 02 79 54
【答案】507
【知识点】随机数表法
【分析】根据随机数表法读取数据即可.
【详解】由题意,依次读取的种子的编号为:
785,916(舍去),955(舍去),567,199,810(舍去),507.
故所抽取的第4粒种子的编号为507.
故答案为:507
3.(23-24高一下·吉林白山·期末)国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的未来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一名学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第四个号码为
随机数表如下:
0154 3287 6595 4287 5346
7953 2586 5741 3369 8324
4597 7386 5244 3578 6241
【答案】44
【知识点】随机数表法
【分析】根据随机数表的读取方法列出前几个数,即可得解
【详解】根据随机数表的读取方法,第2行第4列的数为3,每次从左向右选取两个数字,
如下:32,58,65,74,13,36,98,32,44;
其中58,65,74,98不在编号范围内,舍去,再去除重复的,剩下的号码为32,13,36,44,
所以选取的第四个号码为44.
故答案为:44
题型二 简单随机抽样的概率 
例题1:(23-24高二上·西藏日喀则·期末)采用简单随机抽样的方法,从含有20个个体的总体中抽取1个容量为4的样本,则某个个体被抽到的概率为( )
A. B. C. D.
【答案】B
【知识点】简单随机抽样的概率
【分析】依据总体中的每个个体被抽到的概率都是一样的,再结合容量为4,可以看成是抽4次,从而可求得概率.
【详解】由于每个个体被抽到的概率相等,
所以每个个体被抽到的概率是.
故选B.
例题2:(23-24高一下·河北张家口·期末)已知一个总体中有个个体,用抽签法从中抽取一个容量为的样本,若每个个体被抽到的可能性是,则( )
A.10 B.20 C.40 D.不确定
【答案】C
【知识点】简单随机抽样的概率
【分析】抽签法可知每个个体被抽到的可能性均为,即可得到方程,解得即可.
【详解】根据抽签法可知每个个体被抽到的可能性均为,
依题意可得,解得.
故选:C
例题3:(24-25高一上·全国·随堂练习)用简单随机抽样的方法从含n个个体的总体中,逐个抽取一个样本量为3的样本,若其中个体a在第一次就被抽取的可能性为,那么n= .
【答案】8
【知识点】简单随机抽样的概率
【分析】根据简单随机抽样的定义求解.
【详解】因为用简单随机抽样的方法从含n个个体的总体中逐个抽取,个体a在第一次就被抽取的可能性为,
因此,所以.
故答案为:8
巩固训练
1.(23-24高一下·江苏常州·期末)从某班学号为1到10的十名学生(其中含学生甲)中抽取3名学生参加某项调查,现用抽签法抽取样本(不放回抽取),每次抽取一个号码,共抽3次,设甲第一次被抽到的可能性为,第二次被抽到的可能性为,则( )
A., B.,
C., D.,
【答案】D
【知识点】简单随机抽样的概率
【分析】由题意结合简单随机抽样的特征即可确定实数,的值.
【详解】由简单随机抽样的定义知,每个个体在每次抽取中都有相同的可能性被抽到,
因为每次抽取一个号码,所以甲第一次被抽到的可能性为,
第二次被抽到的可能性为.
即甲同学在每次抽样中被抽到的可能性都是,所以,.
故选:D.
2.(2024高一下·全国·专题练习)在简单随机抽样中,下列关于其中一个个体被抽中的可能性说法正确的是(  )
A.与第几次抽样有关,第一次抽到的可能性更大一些
B.与第几次抽样有关,最后一次抽到的可能性更大一些
C.与第几次抽样无关,每次抽到的可能性都相等
D.与第几次抽样有关,第一次抽到的可能性更小一些
【答案】C
【知识点】简单随机抽样的特征及适用条件、简单随机抽样的概率
【分析】根据给定条件,利用简单随机抽样的意义逐项判断即得.
【详解】在简单随机抽样中,每个个体每次被抽中的可能性都相等,与第几次抽样无关,A,B,D错误,C正确.
故选:C
3.(24-25高二·上海·课堂例题)某中学从800名应届毕业生中,抽取60名学生进行身体素质测试,应采用 抽样,每个个体被抽到的可能性是 .
【答案】 随机数法 /
【知识点】随机数表法、简单随机抽样的概率
【分析】运用简单随机抽样知识可解
【详解】数据较少,编号简单,数据具有代表性,可用随机数法.等可能事件,则概率为.
故答案为:随机数法,.
题型三 简单随机抽样估计总体 
例题1:(24-25高一上·贵州遵义)管理人员从一池塘内随机捞出40条鱼,做上标记后放回池塘.10天后,又从池塘内随机捞出70条鱼,其中有标记的有2条.根据以上数据可以估计该池塘内鱼的总条数是( )
A.2800 B.1800 C.1400 D.1200
【答案】C
【知识点】简单随机抽样的概率、简单随机抽样估计总体
【分析】由从池塘内捞出70条鱼,其中有标记的有2条,可得所有池塘中有标记的鱼的概率,结合池塘内具有标记的鱼一共有40条鱼,按照比例即得解.
【详解】设估计该池塘内鱼的总条数为,
由题意,得从池塘内捞出70条鱼,其中有标记的有2条,
所有池塘中有标记的鱼的概率为:,
又因为池塘内具有标记的鱼一共有40条鱼,
所以,解得,
即估计该池塘内共有条鱼.
故选:C.
例题2:(多选)(2024·湖北·模拟预测)某地区公共部门为了调查本地区中学生的吸烟情况,对随机抽出的编号为1~1000的1000名学生进行了调查.调查中使用了两个问题,问题1:你的编号是否为奇数?问题2:你是否吸烟?被调查者从设计好的随机装置(内有除颜色外完全相同的白球50个,红球50个)中摸出一个小球(摸完放回):摸到白球则如实回答问题1,摸到红球则如实回答问题2,回答“是”的人在一张白纸上画一个“√”,回答“否”的人什么都不用做,由于问题的答案只有“是”和“否”,而且回答的是哪个问题也是别人不知道的,因此被调查者可以毫无顾忌的给出真实的答案.最后统计得出,这1000人中,共有265人回答“是”,则下列表述正确的是( )
A.估计被调查者中约有15人吸烟 B.估计约有15人对问题2的回答为“是”
C.估计该地区约有3%的中学生吸烟 D.估计该地区约有1.5%的中学生吸烟
【答案】BC
【知识点】简单随机抽样估计总体
【分析】先求出回答问题2且回答的“是”的人数,从而估计出该地区中学生吸烟人数的百分比,即得解.
【详解】随机抽出的1000名学生中,回答第一个问题的概率是,其编号是奇数的概率也是,所以回答问题1且回答的“是”的学生人数为,
回答问题2且回答的“是”的人数为,
从而估计该地区中学生吸烟人数的百分比为,
估计被调查者中吸烟的人数为.
故选:BC.
例题3:(2024高一下·全国·专题练习)中国古典数学先后经历了三次发展高潮,即两汉时期、魏晋南北朝时期和宋元时期,并在宋元时期达到顶峰,而南宋时期的数学家秦九韶正是其中的代表人物.作为秦九韶的集大成之作,《数书九章》一书所承载的数学成就非同一般.可以说,但凡是实际生活中需要运用到数学知识的地方,《数书九章》一书皆有所涉及,例如“验米夹谷”问题:今有谷3318石,抽样取谷一把,数得168粒内有秕谷22粒,则粮仓内的秕谷约为 石(结果四舍五入取整数).
【答案】435
【知识点】简单随机抽样估计总体
【分析】根据给定条件,利用样本的数字特征估计总体的相应特征作答.
【详解】设粮仓内的秕谷有x石,依题意,,解得,
所以粮仓内的秕谷约为435石.
故答案为:435.
巩固训练
1.(2024·河南·三模)中国农历的“二十四节气”是凝结着中华民族的智慧与传统文化的结晶,2022年2月4日北京冬奥会开幕式,以二十四节气的方式开始倒计时,惊艳全球.某小学一年级随机抽查100名学生并提问“二十四节气歌”,只能说出两句的有32人,能说出三句或三句以上的有45人,据此估计该校一年级的400名学生中对“二十四节气歌”只能说出一句或一句也说不出的人数约为( )
A.23 B.92 C.128 D.180
【答案】B
【知识点】简单随机抽样估计总体
【分析】先计算100名学生中能说出一句或一句也说不出的人数,根据抽样比例计算即可
【详解】由题意,100名学生中能说出一句或一句也说不出的人数为人
故该校一年级的400名学生中对“二十四节气歌”只能说出一句或一句也说不出的人数约为人
故选:B
2.(24-25高一下·全国·课后作业)某学校有1200名学生,随机抽出300名进行调查研究,调查者设计了一个随机化装置,这是一个装有大小、形状和质量完全相同的10个红球、10个绿球和10个白球的袋子.调查中有两个问题:
问题1:你的阳历生日月份是不是奇数?
问题2:你是否抽烟?
每个被调查者随机从袋中摸出1个球(摸出后再放回袋中).若摸到红球就如实回答第一个问题;若摸到绿球,则不回答任何问题:若摸到白球,则如实回答第二个问题.所有回答“是”的调查者只需往一个盒子中放一个小石子,回答“否”的被调查者什么也不用做.最后收集回来53个小石子,估计该学校吸烟的人数为 .
【答案】36
【知识点】简单随机抽样估计总体
【分析】根据题意估计出该校吸烟人数的比例,再用总人数乘以该比例即可得到答案.
【详解】由题意可知,每个学生从袋中摸出1个红球或1个绿球或1个白球的概率都是,
即大约有(人)回答了第一个问题,(人)不回答任何问题,(人)回答了第二个问题.
因为阳历生日月份是奇数的概率是,
所以回答第一个问题的100人中,大约有50人回答了“是”.
所以我们能推出,在回答第二个问题的100人中,大约有3人回答了“是”,
即估计该学校大约有3%的学生抽烟,也就是全校大约有36人抽烟.
故答案为:36.
3.(23-24高一下·黑龙江哈尔滨·期末)二战期间盟军的统计学家主要是将缴获的德军坦克序列号作为样本,用样本估计总体的方法得出德军某月生产的坦克总数.假设德军某月生产的坦克总数是N,缴获的该月生产的n辆坦克编号从小到大为,,…,,即最大编号为,且缴获的坦克是从所生产的坦克中随机获取的,因为生产坦克是连续编号的,所以缴获坦克的编号,,…,,,相当于从中随机抽取的n个整数,这n个数将区间分成个小区间,由于N是未知的,除了最右边的区间外,其他n个区间都是已知的.由于这n个数是随机抽取的,所以可以用前n个区间的平均长度估计所有个区间的平均长度,进而得到N的估计值.例如,缴获坦克的编号是3,5,12,18,20,则统计学家利用上述方法估计德军每月生产的坦克数为 .

【答案】24
【知识点】简单随机抽样估计总体、简单随机抽样的特征及适用条件
【分析】根据统计学家利用的方法列比例式计算,即可求得答案.
【详解】由于用前n个区间的平均长度估计所有个区间的平均长度,
而缴获坦克的编号是3,5,12,18,20,即,
故,
即则统计学家利用上述方法估计德军每月生产的坦克数为24,
故答案为:24
题型四 分层抽样 
例题1:(2024·河南·三模)国内某优秀新能源电池制造企业在锂电池单位能量密度技术上取得了重大突破,该制造企业内的某车间有两条生产线,分别生产高能量密度锂电池和低能量密度锂电池,总产量为400个锂电池.质检人员采用分层随机抽样的方法随机抽取了一个容量为80的样本进行质量检测,已知样本中高能量密度锂电池有35个,则估计低能量密度锂电池的总产量为( ).
A.325个 B.300个 C.225个 D.175个
【答案】C
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】根据分层抽样计算规则计算可得.
【详解】根据分层随机抽样可知低能量密度锂电池的产量为(个).
故选:C
例题2:(24-25高一上·江西南昌·阶段练习)某中学选派270名学生参加南昌市广播体操比赛,其中高一108人,高二、高三各81人,现要在比赛前抽取10人参加检验训练熟练度,考虑选用简单随机抽样、分层抽样两种方案,将学生按高一、高二、高三依次统一编号为1,2,…,270.如果抽到的号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270.
则不可能为分层抽样的是( )
A.① B.② C.③ D.④
【答案】D
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】设在高一,高二,高三分别抽取人,分层抽样即等比例抽样,要求各层的抽样比相同,即,解得,再按照编号从各层中抽取即可.
【详解】设在高一,高二,高三分别抽取人,
则由分层抽样可知,解得,
由题意可知,需要从高一编号1到108里抽取4个,从高二编号109到189里抽取3个,
从高三编号190到270里抽取3个,所以④中的111不符合题意.
故选:D
例题3:(23-24高二下·云南·期末)某地区的高中学校分为A、B两类,A类高中学校共有学生6000人,B类高中学校共有学生2000人.现按A、B两类进行分层,用分层随机抽样的方法,从该地区的高中学校抽取学生40人进行调查研究.设抽到该地区A类高中学校学生x人,则 .
【答案】30
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】由分层抽样中各层样本数的确定方法求解即可.
【详解】由题意,.
故答案为:30.
巩固训练
1.(2024·黑龙江哈尔滨·模拟预测)在哈尔滨市2024年第一次市模考试中,三所学校高三年级的参考人数分别为、.现按比例分层抽样的方法从三个学校高三年级中抽取样本,经计算得三所学校高三年级数学成绩的样本平均数分别为,则三所学校学生数学成绩的总平均数约为( )
A.101 B.100 C.99 D.98
【答案】B
【知识点】分层抽样的特征及适用条件
【分析】利用分层抽样的均值公式求解即可.
【详解】由题意得可供参考的总人数为人,
故三所学校学生数学成绩的总平均数约为,
故选:B
2.(24-25高三上·河南许昌·期中)唐代以来,牡丹之盛,以“洛阳牡丹甲天下”的美名流传于世.唐已知根据花瓣类型可将牡丹分为单瓣类、重瓣类、千瓣类三类,现有牡丹花n朵,千瓣类比单瓣类多30朵,采用分层抽样方法从中选出12朵牡丹进行观察研究,其中单瓣类有4朵,重瓣类有2朵,千瓣类有6朵,则n=( )
A.360 B.270 C.240 D.180
【答案】D
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】利用分层抽样中各层之间的比例,结合已知条件列方程求解.
【详解】根据分层抽样的特点,设单瓣类、重瓣类、千瓣类的朵数分别为,
由题意可得,解得,所以.
故选:D.
3.(2024·四川德阳·一模)某中学田径队有男运动员28人,女运动员21人,按性别进行分层随机抽样的方法从全体运动员中抽取一个容量为14的样本,如果样本按比例分配,则男运动员应该抽取的人数为
【答案】8
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】先计算得到抽取比例为,再计算得到答案.
【详解】解:田径队运动员的总人数是,要得到14人的样本,占总体的比例为,
于是应该在男运动员中随机抽取(名),
故答案为:8
题型五 分层抽样中的均值和方差
例题1:(24-25高三上·广西·阶段练习)2024年10月,“2024环广西世巡赛”成功举行,志愿者的服务工作是世巡赛成功举办的重要保障,某单位承办了志愿者选拔的面试工作.现随机抽取了200名侯选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.已知第一 二组的频率之和为0.3,第一组和第五组的频率相同.
(1)求的值;
(2)若面试成绩前68名为优秀,请估计优秀成绩的最低分;
(3)现从以上各组中用分层抽样的方法选取20人,担任本次宣传者.若本次宣传者中第二组面试者的面试成绩的平均数和方差分别为62和30,第四组面试者的面试成绩的平均数和方差分别为80和40,据此估计这次第二组和第四组所有面试者的方差.
(注:若将总体划分为若干层,随机抽取两层,通过分层随机抽样,每层抽取的样本量 样本平均数和样本方差分别为:,,,,,.记这两层总的样本平均数为,样本方差为,则).
【答案】(1)
(2)7
(3)
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、计算频率分布直方图中的方差、标准差、抽样比、样本总量、各层总数、总体容量的计算
【分析】(1)根据频率分布直方图和所给条件列出式子,求解得出的值,
(2)根据(1)求出每组频率,再根据判断优秀成绩的最低分,列出等式计算即可;
(3)首先算出抽样比,再根据加权平均公式以及方差的性质即可列式求解.
【详解】(1)由题意可知,,解得;
(2)由(1)可知每组的频率依次为,,,,,
因为,故优秀成绩的最低分,
所以,
可得,所以优秀成绩的最低分为7;
(3)设第二组 第四组的平均数分别为,,方差分别为,,
且各组频率之比为:,
所以用分层抽样的方法抽取第二组面试者人,
第四组面试者人,
则第二组和第四组面试者的面试成绩的平均数:,
第二组 第四组面试者的面试成绩的方差:

故估计第二组 第四组面试者的面试成绩的方差是.
例题2:(24-25高二上·湖南长沙·阶段练习)某校高一年级设有羽毛球训练课,期末对学生进行羽毛球五项指标(正手发高远球、定点高远球、吊球、杀球以及半场计时往返跑)考核,满分100分.参加考核的学生有40人,考核得分的频率分布直方图如图所示.

(1)由频率分布直方图,求出图中的值,并估计考核得分的第60百分位数;
(2)为了提升同学们的羽毛球技能,校方准备招聘高水平的教练.现采用分层抽样的方法(样本量按比例分配),从得分在内的学生中抽取5人,再从中挑出两人进行试课,求两人得分分别来自和的概率;
(3)若一个总体划分为两层,通过按样本量比例分配分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:,,;,,.记总的样本平均数为,样本方差为,证明:.
【答案】(1),85
(2)
(3)证明见解析
【知识点】抽样比、样本总量、各层总数、总体容量的计算、计算几个数据的极差、方差、标准差、计算古典概型问题的概率
【分析】(1)首先根据频率和为1求出,再根据百分数公式即可得到答案;
(2)求出各自区间人数,列出样本空间和满足题意的情况,根据古典概型公式即可;
(3)根据方差定义,证明出分层抽样的方差公式,代入计算即可.
【详解】(1)由题意得:,解得,
设第60百分位数为,则,
解得,即第60百分位数为85.
(2)由题意知,抽出的5位同学中,得分在的有人,设为,,
在的有人,设为a,b,c.
则样本空间为,.
设事件“两人分别来自和”,
则,,
因此,
所以两人得分分别来自和的概率为.
(3)由题得①;


同理,

.
得证.
例题3:(23-24高一下·湖南株洲·期末)某教育集团高一期末考试,从全集团的政治成绩中随机取100名学生的原始成绩(满分100分)进行分析,其频率分布直方图如图所示:
(1)求图中的值;
(2)若采用分层抽样的方法,从原始成绩在和内的学生中共抽取6人查看他们的答题情况,再从中选取2人进行个案分析,求这2人中恰有一人原始成绩在内的概率;
(3)已知落在的平均成绩,方差,落在的平均成绩,方差,求落在的平均成绩,并估计落在的成绩的方差.
【答案】(1)0.03
(2)
(3);.
【知识点】分层抽样的概率、计算古典概型问题的概率、抽样比、样本总量、各层总数、总体容量的计算、补全频率分布直方图
【分析】(1)由各组的频率之和为1,求的值;
(2)由分层抽样得两组抽取人数,再由古典概型求概率;
(3)由分层抽样的均值和方差公式求解.
【详解】(1)由题可知,
解得;
(2)由原始分在和中的频率之比为,
故抽取的6人中,原始分在中的有2人,记为,在中的有4人,记为,
则从6人中抽取2人,所有可能的结果有:
共15个基本事件,
其中抽取这2人中怡有一人原始成绩在内的结果有:
共8个基本事件,
所以抽取这2人中恰有一人原始成绩在内的概率;
(3),
.
巩固训练
1.(23-24高一下·贵州六盘水·期末)文明城市是反映城市整体文明水平的综合性荣誉称号.作为普通市民,既是文明城市的最大受益者,又是文明城市的主要创造者.六盘水市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛(满分100分),从所有答卷的成绩中抽取了容量为100的样本,将样本(成绩均为不低于50分的整数)分成五段:得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值和估计样本的下四分位数;
(2)按照分层抽样的方法,从样本中抽取20份成绩,应从中抽取多少份;
(3)已知落在的平均成绩是53,方差是4;落在的平均成绩为65,方差是7,求成绩落在的平均数和方差.
(注:若将总体划分为若干层,随机抽取两层,通过分层随机抽样,每层抽取的样本量、样本平均数和样本方差分别为:.记这两层总的样本平均数为,样本方差为,则)
【答案】(1),
(2)人
(3),
【知识点】计算几个数据的极差、方差、标准差、总体百分位数的估计、抽样比、样本总量、各层总数、总体容量的计算、计算几个数的平均数
【分析】(1)根据频率分布直方图中所有小矩形的面积之和为得到方程求出的值,再根据百分位数计算规则计算可得;
(2)根据分层抽样计算规则计算可得;
(3)首先求出各组的人数,再根据平均数、方差公式计算可得.
【详解】(1)由已知可得由已知可得

样本成绩在分以下的答卷所占的比例为,
样本成绩在分以下的答卷所占的比例为,
因此样本成绩的下四分位数一定位于内,设为,则,解得,
所以因此样本成绩的下四分位数为;
(2)按照分层抽样的方法,从样本中抽取份成绩,抽样的比例为,
样本成绩在有人,
则从样本成绩中抽取人;
(3)落在的人数为人,
落在的人数为人,
两组成绩的总平均数,
两组成绩的总方差.
2.(23-24高一下·吉林·期末)随着全民健身意识增强,马拉松运动逐渐成为深受群众喜爱的体育健身项目之一.吉林市自2016年以来,现已成功举办五届马拉松比赛,“吉马”也因此成为了东北地区乃至全国颇具影响力的品牌赛事.2023年“吉马”被中国田径协会评为“城市形象媒体传播赛事典型案例”.时隔一年,吉林市委、市政府再次启动这一国际化赛事,将挑战自我、超越极限、坚韧不拔、永不放弃的马拉松精神与我市激流勇进的城市精神相结合,并将其发扬光大.为此,某校举办了“吉马”知识竞赛,从所有竞赛成绩中抽取一个容量为100的样本,并按竞赛成绩(单位:分)分成六组:,,,,,,得到如下图所示的频率分布直方图.

(1)求频率分布直方图中a的值,并求样本中竞赛成绩的第80百分位数;
(2)现从样本中竞赛成绩在内用比例分配的分层随机抽样的方法抽取6人,再从这6人中抽取2人座谈,求至少有一人竞赛成绩在内的概率;
(3)已知样本中竞赛成绩在内的平均数,方差,样本中竞赛成绩在内的平均数,方差,并据此估计所有答卷中竞赛成绩在内的总体方差.
参考公式:总体分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:,,;,,.记总的样本平均数为,样本方差为,.
【答案】(1),第80百分位数为
(2)
(3)
【知识点】计算古典概型问题的概率、计算频率分布直方图中的方差、标准差、抽样比、样本总量、各层总数、总体容量的计算、总体百分位数的估计
【分析】(1)首先求出值,根据百分位数求解公式即可得到答案;
(2)首先利用分层抽样的定义求出两区间占比人数,再根据古典概型和对立事件的概率求法即可;
(3)利用题目所给的分层抽样的方差公式即可.
【详解】(1),.
.

第80百分位数在区间中
设第80百分位数为,则,
,所以第80百分位数为.
(2)由题知,区间的频率比为,,,
则在区间抽取2人,记为,在区间抽取4人,记为,
从这6人中抽取两人座谈,样本空间如下:
,共15个样本点,
设“至少有一人竞赛成绩在内”为事件,
事件,所以,
所以至少有一人竞赛成绩在内的概率为.
(3)区间的频率比为,

.
3.(23-24高一下·吉林通化·阶段练习)2023年10月22日,汉江生态城2023襄阳马拉松在湖北省襄阳市成功举行,志愿者的服务工作是马拉松成功举办的重要保障,襄阳市新时代文明实践中心承办了志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.已知第一、二组的频率之和为0.3,第一组和第五组的频率相同.
(1)估计这100名候选者面试成绩的平均数和第25百分位数;
(2)现从以上各组中用分层随机抽样的方法选取20人,担任本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为62和40,第四组面试者的面试成绩的平均数和方差分别为80和70,据此估计这次第二组和第四组所有面试者的面试成绩的方差.
(注:若总体分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:,,;,,记总样本的平均数为,样本方差为.则样本方差)
【答案】(1);63.
(2)
【知识点】由频率分布直方图估计平均数、总体百分位数的估计、抽样比、样本总量、各层总数、总体容量的计算、估计总体的方差、标准差
【分析】(1)由题意先求出,进一步结合平均数公式、百分位数的定义即可列式求解;
(2)首先算出抽样比,再根据加权平均公式以及方差的性质即可列式求解.
【详解】(1)由题意可知:,解得,
可知每组的频率依次为:,,,,,
所以平均数为,
因为,
设第25百分位数为,则,则,
解得,故第25百分位数为63.
(2)设第二组、第四组面试者的面试成绩的平均数与方差分别为,
且两组频率之比为,
则第二组和第四组所有面试者的面试成绩的平均数,
第二组和第四组所有面试者的面试成绩的方差

故估计第二组和第四组所有面试者的面试成绩的方差是.
题型六 频率分布表 
例题1:(24-25高二上·陕西西安·阶段练习)对某校高二年级学生参加社区服务次数进行统计,随机抽取名学生作为样本,得到名学生参加社区服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图如下:
分组 频数 频率
合计
(1)求出表中,及图中的值;
(2)估计高二年级学生参加社区服务次数的平均数和中位数(保留一位小数).
【答案】(1),;
(2)
【知识点】补全频率分布直方图、由频率分布直方图估计平均数、补全频率分布表、由频率分布直方图估计中位数
【分析】(1)根据频数与频率的统计表和频率分布直方图计算可得结果.
(2)利用频率分布直方图估计平均数和中位数..
【详解】(1)由内的频数是10,频率是0.25知,,解得M=40,
由频数之和为40,得,所以;
而a是对应分组的频率与组距的商,所以.
(2)服务次数落在的频率依次为,
高二年级学生参加社区服务次数的平均数为,
高二年级学生参加社区服务次数的中位数,则,解得,
所以高二年级学生参加社区服务次数的平均数和中位数分别为.
例题2:(24-25高一·全国·随堂练习)从标准质量为的一批洗衣粉中,随机抽查了50袋,测得的质量数据如下(单位:):
494 498 493 494 496 492 490 490 500 499
494 495 482 485 502 493 505 485 501 491
493 500 509 512 484 509 510 494 497 498
504 498 483 510 503 497 502 498 497 500
493 499 505 493 491 497 515 503 498 518
(1)找出这组数的最值,求出极差;
(2)以为第一个分组的区间,作出这组数的频率分布直方图.
【答案】(1)最大值为518,最小值为482,极差为36;
(2)见解析.
【知识点】绘制频率分布直方图、计算几个数据的极差、方差、标准差、绘制频率分布表
【分析】(1)根据数据找出最大值最小值即可得到极差;
(2)根据分组整理各组频数,求出频率,依次统计,即可得出频率分布表再作出频率分布直方图.
【详解】(1)这组数的最大值为518,最小值为482,极差为36.
(2)以为第一个分组区间,组距为7,将数据整理为下表:作出频率分布表如图所示.
分组区间 个数累计 频数 频率
正 5 0.1
14 0.28
17 0.34
7 0.14
正一 6 0.12
一 1 0.02
频率分布直方图如下:
巩固训练
1.(2024高一下·江苏·专题练习)有一容量为50的样本,数据的分组及各组的数据如下:,4;,9;,5;,8;,10;,3;,11.
(1)列出样本频率分布表;
(2)画出频率直方图及频率折线图.
【答案】(1)频率分布表见解析
(2)频率直方图及频率折线图见解析
【知识点】绘制频率分布表、绘制频率分布直方图、绘制频率分布折线图
【分析】(1)由各组的频数除以样本容量即可求得频率分布表;
(2)根据(1)中的频率除以组距得到各组的纵坐标,进而绘制出频率分布直方图,然后连接各个小矩形顶端的中点得到频率分布折线图.
【详解】(1)由所给的数据,不难得出以下样本的频率分布表.
数据段 频数 频率
4 0.08
5 0.10
10 0.20
11 0.22
9 0.18
8 0.16
3 0.06
合计 50 1
(2)频率直方图如图1所示,频率折线图如图2折线部分所示.


2.(2024高一·全国·课后作业)对某电子元件进行寿命追踪调查,情况如下:
寿命(h) 100~200 200~300 300~400 400~500 500~600
个数 20 30 80 40 30
(1)列出频率分布表;
(2)画出频率分布直方图;
(3)估计电子元件寿命在以内的概率;
(4)估计电子元件寿命在400h以上的概率.
【答案】(1)答案见解析;
(2)答案见解析;
(3);
(4).
【知识点】绘制频率分布直方图、由频率分布直方图计算频率、频数、样本容量、总体容量、绘制频率分布表
【分析】(1)根据已知数据画出样本频率分布表;
(2)根据频率分布表画出频率分布直方图:
(3)求出寿命在的电子元件出现的频率即得解;
(4)求出寿命在以上的电子元件出现的频率即得解.
【详解】(1)样本频率分布表如下:
寿命 频数 频率
20
30
80
40
30
合计 200 1
(2)根据频率分布表画出频率分布直方图如下:
(3)由频率分布表可以看出,寿命在的电子元件出现的频率为,所以我们估计电子元件寿命在的概率为.
(4)由频率分布表可知,寿命在以上的电子元件出现的频率为,故我们估计电子元件寿命在以上的概率为.
题型七 频率分布直方图
例题1:(24-25高一上·全国·课后作业)某养猪场定购了一批仔猪,从中随机抽查了100头仔猪的体重(单位:斤),经数据处理得到如图①的频率分布直方图,其中体重最轻的14头仔猪的体重的频数分布表如图②,为了将这批仔猪分栏喂养,需计算频率分布直方图中的一些数据,其中a+b的值为( )
体重 22 24 26 27 28 29 31
频数 1 1 2 3 3 2 2
图②
A.0.144 B.0.152 C.0.76 D.0.076
【答案】B
【知识点】补全频率分布直方图、由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】根据图表的频数及频率分布直方图概率和为1列式求参即可.
【详解】由题意得,且 ,
所以,所以.
故选:B.
例题2:(24-25高二上·安徽·阶段练习)某中职学校为了解全校学生国庆小长假期间阅读古典名著的时间的情况,抽查了1000名学生,将他们的阅读时间进行分组:.抽样结果绘成的频率分布直方图如图所示.则实数 .这1000名学生阅读古典名著的时间不少于8小时的人数为 .
【答案】 /
【知识点】补全频率分布直方图、由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】①由直方图中所有矩形的高度之和乘以组距为可求解,②再由频率分布直方图求出时间在小时以上的频率,再求人数.
【详解】根据频率分布直方图的几何意义,坐标系内的所有矩形的高度之和乘以组距为定值1,
所以,得,
阅读时间不少于小时的人数为.
故答案为:①,②.
例题3:(2024高一下·江苏·专题练习)某校高二年级期末统一测试,随机抽取一部分学生的数学成绩,分组统计如下表.
分组 频数 频率
3 0.03
3 0.03
37 0.37
m n
15 0.15
合计 M N
(1)求出表中的值,并根据表中所给数据在给出的坐标系中画出频率直方图;
(2)若全校参加本次考试的学生有600人,试估计这次测试中全校成绩在90分以上的人数.
【答案】(1),作图见解析
(2)342
【知识点】补全频率分布表、根据频率分布表解决实际问题、绘制频率分布直方图
【分析】(1)利用频率分布表的性质依次求得,再利用频率分布直方图的作法即可得解;
(2)利用频率分布表,结合比例列式即可得解.
【详解】(1)由频率分布表得,
所以,,
频率直方图如图所示,
(2)由题意,知全校成绩在90分以上的学生的人数约为.
巩固训练
1.(24-25高一上·四川成都·开学考试)八年级(1)班同学为了解某小区家庭月均用水情况,随机调查了该小区部分家庭,并将调查数据整理成如下两幅不完整的统计图表:
月均用水量x(t) 频数(户) 频率
6 0.12
m 0.24
16 0.32
10 0.20
4 n
2 0.04
请根据以上信息,解答以下问题:
(1)直接写出频数分布表中的m、n的值并把频数直方图补充完整;
(2)求出该班调查的家庭总户数是多少?
(3)求该小区用水量不超过15的家庭的频率.
【答案】(1),答案见解析
(2)50;
(3)0.68.
【知识点】补全频率分布直方图、由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】(1)根据任意一组频数和频率即可得出总频数,即总频数为,即可得出,进而求得,补充完整的频数直方图见详解;
(2)根据任意一组频数和频率即可得出总频数;
(3)根据统计图表,即可求得该小区用水量不超过15的家庭的频率.
【详解】(1)∵频数为6,频率为,
∴总频数为,
∴,
∴,
数据求出后,即可将频数直方图补充完整,如下图所示:
(2)根据(1)中即可得知,总频数为,
答:该班调查的家庭总户数是50户;
(3)根据统计图表,该小区用水量不超过15的家庭的频率即为
2.(24-25高一上·全国·课后作业)中小学生的视力状况受到全社会的广泛关注,某市有关部门对全市4万名初中生的视力状况进行一次抽样调查统计,所得到的有关数据绘制成频率分布直方图,如图,从左至右五个小组的频率之比是2∶4∶9∶7∶3,第五小组的频数是30.

(1)本次调查共抽调了多少名学生?
(2)如果视力在属正常,那么全市初中生视力正常的约有多少人?
【答案】(1)250
(2)11200(人).
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】(1)由第五小组的频数得出比列,再根据频率分布直方图计算出可得频数;
(2)求出第4组频率,从而可得总人数;
【详解】(1)因为频率之比等于频数之比,设第一小组的频数为,所以各组的频数依次为,
于是,所以.
所以本次调查共抽调的学生人数为.
(2)因为视力在范围内的有70人,
所以频率为,
所以全市初中生视力正常的约有(人)
题型八 条形图、扇形图、折线图
例题1:(23-24高一下·四川内江·期末)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄的分布饼状图 90后从事互联网行业者的岗位分布条形图,则下列结论中不一定正确的是( )
A.互联网行业从事技术岗位的人数中,90后比80后多
B.90后互联网行业者中从事技术岗位的人数超过整个从事互联网行业者总人数的
C.互联网行业中从事运营岗位的人数90后比80前多
D.互联网行业从业人员中90后占一半以上
【答案】A
【知识点】根据条形统计图解决实际问题、根据扇形统计图解决实际问题
【分析】利用整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图即可判断各选项的真假.
【详解】选项A;设整个互联网行业总人数为a,
互联网行业中从事技术岗位的90后人数为,小于80后的人数,
但80后中从事技术岗位的人数比例未知,故A错误.
选项B:设整个互联网行业总人数为a,90后从事技术岗位人数为56%×39.6%a,
而90后总人数的20%为,故B正确;
选项C:设整个互联网行业总人数为a,
互联网行业中从事运营岗位的90后人数为,
超过80前的人数6%a,且80前中从事运营岗位的人数比例未知,故C正确;
选项D: 由整个互联网行业从业者年龄分布饼状图得到互联网行业从业人员中90后占,故D正确.
故选:A.
例题2:(多选)(23-24高三下·河北秦皇岛·开学考试)下图反映2017年到2022年6月我国国有企业营业总收入及增速统计情况:
2017年到2022年6月国有企业营业总收入及增速统计图

根据图中的信息,下列说法错误的是( )
A.2017-2022年我国国有企业营业总收入逐年增加
B.2017-2022年我国国有企业营业总收入逐年下降
C.2017-2021年中,我国国有企业营业总收入增速最快的是2021年
D.2017-2021年我国国有企业营业总收入的平均数大于630000亿元
【答案】ABD
【知识点】根据条形统计图解决实际问题、根据折线统计图解决实际问题
【分析】由统计图提供的数据进行判断.
【详解】由图知.2022年下半年我国国有企业营业总收入及增速未知,故A、B错误;
2017-2021年中,我国国有企业营业总收入增速最快的是2021年,为,C正确;
2017-2021年我国国有企业营业总收入的平均数小于630000亿元.D错误.
故选:ABD.
巩固训练
1.(多选)(2024·全国·模拟预测)某商户收集并整理了其在2023年1月到8月线上和线下收入的数据,并绘制如图所示的折线图,则下列结论正确的是( )
A.该商户这8个月中,月收入最高的是7月
B.该商户这8个月的线上总收入低于线下总收入
C.该商户这8个月中,线上、线下收入相差最小的是7月
D.该商户这8个月中,月收入不少于17万元的频率是
【答案】ACD
【知识点】根据折线统计图解决实际问题
【分析】根据折线图可分别计算出每个月的收入总和,即可得AD正确,易知线上总收入为72万元,线下总收入为61万元,可得B错误;由图中折线距离最近为7月份可知C正确.
【详解】对于A:该商户这8个月中,计算可得月收入分别为16万元,13.5万元,16万元,17万元,17万元,16万元,20万元,17.5万元,月收入最高的是7月,A正确;
对于B:该商户这8个月的线上总收入为72万元,线下总收入为61万元,B错误;
对于C:根据折线图可看出线上、线下收入折线距离最近的时7月份,即该商户这8个月中线上、线下收入相差最小的是7月,C正确;
对于D:根据A选项可知该商户这8个月中,月收入不少于17万元的有4个月,故所求频率为,D正确.
故选:ACD
2.(25-26高一上·全国·课后作业)神舟十三号载人飞行任务的圆满成功,标志着空间站关键技术验证阶段任务圆满完成,中国空间站即将进入建造阶段.某机构研究室通过随机抽样的方式,对18岁及以上人群进行了“你是否曾有过航天梦想”的调查研究,得到如下的统计结果.

根据调查结果,以下说法正确的是 (填序号).
①在“曾有过航天梦想”的人群中,54岁及以上的人数最少;
②在“曾有过航天梦想”的人群中,年龄越大,在航天相关方面的人均消费越少;
③在“曾有过航天梦想”的人群中,18—29岁在航天相关方面的总消费最多.
【答案】①③
【知识点】根据折线统计图解决实际问题、根据扇形统计图解决实际问题
【分析】根据扇形图及折线图得出数据判断各个选项即可.
【详解】对于①,从“曾有过航天梦想”的人年龄分布图可知,在“曾有过航天梦想”的人群中,
54岁及以上的人数最少,所以①正确;
对于②,在“曾有过航天梦想”的人群中,随着年龄增大,在航天相关方面的人均消费先变大后再变小,所以②错误;
对于③,设总人数为岁在航天相关方面的总消费约为,
30-40岁在航天相关方面的总消费约为,
41-53岁在航天相关方面的总消费约为,
54岁及以上在航天相关方面的总消费约为.
所以在“曾有过航天梦想”的人群中,18-29岁在航天相关方面的总消费最多,所以③正确.
故答案为:①③.
3.(24-25高一上·全国·课后作业)某校分别于2020年、2022年随机调查相同数量的学生,对数学课开展小组合作学习的情况进行调查(开展情况分为极少、有时、常常、总是共四种),绘制成部分统计图如下.请根据图中信息,解答下列问题:
(1)________,________,“总是”对应扇形统计图中的圆心角度数为________;
(2)请你补全条形统计图;
(3)若该校2022年共有1200名学生,请你统计其中认为数学课“总是”开展小组合作学习的学生有多少名?
(4)相比2020年,2022年数学课开展小组合作学习的情况有何变化?
【答案】(1),,.
(2)答案见解析
(3)480人
(4)有所好转
【知识点】补全条形统计图、根据条形统计图解决实际问题
【分析】(1)利用开展情况为总是的人数得出总人数,进而由人数或比例求解即可;
(2)利用比例计算“有时”、“常常”的人数,再填表;
(3)利用比例计算数学课“总是”的人数;
(4)观察条形统计图,得出结论.
【详解】(1)(人),


圆心角度数为.
(2)“有时”的人数为(人),“常常”的人数为(人),
如图所示.
(3)(人),故认为数学课“总是”开展小组合作学习的学生有480人.
(4)相比2020年,2022年数学课开展小组合作学习的情况有所好转.
题型九 平均数、众数、中位数
例题1:(2024高三·全国·专题练习)有一组数据24,29,,25,22,,20,24,28,25.若该组数据的中位数与众数相等,则平均数为( )
A.24.4 B.25.8 C.24.4或25.8 D.24.4或24.8
【答案】D
【知识点】计算几个数的中位数、计算几个数的平均数、计算几个数的众数
【分析】先将数据从小到大排列,再结合中位数,众数定义得出数据,进而相等得出,则平均数应用定义即可计算.
【详解】将已知数据从小到大排列为20,22,24,24,25,25,28,29.
因为该组数据的中位数与众数相等,所以众数只能是24和25中的一个.
因为每组数据的中位数是唯一的,所以该组数据的众数也是唯一确定的.
又该组数据中除24,25外其他数据均只出现一次,且与不可能相等,故众数只能是24和25中的一个.
若中位数与众数均为24,则,,此时平均数为;
若中位数与众数均为25,则,
此时平均数为,故该组数据的平均数为24.4或24.8.
故选:D.
例题2:(23-24高三下·江西·开学考试)样本中共有个个体,其值分别为、、、、,若该样本的中位数为,则的取值范围为( )
A. B. C. D.
【答案】C
【知识点】计算几个数的中位数
【分析】对实数的取值进行分类讨论,将数据由小到大排序,结合中位数的定义可得出实数的取值范围.
【详解】若,则这组数据由小到大排列依次为、、、、,中位数为,不合乎题意;
若,则这组数据由小到大排列依次为、、、、,中位数为,不合乎题意;
若,则这组数据由小到大排列依次为、、、、,中位数为;
若,则这组数据由小到大排列依次为、、、、,中位数为;
若,则这组数据由小到大排列依次为、、、、,中位数为.
综上所述,实数的取值范围是.
故选:C.
例题3:(2024·山东济宁·一模)2024年1月九省联考的数学试卷出现新结构,其中多选题计分标准如下:①本题共3小题,每小题6分,满分18分;②每道小题的四个选项中有两个或三个正确选项,全部选对得6分,有选错的得0分;③部分选对得部分分(若某小题正确选项为两个,漏选一个正确选项得3分;若某小题正确选项为三个,漏选一个正确选项得4分,漏选两个正确选项得2分).已知在某次新结构数学试题的考试中,小明同学三个多选题中第一小题确定得满分,第二小题随机地选了两个选项,第三小题随机地选了一个选项,则小明同学多选题所有可能总得分(相同总分只记录一次)的中位数为 .
【答案】11
【知识点】计算几个数的中位数
【分析】列举出所有的得分情况,再结合中位数的概念求答案即可.
【详解】由题意得小明同学第一题得6分;
第二题选了2个选项,可能得分情况有3种,分别是得0分、4分和6分;
第二题选了1个选项,可能得分情况有3种,分别是得0分、2分和3分;
由于相同总分只记录一次,因此小明的总分情况有:6分、8分、9分、10分、12分、13分、14分、15分共8种情况,
所以中位数为,
故答案为:11.
巩固训练
1.(23-24高一上·福建厦门·开学考试)今年是我国现行宪法公布施行40周年.为贯彻党的二十大精神,强化宪法意识,弘扬宪法精神,推动宪法实施,某学校开展法律知识竞赛活动,全校一共100名学生参与其中,得分情况如下表.则分数的中位数和众数分别是( )
分数(分) 60 70 80 90 100
人数 8 22 20 30 20
A.80,90 B.90,100
C.85,90 D.90,90
【答案】C
【知识点】计算几个数的众数、计算几个数的中位数
【分析】本题根据中位数和众数的概念进行解答即可.
【详解】把这些数据从小到大排列,最中间的两个数是第两个数,
所以全班名同学的成绩的中位数是,
出现了次,出现次数最多,则众数为.
所以分数的中位数和众数分别是.
故选:C.
2.(23-24高一下·云南楚雄·期末)已知样本数据的平均数为9,则另一组数据的平均数为( )
A. B. C.4 D.3
【答案】D
【知识点】计算几个数的平均数
【分析】根据平均数的定义求解即可.
【详解】由题意得,
得,
所以所求的平均数为.
故选:D.
3.(多选)(2024高三·全国·专题练习)演讲比赛中9位评委为选手打分,打分区间为,甲的得分是:7.2,8.2,7.9,8.3,7.4,8.6,9.3,7.8,7.3,根据规则要去掉一个最低分和最高分,则剩下的数据与原数据比较不变的是( )
A.中位数 B.平均数 C.极差 D.第60百分位数
【答案】AD
【知识点】计算几个数的中位数、计算几个数的平均数、总体百分位数的估计
【分析】运用中位数概念,平均数,极差,百分位数求法计算即可.
【详解】将数据按照从小到大排列为7.2,7.3,7.4,7.8,7.9,8.2,8.3,8.6,9.3,
其中位数为7.9,平均数为,
由,知第60百分位数为第6个数8.2,极差为;
去掉7.2和9.3后的数据为7.3,7.4,7.8,7.9,8.2,8.3,8.6,
其中位数为7.9,平均数为,
由,知第60百分位数为第5个数8.2,极差为,所以只有中位数和第60百分位数没有改变.
故选:AD.
题型十 平均数、众数、中位数的估计值 
例题1:(多选)(23-24高三下·重庆·阶段练习)某社区通过简单随机抽样,获得了100户居民的月均用水量数据,并绘制出如图所示的频率分布直方图,由该图可以估计( )
A.平均数>中位数 B.中位数>平均数
C.中位数>众数 D.众数>平均数
【答案】AC
【知识点】由频率分布直方图估计中位数、由频率分布直方图估计平均数、根据频率分布直方图计算众数
【分析】首先计算众数,再估算中位数和平均数,或是根据频率分布直方图的特征判断平均数和中位数的大小.
【详解】由图可知,众数为,
估计中位数为,得,
估计平均数,
并且也可以从直方图的特征判断,此直方图在右边“拖尾”,所以平均数大于中位数.
所以平均数>中位数,中位数>众数.
故选:AC
例题2:(24-25高一上·甘肃平凉·阶段练习)100名学生某次数学考试成绩(单位:分)的频率分布直方图如图所示.回答下列问题:
(1)求频率分布直方图中的值;
(2)估计这次考试的平均数、众数和中位数(结果保留一位小数).
【答案】(1)
(2)中位数:,众数:75,平均数:
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计平均数、由频率分布直方图估计中位数、根据频率分布直方图计算众数
【分析】(1)由频率分布直方图的面积和为1求解即可;
(2)由频率分布直方图中中位数两侧的面积相等求中位数,频率与组距之比的最大值的中间值求众数,中间值乘以乘以频率求平均数;
【详解】(1)由频率分布直方图知组距为10,频率总和为1,
所以有,解得.
(2)前两个小矩形面积为,第三个小矩形的面积为,
中位数要平分直方图的面积,

众数:75
平均数:
例题3:(24-25高二上·广东湛江·阶段练习)某校高二年级500名学生的学考适应性演练数学成绩频率分布直方图如图所示,其中成绩分组区间是,,,,,.
(1)求图中a的值;
(2)估计这500名学生的这次考试数学成绩的中位数,第80百分位数;
(3)估计这500名学生的这次考试数学成绩的平均数.
【答案】(1)0.0050
(2)90,122
(3)94
【知识点】频率分布直方图的实际应用、由频率分布直方图估计中位数、由频率分布直方图估计平均数、总体百分位数的估计
【分析】(1)根据频率之和为1列方程可求出的值.
(2)计算中位数及第80百分位数所在的区间,利用中位数和百分位数的定义建立等量关系可计算出结果.
(3)根据平均数的概念列式计算可得结果.
【详解】(1)根据频率之和为1可得,,
解得.
(2)∵成绩在区间内的频率为:,
∴估计这500名学生的这次考试数学成绩的中位数为90.
∵成绩在区间内的频率为:,
成绩在区间内的频率为:,
∴第80百分位数在区间内,设第80百分位数为,
则,解得,
综上得,中位数为90,第80百分位数为.
(3)设这500名学生的这次考试数学成绩的平均数为,
则.
巩固训练
1.(23-24高一下·河南周口·期末)某校从高一年级学生中随机抽取60名学生,将期中考试的数学成绩均为整数分成六组:后得到如图所示频率分布直方图.
(1)求的值;
(2)根据频率分布直方图,求众数和中位数;
(3)用比例分配的分层随机抽样的方法在各分数段的学生中抽取一个容量为20的样本,求在分数段抽取的人数;
【答案】(1)
(2)众数为75,中位数
(3)11
【知识点】抽样比、样本总量、各层总数、总体容量的计算、由频率分布直方图估计中位数、补全频率分布直方图、根据频率分布直方图计算众数
【分析】(1)根据小矩形面积之和为建立等式求解即可;
(2)找到最高的小矩形的底所在的两个端点值求解即可;首先确定中位数在那一组内,再利用从左到右面积等于建立等式求解;
(3)确定抽相比,然后乘以分数段的人数即可求解.
【详解】(1)由题意可得,
解得;
(2)根据频率分布直方图可知,分数段的频率最高,因此众数为75,
设中位数为,则,
解得;
(3)因为总体共60名学生,样本容量为20,因此抽样比为.
又在分数段共有(人),
因此在分数段抽取的人数是(人).
2.(24-25高二上·河南·阶段练习)某高二实验班共有50名学生,数学老师为研究某次考试,将所有学生的成绩分成5组:,,,,,得到频率分布直方图如下.
(1)求的值,并估计本班学生成绩的中位数(计算结果保留1位小数);
(2)全班共有24名女生,该次考试成绩在120分以下的女生有8人,则不低于120分的男生有多少人?
【答案】(1),
(2)
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计中位数、补全频率分布直方图
【分析】(1)根据频率直方图的性质,利用中位数估计公式,可得答案;
(2)由题意求得易知分数段的总人数,利用已知的女生人数,可得答案.
【详解】(1)由,解得.
因为,,
故中位数为.
(2)该次考试成绩在120分以下的总人数为,
故120分以下男生人数为,
故不低于120分的男生人数为.
3.(24-25高一上·河南南阳·阶段练习)随着城镇化不断发展,老旧小区改造及管理已经引起政府部门的高度重视,为了解某小区业主对小区物业服务的满意程度,现从该小区随机抽查了户业主,根据业主对物业服务的满意度评分,将评分分成六段:得到如下频率分布直方图.已知评分在之间的有5户.
(1)求和的值;
(2)从中按分层抽样的方法抽取26人成立物业服务监督小组,则从,中分别抽取几人?
(3)估计满意度评分的平均数和中位数.
【答案】(1)
(2)2人,4人,8人,12人
(3)平均数74,中位数为75
【知识点】抽样比、样本总量、各层总数、总体容量的计算、由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计中位数、由频率分布直方图估计平均数
【分析】(1)由及频率和为1即可求解;
(2)确定抽样比即可求解;
(3)由平均数、中位数的计算公式即可求解;
【详解】(1)由题意可知
(2)由题意可知抽取比例为.
则若抽取26人,则中抽取2人,中抽取4人,中抽取8人,中抽取12人.
(3)平均数:
中位数:
4.(24-25高二上·广东湛江·阶段练习)为了落实习主席提出“绿水青山就是金山银山”的环境治理要求,某市政府积极鼓励居民节约用水.为了了解居民用水情况,通过抽样,获得了某年200位居民每人的月均用水量(单位:吨),将数据按照,,…,分成5组,制成了如图所示的频率分布直方图.
(1)求直方图中x的值;
(2)设该市有50万居民,估计全市居民中月均用水量小于6吨的人数;
(3)由频率分布直方图估计该市居民月均用水的平均数(每组数据用该组区间中点值作为代表).
【答案】(1)
(2)万
(3)吨
【知识点】频率分布直方图的实际应用、由频率分布直方图估计平均数、补全频率分布直方图、由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】(1)由频率之和为1列方程求解即得;
(2)计算月均用水量小于6吨人数对应的频率,求出对应的人数;
(3)由频率分布直方图中间值作为代表,计算估计平均数;
【详解】(1)由频率分布直方图可得,
解得,
故直方图中x的值为.
(2)由频率分布直方图可得,
月均用水量小于6吨的频率为:,
所以估计全市50万居民中月均用水量小于6吨的人数为:(万);
(3)该市居民用水的平均数估计为:

估计该市居民月均用水的平均数吨.
5.(23-24高一下·重庆长寿)为了落实习主席提出的“绿水青山就是金山银山”的环境治理要求,平昌县政府积极鼓励居民节约用水.计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得某年200位居民每人的月均用水量(单位:吨),将数据按照分成9组,制成如图所示的频率分布直方图.
(1)直方图中a的值;
(2)由频率分布直方图估计平昌县居民月用水量的平均数是多少;
(3)若平昌县政府希望使85%的居民每月的用水量不超过标准x(吨),求x的估计值.
【答案】(1)
(2)(吨)
(3)5.8(吨)
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计平均数、频率分布直方图的实际应用、总体百分位数的估计
【分析】(1)由频率分布直方图中长方形的面积和为1列式计算即可;
(2)由频率分布直方图中平均数的求法计算即可;
(3)先由频率之和判断在中,由此即可求出的值.
【详解】(1)由题意可得,
解得.
(2)(吨).
(3)因为的频率为,
的频率为,
故的估计值为(吨),
所以85%的居民每月的用水量不超过标准(吨).
题型十一 总体百分位数 
例题1:(24-25高三上·吉林长春·期末)某校为了宣传青少年身心健康的重要性,随机抽查了高一、高二、高三的名同学进行了跑步测试,按照最终测试成绩的分数进行分组,得到如图所示的频率分布直方图,估计该名同学测试得分的上四分位数为( )
A.82.5 B.81 C.80 D.79.5
【答案】A
【知识点】总体百分位数的估计
【分析】利用上四分位数的定义结合频率分布直方图的性质求解即可.
【详解】因为,
,
所以上四分位数位于内,且设其为,
故,
解得,故A正确.
故选:A
例题2:(24-25高三上·福建漳州·阶段练习)2024年新高考数学Ⅰ卷多选题的计分标准如下:①本题共3小题,每小题6分,共18分;②每小题的四个选项中有两个或三个正确选项,全部选对的得6分,有选错或不选的得0分;③部分选对的得部分分(若某小题正确选项为两个,漏选一个正确选项得3分;若某小题正确选项为三个,漏选一个正确选项得4分,漏选两个正确选项得2分).考生甲在此卷多选题的作答中,第一小题选了三个选项,第二小题选了两个选项,第三小题选了一个选项,则他多选题的所有可能总得分(相同总分只记录一次)的第80百分位数为 .
【答案】13
【知识点】总体百分位数的估计
【分析】根据多选题的计分标准,结合甲在此卷多选题的作答情况、百分位数的定义进行求解即可.
【详解】甲在此卷多选题的作答中,
第一小题选了三个选项,因此甲此题的得分可以是分,或分;
第二小题选了两个选项,因此甲此题的得分可以是分,或分,或分;
第三小题选了一个选项,因此甲此题的得分可以是分,或,或,
因此甲多选题的所有可能总得分为分,分,分,分,分,分,分,分,分,分,分,分,共种情况,
因为,所以甲多选题的所有可能总得分(相同总分只记录一次)的第80百分位数为分,
故答案为:
例题3:(23-24高一下·全国·课后作业)梵净山位于贵州省铜仁市的江口 印江 松桃三县交界处,是具有2000多年历史的文化名山.梵净山山势雄伟 层峦叠嶂,溪流纵横 飞瀑悬泻.为更好地提升旅游品质,随机选择100名游客对景区进行满意度评分(满分100分),根据评分,制成如图所示的频率分布直方图.
(1)根据频率分布直方图,求的值;
(2)估计这100名游客对景区满意度评分的分位数.
【答案】(1)
(2)
【知识点】总体百分位数的估计、补全频率分布直方图
【分析】(1)根据直方图中频率和为即可求解;
(2)由百分位数的定义,结合直方图即可求解;
【详解】(1)由图可知:,解得:.
(2)根据频率分布直方图可知:

所以分位数在区间内,令其为,
则,
解得:
所以满意度评分的分位数为.
巩固训练
1.(24-25高三上·天津河西·期末)某中学组织高中学生参加数学知识竞赛,现从中随机抽取100名学生成绩的频率分布直方图如图所示,则这组样本数据的分位数为( )
A.85 B.86 C.87 D.88
【答案】C
【知识点】总体百分位数的估计、由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】由频率分布直方图的性质求出,再由百分位数的方法求解即可.
【详解】由题意可得,解得,
所以前两组的频率和为,前三组的频率和为,
设这组样本数据的分位数为,则,
解得.
故选:C.
2.(24-25高三上·江苏南通·阶段练习)现有一份由连续正整数(可重复)组成的样本,其容量为m,满足上四分位数为28,第80百分位数为30,则m的最小值为( )
A.24 B.25 C.28 D.29
【答案】D
【知识点】总体百分位数的估计
【分析】根据百分位数定义,结合已知分析各项对应m值,可得答案.
【详解】对于A,若样本容量的最小值为24,则,,
则第个数据的平均数应为,第个数据应为,
由是连续的正整数,显然不符合情况,故A错误;
对于B,若样本容量的最小值为25,则,,
则第19个数据应为,第个数据均为,
由是连续的正整数,矛盾,故B错误;
对于C,若样本容量的最小值为28,则,,
则第个数据均为,第23个数据应为,
由是连续的正整数,矛盾,故C错误;
对于D,若样本容量的最小值为29,则,,
则第22个数据应为,则第个数据应为,所以第个数据应该是29,符合题意,故D正确;
故选:D.
3.(2024高一下·全国·专题练习)某地区为了解最近11天该地区的空气质量,调查了该地区过去11天小颗粒物的浓度(单位:),数据依次为.已知这组数据的极差为,则这组数据的第百分位数为 .
【答案】
【知识点】总体百分位数的估计
【分析】根据极差求得的值,计算,根据百分位数的含义即可确定答案即可.
【详解】由题意得,数据的极差为,因为数据中最小值为,
故应为最大值,为81,则 ,
将数据从小到大排列为:

故这组数据的第百分位数为第九个数据.
故答案为:79
题型十二 方差、标准差的应用
例题1:(24-25高一上·河南南阳·阶段练习)已知一个样本容量为10的样本平均数为5,方差为1.6.现将样本中的3个数据去掉,则去掉后剩余样本容量为7的样本平均数和是( )
A.5,1 B.5,2 C.5,3 D.4,3
【答案】B
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】根据平均数与方差的计算公式,分别表示出去掉前后两组数据的平均数与方差,将条件等式整体代入计算即可.
【详解】由均值得.
方差
得.
不妨设设,则


故选:B.
例题2:(多选)(2024·江苏无锡·模拟预测)某校团委为泙价5个社团暑期开展活动的情况,在各社团中分别抽取部分社员进行调查.若各社团抽取的社员人数的平均数为8,方差为4,则各社团被抽取的社员人数的最大值可能为( )
A.13 B.12 C.11 D.10
【答案】BC
【知识点】根据方差、标准差求参数、根据平均数求参数
【分析】根据题意可得,分类讨论最大值,结合选项分析判断.
【详解】因为,则,
且,
则,
不妨设最大,
1.若,则不成立,故A错误;
2.若,例如,满足题意,故B正确;
3.若,例如,满足题意,故C正确;
4.若,则,
可得,可知该方程组无正整数解,故D错误;
故选:BC.
例题3:(24-25高二上·黑龙江·开学考试)7月23日,第8届中国一南亚博览会暨第28届中国昆明进出口商品交易会在昆明滇池国际会展中心隆重开幕.本届南博会以“团结协作 共谋发展”为主题,会期从23日至28日,共设15个展馆,展览面积15万平方米,吸引82个国家 地区和国际组织参会,2000多家企业进馆参展.某机构邀请了进馆参展的100家企业对此次展览进行评分,分值均在内,并将部分数据整理如下表:
分数
频数 10 10 20 20
(1)估计这100家企业评分的中位数(保留小数点后一位);
(2)估计这100家企业评分的平均数与方差(同一组中的数据用该组区间的中点值作代表).
【答案】(1)
(2)96,5.8
【知识点】计算频率分布直方图中的方差、标准差、由频率分布直方图估计平均数、由频率分布直方图估计中位数
【分析】(1)由中位数的佑计值的定义求解即可;
(2)由平均数的估计值与方差的计算公式计算即可.
【详解】(1)由题意得这100家企业评分在内的频数为
设这100家企业评分的中位数的估计值为,
因为评分在内的频数之和为,
评分在内的频数之和为,
所以,由,得.
(2)这100家企业评分的平均数的估计值为
这100家企业评分的方差的估计值为:
.
巩固训练
1.(24-25高二上·全国·开学考试)班级里有50名学生,在一次考试中统计出平均分为80分,方差为70,后来发现有3名同学的分数登错了,甲实际得60分却记成了75分,乙实际得80分却记成了90分,丙实际得90分却记成了65分,则关于更正后的平均分和方差分别是( )
A.82,73 B.80,73 C.82,67 D.80,67
【答案】B
【知识点】计算几个数据的极差、方差、标准差、计算几个数的平均数
【分析】根据更正前的平均分和方差,计算出其余同学的成绩和以及他们每人成绩和平均值差的平方和,结合平均数以及方差的计算公式,即可求得答案.
【详解】设更正前甲,乙,丙以及其余同学的成绩依次为,
则,即,
则;

则,
更正后平均分:,
更正后方差

故选:B
2.(2024·重庆沙坪坝·模拟预测)已知1,这5个数的平均数为3,方差为2,则这4个数的方差为( )
A.1 B. C. D.2
【答案】B
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差、根据平均数求参数、根据方差、标准差求参数
【分析】利用平均数,方差公式即得.
【详解】∵1,这5个数的平均数为3,方差为2,
∴,即,
∴这4个数的平均数为,
∴,即,
∴这4个数的方差为.
故选:B.
3.(24-25高三上·四川南充·阶段练习)为深入学习贯彻习近平总书记关于禁毒工作重要指示精神,切实落实国家禁毒委员会《关于加强新时代全民禁毒宣传教育工作的指导意见》,巩固青少年毒品预防教育成果,大力推进防范青少年滥用涉麻精药品等成瘾性物质宣传教育活动,进一步增强青少年学生识毒防毒拒毒意识和能力,某市每年定期组织同学们进行禁毒知识竞赛活动,为了解同学们对禁毒知识的掌握情况,现从所有答卷中随机抽取份作为样本,将样本的成绩(满分分,成绩均为不低于分的整数)分成六段:,,…,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)求样本成绩的第百分位数;
(3)已知落在的平均成绩是,方差是,落在的平均成绩为,方差是,求两组成绩的总平均数和总方差.
【答案】(1)
(2)
(3)平均数为;方差为
【知识点】补全频率分布直方图、总体百分位数的估计、由频率分布直方图估计平均数、计算频率分布直方图中的方差、标准差
【分析】(1)根据频率之和为即可求解,
(2)根据百分位数的计算公式即可求解,
(3)根据平均数的计算公式可求得两组成绩的总平均数;再由样本方差计算总体方差公式可求得两组成绩的总方差,即可求解.
【详解】(1)由每组小矩形的面积之和为得,,解得.
(2)成绩落在内的频率为,
落在内的频率为,
显然第百分位数,由,解得,
所以第百分位数为;
(3)由频率分布直方图知,成绩在的市民人数为,
成绩在的市民人数为,所以;
由样本方差计算总体方差公式,得总方差为.
题型十三 平均数、方差、标准差性质
例题1:(24-25高二上·四川成都·阶段练习)有一组样本数据,,,,由这组样本得到新样本数据,,,,其中,则( )
A.,,,的中位数为,则,,,的中位数为
B.,,,的平均数为,则,,,的平均数为
C.,,,的方差为,则,,,的方差为
D.,,,的极差为,则,,,的极差为
【答案】B
【知识点】计算几个数的中位数、计算几个数的平均数、各数据同时加减同一数对方差的影响、各数据同时乘除同一数对方差的影响
【分析】利用中位数的定义可判断;利用平均数和方差的计算方法和性质可判断;举例利用极差的定义可判断.
【详解】对于,数据从小到大排列对应中位数的顺序不变,
所以若,,,的中位数为,
则,,,的中位数为,故不正确;
对于,由平均数的计算方法与性质可知,
若,,,的平均数为,
则,,,的平均数为,故正确;
对于,由方差的性质可知,
若,,,的方差为,
所以,,,的方差为,故不正确;
对于, 若原数据为,,,,极差为,
当,则新数据为,,,,所以极差为,
所以极差为,故不正确.
故选:.
例题2:(多选)(23-24高一下·山东临沂·期末)若数据的平均数为2,方差为3,则( )
A.数据,,,的平均数为20 B.
C.数据,,,的标准差为 D.
【答案】BCD
【知识点】各数据同时加减同一数对方差的影响、各数据同时乘除同一数对方差的影响、计算几个数的平均数
【分析】根据给定条件,利用平均数,方差公式逐项计算即可求解.
【详解】对于A,由平均数公式,得数据,,…,的平均数为,A错误;
对于B,,B正确;
对于C,由方差公式,得数据,,…,的方差为,标准差为,C正确;
对于D,由,
得,即,
所以,D正确.
故选:BCD
例题3:(23-24高一下·山西吕梁·期末)已知数据的方差为16,则数据的方差为 .
【答案】36
【知识点】各数据同时加减同一数对方差的影响、各数据同时乘除同一数对方差的影响
【分析】根据以及方差性质即可得解.
【详解】因为,
又数据的方差为16,
所以由方差性质得数据的方差为.
故答案为:36.
巩固训练
1.(23-24高一下·福建福州·期末)若数据、、…、的平均数是4,方差是4,数据、、…、的平均数是,标准差是,则下列结论正确的是( )
A., B.,
C., D.,
【答案】D
【知识点】各数据同时乘除同一数对方差的影响、平均数的和差倍分性质、各数据同时加减同一数对方差的影响
【分析】由数据、、…、的平均数是4,方差是4,数据、、…、的平均数是,方差,代入计算可得平均数,方差的值,开方求出标准差,可得答案.
【详解】因为数据、、…、的平均数是4,方差是4,
即,,
数据、、…、的平均数

数据、、…、的方差

所以标准差是.
故选:D.
2.(23-24高一下·福建泉州·期末)已知数据的均值为3,方差为1,则数据的均值和方差分别为( )
A.9,5 B.6,5 C.9,4 D.6,4
【答案】C
【知识点】各数据同时加减同一数对方差的影响、各数据同时乘除同一数对方差的影响、计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】根据均值和方差公式计算数据的数字特征,或者根据均值和方差的性质计算.
【详解】方法一:设数据的均值为,方差为,则,
由得的均值为:

的方差为:
方法二:由题意可知:新数据的均值为,方差为.
故选:C.
3.(多选)(2024·四川成都·模拟预测)设的极差为,平均值为,中位数为,方差为.,其中,.的极差为,平均值为,中位数为,方差为,则( )
A. B. C. D.
【答案】BC
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差、计算几个数的中位数、各数据同时乘除同一数对方差的影响
【分析】根据方差及标准差的性质判断A,D,应用平均数及中位数性质判断B,C.
【详解】不妨设,
则知,故A不正确,,D不正确;
由平均值、中位数定义可知,B,C正确.
故选:BC.
试卷第42页,共43页
1中小学教育资源及组卷应用平台
第九章 统计(13题型清单)
1.简单随机抽样
(1)定义:一般地,设一个总体含有N(N为正整数)个个体,从中逐个不放回地抽取n()个个体作为样本,如果每次抽取时各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样方法有两种:随机数法和抽签法.
2.分层抽样
(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.
(2)应用范围:总体是由差异明显的几个部分组成的.
(3)分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,抽样比 .
3.频率分布表与频率分布直方图
频率分布表与频率分布直方图的绘制步骤如下:
(1)求极差,即求一组数据中最大值与最小值的差;
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表,落在各小组内的数据的个数叫做频数,每小组的频数与样本容量的比值叫做这一小组的频率,计算各小组的频率,列出频率分布表;
(5)画频率分布直方图,依据频率分布表画出频率分布直方图,其中纵坐标(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组上的小长方形的面积,即每个小长方形的面积.
各个小长方形面积的总和等于1.
4.用样本的数字特征估计总体的数字特征
数字特征 样本数据 频率分布直方图
众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标
中位数 将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分为左右两个面积相等的部分,分界线与x轴交点的横坐标
平均数 样本数据的算术平均数 每个小长方形的面积乘小长方形底边中点的横坐标之和
方差和标准差反映了数据波动程度的大小.
方差:;
标准差:.
5.百分位数
(1)把100个样本数据按从小到大排序,得到第p个和第p+1个数据分别为.可以发现,区间内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数,并称此数为这组数据的第p百分位数,或p%分位数.
(2)一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(3)四分位数
常用的分位数有第25百分位数,第50百分位数(即中位数),第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
题型一 随机数表法
例题1:(24-25高一上·河南南阳·阶段练习)某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,……,699,700.从中抽取70个样本,若从下图提供随机数表中第1行第6列开始向右读取数据,则得到的第4个样本编号是 .
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
例题2:(24-25高一上·河南南阳·阶段练习)某车间的质检员利用随机数表对生产的60个零件进行抽样测试,先将60个零件进行编号,编号分别为01,02,…,60,从中选取5个个体组成样本,下面提供随机数表的第1行到第2行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第1行第7列开始向右依次读取数据,则得到的第5个样本编号是 .
例题3:(23-24高二下·云南昭通·期中)某学校为了了解学生的学习情况,从每班随机抽取了5名学生进行调查.若(1)班有50名学生,对所有学生按01到50进行编号,请从下面的随机数表的第2行第6列的数开始,依次向右,到行末后转至下一行的行首,逐个取样,直到取足样本为止,则抽取的样本的编号是 .
巩固训练
1.(24-25高一上·江西南昌·阶段练习)在新冠病毒防疫期间,市场监管局为监管某工厂的口罩生产质量,随机调取这个工厂生产的600个口罩,利用随机数表进行抽样测试,先将600个口罩进行编号,编号分别为001,002,…,599,600,再从中抽取60个样本.以下是随机数表的其中三行:
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 54 36 34 8 53 59 94 83 75 22 53 55 78 32 45 77 89 2
若从表中这三行中的第3行第6列开始向右依次读取数据,则得到的第3个样本编号为 .
2.(23-24高二上·陕西咸阳·开学考试)省农科站要检测某品牌种子的发芽率,计划采用随机数表法从该品牌800粒种子中抽取60粒进行检测,现将这800粒种子编号如下001,002,…,800,若从随机数表第8行第7列的数7开始向右读,则所抽取的第4粒种子的编号是 .(如下是随机数表第8行至第9行)
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 0 13 42 99 66 02 79 54
3.(23-24高一下·吉林白山·期末)国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的未来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一名学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第四个号码为
随机数表如下:
0154 3287 6595 4287 5346
7953 2586 5741 3369 8324
4597 7386 5244 3578 6241
题型二 简单随机抽样的概率 
例题1:(23-24高二上·西藏日喀则·期末)采用简单随机抽样的方法,从含有20个个体的总体中抽取1个容量为4的样本,则某个个体被抽到的概率为( )
A. B. C. D.
例题2:(23-24高一下·河北张家口·期末)已知一个总体中有个个体,用抽签法从中抽取一个容量为的样本,若每个个体被抽到的可能性是,则( )
A.10 B.20 C.40 D.不确定
例题3:(24-25高一上·全国·随堂练习)用简单随机抽样的方法从含n个个体的总体中,逐个抽取一个样本量为3的样本,若其中个体a在第一次就被抽取的可能性为,那么n= .
巩固训练
1.(23-24高一下·江苏常州·期末)从某班学号为1到10的十名学生(其中含学生甲)中抽取3名学生参加某项调查,现用抽签法抽取样本(不放回抽取),每次抽取一个号码,共抽3次,设甲第一次被抽到的可能性为,第二次被抽到的可能性为,则( )
A., B.,
C., D.,
2.(2024高一下·全国·专题练习)在简单随机抽样中,下列关于其中一个个体被抽中的可能性说法正确的是(  )
A.与第几次抽样有关,第一次抽到的可能性更大一些
B.与第几次抽样有关,最后一次抽到的可能性更大一些
C.与第几次抽样无关,每次抽到的可能性都相等
D.与第几次抽样有关,第一次抽到的可能性更小一些
3.(24-25高二·上海·课堂例题)某中学从800名应届毕业生中,抽取60名学生进行身体素质测试,应采用 抽样,每个个体被抽到的可能性是 .
题型三 简单随机抽样估计总体 
例题1:(24-25高一上·贵州遵义)管理人员从一池塘内随机捞出40条鱼,做上标记后放回池塘.10天后,又从池塘内随机捞出70条鱼,其中有标记的有2条.根据以上数据可以估计该池塘内鱼的总条数是( )
A.2800 B.1800 C.1400 D.1200
例题2:(多选)(2024·湖北·模拟预测)某地区公共部门为了调查本地区中学生的吸烟情况,对随机抽出的编号为1~1000的1000名学生进行了调查.调查中使用了两个问题,问题1:你的编号是否为奇数?问题2:你是否吸烟?被调查者从设计好的随机装置(内有除颜色外完全相同的白球50个,红球50个)中摸出一个小球(摸完放回):摸到白球则如实回答问题1,摸到红球则如实回答问题2,回答“是”的人在一张白纸上画一个“√”,回答“否”的人什么都不用做,由于问题的答案只有“是”和“否”,而且回答的是哪个问题也是别人不知道的,因此被调查者可以毫无顾忌的给出真实的答案.最后统计得出,这1000人中,共有265人回答“是”,则下列表述正确的是( )
A.估计被调查者中约有15人吸烟 B.估计约有15人对问题2的回答为“是”
C.估计该地区约有3%的中学生吸烟 D.估计该地区约有1.5%的中学生吸烟
例题3:(2024高一下·全国·专题练习)中国古典数学先后经历了三次发展高潮,即两汉时期、魏晋南北朝时期和宋元时期,并在宋元时期达到顶峰,而南宋时期的数学家秦九韶正是其中的代表人物.作为秦九韶的集大成之作,《数书九章》一书所承载的数学成就非同一般.可以说,但凡是实际生活中需要运用到数学知识的地方,《数书九章》一书皆有所涉及,例如“验米夹谷”问题:今有谷3318石,抽样取谷一把,数得168粒内有秕谷22粒,则粮仓内的秕谷约为 石(结果四舍五入取整数).
巩固训练
1.(2024·河南·三模)中国农历的“二十四节气”是凝结着中华民族的智慧与传统文化的结晶,2022年2月4日北京冬奥会开幕式,以二十四节气的方式开始倒计时,惊艳全球.某小学一年级随机抽查100名学生并提问“二十四节气歌”,只能说出两句的有32人,能说出三句或三句以上的有45人,据此估计该校一年级的400名学生中对“二十四节气歌”只能说出一句或一句也说不出的人数约为( )
A.23 B.92 C.128 D.180
2.(24-25高一下·全国·课后作业)某学校有1200名学生,随机抽出300名进行调查研究,调查者设计了一个随机化装置,这是一个装有大小、形状和质量完全相同的10个红球、10个绿球和10个白球的袋子.调查中有两个问题:
问题1:你的阳历生日月份是不是奇数?
问题2:你是否抽烟?
每个被调查者随机从袋中摸出1个球(摸出后再放回袋中).若摸到红球就如实回答第一个问题;若摸到绿球,则不回答任何问题:若摸到白球,则如实回答第二个问题.所有回答“是”的调查者只需往一个盒子中放一个小石子,回答“否”的被调查者什么也不用做.最后收集回来53个小石子,估计该学校吸烟的人数为 .
3.(23-24高一下·黑龙江哈尔滨·期末)二战期间盟军的统计学家主要是将缴获的德军坦克序列号作为样本,用样本估计总体的方法得出德军某月生产的坦克总数.假设德军某月生产的坦克总数是N,缴获的该月生产的n辆坦克编号从小到大为,,…,,即最大编号为,且缴获的坦克是从所生产的坦克中随机获取的,因为生产坦克是连续编号的,所以缴获坦克的编号,,…,,,相当于从中随机抽取的n个整数,这n个数将区间分成个小区间,由于N是未知的,除了最右边的区间外,其他n个区间都是已知的.由于这n个数是随机抽取的,所以可以用前n个区间的平均长度估计所有个区间的平均长度,进而得到N的估计值.例如,缴获坦克的编号是3,5,12,18,20,则统计学家利用上述方法估计德军每月生产的坦克数为 .

题型四 分层抽样 
例题1:(2024·河南·三模)国内某优秀新能源电池制造企业在锂电池单位能量密度技术上取得了重大突破,该制造企业内的某车间有两条生产线,分别生产高能量密度锂电池和低能量密度锂电池,总产量为400个锂电池.质检人员采用分层随机抽样的方法随机抽取了一个容量为80的样本进行质量检测,已知样本中高能量密度锂电池有35个,则估计低能量密度锂电池的总产量为( ).
A.325个 B.300个 C.225个 D.175个
例题2:(24-25高一上·江西南昌·阶段练习)某中学选派270名学生参加南昌市广播体操比赛,其中高一108人,高二、高三各81人,现要在比赛前抽取10人参加检验训练熟练度,考虑选用简单随机抽样、分层抽样两种方案,将学生按高一、高二、高三依次统一编号为1,2,…,270.如果抽到的号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270.
则不可能为分层抽样的是( )
A.① B.② C.③ D.④
例题3:(23-24高二下·云南·期末)某地区的高中学校分为A、B两类,A类高中学校共有学生6000人,B类高中学校共有学生2000人.现按A、B两类进行分层,用分层随机抽样的方法,从该地区的高中学校抽取学生40人进行调查研究.设抽到该地区A类高中学校学生x人,则 .
巩固训练
1.(2024·黑龙江哈尔滨·模拟预测)在哈尔滨市2024年第一次市模考试中,三所学校高三年级的参考人数分别为、.现按比例分层抽样的方法从三个学校高三年级中抽取样本,经计算得三所学校高三年级数学成绩的样本平均数分别为,则三所学校学生数学成绩的总平均数约为( )
A.101 B.100 C.99 D.98
2.(24-25高三上·河南许昌·期中)唐代以来,牡丹之盛,以“洛阳牡丹甲天下”的美名流传于世.唐已知根据花瓣类型可将牡丹分为单瓣类、重瓣类、千瓣类三类,现有牡丹花n朵,千瓣类比单瓣类多30朵,采用分层抽样方法从中选出12朵牡丹进行观察研究,其中单瓣类有4朵,重瓣类有2朵,千瓣类有6朵,则n=( )
A.360 B.270 C.240 D.180
3.(2024·四川德阳·一模)某中学田径队有男运动员28人,女运动员21人,按性别进行分层随机抽样的方法从全体运动员中抽取一个容量为14的样本,如果样本按比例分配,则男运动员应该抽取的人数为
题型五 分层抽样中的均值和方差
例题1:(24-25高三上·广西·阶段练习)2024年10月,“2024环广西世巡赛”成功举行,志愿者的服务工作是世巡赛成功举办的重要保障,某单位承办了志愿者选拔的面试工作.现随机抽取了200名侯选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.已知第一 二组的频率之和为0.3,第一组和第五组的频率相同.
(1)求的值;
(2)若面试成绩前68名为优秀,请估计优秀成绩的最低分;
(3)现从以上各组中用分层抽样的方法选取20人,担任本次宣传者.若本次宣传者中第二组面试者的面试成绩的平均数和方差分别为62和30,第四组面试者的面试成绩的平均数和方差分别为80和40,据此估计这次第二组和第四组所有面试者的方差.
(注:若将总体划分为若干层,随机抽取两层,通过分层随机抽样,每层抽取的样本量 样本平均数和样本方差分别为:,,,,,.记这两层总的样本平均数为,样本方差为,则).
例题2:(24-25高二上·湖南长沙·阶段练习)某校高一年级设有羽毛球训练课,期末对学生进行羽毛球五项指标(正手发高远球、定点高远球、吊球、杀球以及半场计时往返跑)考核,满分100分.参加考核的学生有40人,考核得分的频率分布直方图如图所示.

(1)由频率分布直方图,求出图中的值,并估计考核得分的第60百分位数;
(2)为了提升同学们的羽毛球技能,校方准备招聘高水平的教练.现采用分层抽样的方法(样本量按比例分配),从得分在内的学生中抽取5人,再从中挑出两人进行试课,求两人得分分别来自和的概率;
(3)若一个总体划分为两层,通过按样本量比例分配分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:,,;,,.记总的样本平均数为,样本方差为,证明:.
例题3:(23-24高一下·湖南株洲·期末)某教育集团高一期末考试,从全集团的政治成绩中随机取100名学生的原始成绩(满分100分)进行分析,其频率分布直方图如图所示:
(1)求图中的值;
(2)若采用分层抽样的方法,从原始成绩在和内的学生中共抽取6人查看他们的答题情况,再从中选取2人进行个案分析,求这2人中恰有一人原始成绩在内的概率;
(3)已知落在的平均成绩,方差,落在的平均成绩,方差,求落在的平均成绩,并估计落在的成绩的方差.
巩固训练
1.(23-24高一下·贵州六盘水·期末)文明城市是反映城市整体文明水平的综合性荣誉称号.作为普通市民,既是文明城市的最大受益者,又是文明城市的主要创造者.六盘水市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛(满分100分),从所有答卷的成绩中抽取了容量为100的样本,将样本(成绩均为不低于50分的整数)分成五段:得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值和估计样本的下四分位数;
(2)按照分层抽样的方法,从样本中抽取20份成绩,应从中抽取多少份;
(3)已知落在的平均成绩是53,方差是4;落在的平均成绩为65,方差是7,求成绩落在的平均数和方差.
(注:若将总体划分为若干层,随机抽取两层,通过分层随机抽样,每层抽取的样本量、样本平均数和样本方差分别为:.记这两层总的样本平均数为,样本方差为,则)
2.(23-24高一下·吉林·期末)随着全民健身意识增强,马拉松运动逐渐成为深受群众喜爱的体育健身项目之一.吉林市自2016年以来,现已成功举办五届马拉松比赛,“吉马”也因此成为了东北地区乃至全国颇具影响力的品牌赛事.2023年“吉马”被中国田径协会评为“城市形象媒体传播赛事典型案例”.时隔一年,吉林市委、市政府再次启动这一国际化赛事,将挑战自我、超越极限、坚韧不拔、永不放弃的马拉松精神与我市激流勇进的城市精神相结合,并将其发扬光大.为此,某校举办了“吉马”知识竞赛,从所有竞赛成绩中抽取一个容量为100的样本,并按竞赛成绩(单位:分)分成六组:,,,,,,得到如下图所示的频率分布直方图.

(1)求频率分布直方图中a的值,并求样本中竞赛成绩的第80百分位数;
(2)现从样本中竞赛成绩在内用比例分配的分层随机抽样的方法抽取6人,再从这6人中抽取2人座谈,求至少有一人竞赛成绩在内的概率;
(3)已知样本中竞赛成绩在内的平均数,方差,样本中竞赛成绩在内的平均数,方差,并据此估计所有答卷中竞赛成绩在内的总体方差.
参考公式:总体分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:,,;,,.记总的样本平均数为,样本方差为,.
3.(23-24高一下·吉林通化·阶段练习)2023年10月22日,汉江生态城2023襄阳马拉松在湖北省襄阳市成功举行,志愿者的服务工作是马拉松成功举办的重要保障,襄阳市新时代文明实践中心承办了志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.已知第一、二组的频率之和为0.3,第一组和第五组的频率相同.
(1)估计这100名候选者面试成绩的平均数和第25百分位数;
(2)现从以上各组中用分层随机抽样的方法选取20人,担任本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为62和40,第四组面试者的面试成绩的平均数和方差分别为80和70,据此估计这次第二组和第四组所有面试者的面试成绩的方差.
(注:若总体分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:,,;,,记总样本的平均数为,样本方差为.则样本方差)
题型六 频率分布表 
例题1:(24-25高二上·陕西西安·阶段练习)对某校高二年级学生参加社区服务次数进行统计,随机抽取名学生作为样本,得到名学生参加社区服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图如下:
分组 频数 频率
合计
(1)求出表中,及图中的值;
(2)估计高二年级学生参加社区服务次数的平均数和中位数(保留一位小数).
例题2:(24-25高一·全国·随堂练习)从标准质量为的一批洗衣粉中,随机抽查了50袋,测得的质量数据如下(单位:):
494 498 493 494 496 492 490 490 500 499
494 495 482 485 502 493 505 485 501 491
493 500 509 512 484 509 510 494 497 498
504 498 483 510 503 497 502 498 497 500
493 499 505 493 491 497 515 503 498 518
(1)找出这组数的最值,求出极差;
(2)以为第一个分组的区间,作出这组数的频率分布直方图.
巩固训练
1.(2024高一下·江苏·专题练习)有一容量为50的样本,数据的分组及各组的数据如下:,4;,9;,5;,8;,10;,3;,11.
(1)列出样本频率分布表;
(2)画出频率直方图及频率折线图.

2.(2024高一·全国·课后作业)对某电子元件进行寿命追踪调查,情况如下:
寿命(h) 100~200 200~300 300~400 400~500 500~600
个数 20 30 80 40 30
(1)列出频率分布表;
(2)画出频率分布直方图;
(3)估计电子元件寿命在以内的概率;
(4)估计电子元件寿命在400h以上的概率.
题型七 频率分布直方图
例题1:(24-25高一上·全国·课后作业)某养猪场定购了一批仔猪,从中随机抽查了100头仔猪的体重(单位:斤),经数据处理得到如图①的频率分布直方图,其中体重最轻的14头仔猪的体重的频数分布表如图②,为了将这批仔猪分栏喂养,需计算频率分布直方图中的一些数据,其中a+b的值为( )
体重 22 24 26 27 28 29 31
频数 1 1 2 3 3 2 2
图②
A.0.144 B.0.152 C.0.76 D.0.076
例题2:(24-25高二上·安徽·阶段练习)某中职学校为了解全校学生国庆小长假期间阅读古典名著的时间的情况,抽查了1000名学生,将他们的阅读时间进行分组:.抽样结果绘成的频率分布直方图如图所示.则实数 .这1000名学生阅读古典名著的时间不少于8小时的人数为 .
例题3:(2024高一下·江苏·专题练习)某校高二年级期末统一测试,随机抽取一部分学生的数学成绩,分组统计如下表.
分组 频数 频率
3 0.03
3 0.03
37 0.37
m n
15 0.15
合计 M N
(1)求出表中的值,并根据表中所给数据在给出的坐标系中画出频率直方图;
(2)若全校参加本次考试的学生有600人,试估计这次测试中全校成绩在90分以上的人数.
巩固训练
1.(24-25高一上·四川成都·开学考试)八年级(1)班同学为了解某小区家庭月均用水情况,随机调查了该小区部分家庭,并将调查数据整理成如下两幅不完整的统计图表:
月均用水量x(t) 频数(户) 频率
6 0.12
m 0.24
16 0.32
10 0.20
4 n
2 0.04
请根据以上信息,解答以下问题:
(1)直接写出频数分布表中的m、n的值并把频数直方图补充完整;
(2)求出该班调查的家庭总户数是多少?
(3)求该小区用水量不超过15的家庭的频率.
2.(24-25高一上·全国·课后作业)中小学生的视力状况受到全社会的广泛关注,某市有关部门对全市4万名初中生的视力状况进行一次抽样调查统计,所得到的有关数据绘制成频率分布直方图,如图,从左至右五个小组的频率之比是2∶4∶9∶7∶3,第五小组的频数是30.

(1)本次调查共抽调了多少名学生?
(2)如果视力在属正常,那么全市初中生视力正常的约有多少人?
题型八 条形图、扇形图、折线图
例题1:(23-24高一下·四川内江·期末)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄的分布饼状图 90后从事互联网行业者的岗位分布条形图,则下列结论中不一定正确的是( )
A.互联网行业从事技术岗位的人数中,90后比80后多
B.90后互联网行业者中从事技术岗位的人数超过整个从事互联网行业者总人数的
C.互联网行业中从事运营岗位的人数90后比80前多
D.互联网行业从业人员中90后占一半以上
例题2:(多选)(23-24高三下·河北秦皇岛·开学考试)下图反映2017年到2022年6月我国国有企业营业总收入及增速统计情况:
2017年到2022年6月国有企业营业总收入及增速统计图

根据图中的信息,下列说法错误的是( )
A.2017-2022年我国国有企业营业总收入逐年增加
B.2017-2022年我国国有企业营业总收入逐年下降
C.2017-2021年中,我国国有企业营业总收入增速最快的是2021年
D.2017-2021年我国国有企业营业总收入的平均数大于630000亿元
巩固训练
1.(多选)(2024·全国·模拟预测)某商户收集并整理了其在2023年1月到8月线上和线下收入的数据,并绘制如图所示的折线图,则下列结论正确的是( )
A.该商户这8个月中,月收入最高的是7月
B.该商户这8个月的线上总收入低于线下总收入
C.该商户这8个月中,线上、线下收入相差最小的是7月
D.该商户这8个月中,月收入不少于17万元的频率是
2.(25-26高一上·全国·课后作业)神舟十三号载人飞行任务的圆满成功,标志着空间站关键技术验证阶段任务圆满完成,中国空间站即将进入建造阶段.某机构研究室通过随机抽样的方式,对18岁及以上人群进行了“你是否曾有过航天梦想”的调查研究,得到如下的统计结果.

根据调查结果,以下说法正确的是 (填序号).
①在“曾有过航天梦想”的人群中,54岁及以上的人数最少;
②在“曾有过航天梦想”的人群中,年龄越大,在航天相关方面的人均消费越少;
③在“曾有过航天梦想”的人群中,18—29岁在航天相关方面的总消费最多.
3.(24-25高一上·全国·课后作业)某校分别于2020年、2022年随机调查相同数量的学生,对数学课开展小组合作学习的情况进行调查(开展情况分为极少、有时、常常、总是共四种),绘制成部分统计图如下.请根据图中信息,解答下列问题:
(1)________,________,“总是”对应扇形统计图中的圆心角度数为________;
(2)请你补全条形统计图;
(3)若该校2022年共有1200名学生,请你统计其中认为数学课“总是”开展小组合作学习的学生有多少名?
(4)相比2020年,2022年数学课开展小组合作学习的情况有何变化?
题型九 平均数、众数、中位数
例题1:(2024高三·全国·专题练习)有一组数据24,29,,25,22,,20,24,28,25.若该组数据的中位数与众数相等,则平均数为( )
A.24.4 B.25.8 C.24.4或25.8 D.24.4或24.8
例题2:(23-24高三下·江西·开学考试)样本中共有个个体,其值分别为、、、、,若该样本的中位数为,则的取值范围为( )
A. B. C. D.
例题3:(2024·山东济宁·一模)2024年1月九省联考的数学试卷出现新结构,其中多选题计分标准如下:①本题共3小题,每小题6分,满分18分;②每道小题的四个选项中有两个或三个正确选项,全部选对得6分,有选错的得0分;③部分选对得部分分(若某小题正确选项为两个,漏选一个正确选项得3分;若某小题正确选项为三个,漏选一个正确选项得4分,漏选两个正确选项得2分).已知在某次新结构数学试题的考试中,小明同学三个多选题中第一小题确定得满分,第二小题随机地选了两个选项,第三小题随机地选了一个选项,则小明同学多选题所有可能总得分(相同总分只记录一次)的中位数为 .
巩固训练
1.(23-24高一上·福建厦门·开学考试)今年是我国现行宪法公布施行40周年.为贯彻党的二十大精神,强化宪法意识,弘扬宪法精神,推动宪法实施,某学校开展法律知识竞赛活动,全校一共100名学生参与其中,得分情况如下表.则分数的中位数和众数分别是( )
分数(分) 60 70 80 90 100
人数 8 22 20 30 20
A.80,90 B.90,100
C.85,90 D.90,90
2.(23-24高一下·云南楚雄·期末)已知样本数据的平均数为9,则另一组数据的平均数为( )
A. B. C.4 D.3
3.(多选)(2024高三·全国·专题练习)演讲比赛中9位评委为选手打分,打分区间为,甲的得分是:7.2,8.2,7.9,8.3,7.4,8.6,9.3,7.8,7.3,根据规则要去掉一个最低分和最高分,则剩下的数据与原数据比较不变的是( )
A.中位数 B.平均数 C.极差 D.第60百分位数
题型十 平均数、众数、中位数的估计值 
例题1:(多选)(23-24高三下·重庆·阶段练习)某社区通过简单随机抽样,获得了100户居民的月均用水量数据,并绘制出如图所示的频率分布直方图,由该图可以估计( )
A.平均数>中位数 B.中位数>平均数
C.中位数>众数 D.众数>平均数
例题2:(24-25高一上·甘肃平凉·阶段练习)100名学生某次数学考试成绩(单位:分)的频率分布直方图如图所示.回答下列问题:
(1)求频率分布直方图中的值;
(2)估计这次考试的平均数、众数和中位数(结果保留一位小数).
例题3:(24-25高二上·广东湛江·阶段练习)某校高二年级500名学生的学考适应性演练数学成绩频率分布直方图如图所示,其中成绩分组区间是,,,,,.
(1)求图中a的值;
(2)估计这500名学生的这次考试数学成绩的中位数,第80百分位数;
(3)估计这500名学生的这次考试数学成绩的平均数.
巩固训练
1.(23-24高一下·河南周口·期末)某校从高一年级学生中随机抽取60名学生,将期中考试的数学成绩均为整数分成六组:后得到如图所示频率分布直方图.
(1)求的值;
(2)根据频率分布直方图,求众数和中位数;
(3)用比例分配的分层随机抽样的方法在各分数段的学生中抽取一个容量为20的样本,求在分数段抽取的人数;
2.(24-25高二上·河南·阶段练习)某高二实验班共有50名学生,数学老师为研究某次考试,将所有学生的成绩分成5组:,,,,,得到频率分布直方图如下.
(1)求的值,并估计本班学生成绩的中位数(计算结果保留1位小数);
(2)全班共有24名女生,该次考试成绩在120分以下的女生有8人,则不低于120分的男生有多少人?
3.(24-25高一上·河南南阳·阶段练习)随着城镇化不断发展,老旧小区改造及管理已经引起政府部门的高度重视,为了解某小区业主对小区物业服务的满意程度,现从该小区随机抽查了户业主,根据业主对物业服务的满意度评分,将评分分成六段:得到如下频率分布直方图.已知评分在之间的有5户.
(1)求和的值;
(2)从中按分层抽样的方法抽取26人成立物业服务监督小组,则从,中分别抽取几人?
(3)估计满意度评分的平均数和中位数.
4.(24-25高二上·广东湛江·阶段练习)为了落实习主席提出“绿水青山就是金山银山”的环境治理要求,某市政府积极鼓励居民节约用水.为了了解居民用水情况,通过抽样,获得了某年200位居民每人的月均用水量(单位:吨),将数据按照,,…,分成5组,制成了如图所示的频率分布直方图.
(1)求直方图中x的值;
(2)设该市有50万居民,估计全市居民中月均用水量小于6吨的人数;
(3)由频率分布直方图估计该市居民月均用水的平均数(每组数据用该组区间中点值作为代表).
5.(23-24高一下·重庆长寿)为了落实习主席提出的“绿水青山就是金山银山”的环境治理要求,平昌县政府积极鼓励居民节约用水.计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得某年200位居民每人的月均用水量(单位:吨),将数据按照分成9组,制成如图所示的频率分布直方图.
(1)直方图中a的值;
(2)由频率分布直方图估计平昌县居民月用水量的平均数是多少;
(3)若平昌县政府希望使85%的居民每月的用水量不超过标准x(吨),求x的估计值.
题型十一 总体百分位数 
例题1:(24-25高三上·吉林长春·期末)某校为了宣传青少年身心健康的重要性,随机抽查了高一、高二、高三的名同学进行了跑步测试,按照最终测试成绩的分数进行分组,得到如图所示的频率分布直方图,估计该名同学测试得分的上四分位数为( )
A.82.5 B.81 C.80 D.79.5
例题2:(24-25高三上·福建漳州·阶段练习)2024年新高考数学Ⅰ卷多选题的计分标准如下:①本题共3小题,每小题6分,共18分;②每小题的四个选项中有两个或三个正确选项,全部选对的得6分,有选错或不选的得0分;③部分选对的得部分分(若某小题正确选项为两个,漏选一个正确选项得3分;若某小题正确选项为三个,漏选一个正确选项得4分,漏选两个正确选项得2分).考生甲在此卷多选题的作答中,第一小题选了三个选项,第二小题选了两个选项,第三小题选了一个选项,则他多选题的所有可能总得分(相同总分只记录一次)的第80百分位数为 .
例题3:(23-24高一下·全国·课后作业)梵净山位于贵州省铜仁市的江口 印江 松桃三县交界处,是具有2000多年历史的文化名山.梵净山山势雄伟 层峦叠嶂,溪流纵横 飞瀑悬泻.为更好地提升旅游品质,随机选择100名游客对景区进行满意度评分(满分100分),根据评分,制成如图所示的频率分布直方图.
(1)根据频率分布直方图,求的值;
(2)估计这100名游客对景区满意度评分的分位数.
巩固训练
1.(24-25高三上·天津河西·期末)某中学组织高中学生参加数学知识竞赛,现从中随机抽取100名学生成绩的频率分布直方图如图所示,则这组样本数据的分位数为( )
A.85 B.86 C.87 D.88
2.(24-25高三上·江苏南通·阶段练习)现有一份由连续正整数(可重复)组成的样本,其容量为m,满足上四分位数为28,第80百分位数为30,则m的最小值为( )
A.24 B.25 C.28 D.29
3.(2024高一下·全国·专题练习)某地区为了解最近11天该地区的空气质量,调查了该地区过去11天小颗粒物的浓度(单位:),数据依次为.已知这组数据的极差为,则这组数据的第百分位数为 .
题型十二 方差、标准差的应用
例题1:(24-25高一上·河南南阳·阶段练习)已知一个样本容量为10的样本平均数为5,方差为1.6.现将样本中的3个数据去掉,则去掉后剩余样本容量为7的样本平均数和是( )
A.5,1 B.5,2 C.5,3 D.4,3
例题2:(多选)(2024·江苏无锡·模拟预测)某校团委为泙价5个社团暑期开展活动的情况,在各社团中分别抽取部分社员进行调查.若各社团抽取的社员人数的平均数为8,方差为4,则各社团被抽取的社员人数的最大值可能为( )
A.13 B.12 C.11 D.10
例题3:(24-25高二上·黑龙江·开学考试)7月23日,第8届中国一南亚博览会暨第28届中国昆明进出口商品交易会在昆明滇池国际会展中心隆重开幕.本届南博会以“团结协作 共谋发展”为主题,会期从23日至28日,共设15个展馆,展览面积15万平方米,吸引82个国家 地区和国际组织参会,2000多家企业进馆参展.某机构邀请了进馆参展的100家企业对此次展览进行评分,分值均在内,并将部分数据整理如下表:
分数
频数 10 10 20 20
(1)估计这100家企业评分的中位数(保留小数点后一位);
(2)估计这100家企业评分的平均数与方差(同一组中的数据用该组区间的中点值作代表).
巩固训练
1.(24-25高二上·全国·开学考试)班级里有50名学生,在一次考试中统计出平均分为80分,方差为70,后来发现有3名同学的分数登错了,甲实际得60分却记成了75分,乙实际得80分却记成了90分,丙实际得90分却记成了65分,则关于更正后的平均分和方差分别是( )
A.82,73 B.80,73 C.82,67 D.80,67
2.(2024·重庆沙坪坝·模拟预测)已知1,这5个数的平均数为3,方差为2,则这4个数的方差为( )
A.1 B. C. D.2
3.(24-25高三上·四川南充·阶段练习)为深入学习贯彻习近平总书记关于禁毒工作重要指示精神,切实落实国家禁毒委员会《关于加强新时代全民禁毒宣传教育工作的指导意见》,巩固青少年毒品预防教育成果,大力推进防范青少年滥用涉麻精药品等成瘾性物质宣传教育活动,进一步增强青少年学生识毒防毒拒毒意识和能力,某市每年定期组织同学们进行禁毒知识竞赛活动,为了解同学们对禁毒知识的掌握情况,现从所有答卷中随机抽取份作为样本,将样本的成绩(满分分,成绩均为不低于分的整数)分成六段:,,…,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)求样本成绩的第百分位数;
(3)已知落在的平均成绩是,方差是,落在的平均成绩为,方差是,求两组成绩的总平均数和总方差.
题型十三 平均数、方差、标准差性质
例题1:(24-25高二上·四川成都·阶段练习)有一组样本数据,,,,由这组样本得到新样本数据,,,,其中,则( )
A.,,,的中位数为,则,,,的中位数为
B.,,,的平均数为,则,,,的平均数为
C.,,,的方差为,则,,,的方差为
D.,,,的极差为,则,,,的极差为
例题2:(多选)(23-24高一下·山东临沂·期末)若数据的平均数为2,方差为3,则( )
A.数据,,,的平均数为20 B.
C.数据,,,的标准差为 D.
例题3:(23-24高一下·山西吕梁·期末)已知数据的方差为16,则数据的方差为 .
巩固训练
1.(23-24高一下·福建福州·期末)若数据、、…、的平均数是4,方差是4,数据、、…、的平均数是,标准差是,则下列结论正确的是( )
A., B.,
C., D.,
2.(23-24高一下·福建泉州·期末)已知数据的均值为3,方差为1,则数据的均值和方差分别为( )
A.9,5 B.6,5 C.9,4 D.6,4
3.(多选)(2024·四川成都·模拟预测)设的极差为,平均值为,中位数为,方差为.,其中,.的极差为,平均值为,中位数为,方差为,则( )
A. B. C. D.
试卷第42页,共43页
1