2025年高考数学复习核心考点(新高考专用)专题9.1随机抽样、统计图表【五大题型】(学生版+教师版)

文档属性

名称 2025年高考数学复习核心考点(新高考专用)专题9.1随机抽样、统计图表【五大题型】(学生版+教师版)
格式 zip
文件大小 3.0MB
资源类型 试卷
版本资源 通用版
科目 数学
更新时间 2025-02-25 12:31:32

文档简介

专题9.1 随机抽样、统计图表【五大题型】
【新高考专用】
【题型1 总体、个体、样本】 5
【题型2 抽签法与随机数法的应用】 5
【题型3 抽样方法】 6
【题型4 统计图表】 7
【题型5 频率分布直方图】 8
1、随机抽样、统计图表
考点要求 真题统计 考情分析
(1)了解获取数据的基本途径 (2)会用简单随机抽样的方法从总体中抽取样本,了解分层随机抽样 (3)能根据实际问题的特点选择恰当的统计图表,体会使用统计图表的重要性 2022年全国甲卷(文数):第2题,5分 2023年新高考Ⅱ卷:第19题,12分 从近几年的高考情况来看,高考对随机抽样的考查较少,对统计图表的考查比较稳定,多以选择题、填空题的形式出现,难度不大;有时统计图表会作为条件信息在解答题中出现,与其他知识结合考查,综合性强,需要灵活求解.
【知识点1 随机抽样】
1.总体、个体、样本
名称 定义
总体 调查对象的全体.
个体 从总体中抽取的那部分个体.
样本 从总体中抽取的那部分个体.
样本量 样本中包含的个体数.
2.简单随机抽样
(1)简单随机抽样的概念
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.
(2)(不放回)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取样本的总体中所含个体的个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单随机抽样中各个个体被抽到的可能性(机会)都相等(与第几次抽取无关),从而保证了抽样的公平性.
3.两种常见的简单随机抽样方法
(1)抽签法
一般地,抽签法就是把总体中的N个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也
可以是卡片、小球等)上作为号签,并将这些号签放在一个不透明的盒,充分搅拌,最后从盒中不放回
地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的数量.
(2)随机数法
先把总体中的N个个体编号,用随机数工具产生1~N范围内的整数随机数,把产生的随机数作为抽中
的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需要的数量.如果生成的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的数量.
(3)两种抽样方法的优缺点
抽样方法 优点 缺点 适用范围
抽签法 简单易行. 总体量较大时,操作起来比较麻烦. 适用于总体中个体数不多的情形.
随机数法 简单易行,它很好地解决了总体量较大时用抽签法制签困难的问题. 总体量很大,样本量也很大时,利用随机数法抽取样本仍不方便. 总体量较大,样本量较小的情形.
4.分层随机抽样
(1)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个
子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)分层随机抽样的步骤
①分层:根据已经掌握的信息,将总体分成互不重叠的层.
②求比:根据总体中的个体数N和样本容量n计算抽样比.
③定数:确定第i层应该抽取的个体数为ni=Ni·k(Ni为总体中第i层所包含的个体数),使得各ni之和
为n.
④抽样:按“定数”步骤中确定的个体数在各层中随机地抽取个体,合在一起便得到容量为n的样本.
(5)分层随机抽样的特点
①适用于由差异明显的几部分(即层)组成的总体;
②分成的各层互不重叠;
③各层抽取的比例都等于样本容量在总体中的比例,即,其中n为样本容量,N为总体容量;
④分层随机抽样使样本具有较强的代表性,而且在各层抽样时,又可灵活地选用不同的随机抽样方法.
5.分层随机抽样的平均数计算
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量
分别为m和n,第1层、第2层的总体平均数分别为,,第1层、第2层的样本平均数分别为,,总体平均数为,样本平均数为,则==+.
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用=+估计总体平均数.
又==,
所以+=+=.
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数.
【知识点2 统计图表】
1.频率分布直方图
(1)频率分布表与频率分布直方图的意义
为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初
中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
有时,我们更关心各个小组的数据在样本容量中所占比例的大小,所以选择频率分布表和频率分布直方图来整理和表示数据.
(2)频率分布表与频率分布直方图的制作步骤
与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
第一步,求极差
极差为一组数据中最大值与最小值的差.
第二步,决定组距与组数
第三步,将数据分组
通常对组内数据取左闭右开区间,最后一组数据取闭区间.
第四步,列频率分布表
计算各小组的频率,作出频率分布表.
第五步,画频率分布直方图
画图时,以横轴表示分组,纵轴(小长方形的高度)表示.
2.其他几类常用统计图——条形图、折线图、扇形图
条形图 折线图 扇形图
特 点 一般地,条形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,条形图中每一长方形都是等宽的. 用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化. 用整个圆表示总体,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
作用及选用情景 能清楚地表示每个项目的具体数量,便于相互比较大小. 能清楚地看出数量增减变化的情况及各部分数量的多少.常用来表示随时间变化的数据,当然,也可以用在其他合适的情形中. 可以形象地表示出各部分数据在全部数据中所占的比例情况.
图例
3.统计图表的主要应用
(1)扇形图:直观描述各类数据占总数的比例.
(2)折线图:描述数据随时间的变化趋势.
(3)条形图和直方图:直观描述不同类别或分组数据的频数和频率.
【方法技巧与总结】
1.利用按比例分配的分层随机抽样要注意按比例抽取,若各层应抽取的个体数不都是整数,可以进行一定的技术处理,比如将结果取成整数等.
2.在按比例分配的分层随机抽样中,以层数是2层为例,如果第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层的样本平均数分别为,样本平均数为,则.
3.频率分布直方图中纵轴上的数据是各组的频率除以组距,不要和条形图混淆.
【题型1 总体、个体、样本】
【例1】(2024·四川南充·二模)某工厂生产A,B,C三种不同型号的产品,它们的产量之比为2∶3∶5,用分层抽样的方法抽取一个容量为n的样本.若样本中A型号的产品有30件,则样本容量n为( )
A.150 B.180 C.200 D.250
【变式1-1】(23-24高一下·河北张家口·期末)已知一个总体中有个个体,用抽签法从中抽取一个容量为的样本,若每个个体被抽到的可能性是,则( )
A.10 B.20 C.40 D.不确定
【变式1-2】(2024·全国·模拟预测)某学校高三年级有男生640人,女生360人.为了解高三学生参加体育运动的情况,采用分层抽样的方法抽取样本,现从男、女学生中共抽取50名学生,则男、女学生的样本容量分别为( )
A.30,20 B.18,32 C.25,25 D.32,18
【变式1-3】(23-24高一下·西藏日喀则·期末)高考结束后,为了分析该校高三年级1000名学生的高考成绩,从中随机抽取了100名学生的成绩,就这个问题来说,下列说法中正确的是( )
A.100名学生是个体
B.样本容量是100
C.每名学生的成绩是所抽取的一个样本
D.1000名学生是样本
【题型2 抽签法与随机数法的应用】
【例2】(2024·陕西西安·一模)某高校对中文系新生进行体测,利用随机数表对650名学生进行抽样,先将650名学生进行编号,001,002,…,649,650.从中抽取50个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.623 B.328 C.072 D.457
【变式2-1】(24-25高一·全国·课后作业)下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
【变式2-2】(2024·云南贵州·二模)本次月考分答题卡的任务由高三16班完成,现从全班55位学生中利用下面的随机数表抽取10位同学参加,将这55位学生按01、02、、55进行编号,假设从随机数表第1行第2个数字开始由左向右依次选取两个数字,重复的跳过,读到行末则从下一行行首继续,则选出来的第6个号码所对应的学生编号为( )
0627 4313 2432 5327 0941 2512 6317 6323 2616 8045 6011
1410 9577 7424 6762 4281 1457 2042 5332 3732 2707 3607
0140 0523 2617 3726 3890 5124 5179 3014 2310 2118 2191
A.51 B.25 C.32 D.12
【变式2-3】(2024·陕西·一模)我校高三年级为了学生某项身体指标,利用随机数表对650名学生进行抽样,先将650进行编号,001,002,,649,650.从中抽取50个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第7个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.623 B.328 C.072 D.457
【题型3 抽样方法】
【例3】(2024·陕西·二模)某医院有医生750人,护士1600人,其他工作人员150人,用分层抽样的方法从这些人中抽取一个容量为50的样本,则样本中,医生比护士少( )
A.19人 B.18人 C.17人 D.16人
【变式3-1】(2024·四川成都·模拟预测)用简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( )
A., B.,
C., D.,
【变式3-2】(24-25高一上·全国·随堂练习)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )
A.简单随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.抽签法
【变式3-3】(2024·黑龙江哈尔滨·模拟预测)在哈尔滨市2024年第一次市模考试中,三所学校高三年级的参考人数分别为、.现按比例分层抽样的方法从三个学校高三年级中抽取样本,经计算得三所学校高三年级数学成绩的样本平均数分别为,则三所学校学生数学成绩的总平均数约为( )
A.101 B.100 C.99 D.98
【题型4 统计图表】
【例4】(2024·辽宁·模拟预测)某高中2023年的高考考生人数是2022年高考考生人数的1.5倍.为了更好地对比该校考生的升学情况,统计了该校2022年和2023年高考分数达线情况,得到如图所示扇形统计图:

下列结论正确的是( )
A.该校2023年与2022年的本科达线人数比为6:5
B.该校2023年与2022年的专科达线人数比为6:7
C.2023年该校本科达线人数比2022年该校本科达线人数增加了80%
D.2023年该校不上线的人数有所减少
【变式4-1】(2024·陕西安康·模拟预测)当今时代,数字技术作为世界科技革命和产业变革的先导力量,日益融入经济社会发展各领域全过程,深刻改变着生产方式、生活方式和社会治理方式,从而带动了大量的电子产品在市场的销售.现有某商城统计了近两个月在A,B,C三个区域售出的1000个电子产品,其中A,B,C各个区域销量分布的饼状图及售价的频率条形图(按规定这些电子产品的售价均在50,300之间)如图,则在A区域售出的电子产品中,售价在区间(150,200]内比在区间(250,300]内多( )
A.30件 B.114件 C.120件 D.133件
【变式4-2】(2024·四川遂宁·三模)某调查机构对某地快递行业从业者进行调查统计,得到快递行业从业人员年龄分布饼状图(图1)、“90后”从事快递行业岗位分布条形图(图2),则下列结论中错误的是( )
A.快递行业从业人员中,“90后”占一半以上
B.快递行业从业人员中,从事技术岗位的“90后”的人数超过总人数的20%
C.快递行业从业人员中,从事运营岗位的“90后”的人数比“80前”的多
D.快递行业从业人员中,从事技术岗位的“90后”的人数比“80后”的多
【变式4-3】(2024·陕西西安·模拟预测)2017年至2022年某省年生产总量及其增长速度如图所示,则下列结论错误的是( )
A.2017年至2022年该省年生产总量逐年增加
B.2017年至2022年该省年生产总量的极差为14842.3亿元
C.2017年至2022年该省年生产总量的增长速度逐年降低
D.2017年至2022年该省年生产总量的增长速度的中位数为7.6%
【题型5 频率分布直方图】
【例5】(2024·天津武清·模拟预测)某校高三共有200人参加体育测试,将体测得分情况进行了统计,把得分数据按照分成6组,绘制了如图所示的频率分布直方图.根据规则,82分以上的考生成绩等级为A,则获得的考生人数约为( )
A.25 B.50 C.75 D.100
【变式5-1】(2024·山东·二模)某校高三共有200人参加体育测试,根据规则,82分以上的考生成绩等级为,则估计获得的考生人数约为( )
A.100 B.75 C.50 D.25
【变式5-2】(2024·四川南充·二模)已知某科技公司的某型号芯片的各项指标经过全面检测后,分为I级和Ⅱ级,两种品级芯片的某项指标的频率分布直方图如图所示:
若只利用该指标制定一个标准,需要确定临界值K,将该指标大于K的产品应用于A型手机,小于或等于K的产品应用于B型手机.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)若临界值,请估计该公司生产的1000个该型号芯片I级品和1000个Ⅱ级品中应用于A型手机的芯片个数;
(2)设且,现有足够多的芯片I级品 Ⅱ级品,分别应用于A型手机 B型手机各1万部的生产:
方案一:直接将该芯片I级品应用于A型手机,其中该指标小于等于临界值K的芯片会导致芯片生产商每部手机损失800元;直接将该芯片Ⅱ级品应用于B型手机,其中该指标大于临界值K的芯片,会导致芯片生产商每部手机损失400元;
方案二:重新检测芯片I级品,II级品的该项指标,并按规定正确应用于手机型号,会避免方案一的损失费用,但检测费用共需要130万元;
请求出按方案一,芯片生产商损失费用的估计值(单位:万元)的表达式,并从芯片生产商的成本考虑,选择合理的方案.
【变式5-3】(2024·四川成都·二模)2024年1月,某市的高二调研考试首次采用了“”新高考模式.该模式下,计算学生个人总成绩时,“”的学科均以原始分记入,再选的“2”个学科(学生在政治 地理 化学 生物中选修的2科)以赋分成绩记入.赋分成绩的具体算法是:先将该市某再选科目原始成绩按从高到低划分为五个等级,各等级人数所占比例分别约为.依照转换公式,将五个等级的原始分分别转换到五个分数区间,并对所得分数的小数点后一位进行“四舍五入”,最后得到保留为整数的转换分成绩,并作为赋分成绩.具体等级比例和赋分区间如下表:
等级
比例
赋分区间
已知该市本次高二调研考试化学科目考试满分为100分.
(1)已知转换公式符合一次函数模型,若学生甲 乙在本次考试中化学的原始成绩分别为84,78,转换分成绩为78,71,试估算该市本次化学原始成绩B等级中的最高分.
(2)现从该市本次高二调研考试的化学成绩中随机选取100名学生的原始成绩进行分析,其频率分布直方图如图所示,求出图中的值,并用样本估计总体的方法,估计该市本次化学原始成绩等级中的最低分.
一、单选题
1.(2024·江西南昌·模拟预测)已知三种不同型号的产品数量之比依次为,现用分层抽样的方法抽取容量为的样本,若样本中型号产品有件,则为( )
A.60 B.70 C.80 D.90
2.(24-25高一上·全国·单元测试)①一次数学考试中,某班有12人的成绩在100分以上,30人的成绩在90~100分,12人的成绩低于90分,现从中抽取9人了解有关考试题目难度的情况;②运动会的工作人员为参加接力赛的6支队伍安排跑道.针对这两件事,恰当的抽样方法分别为( )
A.分层抽样,简单随机抽样 B.简单随机抽样,简单随机抽样
C.简单随机抽样,分层抽样 D.分层抽样,分层抽样
3.(2024·河南驻马店·二模)电影《孤注一掷》的上映引发了电信诈骗问题的热议,也加大了各个社区反电信诈骗的宣传力度.已知某社区共有居民480人,其中老年人200人,中年人200人,青少年80人,若按年龄进行分层随机抽样,共抽取36人作为代表,则中年人比青少年多( )
A.6人 B.9人 C.12人 D.18人
4.(2024·福建泉州·模拟预测)从一个含有个个体的总体中抽取一容量为的样本,当选取抽签法、随机数法和分层随机抽样三种不同方法时,总体中每个个体被抽中的概率分别为,三者关系可能是( )
A. B. C. D.
5.(2024·陕西铜川·模拟预测)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生近视情况形成的原因,采用分层抽样的方法抽取部分学生进行调查,若抽取的小学生人数为70,则抽取的高中生中近视人数为( )
A.10 B.20 C.25 D.40
6.(2024·云南·二模)本次月考分答题卡的任务由高三16班完成,现从全班55位学生中利用下面的随机数表抽取10位同学参加,将这55位学生按进行编号,假设从随机数表第1行第2个数字开始由左向右依次选取两个数字,重复的跳过,读到行末则从下一行行首继续,则选出来的第6个号码所对应的学生编号为( )
0627 4313 2432 5327 0941 2512 6317 6323 2616 8045 6011
1410 9577 7424 6762 4281 1457 2042 5332 3732 2707 3607
5124 5179 3014 2310 2118 2191 3726 3890 0140 0523 2617
A.51 B.25 C.32 D.12
7.(2024·陕西渭南·模拟预测)在某次高中数学模拟考试中,对800名考生的考试成绩进行统计,得到如图所示的频率分布直方图,其中分组的区间分别为,,,,,.若考生成绩在内的人数为,考生成绩在内的人数为,则( )
A.20 B.10 C.60 D.40
8.(2024·全国·模拟预测)已知2015—2022年和2023年1~9月某新能源汽车企业的营业收入(单位:亿元)和净利润(单位:亿元)及2015—2022年营业收入的增长率的统计图如图所示,2023年第二、三、四季度的净利润相比上一季度的增长率均为,则下列结论正确的是( )
A.2015—2022年该企业年营业收入逐年增加
B.2015—2022年该企业年营业收入增长率最大的是2015年
C.2022年该企业年净利润超过2017—2021年年净利润总和
D.2023年第四季度的净利润比第一季度的净利润多约30亿元
二、多选题
9.(23-24高一下·吉林·阶段练习)某公司生产三种型号的轿车,年产量分别为1500辆、6000辆和2000辆.为检验产品质量,公司质检部门要抽取57辆进行检验,则下列说法正确的是( )
A.应采用分层随机抽样抽取
B.应采用抽签法抽取
C.三种型号的轿车依次应抽取9辆、36辆、12辆
D.这三种型号的轿车,每一辆被抽到的可能性相同
10.(2024·黑龙江·三模)在某市初三年级举行的一次体育考试中(满分100分),所有考生成绩均在[50,100]内,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五组,甲、乙两班考生的成绩占比如图所示,则下列说法错误的是( )

A.成绩在[70,80)的考生中,甲班人数多于乙班人数
B.甲班成绩在[80,90)内人数最多
C.乙班成绩在[70,80)内人数最多
D.甲班成绩的极差比乙班成绩的极差小
11.(2024·辽宁·二模)下图为某市2023年第一季度全市居民人均消费支出构成图.已知城镇居民人均消费支出7924元,与上一年同比增长4.4%;农村居民人均消费支出4388元,与上一年同比增长7.8%,则关于2023年第一季度该市居民人均消费支出,下列说法正确的是( )
A.2023年第一季度该市居民人均消费支出6393元
B.居住及食品烟酒两项的人均消费支出总和超过了总人均消费支出的50%
C.城乡居民人均消费支出的差额与上一年同比在缩小
D.医疗保健与教育文化娱乐两项人均消费支出总和约占总人均消费支出的20.6%
三、填空题
12.(2023·山东·一模)为了解某中职学校男生的身体发育情况,对随机抽取的100名男生的身高进行了测量(结果精确到),并绘制了如图所示的频率分布直方图,由图可知,其中身高超过的男生的人数为 .

13.(2024·山东泰安·模拟预测)某高中为了了解学生参加数学建模社团的情况,采用了分层随机抽样的方法从三个年级中抽取了300人进行问卷调查,其中高一、高二年级各抽取了90人.已知该校高三年级共有720名学生,则该校共有学生 人.
14.(23-24高一下·黑龙江哈尔滨·期末)二战期间盟军的统计学家主要是将缴获的德军坦克序列号作为样本,用样本估计总体的方法得出德军某月生产的坦克总数.假设德军某月生产的坦克总数是N,缴获的该月生产的n辆坦克编号从小到大为,,…,,即最大编号为,且缴获的坦克是从所生产的坦克中随机获取的,因为生产坦克是连续编号的,所以缴获坦克的编号,,…,,,相当于从中随机抽取的n个整数,这n个数将区间分成个小区间,由于N是未知的,除了最右边的区间外,其他n个区间都是已知的.由于这n个数是随机抽取的,所以可以用前n个区间的平均长度估计所有个区间的平均长度,进而得到N的估计值.例如,缴获坦克的编号是3,5,12,18,20,则统计学家利用上述方法估计德军每月生产的坦克数为 .

四、解答题
15.(24-25高一上·全国·课堂例题)有以下两个案例:
案例一:从同一批次同类型号的10袋牛奶中抽取3袋分别检测三聚氰胺的含量;
案例二:某公司有员工800人,其中具有高级职称的有160人,具有中级职称的有320人,具有初级职称的有200人,其他人员120人,从中抽取容量为40的样本,了解他们的收入情况.
(1)你认为这两个案例分别应采用怎样的抽样方式较为合适?
(2)在你使用的分层抽样案例中写出抽样过程.
16.(2024·全国·模拟预测)以“建设包容、普惠、有韧性的数字世界——携手构建网络空间命运共同体”为主题的2023年世界互联网大会乌镇峰会于11月8日至10日在中国浙江省乌镇举行.为保障大会顺利进行,世界互联网大会的秘书处从招募的志愿者中随机抽取100名进行了一次互联网知识竞赛,所得成绩(单位:分)均在内,并制成如下频数分布表:
成绩/分
频数 8 28 20 12
(1)根据频数分布表,在下图中作出频率分布直方图;

(2)以样本估计总体,记竞赛成绩不低于86分的志愿者为优秀志愿者,则优秀志愿者的占比能否达到20%?
17.(2024·广西柳州·一模)根据国家工信部关于全面推行中国特色企业新型学徒制,加强技能人才培养的通知,我区明确面向各类企业全面推行企业新型学徒制培训,深化产教融合,校企合作,学徒培养目标以符合企业岗位需要的中,高级技术工人.2020年度某企业共需要学徒制培训200人,培训结束后进行考核,现对考核后取得相应岗位证书进行统计,统计情况如下表:
岗位证书 初级工 中级工 高级工 技师 高级技师
人数 20 60 60 40 20
(1)现从这200人中采用分层抽样的方式选出10人组成学习技能经验交流团,求交流团中取得技师类(包含技师和高级技师)岗位证书的人数.
(2)为了鼓励企业员工参加培训,该企业在2021年出台了如下培训奖励措施.
取得岗位证书 初级工 中级工 高级工 技师 高级技师
奖励金额(元/人) 0 500 600 800 1000
以2020年度培训取得各岗位证书的频率来估计2021年的培训考核结果,若该企业在2021年度培训共400人,请估计该企业2021年度共需支付多少奖金?
18.(23-24高一上·云南保山·开学考试)近几年购物的支付方式日益增多,某数学兴趣小组就此进行了抽样调查.调查结果显示,支付方式有:A微信、B支付宝、C现金、D其他,该小组对某超市一天内购买者的支付方式进行调查统计,得到如下两幅不完整的统计图.

请你根据统计图提供的信息,解答下列问题:
(1)本次一共调查了多少名购买者?
(2)请补全条形统计图;
在扇形统计图中A种支付方式所对应的圆心角为______度.
(3)若该超市这一周内有1600名购买者,请你估计使用A和B两种支付方式的购买者共有多少名?
19.(2024·山西太原·三模)在学业测试中,客观题难度的计算公式为,其中为第i题的难度,为答对该题的人数,N为参加测试的总人数.现对某校高三年级240名学生进行一次测试,共5道客观题.测试前根据对学生的了解,预估了每道题的难度,如下表所示:
题号 1 2 3 4 5
考前预估难度 0.9 0.8 0.7 0.6 0.4
测试后,随机抽取了20名学生的答题数据进行统计,结果如下
题号 1 2 3 4 5
实测答对人数 16 16 14 14 8
(1)根据题中数据,估计这240名学生中第5题的实测答对人数;
(2)定义统计量,其中为第i题的实测难度,为第i题的预估难度(i=1,2,…,n).规定:若,则称该次测试的难度预估合理,否则为不合理.试据此判断本次测试的难度预估是否合理.
21世纪教育网(www.21cnjy.com)专题9.1 随机抽样、统计图表【五大题型】
【新高考专用】
【题型1 总体、个体、样本】 5
【题型2 抽签法与随机数法的应用】 6
【题型3 抽样方法】 8
【题型4 统计图表】 9
【题型5 频率分布直方图】 12
1、随机抽样、统计图表
考点要求 真题统计 考情分析
(1)了解获取数据的基本途径 (2)会用简单随机抽样的方法从总体中抽取样本,了解分层随机抽样 (3)能根据实际问题的特点选择恰当的统计图表,体会使用统计图表的重要性 2022年全国甲卷(文数):第2题,5分 2023年新高考Ⅱ卷:第19题,12分 从近几年的高考情况来看,高考对随机抽样的考查较少,对统计图表的考查比较稳定,多以选择题、填空题的形式出现,难度不大;有时统计图表会作为条件信息在解答题中出现,与其他知识结合考查,综合性强,需要灵活求解.
【知识点1 随机抽样】
1.总体、个体、样本
名称 定义
总体 调查对象的全体.
个体 从总体中抽取的那部分个体.
样本 从总体中抽取的那部分个体.
样本量 样本中包含的个体数.
2.简单随机抽样
(1)简单随机抽样的概念
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.
(2)(不放回)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取样本的总体中所含个体的个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单随机抽样中各个个体被抽到的可能性(机会)都相等(与第几次抽取无关),从而保证了抽样的公平性.
3.两种常见的简单随机抽样方法
(1)抽签法
一般地,抽签法就是把总体中的N个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也
可以是卡片、小球等)上作为号签,并将这些号签放在一个不透明的盒,充分搅拌,最后从盒中不放回
地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的数量.
(2)随机数法
先把总体中的N个个体编号,用随机数工具产生1~N范围内的整数随机数,把产生的随机数作为抽中
的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需要的数量.如果生成的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的数量.
(3)两种抽样方法的优缺点
抽样方法 优点 缺点 适用范围
抽签法 简单易行. 总体量较大时,操作起来比较麻烦. 适用于总体中个体数不多的情形.
随机数法 简单易行,它很好地解决了总体量较大时用抽签法制签困难的问题. 总体量很大,样本量也很大时,利用随机数法抽取样本仍不方便. 总体量较大,样本量较小的情形.
4.分层随机抽样
(1)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个
子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)分层随机抽样的步骤
①分层:根据已经掌握的信息,将总体分成互不重叠的层.
②求比:根据总体中的个体数N和样本容量n计算抽样比.
③定数:确定第i层应该抽取的个体数为ni=Ni·k(Ni为总体中第i层所包含的个体数),使得各ni之和
为n.
④抽样:按“定数”步骤中确定的个体数在各层中随机地抽取个体,合在一起便得到容量为n的样本.
(5)分层随机抽样的特点
①适用于由差异明显的几部分(即层)组成的总体;
②分成的各层互不重叠;
③各层抽取的比例都等于样本容量在总体中的比例,即,其中n为样本容量,N为总体容量;
④分层随机抽样使样本具有较强的代表性,而且在各层抽样时,又可灵活地选用不同的随机抽样方法.
5.分层随机抽样的平均数计算
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量
分别为m和n,第1层、第2层的总体平均数分别为,,第1层、第2层的样本平均数分别为,,总体平均数为,样本平均数为,则==+.
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用=+估计总体平均数.
又==,
所以+=+=.
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数.
【知识点2 统计图表】
1.频率分布直方图
(1)频率分布表与频率分布直方图的意义
为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初
中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
有时,我们更关心各个小组的数据在样本容量中所占比例的大小,所以选择频率分布表和频率分布直方图来整理和表示数据.
(2)频率分布表与频率分布直方图的制作步骤
与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
第一步,求极差
极差为一组数据中最大值与最小值的差.
第二步,决定组距与组数
第三步,将数据分组
通常对组内数据取左闭右开区间,最后一组数据取闭区间.
第四步,列频率分布表
计算各小组的频率,作出频率分布表.
第五步,画频率分布直方图
画图时,以横轴表示分组,纵轴(小长方形的高度)表示.
2.其他几类常用统计图——条形图、折线图、扇形图
条形图 折线图 扇形图
特 点 一般地,条形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,条形图中每一长方形都是等宽的. 用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化. 用整个圆表示总体,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
作用及选用情景 能清楚地表示每个项目的具体数量,便于相互比较大小. 能清楚地看出数量增减变化的情况及各部分数量的多少.常用来表示随时间变化的数据,当然,也可以用在其他合适的情形中. 可以形象地表示出各部分数据在全部数据中所占的比例情况.
图例
3.统计图表的主要应用
(1)扇形图:直观描述各类数据占总数的比例.
(2)折线图:描述数据随时间的变化趋势.
(3)条形图和直方图:直观描述不同类别或分组数据的频数和频率.
【方法技巧与总结】
1.利用按比例分配的分层随机抽样要注意按比例抽取,若各层应抽取的个体数不都是整数,可以进行一定的技术处理,比如将结果取成整数等.
2.在按比例分配的分层随机抽样中,以层数是2层为例,如果第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层的样本平均数分别为,样本平均数为,则.
3.频率分布直方图中纵轴上的数据是各组的频率除以组距,不要和条形图混淆.
【题型1 总体、个体、样本】
【例1】(2024·四川南充·二模)某工厂生产A,B,C三种不同型号的产品,它们的产量之比为2∶3∶5,用分层抽样的方法抽取一个容量为n的样本.若样本中A型号的产品有30件,则样本容量n为( )
A.150 B.180 C.200 D.250
【解题思路】直接由分层抽样的定义按比例计算即可.
【解答过程】由题意样本容量为.
故选:A.
【变式1-1】(23-24高一下·河北张家口·期末)已知一个总体中有个个体,用抽签法从中抽取一个容量为的样本,若每个个体被抽到的可能性是,则( )
A.10 B.20 C.40 D.不确定
【解题思路】抽签法可知每个个体被抽到的可能性均为,即可得到方程,解得即可.
【解答过程】根据抽签法可知每个个体被抽到的可能性均为,
依题意可得,解得.
故选:C.
【变式1-2】(2024·全国·模拟预测)某学校高三年级有男生640人,女生360人.为了解高三学生参加体育运动的情况,采用分层抽样的方法抽取样本,现从男、女学生中共抽取50名学生,则男、女学生的样本容量分别为( )
A.30,20 B.18,32 C.25,25 D.32,18
【解题思路】由分层抽样的定义求解即可.
【解答过程】根据分层抽样的定义,知男生共抽取(人),女生共抽取(人).
故选:D.
【变式1-3】(23-24高一下·西藏日喀则·期末)高考结束后,为了分析该校高三年级1000名学生的高考成绩,从中随机抽取了100名学生的成绩,就这个问题来说,下列说法中正确的是( )
A.100名学生是个体
B.样本容量是100
C.每名学生的成绩是所抽取的一个样本
D.1000名学生是样本
【解题思路】根据有关的概念可得总体、个体、样本这三个概念考查的对象都是学生成绩,而不是学生,再结合题中选项即可得到答案.
【解答过程】根据有关的概念并且结合题意可得总体、个体、样本这三个概念考查的对象都是学生成绩,而不是学生,
根据选项可得选项A、D表达的对象都是学生,而不是成绩,所以A、D都错误.
C每名学生的成绩是所抽取的一个样本也是错的,应是每名学生的成绩是一个个体.
B:样本的容量是100正确.
故选:B.
【题型2 抽签法与随机数法的应用】
【例2】(2024·陕西西安·一模)某高校对中文系新生进行体测,利用随机数表对650名学生进行抽样,先将650名学生进行编号,001,002,…,649,650.从中抽取50个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.623 B.328 C.072 D.457
【解题思路】按照随机数表提供的数据,三位一组的读数,并取001到650内的数,重复的只取一次即可
【解答过程】从第5行第6列开始向右读取数据,
第一个数为253,第二个数是313,
第三个数是457,下一个数是860,不符合要求,
下一个数是736,不符合要求,下一个是253,重复,
第四个是007,第五个是328,第六个数是623,,故A正确.
故选:A.
【变式2-1】(24-25高一·全国·课后作业)下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
【解题思路】根据抽签法的适用条件,结合选项依次判断即可.
【解答过程】选项A,总体中的个体数较大,样本容量也较大,不适合用抽签法,故A不符合题意;
选项B,总体中的个体数较小,样本容量也较小,
且同厂生产的两箱产品可视为搅拌均匀了,可用抽签法,故B符合题意;
选项C,甲、乙两厂生产的两箱产品质量可能差别较大,
不能满足搅拌均匀的条件,不能用抽签法,故C不符合题意;
选项D,总体中的个体数较大,不适合用抽签法,故D不符合题意.
故选:B.
【变式2-2】(2024·云南贵州·二模)本次月考分答题卡的任务由高三16班完成,现从全班55位学生中利用下面的随机数表抽取10位同学参加,将这55位学生按01、02、、55进行编号,假设从随机数表第1行第2个数字开始由左向右依次选取两个数字,重复的跳过,读到行末则从下一行行首继续,则选出来的第6个号码所对应的学生编号为( )
0627 4313 2432 5327 0941 2512 6317 6323 2616 8045 6011
1410 9577 7424 6762 4281 1457 2042 5332 3732 2707 3607
0140 0523 2617 3726 3890 5124 5179 3014 2310 2118 2191
A.51 B.25 C.32 D.12
【解题思路】根据随机数表按照规则读数即可得解.
【解答过程】根据随机数表读取,分别抽到的编号为31,32,43,25,12,51,26,04,01,11,
所以选出来的第6个号码所对应的学生编号为51,
故选:A.
【变式2-3】(2024·陕西·一模)我校高三年级为了学生某项身体指标,利用随机数表对650名学生进行抽样,先将650进行编号,001,002,,649,650.从中抽取50个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第7个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.623 B.328 C.072 D.457
【解题思路】依据随机数表的读取规则求解即可.
【解答过程】从表中第5行第6列开始向右读取数据,
前7个数据分别是253,313,457,007,328,623,072.
故选:C.
【题型3 抽样方法】
【例3】(2024·陕西·二模)某医院有医生750人,护士1600人,其他工作人员150人,用分层抽样的方法从这些人中抽取一个容量为50的样本,则样本中,医生比护士少( )
A.19人 B.18人 C.17人 D.16人
【解题思路】根据分层抽样的比例,求出医生、护士抽取的人数,即可得答案.
【解答过程】由题意知某医院有医生750人,护士1600人,
用分层抽样的方法从这些人中抽取一个容量为50的样本,
则样本中,医生抽取(人),
护士抽取(人),
故样本中,医生比护士少17人,
故选:C.
【变式3-1】(2024·四川成都·模拟预测)用简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( )
A., B.,
C., D.,
【解题思路】根据简单随机抽样的等可能性,即可判断和选择.
【解答过程】总体有10个个体,从中抽取第一个,若为,则其可能性为,若不为,则其可能性为;
抽取第二个,若其为,则第一次一定不是,再从9个个体中抽取1个,且为,则其可能性为.
综上所述,某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是.
故选:A.
【变式3-2】(24-25高一上·全国·随堂练习)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )
A.简单随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.抽签法
【解题思路】由已知条件,适合分层抽样法,即可得到答案.
【解答过程】因为事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.为了解该地区中小学生的视力情况,应按学段分层抽样,这种抽样方式抽出的样本具有代表性,比较合理.
故选;C.
【变式3-3】(2024·黑龙江哈尔滨·模拟预测)在哈尔滨市2024年第一次市模考试中,三所学校高三年级的参考人数分别为、.现按比例分层抽样的方法从三个学校高三年级中抽取样本,经计算得三所学校高三年级数学成绩的样本平均数分别为,则三所学校学生数学成绩的总平均数约为( )
A.101 B.100 C.99 D.98
【解题思路】利用分层抽样的均值公式求解即可.
【解答过程】由题意得可供参考的总人数为人,
故三所学校学生数学成绩的总平均数约为,
故选:B.
【题型4 统计图表】
【例4】(2024·辽宁·模拟预测)某高中2023年的高考考生人数是2022年高考考生人数的1.5倍.为了更好地对比该校考生的升学情况,统计了该校2022年和2023年高考分数达线情况,得到如图所示扇形统计图:

下列结论正确的是( )
A.该校2023年与2022年的本科达线人数比为6:5
B.该校2023年与2022年的专科达线人数比为6:7
C.2023年该校本科达线人数比2022年该校本科达线人数增加了80%
D.2023年该校不上线的人数有所减少
【解题思路】设2022年的高考人数为100,则2023年的高考人数为150,再根据扇形统计图中各个种类的人数所占的比例,逐个选项判断即可.
【解答过程】不妨设2022年的高考人数为100,则2023年的高考人数为150,
2022年本科达线人数为50,2023年本科达线人数为90,
2023年与2022年的本科达线人数比为9:5,
本科达线人数增加了,故A错误,C正确;
2022年专科达线人数为35,2023年专科达线人数为45,
2023年与2022年的专科达线人数比为9:7,故B错误;
2022年不上线人数为15,2023年不上线人数也是15,不上线的人数无变化,故D错误.
故选:C.
【变式4-1】(2024·陕西安康·模拟预测)当今时代,数字技术作为世界科技革命和产业变革的先导力量,日益融入经济社会发展各领域全过程,深刻改变着生产方式、生活方式和社会治理方式,从而带动了大量的电子产品在市场的销售.现有某商城统计了近两个月在A,B,C三个区域售出的1000个电子产品,其中A,B,C各个区域销量分布的饼状图及售价的频率条形图(按规定这些电子产品的售价均在50,300之间)如图,则在A区域售出的电子产品中,售价在区间(150,200]内比在区间(250,300]内多( )
A.30件 B.114件 C.120件 D.133件
【解题思路】根据销量分布的饼状图及售价的频率条形图分别求售价在区间,的件数,即可得结果.
【解答过程】由题意可知:区间,内的频率分别为,
可知在区间,内售出的电子产品件数分别为,
则在A区域售出的电子产品中,售价在区间,的件数分别为,
所以售价在区间内比在区间内多件.
故选:B.
【变式4-2】(2024·四川遂宁·三模)某调查机构对某地快递行业从业者进行调查统计,得到快递行业从业人员年龄分布饼状图(图1)、“90后”从事快递行业岗位分布条形图(图2),则下列结论中错误的是( )
A.快递行业从业人员中,“90后”占一半以上
B.快递行业从业人员中,从事技术岗位的“90后”的人数超过总人数的20%
C.快递行业从业人员中,从事运营岗位的“90后”的人数比“80前”的多
D.快递行业从业人员中,从事技术岗位的“90后”的人数比“80后”的多
【解题思路】根据两个图,结合选项,即可判断.
【解答过程】由题图可知,快递行业从业人员中,“90后”占总人数的56%,超过一半,A正确;
快递行业从业人员中,从事技术岗位的“90后”的人数占总人数的百分比为,超过20%,
所以快递行业从业人员中,从事技术岗位的“90”后的人数超过总人数的20%;B正确;
快递行业从业人员中,从事运营岗位的“90后”的人数占总人数的百分比为,超过“80前”的人数占总人数的百分比,C正确;
快递行业从业人员中,从事技术岗位的“90后”的人数占总人数的百分比为22.176%,小于“80后”的人数占总人数的百分比,但“80后”从事技术岗位的人数占“80后”人数的比未知,D不一定正确.
故选:D.
【变式4-3】(2024·陕西西安·模拟预测)2017年至2022年某省年生产总量及其增长速度如图所示,则下列结论错误的是( )
A.2017年至2022年该省年生产总量逐年增加
B.2017年至2022年该省年生产总量的极差为14842.3亿元
C.2017年至2022年该省年生产总量的增长速度逐年降低
D.2017年至2022年该省年生产总量的增长速度的中位数为7.6%
【解题思路】根据给定的条形图和折线图,逐项分析判断即得.
【解答过程】对于A,观察条形图知,2017年至2022年该省年生产总量逐年增加,A正确;
对于B,2017年至2022年该省年生产总量的极差为14842.3(亿元),B正确;
对于C,2017年至2020年该省年生产总量的增长速度逐年降低,
而2021年该省年生产总量的增长速度比2020年该省年生产总量的增长速度高,C错误;
对于D,2017年至2020年该省年生产总量的增长速度由小到大排列为:,
因此增长速度的中位数为,D正确.
故选:C.
【题型5 频率分布直方图】
【例5】(2024·天津武清·模拟预测)某校高三共有200人参加体育测试,将体测得分情况进行了统计,把得分数据按照分成6组,绘制了如图所示的频率分布直方图.根据规则,82分以上的考生成绩等级为A,则获得的考生人数约为( )
A.25 B.50 C.75 D.100
【解题思路】根据频率分布直方图求获得的频率,进而可得相应的人数.
【解答过程】由题意可知:估计获得的频率为,
所以获得的考生人数约为.
故选:B.
【变式5-1】(2024·山东·二模)某校高三共有200人参加体育测试,根据规则,82分以上的考生成绩等级为,则估计获得的考生人数约为( )
A.100 B.75 C.50 D.25
【解题思路】首先计算出82分以上的考生的频率,即可得获得的考生人数.
【解答过程】由频率分布直方图可得82分以上的考生的频率约为,
所以获得的考生人数约为人,
故选:C.
【变式5-2】(2024·四川南充·二模)已知某科技公司的某型号芯片的各项指标经过全面检测后,分为I级和Ⅱ级,两种品级芯片的某项指标的频率分布直方图如图所示:
若只利用该指标制定一个标准,需要确定临界值K,将该指标大于K的产品应用于A型手机,小于或等于K的产品应用于B型手机.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)若临界值,请估计该公司生产的1000个该型号芯片I级品和1000个Ⅱ级品中应用于A型手机的芯片个数;
(2)设且,现有足够多的芯片I级品 Ⅱ级品,分别应用于A型手机 B型手机各1万部的生产:
方案一:直接将该芯片I级品应用于A型手机,其中该指标小于等于临界值K的芯片会导致芯片生产商每部手机损失800元;直接将该芯片Ⅱ级品应用于B型手机,其中该指标大于临界值K的芯片,会导致芯片生产商每部手机损失400元;
方案二:重新检测芯片I级品,II级品的该项指标,并按规定正确应用于手机型号,会避免方案一的损失费用,但检测费用共需要130万元;
请求出按方案一,芯片生产商损失费用的估计值(单位:万元)的表达式,并从芯片生产商的成本考虑,选择合理的方案.
【解题思路】(1)根据频率分布直方图,即可求解频率,进而可求解,
(2)分别计算两种方案的费用,即可比较作答.
【解答过程】(1)临界值时,I级品中该指标大于60的频率为,
II级品中该指标大于60的频率为0.1
故该公司生产的1000个该型号芯片I级品和1000个II级品中应用于型手机的芯片个数估计为:
(2)当临界值时,若采用方案一:
I级品中该指标小于或等于临界值的概率为,
可以估计10000部型手机中有部手机芯片应用错误;
II级品中该指标大于临界值的概率为,
可以估计10000部型手机中有部手机芯片应用错误;
故可以估计芯片生产商的损失费用
又采用方案二需要检测费用共130万元
故从芯片生产商的成本考虑,应选择方案二.
【变式5-3】(2024·四川成都·二模)2024年1月,某市的高二调研考试首次采用了“”新高考模式.该模式下,计算学生个人总成绩时,“”的学科均以原始分记入,再选的“2”个学科(学生在政治 地理 化学 生物中选修的2科)以赋分成绩记入.赋分成绩的具体算法是:先将该市某再选科目原始成绩按从高到低划分为五个等级,各等级人数所占比例分别约为.依照转换公式,将五个等级的原始分分别转换到五个分数区间,并对所得分数的小数点后一位进行“四舍五入”,最后得到保留为整数的转换分成绩,并作为赋分成绩.具体等级比例和赋分区间如下表:
等级
比例
赋分区间
已知该市本次高二调研考试化学科目考试满分为100分.
(1)已知转换公式符合一次函数模型,若学生甲 乙在本次考试中化学的原始成绩分别为84,78,转换分成绩为78,71,试估算该市本次化学原始成绩B等级中的最高分.
(2)现从该市本次高二调研考试的化学成绩中随机选取100名学生的原始成绩进行分析,其频率分布直方图如图所示,求出图中的值,并用样本估计总体的方法,估计该市本次化学原始成绩等级中的最低分.
【解题思路】(1)根据已知条件及待定系数法即可求解;
(2)根据已知条件及频率分布直方图的特点即可求解.
【解答过程】(1)设转换公式中转换分关于原始成绩的一次函数关系式为.
则,解得,
转换分的最高分为85,
.解得.
故该市本次化学原始成绩B等级中的最高分为90分.
(2),
.
设化学原始成绩等级中的最低分为,
综上,化学原始成绩等级中的最低分为70.
一、单选题
1.(2024·江西南昌·模拟预测)已知三种不同型号的产品数量之比依次为,现用分层抽样的方法抽取容量为的样本,若样本中型号产品有件,则为( )
A.60 B.70 C.80 D.90
【解题思路】由条件确定型号产品的抽样比,再根据频数,频率,样本容量的关系求.
【解答过程】因为三种不同型号的产品数量之比依次为,
且用分层抽样的方法抽取一个容量为的样本,
所以型号产品被抽的抽样比为:,
因为型号产品有件,所以,解得.
故选:B.
2.(24-25高一上·全国·单元测试)①一次数学考试中,某班有12人的成绩在100分以上,30人的成绩在90~100分,12人的成绩低于90分,现从中抽取9人了解有关考试题目难度的情况;②运动会的工作人员为参加接力赛的6支队伍安排跑道.针对这两件事,恰当的抽样方法分别为( )
A.分层抽样,简单随机抽样 B.简单随机抽样,简单随机抽样
C.简单随机抽样,分层抽样 D.分层抽样,分层抽样
【解题思路】根据分层抽样和简单随机抽样的特点判断即可.
【解答过程】对于①:考试成绩在不同分数段之间的同学有明显的差异,用分层随机抽样比较恰当;
对于②:总体包含的个体较少,用简单随机抽样比较恰当.
故选:A.
3.(2024·河南驻马店·二模)电影《孤注一掷》的上映引发了电信诈骗问题的热议,也加大了各个社区反电信诈骗的宣传力度.已知某社区共有居民480人,其中老年人200人,中年人200人,青少年80人,若按年龄进行分层随机抽样,共抽取36人作为代表,则中年人比青少年多( )
A.6人 B.9人 C.12人 D.18人
【解题思路】根据题意可以计算出分层随机抽样的抽样比例,进而计算出中年人和青年人的人数,进而可以知道中年人比青少年多多少个.
【解答过程】设中年人抽取人,青少年抽取人,由分层随机抽样可知 ,
解得,故中年人比青少年多9人.
故选:B.
4.(2024·福建泉州·模拟预测)从一个含有个个体的总体中抽取一容量为的样本,当选取抽签法、随机数法和分层随机抽样三种不同方法时,总体中每个个体被抽中的概率分别为,三者关系可能是( )
A. B. C. D.
【解题思路】根据抽样的概念,每个个体被抽中的概率是均等的,进而即可选择答案.
【解答过程】因为在抽签法抽样、随机数法抽样和分层随机抽样中,每个个体被抽中的概率均为,
所以.
故选:B.
5.(2024·陕西铜川·模拟预测)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生近视情况形成的原因,采用分层抽样的方法抽取部分学生进行调查,若抽取的小学生人数为70,则抽取的高中生中近视人数为( )
A.10 B.20 C.25 D.40
【解题思路】根据题意,求得抽取的高中生人数是人,再结合图乙可知高中生的近视率为,即可求解.
【解答过程】由图甲可知抽取的高中生人数是,
又由图乙可知高中生的近视率为,所以抽取的高中生中近视人数为人.
故选:B.
6.(2024·云南·二模)本次月考分答题卡的任务由高三16班完成,现从全班55位学生中利用下面的随机数表抽取10位同学参加,将这55位学生按进行编号,假设从随机数表第1行第2个数字开始由左向右依次选取两个数字,重复的跳过,读到行末则从下一行行首继续,则选出来的第6个号码所对应的学生编号为( )
0627 4313 2432 5327 0941 2512 6317 6323 2616 8045 6011
1410 9577 7424 6762 4281 1457 2042 5332 3732 2707 3607
5124 5179 3014 2310 2118 2191 3726 3890 0140 0523 2617
A.51 B.25 C.32 D.12
【解题思路】根据给定信息,利用随机数表抽样法规则,依次写出前6个符合要求的编号即可.
【解答过程】依题意,前6个编号依次为:31,32,43,25,12,51,
所以选出来的第6个号码所对应的学生编号为51.
故选:A.
7.(2024·陕西渭南·模拟预测)在某次高中数学模拟考试中,对800名考生的考试成绩进行统计,得到如图所示的频率分布直方图,其中分组的区间分别为,,,,,.若考生成绩在内的人数为,考生成绩在内的人数为,则( )
A.20 B.10 C.60 D.40
【解题思路】由频率分布直方图求出、,即可得解.
【解答过程】由频率分布直方图可得,,
所以.
故选:D.
8.(2024·全国·模拟预测)已知2015—2022年和2023年1~9月某新能源汽车企业的营业收入(单位:亿元)和净利润(单位:亿元)及2015—2022年营业收入的增长率的统计图如图所示,2023年第二、三、四季度的净利润相比上一季度的增长率均为,则下列结论正确的是( )
A.2015—2022年该企业年营业收入逐年增加
B.2015—2022年该企业年营业收入增长率最大的是2015年
C.2022年该企业年净利润超过2017—2021年年净利润总和
D.2023年第四季度的净利润比第一季度的净利润多约30亿元
【解题思路】根据统计图中的数据分析,结合选项,依次判断即可求解.
【解答过程】选项A:2019年年营业收入低于2018年,故A错误;
选项B:2015—2022年该企业年营业收入增长率最大的是2022年,故B错误;
选项C:2022年该企业年净利润为166.2亿元,2017—2021年年净利润的总和为
(亿元),故C正确;
选项D:设2023年第一季度的净利润为亿元,
由第二、三、四季度的净利润相比上一季度的增长率均为,
得,即,
即2023年第四季度的净利润比第一季度的净利润多21.37亿元,故D错误.
故选:C.
二、多选题
9.(23-24高一下·吉林·阶段练习)某公司生产三种型号的轿车,年产量分别为1500辆、6000辆和2000辆.为检验产品质量,公司质检部门要抽取57辆进行检验,则下列说法正确的是( )
A.应采用分层随机抽样抽取
B.应采用抽签法抽取
C.三种型号的轿车依次应抽取9辆、36辆、12辆
D.这三种型号的轿车,每一辆被抽到的可能性相同
【解题思路】根据分层抽样的概念及计算方法,逐项判定即可求解.
【解答过程】对于A,因为是三种型号的轿车,个体差异明显,所以选择分层随机抽样,所以A正确;
对于B,个体数目多,用抽签法制签难,搅拌不均匀,抽出的样本不具有代表性,所以B错误;
对于C,因为,所以(辆),(辆),(辆),所以三种型号的轿车依次应抽取9辆、36辆、12辆,所以C正确;
对于D,分层随机抽样中,每一个个体被抽到的可能性相同,故选项D正确.
故选:ACD.
10.(2024·黑龙江·三模)在某市初三年级举行的一次体育考试中(满分100分),所有考生成绩均在[50,100]内,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五组,甲、乙两班考生的成绩占比如图所示,则下列说法错误的是( )

A.成绩在[70,80)的考生中,甲班人数多于乙班人数
B.甲班成绩在[80,90)内人数最多
C.乙班成绩在[70,80)内人数最多
D.甲班成绩的极差比乙班成绩的极差小
【解题思路】根据折线统计图逐个分析判断即可.
【解答过程】对于A,由图知,每一组中的成绩占比都是以各自班级的总人数为基数的,
所以每一组中的甲班、乙班人数不能从所占的百分比来判断,故A错误;
对于BC,由图可知甲班成绩主要集中在[80,90),乙班成绩主要集中在[60,70),B正确,C错误;
对于D,由图可知甲班成绩的极差和乙班成绩的极差的大小无法确定,故D错误.
故选:ACD.
11.(2024·辽宁·二模)下图为某市2023年第一季度全市居民人均消费支出构成图.已知城镇居民人均消费支出7924元,与上一年同比增长4.4%;农村居民人均消费支出4388元,与上一年同比增长7.8%,则关于2023年第一季度该市居民人均消费支出,下列说法正确的是( )
A.2023年第一季度该市居民人均消费支出6393元
B.居住及食品烟酒两项的人均消费支出总和超过了总人均消费支出的50%
C.城乡居民人均消费支出的差额与上一年同比在缩小
D.医疗保健与教育文化娱乐两项人均消费支出总和约占总人均消费支出的20.6%
【解题思路】根据消费支出构成图及已知条件分析数据一一判定选项即可.
【解答过程】2023年第一季度全市居民人均消费支出为(元),故A正确;
易知居住及食品烟酒两项的人均消费支出总和为(元),
占总人均消费支出的,故B正确:
依题意可得2022年第一季度城乡居民人均消费支出的差额为(元),
2023年第一季度城乡居民人均消费支出的差额为(元),
由于,故C错误;
医疗保健与教育文化娱乐两项人均消费支出总和占总人均消费支出的,故D正确.
故选:ABD.
三、填空题
12.(2023·山东·一模)为了解某中职学校男生的身体发育情况,对随机抽取的100名男生的身高进行了测量(结果精确到),并绘制了如图所示的频率分布直方图,由图可知,其中身高超过的男生的人数为 64 .

【解题思路】根据频率分布直方图得到身高超过的频率,再乘以样本容量100可得答案.
【解答过程】由频率分布直方图可知,组距为4,由于结果精确到1cm,故后三组身高超过,
身高超过的频率为,
故身高超过的学生人数为.
故答案为:64.
13.(2024·山东泰安·模拟预测)某高中为了了解学生参加数学建模社团的情况,采用了分层随机抽样的方法从三个年级中抽取了300人进行问卷调查,其中高一、高二年级各抽取了90人.已知该校高三年级共有720名学生,则该校共有学生 1800 人.
【解题思路】根据按比例分配的分层随机抽样的特点确定抽样的比例即可求解.
【解答过程】由题意可知从三个年级中抽取的300人进行问卷调查,其中高三有120人,
所以抽取的比例为
设该校共有名学生,可得,
解得人,即该校共有1800名学生.
故答案为:1800.
14.(23-24高一下·黑龙江哈尔滨·期末)二战期间盟军的统计学家主要是将缴获的德军坦克序列号作为样本,用样本估计总体的方法得出德军某月生产的坦克总数.假设德军某月生产的坦克总数是N,缴获的该月生产的n辆坦克编号从小到大为,,…,,即最大编号为,且缴获的坦克是从所生产的坦克中随机获取的,因为生产坦克是连续编号的,所以缴获坦克的编号,,…,,,相当于从中随机抽取的n个整数,这n个数将区间分成个小区间,由于N是未知的,除了最右边的区间外,其他n个区间都是已知的.由于这n个数是随机抽取的,所以可以用前n个区间的平均长度估计所有个区间的平均长度,进而得到N的估计值.例如,缴获坦克的编号是3,5,12,18,20,则统计学家利用上述方法估计德军每月生产的坦克数为 24 .

【解题思路】根据统计学家利用的方法列比例式计算,即可求得答案.
【解答过程】由于用前n个区间的平均长度估计所有个区间的平均长度,
而缴获坦克的编号是3,5,12,18,20,即,
故,
即则统计学家利用上述方法估计德军每月生产的坦克数为24,
故答案为:24.
四、解答题
15.(24-25高一上·全国·课堂例题)有以下两个案例:
案例一:从同一批次同类型号的10袋牛奶中抽取3袋分别检测三聚氰胺的含量;
案例二:某公司有员工800人,其中具有高级职称的有160人,具有中级职称的有320人,具有初级职称的有200人,其他人员120人,从中抽取容量为40的样本,了解他们的收入情况.
(1)你认为这两个案例分别应采用怎样的抽样方式较为合适?
(2)在你使用的分层抽样案例中写出抽样过程.
【解题思路】(1)由分层抽样和简单随机抽样的定义即可得出答案;
(2)按照分层、确定抽样比、确定各层样本数、按简单随机抽样方式在各层确定相应的样本、汇总构成一个容量为40的样本的过程求解即可.
【解答过程】(1)案例一用简单随机抽样,案例二用分层抽样.
(2)①分层,将总体分为具有高级职称、中级职称、初级职称及其他人员四层;
②确定抽样比;
③按抽样比确定各层应分别抽取的人数为8,16,10,6;
④按简单随机抽样的方法在各层确定相应的样本;
⑤汇总构成一个容量为40的样本.
16.(2024·全国·模拟预测)以“建设包容、普惠、有韧性的数字世界——携手构建网络空间命运共同体”为主题的2023年世界互联网大会乌镇峰会于11月8日至10日在中国浙江省乌镇举行.为保障大会顺利进行,世界互联网大会的秘书处从招募的志愿者中随机抽取100名进行了一次互联网知识竞赛,所得成绩(单位:分)均在内,并制成如下频数分布表:
成绩/分
频数 8 28 20 12
(1)根据频数分布表,在下图中作出频率分布直方图;

(2)以样本估计总体,记竞赛成绩不低于86分的志愿者为优秀志愿者,则优秀志愿者的占比能否达到20%?
【解题思路】(1)先求出n值,再确定每组的频率再画图即可;
(2)计算出不低于86分的志愿者的频率即可求解.
【解答过程】(1),
不同成绩对应的频率如下表:
成绩/分
频数 8 28 32 20 12
频率 0.08 0.28 0.32 0.20 0.12
作出频率分布直方图如图所示:

(2)在随机抽取的100名志愿者中,不低于86分的志愿者的频率为,故优秀志愿者的占比能达到20%.
17.(2024·广西柳州·一模)根据国家工信部关于全面推行中国特色企业新型学徒制,加强技能人才培养的通知,我区明确面向各类企业全面推行企业新型学徒制培训,深化产教融合,校企合作,学徒培养目标以符合企业岗位需要的中,高级技术工人.2020年度某企业共需要学徒制培训200人,培训结束后进行考核,现对考核后取得相应岗位证书进行统计,统计情况如下表:
岗位证书 初级工 中级工 高级工 技师 高级技师
人数 20 60 60 40 20
(1)现从这200人中采用分层抽样的方式选出10人组成学习技能经验交流团,求交流团中取得技师类(包含技师和高级技师)岗位证书的人数.
(2)为了鼓励企业员工参加培训,该企业在2021年出台了如下培训奖励措施.
取得岗位证书 初级工 中级工 高级工 技师 高级技师
奖励金额(元/人) 0 500 600 800 1000
以2020年度培训取得各岗位证书的频率来估计2021年的培训考核结果,若该企业在2021年度培训共400人,请估计该企业2021年度共需支付多少奖金?
【解题思路】(1)依题意可以求出分层随机抽样的比例,进而可以求得取得技师类岗位证书的人数;
(2)分类讨论,将取得各岗位证书的奖金分别算出来,加起来即可.
【解答过程】(1)技师和高级技师占比为
所以分层抽样的人中有(人)
(2)初级工频率,支付:(元)
中级工频率 ,支付: (元)
高级工频率 ,支付: (元)
技师频率 ,支付: (元)
高级技师频率: ,支付 (元)
加起来需支付费用 (元)
所以估计该企业需支付 元.
18.(23-24高一上·云南保山·开学考试)近几年购物的支付方式日益增多,某数学兴趣小组就此进行了抽样调查.调查结果显示,支付方式有:A微信、B支付宝、C现金、D其他,该小组对某超市一天内购买者的支付方式进行调查统计,得到如下两幅不完整的统计图.

请你根据统计图提供的信息,解答下列问题:
(1)本次一共调查了多少名购买者?
(2)请补全条形统计图;
在扇形统计图中A种支付方式所对应的圆心角为______度.
(3)若该超市这一周内有1600名购买者,请你估计使用A和B两种支付方式的购买者共有多少名?
【解题思路】(1)根据频率即可求解,
(2)根据频率之和即可求解,
(3)根据所占频率即可求解.
【解答过程】(1),即本次一共调查了200名购买者;
(2)D方式支付的有:(人),
A方式支付的有:(人),
补全的条形统计图如图所示,

在扇形统计图中A种支付方式所对应的圆心角为:
(3)(名),
使用A和B两种支付方式的购买者共有928名.
19.(2024·山西太原·三模)在学业测试中,客观题难度的计算公式为,其中为第i题的难度,为答对该题的人数,N为参加测试的总人数.现对某校高三年级240名学生进行一次测试,共5道客观题.测试前根据对学生的了解,预估了每道题的难度,如下表所示:
题号 1 2 3 4 5
考前预估难度 0.9 0.8 0.7 0.6 0.4
测试后,随机抽取了20名学生的答题数据进行统计,结果如下
题号 1 2 3 4 5
实测答对人数 16 16 14 14 8
(1)根据题中数据,估计这240名学生中第5题的实测答对人数;
(2)定义统计量,其中为第i题的实测难度,为第i题的预估难度(i=1,2,…,n).规定:若,则称该次测试的难度预估合理,否则为不合理.试据此判断本次测试的难度预估是否合理.
【解题思路】(1)根据实测答对人数表求得第五题的实测难度,然后估计总体的实测答对人数;
(2)根据图表,分别计算出第1题至第5题的实测难度,求解的值,与0.05比较得出结论.
【解答过程】(1)因为第5题的实测难度为
所以估计这240名学生中第5题的实测答对人数为(人).
(2)根据题干中数据可得:,
故,
.
故本次测试的难度所估合理.
21世纪教育网(www.21cnjy.com)
同课章节目录