第1节 随机抽样、统计图表
[课程标准要求]
1.理解随机抽样的必要性和重要性,了解获取数据的基本途径及相关概念,会用简单随机抽样和分层随机抽样从总体中抽取样本.
2.了解频率分布的意义和作用,会列频率分布表,会画频率分布直方图、折线图、条形图和扇形图,理解它们各自的特点.
1.简单随机抽样
(1)简单随机抽样:分为放回简单随机抽样和不放回简单随机抽样.
(2)简单随机抽样的常用方法:抽签法和随机数法是比较常用的两种方法.
2.分层随机抽样
(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个
体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)分层随机抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层随机抽样.
3.统计图表
(1)常见的统计图表有条形图、扇形图、折线图、频数分布直方图、频率分布直方图等.
(2)频率分布表、频率分布直方图的制作步骤及意义.
1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
2.分层随机抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.
3.频率分布直方图中小长方形的高=.
1.(人教A版必修第二册P224复习参考题9 T1改编)某市市场监管局为了了解饮料的质量,从该市区某超市在售的50种饮料中抽取了30种饮料,对其质量进行了检查,在这个问题中,被抽取的30种饮料是( )
[A] 总体 [B] 个体
[C] 样本 [D] 样本量
2.(苏教版必修第二册P233练习T2改编)如图,某学校共有教师200人,按老年教师、中年教师、青年教师的比例用分层随机抽样的方法从中抽取一个60人的样本,则被抽到的青年教师的人数为( )
[A] 18 [B] 14 [C] 12 [D] 6
3.(多选题)在某市初三年级举行的一次体育考试中(满分100分),所有考生成绩均在[50,100]内,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五组,甲、乙两班考生的成绩占比如图所示,则下列说法错误的是( )
[A] 成绩在[70,80)的考生中,甲班人数多于乙班人数
[B] 甲班成绩在[80,90)内人数最多
[C] 乙班成绩在[70,80)内人数最多
[D] 甲班成绩的极差比乙班成绩的极差小
4.(人教A版必修第二册P198练习T1改编)在某次体育考试中,对800名考生的考试成绩进行统计,得到如图所示的频率分布直方图,其中分组的区间分别为[40,50),[50,60),[60,70),
[70,80),[80,90),[90,100].若考生成绩在[70,80)内的人数为m,考生成绩在[80,100]内的人数为n,则m-n= .
5.(人教A版必修第二册P185练习T3改编)某班级有50名学生参加知识竞赛,本次比赛的平均成绩是92分,如果30名男生的平均成绩为90分,那么20名女生的平均成绩为
分.
考点一 抽样方法
1.下列抽取样本的方式是简单随机抽样的是( )
[A] 从无限多个个体中抽取100个个体作为样本
[B] 不透明的盒子里共有80个零件,从中逐个不放回地抽取5个零件进行质量检验
[C] 从10个球(2个红球,8个白球)中依次取出2个红球
[D] 某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛
2.(2025·河南郑州模拟)某中学高一年级有400人,高二年级有320人,高三年级有280人,若用随机数法在该中学抽取容量为n的样本,每人被抽到的可能性都为0.2,则n等于( )
[A] 80 [B] 160
[C] 200 [D] 280
3.(2025·云南昭通模拟)已知某学院甲、乙、丙三个班级人数分别为40,30,50,学校计划采用按比例分配的分层随机抽样的方法在三个班级中评选先进个人,已知乙班分配到的先进个人名额为6,则这三个班先进个人总人数为( )
[A] 16 [B] 30 [C] 24 [D] 18
4.(2025·广东广州模拟)某校高三(1)班(45人)和高三(2)班(30人)进行比赛,按照比例分配的分层随机抽样的方法从两个班共抽取10名同学,相关统计情况如下:高三(1)班答对题目的平均数为1,方差为1;高三(2)班答对题目的平均数为1.5,方差为0.35,则这10人答对题目的方差为( )
[A] 0.61 [B] 0.675
[C] 0.74 [D] 0.8
(1)在按比例分配的分层随机抽样中,抽样比==.
(2)在分层随机抽样中,如果第一层的样本量为m,平均值为,方差为;第二层的样本量为n,平均值为,方差为,则样本的平均值=(m+n),
样本的方差s2=·[+()2]+·[+()2].
考点二 统计图表
角度1 扇形图、条形图
[例1] (2025·吉林通化模拟)某中学组织三个年级的学生进行党史知识竞赛.经统计,得到前200名学生分布的扇形图[如图(1)]和前200名中高一学生排名分布的频率条形图[如图(2)],则下列命题错误的是( )
[A] 成绩在前200名的学生中,高一人数比高二人数多30
[B] 成绩在第1~50名的学生中,高三最多有32人
[C] 高一学生成绩在第101~150名的人数一定比高三学生成绩在第1~50名的人数多
[D] 成绩在第51~100名的学生中,高二人数比高一人数多
统计图表的主要应用
扇形图 直观描述各类数据占总数的比例
条形图 直观描述不同类别或分组数据的频数和频率
角度2 折线图
[例2] (2025·四川成都模拟)如图是2024年1~12月份品种能源生产当月同比增长率情况变化图,下列说法错误的是( )
[A] 4~7月,原煤及天然气当月同比增长率呈下降趋势
[B] 9~12月,原煤及天然气当月同比增长率总体呈上升趋势
[C] 7月份品种能源生产当月同比增长率最高的是原油加工量同比增长率
[D] 2024年品种能源生产当月同比增长率波动最小的是发电量同比增长率
折线图的主要应用是描述数据随时间的变化趋势.
角度3 频率分布直方图
[例3] (2025·安徽亳州模拟)如图所示为某企业员工年龄(单位:岁)的频率分布直方图,从左到右依次为第一组、第二组、…、第五组,若第五组的员工有80人,则第二组的员工人数为( )
[A] 140 [B] 240
[C] 280 [D] 320
频率分布直方图的相关结论
(1)直方图中各小长方形的面积之和为1.
(2)直方图中纵轴表示,故每组样本的频率为组距×,即矩形的面积.
(3)直方图中每组样本的频数为频率×总数.
[针对训练]
1.(角度1)(多选题)某校为更好地支持学生个性发展,开设了学科拓展类、创新素质类、兴趣爱好类三种类型的校本课程,每名同学从中选择一门课程学习.现对该校6 000名学生的选课情况进行统计,如图(1),并用分层随机抽样的方法从中抽取2%的学生对所选课程进行了满意率调查,如图(2).
则下列说法正确的是( )
[A] 抽取的样本容量为6 000
[B] 该校学生中对兴趣爱好类课程满意的人数约为1 050
[C] 若抽取的学生中对创新素质类课程满意的人数为36,则a=70
[D] 该校学生中选择学科拓展类课程的人数为1 500
2.(角度2)(2025·湖南株洲模拟)如图为某地商品零售总额和餐饮收入总额同比增速情况折线图,根据该图,下列结论正确的是( )
(注:同比,指当前的数据与上一年同期进行比较;环比,指当前数据与上个月的数据进行
比较)
[A] 2025年1~2月份,商品零售总额同比增长9.2%
[B] 2024年3~12月份,餐饮收入总额同比都降低
[C] 2024年6~10月份,商品零售总额同比都增加
[D] 2024年12月,餐饮收入总额环比增速为-14.1%
3.(角度3)(2025·河北唐山模拟)某地发起“寻找绿色合伙人——低碳生活”知识竞赛,共有n人参与比赛,将他们的成绩进行适当分组后(每组为左闭右开的区间),得到如图所示的频率分布直方图,且成绩落在[90,100)的人数为10,则n等于( )
[A] 60 [B] 80
[C] 100 [D] 120
(分值:100分)
选题明细表
知识点、方法 题号
随机抽样 1,2,3,7,8,12,13
统计图表 4,5,6,9,10,11,14,15
单选每题5分,多选每题6分,填空每题5分.
1.(2025·福建泉州模拟)从一个含有N个个体的总体中抽取一容量为n的样本,当选取抽签法、随机数法和分层随机抽样法三种不同方法时,总体中每个个体被抽中的概率分别为p1,p2,p3,三者关系是( )
[A] p1=p2
[C] p1=p32.(2025·江苏南京模拟)某社区为了探讨社区养老模式,将社区内的2 100名老年人、1 900名中年人、1 800名青年人按年龄进行分层,用分层随机抽样方法从中抽取一个容量为580的样本发放调查问卷,如果样本按比例分配,则在老年人中发放的调查问卷份数是( )
[A] 220 [B] 210
[C] 200 [D] 190
3.(2025·黑龙江哈尔滨模拟)在某地区一次市模考试中,三所学校高三年级的参考人数分别为500,800,700.现按比例分配的分层随机抽样法从三所学校高三年级中抽取样本,经计算得三所学校高三年级数学成绩的样本平均数分别为92,105,100,则三所学校学生数学成绩的总平均数约为( )
[A] 101 [B] 100
[C] 99 [D] 98
4.(2025·广东梅州模拟)AQI表示空气质量指数,AQI的数值越小,表明空气质量越好,当AQI的数值不大于100时称空气质量为“优良”.如图是某地3月1日到12日AQI的数值的统计数据,图中点A表示3月1日的AQI的数值为201,则下列叙述不正确的是( )
[A] 这12天中有6天空气质量为“优良”
[B] 这12天中空气质量最好的是3月9日
[C] 从3月9日到12日,空气质量越来越好
[D] 从3月4日到9日,空气质量越来越好
5.(多选题)(2025·广西百色模拟)为丰富优质旅游资源,释放旅游消费潜力,推动旅游业高质量发展,某地政府从今年国庆期间到该地旅游的游客中,随机抽取部分游客进行调查,得到各年龄段游客的人数和对景区服务是否满意的数据,并绘制统计图如图所示,则下列结论正确的是( )
[A] 游客中,青年人是老年人的2倍多
[B] 老年人的满意人数是青年人的2倍
[C] 到该地旅游的游客中满意的中年人占总游客人数的24.5%
[D] 到该地旅游的游客满意人数超过一半
6.去年4月,某地猪肉、鸡蛋、鲜果、禽肉、粮食、食用油、鲜菜价格同比(与前年同期相比)的变化情况如图所示,则下列说法正确的是( )
[A] 猪肉、鸡蛋、鲜果、禽肉、粮食、食用油这6种食品中,食用油价格同比涨幅最小
[B] 猪肉价格同比涨幅超过禽肉价格同比涨幅的5倍
[C] 前年4月鲜菜价格要比去年4月低
[D] 这7种食品价格同比涨幅的平均值超过7%
7.(5分)某高校为了促进学生的全面发展,针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团,已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如表:
项目 大学一年级 大学二年级 大学三年级
泥塑 a b c
剪纸 x y z
其中x∶y∶z=5∶3∶2,且“泥塑”社团的人数占两个社团总人数的.为了了解学生对两个社团活动的满意程度,用比例分配的分层随机抽样的方法从中抽取一个50人的样本进行调查,则应从大学二年级“剪纸”社团的学生中抽取 人.
8.(5分)(2025·广东广州模拟)某研究性学习小组为了了解某校学生参加2024年暑期社会实践的情况,通过简单随机抽样的方法抽取一个容量为100的样本,对学生某一天社会实践时间(单位:分钟)进行统计,制作频率分布直方图如图(每组为左闭右开的区间),再从这100人中用比例分配的分层随机抽样的方法抽取20人,应从[120,130)间抽取人数为b,则b的值为 .
9.(2025·山东菏泽模拟)南丁格尔玫瑰图是由英国统计学家南丁格尔发明的,图中每个扇形圆心角都是相等的,半径长短表示数量大小.某机构统计了近几年某地文化旅游消费用户数量(单位:亿人次),并绘制成南丁格尔玫瑰图(如图所示),根据此图,以下说法错误的是( )
[A] 2017年至2024年,文化旅游消费用户数量逐年增加
[B] 2017年至2024年,文化旅游消费用户数量逐年增加量2020年最多
[C] 2017年至2024年,文化旅游消费用户数量的逐年增加量逐年递增
[D] 2024年文化旅游消费用户数量超过2017年文化旅游消费用户数量的10倍
10.(多选题)(2025·辽宁大连模拟)如图为某市2024年第一季度全市居民人均消费支出构成图.已知城镇居民人均消费支出7 924元,与上一年同比增长4.4%;农村居民人均消费支出4 388元,与上一年同比增长7.8%,则关于2024年第一季度该市居民人均消费支出,下列说法正确的是( )
[A] 2024年第一季度该市居民人均消费支出6 393元
[B] 居住及食品两项的人均消费支出总和超过了总人均消费支出的50%
[C] 城乡居民人均消费支出的差额与上一年同比在缩小
[D] 医疗保健与教育文化娱乐两项人均消费支出总和约占总人均消费支出的20.6%
11.(多选题)某调查机构对我国若干大型科技公司进行调查统计,得到了从事芯片、软件两个行业从业者的年龄分布的饼形图和“90后”从事这两个行业的岗位分布雷达图,则下列说法中一定正确的是( )
[A] 芯片、软件行业从业者中,“90后”占总人数的比例超过50%
[B] 芯片、软件行业中从事技术、设计岗位的“90后”人数超过总人数的25%
[C] 芯片、软件行业从事技术岗位的人中,“90后”比“80后”多
[D] 芯片、软件行业中,“90后”从事市场岗位的人数比“80前”的总人数多
12.(5分)某企业三月中旬生产A,B,C三种产品共3 000件,根据分层随机抽样的结果,企业统计员制作了如下的统计表格:
产品类别 A B C
产品数量/件 1 300
样本容量 130
由于不小心,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是 件.
13.(5分)(2025·湖南张家界模拟)为了解学生的课外阅读情况,某校采用样本量比例分配的分层随机抽样的方法对高中三个年级的学生进行平均每周课外阅读时间(单位:h)的调查,所得样本数据如表:
年级 抽样人数 样本平均数 样本方差
高一 40 5 3.5
高二 30 2
高三 30 3
已知高中三个年级学生的总样本平均数为4.1,总样本方差为3.14,则高二年级学生的样本平均数 = ,高三年级学生的样本方差= .
14.(15分)(2025·河南安阳模拟)某市为了制定合理的节水方案,对居民用水情况进行了调查.经过随机抽样,获得200户居民的年用水量(单位:吨)数据,按[0,10),[10,20),[20,30),
[30,40),[40,50),[50,60),[60,70),[70,80),[80,90]分成九组,制成如图所示的频率分布直方图.
(1)求直方图中t的值;
(2)根据频率分布直方图估计该市60%的居民年用水量不超过m吨,求m的值;
(3)已知该市有100万户居民,规定:每户居民年用水量不超过50吨的正常收费,若超过50吨,则超出的部分每吨收1元水资源改善基金,请估计该市居民每年缴纳的水资源改善基金总数约为多少.(每组数据以所在区间的中点值为代表)
15.(17分)(2025·甘肃白银模拟)某中学新建了学校食堂,每天有近2 000名学生在学校食堂用午餐,午餐开放时间约40分钟,食堂制作了三类餐食,第一类是选餐,学生凭喜好在做好的大约6种菜和主食米饭中任意选购;第二类是套餐,已按配套菜色盛装好,可直接取餐;第三类是面食,如煮面、炒粉等,为了更合理地设置窗口布局,增加学生的用餐满意度,学校在用餐的学生中对就餐选择、各类餐食的平均每份取餐时长以及可接受等待时间进行问卷调查,并得到以下的统计图表.
类别 选餐 套餐 面食
选择人数 50 30 20
平均每份取餐时长/min 2 0.5 1
已知食堂的售饭窗口一共有20个,就餐高峰期时有200名学生在等待就餐.
(1)根据以上的调查统计,如果设置12个选餐窗口,4个套餐窗口,4个面食窗口,就餐高峰期时,假设大家在排队时自动选择较短的队伍等待(即各类餐食的窗口前队伍长度各自相同),问:选择选餐的同学最长等待时间是多少 这能否让80%的同学感到满意(即在可接受等待时长内取到餐)
(2)根据以上的调查统计,从等待时长和公平的角度上考虑,如何设置各类售饭窗口数更合理,并给出你的求解过程.
第1节 随机抽样、统计图表(解析版)
[课程标准要求]
1.理解随机抽样的必要性和重要性,了解获取数据的基本途径及相关概念,会用简单随机抽样和分层随机抽样从总体中抽取样本.
2.了解频率分布的意义和作用,会列频率分布表,会画频率分布直方图、折线图、条形图和扇形图,理解它们各自的特点.
1.简单随机抽样
(1)简单随机抽样:分为放回简单随机抽样和不放回简单随机抽样.
(2)简单随机抽样的常用方法:抽签法和随机数法是比较常用的两种方法.
2.分层随机抽样
(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个
体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)分层随机抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层随机抽样.
3.统计图表
(1)常见的统计图表有条形图、扇形图、折线图、频数分布直方图、频率分布直方图等.
(2)频率分布表、频率分布直方图的制作步骤及意义.
1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
2.分层随机抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.
3.频率分布直方图中小长方形的高=.
1.(人教A版必修第二册P224复习参考题9 T1改编)某市市场监管局为了了解饮料的质量,从该市区某超市在售的50种饮料中抽取了30种饮料,对其质量进行了检查,在这个问题中,被抽取的30种饮料是( )
[A] 总体 [B] 个体
[C] 样本 [D] 样本量
【答案】 C
【解析】 在这个问题中,50种饮料是总体,每一种饮料是个体,被抽取的30种饮料是样本,30是样本量.故选C.
2.(苏教版必修第二册P233练习T2改编)如图,某学校共有教师200人,按老年教师、中年教师、青年教师的比例用分层随机抽样的方法从中抽取一个60人的样本,则被抽到的青年教师的人数为( )
[A] 18 [B] 14 [C] 12 [D] 6
【答案】 A
【解析】 由题意,青年教师所占比例为1-30%-40%=30%,故用分层随机抽样的方法从中抽取一个60人的样本,被抽到的青年教师的人数为60×30%=18.故选A.
3.(多选题)在某市初三年级举行的一次体育考试中(满分100分),所有考生成绩均在[50,100]内,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五组,甲、乙两班考生的成绩占比如图所示,则下列说法错误的是( )
[A] 成绩在[70,80)的考生中,甲班人数多于乙班人数
[B] 甲班成绩在[80,90)内人数最多
[C] 乙班成绩在[70,80)内人数最多
[D] 甲班成绩的极差比乙班成绩的极差小
【答案】 ACD
【解析】 对于A,由题图知,每一组中的成绩占比都是以各自班级的总人数为基数的,所以每一组中的甲班、乙班人数不能从所占的百分比来判断,故A错误;对于B,C,由题图可知甲班成绩主要集中在[80,90),乙班成绩主要集中在[60,70),B正确,C错误;对于D,由题图可知甲班成绩的极差和乙班成绩的极差的大小无法确定,故D错误.故选ACD.
4.(人教A版必修第二册P198练习T1改编)在某次体育考试中,对800名考生的考试成绩进行统计,得到如图所示的频率分布直方图,其中分组的区间分别为[40,50),[50,60),[60,70),
[70,80),[80,90),[90,100].若考生成绩在[70,80)内的人数为m,考生成绩在[80,100]内的人数为n,则m-n= .
【答案】 40
【解析】 由频率分布直方图可得m=800×0.03×10=240,n=800×(0.01+0.015)×10=200,
所以m-n=240-200=40.
5.(人教A版必修第二册P185练习T3改编)某班级有50名学生参加知识竞赛,本次比赛的平均成绩是92分,如果30名男生的平均成绩为90分,那么20名女生的平均成绩为
分.
【答案】 95
【解析】 设20名女生的平均成绩为,则92=×90+·,解得=95.
考点一 抽样方法
1.下列抽取样本的方式是简单随机抽样的是( )
[A] 从无限多个个体中抽取100个个体作为样本
[B] 不透明的盒子里共有80个零件,从中逐个不放回地抽取5个零件进行质量检验
[C] 从10个球(2个红球,8个白球)中依次取出2个红球
[D] 某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛
【答案】 B
【解析】 根据简单随机抽样的定义,从80个零件中逐个不放回地抽取5个零件进行质量检验,满足简单随机抽样的条件,所以B符合题意;其他选项均不满足简单随机抽样的定义.
故选B.
2.(2025·河南郑州模拟)某中学高一年级有400人,高二年级有320人,高三年级有280人,若用随机数法在该中学抽取容量为n的样本,每人被抽到的可能性都为0.2,则n等于( )
[A] 80 [B] 160
[C] 200 [D] 280
【答案】 C
【解析】 由题意可知,=0.2,解得n=200.
故选C.
3.(2025·云南昭通模拟)已知某学院甲、乙、丙三个班级人数分别为40,30,50,学校计划采用按比例分配的分层随机抽样的方法在三个班级中评选先进个人,已知乙班分配到的先进个人名额为6,则这三个班先进个人总人数为( )
[A] 16 [B] 30 [C] 24 [D] 18
【答案】 C
【解析】 甲、乙、丙三个班级人数比为4∶3∶5,由按比例分配的分层随机抽样知,三个班级先进个人名额分别为8,6,10,所以这三个班先进个人总人数为8+6+10=24.故选C.
4.(2025·广东广州模拟)某校高三(1)班(45人)和高三(2)班(30人)进行比赛,按照比例分配的分层随机抽样的方法从两个班共抽取10名同学,相关统计情况如下:高三(1)班答对题目的平均数为1,方差为1;高三(2)班答对题目的平均数为1.5,方差为0.35,则这10人答对题目的方差为( )
[A] 0.61 [B] 0.675
[C] 0.74 [D] 0.8
【答案】 D
【解析】 由按比例分配的分层随机抽样可得高三(1)班抽取的人数为n1=×10=6,高三(2)班抽取的人数为n2=×10=4,于是总的样本平均数为==1.2,所以总的样本方差为s2=×[1+(1-1.2)2]+×[0.35+(1.5-1.2)2]=0.8.故选D.
(1)在按比例分配的分层随机抽样中,抽样比==.
(2)在分层随机抽样中,如果第一层的样本量为m,平均值为,方差为;第二层的样本量为n,平均值为,方差为,则样本的平均值=(m+n),
样本的方差s2=·[+()2]+·[+()2].
考点二 统计图表
角度1 扇形图、条形图
[例1] (2025·吉林通化模拟)某中学组织三个年级的学生进行党史知识竞赛.经统计,得到前200名学生分布的扇形图[如图(1)]和前200名中高一学生排名分布的频率条形图[如图(2)],则下列命题错误的是( )
[A] 成绩在前200名的学生中,高一人数比高二人数多30
[B] 成绩在第1~50名的学生中,高三最多有32人
[C] 高一学生成绩在第101~150名的人数一定比高三学生成绩在第1~50名的人数多
[D] 成绩在第51~100名的学生中,高二人数比高一人数多
【答案】 D
【解析】 由扇形图可知,成绩在前200名的学生中,高一人数比高二人数多200×(45%-30%)=30,A正确;
成绩在第1~50名的学生中,高一人数为200×45%×0.2=18,因此高三最多有32人,B正确;
由条形图知高一学生的成绩在第101~150名的人数为200×45%×0.4=36,而高三的学生成绩在第1~50名的人数最多为32,故高一学生的成绩在第101~150名的人数一定比高三的学生成绩在第1~50名的人数多,C正确;
成绩在第51~100名的学生中,高一人数为200×45%×0.3=27,
高二成绩在第51~100名的人数最多为23,
即成绩在第51~100名的学生中,高一人数一定比高二人数多,D错误.故选D.
统计图表的主要应用
扇形图 直观描述各类数据占总数的比例
条形图 直观描述不同类别或分组数据的频数和频率
角度2 折线图
[例2] (2025·四川成都模拟)如图是2024年1~12月份品种能源生产当月同比增长率情况变化图,下列说法错误的是( )
[A] 4~7月,原煤及天然气当月同比增长率呈下降趋势
[B] 9~12月,原煤及天然气当月同比增长率总体呈上升趋势
[C] 7月份品种能源生产当月同比增长率最高的是原油加工量同比增长率
[D] 2024年品种能源生产当月同比增长率波动最小的是发电量同比增长率
【答案】 D
【解析】 观察题中所给的折线图,可知,
4~7月,原煤及天然气当月同比增长率是下降的,呈下降趋势,所以A项正确;
9~12月,虽然天然气11月比10月偏低,但总体趋势仍为上升的,
所以原煤及天然气当月同比增长率总体呈上升趋势,所以B项正确;
由题图易知,7月份品种能源生产当月同比增长率最高的是原油加工量同比增长率,所以C项正确;
由题图易知,相比发电量,原油的曲线波动幅度更小,所以D项错误.故选D.
折线图的主要应用是描述数据随时间的变化趋势.
角度3 频率分布直方图
[例3] (2025·安徽亳州模拟)如图所示为某企业员工年龄(单位:岁)的频率分布直方图,从左到右依次为第一组、第二组、…、第五组,若第五组的员工有80人,则第二组的员工人数为( )
[A] 140 [B] 240
[C] 280 [D] 320
【答案】 C
【解析】 由已知得5(a+0.06+0.04+0.02+0.01)=1,所以a=0.07,因为第五组的员工人数为80,所以第二组的员工人数为80×=280.故选C.
频率分布直方图的相关结论
(1)直方图中各小长方形的面积之和为1.
(2)直方图中纵轴表示,故每组样本的频率为组距×,即矩形的面积.
(3)直方图中每组样本的频数为频率×总数.
[针对训练]
1.(角度1)(多选题)某校为更好地支持学生个性发展,开设了学科拓展类、创新素质类、兴趣爱好类三种类型的校本课程,每名同学从中选择一门课程学习.现对该校6 000名学生的选课情况进行统计,如图(1),并用分层随机抽样的方法从中抽取2%的学生对所选课程进行了满意率调查,如图(2).
则下列说法正确的是( )
[A] 抽取的样本容量为6 000
[B] 该校学生中对兴趣爱好类课程满意的人数约为1 050
[C] 若抽取的学生中对创新素质类课程满意的人数为36,则a=70
[D] 该校学生中选择学科拓展类课程的人数为1 500
【答案】 BD
【解析】 抽取的样本容量为6 000×2%=120,A选项错误;该校学生中对兴趣爱好类课程满意的人数约为6 000×35%×50%=1 050,B选项正确;若抽取的学生中对创新素质类课程满意的人数为36,则 6 000×2%×40%×a%=36,解得a=75,C选项错误;由扇形图知1-35%-40%=25%,则 6 000×25%=1 500,D选项正确.故选BD.
2.(角度2)(2025·湖南株洲模拟)如图为某地商品零售总额和餐饮收入总额同比增速情况折线图,根据该图,下列结论正确的是( )
(注:同比,指当前的数据与上一年同期进行比较;环比,指当前数据与上个月的数据进行
比较)
[A] 2025年1~2月份,商品零售总额同比增长9.2%
[B] 2024年3~12月份,餐饮收入总额同比都降低
[C] 2024年6~10月份,商品零售总额同比都增加
[D] 2024年12月,餐饮收入总额环比增速为-14.1%
【答案】 C
【解析】 对于A,2025年1~2月份,商品零售总额同比增长2.9%,A错误;
对于B,2024年8月份,餐饮收入总额同比增加,B错误;
对于C,2024年6~10月份,商品零售总额同比都增加,C正确;
对于D,2024年12月,餐饮收入总额环比增速并未告知,D错误.故选C.
3.(角度3)(2025·河北唐山模拟)某地发起“寻找绿色合伙人——低碳生活”知识竞赛,共有n人参与比赛,将他们的成绩进行适当分组后(每组为左闭右开的区间),得到如图所示的频率分布直方图,且成绩落在[90,100)的人数为10,则n等于( )
[A] 60 [B] 80
[C] 100 [D] 120
【答案】 C
【解析】 由题图可知,10×(0.006+0.012+0.02+0.032+0.02+m)=1,解得m=0.01,则成绩在[90,100)的频率为0.1,由0.1n=10,得n=100.故选C.
(分值:100分)
选题明细表
知识点、方法 题号
随机抽样 1,2,3,7,8,12,13
统计图表 4,5,6,9,10,11,14,15
单选每题5分,多选每题6分,填空每题5分.
1.(2025·福建泉州模拟)从一个含有N个个体的总体中抽取一容量为n的样本,当选取抽签法、随机数法和分层随机抽样法三种不同方法时,总体中每个个体被抽中的概率分别为p1,p2,p3,三者关系是( )
[A] p1=p2[C] p1=p3【答案】 B
【解析】 因为在抽签法、随机数法和分层随机抽样法中,每个个体被抽中的概率均为,所以p1=p2=p3.故选B.
2.(2025·江苏南京模拟)某社区为了探讨社区养老模式,将社区内的2 100名老年人、1 900名中年人、1 800名青年人按年龄进行分层,用分层随机抽样方法从中抽取一个容量为580的样本发放调查问卷,如果样本按比例分配,则在老年人中发放的调查问卷份数是( )
[A] 220 [B] 210
[C] 200 [D] 190
【答案】 B
【解析】 设在老年人中发放的调查问卷份数为x,
依题意,=,解得x=210,
所以在老年人中发放的调查问卷份数是210.故选B.
3.(2025·黑龙江哈尔滨模拟)在某地区一次市模考试中,三所学校高三年级的参考人数分别为500,800,700.现按比例分配的分层随机抽样法从三所学校高三年级中抽取样本,经计算得三所学校高三年级数学成绩的样本平均数分别为92,105,100,则三所学校学生数学成绩的总平均数约为( )
[A] 101 [B] 100
[C] 99 [D] 98
【答案】 B
【解析】 由题意得参考总人数为500+700+800=2 000,故三所学校高三学生数学成绩的总平均数约为×92+×100+×105=100.故选B.
4.(2025·广东梅州模拟)AQI表示空气质量指数,AQI的数值越小,表明空气质量越好,当AQI的数值不大于100时称空气质量为“优良”.如图是某地3月1日到12日AQI的数值的统计数据,图中点A表示3月1日的AQI的数值为201,则下列叙述不正确的是( )
[A] 这12天中有6天空气质量为“优良”
[B] 这12天中空气质量最好的是3月9日
[C] 从3月9日到12日,空气质量越来越好
[D] 从3月4日到9日,空气质量越来越好
【答案】 C
【解析】 对于A,由3月1日到12日AQI数值的统计数据,AQI数值不大于100的有95,85,77,67,72,92共6天,故A正确;
对于B,3月9日的AQI数值为67,为12天来的最小值,故B正确;
对于C,从3月9日到12日,AQI数值逐渐变大,说明空气质量越来越差,故C错误;
对于D,从3月4日到9日,AQI数值逐渐变小,说明空气质量越来越好,故D正确.故选C.
5.(多选题)(2025·广西百色模拟)为丰富优质旅游资源,释放旅游消费潜力,推动旅游业高质量发展,某地政府从今年国庆期间到该地旅游的游客中,随机抽取部分游客进行调查,得到各年龄段游客的人数和对景区服务是否满意的数据,并绘制统计图如图所示,则下列结论正确的是( )
[A] 游客中,青年人是老年人的2倍多
[B] 老年人的满意人数是青年人的2倍
[C] 到该地旅游的游客中满意的中年人占总游客人数的24.5%
[D] 到该地旅游的游客满意人数超过一半
【答案】 ACD
【解析】 由扇形统计图可知青年人占比45%,是老年人占比20%的2倍多,故A正确;
满意的青年人占总人数的0.45×0.4×100%=18%,满意的中年人占总人数的0.35×0.7×100%=24.5%,满意的老年人占总人数的0.2×0.8×100%=16%,故B错误,C正确;
总满意率为18%+24.5%+16%=58.5%>50%,故D正确.故选ACD.
6.去年4月,某地猪肉、鸡蛋、鲜果、禽肉、粮食、食用油、鲜菜价格同比(与前年同期相比)的变化情况如图所示,则下列说法正确的是( )
[A] 猪肉、鸡蛋、鲜果、禽肉、粮食、食用油这6种食品中,食用油价格同比涨幅最小
[B] 猪肉价格同比涨幅超过禽肉价格同比涨幅的5倍
[C] 前年4月鲜菜价格要比去年4月低
[D] 这7种食品价格同比涨幅的平均值超过7%
【答案】 D
【解析】 对于A,由题图可知,猪肉、鸡蛋、鲜果、禽肉、粮食、食用油这6种食品中,粮食价格同比涨幅最小,所以A错误;
对于B,因为34.4%<5×8.5%,所以B错误;
对于C,前年4月鲜菜价格要比去年4月高,所以C错误;
对于D,因为×(-21.2%+7.6%+3%+8.5%+9.6%+10.4%+34.4%)≈7.47%>7%,所以D正确.
故选D.
7.(5分)某高校为了促进学生的全面发展,针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团,已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如表:
项目 大学一年级 大学二年级 大学三年级
泥塑 a b c
剪纸 x y z
其中x∶y∶z=5∶3∶2,且“泥塑”社团的人数占两个社团总人数的.为了了解学生对两个社团活动的满意程度,用比例分配的分层随机抽样的方法从中抽取一个50人的样本进行调查,则应从大学二年级“剪纸”社团的学生中抽取 人.
【答案】 6
【解析】 因为“泥塑”社团的人数占总人数的,故“剪纸”社团的人数占总人数的,所以抽取的50人的样本中,“剪纸”社团中的人数为50×=20.又因为“剪纸”社团中大学二年级人数所占比例为==,所以应从大学二年级“剪纸”社团的学生中抽取的人数为20×=6.
8.(5分)(2025·广东广州模拟)某研究性学习小组为了了解某校学生参加2024年暑期社会实践的情况,通过简单随机抽样的方法抽取一个容量为100的样本,对学生某一天社会实践时间(单位:分钟)进行统计,制作频率分布直方图如图(每组为左闭右开的区间),再从这100人中用比例分配的分层随机抽样的方法抽取20人,应从[120,130)间抽取人数为b,则b的值为 .
【答案】 6
【解析】 由题得10×(0.005+0.035+a+0.020+0.010)=1,所以a=0.030.
在[120,130)之间的学生有100×10×0.030=30(人),再从这100人中用比例分配的分层随机抽样的方法抽取20人,应从[120,130)间抽取人数为×30=6,故 b=6.
9.(2025·山东菏泽模拟)南丁格尔玫瑰图是由英国统计学家南丁格尔发明的,图中每个扇形圆心角都是相等的,半径长短表示数量大小.某机构统计了近几年某地文化旅游消费用户数量(单位:亿人次),并绘制成南丁格尔玫瑰图(如图所示),根据此图,以下说法错误的是( )
[A] 2017年至2024年,文化旅游消费用户数量逐年增加
[B] 2017年至2024年,文化旅游消费用户数量逐年增加量2020年最多
[C] 2017年至2024年,文化旅游消费用户数量的逐年增加量逐年递增
[D] 2024年文化旅游消费用户数量超过2017年文化旅游消费用户数量的10倍
【答案】 C
【解析】 对于A,由题图可知,2017年至2024年,文化旅游消费用户数量逐年增加,
故A正确;
对于B和C,文化旅游消费用户数量的逐年增加量分别为2018年,0.96-0.48=0.48;
2019年,1.88-0.96=0.92;
2020年,2.95-1.88=1.07;
2021年,3.56-2.95=0.61;
2022年,4.15-3.56=0.59;
2023年,4.77-4.15=0.62;
2024年,5.27-4.77=0.5;
则文化旅游消费用户数量逐年增加量2020年最多,文化旅游消费用户数量的逐年增加量不是逐年递增,故B正确,C错误;
对于D,由5.27>10×0.48,则2024年文化旅游消费用户数量超过2017年文化旅游消费用户数量的10倍,故D正确.故选C.
10.(多选题)(2025·辽宁大连模拟)如图为某市2024年第一季度全市居民人均消费支出构成图.已知城镇居民人均消费支出7 924元,与上一年同比增长4.4%;农村居民人均消费支出4 388元,与上一年同比增长7.8%,则关于2024年第一季度该市居民人均消费支出,下列说法正确的是( )
[A] 2024年第一季度该市居民人均消费支出6 393元
[B] 居住及食品两项的人均消费支出总和超过了总人均消费支出的50%
[C] 城乡居民人均消费支出的差额与上一年同比在缩小
[D] 医疗保健与教育文化娱乐两项人均消费支出总和约占总人均消费支出的20.6%
【答案】 ABD
【解析】 2024年第一季度该市居民人均消费支出为2 084+453+1 435+356+791+583+
528+163=6 393(元),故A正确;
易知居住及食品两项的人均消费支出总和为2 084+1 435=3 519(元),占总人均消费支出的×100%≈55.0%>50%,故B正确;
依题意可得2023年第一季度城乡居民人均消费支出的差额为≈3 520(元),
2024年第一季度城乡居民人均消费支出的差额为7 924-4 388=3 536(元),
由于3 520<3 536,故C错误;
医疗保健与教育文化娱乐两项人均消费支出总和占总人均消费支出的×100%≈
20.6%,故D正确.故选ABD.
11.(多选题)某调查机构对我国若干大型科技公司进行调查统计,得到了从事芯片、软件两个行业从业者的年龄分布的饼形图和“90后”从事这两个行业的岗位分布雷达图,则下列说法中一定正确的是( )
[A] 芯片、软件行业从业者中,“90后”占总人数的比例超过50%
[B] 芯片、软件行业中从事技术、设计岗位的“90后”人数超过总人数的25%
[C] 芯片、软件行业从事技术岗位的人中,“90后”比“80后”多
[D] 芯片、软件行业中,“90后”从事市场岗位的人数比“80前”的总人数多
【答案】 ABD
【解析】 A选项,从饼形图可看出芯片、软件行业从业者中,“90后”占总人数的比例为55%,超过50%,A正确;
B选项,芯片、软件行业中从事技术、设计岗位的“90后”人数比例为55%×(37%+13%)=
27.5%,超过总人数的25%,B正确;
C选项,芯片、软件行业从事技术岗位的人中,“90后”人数占比为55%×37%=20.35%,芯片、软件行业从业者中“80后”占总人数的40%,但不知道从事技术岗位的比例,故无法确定两者人数的多少,C错误;
D选项,芯片、软件行业中,“90后”从事市场岗位的人数占比为55%×14%=7.7%,“80前”占总人数的5%,故D正确.故选ABD.
12.(5分)某企业三月中旬生产A,B,C三种产品共3 000件,根据分层随机抽样的结果,企业统计员制作了如下的统计表格:
产品类别 A B C
产品数量/件 1 300
样本容量 130
由于不小心,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是 件.
【答案】 800
【解析】 设样本容量为x,则×1 300=130,所以x=300.
所以A产品和C产品在样本中共有300-130=170(件).
设C产品的样本容量为y,则y+y+10=170,所以y=80.
所以C产品的数量为×80=800(件).
13.(5分)(2025·湖南张家界模拟)为了解学生的课外阅读情况,某校采用样本量比例分配的分层随机抽样的方法对高中三个年级的学生进行平均每周课外阅读时间(单位:h)的调查,所得样本数据如表:
年级 抽样人数 样本平均数 样本方差
高一 40 5 3.5
高二 30 2
高三 30 3
已知高中三个年级学生的总样本平均数为4.1,总样本方差为3.14,则高二年级学生的样本平均数 = ,高三年级学生的样本方差= .
【答案】 4 1.5
【解析】 由高中三个年级学生的总样本平均数为4.1,
可得=4.1,解得=4;因为总样本方差为3.14,所以×[3.5+(5-4.1)2]+×
[2+(4-4.1)2]+×[+(3-4.1)2]=3.14,解得=1.5.
14.(15分)(2025·河南安阳模拟)某市为了制定合理的节水方案,对居民用水情况进行了调查.经过随机抽样,获得200户居民的年用水量(单位:吨)数据,按[0,10),[10,20),[20,30),
[30,40),[40,50),[50,60),[60,70),[70,80),[80,90]分成九组,制成如图所示的频率分布直方图.
(1)求直方图中t的值;
(2)根据频率分布直方图估计该市60%的居民年用水量不超过m吨,求m的值;
(3)已知该市有100万户居民,规定:每户居民年用水量不超过50吨的正常收费,若超过50吨,则超出的部分每吨收1元水资源改善基金,请估计该市居民每年缴纳的水资源改善基金总数约为多少.(每组数据以所在区间的中点值为代表)
【解】 (1)由频率分布直方图得10×(0.003+0.008+0.022+0.024+0.007+0.003+0.003+2t)=1,解得t=0.015.
(2)在200户居民年用水量频率分布直方图中,前5组频率之和为0.03+0.08+0.15+0.22+0.24=0.72,前4组频率之和为0.03+0.08+0.15+0.22=0.48,
所以40≤m<50,由=,解得m=45.
(3)由题可知区间[50,60),[60,70),[70,80),[80,90]内的居民年用水量分别取55,65,75,85为代表,则他们的年用水量分别超出5吨,15吨,25吨,35吨,则106×(0.15×5+0.07×15+0.03×25+
0.03×35)=3.6×106(元),所以估计该市居民每年缴纳的水资源改善基金总数约为3.6×106元.
15.(17分)(2025·甘肃白银模拟)某中学新建了学校食堂,每天有近2 000名学生在学校食堂用午餐,午餐开放时间约40分钟,食堂制作了三类餐食,第一类是选餐,学生凭喜好在做好的大约6种菜和主食米饭中任意选购;第二类是套餐,已按配套菜色盛装好,可直接取餐;第三类是面食,如煮面、炒粉等,为了更合理地设置窗口布局,增加学生的用餐满意度,学校在用餐的学生中对就餐选择、各类餐食的平均每份取餐时长以及可接受等待时间进行问卷调查,并得到以下的统计图表.
类别 选餐 套餐 面食
选择人数 50 30 20
平均每份取餐时长/min 2 0.5 1
已知食堂的售饭窗口一共有20个,就餐高峰期时有200名学生在等待就餐.
(1)根据以上的调查统计,如果设置12个选餐窗口,4个套餐窗口,4个面食窗口,就餐高峰期时,假设大家在排队时自动选择较短的队伍等待(即各类餐食的窗口前队伍长度各自相同),问:选择选餐的同学最长等待时间是多少 这能否让80%的同学感到满意(即在可接受等待时长内取到餐)
(2)根据以上的调查统计,从等待时长和公平的角度上考虑,如何设置各类售饭窗口数更合理,并给出你的求解过程.
【解】 (1)由题意得,就餐高峰期时选择选餐的总人数为200×=100;
这100人平均分布在12个选餐窗口,平均每个窗口等待就餐的人数为≈9,
所以选择选餐同学的最长等待时间为2×9=18(min),
由可接受等待时长的频率分布直方图可知,分组为[5,10),[10,15),[15,20),[20,25]的频率分别为0.15,0.45,0.35,0.05,
所以可接受等待时长在15分钟以上的同学占(0.05+0.35)×100%=40%<80%,
故设置12个选餐窗口,4个套餐窗口,4个面食窗口,不能让80%的同学感到满意.
(2)假设设置m个选餐窗口,n个套餐窗口,k个面食窗口,则各队伍的同学最长等待时间
如下,
类别 选餐 套餐 面食
高峰期就餐总人数 100 60 40
各队伍长度/人
最长等待时间/min 2× 0.5× 1×
依题意,从等待时长和公平的角度上考虑,则要求每个队伍的最长等待时间大致相同,
即得2×=0.5×=1×,即有m∶n∶k=20∶3∶4,
而m+n+k=20,故m≈15,n≈2,k≈3,
因此建议设置选餐、套餐、面食三个类别的窗口数分别为15,2,3.
(
第
11
页
)(共86张PPT)
第1节 随机抽样、统计图表
第九章 统计、成对数据的统计分析
1.理解随机抽样的必要性和重要性,了解获取数据的基本途径及相关概念,会用简单随机抽样和分层随机抽样从总体中抽取样本.
2.了解频率分布的意义和作用,会列频率分布表,会画频率分布直方图、折线图、条形图和扇形图,理解它们各自的特点.
[课程标准要求]
必备知识
课前回顾
知识梳理
1.简单随机抽样
(1)简单随机抽样:分为放回简单随机抽样和不放回简单随机抽样.
(2)简单随机抽样的常用方法: 和随机数法是比较常用的两种方法.
抽签法
知识梳理
2.分层随机抽样
(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行
抽样,再把所有子总体中抽取的样本 作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
简单随机
合在一起
知识梳理
(2)分层随机抽样的应用范围:当总体是由 的几个部分组成时,往往选用分层随机抽样.
3.统计图表
(1)常见的统计图表有条形图、扇形图、折线图、频数分布直方图、频率分布直方图等.
差异明显
(2)频率分布表、频率分布直方图的制作步骤及意义.
知识梳理
重要结论
1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
2.分层随机抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.
对点自测
1.(人教A版必修第二册P224复习参考题9 T1改编)某市市场监管局为了了解饮料的质量,从该市区某超市在售的50种饮料中抽取了30种饮料,对其质量进行了检查,在这个问题中,被抽取的30种饮料是( )
[A] 总体 [B] 个体
[C] 样本 [D] 样本量
C
对点自测
【解析】在这个问题中,50种饮料是总体,每一种饮料是个体,被抽取的30种饮料是样本,30是样本量.故选C.
对点自测
2.(苏教版必修第二册P233练习T2改编)如图,某学校共有教师200人,按老年教师、中年教师、青年教师的比例用分层随机抽样的方法从中抽取一个
60人的样本,则被抽到的青年教师的人数为( )
[A] 18 [B] 14
[C] 12 [D] 6
A
对点自测
【解析】 由题意,青年教师所占比例为1-30%-40%=30%,故用分层随机抽样的方法从中抽取一个60人的样本,被抽到的青年教师的人数为60×30%=18.故选A.
对点自测
3.(多选题)在某市初三年级举行的一次体育考试中(满分100分),所有考生成绩均在[50,100]内,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五组,甲、乙两班考生的成绩占比如图所示,则下列说法错误的是( )
[A] 成绩在[70,80)的考生中,甲班人数多于乙班人数
[B] 甲班成绩在[80,90)内人数最多
[C] 乙班成绩在[70,80)内人数最多
[D] 甲班成绩的极差比乙班成绩的极差小
ACD
对点自测
【解析】 对于A,由题图知,每一组中的成绩占比都是以各自班级的总人数为基数的,所以每一组中的甲班、乙班人数不能从所占的百分比来判断,故A错误;对于B,C,由题图可知甲班成绩主要集中在[80,90),乙班成绩主要集中在[60,70),B正确,C错误;对于D,由题图可知甲班成绩的极差和乙班成绩的极差的大小无法确定,故D错误.故选ACD.
对点自测
4.(人教A版必修第二册P198练习T1改编)在某次体育考试中,对800名考生的考试成绩进行统计,得到如图所示的频率分布直方图,其中分组的区间分别为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].若考生成绩在[70,80)内的人数为m,考生成绩在[80,100]内的人数为n,则m-n= .
40
对点自测
【解析】 由频率分布直方图可得m=800×0.03×10=240,n=800×(0.01+
0.015)×10=200,所以m-n=240-200=40.
对点自测
5.(人教A版必修第二册P185练习T3改编)某班级有50名学生参加知识竞赛,本次比赛的平均成绩是92分,如果30名男生的平均成绩为90分,那么20名女生的平均成绩为 分.
95
关键能力
课堂突破
1.下列抽取样本的方式是简单随机抽样的是( )
[A] 从无限多个个体中抽取100个个体作为样本
[B] 不透明的盒子里共有80个零件,从中逐个不放回地抽取5个零件进行质量检验
[C] 从10个球(2个红球,8个白球)中依次取出2个红球
[D] 某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛
考点一 抽样方法
B
【解析】 根据简单随机抽样的定义,从80个零件中逐个不放回地抽取5个零件进行质量检验,满足简单随机抽样的条件,所以B符合题意;其他选项均不满足简单随机抽样的定义.故选B.
2.(2025·河南郑州模拟)某中学高一年级有400人,高二年级有320人,高三年级有280人,若用随机数法在该中学抽取容量为n的样本,每人被抽到的可能性都为0.2,则n等于( )
[A] 80 [B] 160
[C] 200 [D] 280
C
3.(2025·云南昭通模拟)已知某学院甲、乙、丙三个班级人数分别为40,30,50,学校计划采用按比例分配的分层随机抽样的方法在三个班级中评选先进个人,已知乙班分配到的先进个人名额为6,则这三个班先进个人总人数为( )
[A] 16 [B] 30
[C] 24 [D] 18
C
【解析】 甲、乙、丙三个班级人数比为4∶3∶5,由按比例分配的分层随机抽样知,三个班级先进个人名额分别为8,6,10,所以这三个班先进个人总人数为8+6+10=24.故选C.
4.(2025·广东广州模拟)某校高三(1)班(45人)和高三(2)班(30人)进行比赛,按照比例分配的分层随机抽样的方法从两个班共抽取10名同学,相关统计情况如下:高三(1)班答对题目的平均数为1,方差为1;高三(2)班答对题目的平均数为1.5,方差为0.35,则这10人答对题目的方差为( )
[A] 0.61 [B] 0.675
[C] 0.74 [D] 0.8
D
题后悟通
考点二 统计图表
[例1] (2025·吉林通化模拟)某中学组织三个年级的学生进行党史知识竞赛.经统计,得到前200名学生分布的扇形图[如图(1)]和前200名中高一学生排名分布的频率条形图[如图(2)],则下列命题错误的是( )
[A] 成绩在前200名的学生中,高一人数比高二人数多30
[B] 成绩在第1~50名的学生中,高三最多有32人
[C] 高一学生成绩在第101~150名的人数一定比高三学生成绩在第1~50名的人数多
[D] 成绩在第51~100名的学生中,高二人数比高一人数多
D
角度1 扇形图、条形图
【解析】 由扇形图可知,成绩在前200名的学生中,高一人数比高二人数多200×(45%-30%)=30,A正确;
成绩在第1~50名的学生中,高一人数为200×45%×0.2=18,因此高三最多有32人,B正确;
由条形图知高一学生的成绩在第101~150名的人数为200×45%×0.4=36,而高三的学生成绩在第1~50名的人数最多为32,故高一学生的成绩在第101~150名的人数一定比高三的学生成绩在第1~50名的人数多,C正确;
成绩在第51~100名的学生中,高一人数为200×45%×0.3=27,
高二成绩在第51~100名的人数最多为23,
即成绩在第51~100名的学生中,高一人数一定比高二人数多,D错误.故选D.
统计图表的主要应用
解题策略
扇形图 直观描述各类数据占总数的比例
条形图 直观描述不同类别或分组数据的频数和频率
角度2 折线图
[例2] (2025·四川成都模拟)如图是2024年1~12月份品种能源生产当月同比增长率情况变化图,下列说法错误的是( )
[A] 4~7月,原煤及天然气当月同比增长率呈下降趋势
[B] 9~12月,原煤及天然气当月同比增长率总体呈上升趋势
[C] 7月份品种能源生产当月同比增长率最高的是原油加工量同比增长率
[D] 2024年品种能源生产当月同比增长率波动最小的是发电量同比增长率
D
【解析】 观察题中所给的折线图,可知,
4~7月,原煤及天然气当月同比增长率是下降的,呈下降趋势,所以A项正确;
9~12月,虽然天然气11月比10月偏低,但总体趋势仍为上升的,
所以原煤及天然气当月同比增长率总体呈上升趋势,所以B项正确;
由题图易知,7月份品种能源生产当月同比增长率最高的是原油加工量同比增长率,所以C项正确;
由题图易知,相比发电量,原油的曲线波动幅度更小,所以D项错误.故选D.
折线图的主要应用是描述数据随时间的变化趋势.
解题策略
角度3 频率分布直方图
[例3] (2025·安徽亳州模拟)如图所示为某企业员工年龄(单位:岁)的频率分布直方图,从左到右依次为第一组、第二组、…、第五组,若第五组的员工有80人,则第二组的员工人数为( )
[A] 140 [B] 240
[C] 280 [D] 320
C
频率分布直方图的相关结论
(1)直方图中各小长方形的面积之和为1.
解题策略
[针对训练]
1.(角度1)(多选题)某校为更好地支持学生个性发展,开设了学科拓展类、创新素质类、兴趣爱好类三种类型的校本课程,每名同学从中选择一门课程学习.现对该校6 000名学生的选课情况进行统计,如图(1),并用分层随机抽样的方法从中抽取2%的学生对所选课程进行了满意率调查,如图(2).
则下列说法正确的是( )
[A] 抽取的样本容量为6 000
[B] 该校学生中对兴趣爱好类课程满意的人数约为1 050
[C] 若抽取的学生中对创新素质类课程满意的人数为36,则a=70
[D] 该校学生中选择学科拓展类课程的人数为1 500
BD
【解析】 抽取的样本容量为6 000×2%=120,A选项错误;该校学生中对兴趣爱好类课程满意的人数约为6 000×35%×50%=1 050,B选项正确;若抽取的学生中对创新素质类课程满意的人数为36,则 6 000×2%×40%×
a%=36,解得a=75,C选项错误;由扇形图知1-35%-40%=25%,则 6 000×
25%=1 500,D选项正确.故选BD.
2.(角度2)(2025·湖南株洲模拟)如图为某地商品零售总额和餐饮收入总额同比增速情况折线图,根据该图,下列结论正确的是( )
(注:同比,指当前的数据与上一年同期进行比较;环比,指当前数据与上个月的数据进行比较)
[A] 2025年1~2月份,商品零售总额同比增长9.2%
[B] 2024年3~12月份,餐饮收入总额同比都降低
[C] 2024年6~10月份,商品零售总额同比都增加
[D] 2024年12月,餐饮收入总额环比增速为-14.1%
C
【解析】 对于A,2025年1~2月份,商品零售总额同比增长2.9%,A错误;
对于B,2024年8月份,餐饮收入总额同比增加,B错误;
对于C,2024年6~10月份,商品零售总额同比都增加,C正确;
对于D,2024年12月,餐饮收入总额环比增速并未告知,D错误.故选C.
3.(角度3)(2025·河北唐山模拟)某地发起“寻找绿色合伙人——低碳生活”知识竞赛,共有n人参与比赛,将他们的成绩进行适当分组后(每组为左闭右开的区间),得到如图所示的频率分布直方图,且成绩落在[90,100)的人数为10,则n等于( )
[A] 60 [B] 80
[C] 100 [D] 120
C
【解析】由题图可知,10×(0.006+0.012+0.02+0.032+0.02+m)=1,解得m=
0.01,则成绩在[90,100)的频率为0.1,由0.1n=10,得n=100.故选C.
课时作业
(分值:100分)
选题明细表
单选每题5分,多选每题6分,填空每题5分.
知识点、方法 题号
随机抽样 1,2,3,7,8,12,13
统计图表 4,5,6,9,10,11,14,15
1.(2025·福建泉州模拟)从一个含有N个个体的总体中抽取一容量为n的样本,当选取抽签法、随机数法和分层随机抽样法三种不同方法时,总体中每个个体被抽中的概率分别为p1,p2,p3,三者关系是( )
[A] p1=p2[C] p1=p3基础巩固练
B
基础巩固练
2.(2025·江苏南京模拟)某社区为了探讨社区养老模式,将社区内的2 100名老年人、1 900名中年人、1 800名青年人按年龄进行分层,用分层随机抽样方法从中抽取一个容量为580的样本发放调查问卷,如果样本按比例分配,则在老年人中发放的调查问卷份数是( )
[A] 220 [B] 210
[C] 200 [D] 190
B
3.(2025·黑龙江哈尔滨模拟)在某地区一次市模考试中,三所学校高三年级的参考人数分别为500,800,700.现按比例分配的分层随机抽样法从三所学校高三年级中抽取样本,经计算得三所学校高三年级数学成绩的样本平均数分别为92,105,100,则三所学校学生数学成绩的总平均数约为( )
[A] 101 [B] 100
[C] 99 [D] 98
B
4.(2025·广东梅州模拟)AQI表示空气质量指数,AQI的数值越小,表明空气质量越好,当AQI的数值不大于100时称空气质量为“优良”.如图是某地3月1日到12日AQI的数值的统计数据,图中点A表示3月1日的AQI的数值为201,则下列叙述不正确的是( )
[A] 这12天中有6天空气质量为“优良”
[B] 这12天中空气质量最好的是3月9日
[C] 从3月9日到12日,空气质量越来越好
[D] 从3月4日到9日,空气质量越来越好
C
【解析】 对于A,由3月1日到12日AQI数值的统计数据,AQI数值不大于100的有95,85,77,67,72,92共6天,故A正确;
对于B,3月9日的AQI数值为67,为12天来的最小值,故B正确;
对于C,从3月9日到12日,AQI数值逐渐变大,说明空气质量越来越差,故C错误;
对于D,从3月4日到9日,AQI数值逐渐变小,说明空气质量越来越好,故D正确.故选C.
5.(多选题)(2025·广西百色模拟)为丰富优质旅游资源,释放旅游消费潜力,推动旅游业高质量发展,某地政府从今年国庆期间到该地旅游的游客中,随机抽取部分游客进行调查,得到各年龄段游客的人数和对景区服务是否满意的数据,并绘制统计图如图所示,则下列结论正确的是( )
[A] 游客中,青年人是老年人的2倍多
[B] 老年人的满意人数是青年人的2倍
[C] 到该地旅游的游客中满意的中年人占
总游客人数的24.5%
[D] 到该地旅游的游客满意人数超过一半
ACD
【解析】 由扇形统计图可知青年人占比45%,是老年人占比20%的2倍多,故A正确;
满意的青年人占总人数的0.45×0.4×100%=18%,满意的中年人占总人数的0.35×0.7×100%=24.5%,满意的老年人占总人数的0.2×0.8×100%=16%,故B错误,C正确;
总满意率为18%+24.5%+16%=58.5%>50%,故D正确.
故选ACD.
6.去年4月,某地猪肉、鸡蛋、鲜果、禽肉、粮食、食用油、鲜菜价格同比
(与前年同期相比)的变化情况如图所示,则下列说法正确的是( )
[A] 猪肉、鸡蛋、鲜果、禽肉、粮食、食用油这6种食品中,食用油价格同比涨幅最小
[B] 猪肉价格同比涨幅超过禽肉价格同比涨幅的5倍
[C] 前年4月鲜菜价格要比去年4月低
[D] 这7种食品价格同比涨幅的平均值超过7%
D
7.(5分)某高校为了促进学生的全面发展,针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团,已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如表:
项目 大学一年级 大学二年级 大学三年级
泥塑 a b c
剪纸 x y z
6
8.(5分)(2025·广东广州模拟)某研究性学习小组为了了解某校学生参加2024年暑期社会实践的情况,通过简单随机抽样的方法抽取一个容量为100的样本,对学生某一天社会实践时间(单位:分钟)进行统计,制作频率分布直方图如图(每组为左闭右开的区间),再从这100人中用比例分配的分层随机抽样的方法抽取20人,应从[120,130)间抽取人数为b,则b的值为 .
6
综合运用练
9.(2025·山东菏泽模拟)南丁格尔玫瑰图是由英国统计学家南丁格尔发明的,图中每个扇形圆心角都是相等的,半径长短表示数量大小.某机构统计了近几年某地文化旅游消费用户数量(单位:亿人次),并绘制成南丁格尔玫瑰图
(如图所示),根据此图,以下说法错误的是( )
[A] 2017年至2024年,文化旅游消费用户数量逐年增加
[B] 2017年至2024年,文化旅游消费用户数量逐年增加量2020年最多
[C] 2017年至2024年,文化旅游消费用户数量的逐年增加量逐年递增
[D] 2024年文化旅游消费用户数量超过2017年
文化旅游消费用户数量的10倍
C
【解析】 对于A,由题图可知,2017年至2024年,文化旅游消费用户数量逐年增加,
故A正确;
对于B和C,文化旅游消费用户数量的逐年增加量分别为2018年,
0.96-0.48=0.48;
2019年,1.88-0.96=0.92;
2020年,2.95-1.88=1.07;
2021年,3.56-2.95=0.61;
2022年,4.15-3.56=0.59;
2023年,4.77-4.15=0.62;
2024年,5.27-4.77=0.5;
则文化旅游消费用户数量逐年增加量2020年最多,文化旅游消费用户数量的逐年增加量不是逐年递增,故B正确,C错误;
对于D,由5.27>10×0.48,则2024年文化旅游消费用户数量超过2017年文化旅游消费用户数量的10倍,故D正确.故选C.
10.(多选题)(2025·辽宁大连模拟)如图为某市2024年第一季度全市居民人均消费支出构成图.已知城镇居民人均消费支出7 924元,与上一年同比增长4.4%;农村居民人均消费支出4 388元,与上一年同比增长7.8%,则关于2024年第一季度该市居民人均消费支出,下列说法正确的是( )
[A] 2024年第一季度该市居民人均消费支出6 393元
[B] 居住及食品两项的人均消费支出总和超过了总人均消费支出的50%
[C] 城乡居民人均消费支出的差额与上一年同比在缩小
[D] 医疗保健与教育文化娱乐两项人均消费支出总和约占总人均消费支出的20.6%
ABD
11.(多选题)某调查机构对我国若干大型科技公司进行调查统计,得到了从事芯片、软件两个行业从业者的年龄分布的饼形图和“90后”从事这两个行业的岗位分布雷达图,则下列说法中一定正确的是( )
[A] 芯片、软件行业从业者中,“90后”占总人数的比例超过50%
[B] 芯片、软件行业中从事技术、设计岗位的“90后”人数超过总人数的25%
[C] 芯片、软件行业从事技术岗位的人中,“90后”比“80后”多
[D] 芯片、软件行业中,“90后”从事市场岗位的人数比“80前”的总人数多
ABD
【解析】 A选项,从饼形图可看出芯片、软件行业从业者中,“90后”占总人数的比例为55%,超过50%,A正确;
B选项,芯片、软件行业中从事技术、设计岗位的“90后”
人数比例为55%×(37%+13%)=27.5%,超过总人数的25%,B正确;
C选项,芯片、软件行业从事技术岗位的人中,“90后”人数占比为55%×37%=
20.35%,芯片、软件行业从业者中“80后”占总人数的40%,但不知道从事技术岗位的比例,故无法确定两者人数的多少,C错误;
D选项,芯片、软件行业中,“90后”从事市场岗位的人数占比为55%×14%=7.7%,
“80前”占总人数的5%,故D正确.故选ABD.
12.(5分)某企业三月中旬生产A,B,C三种产品共3 000件,根据分层随机抽样的结果,企业统计员制作了如下的统计表格:
产品类别 A B C
产品数量/件 1 300
样本容量 130
由于不小心,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是
件.
800
13.(5分)(2025·湖南张家界模拟)为了解学生的课外阅读情况,某校采用样本量比例分配的分层随机抽样的方法对高中三个年级的学生进行平均每周课外阅读时间(单位:h)的调查,所得样本数据如表:
4
1.5
14.(15分)(2025·河南安阳模拟)某市为了制定合理的节水方案,对居民用水情况进行了调查.经过随机抽样,获得200户居民的年用水量(单位:吨)数据,按[0,10),[10,20),[20,30),[30,40),[40,50),[50,60),[60,70),[70,80),[80,90]分成九组,制成如图所示的频率分布直方图.
(1)求直方图中t的值;
【解】 (1)由频率分布直方图得10×(0.003+0.008+0.022+0.024+0.007+
0.003+0.003+2t)=1,解得t=0.015.
(2)根据频率分布直方图估计该市60%的居民年用水量不超过m吨,求m的值;
(3)已知该市有100万户居民,规定:每户居民年用水量不超过50吨的正常收费,若超过50吨,则超出的部分每吨收1元水资源改善基金,请估计该市居民每年缴纳的水资源改善基金总数约为多少.(每组数据以所在区间的中点值为代表)
【解】 (3)由题可知区间[50,60),[60,70),[70,80),[80,90]内的居民年用水量分别取55,65,75,85为代表,则他们的年用水量分别超出5吨,15吨,25吨,35吨,则106×(0.15×5+0.07×15+0.03×25+0.03×35)=3.6×106(元),所以估计该市居民每年缴纳的水资源改善基金总数约为3.6×106元.
应用创新练
15.(17分)(2025·甘肃白银模拟)某中学新建了学校食堂,每天有近2 000名学生在学校食堂用午餐,午餐开放时间约40分钟,食堂制作了三类餐食,第一类是选餐,学生凭喜好在做好的大约6种菜和主食米饭中任意选购;第二类是套餐,已按配套菜色盛装好,可直接取餐;第三类是面食,如煮面、炒粉等,为了更合理地设置窗口布局,增加学生的用餐满意度,学校在用餐的学生中对就餐选择、各类餐食的平均每份取餐时长以及可接受等待时间进行问卷调查,并得到以下的统计图表.
类别 选餐 套餐 面食
选择人数 50 30 20
平均每份取餐时长/min 2 0.5 1
已知食堂的售饭窗口一共有20个,就餐高峰期时有200名学生在等待就餐.
(1)根据以上的调查统计,如果设置12个选餐窗口,4个套餐窗口,4个面食窗口,就餐高峰期时,假设大家在排队时自动选择较短的队伍等待(即各类餐食的窗口前队伍长度各自相同),问:选择选餐的同学最长等待时间是多少 这能否让80%的同学感到满意(即在可接受等待时长内取到餐)
(2)根据以上的调查统计,从等待时长和公平的角度上考虑,如何设置各类售饭窗口数更合理,并给出你的求解过程.
【解】 (2)假设设置m个选餐窗口,n个套餐窗口,k个面食窗口,则各队伍的同学最长等待时间如下,