专题4.1统计(十一个重难点突破)(含答案)2023-2024学年高一数学重难点突破及混淆易错规避(人教A版2019必修第二册)

文档属性

名称 专题4.1统计(十一个重难点突破)(含答案)2023-2024学年高一数学重难点突破及混淆易错规避(人教A版2019必修第二册)
格式 zip
文件大小 3.3MB
资源类型 试卷
版本资源 人教A版(2019)
科目 数学
更新时间 2024-07-12 09:50:24

文档简介

专题 4.1 统计
知识点 1 抽样
1.统计的相关概念
名称 定义
总体 调查对象的全体称为整体
个体 组成整体的每一个调查对象称为个体
样本 从总体中抽取的那部分个体称为样本
样本容量 样本中包含的个体数称为样本容量
样本与样本量的区别:样本是从总体中抽取的个体组成的集合,是对象;样本量是样本中个体的数目,是
一个数.
二、简单随机抽样
设一个总体含有 N 个个体,从中逐个不放回抽取 n 个个体作为样本( n N ),如果每
定义
次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样
把总体中的 N 个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每
抽签法
方法 次从中抽取一个号签,连续抽取 n 次,就得到一个容量为 n 的样本
随机数法 利用随机数表、随机数骰子或计算机产生的随机数进行抽样
①都属于简单随机抽样,并且要求被抽取样本的总体的个体数有限;
抽签法
相同点
与随机 ②都是从总体中逐个不放回地进行抽取
数法 不同点 ①抽签法比随机数法操作简单;
②随机数法更适用于总体中个体数较多的时候,而抽签法适用于总体中个体数较少的情况
利用随机数法抽取个体时的注意事项:
①定起点:事先应确定以表中的哪个数(哪行哪列)作为起点.
②定方向:读数的方向(向左、向右、向上或向下都可以).
③读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三
位地读取,如果出现重复则跳过,直到取满所需的样本个体数.
三、分层抽样
①定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,
将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
②应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.
注意:分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘以抽样比.
重难点 1 统计有关概念
1.某县教育局为了解本县今年参加大联考的学生的成绩,从 5000 名参加今年大联考的学生中抽取了 250
名学生的成绩进行统计,则下列表述正确的是(  )
A.5000 名学生是总体
B.抽取的 250 名学生的成绩是总体的一个样本
C.样本量是 250 名学生的成绩
D.每一名学生是个体
【答案】B
【详解】对 A,总体指的是 5000 名参加今年大联考的学生的成绩,所以 A 错误;
对 B,样本指的是抽取的 250 名学生的成绩,所以 B 正确;
对 C,样本量是 250,所以 C 错误;
对 D,个体指的是 5000 名学生中的每一名学生的成绩,所以 D 错误.
故选:B.
2.(多选)某市场监管局从所管辖的某超市在售的 40 种冷冻饮品中抽取了 20 种冷冻饮品,对其质量进行
了检查,则(  )
A.该市场监管局的调查方法是全面调查
B.样本容量是超市的 20 种冷冻饮品
C.总体是超市在售的 40 种冷冻饮品的质量
D.样本的个体是抽取的 20 种冷冻饮品中每种冷冻饮品的质量
【答案】CD
【详解】该市场监管局的调查方法是抽样调查,故 A 错误;
样本容量是 20,故 B 错误;
总体是超市在售的 40 种冷冻饮品的质量,故 C 正确;
样本的个体是抽取的 20 种冷冻饮品中每种冷冻饮品的质量,故 D 正确.
故选:CD.
3.(多选)从某年级的 500 名学生中抽取 60 名学生进行体重的统计分析,下列说法正确的是( )
A.500 名学生是总体
B.每名学生是个体
C.学生的体重是变量
D.抽取的 60 名学生的体重是样本容量
【答案】ABC
【详解】由题意可知在简单随机抽样概念中,
500 名学生是总体,每名学生是个体,学生的体重是变量,样本容量为 60.
所以 A,B,C 正确; D 错误.
故选:ABC
4.从一批零件中抽取 10 个零件,测得它们的长度(单位:cm)如下:22.36 22.35 22.33 22.35 
22.37 22.34 22.38 22.36 22.32 22.35
在此统计活动中:
(1)总体为: ;
(2)个体为: ;
(3)样本为: ;
(4)样本量为: .
【答案】 这批零件的长度 每个零件的长度 抽取的 10 个零件的长度 10
【详解】略
5.为了了解参加运动会的 2000 名运动员的年龄情况,从中抽取 20 名运动员的年龄进行统计分析.关于
这个问题,下列说法中正确的是 .
①2000 名运动员是总体;
②每个运动员是个体;
③所抽取的 20 名运动员是一个样本;
④样本量为 20;
⑤可采用随机数法抽样.
【答案】④⑤
【详解】①2000 名运动员不是总体,2000 名运动员的年龄才是总体;②每个运动员的年龄是个体;
③所抽取的 20 名运动员的年龄是一个样本,故①②③均错误,样本容量为 20,
由于数量较多,故可采用随机数表法抽样,
故答案为:④⑤.
6.某市为了调研全市 10800 名高一学生期中考试的答题习惯,共抽取 25 袋答题卡,每袋都装有 30 份答
题卡,则本次抽样的样本量是 .
【答案】750
【详解】样本量指样本中包含的个体数,所以本次抽样的样本量是 25 30 = 750 .
故答案为:750 .
重难点 2 简单随机抽样
7.某中学高一年级有 400 人,高二年级有 320 人,高三年级有 280 人,若用随机数法在该中学抽取容量
为 n 的样本,每人被抽到的可能性都为 0.2,则 n 等于(  )
A.80 B.160 C.200 D.280
【答案】C
n
【详解】由题意可知, = 0.2,解得 n = 200 .
400 + 320 + 280
故选:C
8.某工厂利用随机数表对生产的 50 个零件进行抽样测试,先将 50 个零件进行编号,编号分别为 01,
02,…,50,从中抽取 5 个样本,下面提供随机数表的第 1 行到第 2 行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第 1 行第 9 列开始向右依次读取数据,则得到的第 4 个样本编号是( )
A.50 B.09 C.71 D.20
【答案】B
【详解】依题意,样本编号依次为:14,05,11,09,…,第 4 个样本编号是 09,
故选:B.
9.在简单随机抽样中,下列关于其中一个个体被抽中的可能性说法正确的是(  )
A.与第几次抽样有关,第一次抽到的可能性更大一些
B.与第几次抽样有关,最后一次抽到的可能性更大一些
C.与第几次抽样无关,每次抽到的可能性都相等
D.与第几次抽样有关,第一次抽到的可能性更小一些
【答案】C
【详解】在简单随机抽样中,每个个体每次被抽中的可能性都相等,与第几次抽样无关,A,B,D 错误,
C 正确.
故选:C
10.总体由编号 01,02,…,29,30 的 30 个个体组成.利用下面的随机数表选取 6 个个体,选取方法是
从如下随机数表的第 1 行的第 6 列和第 7 列数字开始由左到右依次选取两个数字,则选出来的第 5 个个体
的编号为( )
第 1 行 78 16 62 32 08 02 62 42 62 52 53 69 97 28 01 98
第 2 行 32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
A.19 B.25 C.26 D.24
【答案】B
【详解】依题意,按照要求选取的个体编号依次为:23,20,26,24,25,19,
所以选出来的第 5 个个体的编号为 25.
故选:B
11.某单位有职工 450 人,其中男职工 150 人,现为了解职工健康情况,该单位采取分层随机抽样的方法
抽取了一个容量为 90 的样本,得出体重情况:男性平均体重为 63 千克;女性平均体重为 54 千克.则下列
说法不正确的是( )
A.抽查的样本中女职工人数为 60
B.该单位男职工的体重普遍比女职工较重
C.估计该单位职工平均体重为 58.5
1
D.每一位男或女职工被抽中的可能性均为
5
【答案】C
450 -150
【详解】A 选项,抽查的样本中女职工人数为90 = 60 ,A 选项正确.
450
B 选项,男性平均体重为 63 千克;女性平均体重为 54 千克,
所以该单位男职工的体重普遍比女职工较重,B 选项正确.
150 63 450 -150C 选项,估计该单位职工平均体重为 + 54 = 57,C 选项错误.
450 450
90 1
D 选项,每一位男或女职工被抽中的可能性均为 = ,D 选项正确.
450 5
故选:C
12.某乡镇有居民 20000 户,从中随机抽取 200 户调查是否安装宽带网线,调查结果如表所示,则该乡镇
已安装宽带网线的居民大约有 户.
网线 动迁户 原住户
已安装 65 30
未安装 40 65
【答案】9500
【详解】 20000
65 + 30
= 9500 (户).
200
故答案为:9500.
重难点 3 分层抽样
13.为了保证采用分层随机抽样方法时每个个体被等可能地抽取,必须要求( )
A.每层等可能抽取
B.每层抽取的个体数相等
n
C.每层抽取的比例为 (其中 n 为抽取的样本容量,N 是总体容量)
N
D.只要抽取的样本容量一定,每层抽取的个体数没有限制
【答案】C
【详解】分层随机抽样时,在各层中按层中所含个体在总体中所占的比例进行抽样,
A 中,虽然每层等可能地抽样,但是没有指明各层中应抽取几个个体,故 A 不正确;
B 中,由于每层的个体数不一定相等,每层抽取同样多的个体数,
显然从总体来看,各层的个体被抽取的可能性就不相等了,因此 B 也不正确;
C 中,按照这个比例抽取,对于每个个体来说,被抽取为样本的可能性是相同的,故 C 正确;
D 显然不正确.
故选:C.
14.中国农历的“二十四节气”是凝结着中华民族的智慧与传统文化的结晶.某小学一年级随机抽查 100 名
学生并提问“二十四节气歌”,只能说出两句的有 32 人,能说出三句或三句以上的有 45 人,据此估计该校
一年级的 400 名学生中对“二十四节气歌”只能说出一句或一句也说不出的人数为(  )
A.23 B.92
C.128 D.180
【答案】B
【详解】由题意,100 名学生中只能说出一句或一句也说不出的人数为 100-32-45=23,
23
在样本中的频率为 ,
100
23
故该校一年级的 400 名学生中对“二十四节气歌”只能说出一句或一句也说不出的人数约为 ×400=92.
100
故选:B.
15.随着老龄化时代的到来,某社区为了探讨社区养老模式,在社区内对 2400 名老年人、2400 名中年人、
2100 名青年人用分层抽样方法随机发放了调查问卷 345 份,则在老年人中发放的调查问卷份数是( )
A.110 B.115 C.120 D.125
【答案】C
【详解】设在老年人中发放的调查问卷份数为 x,
x 345
则 = ,
2400 2400 + 2400 + 2100
解得 x =120 .
所以在老年人中发放的调查问卷份数是120 .
故选:C.
16.某校高二年级有学生 1400 人,其中女生 714 人,用分层抽样方法抽取容量为 100 的一个样本,则所
抽男生人数是( )
A.52 B.51 C.49 D.48
【答案】C
100 1400 - 714【详解】根据男女生人数情况可得所抽男生人数是 = 49 .
1400
故选:C.
17.某大学共有教师 1000 人,其中教授、副教授、讲师、助教的人数比为 1:4:3:2,现用分层抽样的
方法从全校所有教师中抽取一个容量为 40 的样本,讲师应抽取的人数为 .
【答案】12
3
【详解】由分层抽样得到讲师应抽取的人数为 40 =12 .
1+ 4 + 3 + 2
故答案为:12
18.某校有高一学生 n名,其中男生数与女生数之比为6 : 5,为了解学生的视力情况,现要求按分层抽样
n
的方法抽取一个样本容量为 的样本,若样本中男生比女生多12人,则 n = .
10
【答案】1320
6 5 n
【详解】依题意可得 - ÷ =12,解得 n =1320 .
è11 11 10
故答案为 1320
【点睛】本题主要考查分层抽样,意在考查学生对这些知识的理解掌握水平和分析推理能力.
19.某高级中学共有学生 3 000 名,各年级男、女生的人数如表:
高一年级 高二年级 高三年级
女生 487 x y
男生 513 560 z
已知高二年级女生比高一年级女生多 53 人.
(1)高二年级有多少名女生?
(2)现对各年级用比例分配的分层随机抽样的方法从全校抽取 300名学生,应从高三年级抽取多少名学生?
【答案】(1)540 名
(2)90 名
【详解】(1)由 x - 487 = 53,解得 x = 540 ,
所以高二年级有540名女生.
(2)高三年级人数为 y + z = 3000 - 487 + 513 + 560 + 540 = 900,
900
所以 300 = 90,
3000
故应从高三年级抽取 90 名学生.
重难点 4 抽样的合理选择
20.现须完成下列 2 项抽样调查:①从 12 瓶饮料中抽取 4 瓶进行食品卫生检查;②某生活小区共有 540
名居民,其中年龄不超过 30 岁的有 180 人,年龄在超过 30 岁不超过 60 岁的有 270 人,60 岁以上的有 90
人,为了解居民对社区环境绿化方面的意见,拟抽取一个容量为 30 的样本.较为合理的抽样方法分别为
( )
A.①抽签法,②分层随机抽样 B.①随机数法,②分层随机抽样
C.①随机数法,②抽签法 D.①抽签法,②随机数法
【答案】A
【详解】对于①,由于抽取的总体个数与样本个数都不大,则应用抽签法;
对于②,抽取的总体个数较多,且总体有明确的分层,抽取的样本个数较大,则采用分层随机抽样.
故选:A.
21.现要完成下列 2项抽样调查:
①从盒饼干中抽取 4盒进行食品卫生检查;
②某中学共有360名教职工,其中一般教师 280名,行政人员55名,后勤人员 25名,为了了解教职工对
学校在校务公开方面的意见,拟抽取一个容量为 72的样本,较为合理的抽样方法是( )
A.①简单随机抽样,②分层抽样
B.①简单随机抽样,②简单随机抽样
C.①分层抽样,②分层抽样
D.①分层抽样,②简单随机抽样
【答案】A
【详解】①总体中的个体数较少,宜用简单随机抽样;
②总体是由差异明显的几部分组成,宜用分层抽样.
故选:A.
22.某校为了了解高二学生的身高情况,打算在高二年级 12 个班中抽取 3 个班,再按每个班男女生比例
抽取样本,正确的抽样方法是( )
A.简单随机抽样 B.先用分层抽样,再用随机数表法
C.分层抽样 D.先用抽签法,再用分层抽样
【答案】D
【详解】解:在高二年级 12 个班中抽取 3 个班,这属于简单随机抽样中的抽签法,
按男女生比例抽取样本属于分层抽样,所以是先用抽签法,再用分层抽样.
故选:D.
23.某集团有老年职工 270 人,中年职工 540 人,青年职工 810 人.为了更好地调查他们的健康情况,需
从所有职工中抽取一个容量为 36 的样本,应采用的抽样方法是 .(用“简单随机抽样”或“分层抽样”
填空)
【答案】分层抽样
【详解】由于所有职工由三类不同年龄段的人群构成,所以存在着较为明显的差异,故选择分层抽样.
故答案为:分层抽样
24.某企业共有 3200 名职工,其中,中年、青年、老年职工的比例为 5:3:2,从所有职工中抽取一个
样本容量为 400 的样本.
(1)应采用哪种抽样方法更合理?
(2)中年、青年、老年职工应分别抽取多少人?
【答案】(1)分层抽样,理由见解析;
(2)抽取的中年、青年、老年职工分别为 200 人,120 人,80 人.
【详解】(1)因为中、青、老年职工有明显的差异,故采用分层抽样更合理;
5
(2)按照比例抽取中、青、老年职工的人数分别为 400 = 200,
5 + 3+ 2
3
400 =120 2, 400 = 80,
5 + 3+ 2 5 + 3+ 2
因此应抽取的中年、青年、老年职工分别为 200 人,120 人,80 人.
25.判断下面的抽样方法是否为简单随机抽样,并说明理由.
(1)某商品的市场调查员为了了解该商品在某日某超市的销售情况,在超市出口处随机向 10 个顾客询问是
否购买了该商品
(2)某班 45 名同学,指定个子最矮的 5 名同学参加学校组织的某项活动;
(3)从 20 个相同的零件中一次性抽出 3 个进行质量检查
【答案】(1)不是简单随机抽样;理由见解析
(2)不是简单随机抽样;理由见解析
(3)不是简单随机抽样;理由见解析
【详解】(1)不是简单随机抽样;被抽取的样本的总体个数不确定.
(2)不是简单随机抽样;因为指定个子最矮的 5 名同学,是在 45 名同学中特指的,不是等可能抽样.
(3)不是简单随机抽样;因为一次性抽取 3 个不是逐个抽取,不符合简单随机抽样的特征.
知识点 2 频率分布直方图
1.画频率分布直方图的步骤
第 1步:求极差(即一组数据中最大值与最小值的差);
第 2步:决定组距与组数;
第 3步:将数据分组;
第 4步:列频率分布表;
第 5步:画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).
2.频率分布直方图的性质
落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于 1.
知识点 3 数字特征
1.众数、中位数、平均数
数字特征 样本数据 频率分布直方图
众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标
将数据按大小依次排列,处在最中间位置的一个 把频率分布直方图划分左右两个面积相等
中位数
数据(或最中间两个数据的平均数) 的分界线与 x 轴交点的横坐标
每个小矩形的面积乘以小矩形底边中点的
平均数 样本数据的算术平均数
横坐标之和
2.极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
s2 1方差: = [(x1 - x )
2 + (x2 - x )
2 +L+ (x - x )2n ] .n
1
标准差: s = [(x - x )2 + (x - x )2 +L+ (x - x )2 ] .
n 1 2 n
注:方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标
准差、方差越小,数据的离散程度越小,越稳定.
3.性质
(1)若 x1, x2 ,L, xn 的平均数为 x ,那么mx1 + a,mx2 + a,L, mxn + a 的平均数为mx + a .
(2)数据 x1, x2 ,L, xn 与数据 x1 = x1 + a, x2 = x2 + a,L, xn = xn + a 的方差相等,即数据经过平移后方
差不变.
(3)若 x1, x2 ,L, xn 的方差为 s2,那么 ax1 + b, ax2 + b,L, ax + b
2 2
n 的方差为 a s .
知识点 4 百分位数
1.定义:一组数据的第 p 百分位数是这样一个值,它使得这组数据中至少有 p% 的数据小于或等于这个值,
且至少有 (100- p)% 的数据大于或等于这个值.
2.计算一组几个数据第 p 百分位数的步骤
第 1 步,按从小到大排列原始数据;
第 2 步,计算 i=n p% .
第 3 步,若 i 不是整数,而大于 i 的比邻整数为 j,则第 p 百分位数为第 j 项数据;若 i 是整数,则第 p 百
分位数为第 i 项与第(i+1)项数据的平均数.
3.四分位数
即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数.
其中第 25 百分位数也称为第一四分位数或下四分位数等,第 75 百分位数也称为第三四分位数或上四分位
数等.
重难点 5 统计图与实际问题
26.每到春夏交替时节,雌性杨树会以满天飞絮的方式来传播下一代,漫天飞舞的杨絮易引发皮肤病、呼
吸道疾病等,给人们造成困扰.为了解市民对治理杨絮方法的赞同情况,某课题小组随机调查了部分市民
(问卷调查表如下表所示),并根据调查结果绘制了尚不完整的统计图(如图所示).
治理杨絮——您选哪一项?(单选)
a.减少杨树新增面积,控制杨树每年的栽种量
b.调整树种结构,逐渐更换现有杨树
c.选育无絮杨品种,并推广种植
d.对雌性杨树注射生物干扰素,避免产生飞絮
e.其他
由两个统计图可知,选择 d 的人数和扇形统计图中 e 的圆心角度数分别为( )
A.500, 28.8° B.250, 28.6° C.500, 28.6° D.250, 28.8°
【答案】A
【详解】设接受调查市民的总人数为 x,
由调查结果条形统计图可知选择 a 的人数为 300,通过调查结果的扇形统计图可知选择 a 的人数比列为
15% 300= ,解得 x = 2000.
x
∴选择 d 的人数为 2000 25% = 500,
∴扇形统计图中 e 的圆心角数为 1-15% -12% - 40% - 25% 360° = 28.8° .
故选:A
27.甲、乙两所学校的男、女生比例如图所示,已知甲校学生总数为 1000,乙校学生总数为 900,下列结
论错误的是( )
A.甲校男生比乙校男生多 B.乙校女生比甲校女生少
C.甲校男生比乙校女生少 D.乙校男生比甲校女生少
【答案】A
【详解】甲校男生的人数为1000 40% = 400,甲校女生的人数为1000 60% = 600 ,
乙校男生的人数为900 50% = 450,乙校女生人数为900 50% = 450 .
所以甲校男生比乙校男生少,故 A 错误;
乙校女生比甲校女生少,故 B 正确;
甲校男生比乙校女生少,故 C 正确;
乙校男生比甲校女生少,故 D 正确.
故选:A.
28.已知全国农产品批发价格 200 指数月度变化情况如图所示,下列选项正确的是( )
A.全国农产品夏季价格比冬季低
B.全国农产品批发价格 200 指数 2023 年每个月逐渐增加
C.2023 年“菜篮子”产品批发价格指数与农产品批发价格 200 指数的变化趋势基本保持一致
D.2023 年 6 月农产品批发价格 200 指数大于 116
【答案】C
【详解】对于 A,图中给的是批发价格 200 指数,所以并不能确定农产品的价格变化,故 A 错误;
对于 B,全国农产品批发价格 200 指数 2023 年 4-6 月呈下降趋势,并未增加,故 B 错误;
对于 C,根据图中曲线的变化趋势可发现 2023 年“菜篮子”产品批发价格指数与农产品批发价格 200 指数
的变化趋势基本保持一致,故 C 正确;
对于 D,2023 年 6 月农产品批发价格 200 指数在 115 附近,故 D 错误.
故选:C
29.(多选)恩格尔系数是食品支出总额占个人消费支出总额的比重,恩格尔系数达 59%以上为贫困,
50%~59%为温饱,40%~50%为小康,30%~40%为富裕,低于 30%为最富裕.国家统计局 2023 年 1 月
17 日发布了我国 2022 年居民收入和消费支出情况,根据统计图表,如图甲、乙所示,下列说法正确的是
( )
A.2022 年农村居民人均可支配收入增长额超过城镇居民人均可支配收入增长额
B.2022 年城镇居民收入增长率快于农村居民
C.从恩格尔系数看,可认为我国在 2022 年达到富裕
D.2022 年全国居民人均消费支出构成中食品烟酒和居住占比超过 50%
【答案】CD
【详解】对于选项 A,从图甲可知,2022 年城镇居民人均可支配收入增长额为 49283- 47412 =1871,2022
年农村居民人均可支配收入增长额为 20133-18931 =1202,故 A 错误;
对于选项 B,从图甲可知,2022 年城镇居民收入实际增速为1.9% ,2022 年农村居民收入实际增速为
4.2%,故 B 错误;
对于选项 C,从图乙可知,2022 年食品支出总额占个人消费支出总额的比重 30.5%,属于30 ~ 40% 的范围,
故 C 正确;
对于选项 D,从图乙可知,2022 年食品烟酒和居住占比为30.5% + 24.0% = 54.5%,故 D 正确.
故选:CD.
30.(多选)空气质量指数 AQI 是反映空气质量状况的指数,AQI 指数的值越小,表明空气质量越好,AQI
指数不超过 50,空气质量为“优”;AQI 指数大于 50 且不超过 100,空气质量为“良”;AQI 指数大于 100,
空气质量为“污染”.如图是某市 2023 年空气质量指数(AQI)的月折线图.下列关于该市 2023 年空气质量
的叙述中,说法正确的是( )
A.全年平均 AQI 指数对应的空气质量等级为优或良
B.每月都至少有一天空气质量为优
C.2 月、8 月、9 月和 12 月均出现污染天气
D.空气质量为“污染”的天数最多的月份是 2 月份
【答案】ABC
【详解】对于 A,根据 AQI 指数月折线图可知,全年平均 AQI 指数都小于 100,故全年的平均 AQI 指数
对应的空气质量等级为优或良,故 A 正确;
对于 B,每个月 AQI 指数的最小值不超过 50,故 B 正确;
对于 C,2 月、8 月、9 月和 12 月的 AQI 指数的最大值超过了 100,故 C 正确;
对于 D,从折线图只能知道,2 月 AQI 指数的最大值最大,不能说明 2 月的空气质量为“污染”的天数最多,
故 D 不正确.
故选:ABC
31.(多选) 2021年 7 月,中共中央办公厅、国务院办公厅印发《关于进一步减轻义务教育阶段学生作业
负担和校外培训负担的意见》,明确要求初中生每天的书面作业时间不得超过90分钟.某校随机抽取部分
学生进行问卷调查,并将调查结果制成如下不完整的统计图表.则下列说法正确的是(  )
作业时间频数分布表
组别 作业时间(单位:分钟) 频数
A 60 < t 70 8
B 70 < t 80 17
C 80 < t 90 m
D t > 90 5
A.调查的样本容量为50
B.频数分布表中m 的值为20
C.若该校有1000名学生,作业完成的时间超过90分钟的约100人
D.在扇形统计图中 B 组所对的圆心角是144o
【答案】ABC
5
【详解】对于 A 选项,由扇形统计图和频数分布表可知,调查的样本容量为 = 50,A 对;
0.1
对于 B 选项,由表格中的数据可得m = 50 - 8 +17 + 5 = 20,B 对;
对于 C 选项,若该校有1000名学生,作业完成的时间超过90分钟的人数约为1000 10% =100人,C 对;
17 o o
对于 D 选项,在扇形统计图中 B 组所对的圆心角是 360 =122.4 ,D 错.
50
故选:ABC.
重难点 6 频率分布直方图的应用
32.某高校调查了 200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中
自习时间的范围是 17.5,30 ,样本数据分组为 17.5,20 , 20,22.5 , 22.5,25 , 25,27.5 , 27.5,30 .根
据直方图,这 200名学生中每周的自习时间不少于 22.5小时的人数是( )
A.56 B.60 C.120 D.140
【答案】D
【详解】由频率分布直方图知,
自习时间不少于 22.5小时的有 200 (0.16 + 0.08 + 0.04) 2.5 =140 .
故选:D.
33.为了了解某校高三学生的视力情况,随机抽查了该校 100 名高三学生的视力情况,得到频率分布直方
图如图所示,由于不慎将部分数据丢失,但知道后 5 组的频数和为 64,最大频率为0.34 ,设视力在 4.6到
4.8之间的学生人数为 a,则 a 的值为( )
A.27 B.48 C.54 D.64
【答案】C
【详解】前两组的频数之和为100 0.1 0.5 +1.1 =16,第四组的频数为100 0.34 = 34,
后五组的频数之和为64,所以,前三组的频数之和为100 - 64 = 36,
故第三组的频数为36 -16 = 20 ,因此 a = 20 + 34 = 54 .
故选:C.
34.(多选)将样本容量为 100 的样本数据分为 4 组: 2,6 , 6,10 , 10,14 , 14,18 ,得到频率分布直方图
如图所示,则下列说法中正确的是( )
A.样本数据分布在 6,10 内的频率为 0.32
B.样本数据分布在 10,14 内的频数为 40
C.样本数据分布在 2,10 内的频数为 40
D.估计总体数据大约有10% 分布在 10,14 内
【答案】ABC
【详解】对于 A,由图可得,样本数据分布在 6,10 内的频率为0.08 4 = 0.32 ,故 A 正确;
对于 B,由图可得,样本数据分布在 10,14 内的频数为100 0.1 4 = 40,故 B 正确;
对于 C,由图可得,样本数据分布在 2,10 内的频数为100 0.02 + 0.08 4 = 40,故 C 正确;
对于 D,由图可估计,总体数据分布在 10,14 内的比例约为0.1 4 100% = 40%,故 D 错误.
故选:ABC.
35.(多选)供电部门对某社区1000位居民 12 月份人均用电情况进行统计后,按人均用电量分为 0,10 ,
10,20 , 20,30 , 30,40 , 40,50 五组,整理得到如图所示的频率分布直方图,则有关这1000位居民,
下列说法正确的是(  )
A.12 月份人均用电量人数最多的一组有 400 人
B.12 月份人均用电量在 20,30 内的有 300 人
C.12 月份人均用电量不低于 20 度的有 500 人
D.在这1000位居民中用比例分配的分层随机抽样方法抽取 10 位居民协助收费,抽到的居民用电量
在 30,40 一组的人数为 2
【答案】ABC
【详解】根据频率分布直方图知,12 月份人均用电量人数最多的一组是 10,20 ,有1000 0.04 10 = 400
(人),故 A 正确;
12 月份人均用电量在 20,30 内的人数为1000 0.03 10 = 300,故 B 正确;
12 月份人均用电量不低于 20 度的频率是 0.03+ 0.01+ 0.01 10 = 0.5,有1000 0.5 = 500(人),故 C 正确;
用电量在 30,40 内的有0.01 10 1000 =100(人),
所以在这1000位居民中用比例分配的分层随机抽样方法抽取 10 位居民协助收费,
100
抽到的居民用电量在 30,40 一组的人数为 10 =1,故 D 错误.
1000
故选:ABC
36.某电视台在本省内 15~65 岁的人群中随机抽取了 n 人回答问题“本省著名旅游景点有哪些”,统计结
果如图表所示.
组号 分组 回答正确的人数 回答正确的人数占本组的频率
第 1 组 15,25 a 0.5
第 2 组 25,35 18 x
第 3 组 35,45 b 0.9
第 4 组 45,55 9 0.36
第 5 组 55,65 3 y
(1)分别求出 a,b,x,y 的值;
(2)从第 2,3,4 组回答正确的人中用分层随机抽样的方法抽取 6 人,求第 2,3,4 组每组各抽取多少人?
【答案】(1) a = 5,b = 27 , x = 0.9, y = 0.2;
(2)第 2 组抽取 2(人);第 3 组抽取 3(人);第 4 组抽取 1(人)
9
【详解】(1)由频率分布表中第 4 组数据可知,第 4 组总人数为 = 25,
0.36
25
再结合频率分布直方图可知 n = =100, 
0.025 10
所以 a =100 0.01 0.5 = 5,
18
b = 100 0.03 10 0.9 = 27, x = = 0.9, y
3
= = 0.2 .
0.02 10 100 0.015 10 100
(2)第 2,3,4 组回答正确的共有 18+27+9=54(人).
利用分层随机抽样的方法在 54 人中抽取 6 人,
18 27 9
所以第 2 组抽取 6 = 2 (人);第 3 组抽取 6 = 3 (人);第 4 组抽取 6 = 1 (人).
54 54 54
37.某校高一某班的某次数学测试成绩(满分 100 分,单位:分)如下:56,58,62,63,63,65,66,
68,69,71,72,72,73,74,75,76,77,78,79, ,90,95,由于保存不利,其中
80,90 内的成绩被墨水覆盖.根据该数据绘制的频率分布直方图(如图)也被墨水覆盖了部分区域.
(1)求成绩在区间 50,60 内的频率及抽样人数;
(2)求成绩在区间 80,90 内的频数,并计算频率分布直方图中区间 80,90 对应的小长方形的高.
【答案】(1)0.08;25
(2)4;0.016
【详解】(1)易知成绩在区间 50,60 内的频率为0.008 10 = 0.08,成绩在区间 50,60 内的频数为 2,所
2
以抽样人数为 = 25.
0.08
(2)成绩在区间 80,90 内的频数为 25 - 21 = 4;
4
频率分布直方图中区间 80,90 对应的小长方形的高为: 10 = 0.016.
25
38.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,
画出频率分布直方图如图所示,图中从左到右各小矩形的面积之比为 2∶4∶17∶15∶9∶3,第二小组的
频数为 12.
(1)第二小组的频率是多少?样本量是多少?
(2)若次数在 110 以上(含 110 次)为达标,则该校全体高一年级学生的达标率是多少?
(3)试求样本中不达标的学生人数;
(4)试求样本中次数在 130 以上(含 130 次)的学生人数.
【答案】(1)0.08;150
(2)88%
(3)18
(4)36
4
【详解】(1)由题意可知:第二小组的频率为 = 0.08;
2 + 4 +17 +15 + 9 + 3
12
所以样本容量为 =150 .
0.08
17 +15 + 9 + 3
(2)由直方图可估计该校高一年级学生的达标率为 100% = 88% .
2 + 4 +17 +15 + 9 + 3
(3)由(1)(2)知达标率为88%,样本量为 150,则不达标率为1-88% =12%,
所以样本中不达标的学生人数为150 12% =18(人).
9 + 3
(4)次数在 130 以上(含 130 次)的学生人数为 150 = 36 .
2 + 4 +17 +15 + 9 + 3
重难点 7 平均数、众数、中位数与直方图
39.某校为了解在校学生对中国传统文化的传承认知情况,随机抽取了 100 名学生进行中国传统文化知识
考试,并将这 100 名学生成绩整理得到如下频率分布直方图.根据此频率分布直方图(分成 40,50 ,
50,60 , 60,70 , 70,80 , 80,90 , 90,100 六组),下列结论中不正确的是( )
A.图中的 a = 0.012
B.若从成绩在 70,80 , 80,90 , 90,100 内的学生中采用分层抽样抽取 10名学生,则成绩在 80,90
内的有 3 人
C.这 100 名学生成绩的中位数约为 65
D.若同一组中的数据用该组区间的中点值作代表,则这 100 名学生的平均成绩约为 68.2
【答案】C
【详解】由 0.008 2 + a + 0.02 2 + 0.032 10 =1,得 a = 0.012,所以 A 正确;
这 100 名学生中成绩在 70,80 , 80,90 , 90,100 内的频率分别为 0.2,0.12,0.08,所以采用分层抽样
0.12
抽取的 10 名学生中成绩在 80,90 内的有10 = 3人,故 B 正确;
0.4
根据频率分布直方图,可知这 100 名学生成绩的中位数在 60, 70 之间,设中位数为 x ,则
x - 60 0.032 = 0.22,所以 x = 66.875,故 C 错误;
根据频率分布直方图的平均数的计算公式,可得
x = 45 0.08 + 55 0.2 + 65 0.32 + 75 0.2 + 85 0.12 + 95 0.08 = 68.2,D 正确.
故选:C
40.(多选)在一次考试中,某地抽取一组样本,将学生的考分按 0,10 , 10, 20 ,…, 90,100 分成 10
组,得到如下频率分布直方图:
根据频率分布直方图,则下列结论正确的是( )
A.规定分数不低于 60 分为及格,则及格率为 0.6
B.样本的中位数为 60
C.以频率作为概率,每组数据区间中点作代表,估计该地此次考试的平均分为 60 分
D.规定此次考试 80%的考生定为合格等级,则合格等级的学生最低分为 40 分
【答案】AD
【详解】分数在 60,100 的频率为: 2 0.016 + 0.020 + 0.008 10 = 0.6,A 正确;
分数在 0,60 0.5 - 0.4的频率为 0.4,分数在 0,70 的频率为 0.56,由60 + = 66.25,得样本的中位数为
0.016
66.25,B 错误;
5 0.02 +15 0.04 + 25 0.06 + 35 0.08 + 45 0.08 = 8.60,
55 0.12 + 65 0.16 + 75 0.2 + 85 0.16 + 95 0.08 = 53.20,而8.60 + 53.20 = 61.80 .
所以估计该地此次考试的平均分为 61.8 分,C 错误;
分数在 0, 40 的频率为 0.2,所以合格等级的学生最低为 40 分,D 正确.
故选:AD.
41.某医院急救中心随机抽取 20 位病人等待急诊的时间记录如下表:
等待时间/分 [0,5) [5,10) [10,15) [15,20) [20,25]
频数 4 8 5 2 1
用上述分组资料计算出病人平均等待时间的估计值 x = 分.
【答案】9.5
1
【详解】 x = (2.5 4 + 7.5 8 +12.5 5 +17.5 2 + 22.5 1) = 9.5(分).
20
故答案为:9.5
42.2022 年 11 月卡塔尔世界杯如期举行,这是世界足球的一场盛宴.为了了解全民对足球的热爱程度,
组委会在某场比赛结束后,随机抽取了 1000 名观众进行对足球“喜爱度”的调查评分,将得到的分数分成 6
段: 70,75 , 75,80 , 80,85 , 85,90 , 90,95 , 95,100 ,得到如图所示的频率分布直方图.图中
部分数据丢失,若已知这 1000 名观众评分的中位数估计值为 87.5,则 m= .
1
【答案】0.02 /
50
【详解】由题可知,5 m + 0.025 + 0.03 + 87.5 -85 0.05 = 0.5,解得m = 0.02 .
故答案为:0.02
43.我国中学生的近视率一直是社会关注的焦点.某市疾控中心为调查该市高中生的视力状况,从某高中
3000 名学生中随机抽取了 100 名学生用五分记录法统计了其裸眼视力,得到如图 1 所示的频率分布直方
图:
为改善学生的视力状况,该校积极落实学生近视防控工作,建立视力监测制度,几年后,再次抽取 100 名
学生,用五分记录法统计其裸眼视力,得到如下频数分布表:
裸眼视力 4.4,4.6 4.6,4.8 4.8,5.0 5.0,5.2
人数 5 20 60 15
(1)若裸眼视力位于 4.7,5.0 为轻度近视,用样本估计总体,用频率估计概率,估计近视防控工作开展前
全校患轻度近视的学生人数;
(2)在图 2 中作出近视防控工作开展后 100 名学生裸眼视力的频率分布直方图;
(3)估计近视防控工作开展后该校学生裸眼视力比开展前学生裸眼视力的平均值提高了多少(同一组中的
数据用该组区间的中点值为代表).
【答案】(1)825;
(2)答案见解析;
(3)0.29.
【详解】(1)由频率分布直方图,得学生裸眼视力在 4.7,5.0 的频率为0.1 1.25 + 0.2 0.75 = 0.275,
所以估计近视防控工作开展前全校患轻度近视的学生人数为3000 0.275 = 825.
(2)近视防控工作开展后学生裸眼视力在 4.4,4.6 5的频率为 = 0.05,在 4.6,4.8 20的频率为 = 0.2,
100 100
4.8,5.0 60在 的频率为 = 0.6,在 5.0,5.2 15的频率为 = 0.15,
100 100
故近视防控工作开展后 100 名学生裸眼视力的频率分布直方图如下.
(3)记近视防控工作开展前该校学生裸眼视力的平均值为 x1 ,
x1 = 0.2 4.1 0.25 + 4.3 1.00 + 4.5 1.50 + 4.7 1.25 + 4.9 0.75 + 5.1 0.25 = 4.58.
记近视防控工作开展后该校学生裸眼视力的平均值为 x2 ,
则 x2 = 4.5 0.05 + 4.7 0.2 + 4.9 0.6 + 5.1 0.15 = 4.87 ,
因为 4.87 - 4.58 = 0.29,
故近视防控工作开展后该校学生裸眼视力比开展前学生裸眼视力的平均值提高了 0.29.
44.对某校高三年级学生参加社区服务的次数进行统计,随机抽取 M 名学生,得到这 M 名学生参加社区
服务的次数,根据此数据作出如下频率分布表和频率分布直方图.
分组 频数 频率
[10,15) 10 0.20
[15,20) 24 n
[20,25) m p
[25,30] 2 0.04
合计 M 1
(1)求出表中 M,p 及图中 a 的值;
(2)若该校有高三学生 300 人,试估计该校高三学生参加社区服务的次数在区间[15,20)内的人数;
(3)估计该校高三学生参加社区服务次数的众数、中位数及平均数.(保留一位小数)
【答案】(1) M = 50 , p = 0.28, a = 0.096
(2)144
(3)17.5,18.1,18.3
10
【详解】(1)由分组[10,15) 对应的频数是 10,频率是 0.20,知 = 0.20,所以M = 50 ,
M
p m 14 0.28 a 24所以10 + 24 + m + 2 = 50,解得m =14,所以 = = = , = = 0.096;
M 50 50 5
(2)估计该校高三学生参加社区服务的次数在区间[15,20)
24
内的人数为 300 =144;
50
15 + 20
(3)估计该校高三学生参加社区服务次数的众数是 =17.5.
2
24
因为 n = = 0.48,所以估计该校高三学生参加社区服务次数的中位数 x 满足:
50
0.2 + (x -15) 0.48 = 0.5,
5
解得 x =18.125,所以该校高三学生参加社区服务次数的中位数约为 18.1,
由12.5 0.20 +17.5 0.48 + 22.5 0.28 + 27.5 0.04 =18.3,
所以估计该校高三学生参加社区服务次数的平均数是 18.3.
45.从某小学随机抽取 100 名学生,将他们的身高(单位:厘米)数据绘成频率分布直方图(如图).
(1)由图中数据求 a的值和中位数;
(2)若要从身高在 120,130 , 130,140 , 140,150 三组内的学生中,用分层抽样的方法选取 12 人参加一项
活动,则从身高在 140,150 内的学生中选取的人数应为多少?
【答案】(1) a = 0.030;123.33
(2) 2
【详解】(1)因为各组频率和为1,即直方图中的各个矩形的面积之和为1,
所以有10 0.005 + 0.035 + a + 0.020 + 0.010 =1,
解得 a = 0.030;
因为10 0.005 + 0.035 = 0.4 < 0.5,
10 0.005 + 0.035 + 0.030 = 0.7 > 0.5,
所以中位数落在区间 120,130 内, 设中位数为 x ,
由0.4 + x -120 0.7 - 0.4 = 0.5
得 x =120+
0.5 - 0.4
10 123.33,
0.7 - 0.4
因此,该校小学生身高中位数约为123.33 .
(2)由直方图知,三个区域内的学生总数为
100 10 0.030 + 0.020 + 0.010 = 60 ,
其中身高在 140,150 内的学生人数为100 10 0.010 =10,
从60人中用分层抽样的方法选取 12 人参加一项活动,
140,150 12所以从身高在 范围内抽取的学生人数为 10 = 2 .
60
重难点 8 标准差、方差、极差
46.某校举行“云翔杯”学生篮球比赛,统计部分班级的得分数据如下.
班级 1 2 3 4 5 6 7 8
得分 28 34 34 30 26 28 28 32
则( )
A.得分的中位数为 28 B.得分的极差为 8
C.得分的众数为 34 D.得分的平均数为 31
【答案】B
【详解】将得分数据从小到大排列为:26,28,28,28,30,32,34,34,
28 + 30
所以中位数为 = 29,故 A 错误;
2
极差为34 - 26 = 8,故 B 正确;
众数为 28,故 C 错误
26 + 28 3 + 30 + 32 + 34 2
平均数为 = 30 ,故 D 错误.
8
故选:B.
47.已知一组样本数据 x1, x2 ,L, x5的方差为 10,且 x1 + x3 = x2 + x4 ,则样本数据 x1 -1, x2 +1, x3 -1, x4 +1, x5
的方差为( )
A.9.2 B.10.8 C.9.75 D.10.25
【答案】B
5
【详解】设样本数据 x1, x2 ,L, x
1 2
5的平均数为 x ,则 xi - x =10,5 i=1
且样本数据 x1 -1, x2 +1, x3 -1, x4 +1, x5的平均数也为 x ,
1 2
故: é x1 -1- x + x2 +1- x
2 + x3 -1- x
2 + x4 +1- x
2 + x5 - x
2 ù
5
1 5
= x x 2 2i - + -x + x5 1 2 - x3 + x4 + 0.8 =10.8i=1 5
故选:B
48.(多选)“体育强则中国强,国运兴则体育兴”.为备战 2024 年巴黎奥运会,运动员们都在积极参加集
训,已知某跳水运动员在一次集训中 7 位裁判给出的分数分别为:9.1,9.3,9.4,9.6,9.8,10,10,则
这组数据的( )
A.平均数为 9.6 B.众数为 10
37
C.第 80 百分位数为 9.8 D.方差为
350
【答案】ABD
1
【详解】对于 A,平均数= 9.1+ 9.3+ 9.4 + 9.6 + 9.8 +10 +10 = 9.6,故 A 正确;
7
对于 B,出现次数最多的数为 10,故 B 正确;
对于 C,7×0.8=5.6,第 80 百分位数为第 6 位,即 10,故 C 错误;
1 é 9.1- 9.6 2 + 9.3 - 9.6 2 + 9.4 - 9.6 2 + 9.6 - 9.6 2对于 D,方差为 + 9.8 - 9.6
2 + 2 10 37- 9.6 2 ù = ,故7 350
D 正确.
故选:ABD.
49.了解某中学学生的身高情况,采用分层随机抽样的方法抽取了 30 名男生,20 名女生.已知男生身高的
平均数为 170cm,方差为 16,女生身高的平均数为 165 cm,方差为 25,则可估计该校学生身高的平均数
为 cm,方差为 .
【答案】 168 25.6
【详解】由分层随机抽样抽取的样本中男生有 30 人,女生有 20 人,
30 3
得男生所占的权重为w男 = = = 0.6,女生所占的权重为w =1- 0.6 = 0.4,30 + 20 5 女
2
而 x s =16男 =170cm, 男 , x女 =165cm
2
, s女 = 25,
所以估计该校学生身高的平均数 x = w男 x男 + w女 x女 = 0.6 170 + 0.4 165 =168 cm ;
s2方差 = w [s2男 男 + (x男 - x)
2 ]+ w女[s
2
女 + (x女 - x)
2 ]
= 0.6 [16 + (170 -168)2 ]+ 0.4 [25 + (165 -168)2 ] = 25.6 .
故答案为:168;25.6
50.若一组数据 m,n,9,8,10 的平均数为 9,方差为 2,则 m - n = .
【答案】4
1
【详解】根据题意得平均数 x = m + n + 9 + 8 +10 = 9,
5
s2 1= é m - 9 2 2方差 + n - 9 + 9 - 9
2 + 8 - 9 2 + 10 - 9 2 ù = 2,5
2 2 ìn =11, ìn = 7,
所以m + n =18,且 m - 9 + n - 9 = 8,解得 ím 7 或= í m =11,
所以 m - n = 4 .
故答案为:4.
51.某工厂甲、乙两名工人参加操作技能培训,他们在培训期间参加的 8 次测试成绩记录如下:
甲:95 82 88 81 93 79 84 78
乙:83 92 80 95 90 80 85 75
(1)哪个工人的成绩较好?
(2)甲、乙成绩位于[x - s, x + s]内的有多少?
【答案】(1)甲的成绩较好;
(2)4 个,5 个.
1
【详解】(1)甲工人成绩的平均数 x1 = (95 + 82 + 88 + 81+ 93 + 79 + 84 + 78) = 85,8
1
乙工人成绩的平均数 x2 = (83+ 92 + 80 + 95 + 90 + 80 + 85 + 75) = 85,8
2 1
甲工人成绩的方差 s1 = [(95 -85)
2 + (82 -85)2 + (88 -85)2 + (81-85)2 + (93 -85)2
8
+(79 -85)2 + (84 -85)2 + (78 -85)2 ] = 35.5,
2 1
乙工人成绩的方差 s2 = [(83 -85)
2 + (92 -85)2 + (80 -85)2 + (95 -85)2 + (90 -85)2
8
+(80 -85)2 + (85 -85)2 + (75 -85)2 ] = 41,
显然 x 2 21 = x2 , s1 < s2 ,所以甲的成绩较稳定,较好.
(2)由(1)知, s 21 = s1 = 35.5 5.96, s
2
2 = s2 = 41 6.40,
甲的成绩位于区间[x1 - s1, x1 + s1],即[79.04,90.96]内的有 4 个,
乙的成绩位于区间[x2 - s2 , x2 + s2 ],即[78.60,91.40]内的有 5 个.
重难点 9 百分位数
52.样本数据 24,13,14,18,12,14,20,16 的 75%分位数为( )
A.17 B.18 C.19 D.20
【答案】C
【详解】数据从小到大排序为 12,13,14,14,16,18,20,24,则8 75% = 6,
18 + 20
所以 75%分位数为 = 192 .
故选:C.
53.(山西省太原市 2024 届高三模拟考试(三)(5 月)数学试题)数据1,5,4,3,6,5,2,6的第 25 百分位数为
( )
A.2 B. 2.5 C.3 D. 4.5
【答案】B
【详解】将 8 个数据从小到大排列,得到1,2,3,4,5,5,6,6,
8 25 0 0 = 2 ,
2 + 3
故选取第 2 个和第 3 个数的平均数作为第 25 百分位数,即 = 2.52 .
故选:B
54.数据 3.2,3.4,3.8,4.2,4.3,4.5,x,6.6 的第 65 百分位数是 4.5,则实数 x 的取值范围是( )
A.[4.5, + ) B.[4.5,6.6)
C. (4.5,+ ) D. (4.5,6.6]
【答案】A
【详解】因为8 65% = 5.2,
所以这组数据的第 65 百分位数是从小到大排列后第 6 项数据 4.5,
则前 6 项数据从小到大排列为:3.2,3.4,3.8,4.2,4.3,4.5,
则 x 4.5 .
故选:A.
55.(多选)已知 100 个数据的 75%分位数是 9.3,则下列说法正确的是( )
A.这 100 个数据中至少有 75 个数小于或等于 9.3
B.把这 100 个数据从小到大排列后,9.3 是第 75 个数据
C.把这 100 个数据从小到大排列后,9.3 是第 75 个数据和第 76 个数据的平均数
D.把这 100 个数据从小到大排列后,9.3 是第 74 个数据和第 75 个数据的平均数
【答案】AC
【详解】通过定义知 A 正确;
因为 100×75%=75 为整数,所以第 75 个数据和第 76 个数据的平均数为 75%分位数,是9.3,则 C 正
确.BD 错误.
故选:AC
56.从高三抽出 50 名学生参加数学竞赛,由成绩得到如图的频率分布直方图,则估计这 50 名学生成绩的
75%分位数为 分.
【答案】86.25
【详解】依题意,前四个小矩形的面积之和为 (0.004 + 0.006 + 0.020 + 0.030) 10 = 0.6,
前五个小矩形的面积之和为 0.6 + 0.024 10 = 0.84 > 0.75,
0.75 - 0.6
因此75%分位数位于[80,90)内,80 +10 = 86.25,
0.84 - 0.6
所以估计这 50 名学生成绩的75%分位数为86.25分.
故答案为:86.25
57.为深入贯彻落实习近平总书记对天津工作“三个着力”重要要求,天津持续深化改革,创建全国文明城
区,城市文明程度显著提升,人民群众的梦想不断实现.在创建文明城区的过程中,中央文明办对某小区
居民进行了创建文明城区相关知识网络问卷调查,从本次问卷中随机抽取了 50 名居民的问卷结果,统计
其得分数据,将所得 50 份数据的得分结果分为 6 组: 40,50 , 50,60 , 60,70 , 70,80 , 80,90 , 90,100 ,
并整理得到如下的频率分布直方图,则该小区居民得分的第 70 百分位数为 .
【答案】84.55
【详解】由题意得 0.004 + a + 0.018 + 2 0.022 + 0.028 10 =1,
解得 a = 0.006,
因为前 4 组数据的频率之和为0.04 + 0.06 + 0.22 + 0.28=0.6,
前 5 组数据的频率之和为0.04 + 0.06 + 0.22 + 0.28 + 0.22=0.82,
则70%分位数在 80,90 内,设70%分位数为 x,
则0.6 + x -80 0.022=0.7,解得 x 84.55,
所以70%分位数约为84.55 .
故答案为:84.55
58.某校从高一年级中随机抽取部分学生,将他们的期末数学测试成绩分成 6 组:
40,50 , 50,60 , 60,70 , 70,80 , 80,90 , 90,100 加以统计,得到如图所示的频率分布直方图.据此统计,
期末数学测试成绩不少于60% 分位数的分数至少为 分.
【答案】74
【详解】因为 0.005 + 0.015 + 0.03 10 = 0.5 < 0.6,0.5 + 0.025 10 = 0.75 > 0.6,
所以60% 分位数应位于 70,80 内.
70 10 0.6 - 0.5由 + = 74,得期末数学测试成绩不少于60% 分位数的分数至少为 74 分.
0.75 - 0.5
故答案为:74.
重难点 10 平均数、方差、标准差的性质
59.已知数据 x1, x2 , x3 ,L, x8 的平均数为 10,方差为 10,则3x1 + 2,3x2 + 2,3x3 + 2,L,3x8 + 2的平均数和方差
分别为( )
A.32,90 B.32,92 C.30,90 D.30,92
【答案】A
【详解】因为 x1, x2 , x3 ,L, x8 的平均数是 10,方差是 10,
所以3x1 + 2,3x2 + 2,3x3 + 2,L,3x8 + 2的平均数是3 10 + 2 = 32,方差是32 10 = 90 .
故选:A.
60.已知样本数据 x1, x2 ,L, x100 的平均数和标准差均为 4,则数据-x1 -1, -x2 -1,L,-x100 -1的平均数与标准
差分别为( )
A.-5,4 B.-5,16 C. 4,16 D. 4,4
【答案】A
【详解】由题意知,样本数据 x1, x2 ,L, x100 的标准差为 4,
所以样本数据 x1, x2 ,L, x100 的方差为 16,
因为样本数据 x1, x2 ,L, x100 的平均数为 4和方差为16,
所以-x1 -1, -x2 -1,L,-x100 -1的平均数为-4 -1 = -5,
-x -1, -x -1,L,-x -1 -1 21 2 100 的方差为 16 =16,
所以-x1 -1, -x2 -1,L,-x100 -1的标准差为 4,
故选:A.
61.设样本数据x1,x ,L2 , x2023的平均数为 x ,方差为 s2 ,若数据 2 x1 +1 , 2 x2 +1 ,L, 2 x2023 +1
2
的平均数比方差大 4,则 s2 - x 的最大值是 .
【答案】 -1
【详解】
数据 2 x1 +1 , 2 x2 +1 ,L, 2 x2022 +1 的平均数为 2 x +1 ,方差为 22 s2 = 4s2 ,
所以, 2 x +1 - 4s2 = 4 s2 1 1,即 = x - ,2 2
2
s2 x 1 x 1
2
2 1
- = - - x = - x - 7则
2 2 4 ÷
- ,
è 16
1 1
因为 x - 0,所以 x 1,2 2
1 2y = - x - 16因函数 ÷ - 在 1, + 上单调递减,
è 4 7
2
故当 x =1时, s2 - x 的最大值是 -1.
故答案为: -1.
62.(多选)一组数据 x1, x2, x3,L, xn的平均值为 5,方差为 2,极差为 7,中位数为 6,记3x1 -1,
3x2 -1,3x3 -1,L,3xn -1的平均值为 a,方差为b ,极差为 c,中位数为d ,则( )
A. a =14 B.b =12 C. c = 21 D. d =17
【答案】ACD
【详解】由题意可得 a = 3 5 -1 =14,b = 32 2 =18, c = 3 7 = 21, d = 3 6 -1 =17 ,
故选:ACD.
63.(多选)有一组样本数据 x1, x2 , × × ×, xn ,另一组样本数据 y1, y2 ,× × ×, yn ,其中 yi = xi - 2c i =1,2, × × ×,n ,c
为非零常数,则( )
A.两组样本数据平均数相同 B.两组样本数据方差相同
C.两组样本数据中位数相等 D.两组样本数据极差相同
【答案】BD
【详解】设样本数据 x1, x2 , × × ×, xn 的平均数、中位数、方差,极差分别为 x,a 21, s1 ,b1,
样本数据 y1, y2 ,× × ×, yn 的平均数、中位数、方差,极差分别为 y, a 22 , s2 ,b2,
因为 yi = xi - 2c i =1,2, × × ×,n ,且 c 0,
对于选项 A:可知 y = x - 2c ,且 c 0,所以 y x,故 A 错误;
对于选项 B 2 2 2 2:可知 s2 =1 s1 = s1 ,故 B 正确;
不妨设 x1 x2 ××× xn
因为 yi = xi - 2c(i = 1,2,× × ×n) ,则两组数据相对大小关系不变,
所以 y1 y2 ××× yn ,
对于选项 C:可知: a2 = a1 - 2c,且 c 0,所以 a2 a1,故 C 错误;
对于选项 D:可知:b1 = xn - x1,b2 = yn - y1 = xn - 2c - x1 - 2c = xn - x1 = b1,
即b2 = b1,故 D 正确;
故选:BD.
64.(多选)高一某次数学考试中,某班学生原始成绩最高分为 100 分,最低分为 20 分,现将每个学生的
原始分数 x 按 y = ax + b (a,b 为常数, a > 0)进行转换, y 是转换后的分数,转换后,全班最高分为 100
分,最低分为 60 分,则下列结论正确的是( )
A.转换后分数的众数的个数不变
B.转换后分数的标准差是原始分数标准差的 0.5 倍
C.转换后分数的平均数一定大于原始分数的平均数
D.转换后分数的中位数一定大于原始分数的中位数
【答案】ABC
ì100a + b =100
【详解】根据题意,由于 a > 0,由 í ,
20a + b = 60
ìa = 0.5
解得 í ,
b = 50
即转换规则为 y = 0.5x + 50,由此分析选项:
对于A ,转化后分数的众数的个数不变,A 正确;
对于B,由于转化规则为 y = 0.5x + 50,转换后分数的方差是原始分数方差的 (0.5)2 倍,故转化后分数的
标准差是原始分数标准差的0.5倍,B正确;
对于C ,设原始分数的平均数为 x ,必有 x <100,则转化后的平均数为0.5x + 50,
所以 (0.5x + 50) - x = 50 - 0.5x = 0.5 (100 - x ) > 0,C 正确;
对于D ,反例:当中位数成绩为100时,其转化后的成绩的中位数也为100, D 错误.
故选:ABC.
重难点 11 分层方差计算总体方差
65.在一次数学模考中,从甲 乙两个班各自抽出 10 个人的成绩,甲班的十个人成绩分别为 x1 x2 L x10,
乙班的十个人成绩分别为 y1, y2 ,L, y10 .假设这两组数据中位数相同 方差也相同,则把这 20 个数据合并后
( )
A.中位数一定不变,方差可能变大
B.中位数可能改变,方差可能变大
C.中位数一定不变,方差可能变小
D.中位数可能改变,方差可能变小
【答案】A
【详解】不妨设 x1 x2 L x10 , y1 y2 L y10 ,
x x L x x5 + x6 y y L y y5 + y则 61 2 10的中位数为 , 1 2 10的中位数为 ,2 2
x5 + x6 y + y因为 = 5 6 ,所以 x5 y5 y6 x6 或 y5 x5 x6 y2 2 6

x5 + x6 y5 + y则合并后的数据中位数是 或者 6 ,所以中位数不变.
2 2
设第一组数据的方差为 s2 ,平均数为 x ,第二组数据的方差为 s2 ,平均数为 y ,
合并后总数为 20,平均数为w,方差为 s 2 ,
s 2 1= 10 és2 + (x -w)2 ù +10 és2 + (y -w)210 +10 ù
1
= é 2 2
1 2 2 2 1 1
s + (x -w) ù + é s + (y -w) ù = s + (x -w)
2 + (y -w)2 s2.
2 2 2 2
如果均值相同则方差不变,如果均值不同则方差变大.
故选:A.
66.(多选)若一组样本数据 x1, x2 ,L, x10 的平均数为 x x 0 ,标准差为 s,另一组样本数据 x11, x12 ,L, x20
的平均数为3x ,标准差为 s .两组数据合成一组新数据 x1, x2 ,L, x10 , x11, x12 ,L, x20,新数据的平均数为 y ,标
准差为 s ,则( )
A. y > 2x B. y = 2x C. s > s D. s = s
【答案】BC
x + x +L+ x x + x +L+ x
【详解】由题意 x = 1 2 10 ,3x = 11 12 20 ,
10 10
所以 x1 + x2 +L+ x10 =10x , x11 + x12 +L+ x20 = 30x ,
x + x +L+ x + x + x
所以 y = 1 2 10 11 12
+L+ x20 10x + 30x= = 2x ,故 A 错误,B 正确;
20 20
10s2 = x - x 21 + x2 - x
2 +L+ x 2 2 2 210 - x = x1 + x2 +L+ x10 -10x 2 ,
所以 x21 + x
2
2 +L+ x
2 =10s210 +10x
2 .
10s2 = x2 2 2 2 2 2 2 2同理 11 + x12 +L+ x20 -10 (3x ) = x11 + x12 +L+ x20 - 90x ,
x2所以 11 + x
2
12 +L+ x
2 =10s2 + 90x 220 ,又 x 0,
1
所以 s 2 = é x1 - y
2 + x 22 - y +L+ x10 - y
2 + x11 - y
2 + x12 - y
2 +L+ x20 - y
2 ù
20
1
= x2 21 + x2 +L+ x2 2 2 2 220 10 + x11 + x12 +L+ x20 - 20y
1
= é10s
2 +10x 2 +10s2 + 90x 2 - 20 2x 2 ù = s
2 + x 2 > s2
20

所以 s > s ,故 C 正确,D 错误.
故选:BC
67.为培养学生的阅读习惯,某校开展了为期一年的“弘扬传统文化,阅读经典名著”活动.在了解全校学
生每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为 10 的样本,并算得样本的平均数为
5,方差为 9;乙同学抽取了一个容量为 8 的样本,并算得样本的平均数为 6,方差为 16.已知甲、乙两同
学抽取的样本合在一起组成一个容量为 18 的样本,则合在一起后的样本平均数为 ,方差为 .
(精确到 0.1)
【答案】 5.4 12.4
2
【详解】把甲同学抽取的样本的平均数记为 x ,方差记为 sx ;
2
把乙同学抽取的样本的平均数记为 y ,方差记为 sy ;
把合在一起后的样本的平均数记为 a,方差记为 s2 .
a 10 5 + 8 6则 = 5.4,
10 + 8
10 és2 x + x - a
2 ù
+ 8
é
s
2 + y - a 2 ù
2 ys =
10 + 8
10 é 9 + 5 - 5.4
2 ù + 8 é 16 + 6 - 5.4
2 ù
= 12.4 .
18
即合在一起后样本的平均数为 5.4,方差为 12.4.
故答案为:5.4;12.4
68.在一个文艺比赛中,8 名专业人士和 12 名观众代表各组成一个评委小组,给参赛选手打分,根据打
分情况,得到专业人士组对选手 A 打分的平均数为 48,方差为 14,观众代表组对选手 A 打分的平均数为
56,方差为 140,则选手 A 得分的总方差为 .
【答案】104.96
8 12
【详解】解:选手 A 得分的平均数为 48 + 56 = 52.8,
20 20
8 2 12 2
选手 A 得分的总方差为 é ù é ù
20
14 + 48 - 52.8 + 140 + 56 - 52.8 =104.96 .20
故答案为:104.96 .
69.在对北师大贵阳附中高一学生体重的调查中,采用按样本量比例分配的分层随机抽样,如果不知道样
本数据,只知道抽取了男生 30 人,其平均数和方差分别为 55 和 15,抽取了女生 20 人,其平均数和方差
分别为 45 和 20.则总样本的平均数为 ,总样本的方差为 .
【答案】 51 41
30 55 + 20 45
【详解】总样本的平均数为 = 51,
30 + 20
30
总样本的方差为 é 15 + 55 - 51
2 ù 20
+
é
20 + 45 - 51
2 ù
= 41.20 + 30 20 + 30
故答案为:51,41
70.某中学为了贯策教育部对学生的五项管理中的体质管理,对高一年级学生身高进行调查,在调查中,
采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男 34 人,其平均数和方差分
别为 170.5 和 15,抽取了女生 16 人,其平均数和方差分别为 160.5 和 35.
(1)由这些数据计算总样本的平均数;
(2)由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差作出估计.
2
参考数据: 15 + 3.2 34 = 858.16, 35 + 6.82 16 =1299.84
【答案】(1)167.3
(2) 43.16
【详解】(1)把男生样本记为 x1、x2、L、x34,其平均数记为 x ,方差记为 s2x ;
把女生样本记为 y1、y2、L、y y s
2
16 ,其平均数记为 ,方差记为 y ;
把总样本数据的平均数记为 z ,方差记为 s2 .
x =170.5, s2 2则 x =15, y =160.5, sy = 35,
z 170.5 34 +160.5 16 5797.0 + 2568故 = = =167.3 .
50 50
34
(2 2)由分层方差公式可得 s = é 15 + 170.5 -167.3
2 ù 16
+
é
35 + 160.5 -167.3
2 ù
50 50
34 15 + 3.22 16 35 + 6.82 858.16 1299.84
= + = + = 43.16 .
50 50 50 50
据此估计高一总方差为 43.16 .专题 4.1 统计
知识点 1 抽样
1.统计的相关概念
名称 定义
总体 调查对象的全体称为整体
个体 组成整体的每一个调查对象称为个体
样本 从总体中抽取的那部分个体称为样本
样本容量 样本中包含的个体数称为样本容量
样本与样本量的区别:样本是从总体中抽取的个体组成的集合,是对象;样本量是样本中个体的数目,是
一个数.
二、简单随机抽样
设一个总体含有 N 个个体,从中逐个不放回抽取 n 个个体作为样本( n N ),如果每
定义
次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样
把总体中的 N 个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每
抽签法
方法 次从中抽取一个号签,连续抽取 n 次,就得到一个容量为 n 的样本
随机数法 利用随机数表、随机数骰子或计算机产生的随机数进行抽样
①都属于简单随机抽样,并且要求被抽取样本的总体的个体数有限;
抽签法
相同点
与随机 ②都是从总体中逐个不放回地进行抽取
数法 不同点 ①抽签法比随机数法操作简单;
②随机数法更适用于总体中个体数较多的时候,而抽签法适用于总体中个体数较少的情况
利用随机数法抽取个体时的注意事项:
①定起点:事先应确定以表中的哪个数(哪行哪列)作为起点.
②定方向:读数的方向(向左、向右、向上或向下都可以).
③读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三
位地读取,如果出现重复则跳过,直到取满所需的样本个体数.
三、分层抽样
①定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,
将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
②应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.
注意:分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘以抽样比.
重难点 1 统计有关概念
1.某县教育局为了解本县今年参加大联考的学生的成绩,从 5000 名参加今年大联考的学生中抽取了 250
名学生的成绩进行统计,则下列表述正确的是(  )
A.5000 名学生是总体
B.抽取的 250 名学生的成绩是总体的一个样本
C.样本量是 250 名学生的成绩
D.每一名学生是个体
2.(多选)某市场监管局从所管辖的某超市在售的 40 种冷冻饮品中抽取了 20 种冷冻饮品,对其质量进行
了检查,则(  )
A.该市场监管局的调查方法是全面调查
B.样本容量是超市的 20 种冷冻饮品
C.总体是超市在售的 40 种冷冻饮品的质量
D.样本的个体是抽取的 20 种冷冻饮品中每种冷冻饮品的质量
3.(多选)从某年级的 500 名学生中抽取 60 名学生进行体重的统计分析,下列说法正确的是( )
A.500 名学生是总体
B.每名学生是个体
C.学生的体重是变量
D.抽取的 60 名学生的体重是样本容量
4.从一批零件中抽取 10 个零件,测得它们的长度(单位:cm)如下:22.36 22.35 22.33 22.35 
22.37 22.34 22.38 22.36 22.32 22.35
在此统计活动中:
(1)总体为: ;
(2)个体为: ;
(3)样本为: ;
(4)样本量为: .
5.为了了解参加运动会的 2000 名运动员的年龄情况,从中抽取 20 名运动员的年龄进行统计分析.关于
这个问题,下列说法中正确的是 .
①2000 名运动员是总体;
②每个运动员是个体;
③所抽取的 20 名运动员是一个样本;
④样本量为 20;
⑤可采用随机数法抽样.
6.某市为了调研全市 10800 名高一学生期中考试的答题习惯,共抽取 25 袋答题卡,每袋都装有 30 份答
题卡,则本次抽样的样本量是 .
重难点 2 简单随机抽样
7.某中学高一年级有 400 人,高二年级有 320 人,高三年级有 280 人,若用随机数法在该中学抽取容量
为 n 的样本,每人被抽到的可能性都为 0.2,则 n 等于(  )
A.80 B.160 C.200 D.280
8.某工厂利用随机数表对生产的 50 个零件进行抽样测试,先将 50 个零件进行编号,编号分别为 01,
02,…,50,从中抽取 5 个样本,下面提供随机数表的第 1 行到第 2 行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第 1 行第 9 列开始向右依次读取数据,则得到的第 4 个样本编号是( )
A.50 B.09 C.71 D.20
9.在简单随机抽样中,下列关于其中一个个体被抽中的可能性说法正确的是(  )
A.与第几次抽样有关,第一次抽到的可能性更大一些
B.与第几次抽样有关,最后一次抽到的可能性更大一些
C.与第几次抽样无关,每次抽到的可能性都相等
D.与第几次抽样有关,第一次抽到的可能性更小一些
10.总体由编号 01,02,…,29,30 的 30 个个体组成.利用下面的随机数表选取 6 个个体,选取方法是
从如下随机数表的第 1 行的第 6 列和第 7 列数字开始由左到右依次选取两个数字,则选出来的第 5 个个体
的编号为( )
第 1 行 78 16 62 32 08 02 62 42 62 52 53 69 97 28 01 98
第 2 行 32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
A.19 B.25 C.26 D.24
11.某单位有职工 450 人,其中男职工 150 人,现为了解职工健康情况,该单位采取分层随机抽样的方法
抽取了一个容量为 90 的样本,得出体重情况:男性平均体重为 63 千克;女性平均体重为 54 千克.则下列
说法不正确的是( )
A.抽查的样本中女职工人数为 60
B.该单位男职工的体重普遍比女职工较重
C.估计该单位职工平均体重为 58.5
1
D.每一位男或女职工被抽中的可能性均为
5
12.某乡镇有居民 20000 户,从中随机抽取 200 户调查是否安装宽带网线,调查结果如表所示,则该乡镇
已安装宽带网线的居民大约有 户.
网线 动迁户 原住户
已安装 65 30
未安装 40 65
重难点 3 分层抽样
13.为了保证采用分层随机抽样方法时每个个体被等可能地抽取,必须要求( )
A.每层等可能抽取
B.每层抽取的个体数相等
n
C.每层抽取的比例为 (其中 n 为抽取的样本容量,N 是总体容量)
N
D.只要抽取的样本容量一定,每层抽取的个体数没有限制
14.中国农历的“二十四节气”是凝结着中华民族的智慧与传统文化的结晶.某小学一年级随机抽查 100 名
学生并提问“二十四节气歌”,只能说出两句的有 32 人,能说出三句或三句以上的有 45 人,据此估计该校
一年级的 400 名学生中对“二十四节气歌”只能说出一句或一句也说不出的人数为(  )
A.23 B.92
C.128 D.180
15.随着老龄化时代的到来,某社区为了探讨社区养老模式,在社区内对 2400 名老年人、2400 名中年人、
2100 名青年人用分层抽样方法随机发放了调查问卷 345 份,则在老年人中发放的调查问卷份数是( )
A.110 B.115 C.120 D.125
16.某校高二年级有学生 1400 人,其中女生 714 人,用分层抽样方法抽取容量为 100 的一个样本,则所
抽男生人数是( )
A.52 B.51 C.49 D.48
17.某大学共有教师 1000 人,其中教授、副教授、讲师、助教的人数比为 1:4:3:2,现用分层抽样的
方法从全校所有教师中抽取一个容量为 40 的样本,讲师应抽取的人数为 .
18.某校有高一学生 n名,其中男生数与女生数之比为6 : 5,为了解学生的视力情况,现要求按分层抽样
n
的方法抽取一个样本容量为 的样本,若样本中男生比女生多12人,则 n .
10
19.某高级中学共有学生 3 000 名,各年级男、女生的人数如表:
高一年级 高二年级 高三年级
女生 487 x y
男生 513 560 z
已知高二年级女生比高一年级女生多 53 人.
(1)高二年级有多少名女生?
(2)现对各年级用比例分配的分层随机抽样的方法从全校抽取 300名学生,应从高三年级抽取多少名学生?
重难点 4 抽样的合理选择
20.现须完成下列 2 项抽样调查:①从 12 瓶饮料中抽取 4 瓶进行食品卫生检查;②某生活小区共有 540
名居民,其中年龄不超过 30 岁的有 180 人,年龄在超过 30 岁不超过 60 岁的有 270 人,60 岁以上的有 90
人,为了解居民对社区环境绿化方面的意见,拟抽取一个容量为 30 的样本.较为合理的抽样方法分别为
( )
A.①抽签法,②分层随机抽样 B.①随机数法,②分层随机抽样
C.①随机数法,②抽签法 D.①抽签法,②随机数法
21.现要完成下列 2项抽样调查:
①从盒饼干中抽取 4盒进行食品卫生检查;
②某中学共有360名教职工,其中一般教师 280名,行政人员55名,后勤人员 25名,为了了解教职工对
学校在校务公开方面的意见,拟抽取一个容量为 72的样本,较为合理的抽样方法是( )
A.①简单随机抽样,②分层抽样
B.①简单随机抽样,②简单随机抽样
C.①分层抽样,②分层抽样
D.①分层抽样,②简单随机抽样
22.某校为了了解高二学生的身高情况,打算在高二年级 12 个班中抽取 3 个班,再按每个班男女生比例
抽取样本,正确的抽样方法是( )
A.简单随机抽样 B.先用分层抽样,再用随机数表法
C.分层抽样 D.先用抽签法,再用分层抽样
23.某集团有老年职工 270 人,中年职工 540 人,青年职工 810 人.为了更好地调查他们的健康情况,需
从所有职工中抽取一个容量为 36 的样本,应采用的抽样方法是 .(用“简单随机抽样”或“分层抽样”
填空)
24.某企业共有 3200 名职工,其中,中年、青年、老年职工的比例为 5:3:2,从所有职工中抽取一个
样本容量为 400 的样本.
(1)应采用哪种抽样方法更合理?
(2)中年、青年、老年职工应分别抽取多少人?
25.判断下面的抽样方法是否为简单随机抽样,并说明理由.
(1)某商品的市场调查员为了了解该商品在某日某超市的销售情况,在超市出口处随机向 10 个顾客询问是
否购买了该商品
(2)某班 45 名同学,指定个子最矮的 5 名同学参加学校组织的某项活动;
(3)从 20 个相同的零件中一次性抽出 3 个进行质量检查
知识点 2 频率分布直方图
1.画频率分布直方图的步骤
第 1步:求极差(即一组数据中最大值与最小值的差);
第 2步:决定组距与组数;
第 3步:将数据分组;
第 4步:列频率分布表;
第 5步:画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).
2.频率分布直方图的性质
落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于 1.
知识点 3 数字特征
1.众数、中位数、平均数
数字特征 样本数据 频率分布直方图
众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标
将数据按大小依次排列,处在最中间位置的一个 把频率分布直方图划分左右两个面积相等
中位数
数据(或最中间两个数据的平均数) 的分界线与 x 轴交点的横坐标
每个小矩形的面积乘以小矩形底边中点的
平均数 样本数据的算术平均数
横坐标之和
2.极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
方差: s2 1 [(x1 - x )
2 + (x - x )22 +L+ (xn - x )
2 ] .
n
1 2 2 2
标准差: s [(x1 - x ) + (x - x ) +L+ (x - x ) ] .n 2 n
注:方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标
准差、方差越小,数据的离散程度越小,越稳定.
3.性质
(1)若 x1, x2 ,L, xn 的平均数为 x ,那么mx1 + a,mx2 + a,L, mxn + a 的平均数为mx + a .
(2)数据 x1, x2 ,L, xn 与数据 x1 x1 + a, x2 x2 + a,L, xn xn + a 的方差相等,即数据经过平移后方
差不变.
(3)若 x1, x2 ,L, xn 的方差为 s2,那么 ax1 + b, ax2 + b,L, ax
2 2
n + b 的方差为 a s .
知识点 4 百分位数
1.定义:一组数据的第 p 百分位数是这样一个值,它使得这组数据中至少有 p% 的数据小于或等于这个值,
且至少有 (100- p)% 的数据大于或等于这个值.
2.计算一组几个数据第 p 百分位数的步骤
第 1 步,按从小到大排列原始数据;
第 2 步,计算 i=n p% .
第 3 步,若 i 不是整数,而大于 i 的比邻整数为 j,则第 p 百分位数为第 j 项数据;若 i 是整数,则第 p 百
分位数为第 i 项与第(i+1)项数据的平均数.
3.四分位数
即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数.
其中第 25 百分位数也称为第一四分位数或下四分位数等,第 75 百分位数也称为第三四分位数或上四分位
数等.
重难点 5 统计图与实际问题
26.每到春夏交替时节,雌性杨树会以满天飞絮的方式来传播下一代,漫天飞舞的杨絮易引发皮肤病、呼
吸道疾病等,给人们造成困扰.为了解市民对治理杨絮方法的赞同情况,某课题小组随机调查了部分市民
(问卷调查表如下表所示),并根据调查结果绘制了尚不完整的统计图(如图所示).
治理杨絮——您选哪一项?(单选)
a.减少杨树新增面积,控制杨树每年的栽种量
b.调整树种结构,逐渐更换现有杨树
c.选育无絮杨品种,并推广种植
d.对雌性杨树注射生物干扰素,避免产生飞絮
e.其他
由两个统计图可知,选择 d 的人数和扇形统计图中 e 的圆心角度数分别为( )
A.500, 28.8° B.250, 28.6° C.500, 28.6° D.250, 28.8°
27.甲、乙两所学校的男、女生比例如图所示,已知甲校学生总数为 1000,乙校学生总数为 900,下列结
论错误的是( )
A.甲校男生比乙校男生多 B.乙校女生比甲校女生少
C.甲校男生比乙校女生少 D.乙校男生比甲校女生少
28.已知全国农产品批发价格 200 指数月度变化情况如图所示,下列选项正确的是( )
A.全国农产品夏季价格比冬季低
B.全国农产品批发价格 200 指数 2023 年每个月逐渐增加
C.2023 年“菜篮子”产品批发价格指数与农产品批发价格 200 指数的变化趋势基本保持一致
D.2023 年 6 月农产品批发价格 200 指数大于 116
29.(多选)恩格尔系数是食品支出总额占个人消费支出总额的比重,恩格尔系数达 59%以上为贫困,
50%~59%为温饱,40%~50%为小康,30%~40%为富裕,低于 30%为最富裕.国家统计局 2023 年 1 月
17 日发布了我国 2022 年居民收入和消费支出情况,根据统计图表,如图甲、乙所示,下列说法正确的是
( )
A.2022 年农村居民人均可支配收入增长额超过城镇居民人均可支配收入增长额
B.2022 年城镇居民收入增长率快于农村居民
C.从恩格尔系数看,可认为我国在 2022 年达到富裕
D.2022 年全国居民人均消费支出构成中食品烟酒和居住占比超过 50%
30.(多选)空气质量指数 AQI 是反映空气质量状况的指数,AQI 指数的值越小,表明空气质量越好,AQI
指数不超过 50,空气质量为“优”;AQI 指数大于 50 且不超过 100,空气质量为“良”;AQI 指数大于 100,
空气质量为“污染”.如图是某市 2023 年空气质量指数(AQI)的月折线图.下列关于该市 2023 年空气质量
的叙述中,说法正确的是( )
A.全年平均 AQI 指数对应的空气质量等级为优或良
B.每月都至少有一天空气质量为优
C.2 月、8 月、9 月和 12 月均出现污染天气
D.空气质量为“污染”的天数最多的月份是 2 月份
31.(多选) 2021年 7 月,中共中央办公厅、国务院办公厅印发《关于进一步减轻义务教育阶段学生作业
负担和校外培训负担的意见》,明确要求初中生每天的书面作业时间不得超过90分钟.某校随机抽取部分
学生进行问卷调查,并将调查结果制成如下不完整的统计图表.则下列说法正确的是(  )
作业时间频数分布表
组别 作业时间(单位:分钟) 频数
A 60 < t 70 8
B 70 < t 80 17
C 80 < t 90 m
D t > 90 5
A.调查的样本容量为50
B.频数分布表中m 的值为20
C.若该校有1000名学生,作业完成的时间超过90分钟的约100人
D.在扇形统计图中 B 组所对的圆心角是144o
重难点 6 频率分布直方图的应用
32.某高校调查了 200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中
自习时间的范围是 17.5,30 ,样本数据分组为 17.5,20 , 20,22.5 , 22.5,25 , 25,27.5 , 27.5,30 .根
据直方图,这 200名学生中每周的自习时间不少于 22.5小时的人数是( )
A.56 B.60 C.120 D.140
33.为了了解某校高三学生的视力情况,随机抽查了该校 100 名高三学生的视力情况,得到频率分布直方
图如图所示,由于不慎将部分数据丢失,但知道后 5 组的频数和为 64,最大频率为0.34 ,设视力在 4.6到
4.8之间的学生人数为 a,则 a 的值为( )
A.27 B.48 C.54 D.64
34.(多选)将样本容量为 100 的样本数据分为 4 组: 2,6 , 6,10 , 10,14 , 14,18 ,得到频率分布直方图
如图所示,则下列说法中正确的是( )
A.样本数据分布在 6,10 内的频率为 0.32
B.样本数据分布在 10,14 内的频数为 40
C.样本数据分布在 2,10 内的频数为 40
D.估计总体数据大约有10% 分布在 10,14 内
35.(多选)供电部门对某社区1000位居民 12 月份人均用电情况进行统计后,按人均用电量分为 0,10 ,
10,20 , 20,30 , 30,40 , 40,50 五组,整理得到如图所示的频率分布直方图,则有关这1000位居民,
下列说法正确的是(  )
A.12 月份人均用电量人数最多的一组有 400 人
B.12 月份人均用电量在 20,30 内的有 300 人
C.12 月份人均用电量不低于 20 度的有 500 人
D.在这1000位居民中用比例分配的分层随机抽样方法抽取 10 位居民协助收费,抽到的居民用电量
在 30,40 一组的人数为 2
36.某电视台在本省内 15~65 岁的人群中随机抽取了 n 人回答问题“本省著名旅游景点有哪些”,统计结
果如图表所示.
组号 分组 回答正确的人数 回答正确的人数占本组的频率
第 1 组 15,25 a 0.5
第 2 组 25,35 18 x
第 3 组 35,45 b 0.9
第 4 组 45,55 9 0.36
第 5 组 55,65 3 y
(1)分别求出 a,b,x,y 的值;
(2)从第 2,3,4 组回答正确的人中用分层随机抽样的方法抽取 6 人,求第 2,3,4 组每组各抽取多少人?
37.某校高一某班的某次数学测试成绩(满分 100 分,单位:分)如下:56,58,62,63,63,65,66,
68,69,71,72,72,73,74,75,76,77,78,79, ,90,95,由于保存不利,其中
80,90 内的成绩被墨水覆盖.根据该数据绘制的频率分布直方图(如图)也被墨水覆盖了部分区域.
(1)求成绩在区间 50,60 内的频率及抽样人数;
(2)求成绩在区间 80,90 内的频数,并计算频率分布直方图中区间 80,90 对应的小长方形的高.
38.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,
画出频率分布直方图如图所示,图中从左到右各小矩形的面积之比为 2∶4∶17∶15∶9∶3,第二小组的
频数为 12.
(1)第二小组的频率是多少?样本量是多少?
(2)若次数在 110 以上(含 110 次)为达标,则该校全体高一年级学生的达标率是多少?
(3)试求样本中不达标的学生人数;
(4)试求样本中次数在 130 以上(含 130 次)的学生人数.
重难点 7 平均数、众数、中位数与直方图
39.某校为了解在校学生对中国传统文化的传承认知情况,随机抽取了 100 名学生进行中国传统文化知识
考试,并将这 100 名学生成绩整理得到如下频率分布直方图.根据此频率分布直方图(分成 40,50 ,
50,60 , 60,70 , 70,80 , 80,90 , 90,100 六组),下列结论中不正确的是( )
A.图中的 a 0.012
B.若从成绩在 70,80 , 80,90 , 90,100 内的学生中采用分层抽样抽取 10名学生,则成绩在 80,90
内的有 3 人
C.这 100 名学生成绩的中位数约为 65
D.若同一组中的数据用该组区间的中点值作代表,则这 100 名学生的平均成绩约为 68.2
40.(多选)在一次考试中,某地抽取一组样本,将学生的考分按 0,10 , 10, 20 ,…, 90,100 分成 10
组,得到如下频率分布直方图:
根据频率分布直方图,则下列结论正确的是( )
A.规定分数不低于 60 分为及格,则及格率为 0.6
B.样本的中位数为 60
C.以频率作为概率,每组数据区间中点作代表,估计该地此次考试的平均分为 60 分
D.规定此次考试 80%的考生定为合格等级,则合格等级的学生最低分为 40 分
41.某医院急救中心随机抽取 20 位病人等待急诊的时间记录如下表:
等待时间/分 [0,5) [5,10) [10,15) [15,20) [20,25]
频数 4 8 5 2 1
用上述分组资料计算出病人平均等待时间的估计值 x = 分.
42.2022 年 11 月卡塔尔世界杯如期举行,这是世界足球的一场盛宴.为了了解全民对足球的热爱程度,
组委会在某场比赛结束后,随机抽取了 1000 名观众进行对足球“喜爱度”的调查评分,将得到的分数分成 6
段: 70,75 , 75,80 , 80,85 , 85,90 , 90,95 , 95,100 ,得到如图所示的频率分布直方图.图中
部分数据丢失,若已知这 1000 名观众评分的中位数估计值为 87.5,则 m= .
43.我国中学生的近视率一直是社会关注的焦点.某市疾控中心为调查该市高中生的视力状况,从某高中
3000 名学生中随机抽取了 100 名学生用五分记录法统计了其裸眼视力,得到如图 1 所示的频率分布直方
图:
为改善学生的视力状况,该校积极落实学生近视防控工作,建立视力监测制度,几年后,再次抽取 100 名
学生,用五分记录法统计其裸眼视力,得到如下频数分布表:
裸眼视力 4.4,4.6 4.6,4.8 4.8,5.0 5.0,5.2
人数 5 20 60 15
(1)若裸眼视力位于 4.7,5.0 为轻度近视,用样本估计总体,用频率估计概率,估计近视防控工作开展前
全校患轻度近视的学生人数;
(2)在图 2 中作出近视防控工作开展后 100 名学生裸眼视力的频率分布直方图;
(3)估计近视防控工作开展后该校学生裸眼视力比开展前学生裸眼视力的平均值提高了多少(同一组中的
数据用该组区间的中点值为代表).
44.对某校高三年级学生参加社区服务的次数进行统计,随机抽取 M 名学生,得到这 M 名学生参加社区
服务的次数,根据此数据作出如下频率分布表和频率分布直方图.
分组 频数 频率
[10,15) 10 0.20
[15,20) 24 n
[20,25) m p
[25,30] 2 0.04
合计 M 1
(1)求出表中 M,p 及图中 a 的值;
(2)若该校有高三学生 300 人,试估计该校高三学生参加社区服务的次数在区间[15,20)内的人数;
(3)估计该校高三学生参加社区服务次数的众数、中位数及平均数.(保留一位小数)
45.从某小学随机抽取 100 名学生,将他们的身高(单位:厘米)数据绘成频率分布直方图(如图).
(1)由图中数据求 a的值和中位数;
(2)若要从身高在 120,130 , 130,140 , 140,150 三组内的学生中,用分层抽样的方法选取 12 人参加一项
活动,则从身高在 140,150 内的学生中选取的人数应为多少?
重难点 8 标准差、方差、极差
46.某校举行“云翔杯”学生篮球比赛,统计部分班级的得分数据如下.
班级 1 2 3 4 5 6 7 8
得分 28 34 34 30 26 28 28 32
则( )
A.得分的中位数为 28 B.得分的极差为 8
C.得分的众数为 34 D.得分的平均数为 31
47.已知一组样本数据 x1, x2 ,L, x5的方差为 10,且 x1 + x3 x2 + x4 ,则样本数据 x1 -1, x2 +1, x3 -1, x4 +1, x5
的方差为( )
A.9.2 B.10.8 C.9.75 D.10.25
48.(多选)“体育强则中国强,国运兴则体育兴”.为备战 2024 年巴黎奥运会,运动员们都在积极参加集
训,已知某跳水运动员在一次集训中 7 位裁判给出的分数分别为:9.1,9.3,9.4,9.6,9.8,10,10,则
这组数据的( )
A.平均数为 9.6 B.众数为 10
37
C.第 80 百分位数为 9.8 D.方差为
350
49.了解某中学学生的身高情况,采用分层随机抽样的方法抽取了 30 名男生,20 名女生.已知男生身高的
平均数为 170cm,方差为 16,女生身高的平均数为 165 cm,方差为 25,则可估计该校学生身高的平均数
为 cm,方差为 .
50.若一组数据 m,n,9,8,10 的平均数为 9,方差为 2,则 m - n .
51.某工厂甲、乙两名工人参加操作技能培训,他们在培训期间参加的 8 次测试成绩记录如下:
甲:95 82 88 81 93 79 84 78
乙:83 92 80 95 90 80 85 75
(1)哪个工人的成绩较好?
(2)甲、乙成绩位于[x - s, x + s]内的有多少?
重难点 9 百分位数
52.样本数据 24,13,14,18,12,14,20,16 的 75%分位数为( )
A.17 B.18 C.19 D.20
54.数据 3.2,3.4,3.8,4.2,4.3,4.5,x,6.6 的第 65 百分位数是 4.5,则实数 x 的取值范围是( )
A.[4.5, + ) B.[4.5,6.6)
C. (4.5,+ ) D. (4.5,6.6]
55.(多选)已知 100 个数据的 75%分位数是 9.3,则下列说法正确的是( )
A.这 100 个数据中至少有 75 个数小于或等于 9.3
B.把这 100 个数据从小到大排列后,9.3 是第 75 个数据
C.把这 100 个数据从小到大排列后,9.3 是第 75 个数据和第 76 个数据的平均数
D.把这 100 个数据从小到大排列后,9.3 是第 74 个数据和第 75 个数据的平均数
56.从高三抽出 50 名学生参加数学竞赛,由成绩得到如图的频率分布直方图,则估计这 50 名学生成绩的
75%分位数为 分.
57.为深入贯彻落实习近平总书记对天津工作“三个着力”重要要求,天津持续深化改革,创建全国文明城
区,城市文明程度显著提升,人民群众的梦想不断实现.在创建文明城区的过程中,中央文明办对某小区
居民进行了创建文明城区相关知识网络问卷调查,从本次问卷中随机抽取了 50 名居民的问卷结果,统计
其得分数据,将所得 50 份数据的得分结果分为 6 组: 40,50 , 50,60 , 60,70 , 70,80 , 80,90 , 90,100 ,
并整理得到如下的频率分布直方图,则该小区居民得分的第 70 百分位数为 .
58.某校从高一年级中随机抽取部分学生,将他们的期末数学测试成绩分成 6 组:
40,50 , 50,60 , 60,70 , 70,80 , 80,90 , 90,100 加以统计,得到如图所示的频率分布直方图.据此统计,
期末数学测试成绩不少于60% 分位数的分数至少为 分.
重难点 10 平均数、方差、标准差的性质
59.已知数据 x1, x2 , x3 ,L, x8 的平均数为 10,方差为 10,则3x1 + 2,3x2 + 2,3x3 + 2,L,3x8 + 2的平均数和方差
分别为( )
A.32,90 B.32,92 C.30,90 D.30,92
60.已知样本数据 x1, x2 ,L, x100 的平均数和标准差均为 4,则数据-x1 -1, -x2 -1,L,-x100 -1的平均数与标准
差分别为( )
A.-5,4 B.-5,16 C. 4,16 D. 4,4
61.设样本数据x1,x2,L, x2023的平均数为 x ,方差为 s2 ,若数据 2 x1 +1 , 2 x2 +1 ,L, 2 x2023 +1
2
的平均数比方差大 4,则 s2 - x 的最大值是 .
62.(多选)一组数据 x1, x2, x3,L, xn的平均值为 5,方差为 2,极差为 7,中位数为 6,记3x1 -1,
3x2 -1,3x3 -1,L,3xn -1的平均值为 a,方差为b ,极差为 c,中位数为d ,则( )
A. a 14 B.b 12 C. c 21 D. d 17
63.(多选)有一组样本数据 x1, x2 , × × ×, xn ,另一组样本数据 y1, y2 ,× × ×, yn ,其中 yi xi - 2c i 1,2, × × ×,n ,c
为非零常数,则( )
A.两组样本数据平均数相同 B.两组样本数据方差相同
C.两组样本数据中位数相等 D.两组样本数据极差相同
64.(多选)高一某次数学考试中,某班学生原始成绩最高分为 100 分,最低分为 20 分,现将每个学生的
原始分数 x 按 y ax + b (a,b 为常数, a > 0)进行转换, y 是转换后的分数,转换后,全班最高分为 100
分,最低分为 60 分,则下列结论正确的是( )
A.转换后分数的众数的个数不变
B.转换后分数的标准差是原始分数标准差的 0.5 倍
C.转换后分数的平均数一定大于原始分数的平均数
D.转换后分数的中位数一定大于原始分数的中位数
重难点 11 分层方差计算总体方差
65.在一次数学模考中,从甲 乙两个班各自抽出 10 个人的成绩,甲班的十个人成绩分别为 x1 x2 L x10,
乙班的十个人成绩分别为 y1, y2 ,L, y10 .假设这两组数据中位数相同 方差也相同,则把这 20 个数据合并后
( )
A.中位数一定不变,方差可能变大
B.中位数可能改变,方差可能变大
C.中位数一定不变,方差可能变小
D.中位数可能改变,方差可能变小
66.(多选)若一组样本数据 x1, x2 ,L, x10 的平均数为 x x 0 ,标准差为 s,另一组样本数据 x11, x12 ,L, x20
的平均数为3x ,标准差为 s .两组数据合成一组新数据 x1, x2 ,L, x10 , x11, x12 ,L, x20,新数据的平均数为 y ,标
准差为 s ,则( )
A. y > 2x B. y 2x C. s > s D. s s
67.为培养学生的阅读习惯,某校开展了为期一年的“弘扬传统文化,阅读经典名著”活动.在了解全校学
生每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为 10 的样本,并算得样本的平均数为
5,方差为 9;乙同学抽取了一个容量为 8 的样本,并算得样本的平均数为 6,方差为 16.已知甲、乙两同
学抽取的样本合在一起组成一个容量为 18 的样本,则合在一起后的样本平均数为 ,方差为 .
(精确到 0.1)
68.在一个文艺比赛中,8 名专业人士和 12 名观众代表各组成一个评委小组,给参赛选手打分,根据打
分情况,得到专业人士组对选手 A 打分的平均数为 48,方差为 14,观众代表组对选手 A 打分的平均数为
56,方差为 140,则选手 A 得分的总方差为 .
69.在对北师大贵阳附中高一学生体重的调查中,采用按样本量比例分配的分层随机抽样,如果不知道样
本数据,只知道抽取了男生 30 人,其平均数和方差分别为 55 和 15,抽取了女生 20 人,其平均数和方差
分别为 45 和 20.则总样本的平均数为 ,总样本的方差为 .
70.某中学为了贯策教育部对学生的五项管理中的体质管理,对高一年级学生身高进行调查,在调查中,
采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男 34 人,其平均数和方差分
别为 170.5 和 15,抽取了女生 16 人,其平均数和方差分别为 160.5 和 35.
(1)由这些数据计算总样本的平均数;
(2)由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差作出估计.
2
参考数据: 15 + 3.2 34 858.16, 35 + 6.82 16 1299.84