第九章 第二节 用样本的数字特征估计总体(课件 学案 练习,共3份)2026届高中数学(通用版)一轮复习

文档属性

名称 第九章 第二节 用样本的数字特征估计总体(课件 学案 练习,共3份)2026届高中数学(通用版)一轮复习
格式 zip
文件大小 4.7MB
资源类型 教案
版本资源 通用版
科目 数学
更新时间 2025-05-14 07:52:04

文档简介

第二节 用样本的数字特征估计总体
1.(2025·江南十校联考)已知甲、乙两组数据(已按从小到大的顺序排列):甲组:27,28,39,40,m,50;乙组:24,n,34,43,48,52.若这两组数据的第30百分位数、第80百分位数分别相等,则=(  )
A.   B.   C.   D.
2.(2025·湖南长郡中学模拟)已知样本数据x1,x2,…,x100的平均数和标准差均为4,则数据-x1-1,-x2-1,…,-x100-1的平均数与方差分别为(  )
A.-5,4 B.-5,16
C.4,16 D.4,4
3.(2024·菏泽一模)已知样本数据为x1,x2,x3,x4,x5,x6,x7,去掉一个最大值和一个最小值后的数据与原来的数据相比,下列数字特征一定不变的是(  )
A.极差 B.平均数
C.中位数 D.方差
4.某校高一年级开设了校本课程,现从甲、乙两班各随机抽取了5名学生校本课程的学分,统计如下表所示,s1,s2分别表示甲、乙两班抽取的5名学生校本课程学分的标准差,则(  )
甲 8 11 14 15 22
乙 6 7 10 23 24
A.s1>s2 B.s1<s2
C.s1=s2 D.s1,s2的大小不能确定
5.〔多选〕(2025·阜阳模拟)关于一组样本数据的平均数、中位数、众数、频率分布直方图和方差,下列说法正确的是(  )
A.改变其中一个数据,平均数和众数都会发生改变
B.频率分布直方图中,中位数左边和右边的小矩形的面积应该相等
C.在数据的频率分布直方图中,众数一定是该直方图中最高矩形底边的某个(些)点的横坐标
D.样本数据的方差越小,说明样本数据的离散程度越小
6.〔多选〕(2024·菏泽三模)某灯具配件厂生产了一种塑胶配件,该厂质检人员某日随机抽取了100个该配件的质量指标值(单位:分)作为一个样本,得到如图所示的频率分布直方图,则(同一组中的数据用该组区间的中点值作代表)(  )
A.m=0.030
B.样本质量指标值的平均数为75
C.样本质量指标值的众数小于其平均数
D.样本质量指标值的第75百分位数为85
7.为调查某地区中学生每天睡眠时间,采用样本量比例分配的分层随机抽样方法,现抽取初中生800人,其每天睡眠时间的均值为9小时,方差为1,抽取高中生1 200人,其每天睡眠时间的均值为8小时,方差为0.5,则估计该地区中学生每天睡眠时间的方差为    .
8.(2024·新乡二模)若一组数据a1,a2,a3,a4,a5的平均数为3,方差为,则a1,a2,a3,a4,a5,9这6个数的平均数为    ,方差为    .
9.某种治疗心脏病的中药产品的质量以其质量指标值衡量,质量指标值越大表明质量越好.为了提高中药产品的质量,我国医疗科研专家攻坚克难,研发出A,B两种新配方,在这两种新配方生产的产品中随机抽取数量相同的样本,测量这些产品的质量指标值,规定质量指标值小于85为废品,在[85,115)为一等品,不小于115为特等品.现把测量数据整理如下,其中B配方的样本中有6件废品.
A配方的频数分布表
质量指标值 [75,85) [85,95) [95,105) [105,115) [115,125]
频数 8 a 36 24 8
(1)求实数a,b的值;
(2)试确定A配方和B配方哪一种更好.(说明:在统计方法中,同一组数据常用该组区间的中点值作代表)
10.(创新考法)设x1,x2,…,xn为样本数据,令f(x)=(xi-x)2,则f(x)的最小值点为(  )
A.样本众数 B.样本中位数
C.样本标准差 D.样本平均数
11.〔多选〕(2023·新高考Ⅰ卷9题)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则(  )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
12.(创新知识交汇)〔多选〕新高考模式下,化学、生物等学科实施赋分制,即通过某种数学模型将原始分换算为标准分.某校在一次高三模拟考试中实施赋分制的方式,其中应用的换算模型为:y=kx+b(k,b∈R),其中x为原始分,y为换算后的标准分.已知在本校2 000名高三学生中某学科原始分最高得分为150分,最低得分为50分,经换算后最高分为150分,最低分为80分.则以下说法正确的是(  )
A.若学生甲本学科考试换算后的标准分为115分,则其原始得分为100分
B.若在原始分中学生乙的得分为中位数,则换算后学生乙的分数仍为中位数
C.该校本学科高三全体学生得分的原始分与标准分的标准差相同
D.该校本学科高三全体学生得分的原始分的平均分低于标准分的平均分
13.某公司购买了A,B,C三种不同品牌的电动智能送风口罩.为了解三种品牌口罩的电池性能,现采用分层随机抽样的方法,从三种品牌的口罩中抽出25个,测试它们一次完全充电后的连续待机时长,统计的结果如下(单位:小时).
A:4 4 4.5 5 5.5 6 6
B:4.5 5 6 6.5 6.5 7 7 7.5
C:5 5 5.5 6 6 7 7 7.5 8 8
(1)已知该公司购买C品牌的电动智能送风口罩比B品牌多200个,则该公司购买B品牌的电动智能送风口罩的数量为    ;
(2)再从A,B,C三种不同品牌的电动智能送风口罩中各随机抽取一个,它们的待机时长分别是a,b,c(单位:小时).将这3个新数据与原来的数据构成的新数据的平均数记为μ1,原来数据的平均数记为μ0.若μ0≤μ1,则a+b+c的最小值为    .
14.我国现代气候学意义上从春季进入夏季的标志为连续5天的日平均气温均不低于22 ℃.现有与甲、乙、丙三地连续5天的日平均气温(单位:℃)的记录数据有关的结论如下(记录数据都是正整数):
①甲地5个数据的中位数为24,众数为22;
②乙地5个数据的中位数为27,平均数为24;
③丙地5个数据中有一个数据是32,平均数为26,方差为10.8.
则肯定进入夏季的地区有    (填序号).
第二节 用样本的数字特征估计总体
1.A 因为30%×6=1.8,大于1.8的比邻整数为2,所以第30百分位数为n=28,80%×6=4.8,大于4.8的比邻整数为5,所以第80百分位数为m=48,所以==.故选A.
2.B 由题意知样本数据x1,x2,…,x100的平均数和标准差均为4,则x1,x2,…,x100的方差为16,则-x1,-x2,…,-x100的平均数为-4,方差为(-1)2×16=16,故-x1-1,-x2-1,…,-x100-1的平均数为-4-1=-5,方差16,故选B.
3.C 样本数据为x1,x2,x3,x4,x5,x6,x7,去掉一个最大值和一个最小值后的数据与原来的数据相比,假设从小到大就是从x1到x7,极差可能变化,故A错误;平均数为=,可能变化,故B错误;中位数还是按从小到大排序中间位置的数,故C正确;方差为s2=[(x2-)2+(x3-)2+(x4-)2+(x5-)2+(x6-)2],有可能变化,故D错误.故选C.
4.B 甲班抽取的5名学生校本课程学分的平均数=×(8+11+14+15+22)=14,乙班抽取的5名学生校本课程学分的平均数=×(6+7+10+23+24)=14.甲班抽取的5名学生校本课程学分的方差=×[(8-14)2+(11-14)2+(14-14)2+(15-14)2+(22-14)2]=22,∴s1=,乙班抽取的5名学生校本课程学分的方差=×[(6-14)2+(7-14)2+(10-14)2+(23-14)2+(24-14)2]=62,∴s2=.∴s1<s2,故选B.
5.BCD 对于A中,例如:数据1,3,3,将数据改成2,3,3,数据的众数未改变,仍为3,A错误;对于B中,根据频率分布直方图中中位数的求法,频率分布直方图中,中位数左边和右边的小矩形的面积应该相等,B正确;对于C中,根据众数的意义可知,由频率分布直方图估计众数时,一般用最高矩形的中点横坐标近似代替,C正确;对于D中,样本数据方差越小,数据越稳定,离散程度越小,D正确.故选B、C、D.
6.ACD 对于A项,由题意知(0.010+0.015+m+0.035+0.010)×10=1,解得m=0.030,故A项正确;对于B项,样本质量指标值的平均数为55×0.1+65×0.15+75×0.35+85×0.3+95×0.1=76.5,故B项错误;对于C项,样本质量指标值的众数是=75<76.5,故C项正确;对于D项,前3组的频率之和为(0.010+0.015+0.035)×10=0.60,前4组的频率之和为0.60+0.030×10=0.90,故第75百分位数位于第4组,设其为t,则(t-80)×0.030+0.60=0.75,解得t=85,即第75百分位数为85,故D项正确.故选A、C、D.
7.0.94 解析:该地区中学生每天睡眠时间的平均数为=8.4(小时),则该地区中学生每天睡眠时间的方差为×[1+(9-8.4)2]+×[0.5+(8-8.4)2]=0.94.
8.4 8 解析:依题意,知这6个数的平均数为=4,又(-5×32)=,得=63,所以这6个数的方差为(+92-6×42)=×(63+92-6×42)=8.
9.解:(1)依题意,A,B两种配方的样本容量相同,设为n.
由B配方的样本中有6件废品,结合B配方的频率分布直方图,得=0.006×10,解得n=100.
∴a=100-(8+36+24+8)=24.
由(0.006+b+0.038+0.022+0.008)×10=1,得b=0.026.
∴实数a,b的值分别为24,0.026.
(2)由(1)及A配方的频数分布表得,A配方质量指标值的样本平均数=×(80×8+90×24+100×36+110×24+120×8)=×(200×8+200×24+100×36)=100,
A配方质量指标值的样本方差=×[(-20)2×8+(-10)2×24+0×36+102×24+202×8]=112.
由(1)及B配方的频率分布直方图得,B配方质量指标值的样本平均数=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100,
B配方质量指标值的样本方差=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.
综上,=,>,
即A,B两种配方质量指标值的样本平均数相等,但A配方质量指标值没有B配方质量指标值稳定,
∴B配方更好.
10.D 因为f(x)=(xi-x)2=(x2-2xxi+)=nx2-2nx+,所以f(x)为二次函数,因为n>0,函数图象开口向上,对称轴方程为x=,故最小值点为样本平均数.
11.BD 若该组样本数据为1,2,3,4,5,8,则2,3,4,5的平均数为,1,2,3,4,5,8的平均数为,两组数据的平均数不相等,故A错误;不妨设x1≤x2≤x3≤x4≤x5≤x6,则x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数,故B正确;若该组样本数据为1,2,2,2,2,8,则2,2,2,2的标准差为0,而1,2,2,2,2,8的标准差大于0,故C错误;由对选项B的分析可知,x2,x3,x4,x5的极差为x5-x2,x1,x2,x3,x4,x5,x6的极差为x6-x1,且易得x6-x1≥x5-x2,故D正确.故选B、D.
12.ABD 对A,由题意得 所以换算模型为y=0.7x+45.由115=0.7x+45 x=100,故A对;对B,因为函数y=0.7x+45为增函数,所以标准分不改变原始分的排名顺序,原始分的中位数换算后,得到的标准分仍为中位数,故B对;对C,由0.7x+45≥x x≤150,所以只有原始分是150分时,标准分与原始分相等,当原始分低于150分时,标准分都高于原始分,所以标准分相比于原始分,分数更集中,所以标准分的标准差比原始分的标准差要小,故C错误;对D,因为标准分都不低于原始分,所以原始分的平均分低于标准分的平均分,故D对.故选A、B、D.
13.(1)800 (2)18 解析:(1)设该公司购买B品牌的电动智能送风口罩x个,则购买C品牌的电动智能送风口罩为x个,由题意得x-x=200,所以x=800.
(2)计算可得μ0=6,为了满足μ0≤μ1,只要≥6,所以a+b+c≥18,a+b+c的最小值是18.
14.①③ 解析:①甲地连续5天的日平均气温的记录数据可能为:22,22,24,25,26,均不低于22,且不可能有低于22的数据出现,故甲地肯定进入夏季;②当乙地的5个数据为19,20,27,27,27时,满足平均数为24,但可能存在某天的日平均气温低于22 ℃,故不能确定乙地是否进入夏季;③若丙地有一个数据小于22,假设取21,此时方差就超出了10.8,所以丙地连续5天的日平均气温均不低于22 ℃.故丙地肯定进入夏季.
3 / 3第二节 用样本的数字特征估计总体
课标要求
1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.
2.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.
3.结合实例,能用样本估计总体的取值规律.
4.结合实例,能用样本估计百分位数,理解百分位数的统计含义.
1.总体百分位数的估计
(1)百分位数
定义 意义
百分 位数 一组数据的第p百分位数是这样一个值,它使得这组数据中    有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值 反映该组数中小于或等于该百分位数的分布特点
(2)求一组n个数据的第p百分位数的步骤
第1步:按从小到大排列原始数据;
第2步:计算i=     ;
第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
2.总体集中趋势的估计
(1)平均数:①若一组数据为x1,x2,…,xn,则该组数据的平均数=      ;
②加权平均数:如果总体的N个变量值中,不同的值共有k(k≤N)个.不妨记为y1,y2,…,yk,其中yi出现的频数为fi(i=1,2,…,k),则加权平均数为=fiyi;
③分层随机抽样的平均数:若一组数据是由分层随机抽样所得到的,其中第一层抽取m个,即x1,x2,…,xm,平均数为,第二层抽取n个,即y1,y2,…,yn,平均数为,则x1,x2,…,xm,y1,y2,…,yn的平均数=      .
(2)中位数:将一组数据按大小依次排列,处于    位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)众数:一组数据中出现次数    的数据叫做这组数据的众数.
提醒 (1)中位数是样本数据所占频率的等分线,不受少数极端值影响;(2)众数体现了样本数据的最大集中点,一组数据可能有n个众数,也可能没有众数;(3)与中位数、众数比较,平均数反映出样本数据的更多信息,对样本数据中的少数极端值更加敏感.
3.总体离散程度的估计
(1)假设一组数据x1,x2,x3,…,xn的平均数为,则:
①极差:max{x1,x2,…,xn}-min{x1,x2,…,xn};
②方差:s2=(xi-)2;
③标准差:s=.
(2)分层随机抽样的方差
分层随机抽样中,如果样本量是按比例分配,记总的样本平均数为,样本方差为s2,其中第一层抽取m个数据的平均数为,方差为,第二层抽取n个数据的平均数为,方差为,则该组数据的方差s2={m[+(-)2]+n[+(-)2]}.
1.频率分布直方图中的常见结论
(1)众数的估计值为最高矩形底边的中点对应的横坐标;(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和;(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.
2.平均数、方差的公式推广
若数据x1,x2,…,xn的平均数为,方差为s2,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a,方差为m2s2.
1.判断正误.(正确的画“√”,错误的画“×”)
(1)对一组数据来说,平均数和中位数总是非常接近.(  )
(2)方差与标准差具有相同的单位.(  )
(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.(  )
2.(人A必修二P181练习1题改编)为了合理调配电力资源,某市欲了解全市50 000户居民的日用电量.若通过简单随机抽样从中抽取了500户进行调查,得到其日用电量的平均数为5.5 kW·h,则可以推测全市居民用户日用电量的平均数(  )
A.一定为5.5 kW·h B.高于5.5 kW·h
C.低于5.5 kW·h D.约为5.5 kW·h
3.(人A必修二P203例2改编)某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则这7次成绩的第80百分位数为(  )
A.88.5 B.89
C.91 D.89.5
4.(人A必修二P224复习参考题3题改编)如果一组数据的中位数比平均数小很多,下列叙述一定错误的是(  )
A.数据中可能有异常值 B.这组数据是近似对称的
C.数据中可能有极端大的值 D.数据中众数可能和中位数相同
5.(人A必修二P216习题2题改编)甲、乙两台机床同时生产一种零件,在10天中,两台机床每天生产的次品数分别为:
甲:0 1 0 2 2 0 3 1 2 4
乙:2 3 1 1 0 2 1 1 0 1
分别计算这两组数据的平均数和标准差,从计算结果看    机床的性能更好.
总体百分位数的估计
(师生共研过关)
(1)(2024·江西重点中学盟校第一次联考)某工厂随机抽取40名工人,对他们某天生产的产品件数进行统计,数据如下表,则该组数据的第75百分位数是(  )
件数 7 8 9 10 11
人数 6 14 10 8 2
A.8.5   B.9   C.9.5   D.10
(2)将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出频率分布直方图如图,则此班模拟考试成绩的80%分位数是    .(结果保留两位小数)
听课记录                                                                                        解题技法
1.总体百分位数的估计需要注意的两个问题
(1)总体百分位数估计的基础是样本百分位数的计算,因此计算准确是关键;
(2)由于样本量比较少,因此对总体的估计可能存在误差,因此对总体百分位数的估计一般是估计值而非精确值.
2.由频率分布直方图求第p百分位数的方法
确定要求的p%分位数所在分组[A,B),由频率分布表或频率分布直方图可知,样本中小于A的频率为a,小于B的频率为b,所以p%分位数=A+组距×.
1.已知100个数据的第75百分位数是9.3,则下列说法正确的是(  )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数
2.(2025·武汉一调)已知一组数据1,2,3,4,x的上四分位数是x,则x的取值范围为(  )
A.{3}  B.[2,3]  C.[3,4]  D.{4}
总体集中趋势的估计
(师生共研过关)
(1)某射击运动员进行打靶练习,已知打十枪每发的环数分别为9,10,7,8,10,10,6,8,9,7,设其平均数为a,中位数为b,众数为c,则有(  )
A.a>b>c B.c>a>b
C.b>c>a D.c>b>a
(2)〔多选〕某城市在创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数,满分100分),从中随机抽取一个容量为100的样本,发现数据均在[40,100]内.现将这些分数分成6组并画出样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,则下列说法正确的是(  )
A.频率分布直方图中第三组的频数为10
B.根据频率分布直方图估计样本的众数为75分
C.根据频率分布直方图估计样本的中位数为75分
D.根据频率分布直方图估计样本的平均数为75分
听课记录                                                                                                                                      解题技法
求众数、中位数、平均数的方法
(1)众数:由定义知,一组数据中出现次数最多的数,即为众数,若有两个或几个数据出现的次数最多,且出现的次数一样,这些数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数;
(2)中位数:若一组数据为奇数个,按照从小到大(或从大到小)的顺序排列,位于中间位置的数据就是这组数据的中位数;若一组数据为偶数个,按照从小到大(或从大到小)的顺序排列,位于中间位置的两个数据的平均数就是这组数据的中位数;
(3)平均数:利用=xi求解.
1.下表是某城市某日在不同观测点对细颗粒物(PM2.5)的观测值:
396 275 268 225 168 166
176 173 188 168 141 157
若在此组数据中增加一个比现有的最大值大25的数据,则下列数字特征没有改变的是(  )
A.极差 B.中位数
C.众数 D.平均数
2.〔多选〕(2024·武汉四调)如图所示的频率分布直方图显示了三种不同的分布形态.图1形成对称形态,图2形成“右拖尾”形态,图3形成“左拖尾”形态,根据所给图作出以下判断,正确的是(  )
A.图1的平均数=中位数=众数
B.图2的平均数<众数<中位数
C.图2的众数<中位数<平均数
D.图3的平均数<中位数<众数
总体离散程度的估计
(定向精析突破)
考向1 方差与标准差
(2023·全国乙卷理17题)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:
试验序号i 1 2 3 4 5
伸缩率xi 545 533 551 522 575
伸缩率yi 536 527 543 530 560
试验序号i 6 7 8 9 10
伸缩率xi 544 541 568 596 548
伸缩率yi 533 522 550 576 536
记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为,样本方差为s2.
(1)求,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果≥2,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).
解题技法
  标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.
考向2 分层随机抽样的方差与标准差
(2024·鹰潭一模)某单位为了解职工体重情况,采用分层随机抽样的方法从800名职工中抽取了一个容量为80的样本.其中,男性平均体重为64千克,方差为151;女性平均体重为56千克,方差为159,男女人数之比为5∶3,则该单位职工体重的方差为(  )
A.166 B.167
C.168 D.169
听课记录                                              
解题技法
计算分层随机抽样的方差的步骤
(1)确定,,,;
(2)确定;
(3)应用公式s2=[+(-)2]+[+(-)2],计算s2.
1.〔多选〕(2025·新乡模拟)已知由5个数据组成的一组数据的平均数为7,方差为2,现再加入一个数据1,组成一组新数据,则(  )
A.这组新数据的平均数为3
B.这组新数据的平均数为6
C.这组新数据的方差为
D.这组新数据的方差为
2.(2024·赣州模拟)若一组样本数据x1,x2,…,x8的方差为2,(-1)ixi=-2,yi=xi+(-1)i(i=1,2,…,8),则样本数据y1,y2,…,y8的方差为    .
3.某班成立了A,B两个数学兴趣小组,A组10人,B组30人,经过一周的补习后进行了一次测试,在该测试中,A组的平均成绩为130分,方差为115,B组的平均成绩为110分,方差为215.则在这次测试中全班学生的平均成绩为    分,方差为    .
第二节 用样本的数字特征估计总体
【知识·逐点夯实】
知识梳理夯基
1.(1)至少 (2)n×p%
2.(1)①(x1+x2+…+xn)
③+ (2)最中间 (3)最多
对点自测诊断
1.(1)× (2)× (3)√
2.D 3.B 4.B 5.乙
【考点·分类突破】
考点1
【例1】 (1)C (2)124.44 解析:(1)抽取的工人总数为40,40×75%=30,那么第75百分位数是所有数据从小到大排序的第30项与第31项数据的平均数,由图表可知第30项与第31项数据分别为9,10,所以第75百分位数是=9.5,故选C.
(2)由频率分布直方图可知,分数在120分以下的学生所占的比例为(0.01+0.015+0.015+0.03)×10×100%=70%,分数在130分以下的学生所占的比例为(0.01+0.015+0.015+0.03+0.022 5)×10×100%=92.5%,因此80%分位数一定位于[120,130)内.因为120+×10≈124.44,所以此班模拟考试成绩的80%分位数约为124.44.
跟踪训练
1.C 因为100×75%=75,为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,则C正确,其他选项均不正确,故选C.
2.C 在五个数中,上四分位数为第二大的数,故1,2,3,4,x中第二大的数是x,所以3≤x≤4.
考点2
【例2】 (1)D (2)ABC 解析:(1)将9,10,7,8,10,10,6,8,9,7按从小到大的顺序排列为6,7,7,8,8,9,9,10,10,10,则众数为c=10,中位数为b=×(8+9)=8.5,平均数为a=×(6+7+7+8+8+9+9+10+10+10)=8.4,所以c>b>a.故选D.
(2)分数在[60,70)内的频率为1-10×(0.005+0.020+0.030+0.025+0.010)=0.10,所以第三组的频数为100×0.10=10,故A正确;因为众数的估计值是频率分布直方图中最高矩形底边中点的横坐标,从图中可看出众数的估计值为75分,故B正确;因为(0.005+0.020+0.010)×10=0.35<0.5,(0.005+0.020+0.010+0.030)×10=0.65>0.5,所以中位数位于[70,80)内,设中位数为x,则0.35+0.03(x-70)=0.5,解得x=75,所以中位数的估计值为75分,故C正确;样本平均数的估计值为45×(10×0.005)+55×(10×0.020)+65×(10×0.010)+75×(10×0.030)+85×(10×0.025)+95×(10×0.010)=73(分),故D错误.
跟踪训练
1.C 在此组数据中增加一个比现有的最大值大25的数据后,所得的一组新数据从小到大排列为141,157,166,168,168,173,176,188,225,268,275,396,421.对于A,所得的新数据的极差为421-141=280,原来数据的极差为396-141=255,故A不正确;对于B,原来数据的中位数为=174.5,所得的新数据的中位数为176,故B不正确;对于C,原来数据与新数据的众数均为168,故C正确;对于D,设原来的数据的平均数为,则421>,所以所得的新数据的平均数>=,故D不正确.
2.ACD 图1所示的频率分布直方图是对称的,所以平均数=中位数=众数,故A正确;图2众数最小,右拖尾平均数大于中位数,故B错误,C正确;图3左拖尾众数最大,平均数小于中位数,故D正确.故选A、C、D.
考点3
【例3】 解:(1)由题意,求出zi的值如表所示,
试验序号i 1 2 3 4 5 6 7 8 9 10
zi 9 6 8 -8 15 11 19 18 20 12
则=×(9+6+8-8+15+11+19+18+20+12)=11,
s2=×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.
(2)因为2=2=,=11=>,
所以可认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
【例4】 D 依题意,该单位职工平均体重为=×64+×56=61(千克),则该单位职工体重的方差为s2=×[151+(64-61)2]+×[159+(56-61)2]=169.故选D.
跟踪训练
1.BC 依题意,这组新数据的平均数为=6,方差为×[2+(7-6)2]+×[0+(1-6)2]=.故选B、C.
2.2.5 解析:设样本数据x1,x2,…,x8的平均数为,则(xi-)2=2,设样本数据y1,y2,…,y8的平均数为,由yi=xi+(-1)i(i=1,2,…,8),则=,所以(yi-)2=[xi+(-1)i-]2=2+(-1)i(xi-)+1=3+(-1)ixi=3+×(-2)=2.5.
3.115 265 解析:依题意=130,=115,=110,=215,∴=×130+×110=115(分),∴全班学生的平均成绩为115分.全班学生成绩的方差为s2=[+(-)2]+·[+(-)2]=×(115+225)+×(215+25)=85+180=265.
6 / 6(共75张PPT)
第二节 用样本的数字特征估计总体
高中总复习·数学
课标要求
1. 结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众
数),理解集中趋势参数的统计含义.
2. 结合实例,能用样本估计总体的离散程度参数(标准差、方差、极
差),理解离散程度参数的统计含义.
3. 结合实例,能用样本估计总体的取值规律.
4. 结合实例,能用样本估计百分位数,理解百分位数的统计含义.
目 录
CONTENTS
知识·逐点夯实
01.
考点·分类突破
02.
课时·跟踪检测
03.
PART 01
知识·逐点夯实
必备知识 | 课前自修
1. 总体百分位数的估计
(1)百分位数
定义 意义
百分 位数 一组数据的第p百分位数是这样一个值,它使
得这组数据中 有p%的数据小于或等于
这个值,且至少有(100-p)%的数据大于或
等于这个值 反映该组数中小
于或等于该百分
位数的分布特点
至少 
(2)求一组n个数据的第p百分位数的步骤
第1步:按从小到大排列原始数据;
第2步:计算i= ;
第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数
据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
n×p% 
2. 总体集中趋势的估计
(1)平均数:①若一组数据为x1,x2,…,xn,则该组数据的平均数
= ;
(x1+x2+…+xn) 
②加权平均数:如果总体的N个变量值中,不同的值共有k(k≤N)个.
不妨记为y1,y2,…,yk,其中yi出现的频数为fi(i=1,2,…,k),
则加权平均数为 = fiyi;
③分层随机抽样的平均数:若一组数据是由分层随机抽样所得到的,其中
第一层抽取m个,即x1,x2,…,xm,平均数为 ,第二层抽取n个,即
y1,y2,…,yn,平均数为 ,则x1,x2,…,xm,y1,y2,…,yn的平均
数 = .
+  
(2)中位数:将一组数据按大小依次排列,处于 位置的一个
数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)众数:一组数据中出现次数 的数据叫做这组数据的众数.
最中间 
最多 
提醒 (1)中位数是样本数据所占频率的等分线,不受少数极端值影响;
(2)众数体现了样本数据的最大集中点,一组数据可能有n个众数,也可
能没有众数;(3)与中位数、众数比较,平均数反映出样本数据的更多
信息,对样本数据中的少数极端值更加敏感.
②方差:s2= (xi- )2;
③标准差:s= .
3. 总体离散程度的估计
(1)假设一组数据x1,x2,x3,…,xn的平均数为 ,则:
①极差:max{x1,x2,…,xn}-min{x1,x2,…,xn};
(2)分层随机抽样的方差
分层随机抽样中,如果样本量是按比例分配,记总的样本平均数为 ,样
本方差为s2,其中第一层抽取m个数据的平均数为 ,方差为 ,第二层
抽取n个数据的平均数为 ,方差为 ,则该组数据的方差s2=
{m[+( - )2]+n[+( - )2]}.
1. 频率分布直方图中的常见结论
(1)众数的估计值为最高矩形底边的中点对应的横坐标;(2)平均
数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边
中点的横坐标之和;(3)中位数的估计值的左边和右边的小矩形的面
积和是相等的.
2. 平均数、方差的公式推广
若数据x1,x2,…,xn的平均数为 ,方差为s2,那么mx1+a,mx2+a,
mx3+a,…,mxn+a的平均数是m +a,方差为m2s2.
1. 判断正误.(正确的画“√”,错误的画“×”)
(1)对一组数据来说,平均数和中位数总是非常接近. ( × )
(2)方差与标准差具有相同的单位. ( × )
(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改
变,方差不变. ( √ )
×
×

2. (人A必修二P181练习1题改编)为了合理调配电力资源,某市欲了解
全市50 000户居民的日用电量.若通过简单随机抽样从中抽取了500户进行
调查,得到其日用电量的平均数为5.5 kW·h,则可以推测全市居民用户日
用电量的平均数(  )
A. 一定为5.5 kW·h
B. 高于5.5 kW·h
C. 低于5.5 kW·h
D. 约为5.5 kW·h
解析:  由样本的数字特征与总体的数字特征的关系,可知全市居民用
户日用电量的平均数约为5.5 kW·h.

3. (人A必修二P203例2改编)某射击运动员7次的训练成绩分别为86,
88,90,89,88,87,85,则这7次成绩的第80百分位数为(  )
A. 88.5 B. 89
C. 91 D. 89.5
解析:  因为7次的训练成绩从小到大排列为85,86,87,88,88,89,
90,且7×80%=5.6,所以第80百分位数为从小到大排列的数据中的第6个
数据,即89.

4. (人A必修二P224复习参考题3题改编)如果一组数据的中位数比平均
数小很多,下列叙述一定错误的是(  )
A. 数据中可能有异常值
B. 这组数据是近似对称的
C. 数据中可能有极端大的值
D. 数据中众数可能和中位数相同

解析:  如果一组数据的中位数比平均数小很多,则数据中可能有异常
值,即数据中可能有极端大的值,故A、C正确;当这组数据近似对称,则
中位数与平均数近似相等,一定不会出现中位数比平均少很多的现象,故
B错误;当众数与中位数相同时,若其余值大于中位数,则中位数就小于
平均数,如数据1,1,1,1,6,8,10,故D可能成立.
5. (人A必修二P216习题2题改编)甲、乙两台机床同时生产一种零件,
在10天中,两台机床每天生产的次品数分别为:
甲:0 1 0 2 2 0 3 1 2 4
乙:2 3 1 1 0 2 1 1 0 1
分别计算这两组数据的平均数和标准差,从计算结果看 机床的性能
更好.

解析:甲机床的平均数 = =1.5,标准差s甲=
≈1.28;乙机床的平均
数 = =1.2,标准差s乙=
≈0.87.比较发现乙机床
的平均数较小而且标准差也较小,说明乙机床生产的次品数比甲机床生产
的次品数少,而且更为稳定,所以乙机床的性能较好.
PART 02
考点·分类突破
精选考点 | 课堂演练
总体百分位数的估计(师生共研过关)
(1)(2024·江西重点中学盟校第一次联考)某工厂随机抽取40名工
人,对他们某天生产的产品件数进行统计,数据如下表,则该组数据的第
75百分位数是( C )
件数 7 8 9 10 11
人数 6 14 10 8 2
A. 8.5 B. 9 C. 9.5 D. 10
C
解析: 抽取的工人总数为40,40×75%=30,那么第75百分位数是所
有数据从小到大排序的第30项与第31项数据的平均数,由图表可知第30项
与第31项数据分别为9,10,所以第75百分位数是 =9.5,故选C.
(2)将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为
整数)整理后画出频率分布直方图如图,则此班模拟考试成绩的80%分位
数是 .(结果保留两位小数)
124.44 
解析: 由频率分布直方图可知,分数在120分以下的学生所占的比例
为(0.01+0.015+0.015+0.03)×10×100%=70%,分数在130分以下
的学生所占的比例为(0.01+0.015+0.015+0.03+0.022 5)
×10×100%=92.5%,因此80%分位数一定位于[120,130)内.因为120
+ ×10≈124.44,所以此班模拟考试成绩的80%分位数约为
124.44.
解题技法
1. 总体百分位数的估计需要注意的两个问题
(1)总体百分位数估计的基础是样本百分位数的计算,因此计算准确是
关键;
(2)由于样本量比较少,因此对总体的估计可能存在误差,因此对总体
百分位数的估计一般是估计值而非精确值.
2. 由频率分布直方图求第p百分位数的方法
确定要求的p%分位数所在分组[A,B),由频率分布表或频率分布直方
图可知,样本中小于A的频率为a,小于B的频率为b,所以p%分位数=
A+组距× .
1. 已知100个数据的第75百分位数是9.3,则下列说法正确的是(  )
A. 这100个数据中一定有75个数小于或等于9.3
B. 把这100个数据从小到大排列后,9.3是第75个数据
C. 把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均

D. 把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平
均数
解析:  因为100×75%=75,为整数,所以第75个数据和第76个数据的
平均数为第75百分位数,是9.3,则C正确,其他选项均不正确,故选C.

2. (2025·武汉一调)已知一组数据1,2,3,4,x的上四分位数是x,则
x的取值范围为(  )
A. {3} B. [2,3]
C. [3,4] D. {4}
解析:  在五个数中,上四分位数为第二大的数,故1,2,3,4,x中第
二大的数是x,所以3≤x≤4.

总体集中趋势的估计(师生共研过关)
(1)某射击运动员进行打靶练习,已知打十枪每发的环数分别为
9,10,7,8,10,10,6,8,9,7,设其平均数为a,中位数为b,众数
为c,则有( D )
A. a>b>c B. c>a>b
C. b>c>a D. c>b>a
D
解析: 将9,10,7,8,10,10,6,8,9,7按从小到大的顺序排列
为6,7,7,8,8,9,9,10,10,10,则众数为c=10,中位数为b=
×(8+9)=8.5,平均数为a= ×(6+7+7+8+8+9+9+10+10+
10)=8.4,所以c>b>a.故选D.
(2)〔多选〕某城市在创建文明城市的活动中,为了解居民对“创建文
明城市”的满意程度,组织居民给活动打分(分数为整数,满分100
分),从中随机抽取一个容量为100的样本,发现数据均在[40,100]内.
现将这些分数分成6组并画出样本的频率分布直方图,但不小心污损了部
分图形,如图所示.观察图形,则下列说法正确的是( ABC )
ABC
A. 频率分布直方图中第三组的频数为10
B. 根据频率分布直方图估计样本的众数为75分
C. 根据频率分布直方图估计样本的中位数为75分
D. 根据频率分布直方图估计样本的平均数为75分
解析:分数在[60,70)内的频率为1-10×(0.005+0.020+0.030+
0.025+0.010)=0.10,所以第三组的频数为100×0.10=10,故A正确;
因为众数的估计值是频率分布直方图中最高矩形底边中点的横坐标,从图
中可看出众数的估计值为75分,故B正确;因为(0.005+0.020+0.010)
×10=0.35<0.5,(0.005+0.020+0.010+0.030)×10=0.65>0.5,
所以中位数位于[70,80)内,设中位数为x,则0.35+0.03(x-70)=
0.5,解得x=75,所以中位数的估计值为75分,故C正确;样本平均数的
估计值为45×(10×0.005)+55×(10×0.020)+65×(10×0.010)
+75×(10×0.030)+85×(10×0.025)+95×(10×0.010)=73
(分),故D错误.
解题技法
求众数、中位数、平均数的方法
(1)众数:由定义知,一组数据中出现次数最多的数,即为众数,若有
两个或几个数据出现的次数最多,且出现的次数一样,这些数据都是这组
数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数
据没有众数;
(2)中位数:若一组数据为奇数个,按照从小到大(或从大到小)的顺
序排列,位于中间位置的数据就是这组数据的中位数;若一组数据为偶数
个,按照从小到大(或从大到小)的顺序排列,位于中间位置的两个数据
的平均数就是这组数据的中位数;
(3)平均数:利用 = xi求解.
1. 下表是某城市某日在不同观测点对细颗粒物(PM2.5)的观测值:
396 275 268 225 168 166
176 173 188 168 141 157
若在此组数据中增加一个比现有的最大值大25的数据,则下列数字特征没
有改变的是(  )
A. 极差 B. 中位数
C. 众数 D. 平均数

解析:  在此组数据中增加一个比现有的最大值大25的数据后,所得的
一组新数据从小到大排列为141,157,166,168,168,173,176,188,
225,268,275,396,421.对于A,所得的新数据的极差为421-141=
280,原来数据的极差为396-141=255,故A不正确;对于B,原来数据的
中位数为 =174.5,所得的新数据的中位数为176,故B不正确;对
于C,原来数据与新数据的众数均为168,故C正确;对于D,设原来的数
据的平均数为 ,则421> ,所以所得的新数据的平均数 >
= ,故D不正确.
2. 〔多选〕(2024·武汉四调)如图所示的频率分布直方图显示了三种不
同的分布形态.图1形成对称形态,图2形成“右拖尾”形态,图3形成“左
拖尾”形态,根据所给图作出以下判断,正确的是(  )
A. 图1的平均数=中位数=众数
B. 图2的平均数<众数<中位数
C. 图2的众数<中位数<平均数
D. 图3的平均数<中位数<众数



解析:  图1所示的频率分布直方图是对称的,所以平均数=中位
数=众数,故A正确;图2众数最小,右拖尾平均数大于中位数,故B
错误,C正确;图3左拖尾众数最大,平均数小于中位数,故D正确.故
选A、C、D.
总体离散程度的估计(定向精析突破)
考向1 方差与标准差
(2023·全国乙卷理17题)某厂为比较甲、乙两种工艺对橡胶产品伸
缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个
橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量
处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率
分别记为xi,yi(i=1,2,…,10),试验结果如下:
试验序号i 1 2 3 4 5
伸缩率xi 545 533 551 522 575
伸缩率yi 536 527 543 530 560
试验序号i 6 7 8 9 10
伸缩率xi 544 541 568 596 548
伸缩率yi 533 522 550 576 536
记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为 ,
样本方差为s2.
(1)求 ,s2;
解: 由题意,求出zi的值如表所示,
试验 序号i 1 2 3 4 5 6 7 8 9 10
zi 9 6 8 -8 15 11 19 18 20 12
则 = ×(9+6+8-8+15+11+19+18+20+12)=11,
s2= ×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-
11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-
11)2]=61.
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品
的伸缩率是否有显著提高(如果 ≥2 ,则认为甲工艺处理后的橡胶产
品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为
有显著提高).
解: 因为2 =2 = , =11= > ,
所以可认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品
的伸缩率有显著提高.
解题技法
  标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准
差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离
散程度越小.
考向2 分层随机抽样的方差与标准差
(2024·鹰潭一模)某单位为了解职工体重情况,采用分层随机抽样
的方法从800名职工中抽取了一个容量为80的样本.其中,男性平均体重为
64千克,方差为151;女性平均体重为56千克,方差为159,男女人数之比
为5∶3,则该单位职工体重的方差为(  )
A. 166 B. 167
C. 168 D. 169

解析:  依题意,该单位职工平均体重为 = ×64+ ×56=61(千
克),则该单位职工体重的方差为s2= ×[151+(64-61)2]+ ×[159
+(56-61)2]=169.故选D.
解题技法
计算分层随机抽样的方差的步骤
(1)确定 , , , ;
(2)确定 ;
(3)应用公式s2= [+( - )2]+ [+( - )2],
计算s2.
1. 〔多选〕(2025·新乡模拟)已知由5个数据组成的一组数据的平均数为
7,方差为2,现再加入一个数据1,组成一组新数据,则(  )
A. 这组新数据的平均数为3
B. 这组新数据的平均数为6
C. 这组新数据的方差为
D. 这组新数据的方差为
解析:  依题意,这组新数据的平均数为 =6,方差为 ×[2+
(7-6)2]+ ×[0+(1-6)2]= .故选B、C.


2. (2024·赣州模拟)若一组样本数据x1,x2,…,x8的方差为2, (-
1)ixi=-2,yi=xi+(-1)i(i=1,2,…,8),则样本数据y1,
y2,…,y8的方差为 .
2.5
解析:设样本数据x1,x2,…,x8的平均数为 ,则 (xi- )2=2,
设样本数据y1,y2,…,y8的平均数为 ,由yi=xi+(-1)i(i=1,
2,…,8),则 = ,所以 (yi- )2= [xi+(-1)i- ]2
=2+ (-1)i(xi- )+1=3+ (-1)ixi=3+ ×(-2)=
2.5.
3. 某班成立了A,B两个数学兴趣小组,A组10人,B组30人,经过一周
的补习后进行了一次测试,在该测试中,A组的平均成绩为130分,方差为
115,B组的平均成绩为110分,方差为215.则在这次测试中全班学生的平
均成绩为 分,方差为 .
解析:依题意 =130, =115, =110, =215,∴ =
×130+ ×110=115(分),∴全班学生的平均成绩为115分.全班学
生成绩的方差为s2= [+( - )2]+ ·[+( - )2]
= ×(115+225)+ ×(215+25)=85+180=265.
115
265
PART 03
课时·跟踪检测
关键能力 | 课后练习
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
20
22
23
24
25
1. (2025·江南十校联考)已知甲、乙两组数据(已按从小到大的顺序排
列):甲组:27,28,39,40,m,50;乙组:24,n,34,43,48,52.
若这两组数据的第30百分位数、第80百分位数分别相等,则 =(  )
A. B. C. D.
解析:  因为30%×6=1.8,大于1.8的比邻整数为2,所以第30百分位
数为n=28,80%×6=4.8,大于4.8的比邻整数为5,所以第80百分位数
为m=48,所以 = = .故选A.

2. (2025·湖南长郡中学模拟)已知样本数据x1,x2,…,x100的平均数和
标准差均为4,则数据-x1-1,-x2-1,…,-x100-1的平均数与方差分
别为(  )
A. -5,4 B. -5,16
C. 4,16 D. 4,4
解析:  由题意知样本数据x1,x2,…,x100的平均数和标准差均为4,
则x1,x2,…,x100的方差为16,则-x1,-x2,…,-x100的平均数为-
4,方差为(-1)2×16=16,故-x1-1,-x2-1,…,-x100-1的平均
数为-4-1=-5,方差16,故选B.

3. (2024·菏泽一模)已知样本数据为x1,x2,x3,x4,x5,x6,x7,去掉
一个最大值和一个最小值后的数据与原来的数据相比,下列数字特征一定
不变的是(  )
A. 极差 B. 平均数
C. 中位数 D. 方差

解析:  样本数据为x1,x2,x3,x4,x5,x6,x7,去掉一个最大值和一
个最小值后的数据与原来的数据相比,假设从小到大就是从x1到x7,极差
可能变化,故A错误;平均数为 = ,可能变化,故B
错误;中位数还是按从小到大排序中间位置的数,故C正确;方差为s2=
[(x2- )2+(x3- )2+(x4- )2+(x5- )2+(x6- )2],有
可能变化,故D错误.故选C.
4. 某校高一年级开设了校本课程,现从甲、乙两班各随机抽取了5名学生
校本课程的学分,统计如下表所示,s1,s2分别表示甲、乙两班抽取的5名
学生校本课程学分的标准差,则(  )
甲 8 11 14 15 22
乙 6 7 10 23 24
A. s1>s2 B. s1<s2
C. s1=s2 D. s1,s2的大小不能确定

解析:  甲班抽取的5名学生校本课程学分的平均数 = ×(8+11+
14+15+22)=14,乙班抽取的5名学生校本课程学分的平均数 = ×
(6+7+10+23+24)=14.甲班抽取的5名学生校本课程学分的方差 =
×[(8-14)2+(11-14)2+(14-14)2+(15-14)2+(22-14)
2]=22,∴s1= ,乙班抽取的5名学生校本课程学分的方差 =
×[(6-14)2+(7-14)2+(10-14)2+(23-14)2+(24-14)2]
=62,∴s2= .∴s1<s2,故选B.
5. 〔多选〕(2025·阜阳模拟)关于一组样本数据的平均数、中位数、众
数、频率分布直方图和方差,下列说法正确的是(  )
A. 改变其中一个数据,平均数和众数都会发生改变
B. 频率分布直方图中,中位数左边和右边的小矩形的面积应该相等
C. 在数据的频率分布直方图中,众数一定是该直方图中最高矩形底边的某
个(些)点的横坐标
D. 样本数据的方差越小,说明样本数据的离散程度越小



解析:  对于A中,例如:数据1,3,3,将数据改成2,3,3,数据
的众数未改变,仍为3,A错误;对于B中,根据频率分布直方图中中位数
的求法,频率分布直方图中,中位数左边和右边的小矩形的面积应该相
等,B正确;对于C中,根据众数的意义可知,由频率分布直方图估计众数
时,一般用最高矩形的中点横坐标近似代替,C正确;对于D中,样本数据
方差越小,数据越稳定,离散程度越小,D正确.故选B、C、D.
6. 〔多选〕(2024·菏泽三模)某灯具配件厂生产了一种塑胶配件,该厂
质检人员某日随机抽取了100个该配件的质量指标值(单位:分)作为一
个样本,得到如图所示的频率分布直方图,则(同一组中的数据用该组区
间的中点值作代表)(  )
A. m=0.030
B. 样本质量指标值的平均数为75
C. 样本质量指标值的众数小于其平均数
D. 样本质量指标值的第75百分位数为85



解析:  对于A项,由题意知(0.010+0.015+m+0.035+0.010)
×10=1,解得m=0.030,故A项正确;对于B项,样本质量指标值的平均
数为55×0.1+65×0.15+75×0.35+85×0.3+95×0.1=76.5,故B项错
误;对于C项,样本质量指标值的众数是 =75<76.5,故C项正确;
对于D项,前3组的频率之和为(0.010+0.015+0.035)×10=0.60,前4
组的频率之和为0.60+0.030×10=0.90,故第75百分位数位于第4组,设
其为t,则(t-80)×0.030+0.60=0.75,解得t=85,即第75百分位数
为85,故D项正确.故选A、C、D.
7. 为调查某地区中学生每天睡眠时间,采用样本量比例分配的分层随机抽
样方法,现抽取初中生800人,其每天睡眠时间的均值为9小时,方差为
1,抽取高中生1 200人,其每天睡眠时间的均值为8小时,方差为0.5,则
估计该地区中学生每天睡眠时间的方差为 .
解析:该地区中学生每天睡眠时间的平均数为 =8.4(小
时),则该地区中学生每天睡眠时间的方差为 ×[1+(9-8.4)
2]+ ×[0.5+(8-8.4)2]=0.94.
0.94
8. (2024·新乡二模)若一组数据a1,a2,a3,a4,a5的平均数为3,方差
为 ,则a1,a2,a3,a4,a5,9这6个数的平均数为 ,方差为 .
解析:依题意,知这6个数的平均数为 =4,又 ( -5×32)=
,得 =63,所以这6个数的方差为 ( +92-6×42)= ×
(63+92-6×42)=8.
4
8
9. 某种治疗心脏病的中药产品的质量以其质量指标值衡量,质量指标值越
大表明质量越好.为了提高中药产品的质量,我国医疗科研专家攻坚克
难,研发出A,B两种新配方,在这两种新配方生产的产品中随机抽取数
量相同的样本,测量这些产品的质量指标值,规定质量指标值小于85为废
品,在[85,115)为一等品,不小于115为特等品.现把测量数据整理如
下,其中B配方的样本中有6件废品.
A配方的频数分布表
质量指 标值 [75,
85) [85,
95) [95,
105) [105,
115) [115,125]
频数 8 a 36 24 8
(1)求实数a,b的值;
解: 依题意,A,B两种配方的样本容量相同,设为n.
由B配方的样本中有6件废品,结合B配方的频率分布直方图,得 =
0.006×10,解得n=100.
∴a=100-(8+36+24+8)=24.
由(0.006+b+0.038+0.022+0.008)×10=1,得b=0.026.
∴实数a,b的值分别为24,0.026.
(2)试确定A配方和B配方哪一种更好.(说明:在统计方法中,同一组
数据常用该组区间的中点值作代表)
解: 由(1)及A配方的频数分
布表得,A配方质量指标值的样本平
均数 = ×(80×8+90×24+
100×36+110×24+120×8)= ×
(200×8+200×24+100×36)=
100,
A配方质量指标值的样本方差 = ×[(-20)2×8+(-10)2×24+
0×36+102×24+202×8]=112.
由(1)及B配方的频率分布直方图得,B配方质量指标值的样本平均数
=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100,
B配方质量指标值的样本方差 =(-20)2×0.06+(-10)2×0.26+
0×0.38+102×0.22+202×0.08=104.
综上, = , > ,
即A,B两种配方质量指标值的样本平均数相等,但A配方质量指标值没
有B配方质量指标值稳定,
∴B配方更好.
10. (创新考法)设x1,x2,…,xn为样本数据,令f(x)= (xi-
x)2,则f(x)的最小值点为(  )
A. 样本众数 B. 样本中位数
C. 样本标准差 D. 样本平均数
解析:  因为f(x)= (xi-x)2= (x2-2xxi+ )=nx2-
2n x+ ,所以f(x)为二次函数,因为n>0,函数图象开口向
上,对称轴方程为x= ,故最小值点为样本平均数.

11. 〔多选〕(2023·新高考Ⅰ卷9题)有一组样本数据x1,x2,…,x6,其
中x1是最小值,x6是最大值,则(  )
A. x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B. x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C. x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D. x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差


解析:  若该组样本数据为1,2,3,4,5,8,则2,3,4,5的平均数
为 ,1,2,3,4,5,8的平均数为 ,两组数据的平均数不相等,故A
错误;不妨设x1≤x2≤x3≤x4≤x5≤x6,则x2,x3,x4,x5的中位数等于
x1,x2,x3,x4,x5,x6的中位数,故B正确;若该组样本数据为1,2,
2,2,2,8,则2,2,2,2的标准差为0,而1,2,2,2,2,8的标准差
大于0,故C错误;由对选项B的分析可知,x2,x3,x4,x5的极差为x5-
x2,x1,x2,x3,x4,x5,x6的极差为x6-x1,且易得x6-x1≥x5-x2,故D
正确.故选B、D.
12. (创新知识交汇)〔多选〕新高考模式下,化学、生物等学科实施赋
分制,即通过某种数学模型将原始分换算为标准分.某校在一次高三模拟
考试中实施赋分制的方式,其中应用的换算模型为:y=kx+b(k,
b∈R),其中x为原始分,y为换算后的标准分.已知在本校2 000名高三
学生中某学科原始分最高得分为150分,最低得分为50分,经换算后最高
分为150分,最低分为80分.则以下说法正确的是(  )
A. 若学生甲本学科考试换算后的标准分为115分,则其原始得分为100分
B. 若在原始分中学生乙的得分为中位数,则换算后学生乙的分数仍为中位数
C. 该校本学科高三全体学生得分的原始分与标准分的标准差相同
D. 该校本学科高三全体学生得分的原始分的平均分低于标准分的平均分



解析:  对A,由题意得 所以换算模
型为y=0.7x+45.由115=0.7x+45 x=100,故A对;对B,因为函数y
=0.7x+45为增函数,所以标准分不改变原始分的排名顺序,原始分的中
位数换算后,得到的标准分仍为中位数,故B对;对C,由0.7x+
45≥x x≤150,所以只有原始分是150分时,标准分与原始分相等,当原
始分低于150分时,标准分都高于原始分,所以标准分相比于原始分,分
数更集中,所以标准分的标准差比原始分的标准差要小,故C错误;对D,
因为标准分都不低于原始分,所以原始分的平均分低于标准分的平均分,
故D对.故选A、B、D.
13. 某公司购买了A,B,C三种不同品牌的电动智能送风口罩.为了解三
种品牌口罩的电池性能,现采用分层随机抽样的方法,从三种品牌的口罩
中抽出25个,测试它们一次完全充电后的连续待机时长,统计的结果如下
(单位:小时).
A:4 4 4.5 5 5.5 6 6
B:4.5 5 6 6.5 6.5 7 7 7.5
C:5 5 5.5 6 6 7 7 7.5 8 8
(1)已知该公司购买C品牌的电动智能送风口罩比B品牌多200个,则该
公司购买B品牌的电动智能送风口罩的数量为 ;
解析: 设该公司购买B品牌的电动智能送风口罩x个,则购买C品牌
的电动智能送风口罩为 x个,由题意得 x-x=200,所以x=800.
800
(2)再从A,B,C三种不同品牌的电动智能送风口罩中各随机抽取一
个,它们的待机时长分别是a,b,c(单位:小时).将这3个新数据与原
来的数据构成的新数据的平均数记为μ1,原来数据的平均数记为μ0.若
μ0≤μ1,则a+b+c的最小值为 .
解析: 计算可得μ0=6,为了满足μ0≤μ1,只要 ≥6,所以
a+b+c≥18,a+b+c的最小值是18.
18
14. 我国现代气候学意义上从春季进入夏季的标志为连续5天的日平均气温
均不低于22 ℃.现有与甲、乙、丙三地连续5天的日平均气温(单位:℃)
的记录数据有关的结论如下(记录数据都是正整数):
①甲地5个数据的中位数为24,众数为22;
②乙地5个数据的中位数为27,平均数为24;
③丙地5个数据中有一个数据是32,平均数为26,方差为10.8.
则肯定进入夏季的地区有 (填序号).
①③
解析:①甲地连续5天的日平均气温的记录数据可能为:22,22,24,
25,26,均不低于22,且不可能有低于22的数据出现,故甲地肯定进入夏
季;②当乙地的5个数据为19,20,27,27,27时,满足平均数为24,但
可能存在某天的日平均气温低于22 ℃,故不能确定乙地是否进入夏季;③
若丙地有一个数据小于22,假设取21,此时方差就超出了10.8,所以丙地
连续5天的日平均气温均不低于22 ℃.故丙地肯定进入夏季.
THANKS
演示完毕 感谢观看
同课章节目录