第九章 第2节 用样本估计总体(含解析)2026年高考数学一轮专题复习(人教A版)

文档属性

名称 第九章 第2节 用样本估计总体(含解析)2026年高考数学一轮专题复习(人教A版)
格式 zip
文件大小 358.4KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2025-10-26 09:08:11

文档简介

第2节 用样本估计总体
[学习目标]
1.能用样本估计总体的集中趋势参数(平均数、中位数、众数、百分位数),理解集中趋势参数的统计含义.2.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.
1.百分位数
(1)第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)四分位数:25%分位数、50%分位数、75%分位数这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.
第50百分位数就是中位数,中位数是百分位数的特例,百分位数是中位数的推广.
2.总体集中趋势的估计
(1)平均数:=(x1+x2+…+xn).
(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时).
(3)众数:一组数据中出现次数最多的数据(即频数最大值所对应的样本数据).
(1)平均数、中位数、众数分别从不同角度描述了一组数据的特征,刻画了一组数据的大致情况.平均数表示“一般水平”,中位数表示“中等水平”,众数表示“多数水平”.
(2)一组数据的平均数、中位数都是唯一的.众数不一定唯一,且众数一定是原数据中的数,而平均数和中位数都不一定是原数据中的数.
3.总体离散程度的估计
设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的方差和标准差分别是s2=(xi-)2,
s=.
1.若数据x1,x2,…,xn的平均数为,方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为m+a,方差为m2s2.
2.s2=(xi-)2=-,即方差等于各数平方的平均数减去平均数的平方.
1.思考辨析(在括号内打“√”或“×”).
(1)若一组样本数据的第10百分位数是23,则在这组数据中有10%的数据大于23.(  )
(2)平均数受数据的极端值的影响较大.(  )
(3)方差反映了一组数据的离散程度.(  )
(4)如果一组数中每个数减去同一个非零常数,那么这组数的平均数改变,方差不变.(  )
(5)样本数据的方差越小,说明样本数据的稳定性越差.(  )
(6)数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半.(  )
【答案】 (1)× (2)√ (3)√ (4)√ (5)× (6)√
2.(人教A版必修第二册P204练习T2改编)某车间9名工人一天生产某产品的数量分别为188,130,157,146,152,150,148,190,170,则所给数据的第75百分位数为(  )
A.148 B.170
C.157 D.150
【答案】 B
【解析】 9个数据由小到大排列为130,146,148,150,152,157,170,188,190,
因为9×75%=6.75>6,故所给数据的第75百分位数为170.故选B.
3.(人教A版必修第二册P215练习T2改编)若样本数据x1,x2,…,x10的方差为3,则3x1-2,3x2-2,…,3x10-2的方差为(  )
A.7 B.9
C.27 D.25
【答案】 C
【解析】 因为样本数据x1,x2,…,x10的方差为3,所以3x1-2,3x2-2,…,3x10-2的方差为32×3=27.故选C.
4.(多选题)(2025·辽宁沈阳模拟)某团队共有20人,他们的年龄分布如表所示,
年龄 28 29 30 32 36 40 45
人数 1 3 3 5 4 3 1
有关这20人年龄的众数、极差、百分位数说法正确的是(  )
A.众数是32 B.众数是5
C.极差是17 D.25%分位数是30
【答案】 ACD
【解析】 年龄为32的有5人且最多,故众数是32,A正确,B错误;45-28=17,极差为17,C正确;因为20×25%=5,(30+30)÷2=30,故25%分位数是30,D正确.故选ACD.
考点一 总体百分位数的估计
角度一 离散型数据的百分位数
[例1] (2025·福建三明模拟)已知从小到大排列的一组数据:1,5,a,10,11,13,15,21,42,57.若这组数据的极差是其第30百分位数的7倍,则a的值为  .
【答案】 6
【解析】 由题意知这组数据的极差是57-1=56,
由于10×30%=3,故第30百分位数为,故56=7×,所以a=6.
计算一组n个数据的第p百分位数的步骤
角度二 连续型数据的百分位数
[例2] 为了加深师生对党史的了解,激发广大师生知史爱党、知史爱国的热情,某校举办了“学党史、育文化”的党史知识竞赛,并将1 000名师生的竞赛成绩(满分100分,成绩取整数)整理成如图所示的频率分布直方图,估计这组数据的第85百分位数为(  )
A.84分 B.85分
C.86分 D.87分
【答案】 C
【解析】 由10(2a+3a+3a+6a+5a+a)=1,解得a=0.005,
所以前4组频率之和为14×0.005×10=0.7,前5组频率之和为19×0.005×10=0.95,
设这组数据的第85百分位数为x分,则0.7+(x-80)×0.025=0.85,解得x=86.故选C.
频率分布直方图中第p百分位数的求解方法可以模仿中位数的求解思路:
(1)确定第p百分位数所在的区间[a,b).
(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+×(b-a).
[针对训练]
1.(角度一)(2025·江西新余模拟)一个容量为10的样本,其数据依次为9,2,5,10,16,7,18,21,
20,3,则该组数据的第60百分位数为(  )
A.9 B.10
C.13 D.16
【答案】 C
【解析】 将该组数据从小到大排列为2,3,5,7,9,10,16,18,20,21,
由10×0.6=6,有=13,故该组数据的第60百分位数为13.故选C.
2.(角度二)某厂家为了保证防寒服的质量,从生产的保暖絮片中随机抽取多组,得到每组纤维长度(单位:mm)的均值,并制成如下所示的频率分布直方图,由此估计其纤维长度均值的90%分位数是    .
【答案】 36
【解析】 由频率分布直方图可得从左到右前6个矩形面积之和为
0.04+0.09+0.16+0.24+0.18+0.14=0.85,
前7个矩形面积之和为0.04+0.09+0.16+0.24+0.18+0.14+0.10=0.95,
故纤维长度均值的90%分位数位于第7组内,
设纤维长度均值的90%分位数为x,则0.85+(x-35)×0.050=0.9,
解得x=36,即估计其纤维长度均值的90%分位数是36.
考点二 总体集中趋势的估计
[例3] (2024·新课标Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:
亩产量 [900, 950) [950, 1 000) [1 000, 1 050) [1 050, 1 100) [1 100, 1 150) [1 150, 1 200)
频数 6 12 18 30 24 10
根据表中数据,下列结论中正确的是(  )
A.100块稻田亩产量的中位数小于1 050 kg
B.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200 kg至300 kg 之间
D.100块稻田亩产量的平均值介于900 kg至1 000 kg 之间
[溯源探本]本例源于人教A版必修第二册P205例4.
【答案】 C
【解析】 对于A, 根据频数分布表可知, 6+12+18=36<50,所以亩产量的中位数不小于 1 050 kg, 故A错误;
对于B,亩产量不低于1 100 kg的频数为24+10=34,所以低于1 100 kg的稻田占比为 ×100%=66%,故B错误;
对于C,因为1 200-900=300,1 150-950=200,所以稻田亩产量的极差介于200 kg至300 kg之间,故C正确;
对于D,由频数分布表可得,
平均值为×(6×925+12×975+18×1 025+30×1 075+24×1 125+10×1 175)=1 067,故D错误.故选C.
众数、中位数、平均数的意义
(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题;当一组数据中个别数据较大或较小时,可用中位数描述其集中趋势.
[针对训练]
(2025·四川宜宾模拟)某校举办了传统文化知识竞赛,并将1 000名师生的竞赛成绩(满分100分,成绩取整数)整理成如图所示的频率分布直方图,则下列说法错误的是(  )
A.a的值为0.005
B.估计这组数据的众数为75分
C.估计成绩低于60分的有250人
D.估计这组数据的中位数为分
【答案】 D
【解析】 对于A,由题意,10(2a+3a+3a+6a+5a+a)=1,解得a=0.005,故A正确;
对于B,由频率分布直方图可估计这组数据的众数为=75(分),故B正确;
对于C,由频率分布直方图可得成绩低于60分的频率为10×(0.01+0.015)=0.25,故估计成绩低于60分的有1 000×0.25=250(人),故C正确;
对于D,由选项A的分析可得区间[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]的频率分别为0.1,0.15,0.15,0.3,0.25,0.05,
因为0.1+0.15+0.15+0.3>0.5,0.1+0.15+0.15<0.5,故中位数位于[70,80)内.
设中位数为x,则0.1+0.15+0.15+0.03×(x-70)=0.5,解得x=,故D错误.故选D.
考点三 总体离散程度的估计
[例4] (2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10).试验结果如下:
试验序号i 1 2 3 4 5 6 7 8 9 10
伸缩率xi 545 533 551 522 575 544 541 568 596 548
伸缩率yi 536 527 543 530 560 533 522 550 576 536
记zi=xi-yi(i=1,2,…,10),记z1,z2,…,z10的样本平均数为 ,样本方差为s2.
(1)求 ,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高.(若≥2,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
【解】 (1)=×(545+533+551+522+575+544+541+568+596+548)=552.3,
=×(536+527+543+530+560+533+522+550+576+536)=541.3,
=-=552.3-541.3=11,
zi=xi-yi 的值分别为9,6,8,-8,15,11,19,18,20,12,
故s2=×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+0+(19-11)2+(18-11)2+(20-11)2+
(12-11)2]=61.
(2)由(1)知,=11,2=2=,故有>2,
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
利用样本的数字特征解决优化决策问题的依据
平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
[针对训练]
甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:
甲 82 81 79 78 95 88 93 84
乙 92 95 80 75 83 80 90 85
(1)求两名学生预赛成绩的平均数和方差;
(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪名学生参加合适 请说明理由.
【解】 (1)=×(82+81+79+78+95+88+93+84)=85,
=×(92+95+80+75+83+80+90+85)=85,
=×[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,
=×[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41.
(2)由(1)可知=,<,所以甲的成绩较稳定,派甲参赛比较合适.第2节 用样本估计总体
[学习目标]
1.能用样本估计总体的集中趋势参数(平均数、中位数、众数、百分位数),理解集中趋势参数的统计含义.2.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.
1.百分位数
(1)第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)四分位数:25%分位数、50%分位数、75%分位数这三个分位数把一组由小到大排列后的数据分成四等份,因此称为 .其中第25百分位数也称为 或 ,第75百分位数也称为 或 .
第50百分位数就是中位数,中位数是百分位数的特例,百分位数是中位数的推广.
2.总体集中趋势的估计
(1)平均数:= .
(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最 的一个数据(当数据个数是奇数时)或最中间两个数据的 (当数据个数是偶数时).
(3)众数:一组数据中出现次数 的数据(即频数最大值所对应的样本数据).
(1)平均数、中位数、众数分别从不同角度描述了一组数据的特征,刻画了一组数据的大致情况.平均数表示“一般水平”,中位数表示“中等水平”,众数表示“多数水平”.
(2)一组数据的平均数、中位数都是唯一的.众数不一定唯一,且众数一定是原数据中的数,而平均数和中位数都不一定是原数据中的数.
3.总体离散程度的估计
设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的方差和标准差分别是s2=(xi-)2,
s=.
1.若数据x1,x2,…,xn的平均数为,方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为m+a,方差为m2s2.
2.s2=(xi-)2=-,即方差等于各数平方的平均数减去平均数的平方.
1.思考辨析(在括号内打“√”或“×”).
(1)若一组样本数据的第10百分位数是23,则在这组数据中有10%的数据大于23.(  )
(2)平均数受数据的极端值的影响较大.(  )
(3)方差反映了一组数据的离散程度.(  )
(4)如果一组数中每个数减去同一个非零常数,那么这组数的平均数改变,方差不变.(  )
(5)样本数据的方差越小,说明样本数据的稳定性越差.(  )
(6)数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半.(  )
2.(人教A版必修第二册P204练习T2改编)某车间9名工人一天生产某产品的数量分别为188,130,157,146,152,150,148,190,170,则所给数据的第75百分位数为(  )
A.148 B.170
C.157 D.150
3.(人教A版必修第二册P215练习T2改编)若样本数据x1,x2,…,x10的方差为3,则3x1-2,3x2-2,…,3x10-2的方差为(  )
A.7 B.9
C.27 D.25
4.(多选题)(2025·辽宁沈阳模拟)某团队共有20人,他们的年龄分布如表所示,
年龄 28 29 30 32 36 40 45
人数 1 3 3 5 4 3 1
有关这20人年龄的众数、极差、百分位数说法正确的是(  )
A.众数是32 B.众数是5
C.极差是17 D.25%分位数是30
考点一 总体百分位数的估计
角度一 离散型数据的百分位数
[例1] (2025·福建三明模拟)已知从小到大排列的一组数据:1,5,a,10,11,13,15,21,42,57.若这组数据的极差是其第30百分位数的7倍,则a的值为 .
计算一组n个数据的第p百分位数的步骤
角度二 连续型数据的百分位数
[例2] 为了加深师生对党史的了解,激发广大师生知史爱党、知史爱国的热情,某校举办了“学党史、育文化”的党史知识竞赛,并将1 000名师生的竞赛成绩(满分100分,成绩取整数)整理成如图所示的频率分布直方图,估计这组数据的第85百分位数为(  )
A.84分 B.85分
C.86分 D.87分
频率分布直方图中第p百分位数的求解方法可以模仿中位数的求解思路:
(1)确定第p百分位数所在的区间[a,b).
(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+×(b-a).
[针对训练]
1.(角度一)(2025·江西新余模拟)一个容量为10的样本,其数据依次为9,2,5,10,16,7,18,21,
20,3,则该组数据的第60百分位数为(  )
A.9 B.10
C.13 D.16
2.(角度二)某厂家为了保证防寒服的质量,从生产的保暖絮片中随机抽取多组,得到每组纤维长度(单位:mm)的均值,并制成如下所示的频率分布直方图,由此估计其纤维长度均值的90%分位数是 .
考点二 总体集中趋势的估计
[例3] (2024·新课标Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:
亩产量 [900, 950) [950, 1 000) [1 000, 1 050) [1 050, 1 100) [1 100, 1 150) [1 150, 1 200)
频数 6 12 18 30 24 10
根据表中数据,下列结论中正确的是(  )
A.100块稻田亩产量的中位数小于1 050 kg
B.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200 kg至300 kg 之间
D.100块稻田亩产量的平均值介于900 kg至1 000 kg 之间
[溯源探本]本例源于人教A版必修第二册P205例4.
众数、中位数、平均数的意义
(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题;当一组数据中个别数据较大或较小时,可用中位数描述其集中趋势.
[针对训练]
(2025·四川宜宾模拟)某校举办了传统文化知识竞赛,并将1 000名师生的竞赛成绩(满分100分,成绩取整数)整理成如图所示的频率分布直方图,则下列说法错误的是(  )
A.a的值为0.005
B.估计这组数据的众数为75分
C.估计成绩低于60分的有250人
D.估计这组数据的中位数为分
考点三 总体离散程度的估计
[例4] (2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10).试验结果如下:
试验序号i 1 2 3 4 5 6 7 8 9 10
伸缩率xi 545 533 551 522 575 544 541 568 596 548
伸缩率yi 536 527 543 530 560 533 522 550 576 536
记zi=xi-yi(i=1,2,…,10),记z1,z2,…,z10的样本平均数为 ,样本方差为s2.
(1)求 ,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高.(若≥2,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
利用样本的数字特征解决优化决策问题的依据
平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
[针对训练]
甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:
甲 82 81 79 78 95 88 93 84
乙 92 95 80 75 83 80 90 85
(1)求两名学生预赛成绩的平均数和方差;
(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪名学生参加合适 请说明理由.
同课章节目录