2026届高中数学(通用版)一轮复习:第十章 第2课时 用样本估计总体(课件 学案 练习,共3份)

文档属性

名称 2026届高中数学(通用版)一轮复习:第十章 第2课时 用样本估计总体(课件 学案 练习,共3份)
格式 zip
文件大小 4.9MB
资源类型 教案
版本资源 通用版
科目 数学
更新时间 2025-05-22 10:18:48

文档简介

第2课时 用样本估计总体
[考试要求] 1.会用统计图表对总体进行估计,会求n个数据的第p百分位数.2.能用数字特征估计总体集中趋势和总体离散程度.3.掌握分层随机抽样的样本方差.
1.众数、中位数、平均数、百分位数
样本数据 频率分布直方图
众数 一组数据中,出现__________的数据 最高的小矩形底边______的横坐标
中位数 把一组数据按从小到大的顺序排列,处在__________的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分为左右两个______相等的部分,分界线与x轴交点的横坐标
平均数 样本数据的算术平均数 每个小矩形的面积乘小矩形底边______的横坐标之和
百分位数 一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值 对于数据组[a,b),a以下的数据比例为m%,b以下的数据比例为n%,若m≤p2.计算一组n个数据的第p百分位数的步骤
第1步,按__________排列原始数据;
第2步,计算i=________;
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第 ___项数据;若i是整数,则第p百分位数为第 ___项与第__________项数据的平均数.
3.四分位数
(1)第25百分位数,第50百分位数,第75百分位数这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
(2)第____百分位数又称第一四分位数或下四分位数;第____百分位数又称第三四分位数或上四分位数.
4. 总体离散程度的估计
(1)方差和标准差
假设一组数据是x1,x2,…,xn,用表示这组数据的平均数,称________为这组数据的方差,也可以写成________的形式;称________为这组数据的标准差.
(2)总体方差和标准差
①一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则总体方差S2=________.
②加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=.总体标准差:S=.
(3)样本方差和标准差
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称s2=为样本方差,s=为样本标准差.
[常用结论]
平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)数据x1,x2,…,xn的方差为s2.
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2.
一、易错易混辨析(正确的打“√”,错误的打“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势. (  )
(2)一组数据的方差越大,说明这组数据越集中. (  )
(3)频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越高. (  )
二、教材经典衍生
1.(人教A版必修第二册P206探究改编)平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关,在如图两种分布形态中,a,b,c,d分别对应平均数和中位数之一,则可能的对应关系是(  )
A.a为中位数,b为平均数,c为平均数,d为中位数
B.a为平均数,b为中位数,c为平均数,d为中位数
C.a为中位数,b为平均数,c为中位数,d为平均数
D.a为平均数,b为中位数,c为中位数,d为平均数
2.(人教A版必修第二册P204练习T2改编)某车间12名工人一天生产某产品的质量(单位:kg)分别为13.8,13,13.5,15.7,13.6,14.8,14,14.6,15,15.2,15.8,15.4,则所给数据的第25,50,75百分位数分别是________.
3.(人教A版必修第二册P215练习T2改编)一组数据的平均数是28,方差是4,若将这组数据中的每一个数据都加上20,得到一组新数据,则所得新数据的平均数是________,方差是________.
4.(人教A版必修第二册P198练习T1改编)为了了解全民对足球的喜爱程度,组委会在某场比赛结束后,随机抽取了1 000名观众进行对足球“喜爱度”的调查评分,将得到的分数分成6段:[70,75),[75,80),[80,85),[85,90),[90,95),[95,100],得到如图所示的频率分布直方图.图中部分数据丢失,若已知这1 000名观众评分的中位数估计值为87.5,则m=________.
考点一 总体百分位数的估计
[典例1] (1)已知由小到大排列的4个数据1,3,5,a,若这4个数据的极差是它们中位数的2倍,则这4个数据的第75百分位数是(  )
A.7 B.6
C.5 D.4
(2)将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出频率分布直方图如图,则此班的模拟考试成绩的第80百分位数约为________.(结果保留两位小数)
[听课记录]___________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
1.计算一组n个数据的第p百分位数的一般步骤
2.频率分布直方图中第p百分位数的计算
(1)确定百分位数所在的区间[a,b).
(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+×(b-a).
[跟进训练]
1.(1)(2025·湖北武汉模拟)有一组样本数据:15,16,11,11,14,20,11,13,13,24,13,18,则这组样本数据的上四分位数是(  )
A.11 B.13
C.16 D.17
(2)(2024·江苏南通二模)某同学在一次数学测试中的成绩是班级第三名(假设测试成绩两两不同),成绩处于第90百分位数,则该班级的人数可能为(  )
A.15 B.25
C.30 D.35
考点二 总体集中趋势的估计
[典例2] (1)(多选)已知运动员甲特训的成绩分别为:9,12,8,16,16,18,20,16,12,13,则这组数据的(  )
A.众数为12 B.平均数为14
C.中位数为14.5 D.第85百分位数为16
(2)(2025·陕西西安模拟)某校为了解在校学生对中国传统文化的传承认知情况,随机抽取了100名学生进行中国传统文化知识考试,并将这100名学生成绩整理得到如下频率分布直方图.根据此频率分布直方图(分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组),下列结论中不正确的是(  )
A.图中的a=0.012
B.若从成绩在[70,80),[80,90),[90,100]内的学生中采用分层随机抽样方法抽取10名学生,则成绩在[80,90)内的有3人
C.这100名学生成绩的中位数约为65
D.若同一组中的数据用该组区间的中点值作代表,则这100名学生的平均成绩约为68.2
[听课记录]___________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
 频率分布直方图的数字特征
(1)众数:最高矩形的底边中点的横坐标.
(2)中位数:中位数左边和右边的矩形的面积和应该相等.
(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.
[跟进训练]
2.(1)某射击运动员连续射击5次,命中的环数(环数为整数)形成的一组数据中,中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为(  )
A.7.6 B.7.8
C.8 D.8.2
(2)有13名同学参加学校组织的才艺表演比赛,已知他们所得的分数互不相同,共设7个获奖名额,某同学知道自己的比赛分数后,要判断自己能否获奖,在这13名同学成绩的统计量中只需知道一个量,它是________.(填“众数”“中位数”或“平均数”)
_________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
考点三 总体离散程度的估计
[典例3] (2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:
试验 序号i 1 2 3 4 5 6 7 8 9 10
伸缩 率xi 545 533 551 522 575 544 541 568 596 548
伸缩 率yi 536 527 543 530 560 533 522 550 576 536
记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为,样本方差为s2.
(1)求,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高.则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
[听课记录]___________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
 标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.
[跟进训练]
3.(1)已知数据x1,x2,x3,x4,x5,x6的平均数是5,方差是9,则=(  )
A.159  B.204  C.231  D.636
(2)(多选)(2025·湖南衡阳开学考试)有一组样本数据x1,x2,…,xn,由这组样本得到新样本数据y1,y2,…,yn,其中yi=axi+b,则(  )
A.x1,x2,…,xn的中位数为m1,则y1,y2,…,yn的中位数为am1+b
B.x1,x2,…,xn的平均数为m2,则y1,y2,…,yn的平均数为am2+b
C.x1,x2,…,xn的方差为m3,则y1,y2,…,yn的方差为am3
D.x1,x2,…,xn的极差为m4,则y1,y2,…,yn的极差为am4
第2课时 用样本估计总体
梳理·必备知识
1.次数最多 中点 中间位置 面积 中点 a+(b-a)·
2.从小到大 n×p% j i (i+1)
3.(2)25 75
4.(1)    (2)
激活·基本技能
一、(1)√ (2)× (3)√
二、1.A [在频率分布直方图中,中位数两侧小矩形的面积和相等,平均数可以用每个小矩形底边中点的横坐标乘以小矩形的面积之和近似代替,结合两个频率分布直方图得: a为中位数,b为平均数,c为平均数,d为中位数.故选A.]
2.13.7,14.7,15.3 [将12个数据按从小到大排序:13,13.5,13.6,13.8,14,14.6,14.8,15,15.2,15.4,15.7,15.8.
由i=12×25%=3,得所给数据的第25百分位数是第3个数据与第4个数据的平均数,即=13.7;
由i=12×50%=6,得所给数据的第50百分位数是第6个数据与第7个数据的平均数,即=14.7;
由i=12×75%=9,得所给数据的第75百分位数是第9个数据和第10个数据的平均数,即=15.3.]
3.48 4 [设该组数据为x1,x2,…,xn,
则新数据为x1+20,x2+20,…,xn+20,记新数据的平均数为′,
因为′==20+28=48.
因为s2=2+2+…+],
所以s′2={2+2+…+2}=s2=4.]
4.0.02 [由题可知,5(m+0.025+0.03)+(87.5-85)×0.05=0.5,解得m=0.02.]
考点一
典例1 (1)A (2)124.44 [(1)由小到大排列的4个数据1,3,5,a,则a≥5,
这4个数的极差为a-1,中位数为=4,
因为这4个数据的极差是它们中位数的2倍,
则a-1=2×4,解得a=9,
所以这四个数由小到大依次为1,3,5,9,
因为4×0.75=3,所以这4个数据的第75百分位数是=7.故选A.
(2)由频率分布直方图可知,分数在120分以下的学生所占的比例为(0.010 0+0.015 0+0.015 0+0.030 0)×10×100%=70%,分数在130分以下的学生所占的比例为(0.010 0+0.015 0+0.015 0+0.030 0+0.022 5)×10×100%=92.5%,
因此,80%分位数一定位于[120,130)内.
因为120+×10≈124.44,
所以此班的模拟考试成绩的第80百分位数约为124.44.]
跟进训练
1.(1)D (2)B [(1)将样本数据由小到大排列依次为:11,11,11,13,13,13,14,15,16,18,20,24,因为12×=9,所以这组数据的上四分位数为=17.故选D.
(2)设班级人数为x,由题意,x-3+1-1<0.9x又x∈N*,结合选项可得,该班级的人数可能为25.故选B.]
考点二
典例2 (1)BC (2)C [(1)成绩从小到大排列为:8,9,12,12,13,16,16,16,18,20.
出现次数最多的数为16,故A错误;
平均数为×(8+9+12+12+13+16+16+16+18+20)=14,故B正确;
中位数为=14.5,故C正确;
10×0.85=8.5,
故第85百分位数为第9位,为18,故D错误.故选BC.
(2)由×10=1,得a=0.012,所以A正确,不符合题意;
这100名学生中成绩在[70,80),[80,90),[90,100]内的频率分别为0.2,0.12,0.08,所以采用分层随机抽样方法抽取的10名学生中成绩在[80,90)内的有10×=3(人),故B正确,不符合题意;
根据频率分布直方图,可知这100名学生成绩的中位数在[60,70)之间,设中位数为x,则0.08+0.2+(x-60)×0.032=0.5,所以x=66.875,故C错误,符合题意;
根据频率分布直方图的平均数的计算公式,可得=45×0.08+55×0.2+65×0.32+75×0.2+85×0.12+95×0.08=68.2,故D正确,不符合题意.故选C.]
跟进训练
2.(1)B (2)中位数 [(1)依题意这组数据一共有5个数,中位数为8,则从小到大排列8的前面有2个数,后面也有2个数,又唯一的众数为9,则有两个9,其余数字均只出现一次,则最大数字为9,又极差为3,所以最小数字为6,所以这组数据为6,7,8,9,9,所以平均数为=7.8.故选B.
(2)因为7名获奖者的分数肯定是13名参赛选手中最高的,所以把13个不同的分数按从小到大排序,只要知道自己的分数和中位数就可以知道是否获奖.]
考点三
典例3 解:(1)由题意,求出zi的值如表所示,
试验 序号i 1 2 3 4 5 6 7 8 9 10
zi 9 6 8 -8 15 11 19 18 20 12
则=×(9+6+8-8+15+11+19+18+20+12)=11,
s2=×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.
(2)因为2=2==11=>,
所以可认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
跟进训练
3.(1)B (2)AB [(1)根据题意,数据x1,x2,x3,x4,x5,x6中,平均数=5,方差s2=9,
则s2=-=9,
所以=204,故选B.
(2)对于A,数据从小到大排列对应中位数的顺序不变,所以若x1,x2,…,xn的中位数为m1,则y1,y2,…,yn的中位数为am1+b,故A正确;
对于B,由平均数的计算方法与性质可知,
若原数据的平均数为m2,则新数据的平均数为am2+b,故B正确;
对于C,由方差的性质可知,若原数据的方差为m3,则新数据的方差为a2m3,故C错误;
对于D,新数据的最大数与最小数与原数据的最大数与最小数对应,即ymax-ymin=,故D错误.故选AB.]
1 / 8(共107张PPT)
第十章 
统计与成对数据的统计分析
第2课时 用样本估计总体
[考试要求] 1.会用统计图表对总体进行估计,会求n个数据的第p百分位数.
2.能用数字特征估计总体集中趋势和总体离散程度.
3.掌握分层随机抽样的样本方差.
链接教材·夯基固本
1.众数、中位数、平均数、百分位数
样本数据 频率分布直方图
众数 一组数据中,出现__________的数据 最高的小矩形底边______的横坐标
次数最多
中点
样本数据 频率分布直方图
中位数 把一组数据按从小到大的顺序排列,处在__________的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分为左右两个______相等的部分,分界线与x轴交点的横坐标
平均数 样本数据的算术平均数 每个小矩形的面积乘小矩形底边______的横坐标之和
中间位置
面积
中点
样本数据 频率分布直方图
百分位数 一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值 对于数据组[a,b),a以下的数据比例为m%,b以下的数据比例为n%,若m≤pa+(b-a)·
2.计算一组n个数据的第p百分位数的步骤
第1步,按__________排列原始数据;
第2步,计算i=________;
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第 ___项数据;若i是整数,则第p百分位数为第 ___项与第__________项数据的平均数.
从小到大
n×p%
j
i
(i+1)
3.四分位数
(1)第25百分位数,第50百分位数,第75百分位数这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
(2)第____百分位数又称第一四分位数或下四分位数;第____百分位数又称第三四分位数或上四分位数.
25
75
4. 总体离散程度的估计
(1)方差和标准差
假设一组数据是x1,x2,…,xn,用表示这组数据的平均数,称
____________为这组数据的方差,也可以写成____________的形式;
称_______________为这组数据的标准差.
(2)总体方差和标准差
①一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,
总体平均数为,则总体方差S2=_____________.
②加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2= .总体标准差:S=.
(3)样本方差和标准差
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称 为样本方差,s=为样本标准差.
[常用结论]
平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)数据x1,x2,…,xn的方差为s2.
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2.
一、易错易混辨析(正确的打“√”,错误的打“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势. (  )
(2)一组数据的方差越大,说明这组数据越集中. (  )
(3)频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越高. (  )
√ 
× 

二、教材经典衍生
1.(人教A版必修第二册P206探究改编)平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关,在如图两种分布形态中,a,b,c,d分别对应平均数和中位数之一,则可能的对应关系是(  )
A.a为中位数,b为平均数,c为平均数,d为中位数
B.a为平均数,b为中位数,c为平均数,d为中位数
C.a为中位数,b为平均数,c为中位数,d为平均数
D.a为平均数,b为中位数,c为中位数,d为平均数

A [在频率分布直方图中,中位数两侧小矩形的面积和相等,平均数可以用每个小矩形底边中点的横坐标乘以小矩形的面积之和近似代替,结合两个频率分布直方图得: a为中位数,b为平均数,c为平均数,d为中位数.故选A.]
2.(人教A版必修第二册P204练习T2改编)某车间12名工人一天生产某产品的质量(单位:kg)分别为13.8,13,13.5,15.7,13.6,14.8,14,14.6,15,15.2,15.8,15.4,则所给数据的第25,50,75百分位数分别是____________________.
13.7,14.7,15.3 
13.7,14.7,15.3 [将12个数据按从小到大排序:13,13.5,13.6,13.8,14,14.6,14.8,15,15.2,15.4,15.7,15.8.
由i=12×25%=3,得所给数据的第25百分位数是第3个数据与第4个数据的平均数,即=13.7;
由i=12×50%=6,得所给数据的第50百分位数是第6个数据与第7个数据的平均数,即=14.7;
由i=12×75%=9,得所给数据的第75百分位数是第9个数据和第10个数据的平均数,即=15.3.]
3.(人教A版必修第二册P215练习T2改编)一组数据的平均数是28,方差是4,若将这组数据中的每一个数据都加上20,得到一组新数据,则所得新数据的平均数是________,方差是________.
48 
4
48 4 [设该组数据为x1,x2,…,xn,
则新数据为x1+20,x2+20,…,xn+20,记新数据的平均数为′,
因为′==20+28=48.
因为s2=2+2+…+],
所以s′2={2+2+…+2}=s2=4.]
4.(人教A版必修第二册P198练习T1改编)为了了解全民对足球的喜爱程度,组委会在某场比赛结束后,随机抽取了1 000名观众进行对足球“喜爱度”的调查评分,将得到的分数分成6段:[70,75),[75,80),[80,85),[85,90),[90,95),[95,100],得到如图所示的频率分布直方图.图中部分数据丢失,若已
知这1 000名观众评分的中位数估计值为
87.5,则m=________.
0.02 
0.02 [由题可知,5(m+0.025+0.03)+(87.5-85)×0.05=0.5,解得m=0.02.]
考点一 总体百分位数的估计
[典例1] (1)已知由小到大排列的4个数据1,3,5,a,若这4个数据的极差是它们中位数的2倍,则这4个数据的第75百分位数是(  )
A.7 B.6
C.5 D.4
典例精研·核心考点

(2)将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出频率分布直方图如图,则此班的模拟考试成绩的第80百分位数约为________.(结果保留两位小数)
124.44 
(1)A (2)124.44 [(1)由小到大排列的4个数据1,3,5,a,则a≥5,
这4个数的极差为a-1,中位数为=4,
因为这4个数据的极差是它们中位数的2倍,
则a-1=2×4,解得a=9,
所以这四个数由小到大依次为1,3,5,9,
因为4×0.75=3,所以这4个数据的第75百分位数是=7.故选A.
(2)由频率分布直方图可知,分数在120分以下的学生所占的比例为(0.010 0+0.015 0+0.015 0+0.030 0)×10×100%=70%,分数在130分以下的学生所占的比例为(0.010 0+0.015 0+0.015 0+0.030 0+0.022 5)×10×100%=92.5%,
因此,80%分位数一定位于[120,130)内.
因为120+×10≈124.44,所以此班的模拟考试成绩的第80百分位数约为124.44.]
【教用·备选题】
已知100个数据的第75百分位数是9.3,则下列说法正确的是(  )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数

C [因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,则C正确,其他选项均不正确,故选C.]
名师点评
1.计算一组n个数据的第p百分位数的一般步骤
2.频率分布直方图中第p百分位数的计算
(1)确定百分位数所在的区间[a,b).
(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+×(b-a).
[跟进训练]
1.(1)(2025·湖北武汉模拟)有一组样本数据:15,16,11,11,14,20,11,13,13,24,13,18,则这组样本数据的上四分位数是
(  )
A.11 B.13
C.16 D.17

(2)(2024·江苏南通二模)某同学在一次数学测试中的成绩是班级第三名(假设测试成绩两两不同),成绩处于第90百分位数,则该班级的人数可能为(  )
A.15 B.25
C.30 D.35

(1)D (2)B [(1)将样本数据由小到大排列依次为:11,11,11,13,13,13,14,15,16,18,20,24,因为12×=9,所以这组数据的上四分位数为=17.故选D.
(2)设班级人数为x,由题意,x-3+1-1<0.9x【教用·备选题】
2024年4月30日,神舟十七号载人飞船返回舱在东风着陆场成功着陆,激发了学生对航天的热爱.某校组织高中学生参加航天知识竞赛,现从中随机抽取100名学生的成绩,其频率分布直方图如图所示,设这组样本数据的第75百分位数为x,众数为y,则(  )
A.x=88,y=90
B.x=83,y=90
C.x=83,y=85
D.x=88,y=85

D [由题意得×10=1,解得a=0.050,
因为0.05+0.3=0.35,0.05+0.3+0.5=0.85,则0.35<0.75<0.85,
则样本数据的第75百分位数位于[80,90),则0.35+(x-80)×0.050=0.75,解得x=88,
因为样本数据中位于成绩[80,90)之间最多,则众数为y==85.故选D.]
考点二 总体集中趋势的估计
[典例2] (1)(多选)已知运动员甲特训的成绩分别为:9,12,8,16,16,18,20,16,12,13,则这组数据的(  )
A.众数为12 B.平均数为14
C.中位数为14.5 D.第85百分位数为16


(2)(2025·陕西西安模拟)某校为了解在校学生对中国传统文化的传承认知情况,随机抽取了100名学生进行中国传统文化知识考试,并将这100名学生成绩整理得到如下频率分布直方图.根据此频率分布直方图(分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组),下列结论中不正确的是(  )
A.图中的a=0.012
B.若从成绩在[70,80),[80,90),[90,100]内的学生中采用分层随机抽样方法抽取10名学生,则成绩在[80,90)内的有3人
C.这100名学生成绩的中位数约为65
D.若同一组中的数据用该组区间的中点值作代表,则这100名学生的平均成绩约为68.2

(1)BC (2)C [(1)成绩从小到大排列为:8,9,12,12,13,16,16,16,18,20.
出现次数最多的数为16,故A错误;
平均数为×(8+9+12+12+13+16+16+16+18+20)=14,故B正确;
中位数为=14.5,故C正确;
10×0.85=8.5,
故第85百分位数为第9位,为18,故D错误.故选BC.
(2)由×10=1,得a=0.012,所以A正确,不符合题意;
这100名学生中成绩在[70,80),[80,90),[90,100]内的频率分别为0.2,0.12,0.08,所以采用分层随机抽样方法抽取的10名学生中成绩在[80,90)内的有10×=3(人),故B正确,不符合题意;
根据频率分布直方图,可知这100名学生成绩的中位数在[60,70)之间,设中位数为x,则0.08+0.2+(x-60)×0.032=0.5,所以x=66.875,故C错误,符合题意;
根据频率分布直方图的平均数的计算公式,可得=45×0.08+55×0.2+65×0.32+75×0.2+85×0.12+95×0.08=68.2,故D正确,不符合题意.故选C.]
【教用·备选题】
1.(多选)(2024·广东汕头一模)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了100名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这100名学生中,成绩位于
[80,90)内的学生成绩方差为12,成
绩位于[90,100]内的学生成绩方差为
10,则(  )
A.a=0.004
B.估计该年级学生成绩的中位数约为77.14
C.估计该年级成绩在80分及以上的学生成绩的平均数为87.50
D.估计该年级成绩在80分及以上的学生成绩的方差为30.25



BCD [对于A,在频率分布直方图中,所有直方图的面积之和为1,则(2a+3a+7a+6a+2a)×10=200a=1,解得a=0.005,A错误;
对于B,前两个矩形的面积之和为×10=50a=0.25<0.5,
前三个矩形的面积之和为×10=120a=0.6>0.5,
设该年级学生成绩的中位数为m,则m∈[70,80),
根据中位数的定义可得0.25+×0.035=0.5,解得m≈77.14,所以估计该年级学生成绩的中位数约为77.14,B正确;
对于C,估计成绩在80分及以上的学生成绩的平均数为×95=87.5,C正确;
对于D,估计该年级成绩在80分及以上的学生成绩的方差为[12+(87.5-85)2]+[10+(87.5-95)2]=30.25,D正确.故选BCD.]
2.某社区组织了垃圾分类知识竞赛活动,从所有参赛选手中随机抽取20人,将他们的得分按照[0,20),[20,40),[40,60),[60,80),[80,100]分组,绘成频率分布直方图(如图).
(1)求x的值;
(2)分别求出抽取的20人中得分落在[0,20)和[20,40)内的人数;
(3)估计所有参赛选手得分的平均数、中位数和众数.
解:(1)由频率分布直方图的性质得:
(0.005 0+0.007 5+x+0.012 5+0.015 0)×20=1,
解得x=0.010 0.
(2)由频率分布直方图能求出:
得分落在[0,20)内的人数为20×0.005 0×20=2,
得分落在[20,40)内的人数为20×0.007 5×20=3.
(3)所有参赛选手得分的平均数为
0.005 0×20×10+0.007 5×20×30+0.015 0×20×50+0.012 5×20×70+0.010 0×20×90=56.
设所有参赛选手得分的中位数为a,
则0.005 0×20+0.007 5×20+0.015 0×(a-40)=0.5,
解得a=.
所有参赛选手得分的众数估计值为=50.
名师点评 频率分布直方图的数字特征
(1)众数:最高矩形的底边中点的横坐标.
(2)中位数:中位数左边和右边的矩形的面积和应该相等.
(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.
[跟进训练]
2.(1)某射击运动员连续射击5次,命中的环数(环数为整数)形成的一组数据中,中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为(  )
A.7.6 B.7.8
C.8 D.8.2

(2)有13名同学参加学校组织的才艺表演比赛,已知他们所得的分数互不相同,共设7个获奖名额,某同学知道自己的比赛分数后,要判断自己能否获奖,在这13名同学成绩的统计量中只需知道一个量,它是________.(填“众数”“中位数”或“平均数”)
中位数 
(1)B (2)中位数 [(1)依题意这组数据一共有5个数,中位数为8,则从小到大排列8的前面有2个数,后面也有2个数,又唯一的众数为9,则有两个9,其余数字均只出现一次,则最大数字为9,又极差为3,所以最小数字为6,所以这组数据为6,7,8,9,9,所以平均数为=7.8.故选B.
(2)因为7名获奖者的分数肯定是13名参赛选手中最高的,所以把13个不同的分数按从小到大排序,只要知道自己的分数和中位数就可以知道是否获奖.]
【教用·备选题】
一组数据x1,x2,x3,…,xn的平均数为,现定义这组数据的平均差D=.
如图是甲、乙两组数据的频率分布折线图:
根据折线图,可判断甲、乙两组数据的平均差D1,D2的大小关系是
(  )
A.D1C.D1>D2 D.无法确定

C [由给定的平均差公式可知:数据越集中于平均值附近,平均差越小.甲、乙两图的纵坐标表示的为频率/组距,反映了各组样本数据的疏密程度,甲图中,数据较为均匀的分布在各区间,而乙图数据较为集中的分布在乙图最高处值的区间,其他区间分布的比较少,故乙图平均差比较小.故选C.]
考点三 总体离散程度的估计
[典例3] (2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:
记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为,样本方差为s2.
试验 序号i 1 2 3 4 5 6 7 8 9 10
伸缩 率xi 545 533 551 522 575 544 541 568 596 548
伸缩 率yi 536 527 543 530 560 533 522 550 576 536
(1)求,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高.则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
解:(1)由题意,求出zi的值如表所示,
试验 序号i 1 2 3 4 5 6 7 8 9 10
zi 9 6 8 -8 15 11 19 18 20 12
则×(9+6+8-8+15+11+19+18+20+12)=11,
s2=×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.
(2)因为2>,
所以可认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
名师点评 标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.
[跟进训练]
3.(1)已知数据x1,x2,x3,x4,x5,x6的平均数是5,方差是9,则=(  )
A.159  B.204  C.231  D.636

(2)(多选)(2025·湖南衡阳开学考试)有一组样本数据x1,x2,…,xn,由这组样本得到新样本数据y1,y2,…,yn,其中yi=axi+b,则
(  )
A.x1,x2,…,xn的中位数为m1,则y1,y2,…,yn的中位数为am1+b
B.x1,x2,…,xn的平均数为m2,则y1,y2,…,yn的平均数为am2+b
C.x1,x2,…,xn的方差为m3,则y1,y2,…,yn的方差为am3
D.x1,x2,…,xn的极差为m4,则y1,y2,…,yn的极差为am4


(1)B (2)AB [(1)根据题意,数据x1,x2,x3,x4,x5,x6中,平均数=5,方差s2=9,
则s2=-=9,
所以=204,故选B.
(2)对于A,数据从小到大排列对应中位数的顺序不变,所以若x1,x2,…,xn的中位数为m1,则y1,y2,…,yn的中位数为am1+b,故A正确;
对于B,由平均数的计算方法与性质可知,
若原数据的平均数为m2,则新数据的平均数为am2+b,故B正确;
对于C,由方差的性质可知,若原数据的方差为m3,则新数据的方差为a2m3,故C错误;
对于D,新数据的最大数与最小数与原数据的最大数与最小数对应,即ymax-ymin=,故D错误.故选AB.]
【教用·备选题】
1.(多选)(2021·新高考Ⅱ卷)下列统计量中,能度量样本x1,x2,…,xn的离散程度的有(  )
A.样本x1,x2,…,xn的标准差
B.样本x1,x2,…,xn的中位数
C.样本x1,x2,…,xn的极差
D.样本x1,x2,…,xn的平均数


AC [中位数反应数据的变化,
标准差反应数据与均值之间的偏离程度,
极差反映最大值与最小值之间的差距,
平均数反应数据的平均水平,
故能反应一组数据离散程度的是标准差、极差.故选AC.]
2.(2024·辽宁葫芦岛二模)某地为了了解学生的睡眠时间,根据初中和高中学生的人数比例采用分层随机抽样方法,抽取了40名初中生和20名高中生,调查发现初中生每天的平均睡眠时间为8小时,方差为2,高中生每天的平均睡眠时间为7小时,方差为1.根据调查数据,估计该地区中学生睡眠时间的总体方差约为(  )
A.1.3 B.1.5
C.1.7 D.1.9

D [该地区中学生每天睡眠时间的平均数为(小时),该地区中学生每天睡眠时间的方差为+=≈1.9.
故选D.]
题号
1
3
5
2
4
6
8
7
9
10
11
12
一、单项选择题
1.(2024·浙江温州一模)某校高一年级18个班参加艺术节合唱比赛,通过简单随机抽样,获得了10个班的比赛得分如下:91,89,90,92,94,87,93,96,91,85,则这组数据的80%分位数为(  )
A.93 B.93.5
C.94 D.94.5
13
课后作业(六十四) 用样本估计总体

B [将比赛得分从小到大重新排列:85,87,89,90,91,91,92,93,94,96,因为10×80%=8,所以这组数据的80%分位数是第8个数与第9个数的平均值,即=93.5.故选B.]
题号
1
3
5
2
4
6
8
7
9
10
11
12
13
2.某组样本数据的频率分布直方图如图所示,设该组样本数据的众数、平均数、第一四分位数分别为x1,x2,x3,则x1,x2,x3的大小关系是(注:同一组中数据用该组区间中点值近似代替)(  )
A.x3B.x2C.x1D.x1题号
1
3
5
2
4
6
8
7
9
10
11
12
13

题号
1
3
5
2
4
6
8
7
9
10
11
12
13
A [由频率分布直方图可知众数为=2.5,即x1=2.5,平均数x2=0.2×1.5+0.24×2.5+0.2×3.5+0.16×4.5+0.12×5.5+0.04×6.5+0.04×7.5=3.54,显然第一四分位数位于[2,3)之间,则0.2+(x3-2)×0.24=0.25,解得x3≈2.208,
所以x33.某校高三年级一共有1 200名同学参加数学测验,已知所有学生成绩的第80百分位数是103分,则数学成绩不小于103分的人数至少为(  )
A.220 B.240
C.250 D.300
题号
1
3
5
2
4
6
8
7
9
10
11
12

13
B [∵1 200×80%=960,
∴小于103分的学生最多有960人,
则数学成绩不小于103分的学生至少有
1 200-960=240(人).]
题号
1
3
5
2
4
6
8
7
9
10
11
12
13
4.样本数据x1,x2,…,xn的平均数=4,方差s2=1,则样本数据2x1+1,2x2+1,…,2xn+1的平均数,方差分别为(  )
A.9,4 B.9,2
C.4,1 D.2,1
题号
1
3
5
2
4
6
8
7
9
10
11
12

13
A [由=4,得样本数据2x1+1,2x2+1,…,2xn+1的平均数为2+1=2×4+1=9,由s2=1,得样本数据2x1+1,2x2+1,…,2xn+1的方差为4s2=4.故选A.]
题号
1
3
5
2
4
6
8
7
9
10
11
12
5.在一次数学测试中,高二某班40名学生成绩的平均分为82,方差为10.2,则下列四个数中不可能是该班数学成绩的是(  )
A.100 B.85
C.65 D.55
13

题号
1
3
5
2
4
6
8
7
9
10
11
12
D [∵s2= =10.2,n=40,
∴ =10.2×40=408.
若存在x=55,则(x-)2=(55-82)2=729>408= ,
导致方差必然大于10.2,不符合题意.
∴55不可能是该班数学成绩.故选D.]
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
6.某班50名同学进行了一次党史知识竞赛,该次竞赛测试成绩统计如下表,其中两个数据被遮盖.
13

成绩/分 91 92 93 94 95 96 97 98 99 100
人数 ■ ■ 1 2 3 5 6 8 10 12
下列关于成绩的统计量中,与被遮盖的数据无关的是(  )
A.平均数,方差 B.中位数,方差
C.中位数,众数 D.平均数,众数
题号
1
3
5
2
4
6
8
7
9
10
11
12
C [由表格数据可知,成绩为91分、92分的人数为50-(12+10+8+6+5+3+2+1)=3,
成绩为100分的出现的次数最多,所以成绩的众数为100,
成绩从小到大排列后处在第25、26位的两个数都是98分,所以数据的中位数为98,
所以中位数和众数与被遮盖的数据无关.故选C.]
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
二、多项选择题
7.(2023·新高考Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则(  )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
13


题号
1
3
5
2
4
6
8
7
9
10
11
12
13
BD [取x1=1,x2=x3=x4=x5=2,x6=9,则x2,x3,x4,x5的平均数等于2,标准差为0,x1,x2,…,x6的平均数等于3,标准差为=,故A,C均不正确;根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x2,x3,x4,x5的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x1,x2,…,x6的中位数相等,故B正确;根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D正确.故选BD.]
题号
1
3
5
2
4
6
8
7
9
10
11
12
8.(2025·福建莆田模拟)已知一组正实数样本数据xi,满足x1≤x2≤x3≤…≤x10,则(  )
A.样本数据的第80百分位数为x8
B.去掉样本的一个数据,样本数据的极差可能不变
C.若样本数据的频率分布直方图为单峰不对称,且在右边“拖尾”,则样本数据的平均数大于中位数
D.将组中的每个数据变为原来的2倍,则所得的新样本数据组的方差变为原数据组方差的2倍
13


题号
1
3
5
2
4
6
8
7
9
10
11
12
BC [对于A,由10×80%=8,所以样本数据的第80百分位数为,故A错误;
对于B,由题意存在这样一种可能,若x1=x2≤x3≤…≤x10,
则极差为x10-x1=x10-x2,此时样本数据的极差不变,故B正确;
对于C,数据的频率分布直方图为单峰不对称,
向右边“拖尾”,大致如图.
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
由于“右拖”时最高峰偏左,中位数靠近高峰处,平均数靠近中点处,
此时平均数大于中位数,故C正确;
对于D,将组中的每个数据变为原来的2倍,所得的新样本数据组的方差变为原数据组方差的4倍,故D错误.故选BC.]
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
三、填空题
9.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如表(单位:环):
13
甲 10 8 9 9 9
乙 10 10 7 9 9
如果甲、乙只有1人能入选,则入选的应是 ________.
甲 
题号
1
3
5
2
4
6
8
7
9
10
11
12
甲 [甲的平均数为=(10+8+9+9+9)=9,
乙的平均数为=(10+10+7+9+9)=9,
甲的方差为=[(10-9)2+(8-9)2]=,
乙的方差为=[(10-9)2×2+(7-9)2]=,
∵=,∴甲、乙的平均水平相同,
,∴甲的成绩稳定,故甲入选.]
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
10.某校组织学生参与航天知识竞答活动,某班8位同学成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的第25百分位数保持不变,则整数m(1≤m≤10)的值可以是_______________________ ____________________(写出一个满足条件的m值即可).
13
7或8或9或10(填上述4个数
中任意一个均可)
题号
1
3
5
2
4
6
8
7
9
10
11
12
7或8或9或10(填上述4个数中任意一个均可) [7,6,8,9,8,7,10,m,若去掉m,该组数据从小到大排列为:6,7,7,8,8,9,10,则7×0.25=1.75,故第25百分位数为第2个数即7,所以7,6,8,9,8,7,10,m,第25百分位数为7,而8×0.25=2,所以7为第2个数与第3个数的平均数,所以m(1≤m≤10)的值可以是7或8或9或10.]
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
四、解答题
11.某校有高中生2 000人,其中男、女生比例约为3∶2,为了获得该校全体高中生的身高信息,采取了以下两种方案:方案一:采用比例分配的分层随机抽样方法,抽取了样本量为n的样本,得到如图所示的频数分布表和频率分布直方图.方案二:采用简单随机抽样方法,抽取了男、女生样本量均为25的样本,计算得到男生样本的均值为170,方差为16,女生样本的均值为160,方差为20.
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
13
身高/ cm [145, 155) [155, 165) [165, 175) [175, 185) [185,
195]
频数 m p q 6 4
题号
1
3
5
2
4
6
8
7
9
10
11
12
(1)根据图表信息,求n,q并补充完整频率分布直方图,估计该校高中生的身高均值;(同一组中的数据以这组数据所在区间中点的值为代表)
(2)计算方案二中总样本的均值及方差;
(3)计算两种方案总样本均值的差,并说明用方案二总样本的均值作为总体均值的估计合适吗?为什么?
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
解:(1)因为身高在区间[185,195]的频率为0.008×10=0.08,频数为4,所以样本量n==50,m=0.008×10×50=4,p=0.04×10×50=20,q=50-4-20-6-4=16,所以身高在[165,175)的频率为=0.32,小矩形的高为0.032,所以身高在[175,185)的频率为=0.12,小矩形的高为0.012,由此补全频率分布直方图.
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
样本的身高均值为(150×0.008+160×0.04+170×0.032+180×0.012+190×0.008)×10=167.2,所以由样本估计总体可知,该校高中生的身高均值为167.2 cm.
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
(2)把男生样本记为x1,x2,x3,…,x25,其均值为,方差为,把女生样本记为y1,y2,y3,…,y25,其均值为总样本均值记方差记为s2,所以===165,s2=+()2]}=×(16+25)+×(20+25)=43.
(3)两种方案总样本均值的差为167.2-165=2.2,所以用方案二总样本均值作为总体均值的估计不合适,原因是没有进行等比例的分层随机抽样,每个个体被抽到的可能性不同,因此代表性较差.
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
12.(2024·云南昆明双基检测)某滨海城市沙滩风景秀丽,夏日美丽的海景和清凉的海水吸引了不少前来游玩的旅客.某饮品店通过公开竞标的方式获得卖现制饮品的业务,为此先根据前一年沙滩开放的160天进入沙滩的人数,做前期的市场调查来模拟饮品店开卖之后的利润情况,考虑沙滩承受能力有限,超过1.4万人即停止预约.如下表格是160天内进入沙滩的每日人数(单位:万)的频数分布表.
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
13
人数 /万 [0, 0.2) [0.2, 0.4) [0.4, 0.6) [0.6, 0.8) [0.8, 1.0) [1.0, 1.2) [1.2,
1.4]
频数 /天 8 8 16 24 a 48 32
题号
1
3
5
2
4
6
8
7
9
10
11
12
(1)绘制160天内进入沙滩的每日人数的频率分布直方图(用阴影表示),并求出a的值和这组数据的第65百分位数;
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
(2)据统计,每10个进入沙滩的游客当中平均有1人会购买饮品,X(单位:个)为进入该沙滩的人数(X为10的整倍数.如有8 006人,则X取8 000).每杯饮品的售价为15元,成本为5元,当日未出售饮品当垃圾处理.若该店每日准备1 000杯饮品,记Y为该店每日的利润(单位:元),求Y和X的函数关系式;
(3)以频率估计概率,求该店在160天的沙滩开放日中利润不低于
7 000元的概率.
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
解:(1)由题意,8+8+16+24+a+48+32=160,解得a=24.
因为=0.5,=0.8,
所以第65百分位数在区间[1.0,1.2)上,
则第65百分位数为1.0+0.2×=1.1.
画出频率分布直方图如图所示.
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
(2)由题意知,当X≥10 000时,Y=(15-5)×1 000=10 000元,当X<10 000时,Y=×(15-5)-×5=1.5X-5 000,
所以Y=
(3)记销售的利润不低于7 000元的事件为A,则人数X≥8 000,
此时P(A)==0.65.
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
13.(2025·山东德州模拟)在一次体育赛事的志愿者选拔面试工作中,随机抽取了200名候选者的面试成绩并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的
频率分布直方图.已知第三、四、五
组的频率之和为0.7,第一组和第五
组的频率相同.
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
(1)利用该频率分布直方图,估计这200名候选者面试成绩的平均数(同一组中的数据用该组区间的中点值作代表);
(2)从成绩在第四、五组的志愿者中,按分层随机抽样方法抽取10人,再从这10人中任选3人,在选出的3人来自不同组的情况下,求恰有2人来自第四组的概率.
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
解:(1)因为第三、四、五组的频率之和为0.7,
所以×10=0.7,解得a=0.005,
所以前两组的频率之和为1-0.7=0.3,即×10=0.3,解得b=0.025,
估计平均数为50×0.05+60×0.25+70×0.45+80×0.2+90×0.05=69.5.
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
(2)成绩在第四、五两组的频率之比为0.02∶0.005=4∶1,
按分层随机抽样抽得第四组志愿者人数为10×=8,第五组志愿者人数为10×=2,
记事件A为“选出的3人来自不同组”,记事件B为“恰有2人来自第四组”,
故A∩B=B,
其中P=,P=P(B)=,
13
题号
1
3
5
2
4
6
8
7
9
10
11
12
P===.
所以在选出的3人来自不同组的情况下,恰有2人来自第四组的概率为.
13
谢 谢!课后作业(六十四) 用样本估计总体
说明:单项选择题每题5分,多项选择题每题6分,填空题每题5分,本试卷共95分
一、单项选择题
1.(2024·浙江温州一模)某校高一年级18个班参加艺术节合唱比赛,通过简单随机抽样,获得了10个班的比赛得分如下:91,89,90,92,94,87,93,96,91,85,则这组数据的80%分位数为(  )
A.93 B.93.5
C.94 D.94.5
2.某组样本数据的频率分布直方图如图所示,设该组样本数据的众数、平均数、第一四分位数分别为x1,x2,x3,则x1,x2,x3的大小关系是(注:同一组中数据用该组区间中点值近似代替)(  )
A.x3C.x13.某校高三年级一共有1 200名同学参加数学测验,已知所有学生成绩的第80百分位数是103分,则数学成绩不小于103分的人数至少为(  )
A.220 B.240
C.250 D.300
4.样本数据x1,x2,…,xn的平均数=4,方差s2=1,则样本数据2x1+1,2x2+1,…,2xn+1的平均数,方差分别为(  )
A.9,4 B.9,2
C.4,1 D.2,1
5.在一次数学测试中,高二某班40名学生成绩的平均分为82,方差为10.2,则下列四个数中不可能是该班数学成绩的是(  )
A.100 B.85
C.65 D.55
6.某班50名同学进行了一次党史知识竞赛,该次竞赛测试成绩统计如下表,其中两个数据被遮盖.
成绩/分 91 92 93 94 95 96 97 98 99 100
人数 ■ ■ 1 2 3 5 6 8 10 12
下列关于成绩的统计量中,与被遮盖的数据无关的是(  )
A.平均数,方差 B.中位数,方差
C.中位数,众数 D.平均数,众数
二、多项选择题
7.(2023·新高考Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则(  )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
8.(2025·福建莆田模拟)已知一组正实数样本数据xi,满足x1≤x2≤x3≤…≤x10,则(  )
A.样本数据的第80百分位数为x8
B.去掉样本的一个数据,样本数据的极差可能不变
C.若样本数据的频率分布直方图为单峰不对称,且在右边“拖尾”,则样本数据的平均数大于中位数
D.将组中的每个数据变为原来的2倍,则所得的新样本数据组的方差变为原数据组方差的2倍
三、填空题
9.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如表(单位:环):
甲 10 8 9 9 9
乙 10 10 7 9 9
如果甲、乙只有1人能入选,则入选的应是 ________.
10.某校组织学生参与航天知识竞答活动,某班8位同学成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的第25百分位数保持不变,则整数m(1≤m≤10)的值可以是________(写出一个满足条件的m值即可).
四、解答题
11.某校有高中生2 000人,其中男、女生比例约为3∶2,为了获得该校全体高中生的身高信息,采取了以下两种方案:方案一:采用比例分配的分层随机抽样方法,抽取了样本量为n的样本,得到如图所示的频数分布表和频率分布直方图.方案二:采用简单随机抽样方法,抽取了男、女生样本量均为25的样本,计算得到男生样本的均值为170,方差为16,女生样本的均值为160,方差为20.
身高/ cm [145, 155) [155, 165) [165, 175) [175, 185) [185, 195]
频数 m p q 6 4
(1)根据图表信息,求n,q并补充完整频率分布直方图,估计该校高中生的身高均值;(同一组中的数据以这组数据所在区间中点的值为代表)
(2)计算方案二中总样本的均值及方差;
(3)计算两种方案总样本均值的差,并说明用方案二总样本的均值作为总体均值的估计合适吗?为什么?
12.(2024·云南昆明双基检测)某滨海城市沙滩风景秀丽,夏日美丽的海景和清凉的海水吸引了不少前来游玩的旅客.某饮品店通过公开竞标的方式获得卖现制饮品的业务,为此先根据前一年沙滩开放的160天进入沙滩的人数,做前期的市场调查来模拟饮品店开卖之后的利润情况,考虑沙滩承受能力有限,超过1.4万人即停止预约.如下表格是160天内进入沙滩的每日人数(单位:万)的频数分布表.
人数 /万 [0, 0.2) [0.2, 0.4) [0.4, 0.6) [0.6, 0.8) [0.8, 1.0) [1.0, 1.2) [1.2, 1.4]
频数 /天 8 8 16 24 a 48 32
(1)绘制160天内进入沙滩的每日人数的频率分布直方图(用阴影表示),并求出a的值和这组数据的第65百分位数;
(2)据统计,每10个进入沙滩的游客当中平均有1人会购买饮品,X(单位:个)为进入该沙滩的人数(X为10的整倍数.如有8 006人,则X取8 000).每杯饮品的售价为15元,成本为5元,当日未出售饮品当垃圾处理.若该店每日准备1 000杯饮品,记Y为该店每日的利润(单位:元),求Y和X的函数关系式;
(3)以频率估计概率,求该店在160天的沙滩开放日中利润不低于7 000元的概率.
13.(2025·山东德州模拟)在一次体育赛事的志愿者选拔面试工作中,随机抽取了200名候选者的面试成绩并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.已知第三、四、五组的频率之和为0.7,第一组和第五组的频率相同.
(1)利用该频率分布直方图,估计这200名候选者面试成绩的平均数(同一组中的数据用该组区间的中点值作代表);
(2)从成绩在第四、五组的志愿者中,按分层随机抽样方法抽取10人,再从这10人中任选3人,在选出的3人来自不同组的情况下,求恰有2人来自第四组的概率.
课后作业(六十四)
[A组 在基础中考查学科功底]
1.B [将比赛得分从小到大重新排列:85,87,89,90,91,91,92,93,94,96,因为10×80%=8,所以这组数据的80%分位数是第8个数与第9个数的平均值,即=93.5.故选B.]
2.A [由频率分布直方图可知众数为=2.5,即x1=2.5,平均数x2=0.2×1.5+0.24×2.5+0.2×3.5+0.16×4.5+0.12×5.5+0.04×6.5+0.04×7.5=3.54,显然第一四分位数位于[2,3)之间,则0.2+(x3-2)×0.24=0.25,解得x3≈2.208,
所以x33.B [∵1 200×80%=960,
∴小于103分的学生最多有960人,
则数学成绩不小于103分的学生至少有
1 200-960=240(人).]
4.A [由=4,得样本数据2x1+1,2x2+1,…,2xn+1的平均数为2+1=2×4+1=9,由s2=1,得样本数据2x1+1,2x2+1,…,2xn+1的方差为4s2=4.故选A.]
5.D [∵s2==10.2,n=40,
∴=10.2×40=408.
若存在x=55,则(x-)2=(55-82)2=729>408=,
导致方差必然大于10.2,不符合题意.
∴55不可能是该班数学成绩.故选D.]
6.C [由表格数据可知,成绩为91分、92分的人数为50-(12+10+8+6+5+3+2+1)=3,
成绩为100分的出现的次数最多,所以成绩的众数为100,
成绩从小到大排列后处在第25、26位的两个数都是98分,所以数据的中位数为98,
所以中位数和众数与被遮盖的数据无关.故选C.]
7.BD [取x1=1,x2=x3=x4=x5=2,x6=9,则x2,x3,x4,x5的平均数等于2,标准差为0,x1,x2,…,x6的平均数等于3,标准差为=,故A,C均不正确;根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x2,x3,x4,x5的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x1,x2,…,x6的中位数相等,故B正确;根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D正确.故选BD.]
8.BC [对于A,由10×80%=8,所以样本数据的第80百分位数为,故A错误;
对于B,由题意存在这样一种可能,若x1=x2≤x3≤…≤x10,
则极差为x10-x1=x10-x2,此时样本数据的极差不变,故B正确;
对于C,数据的频率分布直方图为单峰不对称,向右边“拖尾”,大致如图.
由于“右拖”时最高峰偏左,中位数靠近高峰处,平均数靠近中点处,
此时平均数大于中位数,故C正确;
对于D,将组中的每个数据变为原来的2倍,所得的新样本数据组的方差变为原数据组方差的4倍,故D错误.故选BC.]
9.甲 [甲的平均数为=(10+8+9+9+9)=9,
乙的平均数为=(10+10+7+9+9)=9,
甲的方差为=[(10-9)2+(8-9)2]=,
乙的方差为=[(10-9)2×2+(7-9)2]=,
∵=,∴甲、乙的平均水平相同,
,∴甲的成绩稳定,故甲入选.]
10.7或8或9或10(填上述4个数中任意一个均可)
[7,6,8,9,8,7,10,m,若去掉m,该组数据从小到大排列为:6,7,7,8,8,9,10,则7×0.25=1.75,故第25百分位数为第2个数即7,所以7,6,8,9,8,7,10,m,第25百分位数为7,而8×0.25=2,所以7为第2个数与第3个数的平均数,所以m(1≤m≤10)的值可以是7或8或9或10.]
11.解:(1)因为身高在区间[185,195]的频率为0.008×10=0.08,频数为4,所以样本量n==50,m=0.008×10×50=4,p=0.04×10×50=20,q=50-4-20-6-4=16,所以身高在[165,175)的频率为=0.32,小矩形的高为0.032,所以身高在[175,185)的频率为=0.12,小矩形的高为0.012,由此补全频率分布直方图.
样本的身高均值为(150×0.008+160×0.04+170×0.032+180×0.012+190×0.008)×10=167.2,所以由样本估计总体可知,该校高中生的身高均值为167.2 cm.
(2)把男生样本记为x1,x2,x3,…,x25,其均值为,方差为,把女生样本记为y1,y2,y3,…,y25,其均值为总样本均值记方差记为s2,所以===165,s2=+()2]}=×(16+25)+×(20+25)=43.
(3)两种方案总样本均值的差为167.2-165=2.2,所以用方案二总样本均值作为总体均值的估计不合适,原因是没有进行等比例的分层随机抽样,每个个体被抽到的可能性不同,因此代表性较差.
[B组 在综合中考查关键能力]
12.解:(1)由题意,8+8+16+24+a+48+32=160,解得a=24.
因为=0.5,=0.8,
所以第65百分位数在区间[1.0,1.2)上,
则第65百分位数为1.0+0.2×=1.1.
画出频率分布直方图如图所示.
(2)由题意知,当X≥10 000时,Y=(15-5)×1 000=10 000元,当X<10 000时,Y=×(15-5)-×5=1.5X-5 000,
所以Y=
(3)记销售的利润不低于7 000元的事件为A,则人数X≥8 000,
此时P(A)==0.65.
13.解:(1)因为第三、四、五组的频率之和为0.7,
所以×10=0.7,解得a=0.005,
所以前两组的频率之和为1-0.7=0.3,即×10=0.3,解得b=0.025,
估计平均数为50×0.05+60×0.25+70×0.45+80×0.2+90×0.05=69.5.
(2)成绩在第四、五两组的频率之比为0.02∶0.005=4∶1,
按分层随机抽样抽得第四组志愿者人数为10×=8,第五组志愿者人数为10×=2,
记事件A为“选出的3人来自不同组”,记事件B为“恰有2人来自第四组”,
故A∩B=B,
其中P=,P=P(B)=,
P===.
所以在选出的3人来自不同组的情况下,恰有2人来自第四组的概率为.
1 / 5
同课章节目录