第九章 第58讲 用样本估计总体(课件 学案 练习)2026届高中数学人教A版(2019)一轮复习

文档属性

名称 第九章 第58讲 用样本估计总体(课件 学案 练习)2026届高中数学人教A版(2019)一轮复习
格式 zip
文件大小 18.5MB
资源类型 教案
版本资源 通用版
科目 数学
更新时间 2025-09-27 16:55:20

文档简介

第58讲 用样本估计总体
● 课前基础巩固
【知识聚焦】
1.(2)①最大值 最小值 ②组距 组数 ③分组 ④频率分布表
⑤频率分布直方图
2.(1)(x1+x2+…+xn)
(2)从小到大(或从大到小) 中间
(3)最多 (4)①小于或等于 大于或等于
②从小到大 n×p% j 平均数
【对点演练】
1.4.5 5.5 [解析] 由题意得中位数m==4.5,而10×60%=6,则60%分位数a==5.5.
2.0.004 4 70 [解析] (1)由(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,得x=0.004 4.
(2)所求户数为(0.003 6+0.006 0+0.004 4)×50×100=70.
3.丙 [解析] 从表格中可以看出乙和丙的平均环数最高,即平均成绩最好,又乙、丙两人之间丙的方差较小,所以丙发挥得比乙稳定,故最佳人选应为丙.
4.7 8.5 [解析] 由题意知,这10名学生的得分为3,6,6,6,6,6,7,8,9,10,其极差是10-3=7,因为10×80%=8,所以80%分位数是=8.5.
5.70 70 68 [解析] 由题意知众数为=70.因为0.005×20+0.010×20=0.3<0.5,(0.005+0.010+0.020)×20=0.7>0.5,所以中位数位于[60,80)内,设中位数为x,则(0.005+0.010)×20+(x-60)×0.020=0.5,解得x=70.平均数为30×0.1+50×0.2+70×0.4+90×0.3=68.
6.19 4 [解析] ∵x1,x2,…,xn的平均数为10,标准差为2,∴2x1-1,2x2-1,…,2xn-1的平均数为2×10-1=19,标准差为=4.
● 课堂考点探究
例1 [思路点拨] (1)对于A,直接求出中位数;对于B,分别计算出甲、乙每日行走步数的极差,判断即可;对于C,通过观察折线图即可判断;对于D,将乙的每日行走步数从小到大排列,再计算上四分位数即可.(2)横向对比90后年龄比例和90后行业分布图,来确定各岗位年龄段比例.
(1)AB (2)D [解析] (1)对于A,甲的每日行走步数依次为16 000,7965,12 700,2435,16 800,9500,11 600,从小到大排列为2435,7965,9500,11 600,12 700,16 000,16 800,则中位数是11 600,故A正确;对于B,这一星期内甲的每日行走步数的极差为16 800-2435=14 365,这一星期内乙的每日行走步数的极差为14 200-5340=8860,因为14 365>8860,所以这一星期内甲的每日行走步数的极差大于乙的每日行走步数的极差,故B正确;对于C,由图知甲数据的波动幅度更大,则乙的每日行走步数的方差小于甲的每日行走步数的方差,故C错误;对于D,乙的每日行走步数从小到大排列为5340,7030,10 060,11 600,12 300,12 970,14 200,7×75%=5.25,则这一星期内乙的每日行走步数的上四分位数是12 970,故D错误.故选AB.
(2)由题图可知,快递行业从业人员中,“90后”占总人数的56%,超过一半,A中结论正确;快递行业从业人员中,从事技术岗位的“90后”的人数占总人数的百分比为56%×39.6%=22.176%,超过20%,所以快递行业从业人员中,从事技术岗位的“90”后的人数超过总人数的20%,B中结论正确;快递行业从业人员中,从事运营岗位的“90后”的人数占总人数的百分比为56%×17%=9.52%,超过“80前”的人数占总人数的百分比,C中结论正确;快递行业从业人员中,从事技术岗位的“90后”的人数占总人数的百分比为22.176%,小于“80后”的人数占总人数的百分比,但“80后”从事技术岗位的人数占“80后”人数的百分比未知,D中结论不一定正确.故选D.
变式题 (1)C (2)C [解析] (1)对于A,由题中左图知,样本中男性人数多于女性人数,从而男性比女性更关注地铁建设,故A中结论正确;对于B,由题中右图知,女性中35岁以上的占多数,则样本中多数女性是35岁以上,所以关注地铁建设的女性多数是35岁以上,故B中结论正确;对于C,由题中左图知,男性人数多于女性人数,由题中右图知,35岁以下的男性占男性总人数的比例比35岁以上的女性占女性总人数的比例小,所以无法判断35岁以下的男性人数与35岁以上的女性人数的多少,故C中结论不一定正确;对于D,由题中右图知,样本中35岁以上的人对地铁建设关注度更高,故D中结论正确.故选C.
(2)对于A,由图可知,2016年至2023年,知识付费用户数量逐年增加,故A中说法正确.对于B和C,2017年知识付费用户数量的逐年增加量为0.96-0.48=0.48,2018年知识付费用户数量的逐年增加量为1.88-0.96=0.92,2019年知识付费用户数量的逐年增加量为2.95-1.88=1.07,2020年知识付费用户数量的逐年增加量为3.56-2.95=0.61,2021年知识付费用户数量的逐年增加量为4.15-3.56=0.59,2022年知识付费用户数量的逐年增加量为4.77-4.15=0.62,2023年知识付费用户数量的逐年增加量为5.27-4.77=0.5,则知识付费用户数量逐年增加量2019年最多,知识付费用户数量的逐年增加量不是逐年递增,故B中说法正确,C中说法错误.对于D,由5.27>10×0.48知,2023年知识付费用户数量超过2016年知识付费用户数量的10倍,故D中说法正确.故选C.
例2 [思路点拨] (1)对于A,B,分别计算出前三段频数和低于1100 kg的频数,对于C,D,根据计算公式即可判定.
(2)根据频率分布直方图中,众数、百分位数、均值的概念及计算方法求解.
(3)由所给数据和计算公式可计算统计数据的平均数和方差.
(1)C (2)ABD (3)44 7
[解析] (1)对于A,根据频数分布表可知,6+12+18=36<50,所以亩产量的中位数不小于1050 kg,故A错误;对于B,亩产量不低于1100 kg的频数为24+10=34,所以低于1100 kg的稻田占比为=66%,故B错误;对于C,稻田亩产量的极差小于1200-900=300,大于1150-950=200,故C正确;对于D,由频数分布表可得,平均值为×(6×925+12×975+18×1025+30×1075+24×1125+10×1175)=1067,故D错误.故选C.
(2)对于A,因为体重在[65,70)所占的频率最高,所以估计样本的众数为=67.5,故A正确;对于B,因为5×(0.03+0.05+0.06)=0.70,5×0.04=0.20,所以样本的80%分位数为70+5×=72.5,故B正确;对于C,样本的平均数为57.5×15%+62.5×25%+67.5×30%+72.5×20%+77.5×10%=66.75,故C错误;对于D,根据频率分布直方图,体重低于60 kg的学生的频率为5×0.03=15%,所以估计该校男生中体重低于60 kg的学生人数为2000×15%=300,故D正确.故选ABD.
(3)由题中的数据可得,平均数为×(40+41+43+43+44+46+47+48)=44,方差为×[(40-44)2+(41-44)2+…+(47-44)2+(48-44)2]=7.
变式题 (1)AD (2)BCD [解析] (1)将原数据按从小到大的顺序排列为12,16,22,24,25,31,33,35,45,其中位数为25,平均数是(12+16+22+24+25+31+33+35+45)÷9=27,方差是×[(-15)2+(-11)2+(-5)2+(-3)2+(-2)2+42+62+82+182]=,由40%×9=3.6,得原数据的第40百分位数是第4个数24.将原数据去掉12和45,得16,22,24,25,31,33,35,其中位数为25,平均数是(16+22+24+25+31+33+35)÷7=,方差是×=,由40%×7=2.8,得新数据的第40百分位数是第3个数24,故中位数和第40百分位数不变,平均数和方差改变,故A,D正确,B,C错误.故选AD.
(2)对于A,甲的数据在区间[1.5,7.5]内,极差小于或等于6,乙的数据在区间[2.5,8.5]内,极差小于或等于6,从而甲和乙的极差可能相等,故A说法错误;对于B,根据频率分布直方图可知,甲的众数在区间[2.5,5.5)内,乙的众数在区间[5.5,6.5)内,乙的众数大于甲的众数,故B说法正确;对于C,甲的数据比较分散,乙的数据比较集中,因此乙的方差小于甲的方差,故C说法正确;对于D,甲的各组频率依次为0.15,0.20,0.20,0.20,0.15,0.10,其中位数在区间[3.5,4.5)内,乙的各组频率依次为0.05,0.10,0.15,0.35,0.20,0.15,其中位数在区间[5.5,6.5)内,所以甲的中位数小于乙的中位数,故D说法正确.故选BCD.
例3 [思路点拨] (1)对于A,B,分别计算相应矩形的面积进而可得结论;对于C,验证中位数是否为5h即可;对于D,根据频率分布直方图计算平均数的方法求解即可.(2)①用频率估计概率即可;②分别根据平均数和方差的计算公式求解即可.
(1)BD [解析] 对于A,该校高中学生平均每周英语训练时间不足4 h的人数为(0.03×2+0.10×2)×5000=1300,故A错误;对于B,估计该校高中学生平均每周英语训练时间不少于8 h的人数所占比例为0.08×2+0.03×2=0.22=22%,故B正确;对于C,假设该校高中学生平均每周英语训练时间的中位数为5 h,而训练时间小于5 h的频率为0.03×2+0.10×2+×0.14×2=0.4,与频率为0.5矛盾,所以平均每周英语训练时间的中位数不为5 h,故C错误;对于D,估计该校高中学生平均每周英语训练时间为0.03×2×1+0.10×2×3+0.14×2×5+0.12×2×7+0.08×2×9+0.03×2×11=5.84(h),故D正确.故选BD.
(2)解:①∵(0.004+0.008+0.016+0.034+m+0.008+0.004+0.002)×10=1,∴m=0.024,故估计事件A发生的概率为(0.024+0.008+0.004+0.002)×10=0.38.
②估计本次数学考试成绩的平均数为(75×0.004+85×0.008+95×0.016+105×0.034+115×0.024+125×0.008+135×0.004+145×0.002)×10=106.6,估计本次数学考试成绩的方差为(998.56×0.004+466.56×0.008+134.56×0.016+2.56×0.034+70.56×0.024+338.56×0.008+806.56×0.004+1 474.56×0.002)×10=205.44.
变式题 (1)BCD (2)C [解析] (1)对于A,由(2a+3a+7a+6a+2a)×10=200a=1,解得a=0.005,故A错误;对于B,前两个矩形的面积之和为(2a+3a)×10=50a=0.25<0.5,前三个矩形的面积之和为(2a+3a+7a)×10=120a=0.6>0.5,设该年级学生成绩的中位数为m,则m∈[70,80),根据中位数的定义可得0.25+(m-70)×0.035=0.5,解得m≈77.14,所以估计该年级学生成绩的中位数约为77.14,故B正确;对于C,估计成绩在80分及以上的学生成绩的平均数为×85+×95=87.5,故C正确;对于D,估计该年级成绩在80分及以上的学生成绩的方差为[12+(87.5-85)2]+[10+(87.5-95)2]=30.25,故D正确.故选BCD.
(2)由题意得,年夜饭消费金额在(2400,3200]内的频率为=0.35>,故A中说法正确;若该地区有2000个家庭,则估计年夜饭消费金额超过2400元的家庭个数为2000×=940,故B中说法正确;估计该地区家庭年夜饭消费金额的平均数为400×0.08+1200×0.2+2000×0.25+2800×0.35+3600×0.08+4400×0.04=2216(元),故C中说法不正确;估计该地区家庭年夜饭消费金额的中位数为1600+×800=2304(元),故D中说法正确.故选C.第58讲 用样本估计总体
1.B [解析] 鞋店经理最关心的是哪个鞋号的日销量最大,所以最重要的是众数.故选B.
2.C [解析] 由频率分布直方图可知,0.1+10a+0.45+10a+0.05=20a+0.6=1,解得a=0.020.故选C.
3.B [解析] 10名学生成绩从低到高依次为75,80,85,85,90,90,95,95,100,105,且10×60%=6,故60%分位数为第6个数和第7个数的平均数=92.5.故选B.
4.B [解析] 由图可知,5个时刻温度的极差为9-2=7,故A中说法正确;中位数为4,故B中说法错误;平均温度为×(2+3+4+7+9)=5(℃),故C中说法正确;比较几个数值可知下午17时温度最高,故D中说法正确.故选B.
5.ACD [解析] 对于A,由图知,每一组中的成绩占比都是以各自班级的总人数为基数的,所以每一组中的甲班、乙班人数不能从所占的百分比来判断,故A中说法错误;对于B,C,由图可知甲班考生成绩主要集中在[80,90),乙班考生成绩主要集中在[60,70),故B中说法正确,C中说法错误;对于D,由图可知甲班考生成绩的极差和乙班考生成绩的极差的大小无法确定,故D中说法错误.故选ACD.
6.240 [解析] 由频率分布直方图估计,该校体重(单位:kg)在区间[70,78]内的男生的人数为2000×(0.02+0.01)×4=240.
7.①②④ [解析] 图(1)的频率分布直方图是对称的,所以平均数=中位数=众数,故①正确;图(2)众数最小,右边“拖尾”平均数大于中位数,故②正确,③错误;图(3)左边“拖尾”众数最大,平均数小于中位数,故④正确.故填①②④.
8.B [解析] 对于A,该部门一年中请假天数为0的人数为30-6-3-4-4-3=10,A中说法正确.对于B,该部门一年中请假天数大于5的人数为4+4+3=11,B中说法错误.对于C,因为30×40%=12,且请假天数为0的人数为10,请假天数为4的人数为6,所以这30名员工一年中请假天数的第40百分位数为4,C中说法正确.对于D,这30名员工一年中请假天数的平均数为×(4×6+5×3+6×4+7×4+8×3)=<4,D中说法正确.故选B.
9.D [解析] 对于A,第一次月考数学成绩占16%,第二次月考数学成绩占17%,且第一次月考总分低于第二次月考总分,所以第二次月考数学成绩比第一次月考数学成绩要高,故A错误;对于B,第一次月考政治成绩占17%,第二次月考政治成绩占16%,由于只知道第一次月考总分低于第二次月考总分,故无法判断这两次月考政治学科成绩的变化,故B错误;对于C,第一次月考化学成绩占16%,第二次月考化学成绩占17%,且第一次月考总分低于第二次月考总分,所以第二次月考化学成绩比第一次月考化学成绩要高,故C错误;对于D,第一次月考语文成绩占16%,第二次月考语文成绩占18%,且第一次月考总分低于第二次月考总分,所以第二次月考语文成绩比第一次月考语文成绩要高,故D正确.故选D.
10.AC [解析] 依题意,(0.015+0.025+0.035+0.005+2a)×10=1,解得a=0.010.对于A,∵最高小矩形的中点的横坐标为75,∴估计众数是75,故A正确.对于B,设样本的71%分位数为x,又10×(0.010+0.015+0.025)=0.5,∴0.5+(x-70)×0.035=0.71,解得x=76,故B错误.对于C,估计平均数为45×0.1+55×0.15+65×0.25+75×0.35+85×0.1+95×0.05=68.5,故C正确.对于D,样本中得分低于60分的占(0.010+0.015)×10×100%=25%,∴估计该校学生中得分低于60分的占25%,故D错误.故选AC.
11.AD [解析] 对于A,4个北方城市的环比数据的极差为99.7-99.5=0.2,4个南方城市的环比数据的极差为99.8-99.5=0.3,所以4个北方城市的环比数据的极差小于4个南方城市的环比数据的极差,故A正确;对于B,4个北方城市的环比数据的均值为=99.6,4个南方城市的环比数据的均值为=99.6,所以4个北方城市的环比数据的均值与4个南方城市的环比数据的均值相等,故B错误;对于C,4个北方城市的环比数据的方差为×[(99.5-99.6)2+(99.6-99.6)2+(99.6-99.6)2+(99.7-99.6)2]=0.005,4个南方城市的环比数据的方差为×[(99.5-99.6)2+(99.5-99.6)2+(99.6-99.6)2+(99.8-99.6)2]=0.015,所以4个北方城市的环比数据的方差小于4个南方城市的环比数据的方差,故C错误;对于D,4个北方城市的环比数据的中位数为99.6,4个南方城市的环比数据的中位数为=99.55,所以4个北方城市的环比数据的中位数大于4个南方城市的环比数据的中位数,故D正确.故选AD.
12.3 4 [解析] 因为数据4x1,4x2,…,4x12的中位数为16,方差为64,所以数据x1,x2,…,x12的中位数为4,方差为=4,所以数据x1-1,x2-1,…,x12-1的中位数为4-1=3,方差为4.
13. [解析] 根据题意,数据1,3,4,x,y,y+2的平均数为,数据1,3,4,x,y,y+2的50%分位数为,∴=,即y=x+1,代入数据x,y,y+2,即为x,x+1,x+3,此组数据的平均数为=x+,∴数据x,y,y+2的方差为=×=.
14.解:(1)由题意得=×(5.2+4.8+4.8+5.0+5.0+5.2+5.1+4.8+5.1+5.0)=5.0,=×(5.0+5.2+5.3+5.1+5.4+5.2+5.2+5.3+5.2+5.1)=5.2,=×(4×0.12+2×0.22)=0.012.
(2)由(1)可得-=5.2-5.0=0.2=,==,因为>,所以-≥成立,故新生产线生产的零件质量较旧生产线生产的零件质量有显著提高.
15.解:(1)由男生自主体育锻炼时间的频率折线图可得,m=1-0.04-0.20-0.24-0.16=0.36.
由女生自主体育锻炼时间的频数折线图可知,女生共有1+4+5+12+3=25(人),其中“体育迷”有12+3=15(人),
故男生共有100-25=75(人),其中“体育迷”有75×(0.24+0.16)=30(人),因此估计该校高一年级学生中“体育迷”所占比例为×100%=45%.
(2)由折线图可知,男生自主体育锻炼时间在第一段至第五段的频数分别为75×0.04=3,75×0.20=15,75×0.36=27,75×0.24=18,75×0.16=12,故这100名学生每周的自主体育锻炼时间在第一段至第五段的频率分别为(1+3)÷100=0.04,(4+15)÷100=0.19,(5+27)÷100=0.32,(12+18)÷100=0.30,(3+12)÷100=0.15,所以估计该校高一年级学生的周平均自主体育锻炼时间为1×0.04+3×0.19+5×0.32+7×0.30+9×0.15=5.66.
因为5.66>5,所以估计该校高一年级学生的周平均自主体育锻炼时间达到了保持身体健康发展的水平.
16.ACD [解析] 原来的中位数与现在的中位数均为==x1+9,故中位数不变,故A正确;原始数据的极差为x10-x1=18,新数据的极差为x9-x2=14,故极差变小,故B错误;由于xi-xi-1=2(2≤i≤10),故x2=x1+2,x3=x1+4,…,x9=x1+16,x10=x1+18,原来的平均数为==x1+9,去掉x1,x10后的平均数为==x1+9,平均数不变,故C正确;原来的方差为×[(x1-x1-9)2+(x2-x1-9)2+…+(x10-x1-9)2]=33,去掉x1,x10后的方差为×[(x2-x1-9)2+(x3-x1-9)2+…+(x9-x1-9)2]=21,方差变小,故D正确.故选ACD.
17.解:(1)由题意可知,题图①中第一个矩形面积为0.04>2.8%=0.028,可知80所以错检率g(87)=0.006×(90-87)+10×0.004=0.058=5.8%.
(2)当80≤k<90时,f(k)=0.004×(k-80)=0.004k-0.320,g(k)=0.006×(90-k)+10×0.004=0.580-0.006k,
可得h(k)=f(k)+g(k)=-0.002k+0.260,易知0.080当90≤k≤100时,则f(k)=0.004×10+0.026×(k-90)=0.026k-2.300,g(k)=0.004×(100-k)=0.4-0.004k,可得h(k)=f(k)+g(k)=0.022k-1.900,易知0.080≤h(k)≤0.300.
所以h(k)=
当且仅当k=90时,h(k)取到最小值0.080.第58讲 用样本估计总体
【课标要求】 1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.
2.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.
3.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.
4.能用样本估计总体的取值规律.
5.能用样本估计百分位数,理解百分位数的统计含义.
1.数据的可视化描述
(1)各类统计图的特点
类型 作用
频率分布 直方图 主要以面积的形式描述数据落在各个小组的频率的大小,可以估计总体数据的分布趋势
扇形图 主要用于直观描述各类数据占总数的比例
条形图 主要用于直观描述不同类别或分组数据的频数和频率,尤其是离散型的数据
折线图 主要用于描述数据随时间的变化趋势
(2)作频率分布直方图的步骤
①求极差(即一组数据中    与    的差);
②决定    与    ;
③将数据    ;
④列       ;
⑤画         .
2.数据的数字特征
(1)平均数:如果给定的一组数是x1,x2,…,xn,则这组数的平均数为=      ,简记为=xi .
(2)中位数:把一组数据按        的顺序排列,处在    位置的一个数据(或两个数据的平均数).
(3)众数:一组数据中,出现次数    的数据.
(4)百分位数
①定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据      这个值,且至少有(100-p)%的数据      这个值.
②计算一组n个数据的第p百分位数的步骤:
第1步,按      排列原始数据.
第2步,计算i=    .
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第    项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的     .
③四分位数:第25百分位数,第50百分位数,第75百分位数.其中:第25百分位数又称第一四分位数或下四分位数,第75百分位数又称第三四分位数或上四分位数.
(5)方差和标准差
如果x1,x2,…,xn的平均数为,则其方差s2=(xi-)2=-,标准差s=.
注:方差越大,说明数据的离散程度或波动幅度越大,反之数据越集中,其单位是原始数据单位的平方.
常用结论
1.若数据x1,x2,…,xn的平均数为,方差为s2,则数据yi=axi+b(i=1,2,…,n,a,b∈R)的平均数=a+b,方差为a2s2.
2.众数、中位数(百分位数)、平均数与频率分布直方图的关系:
(1)众数:最高的小矩形底边中点的横坐标.
(2)中位数:从左侧开始满足小矩形面积和为0.5的横坐标的值;根据百分位数的定义,求第p百分位数同样转化为从左侧求小矩形的累计面积和满足的条件.
(3)平均数:每个小矩形底边中点的横坐标与对应频率的积的和.
题组一 常识题
1.[教材改编] 已知数据1,2,2,3,4,5,6,6,7,8的中位数为m,60%分位数为a,则m=    ,a=    .
2.[教材改编] 从某小区抽取100户居民进行月用电量调查,发现他们的月用电量都在50~350 kW·h之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.
(1)直方图中x的值为    ;
(2)在被调查的用户中,月用电量落在区间[100,250)内的户数为    .
3.[教材改编] 甲、乙、丙、丁四人参加运动会射击项目选拔赛,四人的平均环数和方差如下表所示:
甲 乙 丙 丁
平均环数 8.5 8.8 8.8 8
方差s2 3.5 3.5 2.1 8.5
则参加运动会的最佳人选应为    .
题组二 常错题
◆索引:挖掘不出统计图表反映的信息;不理解数字特征的统计含义;不理解百分位数的计算步骤;混淆均值和方差的性质.
4.某校举行了一次知识竞赛,满分10分,有10名学生代表班级参加比赛,已知学生得分均为整数,比赛结束后统计得这10名学生得分情况的折线图,如图所示,则这10名学生得分的极差为    ,80%分位数是    .
5.某班全体学生参加物理测试成绩(单位:分)的频率分布直方图如图所示,则估计该班物理测试成绩的众数、中位数、平均数分别是    、    、    .
6.已知x1,x2,…,xn的平均数为10,标准差为2,则2x1-1,2x2-1,…,2xn-1的平均数和标准差分别为    和    .
 常见统计图表的识读与直观应用
例1 (1)(多选题)如图为甲、乙两人在同一星期内每日行走步数的折线统计图,则 (  )
A.这一星期内甲的每日行走步数的中位数为11 600
B.这一星期内甲的每日行走步数的极差大于乙的每日行走步数的极差
C.这一星期内乙的每日行走步数的方差大于甲的每日行走步数的方差
D.这一星期内乙的每日行走步数的上四分位数是7030
(2)[2024·四川遂宁三模] 某调查机构对某地快递行业从业者进行调查统计,得到快递行业从业人员年龄分布饼状图(图①)、“90后”从事快递行业岗位分布条形图(图②),则下列结论中不一定正确的是 (  )
A.快递行业从业人员中,“90后”占一半以上
B.快递行业从业人员中,从事技术岗位的“90后”的人数超过总人数的20%
C.快递行业从业人员中,从事运营岗位的“90后”的人数比“80前”的多
D.快递行业从业人员中,从事技术岗位的“90后”的人数比“80后”的多
总结反思
扇形图、条形图、折线图的关注点
(1)扇形图能清楚地表示出各部分数量同总数之间的关系.
(2)条形图的长度表示各类别频数的多少,宽度是固定的类别,与频率分布直方图不同.
(3)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.
变式题 (1)某地调查机构随机抽取了部分关注该地地铁建设的市民作为样本,分析其年龄和性别结构,并制作出如图所示的等高堆积条形图.根据图中(35岁以上含35岁)的信息,关于该样本的结论不一定正确的是 (  )
A.男性比女性更关注地铁建设
B.关注地铁建设的女性多数是35岁以上
C.35岁以下的男性人数比35岁以上的女性人数多
D.35岁以上的人对地铁建设关注度更高
(2)[2024·山东菏泽一模] 南丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔设计的,图中每个扇形圆心角都是相等的,半径长短表示数量大小.某机构统计了近几年某国知识付费用户数量(单位:亿人次),并绘制成南丁格尔玫瑰图(如图所示),根据此图,以下说法错误的是 (  )
A.2016年至2023年,知识付费用户数量逐年增加
B.2016年至2023年,知识付费用户数量逐年增加量2019年最多
C.2016年至2023年,知识付费用户数量的逐年增加量逐年递增
D.2023年知识付费用户数量超过2016年知识付费用户数量的10倍
 样本的数字特征的求解与应用
例2 (1)[2024·新课标Ⅱ卷] 某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)都在[900,1200)内,并整理得到下表:
亩产量 [900, 950) [950, 1000) [1000, 1050) [1050, 1100) [1100, 1150) [1150, 1200)
频数 6 12 18 30 24 10
根据表中数据,下列结论正确的是 (  )
A.100块稻田亩产量的中位数小于1050 kg
B.100块稻田中亩产量低于1100 kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200 kg到300 kg之间
D.100块稻田亩产量的平均值介于900 kg到1000 kg之间
(2)(多选题)青少年是国家的未来和民族的希望,国家不断出台相关政策法规,引导广大青少年积极参与体育健身.近年来,随着政策措施牵引带动,学生体质与健康水平不断迈上新台阶.某学校共有2000名男生,为了了解这部分学生的身体发育情况,学校抽查了100名男生的体重情况.根据所得数据绘制样本的频率分布直方图如图所示,则下列结论正确的是 (  )
A.样本的众数为67.5
B.样本的80%分位数为72.5
C.样本的平均值为66
D.估计该校男生中体重低于60 kg的学生有300人
(3)对一个做直线运动的质点的运动过程观测了8次,得到如表所示的数据.
观测序号i 1 2 3 4 5 6 7 8
观测数据ai 40 41 43 43 44 46 47 48
上述统计数据的平均数是    ,方差是    .
总结反思
(1)通过频率分布直方图求中位数时,若小矩形的面积和不恰为0.5,则可按比例求其余部分.
(2)求方差时,勿忘乘,方差是各数据与其中心(平均值)距离的平方的平均值.
                 
变式题 (1)(多选题)已知一组数据12,31,24,33,22,35,45,25,16,若去掉12和45,则剩下的数据与原数据相比,下列结论正确的是 (  )
A.中位数不变
B.平均数不变
C.方差不变
D.第40百分位数不变
(2)(多选题)[2024·广东汕头三模] 如图是样本甲与样本乙的频率分布直方图,下列说法正确的是 (  )
A.样本乙的极差一定大于样本甲的极差
B.样本乙的众数一定大于样本甲的众数
C.样本乙的方差一定小于样本甲的方差
D.样本甲的中位数一定小于样本乙的中位数
 用样本的数字特征估计总体的数字
特征
例3 (1)(多选题)为了提高学生的英语基础,某中学要求学生每天坚持1 h的听、说、读、写训练.为了调查该校5000名高中学生平均每周参加英语训练时间的情况,某教师从高一、高二、高三三个年级的学生中按照3∶1∶1的比例进行分层随机抽样,收集了100名学生平均每周英语训练时间(单位:h)的样本数据,整理后得到如图所示的频率分布直方图,则下列说法中正确的有 (  )
A.估计该校高中学生平均每周英语训练时间不足4 h的人数为1500
B.估计该校高中学生平均每周英语训练时间不少于8 h的人数所占比例为22%
C.估计该校高中学生平均每周英语训练时间的中位数为5 h
D.估计该校高中学生平均每周英语训练时间为5.84 h
(2)某市为了解新高三学生的数学学习情况,以便为即将展开的一轮复习提供准确的数据,在开学初该市教体局组织高三学生进行了一次摸底考试,现从参加考试的学生中随机抽取200名,根据统计结果,将他们的数学成绩(满分150分)分为[70,80),[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150]共8组,得到如图所示的频率分布直方图.
①设事件A=“从参加考试的学生中随机抽取1名学生,该学生的成绩不低于110分”,估计事件A发生的概率(用频率估计概率);
②利用所给数据估计本次数学考试成绩的平均数及方差(各组数据以其中点值作代表).
参考数据:(x1-)2=998.56,(x2-)2=466.56,(x3-)2=134.56,(x4-)2=2.56,(x5-)2=70.56,(x6-)2=338.56,(x7-)2=806.56,(x8-)2=1 474.56,其中xi(i=1,2,…,8)为第i组数据的中点值.


总结反思
用样本的数字特征估计总体的数字特征常常是以频率分布直方图等为工具,应用平均数、方差、中位数等进行分析,解决问题时要注意准确建立统计模型,准确计算各个数字特征.
变式题 (1)(多选题)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了100名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析学生的成绩分布情况,计算得到这100名学生中,成绩位于[80,90)内的学生成绩的方差为12,成绩位于[90,100)内的同学成绩的方差为10,则 (  )
A.a=0.004
B.估计该年级学生成绩的中位数约为77.14
C.估计该年级成绩在80分及以上的学生成绩的平均数为87.5
D.估计该年级成绩在80分及以上的学生成绩的方差为30.25
(2)大年除夕吃年夜饭是中国古老的民俗传统,唐朝诗人孟浩然曾写下“续明催画烛,守岁接长筵”这样的诗句.为了解某地区居民的年夜饭消费金额,研究人员随机调查了该地区100个家庭,所得年夜饭消费金额(单位:元)统计如图所示,则下列说法中不正确的是 (  )
A.可以估计,该地区年夜饭消费金额在(2400,3200]内的家庭数量超过总数的三分之一
B.若该地区有2000个家庭,可以估计年夜饭消费金额超过2400元的有940个
C.估计该地区家庭年夜饭消费金额的平均数不足2100元
D.估计该地区家庭年夜饭消费金额的中位数超过2200元第58讲 用样本估计总体
(时间:45分钟)
1.某鞋店试销一种新款女鞋,销售情况如下表:
鞋号 34 35 36 37 38 39 40 41
日销量/双 2 5 9 16 9 5 3 2
如果你是鞋店经理,那么下列统计量中对你来说最重要的是 (  )               
A.平均数 B.众数
C.中位数 D.极差
2.某研究机构为了解某地年轻人的阅读情况,通过随机抽样调查了100位年轻人,对这些人每天的阅读时间(单位:分钟)进行统计,得到样本的频率分布直方图(如图所示),则a的值为 (  )
A.0.20 B.0.040
C.0.020 D.0.015
3.[2025·西安一模] 为全面普及无人机知识,激发青少年探索航空的创造力与想象力,提升青少年科学素养和创新能力,培养航空后备人才,某省将于2025年4月中旬举办青少年无人机大赛.某校在校内进行选拔赛,10名学生成绩依次为85,105,75,100,90,95,85,90,80,95,则这组数据的60%分位数为 (  )
A.90 B.92.5
C.85 D.95
4.某地区中午11时到夜里23时的气温分布如图所示,关于这5个时刻的温度,以下说法错误的是 (  )
A.5个时刻温度的极差为7
B.5个时刻温度的中位数为9
C.平均温度为5 ℃
D.下午17时温度最高
5.(多选题)[2024·黑龙江部分学校三模] 在某市初三年级举行的一次体育考试中(满分100分),所有考生成绩均在[50,100]内,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五组,甲、乙两班考生的成绩占比如图所示,则下列说法错误的是 (  )
A.成绩在[70,80)的考生中,甲班人数多于乙班人数
B.甲班考生成绩在[80,90)内人数最多
C.乙班考生成绩在[70,80)内人数最多
D.甲班考生成绩的极差比乙班考生成绩的极差小
6.某大学有男生2000名,为了解该校男生的体重情况,随机抽查了该校100名男生的体重,并将这100名男生的体重(单位:kg)按[54,58),[58,62),[62,66),[66,70),[70,74),[74,78]分成六组,绘制成如图所示的频率分布直方图,则估计该校体重(单位:kg)在区间[70,78]内的男生有     人.
7.[2024·武汉调研] 如图所示的频率分布直方图显示了三种不同的分布形态.图(1)形成对称形态,图(2)形成右边“拖尾”形态,图(3)形成左边“拖尾”形态,根据所给图作出以下判断,其中正确的是    .(填序号)
①图(1)的平均数=中位数=众数;
②图(2)的众数<中位数<平均数;
③图(2)的众数<平均数<中位数;
④图(3)的平均数<中位数<众数.
8.某部门30名员工一年中请假天数(未请假则请假天数为0)与对应人数的柱形图(图中只有请假天数为0的未显示)如图所示,则下列说法错误的为 (  )
A.该部门一年中请假天数为0的人数为10
B.该部门一年中请假天数大于5的人数为10
C.这30名员工一年中请假天数的第40百分位数为4
D.这30名员工一年中请假天数的平均数小于4
9.如图为某同学两次月考成绩占总成绩百分数的扇形统计图,已知该同学第一次月考总分低于第二次月考总分,则 (  )
A.该同学数学学科成绩一定下降
B.该同学政治学科成绩一定下降
C.该同学化学学科成绩可能下降
D.该同学语文学科成绩一定提升
10.(多选题)[2024·广东茂名一模] 中秋节起源于上古时代,普及于汉代,定型于唐朝初年,如今已成为中华民族弥足珍贵的文化遗产.某校举行与中秋节相关的“中国传统文化”知识竞赛,随机抽取了100人的成绩整理后得到如图所示的频率分布直方图,则下列结论正确的是 (  )
A.样本的众数估计为75
B.样本的71%分位数估计为75
C.样本的平均值估计为68.5
D.估计该校学生中得分低于60分的占20%
11.(多选题)[2024·浙江绍兴二模] 国家统计局统计了2024年1月全国多个大中城市二手住宅销售价格的分类指数,其中北方和南方各4个城市的90 m2及以下二手住宅销售价格的环比数据如下:
北方城市 环比(单位:%,上月=100) 南方城市 环比(单位:%,上月=100)
北京 99.5 上海 99.5
天津 99.6 南京 99.5
石家庄 99.6 南昌 99.6
沈阳 99.7 福州 99.8
则 (  )
A.4个北方城市的环比数据的极差小于4个南方城市的环比数据的极差
B.4个北方城市的环比数据的均值小于4个南方城市的环比数据的均值
C.4个北方城市的环比数据的方差大于4个南方城市的环比数据的方差
D.4个北方城市的环比数据的中位数大于4个南方城市的环比数据的中位数
12.[2024·河南洛阳三模] 若一组数据4x1,4x2,…,4x12的中位数为16,方差为64,则另一组数据x1-1,x2-1,…,x12-1的中位数为    ,方差为    .
13.[2024·广西柳州二模] 若实数x,y(4≤x14.某新能源汽车配件厂生产一种新能源汽车精密零件,为提高产品质量引入了一套新生产线,为检验新生产线所生产出来的零件质量有无显著提高,现同时用旧生产线和新生产线各生产了10个零件,得到各个零件的质量指标的数据如下:
旧生产线 5.2 4.8 4.8 5.0 5.0 5.2 5.1 4.8 5.1 5.0
新生产线 5.0 5.2 5.3 5.1 5.4 5.2 5.2 5.3 5.2 5.1
设旧生产线和新生产线所生产零件的质量指标的样本平均数分别为和,样本方差分别为和.
(1)求,及;
(2)若-≥,则认为新生产线生产零件的质量有显著提高,否则不认为有显著提高,现计算得=0.022,试判断新生产线生产的零件质量较旧生产线生产的零件质量是否有显著提高.
15.学校为提升高一年级学生自主体育锻炼的意识,拟将每周自主体育锻炼的时间不低于6小时的同学称为“体育迷”并予以奖励,为了确定奖励方案,先对学生自主体育锻炼的情况进行抽样调查,学校从高一年级随机抽取100名学生,将他们分为男生组、女生组,对每周自主体育锻炼的时间(单位:小时)分段进行统计.第一段[0,2),第二段[2,4),第三段[4,6),第四段[6,8),第五段[8,10].将男生在各段的频率及女生在各段的频数用折线图表示如下:
(1)求折线图中m的值,并估计该校高一年级学生中“体育迷”所占的比例;
(2)若中学生每周自主体育锻炼的时间不低于5小时,才能保持身体的健康发展,试估计该校高一年级学生的周平均自主体育锻炼时间是否达到保持身体健康发展的水平 (同一段中的数据用该组区间的中点值为代表)
16.(多选题)[2025·湖南湘潭一模] 已知数据x1,x2,x3,…,x10满足xi-xi-1=2(2≤i≤10),若去掉x1,x10后组成一组新数据,则新数据与原数据相比,下列说法正确的是 (  )
A.中位数不变
B.极差不变
C.平均数不变
D.方差变小
17.[2024·广东汕头一模] 某工厂生产某种电子产品配件,关键环节是需要焊接“接线盒”,焊接是否成功直接导致产品“合格”与“不合格”,公司检验组经过大量后期出厂检测发现“不合格”产品和“合格”产品的性能指标有明显差异,得到“不合格”产品和“合格”产品该指标的频率分布直方图如图.
利用该指标制定一个检测标准,需要确定临界值k,将该指标大于k的产品判定为“不合格”,小于或等于k的产品判定为“合格”.此检测标准的漏检率是将“不合格”产品判定为“合格”产品的概率,记为f(k);错检率是将“合格”产品判定为“不合格”产品的概率,记为g(k).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏检率f(k)=2.8%时,求临界值k和错检率g(k);
(2)设函数h(k)=f(k)+g(k),当k∈[80,100]时,求h(k)的解析式,并求h(k)在区间[80,100]上的最小值.(共130张PPT)
第58讲 用样本估计总体
课前基础巩固
课堂考点探究
教师备用习题
作业手册
答案核查【听】
答案核查【作】
【课标要求】
1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描
述,体会合理使用统计图表的重要性.
2.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理
解集中趋势参数的统计含义.
3.能用样本估计总体的离散程度参数(标准差、方差、极差),理解
离散程度参数的统计含义.
4.能用样本估计总体的取值规律.
5.能用样本估计百分位数,理解百分位数的统计含义.
◆ 知识聚焦 ◆
1.数据的可视化描述
(1)各类统计图的特点
类型 作用
频率分布直方图 主要以面积的形式描述数据落在各个小组的频率
的大小,可以估计总体数据的分布趋势
扇形图 主要用于直观描述各类数据占总数的比例
条形图 主要用于直观描述不同类别或分组数据的频数和
频率,尤其是离散型的数据
折线图 主要用于描述数据随时间的变化趋势
(2)作频率分布直方图的步骤
①求极差(即一组数据中________与________的差);
②决定______与______;
③将数据______;
④列____________;
⑤画________________.
最大值
最小值
组距
组数
分组
频率分布表
频率分布直方图
2.数据的数字特征
(1)平均数:如果给定的一组数是,, , ,则这组数的平均数
为___________________,简记为 .
(2)中位数:把一组数据按________________________的顺序排列,
处在______位置的一个数据(或两个数据的平均数).
(3)众数:一组数据中,出现次数______的数据.
从小到大(或从大到小)
中间
最多
(4)百分位数
①定义:一般地,一组数据的第 百分位数是这样一个值,它使得这组
数据中至少有的数据____________这个值,且至少有
的数据____________这个值.
小于或等于
大于或等于
②计算一组个数据的第 百分位数的步骤:
第1步,按__________排列原始数据.
第2步,计算 ________.
第3步,若不是整数,而大于的比邻整数为,则第 百分位数为第__项
数据;若是整数,则第百分位数为第项与第 项数据的________.
③四分位数:第25百分位数,第50百分位数,第75百分位数.其中:第25
百分位数又称第一四分位数或下四分位数,第75百分位数又称第三四
分位数或上四分位数.
从小到大
平均数
(5)方差和标准差
如果,, ,的平均数为 ,则其方差
,标准差 .
注:方差越大,说明数据的离散程度或波动幅度越大,反之数据越集中,
其单位是原始数据单位的平方.
常用结论
1.若数据,, ,的平均数为,方差为,则数据
的平均数,方差为.
2.众数、中位数(百分位数)、平均数与频率分布直方图的关系:
(1)众数:最高的小矩形底边中点的横坐标.
(2)中位数:从左侧开始满足小矩形面积和为0.5的横坐标的值;根据
百分位数的定义,求第百分位数同样转化为从左侧求小矩形的累计
面积和满足的条件.
(3)平均数:每个小矩形底边中点的横坐标与对应频率的积的和.
◆ 对点演练 ◆
题组一 常识题
1.[教材改编] 已知数据1,2,2,3,4,5,6,6,7,8的中位数
为,分位数为,则____, ____.
4.5
5.5
[解析] 由题意得中位数,而,则 分
位数 .
2.[教材改编] 从某小区抽取100户居民进行月用电量调查,发现他
们的月用电量都在 之间,进行适当分组后(每组为左
闭右开的区间),画出频率分布直方图如图所示.
(1)直方图中 的值为________;
[解析] 由
,得 .
(2)在被调查的用户中,月用电量落在区间 内的户数为
____.
[解析] 所求户数为 .
3.[教材改编] 甲、乙、丙、丁四人参加运动会射击项目选拔赛,
四人的平均环数和方差如下表所示:
甲 乙 丙 丁
8.5 8.8 8.8 8
3.5 3.5 2.1 8.5
则参加运动会的最佳人选应为____.

[解析] 从表格中可以看出乙和丙的平均环数最高,即平均成绩最好,
又乙、丙两人之间丙的方差较小,所以丙发挥得比乙稳定,故最佳
人选应为丙.
题组二 常错题
◆ 索引:挖掘不出统计图表反映的信息;不理解数字特征的统计含
义;不理解百分位数的计算步骤;混淆均值和方差的性质.
4.某校举行了一次知识竞赛,满分10分,
有10名学生代表班级参加比赛,已知学
生得分均为整数,比赛结束后统计得这
10名学生得分情况的折线图,如图所示,
则这10名学生得分的极差为___,
分位数是____.
7
8.5
[解析] 由题意知,这10名学生的得分为3,6,6,6,6,6,7,8,9,
10,其极差是,
因为,所以 分位数是 .
5.某班全体学生参加物理测试成绩(单位:分)
的频率分布直方图如图所示,则估计该班物
理测试成绩的众数、中位数、平均数分别
是____、____、____.
70
70
68
[解析] 由题意知众数为 .
因为 ,
,所以中位数位于 内,
设中位数为 ,则,解
得 .
平均数为 .
6.已知,, ,的平均数为10,标准差为2,则 ,
, , 的平均数和标准差分别为____和___.
19
4
[解析] ,, ,的平均数为10,标准差为2, ,
, ,的平均数为 ,标准差为
.
探究点一 常见统计图表的识读与直观应用
例1(1)(多选题)如图为甲、乙两人在同一星期内每日行走步数
的折线统计图,则( )
A.这一星期内甲的每日行走步数的
中位数为11 600
B.这一星期内甲的每日行走步数的
极差大于乙的每日行走步数的极差
C.这一星期内乙的每日行走步数的
方差大于甲的每日行走步数的方差
D.这一星期内乙的每日行走步数的上四分位数是7030


[思路点拨]对于A,直接求出中位数;对于B,分别计算出甲、乙
每日行走步数的极差,判断即可;对于C,通过观察折线图即可判断;
对于D,将乙的每日行走步数从小到大排列,再计算上四分位数即可.
[解析] 对于A,甲的每日行走步数依次
为,7965, ,2435,
,9500, ,从小到大排列
为2435,7965,9500,,,
,,则中位数是 ,故A正确;
对于B,这一星期内甲的每日行走步数的极差为
,这一星期内乙的每日行走步数的极差为,
因为 ,所以这一星期内甲的每日行走步数的极差大于
乙的每日行走步数的极差,故B正确;
对于C,由图知甲数据的波动幅度更大,则乙的每日行走步数的方差
小于甲的每日行走步数的方差,故C错误;
对于D,乙的每日行走步数从小到大排列为5340,7030,,
,, ,, ,则这一星期内
乙的每日行走步数的上四分位数是,故D错误.故选 .
(2)[2024·四川遂宁三模]某调查机构对某地快递行业从业者进行调
查统计,得到快递行业从业人员年龄分布饼状图(图①)、“90后”
从事快递行业岗位分布条形图(图②),则下列结论中不一定正确
的是( )
A.快递行业从业人员中,“90后”占一半以上
B.快递行业从业人员中,从事技术岗位的“90后”的人数超过总人数的
C.快递行业从业人员中,从事运营岗位的“90后”的人数比“80前”的多
D.快递行业从业人员中,从事技术岗位的“90后”的人数比“80后”的多
[思路点拨]横向对比90后年龄比例和90后行业分布图,来确定各
岗位年龄段比例.

[解析] 由题图可知,快递行业从业人员中,“90后”占总人数的 ,
超过一半,A中结论正确;
快递行业从业人员中,从事技术岗位的“90后”的人数占总人数的百分
比为 ,超过 ,所以快递行业从业人员
中,从事技术岗位的“90”后的人数超过总人数的 ,B中结论正确;
快递行业从业人员中,从事运营岗位的“90后”的人数占总人数的百分比
为 ,超过“80前”的人数占总人数的百分比,C中结
论正确;
快递行业从业人员中,从事技术岗位的“90后”的人数占总人数的百分比
为 ,小于“80后”的人数占总人数的百分比,但“80后”从事技术
岗位的人数占“80后”人数的百分比未知,D中结论不一定正确.故选D.
[总结反思]
扇形图、条形图、折线图的关注点
(1)扇形图能清楚地表示出各部分数量同总数之间的关系.
(2)条形图的长度表示各类别频数的多少,宽度是固定的类别,与
频率分布直方图不同.
(3)折线图可以显示随时间(根据常用比例放置)而变化的连续数
据,因此非常适用于显示在相等时间间隔下数据的趋势.
变式题(1)某地调查机构随机抽取了部分关注该地地铁建设的市民
作为样本,分析其年龄和性别结构,并制作出如图所示的等高堆积
条形图.根据图中(35岁以上含35岁)的信息,关于该样本的结论
不一定正确的是( )
A.男性比女性更关注地铁建设
B.关注地铁建设的女性多数是35岁以上
C.35岁以下的男性人数比35岁以上的女性人数多
D.35岁以上的人对地铁建设关注度更高

[解析] 对于A,由题中左图知,样本中男性人数多于女性人数,从
而男性比女性更关注地铁建设,故A中结论正确;
对于B,由题中右图知,女性中35岁以上的占多数,则样本中多数女
性是35岁以上,所以关注地铁建设的女性多数是35岁以上,故B中结
论正确;
对于C,由题中左图知,男性人数多于
女性人数,由题中右图知,35岁以下
的男性占男性总人数的比例比35岁以
上的女性占女性总人数的比例小,所以
无法判断35岁以下的男性人数与35岁以
上的女性人数的多少,故C中结论不一定正确;
对于D,由题中右图知,样本中35岁以上的人对地铁建设关注度更高,
故D中结论正确.故选C.
(2)[2024·山东菏泽一模]南丁格尔玫瑰图
是由近代护理学和护士教育创始人南丁格
尔设计的,图中每个扇形圆心角都是相等
的,半径长短表示数量大小.某机构统计了
近几年某国知识付费用户数量(单位:亿
人次),并绘制成南丁格尔玫瑰图(如图所示),根据此图,以下说法
错误的是( )
A.2016年至2023年,知识付费用户数量逐
年增加
B.2016年至2023年,知识付费用户数量逐
年增加量2019年最多
C.2016年至2023年,知识付费用户数量的
逐年增加量逐年递增
D.2023年知识付费用户数量超过2016年知
识付费用户数量的10倍

[解析] 对于A,由图可知,2016年至2023年,
知识付费用户数量逐年增加,故A中说法正确.
对于B和C,2017年知识付费用户数量的逐年
增加量为 , 年知识付费
用户数量的逐年增加量为 ,
2019年知识付费用户数量的逐年增加量为 ,2020
年知识付费用户数量的逐年增加量为 ,2021年知
识付费用户数量的逐年增加量为 ,2022年知识付
费用户数量的逐年增加量为 ,2023年知识付费用
户数量的逐年增加量为 ,
则知识付费用户数量逐年增加量2019年最
多,知识付费用户数量的逐年增加量不是
逐年递增,故B中说法正确, C中说法错误.
对于D,由 知,2023年知识
付费用户数量超过2016年知识付费用户数量的10倍,故D中说法正确.
故选C.
探究点二 样本的数字特征的求解与应用
例2(1)[2024· 新课标Ⅱ卷]某农业研究部门在面积相等的100块稻田
上种植一种新型水稻,得到各块稻田的亩产量(单位: )都在
内,并整理得到下表:
亩产 量
频数 6 12 18 30 24 10
根据表中数据,下列结论正确的是( )
A.100块稻田亩产量的中位数小于
B.100块稻田中亩产量低于的稻田所占比例超过
C.100块稻田亩产量的极差介于到 之间
D.100块稻田亩产量的平均值介于到 之间
[思路点拨]对于A,B,分别计算出前三段频数和低于 的
频数,对于C,D,根据计算公式即可判定.

亩产 量
频数 6 12 18 30 24 10
[解析] 对于A,根据频数分布表可知, ,所以亩产
量的中位数不小于,故A错误;
对于B,亩产量不低于 的频数为,所以低于 的稻田占比为 ,故B错误;
亩产 量
频数 6 12 18 30 24 10
对于C,稻田亩产量的极差小于,大于 ,故C正确;
对于D,由频数分布表可得,平均值为 ,故D错误.故选C.
亩产 量
频数 6 12 18 30 24 10
(2)(多选题)青少年是国家的未来和民族的希望,国家不断出台
相关政策法规,引导广大青少年积极参与体育健身.近年来,随着政
策措施牵引带动,学生体质与健康水平不断迈上新台阶.某学校共有
2000名男生,为了了解这部分学生的身体发育情况,学校抽查了100
名男生的体重情况.根据所得数据绘制样本的频率分布直方图如图所
示,则下列结论正确的是( )
A.样本的众数为67.5
B.样本的 分位数为72.5
C.样本的平均值为66
D.估计该校男生中体重低于 的学
生有300人
[思路点拨]根据频率分布直方图中,众数、百分位数、均值的概
念及计算方法求解.



[解析] 对于A,因为体重在 所占的频
率最高,所以估计样本的众数为 ,
故A正确;
对于B,因为,
,所以样本的 分位数为
,故B正确;
对于C,样本的平均数为 ,故C错误;
对于D,根据频率分布直方图,体重低于 的学生的频率为
,所以估计该校男生中体重低于 的学生人数为,故D正确.
故选 .
(3)对一个做直线运动的质点的运动过程观测了8次,得到如表所
示的数据.
1 2 3 4 5 6 7 8
40 41 43 43 44 46 47 48
上述统计数据的平均数是____,方差是___.
44
7
[思路点拨]由所给数据和计算公式可计算统计数据的平均数和方差.
[解析] 由题中的数据可得,平均数为

方差为 .
[总结反思]
(1)通过频率分布直方图求中位数时,若小矩形的面积和不恰为
,则可按比例求其余部分.
(2)求方差时,勿忘乘,方差是各数据与其中心(平均值)距离
的平方的平均值.
变式题(1)(多选题)已知一组数据12,31,24,33,22,35,45,25,16,若去掉
12和45,则剩下的数据与原数据相比,下列结论正确的是( )
A.中位数不变 B.平均数不变
C.方差不变 D.第40百分位数不变
[解析] 将原数据按从小到大的顺序排列为12,16,22,24,25,31,33,35,45,
其中位数为25,平均数是 ,方差是 ,由 ,得原数据的第40百分位数是第4个数24.


将原数据去掉12和45,得16,22,24,25,31,33,35,其中位数为25,
平均数是 ,
方差是 ,
由 ,得新数据的第40百分位数是第3个数24,
故中位数和第40百分位数不变,平均数和方差改变,
故A,D正确,B,C错误.
故选 .
(2)(多选题)[2024· 广东汕头三模] 如图是样本甲与样本乙的频
率分布直方图,下列说法正确的是( )
A.样本乙的极差一定大于样本甲的极差
B.样本乙的众数一定大于样本甲的众数
C.样本乙的方差一定小于样本甲的方差
D.样本甲的中位数一定小于样本乙的中位数



[解析] 对于A,甲的数据在区间 内,极差小于或等于6,乙
的数据在区间 内,极差小于或等于6,从而甲和乙的极差可
能相等,故A说法错误;
对于B,根据频率分布直方图可知,甲的众数在区间内,乙
的众数在区间 内,乙的众数大于甲的众数,故B说法正确;
对于C,甲的数据比较分散,乙的数据比较集中,因此乙的方差小于
甲的方差,故C说法正确;
对于D,甲的各组频率依次为,,,,, ,其中位
数在区间内,乙的各组频率依次为,,,,,
,其中位数在区间 内,所以甲的中位数小于乙的中位数,
故D说法正确.故选 .
探究点三 用样本的数字特征估计总体的数字特征
例3(1)(多选题)为了提高学生的英
语基础,某中学要求学生每天坚持
的听、说、读、写训练.为了调查该校
5000名高中学生平均每周参加英语训练
时间的情况,某教师从高一、高二、高
三三个年级的学生中按照 的比例
进行分层随机抽样,收集了100名学生平均每周英语训练时间
(单位: )的样本数据,整理后得到如图所示的频率分布直方图,则
下列说法中正确的有 ( )
A.估计该校高中学生平均每周英语训练
时间不足 的人数为1500
B.估计该校高中学生平均每周英语训练
时间不少于的人数所占比例为
C.估计该校高中学生平均每周英语训练
时间的中位数为
D.估计该校高中学生平均每周英语训练
时间为


[解析] 对于A,该校高中学生平均每周英语
训练时间不足 的人数为
,故A错误;
对于B,估计该校高中学生平均每周英语训
练时间不少于 的人数所占比例为
,故B正确;
[思路点拨]对于A,B,分别计算相应矩形的面积进而可得结论;
对于C,验证中位数是否为 即可;对于D,根据频率分布直方图
计算平均数的方法求解即可.
对于C,假设该校高中学生平均每周英语训练
时间的中位数为,而训练时间小于 的频
率 为 ,
与频率为0.5矛盾,所以平均每周英语训练时
间的中位数不为 ,故C错误;
对于D,估计该校高中学生平均每周英语训练时间为,故D正确.
故选 .
(2)某市为了解新高三学生的数学学习
情况,以便为即将展开的一轮复习提供
准确的数据,在开学初该市教体局组织
高三学生进行了一次摸底考试,现从参
加考试的学生中随机抽取200名,根据统
计结果,将他们的数学成绩(满分150分)
分为,, ,
, 共8组,得到如图所示的频率分布直方图.
①设事件 “从参加考试的学生中随机
抽取1名学生,该学生的成绩不低于110
分”,估计事件 发生的概率(用频率估
计概率);
[思路点拨]用频率估计概率即可;
,,
故估计事件 发生的概率为 .
②利用所给数据估计本次数学考试成绩的平
均数及方差(各组数据以其中点值作代表).
参考数据: ,
,,
,,
, ,其中为
第 组数据的中点值.
[思路点拨]分别根据平均数和方差的计算公式求解即可.
解:估计本次数学考试成绩的平均数为
6,
估计本次数学考试成绩的方差为
.
[总结反思]
用样本的数字特征估计总体的数字特征常常是以频率分布直方图等
为工具,应用平均数、方差、中位数等进行分析,解决问题时要注意准
确建立统计模型,准确计算各个数字特征.
变式题(1)(多选题)某次数学考试后,为分析学生的学习情况,
某校从某年级中随机抽取了100名学生的成绩,整理得到如图所示的
频率分布直方图.为进一步分析学生的成绩分布情况,计算得到这100
名学生中,成绩位于 内的学生成绩的方差为12,成绩位于
内的同学成绩的方差为10,则( )
A.
B.估计该年级学生成绩的中位数约为77.14
C.估计该年级成绩在80分及以上的学生成绩的平均数为87.5
D.估计该年级成绩在80分及以上的学生成绩的方差为30.25



[解析] 对于A,由
,解得 ,
故A错误;
对于B,前两个矩形的面积之和为
,前三个矩形的面
积之和为 ,设该年级学生成绩的中位数为 ,则 ,根据中位数的定义可得 ,解得 ,所以估计该年级学生成
绩的中位数约为 ,故B正确;
对于C,估计成绩在80分及以上的学生成绩的平均数为 ,故C正确;
对于D,估计该年级成绩在80分及以上的学生成绩的方差为
,故D正确.
故选 .
(2)大年除夕吃年夜饭是中国古老的民俗传统,唐朝诗人孟浩然曾
写下“续明催画烛,守岁接长筵”这样的诗句.为了解某地区居民的
年夜饭消费金额,研究人员随机调查了该地区100个家庭,所得年夜
饭消费金额(单位:元)统计如图所示,则下列说法中不正确的是
( )
A.可以估计,该地区年夜饭消费金额在 内的家庭数量超
过总数的三分之一
B.若该地区有2000个家庭,可以估计年夜饭消费金额超过2400元的
有940个
C.估计该地区家庭年夜饭消费金额的平均数不足2100元
D.估计该地区家庭年夜饭消费金额的中位数超过2200元

[解析] 由题意得,年夜饭消费金额在 内的频率为
,故A中说法正确;
若该地区有2000个家庭,则估计年夜饭消费金额超过2400元的家庭个数为 ,故B中说法正确;
估计该地区家庭年夜饭消费金额的平均数为 (元),故C中说法不正确;
估计该地区家庭年夜饭消费金额的中位数为 (元),故D中说法正确.故选C.
【备选理由】例1考查统计图表的识别与应用;
例1 [配例1使用] (多选题)某调查机构对我国若干大型科技公
司进行调查统计,得到了从事芯片、软件两个行业从业者的年龄分
布的饼状图和“90后”从事这两个行业的岗位分布雷达图如图所示,
则下列说法中一定正确的是( )
A.芯片、软件行业从业者中,“90后”占总人数的比例超过
B.芯片、软件行业中,从事技术、设计岗位的“90后”人数超过总人
数的
C.芯片、软件行业中,从事技术岗位的“90后”人数比“80后”人数多
D.芯片、软件行业中,“90后”从事市场软件岗位的人数比“80前”的总
人数多



[解析] 对于A选项,从饼状图可看出芯片、软件行业从业者中,“90
后”占总人数的比例为,超过 ,A正确;
对于B选项,芯片、软件行业中,从事技术、设计岗位的“90后”占总
人数的比例为.,超过总人数的 ,
B正确;
对于C选项,芯片、软件行业中,
从事技术岗位的“90后”占总人数
的比例为,
芯片、软件行业从业者中“80后”
占 ,但不知道“80后”从事技
术岗位的比例,故无法确定两者人数的多少,C错误;
对于D选项,芯片、软件行业中,“90后”从事市场软件岗位的人数占
总人数的,“80前”占总人数的 ,,
故D正确.故选 .
例2 [配例2使用] (多选题)一家公司为了解客户对公司新产品
的满意度,随机选取了 名客户进行评分调查,根据评分数进行适
当分组后(每组为左闭右开的区间),画出的频率分布直方图如图
所示,其中有8名客户的评分数落在 内,则( )
【备选理由】例2考查频率分布直方图的应用、样本数字特征的求解;
A.图中的
B.
C.若同组数据用该组区间的中点值作
代表,则评分数的平均数为76.2
D.该公司计划邀请评分数低于第25百
分位数的客户参与产品改进会议,若
客户甲的评分数为66,则甲将会被邀
请参与产品改进会议



[解析] 由频率分布直方图可知 ,解得 ,故A错误;
评分数落在 内的有8人,所以 ,故B正确;
评分数的平均数为 ,故C正确;
因为 , ,所以第25百分位数在 内,设其为 ,则 ,解得 ,所以甲会被邀请,故D正确.故选 .
例3 [配例3使用] 某果园试种了, 两个品种的桃树各10棵,并
在桃树成熟挂果后统计了这20棵桃树的产量如下表,记, 两个品
种各10棵产量的平均数分别为和,方差分别为和 .
60 50 40 60 70 80 70 30 50 90
40 60 50 80 80 50 60 20 80 70
【备选理由】例3考查用样本的数字特征估计总体的数字特征,特别
是样本数据变化趋势和离散趋势两方面.
(1)分别求这两个品种产量的极差和中位数;
解:这10棵 品种桃树的产量从小到大分别为30,40,50,50,60,
60,70,70,80,90,则这10棵品种桃树产量的极差为
,中位数为 .
这10棵 品种桃树的产量从小到大分别为20,40,50,50,60,60,
70,80,80,80,则这10棵品种桃树产量的极差为 ,
中位数为 .
60 50 40 60 70 80 70 30 50 90
40 60 50 80 80 50 60 20 80 70
(2)求,,, ;
解: ,

60 50 40 60 70 80 70 30 50 90
40 60 50 80 80 50 60 20 80 70

.
(3)果园要大面积种植这两种桃树中的一种,依据以上计算结果分
析选种哪个品种更合适,并说明理由.
解:由(1)可知这两个品种产量的极差和中位数都相等,
由(2)可知,,则 品种桃树的平均产量高,波动小,
所以应该选种 品种桃树.
作业手册
◆ 基础热身 ◆
1.某鞋店试销一种新款女鞋,销售情况如下表:
鞋号 34 35 36 37 38 39 40 41
日销量/双 2 5 9 16 9 5 3 2
如果你是鞋店经理,那么下列统计量中对你来说最重要的是( )
A.平均数 B.众数 C.中位数 D.极差
[解析] 鞋店经理最关心的是哪个鞋号的日销量最大,所以最重要的
是众数.故选B.

2.某研究机构为了解某地年轻人的
阅读情况,通过随机抽样调查了
100位年轻人,对这些人每天的阅
读时间(单位:分钟)进行统计,
得到样本的频率分布直方图
(如图所示),则 的值为( )
A.0.20 B.0.040 C.0.020 D.0.015
[解析] 由频率分布直方图可知,
,解得 .故选C.

3.[2025·西安一模]为全面普及无人机知识,激发青少年探索航空的
创造力与想象力,提升青少年科学素养和创新能力,培养航空后备
人才,某省将于2025年4月中旬举办青少年无人机大赛.某校在校内进
行选拔赛,10名学生成绩依次为85,105,75,100,90,95,85,90,80,95,则
这组数据的 分位数为( )
A.90 B.92.5 C.85 D.95
[解析] 10名学生成绩从低到高依次为75,80,85,85,90,90,95,95,100,105,
且,故 分位数为第6个数和第7个数的平均数
.故选B.

4.某地区中午11时到夜里23时的气温分布如图所示,关于这5个时刻
的温度,以下说法错误的是( )
A.5个时刻温度的极差为7
B.5个时刻温度的中位数为9
C.平均温度为
D.下午17时温度最高
[解析] 由图可知,5个时刻温度的极差为 ,故A中说法正确;
中位数为4,故B中说法错误;
平均温度为 ,故C中说法正确;
比较几个数值可知下午17时温度最高,故D中说法正确.故选B.

5.(多选题)[2024·黑龙江部分学校三模] 在某市初三年级举行的一
次体育考试中(满分100分),所有考生成绩均在 内,按照
,, 分成五组,甲、乙两班
考生的成绩占比如图所示,则下列说法错误的是( )
A.成绩在 的考生中,甲班人数多于乙班人数
B.甲班考生成绩在 内人数最多
C.乙班考生成绩在 内人数最多
D.甲班考生成绩的极差比乙班考生成绩的极差小



[解析] 对于A,由图知,每一组中的成
绩占比都是以各自班级的总人数为基数
的,所以每一组中的甲班、乙班人数不能
从所占的百分比来判断,故A中说法错误;
对于B,C,由图可知甲班考生成绩主要集中在,乙班考生成
绩主要集中在 ,故B中说法正确,C中说法错误;
对于D,由图可知甲班考生成绩的极差和乙班考生成绩的极差的大小
无法确定,故D中说法错误.故选 .
6.某大学有男生2000名,为了解该校
男生的体重情况,随机抽查了该校
100名男生的体重,并将这100名男生
的体重(单位: )按
, ,
, 分成六组,绘制成如
图所示的频率分布直方图,则估计该
校体重(单位:)在区间 内的男生有_____人.
240
[解析] 由频率分布直方图估计,该校体重(单位: )在区间
内的男生的人数为 .
7.[2024·武汉调研] 如图所示的频率分布直方图显示了三种不同的分
布形态.图(1)形成对称形态,图(2)形成右边“拖尾”形态,图(3)
形成左边“拖尾”形态,根据所给图作出以下判断,其中正确的是
________.(填序号)
①②④
①图(1)的平均数中位数 众数;
②图(2)的众数 中位数 平均数;
③图(2)的众数 平均数 中位数;
④图(3)的平均数 中位数 众数.
[解析] 图(1)的频率分布直方图是对称的,所以平均数中位数
众数,故①正确;
图(2)众数最小,右边“拖尾”平均数大于中位数,故②正确,③错误;
图(3)左边“拖尾”众数最大,平均数小于中位数,故④正确.
故填①②④.
◆ 综合提升 ◆
8.某部门30名员工一年中请假天数
(未请假则请假天数为0)与对应人
数的柱形图(图中只有请假天数为0
的未显示)如图所示,则下列说法错
误的为( )
A.该部门一年中请假天数为0的人数为10
B.该部门一年中请假天数大于5的人数为10
C.这30名员工一年中请假天数的第40百分位数为4
D.这30名员工一年中请假天数的平均数小于4

[解析] 对于A,该部门一年中请假天数为0的人数为
,A中说法正确.
对于B,该部门一年中请假天数大于5的人数为 ,B中说
法错误.
对于C,因为 ,且请假天数为0的人数为10,请假天数
为4的人数为6,所以这30名员工一年中请假天数的第40百分位数为
4,C中说法正确.
对于D,这30名员工一年中请假天数的平均数为
,D中说法正确.故选B.
9.如图为某同学两次月考成绩占总成绩百分数的扇形统计图,已知该
同学第一次月考总分低于第二次月考总分,则( )
A.该同学数学学科成绩一定下降 B.该同学政治学科成绩一定下降
C.该同学化学学科成绩可能下降 D.该同学语文学科成绩一定提升

[解析] 对于A,第一次月考数学成
绩占 ,第二次月考数学成绩占
,且第一次月考总分低于第二
次月考总分,所以第二次月考数学
成绩比第一次月考数学成绩要高,
故A错误;
对于B,第一次月考政治成绩占,第二次月考政治成绩占 ,
由于只知道第一次月考总分低于第二次月考总分,故无法判断这两
次月考政治学科成绩的变化,故B错误;
对于C,第一次月考化学成绩占
,第二次月考化学成绩占 ,
且第一次月考总分低于第二次月考
总分,所以第二次月考化学成绩比
第一次月考化学成绩要高,故C错误;
对于D,第一次月考语文成绩占,第二次月考语文成绩占 ,
且第一次月考总分低于第二次月考总分,所以第二次月考语文成绩
比第一次月考语文成绩要高,故D正确.故选D.
10.(多选题)[2024·广东茂名一模] 中秋节起源于上古时代,普及
于汉代,定型于唐朝初年,如今已成为中华民族弥足珍贵的文化遗
产.某校举行与中秋节相关的“中国传统文化”知识竞赛,随机抽取了
100人的成绩整理后得到如图所示的频率分布直方图,则下列结论正
确的是( )
A.样本的众数估计为75
B.样本的 分位数估计为75
C.样本的平均值估计为68.5
D.估计该校学生中得分低于60分的占


[解析] 依题意, ,解得
.
对于A, 最高小矩形的中点的横坐标为75, 估计众数是75,故A正确.
对于B,设样本的分位数为,又 ,,解得 ,故B错误.
对于C,估计平均数为 ,故C正确.
对于D,样本中得分低于60分的占, 估计该校学生中得分低于60分的占,故D错误.故选 .
11.(多选题)[2024·浙江绍兴二模] 国家统计局统计了2024年1月全
国多个大中城市二手住宅销售价格的分类指数,其中北方和南方各4
个城市的 及以下二手住宅销售价格的环比数据如下:
北方城市 南方城市
北京 99.5 上海 99.5
天津 99.6 南京 99.5
石家庄 99.6 南昌 99.6
沈阳 99.7 福州 99.8
则( )
A.4个北方城市的环比数据的极差小于4个南方城市的环比数据的极差
B.4个北方城市的环比数据的均值小于4个南方城市的环比数据的均值
C.4个北方城市的环比数据的方差大于4个南方城市的环比数据的方差
D.4个北方城市的环比数据的中位数大于4个南方城市的环比数据的
中位数


北方城市 南方城市
北京 99.5 上海 99.5
天津 99.6 南京 99.5
石家庄 99.6 南昌 99.6
沈阳 99.7 福州 99.8
[解析] 对于A,4个北方城市的环比数据的极差为 ,
4个南方城市的环比数据的极差为 ,所以4个北方城
市的环比数据的极差小于4个南方城市的环比数据的极差,故A正确;
北方城市 南方城市
北京 99.5 上海 99.5
天津 99.6 南京 99.5
石家庄 99.6 南昌 99.6
沈阳 99.7 福州 99.8
对于B,4个北方城市的环比数据的均值为 ,
4个南方城市的环比数据的均值为 ,所以4个
北方城市的环比数据的均值与4个南方城市的环比数据的均值相等,
故B错误;
北方城市 南方城市
北京 99.5 上海 99.5
天津 99.6 南京 99.5
石家庄 99.6 南昌 99.6
沈阳 99.7 福州 99.8
对于C,4个北方城市的环比数据的方差为 ,4个南方城市的环比数据的方差为 ,所以4个北方城市的环比数据的方差小于4个南方城市的环比数据的方差,故C错误;
北方城市 南方城市
北京 99.5 上海 99.5
天津 99.6 南京 99.5
石家庄 99.6 南昌 99.6
沈阳 99.7 福州 99.8
对于D,4个北方城市的环比数据的中位数为,4个南方城市的环比数据的中位数为 ,所以4个北方城市的环比数据的中位数大于4个南方城市的环比数据的中位数,故D正确.故选 .
北方城市 南方城市
北京 99.5 上海 99.5
天津 99.6 南京 99.5
石家庄 99.6 南昌 99.6
沈阳 99.7 福州 99.8
12.[2024·河南洛阳三模] 若一组数据,, , 的中位数为16,
方差为64,则另一组数据,, , 的中位数为___,
方差为___.
3
4
[解析] 因为数据,, , 的中位数为16,方差为64,
所以数据,, ,的中位数为4,方差为,
所以数据 ,, ,的中位数为 ,方差为4.
13.[2024·广西柳州二模] 若实数,满足1,3,4, ,
的平均数与分位数相等,则数据,, 的方差为___.
[解析] 根据题意,数据1,3,4,,,的平均数为 ,
数据1,3,4,,,的分位数为, ,
即,代入数据,,,即为,, ,
此组数据的平均数为,
数据,, 的方差为
.
14.某新能源汽车配件厂生产一种新能源汽车精密零件,为提高产品
质量引入了一套新生产线,为检验新生产线所生产出来的零件质量
有无显著提高,现同时用旧生产线和新生产线各生产了10个零件,
得到各个零件的质量指标的数据如下:
旧生产线 5.2 4.8 4.8 5.0 5.0 5.2 5.1 4.8 5.1 5.0
新生产线 5.0 5.2 5.3 5.1 5.4 5.2 5.2 5.3 5.2 5.1
设旧生产线和新生产线所生产零件的质量指标的样本平均数分别为
和,样本方差分别为和 .
(1)求,及 ;
解:由题意得 ,

.
旧生产线 5.2 4.8 4.8 5.0 5.0 5.2 5.1 4.8 5.1 5.0
新生产线 5.0 5.2 5.3 5.1 5.4 5.2 5.2 5.3 5.2 5.1
(2)若 ,则认为新生产线生产零件的质量有显著
提高,否则不认为有显著提高,现计算得 ,试判断新生产
线生产的零件质量较旧生产线生产的零件质量是否有显著提高.
解:由(1)可得 ,

因为 ,所以 成立,
故新生产线生产的零件质量较旧生产线生产的零件质量有显著提高.
15.学校为提升高一年级学生自主体育锻炼的意识,拟将每周自主体
育锻炼的时间不低于6小时的同学称为“体育迷”并予以奖励,为了确
定奖励方案,先对学生自主体育锻炼的情况进行抽样调查,学校从
高一年级随机抽取100名学生,将他们分为男生组、女生组,对每周
自主体育锻炼的时间(单位:小时)分段进行统计.第一段 ,第
二段,第三段,第四段,第五段 .将男生在各
段的频率及女生在各段的频数用折线图表示如下:
(1)求折线图中 的值,并估计该校高一年级学生中“体育迷”所占
的比例;
解:由男生自主体育锻炼时间的频率
折线图可得,
.
由女生自主体育锻炼时间的频数折线
图可知,女生共有
(人),其中“体育迷”有 (人),
故男生共有 (人),其中“体育迷”有
(人),因此估计该校高一年级学生中“体育迷”所占比例为

(2)若中学生每周自主体育锻炼的时间不低于5小时,才能保持身
体的健康发展,试估计该校高一年级学生的周平均自主体育锻炼时
间是否达到保持身体健康发展的水平?(同一段中的数据用该组区
间的中点值为代表)
解:由折线图可知,男生自主体育
锻炼时间在第一段至第五段的频数
分别为,
, ,
, ,
故这100名学生每周的自主体育锻炼时间在第一段至第五段的频率分
别为 ,
,, ,
所以估计该校高一年级学生的周平均自主体育锻炼时间为

因为 ,所以估计该校高一年级学生的周平均自主体育锻炼时
间达到了保持身体健康发展的水平.
◆ 能力拓展 ◆
16.(多选题)[2025·湖南湘潭一模] 已知数据,,, , 满足
,若去掉, 后组成一组新数据,则新
数据与原数据相比,下列说法正确的是( )
A.中位数不变 B.极差不变 C.平均数不变 D.方差变小



[解析] 原来的中位数与现在的中位数均为 ,
故中位数不变,故A正确;
原始数据的极差为 ,新数据的极差为 ,故极差
变小,故B错误;
由于,故,, ,
, ,原来的平均数为
,去掉, 后的平均数为 ,平均数
不变,故C正确;
原来的方差为

去掉, 后的方差为
,方
差变小,故D正确.
故选 .
17.[2024·广东汕头一模] 某工厂生产某种电子产品配件,关键环节
是需要焊接“接线盒”,焊接是否成功直接导致产品“合格”与“不合格”,
公司检验组经过大量后期出厂检测发现“不合格”产品和“合格”产品
的性能指标有明显差异,得到“不合格”产品和“合格”产品该指标的
频率分布直方图如图.
利用该指标制定一个检测标准,需要确定临界值,将该指标大于
的产品判定为“不合格”,小于或等于 的产品判定为“合格”.此检测标
准的漏检率是将“不合格”产品判定为“合格”产品的概率,记为 ;
错检率是将“合格”产品判定为“不合格”产品的概率,记为 .假设
数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
解:由题意可知,题图①中第一个矩形面积为 ,可
知,可得 ,解得 ,
所以错检率 .
(1)当漏检率时,求临界值和错检率 ;
(2)设函数,当时,求 的解析式,
并求在区间 上的最小值.
解:当 时,,

可得 ,
易知 ;
当 时,则

,可得
,易知 .
所以 当且仅当时,
取到最小值0.080.
【知识聚焦】1.(2)①最大值 最小值 ②组距 组数 ③分组 ④频率分布表
⑤频率分布直方图 2.(1)(x1+x2+…+xn) (2)从小到大(或从大到小) 中间 (3)最多 
(4)①小于或等于 大于或等于 ②从小到大 n×p% j 平均数
【对点演练】1. 4.5 5.5 2. 0.004 4 70 3. 丙 4. 7 8.5 5. 70 70 68 6. 19 4
课堂考点探究
例1(1)AB (2)D 变式题(1)C (2)C 例2(1)C (2)ABD (3)44 7 变式题(1)AD (2)BCD
例3(1)BD (2)①0.38 ②估计本次数学考试成绩的平均数为106.6,方差为205.44
变式题(1)BCD (2)C
教师备用习题
例1 ABD 例2 BCD
例3(1) 这10棵A品种桃树产量的极差为60,中位数为60.这10棵B品种桃树产量的极差为60,
中位数为60 (2)=60,=59,=300,=349 (3) 应该选种A品种桃树,理由略
基础热身
1.B 2.C 3.B 4.B 5.ACD 6. 240 7. ①②④ 
综合提升
8.B 9.D 10.AC 11.AD 12. 3 4 13.   14.(1) =5.0,5.2,=0.012
(2) 新生产线生产的零件质量较旧生产线生产的零件质量有显著提高
15.(1) m=0.36,45% (2)估计该校高一年级学生的周平均自主体育锻炼时
间达到了保持身体健康发展的水平
能力拓展
16. ACD 17. (1) k=87,错检率为g(87)= 5.8%
(2) h(k)=当k=90时,h(k)取到最小值0.080
同课章节目录