第九章 9.2 用样本估计总体(全国通用)2026年高考数学一轮复习讲义(教师版)

文档属性

名称 第九章 9.2 用样本估计总体(全国通用)2026年高考数学一轮复习讲义(教师版)
格式 zip
文件大小 426.0KB
资源类型 试卷
版本资源 通用版
科目 数学
更新时间 2025-12-31 00:00:00

图片预览

文档简介

9.2 用样本估计总体
1.会用统计图表对总体进行估计,会求n个数据的第p百分位数.
2.能用数字特征估计总体集中趋势和总体离散程度.
1.百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.平均数、中位数和众数
(1)平均数:=(x1+x2+…+xn).
(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时).
(3)众数:一组数据中出现次数最多的数据(即频数最大值所对应的样本数据).
3.方差和标准差
(1)方差:s2=(xi-)2或-2.
(2)标准差:s=.
4.总体方差和总体标准差
(1)一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则总体方差S2=(Yi-)2,S=为总体标准差.
(2)加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=i(Yi-)2.
教材拓展
1.若x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,…,mxn+a的平均数为+a.
2.数据x1,x2,…,xn与数据x′1=x1+a,x′2=x2+a,…,x′n=xn+a的方差相等,即数据经过平移后方差不变.
3.若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2.
1.判断(正确的画“√”,错误的画“×”)
(1)对一组数据来说,平均数和中位数总是非常接近.( × )
(2)方差与标准差具有相同的单位.( × )
(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.( √ )
(4)在频率分布直方图中,可以用最高的小长方形底边中点的横坐标作为众数的估计值.( √ )
2.(人教A版必修第二册P181T1)为了合理调配电力资源,某市欲了解全市50 000户居民的日用电量.若通过简单随机抽样从中抽取了300户进行调查,得到其日用电量的平均数为5.5 kW·h,则可以推测全市居民用户日用电量的平均数( D )
A.一定为5.5 kW·h B.高于5.5 kW·h
C.低于5.5 kW·h D.约为5.5 kW·h
解析:由样本的数字特征与总体的数字特征的关系,可知全市居民用户日用电量的平均数约为5.5 kW·h.故选D.
3.(人教A版必修第二册P215T2改编)若数据x1,x2,…,x9的方差为2,则数据2x1,2x2,…,2x9的方差为( D )
A.2 B.4
C.6 D.8
解析:根据方差的性质可知,数据x1,x2,…,x9的方差s2=2,那么数据2x1,2x2,…,2x9的方差为22s2=8.故选D.
4.若某校高一年级10个班参加合唱比赛的得分分别为89,91,90,92,87,93,96,94,96,95,则这组数据的众数是96,中位数是92.5.
解析:将这组数据从小到大排列为87,89,90,91,92,93,94,95,96,96,其中96出现的次数最多,则这组数据的众数是96,中位数是=92.5.
考点1 样本数字特征的简单计算
【例1】 (1)(2024·新课标Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:
亩产量 [900,950) [950,1 000) [1 000,1 050)
频数 6 12 18
亩产量 [1 050,1 100) [1 100,1 150) [1 150,1 200)
频数 30 24 10
根据表中数据,下列结论中正确的是( C )
A.100块稻田亩产量的中位数小于1 050 kg
B.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200 kg至300 kg之间
D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间
【解析】 根据频数分布表可知,6+12+18=36<50,所以亩产量的中位数不小于1 050 kg,故A错误;亩产量不低于1 100 kg的频数为24+10=34,所以低于1 100 kg的稻田占比为×100%=66%,故B错误;稻田亩产量的极差的最大值小于1 200-900=300(kg),最小值大小1 150-950=200(kg),故C正确;这100块稻田亩产量的平均值的最小值为×(900×6+950×12+1 000×18+1 050×30+1 100×24+1 150×10)=1 042(kg),故D错误.故选C.
(2)(多选)(2023·新课标Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( BD )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
【解析】 取x1=1,x2=x3=x4=x5=2,x6=9,则x2,x3,x4,x5的平均数等于2,标准差为0,x1,x2,…,x6的平均数等于3,标准差为=,故A,C均不正确;根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x2,x3,x4,x5的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x1,x2,…,x6的中位数相等,故B正确;根据极差的定义知,x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D正确.故选BD.
1.求一组数据的数字特征时,要掌握其方法,不要混淆.
2.中位数、众数和平均数分别反映了一组数据的“中等水平”“多数水平”和“平均水平”,我们需根据实际需要选择使用.
【对点训练1】 (1)(多选)根据中国报告大厅对2023年3—10月全国太阳能发电量进行监测统计,太阳能发电量(单位:亿千瓦时)月度数据统计如下表:
月份 3 4 5 6
发电量/ 亿千瓦时 242.94 230.87 240.59 259.33
月份 7 8 9 10
发电量/ 亿千瓦时 258.9 269.19 246.06 244.31
关于2023年3—10月全国太阳能发电量,下列四种说法正确的是( BC )
A.中位数是259.115亿千瓦时
B.极差是38.32亿千瓦时
C.第85百分位数是259.33亿千瓦时
D.第25百分位数是240.59亿千瓦时
解析:将太阳能发电量(单位:亿千瓦时)从小到大排列为230.87,240.59,242.94,244.31,246.06,258.9,259.33,269.19,所以中位数是=245.185(亿千瓦时),故A错误;极差是269.19-230.87=38.32(亿千瓦时),故B正确;因为8×0.85=6.8,所以第85百分位数是259.33亿千瓦时,故C正确;因为8×0.25=2,所以第25百分位数是
=241.765(亿千瓦时),故D错误.故选BC.
(2)(多选)已知数据x1,x2,x3,…,x10的平均数为a,中位数为b,方差为c,极差为d,由这些数据得到新数据y1,y2,y3,…,y10,其中yi=2xi-3(i=1,2,3,…,10),则对于所得新数据,下列说法一定正确的是( BC )
A.平均数是2a B.中位数是2b-3
C.方差是4c D.极差是2d-3
解析:由题意得x1+x2+x3+…+x10=10a,则y1+y2+…+y10=2(x1+x2+…+x10)-30=20a-30,则y1,y2,y3,…,y10的平均数是=2a-3,A错误;x1,x2,x3,…,x10从小到大排列后为x′1,x′2,x′3,…,x′10,取第5个数和第6个数的平均数作为中位数,即=b,由于yi=2xi-3(i=1,2,3,…,10),故y1,y2,y3,…,y10从小到大排列后为y1′,y2′,y′3,…,y′10,取第5个数和第6个数的平均数作为中位数,即=
=2b-3,B正确;由题意得(x1-a)2+(x2-a)2+…+(x10-a)2=10c,则(y1-2a+3)2+(y2-2a+3)2+…+(y10-2a+3)2=(2x1-3-2a+3)2+(2x2-3-2a+3)2+…+(2x10-3-2a+3)2=(2x1-2a)2+(2x2-2a)2+…+(2x10-2a)2=40c,故方差是=4c,C正确;x1,x2,x3,…,x10从小到大排列后为x′1,x′2,x′3,…,x′10,故x′10-x′1=d,其中y1,y2,y3,…,y10从小到大排列后为y1′,y2′,y3′,…,y′10,则y′10-y′1=2x′10-3-2x′1+3=2d,故极差是2d,D错误.故选BC.
考点2 总体集中趋势的估计
【例2】 (多选)(2024·山西晋中模拟)某校为了解甲、乙两个班级学生的化学学习情况,从两个班某次考试的化学成绩(均为整数,单位:分)中各随机抽查20名学生的成绩,得到如图所示的数据图(用频率分布直方图估计总体平均数时,每个区间的值均取该区间的中点值),用样本估计总体,关于甲、乙两个班级的化学成绩,下列结论正确的是( BCD )
A.甲班成绩的众数一定大于乙班成绩的众数
B.乙班成绩的第75百分位数的估计值为80分
C.甲班成绩的中位数为79分
D.甲班成绩的平均数大于乙班成绩的平均数的估计值
【解析】 甲班成绩的众数为79分,由频率分布直方图可得乙班成绩众数的估计值为75分,无法准确得到乙班成绩的众数,故A错误;因为(0.020+0.025+0.030)×10=0.75,所以乙班成绩的第75百分位数的估计值为80分,故B正确;由甲班成绩可得小于79分的数据有2+1+1+1+2+2=9(个),79分的数据有6个,样本共20个数据,所以甲班成绩的中位数为79分,故C正确;甲班成绩的平均数为1=×(2×57+58+59+67+2×68+2×69+6×79+87+2×88+89+98)=74.8(分),乙班成绩的平均数的估计值为2=10×(55×0.020+65×0.025+75×0.030+85×0.020+95×0.005)=71.5(分),所以甲班成绩的平均数大于乙班成绩的平均数的估计值,故D正确.故选BCD.
频率分布直方图中的数字特征
(1)众数:最高矩形的底边中点的横坐标.
(2)中位数:中位数左边和右边的矩形的面积和应该相等.
(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.
【对点训练2】 (1)(多选)(2024·安徽阜阳一模)关于一组样本数据的平均数、中位数、众数、频率分布直方图和方差,下列说法正确的是( BCD )
A.改变其中一个数据,平均数和众数都会发生改变
B.频率分布直方图中,中位数左边和右边的直方图的面积应该相等
C.若数据的频率分布直方图为单峰不对称,且在右边“拖尾”,则平均数大于中位数
D.样本数据的方差越小,说明样本数据的离散程度越小
解析:例如:数据1,3,3,将数据改成2,3,3,数据的众数未改变,仍为3,所以A错误;频率分布直方图中,中位数左边和右边的直方图的面积应该相等,所以B正确;若频率分布直方图单峰不对称且在右边“拖尾”,则平均数大于中位数,所以C正确;样本数据方差越小,数据越稳定,离散程度越小,所以D正确.故选BCD.
(2)(多选)(2024·湖南邵阳三模)为了解一片经济林的生长情况,随机抽取了其中60株树木,测量底部周长(单位:cm),所得数据均在区间[80,130]内,其频率分布直方图如图所示,则( AC )
A.图中a的值为0.025
B.样本中底部周长不小于110 cm的树木有12株
C.估计该片经济林中树木的底部周长的80%分位数为115 cm
D.估计该片经济林中树木的底部周长的平均数为104 cm(每组数据用该组所在区间的中点值作代表)
解析:由频率分布直方图的性质,可得(0.015+a+0.030+0.020+0.010)×10=1,解得a=0.025,所以A正确;由频率分布直方图可得底部周长不小于110 cm的频率为(0.020+0.010)×10=0.3,所以底部周长不小于110 cm的树木有0.3×60=18(株),所以B错误;由频率分布直方图得前三个矩形的面积为(0.015+0.025+0.030)×10=0.7,前四个矩形的面积为(0.015+0.025+0.030+0.020)×10=0.9,所以80%分位数位于区间[110,120),则110+×10=115(cm),所以C正确;由频率分布直方图的平均数的计算公式,可得(85×0.015+95×0.025+105×0.030+115×0.020+125×0.010)×10=103.5(cm),所以D错误.故选AC.
考点3 总体离散程度的估计
【例3】 (2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:
试验序号i 1 2 3 4 5
伸缩率xi 545 533 551 522 575
伸缩率yi 536 527 543 530 560
试验序号i 6 7 8 9 10
伸缩率xi 544 541 568 596 548
伸缩率yi 533 522 550 576 536
记zi=xi-yi(i=1,2,…,10),记z1,z2,…,z10的样本平均数为,样本方差为s2.
(1)求,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高如果 ,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高.
【解】 (1)由题意得zi=xi-yi的值分别为9,6,8,-8,15,11,19,18,20,12,则=×(9+6+8-8+15+11+19+18+20+12)=11,s2=×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+0+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.
(2)由(1)知,=11,2=2=,故有≥2,所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
总体离散程度的估计
标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.
【对点训练3】 甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩(单位:分)中随机抽取8次,记录如下:
甲:82,81,79,78,95,88,93,84;
乙:92,95,80,75,83,80,90,85.
(1)求甲成绩的第60百分位数.
(2)现要从中选派一人参加数学竞赛,从统计学数据特征的角度考虑,你认为选派哪位学生参加合适?请说明理由.
解:(1)把甲成绩的数据按照从小到大的顺序排列可得78,79,81,82,84,88,93,95,
因为8×0.6=4.8,第五个数据为84,
所以甲成绩的第60百分位数为84分.
(2)选派甲参加合适.理由:甲=×(78+79+81+82+84+88+93+95)=85(分),乙=×(75+80+80+83+85+90+92+95)=85(分).
s=×[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,
s=×[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41.
因为甲=乙,s【例】 (多选)某社区通过简单随机抽样,获得了100户居民的月均用水量数据,并绘制出如图所示的频率分布直方图,由该图可以估计( AC )
A.平均数>中位数 B.中位数>平均数
C.中位数>众数 D.众数>平均数
【解析】 由题中直方图在右边“拖尾”知平均数大于中位数,故A正确;由题图估计中位数接近7.2 t,众数为5.7 t,所以中位数大于众数,故C正确.故选AC.
本题考查了平均数、中位数、众数的运算.平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形状有关.准确理解概念的本质是解题的关键.
课时作业66
1.(5分)(2024·广东江门二模)有下列一组数据:2,17,33,15,11,42,34,13,22,则这组数据的下四分位数是( C )
A.11 B.33
C.13 D.22
解析:将该组数据从小到大排列为2,11,13,15,17,22,33,34,42,共有9个数据,且9×25%=2.25,则这组数据的下四分位数是从小到大排列的第三个数,即13.故选C.
2.(5分)(2024·河北张家口三模)现有一组数据x1,x2,…,xn,将这组数据按照从小到大的顺序排列,去掉第一个数和最后一个数后,则下列统计量一定不变的是( B )
A.平均数 B.中位数
C.方差 D.极差
解析:现有一组数据x1,x2,…,xn,将这组数据按照从小到大的顺序排列为y1,y2,…,yn,去掉第一个数和最后一个数后为y2,…,yn-1.原平均数为,去掉数据后平均数为,不一定相等,故A不正确;根据中位数的定义可知,中位数不会发生改变,故B正确;因为最小的数据变大,最大的数据变小,其余数据不变,方差的意义是新数据与新平均值的波动情况,不能确定不变,故C不正确;原极差为yn-y1,去掉数据后极差为yn-1-y2,不一定相等,故D不正确.故选B.
3.(5分)(2024·浙江绍兴三模)已知实数1<2A.   B.3
C.   D.4
解析:由题意可得即则==4.故选D.
4.(5分)(2024·陕西西安一模)某班学生每天完成数学作业所需的时间的频率分布直方图如图所示,为响应国家减负政策,若每天作业布置量在此基础上减少5分钟,则减负后下列有关完成作业的时间的说法中正确的是( D )
A.减负后完成作业的时间的标准差减少25
B.减负后完成作业的时间的方差减少25
C.减负后完成作业的时间在60分钟以上的概率为12%
D.估计减负后完成作业的时间的中位数为25分钟
解析:由频率分布直方图可得20x+0.025×20+0.006 5×20+0.003×2×20=1,解得x=0.012 5.减负后每天作业布置量减少5分钟,则减负后完成作业的时间的平均数减少5分钟,而完成作业的时间波动大小不变,因此减负后完成作业的时间的标准差、方差不变,A,B错误;减负前完成作业的时间在60分钟以上的频率为0.003×40=0.12,减负后完成作业的时间在60分钟以上的频率小于0.12,由此估计减负后完成作业的时间在60分钟以上的概率小于12%,C错误;减负前,第一组的频率为0.012 5×20=0.25,第二组的频率为0.025×20=0.5,则估计完成作业的时间的中位数在第二组的中间,即中位数为=30(分钟),所以具有计减负后完成作业的时间的中位数为30-5=25(分钟),D正确.故选D.
5.(5分)(2024·陕西宝鸡一模)第19届亚运会于2023年9月23日至10月8日在中国杭州举行,中国代表团共获得201枚金牌,111枚银牌,71枚铜牌,共383枚奖牌的历史最好成绩.某个项目的比赛的六个裁判为某运动员的打分分别为95,95,95,93,94,94,评分规则为去掉六个原始分的一个最高分和一个最低分,剩下四个有效分的平均分为该选手的最后得分,设这六个原始分的中位数为A,方差为S2,四个有效分的中位数为A1,方差为S,则下列结论正确的是( D )
A.A≠A1,S2S
C.A=A1,S2S
解析:容易求出这六个原始分95,95,95,93,94,94的中位数为A=94.5,方差为S2;四个有效分95,95,94,94的中位数为A1=94.5,方差为S.根据方差的定义知四个有效分的波动性变小,所以S2>S.故选D.
6.(5分)(2024·湖南长沙二模)已知样本数据x1,x2,…,x100的平均数和标准差均为4,则数据-x1-1,-x2-1,…,-x100-1的平均数与方差分别为( B )
A.-5,4 B.-5,16
C.4,16 D.4,4
解析:由题意知样本数据x1,x2,…,x100的平均数和标准差均为4,则x1,x2,…,x100的方差为16,则-x1,-x2,…,-x100的平均数为-4,方差为(-1)2×16=16,故-x1-1,-x2-1,…,-x100-1的平均数为-4-1=-5,方差为16.故选B.
7.(6分)(多选)(2024·广东茂名一模)中秋节起源于上古时代,普及于汉代,定型于唐代,如今逐渐演化为赏月、颂月等活动,以月之圆兆人之团圆,为寄托思念故乡、思念亲人之情,祈盼丰收、幸福,成为丰富多彩、弥足珍贵的文化遗产.某校举行与中秋节相关的“中国传统文化”知识竞赛,随机抽查了100人的成绩整理后得到如图所示的频率分布直方图,则下列结论正确的是( AC )
A.估计样本数据的众数为75
B.估计样本数据的71%分位数为75
C.估计样本数据的平均数为68.5
D.该校学生中得分低于60分的约占20%
解析:依题意,(0.015+0.025+0.035+0.005+2a)×10=1,解得a=0.010.∵最高小矩形的中点横坐标为75,∴众数的估计值是75,故A正确;设样本的71%分位数的估计值为x,又10×(0.010+0.015+0.025)=0.5,∴0.5+(x-70)×0.035=0.71,解得x=76,故B错误;平均数的估计值为45×0.10+55×0.15+65×0.25+75×0.35+85×0.10+95×0.05=68.5,故C正确;样本中得分低于60分的占(0.010+0.015)×10=25%,∴该校学生中得分低于60分的约占25%,故D错误.故选AC.
8.(6分)(多选)(2024·湖北黄石三模)已知甲组数据为1,1,3,3,5,7,9,乙组数据为1,3,5,7,9,则下列说法正确的是( BC )
A.这两组数据的第80百分位数相等
B.这两组数据的极差相等
C.这两组数据分别去掉一个最大值和一个最小值后,仅乙组数据的均值不变
D.甲组数据比乙组数据分散
解析:由7×80%=5.6,得甲组数据的第80百分位数为7,由5×80%=4,得乙组数据的第80百分位数为=8,A错误;甲组数据与乙组数据的极差均为8,B正确;甲组数据去掉一个最大值和一个最小值前、后的均值分别为,,乙组数据去掉一个最大值和一个最小值前、后的均值分别为5,5,C正确;甲组数据的方差s=×=,乙组数据的方差s=×(42+22+02+22+42)=8,显然<8,因此乙组数据较分散,D错误.故选BC.
9.(5分)(2024·福建龙岩三模)互不相等的4个正整数从小到大排列为a1,a2,a3,a4,若它们的平均数为4,且这4个数据的极差是中位数的2倍,则这4个数据的中位数为.
解析:由题意可知,a1+a2+a3+a4=16,a4-a1=2×=a2+a3,所以a4=a1+a2+a3=16-a4,所以a4=8,所以a1+a2+a3=8,又因为a1,a2,a3,a4是互不相等的4个正整数从小到大排列的,所以a1=1,a2=2,a3=5或a1=1,a2=3,a3=4,所以这4个数据的中位数为=.
10.(5分)(2024·陕西铜川一模)构建德智体美劳全面培养的教育体系是我国教育一直以来努力的方向,铜川市第一中学积极响应党的号召,开展各项有益于德智体美劳全面发展的活动.如图所示的是该校高三(1)班、(2)班两个班在某次活动中德智体美劳的评价得分对照图(得分越高,说明该项教育越好),则下列结论正确的是①③.(填序号)
实线:高三(1)班的数据
虚线:高三(2)班的数据
①高三(2)班五项评价得分的极差为1;
②除体育外,高三(1)班的各项评价得分均高于高三(2)班对应的得分;
③高三(1)班五项评价得分的平均数比高三(2)班五项评价得分的平均数要高;
④各项评价得分中,这两个班的体育得分相差最大.
解析:高三(1)班德智体美劳各项得分依次为9.5,9.5,9,9.5,9.25,高三(2)班德智体美劳各项得分依次为9.5,9,9.5,9,8.5.对于①,高三(2)班五项评分得分的极差为9.5-8.5=1,故①正确;对于②,两班的德育分相等,故②错误;对于③,高三(1)班得分的平均数为=9.35,高三(2)班得分的平均数为=9.1,故③正确;对于④,两班的体育得分相差9.5-9=0.5,而两班的劳育得分相差9.25-8.5=0.75,故④错误.
11.(14分)(2024·四川德阳二模)某中学为了解大数据提供的个性化作业质量情况,随机访问n名学生,并对这n名学生的个性化作业进行评分(满分:100分),根据得分将他们的成绩分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组,制成如图所示的频率分布直方图,其中成绩在[70,80)的学生人数为30.
(1)求a,n的值;
(2)估计这n名学生成绩的平均数(同一组数据用该组数据的中点值代替)和中位数(精确到0.01).
解:(1)由题意可得n==100,10×(0.005+a+0.020+0.030+0.025+0.005)=1,解得a=0.015.
(2)平均数的估计值为(45×0.005+55×0.015+65×0.020+75×0.030+85×0.025+95×0.005)×10=72(分).
因为(0.005+0.015+0.020)×10=0.4,(0.005+0.015+0.020+0.030)×10=0.7,
所以中位数在[70,80)之间,设中位数的估计值为x分,则0.4+(x-70)×0.030=0.5,解得x≈73.33.
12.(14分)(2024·宁夏银川一模)滨海盐碱地是我国重要的盐碱土地类型之一,如何利用更有效的方法改造这些宝贵的土地资源,成为摆在我们面前的世界级难题.对盐碱的治理方法,研究人员在长期的实践中获得了两种成本差异不大,且能降低滨海盐碱地30~60 cm土壤层可溶性盐含量的技术,为了对比两种技术治理盐碱的效果,科研人员在同一区域采集了12个土壤样本,平均分成A,B两组,测得A组土壤可溶性盐含量数据样本平均数1=0.82,方差s2x1=0.029 3,B组土壤可溶性盐含量数据样本平均数2=0.83,方差s2x2=0.169 7.用技术1对A组土壤进行可溶性盐改良试验,用技术2对B组土壤进行可溶性盐改良试验,分别获得改良后土壤可溶性盐含量数据如下:
A组y1 0.66 0.68 0.69 0.71 0.72 0.74
B组y2 0.46 0.48 0.49 0.49 0.51 0.54
改良后A组、B组土壤可溶性盐含量数据样本平均数分别为1和2,样本方差分别记为s2y1和s2y2.
(1)求1,2,s2y1,s2y2;
(2)应用技术1与技术2对土壤进行可溶性盐改良试验后,土壤可溶性盐含量是否有显著降低? ,i=1,2,则认为技术能显著降低土壤可溶性盐含量,否则不认为有显著降低
解:(1)1=×(0.66+0.68+0.69+0.71+0.72+0.74)=0.70,
s2y1=×[(0.66-0.70)2+(0.68-0.70)2+(0.69-0.70)2+(0.71-0.70)2+(0.72-0.70)2+(0.74-0.70)2]=0.000 7,
2=×(0.46+0.48+0.49+0.49+0.51+0.54)=0.495,
s2y2=×[(0.46-0.495)2+(0.48-0.495)2+(0.49-0.495)2+(0.49-0.495)2+(0.51-0.495)2+(0.54-0.495)2]=0.000 625.
(2)当i=1时,|1-1|2=0.014 4,=0.02,
∵0.014 4<0.02,
∴|1-1|<,
∴应用技术1后,土壤可溶性盐含量没有显著降低.
当i=2时,|2-2|2≈0.112 2,
≈0.113 6,
∵0.112 2<0.113 6,
∴|2-2|<,
∴应用技术2后,土壤可溶性盐含量没有显著降低.
故应用技术1和技术2后,土壤可溶性盐含量没有显著降低.
13.(5分)(2024·辽宁葫芦岛二模)某地为了了解学生的睡眠时间,根据初中和高中学生的人数比例采用分层随机抽样法抽取了40名初中生和20名高中生,调查发现初中生每天的平均睡眠时间为8小时,方差为2,高中生每天的平均睡眠时间为7小时,方差为1.根据调查数据,估计该地区中学生睡眠时间的总体方差约为( D )
A.1.3   B.1.5
C.1.7   D.1.9
解析:该地区中学生每天睡眠时间的平均数为×8+×7=(小时),该地区中学生每天睡眠时间的方差为×+×=≈1.9.故选D.
14.(15分)(2024·安徽合肥二模)树人中学高三(1)班某次数学质量检测(满分150分)的统计数据如下表:
性别 参加考试人数 平均成绩 标准差
男 30 100 16
女 20 90 19
在按比例分配的分层随机抽样中,已知总体划分为2层,把第一层样本记为x1,x2,x3,…,xn,其平均数记为,方差记为s;把第二层样本记为y1,y2,y3,…,ym,其平均数记为,方差记为s;把总样本数据的平均数记为,方差记为s2.
(1)求证:s2={n[s+(-)2]+m[s+(-)2]};
(2)求该班参加考试学生成绩的平均数和标准差.(精确到1)
解:(1)证明:s2=[(xi-)2+(yi-)2]=·[(xi-+-)2+(yi-+-)2]={(xi-)2+(-)2+2(xi-)(-)]+(yi-)2+(-)2+2(yi-)(-)]},
因为2(xi-)(-)]=2(-)·(xi-)=2(-)(x1+x2+x3+…+xn-)=0,
同理2(yi-)(-)]=0,
所以s2={n[s+(-)2]+m[s+(-)2]}.
(2)该班参加考试学生成绩的平均数为,方差为s2,
则=×(30×100+20×90)=96(分),
所以s2==322,
又≈18,所以s≈18.
即该班参加考试学生成绩的平均数为96分,标准差约为18.
同课章节目录