本章总结提升
判断下列说法的正误.(正确的打“√”,错误的打“×”)
1.简单随机抽样主要包括抽签法和随机数法.( )
2.在简单随机抽样中,用样本平均数可以估计总体平均数,用样本中的比例估计总体中的比例. ( )
3.比例分配的分层随机抽样中,每个个体被抽到的可能性不一样. ( )
4.通过网络查询的数据一定是真实的数据. ( )
5.频率分布直方图中每个小长方形的面积等于相应组的频率,各个小长方形面积之和等于1. ( )
6.从频率分布直方图中得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了. ( )
7.15%分位数的含义是总体中任何一个数小于它的可能性是15%( )
8.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势. ( )
9.一组数据的方差越大,说明这组数据的波动越大. ( )
10.在样本数据中,频率分布最大值所对应的样本数据是众数. ( )
11.从总体中抽取一个样本,用样本的分布估计总体的分布,样本量越小估计越准确. ( )
12.样本量越大,用第p百分位数来估计总体的第p百分位数就越准确. ( )
◆ 题型一 随机抽样
[类型总述] (1)随机抽样的相关概念;(2)用简单随机抽样的方法抽取样本; (3)用分层随机抽样的方法抽取样本.
例1 (1)某校为了解高一年级学生的学业生涯规划情况,在高一年级6个班级中任选2个班级,并在所选的班级中按男女比例抽取样本,则应采用的抽样方法是 ( )
A.简单随机抽样
B.比例分配的分层随机抽样
C.先用比例分配的分层随机抽样,再用随机数法
D.先用抽签法,再用比例分配的分层随机抽样
(2)现有以下两项调查:①从40台刚出厂的大型挖掘机中抽取4台进行质量检测;②在某校800名学生中,O型、A型、B型和AB型血的学生依次有300,200,180,120人,为了研究血型与色弱的关系,需从中抽取一个容量为40的样本.完成这两项调查最适宜采用的抽样方法是 ( )
A.①②都采用简单随机抽样
B.①②都采用分层随机抽样
C.①采用简单随机抽样,②采用分层随机抽样
D.①采用分层随机抽样,②采用简单随机抽样
变式 (1)[2024·甘肃兰州一中高一月考] 下列抽取样本的方式属于简单随机抽样的个数为 ( )
①从无限多个个体中抽取100个个体作为样本;
②从20件玩具中一次性抽取3件进行质量检验;
③某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛;
④盒子中共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.
A.0 B.1
C.2 D.3
(2)(多选题)[2024·唐山五校高一联考] 为了实现教育资源的均衡化,某地决定派遣480名教师志愿者(480名教师情况如图)轮流支援当地的教育工作.若第一批志愿者采用比例分配的分层随机抽样的方法随机派遣150名教师,则下列结论正确的是 ( )
A.派遣的青年男、女教师的人数之和与老年教师的人数相同
B.派遣的青年女教师的人数占派遣教师总数的10%
C.派遣的老年教师有144人
D.派遣的青年女教师有15人
◆ 题型二 总体取值规律的估计
[类型总述] (1)频率分布表与频率分布直方图;(2)统计图中的样本分布.
例2 (1)[2024·上海财经大学附中高一期末] 某商场从参与购物的人群中随机选出 200 人,并将这200人按年龄分组,得到的频率分布直方图如图所示,则在这200人中年龄在[25,35)内的人数n及直方图中的a的值分别是 ( )
A.n=35,a=0.032
B.n=35,a=0.32
C.n=30,a=0.035
D.n=30,a=0.35
(2)南丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔设计的,图中每个扇形圆心角都相等,半径长短表示数量大小.某机构统计了近些年中国知识付费用户数量(单位:亿人次),并绘制成南丁格尔玫瑰图如图,根据此图,下列说法错误的是 ( )
A.2015年至2022年,中国知识付费用户数量逐年增加
B.2017年至2018年,中国知识付费用户数量的增加量为近些年来最多
C.2022年中国知识付费用户数量超过2015年中国知识付费用户数量的10倍
D.2016年至2022年,中国知识付费用户数量的增加量逐年递增
(3)如图为某地2022年2月至2023年1月商品零售总额和餐饮收入总额同比增速情况折线图,根据该图,下列结论正确的是 ( )
A.2023年1月份,商品零售总额同比增长9.2%
B.2022年3—12月份,餐饮收入总额同比增速都降低
C.2022年6—10月份,商品零售总额同比增速都上升
D.2022年12月份,餐饮收入总额环比增速为-14.1%
变式 (1)[2024·甘肃酒泉敦煌中学高一月考] 如图是2023年11月中国的10个城市地铁运营里程(单位:km)及运营线路条数的统计图,下列判断正确的是 ( )
A.这10个城市中北京的地铁运营里程最长且运营线路条数最多
B.这10个城市地铁运营里程的中位数是516 km
C.这10个城市地铁运营线路条数的平均数为15.4
D.这10个城市地铁运营线路条数的极差是12
(2)(多选题)[2024·安徽六安高一期中] 某市为最大限度地吸引“高精尖缺”人才,向全球“招贤纳士”,推进了人才引入落户政策.随着人口增多,对住房要求也随之而来,而选择购买商品房时,住户对商品房的户型结构越来越重视,因此某商品房调查机构随机抽取n户住户,针对其居住的户型结构和满意度进行了调查,如图①,调查的所有住户中四居室共200户,所占比例为,二居室住户占.如图②是用比例分配的分层随机抽样的方法从所有调查的住户的满意度问卷中,抽取10%的调查结果绘制成的统计图,则下列说法错误的是 ( )
A.样本容量为70
B.样本中三居室住户共抽取了25户
C.根据样本可估计这n户住户对四居室满意的住户有70户
D.样本中对三居室满意的住户有15户
◆ 题型三 用样本的数字特征估计总体的数字特征
[类型总述] (1)总体百分位数的估计;(2)总体集中趋势的估计;(3)总体离散程度的估计.
例3 (1)少年强则国强,少年智则国智.党和政府一直重视青少年的健康成长,出台了一系列政策和行动计划,提高学生身体素质.为了加强对学生的营养健康监测,某校在3000名学生中,抽查了100名学生的体重数据,根据所得数据绘制成样本的频率分布直方图如图所示(同一组中的数据用该组区间的中点值作代表),则下列结论正确的是 ( )
A.样本的众数为65
B.样本的第80百分位数为72.5
C.样本的平均数为67.5
D.估计该校学生中体重低于65 kg的学生人数为1000
(2)(多选题)[2024·辽宁沈阳高一期末] 运动员甲在某射击比赛中的成绩(环数)如下表:
次数 1 2 3 4 5 6 7 8 9 10
环数 10.5 10.6 10.3 10.5 10.3 10.6 10.7 10.7 10.5 10.6
则下列说法正确的是 ( )
A.成绩的众数是10.5环
B.成绩的极差是0.4环
C.成绩的25%分位数是10.5环
D.平均成绩是10.4环
(3)[2023·全国乙卷] 某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:
试验序号i 1 2 3 4 5 6 7 8 9 10
伸缩率xi 545 533 551 522 575 544 541 568 596 548
伸缩率yi 536 527 543 530 560 533 522 550 576 536
记zi=xi-yi(i=1,2,…,10),记z1,z2,…,z10的样本平均数为,样本方差为s2.
求,s2;
②判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(
变式 (1)[2023·陕西咸阳高一期末] 已知一组数据从小到大排列为1,1,2,2,3,3,4,5,7,7,8,10,则该组数据的25%分位数和中位数分别是 ( )
A.3,9 B.2,3.5
C.9,3.5 D.2,3
(2)(多选题)[2023·新课标Ⅰ卷] 有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
(3)某市旅游部门为了促进该市生态特色城镇和新农村建设,将甲、乙、丙三家民宿的相关资料放到某网络平台上进行推广宣传.该平台邀请部分曾在这三家民宿体验过的游客参与调查,得到了这三家民宿的“综合满意度”评分,评分越高表明游客体验越好,现从这三家民宿“综合满意度”的评分中各随机抽取10个评分数据,并对所得数据进行整理、描述和分析,下面给出了部分信息.
a.甲、乙两家民宿“综合满意度”评分的折线图:
b.丙家民宿“综合满意度”评分:
2.6,4.7,4.5,5.0,4.5,4.8,4.5,3.8,4.5,3.1
c.甲、乙、丙三家民宿“综合满意度”评分的平均数、中位数如下表:
甲 乙 丙
平均数 m 4.5 4.2
中位数 4.5 4.7 n
根据以上信息,回答下列问题:
①分别求表中m,n的值;
②设甲、乙、丙三家民宿“综合满意度”评分的方差分别为,,,试比较其大小.
③根据“综合满意度”的评分情况,该平台打算将甲、乙、丙三家民宿中的一家置顶推荐,你认为该平台会将这三家民宿中的哪家置顶推荐 说明理由(至少从两个方面说明).
例4 某工艺品加工厂生产线一天能生产200件某款产品,该产品市场评级规定:工艺质量指标值大于或等于10的为A等品,小于10的为B等品.厂家将A等品售价定为160元/件,B等品售价定为140元/件.
下表是检验员在现有生产线上随机抽取的16件产品的工艺质量指标值:
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得=xi=9.97,s2=(xi-)2≈0.045,其中xi为抽取的第i件产品的工艺质量指标值,i=1,2,…,16.
为了提高产品质量,该厂计划通过增加生产工序来改进生产工艺,已知增加生产工序每年需花费30万元,改进后该条生产线产能不变,但生产出的每件产品工艺质量指标值均提高0.05.
(1)若将随机抽取的16件产品中各等级产品的频率视为概率,估计改进后该厂的年收益是否增加,并说明理由;(一年按365天计算)
(2)根据随机抽取的16件产品的工艺质量指标值,估计改进后该厂一天生产的所有产品的工艺质量指标值的平均数和方差.
变式 已知瓷器产品T的质量采用综合指标值M进行衡量,M∈[8,10]为一等品,M∈[4,8)为二等品,M∈[0,4)为三等品.某瓷器厂准备购进新型窑炉以提高生产效益,在某供应商提供的窑炉中任选一个试用,烧制了一批产品并统计相关数据,将综合指标值M分为[0,2),[2,4),[4,6),[6,8),[8,10]共五组,绘制成如图所示的频率分布直方图.
(1)估计该瓷器产品T的综合指标值M的第60百分位数.
(2)根据瓷器厂的记录,产品各等次的销售率(某等次产品销量与其对应产量的比值)及单件售价情况如下:
一等品 二等品 三等品
销售率
单件售价 20元 16元 12元
根据以往的销售方案,未售出的产品统一按原售价的50%全部处理完.已知该瓷器厂认购该窑炉的前提条件是,该窑炉烧制的产品同时满足下列两个条件:
①综合指标值M的平均数(同一组中的数据用该组区间的中点值作代表)不小于6;
②单件平均利润不低于4元.
若该新型窑炉烧制瓷器产品T的成本为10元/件,且月产量为2000件,在销售方案不变的情况下,根据图表数据,分析该新型窑炉是否达到瓷器厂的认购条件.本章总结提升
【知识辨析】
1.√ 2.√ 3.× 4.× 5.√ 6.√ 7.× 8.√
9.√ 10.√ 11.× 12.√
【素养提升】
题型一
例1 (1)D (2)C [解析] (1)某校为了解高一年级学生的学业生涯规划情况,在高一年级6个班级中任选2个班级,这一过程应采用抽签法或随机数法;在所选的班级中按男女比例抽取样本,应用比例分配的分层随机抽样.故选D.
(2)对于①,40台刚出厂的大型挖掘机被抽取的可能性一样,故为简单随机抽样;对于②,因为要研究血型与色弱的关系,所以该校800名学生被抽取的可能性要按照血型比例分层抽取,故为分层随机抽样.故选C.
变式 (1)A (2)ABD [解析] (1)①从无限多个个体中抽取100个个体作为样本,不满足总体个数为有限个;②从20件玩具中一次性抽取3件进行质量检验,不满足逐个抽取;③某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛,不满足随机抽取;④盒子中共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里,不满足无放回抽取.综上可得,以上均不满足简单随机抽样的定义,故选A.
(2)因为=0.2,所以派遣的青年男教师的数量占派遣教师总数的20%,则派遣的青年女教师的人数占派遣教师总数的1-30%-40%-20%=10%,则派遣的青年男、女教师的人数之和与老年教师的人数相同,均占总数的30%,故A,B正确;派遣的老年教师人数为150×0.3=45,故C错误;派遣的青年女教师的人数为150×0.1=15,故D正确.故选ABD.
题型二
例2 (1)C (2)D (3)C [解析] (1)由题图知,年龄在[25,35)内的小矩形的面积为0.015×10=0.15,即年龄在[25,35)内的频率为0.15,所以年龄在[25,35)内的人数n=0.15×200=30.由频率分布直方图的小矩形面积和为1可得0.010×10+0.015×10+0.030×10+a×10+0.010×10=1,解得a=0.035.故选C.
(2)对于A,由题图可知,2015年至2022年,中国知识付费用户数量逐年增加,故A中说法正确;对于B,D,2015年至2016年,中国知识付费用户数量的增加量为0.96-0.48=0.48(亿人次),2016年至2017年,中国知识付费用户数量的增加量为1.88-0.96=0.92(亿人次),2017年至2018年,中国知识付费用户数量的增加量为2.95-1.88=1.07(亿人次),2018年至2019年,中国知识付费用户数量的增加量为3.56-2.95=0.61(亿人次),2019年至2020年,中国知识付费用户数量的增加量为4.18-3.56=0.62(亿人次),2020年至2021年,中国知识付费用户数量的增加量为4.77-4.18=0.59(亿人次),2021年至2022年,中国知识付费用户数量的增加量为5.27-4.77=0.5(亿人次),可知2017年至2018年,中国知识付费用户数量的增加量为近些年来最多,且2016年至2022年,中国知识付费用户数量的增加量并不是逐年递增的,故B中说法正确,D中说法错误;对于C,由5.27>0.48×10,可知2022年中国知识付费用户数量超过2015年中国知识付费用户数量的10倍,故C中说法正确.故选D.
(3)对于A,2023年1月份,商品零售总额同比增长2.9%,故A错误;对于B,2022年8月份,餐饮收入总额同比增速上升,故B错误;对于C,2022年6—10月份,商品零售总额同比增速都上升,故C正确;对于D,2022年12月份,餐饮收入总额环比增速并未告知,故D错误.故选C.
变式 (1)C (2)ABC [解析] (1)对于A,北京的地铁运营线路条数最多,而运营里程最长的是上海,故A错误;对于B,地铁运营里程的中位数是=537.3(km),故B错误;对于C,地铁运营线路条数的平均数为=15.4,故C正确;对于D,地铁运营线路条数的极差是27-8=19,故D错误.故选C.
(2)对于A选项,总体容量为200×3=600,样本容量为600×10%=60,故选项A中说法错误;对于B选项,样本中三居室住户共抽取60×=30(户),故选项B中说法错误;对于C选项,对四居室满意的住户共有200×40%=80(户),故选项C中说法错误;对于D选项,样本中三居室住户为30户,对三居室满意的住户有30×50%=15(户),故选项D中说法正确.故选ABC.
题型三
例3 (1)B (2)BC [解析] (1)由频率分布直方图可得众数为67.5,A错误;样本的平均数为57.5×0.03×5+62.5×0.05×5+67.5×0.06×5+72.5×0.04×5+77.5×0.02×5=66.75,C错误;因为体重位于[55,60),[60,65),[65,70),[70,75)内的频率分别为0.15,0.25,0.3,0.2,因为0.15+0.25+0.3=0.7<0.8,0.15+0.25+0.3+0.2=0.9>0.8,所以第80百分位数位于区间[70,75)内,设第80百分位数为x,则0.15+0.25+0.3+(x-70)×0.04=0.8,所以x=72.5,即样本的第80百分位数为72.5,B正确;样本中体重低于65 kg的频率为0.15+0.25=0.4,所以估计该校学生中体重低于65 kg的学生人数为3000×0.4=1200,D错误.故选B.
(2)对于A,数据中有3个10.5和3个10.6,所以众数是10.5环,10.6环,所以A选项错误;对于B,极差是最大值与最小值的差,即为10.7-10.3=0.4(环),所以B选项正确;对于C,将数据从小到大排列,由10×25%=2.5,得其25%分位数是第3个数,即成绩的25%分位数为10.5环,所以C选项正确;对于D,平均成绩为=10.53(环),所以D选项错误.故选BC.
(3)解:①∵zi=xi-yi(i=1,2,…,10),∴当i=1,2,…,10时,zi的值依次为9,6,8,-8,15,11,19,18,20,12,∴=×[9+6+8+(-8)+15+11+19+18+20+12]=11,
s2=×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=×(22+52+32+192+42+02+82+72+92+12)=×610=61.
②∵-4×=112-4×=121-24.4=96.6>0,
∴>4×,即>2,∴≥2成立.
∴甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
变式 (1)B (2)BD [解析] (1)这组数据共有12个,12×25%=3,因为数据从小到大排列为1,1,2,2,3,3,4,5,7,7,8,10,所以该组数据的25%分位数是=2,中位数是=3.5,故选B.
(2)对于A,这一组样本数据可取1,2,2,2,2,4,则2,2,2,2的平均数不等于1,2,2,2,2,4的平均数,故A错误;对于B,不妨设x2≤x3≤x4≤x5,则x2,x3,x4,x5的中位数为,而x1,x2,x3,x4,x5,x6的中位数也为,故B正确;对于C,根据题意可知,x1,x2,x3,x4,x5,x6的数据波动性大于x2,x3,x4,x5的数据波动性,故x2,x3,x4,x5的标准差小于x1,x2,x3,x4,x5,x6的标准差,故C错误;对于D,不妨设x2≤x3≤x4≤x5,则x1≤x2≤x3≤x4≤x5≤x6,故x5-x2≤x6-x1,故D正确.故选BD.
(3)解:①甲家民宿“综合满意度”评分为3.2,4.2,5.0,4.5,5.0,4.8,4.5,4.3,5.0,4.5,
∴m=×(3.2+4.2+5.0+4.5+5.0+4.8+4.5+4.3+5.0+4.5)=4.5,
将丙家民宿“综合满意度”评分从小到大排列为2.6,3.1,3.8,4.5,4.5,4.5,4.5,4.7,4.8,5.0,∴n==4.5.
②=×[(3.2-4.5)2+(4.2-4.5)2+(5.0-4.5)2+(4.5-4.5)2+(5.0-4.5)2+(4.8-4.5)2+(4.5-4.5)2+(4.3-4.5)2+(5.0-4.5)2+(4.5-4.5)2]=0.266,
=×[(4.0-4.5)2+(4.2-4.5)2+(4.7-4.5)2+(5.0-4.5)2+(4.7-4.5)2+(4.7-4.5)2+(4.1-4.5)2+(4.7-4.5)2+(4.2-4.5)2+(4.7-4.5)2]=0.104,
=×[(2.6-4.2)2+(4.7-4.2)2+(4.5-4.2)2+(5.0-4.2)2+(4.5-4.2)2+(4.8-4.2)2+(4.5-4.2)2+(3.8-4.2)2+(4.5-4.2)2+(3.1-4.2)2]=0.554,
∴<<.
③推荐乙,理由:乙的方差最小,数据稳定,平均分比丙高.(答案不唯一,合理即可)
例4 解:(1)估计改进后该厂的年收益增加了,理由如下:
依题意,可知原生产线生产A等品的概率为=,生产B等品的概率为,
所以原生产线一天的收益为200××160+200××140=30 000(元),即3万元,所以改进前该厂的年收益为3×365=1095(万元).
改进后的生产线随机抽取的16件产品的工艺质量指标值为
10.00 10.17 10.01 10.01 10.06 9.97 10.03 10.09
10.31 9.96 10.18 10.07 9.27 10.09 10.10 10.00
则改进后的生产线生产A等品的概率为,生产B等品的概率为,
所以改进后的生产线一天的收益为200××160+200××140=31 250(元),即3.125万元,
则改进后该厂的年收益为3.125×365-30=1110.625(万元).因为1110.625>1095,
所以估计改进后该厂的年收益增加了.
(2)由=9.97,s2≈0.045,可估计改进后该厂一天生产的所有产品的工艺质量指标值的平均数为+0.05=10.02,
方差为(xi+0.05--0.05)=(xi-)=s2≈0.045.
变式 解:(1)设该瓷器产品T的综合指标值M的第60百分位数为m,
由频率分布直方图知m∈[6,8),0.01×2+0.04×2+0.11×2+0.16×(m-6)=0.6,解得m=7.75,
所以估计该瓷器产品T的综合指标值M的第60百分位数约为7.75.
(2)先分析该窑炉烧制的瓷器产品T的综合指标值M的平均数:
由频率分布直方图知,综合指标值M的平均数=(1×0.01+3×0.04+5×0.11+7×0.16+9×0.18)×2=6.84>6,故满足认购条件①;
再分析该窑炉烧制的瓷器产品T的单件平均利润值:
由频率分布直方图可知,该新型窑炉烧制的瓷器产品T为一、二、三等品的概率的估计值分别为0.36,0.54,0.1,
所以2000件产品中,一、二、三等品的件数的估计值分别为720,1080,200,故估计一等品的销售总利润为720××(20-10)=6400(元),
二等品的销售总利润为1080××(16-10)-1080××(10-16×50%)=3600(元),
三等品的销售总利润为200××(12-10)-200××(10-12×50%)=-320(元),
故2000件产品的单件平均利润值的估计值为(6400+3600-320)×=4.84(元),而4.84>4,故满足认购条件②.
综上,该新型窑炉达到瓷器厂的认购条件.(共62张PPT)
本章总结提升
题型一 随机抽样
题型二 总体取值规律的估计
题型三 用样本的数字特征估计总体的数
字特征
判断下列说法的正误.(正确的打“√”,错误的打“×”)
1.简单随机抽样主要包括抽签法和随机数法.( )
√
2.在简单随机抽样中,用样本平均数可以估计总体平均数,用样本中
的比例估计总体中的比例.( )
√
3.比例分配的分层随机抽样中,每个个体被抽到的可能性不一样.
( )
×
4.通过网络查询的数据一定是真实的数据.( )
×
5.频率分布直方图中每个小长方形的面积等于相应组的频率,各个小
长方形面积之和等于1. ( )
√
6.从频率分布直方图中得不出原始的数据内容,把数据表示成直方图
后,原有的具体数据信息就被抹掉了.( )
√
7.分位数的含义是总体中任何一个数小于它的可能性是 ( )
×
8.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.
( )
√
9.一组数据的方差越大,说明这组数据的波动越大.( )
√
10.在样本数据中,频率分布最大值所对应的样本数据是众数.( )
√
11.从总体中抽取一个样本,用样本的分布估计总体的分布,样本量越小
估计越准确.( )
×
12.样本量越大,用第百分位数来估计总体的第 百分位数就越准确.
( )
√
题型一 随机抽样
[类型总述](1)随机抽样的相关概念;(2)用简单随机抽样的
方法抽取样本; (3)用分层随机抽样的方法抽取样本.
例1(1) 某校为了解高一年级学生的学业生涯规划情况,在高一年
级6个班级中任选2个班级,并在所选的班级中按男女比例抽取样本,
则应采用的抽样方法是( )
A.简单随机抽样
B.比例分配的分层随机抽样
C.先用比例分配的分层随机抽样,再用随机数法
D.先用抽签法,再用比例分配的分层随机抽样
√
[解析] 某校为了解高一年级学生的学业生涯规划情况,在高一年级6个
班级中任选2个班级,这一过程应采用抽签法或随机数法;
在所选的班级中按男女比例抽取样本,应用比例分配的分层随机抽样.
故选D.
(2)现有以下两项调查:①从40台刚出厂的大型挖掘机中抽取4台
进行质量检测;②在某校800名学生中,型、A型、B型和 型血
的学生依次有300,200,180,120人,为了研究血型与色弱的关系,需从
中抽取一个容量为40的样本.完成这两项调查最适宜采用的抽样方法
是( )
A.①②都采用简单随机抽样
B.①②都采用分层随机抽样
C.①采用简单随机抽样,②采用分层随机抽样
D.①采用分层随机抽样,②采用简单随机抽样
√
[解析] 对于①,40台刚出厂的大型挖掘机被抽取的可能性一样,故
为简单随机抽样;
对于②,因为要研究血型与色弱的关系,所以该校800名学生被抽取
的可能性要按照血型比例分层抽取,故为分层随机抽样.故选C.
变式(1) [2024·甘肃兰州一中高一月考]下列抽取样本的方式属于
简单随机抽样的个数为( )
①从无限多个个体中抽取100个个体作为样本;
②从20件玩具中一次性抽取3件进行质量检验;
③某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛;
④盒子中共有80个零件,从中选出5个零件进行质量检验,在抽样操
作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.
A.0 B.1 C.2 D.3
√
[解析] ①从无限多个个体中抽取100个个体作为样本,不满足总体个
数为有限个;
②从20件玩具中一次性抽取3件进行质量检验,不满足逐个抽取;
③某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛,
不满足随机抽取;
④盒子中共有80个零件,从中选出5个零件进行质量检验,在抽样操
作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里,
不满足无放回抽取.综上可得,以上均不满足简单随机抽样的定义,
故选A.
(2)(多选题)[2024·唐山五校高一联考] 为了实现教育资源的均
衡化,某地决定派遣480名教师志愿者(480名教师情况如图)轮流
支援当地的教育工作.若第一批志愿者采用比例分配的分层随机抽样
的方法随机派遣150名教师,则下列结论正确的是( )
A.派遣的青年男、女教师的人数
之和与老年教师的人数相同
B.派遣的青年女教师的人数占派
遣教师总数的
C.派遣的老年教师有144人
D.派遣的青年女教师有15人
√
√
√
[解析] 因为 ,所以派遣
的青年男教师的数量占派遣教师
总数的 ,则派遣的青年女教
师的人数占派遣教师总数的
,则派遣的青年男、女教师的人数之和
与老年教师的人数相同,均占总数的 ,故A,B正确;
派遣的老年教师人数为 ,故C错误;
派遣的青年女教师的人数为,故D正确.故选 .
题型二 总体取值规律的估计
[类型总述](1)频率分布表与频率分布直方图;(2)统计图中
的样本分布.
例2(1) [2024·上海财经大学附中高一
期末]某商场从参与购物的人群中随机选
出 200 人,并将这200人按年龄分组,得到
的频率分布直方图如图所示,则在这200
人中年龄在内的人数 及直方图
中的 的值分别是( )
A., B.,
C., D.,
√
[解析] 由题图知,年龄在 内的小矩
形的面积为 ,即年龄在
内的频率为 ,所以年龄在
内的人数 .
由频率分布直方图的小矩形面积和为1可得 , 解得
.故选C.
(2)南丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔设
计的,图中每个扇形圆心角都相等,半径长短表示数量大小.某机构
统计了近些年中国知识付费用户数量(单位:亿人次),并绘制成
南丁格尔玫瑰图如图,根据此图,下列说法错误的是( )
A.2015年至2022年,中国知识付费用
户数量逐年增加
B.2017年至2018年,中国知识付费用
户数量的增加量为近些年来最多
C.2022年中国知识付费用户数量超过
2015年中国知识付费用户数量的10倍
D.2016年至2022年,中国知识付费用
户数量的增加量逐年递增
√
[解析] 对于A,由题图可知,2015年
至2022年,中国知识付费用户数量逐
年增加,故A中说法正确;
对于B,D,2015年至2016年,中国
知识付费用户数量的增加量为
(亿人次),
2016年至2017年,中国知识付费用户数量的增加量为
(亿人次),2017年至2018年,中国知识付费用户数量的增加量
为 (亿人次),
2018年至2019年,中国知识付
费用户数量的增加量为
(亿人次),
2019年至2020年,中国知识付费用户
数量的增加量为
(亿人次),
2020年至2021年,中国知识付费用户数量的增加量为
(亿人次),
2021年至2022年,中国知识付费用户数量
的增加量为 (亿人次),
可知2017年至2018年,中国知识付费
用户数量的增加量为近些年来最多,
且2016年至2022年,中国知识付费
用户数量的增加量并不是逐年递增
的,故B中说法正确,D中说法错误;
对于C,由 ,
可知2022年中国知识付费用户数量超过2015年中国知识付费用户数量的10倍,故C中说法正确.故选D.
(3)如图为某地2022年2月至
2023年1月商品零售总额和餐
饮收入总额同比增速情况折
线图,根据该图,下列结论
正确的是( )
A.2023年1月份,商品零售总
额同比增长
B.2022年 月份,餐饮收入总额同比增速都降低
C.2022年 月份,商品零售总额同比增速都上升
D.2022年12月份,餐饮收入总额环比增速为
√
[解析] 对于A,2023年1月份,商品
零售总额同比增长 ,故A错误;
对于B,2022年8月份,餐饮收入总
额同比增速上升,故B错误;
对于C,2022年 月份,商品
零售总额同比增速都上升,故C正确;
对于D,2022年12月份,餐饮收入总额环比增速并未告知,故D错误.
故选C.
变式(1) [2024·甘肃酒泉敦煌中学
高一月考]如图是2023年11月中国的1
0个城市地铁运营里程(单位: )
及运营线路条数的统计图,下列判断
正确的是( )
A.这10个城市中北京的地铁运营里程最长且运营线路条数最多
B.这10个城市地铁运营里程的中位数是
C.这10个城市地铁运营线路条数的平均数为15.4
D.这10个城市地铁运营线路条数的极差是12
√
[解析] 对于A,北京的地铁运营
线路条数最多,而运营里程最长
的是上海,故A错误;
对于B,地铁运营里程的中位数是
,故B错误;
对于C,地铁运营线路条数的平均数为
,故C正确;
对于D,地铁运营线路条数的极差是 ,故D错误. 故选C.
(2)(多选题)[2024·安徽六安高一期中] 某市为最大限度地吸引
“高精尖缺”人才,向全球“招贤纳士”,推进了人才引入落户政策.随
着人口增多,对住房要求也随之而来,而选择购买商品房时,住户
对商品房的户型结构越来越重视,因此某商品房调查机构随机抽取
户住户,针对其居住的户型结构和满意度进行了调查,如图①,调
查的所有住户中四居室共200户,所占比例为,二居室住户占 .如图
②是用比例分配的分层随机抽样的方法从所有调查的住户的满意度
问卷中,抽取 的调查结果绘制成的统计图,则下列说法错误的
是( )
A.样本容量为70
B.样本中三居室住户共抽取了25户
C.根据样本可估计这 户住户对四居室满意的住户有70户
D.样本中对三居室满意的住户有15户
√
√
√
[解析] 对于A选项,总体容量为 ,样本容量为
,故选项A中说法错误;
对于B选项,样本中三居室住户共抽取 (户),
故选项B中说法错误;
对于C选项,对四居室满意的住户共有 (户),故
选项C中说法错误;
对于D选项,样本中三居室住户为30户,对三居室满意的住户有
(户),故选项D中说法正确.故选 .
题型三 用样本的数字特征估计总体的数字特征
[类型总述](1)总体百分位数的估计;(2)总体集中趋势的估
计;(3)总体离散程度的估计.
例3(1) 少年强则国强,少年智则国智.党和政府一直重视青少年的
健康成长,出台了一系列政策和行动计划,提高学生身体素质.为了
加强对学生的营养健康监测,某校在3000名学生中,抽查了100名学
生的体重数据,根据所得数据绘制成样本的频率分布直方图如图所
示(同一组中的数据用该组区间的中点值作代表),则下列结论正
确的是( )
A.样本的众数为65
B.样本的第80百分位数为72.5
C.样本的平均数为67.5
D.估计该校学生中体重低于 的学生人
数为1000
√
[解析] 由频率分布直方图可得众数为 ,
A错误;
样本的平均数为
,C错误;
因为体重位于,,, 内的频率分别为,,,,因为 , ,所以第80百分位数位于区间内,
,
所以 ,即样本的第80百分位数为
,B正确;
样本中体重低于 的频率为
,所以估计该校学
生中体重低于 的学生人数为
,D错误.故选B.
(2)(多选题)[2024·辽宁沈阳高一期末] 运动员甲在某射击比赛
中的成绩(环数)如下表:
次数 1 2 3 4 5 6 7 8 9 10
环数 10.5 10.6 10.3 10.5 10.3 10.6 10.7 10.7 10.5 10.6
则下列说法正确的是( )
A.成绩的众数是10.5环 B.成绩的极差是0.4环
C.成绩的 分位数是10.5环 D.平均成绩是10.4环
√
√
[解析] 对于A,数据中有3个10.5和3个 ,所以众数是10.5环,
环,所以A选项错误;
对于B,极差是最大值与最小值的差,即为 (环),
所以B选项正确;
对于C,将数据从小到大排列,由,得其 分位数
是第3个数,即成绩的 分位数为10.5环,所以C选项正确;
对于D,平均成绩为(环),所以
D选项错误.故选 .
(3)[2023·全国乙卷] 某厂为比较甲、乙两种工艺对橡胶产品伸缩
率的处理效应,进行10次配对试验,每次配对试验选用材质相同的
两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺
处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的
橡胶产品的伸缩率分别记为, ,试验结果如下:
1 2 3 4 5 6 7 8 9 10
545 533 551 522 575 544 541 568 596 548
536 527 543 530 560 533 522 550 576 536
记,记,, ,的样本平均数为 ,样本
方差为 .
①求, ;
解:, 当,2, ,10时, 的值
依次为9,6,8, ,15,11,19,18,20,12,
,
.
②判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产
品的伸缩率是否有显著提高(如果 ,则认为甲工艺处理后的
橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,
否则不认为有显著提高).
解: ,
,即, 成立.
甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的
伸缩率有显著提高.
变式(1) [2023·陕西咸阳高一期末]已知一组数据从小到大排列为1,
1,2,2,3,3,4,5,7,7,8,10,则该组数据的 分位数和
中位数分别是( )
A.3,9 B.2, C.9, D.2,3
[解析] 这组数据共有12个, ,因为数据从小到大排列
为1,1,2,2,3,3,4,5,7,7,8,10,所以该组数据的 分
位数是,中位数是 ,故选B.
√
(2)(多选题)[2023·新课标Ⅰ卷] 有一组样本数据,, ,
,其中是最小值, 是最大值,则( )
A.,,,的平均数等于,, , 的平均数
B.,,,的中位数等于,, , 的中位数
C.,,,的标准差不小于,, , 的标准差
D.,,,的极差不大于,, , 的极差
√
√
[解析] 对于A,这一组样本数据可取1,2,2,2,2,4,则2,2,2,
2的平均数不等于1,2,2,2,2,4的平均数,故A错误;
对于B,不妨设,则,,,的中位数为
,而,,,,,的中位数也为 ,故B正确;
对于C,根据题意可知,,,,,,的数据波动性大于,,,
的数据波动性,故,,,的标准差小于,,,,, 的标
准差,故C错误;
对于D,不妨设,则 ,
故,故D正确.故选 .
(3)某市旅游部门为了促进该市生态特色城镇和新农村建设,将甲、
乙、丙三家民宿的相关资料放到某网络平台上进行推广宣传.该平台
邀请部分曾在这三家民宿体验过的游客参与调查,得到了这三家民
宿的“综合满意度”评分,评分越高表明游客体验越好,现从这三家
民宿“综合满意度”的评分中各随机抽取10个评分数据,并对所得数
据进行整理、描述和分析,下面给出了部分信息.
.甲、乙两家民宿“综合满意度”评分的折线图:
.丙家民宿“综合满意度”评分:
,,,,,,,,,
.甲、乙、丙三家民宿“综合满意度”评分的平均数、中位数如下表:
甲 乙 丙
平均数 4.5 4.2
中位数 4.5 4.7
根据以上信息,回答下列问题:
①分别求表中, 的值;
解:甲家民宿“综合满意度”评分为
,,,,, ,
,,, ,
,
将丙家民宿“综合满意度”评分从小到大排列为,,, ,,,,,, ,
.
②设甲、乙、丙三家民宿“综合满意度”评分的方差分别为, ,
,试比较其大小.
解:
,
,
,
.
③根据“综合满意度”的评分情况,该平台打算将甲、乙、丙三家民
宿中的一家置顶推荐,你认为该平台会将这三家民宿中的哪家置顶
推荐?说明理由(至少从两个方面说明).
解:推荐乙,理由:乙的方差最小,数据稳定,平均分比丙高.
(答案不唯一,合理即可)
例4 某工艺品加工厂生产线一天能生产200件某款产品,该产品市场
评级规定:工艺质量指标值大于或等于10的为等品,小于10的为
等品.厂家将等品售价定为160元/件, 等品售价定为140元/件.
下表是检验员在现有生产线上随机抽取的16件产品的工艺质量指标值:
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得,,其中
为抽取的第件产品的工艺质量指标值,,2, ,16.
为了提高产品质量,该厂计划通过增加生产工序来改进生产工艺,
已知增加生产工序每年需花费30万元,改进后该条生产线产能不变,
但生产出的每件产品工艺质量指标值均提高0.05.
(1)若将随机抽取的16件产品中各等级产品的频率视为概率,估计
改进后该厂的年收益是否增加,并说明理由;(一年按365天计算)
解:估计改进后该厂的年收益增加了,理由如下:
依题意,可知原生产线生产等品的概率为,生产 等品的概
率为 ,
所以原生产线一天的收益为
(元),即3万元,
所以改进前该厂的年收益为 (万元).
10.00 10.17 10.01 10.01 10.06 9.97 10.03 10.09
10.31 9.96 10.18 10.07 9.27 10.09 10.10 10.00
则改进后的生产线生产等品的概率为,生产等品的概率为 ,
所以改进后的生产线一天的收益为
(元),即3.125万元,
则改进后该厂的年收益为 (万元).
因为 ,
所以估计改进后该厂的年收益增加了.
改进后的生产线随机抽取的16件产品的工艺质量指标值为
(2)根据随机抽取的16件产品的工艺质量指标值,估计改进后该厂
一天生产的所有产品的工艺质量指标值的平均数和方差.
解:由, ,可估计改进后该厂一天生产的所有产
品的工艺质量指标值的平均数为 ,
方差为 .
变式 已知瓷器产品的质量采用综合指标值进行衡量,
为一等品,为二等品, 为三等品.某瓷器厂准备购
进新型窑炉以提高生产效益,在某供应商提供的窑炉中任选一个试用,
烧制了一批产品并统计相关数据,
将综合指标值分为 ,
, 共五组,绘制成
如图所示的频率分布直方图.
(1)估计该瓷器产品的综合指标值 的第60百分位数.
解:设该瓷器产品的综合指标值的第60百分位数为 ,
由频率分布直方图知 ,
,解得
,
所以估计该瓷器产品的综合指标值 的第60百分位数约为7.75.
(2)根据瓷器厂的记录,产品各等次的销售率(某等次产品销量与
其对应产量的比值)及单件售价情况如下:
一等品 二等品 三等品
销售率
单件售价 20元 16元 12元
根据以往的销售方案,未售出的产品统一按原
售价的 全部处理完.已知该瓷器厂认购该
窑炉的前提条件是,该窑炉烧制的产品同时满
足下列两个条件:
①综合指标值 的平均数(同一组中的数据用该组区间的中点值作代表)
不小于6;
②单件平均利润不低于4元.
若该新型窑炉烧制瓷器产品 的成本为10元/件,
且月产量为2000件,在销售方案不变的情况下,
根据图表数据,分析该新型窑炉是否达到瓷器厂
的认购条件.
解:先分析该窑炉烧制的瓷器产品 的综合
指标值 的平均数:
由频率分布直方图知,综合指标值 的平均
数 ,
故满足认购条件①;
再分析该窑炉烧制的瓷器产品 的单件平均利润值:
由频率分布直方图可知,该新型窑炉烧制的瓷器产品 为一、二、三
等品的概率的估计值分别为,, ,
所以2000件产品中,一、二、三等品的件数的估计值分别为720,1080,200,故估计一等品的销售总利润为 (元),二等品的销售总利润为 (元),
(元),
故2000件产品的单件平均利润值的估计值为 (元),而 ,故满足认购条件②.
综上,该新型窑炉达到瓷器厂的认购条件.