(共20张PPT)
章末复习提升
『网络建构』
『知识辨析』
判断对错.(正确的画“√”,错误的画“×”)
1.在简单随机抽样中,第一次抽到的可能性最小.( )
2.在分层随机抽样的过程中,每个个体被抽到的可能性与层数及分层有关.
( )
3.方差与标准差有相同的单位.( )
4.标准差越大,数据的稳定性越强.( )
5.一组数据的众数一定是唯一的.( )
×
×
×
×
×
6.一组数据的75%分位数是指该组数据的任意一个数大于或等于它的可能性是75%.( )
7.频率分布直方图的纵轴表示频率.( )
8.频率分布直方图中所有小矩形的面积之和为1.( )
×
×
√
核心题型突破
题型一 抽样
[典例1] 某校500名学生中,血型为O型的有200人,A型的有125人,B型的有125人,AB型的有50人,为了研究血型与性格的关系,需从中抽取一个容量为20的样本,应怎样抽取样本
(2)按比例分配各层所要抽取的个体数,血型为O型的抽取8人,A型的抽取5人,
B型的抽取 5人,AB型的抽取2人.
(3)各层分别按照简单随机抽样的方法,抽取样本.
(4)综合各层抽取的个体,组成样本.
·规律方法·
题型二 统计图表
[典例2] 某校举行了一次网络安全知识竞赛,满分10分,有10名同学代表班级参加比赛,已知学生成绩均为整数,比赛结束后统计这10名同学成绩情况如折线图所示,若这10名同学成绩的极差为a,平均数为b,则a+b= .
13.7
·规律方法·
求解统计图表问题,首先明确统计图表的特征,然后从统计图表中读取相应的数据,结合数据特征及题目要求进行分析求解.
题型三 频率分布
[典例3] 从某校随机抽取100名学生,获得了他们一周课外阅读时长(单位:h)的数据,整理得到频数分布表和频率分布直方图.
组号 分组 频数
1 [0,2) 6
2 [2,4) 8
3 [4,6) 17
4 [6,8) 22
5 [8,10) 25
6 [10,12) 12
7 [12,14) 6
8 [14,16) 2
9 [16,18] 2
总计 100
(1)计算这100名学生中一周课外阅读时长少于12 h的比例;
(2)求频率分布直方图中的a,b的值;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生中一周课外阅读时长的平均数在第几组(只需写出结论).
【解】 (3)估计样本中的100名学生中一周课外阅读时长的平均数在第4组.
·规律方法·
频率分布直方图是以面积的形式反映数据落在各个小组的频率的大小,要注意在频率分布直方图中,各小矩形的面积等于相应各组的频率,小矩形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.
题型四 样本的数字特征
[典例4] 某市针对本市不同年龄和不同职业的人举办了一次知识竞赛,满分100分(95分及以上为得分高),结果得分高的有20人,按年龄分成5组,其中第一组[20,25),第二组[25,30),第三组[30,35),第四组[35,40),第五组[40,45],得到如图所示的频率分布直方图.
(1)根据频率分布直方图,估计这20人的平均年龄和80%分位数;
·规律方法·
样本的数字特征可分为两大类:一类是反映样本数据集中程度的,包括众数、中位数和平均数.要求解一组数据的众数、中位数,首先要将数据按照从小到大的顺序排列.另一类是反映样本数据波动大小的,包括方差及标准差.应明确方差的计算公式以及方差与标准差的关系,即标准差是方差的算术平
方根.章末复习提升
网络建构
知识辨析
判断对错.(正确的画“√”,错误的画“×”)
1.在简单随机抽样中,第一次抽到的可能性最小.( × )
2.在分层随机抽样的过程中,每个个体被抽到的可能性与层数及分层有关.( × )
3.方差与标准差有相同的单位.( × )
4.标准差越大,数据的稳定性越强.( × )
5.一组数据的众数一定是唯一的.( × )
6.一组数据的75%分位数是指该组数据的任意一个数大于或等于它的可能性是75%.
( × )
7.频率分布直方图的纵轴表示频率.( × )
8.频率分布直方图中所有小矩形的面积之和为1.( √ )
题型一 抽样
[典例1] 某校500名学生中,血型为O型的有200人,A型的有125人,B型的有125人,AB型的有50人,为了研究血型与性格的关系,需从中抽取一个容量为20的样本,应怎样抽取样本
【解】 用分层随机抽样的方法抽取样本.
因为=,
即抽样比例为,
所以200×=8,125×=5,50×=2,
故血型为O型的抽取8人,A型的抽取5人,B型的抽取5人,AB型的抽取2人.
抽样步骤:
(1)确定抽样比例为.
(2)按比例分配各层所要抽取的个体数,血型为O型的抽取8人,A型的抽取5人,B型的抽取 5人,AB型的抽取2人.
(3)各层分别按照简单随机抽样的方法,抽取样本.
(4)综合各层抽取的个体,组成样本.
(1)分层随机抽样问题中每层抽取的个体数为ni=Ni·,其中Ni为第i(i=1,2,…,k)层的个体数,为抽样比例.
(2)分层随机抽样中在每一层抽取时,可以利用简单随机抽样中的抽签法与随机数法抽取.
题型二 统计图表
[典例2] 某校举行了一次网络安全知识竞赛,满分10分,有10名同学代表班级参加比赛,已知学生成绩均为整数,比赛结束后统计这10名同学成绩情况如折线图所示,若这10名同学成绩的极差为a,平均数为b,则a+b= .
【答案】 13.7
【解析】 由题意知,这10名同学的成绩分别为3,6,6,6,6,6,7,8,9,10,则极差a=10-3=7,平均数b==6.7,所以a+b=13.7.
求解统计图表问题,首先明确统计图表的特征,然后从统计图表中读取相应的数据,结合数据特征及题目要求进行分析求解.
题型三 频率分布
[典例3] 从某校随机抽取100名学生,获得了他们一周课外阅读时长(单位:h)的数据,整理得到频数分布表和频率分布直方图.
组号 分组 频数
1 [0,2) 6
2 [2,4) 8
3 [4,6) 17
4 [6,8) 22
5 [8,10) 25
6 [10,12) 12
7 [12,14) 6
8 [14,16) 2
9 [16,18] 2
总计 100
(1)计算这100名学生中一周课外阅读时长少于12 h的比例;
(2)求频率分布直方图中的a,b的值;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生中一周课外阅读时长的平均数在第几组(只需写出结论).
【解】 (1)根据频数分布表知,这100名学生中一周课外阅读时长不少于12 h的学生共有 6+2+2=10(名),所以样本中的学生一周课外阅读时长少于12 h的频率是1-=0.9,
所以这100名学生中一周课外阅读时长少于12 h的比例为90%.
(2)一周课外阅读时长落在[4,6)组内的有 17人,频率为0.17,所以a==0.085.
一周课外阅读时长落在[8,10)组内的有 25人,频率为0.25,所以b==0.125.
(3)估计样本中的100名学生中一周课外阅读时长的平均数在第4组.
频率分布直方图是以面积的形式反映数据落在各个小组的频率的大小,要注意在频率分布直方图中,各小矩形的面积等于相应各组的频率,小矩形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.
题型四 样本的数字特征
[典例4] 某市针对本市不同年龄和不同职业的人举办了一次知识竞赛,满分100分(95分及以上为得分高),结果得分高的有20人,按年龄分成5组,其中第一组[20,25),第二组[25,30),第三组[30,35),第四组[35,40),第五组[40,45],得到如图所示的频率分布直方图.
(1)根据频率分布直方图,估计这20人的平均年龄和80%分位数;
(2)若第四组参赛者的年龄的平均数与方差分别为37和,第五组参赛者的年龄的平均数与方差分别为43和1,求这20人中35~45岁所有人的年龄的方差.
【解】 (1)设这20人的平均年龄为,
则=22.5×0.05+27.5×0.35+32.5×0.3+37.5×0.2+42.5×0.1=32.25.
设80%分位数为a,由5×(0.01+0.07+0.06)+(a-35)×0.04=0.8,解得a=37.5.
(2)由频率分布直方图得各组人数之比为1∶7∶6∶4∶2,又共有20人,故第四组和第五组的人数分别为4和2,设第四组、第五组的参赛者的年龄的平均数分别为,,方差分别为,,则=37,=43,=,=1,设第四组和第五组所有参赛者的年龄的平均数为,方差为s2.则==39,s2=×{4×[+]+2×[+]}=10,因此这20人中35~45岁所有人的年龄的方差为10.
样本的数字特征可分为两大类:一类是反映样本数据集中程度的,包括众数、中位数和平均数.要求解一组数据的众数、中位数,首先要将数据按照从小到大的顺序排列.另一类是反映样本数据波动大小的,包括方差及标准差.应明确方差的计算公式以及方差与标准差的关系,即标准差是方差的算术平方根.
第六章 检测试题
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.在以下调查中,适合用普查的个数是( )
①调查一个班级学生的吃早餐情况;②调查某种饮料质量合格情况;③调查某批飞行员的身体健康指标;④调查某个水库中草鱼所占的比例.
A.1 B.2 C.3 D.4
【答案】 B
【解析】 ①因为一个班级学生的人数不多,吃早餐情况的全面调查也容易操作,所以适合普查;②某种饮料数量太多,质量合格情况适合抽样调查;③飞行员的职业特点决定了身体健康指标必须进行普查;④某个水库中鱼的种类和数量一般都较多,不适合普查.故选B.
2.为了了解高一年级学生的视力情况,特别是近视率问题,抽查了其中100名同学的视力情况.在这个过程中,100名同学的视力情况(数据)是( )
A.总体 B.个体
C.总体的一个样本 D.样本容量
【答案】 C
【解析】 100名同学的视力情况(数据)是从总体中抽取的一部分个体所组成的集合,所以是总体的一个样本.故选C.
3.从某班57名同学中选出4人参加户外活动,利用随机数表法抽取样本时,先将57名同学按01,02,…,57进行编号,然后从随机数表第1行的第3列和第4列数字开始往右依次选取两个数字,则选出的第4名同学的编号为( )
0347 4373 8636 9647 3661 4698 6371 6297
7424 6292 4281 1457 2042 5332 3732 1676
(注:表中的数据为该随机数表第1行和第2行)
A.36 B.42 C.46 D.47
【答案】 C
【解析】 57名同学按01,02,…,57进行编号,然后从随机数表第1行的第3列和第4列数字开始往右依次选取两个数字,由随机数表法可知,样本前4名同学的编号依次为47,43,36,46,故选出的第4名同学的编号为46.故选C.
4.某工厂生产A,B,C三种不同型号的产品,某月生产A,B,C这三种型号的产品的数量之比依次为1∶a∶2,现用分层随机抽样的方法抽取一个容量为60的样本,已知B种型号的产品被抽取了24件,则a等于( )
A.1 B.2 C.3 D.4
【答案】 B
【解析】 由题可知=,解得a=2.故选B.
5.一组数据为73,74,75,75,76,76,77,78,79,80,则这组数据的70%分位数是( )
A.77.5 B.77 C.78 D.76.5
【答案】 A
【解析】 一组数据为73,74,75,75,76,76,77,78,79,80共10个数,由10×70%=7,可知这组数据的70%分位数是第7个数与第8个数的平均数,为=77.5.故选A.
6.某同学掷一枚正方体骰子5次,记录每次骰子出现的点数,统计出结果的平均数为2,方差为0.4,可判断这组数据的众数为( )
A.1 B.2 C.3 D.4
【答案】 B
【解析】 不妨设五个点数为x1≤x2≤x3≤x4≤x5,由题意平均数为2,方差为0.4,知(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2+(x5-2)2=2,x1+x2+x3+x4+x5=10.
可知五个点数中最大点数不可能为4,5,6,若五个点数情况为1,2,2,2,3,其方差为
==0.4,符合题意,其众数为2;五个点数也不可能都是2,则五个点数情况可能是1,1,2,3,3,其方差为==0.8,不合题意.故选B.
7.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为 和 ,样本标准差分别为sA和sB,样本极差分别为yA和yB,则( )
A.>,sA>sB,yAB.<,sA>sB,yA>yB
C.>,sAyB
D.<,sA【答案】 B
【解析】 观察图形可知,样本A的数据均在[2.5,10]之间,样本B的数据均在[10,15]之间,由折线图可得<10,>10,故 <,而样本极差yA=7.5>5=yB,又样本B的数据波动较小,故sA>sB.故选B.
8.在一次数学模考中,从甲、乙两个班各自抽出10个人的成绩,甲班的10个人成绩分别为x1,x2,…,x10,乙班的10个人成绩分别为y1,y2,…,y10.假设这两组数据中位数相同、方差也相同,则把这20个数据合并后( )
A.中位数一定不变,方差可能变大
B.中位数可能改变,方差可能变大
C.中位数一定不变,方差可能变小
D.中位数可能改变,方差可能变小
【答案】 A
【解析】 不妨设x1≤x2≤…≤x10,y1≤y2≤…≤y10,
则x1,x2,…,x10的中位数为,y1,y2,…,y10的中位数为,因为这两组数据中位数相同,所以=,即x5+x6=y5+y6,即x5≤y5≤y6≤x6或y5≤x5≤x6≤y6,所以合并后的数据中位数是或,所以中位数不变,设第一组数据的方差为s2,平均数为,第二组数据的方差为s2,平均数为,合并后总数为20,平均数为,方差为s′2,由方差的公式可得,s′2={10[s2+
(-)2]+10[s2+(-)2]}=[s2+(-)2]+[s2+(-)2]=s2+(-)2+(-)2≥s2.
所以当平均数相同时,方差不变;当平均数不同时,方差变大.故选A.
二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.某公司生产三种型号的轿车,产量分别为1 500辆,6 000辆和2 000辆,为检验该公司的产品质量,公司质检部门要抽取57辆进行检验,则下列说法中正确的是( )
A.应采用分层随机抽样的方法
B.应采用抽签法抽取
C.三种型号的轿车应依次抽取9辆,36辆和12辆
D.这三种型号的轿车,每一辆被抽到的可能性相等
【答案】 ACD
【解析】 某公司生产三种型号的轿车,产量分别为1 500辆,6 000辆和2 000辆,为检验该公司的产品质量,公司质检部门要抽取57辆进行检验,所以该检验采用分层随机抽样的方法,且数量较多,不宜采用抽签法,故A正确,B错误;对于C,1 500+6 000+2 000=9 500(辆),所以三种型号的轿车应依次抽取×57=9(辆),×57=36(辆),×57=12(辆),故C正确;对于D,对于分层随机抽样的每一辆轿车被抽到的可能性相等,故D正确.故选A,C,D.
10.已知一组数据1,2,1,3,a,b,1,3,则下列结论正确的是( )
A.若a=b=4,则这组数据的众数为1
B.若a=b=4,则这组数据的70%分位数为3
C.若ab=4(a>0,b>0),则这组数据的平均数的最小值为
D.若ab=4(a>0,b>0),则这组数据的平均数的最小值为2
【答案】 ABC
【解析】 对于A,若a=b=4,则这组数据出现次数最多的是1,所以这组数据的众数为1,选项A正确;
对于B,若a=b=4,这组数据按从小到大顺序排列为1,1,1,2,3,3,4,4,且8×70%=5.6,所以这组数据的70%分位数为3,选项B正确;
对于C,若ab=4(a>0,b>0),a+b≥2=4,当且仅当a=b时,等号成立,所以这组数据的平均数的最小值为×(1+1+1+2+3+3+a+b)≥,选项C正确,选项D错误.
故选A,B,C.
11.某保险公司为客户定制了5个险种.甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种的参保客户进行抽样调查,得出统计图例如图,则以下四个选项正确的是( )
A.18~29周岁人群参保总费用最少
B.30周岁及以上的参保人群约占参保总人群的20%
C.54周岁及以上的参保人数最少
D.丁险种更受参保人青睐
【答案】 ACD
【解析】 由第一个图可得54周岁及以上的参保人数最少,占比为1-30%-33%-20%=17%,故C正确;其余年龄段的人均参保费用均比18~29周岁人群人均参保费用多,由第二个图可得,因为20%×4 000< 17%×6 000,所以18~29周岁人群参保总费用最少,故A正确;由第一个图可得,30周岁及以上的参保人群约占参保总人群的80%,故B错误;由第三个图可得,丁险种参保人群占参保总人群的55%,所以最受青睐,故D正确.故选A,C,D.
三、填空题:本题共3小题,每小题5分,共15分.
12.某校高二年级选择“理化生”“理化地”“史政地”和“史政生”组合的学生人数分别为480,40,120和80,现采用分层随机抽样的方法从这些学生中选出72人参加一项活动,则从“史政生”组合中选出的学生人数为 .
【答案】 8
【解析】 由题意可知,从“史政生”组合中选出的学生人数为72×=8.
13.为了解某地中学生的体重情况,某机构从该地中学生中随机抽取100名学生,测量他们的体重(单位:kg),根据测量数据,按[40,45),[45,50),[50,55),[55,60),[60,65),[65,70]分成六组,得到的频率分布直方图如图所示,根据调查的数据,估计该地中学生体重的50%分位数是 .
【答案】 53.75
【解析】 因为(0.01+0.03)×5=0.2<0.5,0.2+0.08×5=0.6>0.5,所以该地中学生体重的50%分位数等于中位数,且位于[50,55)内,设中位数为m,则0.2+(m-50)×0.08=0.5,解得m=53.75.
14.某校采用分层随机抽样采集了高一、高二、高三年级学生的身高情况,部分调查数据如下:
年级 样本量 样本平均数 样本方差
高一 100 167 120
高二 100 170 150
高三 100 173 150
则总的样本方差s2= .
【答案】 146
【解析】 由题意知,总的样本平均数为
=×167+×170+×173=170,
所以总的样本方差为
s2=×[120+(167-170)2]+×[150+(170-170)2]+×[150+(173-170)2]=×(120+9)+×150+×(150+9)=146.
四、解答题:本题共5小题,共77分.解答应写出文字说明、证明过程或演算步骤.
15.(本小题满分13分)
为了解市民的环保意识,某校高一(1)班50名学生在6月5日(世界环境日)这一天调查了各自家庭丢弃旧塑料袋的情况,有关数据如表所示.
每户丢弃旧 塑料袋个数 2 3 4 5
户数 6 17 15 12
(1)求这50户居民6月5日这一天丢弃旧塑料袋的平均数、中位数;
(2)求这50户居民6月5日这一天丢弃旧塑料袋的75%分位数.
【解】 (1)根据题意得,平均数为 =×(2×6+3×17+4×15+5×12)==3.66,中位数是4.
(2)因为50×75%=37.5,
所以这50户居民6月5日这一天丢弃旧塑料袋的75%分位数是4.
16.(本小题满分15分)
某化工厂三个车间男工、女工人数如下表:
项目 第一车间 第二车间 第三车间
女工人数 150 100 y
男工人数 200 x z
若按车间人数用分层随机抽样的方法抽取100名工人,则应在第一车间抽取35名工人,在第二车间抽取25名工人.
(1)求这三个车间的工人总数及x的值;
(2)若按工人性别用分层随机抽样的方法在第三车间抽取8名工人,其中有5名女工,求该化工厂这三个车间女工与男工的人数之比.
【解】 (1)设这三个车间的工人总数为n,
则=,
解得n=1 000.
由×100=25,得x=150.
(2)因为在第三车间抽取8名工人,其中有5名女工,所以y∶z=5∶(8-5),即3y=5z.
又由(1)易知y+z=400,所以y=250,z=150.
所以(150+100+250)∶(200+150+150)=1∶1.
所以该化工厂这三个车间女工与男工的人数之比为1∶1.
17.(本小题满分15分)
某果园试种了A,B两个品种的桃树各10棵,并在桃树成熟挂果后统计了这20棵桃树的产量如下表,记A,B两个品种各10棵产量的平均数分别为和,方差分别为和.
A/kg 60 50 45 60 70 80 80 80 85 90
B/kg 40 60 60 80 80 55 80 80 70 95
(1)求,,,;
(2)果园要大面积种植这两个品种的桃树中的一种,依据以上计算结果分析选种哪个品种更合适 并说明理由.
【解】 (1)=×(45+50+60+60+70+80+80+80+85+90)=70,
=×[(-25)2+(-20)2+2×(-10)2+02+3×102+152+202]=215,
=×(40+55+60+60+70+80+80+80+80+95)=70,=×[(-30)2+(-15)2+2×(-10)2+02+4×102+252)=235.
(2)由==70可得A,B两个品种的桃树平均产量相等,
又<,则A品种产量较稳定,故选择A品种.
18.(本小题满分17分)
某学校开展组织学生参加线上环保知识竞赛活动,现从中抽取200名学生,记录他们的首轮竞赛成绩并作出如图所示的频率分布直方图,根据图形,请回答下列问题:
(1)若从成绩低于60分的同学中按分层随机抽样的方法抽取5人成绩,求5人中成绩低于50分的人数;
(2)以样本估计总体,利用组中值估计该校学生首轮竞赛成绩的平均数;
(3)首轮竞赛成绩位列前10%的学生入围第二轮的复赛,请根据图中信息,估计入围复赛的成绩(记为k).
【解】 (1)由(0.005+0.01+0.015+0.015+0.025+a)×10=1,得a=0.03,因为0.01×10×200=20(人),
0.015×10×200=30(人),
所以成绩低于50分的抽取5×=2(人).
(2)平均数=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).
(3)因为成绩位于[90,100]的频率为0.005×10=0.05,成绩位于[80,90)的频率为0.025×10=
0.25,所以k∈[80,90),
则0.05+(90-k)×0.025=0.1,
解得k=88,即入围复赛的成绩为88分.
19.(本小题满分17分)
已知A,B两家公司的员工月均工资(单位:万元)情况分别如图①,图②所示.
(1)以每组数据的区间中点值为代表,根据图①估计A公司员工月均工资的平均数、中位数,你认为用哪个数据更能反映该公司普通员工的工资水平 请说明理由;
(2)某人拟到A,B两家公司中的一家应聘,以公司普通员工的工资水平作为决策依据,此人应该选哪个公司
【解】 (1)A公司员工月均工资的平均数为
0.3×0.21+0.5×0.29+0.7×0.27+0.9×0.21+29×0.02=1.166(万元).
由题图①可知A公司员工月均工资在0.6万元以下的比例为21%+29%=50%,所以A公司员工月均工资的中位数约为0.6万元.
用中位数更能反映该公司普通员工的工资水平,理由如下:
因为平均数受每一个数据的影响,越离群的数据对平均数的影响越大,该公司少数员工的月均工资很高,在这种情况下平均数并不能较好地反映普通员工的工资水平,而中位数不受少数极端数据的影响,可以较好地反映普通员工的工资水平.
(2)B公司员工月均工资的平均数为
(0.3×0.375+0.5×0.750+0.7×2.750+0.9×1.000+1.1×0.125)×0.2=0.69(万元).
由题图②知,B公司员工月均工资在0.6万元以下的频率为(0.375+0.75)×0.2=0.225,在0.8万元以下的频率为(0.375+0.75+2.75)×0.2=0.775.
设B公司员工月均工资的中位数为x万元,
则(x-0.6)×2.75=0.5-0.225,
得x=0.7.
此人应该选B公司应聘,理由如下:
B公司员工月均工资数据较为集中,月均工资的平均数和中位数均能反映该公司普通员工的平均工资水平,B公司员工月均工资平均数为0.69,中位数为0.7,大于A公司员工月均工资的中位数0.6,所以以公司普通员工的工资水平作为决策依据,此人应该选B公司应聘.
21世纪教育网(www.21cnjy.com)第六章 检测试题
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.在以下调查中,适合用普查的个数是( )
①调查一个班级学生的吃早餐情况;②调查某种饮料质量合格情况;③调查某批飞行员的身体健康指标;④调查某个水库中草鱼所占的比例.
A.1 B.2 C.3 D.4
【答案】 B
【解析】 ①因为一个班级学生的人数不多,吃早餐情况的全面调查也容易操作,所以适合普查;②某种饮料数量太多,质量合格情况适合抽样调查;③飞行员的职业特点决定了身体健康指标必须进行普查;④某个水库中鱼的种类和数量一般都较多,不适合普查.故选B.
2.为了了解高一年级学生的视力情况,特别是近视率问题,抽查了其中100名同学的视力情况.在这个过程中,100名同学的视力情况(数据)是( )
A.总体 B.个体
C.总体的一个样本 D.样本容量
【答案】 C
【解析】 100名同学的视力情况(数据)是从总体中抽取的一部分个体所组成的集合,所以是总体的一个样本.故选C.
3.从某班57名同学中选出4人参加户外活动,利用随机数表法抽取样本时,先将57名同学按01,02,…,57进行编号,然后从随机数表第1行的第3列和第4列数字开始往右依次选取两个数字,则选出的第4名同学的编号为( )
0347 4373 8636 9647 3661 4698 6371 6297
7424 6292 4281 1457 2042 5332 3732 1676
(注:表中的数据为该随机数表第1行和第2行)
A.36 B.42 C.46 D.47
【答案】 C
【解析】 57名同学按01,02,…,57进行编号,然后从随机数表第1行的第3列和第4列数字开始往右依次选取两个数字,由随机数表法可知,样本前4名同学的编号依次为47,43,36,46,故选出的第4名同学的编号为46.故选C.
4.某工厂生产A,B,C三种不同型号的产品,某月生产A,B,C这三种型号的产品的数量之比依次为1∶a∶2,现用分层随机抽样的方法抽取一个容量为60的样本,已知B种型号的产品被抽取了24件,则a等于( )
A.1 B.2 C.3 D.4
【答案】 B
【解析】 由题可知=,解得a=2.故选B.
5.一组数据为73,74,75,75,76,76,77,78,79,80,则这组数据的70%分位数是( )
A.77.5 B.77 C.78 D.76.5
【答案】 A
【解析】 一组数据为73,74,75,75,76,76,77,78,79,80共10个数,由10×70%=7,可知这组数据的70%分位数是第7个数与第8个数的平均数,为=77.5.故选A.
6.某同学掷一枚正方体骰子5次,记录每次骰子出现的点数,统计出结果的平均数为2,方差为0.4,可判断这组数据的众数为( )
A.1 B.2 C.3 D.4
【答案】 B
【解析】 不妨设五个点数为x1≤x2≤x3≤x4≤x5,由题意平均数为2,方差为0.4,知(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2+(x5-2)2=2,x1+x2+x3+x4+x5=10.
可知五个点数中最大点数不可能为4,5,6,若五个点数情况为1,2,2,2,3,其方差为
==0.4,符合题意,其众数为2;五个点数也不可能都是2,则五个点数情况可能是1,1,2,3,3,其方差为==0.8,不合题意.故选B.
7.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为 和 ,样本标准差分别为sA和sB,样本极差分别为yA和yB,则( )
A.>,sA>sB,yAB.<,sA>sB,yA>yB
C.>,sAyB
D.<,sA【答案】 B
【解析】 观察图形可知,样本A的数据均在[2.5,10]之间,样本B的数据均在[10,15]之间,由折线图可得<10,>10,故 <,而样本极差yA=7.5>5=yB,又样本B的数据波动较小,故sA>sB.故选B.
8.在一次数学模考中,从甲、乙两个班各自抽出10个人的成绩,甲班的10个人成绩分别为x1,x2,…,x10,乙班的10个人成绩分别为y1,y2,…,y10.假设这两组数据中位数相同、方差也相同,则把这20个数据合并后( )
A.中位数一定不变,方差可能变大
B.中位数可能改变,方差可能变大
C.中位数一定不变,方差可能变小
D.中位数可能改变,方差可能变小
【答案】 A
【解析】 不妨设x1≤x2≤…≤x10,y1≤y2≤…≤y10,
则x1,x2,…,x10的中位数为,y1,y2,…,y10的中位数为,因为这两组数据中位数相同,所以=,即x5+x6=y5+y6,即x5≤y5≤y6≤x6或y5≤x5≤x6≤y6,所以合并后的数据中位数是或,所以中位数不变,设第一组数据的方差为s2,平均数为,第二组数据的方差为s2,平均数为,合并后总数为20,平均数为,方差为s′2,由方差的公式可得,s′2={10[s2+
(-)2]+10[s2+(-)2]}=[s2+(-)2]+[s2+(-)2]=s2+(-)2+(-)2≥s2.
所以当平均数相同时,方差不变;当平均数不同时,方差变大.故选A.
二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.某公司生产三种型号的轿车,产量分别为1 500辆,6 000辆和2 000辆,为检验该公司的产品质量,公司质检部门要抽取57辆进行检验,则下列说法中正确的是( )
A.应采用分层随机抽样的方法
B.应采用抽签法抽取
C.三种型号的轿车应依次抽取9辆,36辆和12辆
D.这三种型号的轿车,每一辆被抽到的可能性相等
【答案】 ACD
【解析】 某公司生产三种型号的轿车,产量分别为1 500辆,6 000辆和2 000辆,为检验该公司的产品质量,公司质检部门要抽取57辆进行检验,所以该检验采用分层随机抽样的方法,且数量较多,不宜采用抽签法,故A正确,B错误;对于C,1 500+6 000+2 000=9 500(辆),所以三种型号的轿车应依次抽取×57=9(辆),×57=36(辆),×57=12(辆),故C正确;对于D,对于分层随机抽样的每一辆轿车被抽到的可能性相等,故D正确.故选A,C,D.
10.已知一组数据1,2,1,3,a,b,1,3,则下列结论正确的是( )
A.若a=b=4,则这组数据的众数为1
B.若a=b=4,则这组数据的70%分位数为3
C.若ab=4(a>0,b>0),则这组数据的平均数的最小值为
D.若ab=4(a>0,b>0),则这组数据的平均数的最小值为2
【答案】 ABC
【解析】 对于A,若a=b=4,则这组数据出现次数最多的是1,所以这组数据的众数为1,选项A正确;
对于B,若a=b=4,这组数据按从小到大顺序排列为1,1,1,2,3,3,4,4,且8×70%=5.6,所以这组数据的70%分位数为3,选项B正确;
对于C,若ab=4(a>0,b>0),a+b≥2=4,当且仅当a=b时,等号成立,所以这组数据的平均数的最小值为×(1+1+1+2+3+3+a+b)≥,选项C正确,选项D错误.
故选A,B,C.
11.某保险公司为客户定制了5个险种.甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种的参保客户进行抽样调查,得出统计图例如图,则以下四个选项正确的是( )
A.18~29周岁人群参保总费用最少
B.30周岁及以上的参保人群约占参保总人群的20%
C.54周岁及以上的参保人数最少
D.丁险种更受参保人青睐
【答案】 ACD
【解析】 由第一个图可得54周岁及以上的参保人数最少,占比为1-30%-33%-20%=17%,故C正确;其余年龄段的人均参保费用均比18~29周岁人群人均参保费用多,由第二个图可得,因为20%×4 000< 17%×6 000,所以18~29周岁人群参保总费用最少,故A正确;由第一个图可得,30周岁及以上的参保人群约占参保总人群的80%,故B错误;由第三个图可得,丁险种参保人群占参保总人群的55%,所以最受青睐,故D正确.故选A,C,D.
三、填空题:本题共3小题,每小题5分,共15分.
12.某校高二年级选择“理化生”“理化地”“史政地”和“史政生”组合的学生人数分别为480,40,120和80,现采用分层随机抽样的方法从这些学生中选出72人参加一项活动,则从“史政生”组合中选出的学生人数为 .
【答案】 8
【解析】 由题意可知,从“史政生”组合中选出的学生人数为72×=8.
13.为了解某地中学生的体重情况,某机构从该地中学生中随机抽取100名学生,测量他们的体重(单位:kg),根据测量数据,按[40,45),[45,50),[50,55),[55,60),[60,65),[65,70]分成六组,得到的频率分布直方图如图所示,根据调查的数据,估计该地中学生体重的50%分位数是 .
【答案】 53.75
【解析】 因为(0.01+0.03)×5=0.2<0.5,0.2+0.08×5=0.6>0.5,所以该地中学生体重的50%分位数等于中位数,且位于[50,55)内,设中位数为m,则0.2+(m-50)×0.08=0.5,解得m=53.75.
14.某校采用分层随机抽样采集了高一、高二、高三年级学生的身高情况,部分调查数据如下:
年级 样本量 样本平均数 样本方差
高一 100 167 120
高二 100 170 150
高三 100 173 150
则总的样本方差s2= .
【答案】 146
【解析】 由题意知,总的样本平均数为
=×167+×170+×173=170,
所以总的样本方差为
s2=×[120+(167-170)2]+×[150+(170-170)2]+×[150+(173-170)2]=×(120+9)+×150+×(150+9)=146.
四、解答题:本题共5小题,共77分.解答应写出文字说明、证明过程或演算步骤.
15.(本小题满分13分)
为了解市民的环保意识,某校高一(1)班50名学生在6月5日(世界环境日)这一天调查了各自家庭丢弃旧塑料袋的情况,有关数据如表所示.
每户丢弃旧 塑料袋个数 2 3 4 5
户数 6 17 15 12
(1)求这50户居民6月5日这一天丢弃旧塑料袋的平均数、中位数;
(2)求这50户居民6月5日这一天丢弃旧塑料袋的75%分位数.
【解】 (1)根据题意得,平均数为 =×(2×6+3×17+4×15+5×12)==3.66,中位数是4.
(2)因为50×75%=37.5,
所以这50户居民6月5日这一天丢弃旧塑料袋的75%分位数是4.
16.(本小题满分15分)
某化工厂三个车间男工、女工人数如下表:
项目 第一车间 第二车间 第三车间
女工人数 150 100 y
男工人数 200 x z
若按车间人数用分层随机抽样的方法抽取100名工人,则应在第一车间抽取35名工人,在第二车间抽取25名工人.
(1)求这三个车间的工人总数及x的值;
(2)若按工人性别用分层随机抽样的方法在第三车间抽取8名工人,其中有5名女工,求该化工厂这三个车间女工与男工的人数之比.
【解】 (1)设这三个车间的工人总数为n,
则=,
解得n=1 000.
由×100=25,得x=150.
(2)因为在第三车间抽取8名工人,其中有5名女工,所以y∶z=5∶(8-5),即3y=5z.
又由(1)易知y+z=400,所以y=250,z=150.
所以(150+100+250)∶(200+150+150)=1∶1.
所以该化工厂这三个车间女工与男工的人数之比为1∶1.
17.(本小题满分15分)
某果园试种了A,B两个品种的桃树各10棵,并在桃树成熟挂果后统计了这20棵桃树的产量如下表,记A,B两个品种各10棵产量的平均数分别为和,方差分别为和.
A/kg 60 50 45 60 70 80 80 80 85 90
B/kg 40 60 60 80 80 55 80 80 70 95
(1)求,,,;
(2)果园要大面积种植这两个品种的桃树中的一种,依据以上计算结果分析选种哪个品种更合适 并说明理由.
【解】 (1)=×(45+50+60+60+70+80+80+80+85+90)=70,
=×[(-25)2+(-20)2+2×(-10)2+02+3×102+152+202]=215,
=×(40+55+60+60+70+80+80+80+80+95)=70,=×[(-30)2+(-15)2+2×(-10)2+02+4×102+252)=235.
(2)由==70可得A,B两个品种的桃树平均产量相等,
又<,则A品种产量较稳定,故选择A品种.
18.(本小题满分17分)
某学校开展组织学生参加线上环保知识竞赛活动,现从中抽取200名学生,记录他们的首轮竞赛成绩并作出如图所示的频率分布直方图,根据图形,请回答下列问题:
(1)若从成绩低于60分的同学中按分层随机抽样的方法抽取5人成绩,求5人中成绩低于50分的人数;
(2)以样本估计总体,利用组中值估计该校学生首轮竞赛成绩的平均数;
(3)首轮竞赛成绩位列前10%的学生入围第二轮的复赛,请根据图中信息,估计入围复赛的成绩(记为k).
【解】 (1)由(0.005+0.01+0.015+0.015+0.025+a)×10=1,得a=0.03,因为0.01×10×200=20(人),
0.015×10×200=30(人),
所以成绩低于50分的抽取5×=2(人).
(2)平均数=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).
(3)因为成绩位于[90,100]的频率为0.005×10=0.05,成绩位于[80,90)的频率为0.025×10=
0.25,所以k∈[80,90),
则0.05+(90-k)×0.025=0.1,
解得k=88,即入围复赛的成绩为88分.
19.(本小题满分17分)
已知A,B两家公司的员工月均工资(单位:万元)情况分别如图①,图②所示.
(1)以每组数据的区间中点值为代表,根据图①估计A公司员工月均工资的平均数、中位数,你认为用哪个数据更能反映该公司普通员工的工资水平 请说明理由;
(2)某人拟到A,B两家公司中的一家应聘,以公司普通员工的工资水平作为决策依据,此人应该选哪个公司
【解】 (1)A公司员工月均工资的平均数为
0.3×0.21+0.5×0.29+0.7×0.27+0.9×0.21+29×0.02=1.166(万元).
由题图①可知A公司员工月均工资在0.6万元以下的比例为21%+29%=50%,所以A公司员工月均工资的中位数约为0.6万元.
用中位数更能反映该公司普通员工的工资水平,理由如下:
因为平均数受每一个数据的影响,越离群的数据对平均数的影响越大,该公司少数员工的月均工资很高,在这种情况下平均数并不能较好地反映普通员工的工资水平,而中位数不受少数极端数据的影响,可以较好地反映普通员工的工资水平.
(2)B公司员工月均工资的平均数为
(0.3×0.375+0.5×0.750+0.7×2.750+0.9×1.000+1.1×0.125)×0.2=0.69(万元).
由题图②知,B公司员工月均工资在0.6万元以下的频率为(0.375+0.75)×0.2=0.225,在0.8万元以下的频率为(0.375+0.75+2.75)×0.2=0.775.
设B公司员工月均工资的中位数为x万元,
则(x-0.6)×2.75=0.5-0.225,
得x=0.7.
此人应该选B公司应聘,理由如下:
B公司员工月均工资数据较为集中,月均工资的平均数和中位数均能反映该公司普通员工的平均工资水平,B公司员工月均工资平均数为0.69,中位数为0.7,大于A公司员工月均工资的中位数0.6,所以以公司普通员工的工资水平作为决策依据,此人应该选B公司应聘.
21世纪教育网(www.21cnjy.com)