中小学教育资源及组卷应用平台
第六章 统计
一、选择题
1.某校高一有20个班级,从每个班级中抽取一男一女两名学生进行调查,调查其对学校食堂的满意程度以及意见建议,在这个问题中样本容量是( )
A.2 B.40 C.20 D.不确定
2.下列调查方式中,不适合的是( )
A.调查全国中学生课外阅读情况,采用抽样调查
B.调查某人血液中白细胞含量是否正常,采用抽样调查
C.调查一批可乐的含糖量,采用普查
D.调查北京冬奥会男子500米短道速滑比赛参赛运动员兴奋剂的使用情况,采用普查
3.在某种疫苗试验初期,某居民区有5000人自愿接种了该种疫苗,其中60~70岁的老年人有800人,16~19岁的中学生有1200人,其余为符合接种条件的其他年龄段的居民.在一项接种疫苗的追踪调查中,要用分层随机抽样的方法从该居民区5000名接种疫苗的人群中抽取部分人作为样本进行追踪调查,已知老年人中抽取了16人,则从其余符合接种条件的其他年龄段的居民中抽取的人数为( )
A.16 B.24 C.30 D.60
4.某公司计划招收400名新员工,共报名了2000人,远超计划,故该公司采用笔试的方法进行选拔,并按照笔试成绩择优录取.现采用随机抽样的方法抽取200名报名者的笔试成绩,绘制频率分布直方图:
则录取分数线可估计为( )
A.77.5 B.78 C.80 D.82.5
5.某中学高一年级有400人,高二年级有320人,高三年级有280人,若用随机数法在该中学抽取容量为n的样本,每人被抽到的可能性都为0.2,则n等于( )
A.80 B.160 C.200 D.280
6.如表记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均数也相等,则x和y的值分别为( )
甲组 56 61 70 x 77
乙组 59 66 66 y 71
A.70,65 B.66,68 C.66,69 D.66,70
7.某地依托“互联网+智慧农业”推动精准扶贫.其地域内A山村的经济收入从2020年的8万元,增长到2021年的30万元,在实现华丽蜕变的过程中,村里的支柱性收入也在悄悄发生变化,具体如图所示,则下列结论正确的是( )
A.2021年外出务工收入比2020年外出务工收入减少
B.2021年的种植收入不足2020年种植收入的4倍
C.2021年其他收入比2020年全部收入总和高
D.2021年养殖收入与2020年其它收入持平
二、填空题
8.已知某地最近10天每天的最高气温(单位:℃)分别为10,9,13,15,17,16,18,17,20,12,则这10天平均气温的80%分位数为 ℃.
9.某汽车零件加工厂工作人员根据以往该厂的销售情况,绘制了该厂日销售量的频率分布直方图,如图所示,则图中组距为 .
10.某工厂生产了A、B、C三种不同型号的产品,数量之比为2:m:4,现采用分层抽样的方法抽取36个产品进行分析,已知A型号产品抽取了8个,则B型号产品被抽取的数量是 .
11.若某次调查样本数据为1,a,5,y,7,且a,y是方程x2﹣7x+12=0的两根,则这个样本的方差是 .
三、多选题
(多选)12.已知6个样本数据﹣5,0,1,1,3,5,则( )
A.这组数据的众数是1
B.这组数据的中位数是1
C.这组数据的极差是10
D.这组数据的平均数为1
(多选)13.某市7天国庆节假期期间的楼房认购量(单位:套)与成交量(单位:套)的折线图如图所示,则以下说法错误的是( )
A.成交量的中位数是16
B.日成交量超过日平均成交量的有1天
C.认购量越大,则成交量就越大
D.认购量的第一四分位数是100
(多选)14.《九章算术 衰分》中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱.欲以钱数多少衰出之,问各几何?”翻译为:“今有甲持钱560,乙持钱350,丙持钱180,甲、乙、丙三个人一起出关,关税共计100钱,要按各人持钱多少的比率交税,问三人各应付多少税?”下列说法正确的是( )
A.乙付的税钱应占总税钱的
B.乙、丙两人付的税钱不超过甲
C.丙应出的税钱约为32钱
D.甲、乙、丙三人出税钱的比例为56:35:18
(多选)15.有一种花种的花卉,其植株高度的一个随机样本的频率分布直方图如图所示,根据这个样本的频率分布直方图,下面结论中正确的是( )
A.这种花卉的植株高度超过50cm的估计占25%
B.这种花卉的植株高度低于30cm的估计占5%
C.这种花卉的植株高度的平均数估计超过45cm
D.这种花卉的植株高度的中位数估计不超过45cm
四、解答题
16.某中学举行了体育运动会,同时进行了全校精神文明擂台赛,为了解这次活动在全校师生中产生的影响,分别对全校500名教职工、3000名初中生、4000名高中生进行问卷调查.
(1)如果要在所有问卷中抽出120份用于评估,请说明如何抽取才能得到比较客观的评估结论,并写出抽样过程;
(2)要从3000份初中生的问卷中抽取一个容量为48的样本,如果采用简单随机抽样,应选什么方法?请说明理由.
17.某高校为了解新生的英语基础,在3250名大学一年级学生中进行英语水平测试.下面是随机抽取的46名参加测试学生的成绩(单位:分).
40 74 89 72 96 88 78 48 69 87
90 89 95 82 66 77 65 46 70 79
85 77 84 83 97 82 40 60 68 76
89 71 88 86 88 86 60 53 74 93
91 60 60 83 82 56
某学生在此次测试中的成绩为85分,试估计该学生的成绩在该校大学一年级学生中处于第几百分位数.
18.某企业在2021年的校园招聘考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如表所示.
组号 分组 频数 频率
第1组 [160,165) 5 0.05
第2组 [165,170) a 0.35
第3组 [170,175) 30 b
第4组 [175,180) 20 0.20
第5组 [180,185] c 0.10
合计 100 1.00
(1)求出频率分布表中a,b,c的值,然后画出频率分布直方图并估计100名学生笔试成绩的中位数(精确到0.1);
(2)该企业决定在第3、4、5组中用分层抽样的方法抽取6名学生,再从这6名学生中抽取2名进入第二轮面试,求抽取的2人中有第5组学生的概率.
19.某市共有户籍人口400万人,其中60岁及以上的老人约有66万人.为了了解老人们的健康状况,该市从老人中随机抽取600人并对他们进行健康评估,健康状况共分为不能自理、不健康尚能自理、基本健康、健康四个等级,并以80岁为界限分成两个群体进行统计,制成如图所示的统计图.
(1)若采用分层随机抽样的方法从样本中健康状况为基本健康的老人中抽取36人进一步了解他们的生活状况,则两个群体中各应抽取多少人?
(2)试估算该市80岁及以上老人占该市户籍人口的百分比.
20.某食品加工厂生产出A,B两种新配方饮料,现从生产的A,B这两种饮料产品中随机抽取数量相同的样本,测量这些产品的质量指标值,规定指标值小于85的为废品,在[85,115)内的为一等品,大于或等于115的为特等品.现把A,B两种配方饮料的质量指标值的测量数据整理如下表及图,其中B饮料的废品有6件.
A配方饮料质量指标值的频数分布表
质量指标值 [75,85) [85,95) [95,105) [105,115) [115,125)
频数 8 22 a 26 8
(1)求a,b的值;
(2)若从A,B两种饮料中选择一种进行推广,以两种饮料的质量指标值的均值为判断依据,试确定推广哪种比较好?(同一组中的数据用该组区间的中点值作代表)
21.某校高一年级有男生200人,女生100人.为了解该校全体高一学生的身高信息,按性别比例进行分层随机抽样,抽取总样本为30的样本,并观测样本的指标价(单位:cm),计算得男生样本的身高平均数为169,方差为39.下表是抽取的女生样本的数据;
抽取次序 1 2 3 4 5 6 7 8 9 10
身高 155 158 156 157 160 161 159 162 169 163
记抽取的第i个女生的身高为xi(i=1,2,3,…,10),样本平均数,方差s2=15.参考数据:,1592=25281,1692=28561.
(1)若用女生样本的身高频率分布情况代替该校高一女生总体的身高频率分布情况,试估计该校高一女生身高在[160,165]范围内的人数;
(2)用总样本的平均数和标准差分别估计该校高一学生总体身高的平均数μ和标准差σ,求μ,σ的值;
(3)如果女生样本数据在之外的数据称为离群值,试剔除离群值后,计算剩余女生样本身高的平均数与方差.
第六章 统计
参考答案与试题解析
一、选择题
1.某校高一有20个班级,从每个班级中抽取一男一女两名学生进行调查,调查其对学校食堂的满意程度以及意见建议,在这个问题中样本容量是( )
A.2 B.40 C.20 D.不确定
【答案】B
【分析】根据样本容量的定义求解.
【解答】解:某校高一有20个班级,从每个班级中抽取一男一女两名学生进行调查,共调查了20×2=40名学生,
所以在这个问题中,样本容量是40.
故选:B.
【点评】本题主要考查了样本容量的定义,属于基础题.
2.下列调查方式中,不适合的是( )
A.调查全国中学生课外阅读情况,采用抽样调查
B.调查某人血液中白细胞含量是否正常,采用抽样调查
C.调查一批可乐的含糖量,采用普查
D.调查北京冬奥会男子500米短道速滑比赛参赛运动员兴奋剂的使用情况,采用普查
【答案】C
【分析】根据抽样调查和普查的使用条件判断.
【解答】解:对于A项,调查全国中学生课外阅读情况,总体人数多,要节约调查成本并取得具有代表性的调查结论,应使用抽样调查,故A正确;
对于B项,调查某人血液中白细胞含量是否正常,应采用抽样调查,故B正确;
对于C项,调查一批可乐的含糖量,破坏性较强,应采用抽样调查,故C错误;
对于D项,调查北京冬奥会男子500米短道速滑比赛参赛运动员兴奋剂的使用情况,由于调查结果直接影响到比赛结果及个人荣誉,意义重大,应采用普查,故D正确.
故选:C.
【点评】本题主要考查了调查方法的选择,属于基础题.
3.在某种疫苗试验初期,某居民区有5000人自愿接种了该种疫苗,其中60~70岁的老年人有800人,16~19岁的中学生有1200人,其余为符合接种条件的其他年龄段的居民.在一项接种疫苗的追踪调查中,要用分层随机抽样的方法从该居民区5000名接种疫苗的人群中抽取部分人作为样本进行追踪调查,已知老年人中抽取了16人,则从其余符合接种条件的其他年龄段的居民中抽取的人数为( )
A.16 B.24 C.30 D.60
【答案】D
【分析】根据分层抽样的抽样比计算即可.
【解答】解:由题意,其余符合接种条件的其他年龄段的居民人数为5000﹣800﹣1200=3000,
则从其余符合接种条件的其他年龄段的居民中抽取的人数为3000×=60.
故选:D.
【点评】本题考查分层抽样的应用,属于基础题.
4.某公司计划招收400名新员工,共报名了2000人,远超计划,故该公司采用笔试的方法进行选拔,并按照笔试成绩择优录取.现采用随机抽样的方法抽取200名报名者的笔试成绩,绘制频率分布直方图:
则录取分数线可估计为( )
A.77.5 B.78 C.80 D.82.5
【答案】C
【分析】结合频率分布直方图,以及频率的定义,即可求解.
【解答】解:=0.2,
故80%的人不能录取,
由频率分布直方图可知,80分以上的频率为(0.015+0.005)×10=0.2,
80分以下的频率为1﹣0.2=0.8,
故录取分数线可估计为80.
故选:C.
【点评】本题主要考查频率分布直方图的应用,属于基础题.
5.某中学高一年级有400人,高二年级有320人,高三年级有280人,若用随机数法在该中学抽取容量为n的样本,每人被抽到的可能性都为0.2,则n等于( )
A.80 B.160 C.200 D.280
【答案】C
【分析】根据简单随机抽样概率求解方法,列出方程计算即可.
【解答】解:由题意可知,,
解得n=200.
故选:C.
【点评】本题主要考查了简单随机抽样的性质,属于基础题.
6.如表记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均数也相等,则x和y的值分别为( )
甲组 56 61 70 x 77
乙组 59 66 66 y 71
A.70,65 B.66,68 C.66,69 D.66,70
【答案】B
【分析】根据中位数和平均数的定义,列方程求出y和x即得答案.
【解答】解:由平均数相等,得56+61+70+x+77=59+66+66+y+71,
∴x﹣y=﹣2,结合选项可知,x=66,y=68.
此时,两组数据从小到大排列为:甲组:56,61,66,70,77;乙组:59,66,66,68,71.
中位数均为66,符合题意.
故选:B.
【点评】本题考查了平均数与中位数的定义与计算问题,是基础题.
7.某地依托“互联网+智慧农业”推动精准扶贫.其地域内A山村的经济收入从2020年的8万元,增长到2021年的30万元,在实现华丽蜕变的过程中,村里的支柱性收入也在悄悄发生变化,具体如图所示,则下列结论正确的是( )
A.2021年外出务工收入比2020年外出务工收入减少
B.2021年的种植收入不足2020年种植收入的4倍
C.2021年其他收入比2020年全部收入总和高
D.2021年养殖收入与2020年其它收入持平
【答案】C
【分析】根据两个扇形图逐项判断即可.
【解答】解:2020年与2021年A山村的经济收入如下:
种植收入 养殖收入 其他收入 外出务工收入
2020年 3.6万元 2.8万元 0.4万元 1.2万元
2021年 15万元 1.5万元 12万元 1.5万元
对于A,由上表可知,2021年外出务工收入比2020年外出务工收入增多,故A错误;
对于B,由上表可知,2020年种植收入的4倍为3.6×4=14.4<15,
所以2021年的种植收入多余2020年种植收入的4倍,故B错误;
对于C,由上表可知,2021年其他收入比2020年全部收入总和高,故C正确;
对于D,2021年养殖收入大于2020年其它收入,故D错误.
故选:C.
【点评】本题主要考查了统计图的应用,考查了学生的计算能力,属于基础题.
二、填空题
8.已知某地最近10天每天的最高气温(单位:℃)分别为10,9,13,15,17,16,18,17,20,12,则这10天平均气温的80%分位数为 17.5 ℃.
【答案】17.5.
【分析】根据百分位数的定义求解.
【解答】解:这10天的平均气温的数据按照从小到大的顺序排列为:
9,10,12,13,15,16,17,17,18,20,∵10×80%=8,
∴这10天平均气温的80%分位数为.
故答案为:17.5.
【点评】本题主要考查百分数的定义,属于基础题.
9.某汽车零件加工厂工作人员根据以往该厂的销售情况,绘制了该厂日销售量的频率分布直方图,如图所示,则图中组距为 2 .
【答案】2.
【分析】根据频率分布直方图中各个小矩形的面积之和为1求解.
【解答】解:设图中组距为a,
则(0.050+0.100+0.150+0.125+0.075)×a=1,
解得a=2,
即图中组距为2.
故答案为:2.
【点评】本题主要考查了频率分布直方图的性质,属于基础题.
10.某工厂生产了A、B、C三种不同型号的产品,数量之比为2:m:4,现采用分层抽样的方法抽取36个产品进行分析,已知A型号产品抽取了8个,则B型号产品被抽取的数量是 12 .
【答案】12.
【分析】先根据分层抽样的定义结合题意列方程求出m,再根据分层抽样的定义可求出结果.
【解答】解:由题意得,解得m=3,
所以B型号产品被抽取的数量为.
故答案为:12.
【点评】本题主要考查分层抽样的定义,属于基础题.
11.若某次调查样本数据为1,a,5,y,7,且a,y是方程x2﹣7x+12=0的两根,则这个样本的方差是 4 .
【答案】4.
【分析】先求出方程x2﹣7x+12=0的两个根,再结合方差的定义求解.
【解答】解:解方程x2﹣7x+12=0,得x=3或4,
不妨a=3,y=4,
则样本平均数是=4,
所以这个样本的方差是.
故答案为:4.
【点评】本题主要考查了方差的定义,属于基础题.
三、多选题
(多选)12.已知6个样本数据﹣5,0,1,1,3,5,则( )
A.这组数据的众数是1
B.这组数据的中位数是1
C.这组数据的极差是10
D.这组数据的平均数为1
【答案】ABC
【分析】根据已知条件,结合众数、中位数、极差的定义,平均数公式,即可求解.
【解答】解:6个样本数据﹣5,0,1,1,3,5,
众数、中位数均为1,故AB正确;
极差为5﹣(﹣5)=10,故C正确;
平均数为,故D错误.
故选:ABC.
【点评】本题主要考查众数、中位数、极差的定义,平均数公式,是基础题.
(多选)13.某市7天国庆节假期期间的楼房认购量(单位:套)与成交量(单位:套)的折线图如图所示,则以下说法错误的是( )
A.成交量的中位数是16
B.日成交量超过日平均成交量的有1天
C.认购量越大,则成交量就越大
D.认购量的第一四分位数是100
【答案】AC
【分析】根据统计图中数据,结合平均数、中位数和百分位数的定义求解.
【解答】解:对于A,由图中日成交量的数据从小到大排列为:8,13,16,26,32,38,166,
故可得中位数为26,可知选项A错误;
对于B,由图中折线可知:日平均成交量=,
日成交量超过日平均成交量的只有10月7日1天,故选项B正确;
对于C,由折线可知日认购量与日期不是正相关关系,故选项C错误;
对于D,日认购量的数据从小到大排列为:91,100,105,107,112,223,276,
因为25%×7=1.75,
所以认购量的第一四分位数是100,故D正确.
故选:AC.
【点评】本题主要考查了统计的整理分析,考查了平均数、中位数和百分位数的定义,属于基础题.
(多选)14.《九章算术 衰分》中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱.欲以钱数多少衰出之,问各几何?”翻译为:“今有甲持钱560,乙持钱350,丙持钱180,甲、乙、丙三个人一起出关,关税共计100钱,要按各人持钱多少的比率交税,问三人各应付多少税?”下列说法正确的是( )
A.乙付的税钱应占总税钱的
B.乙、丙两人付的税钱不超过甲
C.丙应出的税钱约为32钱
D.甲、乙、丙三人出税钱的比例为56:35:18
【答案】ABD
【分析】根据分层随机抽样的性质求解.
【解答】解:乙付的税钱应占总税钱的=,可知A正确;
乙、丙两人付的税钱占总税钱的 ,不超过甲,可知B正确;
丙应出的税钱为=(钱),可知C错误;
甲、乙、丙三人出税钱的比例为560:350:180=56:35:18,可知D正确.
故选:ABD.
【点评】本题主要考查了分层随机抽样的定义,属于基础题.
(多选)15.有一种花种的花卉,其植株高度的一个随机样本的频率分布直方图如图所示,根据这个样本的频率分布直方图,下面结论中正确的是( )
A.这种花卉的植株高度超过50cm的估计占25%
B.这种花卉的植株高度低于30cm的估计占5%
C.这种花卉的植株高度的平均数估计超过45cm
D.这种花卉的植株高度的中位数估计不超过45cm
【答案】ABC
【分析】根据频率分布直方图的性质,结合中位数和平均数的定义求解.
【解答】解:对于A,这种花卉的植株高度超过50cm的频率为10×(0.010+0.015)=0.25,
所以这种花卉的植株高度超过50cm的估计占25%,所以A项正确;
对于B,由频率分布直方图可知,这种花卉的植株高度低于30cm的频率为10×0.005=0.05,
所以这种花卉的植株高度低于30cm的估计占5%,所以B项正确;
对于C,这种花卉的植株高度的平均数约为25×10×0.005+35×10×0.010+45×10×0.060+55×10×0.015+65×10×0.010=46.5>45,所以C项正确;
对于D,因为10×0.005+10×0.010=0.15<0.5,10×0.005+10×0.010+10×0.060=0.75>0.5,
所以中位数在40﹣50之间,设中位数为x,
则10×0.005+10×0.010+(x﹣40)×0.060=0.5,
解得x≈45.8>45,所以D项错误.
故选:ABC.
【点评】本题主要考查了频率分布直方图的应用,属于基础题.
四、解答题
16.某中学举行了体育运动会,同时进行了全校精神文明擂台赛,为了解这次活动在全校师生中产生的影响,分别对全校500名教职工、3000名初中生、4000名高中生进行问卷调查.
(1)如果要在所有问卷中抽出120份用于评估,请说明如何抽取才能得到比较客观的评估结论,并写出抽样过程;
(2)要从3000份初中生的问卷中抽取一个容量为48的样本,如果采用简单随机抽样,应选什么方法?请说明理由.
【答案】(1)采取分层抽样的方法,过程见解析;
(2)采用随机数法,理由见解析.
【分析】(1)由于总体容量较大,这次活动对教职工、初中生、高中生产生的影响差异较大,故采取分层抽样的方法进行抽样,然后利用分层抽样的定义求解;
(2)根据抽签法和随机数法的特点选择.
【解答】解:(1)由于总体容量较大,这次活动对教职工、初中生、高中生产生的影响差异较大,
故采取分层抽样的方法进行抽样才能得到比较客观的评估,
因为样本容量为120,总体容量为500+3000+4000=7500,
则抽样比为,
所以500×=8,3000×=48,4000×=64,
所以在教职工、初中生、高中生中抽取的个体数分别是8,48,64,
分层抽样的步骤如下:①分层:分为教职工、初中生、高中生,共三层;
②确定每层抽取个体的个数:在教职工、初中生、高中生中抽取的个体数分别是8,48,64;
③各层分别按简单随机抽样的方法抽取样本;
④综合每层抽取的个体,组成样本,这样便完成了整个抽样过程,就能得到比较客观的评估结论;
(2)简单随机抽样有两种方法:抽签法和随机数法,若用抽签法,则要做3000个号签,费时费力,因此应采用随机数法抽取样本.
【点评】本题主要考查了简单随机抽样,属于基础题.
17.某高校为了解新生的英语基础,在3250名大学一年级学生中进行英语水平测试.下面是随机抽取的46名参加测试学生的成绩(单位:分).
40 74 89 72 96 88 78 48 69 87
90 89 95 82 66 77 65 46 70 79
85 77 84 83 97 82 40 60 68 76
89 71 88 86 88 86 60 53 74 93
91 60 60 83 82 56
某学生在此次测试中的成绩为85分,试估计该学生的成绩在该校大学一年级学生中处于第几百分位数.
【答案】第67百分位数.
【分析】将这组数据从小到大排列,再根据百分位数的定义计算即可.
【解答】解:由题意,46名学生的测试成绩从小到大排列为:
40,40,46,48,53,56,60,60,60,60,65,66,68,69,70,71,72,74,74,76,77,77,78,79,82,82,82,83,83,84,85,86,86,87,88,88,88,89,89,89,90,91,93,95,96,97,31,
85是第31个数据,≈0.674,
故该学生的成绩在该校大学一年级学生中处于第67百分位数.
【点评】本题考查百分位数的定义,是基础题.
18.某企业在2021年的校园招聘考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如表所示.
组号 分组 频数 频率
第1组 [160,165) 5 0.05
第2组 [165,170) a 0.35
第3组 [170,175) 30 b
第4组 [175,180) 20 0.20
第5组 [180,185] c 0.10
合计 100 1.00
(1)求出频率分布表中a,b,c的值,然后画出频率分布直方图并估计100名学生笔试成绩的中位数(精确到0.1);
(2)该企业决定在第3、4、5组中用分层抽样的方法抽取6名学生,再从这6名学生中抽取2名进入第二轮面试,求抽取的2人中有第5组学生的概率.
【答案】(1)a=35,b=0.30,c=10,画出频率分布直方图如下:
171.7.
(2).
【分析】(1)由频率分布表求出a,b,c,画出频率分布直方图,[160,170)的频率为0.4,[170,175)的频率为0.3,由此能估计这100名学生笔试成绩的中位数.
(2)用分层抽样抽取的6名学生中属于第3,4,5组的分别有3,2,1人,分别记为A,B,C,a,b,x,从中抽取2人,利用列举法能求出抽取的2人中有第5组学生的概率.
【解答】解:(1)由频率分布表得:
a=100×0.35=35,b==0.30,c=0.10×100=10,
画出频率分布直方图如下:
∴[160,170)的频率为(0.01+0.07)×5=0.4,
[170,175)的频率为0.06×5=0.3,
∴估计这100名学生笔试成绩的中位数为170+≈171.7.
(2)用分层抽样抽取的6名学生中属于第3,4,5组的分别有3,2,1人,
分别记为A,B,C,a,b,x,从中抽取2人,有15种结果,分别为:
(A,B),(A,C),(A,a),(A,b),(A,x),(B,C),(B,a),(B,b),(B,x),(C,a),(C,b),(C,x),(a,b),(a,x),(b,x),
抽取的2人中有第5组学生的结果有5个,分别为:
(A,x),(B,x),(C,x),(a,x),(b,x),
∴抽取的2人中有第5组学生的概率P==.
【点评】本题考查频率、频数、中位数、概率的求法,考查频率分布表、频率分布直方图、古典概型、列举法等基础知识,考查运算求解能力,是基础题.
19.某市共有户籍人口400万人,其中60岁及以上的老人约有66万人.为了了解老人们的健康状况,该市从老人中随机抽取600人并对他们进行健康评估,健康状况共分为不能自理、不健康尚能自理、基本健康、健康四个等级,并以80岁为界限分成两个群体进行统计,制成如图所示的统计图.
(1)若采用分层随机抽样的方法从样本中健康状况为基本健康的老人中抽取36人进一步了解他们的生活状况,则两个群体中各应抽取多少人?
(2)试估算该市80岁及以上老人占该市户籍人口的百分比.
【答案】(1)80岁以上应抽取6人,80岁以下应抽取30人;
(2)2.75%.
【分析】(1)根据题意,从统计图分析数据,结合分层抽样方法分析可得答案;
(2)根据题意,由统计图的数据计算样本中80岁以上人的占比,进而分析可得答案.
【解答】解:(1)根据题意,基本健康的老人中,80岁以上为有45人,80岁以下为有225人,
若从中抽取36人,80岁以上应抽取×36=6人,
80岁以下应抽取×36=30人,
故80岁以上应抽取6人,80岁以下应抽取30人;
(2)因为样本中80岁以上老人的占比==,
而其中60岁及以上的老人约有66万人,则其中80岁以上老人大约有66×=11万,
则可以估计,80岁及以上长者占全市户籍人口的比为=2.75%.
【点评】本题考查分层抽样的定义和方法,注意统计图的分析,属于基础题.
20.某食品加工厂生产出A,B两种新配方饮料,现从生产的A,B这两种饮料产品中随机抽取数量相同的样本,测量这些产品的质量指标值,规定指标值小于85的为废品,在[85,115)内的为一等品,大于或等于115的为特等品.现把A,B两种配方饮料的质量指标值的测量数据整理如下表及图,其中B饮料的废品有6件.
A配方饮料质量指标值的频数分布表
质量指标值 [75,85) [85,95) [95,105) [105,115) [115,125)
频数 8 22 a 26 8
(1)求a,b的值;
(2)若从A,B两种饮料中选择一种进行推广,以两种饮料的质量指标值的均值为判断依据,试确定推广哪种比较好?(同一组中的数据用该组区间的中点值作代表)
【答案】(1)a=36,b=0.026;
(2)选择B配方较好.
【分析】(1)计算B出配方的样本容量,结合A配方的频数分布表可求得a的值,利用频率分布直方图中所有矩形的面积之和为1可求得b的值;
(2)计算出A、B配方质量指标值的平均数和方差,比较大小后可得出结论.
【解答】解:(1)因为A、B配方样本容量相同,设为n,
由于B配方废品有6件,由B配方的频率分布直方图可知,废品的频率为,
解得n=100,
所以a=100﹣(8+22+26+8)=36,
由1=10×(0.006+0.008+b+0.038+0.022),
解得b=0.026;
(2)由(1)及A配方的频数分布表得,
A配方质量指标值的样本平均数为,
质量指标值的方差为=[(﹣20.4)2×8+(﹣10.4)2×22+02×36+10.42×26+20.42×8]=118.5024,
由B配方的频率分布直方图知,B配方质量指标值的样本平均数为:
,
质量指标值的样本方差为:
=(﹣20)2×0.06+(﹣10)2×0.26+02×0.38+102×0.22+202×0.08=104,
所以xA≈xB,,
即两种配方质量指标值的样本平均数大致相等,但A配方质量指标值的样本方差比B配方质量指标值的样本方差大,
所以选择B配方较好.
【点评】本题主要考查了频率分布直方图的应用,考查了平均数和方差的定义,属于中档题.
21.某校高一年级有男生200人,女生100人.为了解该校全体高一学生的身高信息,按性别比例进行分层随机抽样,抽取总样本为30的样本,并观测样本的指标价(单位:cm),计算得男生样本的身高平均数为169,方差为39.下表是抽取的女生样本的数据;
抽取次序 1 2 3 4 5 6 7 8 9 10
身高 155 158 156 157 160 161 159 162 169 163
记抽取的第i个女生的身高为xi(i=1,2,3,…,10),样本平均数,方差s2=15.参考数据:,1592=25281,1692=28561.
(1)若用女生样本的身高频率分布情况代替该校高一女生总体的身高频率分布情况,试估计该校高一女生身高在[160,165]范围内的人数;
(2)用总样本的平均数和标准差分别估计该校高一学生总体身高的平均数μ和标准差σ,求μ,σ的值;
(3)如果女生样本数据在之外的数据称为离群值,试剔除离群值后,计算剩余女生样本身高的平均数与方差.
【答案】见试题解答内容
【分析】(1)根据样本数据在[160,165]范围内的占比易求得女生总体在此范围内的人数;
(2)先利用加权平均数公式求出总样本的平均数,再利用混合样本的方差公式计算S2,最后对μ,σ进行估计即可;
(3)先判断169为离群值,再由平均数公式计算剩余9人的身高平均数,利用方差公式求出,再由公式
计算出方差.
【解答】解:(1)因女生样本中,身高在[160,165]范围内的占比为,
故该校高一女生身高在[160,165]范围内的人数估计为;
(2)记总样本的平均数为,标准差为S,
由题意,设男生样本(20人)的身高平均数为,方差为,女生样本(10人)的身高平均数为,方差,
则,
,
故;
(3)因,,则,
即,约为(152.2,167.8),
由样本数据知,,为离群值,
剔除169后,女生样本(9人)的身高平均数为:,
由,
可得,则剔除169后,女生样本(9人)的身高的方差为:.
【点评】本题主要考查了平均数和方差的定义,考查了学生的计算能力,属于中档题.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)