阶段质量评价(四) 统计
(时间:120分钟 满分:150分)
一、单项选择题(本大题共8小题,每小题5分,共40分.)
1.如图所示是一样本的频数分布直方图,则样本数据落在[15,20]内的频率为( )
A.0.2 B.0.3
C.0.4 D.0.5
2.从某地参加计算机水平测试的5 000名学生的成绩中抽取200名学生的成绩进行统计分析,在这个问题中,200名学生的成绩是( )
A.总体
B.个体
C.从总体中所取的一个样本
D.总体的容量
3.某校高三年级一共有1 200名同学参加数学测验,已知所有学生成绩的80%分位数是103分,则数学成绩不小于103分的人数至少为( )
A.220 B.240
C.250 D.300
4.总体由编号为01,02,…,39,40的40个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第2个个体的编号为( )
50 44 66 44 21 66 06 58 05 62 61 65 54 35 02 42 35 48 96 32 14 52 41 52 48
22 66 22 15 86 26 63 75 41 99 58 42 36 72 24 58 37 52 18 51 03 37 18 39 11
A.23 B.26
C.35 D.32
5.某学校为了了解本校教师课外阅读教育专著情况,对老年、中年、青年教师进行了分层随机抽样调查,已知老年、中年、青年教师分别有36人,48人,60人,若从中年教师中抽取了4人,则从青年教师中抽取的人数比从老年教师中抽取的人数多( )
A.5人 B.4人
C.3人 D.2人
6.为了了解市民的环保意识,某校高一(1)班50名学生在6月5日(世界环境日)这一天调查了各自家庭丢弃旧塑料袋的情况,得到有关数据如下表:
每户丢弃旧塑料袋个数 2 3 4 5
户数 6 16 15 13
则这50户居民每天丢弃旧塑料袋的标准差为( )
A.0.955 B.0.965
C.0.975 D.0.985
7.若某同学连续三次考试的名次(第一名为1,第二名为2,以此类推,且可以有名次并列的情况)均不超过3,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续三次考试的名次数据,推断一定不是尖子生的是( )
A.甲同学:平均数为2,中位数为2
B.乙同学:平均数为2,方差小于1
C.丙同学:中位数为2,众数为2
D.丁同学:众数为2,方差大于1
8.在测量某物理量的过程中,因仪器和观察的误差,使得n次测量分别得到x1,x2,…,xn共n个数据.我们规定所测量物理量的“最佳近似值”a应该满足与所有测量数据的差的平方和最小.由此规定,从这些数据得出的“最佳近似值”a应是( )
A. B.
C. D.
二、多项选择题(本大题共3小题,每小题6分,共18分.)
9.某校有5名同学参加国家安全知识竞赛,甲同学得知其他4名同学的成绩(单位:分)分别为80,84,86,90,若这5名同学的平均成绩为87,则下列结论正确的是( )
A.甲同学的竞赛成绩为95
B.这5名同学竞赛成绩的方差为26.4
C.这5名同学竞赛成绩的40%分位数是84
D.从这5名同学中任取一人,其竞赛成绩高于平均成绩的概率为0.6
10.在某区高三年级举行的一次质量检测中,某学科共有3 000人参加考试.为了解本次考试学生的成绩情况,从中抽取了部分学生的成绩(成绩均为正整数,满分为100分)作为样本进行统计,样本容量为n.按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出频率分布直方图(如图所示).已知成绩落在[50,60)内的人数为16,则下列结论错误的是( )
A.样本容量n=1 000
B.图中x=0.030
C.估计全体学生该学科成绩的平均分为70.6分
D.若将该学科成绩由高到低排序,前15%的学生该学科成绩为A等,则成绩为78分的学生该学科成绩肯定不是A等
11.甲、乙两城市某月初连续7天的日均气温数据如图所示,则在这7天中,下列判断正确的是( )
A.甲城市日均气温的中位数与平均数相等
B.甲城市的日均气温比乙城市的日均气温稳定
C.乙城市日均气温的极差为3 ℃
D.乙城市日均气温的众数为5 ℃
三、填空题(本大题共3小题,每小题5分,共15分.)
12.某高中共有学生1 200人,其中高一、高二、高三的学生人数比为6∶5∶4,现用分层随机抽样的方法从该校所有学生中抽取一个容量为60的样本,则高三年级应该抽取________人.
13.已知总体的各个个体的值由小到大依次为3,7,a,b,12,20,且总体的中位数为12,若要使该总体的标准差最小,则a=________.
14.中医药是包括汉族和少数民族医药在内的我国各民族医药的统称,是反映中华民族对生命、健康和疾病的认识,具有悠久历史传统和独特理论及技术方法的医药学体系,是中华民族的瑰宝.某科研机构研究发现,某品种中医药的药物成分甲的含量x(单位:克)与药物功效y(单位:药物单位)之间具有关系y=10x-x2.检测这种药品一个批次的6个样本,得到成分甲的平均值为6克,标准差为2,则估计这批中医药的药物功效的平均值为________.
四、解答题(本大题共5小题,共77分.)
15.(13分)某校高中年级举办科技节活动,开设A,B两个会场,其中每个同学只能去一个会场,且将25%的同学去A会场,剩下的同学去B会场.已知A,B会场学生年级及比例情况如下表所示:
高一 高二 高三
A会场 50% 40% 10%
B会场 40% 50% 10%
记该校高一、高二、高三年级学生所占总人数的比例分别为x,y,z,利用分层随机抽样的方法从参加活动的全体学生中抽取一个容量为n的样本.
(1)求x∶y∶z的值;
(2)若抽到的B会场的高二学生有75人,求n的值以及抽到的A会场高一、高二、高三年级的学生人数.
16.(15分)某风景区对5个旅游景点的门票价格进行了调整,据统计,调价前后各景点的游客人数基本不变.有关数据如表所示:
景点 A B C D E
原价(元) 10 10 15 20 25
现价(元) 5 5 15 25 30
日平均人数(千人) 1 1 2 3 2
(1)该风景区称调整前后这5个景点门票的平均收费不变,日平均总收入持平.问风景区是怎样计算的?
(2)另一方面,游客认为调整收费后风景区的日平均总收入相对于调价前,实际上增加了约9.4%,问游客是怎样计算的?
(3)你认为风景区和游客哪一个的说法较能反映整体实际?
17.(15分)某果园试种了 A,B两个品种的桃树各10棵,并在桃树成熟挂果后统计了这20棵桃树的产量如下表,记A,B两个品种各10棵产量的平均数分别为和,方差分别为s和s.
A(单位/kg) 60 50 40 60 70 80 70 30 50 90
B(单位/kg) 40 60 50 80 80 50 60 20 80 70
(1)分别求这两个品种产量的极差和中位数;
(2)求,,s,s;
(3)果园要大面积种植这两种桃树中的一种,依据以上计算结果分析选种哪个品种更合适,并说明理由.
18.(17分)为了深入学习领会党的二十大精神,某高级中学全体学生参加了《二十大知识竞赛》,试卷满分为100分,所有学生成绩均在区间[40,100]内,已知该校高一、高二、高三年级的学生人数分别为800,1 000,1 200,现用分层随机抽样的方法抽取了300名学生的答题成绩,绘制了如下样本频率分布直方图.
年级 样本平均数 样本方差
高一 60 75
高二 63 s
高三 55
(1)根据样本频率分布直方图估计该校全体学生成绩的众数、平均数、71%分位数;
(2)已知所抽取各年级答题成绩的平均数、方差的数据如表,且根据频率分布直方图估计出总成绩的方差为140,求高三年级学生成绩的平均数3和高二年级学生成绩的方差s.
19.(17分)随着电子商务的发展,人们的购物习惯也在改变,几乎所有的需求都可以通过网络购物来解决,同时顾客的评价也成为电子商铺的“生命线”.某电商平台从其旗下的所有电商中随机抽取了100个电子商铺,对电商的顾客评价,包括商品符合度、物流服务、服务态度、快递包装等方面进行调查,并把调查结果转化为顾客的评价指数x,得到了如下的频数分布表:
评价指数x [0,20) [20,40) [40,60) [60,80) [80,100]
频数 10 10 20 40 20
(1)画出这100个电子商铺顾客评价指数的频率分布直方图;
(2)求该电商平台旗下的所有电子商铺的顾客评价指数的平均数与标准差的估计值(同一组中的数据以该组区间的中点值为代表).(精确到0.1,参考数据:≈12.04)
阶段质量评价(四)
1.选B 由频数分布直方图知,样本数据落在[15,20]内的频率为=0.3.
2.选C 由题知,总体是5 000名学生的成绩,个体是每一名学生的成绩,200名学生的成绩是从总体中所取的一个样本,总体的容量为5 000.
3.选B 由1 200×80%=960人,所以小于103分的学生最多有960人,所以不小于103分的学生有1 200-960=240人.故选B.
4.选B 随机数表第1行的第6列和第7列数字为6,4,所以从这两个数字开始,由左向右依次选取两个数字如下:
64,42,16,60,65,80,56,26,16,55,43,50,24,…,
其中落在编号01,02,…,39,40内且不重复的有:16,26,24,…,
故第2个个体的编号为26.故选B.
5.选D 设从老年教师和青年教师中抽取的人数分别是x,y.因为老年、中年、青年教师分别有36人,48人,60人,且从中年教师中抽取了4人,所以==,解得x=3,y=5,则y-x=2.故选D.
6.选D 因为(2×6+3×16+4×15+5×13)÷50=3.7,所以s2=[6×(2-3.7)2+16×(3-3.7)2+15×(4-3.7)2+13×(5-3.7)2]÷50=(17.34+7.84+1.35+21.97)÷50=0.97,
所以s≈0.985.故选D.
7.选D 甲同学名次数据的平均数为2,说明名次之和为6,由中位数为2,
得出三次考试名次均不超过3,断定甲是尖子生;
乙同学名次数据的平均数为2,设乙同学3次考试的名次分别为x1,x2,x3,
由题意可得x1+x2+x3=6,则方差s2=[(x1-2)2+(x2-2)2+(x3-2)2]<1,
所以(x1-2)2+(x2-2)2+(x3-2)2=x+x+x-4(x1+x2+x3)+12=x+x+x-12<3,则x+x+x<15,所以x1,x2,x3均不超过3,
由此可断定乙是尖子生;
丙同学名次数据的中位数为2,众数为2,说明三次考试中至少有两次名次为2,故丙可能是尖子生;
丁同学名次数据的众数为2,说明某两次名次为2,设另一次名次为x,
平均数为,方差为s2=
=>1,
即(x-2)2>,所以x=1或2或3或4均不满足(x-2)2>,故x>4,断定丁一定不是尖子生.故选D.
8.选A 根据题意得
f(a)=(a-x1)2+(a-x2)2+…+(a-xn)2=na2-2(x1+x2+…+xn)a+(x+…+x),由于n>0,所以f(a)是关于a的二次函数,因此当a=,即a=时,f(a)取得最小值.故选A.
9.选AB 根据题意,依次分析选项.
对于A,设甲的成绩为x,
则有(x+80+84+86+90)=87,解得x=95,所以A正确;
对于B,甲的成绩为95,则这5名同学竞赛成绩的方差s2=[(95-87)2+(80-87)2 +(84-87)2+(86-87)2+(90-87)2]=26.4,所以B正确;
对于C,五人的成绩从小到大排列,依次为80,84,86,90,95,
因为5×40%=2,则其40%分位数是(84+86)=85,所以C错误;
对于D,五人的成绩中,高于平均分的有2人,
则从这5名同学中任取一人,其竞赛成绩高于平均成绩的概率为=0.4,所以D错误.故选A、B.
10.选AD 由频率分布直方图可得[50,60),[60,70),[70,80),[80,90),[90,100]的频率依次为0.16,10x,0.4,0.1,0.04.
对于A,∵成绩落在[50,60)内的人数为16,则=0.16,解得n=100,故A错误;
对于B,由频率可得0.16+10x+0.4+0.1+0.04=1,解得x=0.030,故B正确;
对于C,由选项B可得,成绩落在[60,70)的频率为10x=0.3,估计全体学生该学科成绩的平均分为0.16×55+0.3×65+0.4×75+0.1×85+0.04×95=70.6分,故C正确;
对于D,设该学科成绩为A等的最低分数为m,
∵[70,80),[80,90),[90,100]的频率依次为0.4,0.1,0.04,即0.1+0.04=0.14<0.15<0.54=0.4+0.1+0.04,
可知m∈[70,80),则(80-m)×0.04+0.1+0.04=0.15,解得m=79.75,
虽然79.75>78,但79.75是估计值,有可能出现没有学生考到79分的情况(学生成绩均为正整数),
这种情况下成绩为78分的学生该学科成绩可以是A等,D错误.
11.选AD 甲城市的气温分别为5 ℃,3 ℃,6 ℃,3 ℃,7 ℃,5 ℃,6 ℃;
乙城市的气温分别为5 ℃,4 ℃,6 ℃,5 ℃,5 ℃,4 ℃,6 ℃.
对于A,甲城市气温的中位数为5 ℃;平均数为×(5+3+6+3+7+5+6)=5 ℃,故A正确;
对于B,根据折线图知乙城市的日均气温更稳定,故B错误;
对于C,乙城市日均气温的极差为2 ℃,故C错误;
对于D,乙城市日均气温的众数为5 ℃,故D正确.故选A、D.
12.解析:设高一学生数为6k,则高二学生数为5k,高三学生数为4k,
所以该高中共有学生数为6k+5k+4k=15k=1 200,解得k=80,
用分层随机抽样的方法从该校所有学生中抽取一个容量为60的样本,抽样比为=,所以高三年级应该抽取4×80×=16人.
答案:16
13.解析:由中位数为12可得=12,
所以a+b=24,
所以总体的平均数为×(3+7+a+b+12+20)=11,
要使该总体的标准差最小,
需要(a-11)2+(b-11)2最小,
而(a-11)2+(b-11)2=(a-11)2+(24-a-11)2=2(a-12)2+2,
所以a=12时总体的标准差最小.
答案:12
14.解析:设这6个样本中成分甲的含量分别为x1,x2,x3,x4,x5,x6,平均值为,
则=×(x1+x2+x3+x4+x5+x6)=6,所以x1+x2+x3+x4+x5+x6=36,
所以(x1-)2+(x2-)2+…+(x6-)2=(x+x+…+x)-62=24,
所以x+x+…+x=240,
于是y1+y2+…+y6=10(x1+x2+…+x6)-(x+x+…+x)=120,
则=×(y1+y2+…+y6)=20.
答案:20
15.解:(1)设该校高一、高二、高三年级的人数分别为a,b,c,
则去A会场的学生总数为0.25(a+b+c),
去B会场的学生总数为0.75(a+b+c),
则对应人数如下表所示:
高一 高二 高三
A会场 0.125(a+b+c) 0.1(a+b+c) 0.025(a+b+c)
B会场 0.3(a+b+c) 0.375(a+b+c) 0.075(a+b+c)
则x∶y∶z=0.425(a+b+c)∶0.475(a+b+c)∶0.1(a+b+c)=17∶19∶4.
(2)依题意,n×0.75×0.5=75,解得n=200,
故抽到的A会场的学生总数为50人,
则高一年级人数为50×50%=25,
高二年级人数为50×40%=20,
高三年级人数为50×10%=5.
16.解:(1)风景区是这样计算的:
调整前的平均价格为×(10+10+15+20+25)=16(元),
调整后的平均价格为×(5+5+15+25+30)=16(元),
因为调整前后的平均价格不变,日平均人数不变,所以日平均总收入持平.
(2)游客是这样计算的:
原日平均总收入为10×1+10×1+15×2+20×3+25×2=160(千元),
现日平均总收入为5×1+5×1+15×2+25×3+30×2=175(千元),
所以调整收费后风景区的日平均总收入增加了×100%≈9.4%.
(3)游客的算法是正确的,游客的说法较能反映整体实际.
17.解:(1)这10棵A品种桃树的产量从小到大分别为30,40,50,50,60,60,70,70,80,90,
这10棵A品种桃树产量的极差为90-30=60,中位数为=60,
这10棵B品种桃树的产量从小到大分别为20,40,50,50,60,60,70,80,80,80,
这10棵B品种桃树产量的极差为80-20=60,中位数为=60.
(2)=×(30+40+50+50+60+60+70+70+80+90)=60,
=×(20+40+50+50+60+60+70+80+80+80)=59,
s=×[(30-60)2+(40-60)2+(50-60)2+(50-60)2+(60-60)2+(60-60)2+(70-60)2+(70-60)2+(80-60)2+(90-60)2]=300.
s=×[(20-59)2+(40-59)2+(50-59)2+(50-59)2+(60-59)2+(60-59)2+(70-59)2+(80-59)2+(80-59)2+(80-59)2]=349.
(3)由第一问可知这两个品种极差和中位数都相等, 由第二问可知>,s则A品种桃树平均产量高,波动小,
所以应该选种A品种桃树.
18.解:(1)由频率分布直方图知,学生成绩在[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]内的频率分别为
0.06,0.12,0.40,0.26,0.10,0.06,显然学生成绩在[60,70)内的频率最大,
所以估计该校全体学生成绩的众数为65;
平均数=0.06×45+0.12×55+0.40×65+0.26×75+0.10×85+0.06×95=69;
显然71%分位数m∈[70,80),由0.06+0.12+0.40+(m-70)×0.026=0.71,解得m=75,
所以71%分位数为75.
(2)显然样本中高一、高二、高三年级分别抽取了80人、100人、120人,
记样本中高一学生的成绩为ai(1≤i≤80,i∈N+),高二学生的成绩为bi(1≤i≤100,i∈N+),
高三学生的成绩为ci(1≤i≤120,i∈N+),
于是ai=80×60,bi=100×63,ci=1203,因此=(ai+bi+ci)=(80×60+100×63+1203)=69,解得3=80,样本中三个年级成绩的方差s2=[(ai-)2+(bi-)2+(ci-)2],
设高一、高二、高三年级学生成绩的平均数分别为1,2,3,方差分别为s,s,s,
则有(ai-1)2=80s, (ai-1)=ai-801=801-801=0,
(ai-)2=[(ai-1)+(1-)]2=[(ai-1)2+2(ai-1)(1-)+(1-)2]=(ai-1)2+2(1-) (ai-1)+80(1-)2=80[(1-)2+s],
同理(bi-)2=100[(2-)2+s],(ci-)2=120[(3-)2+s],
因此s2={80[(1-)2+s]+100·[(2-)2+s]+120[(3-)2+s]}
=[(1-)2+s]+[(2-)2+s]+[(3-)2+s]
=[(60-69)2+75]+[(63-69)2+s]+[(80-69)2+55]
=+12+s+=124+s=140,解得s=48,
所以估计高三年级学生成绩的平均数3=80,高二年级学生成绩的方差s=48.
19.解:(1)由题中数据可得,
评价指数x [0,20) [20,40) [40,60) [60,80) [80,100]
频数 10 10 20 40 20
频率 0.1 0.1 0.2 0.4 0.2
频率/组距 0.005 0.005 0.01 0.02 0.01
所以频率分布直方图如图.
(2)由题中数据可得,=(10×10+30×10+50×20+70×40+90×20)=60,
方差为s2=[(10-60)2×10+(30-60)2×10+(50-60)2×20+(70-60)2×40+(90-60)2×20]=580,
所以标准差s==2≈24.1.
1 / 6