第九章 统计
(时间:120分钟,满分150分)
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.某防疫站对学生进行身体健康调查,欲采用分层随机抽样的方法抽取样本.某中学共有学生2000名,从中抽取了一个样本量为200的样本,其中男生103名,则该中学共有女生为( )
A.1 030名 B.97名
C.950名 D.970名
【答案】D
【解析】由题意,知该中学共有女生2 000×=970(名).故选D.
2.艺术体操比赛共有7位评委分别给出某选手的原始评分,评定该选手的成绩时,从7个原始评分中去掉1个最高分、1个最低分,得到5个有效评分.5个有效评分与7个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数
C.方差 D.极差
【答案】A
【解析】根据题意,从7个原始评分中去掉1个最高分、1个最低分,得到5个有效评分,与7个原始评分相比,不变的是中位数.故选A.
3.对一个容量为N的总体抽取容量为n的样本,当选取抽签法抽样、随机数法抽样和分层随机抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( )
A.p1=p2<p3 B.p2=p3<p1
C.p1=p3<p2 D.p1=p2=p3
【答案】D
【解析】在抽签法抽样、随机数法抽样和分层随机抽样中,每个个体被抽中的概率均为,所以p1=p2=p3.故选D.
4.(2022年太原期中)在抽查产品尺寸的过程中,将其尺寸分成若干组,[a,b]是其中的一组.已知该组的频率为m,该组上的频率分布直方图的高为h,则|a-b|等于( )
A.mh B.
C. D.m+h
【答案】C
【解析】在频率分布直方图中小长方形的高等于,所以h=,|a-b|=.故选C.
5.某地区连续六天的最低气温(单位:℃)为:9,8,7,6,5,7,则该六天最低气温的平均数和方差分别为( )
A.7和 B.8和
C.7和1 D.8和
【答案】A
【解析】由题意,六天最低气温的平均数=×(9+8+7+6+5+7)=7,方差s2=×[(9-7)2+(8-7)2+(7-7)2+(6-7)2+(5-7)2+(7-7)2]=.故选A.
6.假设从高一年级全体同学(500人)中随机抽出60人参加一项活动,利用随机数法抽取样本时,先将500名同学按000,001,…,499进行编号,如果从随机数表第8行第11列的数开始,按三位数连续向右读取,最先抽出的4名同学的号码是(下面摘取了此随机数表第7行和第8行)( )
84421 75331 57245 50688 77047 44767 21763 35025
63016 37859 16955 56719 98105 07175 12867 35807
A.455 068 047 447 B.169 105 071 286
C.050 358 074 439 D.447 176 335 025
【答案】B
【解析】由随机数表法的随机抽样的过程可知最先抽出的4名同学的号码为169,105,071,286.
7.(2023年广州期末)某大桥桥隧全长55千米,大桥通行限速100 km/h.现对大桥某路段上汽车行驶速度进行抽样调查,画出频率分布直方图(如图).根据直方图估计在此路段上汽车行驶速度的众数和行驶速度超过90 km/h的频率分别为( )
A.85,0.25 B.87.5,0.25
C.87.5,0.35 D.90,0.35
【答案】C
【解析】由频率分布直方图估计在此路段上汽车行驶速度的众数为=87.5,行驶速度超过90 km/h的频率为(0.05+0.02)×5=0.35.故选C.
8.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体均值为3,中位数为4
B.乙地:总体均值为1,总体方差大于0
C.丙地:中位数为2,众数为3
D.丁地:总体均值为2,总体方差为3
【答案】D
【解析】A中,中位数为4,可能存在大于7的数;同理,在C中也有可能;B中的总体方差大于0,叙述不明确,如果方差太大,也有可能存在大于7的数;D中,因为平均数为2,根据方差公式,如果有大于7的数存在,那么方差不可能为3.故选D.
二、选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.下列叙述正确的是( )
A.极差与方差都反映了数据的集中程度
B.方差是没有单位的统计量
C.标准差比较小时,数据比较分散
D.只有两个数据时,极差是标准差的2倍
【答案】AD
【解析】由极差与方差的定义可知A正确;方差是有单位的,其单位是原始数据单位的平方,B错误;标准差较小时,数据比较集中,C错误;只有两个数据x1,x2时,极差等于|x2-x1|,平均数为,所以方差s2==(x1-x2)2,则标准差=|x2-x1|,D正确.故选AD.
10.某学校为了调查学生在一周生活方面的支出情况,抽出了一个样本量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)元的学生有60人,则下列说法正确的是( )
A.样本中支出在[50,60)元的频率为0.03
B.样本中支出不少于40元的人数有132
C.n的值为200
D.若该校有2 000名学生,则一定有600人支出在[50,60)元
【答案】BC
【解析】A中,样本中支出在[50,60)元的频率为1-(0.01+0.024+0.036)×10=0.3,故A错误;B中,样本中支出不少于40元的人数有×60+60=132,故B正确;C中,n==200,故C正确;D中,若该校有2 000名学生,则可能有600人支出在[50,60)元,故D错误.故选BC.
11.空气质量指数AQI是检测空气质量的重要参数,其数值越大说明空气污染状况越严重,空气质量越差.某地环保部门统计了该地区12月1日至12月24日连续24天的空气质量指数AQI,根据得到的数据绘制出如图所示的折线图,则下列说法正确的是( )
A.该地区在12月2日空气质量最好
B.该地区在12月24日空气质量最差
C.该地区从12月7日到12月12日AQI持续增大
D.该地区统计的这段时间内的空气质量随着日期有变差的趋势
【答案】ABCD
【解析】12月2日空气质量指数最低,所以空气质量最好,A正确;12月24日空气质量指数最高,所以空气质量最差,B正确;12月7日到12月12日AQI在持续增大,所以C正确;在该地区统计这段时间内,空气质量指数AQI整体呈上升趋势,所以空气质量随着日期有变差的趋势,D正确.
12.2021年是中国共产党成立100周年,社会各界以多种形式的庆祝活动送上祝福,其中,“快闪”因其独特新颖的传播方式吸引大众眼球.根据大数据,关注“快闪”系列活动的网民群体年龄比例构成,及男女比例构成如图所示,则下面相关结论中正确的是( )
A.35岁以下网民群体超过70%
B.男性网民人数多于女性网民人数
C.该网民群体年龄的中位数在15~25之间
D.25~35岁网民中的女性人数一定比35~45岁网民中的男性人数多
【答案】ABC
【解析】对于A,依题意可得,35岁以下网民群体所占比例为74%,正确;对于B,由男女比例构成图可得男性所占比例为55%,正确;对于C,因为15岁以下所占比例为23%,25岁以下所占比例为54%,故该网民群体年龄的中位数在15~25之间,正确;对于D,无法判断,错误.
三、填空题:本题共4小题,每小题5分,共20分.
13.为了解篮球爱好者小李的投篮命中率,下表记录了小李某月1号到5号每天打篮球的投篮命中率:
日期 1 2 3 4 5
命中率 0.4 0.5 0.6 0.6 0.4
小李这5天的平均投篮命中率为________.
【答案】0.5
【解析】小李这5天的平均投篮命中率=(0.4+0.5+0.6+0.6+0.4)=0.5.
14.将样本量为100的某个样本数据拆分为10组,若前七组的频率之和为0.79,而剩下的三组的频率依次相差0.05,则剩下的三组中频率最高的一组的频率为________.
【答案】0.12
【解析】设剩下的三组中频率最高的一组的频率为x,则另两组的频率分别为x-0.05,x-0.1.因为频率总和为1,所以0.79+(x-0.05)+(x-0.1)+x=1,解得x=0.12.
15.12,13,25,26,28,31,32,40的80%分位数为________.
【答案】32
【解析】因为8×80%=6.4,所以80%分位数为x7=32.
16.从甲、乙两个厂家生产的同一种产品中各抽取8件产品,对其使用寿命(单位:年)跟踪调查结果如下:甲:3,4,5,6,8,8,8,10;乙:3,3,4,7,9,10,11,12.两个厂家在广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数:甲:________,乙:________.
【答案】众数 中位数
【解析】甲、乙两个厂家从不同角度描述了一组数据的特征.对甲分析:该组数据8出现的次数最多,故运用了众数;对乙分析:该组数据最中间的是7与9,故中位数是=8,故运用了中位数.
四、解答题:本题共6小题,共70分,解答应写出文字说明、证明过程或演算步骤.
17.(10分)求下列数据的四分位数.
13,15,12,27,22,24,28,30,31,18,19,20.
解:把12个数据按从小到大的顺序排列如下:
12,13,15,18,19,20,22,24,27,28,30,31.
计算12×25%=3,12×50%=6,12×75%=9,
所以数据的第25百分位数为=16.5,
第50百分位数为=21,
第75百分位数为=27.5.
18.(12分)某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图).已知上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].
(1)求直方图中x的值;
(2)如果上学所需时间在[60,100]的学生可申请在学校住宿,请估计该校800名新生中有多少名学生可以申请住宿.
解:(1)由直方图可得到20x+0.025×20+0.006 5×20+0.003×2×20=1,解得x=0.012 5.
(2)由直方图可知,新生上学所需时间在[60,100]的频率为0.003×2×20=0.12,所以800×0.12=96(名).
所以800名新生中估计有96名学生可以申请住宿.
19.(12分)某汽车制造厂分别从A,B两种轮胎中各随机抽取了8个进行测试,A,B两种轮胎行驶的最远里程数如下表:
单位:1 000 km
轮胎A 96 112 97 108 100 103 86 98
轮胎B 108 101 94 105 96 93 97 106
(1)分别计算A,B两种轮胎行驶的最远里程的平均数、中位数;
(2)分别计算A,B两种轮胎行驶的最远里程的极差、方差;
(3)根据以上数据,你认为哪种型号轮胎的性能更加稳定?
解:(1)A轮胎行驶的最远里程的平均数为×(96+112+97+108+100+103+86+98)=100,中位数为×(100+98)=99.
B轮胎行驶的最远里程的平均数为×(108+101+94+105+96+93+97+106)=100,中位数为×(101+97)=99.
(2)A轮胎行驶的最远里程的极差为112-86=26,方差为×[(-4)2+122+(-3)2+82+02+32+(-14)2+(-2)2]=55.25,B轮胎行驶的最远里程的极差为108-93=15,方差为×[82+12+(-6)2+52+(-4)2+(-7)2+(-3)2+62]=29.5,
(3)根据以上数据,A轮胎和B轮胎的最远行驶里程的平均数相同,但B轮胎行驶的最远里程的极差和方差相对于A轮胎较小,所以B轮胎性能更加稳定.
20.(12分)(2023年达州期末)某电视台为宣传本省,随机对本省内15~65岁的人群抽取了n人,回答问题“本省内著名旅游景点有哪些”,统计结果如图表所示.
组号 分组 回答正确的人数 回答正确的人数占本组的频率
第1组 [15,25) a 0.5
第2组 [25,35) 18 x
第3组 [35,45) b 0.9
第4组 [45,55) 9 0.36
第5组 [55,65] 3 y
(1)分别求出a,b,x,y的值.
(2)从第2,3,4组回答正确的人中用分层随机抽样的方法抽取6人,求第2,3,4组每组各抽取多少人?
解:(1)由频率表中第4组数据可知第4组总人数为=25,
再结合频率分布直方图可知n==100,
∴a=100×0.01×10×0.5=5,
b=100×0.03×10×0.9=27,
x==0.9,y==0.2.
(2)第2,3,4组回答正确的共有54人,
∴利用分层随机抽样在54人中抽取6人,
每组分别抽取的人数为
第2组:×6=2,
第3组:×6=3,
第4组:×6=1.
21.(12分)(2023年福州模拟)某种植园在杧果临近成熟时,随机从一些杧果树上摘下100个杧果,其质量分别在[100,150),[150,200),[200,250),[250,300),[300,350),[350,400](单位:克)中,经统计得频率分布直方图如图所示.
(1)经计算估计这组数据的中位数;
(2)某经销商来收购杧果,以各组数据的中间数代表这组数据的平均值,用样本估计总体,该种植园中还未摘下的杧果大约还有10 000个,经销商提出如下两种收购方案:
A方案是所有杧果以10元/千克收购;
B方案是对质量低于250克的杧果以2元/个收购,高于或等于250克的杧果以3元/个收购.
通过计算确定该种植园选择哪种方案获利更多.
解:(1)这组数据的中位数是250+=268.75.
(2)A方案可获利(125×0.002+175×0.002+225×0.003+275×0.008+325×0.004+375×0.001)×50×10 000×10×0.001=25 750(元).
B方案可获利(0.002+0.002+0.003)×50×10 000×2+(0.008+0.004+0.001)×50×10 000×3=26 500(元).
由于25 750<26 500,因此该种植园选择B方案获利更多.
22.(12分)共享单车入驻泉州一周年以来,因其“绿色出行,低碳环保”的理念而备受人们的喜爱,值此周年之际,某机构为了了解共享单车使用者的年龄段、使用频率、满意度等三个方面的信息,在全市范围内发放5 000份调查问卷,回收到有效问卷3 125份,现从中随机抽取80份,分别对使用者的年龄段、26~35岁使用者的使用频率、26~35岁使用者的满意度进行汇总,得到如下三个表格:
表1
使用者年龄段 25岁以下 26~35岁 36~45岁 45岁以上
人数/人 20 40 10 10
表2
使用频率 0~6次/月 7~14次/月 15~22次/月 23~31次/月
人数/人 5 10 20 5
表3
满意度 非常满意(9~10) 满意(8~9) 一般(7~8) 不满意(6~7)
人数/人 15 10 10 5
(1)依据上述表格完成下列三个统计图形:
(2)某城区现有常住人口30万,请用样本估计总体的思想,试估计年龄在26~35岁之间,每月使用共享单车在7~14次的人数.
解:(1)
(2)由题中表1可知年龄在26~35岁之间的有40人,占总抽取人数的,所以30万人口中年龄在26~35岁之间的约有30×=15(万人).
由题中表2可知,年龄在26~35岁之间每月使用共享单车在7~14次之间的有10人,占总抽取人数的,所以年龄在26~35岁之间的15万人中,每月使用共享单车在7~14次之间的约有15×=3.75(万人).第九章 统计
(时间:120分钟,满分150分)
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.某防疫站对学生进行身体健康调查,欲采用分层随机抽样的方法抽取样本.某中学共有学生2000名,从中抽取了一个样本量为200的样本,其中男生103名,则该中学共有女生为( )
A.1 030名 B.97名
C.950名 D.970名
2.艺术体操比赛共有7位评委分别给出某选手的原始评分,评定该选手的成绩时,从7个原始评分中去掉1个最高分、1个最低分,得到5个有效评分.5个有效评分与7个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数
C.方差 D.极差
3.对一个容量为N的总体抽取容量为n的样本,当选取抽签法抽样、随机数法抽样和分层随机抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( )
A.p1=p2<p3 B.p2=p3<p1
C.p1=p3<p2 D.p1=p2=p3
4.(2022年太原期中)在抽查产品尺寸的过程中,将其尺寸分成若干组,[a,b]是其中的一组.已知该组的频率为m,该组上的频率分布直方图的高为h,则|a-b|等于( )
A.mh B.
C. D.m+h
5.某地区连续六天的最低气温(单位:℃)为:9,8,7,6,5,7,则该六天最低气温的平均数和方差分别为( )
A.7和 B.8和
C.7和1 D.8和
6.假设从高一年级全体同学(500人)中随机抽出60人参加一项活动,利用随机数法抽取样本时,先将500名同学按000,001,…,499进行编号,如果从随机数表第8行第11列的数开始,按三位数连续向右读取,最先抽出的4名同学的号码是(下面摘取了此随机数表第7行和第8行)( )
84421 75331 57245 50688 77047 44767 21763 35025
63016 37859 16955 56719 98105 07175 12867 35807
A.455 068 047 447 B.169 105 071 286
C.050 358 074 439 D.447 176 335 025
7.(2023年广州期末)某大桥桥隧全长55千米,大桥通行限速100 km/h.现对大桥某路段上汽车行驶速度进行抽样调查,画出频率分布直方图(如图).根据直方图估计在此路段上汽车行驶速度的众数和行驶速度超过90 km/h的频率分别为( )
A.85,0.25 B.87.5,0.25
C.87.5,0.35 D.90,0.35
8.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体均值为3,中位数为4
B.乙地:总体均值为1,总体方差大于0
C.丙地:中位数为2,众数为3
D.丁地:总体均值为2,总体方差为3
二、选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.下列叙述正确的是( )
A.极差与方差都反映了数据的集中程度
B.方差是没有单位的统计量
C.标准差比较小时,数据比较分散
D.只有两个数据时,极差是标准差的2倍
10.某学校为了调查学生在一周生活方面的支出情况,抽出了一个样本量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)元的学生有60人,则下列说法正确的是( )
A.样本中支出在[50,60)元的频率为0.03
B.样本中支出不少于40元的人数有132
C.n的值为200
D.若该校有2 000名学生,则一定有600人支出在[50,60)元
11.空气质量指数AQI是检测空气质量的重要参数,其数值越大说明空气污染状况越严重,空气质量越差.某地环保部门统计了该地区12月1日至12月24日连续24天的空气质量指数AQI,根据得到的数据绘制出如图所示的折线图,则下列说法正确的是( )
A.该地区在12月2日空气质量最好
B.该地区在12月24日空气质量最差
C.该地区从12月7日到12月12日AQI持续增大
D.该地区统计的这段时间内的空气质量随着日期有变差的趋势
12.2021年是中国共产党成立100周年,社会各界以多种形式的庆祝活动送上祝福,其中,“快闪”因其独特新颖的传播方式吸引大众眼球.根据大数据,关注“快闪”系列活动的网民群体年龄比例构成,及男女比例构成如图所示,则下面相关结论中正确的是( )
A.35岁以下网民群体超过70%
B.男性网民人数多于女性网民人数
C.该网民群体年龄的中位数在15~25之间
D.25~35岁网民中的女性人数一定比35~45岁网民中的男性人数多
三、填空题:本题共4小题,每小题5分,共20分.
13.为了解篮球爱好者小李的投篮命中率,下表记录了小李某月1号到5号每天打篮球的投篮命中率:
日期 1 2 3 4 5
命中率 0.4 0.5 0.6 0.6 0.4
小李这5天的平均投篮命中率为________.
14.将样本量为100的某个样本数据拆分为10组,若前七组的频率之和为0.79,而剩下的三组的频率依次相差0.05,则剩下的三组中频率最高的一组的频率为________.
15.12,13,25,26,28,31,32,40的80%分位数为________.
16.从甲、乙两个厂家生产的同一种产品中各抽取8件产品,对其使用寿命(单位:年)跟踪调查结果如下:甲:3,4,5,6,8,8,8,10;乙:3,3,4,7,9,10,11,12.两个厂家在广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数:甲:________,乙:________.
四、解答题:本题共6小题,共70分,解答应写出文字说明、证明过程或演算步骤.
17.(10分)求下列数据的四分位数.
13,15,12,27,22,24,28,30,31,18,19,20.
18.(12分)某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图).已知上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].
(1)求直方图中x的值;
(2)如果上学所需时间在[60,100]的学生可申请在学校住宿,请估计该校800名新生中有多少名学生可以申请住宿.
19.(12分)某汽车制造厂分别从A,B两种轮胎中各随机抽取了8个进行测试,A,B两种轮胎行驶的最远里程数如下表:
单位:1 000 km
轮胎A 96 112 97 108 100 103 86 98
轮胎B 108 101 94 105 96 93 97 106
(1)分别计算A,B两种轮胎行驶的最远里程的平均数、中位数;
(2)分别计算A,B两种轮胎行驶的最远里程的极差、方差;
(3)根据以上数据,你认为哪种型号轮胎的性能更加稳定?
20.(12分)(2023年达州期末)某电视台为宣传本省,随机对本省内15~65岁的人群抽取了n人,回答问题“本省内著名旅游景点有哪些”,统计结果如图表所示.
组号 分组 回答正确的人数 回答正确的人数占本组的频率
第1组 [15,25) a 0.5
第2组 [25,35) 18 x
第3组 [35,45) b 0.9
第4组 [45,55) 9 0.36
第5组 [55,65] 3 y
(1)分别求出a,b,x,y的值.
(2)从第2,3,4组回答正确的人中用分层随机抽样的方法抽取6人,求第2,3,4组每组各抽取多少人?
21.(12分)(2023年福州模拟)某种植园在杧果临近成熟时,随机从一些杧果树上摘下100个杧果,其质量分别在[100,150),[150,200),[200,250),[250,300),[300,350),[350,400](单位:克)中,经统计得频率分布直方图如图所示.
(1)经计算估计这组数据的中位数;
(2)某经销商来收购杧果,以各组数据的中间数代表这组数据的平均值,用样本估计总体,该种植园中还未摘下的杧果大约还有10 000个,经销商提出如下两种收购方案:
A方案是所有杧果以10元/千克收购;
B方案是对质量低于250克的杧果以2元/个收购,高于或等于250克的杧果以3元/个收购.
通过计算确定该种植园选择哪种方案获利更多.
22.(12分)共享单车入驻泉州一周年以来,因其“绿色出行,低碳环保”的理念而备受人们的喜爱,值此周年之际,某机构为了了解共享单车使用者的年龄段、使用频率、满意度等三个方面的信息,在全市范围内发放5 000份调查问卷,回收到有效问卷3 125份,现从中随机抽取80份,分别对使用者的年龄段、26~35岁使用者的使用频率、26~35岁使用者的满意度进行汇总,得到如下三个表格:
表1
使用者年龄段 25岁以下 26~35岁 36~45岁 45岁以上
人数/人 20 40 10 10
表2
使用频率 0~6次/月 7~14次/月 15~22次/月 23~31次/月
人数/人 5 10 20 5
表3
满意度 非常满意(9~10) 满意(8~9) 一般(7~8) 不满意(6~7)
人数/人 15 10 10 5
(1)依据上述表格完成下列三个统计图形:
(2)某城区现有常住人口30万,请用样本估计总体的思想,试估计年龄在26~35岁之间,每月使用共享单车在7~14次的人数.