第九章 9.1 9.1.1
A级——基础过关练
1.在“世界读书日”前夕,为了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析,在这个问题中,5 000名居民的阅读时间的全体是( )
A.总体 B.个体
C.样本量 D.从总体中抽取的一个样本
2.(2023年贵州模拟)从某班57名同学中选出4人参加户外活动,利用随机数表法抽取样本时,先将57名同学按01,02,…,57进行编号,然后从如下随机数表第一行的第7列和第8列数字开始往右依次选取两个数字,则选出的第3个同学的编号为( )
0347 4373 8636 9647 3661 4698 6371 6297
7424 6292 4281 1457 2042 5332 3732 1676
(注:表中的数据为随机数表第一行和第二行)
A.36 B.43
C.57 D.46
3.从一群玩游戏的小孩中随机抽出k人,一人分一个苹果,让他们返回继续游戏.过了一会儿,再从中任取m人,发现其中有n个小孩曾分过苹果,估计参加游戏的小孩的人数为( )
A. B.k+m-n
C. D.不能估计
4.(多选)(2023年南昌期末)某市有大、中、小型商店共1 500家,且这三种类型的商店的数量之比为1∶5∶9,现在要调查该市商店的每日零售额情况,从中随机抽取60家商店,则下列选项正确的有( )
A.1 500家商店是总体
B.样本量为60
C.小型商店有900家
D.被抽取的60家商店的零售额情况是所抽取的一个样本
5.已知m个数的平均数为a,n个数的平均数为b,用这m+n个数的平均数为( )
A. B.
C. D.
6.(多选)为了解参加运动会的2 000名运动员的年龄情况,从中抽取20名运动员的年龄进行统计分析.下列说法中正确的有( )
A.2 000名运动员的年龄是总体
B.每个运动员的年龄是个体
C.所抽取的20名运动员的年龄是一个样本
D.样本量为2 000
7.从全校2 000名小学女生中用随机数法抽取300名调查其身高,得到样本量的平均数为148.3 cm,则可以推测该校女生的身高( )
A.一定为148.3 cm B.高于148.3 cm
C.低于148.3 cm D.约为148.3 cm
8.用随机数表法从100名学生(男生25人)中抽选20人进行评教,某男学生被抽到的概率是__________.
9.为了考察某地6月份最高气温的情况,随机抽取了5天,所得数据约为29,29,31,30,31,则该地6月份最高气温的平均值约为________.
10.某校2023级高一年级有50位任课教师,为了调查老师的业余兴趣情况,打算抽取一个样本量为5的样本,问此样本若采用抽签法将如何获得?
B级——能力提升练
11.(多选)下列问题中,适合用简单随机抽样方法抽样的有( )
A.从某小组10名学生中,任意选取2人去打扫卫生
B.从10台冰箱中抽出3台进行质量检查
C.某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人,教育部门为了解在编人员对学校机构改革的意见,要从中抽取一个样本量为20的样本
D.某乡农田有:山地800公顷,丘陵1 200公顷,平地2 400公顷,洼地400公顷,现抽取农田48公顷估计全乡农田平均每公顷产量
12.某班30位同学,学号记为01,02,03,…,30.用如下的随机数表选取5组数作为参加某调研活动的同学学号,选取方式从第一行的第4列和第5列数字开始,从左到右依次选取两个,则选出的5个同学的学号分别是( )
随机数表
1425 9802 8767 9923 4565 1204 2169
0013 5131 4178 6203 8454 1790 2332
A.25,02,23,12,04 B.02,23,12,04,21
C.28,23,12,04,21 D.28,20,16,01,13
13.某学校抽取100位老师的年龄,得到如下数据:
年龄/岁 32 34 38 40 42 43 45 46 48
频数 2 4 20 20 26 10 8 6 4
则估计这100位老师的样本的平均年龄为__________岁.
14.一个布袋中有6个同样质地的小球,从中不放回地抽取3个小球,则某一特定小球被抽到的可能性是__________;第三次抽取时,剩余小球中的某一特定小球被抽到的可能性是__________.
15.为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,如何用简单随机抽样抽取样本?(下面抽取了第5行到9行的随机数表)
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78
87 35 20 96 43 84 26 34 91 64 84 42 17 53 31
57 24 55 06 88 77 04 74 47 67 21 76 33 50 25
83 92 12 06 76 63 01 63 78 59 16 95 55 67 19
98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
答案
1【答案】A
【解析】根据题意,结合总体、样本、个体、样本容量的定义可知,5 000名居民的阅读时间的全体是总体.
2【答案】D
【解析】根据题意,选出的第1个同学的编号为36,第2个同学的编号为47,第3个同学的编号为46.故选D.
3【答案】C
【解析】设参加游戏的小孩有x人,则=,x=.
4【答案】BCD
【解析】1 500家商店的每日零售额情况为总体,故A错误;从中随机抽取60家商店,样本量为60,故B正确;小型商店有1 500×=900(家),故C正确;由样本的定义可知,被抽取的60家商店的零售额情况是所抽取的一个样本,故D正确.故选BCD.
5【答案】D
【解析】m个数的平均数为a,n个数的平均数为b,则这m+n个数的平均数为=.故选D.
6【答案】ABC
【解析】样本量为20,D错误.A,B,C正确.
7【答案】D
【解析】由抽样调查的意义可以知道该校女生的身高约为148.3 cm.
8【答案】
【解析】简单随机抽样是等可能性抽样,每个个体被抽到的概率都是=.
9【答案】30
【解析】=30.
10解:首先,把50位任课教师编上号码:01,02,03,…,50.制作50个形状、大小均相同的号签(号签可以用小球、卡片、纸条等制作),然后将这些号签放在一个不透明的箱子里,进行均匀搅拌.抽签时,每次从中抽出1个号签,不放回,连续抽取5次,就得到一个容量为5的样本.
11【答案】AB
【解析】A,B的总体容量较少,用简单随机抽样法比较方便;C由于学校各类人员对这一问题的看法可能差异很大,不宜采用简单随机抽样法;D总体容量大,且各类田地的差别很大,也不宜采用简单随机抽样法.
12【答案】D
【解析】从给定的随机数表的第一行的第4列和第5列数字开始,从左到右依次选取两个数字,去掉其中重复及大于30的数,则选出的5个同学的学号是28,20,16,01,13,故选D.
13【答案】41.1
【解析】=(32×2+34×4+38×20+40×20+42×26+43×10+45×8+46×6+48×4)=41.1(岁),即这100位老师的样本的平均年龄约为41.1岁.
14【答案】
【解析】因为简单随机抽样时每个个体被抽到的可能性为=,所以某一特定小球被抽到的可能性是.因为此抽样是不放回抽样,所以第一次抽样时,每个小球被抽到的可能性均为;第二次抽取时,剩余5个小球中每个小球被抽到的可能性均为;第三次抽取时,剩余4个小球中每个小球被抽到的可能性均为.
15解:(方法一,抽签法)①将这40件产品编号为01,02,…,40;
②做好大小、形状相同的号签,分别写上这40个号码;
③将这些号签放在一个不透明的容器内,搅拌均匀;
④连续抽取10个号签;
⑤然后对这10个号签对应的产品检验.
(方法二,随机数法)①将40件产品编号,可以编为00,01,02,…,38,39;
②在随机数表中任选一个数作为开始,例如从第7行第9列的数8开始;
③从选定的数8开始向右读下去,得到一个两位数字号码88,由于88>39,将它去掉;继续向右读,得到77,由于77>39,将它去掉;继续向右读,得到04,将它取出;继续下去,又得到21,33,25,12,06,01,16,19,10,至此,10个样本号码已经取满,于是,所要抽取的样本号码是04,21,33,25,12,06,01,16,19,10.第九章 9.1 9.1.2、3
A级——基础过关练
1.为了研究近年来我国高等教育发展状况,小明需要获取近年来我国大学生入学人数的相关数据,他获取这些数据的途径最好是( )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
2.(多选)下面的抽样方法不是分层随机抽样的有( )
A.在某年邮票销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为3258的为三等奖
B.某车间包装一种产品,在自动包装的传送带上,每隔80分钟抽一包产品,称其质量是否合格
C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见
D.用抽签法从25件产品中选取6件进行质量检验
3.(2023年绵阳期末)现要完成下列2项抽样调查:①从12瓶饮料中抽取4瓶进行食品卫生检查;②某生活小区共有540名居民,其中年龄不超过30岁的有180人,年龄超过30岁不超过60岁的有270人,60岁以上的有90人.为了解居民对社区环境绿化方面的意见,拟抽取一个容量为30的样本.较为合理的抽样方法是( )
A.①抽签法;②分层随机抽样 B.①随机数法;②分层随机抽样
C.①随机数法;②抽签法 D.①抽签法;②随机数法
4.在30名运动员和6名教练员中用分层随机抽样的方法共抽取n人参加新闻发布会,若抽取的n人中教练员只有1人,则n=( )
A.5 B.6
C.7 D.8
5.一批灯泡400只,其中20 W,40 W,60 W的数目之比是4∶3∶1,现用分层随机抽样的方法产生一个样本量为40的样本,三种灯泡依次抽取的个数为( )
A.20,15,5 B.4,3,1
C.16,12,4 D.8,6,2
6.(2023年大荔期末)高一某班级有男生30人,女生20人,用分层随机抽样的方法从中抽取10人,抽出的男生的平均高为175 cm,抽出的女生的平均身高为165 cm,则估计该班级所有学生的平均身高为( )
A.172 cm B.171 cm
C.170 cm D.169 cm
7.某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为120份、180份、240份、x份.因调查需要,从回收的问卷中按年龄段分层随机抽取样本量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为( )
A.60 B.80
C.120 D.180
8.(2023年甘肃模拟)为庆祝中国共产党第二十次全国代表大会胜利闭幕,某高中学校在学生中开展了“学精神,悟思想,谈收获”的二十大精神宣讲主题活动.为了解该校学生参加主题活动的具体情况,校团委利用分层随机抽样的方法从三个年级中抽取了260人进行问卷调查,其中高一、高二年级各抽取了85人.已知该校高三年级共有720名学生,则该校共有学生__________人.
9.某分层随机抽样中,有关数据如下表所示:
层级 样本量 平均数
第1层 25 2
第2层 15 3
此样本的平均数为__________.
10.某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:
单位:人
部门 管理 技术开发 营销 生产 合计
老年 40 40 40 80 200
中年 80 120 160 240 600
青年 40 160 280 720 1 200
合计 160 320 480 1 040 2 000
(1)若要抽取40人调查身体状况,则应怎样抽样?
(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?
B级——能力提升练
11.研究下列问题:①某城市元旦前后的气温;②某种新型电器元件使用寿命的测定;③电视台想知道某一节目的收视率;④银行在收进储户现金时想知道有没有假钞.一般通过试验获取数据的是( )
A.①② B.③④
C.② D.④
12.(多选)(2023年杭州模拟)某运动队由足球运动员12人,篮球运动员18人,乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n的样本,若采用分层随机抽样的方法,且不用删除个体,则样本量n的取值不可能是( )
A.24 B.20
C.6 D.5
13.(2023年汉中期末)目前,全国多数省份已经开始了新高考改革.改革后,考生的高考总成绩由语文、数学、外语3门全国统一考试科目成绩和3门选择性科目成绩组成.某校高三年级选择“物理、化学、生物学”,“物理、化学、地理”和“历史、思想政治、地理”组合的学生人数分别是200,320,280.现采用分层随机抽样的方法从上述学生中选出40位学生进行调查,则从选择“物理、化学、生物学”组合的学生中应抽取的人数是__________.
14.高一和高二两个年级的同学参加了数学竞赛,高一年级有450人,高二年级有350人,通过分层随机抽样的方法抽取了160个样本,得到两个年级的竞赛成绩分别为80分和90分,则高一、高二抽取的样本量分别为__________;高一和高二数学竞赛的平均分约为__________分.
15.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的,且该组中青年人占50%,中年人占40%,老年人占10%.为了解各组不同年龄层次的职工对本次活动的满意程度,现用分层随机抽样的方法从参加活动的全体职工中抽取一个样本量为200的样本.试确定:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
答案
1【答案】D
【解析】因为近年来我国大学生入学人数的相关数据有所存储,所以小明获取这些数据的途径最好是通过查询获得数据.
2【答案】ABD 【解析】A,B不是分层随机抽样,因为不符合分层随机抽样的特点;C是分层随机抽样,因为总体的个体有明显的层次;D是简单随机抽样.故选ABD.
3【答案】A
【解析】①从12瓶饮料中抽取4瓶进行食品卫生检查,样本量小,宜用抽签法;②某生活小区共有540名居民,其中年龄不超过30岁的有180人,年龄超过30岁不超过60岁的有270人,60岁以上的有90人,具有明显的层次,宜用分层随机抽样.故选A.
4【答案】B
【解析】由题意可得=,解得n=6.故选B.
5【答案】A
【解析】40×=20,40×=15,40×=5.故选A.
6【答案】B
【解析】估计该班所有学生的平均身高为=171(cm).故选B.
7【答案】C
【解析】11~12岁回收180份,其中在11~12岁学生问卷中抽取60份,抽样比为.因为分层抽取样本的容量为300,故回收问卷总数为=900(份),故x=900-120-180-240=360(份),则在15~16岁学生中抽取的问卷有360×=120(份).
8【答案】2 080
【解析】由题意可得抽取的高三年级总人数为260-85-85=90,设该校共有x个学生,则抽取比例为,所以×720=90,解得x=2 080.
9【答案】2.375
【解析】=×2+×3=2.375.
10解:(1)按老年、中年、青年分层随机抽样,抽取比例为=,故老年人、中年人、青年人各抽取4人、12人、24人.
(2)按管理、技术开发、营销、生产进行分层,用分层随机抽样,抽取比例为=,故管理、技术开发、营销、生产各抽取2人、4人、6人、13人.
11【答案】C
【解析】①通过观察获取数据,③④通过调查获取数据,只有②通过试验获取数据.
12【答案】BD
【解析】总体容量12+18+6=36,则抽取的比例是,抽取的足球运动员人数为×12=,篮球运动员人数为×18=,乒乓球运动员人数为×6=,可知n应为6的倍数,36的约数,结合选项可知,样本量n的取值不可能是20,5.故选BD.
13【答案】10
【解析】由已知可得抽取比例为==,则从选择“物理、化学、生物学”组合的学生中应抽取的人数是200×=10.
14【答案】90,70 84.375
【解析】由题意可得高一年级抽取的样本量为×160=90,高二年级抽取的样本量为160-90=70.高一和高二数学竞赛的平均分约为=×80+×90=84.375(分).
15解:(1)设登山组人数为x,游泳组中,青年人、中年人、老年人所占比例分别为a,b,c,则有=47.5%,=10%,解得b=50%,c=10%.
故a=100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人所占比例分别为40%,50%,10%.
(2)游泳组中,抽取的青年人人数为200××40%=60;抽取的中年人人数为200××50%=75;抽取的老年人人数为200××10%=15.
即游泳组中,青年人、中年人、老年人分别应抽取的人数为60,75,15.第九章 9.2 9.2.1、2
A级——基础过关练
1.容量为100的样本数据,按从小到大的顺序分为8组,如下表所示:
组号 1 2 3 4 5 6 7 8
频数 10 13 x 14 15 13 12 9
第三组的频数和频率分别是( )
A.14和0.14 B.0.14和14
C.和0.14 D.和
2.(2023年唐山二模)某校高三年级一共有1 200 名同学参加数学测验,已知所有学生成绩的第80百分位数是103分,则数学成绩不小于103分的人数至少为( )
A.220 B.240
C.250 D.300
3.下面是两户居民家庭全年各项支出的统计图.
根据统计图,下列对两户教育支出占全年总支出的百分比作出的判断中,正确的是( )
A.甲户比乙户大 B.乙户比甲户大
C.甲、乙两户一样大 D.无法确定哪一户大
4.(2023年重庆月考)某中学举行了一次“网络信息安全”知识竞赛,将参赛的100名学生成绩分为6组,绘制了如图所示的频率分布直方图,则成绩在区间[75,80)内的学生有( )
A.15人 B.20人
C.25人 D.40人
5.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n的值为( )
A.20 B.27
C.6 D.60
6.(2023年杭州月考)互不相等的5个正整数从小到大排序为a1,a2,a3,a4,a5,若它们的和为18,且其70%分位数是30%分位数的2倍,则a5的值为( )
A.6 B.7
C.8 D.9
7.(多选)容量为100的样本,其数据分布在[2,18]内,将样本数据分为4组:[2,6),[6,10),[10,14),[14,18],得到频率分布直方图如图所示,则下列说法中正确的有( )
A.样本数据分布在[6,10)内的频率为0.32
B.样本数据分布在[10,14)内的频数为40
C.样本数据分布在[2,10)内的频数为40
D.估计总体数据大约有10%分布在[10,14)内
8.一组数据:6,5,3,10,2,7,5,1,6,5,则这组数据的75%分位数是__________.
9.(2023年辽宁期末)某学校为了调查学生生活方面的日支出情况,抽出了一个容量为n的样本,将数据按[20,30),[30,40),[40,50),[50,60),[60,70]分成5组,绘制成如图所示的频率分布直方图,则a=__________.要从日支出在[50,70]的样本中用分层抽样的方法抽取10人,则日支出在[60,70]中被抽取的人数为__________.
10.为了解学生参加体育活动的情况,某校对学生进行了随机抽样调查,其中一个问题是“你平均每天参加体育活动的时间是多少”,共有4个选项可供选择:A.1.5小时以上,B.1~1.5小时,C.0.5~1小时,D.0.5小时以下,下图是根据调查结果绘制的两幅不完整的统计图.
图1 图2
请你根据统计图中提供的信息解答以下问题:
(1)本次一共调查了多少名学生?
(2)在图1中将选项B对应的部分补充完整.
(3)若该校有3 000名学生,你估计全校有多少名学生平均每天参加体育活动的时间在0.5小时以下?
B级——能力提升练
11.某省普通高中学业水平考试成绩按人数所占比例依次由高到低分为A,B,C,D,E五个等级,A等级20%,B等级46%.其中E等级为不合格,原则上比例不超过5%.该省某校高二年级学生都参加学业水平考试,先从中随机抽取了部分学生的考试成绩进行统计,统计结果如图所示.若该校高二年级共有1 000名学生,则估计该年级拿到C级及以上级别的学生有( )
A.45人 B.660人
C.880人 D.900人
12.(多选)(2023年南宁二模)某商场一年中各月份的收入、支出情况的统计如图所示,则下列说法中正确的有( )
A.支出最高值与支出最低值的比是6∶1
B.利润最高的月份是2月份
C.第三季度平均收入为50万元
D.1~2月份的支出的变化率与10~11月份的支出的变化率相同
13.在样本的频率分布直方图中,共有8个小长方形,若最后一个小长方形的面积等于其他7个小长方形的面积和的,且样本量为200,则第8组的频数为__________.
14.(2023年淮南二模)近年来,我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.目前,国际上常用身体质量指数(BMI)来衡量人体胖瘦程度以及是否健康,其计算公式是BMI=.我国成人的BMI数值标准为:BMI<18.5为偏瘦,18.5≤BMI<24为正常,24≤BMI<28为偏胖,BMI≥28为肥胖.为了解某公司员工的身体肥胖情况,研究人员从公司员工体检数据中,利用分层随机抽样得到15名员工的BMI数据如下:23.5,21.6,30.6,22.1,23.7,20.6,25.5,23.9,20.8,21.5,21.8,18.2,25.2,21.5,19.1.则该组数据的第70百分位数为__________.
15.某城市100户居民的月平均用电量(单位:kw·h),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图所示.
(1)求直方图中x的值;
(2)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层随机抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?
答案
1【答案】A
【解析】x=100-(10+13+14+15+13+12+9)=14,第三组的频率为=0.14.
2【答案】B
【解析】因为1 200×80%=960(人),所以小于103分学生最多有960人,所以大于或等于103分的学生有1 200-960=240(人).故选B.
3【答案】B
【解析】条形统计图反映具体数值,则由图甲可知,甲户教育支出占全年总支出的百分比为1 200÷(1 200+2 000+1 200+1 600)=20%;从扇形统计图乙可知,乙户教育支出占全年总支出的百分比为25%.所以乙户比甲户大.
4【答案】B
【解析】∵(0.05+0.06+a+0.03+0.01+0.01)×5=1,∴a=0.04,∴成绩在区间[75,80)内的频率为0.04×5=0.2,∴成绩在区间[75,80)内的人数为0.2×100=20.故选B.
5【答案】D
【解析】∵n·=27,∴n=60.
6【答案】C
【解析】由它们的和为18,得a1+a2+a3+a4+a5=18,70%分位数为5×70%=3.5,∴数据a1,a2,a3,a4,a5的70%分位数是第4个数,为a4,30%分位数为5×30%=1.5,∴数据a1,a2,a3,a4,a5的30%分位数是第2个数,为a2.∵70%分位数是30%分位数的2倍,即a4=2a2,∴a1+3a2+a3+a5=18.∵a1,a2,a3,a4,a5是互不相等的5个正整数,且a1<a2<a3<a4<a5,故a1=1,a2=2,a3=3,a5=8.故选C.
7【答案】ABC
【解析】对于A,由题图可得,样本数据分布在[6,10)内的频率为0.08×4=0.32,所以A正确.对于B,由题图可得,样本数据分布在[10,14)内的频数为100×(0.1×4)=40,所以B正确.对于C,由题图可得,样本数据分布在[2,10)内的频数为100×(0.02+0.08)×4=40,所以C正确.对于D,由题图可估计,总体数据分布在[10,14)内的比例为0.1×4=0.4=40%,所以D错误.故选ABC.
8【答案】6
【解析】将这组数据从小到大排列为1,2,3,5,5,5,6,6,7,10,因为10×75%=7.5,所以这组数据的75%分位数是第8个数,即为6.
9【答案】0.005 2
【解析】(2×a+0.02+0.025+0.045)×10=1,解得a=0.005,因为[50,60)内和[60,70]内的样本个数比例为0.020∶0.005=4∶1,根据分层随机抽样可知,日支出在[60,70]中被抽取的人数为10×=2.
10解:(1)由图1知,选A的人数为60,而图2显示,选A的人数占总人数的30%,故本次调查的总人数为60÷30%=200.
(2)由图2知,选B的人数占总人数的50%,因此其人数为200×50%=100,图1补充如图所示:
(3)根据图2知,平均每天参加体育活动的时间在0.5小时以下的人数占统计人数的5%,以此估计得3 000×5%=150(人).
11【答案】D
【解析】根据图形,抽取的总人数10÷20%=50,其中C等级所占的百分比为12÷50=0.24,故1 000×(0.24+0.2+0.46)=1 000×0.9=900.故选D.
12【答案】ACD
【解析】由题图可知,支出最高值是60,支出最低值是10,则支出最高值与支出最低值的比是6∶1,故A正确;由题图可知,利润最高的月份是3月份和10月份,故B错误;由题图可知,第三季度平均收入为(40+50+60)=50,故C正确;由图可知,1~2月份的支出的变化率与10~11月份的支出的变化率均为30,故D正确.故选ACD.
13【答案】40
【解析】设最后一个小长方形的面积为x,则其他7个小长方形的面积和为4x,从而x+4x=1,所以x=0.2.故第8组的频数为200×0.2=40.
14【答案】23.7
【解析】15名员工的BMI数据由小到大排列如下:18.2,19.1,20.6,20.8,21.5,21.5,21.6,21.8,22.1,23.5,23.7,23.9,25.2,25.5,30.6,由15×70%=10.5,所以该组数据的第70百分位数是第11个数23.7.
15解:(1)x=[1-(0.002 0+0.009 5+0.011 0+0.012 5+0.005 0+0.002 5)×20]÷20=0.007 5.
(2)由频率分布直方图知,月平均用电量为[220,240),[240,260),[260,280),[280,300]的共有[(0.012 5+0.007 5+0.005 0+0.002 5)×20]×100=55(户),其中在[220,240)中的有0.012 5×20×100=25(户).
因此,在所抽取的11户居民中,月平均用电量在[220,240)的用户中应抽取×11=5(户).第九章章末检测
(时间:120分钟,满分150分)
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.(2023年银川二模)某单位职工老年人有60人,中年人有100人,青年人有40人,为了解职工的健康状况,用分层随机抽样的方法从中抽取10人进行体检,则应抽查的老年人的人数为( )
A.3 B.4
C.5 D.6
2.艺术体操比赛共有7位评委分别给出某选手的原始评分,评定该选手的成绩时,从7个原始评分中去掉1个最高分、1个最低分,得到5个有效评分.5个有效评分与7个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数
C.方差 D.极差
3.(2023年乐山期末)关于简单随机抽样,下列说法错误的是( )
A.它是从总体中逐个随机抽取
B.被抽取样本的总体可以是无限的
C.它是等可能抽取的
D.可以是放回抽样也可以是不放回抽样
4.(2023年江西模拟)已知一组数据3x1-1,3x2-1,…,3xn-1的方差为1,则数据x1,x2,…,xn的方差为( )
A.3 B.1
C. D.
5.某地区连续六天的最低气温(单位:℃)为9,8,7,6,5,7,则该六天最低气温的平均数和方差分别为( )
A.7和 B.8和
C.7和1 D.8和
6.假设从高一年级全体同学(500人)中随机抽出60人参加一项活动,利用随机数法抽取样本时,先将500名同学按000,001,…,499进行编号,如果从随机数表第8行第11列的数开始,按三位数连续向右读取,最先抽出的4名同学的号码是(下面摘取了此随机数表第7行和第8行)( )
84421 75331 57245 50688 77047 44767 21763 35025
63016 37859 16955 56719 98105 07175 12867 35807
A.455 068 047 447 B.169 105 071 286
C.050 358 074 439 D.447 176 335 025
7.(2023年商丘模拟)在某次演讲比赛中,由两个评委小组[分别为专业人士(记为小组A)和观众代表(记为小组B)]给参赛选手打分,根据两个评委小组给同一名选手打分的分值绘制成如图所示的折线图,则下列结论错误的是( )
A.小组A打分的分值的平均数为48
B.小组B打分的分值的中位数为66
C.小组A打分的分值的极差大于小组B打分的分值的极差
D.小组A打分的分值的方差小于小组B打分的分值的方差
8.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体均值为3,中位数为4
B.乙地:总体均值为1,总体方差大于0
C.丙地:中位数为2,众数为3
D.丁地:总体均值为2,总体方差为3
二、选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.(2023年张家口二模)中央广播电视总台《2023年春节联欢晚会》以温暖人心的精品节目、亮点满满的技术创新、美轮美奂的舞美效果为全球华人送上了一道红红火火的文化大餐.某机构随机调查了18位观众对2023年春晚节目的满意度评分情况,得到如下数据:a,60,70,70,72,73,74,74,75,76,77,79,80,83,85,87,93,100.若a恰好是这组数据的上四分位数,则a的值可能为( )
A.83 B.84
C.85 D.87
10.某学校为了调查学生在一周生活方面的支出情况,抽出了一个样本量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)元的学生有60人,则下列说法正确的有( )
A.样本中支出在[50,60)元的频率为0.03
B.样本中支出不少于40元的人数有132
C.n的值为200
D.若该校有2 000名学生,则一定有600人支出在[50,60)元
11.空气质量指数AQI是检测空气质量的重要参数,其数值越大说明空气污染状况越严重,空气质量越差.某地环保部门统计了该地区12月1日至12月24日连续24天的空气质量指数AQI,根据得到的数据绘制出如图所示的折线图,则下列说法正确的有( )
A.该地区在12月2日空气质量最好
B.该地区在12月24日空气质量最差
C.该地区从12月7日到12月12日AQI持续增大
D.该地区统计的这段时间内的空气质量随着日期有变差的趋势
12.(2023年茂名二模)小爱同学在一周内自测体温(单位:℃)依次为36.1,36.2,36.1,36.5,36.3,36.6,36.3,则该组数据的( )
A.平均数为36.3 B.方差为0.04
C.中位数为36.3 D.第80百分位数为36.55
三、填空题:本题共4小题,每小题5分,共20分.
13.为了解篮球爱好者小李的投篮命中率,下表记录了小李某月1号到5号每天打篮球的投篮命中率:
日期 1 2 3 4 5
命中率 0.4 0.5 0.6 0.6 0.4
小李这5天的平均投篮命中率为__________.
14.将样本量为100的某个样本数据拆分为10组,若前七组的频率之和为0.79,而剩下的三组的频率依次相差0.05,则剩下的三组中频率最高的一组的频率为__________.
15.(2023年重庆模拟)棉花的纤维长度是棉花质量的重要指标,在一批棉花中随机抽到50根棉花的纤维长度(单位:mm),按从小到大排序结果如下:
28 33 50 52 58 60 61 62 82 86
113 140 143 146 170 175 202 206 233 236
238 260 263 264 265 293 294 296 301 302
303 305 306 321 323 325 328 340 343 346
348 352 355 357 357 358 370 380 383 385
请你估算这批棉花的第90百分位数是________.
16.
从甲、乙两个厂家生产的同一种产品中各抽取8件产品,对其使用寿命(单位:年)跟踪调查结果如下:甲:3,4,5,6,8,8,8,10;乙:3,3,4,7,9,10,11,12.两个厂家在广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数:甲:__________,乙:__________.
四、解答题:本题共6小题,共70分,解答应写出文字说明、证明过程或演算步骤.
17.(10分)求下列数据的四分位数.
13,15,12,27,22,24,28,30,31,18,19,20.
18.(12分)某学校随机抽取部分新生调查其上学所需时间(单位:分),并将所得数据绘制成频率分布直方图(如图).已知上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].
(1)求直方图中x的值;
(2)如果上学所需时间在[60,100]的学生可申请在学校住宿,请估计该校800名新生中有多少名学生可以申请住宿.
19.(12分)某汽车制造厂分别从A,B两种轮胎中各随机抽取了8个进行测试,A,B两种轮胎行驶的最远里程数如下表所示:
单位:1 000 km
轮胎A 96 112 97 108 100 103 86 98
轮胎B 108 101 94 105 96 93 97 106
(1)分别计算A,B两种轮胎行驶的最远里程的平均数、中位数;
(2)分别计算A,B两种轮胎行驶的最远里程的极差、方差;
(3)根据以上数据,你认为哪种型号轮胎的性能更加稳定?
20.(12分)某电视台为宣传本省,随机对本省内15~65岁的人群抽取了n人,回答问题“本省内著名旅游景点有哪些”,统计结果如图表所示.
组号 分组 回答正确的人数 回答正确的人数占本组的频率
第1组 [15,25) a 0.5
第2组 [25,35) 18 x
第3组 [35,45) b 0.9
第4组 [45,55) 9 0.36
第5组 [55,65] 3 y
(1)分别求出a,b,x,y的值;
(2)从第2,3,4组回答正确的人中用分层随机抽样的方法抽取6人,求第2,3,4组每组各抽取的人数.
21.(12分)某种植园在芒果临近成熟时,随机从一些芒果树上摘下100个芒果,其质量分别在[100,150),[150,200),[200,250),[250,300),[300,350),[350,400](单位:克)中,经统计得频率分布直方图如图所示.
(1)经计算估计这组数据的中位数;
(2)某经销商来收购芒果,以各组数据的中间数代表这组数据的平均值,用样本估计总体,该种植园中还未摘下的芒果大约还有10 000个,经销商提出如下两种收购方案:
A方案是所有芒果以10元/千克收购;
B方案是对质量低于250克的芒果以2元/个收购,高于或等于250克的芒果以3元/个收购.
通过计算确定该种植园选择哪种方案获利更多.
22.(12分)(2023年黄山模拟)为了深入学习领会党的二十大精神,某高级中学全体学生参加了《二十大知识竞赛》,试卷满分为100分,所有学生成绩均在区间[40,100]分内,已知该校高一、高二、高三年级的学生人数分别为800,1 000,1 200,现用分层随机抽样的方法抽取了300名学生的答题成绩,按[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]进行分组,绘制了如下样本频率分布直方图.
(1)根据样本频率分布直方图估计该校全体学生成绩的众数、平均数、第71百分位数;
(2)已知所抽取各年级答题成绩的平均数、方差的数据如下表,且根据频率分布直方图估计出总成绩的方差为140,求高三年级学生成绩的平均数和高二年级学生成绩的方差s.
年级 样本平均数 样本方差
高一 60 75
高二 63 s
高三 55
答案
1【答案】A
【解析】用分层随机抽样的方法从中抽取10人进行体检,则应抽查的老年人的人数为10×=3.故选A.
2【答案】A
【解析】根据题意,从7个原始评分中去掉1个最高分、1个最低分,得到5个有效评分,与7个原始评分相比,不变的是中位数.故选A.
3【答案】B
【解析】简单随机抽样中被抽取样本的总体的个数有限,它是从总体中逐个随机抽取,样本抽取可以是放回抽样也可以是不放回抽样,简单随机抽样是一种等可能抽样,即每个个体被抽取的可能性相等,故A,C,D正确,B错误.故选B.
4【答案】D
【解析】设数据x1,x2,…,xn的方差为a,∵数据3x1-1,3x2-1,…,3xn-1的方差为1,∴9a=1,解得a=,∴数据x1,x2,…,xn的方差为.故选D.
5【答案】A
【解析】由题意,六天最低气温的平均数=×(9+8+7+6+5+7)=7,方差s2=×[(9-7)2+(8-7)2+(7-7)2+(6-7)2+(5-7)2+(7-7)2]=.故选A.
6【答案】B
【解析】由随机数表法的随机抽样的过程可知最先抽出的4名同学的号码为169,105,071,286.
7【答案】C
【解析】由图可知,小组A打分的平均数为×(43+47+46+48+50+47+54+50+47)=48,故A正确;将小组B打分从小到大排列为36,55,58,62,66,68,68,70,75,所以中位数为66,故B正确;小组A打分的分值的极差为54-43=11,小组B打分的分值的极差为75-36=39,故C错误;小组A打分的分值相对更集中,所以小组A打分的分值的方差小于小组B打分的分值的方差,故D正确.故选C.
8【答案】D
【解析】A中,中位数为4,可能存在大于7的数;同理,在C中也有可能;B中的总体方差大于0,叙述不明确,如果方差太大,也有可能存在大于7的数;D中,因为平均数为2,根据方差公式,如果有大于7的数存在,那么方差不可能为3.故选D.
9【答案】ABC
【解析】由于上四分位数即第75百分位数,于是18×75%=13.5,将这些数据按照从小到大排列后,第14个数为上四分位数,所以a应该是18个数据从小到大排列后的第14个数,显然a不是最小的数.而除去a后,从小到大排列得到的第13个数为83,第14个数为85,所以83≤a≤85.故选ABC.
10【答案】BC
【解析】A中,样本中支出在[50,60)元的频率为1-(0.01+0.024+0.036)×10=0.3,故A错误;B中,样本中支出不少于40元的人数有×60+60=132,故B正确;C中,n==200,故C正确;D中,若该校有2 000名学生,则可能有600人支出在[50,60)元,故D错误.故选BC.
11【答案】ABCD
【解析】12月2日空气质量指数最低,所以空气质量最好,A正确;12月24日空气质量指数最高,所以空气质量最差,B正确;12月7日到12月12日AQI在持续增大,所以C正确;在该地区统计这段时间内,空气质量指数AQI整体呈上升趋势,所以空气质量随着日期有变差的趋势,D正确.
12【答案】AC
【解析】根据题意,将7个数据从小到大排列:36.1,36.1,36.2,36.3,36.3,36.5,36.6.对于A,其平均数=(36.1+36.1+36.2+36.3+36.3+36.5+36.6)=36.3,A正确;对于B,其方差s2=(0.04+0.04+0.01+0+0+0.04+0.09)=,B错误;对于C,其中位数为第4个数据,即36.3,C正确;对于D,7×80%=5.6,则该组数据的第80百分位数为36.5,D错误.故选AC.
13【答案】0.5
【解析】小李这5天的平均投篮命中率
=(0.4+0.5+0.6+0.6+0.4)=0.5.
14【答案】0.12
【解析】设剩下的三组中频率最高的一组的频率为x,则另两组的频率分别为x-0.05,x-0.1.因为频率总和为1,所以0.79+(x-0.05)+(x-0.1)+x=1,解得x=0.12.
15【答案】357.5
【解析】50×0.9=45,第90百分位数为第45个数和第46个数的平均数,即为=357.5,故这批棉花的第90百分位数是357.5.
16【答案】众数 中位数
【解析】甲、乙两个厂家从不同角度描述了一组数据的特征.对甲分析,该组数据8出现的次数最多,故运用了众数;对乙分析,该组数据最中间的是7与9,故中位数是=8,故运用了中位数.
17解:把12个数据按从小到大的顺序排列如下:
12,13,15,18,19,20,22,24,27,28,30,31.
计算12×25%=3,12×50%=6,12×75%=9,
所以数据的第25百分位数为=16.5,
第50百分位数为=21,
第75百分位数为=27.5.
18解:(1)由直方图可得到20x+0.025×20+0.006 5×20+0.003×2×20=1,解得x=0.012 5.
(2)由直方图可知,新生上学所需时间在[60,100]的频率为0.003×2×20=0.12,所以800×0.12=96(名).
所以800名新生中估计有96名学生可以申请住宿.
19解:(1)A轮胎行驶的最远里程的平均数为×(96+112+97+108+100+103+86+98)=100,中位数为×(100+98)=99.
B轮胎行驶的最远里程的平均数为×(108+101+94+105+96+93+97+106)=100,中位数为×(101+97)=99.
(2)A轮胎行驶的最远里程的极差为112-86=26,方差为×[(-4)2+122+(-3)2+82+02+32+(-14)2+(-2)2]=55.25,
B轮胎行驶的最远里程的极差为108-93=15,方差为×[82+12+(-6)2+52+(-4)2+(-7)2+(-3)2+62]=29.5,
(3)根据以上数据,A轮胎和B轮胎的最远行驶里程的平均数相同,但B轮胎行驶的最远里程的极差和方差相对于A轮胎较小,所以B轮胎性能更加稳定.
20解:(1)由频率表中第4组数据可知第4组总人数为=25,
再结合频率分布直方图可知n==100,∴a=100×0.01×10×0.5=5,b=100×0.03×10×0.9=27,
x==0.9,y==0.2.
(2)第2,3,4组回答正确的共有54人,
∴利用分层随机抽样在54人中抽取6人,
每组分别抽取的人数为
第2组:×6=2,
第3组:×6=3,
第4组:×6=1.
21解:(1)这组数据的中位数是250+=268.75.
(2)A方案可获利(125×0.002+175×0.002+225×0.003+275×0.008+325×0.004+375×0.001)×50×10 000×10×0.001=25 750(元).
B方案可获利(0.002+0.002+0.003)×50×10 000×2+(0.008+0.004+0.001)×50×10 000×3=26 500(元).
由于25 750<26 500,因此该种植园选择B方案获利更多.
22解:(1)由频率分布直方图知,学生成绩在[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]内的频率分别为0.06,0.12,0.4,0.26,0.10,0.06,
学生成绩在[60,70)内的频率最大,
∴估计该校全体学生成绩的众数为65,
平均数=0.06×45+0.12×55+0.4×65+0.26×75+0.10×85+0.06×95=69,
第71百分位数m∈[70,80),
由0.06+0.12+0.4+(m-70)×0.026=0.71,解得m=75,
∴第71百分位数为75.
(2)由题意高一、高二、高三年级分别抽取了80人、100人、120人,
记样本中高一学生的成绩为ai(1≤i≤80,i∈N*),高二学生的成绩为bi(1≤i≤100,i∈N*),
高三学生的成绩为ci(1≤i≤120,i∈N*),
∴i=80×60,i=100×63,i=120,
∴==(80×60+100×63+120)=×60+×63+=69,
解得=80,
样本中三个年级成绩的方差s2=,
高一、高二、高三年级学生成绩的平均数分别为,,,方差分别为s,s,s,
则(ai-)2=80s,(ai-)=i-80=80-80=0,
(ai-)2=(ai-)+(-)]2=(ai-)2+2(ai-)(-)+(-)2]=(ai-)2+2(-)(ai-)+80(-)2=80[(-)2+s],
同理,(bi-)2=100[(-)2+s],(ci-)2=120[(-)2+s],
∴s2={80[(-)2+s]+100[(-)2+s]+120[(-)2+s]}
=[(-)2+s]+[(-)2+s]+[(-)2+s]
=[(60-69)2+75]+[(63-69)2+s]+[(80-69)2+55]
=+12+s+=124+s=140,
解得s=48,
∴高三年级学生成绩的平均数=80,和高二年级学生成绩的方差s=48.