高中数学人教A版(2019)必修二 第九章 统计测试卷
一、单选题
1.(2021高一上·玉林期中)新能源汽车产业是我国经济发展的重要支柱,为了了解新能源汽车的质量情况,有关部门分别随机抽查了 型新能源汽车与 型新能源汽车各10个品牌.得到相关指标的综合评价得分(百分制)的茎叶图如图所示,则从茎叶图可得出正确的信息为(80分及以上为优秀)( ).
① 型新能源汽车与 型汽车得分的优秀率相同.
② 型新能源汽车得分与 型新能源汽车得分的中位数相同.
③ 型新能源汽车得分的方差比 型新能源汽车得分的方差大.
④ 型新能源汽车得分与 型新能源汽车得分的平均分相同.
A.①② B.①③ C.②④ D.③④
【答案】B
【知识点】茎叶图;众数、中位数、平均数;极差、方差与标准差
【解析】【解答】① 型、 型汽车优秀均有3个品牌,即优秀率相同,正确;
② 型、 型汽车得分中位数分别为 、 ,故中位数不同,错误;
, , , ,
③由 ,正确;
④由 ,错误;
综上只有①③正确.
故答案为:B
【分析】根据题意由茎叶图中的数据,然后由平均数、中位数以及方差的个数,代入数值计算出结果,进行比较后,对选项逐一判断即可得出答案。
2.(2020高二下·三明期末)某中学共有学生2500人,其中男生1500人,为了解该校学生参加体育锻炼的时间,采用分层抽样的方法从该校全体学生中抽取一个容量为50的样本,则样本中女生的人数为( )
A.10 B.15 C.20 D.30
【答案】C
【知识点】分层抽样方法
【解析】【解答】因为共有学生2500人,其中男生1500人,
所以女生有1000人,
所以样本中女生的人数为 人
故答案为:C
【分析】根据题意由分层抽样的定义代入数值计算出结果即可。
3.(2018高二上·吉林期末)在某项体育比赛中,七位裁判为一选手打出的分数如下:90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )
A. , B. , C. , D. ,
【答案】B
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【解答】 , ,故选B.
【分析】应用平均数与方差公式计算即可。
4.(2021·自贡模拟)有专业机构认为某流感在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过15人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体均值为4,中位数为3
B.乙地:总体均值为5,总体方差为12
C.丙地:中位数为3,众数为2
D.丁地:总体均值为3,总体方差大于0
【答案】B
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【解答】解:对于A,均值为4,中位数为3,不能保证10个数据中每个数据都不超过15,
∴A不符合该标志;
对于B,均值为5,方差为12时,假设这10个数据分别是 ,
则有 ,
,
而 能成立,
没有矛盾,即所有数据不超过15,B符合该标志;
同理,对于C、D,都不能保证10个数据中每个数据不超过15,
∴C、D也不符合题意.
故答案为:B.
【分析】根据平均数,中位数,众数,方差可判断A错误,B正确,C错误,D错误。
5.(2021·兰州模拟)一组数据 的平均数为 ,现定义这组数据的平均差 .下图是甲、乙两组数据的频率分布折线图
根据折线图,判断甲、乙两组数据的平均差 的大小关系是( )
A. B. C. D.无法确定
【答案】C
【知识点】频率分布折线图、密度曲线;众数、中位数、平均数
【解析】【解答】由给定的平均差公式可知:数据越集中于平均值附近,平均差越小.
甲乙两图的纵坐标表示的为频率/组距,即指数据落在此处的概率,甲图中,不同组距区间的概率相差不大,即指数据较为均匀的分布在各区间,而乙图数据较为集中的分布在乙图最高处指代的区间,其他区间分布的比较少,故乙图平均差比较小.
故答案为:C
【分析】 根据题意分析平均差是表示一组数据离散程度的量,平均差越小,数据越集中,结合频率分布折线图得出结论.
6.(2019高二上·钦州期末)某中学共有1000名学生,其中高一年级350人,该校为了了解本校学生视力情况,用分层抽样的方法从该校学生中抽出一个容量为100的样本进行调查,则应从高一年级抽取的人数为( )
A.20 B.25 C.30 D.35
【答案】D
【知识点】分层抽样方法
【解析】【解答】高一年级抽取的人数为 ,
故答案为:D。
【分析】利用分层抽样的方法结合实际问题的已知条件求出应从高一年级抽取的人数。
7.(2021高二下·安徽月考)如图是某校调查高一年级文理分科男女生是否喜欢理科的等高条形图,阴影部分的高表示喜欢理科的频率.假设参加调查的男生有600人,女生有400人,现从所有喜欢理科的同学中按分层抽样的方式抽取48人,则抽取的女生人数为( )
A.8 B.12 C.16 D.24
【答案】B
【知识点】分层抽样方法
【解析】【解答】由图得喜欢理科的男生人数为 人,喜欢理科的女生 人,男女生人数之比为 ,所以从所有喜欢理科的同学中按分层抽样的方式抽取48人,则抽取的女生人数为 。
故答案为:B
【分析】利用某校调查高一年级文理分科男女生是否喜欢理科的等高条形图,阴影部分的高表示喜欢理科的频率结合频数等于频率乘以样本容量的公式,从而求出喜欢理科的男生人数和喜欢理科女生的人数,再利用分层抽样的方法,从而求出抽取的女生人数。
8.(2021高一下·徐州期末)近日,2021中国最具幸福感城市调查推选活动正式启动,在100个地级及以上候选城市名单中,徐州市入选."幸福感指数"是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高.现随机抽取20位徐州市居民,他们的幸福感指数见下表,则这组数据的80百分位数是( )
3 3 4 5 5 6 6 6 7 7
7 7 8 8 8 8 9 9 10 10
A.7.7 B.8 C.8.5 D.9
【答案】C
【知识点】众数、中位数、平均数
【解析】【解答】表格中的数据已按由小到大排列,而 ,从小到大开始,第16个数和第17个数的平均数为 ,
所以这组数据的80百分位数是8.5.
故答案为:C
【分析】 根据百分位数的定义,直接计算即可.
二、多选题
9.(2020高三上·湖南月考)某校对120名考生的数学竞赛成绩进行统计,分成[50,60),[60,70),[70,80),[80,90),[90,100]五组,得到如图所示频率分布直方图,则下列说法正确的是( )
A.
B.该校学生数学竞赛成绩落在 内的考生人数为24
C.该校学生数学竞赛成绩的中位数大于80
D.估计该校学生数学竞赛成绩的平均数落在 内
【答案】B,D
【知识点】频率分布直方图;众数、中位数、平均数
【解析】【解答】对于A,由频率分布直方图性质得: ,解得 ,A不符合题意;
对于B,由频率分布直方图得成绩落在 的概率为0.2,人数为 ,B符合题意;
对于C,由频率分布直方图得: 的频率为 , 的频率为 ,所以成绩的中位数位于 内,C不符合题意;
对于D,估计成绩的平均数为: 所以成绩的平均数落在 内,D符合题意.
故答案为:BD.
【分析】利用频率分布直方图各小组矩形的面积等于各小组的频率,再利用频率之和等于1,从而求出a的值;再利用频数等于频率乘以样本容量,从而求出该校学生数学竞赛成绩落在 内的考生人数; 利用频率分布直方图求中位数的公式求出该校学生数学竞赛成绩的中位数; 利用频率分布直方图求平均数公式估计出该校学生数学竞赛成绩的平均数,从而找出说法正确的选项。
10.(2021高一下·安吉期末)给出如下数据:第一组:3,11,5,13,7,2,6,8,9;第二组:12,20,14,22,16,11,15,17,18.则这两组数据的( )
A.平均数相等 B.中位数相等 C.极差相等 D.方差相等
【答案】C,D
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【解答】由题可得,第二组的每个数据都是第一组对应数据加上9得到,
因此可以判断第二组的平均数和中位数都比第一组多9,而极差和方差不变.
故答案为:CD.
【分析】利用已知条件结合平均数公式、中位数公式、极差公式和方差公式,从而找出正确的选项。
11.(2020高二上·建瓯月考)2020年春节前后,一场突如其来的新冠肺炎疫情在全国蔓延.疫情就是命令,防控就是责任.在党中央的坚强领导和统一指挥下,全国人民众志成城、团结一心,掀起了一场坚决打赢疫情防控阻击战的人民战争.下侧的图表展示了2月14日至29日全国新冠肺炎疫情变化情况,根据该折线图,下列结论正确的是( )
A.16天中每日新增确诊病例数量在下降且19日的降幅最大
B.16天中每日新增确诊病例的中位数小于新增疑似病例的中位数
C.16天中新增确诊、新增疑似、新增治愈病例的极差均大于2000
D.21日至29日每日新增治愈病例数量均大于新增确诊与新增疑似病例之和
【答案】B,C,D
【知识点】频率分布折线图、密度曲线;众数、中位数、平均数;极差、方差与标准差
【解析】【解答】20日新增确诊病例数量比19日多,A不符合题意;
新增确诊病例的中位数小于新增疑似病例的中位数在21、22日左右,比较可得B符合题意;
新增确诊极差 、新增疑似极差 、新增治愈病例的极差 ,均大于2000,C符合题意;
21日至29日每日新增治愈病例数量均大于新增确诊与新增疑似病例之和,D符合题意.
故答案为:BCD.
【分析】根据折线图,中位数、极差的概念,判断各选项.
12.(2021高一下·青岛期中)关于一组样本数据的平均数、中位数、频率分布直方图和方差,下列说法正确的是( )
A.改变其中一个数据,平均数和中位数都会发生改变
B.频率分布直方图中,中位数左边和右边的直方图的面积应该相等
C.若数据的频率分布直方图为单峰不对称,且在左边“拖尾”,则平均数小于中位数
D.样本数据的方差越小,说明样本数据的离散程度越小
【答案】B,C,D
【知识点】众数、中位数、平均数;用样本的频率分布估计总体分布
【解析】【解答】对于A:例如数据1,3,5,将数据改成2,3,5,数据的中位数未改变,仍为3,A不符合题意;
对于B:根据频率分布直方图中,中位数的求法,可得B符合题意;
对于C:根据频率直方图可得,左边“拖尾”,且不对称,则平均数变小,中位数变大,所以平均数小于中位数,C符合题意;
对于D:方差越小,数据越稳定,离散程度越小,D符合题意.
故答案为:BCD
【分析】对于A,当改变的数,不影响原来中位数的位置时,中位数是不变的,所以A错,
对于B,C,D,由相关定义知,BCD都是正确的。
三、填空题
13.(2022·漳州模拟)2021年电影《长津湖》累计票房逾57亿,该片点燃了每个人心中对英雄的崇敬之情,也更加显示出如今和平生活的来之不易.某影院记录了观看此片的70位观众的年龄,其中年龄位于区间的有10位,位于区间的有20位,位于区间的有25位,位于区间的有15位,则这70位观众年龄的众数的估计值为
【答案】35
【知识点】众数、中位数、平均数
【解析】【解答】由于25>20>15>10,故众数位于区间
,所以众数的估计值为
.
故答案为:35
【分析】从人数可以看出众数位于区间 ,从而求出众数的估计值.
14.(2018高二下·泰州月考)某校高二年级1000名学生中,血型为 型的有400人, 型的有250人, 型的有250人, 型的有100人.为了研究血型与色弱之向的关系,要从中抽取1个容量为100的样本,则应从 型血的学生中抽取 人.
【答案】40
【知识点】分层抽样方法
【解析】【解答】解:由题意可得应按照分层抽样的方法抽取样本,
且抽样比为 ,
所以应从 型血的学生中抽取的人数为 人.
【分析】利用分层抽样法各层的抽样比相等,即可求出从 O 型血的学生中抽取的人数.
15.(2020·江苏模拟)从2021年起,江苏考生的高考成绩由语文、数学、外语3门统一高考成绩和考生选考的3门普通高中学业水平考试等级性考试科目成绩构成。等级性考试成绩位次由高到低分为A、B、C、D、E,各等级人数所占比例依次为:A等级15%,B等级40%,C等级30%,D等级14%,E等级1%。现采用分层抽样的方法,从参加物理等级性考试的学生中抽取500人作为样本,则该样本中获得B或C等级的学生人数为 。
【答案】350
【知识点】分层抽样方法
【解析】【解答】设该样本中获得B或C等级的学生人数为x,则 ,所以x=350。
【分析】利用已知条件结合分层抽样的方法,从而求出该样本中获得B或C等级的学生人数。
16.(2021高一下·台州期末)某小区12户居民四月份月用水呈(单位:t)分别为:
则所给数据的第75百分位数是 .
【答案】14.4
【知识点】众数、中位数、平均数
【解析】【解答】解:将12个数据按照从小到大的顺序排列:
3.5 4.9 5.4 6.8 7.1 7.7 10.5 11.1 13.6 15.2 16.8 20.5
,所以第75百分位数是 .
故答案为:14.4.
【分析】 先把数据从小到大排列,然后根据百分位数的计算公式求解即可.
四、解答题
17.(2018高一下·蚌埠期末)某校高一年级学生全部参加了体育科目的达标测试,现从中随机抽取40名学生的测试成绩,整理数据并按分数段 , , , , , 进行分组.已知测试分数均为整数,现用每组区间的中点值代替该组中的每个数据,则得到体育成绩的折线图如下:
(1)若体育成绩大于或等于70分的学生为“体育良好”,已知该校高一年级有1000名学生,试估计该校高一年级学生“体育良好”的人数;
(2)用样本估计总体的思想,试估计该校高一年级学生达标测试的平均分;
(3)假设甲、乙、丙三人的体育成绩分别为 ,且 , , ,当三人的体育成绩方差 最小时,写出 的所有可能取值(不要求证明)
【答案】(1)解:由图可知,抽取的40人中,“体育良好”的有30人,
所以估计该校高一年级“体育良好”的人数为 人
(2)解: ,
估计该校高一年级学生达标测试的平均分为77.25
(3)解:当数据 的方差最小时, ,
或 .
【知识点】众数、中位数、平均数;概率的应用
【解析】【分析】(1)体育良好人数等于总人数乘上抽取体育人数占抽取人数的比例。
(2)平均分等于分数段的中间数乘上对应频率求得。
(3)直接写出符合要求答案。
18.(2021高一下·孝感期末)一家保险公司决定对推销员实行月标管理,按以往月销售额(单位:千元)把推销员分为 、 、 三个层次,各层次人数如下:
月销售额
人数 150 250 100
(1)为了了解推销员对目标设定的意见,决定从 、 、 三个层次中采取比例分配的分层随机抽样抽取30人进行座谈,请计算 、 、 三个层次各应抽取多少人?
(2)确定的销售日标是否合适,直接影响到公司的经济效益,如果目标定得过高,多数推销员完不成任务,会使推销员失去信心;如果目标定得太低,将不利于挖掘推销员的工作潜力.现已知按上面的方法抽取了部分推销员的月销售额(单位:千元):
14.2 15.8
17.7 19.2 22.4
18.2 16.4 21.8
15.6 24.6
23.2 19.8
12.8 13.5 16.3
11.5 13.6 14.9
15.7 16.2
17.0 17.2
17.8 18.0 18.4
20.5 21.5 22.1
24.0 24.8
公司为了使75%的推销员能够完成销售目标,根据这组样本数据,应将销售目标定为多少比较合理?
【答案】(1)解:根据表中数据可得,三层共有 人,抽样比为 ,
故应该从 层抽取 人;
从 层抽取 人;
从 层抽取 人.
(2)将30个数据按照从小到大的顺序进行排序,可得:
11.5,12.8,13.5,13.6,14.2,14.9,15.6,15.7,15.8,16.2,
16.3,16.4,17.0,17.2,17.7,17.8,18.0,18.2,18.4,19.2,
19.8,20.5,21.5,21.8,22.1,22.4,23.2,24.0,24.6,24.8,
为使得75%的销售员完成目标,则没有完成目标的员工占25%,只需求出第25百分位数即可.
由 ,可知样本数据的第25百分位数为第8项数据,即为15.7.
所以应该将销售目标定位157000元比较合理.
【知识点】简单随机抽样
【解析】【分析】 (1)根据表中数据求出抽样比,即可据此求得每层抽取的人数;
(2)将数据从小到大排序,求得第25百分位数即可.
19.(2022高一下·焦作期末)为了回馈消费者,某商场准备在假期举行优惠活动,据统计,消费者在该商场的消费金额都不超过800元,活动策划人员准备了两种优惠方案.
方案一:消费金额满300元减50元,满600元减120元,只取最高优惠,不重复减免;
方案二:消费金额满400元享受8折优惠.
活动策划人员从电脑中存储的最近的消费记录中随机抽取了100位消费者的消费金额(单位:元),整理得到如下频数分布表:
消费金额(元)
频数 8 14 22 20 12 10 8 6
(1)分别估计两种方案下消费者参与优惠活动的概率;
(2)在消费金额的频数分布表中取每组中间值作为代表,从全部消费者享受的优惠平均值角度分析哪种方案的优惠力度更大.
【答案】(1)方案一:消费者的消费金额满300元即可参与优惠活动,其人数为
其概率:
方案二:消费者的消费金额满400元即可参与优惠活动,其人数为
其概率:
(2)这100位消费者的消费金额下频数分布表
消费 金额(元)
频数 8 14 22 20 12 10 8 6
频率 0.08 0.14 0.22 0.2 0.12 0.1 0.08 0.06
方案一:消费者消费金额的平均值
方案二:消费者消费金额平均值
显然方案二的优惠力度更大.
【知识点】众数、中位数、平均数;古典概型及其概率计算公式
【解析】【分析】 (1)利用表中数据,分别计算方案一、方案二消费者参与优惠活动的概率即可;
(2)由表中数据,分别计算方案一、 方案二购物的平均费用,比较大小即可.
20.(2022高二下·桐乡开学考)为了了解高二段1000名学生的一周课外活动情况,随机抽取了若干学生的一周课外活动时间,时间全部介于10分钟与110分钟之间,将课外活动时间按如下方式分成五组:第一组 ,第二组 ,…,第五组 .按上述分组方法得到的频率分布直方图如图所示,已知图中从左到右前3个组的频率之比为3∶8∶19,且第二组的频数为8.
(1)求第一组数据的频率并计算调查中随机抽取了多少名学生的一周课外活动时间;
(2)求这组数据的平均数.
【答案】(1)解:设图中从左到右前3个组的频率分别为3x,8x,19x.
依题意,得
所以 .所以第一组数据的频率为 ,
设调查中随机抽取了n名学生的课外活动时间,则 ,得 ,
所以调查中随机抽取了50名学生的课外活动时间.
(2)解:由题意,这组数据的平均数 (分钟).
【知识点】频率分布直方图;众数、中位数、平均数
【解析】【分析】(1)根据直方图的性质,结合频率的定义求解即可;
(2)根据直方图的性质,结合平均数的解法求解即可.
21.(2022高一下·凌源月考)一次性医用口罩是适用于覆盖使用者的口 鼻及下颌,用于普通医疗环境中阻隔口腔和鼻腔呼出或喷出污染物的一次性口罩.按照我国医药行业标准,口罩对细菌的过滤效率达到95%及以上为合格,98%及以上为优等品.某部门为了检测一批口罩对细菌的过滤效率,随机抽检了200个口罩,将它们的过滤效率(百分比)按照,,,,分成5组,制成如图所示的频率分布直方图.
(1)求图中m的值及这200个口罩中优等品的频率;
(2)为了进一步检测样本中优等品的质量,用分层抽样的方法从和两组中抽取21个口罩,已知过滤效率百分比低于99%的检测费为每个8元,不低于99%的检测费为每个12元,求这21个口罩的检测总费用.
【答案】(1)解:由图可知,,
这200个口罩中优等品的频率为.
(2)解:因为,所以从中抽取个,从中抽取个,
故这21个口罩的检测总费用为元.
【知识点】分层抽样方法;频率分布直方图
【解析】【分析】 (1)由频率分布直方图求出第4组的频率,由此能求出m,从而可估计这200个口罩中优等品的频率;
(2)先利用分层抽样,求出后两组中所抽取的人数,然后由过滤效率百分比低于99%的检测费为每个8元,不低于99%的检测费为每个12元求解即可得检测总费用.
22.(2022高一下·武功月考)某生物研究小组准备探究某种蜻蜒的翼长分布规律,随机捕捉20只该种蜻蜓,测量它们的翼长(翼长为整数,单位:mm)并绘制成如下的茎叶图和一部分频率分布直方图,其中基叶图中有一处数字看不清(用表示),但已知茎叶图中每一行的数据都按照从小到大的顺序排列且无相同数据频率分布直方图每个分组含左端点不含右端点.
(1)求的值;
(2)根据茎叶图将频率分布直方图补充完整;
(3)分别根据茎叶图和频率分布直方图计算蜻蜓翼长的中位数,并分析哪个中位数可以更准确地反映蜻蜓翼长的总体情况.
【答案】(1)解:区间对应的个体个数为,对应的三个数据分别为41,42,43,
因此必须要大于4且小于6,从而.
(2)解:区间,,,,对应的纵坐标分别为
,,,,.
所以频率分布直方图如下:
(3)解:根据茎叶图,中位数为.
频率分布直方图中,区间的频率为,因此中位数为50.
利用茎叶图计算的中位数更加准确,因为频率分布直方图损失了样本的部分信息,数据的分组对数字特征的估计结果也有影响;
茎叶图是原始数据,记录了样本的全部信息,所以能更准确地反映蜻蜓翼长的总体情况.
【知识点】频率分布直方图;茎叶图;众数、中位数、平均数;用样本的频率分布估计总体分布
【解析】【分析】(1)利用已知条件结合茎叶图中的数据,再结合频率分布直方图中各小组的矩形的面积等于各小组的频率,进而得出a的取值范围,从而得出实数a的值。
(2)利用已知条件结合茎叶图中的数据,再利用频率分布直方图中各小组的矩形的面积等于各小组的频率,进而根据茎叶图将频率分布直方图补充完整。
(3)利用已知条件结合茎叶图求中位数的方法和频率分布直方图求中位数的方法,进而得出分别计算蜻蜓翼长的中位数,再利用茎叶图是原始数据,记录了样本的全部信息,所以能更准确地反映蜻蜓翼长的总体情况。
1 / 1高中数学人教A版(2019)必修二 第九章 统计测试卷
一、单选题
1.(2021高一上·玉林期中)新能源汽车产业是我国经济发展的重要支柱,为了了解新能源汽车的质量情况,有关部门分别随机抽查了 型新能源汽车与 型新能源汽车各10个品牌.得到相关指标的综合评价得分(百分制)的茎叶图如图所示,则从茎叶图可得出正确的信息为(80分及以上为优秀)( ).
① 型新能源汽车与 型汽车得分的优秀率相同.
② 型新能源汽车得分与 型新能源汽车得分的中位数相同.
③ 型新能源汽车得分的方差比 型新能源汽车得分的方差大.
④ 型新能源汽车得分与 型新能源汽车得分的平均分相同.
A.①② B.①③ C.②④ D.③④
2.(2020高二下·三明期末)某中学共有学生2500人,其中男生1500人,为了解该校学生参加体育锻炼的时间,采用分层抽样的方法从该校全体学生中抽取一个容量为50的样本,则样本中女生的人数为( )
A.10 B.15 C.20 D.30
3.(2018高二上·吉林期末)在某项体育比赛中,七位裁判为一选手打出的分数如下:90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )
A. , B. , C. , D. ,
4.(2021·自贡模拟)有专业机构认为某流感在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过15人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体均值为4,中位数为3
B.乙地:总体均值为5,总体方差为12
C.丙地:中位数为3,众数为2
D.丁地:总体均值为3,总体方差大于0
5.(2021·兰州模拟)一组数据 的平均数为 ,现定义这组数据的平均差 .下图是甲、乙两组数据的频率分布折线图
根据折线图,判断甲、乙两组数据的平均差 的大小关系是( )
A. B. C. D.无法确定
6.(2019高二上·钦州期末)某中学共有1000名学生,其中高一年级350人,该校为了了解本校学生视力情况,用分层抽样的方法从该校学生中抽出一个容量为100的样本进行调查,则应从高一年级抽取的人数为( )
A.20 B.25 C.30 D.35
7.(2021高二下·安徽月考)如图是某校调查高一年级文理分科男女生是否喜欢理科的等高条形图,阴影部分的高表示喜欢理科的频率.假设参加调查的男生有600人,女生有400人,现从所有喜欢理科的同学中按分层抽样的方式抽取48人,则抽取的女生人数为( )
A.8 B.12 C.16 D.24
8.(2021高一下·徐州期末)近日,2021中国最具幸福感城市调查推选活动正式启动,在100个地级及以上候选城市名单中,徐州市入选."幸福感指数"是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高.现随机抽取20位徐州市居民,他们的幸福感指数见下表,则这组数据的80百分位数是( )
3 3 4 5 5 6 6 6 7 7
7 7 8 8 8 8 9 9 10 10
A.7.7 B.8 C.8.5 D.9
二、多选题
9.(2020高三上·湖南月考)某校对120名考生的数学竞赛成绩进行统计,分成[50,60),[60,70),[70,80),[80,90),[90,100]五组,得到如图所示频率分布直方图,则下列说法正确的是( )
A.
B.该校学生数学竞赛成绩落在 内的考生人数为24
C.该校学生数学竞赛成绩的中位数大于80
D.估计该校学生数学竞赛成绩的平均数落在 内
10.(2021高一下·安吉期末)给出如下数据:第一组:3,11,5,13,7,2,6,8,9;第二组:12,20,14,22,16,11,15,17,18.则这两组数据的( )
A.平均数相等 B.中位数相等 C.极差相等 D.方差相等
11.(2020高二上·建瓯月考)2020年春节前后,一场突如其来的新冠肺炎疫情在全国蔓延.疫情就是命令,防控就是责任.在党中央的坚强领导和统一指挥下,全国人民众志成城、团结一心,掀起了一场坚决打赢疫情防控阻击战的人民战争.下侧的图表展示了2月14日至29日全国新冠肺炎疫情变化情况,根据该折线图,下列结论正确的是( )
A.16天中每日新增确诊病例数量在下降且19日的降幅最大
B.16天中每日新增确诊病例的中位数小于新增疑似病例的中位数
C.16天中新增确诊、新增疑似、新增治愈病例的极差均大于2000
D.21日至29日每日新增治愈病例数量均大于新增确诊与新增疑似病例之和
12.(2021高一下·青岛期中)关于一组样本数据的平均数、中位数、频率分布直方图和方差,下列说法正确的是( )
A.改变其中一个数据,平均数和中位数都会发生改变
B.频率分布直方图中,中位数左边和右边的直方图的面积应该相等
C.若数据的频率分布直方图为单峰不对称,且在左边“拖尾”,则平均数小于中位数
D.样本数据的方差越小,说明样本数据的离散程度越小
三、填空题
13.(2022·漳州模拟)2021年电影《长津湖》累计票房逾57亿,该片点燃了每个人心中对英雄的崇敬之情,也更加显示出如今和平生活的来之不易.某影院记录了观看此片的70位观众的年龄,其中年龄位于区间的有10位,位于区间的有20位,位于区间的有25位,位于区间的有15位,则这70位观众年龄的众数的估计值为
14.(2018高二下·泰州月考)某校高二年级1000名学生中,血型为 型的有400人, 型的有250人, 型的有250人, 型的有100人.为了研究血型与色弱之向的关系,要从中抽取1个容量为100的样本,则应从 型血的学生中抽取 人.
15.(2020·江苏模拟)从2021年起,江苏考生的高考成绩由语文、数学、外语3门统一高考成绩和考生选考的3门普通高中学业水平考试等级性考试科目成绩构成。等级性考试成绩位次由高到低分为A、B、C、D、E,各等级人数所占比例依次为:A等级15%,B等级40%,C等级30%,D等级14%,E等级1%。现采用分层抽样的方法,从参加物理等级性考试的学生中抽取500人作为样本,则该样本中获得B或C等级的学生人数为 。
16.(2021高一下·台州期末)某小区12户居民四月份月用水呈(单位:t)分别为:
则所给数据的第75百分位数是 .
四、解答题
17.(2018高一下·蚌埠期末)某校高一年级学生全部参加了体育科目的达标测试,现从中随机抽取40名学生的测试成绩,整理数据并按分数段 , , , , , 进行分组.已知测试分数均为整数,现用每组区间的中点值代替该组中的每个数据,则得到体育成绩的折线图如下:
(1)若体育成绩大于或等于70分的学生为“体育良好”,已知该校高一年级有1000名学生,试估计该校高一年级学生“体育良好”的人数;
(2)用样本估计总体的思想,试估计该校高一年级学生达标测试的平均分;
(3)假设甲、乙、丙三人的体育成绩分别为 ,且 , , ,当三人的体育成绩方差 最小时,写出 的所有可能取值(不要求证明)
18.(2021高一下·孝感期末)一家保险公司决定对推销员实行月标管理,按以往月销售额(单位:千元)把推销员分为 、 、 三个层次,各层次人数如下:
月销售额
人数 150 250 100
(1)为了了解推销员对目标设定的意见,决定从 、 、 三个层次中采取比例分配的分层随机抽样抽取30人进行座谈,请计算 、 、 三个层次各应抽取多少人?
(2)确定的销售日标是否合适,直接影响到公司的经济效益,如果目标定得过高,多数推销员完不成任务,会使推销员失去信心;如果目标定得太低,将不利于挖掘推销员的工作潜力.现已知按上面的方法抽取了部分推销员的月销售额(单位:千元):
14.2 15.8
17.7 19.2 22.4
18.2 16.4 21.8
15.6 24.6
23.2 19.8
12.8 13.5 16.3
11.5 13.6 14.9
15.7 16.2
17.0 17.2
17.8 18.0 18.4
20.5 21.5 22.1
24.0 24.8
公司为了使75%的推销员能够完成销售目标,根据这组样本数据,应将销售目标定为多少比较合理?
19.(2022高一下·焦作期末)为了回馈消费者,某商场准备在假期举行优惠活动,据统计,消费者在该商场的消费金额都不超过800元,活动策划人员准备了两种优惠方案.
方案一:消费金额满300元减50元,满600元减120元,只取最高优惠,不重复减免;
方案二:消费金额满400元享受8折优惠.
活动策划人员从电脑中存储的最近的消费记录中随机抽取了100位消费者的消费金额(单位:元),整理得到如下频数分布表:
消费金额(元)
频数 8 14 22 20 12 10 8 6
(1)分别估计两种方案下消费者参与优惠活动的概率;
(2)在消费金额的频数分布表中取每组中间值作为代表,从全部消费者享受的优惠平均值角度分析哪种方案的优惠力度更大.
20.(2022高二下·桐乡开学考)为了了解高二段1000名学生的一周课外活动情况,随机抽取了若干学生的一周课外活动时间,时间全部介于10分钟与110分钟之间,将课外活动时间按如下方式分成五组:第一组 ,第二组 ,…,第五组 .按上述分组方法得到的频率分布直方图如图所示,已知图中从左到右前3个组的频率之比为3∶8∶19,且第二组的频数为8.
(1)求第一组数据的频率并计算调查中随机抽取了多少名学生的一周课外活动时间;
(2)求这组数据的平均数.
21.(2022高一下·凌源月考)一次性医用口罩是适用于覆盖使用者的口 鼻及下颌,用于普通医疗环境中阻隔口腔和鼻腔呼出或喷出污染物的一次性口罩.按照我国医药行业标准,口罩对细菌的过滤效率达到95%及以上为合格,98%及以上为优等品.某部门为了检测一批口罩对细菌的过滤效率,随机抽检了200个口罩,将它们的过滤效率(百分比)按照,,,,分成5组,制成如图所示的频率分布直方图.
(1)求图中m的值及这200个口罩中优等品的频率;
(2)为了进一步检测样本中优等品的质量,用分层抽样的方法从和两组中抽取21个口罩,已知过滤效率百分比低于99%的检测费为每个8元,不低于99%的检测费为每个12元,求这21个口罩的检测总费用.
22.(2022高一下·武功月考)某生物研究小组准备探究某种蜻蜒的翼长分布规律,随机捕捉20只该种蜻蜓,测量它们的翼长(翼长为整数,单位:mm)并绘制成如下的茎叶图和一部分频率分布直方图,其中基叶图中有一处数字看不清(用表示),但已知茎叶图中每一行的数据都按照从小到大的顺序排列且无相同数据频率分布直方图每个分组含左端点不含右端点.
(1)求的值;
(2)根据茎叶图将频率分布直方图补充完整;
(3)分别根据茎叶图和频率分布直方图计算蜻蜓翼长的中位数,并分析哪个中位数可以更准确地反映蜻蜓翼长的总体情况.
答案解析部分
1.【答案】B
【知识点】茎叶图;众数、中位数、平均数;极差、方差与标准差
【解析】【解答】① 型、 型汽车优秀均有3个品牌,即优秀率相同,正确;
② 型、 型汽车得分中位数分别为 、 ,故中位数不同,错误;
, , , ,
③由 ,正确;
④由 ,错误;
综上只有①③正确.
故答案为:B
【分析】根据题意由茎叶图中的数据,然后由平均数、中位数以及方差的个数,代入数值计算出结果,进行比较后,对选项逐一判断即可得出答案。
2.【答案】C
【知识点】分层抽样方法
【解析】【解答】因为共有学生2500人,其中男生1500人,
所以女生有1000人,
所以样本中女生的人数为 人
故答案为:C
【分析】根据题意由分层抽样的定义代入数值计算出结果即可。
3.【答案】B
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【解答】 , ,故选B.
【分析】应用平均数与方差公式计算即可。
4.【答案】B
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【解答】解:对于A,均值为4,中位数为3,不能保证10个数据中每个数据都不超过15,
∴A不符合该标志;
对于B,均值为5,方差为12时,假设这10个数据分别是 ,
则有 ,
,
而 能成立,
没有矛盾,即所有数据不超过15,B符合该标志;
同理,对于C、D,都不能保证10个数据中每个数据不超过15,
∴C、D也不符合题意.
故答案为:B.
【分析】根据平均数,中位数,众数,方差可判断A错误,B正确,C错误,D错误。
5.【答案】C
【知识点】频率分布折线图、密度曲线;众数、中位数、平均数
【解析】【解答】由给定的平均差公式可知:数据越集中于平均值附近,平均差越小.
甲乙两图的纵坐标表示的为频率/组距,即指数据落在此处的概率,甲图中,不同组距区间的概率相差不大,即指数据较为均匀的分布在各区间,而乙图数据较为集中的分布在乙图最高处指代的区间,其他区间分布的比较少,故乙图平均差比较小.
故答案为:C
【分析】 根据题意分析平均差是表示一组数据离散程度的量,平均差越小,数据越集中,结合频率分布折线图得出结论.
6.【答案】D
【知识点】分层抽样方法
【解析】【解答】高一年级抽取的人数为 ,
故答案为:D。
【分析】利用分层抽样的方法结合实际问题的已知条件求出应从高一年级抽取的人数。
7.【答案】B
【知识点】分层抽样方法
【解析】【解答】由图得喜欢理科的男生人数为 人,喜欢理科的女生 人,男女生人数之比为 ,所以从所有喜欢理科的同学中按分层抽样的方式抽取48人,则抽取的女生人数为 。
故答案为:B
【分析】利用某校调查高一年级文理分科男女生是否喜欢理科的等高条形图,阴影部分的高表示喜欢理科的频率结合频数等于频率乘以样本容量的公式,从而求出喜欢理科的男生人数和喜欢理科女生的人数,再利用分层抽样的方法,从而求出抽取的女生人数。
8.【答案】C
【知识点】众数、中位数、平均数
【解析】【解答】表格中的数据已按由小到大排列,而 ,从小到大开始,第16个数和第17个数的平均数为 ,
所以这组数据的80百分位数是8.5.
故答案为:C
【分析】 根据百分位数的定义,直接计算即可.
9.【答案】B,D
【知识点】频率分布直方图;众数、中位数、平均数
【解析】【解答】对于A,由频率分布直方图性质得: ,解得 ,A不符合题意;
对于B,由频率分布直方图得成绩落在 的概率为0.2,人数为 ,B符合题意;
对于C,由频率分布直方图得: 的频率为 , 的频率为 ,所以成绩的中位数位于 内,C不符合题意;
对于D,估计成绩的平均数为: 所以成绩的平均数落在 内,D符合题意.
故答案为:BD.
【分析】利用频率分布直方图各小组矩形的面积等于各小组的频率,再利用频率之和等于1,从而求出a的值;再利用频数等于频率乘以样本容量,从而求出该校学生数学竞赛成绩落在 内的考生人数; 利用频率分布直方图求中位数的公式求出该校学生数学竞赛成绩的中位数; 利用频率分布直方图求平均数公式估计出该校学生数学竞赛成绩的平均数,从而找出说法正确的选项。
10.【答案】C,D
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【解答】由题可得,第二组的每个数据都是第一组对应数据加上9得到,
因此可以判断第二组的平均数和中位数都比第一组多9,而极差和方差不变.
故答案为:CD.
【分析】利用已知条件结合平均数公式、中位数公式、极差公式和方差公式,从而找出正确的选项。
11.【答案】B,C,D
【知识点】频率分布折线图、密度曲线;众数、中位数、平均数;极差、方差与标准差
【解析】【解答】20日新增确诊病例数量比19日多,A不符合题意;
新增确诊病例的中位数小于新增疑似病例的中位数在21、22日左右,比较可得B符合题意;
新增确诊极差 、新增疑似极差 、新增治愈病例的极差 ,均大于2000,C符合题意;
21日至29日每日新增治愈病例数量均大于新增确诊与新增疑似病例之和,D符合题意.
故答案为:BCD.
【分析】根据折线图,中位数、极差的概念,判断各选项.
12.【答案】B,C,D
【知识点】众数、中位数、平均数;用样本的频率分布估计总体分布
【解析】【解答】对于A:例如数据1,3,5,将数据改成2,3,5,数据的中位数未改变,仍为3,A不符合题意;
对于B:根据频率分布直方图中,中位数的求法,可得B符合题意;
对于C:根据频率直方图可得,左边“拖尾”,且不对称,则平均数变小,中位数变大,所以平均数小于中位数,C符合题意;
对于D:方差越小,数据越稳定,离散程度越小,D符合题意.
故答案为:BCD
【分析】对于A,当改变的数,不影响原来中位数的位置时,中位数是不变的,所以A错,
对于B,C,D,由相关定义知,BCD都是正确的。
13.【答案】35
【知识点】众数、中位数、平均数
【解析】【解答】由于25>20>15>10,故众数位于区间
,所以众数的估计值为
.
故答案为:35
【分析】从人数可以看出众数位于区间 ,从而求出众数的估计值.
14.【答案】40
【知识点】分层抽样方法
【解析】【解答】解:由题意可得应按照分层抽样的方法抽取样本,
且抽样比为 ,
所以应从 型血的学生中抽取的人数为 人.
【分析】利用分层抽样法各层的抽样比相等,即可求出从 O 型血的学生中抽取的人数.
15.【答案】350
【知识点】分层抽样方法
【解析】【解答】设该样本中获得B或C等级的学生人数为x,则 ,所以x=350。
【分析】利用已知条件结合分层抽样的方法,从而求出该样本中获得B或C等级的学生人数。
16.【答案】14.4
【知识点】众数、中位数、平均数
【解析】【解答】解:将12个数据按照从小到大的顺序排列:
3.5 4.9 5.4 6.8 7.1 7.7 10.5 11.1 13.6 15.2 16.8 20.5
,所以第75百分位数是 .
故答案为:14.4.
【分析】 先把数据从小到大排列,然后根据百分位数的计算公式求解即可.
17.【答案】(1)解:由图可知,抽取的40人中,“体育良好”的有30人,
所以估计该校高一年级“体育良好”的人数为 人
(2)解: ,
估计该校高一年级学生达标测试的平均分为77.25
(3)解:当数据 的方差最小时, ,
或 .
【知识点】众数、中位数、平均数;概率的应用
【解析】【分析】(1)体育良好人数等于总人数乘上抽取体育人数占抽取人数的比例。
(2)平均分等于分数段的中间数乘上对应频率求得。
(3)直接写出符合要求答案。
18.【答案】(1)解:根据表中数据可得,三层共有 人,抽样比为 ,
故应该从 层抽取 人;
从 层抽取 人;
从 层抽取 人.
(2)将30个数据按照从小到大的顺序进行排序,可得:
11.5,12.8,13.5,13.6,14.2,14.9,15.6,15.7,15.8,16.2,
16.3,16.4,17.0,17.2,17.7,17.8,18.0,18.2,18.4,19.2,
19.8,20.5,21.5,21.8,22.1,22.4,23.2,24.0,24.6,24.8,
为使得75%的销售员完成目标,则没有完成目标的员工占25%,只需求出第25百分位数即可.
由 ,可知样本数据的第25百分位数为第8项数据,即为15.7.
所以应该将销售目标定位157000元比较合理.
【知识点】简单随机抽样
【解析】【分析】 (1)根据表中数据求出抽样比,即可据此求得每层抽取的人数;
(2)将数据从小到大排序,求得第25百分位数即可.
19.【答案】(1)方案一:消费者的消费金额满300元即可参与优惠活动,其人数为
其概率:
方案二:消费者的消费金额满400元即可参与优惠活动,其人数为
其概率:
(2)这100位消费者的消费金额下频数分布表
消费 金额(元)
频数 8 14 22 20 12 10 8 6
频率 0.08 0.14 0.22 0.2 0.12 0.1 0.08 0.06
方案一:消费者消费金额的平均值
方案二:消费者消费金额平均值
显然方案二的优惠力度更大.
【知识点】众数、中位数、平均数;古典概型及其概率计算公式
【解析】【分析】 (1)利用表中数据,分别计算方案一、方案二消费者参与优惠活动的概率即可;
(2)由表中数据,分别计算方案一、 方案二购物的平均费用,比较大小即可.
20.【答案】(1)解:设图中从左到右前3个组的频率分别为3x,8x,19x.
依题意,得
所以 .所以第一组数据的频率为 ,
设调查中随机抽取了n名学生的课外活动时间,则 ,得 ,
所以调查中随机抽取了50名学生的课外活动时间.
(2)解:由题意,这组数据的平均数 (分钟).
【知识点】频率分布直方图;众数、中位数、平均数
【解析】【分析】(1)根据直方图的性质,结合频率的定义求解即可;
(2)根据直方图的性质,结合平均数的解法求解即可.
21.【答案】(1)解:由图可知,,
这200个口罩中优等品的频率为.
(2)解:因为,所以从中抽取个,从中抽取个,
故这21个口罩的检测总费用为元.
【知识点】分层抽样方法;频率分布直方图
【解析】【分析】 (1)由频率分布直方图求出第4组的频率,由此能求出m,从而可估计这200个口罩中优等品的频率;
(2)先利用分层抽样,求出后两组中所抽取的人数,然后由过滤效率百分比低于99%的检测费为每个8元,不低于99%的检测费为每个12元求解即可得检测总费用.
22.【答案】(1)解:区间对应的个体个数为,对应的三个数据分别为41,42,43,
因此必须要大于4且小于6,从而.
(2)解:区间,,,,对应的纵坐标分别为
,,,,.
所以频率分布直方图如下:
(3)解:根据茎叶图,中位数为.
频率分布直方图中,区间的频率为,因此中位数为50.
利用茎叶图计算的中位数更加准确,因为频率分布直方图损失了样本的部分信息,数据的分组对数字特征的估计结果也有影响;
茎叶图是原始数据,记录了样本的全部信息,所以能更准确地反映蜻蜓翼长的总体情况.
【知识点】频率分布直方图;茎叶图;众数、中位数、平均数;用样本的频率分布估计总体分布
【解析】【分析】(1)利用已知条件结合茎叶图中的数据,再结合频率分布直方图中各小组的矩形的面积等于各小组的频率,进而得出a的取值范围,从而得出实数a的值。
(2)利用已知条件结合茎叶图中的数据,再利用频率分布直方图中各小组的矩形的面积等于各小组的频率,进而根据茎叶图将频率分布直方图补充完整。
(3)利用已知条件结合茎叶图求中位数的方法和频率分布直方图求中位数的方法,进而得出分别计算蜻蜓翼长的中位数,再利用茎叶图是原始数据,记录了样本的全部信息,所以能更准确地反映蜻蜓翼长的总体情况。
1 / 1