第六章统计 达标检测
学校:___________姓名:___________班级:___________考号:___________
一、单选题
1.样本的数据如下:3,4,4,,5,6,6,7,若该样本平均数为5,则样本方差为
A.1.2 B.1.3 C.1.4 D.1.5
2.(2017-2018学年贵州省遵义市遵义四中高三第三次月考)一支田径队有男运动员40人,女运动员30人,要从全体运动员中抽取一个容量为28的样本来研究一个与性别有关的指标,则抽取的男运动员人数为
A.20 B.18
C.16 D.12
3.某滑冰馆统计了2021年11月1日到30日某小区居民在该滑冰馆的锻炼天数,得到如图所示的频率分布直方图(将频率视为概率),则下列说法正确的是( )
A.该小区居民在该滑冰馆的锻炼天数在区间内的最少
B.估计该小区居民在该滑冰馆的锻炼天数的中位数为16
C.估计该小区居民在该滑冰馆的锻炼天数的平均值大于14
D.估计该小区居民在该滑冰馆的锻炼天数超过15天的概率为0.456
4.某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n人中,抽取81人进行问卷调查.已知高二被抽取的人数为30,那么n=( )
A.860 B.720
C.1 020 D.1 040
5.为了调查全国人口的寿命,抽查了11个省(市)的2500 名城镇居民,这2500名城镇居民的寿命的全体是( )
A.总体 B.个体 C.样本 D.样本容量
6.已知一组样本数据,,…,的均值和方差分别为2和0.25,则,,…,的均值和方差分别为( )
A.6和0.75 B.8和0.75 C.8和2.25 D.6和2.25
二、多选题
7.一组数据,,…,的平均数是3,方差为4,关于数据,,…,,下列说法正确的是( )
A.平均数是3 B.平均数是8
C.方差是11 D.方差是36
8.根据下列数据:16,20,22,25,24,25,下列说法正确的是( )
A.这些数据的平均数为22 B.这些数据的平均数为23
C.这些数据的中位数为22 D.这些数据的中位数为23
三、填空题
9.某班的全体学生参加年级数学竞赛,成绩的频率分布直方图如下图所示,数据的分组依次为,,,.已知低于40分的有5人,则该班学生总人数是 .
10.菲尔兹奖(Fields Medal)被视为数学界的诺贝尔奖,每次在国际数学大会上颁给2~4位有卓越贡献的年轻数学家.于1936年首次颁发,截至2020年,世界上共有60位数学家获得过菲尔兹奖,其中2位为华裔数学家,分别是1982年获奖的数学家丘成桐和2006年获奖的数学家陶哲轩.从年龄的维度统计,菲尔兹奖获奖者人数的折线图如下图所示,则获奖者年龄数据的中位数为 .
11.有一个简单的随机样本,,,,,则这个样本的方差 .
12.某校为了解高三学生身体素质情况,从某项体育测试成绩中随机抽取个学生成绩进行分析,得到成绩频率分布直方图(如图所示),已知成绩在的学生人数为,且有个女生的成绩在中,则 ;现由成绩在的样本中随机抽取2名学生作指导工作,记所抽取学生中女生的人数为,则的数学期望是 .
四、解答题
13.给定两组数据与,称为这两组数据之间的“差异量”.鉴宝类的节目是当下非常流行的综艺节目.现有个古董,它们的价值各不相同,最值钱的古董记为1号,第二值钱的古董记为2号,以此类推,则古董价值的真实排序为.现在某专家在不知道古董真实排序的前提下,根据自己的经验对这个古董的价值从高到低依次进行重新排序为,其中为该专家给真实价值排第位古董的位次编号,记,那么与的差异量可以有效反映一个专家的水平,该差异量越小说明专家的鉴宝能力越强.
(1)当时,求的所有可能取值;
(2)当时,求满足的的个数;
(3)现在有两个专家甲、乙同时进行鉴宝,已知专家甲的鉴定结果与真实价值的差异量为,专家甲与专家乙的鉴定结果的差异量为4,那么专家乙的鉴定结果与真实价值的差异量是否可能为?请说明理由.
(注:实数满足:,当且仅当时取“”号)
14.某市为了了解学生的体能情况,从全市所有高一学生中按的比例随机抽取人进行一分钟跳绳测试,将所得数据整理后,分为组画出频率分布直方图(如图所示),由于操作失误,导致第一组和第二组的数据丢失,但知道第二组频率是第一组的倍.
(1)求和的值;
(2)若次数在以上(含次)为优秀,试估计全市高一学生的优秀率是多少?全市优秀学生的人数约为多少?
(3)估计全市学生跳绳次数的中位数和平均数?
15.为了调查一款电视机的使用时间,研究人员对该款电视机进行了相应的测试,将得到的数据统计如下图所示:
并对不同年龄层的市民对这款电视机的购买意愿作出调查,得到的数据如下表所示:
愿意购买这款电视机 不愿意购买这款电视机 总计
40岁以上 800 1000
40岁以下 600
总计 1200
(1)根据图中的数据,试估计该款电视机的平均使用时间;
(2)根据表中数据,判断是否有99.9%的把握认为“愿意购买该款电视机”与“市民的年龄”有关;
(3)若按照电视机的使用时间进行分层抽样,从使用时间在和的电视机中抽取5台,再从这5台中随机抽取2台进行配件检测,求被抽取的2台电视机的使用时间都在内的概率.
附: 0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
16.一般地,元有序实数对称为维向量.对于两个维向量,定义:两点间距离,利用维向量的运算可以解决许多统计学问题.其中,依据“距离”分类是一种常用的分类方法:计算向量与每个标准点的距离,与哪个标准点的距离最近就归为哪类.某公司对应聘员工的不同方面能力进行测试,得到业务能力分值 管理能力分值 计算机能力分值 沟通能力分值(分值代表要求度,1分最低,5分最高)并形成测试报告.不同岗位的具体要求见下表:
岗位 业务能力分值 管理能力分值 计算机能力分值 沟通能力分值 合计分值
会计(1) 2 1 5 4 12
业务员(2) 5 2 3 5 15
后勤(3) 2 3 5 3 13
管理员(4) 4 5 4 4 17
对应聘者的能力报告进行四维距离计算,可得到其最适合的岗位.设四种能力分值分别对应四维向量的四个坐标.
(1)将这四个岗位合计分值从小到大排列得到一组数据,直接写出这组数据的第三四分位数;
(2)小刚与小明到该公司应聘,已知:只有四个岗位的拟合距离的平方均小于20的应聘者才能被招录.
(i)小刚测试报告上的四种能力分值为,将这组数据看成四维向量中的一个点,将四种职业的分值要求看成样本点,分析小刚最适合哪个岗位;
(ii)小明已经被该公司招录,其测试报告经公司计算得到四种职业的推荐率分别为,试求小明的各项能力分值.
参考答案:
题号 1 2 3 4 5 6 7 8
答案 D C C D C C BD AD
1.D
【详解】,得,则故选D.
2.C
【详解】因为田径队男运动员40人,女运动员30人,所以这支田径队共有40+30=70人,用分层抽样的方法从该队的全体运动员中抽取一个容量为28的样本,所以每个个体被抽到的概率是,因为田径队有男运动员40人,所以男运动员要抽取人,故选C.
3.C
【分析】由频率分布直方图比较各区间的频率大小,由此确定各区间的频数大小,由此判断A,再计算样本数据的中位数和平均数,判断B,C,再求锻炼天数超过15天的频率,由此估计概率,判断D.
【详解】频率分布直方图中,面积最小的矩形条所在的区间为,即样本中区间内的数据频率最小,频数也最小,故选项错误,
由频率分布直方图可得,前三个小矩形的面积之和为,所以估计该小区居民在该滑冰馆的锻炼天数的中位数小于15,故选项错误;
由频率分布直方图可得,,故选项C正确;
由频率分布直方图可得,该小区居民在该滑冰馆的锻炼天数超过15天的频率为,故锻炼天数超过15天的概率为,
故选项错误.
故选:C.
4.D
【详解】分层抽样是按比例抽样,可得,可得.故本题选.
5.C
【分析】由样本的概念即知.
【详解】由题意可知,这2500名城镇居民的寿命的全体是样本.
6.C
【分析】根据均值和方差的定义和性质进行计算.
【详解】由题意得,故,
则
即,,…,的均值为,
又,
故,
解得,
故
故,,…,的方差为.
故选:C
7.BD
【详解】代入平均数和方差公式,即可求解.
【分析】,,,…,的平均数为,方差为,则,,
所以数据,,…,的平均数为,
方差为.
故选:BD.
8.AD
【解析】根据数据的平均数和中位数的求法可得选项.
【详解】由已知得:这些数据的平均数为,这些数据的中位数为,
故选:AD.
9.50
【详解】根据频率分布直方图,得低于分的频率是,又因为低于分的有 人,样本容量是人,故答案为.
10.36
【分析】列举出获奖者的年龄,即得解.
【详解】解:由题得获奖年龄为:27,27,29,29,29,31,31,31,31,31,32,32,32,32,33,33,33,33,34,34,34,34,35,35,35,35,35,36,36,36,36,36,37,37,37,37,37,37,37,37,38,38,38,38,38,38,38,38,39,39,39,39,39,39,40,40,40,40,40,40,40,共60人. 第30位和第31位都是36岁,所以获奖者年龄数据的中位数为36.
故答案为:36
11.
【分析】根据所给的样本,先算出这组数据的平均数,再把所求的平均数和数据代入求出这组数据的方差,得到结果.
【详解】解:由样本数据,,,,,
所以这组数据的平均数是.
这组数据的方差为.
故答案为:.
【点睛】本题考查一组数据的方差的求法,属于基础题.
12.
【分析】先利用频率和为求得的值.根据的学生人数及频率,计算出的值.根据的频率计算出该组的总人数,利用超几何分布概率计算公式求得分布列,由此求得的数学期望.
【详解】由,解得.依题意,则.成绩在的人数为,其中个为女生,个为男生.的可能取值为.,故.
【点睛】本小题主要考查频率分布直方图的知识,考查超几何分布的概率计算公式,考查分布列的期望求法.属于中档题.对于频率分布直方图,要注意的有以下两点:一个是小长方形的面积和为,二个是频率分布直方图的纵坐标为.超几何分布的计算公式,类似于古典概型的计算公式.
13.(1)0,2,4
(2)12
(3)不可能,理由见详解
【分析】(1)利用列举法求的所有可能性结果,结合的定义运算求解;
(2)分析可知只能调整两次两个连续序号或连续三个序号之间调整顺序,结合(1)中结论运算求解;
(3)由题意可得:,,结合绝对值不等式的运算求解.
【详解】(1)若时,则,且,
可得,
所以的所有可能取值为0,2,4.
(2)若对调两个位置的序号之差大于2,则,
可知只能调整两次两个连续序号或连续三个序号之间调整顺序,
若调整两次两个连续序号:则有,共有3种可能;
若连续三个序号之间调整顺序,连续三个序号有:,共3组,
由(1)可知:每组均有3种可能满足,可得共有种可能;
所以的个数为.
(3)不可能,理由如下:
设专家甲的排序为,记;
专家乙的排序为,记;
由题意可得:,,
因为,
结合的任意性可得,
所以专家乙的鉴定结果与真实价值I的差异量不可能为.
【点睛】方法点睛:1,对于(2):利用转化法,将问题转为(1)中已知的结论;
2,对于(3):结合绝对值不等式分析证明.
14.(1)
(2),人
(3),平均数
【分析】(1)根据频率之和为列方程,结合已知条件求得.
(2)根据频率分布直方图计算出优秀率,并计算出全市优秀学生的人数.
(3)根据中位数、平均数的求法求得正确答案.
【详解】(1)由题意得,
解得.
(2)由图可知,超过分的组的频率分别为,,,
优秀率为.
全市优秀学生的人数约为(人).
(3)第组的频率分别为,,,,
前三组的频率和为,
中位数约为.
平均数约为
.
15.(1)7.76;(2)见解析;(3).
【分析】(1)利用频率分布直方图求出平均数;
(2)依题意填写列联表,计算观测值,对照临界值得出结论;
(3)依题意用列举法求出基本事件数,再计算所求的概率值
【详解】(1)依题意,所求平均数为
;
(2)依题意,完善表中的数据如下所示:
愿意购买该款电视机 不愿意购买该款电视机 总计
40岁以上 800 200 1000
40岁以下 400 600 1000
总计 1200 800 2000
故;
故有99.9%的把握认为“愿意购买该款电视机”与“市民的年龄”有关;
(3)依题意,使用时间在内的有1台,记为A,使用时间在内的有4台,记为;
则随机抽取2台,所有的情况为,,,,,,,,,共10种;
其中满足条件的为,,,,,共6种,
故所求概率为.
【点睛】本题考查了频率分布直方图与独立性检验的应用问题,是基础题
16.(1)
(2)(i)小刚最适合业务员岗位;(ii)小明业务能力分值、管理能力分值、计算机能力分值、沟通能力分值分别为
【分析】(1)将合计分值从小到大排列,再利用百分位数的求法,即可求出结果;
(2)(i)根据条件,先求出各个岗位的样本点,再根据题设定义即可求出结果;(ii)先根据条件得到的相关方程组,利用,,得到,再根据题设列出方程,利用,得出,再对三种情况分析讨论,即可求出结果.
【详解】(1)将四个岗位合计分值从小到大排列得到数据,
又,所以这组数据的第三四分位数为.
(2)(i)由图表知,会计岗位的样本点为,则,
业务员岗位的样本点为,则,
后勤岗位的样本点为,则,
管理员岗位的样本点为,则,
所以,故小刚最适合业务员岗位.
(ii)四种职业的推荐率分别为,且,
所以,得到,
又均小于20,所以,且,
故可得到,
设小明业务能力分值、管理能力分值、计算机能力分值、沟通能力分值分别为,且,,
依题有①,
②,
③,
④,
由①③得,
,
整理得:,
故有三组正整数解,
对于第一组解,代入④式有,不成立;
对于第二组解,代入①式有,
解得或,代入②④式均不成立;
对于第三组解,代入②式有,
解得,代入①②③④均成立,故;
故小明业务能力分值、管理能力分值、计算机能力分值、沟通能力分值分别为.
【点睛】关键点点晴:本题第(2)问的(ii)问的解决关键在于,根据题设定义列出的相关方程组,分析得,进而选择合适的式子得到,从而分析得解.