第九章 统计
一、单选题
1. 某大学共有本科生人,其中一、二、三、四年级的人数比为,要用分层抽样的方法从所有本科生中抽取一个容量为的样本,则应抽取三年级的学生人数为( )
A. B. C. D.
2. 已知是,,,,,,,的第百分位数,在,,,,,,,中随机取两个数,这两个数都小于的概率为( )
A. B. C. D.
3. 有一组样本数据:,,,,,,,,,则关于该组数据的下列数字特征中,数值最大的为( )
A. 平均数 B. 第百分位数 C. 极差 D. 众数
4. 如果数据,,,的平均数为,方差为,则,,,的平均数和方差分别为( )
A. 、 B. 、 C. 、 D. 、
5. 下列叙述错误的是( )
A. 若事件发生的概率为,则
B. 分层是不放回抽样,每个个体被抽到的可能性相等
C. 甲、乙、丙三位同学争着去参加一个公益活动,抽签决定谁去,则无论谁先抽概率都相同,所以抽签是公平的
D. 对于任意两个事件和,都有
6. 某校有高一学生名,其中男生数与女生数之比为,为了解学生的视力情况,现要求按分层随机抽样的方法抽取一个样本容量为的样本,若样本中男生比女生多人,则( )
A. B. C. D.
7. 甲、乙、丙、丁四人各掷骰子次骰子出现的点数可能为,,,,,,并分别记录自己每次出现的点数,四人根据统计结果对自己的试验数据分别做了如下描述,可以判断一定出现点的描述是( )
A. 中位数为,众数为 B. 中位数为,极差为
C. 平均数为,方差为 D. 平均数为,百分位数为
8. 已知样本的平均数是,方差是,则( )
A. B. C. D.
9. 云南某镇因地制宜,在政府的带领下,数字力量赋能乡村振兴,利用“农抬头”智慧农业平台,通过大数据精准分析柑橘等特色产业的生产数量、价格走势、市场供求等数据,帮助小农户找到大市场,开启“直播电商”销售新模式,推进当地特色农产品“走出去”通过“互联网旅游”聚焦特色农产品、绿色食品、生态景区资源下面是年月到月份该镇甲、乙两村销售收入统计数据单位:百万
甲:,,,,,
乙:,,,,,.
根据上述数据,则( )
A. 甲村销售收入的第百分位数为百万
B. 甲村销售收入的平均数小于乙村销售收入的的平均数
C. 甲村销售收入的中位数大于乙村销售收入的中位数
D. 甲村销售收入的方差大于乙村销售收入的方差
10. 机器人是一种能够半自主或全自主工作的智能机器.它可以辅助甚至替代人类完成某些工作,提高工作效率,服务人类生活,扩大或延伸人的活动及能力范畴.某公司为了研究某机器人的销售情况,统计了年月至月,两店每月该机器人的营业额单位:万元,得到如图所示的折线图,则下列说法中不正确的是( )
A. 店营业额的平均值是 B. 店营业额的中位数在内
C. 店营业额的极差比店营业额的极差小 D. 店营业额的方差大于店营业额的方差
二、多选题
11. 下列说法正确的是( )
A. 用分层抽样法从名学生男、女分别占、中抽取人,则每位男生被抽中的概率为
B. 将一组数据中的每个数据都乘以后,平均数也变为原来的倍
C. 将一组数据中的每个数据都乘以后,方差也变为原来的倍
D. 一组数据,,,的平均数是,方差为,现将其中一个值为的数据剔除后,余下个数据的方差是.
12. 近年来,我国人口老龄化持续加剧,为改善人口结构,保障国民经济可持续发展,国家出台了一系列政策,如年起实施全面两孩生育政策,年起实施三孩生育政策等.根据下方的统计图,下列结论正确的是
A. 至年每年新生儿数量的平均数高于万
B. 至年每年新生儿数量的第一四分位数低于万
C. 至年每年新生儿数量呈现先增加后下降的变化趋势
D. 至年每年新生儿数量的方差大于至年每年新生儿数量的方差
13. 某高中有学生人,其中男生人,女生人,希望获得全体学生的身高信息,按照分层抽样的原则抽取了容量为的样本经计算得到男生身高样本均值为,方差为女生身高样本均值为,方差为下列说法中正确的是( )
A. 男生样本容量为 B. 每个女生被抽入到样本的概率均为
C. 所有样本的均值为 D. 所有样本的方差为
14. 某企业为普及法制教育,对本单位名员工开展了一次法律知识竞赛答题活动现从中随机抽取人的得分进行统计分析,整理得到如图所示的频率分布直方图,则根据该直方图,下列结论正确的是( )
A. 估计该企业的员工得分在区间内
B. 该企业员工竞赛得分不小于的人数估计为人
C. 估计该企业员工的平均竞赛得分约为
D. 该企业员工竞赛得分的第百分位数约为
15. 下列命题中,正确的命题的序号为( )
A. 已知随机变量服从二项分布,若,则
B. 将一组数据中的每个数据都加上同一个常数后,方差恒不变
C. 设随机变量服从正态分布,若,则
D. 某人在次射击中,击中目标的次数为,且,则当时概率最大
三、填空题
16. 一工厂生产了某种产品件,它们来自甲,乙,丙个车间,现采用分层抽样的方法对这批产品进行抽样检查,已知从甲,乙,丙个车间依次抽取产品的件数恰好组成一个等差数列,则这批产品中乙车间生产的产品件数是 .
17. 数据,,,,,,,,,,,的百分位数是________.
18. 某学校有男生人,女生人为了调查该校全体学生每天睡眠时间,采用分层抽样的方法抽取样本,计算得男生每天睡眠时间均值为小时,方差为,女生每天睡眠时间为小时,方差为若男、女样本量按比例分配,则可估计总体方差为__________.
19. 某年级名学生在一次百米测试中,成绩全部介于秒与秒之间,将测试结果分成组:,,,,,已知各组频数之比为,那么成绩的第百分位数约为 秒.
20. 为了解某校高三年级男生的体重,从该校高三年级男生中抽取名,测得他们的体重数据如下按从小到大的顺序排列,单位::、、、、、、、、、、、、、、、、据此估计该校高三年级男生体重的第百分位数为 .
四、解答题
21. 高二年级有男生人,女生人,张华按男生、女生进行分层,通过分层随机抽样的方法,得到男生、女生的平均身高分别为和.
如果张华在各层中按比例分配样本,总样本量为,那么在男生、女生中分别抽取了多少个在这种情况下,请估计高二年级全体学生的平均身高
如果张华从男生、女生中抽取的样本量分别为和,那么在这种情况下,如何估计高二年级全体学生的平均身高更合理
22. 文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取份作为样本,将样本的成绩满分分,成绩均为不低于分的整数分成六段:,,,得到如图所示的频率分布直方图.
求频率分布直方图中的值;
求样本成绩的第百分位数;
已知落在的平均成绩是,方差是,落在的平均成绩为,方差是,求两组成绩的总平均数和总方差.
23. 年月日,北京冬奥会在鸟巢落下帷幕,中国队创历史最佳战绩北京冬奥会的成功举办推动了我国冰雪运动的普及,让越来越多的青少年爱上了冰雪运动。某校组织了一次全校冰雪运动知识竞赛,并抽取了名参赛学生的成绩制作成如下频率分布表:
竞赛得分
频率
如果规定竞赛得分在为“良好”,竞赛得分在为“优秀”,从成绩为“良好”和“优秀”的两组学生中,使用分层抽样抽取人现从这人中抽取人进行座谈,求两人竞赛得分都是“优秀”的概率
以这名参赛学生中竞赛得分为“优秀”的频率作为全校知识竞赛中得分为“优秀”的学生被抽中的概率现从该校学生中随机抽取人,记竞赛得分为“优秀”的人数为,求随机变量的分布列及数学期望.
24. 防洪是修建水坝的重要目的之一.现查阅一条河流在某个水文站年的年最大洪峰流量单位:的记录,统计得到如下部分频率分布直方图:
记年最大洪峰流量大于某个数的概率为,则年最大洪峰流量不大于这个数的概率为定义重现期单位:年为概率的倒数.规定:当时,用报告洪水,即洪水的重现期;当时,用报告枯水,即枯水的重现期如,则报告洪水,重现期年,通俗的说法就是“百年一遇”.
补齐频率分布直方图用阴影表示,并估计该河流年最大洪峰流量的平均值同一组数据用该区间的中点值作代表;
现拟在该水文站修建水坝,要求其能抵挡五十年一遇的洪水.用频率估计概率,求它能承受的最大洪峰流量单位:的最小值的估计值.
25. 月日“世界读书日”来临时,某校为了解中学生课外阅读情况,随机抽取了名学生,并获得了他们一周课外阅读时间单位:小时的数据,整理得到下表.
组号 分组 频数 频率
求,的值,并在下图中作出这些数据的频率分布直方图用阴影涂色
根据频率分布直方图估计该组数据的众数及中位数精确到
现从第,组中用比例分配的分层随机抽样方法抽取人参加校中华诗词比赛,经过比赛后,第组得分的平均数,方差,第组得分的平均数,方差,则这人得分的平均数和方差分别为多少方差精确到
1、 ; 2、 ; 3、 ; 4、 ; 5、 ; 6、 ; 7、 ; 8、 ; 9、 ; 10、 ;
11、 ; 12、 ; 13、 ; 14、 ; 15、 ; 16、 ; 17、 ; 18、 ; 19、 ; 20、
21、解析抽取男生人数为 ,抽取女生人数为.
高二年级全体学生的平均身高估计为 .
仍按中的方式进行估计,
即.
22、解:每组小矩形的面积之和为,
,
.
成绩落在内的频率为,
落在内的频率为,
设第百分位数为,
由,
得,故第百分位数为.
由图可知,成绩在的市民人数为,
成绩在的市民人数为,
故.
设成绩在中人的分数分别为,,,,成绩在中人的分数分别为,,,,,
则由题意可得,
,,
即,,
,
所以两组市民成绩的总平均数是,总方差是.
23、解:成绩为“良好”和“优秀”的两组频率合计,共人,抽样比.
所以成绩为“良好”的抽取人,成绩为“优秀”的抽取人.
所以抽到的竞赛得分都是“优秀”的概率为.
由题意知,的可能取值,,,.
由题可知,任意名学生竞赛得分“优秀”的概率为,
竞赛得分不是“优秀”的概率为.
若以频率估计概率,则服从二项分布
.
所以的分布列为
.
24、解:由频率分布直方图知年最大洪峰流量在区间,,,
上的频率分别为,,,,
所以年最大洪峰流量在区间的频率为.
所以频率分布直方图中缺失的小矩形的高度为.
补齐频率分布直方图如下:
所以该河流年最大洪峰流量的平均值
设水坝能承受的最大洪峰流量的最小值为.
由题意知,所以,即要求年最大洪峰流量大于的概率小于等于.
所以可由样本的分位数作为的估计值.
由频率分布方图可知年最大洪峰流量在区间的频率为,
所以样本的分位数在内.
设样本的分位数为,由,得.
所以样本的分位数的估计值为.
所以,的估计值为单位:
25、解:由表格可知,,,
,,
则频率分布直方图如下:
由频率分布直方图可知,该组数据众数的估计值为.
易知中位数应在内,
设中位数为,则,解得,
故中位数的估计值为
因为第组和第组的频数之比为,所以从第组抽取人,第组抽取人,
由第组得分的平均数,方差,第组得分的平均数,方差,
则这人得分的平均数,
方差,
即这人得分的平均数为,方差为.