第九章 统计 章末复习试题
一.选择题
1.某校去年有1100名同学参加高考,从中随机抽取50名同学的总成绩进行分析,在这个调查中,下列叙述错误的是( )
A.1100名同学的总成绩是总体
B.每一名同学是个体
C.50名同学的总成绩是样本
D.50是样本容量
2.现要完成下列两项调查:
①从某社区70户高收入家庭、335户中等收入家庭、95户低收入家庭中选出100户,调查社会购买能力的某项指标;
②从某中学的15名艺术特长生中选出3名调查学习负担情况.
这两项调查宜采用的抽样方法是( )
A.①简单随机抽样,②分层抽样
B.①分层抽样,②简单随机抽样
C.①②都用简单随机抽样
D.①②都用分层抽样
3.某射击运动员6次的训练成绩分别为:88,91,89,88,86,85,则这6次成绩的第70百分位数为( )
A.89 B.89.5 C.90 D.90.5
4.总体由编号01,02,…,29,30的30个个体组成.利用下面的随机数表选取5个个体,选取方法是从如下随机数表的第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )
第1行78 16 62 32 08 02 62 42 62 52 53 69 97 28 01 98
第2行32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
A.27 B.26 C.25 D.24
5.为了鼓励学生锻炼身体,强健体魄,增强抵抗病毒能力,某校决定加强体育活动并对体育成绩进行定期统计,下表是该校高三年级某次体育测试成绩的样本频率分布表:
500名高三学生体育成绩的频率分布表
分组 [70,75) [75,80) [80,85) [85,90) [90,95]
频率 0.1 0.15 0.4 0.25 0.1
该次高三年级体育测试成绩中位数的估计值位于区间( )
A.[75,80) B.[80,82.5) C.[82.5,85) D.[85,90)
6.随着消费者环保意识的增强,新能源汽车得到了消费者的青睐.如图是某品牌的新能源汽车在今年的前8个月的销量(单位:辆)情况,以下描述错误的是( )
A.这8个月销量的极差是3258
B.这8个月销量的中位数是3194
C.这8个月中2月份的销量最低
D.这8个月中销量比前一个月增长最多的是4月份
7.耀华中学全体学生参加了主题为“致敬建党百年,传承耀华力量”的知识竞赛,随机抽取了400名学生进行成绩统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示,下列说法正确的是( )
A.直方图中x的值为0.004
B.在被抽取的学生中,成绩在区间[70,80)的学生数为30人
C.估计全校学生的平均成绩为84分
D.估计全校学生成绩的样本数据的80%分位数约为93分
8.某城市2022年1月到10月中每月空气质量为中度污染的天数分别为1,4,7,9,a,b,13,14,15,17,且9≤a≤b≤13.已知样本的中位数为10,则该样本的方差的最小值为( )
A.21.4 B.22.6 C.22.9 D.23.5
多选题
9.已知甲、乙两组数据:
甲组:27,28,39,40,m,50;
乙组:24,n,34,43,48,52;
若这两组数据的第30百分位数、第80百分位数分别相等,则( )
A.m=48 B.n=28 C.m=46 D.n=26
10.某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人;高三年级有13个班,每班50人.甲同学就读于高一,乙同学就读于高二.学校计划从这三个年级中共抽取300人进行视力调查,下列说法中正确的有( )
A.应该采用分层随机抽样法
B.高一、高二、高三年级应分别抽取100人、135人和65人
C.乙同学被抽到的可能性比甲同学大
D.该问题中的总体是高一、高二、高三年级的全体学生的视力
11.为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄群体中随机抽取了容量为200的调查样本,其中城镇户籍与农村户籍各100人;男性120人,女性80人,绘制的不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图如图所示,其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述正确的是( )
A.是否倾向选择生育二胎与户籍有关
B.是否倾向选择生育二胎与性别无关
C.调查样本中倾向选择生育二胎的群体中,男性人数与女性人数相同
D.倾向选择不生育二胎的群体中,农村户籍人数多于城镇户籍人数
12.为了解决传统的3D人脸识别方法中存在的问题,科学家提出了一种基于视频分块聚类的格拉斯曼流形自动识别系统.规定:某区域内的m个点Pi(xi,yi,zi)的深度zi的均值为μ=,标准偏差为σ=,深度zi→[μ﹣3σ,μ+3σ]的点视为孤立点.则根据下表中某区域内8个点的数据,有( )
Pi P1 P2 P3 P4 P5 P6 P7 P8
xi 15.1 15.2 15.3 15.4 15.5 15.4 15.4 13.4
yi 15.1 14.2 14.3 14.4 14.5 15.4 14.4 15.4
zi 20 12 13 15 16 14 12 18
A.μ=15 B.σ=
C.P1是孤立点 D.P2不是孤立点
三.填空题
13.一个容量为n的样本分成若干个小组,已知某组的频数和频率分别是48和0.3,则n= .
14.已知x1,x2,x3, ,xn的中位数为a,则2x1﹣1,2x2﹣1,2x3﹣1, ,2xn﹣1的中位数为 .
15.抽样调查某地区120名教师的年龄和学历状况,情况如下饼图:
则估计该地区35岁以下具有研究生学历的教师百分比为 .
16.习近平总书记在2021年2月25日召开的全国脱贫攻坚总结表彰大会上发表重要讲话,庄严宣告,在迎来中国共产党成立一百周年的重要时刻,我国脱贫攻坚取得了全面胜利.在脱贫攻坚过程中,为了解某地农村经济情况,工作人员对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下列结论中正确结论的序号是 .
①该地农户家庭年收入低于4.5万元的农户比率估计为6%;
②该地农户家庭年收入不低于10.5万元的农户比率估计为10%;
③估计该地农户家庭年收入的平均值不超过6.5万元;
④估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间.
四.解答题
17.为了了解某地高一学生的体能状况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形的面积之比为2:4:17:15:9:3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上为达标,试估计全体高一学生的达标率为多少?
(3)通过该统计图,可以估计该地学生跳绳次数的众数是 ,中位数是 .
18.从某食品厂生产的某种面包中随机抽取100个面包,测量这些面包的一项质量指标值,由测量结果得到的频率分布直方图如图所示.
(Ⅰ)估计该食品厂生产的这种面包的该项质量指标值的平均数(同一组中的数据用该组区间的中点值作代表);
(Ⅱ)根据抽样调查数据,能否认为该食品生产的这种面包符合“该项质量指标值不于85的面包至少要占全部面包90%”的规定?
19.某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数 0 1 2 3 4 ≥5
保费 0.85a a 1.25a 1.5a 1.75a 2a
随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:
出险次数 0 1 2 3 4 ≥5
频数 60 50 30 30 20 10
(1)记A为事件:“一续保人本年度的保费不高于基本保费”.求P(A)的估计值;
(2)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.求P(B)的估计值;
(3)求续保人本年度的平均保费估计值.
20.某批库存零件在外包装上标有从到N的连续自然数序号,总数N未知,工作人员随机抽取了n个零件,它们的序号从小到大依次为:x1,x2,…,xn.现有两种方法对零件总数N进行估计.
方法一:用样本的数字特征估计总体的数字特征,可以认为样本零件序号的中位数与总体序号的中位数近似相等,进而可以得到N的估计值.
方法二:因为零件包装上的序号是连续的,所以抽出零件的序号x1,x2,…,xn相当于从区间[0,N+1]中随机抽取n个整数,这n个整数将区间[0,N+1]分为(n+1)个小区间:(0,x1),(x1,x2),…,(xn,N+1).由于这n个数是随机抽取的,所以前n个区间的平均长度与所有(n+1)个区间的平均长度近似相等,进而可以得到N的估计值.
现工作人员随机抽取了31个零件,序号从小到大依次为:83、135、274、380、668、895、955、964、1113、1174、1210、1344、1387、1414、1502、1546、1689、1756、1865、1874、1880、1936、2005、2006、2065、2157、2220、2224、2396、2543、2791.
(1)请用上述两种方法分别估计这批零件的总数.(结果四舍五入保留整数)
(2)将第(1)问方法二估计的总数N作为这批零件的总数,从中随机抽取100个零件测量其内径y(单位:mm),绘制出频率分布直方图(如图).已知标准零件的内径为200mm,将这100个零件的内径落入各组的频率视为这批零件内径分布的概率.其中内径长度最接近标准的720个零件为优等品,请求出优等品的内径范围(结果四舍五入保留整数).
21.为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机各选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如图的折线图:
(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均值;
(2)轮胎的宽度在[194,196]内,则称这个轮胎是标准轮胎.
(i)若从甲厂提供的10个轮胎中随机选取1个,求所选的轮胎是标准轮胎的概率;
(ii)试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好?
22.《中国制造2025》是中国实施制造强国战略第一个十年的行动纲领,制造业是国民经济的主体,是立国之本、兴国之器、强国之基发展制造业的基本方针为质量为先,坚持把质量作为建设制造强国的生命线.某电子产品制造企业为了提升生产效率,对现有的一条电子产品生产线进行技术升级改造,为了分析改造的效果,该企业质检人员从该条生产线所生产的电子产品中随机抽取了1000件,检测产品的某项质量指标值,根据检测数据得到下表(单位:件).
质量指标 (25,35) (35,45) (45,55) (55,65) (65,75) (75,85) (85,95)
产品 60 100 160 300 200 100 80
(1)估计这组样本的质量指标值的平均数和方差s2(同一组中的数据用该组区间中点值作代表);
(2)设[x]表示不大于x的最大整数,{x}表示不小于x的最小整数,s精确到个位,an=5,bn=5 []n∈N*,根据检验标准,技术升级改造后,若质量指标值有65%落在[a1,b1]内,则可以判断技术改造后的产品质量初级稳定;若有95%落在[a2,b2]内,则可以判断技术改造后的产品质量稳定,可认为生产线技术改造成功.请问:根据样本数据估计,是否可以判定生产线的技术改造是成功的?