第九章 统计 复习参考题
【教材课后习题】
1.为了了解某地参加计算机水平测试的5000名学生的成绩,从中抽取了200名学生进行调查分析.在这个问题中,被抽取的200名学生是( ).
A.总体 B.个体 C.样本 D.样本量
2.四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数6的是( ).
A.平均数为3,中位数为2 B.中位数为3,众数为2
C.平均数为2,方差为2.4 D.中位数为3,方差为2.8
3.如果一组数据的中位数比平均数小很多,下面哪种叙述一定是错误的?为什么?
(1)数据中可能有异常值;
(2)这组数据是近似对称的;
(3)数据中可能有极端大的值;
(4)数据中众数可能和中位数相同.
4.(1)在已分组的若干数据中,每组的频数是指_______,每组的频率是指_______.
(2)一个公司共有N名员工,下设一些部门,要采用等比例分层随机抽样的方法从全体员工中抽取样本量为n的样本.如果某部门有m名员工,那么从该部门抽取的员工人数是_______.
5.一家著名的全国性连锁服装店进行了一项关于当年秋季服装流行色的民意调查.调查者通过向顾客发放饮料,并让顾客通过挑选饮料杯上印着的颜色来对自己喜欢的服装颜色“投票”.根据这次调查结果,在某大城市A,服装颜色的众数是红色,而当年全国服装协会发布的调查结果是咖啡色.
(1)这个结果是否代表A城市的人的看法?
(2)你认为这两种调查的差异是由什么引起的?
6.在一个文艺比赛中,12名专业人士和12名观众代表各组成一个评委小组,给参赛选手打分.下面是两组评委对同一名选手的打分:
小组A 42 45 48 46 52 47 49 55 42 51 47 45
小组B 55 36 70 66 75 49 46 68 42 62 58 47
(1)选择一个可以度量每一组评委打分相似性的量,并对每组评委的打分计算度量值.
(2)你能据此判断小组A和小组B中哪一个更像是由专业人士组成的吗?
7.一名学生通过计步仪器,记录了自己100天每天走的步数,数据如下:
5678 13039 8666 9521 8722 10575 2107 4165
17073 11205 5467 11736 9986 8592 6542 12386
13115 5705 8358 13234 20142 9769 10426 12802
16722 8587 9266 8635 2455 4524 8260 13165
9812 9533 2377 5132 8212 7968 9859 3961
5484 11344 8722 12944 8597 12594 15101 4751
11130 11286 8897 7192 7313 8790 7699 10892
9583 9207 16358 10182 3607 1789 9417 4566
12347 3228 7606 8689 8755 15609 8767 9226
5622 11094 8865 11246 17417 7995 7317 6878
4270 11051 5705 5442 10078 9107 8354 6483
16808 1509 1301 10843 13864 12691 8419 14267
9809 9858 8922 12682
(1)画出这组数据的频率分布直方图,并分析数据的分布特点;
(2)计算这组数据的平均数、中位数和标准差,并根据这些数值描述这名学生的运动情况.
8.一家水果店的店长为了解本店苹果的日销售情况,记录了过去30天苹果的日销售量(单位:kg),结果如下:
83,96,107,91,70,75,94,80,80,100,
75,99,117,89,74,94,84,85,101,87,
93,85,107,99,55,97,86,84,85,104
(1)请计算该水果店过去30天苹果日销售量的中位数、平均数、极差和标准差.
(2)一次进货太多,水果会变得不新鲜;进货太少,又不能满足顾客的需求.店长希望每天的苹果尽量新鲜,又能80%地满足顾客的需求(在100天中,大约有80天可以满足顾客的需求).请问,每天应该进多少千克苹果?
9.一家保险公司决定对推销员实行目标管理,即给推销员确定一个具体的销售目标.确定的销售目标是否合适,直接影响到公司的经济效益.如果目标定得过高,多数推销员完不成任务,会使推销员失去信心:如果目标定得太低,将不利于挖掘推销员的工作潜力.下面一组数据是部分推销员的月销售额(单位:千元):
19.58 16.11 16.45 20.45 20.24 21.66 22.45 18.22 12.34
19.35 20.55 17.45 18.78 17.96 19.91 18.12 14.65 14.78
16.78 18.78 18.29 18.51 17.86 19.58 19.21 18.55 16.34
15.54 17.55 14.89 18.94 17.43 17.14 18.02 19.98 17.88
17.32 19.35 15.45 19.58 13.45 21.34 14.00 18.42 23.00
17.52 18.51 17.16 24.56 25.14
请根据这组样本数据提出使65%的职工能够完成销售指标的建议.
10.为了解某市家庭用电量的情况,该市统计局调查了200户居民去年一年的月均用电量(单位:kW·h),数据从小到大排序如下:
8 18 22 31 42 48 49 50 51 56 57 57 60 61 61
61 62 62 63 63 65 66 67 69 70 70 71 72 72 74
76 77 77 78 78 80 80 82 82 82 83 84 84 88 88
89 90 91 93 93 94 95 96 96 96 97 98 98 98 99
100 100 100 101 101 101 105 106 106 106 107
107 107 107 108 108 109 109 110 110 110 111
112 113 113 114 115 116 118 120 120 120 121
123 124 127 127 127 130 130 130 131 131 132
132 132 133 133 134 134 134 135 135 135 135
136 137 137 138 139 139 140 141 142 144 146
146 147 148 149 151 152 154 156 159 160 162
163 163 164 165 167 169 170 170 172 174 174
177 178 178 180 182 182 187 189 191 191 192
194 194 200 201 201 202 203 203 206 208 212
213 214 216 223 224 237 247 250 250 251 253
254 258 260 265 274 274 283 288 289 304 319
320 324 339 462 498 530 542 626
为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯电价,使75%的居民缴费在第一档,20%的居民缴费在第二档,其余5%的居民缴费在第三档.请确定各档的范围.
【定点变式训练】
11.为了调查某地区不同年龄、不同职级的教师工资情况,研究人员在A学校进行抽样调查,则比较合适的抽样方法为( )
A.简单随机抽样 B.随机数法 C.分层随机抽样 D.不能确定
12.为了大致了解某公司员工的身高情况,决定从50名员工(已编号为00~49)中选取10名进行测量.如果利用随机数法进行抽取,得到如下4组编号,则符合要求的编号是( )
A.26,94,29,27,43,99,55,19,81,06
B.20,26,31,40,24,36,19,34,03,48
C.02,38,22,41,38,24,49,44,03,11
D.04,00,45,32,44,22,04,11,08,49
13.某地区有大型商场x个,中型商场y个,小型商场z个,且.为了掌握该地区商场的营业情况,采用分层随机抽样(样本量按比例分配)的方法抽取一个容量为45的样本,则抽取的中型商场的个数为( )
A.3 B.6 C.12 D.27
14.某工厂生产甲、乙、丙三种型号的产品,产品数量之比为,现按型号用分层随机抽样的方法随机抽取容量为n的样本.若抽到24件乙型号产品,则n等于( )
A.80 B.70 C.60 D.50
15.甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:
甲 乙 丙 丁
平均环数 8.6 8.9 8.9 8.2
方差 3.5 3.5 2.1 5.6
从这四个人中选择一人参加奥运会射击项目比赛,最佳人选是( )
A.甲 B.乙 C.丙 D.丁
16.为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:
①样本数据落在区间的频率为0.45;
②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有的当地中小型企业能享受到减免税政策;
③估计样本的中位数为480万元.
其中正确结论的个数为( )
A.0 B.1 C.2 D.3
17.为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图.根据统计图的数据,下列结论错误的是( )
A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次
B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5次
C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约为320
D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约为32
18.已知甲、乙两组按顺序排列的数据:
甲组:27,28,37,m,40,50;
乙组:24,n,34,43,48,52.
若这两组数据的第30百分位数、第50百分位数分别对应相等,则等于( )
A. B. C. D.
19.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有( )
A. B. C. D.
20.已知在一次射击预选赛中,甲、乙两人各射击10次,两人成绩的条形统计图如图所示,则下列四个选项中判断不正确的是( )
A.甲的成绩的平均数小于乙的成绩的平均数 B.甲的成绩的中位数小于乙的成绩的中位数 C.甲的成绩的方差大于乙的成绩的方差 D.甲的成绩的极差小于乙的成绩的极差
21.用分层随机抽样的方法对某品牌暖风机同一批次的甲、乙两种型号的产品进行抽查.已知样本量为80,其中有50件甲型产品.若乙型号产品的总数为2100,则该批次产品的总数为_______.
22.若,,…,平均数、方差分别是2和1,,则,,…,的平均数为_______________,方差为______________.
23.某市举行“中学生诗词大赛”,某校有1000名学生参加了比赛,从中抽取100名学生,统计他们的成绩(单位:分),并进行适当的分组(每组为左闭右开的区间),得到的频率分布直方图如图所示,则估计该校学生成绩的分位数为______.
24.为了解中学生课外阅读情况,现从某中学随机抽取200名学生,收集了他们一年内的课外阅读量(单位:本)等数据,以下是根据数据绘制的统计图表的一部分.
性别 男 7 31 25 30 4
女 8 29 26 32 8
学段 初中 25 36 44 11
高中
下面有四个推断:
①这200名学生阅读量的平均数可能是26本;
②这200名学生阅读量的分位数在区间内;
③这200名学生的初中生阅读量的中位数一定在区间内;
④这200名学生中的初中生阅读量的分位数可能在区间内.
所有合理推断的序号是________.
25.某学校随机抽取部分新生调查其上学所需时间(单位:min),并将所得数据绘制成频率分布直方图(如图),其中上学所需时间的范围是,样本数据分组为,,,,.
(1)求频率分布直方图中x的值;
(2)假设上学所需时间不少于1 h的学生可申请在学校住宿,若该学校有600名新生,请估计新生中有多少名学生可以申请住宿;
(3)由频率分布直方图估计该校新生上学所需时间的平均值.
26.我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民每户月用水量标准x(吨),用水量不超过x的部分按平价收费,超过x的部分按议价收费.为了了解全市居民每户月均用水量的分布情况,通过抽样,获得了100户居民某年的月均用水量(单位:吨),将数据按照分成9组,制成了如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)已知该市有80万户居民,估计全市居民中每户月均用水量不低于3吨的户数,并说明理由;
(3)若该市改府希望使85%的居民每户每月的用水量不超过标准x(吨),估计x的值,并说明理由.
答案以及解析
1.答案:C
解析:
2.答案:C
解析:若平均数为2,且出现6点,则方差.
因而答案选C.
3.答案:(2)是错误的,原因见解析
解析:数据近似对称时,中位数与平均数差不多大,因而(2)是错误的.
4.答案:(1)每组的数据个数;该组的频数除以全体数据总数
(2)
解析:见解析
5.答案:(1)这个结果只能说明A城市中光顾这家服装连锁店的人比其他人较少倾向于选择伽啡色.因为光顾连锁店的人不能代表A城市其他人群的想法.
(2)这两种调查的差异是由样本的代表性所引起的.因为A城市的调查结果来自该城市光顾这家服装连锁店的人群,这个样本不能很好地代表全国民众的观点.
解析:
6.答案:(1)样本标准差,A组的样本标准差3.730,B组的样本标准差11.789
(2)A组
解析:(1)可以用样本标准差作为度量每一组评委打分相似性的量,样本标准差越小,相似程度越高A组的样本标准差,B组的样本标准差为.
(2)由于专业人士给分更符合专业规则,相似程度更高,因此A组更像是由专业人士组成的.
7.答案:(1)这组数据的频率分布直方图如下.
由直方图可知数据有72%分布在内.
(2)这组数据的平均数为9170.48.中位数为8909.5.
标准差为2756.40449.
这名学生的运动状况是每天大约走9000步.
解析:
8.答案:(1)中位数为88,平均数为89.2,极差为62,标准差约为12.58
(2)每天应该进99千克苹果
解析:(1)将数据从小到大排列为
55 70 74 75 75 80 80 83 84 84 85
85 85 86 87 89 91 93 94 94 96 97
99 99 100 101 104 107 107 117
中位数为,平均数为89.2,极差为.
标准差约为12.58.
(2).数据从小到大排列,第24个数据为99,
每天应该进99千克苹果.
9.答案:频率分布表如下:
分组 频数 频率 累计频率
2 0.04 0.04
4 0.08 0.12
3 0.06 0.18
8 0.16 0.34
13 0.26 0.6
11 0.22 0.82
3 0.06 0.88
3 0.06 0.94
1 0.02 0.96
2 0.04 1
当把指标定为千元)时,约的推销员经过努力才能完成销售指标.
10.答案:第一档用电范围为,第二档用电范围为,第三档用电范围为
解析:,,本题数据中,第150个数据为178,第190个数据为289,所以第一档用电范围为,第二档用电范围为,第三档用电范围为.
12.要了解全校学生的体重情况,请你设计一个调查方案,并实施调查,完成一份统计调查分析报告.
答案:略
解析:
11.答案:C
解析:因为调查教师的工资情况需要分年龄和职级,所以使用分层随机抽样的方法能够正确反映不同年龄、不同职级的教师工资情况.故选C.
12.答案:B
解析:观察选项A中的编号,有不在00~49内的数字,故排除选项A;选项C,D中都有重复的编号,故排除选项C和D.故选B.
13.答案:C
解析:因为该地区有大型商场x个,中型商场y个,小型商场z个,且,所以用分层随机抽样进行调查,应抽取中型商场的个数为.故选C.
14.答案:A
解析:因为,所以.故选A.
15.答案:C
解析:因为丙的平均数大且方差小.故选C.
16.答案:D
解析:由,得,
所以数据在区间的频率为,①正确;
数据在区间的频率为,②正确;
数据在区间的频率为0.3,数据在区间的频率为0.55,
故估计中位数为,③正确.
17.答案:D
解析:由题图可知,该校九年级学生1分钟仰卧起坐的次数的中位数是次,众数是27.5次,1分钟仰卧起坐的次数超过30次的频率为0.2,所以该校九年级学生1分钟仰卧起坐的次数超过30次的约有320人,故A,B,C正确;1分钟仰卧起坐的次数少于20次的频率为0.1,所以该校九年级学生1分钟仰卧起坐的次数少于20次的约有160人,故D错误.
18.答案:B
解析:因为,,
所以第30百分位数为,第50百分位数为,所以,所以,故选B.
19.答案:D
解析:由已知得,,,则.故选D.
20.答案:D
解析:甲的成绩的平均数为,乙的成绩的平均数为,甲的成绩的平均数小于乙的成绩的平均数,故A判断正确;甲的成绩的中位数为,乙的成绩的中位数为,甲的成绩的中位数小于乙的成绩的中位数,故B判断正确;由条形统计图得甲的成绩相对分散,乙的成绩相对稳定,甲的成绩的方差大于乙的成绩的方差,故C判断正确;甲的成绩的极差为,乙的成绩的极差为,甲的成绩的极差大于乙的成绩的极差,故D判断不正确.
21.答案:5600
解析:由题知抽取的样本中乙型号产品所占比例为,所以该批次产品的总数为.
22.答案:8;9
解析:因为,所以,,…,的平均数是,方差是.
23.答案:122
解析:根据频率分布直方图可知,成绩在130分以下的学生所占比例为,成绩在110分以下的学生所占比例为,因此分位数一定位于内,由,故可估计该校学生成绩的分位数为122.
24.答案:②③④
解析:在②中,,阅读量在的人数有人,
在的人数有62人,所以这200名学生阅读量的分位数在区间内,故②正确;
在③中,设在区间内的初中生人数为x,则,,
当时,初中生总人数为人,,
此时区间内有25人,区间内有36人,所以中位数在内,
当时,初中生总人数为人,,
区间内有人,区间内有36人,所以中位数在内,
所以当区间内人数取最小和最大值时,中位数都在内,
所在这200名学生的初中生阅读量的中位数一定在区间内,故③正确;
在④中,设在区间内的初中生人数为x,则,,
当时,初中生总人数为116人,,
此时区间有25人,区间有36人,所以分位数在内,
当时,初中生总人数为131人,,
区间有人,所以分位数在内,
所以这200名学生中的初中生阅读量的分位数可能在区间内,故④正确.
25.答案:(1)0.0125(2)72(3)33.6 min
解析:(1)由频率分布直方图可得,解得.
(2)新生上学时间不少于1 h的频率为,
因为,
所以600名新生中约有72名学生可以申请住宿.
(3)由题可知.
故该校新生上学所需时间的平均值约为33.6 min.
26.答案:(1)
(2)月均用水量不低于3吨的户数为96000
(3)每户月用水量标准为2.9吨时,85%的居民每户每月的用水量不超过标准
解析:(1)由频率分布直方图,可得,解得.
(2)由频率分布直方图可知,100户居民每户月均用水量不低于3吨的频率为,
由以上样本频率分布,可以估计全市80万户居民中月均用水量不低于3吨的户数为.
(3)前6组的频率之和为,
而前5组的频率之和为.
由,解得.
因此估计每户月用水量标准为2.9吨时,85%的居民每户每月的用水量不超过标准.
2