9.3 统计案例 公司员工的肥胖情况调查分析 (31张PPT)

文档属性

名称 9.3 统计案例 公司员工的肥胖情况调查分析 (31张PPT)
格式 ppt
文件大小 4.0MB
资源类型 试卷
版本资源 人教A版(2019)
科目 数学
更新时间 2021-08-04 11:26:13

图片预览

文档简介

09人教A版 必修二
7.1复数的概念
9.3 统计案例 公司员工的肥胖情况调查分析
一、背景与数据
近年来,我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.目前,国际上常用身体质量指数(Body Mass Index,缩写BMI)来衡量人体胖瘦程度以及是否健康,其计算公式是
男员工
23.5
21.6
30.6
22.1
23.7
20.6
24.0
23.9
20.8
21.5
22.1
21.6
19.0
20.2
19.6
17.3
17.9
23.4
18.7
23.1
17.3
22.4
20.8
25.1
21.3
27.7
23.5
23.6
19.4
23.1
18.6
24.1
21.3
19.5
18.7
21.0
22.6
16.0
18.0
17.9
22.1
19.3
19.3
22.8
29.0
21.4
22.3
18.8
19.7
27.4
23.5
23.6
30.5
22.3
21.6
17.6
21.5
29.1
25.5
18.7
22.1
18.9
25.8
27.8
35.3
17.5
27.0
19.9
22.2
24.5
18.0
19.0
21.1
21.3
18.7
23.9
20.8
34.2
16.6
19.3
20.9
23.7
23.7
23.0
18.7
27.3
21.2
17.3
23.5
30.1
为了解某公司员工的身体肥胖情况,研究人员从公司员工体检数据中,采用比例分配的分层随机抽样方法抽取了90名男员工、50名女员工的身高和体重数据,计算得到他们的BMI值如下:
女员工
21.8
18.2
25.2
28.1
21.5
19.1
25.7
24.4
17.6
20.8
20.5
20.2
17.4
21.6
18.4
20.3
30.8
23.6
23.3
22.8
20.8
16.8
19.0
16.4
18.7
26.1
20.2
17.6
15.4
21.5
19.5
31.6
19.1
20.4
13.9
18.6
16.6
15.9
18.3
18.1
29.7
18.9
16.9
25.8
19.8
18.5
16.0
17.6
19.1
26.5
二、任务与要求
根据上面的数据,写一份该公司员工肥胖情况的统计分析报告.要求:
选择合适的图表展示数据;
比较男、女员工在肥胖状况上的差异;
分析公司员工胖瘦程度的整体情况;
提出控制体重的建议.
三、统计分析报告的主要组成部分
1.标题
2.前言
简单交代调查的目的、方法、范围等背景情况,使读者了解调查的基本情况.
主体
展示数据分析的全过程:首先要明确所关心的问题是什么,说明数据蕴含的信息;根据数据分析的需要,说明如何选择合适的图表描述和表达数据;从样本数据中提取能刻画其特征的量,如均值、方差等,用于比较男、女员工在肥胖状况上的差异;通过样本估计总体的统计规律,分析公司员工胖瘦程度的整体情况.
结尾
对主体部分的内容进行概括,结合控制体重的一般方法(可以查阅有关文献),提出控制公司员工体重的建议.
本节问题中,BMI值可以看成连续型数据,所以可以通过频率分布直方图了解男、女员工 BMI值的分布情况,再对男、女员工BMI值的平均数和标准差等数字特征进行比较,最后将男、 女员工BMI值的数据合在一起进行分析.
男、女员工BMI值的频率分布直方图分别如图9-2 (1)(2)所示.
为了方便比较,可以以相同的分组对男、女职工的BMI值分别画出频率分布直方图,如图9.3-(1)(2)所示.
男、女员工的BMI值的中位数、平均数、标准差、方差和极差如表9-1所示.
中位数
平均数
标准差
方差
极差
男员工
21.6
22.18
3.78
14.32
19.3
女员工
19.65
20.70
4.06
16.47
17.7
表9-1
可以看出,男员工的BMI值的中位数和平均数都比女员工的大,但都在正常值范围之内.男员工的BMI值变化范围比女员工的变化范围大,这是由某个极端值引起的,男员工的BMI值的最大值为35. 3,已经达到了重度肥胖的标准.从标准差上看,男员工的整体的分散程度比女员工的略小.
男、女员工的BMI值的每组的百分比如表9-2所示.
表9-2
偏瘦
正常
偏胖
肥胖
男员工
12%
68%
12%
8%
女员工
32%
48%
12%
8%
男、女员工偏胖和肥胖的比例差不多,但女员工偏瘦的比例较大,这可能与女性更追求身材好有关.
最后,分析公司员工胖瘦程度的整体情况.将男、女员工的数据放在一起,计算全140个数据的平均数和方差.在分层随机抽样中已经学过,知道每组的数据个数和平均数,可以直接计算全部数据的平均数.
平均数约为21. 65,这个值在正常值范围内,可见这个公司员工BMI值的平均水平是正常的,方 差为15. 59,得标准差约为3. 95,于是可见,还有个别员工的BMI值大于28,属于肥胖但比例很小.
总之,该公司员工的BMI值分布不对称,大约8%员工属于肥胖,需要引起注意,女员工偏瘦的人数明显比男员工多.
复习参考题9(第222页)
1.为了了解某地参加计算机水平测试的5000名学生的成绩,从中抽取了200名学生进行调查分析.在这个问题中,被抽取的200名学生是( )
A.总体 B.个体
C.样本 D.样本量
C
2.四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数6的是( )
A.平均数为3,中位数为2
B.中位数为3,众数为2
C.平均数为2,方差为2.4
D.中位数为3,方差为2.8
A不正确,例如1,1,2,5,6满足选项A,但不满足题意;
B不正确,例如2,2,3,4,6满足选项B,但不满足题意;
D不正确,例如2,3,3,6,6满足选项D,但不满足题意;故选C.
C
3.如果一组数据的中位数比平均数小很多,下面哪种叙述一定是错误的?为什么?
(1)数据中可能有异常值;
(2)这组数据是近似对称的;
(3)数据中可能有极端大的值;
(4)数据中众数可能和中位数相同.
“(2)”一定是错误的,如果这数据是近似对称的,那么中位数和平均数会比较接近.
4.(1)在已分组的若干数据中,每组的频数是指 ,每组的频率是指 .
(2)一个公司共有N名员工,下设一些部门,要采用等比例分层随机抽样的方法从全体员工中抽取样本量为n的样本.如果某部门有m名员工,那么从该部门抽取的员工人数是 .
该组中数据的个数
该组的频数除以全体数据个数
5.一家著名的全国性连锁服装店进行了一项关于当年秋季服装流行色的民意调查.调查者通过向顾客发放饮料,并让顾客通过挑选饮料杯上印着的颜色来对自己喜欢的服装颜色“投票”.根据这次调查结果,在某大城市A,服装颜色的众数是红色,而当年全国服装协会发布的调査结果是咖啡色.
(1)这个结果是否代表A城市的人的看法?
(2)你认为这两种调查的差异是由什么引起的?
(1) 这个结果只能说明,A城市中光顾这家服装连锁店的人比其他人较少倾向于选择咖啡色,因为光顾连锁店的人是一种方便样本,不能代表 A 城市其他人群的看法.
(2)这两种调查的差异是由样本的代表性所引起的.因为A 城市的调査结果来自该市光顾这家服装连锁店的人群,这个样本不能很好地代表全国民众的观点.
6.从一本英语书中随机抽取100个句子,数出每个句子中的单词数,作出这100个数据的频率分布表,由此你可以作出什么估计?
表略. 可以估计出此书句子中所含单词数的分布,以及有关的数字特征,如平均数、标准差等.
7.在一个文艺比赛中,12名专业人士和12名观众代表各组成一个评委小组,给参赛选手打分.下面是两组评委对同一名选手的打分:
小组A
42
45
48
46
52
47
49
55
42
51
47
45
小组B
55
36
70
66
75
49
46
68
42
62
58
47
(1)选择一个可以度量每一组评委打分相似性的量,并对每组评委的打分计算度量值.
(2)你能据此判断小组A与小组B中哪一个更像是由专业人士组成的吗?
(1)可以用标准差来度量每一组评委打分的相似性,标准差越小,相似程度越高,A 组打分的标准差约为 3.730,B组打分的标准差约为11.789 .
(2)由于专业评委给分更符合专业规则,相似程度应该高,因而A组评委更像是由专业人士组成的.
8.一名学生通过计步仪器,记录了自己100天每天走的步数,数据如下:
5678
13039
8666
9521
8722
10575
2107
4165
17073
11205
5467
11736
9986
8592
6542
12386
13115
5705
8358
13234
20142
9769
10426
12802
16722
8587
9266
8635
2455
4524
8260
13165
9812
9533
2377
5132
8212
7968
9859
3961
5484
11344
8722
12944
8597
12594
15101
4751
11130
11286
8897
7192
7313
8790
7699
10892
9583
9207
16358
10182
3607
1789
9417
4566
12347
3228
7606
8689
8755
15609
8767
9226
5622
11094
8865
11246
17417
7995
7317
6878
4270
11051
5705
5442
10078
9107
8354
6483
16808
1509
1301
10843
13864
12691
8419
14267
9809
9858
8922
12682
(1)画出这组数据的频率分布直方图,并分析数据的分布特点;
(1)这组数据的最大值为 20142,最小值为 1301,极差为18841 .将数据分为 9 组,组距取 2100 ,可作出频率分布表和频率分布直方图.
分组
频数
频率
[1300, 3400)
7
0.07
[3400, 5500)
11
0.11
[5500, 7600)
10
0.10
[7600, 9700)
31
0.31
[9700, 11800)
20
0.20
[11800, 13900)
12
0.12
[13900, 16000)
3
0.03
[16000, 18100)
5
0.05
[18100, 20200]
1
0.01
合计
100
100%
(2)计算这组数据的平均数、中位数和标准差,并根据这些数值描述这名学生的运动情况.
(2)平均数为9170.48,表示该同学平均每天约走 9170 步;中位数为8909.5,表示该同学 有 50 天走的步数不少于8909.5,即该同学所走步数的中间水平约为 8909;标准差为3756.404,表示该同学每天所走步数的离散程度,即在平均数附近的波动程度的大小.
9.一家水果店的店长为了解本店苹果的日销售情况,记录了过去30天苹果的日销售量(单位:kg),结果如下:
83,96,107,91,70,75,94,80,80,100,
75,99,117,89,74,94,84,85,101,87,
93,85,107,99,55,97,86,84,85,104
(1)请计算该水果店过去30天苹果日销售量的中位数、平均数、极差和标准差.
(2)一次进货太多,水果会变得不新鲜;进货太少,又不能满足顾客的需求.店长希望每天的苹果尽量新鲜,又能80%地满足顾客的需求(在100天中,大约有80天可以满足顾客的需求).请问,每天应该进多少千克苹果?
(1)中位数:88 , 平均数:89. 2, 极差:62, 标准差:12.58.
(2)一次进货太多,水果会变得不新鲜;进货太少,又不能满足顾客的需求.店长希望每天的苹果尽量新鲜,又能80%地满足顾客的需求(在100天中,大约有80天可以满足顾客的需求).请问,每天应该进多少千克苹果?
(2)80%地满足顾客需求相当于估计苹果日销售量的 80%分位数.将上述数据排序:55,70,74,75,75,80,80,83,84,84 ,85,85,85,86,87,89,91,93,94,94,96,97,99,99,100,101,104,107,107,117.
10.一家保险公司决定对推销员实行目标管理,即给推销员确定一个具体的销售目标.确定的销:售目标是否合适,直接影响到公司的经济效益.如果目标定得过高,多数推销员完不成任务,会使推销员失去信心;如果目标定得太低,将不利于挖掘推销员的工作潜力.下面一组数据是部分推销员的月销售额(单位:千元):
19.58
16.11
16.45
20.45
20.24
21.66
22.45
18.22
12.34
19.35
20.55
17.45
18.78
17.96
19.91
18.12
14.65
14.78
16.78
18.78
18.29
18.51
17.86
19.58
19.21
18.55
16.34
15.54
17.55
14.89
18.94
17.43
17.14
18.02
19.98
17.88
17.32
19.35
15.45
19.58
13.45
21.34
14.00
18.42
23.00
17.52
18.51
17.16
24.56
25.14
请根据这组样本数据提出使65%的职工能够完成销售指标的建议.
将数据按照从小到大排序
12.34
13.45
14
14.65
14.78
14.89
15.45
15.54
16.11
16.34
16.45
16.78
17.14
17.16
17.32
17.43
17.45
17.52
17.55
17.86
17.88
17.96
18.02
18.12
18.22
18.29
18.42
18.51
18.51
18.55
18.78
18.78
18.94
19.21
19.35
19.35
19.58
19.58
19.58
19.91
19.98
20.24
20.45
20.55
21.34
21.66
22.45
23.00
24.56
25.14
11.为了解某市家庭用电量的情况,该市统计局调查了200户居民去年一年的月均用电量(单位:kW?h),数据从小到大排序如下:
8
18
22
31
42
48
49
50
51
56
57
57
60
61
61
61
62
62
63
63
65
66
67
69
70
70
71
72
72
74
76
77
77
78
78
80
80
82
82
82
83
84
84
88
88
89
90
91
93
93
94
95
96
96
96
97
98
98
98
99
100
100
100
101
101
101
105
106
106
106
107
107
107
107
108
108
109
109
110
110
110
111
112
113
113
114
115
116
118
120
120
120
121
123
124
127
127
127
130
130
130
131
131
132
132
132
133
133
134
134
134
135
135
135
135
136
137
137
138
139
139
140
141
142
144
146
146
147
148
149
151
152
154
156
159
160
162
163
163
164
165
167
169
170
170
172
174
174
177
178
178
180
182
182
187
189
191
191
192
194
194
200
201
201
202
203
203
206
208
212
213
214
216
223
224
237
247
250
250
251
253
254
258
260
265
274
274
283
288
289
304
319
320
324
339
462
498
530
542
626
为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯电价,使75%的居民缴费在第一档,20%的居民缴费在第二档,其余5%的居民缴费在第三档.请确定各档的范围.
为了使 75%的居民缴费在第一档,需要确定月用电量的 75%分位数;使20%的居民缴费在第二档,还需要确定月用电量的95%分位数.
12.要了解全校学生的体重情况,请你设计一个调查方案,并实施调查,完成一份统计调查分析报告.