§9.2 用样本估计总体--9.3统计案例 公司员工的肥胖情况调查分析
9
作频率分布直方图的步骤:
(1)求极差(一组数据中最大值与最小值的差)
决定组距与组数
决定定组距与组数
组距是指每个小组的两个端点之间的距离。数据分组的组数与数据的个数有关,一股数据的个数越多,所分组数也越多、当样本容量现不超过10时.常分成5~12组为方便起见,一般取等长组距,并并且组距应力求“取整”。
(3)将数据分组
通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.
(4)列频率分布表
统计各组数据的频数,计算频率.填人表格中,完成频率分布表.
(5)画频率分布直方图
画图时,以横轴表示分组,纵轴(小长方形的高表示频率与组距的比值.
众数
在一组数据中,出现次数最多的数据叫做这组数据的众数
中位数
将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数叫做这组数据的中位数
在频率分布直方图中,中位数左边和右边的直方图的面积相等
平均数
样本数据的算术平均数
索引3:统计图表
常见的统计图表有条形统计图、扇形统计图、折线统计图.
1,条形图
定义:用一个单位长度表示一定的数量关系,根据数量的多少画成长短不同的条形,条形的宽度必须保持一致,然后把这些条形排列起来,这样的统计图称为条形图.
(2)特点
①条形图可以形象地比较各种数据之间的数量关系.
②条形图中,一条轴上显示的是所关注的数据类型,另-条轴上对应的是数量、个数或者比例,条形图中每一矩形都是等宽的.
扇形图
(1)定义:用整个圆代替总体,圆中的各个扇形分别代表总体中的不同部分,扇形的大小反映部分
占总体的百分比的大小,这样的统计图称为扇形图.
(2)特点:扇形图可以形象地表示出各部分数据在全部数据中所占的比例情况,扇形图中,每一个扇形的圆心角以及弧长都与这一部分表示的数据大小成正比,
3.折线图
(1)定义:用一个单位长度表示一定的数据,根据数量的多少描出各点,然后用线段顺次把各点连接起来,这样的统计图称为折线图.
(2):)特点:折线图既可以表示出项目的具体数量,又能清楚地反时决数据的变化情况.
9
精例1
随机抽取骑行共享单车的市民进行问卷调查,得到样本的频率分布直方图如图所示.再从这些市民中用分层抽样的方法抽取一个样本进行调查,若第二次抽取的样本中 年龄段的人数为14,则第二次抽取的样本中 年龄段的人数为(??? )
?2?????????????????????????B.?3?????????????????????C.?5????????????????????????????D.?6
【答案】 A
【考点】分层抽样方法,频率分布直方图
【解析】设 年龄段应抽取人数为 .由图可知 年龄段对应的频率为 .
由 ,得 .
故答案为:A.
【分析】 根据频率分布直方图,求出样本中不小于30岁人的频率与频数,再求用分层抽样方法抽取的人数
精例2
新莽铜嘉量是由王莽国师刘歆等人设计制造的标准量器,它包括了龠(yuè)、合、升、斗、斛这五个容量单位.每一个量又有详细的分铭,记录了各器的径、深、底面积和容积.根据铭文不但可以直接测得各个容量单位的量值,而且可以通过对径、深各个部位的测量,得到精确的计算容积,从而推算出当时的标准尺度.现根据铭文计算,当时制造容器时所用的圆周率分别为3.1547,3.1992,3.1498,3.2031,比径一周三的古率已有所进步,则上面四个数与祖冲之给出的约率( )、密率( )这6个数据的中位数与极差分别为(??? )
?3.1429,0.0615?????????????
?3.1523,0.0615?????????????
?3.1498,0.0484????????????
D.?3.1547,0.0484
【答案】 B
【考点】众数、中位数、平均数,极差、方差与标准差
【解析】所给数据按顺序排列为: , ,3.1498,3.1547,3.1992,3.2031,所以这6个数据的中位数为 ,极差为 ,
故答案为:B。
【分析】利用实际问题的已知条件结合中位数求解公式和极差的求解公式,从而求出这6个数据的中位数与极差。
9
练习1.某市要实行新的用电制度,在实行新的用电制度之前,电部门统计了200户居民的月用电数据,绘成如图所示的频率分布直方图.新的用电制度规定:每户每用电量不超过80千瓦时,则按相对较低的价格收费;若超过80千瓦时,则超出部分按相对较高的价格收费,这样会使平均每户节省超出部分电的50%.
(1)在 , , , , , 六个用电段上,确定用户最多的用电段上的用户数;
(2)如果该市有60万户居民,估计实行新的用电制度后,该市全体居民每月节约的电量(注:同一组数据用该区间的中点值作代表)
练习2青少年“心理健康”问题越来越引起社会关注,某校对高一600名学生进行了一次“心理健康”知识测试,并从中抽取了部分学生的成绩(得分取正整数,满分100分)作为样本,绘制了下面尚未完成的频率分布表和频率分布直方图.
分组 频数 频率
[50,60) 2 0.04
[60,70) 8 0.16
[70,80) 10
[80,90)
[90,100] 14 0.28
?合计
1.00
(1)填写答题卡上频率分布表中的空格,并补全频率分布直方图;
(2)试估计该年段成绩在[70,90)段的有多少人?
(3)请你估算该年段的平均分.
练习3.容量为 的样本数据,按从小到大的顺序分为 组,如下表:
组号 1 2 3 4 5 6 7 8
频数 10 13 x 14 15 13 12 9
第三组的频数和频率分别是(?? )
? 和0.14?????????????????????????
?B.?0.14和 ?????????????????????????
?C.? 和0.14?????????????????????????
?D.? 和
?
?练习4.若样本数据 , , , 标准差为8,则数据 , , , 的标准差为(??? )
?8?????????????????????????????????B.?16??????????????????????C.?32???????????????????????????????????D.?64
9
练习1
【答案】 (1)解:由频率分布直方图,可算得各组数据对应的频率及频数,如下表:
分组
频率 0.04 0.12 0.24 0.30 0.25 0.05
频数 8 24 48 60 50 10
由频率分布表可知:用户最多的用电段为 ,用户数为60
(2)解:由(1)可知,月用电量在 内的140户居民在新的用电制度实行前后平均每月用电量不变,节约电量为0千瓦时;
月用电量在 内的50户居民,平均每户月用电为90千瓦时,超出部分为10千瓦时,实行新的用电制度后,平均每户每月节电 千瓦时,50户每月共节电 千瓦时;
月用电量在 内的10户居民,平均每户月用电为110千瓦时,超出部分为30千瓦时,实行新的用电制度后,平均每户每月节电 千瓦时,10户每月共节电 千瓦时.
故这200户居民每月共节电 千瓦时.
用样本估计总体,得该市全体居民每月节约电量约为 千瓦时.
【考点】频率分布直方图
【解析】(1)由频率分布直方图可计算得到各组数据对应的频率和频数,由此可得结果;
(2)由(1)可计算出200户居民节省的电量总数,利用样本估计总体的方法计算可得结果。
练习2
【答案】 (1)解:如图:
分组 频数 频率
[50,60) 2 0.04
[60,70) 8 0.16
[70,80) 10 0.2
[80,90) 16 0.32
[90,100] 14 0.28
合计 50 1.00
(2)解:估计该年段成绩在[70,90)段的有: (人)
(3)解:估计该年段的平均分为:
=81.4
【考点】频率分布表,频率分布直方图,众数、中位数、平均数
【解析】(1) 根据第一组的频率和频数做出样本容量,做出 [70,80) 的频率是,根据合计是1得到 [80,90) 之间的频率,进而做出它的频数,填入表格。
(2)根据前面做出的数据,用加法做出50个人中在这一个分数段的人数,再在总人数中做出结果。
(3)估计平均分,只要在每一段上能取端点数的平均数,利用加权平均数的公式带入数据得出结果。
练习3
【答案】 A
【考点】用样本的频率分布估计总体分布
【解析】解:∵由容量100的样本数据知有100个数字,
而其他组的数字个数都是已知,
∴频数为100-(10+13+14+14+13+12+90)=14
频率为 =0.14.
故答案为:A.
【分析】由频数和频率的定义代入数值计算出结果即可。
练习4
【答案】 B
【考点】极差、方差与标准差
【解析】解:由方差的性质可知, ,
因为样本数据 , , , 标准差为8,即方差为64,
则数据 , , , 的方差为 , ,即标准差为16
故答案为:B.
【分析】由已知结合方差的性质即可直接求解.