1.5.1
估计总体的分布
学案
1.通过实例进一步体会用样本估计总体的意义和作用,在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图,并体会它们各自的特点.
2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,初步体会样本频率分布的随机性.
1.以宽度分组Δxi为底,以各组频率除以Δxi的商为高,分别画成小矩形,小矩形的面积恰为______________,通常这样的图形我们称为__________________.
频率分布直方图中,每个小矩形的面积表示相应组的________,所有小矩形的面积的总和等于______.
频率分布直方图的特征:直观、形象地反映了样本的分布规律;可以清楚地看出数据分布的总体趋势.但是从频率分布直方图得不出原始的数据内容,把数据绘制成频率分布直方图后,原有的具体数据信息就被抹掉了.
2.在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的________开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条________,我们称之为频率折线图,有时也用它来估计总体的分布情况.
【做一做1】频率分布直方图中,各小矩形面积的和等于( ).
A.0
B.
C.1
D.不确定
【做一做2】在画频率分布直方图时,某组的频数为10,样本容量为50,总体容量为600,则该组的频率是( ).
A.
B.
C.
D.不确定
【做一做3】一个容量为20的样本数据,分组后,组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2.则样本在区间(-∞,50]内的频率为______.
1.列频率分布表的步骤是什么?
剖析:(1)计算数据中最大值与最小值的差称为极差,算出极差就知道数据变动的范围.
(2)决定组数与宽度分组Δxi.
(3)决定分点.
(4)列频率分布表,数据落在第i个小组内的个数为频数ni;每小组的频数与数据总数的比值叫做这一小组的频率fi,算出各小组的频率;为画图的方便还需计算出填入表中.
宽度分组(Δxi)
频数(ni)
频率(fi)
频率分布表在数量表示上比较确切,而频率分布直方图比较直观,两者相互补充,使我们对数据的频率分布情况了解得更加清楚.
2.画频率分布直方图要注意什么?
剖析:(1)注意问题:
①频率分布直方图的横轴表示数据,纵轴表示.
②在频率分布直方图中,各小矩形的面积之和等于1.
同样一组数据,分组时组距要相等,每个矩形的高和频率成正比,这点画图时应特别注意.
(2)意义:用图形的面积的大小来表示各区间内取值的频率.
题型一
画频率分布直方图
【例题1】某中学同年级40名男生的体重数据如下(单位:kg):
61 60 59 59 59 58 58 57 57 57
57 56 56 56 56 56 56 56 55 55
55 55 54 54 54 54 53 53 52 52
52 52 52 51 51 51 50 50 49 48
列出样本的频率分布表,画出频率分布直方图.
分析:画频率分布直方图的一般步骤:算极差,找组距,定分点,列频率分布表,画频率分布直方图.
反思:(1)组数的决定方法是:设数据总数目为n,一般地,当n≤50,则分为5组~8组;当50≤n≤100,则分为8组~12组较为合适;
(2)分点的决定方法是:若数据为整数,则分点数据减去0.5;若数据是小数点后一位数,则分点减去0.05,以此类推;
(3)画频率分布直方图中小长方形的高的方法是:假设频数为1的小长方形的高为h,则频数为k的小长方形的高为kh.
题型二
频率分布直方图的应用
【例题2】某工厂对一批产品进行了抽样检测,如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( ).
A.90
B.75
C.60
D.45
反思:频率分布直方图的性质:
(1)因为小矩形的面积=组距×=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率的大小.
(2)在频率分布直方图中,各小矩形的面积之和等于1.
(3)频率=,还要注意此公式的一些变形及应用.
题型三
频率分布折线图
【例题3】已知50个样本数据的分组以及各组的频数如下:
153.5~155.5,2 161.5~163.5,10
155.5~157.5,7 163.5~165.5,6
157.5~159.5,9 165.5~167.5,4
159.5~161.5,11 167.5~169.5,1
(1)列出频率分布表;
(2)画出频率分布直方图和频率分布折线图.
分析:此题按照频率分布直方图的绘制步骤解决即可.
题型四
易错辨析
【例题4】有一个容量为500的样本数据,把它分成7组,它的频率分布直方图如图,根据其频率分布直方图,请你估计数据落在[15.5,24.5)的有________个.
错解:由频率分布直方图可知数据在[15.5,18.5)内的频率为0.054,在[18.5,21.5)内的频率为0.06,在[21.5,24.5)内的频率为0.075,则数据落在[15.5,24.5)内的频率为0.054+0.06+0.075=0.189.
又因为0.189×500=94.5≈95,
所以数据落在[15.5,24.5)内的大约有95个.
错因分析:上面解法的错因就是没有看懂纵坐标所表示的意义,错误地把纵坐标表示的数据看做频率了,其实它表示的是.若要计算频率,则要知道组距为多少,从横坐标中明显可看出组距为3,那么就有频率=×组距.
1当收集到的数据量很大时,比较合适的统计图是( ).
A.茎叶图
B.频率分布直方图
C.频率分布折线统计图
D.频率分布表
2关于频率分布直方图中小长方形的高的说法,正确的是( ).
A.表示该组上的个体在样本中出现的频率
B.表示取某数的频率
C.表示该组上的个体数与组距的比值
D.表示该组上的个体在样本中出现的频率与组距的比值
3200辆汽车通过某一段公路时,时速的频率分布直方图如图所示,则时速在[50,70)的汽车大约有( ).
A.60辆
B.80辆
C.70辆
D.140辆
4(2012浙江名校第一次联考,文13)某班50名学生在一次健康体检中,身高全部介于155
cm与185
cm之间.其身高频率分布直方图如图所示.则该班级中身高在[170,185]之间的学生共有__________人.
5(2011广东汕头期中,16)某校从高一年级期末考试的学生中抽出60名学生,其英语成绩(均为整数)的频率分布直方图如图所示:
(1)估计这次考试的及格率(60分及以上为及格);
(2)估计这次考试的平均分.
答案:
基础知识·梳理
1.相应的频率fi 频率分布直方图 频率 1
2.中点 折线
【做一做1】C
【做一做2】A
【做一做3】0.7 样本在区间(-∞,50]内的频率为=0.7.
典型例题·领悟
【例题1】解:(1)计算最大值与最小值的差:61-48=13.
(2)决定组距与组数,取组距为2,
==6,
所以,共分成7组.
(3)决定分点,使分点比数据多一位小数,并把第1小组的分点减小0.5,即分成如下7组:
47.5~49.5 49.5~51.5 51.5~53.5 53.5~55.5 55.5~57.5 57.5~59.5 59.5~61.5
(4)列出频率分布表如下:
分组
频数
频率
47.5~49.5
2
0.05
49.5~51.5
5
0.125
51.5~53.5
7
0.175
53.5~55.5
8
0.20
55.5~57.5
11
0.275
57.5~59.5
5
0.125
59.5~61.5
2
0.05
合计
40
1.00
(5)画出频率分布直方图(如图所示).
【例题2】A 产品净重小于100克的频率为(0.050+0.100)×2=0.300,已知样本中产品净重小于100克的个数是36,设样本容量为n,则=0.300,所以n=120.产品净重大于或等于98克并且小于104克的频率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.故选A.
【例题3】解:(1)频率分布表如下:
分组
频数
频率
153.5~155.5
2
0.04
155.5~157.5
7
0.14
157.5~159.5
9
0.18
159.5~161.5
11
0.22
161.5~163.5
10
0.20
163.
5~165.5
6
0.12
165.5~167.5
4
0.08
167.5~169.5
1
0.02
合计
50
1.00
(2)频率分布直方图和频率分布折线图如图所示.
【例题4】正解:由频率分布直方图可知,数据分成7组,其组距为3,所以数据落在[15.5,18.5)内的频率为0.054×3,落在[18.5,21.5)内的频率为0.06×3,落在[21.5,24.5)内的频率为0.075×3,故数据落在[15.5,24.5)内的个数为500×(0.054×3+0.06×3+0.075×3)=283.5≈284.
所以数据落在[15.5,24.5)内的大约有284个.
随堂练习·巩固
1.B 当收集到的数据量很大时,一般用频率分布直方图表示.
2.D 频率分布直方图中小长方形的高是,面积才表示频率.
3.D 时速在[50,70)的频率为(0.03+0.04)×10=0.7,则200辆汽车中时速在[50,70)的汽车大约有0.7×200=140(辆).
4.22
5.解:(1)依题意,60分及以上的分数所在的第三、四、五、六组,频率和为(0.020+0.030+0.025+0.005)×10=0.80,
所以,这次考试的及格率大约是80%.
(2)利用组中值估算抽样学生的平均分:
45·f1+55·f2+65·f3+75·f4+85·f5+95·f6=45×0.05+55×0.15+65×0.2+75×0.3+85×0.25+95×0.05=72.
所以这次考试的平均分约为72分.