(共52张PPT)
第六章
3.1 从频数到频率 3.2 频率分布直方图
基础落实·必备知识一遍过
重难探究·能力素养速提升
目录索引
学以致用·随堂检测促达标
课程标准 1.了解频率与频数对总体的估计情况.
2.理解用样本的频率分布估计总体的分布的方法.
3.会列频率分布表,画频率分布直方图、频率折线图.
4.能够利用频率分布直方图解决实际问题.
基础落实·必备知识一遍过
知识点1 频率分布表与频率分布直方图
1.基本概念
名称 概念
频数、 频率 将一批数据按要求分为若干个组,各组内数据的个数,叫作该组的频数.每组频数除以全体数据个数的商叫作该组的频率.频率反映该组数据在样本中所占比例的大小
样本的 频率分布 根据随机所抽样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况)就叫作样本的频率分布
极差 若一组数据的最小值为a,最大值为b,则b-a的差就叫作极差
组距 把所有数据分成若干组,每个小组的两个端点之间的距离称为组距
2.频率分布表和频率分布直方图的意义
从一个总体得到一个包含大量数据的样本时,我们很难从一个个数据中直接看出样本所含的信息.如果把这些数据整理成频率分布表或频率分布直方图,就可以比较清楚地看出样本数据的频率分布,从而估计总体的分布情况.用样本估计总体,是研究统计问题的一个基本思想方法,而对于总体分布,我们总是用样本频率分布对它进行估计.
3.频率分布表与频率分布直方图的制作步骤
(1)频率分布是指从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.
(2)一般用频率分布直方图反映样本的频率分布.
(3)画频率分布直方图的一般步骤为:
第一步,求极差.
第二步,确定组距和组数.为了方便起见,组距的选择应力求“取整”,极差、
组距、组数有如下关系:①若 为整数,则 =组数;②若 不为整数,则 +1=组数.
([x]表示不大于x的最大整数)
第三步,分组.通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.
第四步,列频率分布表.统计各组数据的频数,计算频率,填入表格中,完成频率分布表.
第五步,依据频率分布表画频率分布直方图.画图时,以横轴表示样本数据,纵轴(小长方形的高)表示频率与组距的比值.
名师点睛
频率分布直方图的特征
总体分布情况可以通过样本频率分布情况来估计,样本频率分布是总体分布的一种近似表示,频率分布表和频率分布直方图有以下特征:(1)从频率分布直方图可以清楚地看出数据分布的总体趋势.(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.(3)频率分布表和频率分布直方图由样本决定,因此它们会随样本的变化而变化.(4)若固定分组数,随着样本容量的增加,频率分布表中各个频率会稳定在某一个值的附近,从而频率分布直方图中的各个小长方形的高度也会稳定在特定的值上.
思考辨析
1.为什么要对样本数据进行分组
2.频数分布表与频率分布直方图有什么不同
提示 不分组很难看出样本中的数据所包含的信息,分组后,计算出频率,从而估计总体的分布特征.
提示 频数分布表能使我们清楚地知道数据分布在各个小组的个数,而频率分布直方图则是从各个小组数据在样本容量中所占比例大小的角度来表示数据分布的规律.
自主诊断
1.判断正误.(正确的画√,错误的画×)
(1)一般样本容量越大,所分组数越多;样本容量越小,所分组数越少.( )
(2)频率分布直方图的纵坐标表示频率.( )
(3)频率分布直方图中小矩形的面积表示该组的频数.( )
√
×
×
2.[人教B版教材例题] 某市为了制定合理的节水方案,对家庭用水情况进行了调查,通过抽样,获得了某年100个家庭的月均用水量(单位:t),将数据按照[0,1),[1,2),[2,3),[3,4),[4,5]分成5组,制成了如图所示的频率分布直方图.
(1)求图中a的值;
(2)设该市有10万个家庭,估计全市月均用水量不低于3 t的家庭数;
(3)假设同组中的每个数据都用该组区间的中点值代替,估计全市家庭月均用水量的平均数.
解 (1)因为频率分布直方图所有矩形的面积之和为1,
所以(0.12+0.22+0.36+a+0.12)×1=1,
解得a=0.18.
(2)抽取的样本中,月均用水量不低于3 t的家庭所占比例为(a+0.12)×1=0.3=30%,
因此估计全市月均用水量不低于3 t的家庭所占比例也为30%,所求家庭数为100 000×30%=30 000.
(3)因为0.12×0.5+0.22×1.5+0.36×2.5+0.18×3.5+0.12×4.5=2.46,
所以估计全市家庭月均用水量的平均数为2.46.
知识点2 频率折线图
在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
名师点睛
频率折线图的优点是它反映了数据的变化趋势,随着样本容量的不断增加,分组的不断加密,频率折线图就会越来越接近于一条光滑的曲线.
自主诊断
判断正误.(正确的画√,错误的画×)
(1)分组越密的频率分布直方图得到的频率折线图越光滑.( )
(2)频率折线图不能反应数据的变化趋势.( )
√
×
微拓展
总体密度曲线的特征
(1)在样本频率分布直方图中,随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计学中称这条光滑曲线为总体密度曲线,如图所示.
(2)总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,图中阴影部分的面积,就是总体在区间(a,b)内取值的百分比.
重难探究·能力素养速提升
探究点一 频数与频率的有关计算
【例1】 已知一个容量是40的样本,把它分成六组,第一组到第四组的频数分别是5,6,7,10,第五组的频率是0.2,那么第六组的频数是 ,频率是 .
4
0.1
规律方法 频数与频率的求解策略
对于频数与频率的问题,首先要明确几个等量关系,即各组的频数之和等于样本容量,各组的频率之和为1,频率= .在解题过程中,要明确频数、频率以及样本容量之间的关系,弄清已知、未知,选择合适的公式进行解题.
探究点二 画频率分布直方图、频率折线图
【例2】 某省为了了解和掌握2023年高考考生的实际答卷情况,随机地取出了100名考生的数学成绩,数据如下:(单位:分)
135 98 102 110 99 121 110 96 100 103
125 97 117 113 110 92 102 109 104 112
105 124 87 131 97 102 123 104 104 128
109 123 111 103 105 92 114 108 104 102
129 126 97 100 115 111 106 117 104 109
111 89 110 121 80 120 121 104 108 118
129 99 90 99 121 123 107 111 91 100
99 101 116 97 102 108 101 95 107 101
102 108 117 99 118 106 119 97 126 108
123 119 98 121 101 113 102 103 104 108
(1)列出频率分布表;
(2)画出频率分布直方图和频率折线图;
(3)估计该省考生数学成绩在[100,120)分之间的比例.
解 在100个数据中,最大值为135,最小值为80,极差为135-80=55.取组距为5,则组数为 =11.
(1)频率分布表如下:
分组 频数 频率
[80,85) 1 0.01 0.002
[85,90) 2 0.02 0.004
[90,95) 4 0.04 0.008
[95,100) 14 0.14 0.028
[100,105) 24 0.24 0.048
[105,110) 15 0.15 0.030
[110,115) 12 0.12 0.024
[115,120) 9 0.09 0.018
[120,125) 11 0.11 0.022
[125,130) 6 0.06 0.012
[130,135] 2 0.02 0.004
合计 100 1.00 0.200
(2)根据频率分布表中的有关信息画出频率分布直方图及频率折线图,如图所示.
(3)从频率分布表中可知,这100名考生的数学成绩在[100,120)分之间的频率为0.24+0.15+0.12+0.09=0.60,据此估计该省考生数学成绩在[100,120)分之间的比例为60%.
规律方法 组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响对数据分布情况的了解,若样本容量不超过120个时,按照数据的多少常分为5组~12组,一般样本容量越大,所分组数越多.
变式训练1 为了检测某种产品的质量(单位:g),抽取了一个容量为100的样本,数据的分组情况与频数如下:
[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;[11.35,11.45),7;[11.45,11.55),4;[11.55,11.65],2.
(1)列出频率分布表;
(2)画出频率分布直方图以及频率分布折线图;
(3)根据上述图表,估计数据落在[10.95,11.35)范围内的可能性是百分之几;
(4)估计数据小于11.20的可能性是百分之几.
解 (1)频率分布表如下:
质量分组/g 频数 频率
[10.75,10.85) 3 0.03
[10.85,10.95) 9 0.09
[10.95,11.05) 13 0.13
[11.05,11.15) 16 0.16
[11.15,11.25) 26 0.26
[11.25,11.35) 20 0.20
[11.35,11.45) 7 0.07
[11.45,11.55) 4 0.04
[11.55,11.65] 2 0.02
合计 100 1.00
(2)频率分布直方图及频率分布折线图如图:
(3)由上述图表可知数据落在[10.95,11.35)范围内的频率为0.13+0.16+0.26+0.20=0.75=75%,即数据落在[10.95,11.35)范围内的可能性是75%.
(4)数据小于11.20的可能性即数据小于11.20的频率,设为x,则
(x-0.41)÷(11.20-11.15)=(0.67-0.41)÷(11.25-11.15),所以x-0.41=0.13,即x=0.54,从而估计数据小于11.20的可能性是54%.
探究点三 频率分布直方图的应用
角度1频率分布直方图中的计算问题
【例3】 某校在5月份开展了科技月活动.在活动中某班举行了小制作评比,规定作品上交的时间为5月1日到31日,逾期不得参加评比.评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:
(1)本次活动共有多少件作品参加评比
(2)哪组上交的作品数最多,有多少件
(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高
解 (1)设从左到右各长方形的高分别为2x,3x,4x,6x,4x,x.参加评比的作品总数为a,
又(2x+3x+4x+6x+4x+x)×5=1,解得a=60(件).
(2)由频率分布直方图可以看出第四组上交的作品数量最多,共有6×x×5×a=18(件).
(3)第四组上交的作品数为18,第六组上交的作品数为x×5×a=3件,则它们的获奖率分别为
规律方法 1.频率分布直方图的性质
(1)因为小矩形的面积=组距× =频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小;
(2)在频率分布直方图中,各小矩形的面积之和等于1;
(3) =样本容量.
2.频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内取值的可能性.
变式训练2为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图如图所示,图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少 样本容量是多少
(2)若次数在110或110以上为达标,试估计该校全体高一学生的达标率是多少
角度2利用频率分布直方图估计总体分布
【例4】 一个农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位: cm):
6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6
5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8
6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5
6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4
6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4
6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6
5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0
5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7
5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0
6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
根据上面的数据列出频率分布表,绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35 cm之间的麦穗所占的百分比.
解 (1)计算极差:7.4-4.0=3.4.
(2)决定组距与组数:若取组距为0.3,因为 ≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12.
(3)分组所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.
分组 频数 频率
[3.95,4.25) 1 0.01
[4.25,4.55) 1 0.01
[4.55,4.85) 2 0.02
[4.85,5.15) 5 0.05
[5.15,5.45) 11 0.11
[5.45,5.75) 15 0.15
[5.75,6.05) 28 0.28
[6.05,6.35) 13 0.13
[6.35,6.65) 11 0.11
[6.65,6.95) 10 0.10
[6.95,7.25) 2 0.02
[7.25,7.55] 1 0.01
合计 100 1.00
(4)列频率分布表:
(5)绘制频率分布直方图如图.
从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm之间的麦穗约占41%.
规律方法 1.频率分布表能比较准确地反映样本的频率分布,而频率分布直方图则能直观地反映样本的频率分布.
2.估计总体分布时,样本容量越大,估计越准确.
变式训练3公交车的数量太多容易造成资源的浪费,太少又难以满足乘客的需求.为此,公交公司在某站台随机调查了80名乘客,他们的候车时间如下所示(单位:分钟):
17 14 20 12 10 24 18 17 1 22
13 19 28 5 34 7 25 18 28 1
15 31 12 11 10 16 12 9 10 13
19 10 12 12 16 22 17 23 16 15
16 11 9 3 13 2 18 22 19 9
23 28 15 21 28 12 11 14 15 3
11 6 2 18 25 5 12 15 20 16
12 28 20 12 28 15 8 32 18 9
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率折线图.
(2)候车时间15分钟以上的频率是多少 你能为公交公司提出什么建议
解 (1)该数据中最大值为34,最小值为1,两者之差为33,故取组距为5,分为7组.
分组 频数 频率
[0,5) 6 0.075 0.015
[5,10) 9 0.112 5 0.022 5
[10,15) 22 0.275 0.055
[15,20) 22 0.275 0.055
[20,25) 10 0.125 0.025
[25,30) 8 0.100 0.020
[30,35] 3 0.037 5 0.007 5
频率分布直方图如图所示:
频率折线图如图所示:
(2)候车时间不低于15分钟的比例为0.275+0.125+0.100+0.037 5=0.537 5.
建议:公交公司可以适当增加公交车的数量.
本节要点归纳
1.知识清单:
(1)频数与频率的关系;
(2)列频率分布表、画频率分布直方图与频率折线图;
(3)频率分布直方图的应用.
2.方法归纳:数据分析.
3.常见误区:误把频率分布直方图中的纵坐标当成频率,导致计算错误.
学以致用·随堂检测促达标
1
2
3
4
5
1.一个容量为20的样本数据,分组及各组的频数如下
分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]
频数 2 3 4 5 4 2
则样本在区间[20,60)上的频率是( )
A.0.5 B.0.6 C. 0.7 D. 0.8
D
1
2
3
4
5
2.一个容量为32的样本,已知某组数据的频率为0.125,则该组数据的频数为
( )
A.2 B. 4 C. 6 D. 8
B
解析 0.125×32=4.
1
2
3
4
5
3.200辆汽车经过某一雷达地区,时速的频率分布直方图如图所示,则时速超过60 km/h(含60 km/h)的汽车数量为( )
A.65
B.76
C.88
D.95
B
解析 由频率分布直方图可得数据落在[60,80]内的频率是(0.028+0.010)×10=0.38,故时速超过60 km/h(含60 km/h)的汽车数量为200×0.38=76.
1
2
3
4
5
4.从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组: [5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )
A.10 B.18 C.20 D.36
B
解析 在[5.43,5.47)的频率为(6.25+5.00)×0.02=0.225,
0.225×80=18.故选B.
1
2
3
4
5
1
2
3
4
5
5.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图如图所示.由图中数据可知a= .若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数为 .
0.030
3
1
2
3
4
5
解析 ∵0.005×10+0.035×10+a×10+0.020×10+0.010×10=1,
∴a=0.030,设身高在[120,130),[130,140),[140,150]三组的人数分别为x,y,z.
∴ =0.030×10,∴x=30,同理y=20,z=10.
∴从[140,150]中抽取的人数为 ×18=3.
本 课 结 束