§3 用样本估计总体分布
3.1 从频数到频率
3.2 频率分布直方图
【课前预习】
知识点一
1.数目
诊断分析
(1)√ (2)√ [解析] (1)因为=频率,总数不变,所以某个组的频数越大,该组的频率也越大.
(2)因为=频率,总数不变,所以每个组的频数之比与频率之比相同.
知识点二
1.组距 频率
2.(1)最大值和最小值 (2)③ (5)该组上的矩形的面积
知识点三
中点 顶端中点
诊断分析
解:随着样本容量越来越大,所划分的区间个数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.
【课中探究】
探究点一
例1 (1)C (2)C (3)144 24 [解析] (1)由题可得总人数为2+6+4+10+12+5+4+2=45,分数在[100,130)内的人数为10+12+5=27,所以所求频数为27,频率为=0.6.故选C.
(2)由题意得,参加面试的人数占总人数的比例为=0.25.结合表中的数据可得,成绩在[80,90]内人数的频率为=0.25,所以估计允许参加面试的分数线为80.故选C.
(3)由题意得=,所以n=36×4=144,同理=,解得x=24.
探究点二
例2 解:(1)频率分布表如下:
分组 频数 频率
[20.5,22.5) 2 0.1 0.05
[22.5,24.5) 3 0.15 0.075
[24.5,26.5) 8 0.4 0.2
[26.5,28.5) 4 0.2 0.1
[28.5,30.5] 3 0.15 0.075
(2)由(1)中的频率分布表可得频率分布直方图和频率折线图,如图所示.
(3)由频率分布表和频率分布直方图得,样本数据出现在[23,28]内的频率为0.15+0.4+0.2=0.75,所以可以估计总体中的数据出现在[23,28]内的频率为0.75.
探究点三
提问 解:等于.
例3 解:(1)由题意可知,第二小组的频率为=0.08,
又第二小组的频数为12,所以样本容量为=150.
(2)由频率分布直方图可估计该校高一年级学生的体能达标率为×100%=88%.
(3)由(1)(2)知体能达标率为88%,样本容量为150,所以体能不达标的学生频率为1-0.88=0.12,
所以样本中体能不达标的学生人数为150×0.12=18.
变式 ABC [解析] 根据频率分布直方图知,12月份人均用电量在[10,20)内的户数最多,有1000×0.04×10=400(户),A正确;12月份人均用电量在[20,30)内的户数为1000×0.03×10=300,B正确;12月份人均用电量不低于20 kW·h的频率是(0.03+0.01+0.01)×10=0.5,有1000×0.5=500(户),C正确;人均用电量在[30,40)内的有0.01×10×1000=100(户),所以在1000户居民中任选1户,选到的居民的人均用电量在[30,40)内的概率为=,D错误.故选ABC.
拓展 解:(1)因为(0.002 4+0.003 6+a+0.004 4+0.002 4+0.001 2)×50=1,所以a=0.006.
(2)根据频率分布直方图可知月用电量不少于250 kW·h的频率为(0.002 4+0.001 2)×50=0.18,所以月用电量不少于250 kW·h的户数为100×0.18=18.
(3)设月用电量在[50,t)内的频率为0.8,即第一档用电标准为t kW·h.
因为前三组的频率之和为(0.002 4+0.003 6+0.006)×50=0.6<0.8,
前四组的频率之和为(0.002 4+0.003 6+0.006+0.004 4)×50=0.82>0.8,所以t∈[200,250),
所以t=200+≈245.5(kW·h).§3 用样本估计总体分布
3.1 从频数到频率
3.2 频率分布直方图
1.B [解析] 因为==8.9,所以分为9组较为恰当.故选B.
2.A [解析] 由题易得数据在区间[40,60)内的频率为0.8-=0.5,故样本在区间[40,60)内的数据个数为30×0.5=15.故选A.
3.B [解析] 由题意知=h,故|a-b|=组距==.
4.D [解析] 样本数据在[5.5,7.5)内的频数为2,频率为0.1;样本数据在[7.5,9.5)内的频数为6,频率为0.3;样本数据在[9.5,11.5)内的频数为7,频率为0.35;样本数据在[11.5,13.5)内的频数为5,频率为0.25.故选D.
5.D [解析] 根据频率分布直方图可知,不低于60分的频率为(0.025+0.035+0.010+0.010)×10=0.8,所以及格率为80%.故选D.
6.D [解析] 因为所有小矩形的面积之和为1,所以中间小矩形的面积是=0.25,即这一组的频率是0.25,所以这一组的频数是160×0.25=40.
7.C [解析] 设质量指标在区间[50,60)内的零件应抽取x个,则=,解得x=60,故选C.
8.ABC [解析] 估计该校高一年级学生参加3场活动的学生有1000×26%=260(人),A中说法错误;估计该校高一年级学生参加2场或4场活动的学生有1000×(20%+18%)=380(人),B中说法错误;估计该校高一年级学生参加不高于2场活动的学生有1000×(8%+10%+20%)=380(人),C中说法错误;估计该校高一年级学生参加不低于4场活动的学生有1000×(18%+12%+4%+2%)=360(人),D中说法正确.故选ABC.
9.ABC [解析] 根据频率分布直方图中各小矩形的面积之和为1,可得样本中消费支出在50元到60元之间的频率为1-10×(0.01+0.024+0.036)=0.3,A正确;样本容量n==200,则样本中消费支出不少于40元的人数为200×(0.036×10+0.3)=132,B,C正确;根据频率分布直方图可知,样本中消费支出在20元到30元之间的频率为0.1,则估计该校2000名参加研学的学生中消费支出在20元到30元之间的有200人,D错误.故选ABC.
10.30 [解析] 由题意可知,这300名学生中每周的自习时间不少于27.5小时的人数是300×0.04×2.5=30.
11.0.7 [解析] 由题意得x=20-(2+3+5+4+2)=4,则样本中数据落在[10,50)内的频率为==0.7,所以估计总体中数据m在[10,50)内的概率为0.7.
12.0.04 3,2,1 [解析] 由(0.01+0.02+a+0.06+0.07)×5=1,得a=0.04.设第3,4,5组抽取的学生人数依次为x,y,z,则x∶y∶z=0.06∶0.04∶0.02=3∶2∶1,又x+y+z=6,所以x=3,y=2,z=1.
13.解:(1)频率分布表如下:
分组 频数 频率
[153.5,155.5) 2 0.04
[155.5,157.5) 7 0.14
[157.5,159.5) 9 0.18
[159.5,161.5) 11 0.22
[161.5,163.5) 10 0.20
[163.5,165.5) 6 0.12
[165.5,167.5) 4 0.08
[167.5,169.5] 1 0.02
(2)频率分布直方图和频率折线图如图所示.
14.解:(1)由20×(0.006+0.014+0.020+0.008+a)=1,得a=0.002.
(2)由(1)知,样本中及格人数的频率为20×0.020+20×0.008+20×0.002=0.6,样本中优秀人数的频率为20×0.002=0.04,从而估计本次月考数学成绩及格和优秀的人数分别为1500×0.6=900,1500×0.04=60.
15.125 [解析] 设频率分布直方图中从左到右前3个小矩形的面积分别为P,2P,3P.由频率分布直方图可知,最后两个小矩形的面积之和为(0.087 5+0.037 5)×2=0.25.因为频率分布直方图中各小矩形的面积之和为1,所以P+2P+3P=0.75,即P=0.125,则2P=0.25,故抽取的500户居民中去年月均用电量在[37,39)内的居民共有0.25×500=125(户).
16.解:(1)频率分布表如下:
分组 频数 频率
[41,51) 2
[51,61) 1
[61,71) 4
[71,81) 6
[81,91) 10
[91,101) 5
[101,111] 2
(2)频率分布直方图如图所示.
(3)答对下述两条中的一条即可.
①该市在一个月中空气质量指数有2天处于优的水平,占当月天数的;有26天处于良的水平,占当月天数的.则处于优或良的天数为28,占当月天数的.说明该市空气质量基本良好.
②该市在一个月中空气质量为轻度污染的有2天,占当月天数的;空气质量指数在80以上且接近轻度污染的天数为15,加上处于轻度污染的2天,共17天,占当月天数的,超过50%,说明该市空气质量有待进一步改善.§3 用样本估计总体分布
3.1 从频数到频率
3.2 频率分布直方图
一、选择题(本大题共9小题,每小题5分,共45分)
1.[2023·江西分宜中学高一月考] 一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为 ( )
A.10组 B.9组
C.8组 D.7组
2.一个频数分布表(样本容量为30)不小心被损坏了一部分,如图,若样本中数据在区间[20,60)内的频率为0.8,则估计样本在区间[40,60)内的数据个数为 ( )
A.15 B.16 C.17 D.19
3.在抽查产品尺寸的过程中,将其尺寸分成若干组,[a,b)是其中的一组,该组的频率为m,该组在频率分布直方图中对应矩形的高为h,则|a-b|= ( )
A.hm B. C. D.h+m
4.已知样本数据为12,7,11,12,11,12,10,10,9,8,13,12,10,9,6,11,8,9,8,10,那么频率为0.25的样本数据的分组是 ( )
A.[5.5,7.5) B.[7.5,9.5)
C.[9.5,11.5) D.[11.5,13.5)
5.[2023·河南南阳邓州春雨国文学校高一月考] 统计某校1000名学生的数学测试成绩(单位:分),得到样本的频率分布直方图如图所示.若满分为100分,规定不低于60分为及格,则及格率是 ( )
A.20% B.25% C.60% D.80%
6.在样本频率分布直方图中共有11个小矩形,若中间一个小矩形的面积等于所有小矩形面积之和的,样本容量是160,则中间一组的频数是 ( )
A.0.2 B.0.25 C.32 D.40
7.[2023·山西大同汇林中学高一月考] 某车间从生产的一批零件中随机抽取了1000个进行一项质量指标的检测,整理检测结果得到此项质量指标的频率分布直方图如图所示.若用分层随机抽样的方法从质量指标在区间[40,70)内的零件中抽取170个进行再次检测,则质量指标在区间[50,60)内的零件应抽取 ( )
A.30个 B.40个 C.60个 D.70个
8.(多选题)为弘扬中华民族优秀传统文化,某中学学生会从本校高一年级1000名学生中随机抽取50名学生,调查他们课余时间参加优秀传统文化活动的情况,将所得数据分组整理后,得到下表:
参加场数 0 1 2 3 4 5 6 7
人数占调查人数的百分比 8% 10% 20% 26% 18% 12% 4% 2%
用样本频率分布估计总体分布,则下列说法中错误的是 ( )
A.估计该校高一年级学生参加3场活动的学生有360人
B.估计该校高一年级学生参加2场或4场活动的学生有480人
C.估计该校高一年级学生参加不高于2场活动的学生有280人
D.估计该校高一年级学生参加不低于4场活动的学生有360人
9.(多选题)[2023·陕西汉中城固二中高一月考] 某学校为了调查学生某次研学活动中的消费支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在50元到60元之间的学生有60人,则 ( )
A.样本中消费支出在50元到60元之间的频率为0.3
B.样本中消费支出不少于40元的人数为132
C.n的值为200
D.若该校有2000名学生参加研学,则估计有20人的消费支出在20元到30元之间
二、填空题(本大题共3小题,每小题5分,共15分)
10.某高校调查了300名学生每周的自习时间(单位:小时),其中自习时间的范围是[17.5,30],并制成了频率分布直方图,如图所示,样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图可知,这300名学生中每周的自习时间不少于27.5小时的人数是 .
11.[2023·湖北十堰高一期中] 从总体中随机抽取一个容量为20的样本,其数据的分组及各组的频数如下:[10,20),2;[20,30),3;[30,40),x;[40,50),5;[50,60),4;[60,70),2.根据样本的频率分布,估计总体中数据m在[10,50)内的概率为 .
12.为了解学生的身体状况,某校随机抽取了一批学生测量体重.经统计,这批学生的体重(单位:kg)数据全部介于45至70之间.将数据分成以下5组:第1组[45,50),第2组[50,55),第3组[55,60),第4组[60,65),第5组[65,70].整理得到如图所示的频率分布直方图,则a= .现采用分层随机抽样的方法,从第3,4,5组中随机抽取6名学生,则第3,4,5组抽取的学生人数依次为 .
三、解答题(本大题共2小题,共20分)
13.(10分)已知50个样本数据的分组以及各组的频数如下:
[153.5,155.5),2;[155.5,157.5),7;[157.5,159.5),9;[159.5,161.5),11;[161.5,163.5),10;[163.5,165.5),6;[165.5,167.5),4;[167.5,169.5],1.
(1)列出频率分布表;
(2)画出频率分布直方图和频率折线图.
14.(10分)[2023·四川德阳高一期末] 为了解某中学高一学生的某次月考的数学成绩,备课组人员随机抽取了100名学生的数学成绩,根据所得数据制成如图所示的频率分布直方图.已知成绩不低于90分为及格,不低于130分为优秀.
(1)求实数a的值;
(2)若参加本次月考的学生总人数为1500,试根据样本的相关信息估计本次月考数学成绩及格和优秀的人数.
15.(5分)某乡镇供电所为了调查农村居民用电量情况,随机抽取了500户居民去年的月均用电量(单位:kW·h),将所得数据整理后按[35,37),[37,39),[39,41),[41,43),[43,45]分组,并画出频率分布直方图如图所示.直方图中从左到右前3个小矩形的面积之比为1∶2∶3,则抽取的500户居民中去年月均用电量在[37,39)内的居民共有 户.
16.(15分)某市某年4月1日~4月30日对空气质量指数的监测数据如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
(1)将空气质量指数按[41,51),[51,61),…,[91,101),[101,111]分组,列出频率分布表.
(2)画出频率分布直方图.
(3)根据国家标准,空气质量指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻度污染;在151~200之间时,为中度污染.
请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.(共31张PPT)
§3 用样本估计总体分布
3.1 从频数到频率
3.2 频率分布直方图
◆ 课前预习
◆ 课中探究
◆ 备课素材
◆ 备用习题
【学习目标】
1.了解频数与频率的关系.
2.掌握频率分布直方图的画法.
3.会用频率分布直方图或频率折线图估计总体分布.
4.会利用频率分布直方图或频率折线图解决实际问题.
知识点一 频数与频率
1.频数:在统计学中,将样本按照一定的方法分成若干组,每个组内含有这个
样本的个体的______叫作频数.
数目
2.频率:某个组的频数与总数的比值叫作这个组的频率,即 频率.
【诊断分析】
判断正误.(请在括号中打“√”或“×”)
(1)总数不变的情况下,某个组的频数越大,则该组的频率也越大.( )
√
[解析] 因为 频率,总数不变,所以某个组的频数越大,该组的频率也越
大.
(2)每个组的频数之比与频率之比是一样的.( )
√
[解析] 因为 频率,总数不变,所以每个组的频数之比与频率之比相同.
知识点二 频率分布直方图
1.概念
图中每个小矩形的底边长是该组的______,每个小矩形的高是该组的频率与组
距的比,从而每个小矩形的面积等于该组的______,即每个小矩形的面积 组
距 频率.我们把这样的图叫作频率分布直方图.频率分布直方图以面积的
形式反映了数据落在各个小组的频率的大小.
组距
频率
2.绘制频率分布直方图的步骤
(1)计算极差
极差即一组数据中________________的差.
最大值和最小值
(2)确定组距与组数
①组距与组数的确定没有固定的标准,常常需要一个尝试与选择的过程.
②组距和样本容量有关,一般样本容量越大,分的组也越多,当样本容量不超
过120时,按照数据的多少,常分为5组 组.
③极差、组距、组数之间有如下关系:
设_ _____,若,则组数为;若,则组数为大于 的最小整数.
(3)将数据分组
按组距将数据分组,分组时,各组一般均为左闭右开区间,最后一组全是闭区间.
(4)列频率分布表
(5)画频率分布直方图
画图时,应以横轴表示分组,纵轴表示各组频率与组距的比值,其相应组距上
的频率应该等于____________________.
该组上的矩形的面积
知识点三 频率折线图
在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加
的左边区间的______开始,用线段依次连接各个矩形的__________,直至右边
所加区间的中点,就可以得到一条折线,称之为频率折线图.
中点
顶端中点
【诊断分析】
样本容量越大,频率折线图就会越来越接近于一条光滑曲线吗?
解:随着样本容量越来越大,所划分的区间个数也可以随之增多,而每个区间
的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.
探究点一 频数与频率
例1(1) 某班学生在一次数学考试中各分数段以及人数为: ,2人;
,6人;,4人;,10人; ,12人;
,5人;,4人; ,2人.那么分数在 内的
频数以及频率分别为( )
C
A.27, B.20, C.27, D.13,
[解析] 由题可得总人数为 ,分数在
内的人数为,所以所求频数为27,频率为 .
故选C.
(2)某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩
择优选出100人参加面试.现随机抽取了24名笔试者的成绩,统计结果如下表所示:
分数段
人数 2 3 4 9 5 1
据此估计允许参加面试的分数线是( )
C
A.90 B.85 C.80 D.75
[解析] 由题意得,参加面试的人数占总人数的比例为 结合表中的数
据可得,成绩在内人数的频率为 ,所以估计允许参加面试的分
数线为80.故选C.
(3)一个容量为 的样本,将其观测数据分成若干组,已知甲组的频数和频
率分别为36和,则_____,频率为的乙组的频数 ____.
144
24
[解析] 由题意得,所以,同理,解得 .
[素养小结]
要解决频数与频率的问题,首先要明确几个关系,即各组的频数之和等于样本
容量,各组的频率之和为1,频率 .
探究点二 画频率分布直方图和频率折线图
例2 已知一组样本数据:30,29,26,24,25,27,26,22,24,25,26,28,
25,21,23,25,27,29,25,28.按 ,
, 分成5组.
(1)列出样本的频率分布表;
解:频率分布表如下:
分组 频数 频率
2 0.1 0.05
3 0.15 0.075
8 0.4 0.2
4 0.2 0.1
3 0.15 0.075
(2)画出频率分布直方图和频率折线图;
解:由(1)中的频率分布表可得频率分布直方图和频率折线图,如图所示.
(3)根据频率分布直方图,估计总体中的数据出现在 内的频率.
解:由频率分布表和频率分布直方图得,样本数据出现在 内的频率为
,所以可以估计总体中的数据出现在 内的频率为
0.75.
[素养小结]
绘制频率分布直方图的关键点
(1)在画频率分布直方图时,横轴表示随机变量的取值,纵轴表示 ,这样
每一组的频率都可以用该组的组距为底, 为高的小矩形的面积来表示,其
中,矩形的高 频数;
(2)同一组数据,如果组距不同,得到的频率分布直方图也会不同.
探究点三 频率分布直方图的应用
[提问] 在频率分布直方图中,各小矩形的高度之比、面积之比都等于对
应频率之比吗?
解:等于.
例3 为了了解高一年级学生的体能情况,某校
抽取部分学生进行一分钟跳绳次数测试.将所得数
据整理后,画出频率分布直方图(如图所示),
图中从左到右各小长方形的面积之比为
,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
解:由题意可知,第二小组的频率为 ,
又第二小组的频数为12,所以样本容量为 .
(2)若次数在110以上(含110次)为体能达标,则估计该校全体高一年级学生
的体能达标率是多少?
解:由频率分布直方图可估计该校高一年级学生的体能达标率为
.
(3)样本中体能不达标的学生人数是多少?
解:由知体能达标率为 ,样本容量为150,所以体能不达标的学生频
率为 ,
所以样本中体能不达标的学生人数为 .
变式 (多选题)[2023·江西铜鼓中学高一月考] 供
电部门对某社区1000户居民12月份人均用电情况进行
统计后,按人均用电量(单位: )分为
,, 五组,整理得到
如图所示的频率分布直方图,则有关这1000户居民,下列说法正确的是( )
ABC
A.12月份人均用电量在 内的户数最多,有400户
B.12月份人均用电量在 内的有300户
C.12月份人均用电量不低于 的有500户
D.在这1000户居民中任选1户做进一步调查,选到的居民的人均用电量在 内
的概率为
[解析] 根据频率分布直方图知,12月份人均用电量在 内的户数最多,有
(户),A正确;
12月份人均用电量在 内的户数为,B正确;
12月份人均用电量不低于 的频率是,
有 (户),C正确;
人均用电量在内的有 (户),
所以在1000户居民中任选1户,选到的居民的人均用电量在内的概率为
,D错误.
故选 .
[素养小结]
频率分布直方图的性质:
(1)因为小矩形的面积组距 频率,所以各小矩形的面积表示相应各
组的频率,这样,频率分布直方图就以面积的形式反映了数据落在各个小组内
的频率大小.
(2)在频率分布直方图中,各小矩形的面积之和等于1.
(3) 样本容量.
拓展 为了解某市家庭用电量的情况,该市统计局调查了100户居民去年一年
的月均用电量(单位:),发现他们的月均用电量都在 内,
按,, ,
分组后,画出频率分布直方图如图所示.
(1)求 的值;
解:因为 ,
所以 .
(2)求在被调查的用户中,月均用电量不少于 的户数;
解:根据频率分布直方图可知月用电量不少于 的频率为
,所以月用电量不少于 的户数为
.
(3)为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采
用阶梯定价,希望使 的居民缴费在第一档(费用最低),请给出第一档用
电标准(单位: )的建议,并简要说明理由.(结果保留一位小数)
解:设月用电量在内的频率为,即第一档用电标准为 .
因为前三组的频率之和为 ,前四组
的频率之和为 ,
所以 ,所以 .
1.频数与频率如何对总体分布进行估计?
在实际问题中,如果总体容量较小,频数也可以较客观地反映总体分布;如果
总体容量较大,频率就更能客观地反映总体分布.
2.画频率分布直方图要注意什么?
(1)频率分布直方图的横轴表示数据,纵轴表示 ;
(2)频率分布直方图中,各小矩形的面积之和等于1;
(3)同样一组数据,分组时组距要相等,直方图中每个矩形的高和频率成正比,
这点画图时应特别注意.
分清频率分布直方图中横、纵坐标表示的意义
例 [2024·辽宁沈阳高一期末] 在某市高一年级举行
的一次数学调研考试中,为了了解考生的成绩状况,
现抽取了 名考生的成绩,作出如图所示的频率分布
直方图(所有考生的成绩均在 内,按照
, , 分组).
30
[解析] 依题意,,得 ,
所以成绩在内的考生人数为 .
若在样本中,成绩在 内的考生人数为50,则成绩在 内的考生人数
为____.§3 用样本估计总体分布
3.1 从频数到频率
3.2 频率分布直方图
【学习目标】
1.了解频数与频率的关系.
2.掌握频率分布直方图的画法.
3.会用频率分布直方图或频率折线图估计总体分布.
4.会利用频率分布直方图或频率折线图解决实际问题.
◆ 知识点一 频数与频率
1.频数:在统计学中,将样本按照一定的方法分成若干组,每个组内含有这个样本的个体的 叫作频数.
2.频率:某个组的频数与总数的比值叫作这个组的频率,即=频率.
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)总数不变的情况下,某个组的频数越大,则该组的频率也越大. ( )
(2)每个组的频数之比与频率之比是一样的. ( )
◆ 知识点二 频率分布直方图
1.概念
图中每个小矩形的底边长是该组的 ,每个小矩形的高是该组的频率与组距的比,从而每个小矩形的面积等于该组的 ,即每个小矩形的面积=组距×=频率.我们把这样的图叫作频率分布直方图.频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小.
2.绘制频率分布直方图的步骤
(1)计算极差
极差即一组数据中 的差.
(2)确定组距与组数
①组距与组数的确定没有固定的标准,常常需要一个尝试与选择的过程.
②组距和样本容量有关,一般样本容量越大,分的组也越多,当样本容量不超过120时,按照数据的多少,常分为5组~12组.
③极差、组距、组数之间有如下关系:
设k= ,若k∈Z,则组数为k;若k Z,则组数为大于k的最小整数.
(3)将数据分组
按组距将数据分组,分组时,各组一般均为左闭右开区间,最后一组全是闭区间.
(4)列频率分布表
(5)画频率分布直方图
画图时,应以横轴表示分组,纵轴表示各组频率与组距的比值,其相应组距上的频率应该等于 .
◆ 知识点三 频率折线图
在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的 开始,用线段依次连接各个矩形的 ,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.
【诊断分析】 样本容量越大,频率折线图就会越来越接近于一条光滑曲线吗
◆ 探究点一 频数与频率
例1 (1)某班学生在一次数学考试中各分数段以及人数为:[0,80),2人;[80,90),6人;[90,100),4人;[100,110),10人;[110,120),12人;[120,130),5人;[130,140),4人;[140,150],2人.那么分数在[100,130)内的频数以及频率分别为 ( )
A.27,0.56
B.20,0.56
C.27,0.6
D.13,0.29
(2)某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机抽取了24名笔试者的成绩,统计结果如下表所示:
分数段 [60,65) [65,70) [70,75) [75,80) [80,85) [85,90]
人数 2 3 4 9 5 1
据此估计允许参加面试的分数线是 ( )
A.90 B.85 C.80 D.75
(3)一个容量为n的样本,将其观测数据分成若干组,已知甲组的频数和频率分别为36和,则n= ,频率为的乙组的频数x= .
[素养小结]
要解决频数与频率的问题,首先要明确几个关系,即各组的频数之和等于样本容量,各组的频率之和为1,频率=.
◆ 探究点二 画频率分布直方图和频率折线图
例2 已知一组样本数据:30,29,26,24,25,27,26,22,24,25,26,28,25,21,23,25,27,29,25,28.按[20.5,22.5),[22.5,24.5),[24.5,26.5),[26.5,28.5),[28.5,30.5]分成5组.
(1)列出样本的频率分布表;
(2)画出频率分布直方图和频率折线图;
(3)根据频率分布直方图,估计总体中的数据出现在[23,28]内的频率.
[素养小结]
绘制频率分布直方图的关键点
(1)在画频率分布直方图时,横轴表示随机变量的取值,纵轴表示,这样每一组的频率都可以用该组的组距为底,为高的小矩形的面积来表示,其中,矩形的高==×频数;
(2)同一组数据,如果组距不同,得到的频率分布直方图也会不同.
◆ 探究点三 频率分布直方图的应用
[提问] 在频率分布直方图中,各小矩形的高度之比、面积之比都等于对应频率之比吗
例3 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试.将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少 样本容量是多少
(2)若次数在110以上(含110次)为体能达标,则估计该校全体高一年级学生的体能达标率是多少
(3)样本中体能不达标的学生人数是多少
变式 (多选题)[2023·江西铜鼓中学高一月考] 供电部门对某社区1000户居民12月份人均用电情况进行统计后,按人均用电量(单位:kW·h)分为[0,10),[10,20),[20,30),[30,40),[40,50]五组,整理得到如图所示的频率分布直方图,则有关这1000户居民,下列说法正确的是 ( )
A.12月份人均用电量在[10,20)内的户数最多,有400户
B.12月份人均用电量在[20,30)内的有300户
C.12月份人均用电量不低于20 kW·h的有500户
D.在这1000户居民中任选1户做进一步调查,选到的居民的人均用电量在[30,40)内的概率为
[素养小结]
频率分布直方图的性质:
(1)因为小矩形的面积=组距×=频率,所以各小矩形的面积表示相应各组的频率,这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
(2)在频率分布直方图中,各小矩形的面积之和等于1.
(3)=样本容量.
拓展 为了解某市家庭用电量的情况,该市统计局调查了100户居民去年一年的月均用电量(单位:kW·h),发现他们的月均用电量都在[50,350]内,按[50,100),[100,150),[150,200),[200,250),[250,300),[300,350]分组后,画出频率分布直方图如图所示.
(1)求a的值;
(2)求在被调查的用户中,月均用电量不少于250 kW·h的户数;
(3)为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯定价,希望使80%的居民缴费在第一档(费用最低),请给出第一档用电标准(单位:kW·h)的建议,并简要说明理由.(结果保留一位小数)