6.3用样本估计总体的分布
学习目标
1.掌握画样本数据的频率分布表和频率分布直方图的步骤和方法, 并学会利用频率分布直方图对总体进行分布规律的估计
2.理解不同的统计图在表示数据上的不同特点
3.掌握作图、用图、识图读懂统计图的能力
二、学习重难点
重点
统计的基本思想及其在实际问题中的应用价值.
难点
利用频率分布直方图对总体进行分布规律的估计
三、自主预习、知识梳理
频率反映了相对总数而言的相对强度,其所携带的总体信息远超过频数.在实际问题中,如果总体容量比较小,频数也可以较客观地反映总体分布;当总体容量较大时,________就更能客观地反映总体分布.在统计中,经常要用样本数据的________去估计总体中相应的频率,即对总体分布进行估计.
2.根据频率分布表可以画出频率分布直方图.图中每个小矩形的底边长是该组的组距,每个小矩形的高是该组的________与________的比,从而每个小矩形的面积等于该组的________,即每个小矩形的面积=组距×=频率.我们把这样的图叫作频率分布直方图.频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小.频率分布直方图的好处在于:首先,能清楚直观地显示各组频率分布情况及各组频率之间的差别;其次,当考虑数据落在若干个组内的频率之和时,可以用相应矩形________之和来表示.
3.画频率分布直方图的步骤
(1)计算极差;(2)确定组距与组数;(3)分组;(4)列表;(5)画频率分布直方图.
4.频率折线图:通常,在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的________开始,用线段依次连接各个矩形的________,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图,有时也用它来估计总体的分布情况.
五、课堂练习
1.某研究机构为了解某地年轻人的阅读情况,通过随机抽样调查了100位年轻人,对这些人每天的阅读时间(单位:min)进行统计,得到样本的频率分布直方图如图所示,则a的值为( )
A.0.02 B.0.2 C.0.04 D.0.4
2.一个容量为n的样本,已知某个体的频数和频率分别为40,0.125,则n的值为( )
A.640 B.320 C.240 D.160
3.随机抽查了某校100名高三学生的视力情况,得到的频率分布直方图如图所示,由于不慎将部分数据丢失,但知道后5组的频数和为64,设视力在4.6到4.8之间的学生人数为a,各组中频率最大的为0.34,则a的值为( )
A.64 B.54 C.48 D.27
4.在频率分布直方图中,各个小矩形的面积表示( )
A.落在相应各组的数据的频数 B.相应各组的频率
C.该样本所分成的组数 D.该样本的样本容量
5.在某样本的频率分布直方图中,共有5个小长方形,已知中间1个小长方形的面积等于其他4个小长方形面积之和的,若样本容量是100,则中间一组的频数为( )
A.20 B.30 C.25 D.35
6.某班全体学生参加一次测试,将所得分数依次分组:,,,,绘制出如图所示的成绩频率分布直方图.若低于60分的人数是18,则该班的学生人数是( )
A.50 B.54 C.60 D.64
7.(多选)统计某校n名学生的某次数学同步练习成绩(满分150分),根据成绩分数依次分成六组:,,,,,,得到频率分布直方图如图所示.若不低于140分的人数为110,则下列说法中正确的有( )
A. B.
C.100分以下的人数为60 D.分数在区间的人数占大半
8.(多选)下图为某地区2006年~2018年地方财政预算内收入、城乡居民储蓄年末余额折线图.
根据该折线图可知该地区2006年~2018年( )
A.财政预算内收入、城乡居民储蓄年末余额均呈增长趋势
B.财政预算内收入、城乡居民储蓄年末余额的逐年增长速度相同
C.财政预算内收人年平均增长量高于城乡居民储蓄年末余额年平均增长量
D城乡居民储蓄年末余额与财政预算内收入的差额逐年增大
9.从某小区抽取100户居民用户进行月用电量调查,发现他们的用电量都在之间,进行适当分组后(每组为左闭右开的区间),画出如图所示的频率分布直方图.
(1)直方图中x的值为__________;
(2)在被调查的用户中,用电量落在区间内的户数为__________.
10.某商场为了制订合理的停车收费政策,需要了解顾客的停车时长(单位:分钟).现随机抽取了该商场到访顾客的100辆车进行调查,将数据分成6组:,,,,,,并整理得到如下频率分布直方图:
(1)求样本中停车时长在区间内的频率;
(2)若某天该商场到访顾客的车辆数为1000,根据频率分布直方图估计该天停车时长在区间内的车辆数;
(3)为了吸引顾客,该商场准备给停车时长较短的车辆提供免费停车服务.若使该服务能够惠及的到访顾客的车辆,请你根据频率分布直方图,给出确定免费停车时长标准的建议.
三、课后练习
1.为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为
B.该地农户家庭年收入不低于10.5万元的农户比率估计为
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
2.北京冬奥会和冬残奥会主题口号——“一起向未来”,其英文为“Together for a Shared Future”,字母出现频数统计如下表:
字母 T F t o g e h r f a S d u
频数 1 1 2 2 1 4 2 4 1 2 1 1 2
合计总频数为24,那么字母“e”出现的频率是( )
A. B. C. D.
3.2022年2月28日,国家统计局发布了我国2021年国民经济和社会发展统计公报,2021年全国居民人均可支配收入和消费支出较上一年均有所增长,结合如下统计图,下列说法中错误的是( )
A.2017—2021年全国居民人均可支配收入逐年递增
B.2021年全国居民人均消费支出构成中教育文化娱乐占比高于医疗保健占比
C.2020年全国居民人均可支配收入较上一年下降
D.2021年全国居民人均消费支出构成中食品烟酒和居住占比之和超过50%
4.为了了解某外贸企业职工对“一带一路”的认知程度,随机抽取了110名职工组织“一带一路”知识竞赛,满分为100分(80分及以上为认知程度较高),并将所得成绩分组得到了如图所示的频率折线图.从频率折线图中得到的这110名职工成绩的以下信息正确的是( )
A.成绩是100分的人数比成绩是50分的人数多
B.对“一带一路”认知程度较高的人数是40
C.成绩是75分的人数为40
D.成绩落在内的人数为20
5.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是,样本数据分组为.
根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
A.56 B.60 C.120 D.140
6.为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:
①样本数据落在区间的频率为0.45;
②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免税政策;
③估计样本的中位数为480万元.
其中正确结论的个数为( )
A.0 B.1 C.2 D.3
7.(多选)某企业对目前销售的A,B,C,D四种产品进行改造升级,经过改造升级后,企业营收实现翻番,现统计了该企业升级前后四种产品的营收占比,得到如下饼图:
下列说法正确的是( )
A.产品升级后,产品A的营收是升级前的4倍
B.产品升级后,产品B的营收是升级前的2倍
C.产品升级后,产品C的营收减少
D.产品升级后,产品B,D的营收总和占总营收的比例不变
8.(多选)某保险公司为客户定制了5个险种:甲,一年期短期;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得到如图所示的统计图,则( )
A.丁险种参保人数超过五成
B.41岁以上参保人数超过总参保人数的五成
C.18~29周岁人群参保的总费用最少
D.人均参保费用不超过5000元
9.某学校随机抽取部分新生调查其上学所需时间(单位:min),并将所得数据绘制成频率分布直方图(如图),其中上学所需时间的范围是,样本数据分组为,,,,.
(1)求频率分布直方图中x的值;
(2)假设上学所需时间不少于1 h的学生可申请在学校住宿,若该学校有600名新生,请估计新生中有多少名学生可以申请住宿;
(3)由频率分布直方图估计该校新生上学所需时间的平均值.
10.某市统计局就2015年毕业大学生的月收入情况调查了10000人,并根据所得数据画出样本的频率分布直方图如图所示,每个分组包括左端点,不包括右端点,如第一组表示.
(1)求毕业大学生月收入在的频率;
(2)根据频率分布直方图估计样本数据的中位数;
(3)为了分析大学生的收入与所学专业、性别等方面的关系,还要再从这10000人中依月收入按分层抽样方法抽出100人进一步分析,则月收入在的毕业大学生应抽取多少人
答案及解析
一、知识梳理
1.频率;频率
2.频率;组距;频率;面积
4.中点;顶端中点
二、基础训练
1.答案:A
解析:由频率分布直方图可知,每组频率依次为0.1,10a,0.45,10a,0.05,
则,解得.
2.答案:B
解析:由频数、频率和样本容量之间的关系得,解得.故选B.
3.答案:B
解析:由题意知,前两组的频数之和为,第四组的频数为,后五组的频数之和为64,所以前二组的频数之和为,故第三组的频数为,因此.故选B.
4.答案:B
解析:频率分布直方图中,各个小矩形的面积表示相应数据的频率,它等于这组的频数除以样本容量的值,样本容量是这组数据的所有数据的个数.小矩形的个数表示该样本所分成的组数,故选B.
5.答案:C
解析:设中间1个小长方形的面积为x,则其他4个小长方形的面积之和为.由,得,所以中间一组的频数为.故选C.
6.答案:C
解析:由题中频率分布直方图可知,得分低于60分的频率为.低于60分的人数是18,该班的学生人数是.故选C.
7.答案:AC
解析:由频率分布直方图的性质,得,解得.故A正确;
因为不低于140分的频率为,所以,故B错误;
100分以下的频率为,所以100分以下的人数为,故C正确;
分数在区间的人数占,占小半.故D错误.故选AC.
8.答案:AD
解析:本题考查数据的处理与分析两条曲线均为上升趋势,从而选项A正确;两曲线间隔越来越大,说明年增长速度不同,差额逐年增大,故选项B错误,选项D正确;从图中可以看出地方财政预算内收入年平均增长量小于城乡居民储蓄年末余额年平均增长量,选项C错误,故选AD.
9.答案:(1)0.0044
(2)70
解析:(1)由,得;
(2)户数为.
故答案为:0.0044;70.
10.答案:(1)0.03
(2)820
(3)免费停车时长标准定为137.5分钟
解析:(1)设样本中停车时长在区间内的频率为x,
由题意得,解得.
所以样本中停车时长在区间内的频率为0.03.
(2)根据题中频率分布直方图可知停车时长在区间内的频率为,
所以估计该天停车时长在区间内的车辆数为.
(3)因为停车时长在内的频率为0.13,停车时长在内的频率为0.45,
所以免费停车时长标准在内,
设免费停车时长标准为y分钟,
则,解得.
故免费停车时长标准定为137.5分钟.
三、课后练习
1.答案:C
解析:由题中频率分布直方图可得,该地农户家庭年收入低于4.5万元和不低于10.5万元的频率分别为0.06和0.1,则农户比率分别为和,故A,B中结论正确;家庭年收入介于4.5万元和8.5万元之间的频率为,故D中结论正确;家庭年收入的平均值为(万元),因为,所以估计该地农户家庭年收入的平均值超过6.5万元,故C中结论不正确.
故选C.
2.答案:B
解析:由题中表格可知,字母“e”出现的频数为4,又合计总频数为24,所以字母“e”出现的频率为.故选B.
3.答案:C
解析:观察题图1可知2017—2021年全国居民人均可支配收入逐年递增,2020年全国居民人均可支配收入较上一年增长了,故A中说法正确,C中说法错误;
观察题图2可知2021年全国居民人均消费支出构成中教育文化娱乐占比为,医疗保健占比为,食品烟酒和居住占比之和为,超过,故B,D中说法均正确.故选C.
4.答案:B
解析:由于频率折线图表示的是某一范围的频率,所以从频率折线图看不出成绩是100分的人数多还是成绩是50分的人数多,也不能得出成绩是75分的人数,故A,C错误;
对于B,成绩为80分及以上的人数为,故B正确;
对于D,成绩落在内的人数为,故D错误.
故选B.
5.答案:D
解析:
6.答案:D
解析:由,得,
所以数据在区间的频率为,①正确;
数据在区间的频率为,②正确;
数据在区间的频率为0.3,数据在区间的频率为0.55,故估计中位数为,③正确.故选D.
7.答案:ABD
解析:设产品升级前的总营收为a,则产品升级后的总营收为2a.
对于产品A,产品升级前的营收为0.1a,升级后的营收为,故升级后的产品A的营收是升级前的4倍,A正确.
对于产品B,产品升级前的营收为0.2a,升级后的营收为,故升级后的产品B的营收是升级前的2倍,B正确.
对于产品C,产品升级前的营收为0.5a,升级后的营收为,故升级后的产品C的营收增加,C错误.
产品升级前后,产品B,D的营收总和占总营收的比例均为,不变,D正确.
故选ABD.
8.答案:ACD
解析:由题图1可知,丁险种参保人数所占比例为,超过五成,故A正确;由题图2可知,41岁以上参保人数所占比例为,不到五成,故B错误;
由题图2与题图3可知,周岁参保人数所占比例为,人均参保费用在区间(单位:元)内,54周岁及以上参保人数所占比例最少,为,人均参保费用为6000元,所以周岁人群参保的总费用最少,故C正确;
由题图2与题图3可知,人均参保费用不超过5000元,故D正确.
故选ACD.
9.答案:(1)0.0125(2)72(3)33.6 min
解析:(1)由频率分布直方图可得,解得.
(2)新生上学时间不少于1 h的频率为,
因为,
所以600名新生中约有72名学生可以申请住宿.
(3)由题可知.
故该校新生上学所需时间的平均值约为33.6 min.
10.答案:(1)毕业大学生月收入在的频率为
.
(2)由频率分布直方图知,中位数在内,设中位数为m,
则,解得,
所以根据频率分布直方图估计样本数据的中位数为3400.
(3)毕业大学生月收入在的频率为,
所以这10000人中月收入在的人数为.
因为要从这10000人中用分层抽样方法抽出100人,
所以月收入在的毕业大学生应抽取(人).