(新教材)高中数学人教B版必修第二册 5.1.3 数据的直观表示(38张PPT+33张PPT课件+学案)

文档属性

名称 (新教材)高中数学人教B版必修第二册 5.1.3 数据的直观表示(38张PPT+33张PPT课件+学案)
格式 zip
文件大小 7.8MB
资源类型 教案
版本资源 人教B版(2019)
科目 数学
更新时间 2019-12-10 17:19:21

文档简介

5.1.3 数据的直观表示
第一课时 柱形图、折线图、扇形图和茎叶图
课标要求
素养要求
1.能根据所给数据和需要作出统计图.
2.能根据统计图提供的信息,解决实际问题.
通过对各种统计图的认识与应用,提升学生的数据分析素养.
教材知识探究
 2018年某市居民的支出构成情况如下表所示:
食品
衣着
家庭设备用品及服务
医疗
保健
交通和通信
教育文化娱乐服务
居住
杂项商品和服务
39.4%
5.9%
6.2%
7.0%
10.7%
15.9%
11.4%
3.5%
问题1 要直观、形象地表示这些数据间的数量关系,应作出哪种统计图?
问题2 要直观、形象地表示这些数据在全部数据中所占的比例,应作出哪种统计图?
提示1 柱形图.
提示2 扇形图.
1.柱形图 形象地比较各数据之间的数量关系,有折线图
柱形图(也称为条形图)中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,柱形图中每一矩形都是等宽的.
2.折线图 反映数据的变化情况
一般地,如果数据是随时间变化的,想了解数据的变化情况,可将数据用折线图来表示.当然,折线图也可以用在其他情形中.
3.扇形图 无折线图
扇形图可以形象地表示出各部分数据在全部数据中所占的比例情况.扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
4.茎叶图 无折线图,能保留原始数据
一般来说,茎叶图中,所有的茎都竖直排列,而叶沿水平方向排列.茎叶图也可以只表示一组数.
将一组数整理成茎叶图后,如果每一行的数都是按从大到小(或从小到大)顺序排列,则从中可以方便地看出这组数的最值、中位数等数字特征.
(1)从茎叶图中还可以看出一组数的分布情况,从而可能可以得到一些额外的信息.
(2)可以估计出一组数据的平均数所在区间.
(3)还可以估计出两组数据平均数及方差的相对大小.
教材拓展补遗
[微判断]
1.柱形(条形)图中,每一矩形是等宽的,小矩形间的距离一般相等.(√)
2.由柱形图,可以作出折线图.(√)
3.扇形图与半径大小有关.(×)
提示 扇形图与半径无关.
4.茎叶图的茎可能是一位数字,也可能是多位数字.(√)
[微训练]
1.如图所示,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB,则(  )
A.A>B,sA>sB B.A<B,sA>sB
C.A>B,sA解析 A中的数据都不大于B中的数据,所以A<B,但A中的数据比B中的数据波动幅度大,所以sA>sB.
答案 B
2.某校为了了解学生的睡眠情况,随机调查了50名学生,得到他们在某一天各自的睡眠时间的数据,结果如图所示.根据此条形图可得这50名学生这一天平均每人的睡眠时间为________h.
解析 根据图形得,平均每人的睡眠时间t=5.5×0.1+6×0.3+6.5×0.4+7×0.1+7.5×0.1=6.4(h).
答案 6.4
3.某省选拔运动员参加运动会,测得7名选手的身高(单位:cm)分布茎叶图如图所示,记录的平均身高为177 cm,其中有一名候选人的身高记录不清,其末位数为x,那么x的值为________.
解析 依题意得,180×2+1+170×5+3+x+8+9=177×7,x=8.
答案 8
[微思考]
在扇形图中,部分数据在全部数据中的比例等于对应的扇形面积与整个圆面积的比吗?为什么?
提示 等于,因为==(扇形圆心角为n°).
题型一 柱形图与折线图

【例1】 2015年7月6日的《中国青年报》报道:“根据调查,有担当(76.3%)和踏实(74.5%)的年轻人最被受访者欣赏.奋进(54.7%)、坚毅(54.1%)、有梦想(50.2%)、有闯劲儿(40.1%)、沉稳(36.7%)、直率(34.6%)、幽默(33.4%)、活泼(27.2%)、庄重(20.3%)、洒脱(20%)也是受访者欣赏的品质.”为形象地表示这一调查结果,
(1)作出柱形图;
(2)作出折线图.
解 (1)柱形图如图①
图①
(2)方法一 取图①中各小矩形上面的中点用线段连接起来(图略),即得折线图.
方法二 直接作出折线图如图②
图②
其中横轴上的1,2,3,…,12分别表示“有担当”,“踏实”,…,“洒脱”.
规律方法 1.柱形图中,各小矩形宽相等;
2.注意横、纵轴的意义;
3.由柱形图可以作出折线图:取各小矩形上边的中点,再用线段连接,取各小矩形下边的中点并标注上数字,要说明标注数字所对应的数据类型.
【训练1】 某射击运动员一次射击训练的成绩可以整理成如图所示的柱形图,试计算这次成绩的平均数与方差.
解 设运动员共射击了n次,则由图可知,射中7环与10环的次数为0.2n,射中8环与9环的次数为0.3n.因此平均数为

=0.2×7+0.3×8+0.3×9+0.2×10=8.5.
类似地,可以算出方差为
0.2×(7-8.5)2+0.3×(8-8.5)2+0.3×(9-8.5)2+0.2×(10-8.5)2=1.05.
题型二 扇形图
【例2】 某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示,现在用分层随机抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为________;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为________小时.
解析 由分层随机抽样可知,第一分厂应抽取100×50%=50(件),
该产品的平均使用寿命为
=1 015(小时).
答案 50 1 015
规律方法 在扇形图中,部分数据在全部数据中的比例等于对应扇形的圆心角度数与360°之比,等于对应扇形的弧长与周长之比,也等于对应扇形面积与圆面积之比.
【训练2】 某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本.若用分层随机抽样方法,则40岁以下年龄段应抽取________人.
解析 分层随机抽样时,由于40岁以下年龄段占总数的50%,故容量为40的样本中在40岁以下年龄段中应抽取40×50%=20(人).
答案 20
题型三 茎叶图
【例3】 某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:
甲:95,81,75,91,86,89,71,65,76,88,94,110,107;
乙:83,86,93,99,88,103,98,114,98,79,78,106,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
解析 甲、乙两人数学成绩的茎叶图如图所示.
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,叶主要集中在8、9、10的茎上;甲同学的得分情况也是
大致对称,叶主要集中在7、8、9的茎上.乙同学的成绩总体情况比甲同学好.
规律方法 茎叶图的画法步骤
(1)将每个数据分为茎(高位)和叶(低位)两部分.
(2)将最小的茎和最大的茎之间的数按从小到大的顺序从上到下列出,茎相同者共用一个茎,再画上竖线作为分界线.
(3)将各个数据的叶写在其茎右(左)侧.
【训练3】 从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示),设甲、乙两组数据的平均数分别为甲,乙,中位数分别为m甲,m乙,则(  )
A.甲<乙,m甲>m乙
B.甲<乙,m甲C.甲>乙,m甲>m乙
D.甲>乙,m甲解析 由茎叶图知,甲的平均数为(5+6+8+10+10+14+18+18+22+25+27+30+30+38+41+43)÷16=21.562 5,
乙的平均数为(10+12+18+20+22+23+23+27+31+32+34+34+38+42+43+48)÷16=28.562 5,
所以甲<乙.
甲的中位数为(18+22)÷2=20,乙的中位数为(27+31)÷2=29,
所以m甲答案 B
一、素养落地
1.通过学习柱形图、折线图、扇形图和茎叶图这四种统计图,提升数据分析素养.
2.通过这四种统计图,对凌乱、没有规律的数据加以整理,并用合适的统计图形象化,能看出数据的特征,有利于挖掘有关信息.
3.要根据要解决的问题或关注了解的信息选取合适的统计图,利用茎叶图可以估计数据的一些数据特征.
4.本节的统计图能保留原始数据.
二、素养训练
1.若某校高一年级8个班参加合唱比赛的得分如茎叶图如图所示,则这组数据的中位数和平均数分别是(  )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
解析 将这组数据从小到大排列,得
87,89,90,91,92,93,94,96.
故平均数==91.5,
中位数为=91.5,故选A.
答案 A
2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为m0,平均数为,则(  )
A.me=m0= B.me=m0<
C.me=m0< D.m0解析 将30个数从小到大排列,其中第15个数是5,第16个数是6,故中位数me==5.5,众数m0=5,平均数=×(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)=,
所以m0答案 D
3.甲、乙两个小组各8名同学的英语口语测试成绩的茎叶图如图所示,则甲、乙两组的平均数与中位数之差较大的是________组.
解析 由茎叶图可知,甲的平均数和中位数分别是83.625和83.5;乙的平均数和中位数分别是82.25和81,故乙的平均数和中位数的差较大.
答案 乙
4.国家统计局网站显示,2011~2015年高中在校学生数信息如下.
年份
2011年
2012年
2013年
2014年
2015年
高中在校学生数/万
2 454.82
2 467.17
2 435.881 7
2 400.472 3
2 374.399 2
画出折线图,并指出这几年高中在校学生数的变化趋势.
解 用折线图来表示上述情境与问题中的数据如图所示.
由折线图可以看出,从2012年起,高中在校学生数逐年减少.
基础达标
一、选择题
1.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为(  )
A.93 B.123
C.137 D.167
解析 初中部的女教师人数为110×70%=77,高中部的女教师人数为150×(1-60%)=60,该校女教师的人数为77+60=137,故选C.
答案 C
2.如图是某次拉丁舞比赛七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则a1,a2的大小关系是(  )
A.a1=a2 B.a1>a2
C.a2>a1 D.无法确定
解析 由茎叶图,得甲、乙两名选手得分的平均数分别为a1==84,a2==85,即a2>a1.
答案 C
3.根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中正确的个数是(  )
①逐年比较,2008年减少二氧化硫排放量的效果最显著
②2007年我国治理二氧化硫排放显现成效
③2006年以来我国二氧化硫年排放量呈减少趋势
④2004~2006年我国二氧化硫排放量逐年增加
A.1 B.2
C.3 D.4
解析 依据给出的柱形图,逐项验证.
对于①,由图知从2007年到2008年二氧化硫排放量下降得最多,故①正确;对于②,由图知,由2006年到2007年矩形高度明显下降,因此②正确;对于③,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以③正确;由图知2004年~2006年我国二氧化硫年排放量逐年增加,故④正确,故选D.
答案 D
4.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是(  )
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
解析 对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;对于选项C、D,由图可知显然正确.故选A.
答案 A
5.我国农民工收入持续快速增长.某地区农民工人均月收入增长率如图1,并将人均月收入绘制成如图2的不完整的条形统计图.
根据以上统计图来判断以下说法错误的是(  )
A.2013年农民工人均月收入的增长率是10%
B.2011年农民工人均月收入是2 205元
C.李明看了统计图后说:“农民工2012年的人均月收入比2011年的少了.”
D.2009年到2013年这五年中2013年农民工人均月收入最高
解析 A.由折线统计图可得出:2013年农民工人均月收入的增长率是10%,故正确;B.由条形统计图可得出:2011年农民工人均月收入是2 205元,故正确;C.因为2012年农民工人均月收入是2 205×(1+20%)=2 646(元),大于2 205元,所以农民工2012年的人均月收入比2011年的少了,是错误的;D.由条形统计图可得出,2009年到2013年这五年中2013年农民工人均月收入最高,故正确.
答案 C
二、填空题
6.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________,________.
解析 甲组数据为:28,31,39,42,45,55,57,58,66,中位数为45;
乙组数据为:29,34,35,42,46,48,53,55,67,中位数为46.
答案 45 46
7.已知甲、乙两组数可分别用图(1)(2)表示,估计这两组数的平均数的相对大小是甲________乙,方差的相对大小是s________s(填“>”或“<”或“=”).
解析 甲=(10×2+20×6+30×6+40×2)=25,
乙=(10×3+20×5+30×5+40×3)=25,
s=[(10-25)2×2+(20-25)2×6+(30-25)2×6+(40-25)2×2]=75,
s=[(10-25)2×3+(20-25)2×5+(30-25)2×5+(40-25)2×3]=100,
故甲=乙,s答案 = <
8.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是________.
①各月的平均最低气温都在0 ℃以上
②七月的平均温差比一月的平均温差大
③三月和十一月的平均最高气温基本相同
④平均最高气温高于20 ℃的月份有5个
解析 依据给出的雷达图,逐项验证.
对于①,由图易知各月的平均最低气温都在0 ℃以上,①正确;对于②,七月的平均最高气温点与平均最低气温点间的距离大于一月的平均最高气温点与平均最低气温点间的距离,所以七月的平均温差比一月的平均温差大,②正确;对于③,三月和十一月的平均最高气温均为10 ℃,所以③正确;对于④,平均最高气温高于20 ℃的月份有七月、八月、共2个月份,故④错误.
答案 ④
三、解答题
9.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图所示.
(1)根据茎叶图判断哪个班的平均身高较高;
(2)计算甲班的样本方差;
(3)用样本数据估计甲班总体中有多少数据落入区间(-s,+s)中.
解 (1)由茎叶图可知,甲班身高集中于160~179 cm之间,而乙班身高集中于170~180 cm之间.因此,乙班平均身高高于甲班.
(2)==170.
甲班的样本方差为×[(158-170)2+(162-170)2+(163-170)2+(168-170)2+(168-170)2+(170-170)2+(171-170)2+(179-170)2+(179-170)2+(182-170)2]=57.2.
(3)由(2)知,s≈7.56,故区间(-s,+s)=(162.44,177.56).由茎叶图可知,甲班总体中落入区间(162.44,177.56)中的数据约为=50%.
10.甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示.
(1)请填写下表:
平均数
中位数
命中9环以上(含9环)次数


(2)从下列三个不同角度对这次测试结果进行分析:
①从平均数和中位数相结合看,谁的成绩好些?
②从平均数和命中9环以上(含9环)的次数相结合看,谁的成绩好些?
③从折线图中两人射击命中环数的走势看,谁更有潜力?
解 (1)由题图可知,甲打靶的成绩为2,4,6,8,7,7,8,9,9,10;乙打靶的打绩为9,5,7,8,7,6,8,6,7,7.
则甲的平均数是7,中位数是7.5,命中9环以上(含9环)的次数是3;
乙的平均数是7,中位数是7,命中9环以上(含9环)的次数是1.
(2)由(1)知,甲、乙的平均数相同.
①甲、乙的平均数相同,甲的中位数比乙的中位数大 ,所以甲成绩较好.
②甲、乙的平均数相同,甲命中9环以上(含9环)的次数比乙多,所以甲成绩较好.
③从折线图中看,在后半部分,甲呈上升趋势,而乙呈下降趋势,故甲更有潜力.
能力提升
11.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:
则下面结论中不正确的是(  )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
解析 设新农村建设前,经济收入为a,则新农村建设后经济收入为2a,则由饼图可得新农村建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.新农村建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.故选A.
法二 因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的.故选A.
答案 A
12.甲、乙两位学生参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次.记录如下:
甲:82 81 79 78 95 88 93 84
乙:92 95 80 75 83 80 90 85
(1)画出甲、乙两位学生成绩的茎叶图,指出学生乙成绩的中位数.
(2)现要从中选派一人参加数学竞赛,从平均状况和方差的角度考虑,你认为派哪位学生参加合适?请说明理由.
解 (1)茎叶图如图:
学生乙成绩分别为75,80,80,83,85,90,92,95,中位数为=84.
(2)派甲参加比较合适,理由如下:
甲=(70×2+80×4+90×2+9+8+8+4+2+1+5+3)=85,
乙=(70×1+80×4+90×3+5+3+5+2+5)=85,
s=[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,
s=[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41.
所以甲=乙,s所以甲的成绩比较稳定,派甲参加比较合适.
创新猜想
13.(多空题)甲、乙两位同学某学科连续五次的考试成绩用茎叶图表示如图所示,则平均分数较高的是________,成绩较为稳定的是________.
解析 甲=70,乙=68,s=×(22+12+12+22)=2,s=×(52+12+12+32)=7.2.
答案 甲 甲

14.某校高三年级在5月份进行了一次质量考试,考生成绩情况如表所示:
[0,400)
[400,480)
[480,550)
[550,750]
文科考生
67
35
19
6
理科考生
53
x
y
z
已知用分层抽样的方法在不低于550分的考生中随机抽取5名考生进行质量分析,其中文科考生抽取了2名.
(1)求z的值.
(2)如图是不低于550分的6名文科考生的语文成绩的茎叶图,计算这6名考生的语文成绩的方差.
解 (1)依题意=,得z=9.
(2)这6名文科考生的语文成绩的平均分为
=125,
则这6名考生的语文成绩的方差为
s2=×[(111-125)2+(120-125)2+(125-125)2+(128-125)2+(132-125)2+(134-125)2]
=×[(-14)2+52+02+32+72+92]=60.
课件33张PPT。5.1.3 数据的直观表示
第一课时 柱形图、折线图、扇形图和茎叶图教材知识探究2018年某市居民的支出构成情况如下表所示:问题1 要直观、形象地表示这些数据间的数量关系,应作出哪种统计图?
问题2 要直观、形象地表示这些数据在全部数据中所占的比例,应作出哪种统计图?
提示1 柱形图.
提示2 扇形图.1.柱形图柱形图(也称为条形图)中,一条轴上显示的是所关注的 ,另一条轴上对应的是数量、个数或者比例,柱形图中每一矩形都是 的.一般地,如果数据是随时间变化的,想了解数据的 情况,可将数据用折线图来表示.当然,折线图也可以用在其他情形中.形象地比较各数据之间的数量关系,有折线图2.折线图反映数据的变化情况数据类型等宽变化3.扇形图扇形图可以形象地表示出各部分数据在全部数据中所占的 情况.扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成 .4.茎叶图无折线图无折线图,能保留原始数据一般来说,茎叶图中,所有的茎都 排列,而叶沿 排列.茎叶图也可以只表示一组数.比例正比竖直水平方向将一组数整理成茎叶图后,如果每一行的数都是按从大到小(或从小到大)顺序排列,则从中可以方便地看出这组数的最值、中位数等数字特征.
(1)从茎叶图中还可以看出一组数的分布情况,从而可能可以得到一些额外的信息.
(2)可以估计出一组数据的平均数所在区间.
(3)还可以估计出两组数据平均数及方差的相对大小.教材拓展补遗
[微判断]
1.柱形(条形)图中,每一矩形是等宽的,小矩形间的距离一般相等.( )
2.由柱形图,可以作出折线图.( )
3.扇形图与半径大小有关.( )
提示 扇形图与半径无关.
4.茎叶图的茎可能是一位数字,也可能是多位数字.( )√√×√答案 B2.某校为了了解学生的睡眠情况,随机调查了50名学生,得到他们在某一天各自的睡眠时间的数据,结果如图所示.根据此条形图可得这50名学生这一天平均每人的睡眠时间为________h.解析 根据图形得,平均每人的睡眠时间t=5.5×0.1+6×0.3+6.5×0.4+7×0.1+7.5×0.1=6.4(h).
答案 6.43.某省选拔运动员参加运动会,测得7名选手的身高(单位:cm)分布茎叶图如图所示,记录的平均身高为177 cm,其中有一名候选人的身高记录不清,其末位数为x,那么x的值为________.解析 依题意得,180×2+1+170×5+3+x+8+9=177×7,x=8.
答案 8[微思考]
在扇形图中,部分数据在全部数据中的比例等于对应的扇形面积与整个圆面积的比吗?为什么?题型一 【例1】 2015年7月6日的《中国青年报》报道:“根据调查,有担当(76.3%)和踏实(74.5%)的年轻人最被受访者欣赏.奋进(54.7%)、坚毅(54.1%)、有梦想(50.2%)、有闯劲儿(40.1%)、沉稳(36.7%)、直率(34.6%)、幽默(33.4%)、活泼(27.2%)、庄重(20.3%)、洒脱(20%)也是受访者欣赏的品质.”为形象地表示这一调查结果,
(1)作出柱形图;
(2)作出折线图.柱形图与折线图解 (1)柱形图如图①图①(2)方法一 取图①中各小矩形上面的中点用线段连接起来(图略),即得折线图.
方法二 直接作出折线图如图②图②其中横轴上的1,2,3,…,12分别表示“有担当”,“踏实”,…,“洒脱”.规律方法 1.柱形图中,各小矩形宽相等;
2.注意横、纵轴的意义;
3.由柱形图可以作出折线图:取各小矩形上边的中点,再用线段连接,取各小矩形下边的中点并标注上数字,要说明标注数字所对应的数据类型.【训练1】 某射击运动员一次射击训练的成绩可以整理成如图所示的柱形图,试计算这次成绩的平均数与方差.题型二 扇形图
【例2】 某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示,现在用分层随机抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为________;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为________小时.解析 由分层随机抽样可知,第一分厂应抽取100×50%=50(件),
该产品的平均使用寿命为答案 50 1 015规律方法 在扇形图中,部分数据在全部数据中的比例等于对应扇形的圆心角度数与360°之比,等于对应扇形的弧长与周长之比,也等于对应扇形面积与圆面积之比.【训练2】 某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本.若用分层随机抽样方法,则40岁以下年龄段应抽取________人.解析 分层随机抽样时,由于40岁以下年龄段占总数的50%,故容量为40的样本中在40岁以下年龄段中应抽取40×50%=20(人).
答案 20题型三 茎叶图
【例3】 某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:
甲:95,81,75,91,86,89,71,65,76,88,94,110,107;
乙:83,86,93,99,88,103,98,114,98,79,78,106,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
解析 甲、乙两人数学成绩的茎叶图如图所示.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,叶主要集中在8、9、10的茎上;甲同学的得分情况也是大致对称,叶主要集中在7、8、9的茎上.乙同学的成绩总体情况比甲同学好.规律方法 茎叶图的画法步骤
(1)将每个数据分为茎(高位)和叶(低位)两部分.
(2)将最小的茎和最大的茎之间的数按从小到大的顺序从上到下列出,茎相同者共用一个茎,再画上竖线作为分界线.
(3)将各个数据的叶写在其茎右(左)侧.解析 由茎叶图知,甲的平均数为(5+6+8+10+10+14+18+18+22+25+27+30+30+38+41+43)÷16=21.562 5,
乙的平均数为(10+12+18+20+22+23+23+27+31+32+34+34+38+42+43+48)÷16=28.562 5,甲的中位数为(18+22)÷2=20,乙的中位数为(27+31)÷2=29,
所以m甲答案 B一、素养落地
1.通过学习柱形图、折线图、扇形图和茎叶图这四种统计图,提升数据分析素养.
2.通过这四种统计图,对凌乱、没有规律的数据加以整理,并用合适的统计图形象化,能看出数据的特征,有利于挖掘有关信息.
3.要根据要解决的问题或关注了解的信息选取合适的统计图,利用茎叶图可以估计数据的一些数据特征.
4.本节的统计图能保留原始数据.二、素养训练
1.若某校高一年级8个班参加合唱比赛的得分如茎叶图如图所示,则这组数据的中位数和平均数分别是(  )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92答案 A2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为m0,平均数为 ,则(  )答案 D3.甲、乙两个小组各8名同学的英语口语测试成绩的茎叶图
如图所示,则甲、乙两组的平均数与中位数之差较大的
是________组.
解析 由茎叶图可知,甲的平均数和中位数分别是83.625和83.5;乙的平均数和中位数分别是82.25和81,故乙的平均数和中位数的差较大.
答案 乙4.国家统计局网站显示,2011~2015年高中在校学生数信息如下.画出折线图,并指出这几年高中在校学生数的变化趋势.解 用折线图来表示上述情境与问题中的数据如图所示.由折线图可以看出,从2012年起,高中在校学生数逐年减少.第二课时 频数分布直方图与频率分布直方图
课标要求
素养要求
1.了解频数与频率的关系.
2.会列频数、频率分布表,会画频数分布直方图、频率分布直方图及其折线图.
3.能利用直方图估计数据的数字特征.
通过对样本的频数、频率分布直方图及其频率折线图的学习,提升学生的数据分析、逻辑推理素养.
教材知识探究
1895年,在英国伦敦有106块男性头盖骨被挖掘出土.经考证,这些头盖骨的主人死于1665~1666年之间的大瘟疫.人类学家分别测量了这些头盖骨的宽度,
数据如下所示(单位:mm):
146 141 139 140 145 141 142 131 142 140 144 140 138 139 147 139 141 137 141 132 140 140 141 143 134 146 134 142 133 149 140 140 143 143 149 136 141 143 143 141 138 136 138 144 136 145 143 137 142 146 140 148 140 140 139 139 144 138 146 153 148 152 143 140 141 145 148 139 136 141 140 139 158 135 132 148 142 145 145 121 129 143 148 138 149 146 141 142 144 137 153 148 144 138 150 148 138 145 145 142 143 143 148 141 145 141
问题1 直接用前面提到过的统计图来表示上述数据,方便可行吗?
问题2 怎样才能直观地表示出上述数据的大致分布情况(比如指出哪个区间的数据比较多,哪个区间的数据比较少)?
提示1 由于数据太多,直接用前面提到的统计图表示太麻烦也无必要.
提示2 将数据按照一定的方式进行“压缩”,然后再用图来直观地表示压缩后的数据.
因为我们关心的是数据的大致分布情况,因此可以事先确定出几个区间,然后统计落在每一个区间内的数的个数,最后将统计的结果用图示表示.

1.频数与频率
(1)频数:在一组数据中,数据出现的次数称为频数,某个区间内的数据的个数称为区间对应的频数.
(2)频率:在一组数据中,数据的频数与这组数据总个数的比称为频率,区间对应的频数与这组数据总个数的比称为区间对应的频率.
2.频数、频率分布直方图及其折线图,
对频数直方图、频率分布直方图,它们的折线图与上节的折线图有什么不同
画频率分布直方图时,纵坐标表,示频率与组距的比值,而不是频率.
,
教材拓展补遗
[微判断]
1.在频率分布直方图中,=样本容量.(√)
2.在频数或频率分布折线图中,折线图与横轴的左右两个交点是没有实际意义.(√)
3.上节所学的统计图没有丢失原始数据,频数或频率分布直方图看不出原始数据.(√)
[微训练]
1.频率分布直方图中,小长方形的面积等于(  )
A.组距 B.频率
C.组数 D.频数
解析 根据小长方形的宽及高的意义,可知小长方形的面积为一组样本数据的频率.
答案 B
2.如图所示的是一容量为100的样本的频率分布直方图,则由图中数据可知样本落在[15,20]内的频数为(  )
A.20 B.30
C.40 D.50
解析 样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.
答案 B
3.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40,0.125,则n的值为________.
解析 依题意得=0.125,∴n==320.
答案 320
[微思考]
1.为什么要对样本数据进行分组?
提示 不分组很难看出样本中的数字所包含的信息,分组后,计算出频率,从而可估计总体的分布特征.
2.频数、频率分布直方图有什么优缺点?
提示 (1)优点:可以直观、形象地反映样本的分布规律,清楚地看出数据分布的总体趋势.
(2)缺点:从频数、频率分布直方图得不出原始的数据内容,把数据绘制成频率(或频数)分布直方图后,原有的具体数据信息就抹掉了.
3.在柱形图中,若纵轴表示频数(或频率),这种柱形图与频数(或频率)分布直方图有什么本质区别?
提示 柱形图中,纵轴表示原始数据的频数或频率,频数分布直方图的纵轴表示区间对应的频数,频率分布直方图的纵轴表示的不是频率,而是区间对应的频率与区间宽度之比.
题型一 频数与频率
【例1】 将容量为100的样本数据分为8个组,如下表:
组号
1
2
3
4
5
6
7
8
频数
10
13
x
14
15
13
12
9
则第3组的频率为(  )
A.0.03 B.0.07
C.0.14 D.0.21
解析 由题意得x=100-(10+13+14+15+13+12+9)=14,所以第3组的频率为=0.14.
答案 C
规律方法 对于频数与频率的问题,首先要明确几个关系,即各组的频数之和等于样本容量,各组的频率之和为1,频率=.在解题过程中,要明确频数、频率以及样本容量之间的关系,弄清楚已知和所求,选择合适的公式解题.
【训练1】 一个频数分布表(样本容量为30)不小心被损坏了一部分,若样本中数据在[20,60)上的频率为0.8,则估计样本在[40,50),[50,60)内的数据个数共为(  )
A.15 B.16
C.17 D.19
解析 由题意得样本在[40,50),[50,60)内的数据个数共为30×0.8-4-5=15.
答案 A
题型二 频数、频率分布直方图及其绘制

【例2】 为了了解一大片经济林的生长情况,人们随机测量其中的100株树木的底部周长(单位:cm),得到如下数据:
135 98 102 110 99 121 110 96 100 103
125 97 117 113 110 92 102 109 104 112
105 124 87 131 97 102 123 104 104 128
109 123 111 103 105 92 114 108 104 102
129 126 97 100 115 111 106 117 104 109
111 89 110 121 80 120 121 104 108 118
129 99 90 99 121 123 107 111 91 100
99 101 116 97 102 108 101 95 107 101
102 108 117 99 118 106 119 97 126 108
123 119 98 121 101 113 102 103 104 108
绘制频率分布直方图、频率分布折线图.
频率分布直方图很容易观察出经济林生长的分布情况
解 从数据中可以看出,这组数据的最大值为135,最小值为80,故极差为55,可将其分为11组,组距,为5.列表如下:
分组
频数
频率
[80,85)
1
0.01
[85,90)
2
0.02
[90,95)
4
0.04
[95,100)
14
0.14
[100,105)
24
0.24
[105,110)
15
0.15
[110,115)
12
0.12
[115,120)
9
0.09
[120,125)
11
0.11
[125,130)
6
0.06
[130,135]
2
0.02
合计
100
1.00
画频率分布直方图、频率分布折线图如图所示.
规律方法 绘制频率分布直方图的注意点
(1)各组频率的和等于1,因此,各小矩形的面积的和也等于1;
(2)频率分布直方图比频率分布表更直观、形象地反映了样本的分布规律;
(3)在xOy坐标平面内画频率分布直方图时,x=样本数据,y=,这样每一组的频率可以用该组的组距为底、为高的小矩形的面积来表示.其中,矩形的高==×频数;
(4)同样一组数据,如果组距不同,横轴、纵轴单位不同,得到的频率分布直方图的形状也会不同;
(5)同一个总体,由于抽样的随机性,如果随机抽取另外一个容量为100的样本,所形成的样本频率分布直方图一般会与前一个样本频率分布直方图有所不同,但它们都可以近似地看作总体的分布.
【训练2】 美国历届总统中,就任时年龄最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年龄最大的是特朗普,他于2016年就任,当时70岁.下面按时间顺序(从1789年的华盛顿到2016年的特朗普,共45任)给出了历届美国总统就任时的年龄:
57,61,57,57,58,57,61,54,68,51,49,
64,50,48,65,52,56,46,54,49,51,47,
55,55,54,42,51,56,55,51,54,51,60,
62,43,55,56,61,52,69,64,46,54,47,70.
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图;
(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.
解 (1)以4为组距,列频率分布表如下:
分组
频数
频率
[42,46)
2
0.044 4
[46,50)
7
0.155 5
[50,54)
8
0.177 8
[54,58)
16
0.355 6
[58,62)
5
0.111 1
[62,66)
4
0.088 9
[66,70]
3
0.066 7
合计
45
1.000 0
画出相应的频率分布直方图和频率分布折线图,
(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁及45岁以下和65岁以上就任的总统所占的比例相对较小.
题型三 频率分布直方图在样本中的应用
【例3】 某中学举行电脑知识竞赛,现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成如图所示的频率分布直方图.已知图中从左到右的第一、第二、第三、第四、第五小组的频率分别是0.30,0.40,0.15,0.10,x,第五组小矩形高度为y.
(1)求x,y的值;
(2)估计参赛学生成绩的众数和中位数;
(3)估计参赛学生的平均成绩;
(4)若第5组频率为2,求高一两个班参赛学生的人数.
解 (1)∵0.30+0.40+0.15+0.10+x=1,
∴x=0.05.y==0.005.
(2)由于第二组频率最大,估计众数为第二组中间值65.设中位数为z,则0.03×10+(z-60)×0.04=0.5,解得z=65.
(3)估计参赛学生的平均成绩为
55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67.
(4)设高一两个班参赛学生的人数为n,则2=0.05n,
∴n=40,即高一两个班参赛人数有40人.
规律方法 频率分布直方图在样本中的应用:
(1)求参数、样本容量、在某个区间内的频数;
(2)估计样本数据的众数、中位数(百分位数)、平均数、方差、标准差等:
众数估计值为频率最大组的中点(横坐标),中位数的两侧面积相等(p%分位数使左边面积等于p%),平均数在频率分布表中等于组中值与对应的频率之积的和,方差=pi(i-)2(其中n为组数,为估计平均值,pi,i分别为第i组的频率和中点值).
【训练3】 从高三抽出50名学生参加数学竞赛,由成绩得到如图的频率分布直方图.由于一些数据丢失,试利用频率分布直方图求:
(1)这50名学生成绩的众数与中位数;
(2)这50名学生的平均成绩.
解 (1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为75.
由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就使中位数左右两边的小矩形的面积和相等,
因为0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,
所以前三个小矩形面积的和为0.3.而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,
所以中位数应约位于第四个小矩形内.
设其底边为x,高为0.03,所以令0.03x=0.2,得x≈6.7,故中位数应约为70+6.7=76.7.
(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.
所以平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)=73.65.
一、素养落地
1.通过学习频数、频率分布直方图及其应用,提升数据分析、逻辑推理素养.
2.上节所学的统计图不丢失原始数据,本节所学的统计图看不出原始数据,注意上节频数、频率条形图及其折线图与本节所学频数、频率分布直方图及其折线图的区别.
3.利用统计图可以计算或估计样本的数字特征,用频率分布直方图估计样本的数字特征是难点.
二、素养训练
                   
1.容量为20的样本数据,分组后的频数如下表:
分组
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
[60,70]
频数
2
3
4
5
4
2
则样本数据落在区间[10,40)的频率为(  )
A.0.35 B.0.45
C.0.55 D.0.65
解析 由表得样本数据落在区间[10,40)的频率为=0.45.
答案 B
2.200辆汽车经过某一雷达地区,时速的频率分布直方图如图所示,则时速超过60 km/h的汽车数量为(  )
A.65辆 B.76辆
C.88辆 D.95辆
解析 由频率分布直方图可得数据落在(60,80)内的频率是(0.028+0.010)×10=0.38,故时速超过60 km/h的汽车数量为200×0.38=76(辆).
答案 B
3.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则这20名工人中一天生产该产品数量的中位数为________.
解析 设中位数为x,则0.2+(x-55)×0.04=0.5,x=62.5.
答案 62.5
4.已知一个容量是40的样本,把它分成六组,第一组到第四组的频数分别是5,6,7,10,第五组的频率是0.2,求第六组的频数和频率.
解 频数=频率×样本容量,因为第五组的频率是0.2,样本容量是40,所以频数是0.2×40=8,所以第六组的频数是40-(5+6+7+10+8)=4,频率是=0.1.
基础达标
一、选择题
1.已知样本7,10,14,8,7,12,11,10,8,10,13,10,8,11,8,9,12,9,13,20,那么这组数据落在8.5~11.5的频率为(  )
A.0.5 B.0.4
C.0.3 D.0.2
解析 样本数据落在范围8.5~11.5内的数据有10,11,10,10,10,11,9,9共8个,频率为8÷20=0.4.
答案 B
2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是(  )
A.56 B.60
C.120 D.140
解析 根据频率分布直方图,200名学生中每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,故200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.
答案 D
3.为了解学生参加体育锻炼的情况,现抽取了n名学生进行调查,结果显示这些学生每月的锻炼时间(单位:小时)在[10,50]内,其中锻炼时间在[30,50]内的学生有134人,频率分布直方图如图所示,则n=(  )
A.150 B.160
C.180 D.200
解析 由频率分布直方图得锻炼时间在[30,50]对应的频率为1-(0.010+0.023)×10=0.670,所以n==200.
答案 D
4.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(  )
A.6 B.8
C.12 D.18
解析 由题意知第一组和第二组的频率之和为0.24+0.16=0.4,故样本容量为=50,又第三组的频率为0.36,故第三组的人数为50×0.36=18,故该组中有疗效的人数为18-6=12.
答案 C
5.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的众数、中位数的估计值分别为(  )
A.62,62.5 B.65,62
C.65,62.5 D.62.5,62.5
解析 最高的矩形为第三个矩形,
所以时速的众数为65,
前两个矩形的面积和为(0.01+0.03)×10=0.4,
由于0.5-0.4=0.1,则×10=2.5,
所以中位数为60+2.5=62.5.
答案 C
二、填空题
6.将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.
解析 设第一组至第六组数据的频率分别为2x,3x,4x,6x,4x,x,则2x+3x+4x+6x+4x+x=1,解得x=,所以前三组数据的频率分别是,,,故前三组数据的频数之和为++=27,解得n=60.
答案 60
7.某校从参加高一年级期末考试的学生中抽出60名学生,将其成绩(均为整数,单位:分)分成六段:[40,50),[50,60),…,[90,100],画出如下部分频率分布直方图.观察图形的信息,第四小组的频率为________.
解析 第四小组的频率为1-(0.025+0.015×2+0.01+0.005)×10=0.3.
答案 0.3
8.某路段属于限速路段,规定通过该路段的汽车时速不得超过70 km/h,否则视为违规扣分.某天有1 000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图(如图所示),则违规扣分的汽车大约为______辆.
解析 易求得70~80这组的频率为1-0.05-0.18-0.38-0.27=0.12,
则违规扣分的汽车大约为0.12×1 000=120(辆).
答案 120
三、解答题
9.一个容量为100的样本数据如下,试列出该样本的频率分布表.
168 165 171 167 170 165 170 152 175 174
165 170 168 169 171 166 164 155 164 158
170 155 166 158 155 160 160 164 156 162
160 170 168 164 174 171 165 179 163 172
180 174 173 159 163 172 167 160 164 169
151 168 158 168 176 155 165 165 169 162
177 158 175 165 169 151 163 166 163 167
178 165 158 170 169 159 155 163 153 155
167 163 164 158 168 167 161 162 167 168
161 165 174 156 167 166 162 161 164 166
解 (1)求极差:从数据中可看出,最大值是180,最小值是151,故极差为180-151=29.
(2)确定组距与组数:取3为组距,则==9,故可将样本数据分成10组.
(3)第一组起点定为150.5,组距为3,这样分出10个组:
[150.5,153.5),[153.5,156.5),[156.5,159.5),[159.5,162.5),[162.5,165.5),[165.5,168.5),[168.5,171.5),[171.5,174.5),[174.5,177.5),[177.5,180.5].
(4)列频率分布表:
分组
频数
频率
[150.5,153.5)
4
0.04
[153.5,156.5)
8
0.08
[156.5,159.5)
8
0.08
[159.5,162.5)
11
0.11
[162.5,165.5)
22
0.22
[165.5,168.5)
19
0.19
[168.5,171.5)
14
0.14
[171.5,174.5)
7
0.07
[174.5,177.5)
4
0.04
[177.5,180.5]
3
0.03
合计
100
1.00
10.某校100名学生期中考试语文成绩(单位:分)的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值;
(2)若这100名学生的语文成绩在某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.
分数段
[50,60)
[60,70)
[70,80)
[80,90)
x∶y
1∶1
2∶1
3∶4
4∶5
解 (1)依题意得,10(2a+0.02+0.03+0.04)=1,解得a=0.005.
(2)数学成绩在[50,60)之间的人数为100×0.05=5,数学成绩在[60,70)之间的人数为100×0.4×=20,数学成绩在[70,80)之间的人数为100×0.3×=40,数学成绩在[80,90)之间的人数为100×0.2×=25,所以数学成绩在[50,90)之外的人数为100-5-20-40-25=10.
能力提升
11.某教育机构随机抽查某校20个班级,调查各班关注“汉字听写大赛”的学生人数,根据所得数据的茎叶图,以5为组距将数据分组成[0,5),[5,10),[10,15),[15,20),[20,25),[25,30),[30,35),[35,40]时,所作的频率分布直方图如图所示,则原始的茎叶图可能是(  )
解析 由频率分布直方图知,各组频数统计如表:
分组
[0,5)
[5,10)
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40]
频数
1
1
4
2
4
3
3
2
结合各选项茎叶图中的数据可知选项A正确.
答案 A
12.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:
(1)求分数在[50,60]的频率及全班人数;
(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.
解 (1)分数在[50,60]的频率为0.008×10=0.08.
由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为=25.
(2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为÷10=0.016.
创新猜想
13.(多空题)某电子商务公司对10 000名网络购物者2018年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a=________;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.
解析 (1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.
(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.
因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.
答案 (1)3 (2)6 000
14.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中x的值;
(2)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层随机抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?
解 (1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1得
x=0.007 5,所以直方图中x的值是0.007 5.
(2)月平均用电量为[220,240)的用户有0.012 5×20×100=25(户),
月平均用电量为[240,260)的用户有0.007 5×20×100=15(户),
月平均用电量为[260,280)的用户有0.005×20×100=10(户),
月平均用电量为[280,300]的用户有0.002 5×20×100=5(户),
抽取比例为=,
所以月平均用电量在[220,240)的用户中应抽取25×=5(户).
课件38张PPT。第二课时 频数分布直方图与频率分布直方图教材知识探究1895年,在英国伦敦有106块男性头盖骨被挖掘出土.经考证,这些头盖骨的主人死于1665~1666年之间的大瘟疫.人类学家分别测量了这些头盖骨的宽度,
数据如下所示(单位:mm):146 141 139 140 145 141 142 131 142 140 144 140 138 139 147 139 141 137 141 132 140 140 141 143 134 146 134 142 133 149 140 140 143 143 149 136 141 143 143 141 138 136 138 144 136 145 143 137 142 146 140 148 140 140 139 139 144 138 146 153 148 152 143 140 141 145 148 139 136 141 140 139 158 135 132 148 142 145 145 121 129 143 148 138 149 146 141 142 144 137 153 148 144 138 150 148 138 145 145 142 143 143 148 141 145 141问题1 直接用前面提到过的统计图来表示上述数据,方便可行吗?
问题2 怎样才能直观地表示出上述数据的大致分布情况(比如指出哪个区间的数据比较多,哪个区间的数据比较少)?
提示1 由于数据太多,直接用前面提到的统计图表示太麻烦也无必要.
提示2 将数据按照一定的方式进行“压缩”,然后再用图来直观地表示压缩后的数据.
因为我们关心的是数据的大致分布情况,因此可以事先确定出几个区间,然后统计落在每一个区间内的数的个数,最后将统计的结果用图示表示.1.频数与频率
(1)频数:在一组数据中,数据出现的次数称为频数,某个区间内的数据的个数称为区间对应的频数.
(2)频率:在一组数据中,数据的频数与这组数据总个数的比称为频率,区间对应的频数与这组数据总个数的比称为区间对应的频率.2.频数、 及其画频率分布直方图时,纵坐标表,示频率与组距的比值,而不是频率.频率分布直方图折线图,对频数直方图、频率分布直方图,它们的折线图与上节的折线图有什么不同左闭右开样本容量1频率/组距 各小长方形的
面积1中点√√√[微训练]
1.频率分布直方图中,小长方形的面积等于(  )
A.组距 B.频率
C.组数 D.频数
解析 根据小长方形的宽及高的意义,可知小长方形的面积为一组样本数据的频率.
答案 B2.如图所示的是一容量为100的样本的频率分布直方图,
则由图中数据可知样本落在[15,20]内的频数为(  )
A.20 B.30
C.40 D.50
解析 样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.
答案 B3.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40,0.125,则n的值为________.答案 320[微思考]
1.为什么要对样本数据进行分组?
提示 不分组很难看出样本中的数字所包含的信息,分组后,计算出频率,从而可估计总体的分布特征.
2.频数、频率分布直方图有什么优缺点?
提示 (1)优点:可以直观、形象地反映样本的分布规律,清楚地看出数据分布的总体趋势.
(2)缺点:从频数、频率分布直方图得不出原始的数据内容,把数据绘制成频率(或频数)分布直方图后,原有的具体数据信息就抹掉了.3.在柱形图中,若纵轴表示频数(或频率),这种柱形图与频数(或频率)分布直方图有什么本质区别?
提示 柱形图中,纵轴表示原始数据的频数或频率,频数分布直方图的纵轴表示区间对应的频数,频率分布直方图的纵轴表示的不是频率,而是区间对应的频率与区间宽度之比.题型一 频数与频率
【例1】 将容量为100的样本数据分为8个组,如下表:则第3组的频率为(  )
A.0.03 B.0.07
C.0.14 D.0.21答案 C【训练1】 一个频数分布表(样本容量为30)不小心被损坏了一部分,若样本中数据在[20,60)上的频率为0.8,则估计样本在[40,50),[50,60)内的数据个数共为(  )
A.15 B.16
C.17 D.19
解析 由题意得样本在[40,50),[50,60)内的数据个数共为30×0.8-4-5=15.
答案 A题型二 【例2】 为了了解一大片经济林的生长情况,人们随机测量其中的100株树木的底部周长(单位:cm),得到如下数据:
135 98 102 110 99 121 110 96 100 103
125 97 117 113 110 92 102 109 104 112
105 124 87 131 97 102 123 104 104 128
109 123 111 103 105 92 114 108 104 102
129 126 97 100 115 111 106 117 104 109频数、频率分布直方图及其绘制若一组数据不超过200个,常分为5~12组为宜111 89 110 121 80 120 121 104 108 118
129 99 90 99 121 123 107 111 91 100
99 101 116 97 102 108 101 95 107 101
102 108 117 99 118 106 119 97 126 108
123 119 98 121 101 113 102 103 104 108解 从数据中可以看出,这组数据的最大值为135,最小值为80,故极差为55,可将其分为11组,组距,为5.列表如下:绘制频率分布直方图、频率分布折线图.频率分布直方图很容易观察出经济林生长的分布情况画频率分布直方图、频率分布折线图如图所示.(4)同样一组数据,如果组距不同,横轴、纵轴单位不同,得到的频率分布直方图的形状也会不同;
(5)同一个总体,由于抽样的随机性,如果随机抽取另外一个容量为100的样本,所形成的样本频率分布直方图一般会与前一个样本频率分布直方图有所不同,但它们都可以近似地看作总体的分布.【训练2】 美国历届总统中,就任时年龄最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年龄最大的是特朗普,他于2016年就任,当时70岁.下面按时间顺序(从1789年的华盛顿到2016年的特朗普,共45任)给出了历届美国总统就任时的年龄:
57,61,57,57,58,57,61,54,68,51,49,
64,50,48,65,52,56,46,54,49,51,47,
55,55,54,42,51,56,55,51,54,51,60,
62,43,55,56,61,52,69,64,46,54,47,70.
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图;
(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.解 (1)以4为组距,列频率分布表如下:画出相应的频率分布直方图和频率分布折线图,(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁及45岁以下和65岁以上就任的总统所占的比例相对较小.题型三 频率分布直方图在样本中的应用
【例3】 某中学举行电脑知识竞赛,现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成如图所示的频率分布直方图.已知图中从左到右的第一、第二、第三、第四、第五小组的频率分别是0.30,0.40,0.15,0.10,x,第五组小矩形高度为y.(1)求x,y的值;
(2)估计参赛学生成绩的众数和中位数;
(3)估计参赛学生的平均成绩;
(4)若第5组频率为2,求高一两个班参赛学生的人数.(2)由于第二组频率最大,估计众数为第二组中间值65.设中位数为z,则0.03×10+(z-60)×0.04=0.5,解得z=65.(3)估计参赛学生的平均成绩为
55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67.
(4)设高一两个班参赛学生的人数为n,则2=0.05n,
∴n=40,即高一两个班参赛人数有40人.【训练3】 从高三抽出50名学生参加数学竞赛,由成绩得到如图的频率分布直方图.由于一些数据丢失,试利用频率分布直方图求:
(1)这50名学生成绩的众数与中位数;
(2)这50名学生的平均成绩.解 (1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为75.
由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就使中位数左右两边的小矩形的面积和相等,
因为0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,
所以前三个小矩形面积的和为0.3.而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,
所以中位数应约位于第四个小矩形内.
设其底边为x,高为0.03,所以令0.03x=0.2,得x≈6.7,故中位数应约为70+6.7=76.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.
所以平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)=73.65.一、素养落地
1.通过学习频数、频率分布直方图及其应用,提升数据分析、逻辑推理素养.
2.上节所学的统计图不丢失原始数据,本节所学的统计图看不出原始数据,注意上节频数、频率条形图及其折线图与本节所学频数、频率分布直方图及其折线图的区别.
3.利用统计图可以计算或估计样本的数字特征,用频率分布直方图估计样本的数字特征是难点.二、素养训练
1.容量为20的样本数据,分组后的频数如下表:则样本数据落在区间[10,40)的频率为(  )
A.0.35 B.0.45
C.0.55 D.0.65答案 B2.200辆汽车经过某一雷达地区,时速的频率分布直方
图如图所示,则时速超过60 km/h的汽车数量为(  )
A.65辆 B.76辆
C.88辆 D.95辆
解析 由频率分布直方图可得数据落在(60,80)内的频率是(0.028+0.010)×10=0.38,故时速超过60 km/h的汽车数量为200×0.38=76(辆).
答案 B3.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则这20名工人中一天生产该产品数量的中位数为________.

解析 设中位数为x,则0.2+(x-55)×0.04=0.5,x=62.5.
答案 62.54.已知一个容量是40的样本,把它分成六组,第一组到第四组的频数分别是5,6,7,10,第五组的频率是0.2,求第六组的频数和频率.