高中数学人教版必修3 2.2.1用样本的频率分布估计总体分布【教案+作业】( 10份 )

文档属性

名称 高中数学人教版必修3 2.2.1用样本的频率分布估计总体分布【教案+作业】( 10份 )
格式 zip
文件大小 2.0MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2017-09-26 16:15:15

文档简介

2.2.1用样本的频率分布估计总体分布
一、教学目标:
知识与能力:
(1)
通过实例体会分布的意义和作用。
(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
(3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。
过程与方法:通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。
情感态度与价值观:通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。
二、教学重点与难点
重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
难点:能通过样本的频率分布估计总体的分布。
三、教学过程:
(一)创设情境,引入课题
在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕
甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50
乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33
请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?
如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板出课题)。
(二)研探新知
阅读课本67页探究(让学生展开讨论)
为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等。因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况。
分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式。
下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律。可以让我们更清楚的看到整个样本数据的频率分布情况。
1、频率分布的概念:
频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:
计算一组数据中最大值与最小值的差,即求极差
决定组距与组数
将数据分组
列频率分布表
画频率分布直方图
以课本P67制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图。(让学生自己动手作图)
频率分布直方图的特征:
(1)、从频率分布直方图可以清楚的看出数据分布的总体趋势。
(2)、从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
探究:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?
思考:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,(见课本P68)你能对制定月用水量标准提出建议吗?(让学生仔细观察表和图)
2、频率分布折线图、总体密度曲线
频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。
总体密度曲线:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。
思考:
(1).对于任何一个总体,它的密度曲线是不是一定存在?为什么?
(2).对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?
实际上,尽管有些总体密度曲线是饿、客观存在的,但一般很难想函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确.
3、茎叶图
(1).茎叶图的概念:
当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本P61例子)
(2).茎叶图的特征:
a、用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
b、茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。
(三)典例精析
例1:下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)
(1)列出样本频率分布表﹔
(2)一画出频率分布直方图;
(3)估计身高小于134cm的人数占总人数的百分比.。
分析:根据样本频率分布表、频率分布直方图的一般步骤解题。
解:(1)样本频率分布表如下:
(2)其频率分布直方图如下:
(3)由样本频率分布表可知身高小于134cm
的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.
例2:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.
第二小组的频率是多少?样本容量是多少?
若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。
分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1。
解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,
因此第二小组的频率为:
又因为频率=
所以
(2)由图可估计该学校高一学生的达标率约为
(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内。
(四)课堂练习:P73
练习
1.
2.
3
(五)课堂小结
1、总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。
2、总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。
(六)布置作业:P84
习题2.2
A组
1、
2
四、课后反思
122
126
130
134
138
142
146
150
158
154
身高(cm)
o
0.01
0.02
0.03
0.04
0.05
0.06
0.07
频率/组距
90
100
110
120
130
140
150
次数
o
0.004
0.008
0.012
0.016
0.020
0.024
0.028
频率/组距
0.032
0.036第二章 统 计
2.1.1 简单随机抽样
课时目标 1.理解并掌握简单随机抽样的概念、特点和步骤.2.掌握简单随机抽样的两种方法.
1.简单随机抽样的定义
设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
2.简单随机抽样的分类
简单随机抽样
3.简单随机抽样的优点及适用类型
简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的.
一、选择题
1.为了了解某种花的发芽天数,种植某种花的球根200个,进行调查发芽天数的试验,样本是(  )
A.200个表示发芽天数的数值
B.200个球根
C.无数个球根发芽天数的数值集合
D.无法确定
答案 A
2.某校有40个班,每班50人,要求每班随机选派3人参加“学生代表大会”.在这个问题中样本容量是(  )
A.40
B.50
C.120
D.150
答案 C
解析 由于样本容量即样本的个数,抽取的样本的个数为40×3=120.
3.抽签法中确保样本代表性的关键是(  )
A.制签
B.搅拌均匀
C.逐一抽取
D.抽取不放回
答案 B
解析 由于此问题强调的是确保样本的代表性,即要求每个个体被抽到的可能性相等.所以选B.
4.下列抽样实验中,用抽签法方便的有(  )
A.从某厂生产的3
000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3
000件产品中抽取10件进行质量检验
答案 B
解析 A总体容量较大,样本容量也较大不适宜用抽签法;B总体容量较小,样本容量也较小可用抽签法;C中甲、乙两厂生产的两箱产品有明显区别,不能用抽签法;D总体容量较大,不适宜用抽签法.
5.为调查参加运动会的1
000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是(  )
A.1
000名运动员是总体
B.每个运动员是个体
C.抽取的100名运动员是样本
D.样本容量是100
答案 D
解析 此问题研究的是运动员的年龄情况,不是运动员,故A、B、C错,故选D.
6.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性,“第二次被抽到”的可能性分别是(  )
A.,
B.,
C.,
D.,
答案 A
二、填空题
7.要检查一个工厂产品的合格率,从1
000件产品中抽出50件进行检查,检查者在其中随意抽取了50件,这种抽样法可称为________.
答案 简单随机抽样
解析 由简单随机抽样的特点可知,该抽样方法是简单随机抽样.
8.福利彩票的中奖号码是从1~36个号码中选出7个号码来按规则确定中奖情况,这种从36个号码中选7个号码的抽样方法是________.
答案 抽签法
9.用随机数表法进行抽样,有以下几个步骤:①将总体中的个体编号;②获取样本号码;③选定随机数表开始的数字,这些步骤的先后顺序应该是________.(填序号)
答案 ①③②
三、解答题
10.要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程.
解 利用抽签法,步骤如下:
(1)将30辆汽车编号,号码是01,02,…,30;
(2)将号码分别写在一张纸条上,揉成团,制成号签;
(3)将得到的号签放入一个不透明的袋子中,并搅拌均匀;
(4)从袋子中依次抽取3个号签,并记录上面的编号;
(5)所得号码对应的3辆汽车就是要抽取的对象.
11.现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检验.如何用随机数表法设计抽样方案?
解 (1)将元件的编号调整为010,011,012,…,099,100,…600;
(2)在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第6行第7列数“9”,向右读;
(3)从数“9”开始,向右读,每次读取三位,凡不在010~600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到544,354,378,520,384,263;
(4)以上号码对应的6个元件就是要抽取的样本.
能力提升
12.在简单随机抽样中,某一个个体被抽到的可能性(  )
A.与第几次抽样有关,第一次抽到的可能性大一些
B.与第几次抽样无关,每次抽到的可能性相等
C.与第几次抽样有关,最后一次抽到的可能性大些
D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不同
答案 B
解析 由简单随机抽样的特点知与第n次抽样无关,每次抽到的可能性相等.
13.某车间工人已加工一种轴50件,为了了解这种轴的直径是否符合要求,要从中抽出5件在同一条件下测量,试用两种方法分别取样.
解 方法一 抽签法.
(1)将50个轴进行编号01,02,…,50;
(2)把编号写在大小、形状相同的纸片上作为号签;
(3)把纸片揉成团,放在箱子里,并搅拌均匀;
(4)依次不放回抽取5个号签,并记下编号;
(5)把号签对应的轴组成样本.
方法二 随机数法
(1)将50个轴进行编号为00,01,…,49;
(2)在随机数表中任意选定一个数并按向右方向读取;
(3)每次读两位,并记下在00~49之间的5个数,不能重复;
(4)把与读数相对应的编号相同的5个轴取出组成样本
1.判断所给的抽样是否为简单随机抽样的依据是随机抽样的特征:
简单随机抽样
如果四个特征有一个不满足就不是简单随机抽样.
2.利用抽签法抽取样本时应注意以下问题:
(1)编号时,如果已有编号(如学号、标号等)可不必重新编号.
(2)号签要求大小、形状完全相同.
(3)号签要搅拌均匀.
(4)要逐一不放回抽取.
3.在利用随机数表法抽样的过程中注意:
(1)编号要求数位相同.
(2)第一个数字的抽取是随机的.
(3)读数的方向是任意的,且事先定好的.2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体的分布(一)
一、基础过关
1.下列说法不正确的是
(  )
A.频率分布直方图中每个小矩形的高就是该组的频率
B.频率分布直方图中各个小矩形的面积之和等于1
C.频率分布直方图中各个小矩形的宽一样大
D.频率分布直方图能直观地表明样本数据的分布情况
2.如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据,样本落在[15,20)内的频数为
(  )
A.20   
B.30   
C.40   
D.50
3.容量为20的样本数据,分组后的频数如下表:
分组
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
[60,70)
频数
2
3
4
5
4
2
则样本数据落在区间[10,40)的频率为
(  )
A.0.35
B.0.45
C.0.55
D.0.65
4.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)的同学有30人,若想在这n个人中抽取50个人,在[50,60)之间应抽取的人数为
(  )
A.10
B.15
C.25
D.30
5.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在这组上的频率为m,该组上直方图的高为h,则|a-b|=________.
6.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.
7.某班共有60名学生,先用抽签法从中抽取10名学生调查他们的学习情况,若抽查结果如下表所示,先确定x的值,再完成频率分布直方图.
每周学习时间(小时)
[0,10)
[10,20)
[20,30)
[30,40]
人数
2
4
x
1
8.某制造商3月生产了一批乒乓球,随机抽样100个进行检查,测得每个球的直径(单位:mm),将数据分组如下表:
分组
频数
频率
[39.95,39.97)
10
[39.97,39.99)
20
[39.99,40.01)
50
[40.01,40.03)
20
合计
100
补充完成频率分布表(结果保留两位小数),并在上图中画出频率分布直方图.
二、能力提升
9.一个容量为100的样本,其数据的分组与各组的频数如下:则样本数据落在(10,40]上的频率为
(  )
组别
(0,10]
(10,20]
(20,30]
(30,40]
(40,50]
(50,60]
(60,70]
频数
12
13
24
15
16
13
7
A.0.13
B.0.39
C.0.52
D.0.64
10.100辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速在[60,70)的汽车大约有
(  )
A.30辆
B.40辆
C.60辆
D.80辆
11.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5
℃的城市个数为11,则样本中平均气温不低于25.5
℃的城市个数为________.
12.某市共有5
000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:
分组
频数
频率
[80,90)


[90,100)
0.050
[100,110)
0.200
[110,120)
36
0.300
[120,130)
0.275
[130,140)
12

[140,150]
0.050
合计

(1)根据上面的频率分布表,求①,②,③,④处的数值;
(2)在所给的坐标系中画出区间[80,150]上的频率分布直方图.
三、探究与拓展
13.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值;
(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;
(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.
分数段
[50,60)
[60,70)
[70,80)
[80,90)
x∶y
1∶1
2∶1
3∶4
4∶5
2.2.1 用样本的频率分布估计总体的分布(一)
1.A 2.B 3.B 4.B 5. 6.60
7.解 由2+4+x+1=10,得x=3,频率分布直方图如下:
8.解 频率分布表如下:
分组
频数
频率
[39.95,39.97)
10
0.10
[39.97,39.99)
20
0.20
[39.99,40.01)
50
0.50
[40.01,40.03)
20
0.20
合计
100
1
频率分布直方图如下:
9.C 10.B 11.9
12.解 (1)①3,②0.025,③0.100,④120.
(2)频率分布直方图如下图:
13.解 (1)由频率分布直方图知(2a+0.02+0.03+0.04)×10=1,
解得a=0.005.
(2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).
(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.
由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×=20,30×=40,20×=25.
故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.2.2.1
用样本的频率分布估计总体分布
基础巩固
一、选择题
1.下列关于频率分布直方图的说法正确的是(  )
A.直方图的高表示取某数的频率
B.直方图的高表示该组上的个体在样本中出现的频率
C.直方图的高表示取某组上的个体在样本中出现的频数与组距的比值
D.直方图的高表示取该组上的个体在样本中出现的频率与组距的比值
[答案] D
[解析] 要注意频率直方图的特点.在直方图中,纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积.
[点评] 注意区别直方图与条形图.
2.下列说法正确的是(  )
A.对于样本数据增加时,频率分布表不能增加变化
B.对于样本数据增加时,茎叶图不能增加变化
C.对于样本数据增加时,频率折线图不会跟着变化
D.对于样本数据增加时,频率分布直方图变化不太大
[答案] D
3.一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为(  )
A.10组      
B.9组
C.8组
D.7组
[答案] B
[解析] 根据列频率分布表的步骤,==8.9.所以分为9组较为恰当.
4.(2013·福建卷)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测度成绩不低于60分的学生人数为(  )
A.588
B.480
C.450
D.120
[答案] B
[解析] 本题考查频率分布直方图及频数的求法.成绩在[40,60)的频率P1=(0.005+0.015)×10=0.2,则成绩不少于60分的频率P2=1-0.2=0.8,所以可估计成绩不少于60分的学生人数为600×0.8=480,故选B.
5.(2013·重庆高考)如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为(  )
A.0.2
B.0.4
C.0.5
D.0.6
[答案] B
[解析] 利用频率及茎叶图的知识直接运算求解.由题意知,这10个数据落在区间[22,30)内的有22、22、27、29,共4个,所以其频率为=0.4,故选B.
6.(2015·河北省唐山一中月考)某校100名学生的数学测试成绩的频率分布直方图如图所示,分数不低于a即为优秀,如果优秀的人数为20,则a的估计值是(  )
A.130
B.140
C.133
D.137
[答案] C
[解析] 本题考查频率分布直方图.由已知可以判断a∈(130,140),所以[(140-a)×0.015+0.01×10]×100=20,解得a≈133,故选C.
二、填空题
7.今年5月海淀区教育网开通了网上教学,某校高一年级(8)班班主任为了了解学生上网学习时间,对本班40名学生某天上网学习时间进行了调查,将数据(取整数)整理后,绘制出如图所示频率分布直方图,已知从左到右各个小组的频率分别是0.15,0.25,0.35,0.20,0.05,则根据直方图所提供的信息,这一天上网学习时间在100~119分钟之间的学生人数是________人,如果只用这40名学生这一天上网学习时间作为样本去推断该校高一年级全体学生该天的上网学习时间,这样推断是否合理?________(填“合理”或“不合理”)
[答案] 14 不合理
[解析] 由频数=样本容量×频率=40×0.35=14(人)
因为该样本的选取只在高一(8)班,不具有代表性,所以这样推断不合理.
8.青年歌手大奖赛共有10名选手参赛,并请了7名评委.如图所示的茎叶图是7名评委给参加最后决赛的两位选手甲、乙评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为________、________.
[答案] 84.2分 85分
[解析] 甲的成绩去掉一个最高分92分和一个最低分75分后,甲的剩余数据的平均成绩为84.2分;乙的成绩去掉一个最高分93分和一个最低分79分后,乙的剩余数据的平均成绩为85分.
三、解答题
9.有关部门从甲、乙两个城市所有的自动售货机中随机抽取了16台,记录了上午8?00~11?00之间各自的销售情况(单位:元)
甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;
乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.
试用两种不同的方式分别表示上面的数据,并简要说明各自的优点.
[解析] 方法一:从题目中的数不易直接看出各自的分布情况,为此,我们将以上数据用条形统计图表示.如图:
方法二:茎叶图如图,两竖线中间的数字表示甲、乙销售额的十位数,两边的数字表示甲、乙销售额的个位数.
从方法一可以看出条形统计图能直观地反映数据分布的大致情况,并且能够清晰地表示出各个区间的具体数目;从方法二可以看出,用茎叶图表示有关数据,对数据的记录和表示都带来方便.
10.(2015·合肥高二检测)为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8?00~10?00间各自的点击量,得如图所示的茎叶图,根据茎叶图回答下列问题.
(1)甲、乙两个网站点击量的极差分别是多少?
(2)甲网站点击量在[10,40]间的频率是多少?
(3)甲、乙两网站哪个更受欢迎?并说明理由.
[解析] (1)甲网站的极差为:73-8=65,乙网站的极差为:71-5=66.
(2)=≈0.286.
(3)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.
能力提升
一、选择题
1.一个样本的容量为72,分成5组,已知第一、五组的频数都为8,第二、四组的频率都为,则第三组的频数为(  )
A.16 
B.20    
C.24    
D.36
[答案] C
[解析] 因为频率=,所以第二、四组的频数都为72×=16.所以第三组的频数为72-2×8-2×16=24.
2.某工厂对一批产品进行了抽样检测,下图是根据抽样检测后的产品净重数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100
g的个数是36,则样本中净重大于或等于98
g并且小于104
g的产品的个数是(  )
A.90
B.75
C.60
D.45
[答案] A
[解析] 由频率分布直方图可知,产品净重小于100g的频率是0.05×2十0.1×2=0.3,所以样本中产品的个数为=120.产品净重大于或等于104
g的频率为0.075×2=0.15.
所以产品净重大于或等丁98
g而小于104
g的频率为1-0.15-0.1=0.75.则净重在此范围内的产品个数为120×0.75=90个.
3.为了解电视对生活的影响,一个社会调查机构就平均每天看电视的时间对某地居民调查了10
000人,并根据所得数据画出样本的频率分布直方图(如图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从这10
000人中再用分层抽样方法抽出100人做进一步调查.则在[2.5,3]h时间段内应抽出的人数是(  )
A.25
B.30
C.50
D.75
[答案] A
[解析] 抽出的100人中平均每天看电视的时间在[2.5,3](h)时间内的频率是(0.5×0.5=0.25,所以这10
000人中平均每天看电视的时间在[2.5,3](11)时间内的人数是10000×0.25=2500,抽样比是=,则在[2.5,3](h)时间内应抽出的人数是2500×=25.
4.下图是根据《山东统计年鉴2009》中的资料作成的1999年至2008年山东省城镇居民百户家庭人口数的茎叶图,图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1999年至2008年山东省城镇居民百户家庭人口数的平均数为(  )
A.304.6
B.303.6
C.302.6
D.301.6
[答案] B
[解析] 自1999年至2008年百户家庭人口数分别为291,291,295,298,302,306,
310,312,314,317,则平均数为(291+291+295+298+302+306+310+312+314+317)=303.6.
二、填空题
5.某校开展“爱我海西,爱我家乡”摄影比赛,9位评委给参赛作品A打出的分数如茎叶图所示,记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现一个数字(茎叶图中的x)无法看清.若记分员计算无误,则数字x应该是________.
[答案] 1
[解析] 若x≤4,则由平均分为91知总分应为91×7=637.故637=89+89+92+93+92+91+90+x,得x=1;若x>4,637≠89+89+92+93+92+91+94=640不合题意.
6.图1是某工厂2010年9月份10个车间产量统计条形图,条形图从左到右表示各车间的产量依次记为A1,A2,…,A10(如A3表示3号车间的产量为950件).图2是统计图1中产量在一定范围内车间个数的一个算法流程图.那么运行该算法流程后输出的结果是________.
[答案] 4
[解析] 通过算法流程图可知,它的功能是统计产量超过950件的车间数,所以通过条形统计图可知产量超过950件的车间数为4个,所以最后输出的结果是4.
三、解答题
7.某市2010年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸人颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,
(1)完成频率分布表;
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
[解析] (1)频率分布表:
分组
频数
频率
[41,51)
2
[51,61)
1
[61,71)
4
[71,81)
6
[81,91)
10
[91,101)
5
[101,111)
2
(2)频率分布直方图,如图所示.
(3)答对下述两条中的一条即可:
①该市一个月中空气污染指数有2天处于优的水平,占当月天数的,有26天处于良的水平,占当月天数的,处于优或良的天数共有28天,占当月天数的.说明该市空气质量基本良好.
②轻微污染有2天,占当月天数的.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的,超过50%,说明该市空气质量有待进一步改善.
8.某电视台为宣传本省,随机对本省内15~65岁的人群抽取了n人,回答问题“本省内著名旅游景点有哪些”统计结果如图表所示.
组号
分组
回答正确的人数
回答正确的人数占本组的频率
第1组
[15,25)
a
0.5
第2组
[25,35)
18
x
第3组
[35,45)
b
0.9
第4组
[45,55)
9
0.36
第5组
[55,65]
3
y
(1)分别求出a、b、x、y的值;
(2)从第2、3、4组回答正确的人中用分层抽样的方法抽取6人,求第2、3、4组每组各抽取多少人?
[解析] (1)由频率表中第4组数据可知,第4组总人数为=25,再结合频率分布直方图可知
n==100,
∴a=100×0.01×10×0.5=5,
b=100×0.03×10×0.9=27,
x==0.9,y==0.2.
(2)第2、3、4组回答正确的共有54人.
∴利用分层抽样在54人中抽取6人,每组分别抽取的人数为:第2组:×6=2(人);第3组:×6=3(人);第4组:×6=1(人).2.2用样本估计总体(二)
(
)频率分布直线图和茎线图
(
)问题提出:
(
)列出一组样本数据的频率分布表可以分哪几个步骤进行?
(
)第一步,求极差.
(
)第二步,决定组距与组数.
(
)第三步,确定分点,将数据分组.
(
)第四步,统计频数,计算频率,制成表格.
(
)频率分布直方图是在平面直角坐标系中画若干个依次相邻的小长方形,这些小长方形的宽、高和面积在数量上分别表示什么?
(
)
3.
我们可以用样本数据的频率分布表和频率分布直方图估计总体的频率分布,当总体中的个体数较多或较少时,统计中用什么方法提取样本数据的相关信息,我们将进一步作些探究.
(
)频率分布折线图和茎叶图
(
)探究1:频率分布折线图与总体密度曲线
(
)思考1:在城市居民月均用水量样本数据的频率分布直方图中,各组数据的平均值大致是哪些数?
(
)思考2:在频率分布直方图中,依次连接各小长方形上端的中点,就得到一条折线,这条折线称为频率分布折线图.
你认为频率分布折线图能大致反映样本数据的频率分布吗?
(
)
思考3:当总体中的个体数很多时(如抽样调查全国城市居民月均用水量),随着样本容量的增加,作图时所分的组数增多,组距减少,你能想象出相应的频率分布折线图会发生什么变化吗?
(
)思考4:在上述背景下,相应的频率分布折线图越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.那么图中阴影部分的面积有何实际意义?
(
)思考5:当总体中的个体数比较少或样本数据不密集时,是否存在总体密度曲线?为什么?
(
)不存在,因为组距不能任意缩小
(
)思考6:对于一个总体,能否通过样本数据准确地画出总体密度曲线?
(
)探究1:茎叶图
(
)频率分布表、频率分布直方图和折线图的主要作用是表示样本数据的分布情况,此外,我们还可以用茎叶图来表示样本数据的分布情况.
(
)【问题】
某赛季甲、乙两名篮球运动员每场
比赛的得分情况如下:
(
)
甲运动员得分:13,51,23,8,26,38,16,
33,14,28,39;
乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.
思考1:你能理解这个图是如何记录这些数据的吗?你能通过该图说明哪个运动员的发挥更稳定吗?
思考2:在统计中,上图叫做茎叶图,它也是表示样本数据分布情况的一种方法,其中“茎”指的是哪些数,“叶”指的是哪些数?
思考3:对于样本数据:3.1,2.5,2.0,0.8,1.5,1.0,4.3,2.7,3.1,3.5,用茎叶图如何表示?
思考4:一般地,画出一组样本数据的茎叶图的步骤如何?
第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;
第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;
第三步,将各个数据的叶按大小次序写在茎右(左)侧.
思考5:用茎叶图表示数据的分布情况是一种好方法,你认为茎叶图有哪些优点?
(1)保留了原始数据,没有损失样本信息;(2)数据可以随时记录、添加或修改.
思考6:比较茎叶图和频率分布表,茎叶图中“茎”和“叶”的数目分别与频率分布表中哪些数目相当?
思考7:对任意一组样本数据,是否都适合用茎叶图表示?为什么?
不适合样本容量很大或茎、叶不分明的样本数据.
例.
甲、乙两人数学成绩的茎叶图如下.
(1)求出这两名同学的数学成绩的平均数、中位数;
(2)比较两名同学的成绩,谈谈看法.
练习
1.
为了了解高一学生的体能情况,某校随机抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出了频率分布直方图.图中从左到右各小长方形的面积之比为2:4:17:15:9:3,第二小组的频数为12.
(1)第二小组的频率是多少?
(2)样本容量是多少?
(3)若次数在110以上(含110次)为达
标,试估计该校全体高一学生的达标率约
是多少?
2.
某班级共有学生54人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本.已知2号,28号,41号同学在样本中,那么样本中还有一个同学的学号是
.
3.
在抽取某产品的尺寸过程中,将其尺寸分成若干组,[a,b]是其中一组,抽查出的个体数在该组上的频率为m,该组上的直方图的高为h,则|
a-b
|等于
4.
在一个样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形和的
,且样本容量为160,则中间一组的频数为


A.
32
B.
0.2
C.
40
D.
0.25高一数学必修三教案
课题
§2.2.1
用样本的频率分布估计总体分布(一)
课型
新课
教学目标
(1)
通过实例体会分布的意义和作用。(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图。(3)通过实例体会频率分布直方图、从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。
教学过程
教学内容
备注
一、自主学习
阅读教材P65—P68,思考下列问题:(1)什么是频率分布?(2)怎样列频率分布表?(3)画频率分布直方图的步骤?
二、质疑提问
知识探究(一):频率分布表【问题】
我国是世界上严重缺水的国家
之一,城市缺水问题较为突出,某市政
府为了节约生活用水,计划在本市试行
居民
生活用水定额管理,即确定一个居
民月用水量标准a,用水量不超过a的部
分按平价收费,超出a的部分按议价收费.
通过抽样调查,获得100位居民2007年的
月均用水量如下表(单位:t):
3.1
2.5
2.0
2.0
1.5
1.0
1.6
1.8
1.9
1.63.4
2.6
2.2
2.2
1.5
1.2
0.2
0.4
0.3
0.43.2
2.7
2.3
2.1
1.6
1.2
3.7
1.5
0.5
3.83.3
2.8
2.3
2.2
1.7
1.3
3.6
1.7
0.6
4.13.2
2.9
2.4
2.3
1.8
1.4
3.5
1.9
0.8
4.33.0
2.9
2.4
2.4
1.9
1.3
1.4
1.8
0.7
2.02.5
2.8
2.3
2.3
1.8
1.3
1.3
1.6
0.9
2.32.6
2.7
2.4
2.1
1.7
1.4
1.2
1.5
0.5
2.42.5
2.6
2.3
2.1
1.6
1.0
1.0
1.7
0.8
2.42.8
2.5
2.2
2.0
1.5
1.0
1.2
1.8
0.6
2.2思考1:上述100个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么?
0.2~4.3思考2:样本数据中的最大值和最小值的差称为极差.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?
(4.3-0.2)÷0.5=8.2思考3:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].思考4:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?
思考5:上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?用样本的频率分布估计总体分布.思考6:如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?
88%的居民月用水量在3t以下,可建议取a=3.
思考7:在实际中,取a=3t一定能保证85%以上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?分组时,组距的大小可能会导致结论出现偏差,实践中,对统计结论是需要进行评价的.
思考8:对样本数据进行分组,其组数是由哪些因素确定的?思考9:对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.
思考10:一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?第一步,求极差.第二步,决定组距与组数.第三步,确定分点,将数据分组.第四步,列频率分布表.
三、问题探究
知识探究(二):频率分布直方图
思考1:为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:
思考2:频率分布直方图中小长方形的面积表示什么?小长方形的面积表示该组的频率.所有小长方形的面积和=?所有小长方形的面积和=1.思考3:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?
(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;
(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性等.思考4:样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布直方图的作图步骤如何?第一步,画平面直角坐标系.
第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.
四、课堂检测
1.
有一个容量为50的样本数据的分组及各组的频数如下:[12.5,
15.5)
3
[24.5,
27.5)
10[15.5,
18.5)
8
[27.5,
30.5)
5[18.5,
21.5)
9
[30.5,
33.5)
4[21.5,
24.5)
11⑴列出样本的频率分布表和画出频率分布直方图;⑵根据样本的频率分布估计,小于30.5的数据约占多少?
2.(2006年全国卷II)一个社会调查机构就某地居民的月收入调查了10
000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10
000人中再用分层抽样方法抽出100人作进一步调查,则在[2500,3000](元)月收入段应抽出
25
人3.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;第六组,成绩大于等于18秒且小于等于19秒.右图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为,成绩大于等于15秒且小于17秒的学生人数为,则从频率分布直方图中可分析出和分别为(
A
)A.0.9,35
B.0.9,45C.0.1,35
D.0.1,454.
(
2006年重庆卷)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg)
,得到频率分布直方图如下:根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是
(
C)(A)20
(B)30
(C)40
(D)505.(广东文7、艺术理6)下面左图是某县参加2007年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1、A2、…、A10(如A2表示身高(单位:cm)(150,155)内的学生人数).右图是统计左图中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180cm(含160cm,不含180cm)的学生人数,那么在流程图中的判断框内应填写的条件是(B)A.i<9
B.
i<8
C.
i<7
D.
i<66.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如右,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,
b的值分别为(
A
)A.0,27,78
B.0,27,83C.2.7,78
D.2.7,83
五、小结评价
1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律.我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式.用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚的看到整个样本数据的频率分布情况,并由此估计总体的分布情况.
0.0001
0.0002
0.0003
0.0004
0.0005
1000
1500
2000
2500
3000
3500
4000
月收入(元)
频率/组距
0
13
14
15
16
17
18
19

频率/组距
0.36
0.34
0.18
0.06
0.04
0.02
0.3
0.1
4.3
4.4
4.5
4.6
4.7
4.8
4.9
5.0
5.1
5.2
视力年级
高二
科目____
数学
__
_
主备教师____
__
备课组长审核
课题内容
必修3第二章统计2.2.1频率分布表和频率分布直方图
时间
2009
教学资源分析
课程标准考试说明
课程标准:基本要求:1.了解数据分布的意义和作用,理解样本频率分布的概念。2.学会列频率分布表、画频率分布直方图,体会它们各自的特点。3.能根据实际问题合理地选取样本,并作出合理的解释。发展要求:1.能选择适当的统计图表来表示数据。2.能使用计算器、计算机进行数据分析,绘制统计图表考试说明:1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图,理解它们各自的特点。2.会用样本的频率分布估计总体分布,理解用样本估计总体的思想。3.会用样本估计总体的思想,解决一些简单的实际问题。
教材分析
本章节是学生在初中学过的简单的统计知识一个深化。学生通过本章的学习应体会统计思维与确定性思维的差异。在本章中学生应通过实习作业较为系统地经历数据收集与处理的全过程。学生在了解统计问题时,应该包括两个方面的信息,即问题所涉及的总体和变量,处理统计问题时,学生对于随机性的理解是困难的,为此在教学过程中要通过日常生活中大量的实例以助理解。
教辅资源
中学第二教材
高中教学质量监控讲义A基础训练
多媒体
投影仪
教学目标分析
知识与技能
(1)
通过实例体会分布的意义和作用。(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图。(3)通过实例体会频率分布直方图的特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。
过程与方法
(1)能够从现实生活或其他学科中提出具有一定价值的统计问题;(2)在解决统计问题的过程中,解决一些简单的实际问题。
情感态度与价值观
通过对现实生活和其他学科中统计问题的提出,体会体会统计思维与确定性思维的差异,认识数学的重要性。
重点分析
具体细化内容和确定依据
(1)会列频率分布表,画频率分布直方图;(2)体会用样本估计总体的思想,会用样本的频率分布估计总体分布。
难点分析
(1)通过样本的频率分布估计总体的分布;(2)统计思维的建立;(3)一些简单的实际问题的解决。
主要教学方法
通过对现实生活的探究,感知应用数学知识解决问题的方法,探究法等。
教学过程
(一)新课导入1、复习回顾:引导学生回顾简单随机抽样,系统抽样,分层抽样等概念及相应的步骤;
2、创设情境:在NBA的2008赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板出课题)。(二)新课教学:探究:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢
?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等。因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况。分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式。下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律。可以让我们更清楚的看到整个样本数据的频率分布情况。一、频率分布的概念:频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图以课本制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图。(让学生自己动手作图)二、频率分布直方图的特征:(1)从频率分布直方图可以清楚的看出数据分布的总体趋势。(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。〖探究〗:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?(把学生分成两大组进行,分别作出两种组距的图,然后组织同学们对所作图不同的看法进行交流……)接下来请同学们思考下面这个问题:〖思考〗:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,你能对制定月用水量标准提出建议吗?(让学生仔细观察表和图)三、例题精讲:例1:下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)
(1)列出样本频率分布表﹔(2)一画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.。分析:根据样本频率分布表、频率分布直方图的一般步骤解题,解:(1)样本频率分布表如下:【例题精析】例1:下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)
(1)列出样本频率分布表﹔(2)一画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.。分析:根据样本频率分布表、频率分布直方图的一般步骤解题。解:(1)样本频率分布表如下:(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134cm
的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.〖例2〗:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.第二小组的频率是多少?样本容量是多少?若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1。解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:又因为频率=所以
(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内。(2)在随机数表中选择开始数字。(3)读数获取样本号码。
[分析]
简单随机抽样一般采用两种方法:抽签法和随机数表法。
个性化设计与改进
(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134cm
的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.(三)课堂小结:总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。(四)课堂精练:P71,1.2.(五)课后练习:高中教学质量监控讲义A
数学必修3基础训练(16)(六)板书设计【课堂练习】P第二教材43、44面相关练习【课堂精练】P61
练习
1.
2.
3【课堂小结】总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。【评价设计】1.P72
习题2.2
A组
1、
2(六)板书设计
教学反思
122
126
130
134
138
142
146
150
158
154
身高(cm)
o
0.01
0.02
0.03
0.04
0.05
0.06
0.07
频率/组距
90
100
110
120
130
140
150
次数
o
0.004
0.008
0.012
0.016
0.020
0.024
0.028
频率/组距
0.032
0.036
122
126
130
134
138
142
146
150
158
154
身高(cm)
o
0.01
0.02
0.03
0.04
0.05
0.06
0.07
频率/组距
概念板书
例题示范
学生板演
概念板书
例题示范
学生板演2.2.1 用样本的频率分布估计总体分布
1.频率分布直方图中,小长方形的面积等于该组的(  )                
A.组距
B.频率
C.组数
D.频数
答案:B
2.将容量为100的样本数据按由小到大排列分成8个小组,如下表所示,但第3组被墨汁污染,则第三组的频率为(  )
组号
1
2
3
4
5
6
7
8
频数
10
13
14
15
13
12
9
A.0.14
B.
C.0.03
D.
解析:∵第三组的频数=100-(10+13+14+15+13+12+9)=14,
∴第三组的频率==0.14.
答案:A
3.某时段内共有100辆汽车经过某一雷达地区,汽车时速的频率分布直方图如图所示,则时速不低于60km/h的汽车数量为(  )
A.38
B.28
C.10
D.5
解析:由题图可知,时速不低于60km/h的汽车频率为(0.028+0.010)×10=0.38,则根据公式,频数=频率×样本容量,可得时速不低于60
km/h的汽车数量为0.38×100=38.
答案:A
4.在样本的频率分布直方图中,共有11个小长方形,若中间一个长方形的面积等于其他10个小长方形面积和的,且样本容量为160,则中间一组的频数为(  )
A.32
B.0.2
C.40
D.0.25
解析:设中间一组的频率为x,则x+4x=1,x=0.2,所以中间一组的频数为160×0.2=32.
答案:A
5.为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为(  )
A.64
B.54
C.48
D.27
解析:前两组的频数为100×(0.5+1.1)×0.1=16.
后5组频数为62,所以第三组频数100-16-62=22.
又因为第四组频率最大,所以第四组频率为0.32,频数为32.所以在4.6到4.8之间的学生数为32+22=54.
答案:B
6.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n等于     .
解析:设第一组至第六组数据的频率分别为2x,3x,4x,6x,4x,x,则2x+3x+4x+6x+4x+x=1,解得x=,所以前三组数据的频率分别是,则前三组数据的频数之和等于=27,解得n=60.
答案:60
7.某校开展摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是     .
解析:当x≥4时,≠91,
∴x<4,则=91,
∴x=1.
答案:1
8.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).由图中数据可知a=   .若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为    .
解析:所有小矩形的面积和等于10×(0.005+0.010+0.020+a+0.035)=1,解得a=0.030;100名同学中,身高在[120,130)内的学生数是10×0.030×100=30,身高在[130,140)内的学生数是10×0.020×100=20,身高在[140,150]内的学生数是10×0.010×100=10,则三组内的总学生数是30+20+10=60,抽样比等于,所以从身高在[140,150]内的学生中选取的人数应为10×=3.
答案:0.030 3
9.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8:00~10:00间各自的点击量,得到如图所示的茎叶图.
(1)甲网站点击量在[10,40]间的频率是多少
(2)甲、乙两个网站哪个更受欢迎 请说明理由.
解:(1)甲网站点击量在[10,40]内有17,20,38,32,共有4天,则频率为.
(2)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站的这14天点击量的平均数较大,所以甲网站更受欢迎.
10.如图所示是总体的一样本频率分布直方图,且在[15,18)内的频数为8.
(1)求样本容量.
(2)在该直方图中,[12,15)内小矩形面积为0.06,求样本在[12,15)内的频数.
(3)在(2)条件下,求样本在[18,33]内的频率.
解:(1)由题图可知,[15,18)对应纵轴数字为,且组距为3,故[15,18)对应频率为×3=.
又已知[15,18)内频数为8,故样本容量n==50.
(2)[12,15)内小矩形面积为0.06,即[12,15)内频率为0.06,且样本容量为50,故样本在[12,15)内的频数为50×0.06=3.
(3)由(1)(2)知样本在[12,15)内的频数为3,在[15,18)内的频数为8,样本容量为50.所以在[18,33]内的频数为50-3-8=39,在[18,33]内的频率为=0.78.2.2.1 用样本的频率分布估计总体的分布(二)
一、基础过关
1.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.
则样本在区间[20,+∞)上的频率为
(  )
A.20%   
B.69%   
C.31%   
D.27%
2.
从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为甲、乙,中位数分别为m甲、m乙,则
(  )
A.甲<乙,m甲>m乙
B.甲<乙,m甲C.甲>乙,m甲>m乙
D.甲>乙,m甲3.
右图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为
(  )
A.304.6
B.303.6
C.302.6
D.301.6
4.
对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是
(  )
A.46,45,56
B.46,45,53
C.47,45,56
D.45,47,53
5.对一个未知总体,我们常用样本的频率分布估计总体的分布,其中表示样本数据的频率分布的基本方法有________、________、________、________.
6.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是______,______.
7.某中学高一(2)班甲、乙两名同学自上高中以来每场数学考试成绩情况如下:
甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
8.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.
(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.
二、能力提升
9.某工厂对一批产品进行了抽样检测,右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是
(  )
A.70
B.80
C.90
D.100
10.如图是某赛季甲、乙两名篮球运动员参加的每场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是
(  )


8
0
4
6
3
1
2
5
3
6
8
2
5
4
3
8
9
3
1
6
1
6
7
9
2
4
4
9
1
5
0
A.65
B.64
C.63
D.62
11.在某电脑杂志的一篇文章中,每个句子的字数如下:
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17
在某报纸的一篇文章中,每个句子的字数如下:
27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22
(1)将这两组数据用茎叶图表示;
(2)将这两组数据进行比较分析,你会得到什么结论?
三、探究与拓展
12.某市2012年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,
95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
(1)完成频率分布表.
(2)作出频率分布直方图.
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.
请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
2.2.1 用样本的频率分布估计总体的分布(二)
1.C 2.B 3.B
4.A [由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.]
5.频率分布直方图 频率分布表 频率分布折线图 茎叶图
6.45 46
7.解 甲、乙两人数学成绩的茎叶图如图所示:
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88.因此,乙同学发挥比较稳定,总体得分情况比甲同学好.
8.解 (1)以4为组距,列表如下:
分组
个数累计
频数
频率
[41.5,45.5)
2
0.045
5
[45.5,49.5)
7
0.159
1
[49.5,53.5)
8
0.181
8
[53.5,57.5)
16
0.363
6
[57.5,61.5)
5
0.113
6
[61.5,65.5)
4
0.090
9
[65.5,69.5)
2
0.045
5
合计
44
1.00
(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下及65岁以上就任的总统所占的比例相对较小.
9.C [设这一批产品的总数量为n,因净重小于100克的产品的频率对应的是直方图中最左边两个矩形面积之和,面积之和为0.05×2+0.1×2=0.3,由题意得=0.3,所以
n==120,又因净重大于或等于104克的产品的个数为0.075×2×120=18.产品净重小于98克的数量为0.05×2×120=12,因此,所求产品数量为120-18-12=90.]
10.C
11.解 (1)
 电脑杂志     报纸文章
9
8
7
7
5
5
4
1
0
1
2
3
8
9
8
7
7
7
6
5
4
4
3
2
0
2
2
2
3
4
7
7
7
8
6
1
3
2
2
3
3
5
6
9
4
1
1
6
(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.
12.解 (1)频率分布表:
分组
频数
频率
[41,51)
2
[51,61)
1
[61,71)
4
[71,81)
6
[81,91)
10
[91,101)
5
[101,111]
2
(2)频率分布直方图如图所示.
(3)答对下述两条中的一条即可:
①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的;有26天处于良的水平,占当月天数的;处于优或良的天数为28,占当月天数的.说明该市空气质量基本良好.
②轻微污染有2天,占当月天数的;污染指数在80以上的接近轻微污染的天数为15,加上处于轻微污染的天数2,占当月天数的,超过50%;说明该市空气质量有待进一步改善.2.2用样本估计总体(一)
(
)知识探究(一):频率分布表
(
)【问题】
我国是世界上严重缺水的国家
之一,城市缺水问题较为突出,某市政
府为了节约生活用水,计划在本市试行
居民
生活用水定额管理,即确定一个居
民月用水量标准a,用水量不超过a的部
分按平价收费,超出a的部分按议价收费.
通过抽样调查,获得100位居民2007年的
月均用水量如下表(单位:t):
(
)3.1
2.5
2.0
2.0
1.5
1.0
1.6
1.8
1.9
1.6
(
)3.4
2.6
2.2
2.2
1.5
1.2
0.2
0.4
0.3
0.4
(
)3.2
2.7
2.3
2.1
1.6
1.2
3.7
1.5
0.5
3.8
(
)3.3
2.8
2.3
2.2
1.7
1.3
3.6
1.7
0.6
4.1
(
)3.2
2.9
2.4
2.3
1.8
1.4
3.5
1.9
0.8
4.3
(
)3.0
2.9
2.4
2.4
1.9
1.3
1.4
1.8
0.7
2.0
(
)2.5
2.8
2.3
2.3
1.8
1.3
1.3
1.6
0.9
2.3
(
)2.6
2.7
2.4
2.1
1.7
1.4
1.2
1.5
0.5
2.4
(
)2.5
2.6
2.3
2.1
1.6
1.0
1.0
1.7
0.8
2.4
(
)2.8
2.5
2.2
2.0
1.5
1.0
1.2
1.8
0.6
2.2
(
)思考1:上述100个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么?
0.2~4.3
(
)思考2:样本数据中的最大值和最小值的差称为极差.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?
(4.3-0.2)÷0.5=8.2
(
)思考3:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].
(
)思考4:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?
(
)
(
)思考5:上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?
(
)用样本的频率分布估计总体分布.
(
)思考6:如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?
(
)88%的居民月用水量在3t以下,可建议取a=3.
(
)思考7:在实际中,取a=3t一定能保证85%以上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?
(
)分组时,组距的大小可能会导致结论出现偏差,实践中,对统计结论是需要进行评价的.
(
)思考8:对样本数据进行分组,其组数是由哪些因素确定的?
(
)思考9:对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.
(
)思考10:一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?
(
)第一步,求极差.
(
)第二步,决定组距与组数.
(
)第三步,确定分点,将数据分组.
(
)第四步,列频率分布表.
(
)知识探究(二):频率分布直方图
(
)思考1:为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:
(
)
思考2:
(
)频率分布直方图中
(
)小长方形的面积表示什么?小长方形的面积表示该组的频率.
(
)所有小长方形的面积和=?所有小长方形的面积和=1.
(
)思考3:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?
(
)
(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;
(
)(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;
(
)(3)居民月均用水量的分布有一定的对称性等.
(
)思考4:样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布
直方图的作图步骤如何?
第一步,画平面直角坐标系.
第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.
第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.
课堂练习
1.
有一个容量为50的样本数据的分组及各组的频数如下:
[12.5,
15.5)
3
[24.5,
27.5)
10
[15.5,
18.5)
8
[27.5,
30.5)
5
[18.5,
21.5)
9
[30.5,
33.5)
4
[21.5,
24.5)
11
⑴列出样本的频率分布表和画出频率分布直方图;
⑵根据样本的频率分布估计,小于30.5的数据约占多少?
2.(2006年全国卷II)一个社会调查机构就某地居民的月收入调查了10
000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10
000人中再用分层抽样方法抽出100人作进一步调查,则在[2500,3000](元)月收入段应抽出
25

3.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;第六组,成绩大于等于18秒且小于等于19秒.右图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为,成绩大于等于15秒且小于17秒的学生人数为,则从频率分布直方图中可分析出和分别为(
A

A.0.9,35
B.0.9,45
C.0.1,35
D.0.1,45
4.
(
2006年重庆卷)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg)
,得到频率分布直方图如下:
根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是
(
C)
(A)20
(B)30
(C)40
(D)50
5.(广东文7、艺术理6)下面左图是某县参加2007年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1、A2、…、A10(如A2表示身高(单位:cm)(150,155)内的学生人数).右图是统计左图中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180cm(含160cm,不含180cm)的学生人数,那么在流程图中的判断框内应填写的条件是(B)
A.i<9
B.
i<8
C.
i<7
D.
i<6
6.为了解某校高三学生的视力情况,随机地抽查了该
校100名高三学生的视力情况,得到频率分布直方图,
如右,由于不慎将部分数据丢失,但知道前4组的频
数成等比数列,后6组的频数成等差数列,设最大频
率为a,视力在4.6到5.0之间的学生数为b,则a,
b
的值分别为(
A

A.0,27,78
B.0,27,83
C.2.7,78
D.2.7,83
小结作业
1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律.我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.
2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式.用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.
3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚的看到整个样本数据的频率分布情况,并由此估计总体的分布情况.
0.0001
0.0002
0.0003
0.0004
0.0005
1000
1500
2000
2500
3000
3500
4000
月收入(元)
频率/组距
0
13
14
15
16
17
18
19

频率/组距
0.36
0.34
0.18
0.06
0.04
0.02
0.3
0.1
4.3
4.4
4.5
4.6
4.7
4.8
4.9
5.0
5.1
5.2
视力