高中数学(新课标人教A版)必修三《221用样本的频率分布估计总体分布》(课件+教案+导学案+训练评估)(打包5份)

文档属性

名称 高中数学(新课标人教A版)必修三《221用样本的频率分布估计总体分布》(课件+教案+导学案+训练评估)(打包5份)
格式 zip
文件大小 1.6MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2013-03-16 16:29:23

文档简介

§2.2.1用样本的频率分布估计总体分布1
授课
时间
第 周 星期 第 节
课型
新授课
主备课人
学习
目标
1.掌握常用四种统计图表(条形统计图、扇形统计图、折线统计图、茎叶图)的功能及其特点.
2.能针对实际问题和收集到的数据的特点,选择科学的统计图表.
3.能从统计图表中获取有价值的信息
重点难点
选择一种适当数据表示方法;
能从统计图表中获取有价值的信息
学习
过程
与方

自主学习
复习回顾
1.四种常用的统计图表为 ;
2.绘制频数条形统计图的一般步骤:
阅读课本16-22页并回答课本中的问题.
精讲互动
分析绘制四种统计图表的方法及优缺点
达标训练
1.关于频率直方图的下列有关说法正确的是(  )
A.直方图的高表示取某数的频率
B.直方图的高表示该组上的个体在样本中出现的频率
C.直方图的高表示取某组上的个体在样本中出现的频数与组距的比值
D.直方图的高表示取该组上的个体在样本中出现的频率与组距的比值
2.某地一种植物一年生长的高度如下表:
高度(cm)
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
棵数
20
30
80
40
30
则该植物一年生长在[30,40)内的频率是(  )
A.0.80 B.0.65
C.0.40 D.0.25
3.如图表示甲、乙两名篮球运动员每场比赛得分情况的茎叶图,则甲和乙得分的中位数的和是(  )

4.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力从4.6到5.0之间的学生数为b,则a,b的值分别为(  )
A.0.27,78 B.0.27,83
C.2.7,78 D.2.7,83
5.一组数据中的每一个数据都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是(  )
A.81.2,4.4 B.78.8,4.4
C.81.2,84.4 D.78.8,75.6
6.(2008年上海卷)已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a、b的取值分别是________.
7.(15分)下图是某个人口为90万人的县城人口年龄分布:
(1)年龄大于60岁的有多少人?
(2)年龄小于20岁和在40~60岁间的共有多少人?
(3)年龄在20~40岁的人口比大于60岁的人口多多少?
8.(15分)为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行了一次测量,所得数据整理后列出了频率分布表如下:
组别
频数
频率
145.5~149.5
1
0.02
149.5~153.5
4
0.08
153.5~157.5
20
0.40
157.5~161.5
15
0.30
161.5~165.5
8
0.16
165.5~169.5
m
n

M
N
(1)求出表中m,n,M,N所表示的数分别是多少?
(2)画出频率分布直方图;
(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5以上的概率.
9.(16分)对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如下表:

27
38
30
7
35
31

33
29
38
34
28
36
(1)画出茎叶图,由茎叶图你能获得哪些信息?
(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、中位数、标准差,并判断选谁参加比赛更合适.
作业
布置
习题1-3 3,4,5
学习小结/教学
反思
§2.2.1用样本的频率分布估计总体分布2
授课
时间
第 周 星期 第 节
课型
新授课
主备课人
学习
目标
体会分布的意义和作用;
学会列频率分布表,会画频率分布条形图、直方图;
会用频率分布表或分布条形图、直方图估计总体分布,并作出合理解释。
重点难点
会用频率分布表或分布条形图、直方图估计总体分布,并作出合理解释。
学习
过程
与方

自主学习
阅读课本32-33页并回答思考交流的问题.
抽象概括出:
1)编制频率分布直方表的步骤
2)频率分布直方图的绘制的步骤
3)频率分布折线图的绘制
精讲互动
讲解几种频率分布的联系和区别
例题讲解
例1 :为检测某产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件。
⑴ 列出样本的频率分布表;
⑵此种产品为二级品或三级品的概率?
⑶能否画出样本分布的条形图?
分析:当总体中的个体取不同数值很少时,可用频率分布表或频率分布条形图估计总体分布。
达标训练
1.在用样本频率估计总体分布的过程中,下列说法中正确的是( )
A.总体容量越大,估计越精确 B.总体容量越小,估计越精确C.样本容量越大,估计越精确 D.样本容量越小,估计越精确
2. 一个容量为n的样本,分成若干组,已知某数的频数和频率分别为50和0.25,则n=     .
3. 一个容量为32的样本,已知某组的样本的频率为0.25,则该组样本的频数为( )
A.2 B.4 C.6 D.8
4.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用右侧的条形图表示. 根据条形图可得这50名学生这一天平均每人的课外阅读时间为 ( )
0.6小时 0.9小时
1.0小时 1.5小时
5.(江西卷)为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如右,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a, b的值分别为( )
A.0,27,78 B.0,27,83
C.2.7,78 D.2.7,83
3.如图表示甲、乙两名篮球运动员每场比赛得分情况的茎叶图,则甲和乙得分的中位数的和是(  )

2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体分布
整体设计
教学分析
教科书通过探究栏目引导学生思考居民生活用水定额管理问题,引出总体分布的估计问题,该案例贯穿于本节始终.通过对该问题的探究,使学生学会列频率分布表、画频率分布直方图、频率分布折线图.教科书在这里主要介绍有关频率分布的列表和画图的方法,而关于频率分布的随机性和规律性方面则给教师留下了较大的发挥空间.教师可以通过初中有关随机事件的知识,也可以利用计算机多媒体技术,引导学生进一步体会由样本确定的频率分布表和频率分布直方图的随机性;通过初中有关频率与概率之间的关系,了解频率分布直方图的规律性,即频率分布与总体分布之间的关系,进一步体会用样本估计总体的思想.
由于样本频率分布直方图可以估计总体分布,因此可以用样本频率分布特征来估计相应的总体分布特征,这就提供了估计总体特征的另一种途径,其意义在于:在没有原始数据而仅有频率分布的情况下,此方法可以估计总体的分布特征.
三维目标
1.通过实例体会分布的意义和作用,通过对现实生活的探究,感知应用数学知识解决问题的方法.
2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图,理解数形结合的数学思想和逻辑推理的数学方法.
3.通过对样本分析和总体估计的过程,感受数学对实际生活的需要,通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地作出总体估计,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.
重点难点
教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.
教学难点:能通过样本的频率分布估计总佒的分布.
课时安排
1课时
教学过程
导入新课
思路1
在NBA的2006赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕
甲运动员得分:12,15,20,25,31,31,36,36,37,39,44,49,50
乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,29,33
请问从上面的数据中你能否看出甲、乙两名运动员哪一位发挥比较稳定?
如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板书课题).
思路2
如下样本是随机抽取近年来北京地区7月25日至8月24日的日最高气温.
7月25日至8月10日
41.9
37.5
35.7
35.4
37.2
38.1
34.7
33.7
33.3
32.5
34.6
33.0
30.8
31.0
28.6
31.5
28.8
8月8日至8月24日
28.6
31.5
28.8
33.2
32.5
30.3
30.2
29.8
33.1
32.8
29.8
25.6
24.7
30.0
30.1
29.5
30.3
怎样通过上表中的数据,分析比较两时间段内的高温(≥33 ℃)状况?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.
思路3
讨论:我们要了解我校学生每月零花钱的情况,应该怎样进行抽样?
提问:学习了哪些抽样方法?一般在什么时候选取什么样的抽样方法呢?
讨论:通过抽样方法收集数据的目的是什么?(从中寻找所包含的信息,用样本去估计总体)
指出两种估计手段:一是用样本的频率分布估计总体的分布,二是用样本的数字特征(平均数、标准差等)估计总体的数字特征.这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.
推进新课
新知探究
提出问题
(1)我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)
(2)什么是频率分布?
(3)画频率分布直方图有哪些步骤?
(4)频率分布直方图的特征是什么?
讨论结果:
(1)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.
分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.
下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚地看到整个样本数据的频率分布情况.
(2)频率分布是指一个样本数据在各个小范围内所占比例的大小;一般用频率分布直方图反映样本的频率分布.
(3)其一般步骤为:
①计算一组数据中最大值与最小值的差,即求极差;
②决定组距与组数;
③将数据分组;
④列频率分布表;
⑤画频率分布直方图.
(4)频率分布直方图的特征:
①从频率分布直方图可以清楚地看出数据分布的总体趋势.
②从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象.
提出问题
(1)什么是频率分布折线图?
(2)什么是总体密度曲线?
(3)对于任何一个总体,它的密度曲线是否一定存在?是否可以被非常准确地画出来?
(4)什么叫茎叶图?画茎叶图的步骤有哪些?
(5)茎叶图有什么特征?
讨论结果:
(1)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.
(3)实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越?精确?.
(4)当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.
画茎叶图的步骤如下:
①将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎为十位上的数字,叶为个位上的数字;
②将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;
③将各个数据的叶按大小次序写在其茎右(左)侧.
(5)①用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.
②茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.
茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录(这对于教练员发现运动员现场状态特别有用);而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.
正确利用三种分布的描述方法,都能得到一些有关分布的主要特点(如分布是否具有单峰性、是否具有对称性、样本点落在各分组中的频率等),这些主要特点受样本的随机性的影响比较小,更接近于总体分布的相应的特点.
频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,茎叶图和频率分布表极为类似,事实上,茎相当于频率分布表中的分组;茎上叶的数目相当于频率分布表中指定区间组的频数.
应用示例
思路1
例1 有100名学生,每人只能参加一个运动队,其中参加足球队的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人.
(1)列出学生参加运动队的频率分布表.
(2)画出频率分布条形图.
解:(1)参加足球队记为1,参加篮球队记为2,参加排球队记为3,参加乒乓球队记为4,得频率分布表如下:
试验结果
频数
频率
参加足球队(记为1)
30
0.30
参加篮球队(记为2)
27
0.27
参加排球队(记为3)
23
0.23
参加乒乓球队(记为4)
20
0.20
合 计
100
1.00
(2)由上表可知频率分布条形图如下:
例2 为了了解中学生的身体发育情况,对某中学17岁的60名女生的身高进行了测量,结果如下:(单位:cm)
154 159 166 169 159 156 166 162 158
156 166 160 164 160 157 151 157 161
158 153 158 164 158 163 158 153 157
162 159 154 165 166 157 151 146 151
160 165 158 163 163 162 161 154 165
162 159 157 159 149 164 168 159 153
列出样本的频率分布表;绘出频率分布直方图.
解:第一步,求极差:上述60个数据中最大为169,最小为146.
故极差为:169-146=23 cm.
第二步,确定组距和组数,可取组距为3 cm,则组数为,可将全部数据分为8组.
第三步,确定组限:[145.5,148.5),[148.5,151.5),[151.5,154.5),[154.5,157.5),[157.5,160.5),[160.5,163.5),[163.5,166.5),[166.5,169.5).
第四步,列频率分布表:
分组
个数累计
频数
频率
[145.5,148.5)
1
0.017
[148.5,151.5)
3
0.050
[151.5,154.5)
6
0.100
[154.5,157.5)
8
0.133
[157.5,160.5)
18
0.300
[160.5,163.5)
11
0.183
[163.5,166.5)
10
0.167
[166.5,169.5)
3
0.050
合计
60
1.000
第五步,根据上述数据绘制频率分布直方图如下图:
以上例1和例2两种情况的不同之处在于,前者的频率分布表列出的是几个不同数值的频率,相应的条形图是用其高度表示取各个值的频率;后者的频率分布表列出的是在不同区间内取值的频率,相应的直方图是用图表面积的大小来表示在各个区间内取值的频率.
我们在处理一个数理问题时可以采用样本的频率分布估计总体分布的方法,这是因为,频率分布随着样本容量的增大更加接近于总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布的直方图就演变成一条光滑的曲线——总体密度曲线.这条曲线是客观存在的,但是我们却很难将它准确地画出,我们只能用样本的频率分布去对它进行估计.基于频率分布与相应的总体分布有这种关系,再加上我们通常并不知道一个总体的分布,我们往往是从一个总体中抽取一个样本,用样本的频率去估计相应的总体分布.一般说来,样本的容量越大,这种估计就越精确.
例3 从某校高一年级的1 002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表,并估计身高不小于170(cm)的同学所占的百分率.
168
165
171
167
170
165
170
152
175
174
165
170
168
169
171
166
164
155
164
158
170
155
166
158
155
160
160
164
156
162
160
170
168
164
174
170
165
179
163
172
180
174
173
159
163
172
167
160
164
169
151
168
158
168
176
155
165
165
169
162
177
158
175
165
169
151
163
166
163
167
178
165
158
170
169
159
155
163
153
155
167
163
164
158
168
167
161
162
167
168
161
165
174
156
167
166
162
161
164
166
解:(1)在全部数据中找出最大值180与最小值151,它们相差(极差)29,决定组距为3;
(2)将区间[150.5,180.5]分成10组;分别是[150.5,153.5),[153.5,156.5),…,?[177.5,180.5)?;
(3)从第一组[150.5,153.5)开始分别统计各组的频数,再计算各组的频率,列频率分布表:
分组
频数累计
频数
频率
[150.5,153.5)
4
4
0.04
[153.5,156.5)
12
8
0.08
[156.5,159.5)
20
8
0.08
[159.5,162.5)
31
11
0.11
[162.5,165.5)
53
22
0.22
[165.5,168.5)
72
19
0.19
[168.5,171.5)
86
14
0.14
[171.5,174.5)
93
7
0.07
[174.5,177.5)
97
4
0.04
[177.5,180.5)
100
3
0.03
合计
100
1
根据频率分布表可以估计,估计身高不小于170的同学所占的百分率为:
[0.14×+0.07+0.04+0.03]×100%=21%.
点评:一般地,编制频率分布表的步骤如下:
(1)求极差,决定组数和组距;
(2)分组,通常对组内的数值所在的区间取左闭右开区间;
(3)登记频数,计算频率,列出频率分布表.
思路2
例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm).
区间界限
[122,126)
[126,130)
[130,134)
[134,138)
[138,142)
人数
5
8
10
22
33
区间界限
[142,146)
[146,150)
[150,154)
[154,158)
人数
11
6
5
20
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)估计身高小于134 cm的人数占总人数的百分比.
分析:根据样本频率分布表、频率分布直方图的一般步骤解题.
解:(1)样本频率分布表如下:
分组
频数
频率
[122,126)
5
0.04
[126,130)
8
0.07
[130,134)
10
0.08
[134,138)
22
0.18
[138,142)
33
0.28
[142,146)
20
0.17
[146,150)
11
0.09
[150,154)
6
0.05
[154,158)
5
0.04
合计
120
1
(2)其频率分布直方图如下:
(3)由样本频率分布表可知身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.
例2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如下图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.
解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,
因此第二小组的频率为:=0.08;
又因为频率=,
所以样本容量==150.
(2)由图可估计该学校高一学生的达标率约为×100%=88%.
例3 甲、乙两篮球运动员在上赛季每场比赛的得分如下,试比较这两位运动员的得分水平.
甲:12,15,24,25,31,31,36,36,37,39,44,49,50;
乙:8,13,14,16,23,26,28,33,38,39,51.
解:画出两人得分的茎叶图如下:
从这个茎叶图可以看出甲运动员的得分大致对称,平均得分及中位数、众数都是30多分;乙运动员的得分除一个51外,也大致对称,平均得分及中位数、众数都是20多分,因此甲运动员发挥比较稳定,总体得分情况比乙好.
知能训练
1.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据下图可知( )
A.甲运动员的成绩好于乙运动员 B.乙运动员的成绩好于甲运动员
C.甲、乙两名运动员的成绩没有明显的差异 D.甲运动员的最低得分为0分
答案:A
2.有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15.5],3;(15.5,?18.5?], 8;(18.5,21.5],9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的( )
A.91% B.92% C.95% D.30%
答案:A
3.一个容量为20的样本数据,数据的分组及各组的频数如下:
(10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4;(60,70),2.
则样本在区间(10,50)上的频率为( )
A.0.5 B.0.7 C.0.25 D.0.05
答案:B
4.一个高中研究性学习小组对本地区2000年至2002年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如下图),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭____________万盒.

快餐公司个数情况图 快餐公司盒饭年销售量的平均数情况图
答案:85
拓展提升
为了了解一大片经济林生长情况,随机测量其中的100株的底部周长,得到如下数据表(单位:cm).
135
98
102
110
99
121
110
96
100
103
125
97
117
113
110
92
102
109
104
112
109
124
87
131
97
102
123
104
104
128
105
123
111
103
105
92
114
108
104
102
129
126
97
100
115
111
106
117
104
109
111
89
110
121
80
120
121
104
108
118
129
99
90
99
121
123
107
111
91
100
99
101
116
97
102
108
101
95
107
101
102
108
117
99
118
106
119
97
126
108
123
119
98
121
101
113
102
103
104
108
(1)编制频率分布表;(2)绘制频率分布直方图;(3)估计该片经济林中底部周长小于100 cm的树木约占多少?周长不小于120 cm的树木约占多少?
解:(1)这组数据的最大值为135,最小值为80, 极差为55,可将其分为11组,组距为5.
频率分布表如下:
分组
频数
频率
频率/组距
[80,85)
1
0.01
0.002
[85,90)
2
0.02
0.004
[90,95)
4
0.04
0.008
[95,100)
14
0.14
0.028
[100,105)
24
0.24
0.048
[105,110)
15
0.15
0.030
[110,115)
12
0.12
0.024
[115,120)
9
0.09
0.018
[120,125)
11
0.11
0.022
[125,130)
6
0.06
0.012
[130,135]
2
0.02
0.004
合计
100
1
0.2
(2)直方图如下图:
(3)从频率分布表得,样本中小于100的频率为0.01+0.02+0.04+0.14=0.21,样本中不小于120的频率为0.11+0.06+0.02=0.19,估计该片经济林中底部周长小于100 cm的树木约占21%,周长不小于120 cm的树木约占19%.
课堂小结
总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.
总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.
作业
习题2.2A组1、2.
设计感想
本节课是高一新课程必修三第二章《统计》中的第二节《用样本估计总体》的第一节课,尽管用样本估计总体是一种实用性很强,操作烦琐、麻烦的工作,但却是统计学中常用的方法,在生产、生活中应用非常广泛.用样本估计总体,其实就是一种“以偏概全”“以部分代替全部”的思想.虽然有贬义的成分,但我们还是要认真去教好学好,而且,这也是平时考试和高考中的重点内容之一.
本节要解决的问题就是:为何要用样本估计总体——社会生产、生活的实际需要(必要性),如比赛、竞技中预测结果,评判质量谁好谁差,水平谁高谁低经常要用到.如何去用样本估计总体——用样本的频率分布去估计总体的频率分布;怎样用样本估计总体——作出样本频率分布表或频率分布直方图,懂得用 “数据”语言说话.
另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育并增强学生的自信心,使学生养成良好的学习态度.
2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体分布
双基达标 ?限时20分钟?
1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是 (  ).
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确
解析 由用样本估计总体的性质可得.
答案 C
2.频率分布直方图中,小长方形的面积等于 (  ).
A.组距 B.频率
C.组数 D.频数
解析 根据小长方形的宽及高的意义,可知小长方形的面积为一组样本数据的频率.
答案 B
3.一个容量为100的样本,其数据的分组与各组的频数如下表
组别
(0,10]
(10,20]
(20,30]
(30,40]
(40,50]
(50,60]
(60,70]
频数
12
13
24
15
16
13
7
则样本数据落在(10,40)上的频率为 (  ).
A.0.13 B.0.39 C.0.52 D.0.64
解析 由题意可知频数在(10,40]的有:13+24+15=52,由频率=频数÷总数可得0.52.
答案 C
4.一个容量为n的样本,分成若干组,已知甲组的频数和频率分别为36和,则容量n=________,且频率为的乙组的频数是________.
解析 抽样时要保证每个个体被抽到的机会均等,=,所以n=36×4=144,同理=,x=24.
答案 144 24
5.为了帮助班上的两名贫困生解决经济困难,班上的20名同学捐出了自己的零花钱,他们捐款数(单位:元)如下:19,20,25,30,24,23,25,29,27,27,28,28,26,27,21,30,20,19,22,20.班主任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心.制图时先计算最大值与最小值的差是________.若取组距为2,则应分成________组;若第一组的起点定为18.5,则在[26.5,28.5)内的频数为________.
解析 由题意知,极差为30-19=11;由于组距为2,则=5.5不是整数,所以取6组;捐款数落在[26.5,28.5)内的有27,27,28,28,27共5个,因此频数为5.
答案 11 6 5
6.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.
(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.
解 (1)以4为组距,列表如下:
分组
频数累计
频数
频率
[41.5,45.5)
2
0.045 5
[45.5,49.5)
7
0.159 1
[49.5,53.5)
8
0.181 8
[53.5,57.5)
16
0.363 6
[57.5,61.5)
5
0.113 6
[61.5,65.5)
4
0.090 9
[65.5,69.5]
2
0.045 5
合计
44
1.00
(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.
综合提高 ?限时25分钟?
7.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.
则样本在区间[20,+∞)上的频率为 (  ).
A.20% B.69% C.31% D.27%
解析 由题意,样本中落在[20,+∞)上的频数为5+4+2=11,∴在区间[20,+∞)上的频率为≈0.31.
答案 C
8.(2012·烟台高一检测)某工厂对一批产品进行了
抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是 (  ).
A.90 B.75 C.60 D.45
解析 ∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,
∴样本总数为=120.
∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,
∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.
答案 A
9.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.
解析 ∵n×=27,∴n=60.
答案 60
10.如图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知________.
甲运动员的成绩好于乙运动员;②乙运动员的成绩好于甲运动员;③甲、乙两名运
动员的成绩没有明显的差别;④甲运动员的最低得分为0分.
解析 从这个茎叶图可以看出甲运动员的得分大致对称,平均得分是30多分,乙运动员的得分除一个52分外,也大致对称,平均得分20多分.因此,甲运动员发挥比较稳定,总体得分情况比乙好.
答案 ①
11.(2012·合肥高一检测)在某电脑杂志的一篇文章中,每个句子的字数如下:
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17
在某报纸的一篇文章中,每个句子的字数如下:
27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22
(1)将这两组数据用茎叶图表示;
(2)将这两组数据进行比较分析,你会得到什么结论?
解 (1)
(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.
12.(创新拓展)如图是一个样本的频率分布直方图,且在[15,18)内频数为8.
(1)求样本容量;
(2)若[12,15)一组的小长方形面积为0.06,求[12,15)
一组的频数;
(3)求样本在[18,33)内的频率.
解 (1)由图可知[15,18)一组对应的纵轴数值为,且组距为3,所以[15,18)一组对应的频率为×3=.
又已知[15,18)一组的频数为8,所以样本容量n==50.
(2)[12,15)一组的小长方形面积为0.06,即[12,15)一组的频率为0.06,且样本容量为50,所以[12,15)一组的频数为50×0.06=3.
(3)由(1)、(2)知[12,15)一组的频数为3,[15,18)一组的频数为8,样本容量为50,所以[18,33)内频数为50-3-8=39,所以[18,33)内的频率为=0.78.
课件33张PPT。【课标要求】
1.理解用样本的频率分布估计总体分布的方法.
2.会列频率分布表,画频率分布直方图、频率分布折线
图、茎叶图.
3.能够利用图形解决实际问题.
【核心扫描】
1.频率分布直方图、频率分布折线图的意义.(重点)
2.应用频率分布直方图估计总体的分布.(难点)
3.准确理解频率分布直方图中纵、横轴的意义.(易混点)
2.2.1 用样本的频率分布估计总体分布2.2 用样本估计总体用样本估计总体的两种情况
(1)用样本的_________估计总体分布.
(2)用样本的_________估计总体数字特征.
数据分析的基本方法
(1)借助于图形
分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中_________ ,二是利用图形_________.
(2)借助于表格
分析数据的另一方法是用紧凑的表格改变数据的排列方式,此法是通过改变数据的构成形式,为我们提供解释数据的新方式.1.2.自学导引频率分布数字特征提取信息传递信息作频率分布直方图的步骤
(1)求极差:即一组数据中_______和_______的差;
(2)决定组距与组数:将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.这时应注意:①一般样本容量越大,所分组数_____;②为方便起见,组距的选择应力求“取整”;③当样本容量不超过100时,按照数据的多少,通常分成5~12组.
(3)将数据分组:按组距将数据分组,分组时,各组均为左闭右开区间,最后一组是闭区间.
(4) ______________.一般分四列:分组、频数累计、频数、频率,最后一行是合计.其中频率合计应是样本容量,频率合计是1.
3.最大值最小值越多列频率分布表(5)画频率分布直方图.画图时,应以横轴表示分组,纵轴表示_________.其相应组距上的频率等于该组上的小长方形的面积. 将数据的样本进行分组的目的是什么?
提示 从样本中的一个个数字中很难直接看出样本所包含的信息,通过分组,并计算其频率,目的是通过描述样本数据分布的特征估计总体的分布情况.
频率/组距频率分布折线图与总体密度曲线
(1)连接频率分布直方图中各小长方形上端的_____,就得到频率分布折线图.
(2)在样本频率分布直方图中,当样本容量逐渐增加,作图时所分的组数增加, _____减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.4.中点组距茎叶图
(1)定义:顾名思义,茎是指_____的一列数,叶就是从茎的_____生长出来的数,中间的数字表示十位数,旁边的数字表示个位数.
(2)茎叶图的优点与不足
①优点:一是原始数据信息在图中能够保留,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.
②不足:当样本数据较多时,茎叶图就显得不太方便.
5.中间旁边1.关于频率分布直方图的理解
名师点睛(2)在频率分布直方图中,各小长方形的面积的总和等于1.
(3)同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到图的形式也不一样,不同的形状给人不同的印象,这种印象有时会影响我们对总体的判断.
(4)频率分布图(表)能使我们清楚地知道数据分布在各个小组的个数,而频率分布直方图则是从各个小组数据在样本容量中所占比例大小的角度来表示数据分布的规律,它可以使我们看到整个样本数据的频率分布.列频率分布直方图的步骤及注意事项
(1)步骤:①计算数据中最大值和最小值的差,知道了极差就知道了这组数据的变动范围有多大.②决定组数和组距.组距是指每个小组的两个端点之间的距离.③决定分点.④列频率分布表.⑤绘制频率分布直方图.
(2)注意事项:①组距的选择应力求“取整”,如果极差不利于分组(如不能被组数整除),可适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同).
②分点数的决定方法是:若数据为整数,则分点数据减去0.5;若数据是小数点后一位的数,则分点减去0.05,以此类推.2.几种表示频率分布的方法的优点与不足
(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势时不太方便.
(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在频率分布表中看不清楚的数据模式.例如,从教材中调查100位居民的月均用水量的问题所示的图中可以清楚地看到,居民月均用水量的分布是“山峰”状的,而且是“单峰”的,另外还有一定的对称性.这说明,大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少.但是从频率分布直方图本身得不出原始的数据内容,也就是说,把数据表示成频率分布直方图后,原有的具体数据信息就被抹掉了.3.(3)频率分布折线图的优点是它反映了数据的变化趋势.如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体密度曲线.
(4)用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到.二是茎叶图便于记录和表示数据,能够展示数据的分布情况.但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.题型一 频率分布直方图的绘制 调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:
171 163 163 166 166 168 168 160 168 165
171 169 167 169 151 168 170 168 160 174
165 168 174 159 167 156 157 164 169 180
176 157 162 161 158 164 163 163 167 161
(1)作出频率分布表;
(2)画出频率分布直方图.【例1】[思路探索] 确定组距与组数是解决“样本中的个体取不同值较多”这类问题的出发点.
解 (1)最低身高151 cm,最高身高180 cm,它们的差是180-151=29,即极差为29;确定组距为4,组数为8,列表如下:
(2)频率分布直方图如图所示.规律方法 (1)解决此类问题的关键是绘制频率分布表,在绘制频率分布表时要体现分组的合理性,针对具体问题具体分析,体会组数太多或太少对处理问题的影响.
(2)如果极差不利于分组(如不能被组数整除),可适当增大极差,如在左右两端各增加适当范围(尽量使两端增加的量相同). 在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共有100个数据,将数据分组如下表:
(1)完成频率分布表,并画出频率分布直方图;
(2)估计纤度落在[1.38,1.50)内的可能性及纤度小于1.42的可能性各是多少?【变式1】解 (1)频率分布表如下:
频率分布直方图如图所示.
(2)纤度落在[1.38,1.50)的可能性即为纤度落在[1.38,1.50)的频率,即为0.3+0.29+0.10=0.69=69%.
纤度小于1.42的可能性即为纤度小于1.42的频率,即为0.04+0.25+0.30=0.59=59%. 某中学甲、乙两名同学最近几次的数学考试成绩情况如下:
甲的得分:95,81,75,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
题型二 茎叶图及其应用【例2】解 甲、乙两人数学成绩的茎叶图如图所示.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此乙同学发挥比较稳定,总体得分情况比甲同学好.规律方法 茎叶图在样本数据较少,较为集中且位数不多时比较适用.由于它较好地保留了原始数据,所以可以帮助分析样本数据的大致频率分布,还可以用来分析样本数据的一些数字特征. 甲、乙两个小组各10名学生的英语口语测试成绩(单位:分)如下:
甲组:76 90 84 86 81 87 86 82 85 83
乙组:82 84 85 89 79 80 91 89 79 74
用茎叶图表示两个小组的成绩,并判断哪个小组的成绩更整齐一些.
解 茎叶图如图所示(中间的茎为十位上的数字):【变式2】 为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组情况与频数如下:
[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;[11.35,11.45),7;[11.45,11.55),4;[11.55,11.65],2
(1)列出频率分布表;
(2)画出频率分布直方图以及频率分布折线图;
(3)据上述图表,估计数据落在[10.95,11.35)范围内的可能性是百分之几;
(4)数据小于11.20的可能性是百分之几.
审题指导 根据画频率分布直方图的步骤先画频率分布直方图,再画折线图.
题型三 频率分布直方图的综合应用【例3】[规范解答] (1)频率分布表如下:(3分)(2)频率分布直方图及频率分布折线图,如图
(3)由上述图表可知数据落在[10.95,11.35)范围内的频率为1-(0.03+0.09)-(0.07+0.04+0.02)=0.75=75%,即数据落在[10.95,11.35)范围内的可能性是75%. (10分)
(4)数据小于11.20的可能性即数据小于11.20的频率,设为x,
则(x-0.41)÷(11.20-11.15)
=(0.67-0.41)÷(11.25-11.15),
所以x-0.41=0.13,即x=0.54,
从而估计数据小于11.20的可能性是54%. (12分)(8分)【题后反思】 (1)用样本的频率分布估计总体的分布,是列频率分布表和画频率分布直方图的主要目的,频率分布表比较准确地反映样本的频率分布,而频率分布直方图则能直观地反映样本的频率分布.
(2)频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.
(2012·盐城高一检测)为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?【变式3】 数形结合思想是中学数学很重要的方法之一,是高考的重要内容之一,基本思想是根据数的结构特征,构造出与之相应的几何图形,并利用图形的特性和规律,解决数的问题,或将图形信息全部转化成代数信息,使解决形的问题转化为数学关系的讨论.
方法技巧 数形结合思想 (2009·安徽高考)某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:
品种A:357,359,367,368,375,388,392,399,400,405,
412,414,415,421,423,423,427,430,430,434,
443,445,445,451,454
品种B:363,371,374,383,385,386,391,392,394,394,
395,397,397,400,401,401,403,406,407,410,
412,415,416,422,430
【示例】(1)完成数据的茎叶图;
(2)用茎叶图处理现有的数据,有什么优点?
(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
[思路分析] (1)根据茎叶图的特点制作茎叶图;(2)问考查茎叶图的优点;(3)问根据茎叶图中数的分布规律写出结论.解  (1)
(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.
(3)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.方法点评 茎叶图的优缺点
优点:(1)统计图上无原始信息的损失;
(2)可以直观地看出数据的分布情况;
(3)双茎叶图还有利于对两组数据进行比较.
缺点:(1)数据量较大时,茎叶图效果不好;
(2)特别分散的数据不宜制作茎叶图.单击此处进入 活页规范训练