2019_2020学年高中数学第12章统计学初步12.3用样本分布估计总体分布课件+学案(3份打包)湘教版必修5

文档属性

名称 2019_2020学年高中数学第12章统计学初步12.3用样本分布估计总体分布课件+学案(3份打包)湘教版必修5
格式 zip
文件大小 6.8MB
资源类型 教案
版本资源 湘教版
科目 数学
更新时间 2020-06-28 21:23:15

文档简介

(共54张PPT)
第12章 统计学初步
第12章 统计学初步
分段
各段的端点
频率折线图
数据频率分布的规律


分布形状
是否集中
本部分内容讲解结束
按ESC键退出全屏播放
A
预习案,自生学习
研读·思考·尝试
探究案·讲练叵动
解惑·探究·突破
1621263
0.19
0.15
0.05
0.02
2468101212.3.1 频率分布表
12.3.2 频率分布直方图
12.3.3 频率折线图
12.3.4 数据茎叶图
 1.理解用样本的频率分布估计总体分布的方法. 2.会列频率分布表,会画频率分布直方图、频率折线图、数据茎叶图. 3.能够利用图表解决实际问题,培养学生处理数据的能力.
1.频率
当样本量是n的观测数据中有ni个yi时,我们称fi=是yi出现的频率,简称yi的频率.
2.频率分布表的制作步骤
第一步:分段(分组);
第二步:决定各段的长短;
第三步:绘制频率分布表的第一列;
第四步:计算每段内数据的个数ni,填入表格的第二列;
第五步:计算数据落在每一段内的频率fi,填入表格的第三列.
第六步:将第二、第三列之和填入最后一行.
3.频率分布直方图
将观测数据按照制作频率分布表的方法进行分段,计算出数据落入各段的fi,将各段的端点画在直角坐标系中的横坐标上,用fi/组距作为纵坐标的高,就得到了由相连接长方形构成的图形,把所得到的图形称为数据的频率分布直方图,简称直方图.
4.频率折线图
用d1,d2,…,dk分别表示频率分布直方图中各矩形上边的中点,在直方图的左边延长出一个分段,分段的中点用d0表示,在直方图的右边也延长出一个分段,分段的中点用dk+1表示.
用直线连接d0,d1,d2,…,dk+1就得到了一条折线,这条折线叫作频率折线图,频率折线图也反映出数据频率分布的规律.
5.茎叶图
(1)由茎和叶两部分组成,在制作茎叶图的时候要先确定数据的“茎”和“叶”.
(2)从数据的茎叶图可以看出数据的分布形状及数据是否对称,是否集中等分布特性.
6.双茎叶图
(1)定义:表示两组数据的茎叶图.
(2)优点:有利于对这两组数据进行比较.
1.判断正误.(对的打“√”,错的打“×”)
(1)直方图的高表示取某数的频率.(  )
(2)直方图的高表示该组上的个体在样本中出现的频率.(  )
(3)直方图的高表示取某组上的个体在样本中出现的频数与组距的比值.(  )
(4)直方图的高表示取该组上的个体在样本中出现的频率与组距的比值.(  )
解析:要注意频率分布直方图的特点.在直方图中,纵轴(矩形的高)表示频率与组距的比值,其相应组上的频率等于该组上的矩形的面积.
答案:(1)× (2)× (3)× (4)√
2.一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为(  )
A.10组        
B.9组
C.8组
D.7组
解析:选B.极差为140-51=89,而组距为10,故应将样本数据分为9组.
3.在频率分布直方图中,各小长方形的面积表示________,它们的总和是________.
解析:各小长方形的面积表示样本中落在该组内的数据的频率;总和等于1.
答案:频率 1
 列频率分布表,画频率分布直方图、折线图[学生用书P37]
 抽查100袋洗衣粉,测量它们的净重如下(单位:g):
494
498
493
505
496
492
485
483
508
511
495
494
483
485
511
493
505
488
501
491
493
509
509
512
484
509
510
495
497
498
504
498
483
510
503
497
502
511
497
500
493
509
510
493
491
497
515
503
515
518
510
514
509
499
493
499
509
492
505
489
494
501
509
498
502
500
508
491
509
509
499
495
493
509
496
509
505
499
486
491
492
496
499
508
485
498
496
495
496
505
499
505
496
501
510
496
487
511
501
496
(1)列出样本的频率分布表;
(2)画频率分布直方图及频率分布折线图;
(3)估计净重在494.5~506.5
g之间的频率.
【解】 (1)在样本数据中,最大值是518,最小值是483,所以极差为35,取组距为4,由于=8,故要分成9组,使分点比数据多一位小数,且把第1组的起点稍微减小一点,得分组如下:
[482.5,486.5),[486.5,490.5),[490.5,494.5),…,[514.5,518.5].
列出频率分布表如下:
分组
频数
频率
[482.5,486.5)
8
0.08
[486.5,490.5)
3
0.03
[490.5,494.5)
17
0.17
[494.5,498.5)
21
0.21
[498.5,502.5)
14
0.14
[502.5,506.5)
9
0.09
[506.5,510.5)
19
0.19
[510.5,514.5)
6
0.06
[514.5,518.5]
3
0.03
合计
100
1.00
(2)频率分布直方图及频率分布折线图如图:
(3)净重在494.5~506.5
g之间的频率为0.21+0.14+0.09=0.44.
绘制频率分布直方图的注意事项
(1)计算极差,需要找出这组数据的最大值和最小值,当数据很多时,可选一个数据当参照.
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数. 
 1.下表给出了某校120名12岁男孩的身高资料.(单位:cm)
区间界限
[122,126)
[126,130)
[130,134)
[134,138)
[138,142)
人数
5
8
10
22
33
区间界限
[142,146)
[146,150)
[150,154)
[154,158]
人数
20
11
6
5
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)根据样本的频率分布直方图,估计身高小于134
cm的人数约占总人数的百分比.
解:(1)频率分布表如下:
分组
频数
频率
[122,126)
5
[126,130)
8
[130,134)
10
[134,138)
22
[138,142)
33
[142,146)
20
[146,150)
11
[150,154)
6
[154,158]
5
合计
120
1
(2)频率分布直方图如图:
(3)由上图估计,身高小于134
cm的学生数约占总数的19%.
 茎叶图及其应用[学生用书P37]
 某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照实验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:
品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,
445,451,454
品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430
(1)完成数据的茎叶图;
(2)用茎叶图处理现有的数据,有什么优点?
(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
【解】 (1)
A
B
树叶
树茎
树叶
9
7
35
8
7
36
3
5
37
8
38
3
5
6
9
2
39
1
2
4
4
5
7
7
5
0
40
0
1
1
3
6
7
5
4
2
41
0
2
5
6
7
3
3
1
42
2
4
0
0
43
0
5
5
3
44
4
1
45
(2)由于每个品种的数据都只有25个,样本不大.画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.
(3)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.
绘制茎叶图的注意点
(1)绘制茎叶图时需注意“叶”的位置的数字位数只有一位,而“茎”的位置的数字位数一般不需要统一.
(2)茎叶图可用于确定数据的中位数,判断数据大致集中在哪个茎,是否关于该茎对称,是否分布均匀等. 
 2.如图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知(  )
A.甲运动员的成绩好于乙运动员
B.乙运动员的成绩好于甲运动员
C.甲、乙两名运动员的成绩没有明显的差别
D.甲运动员的最低得分为0分
解析:选A.从这个茎叶图可以看出,甲运动员的得分大致对称,平均得分是30多分,乙运动员的得分除一个52分外,也大致对称,平均得分是20多分,因此,甲运动员发挥比较稳定,总体得分情况比乙好.
 频率分布直方图、折线图的综合应用[学生用书P38]
 为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组情况与频数如下:
[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;[11.35,11.45),7;[11.45,11.55),4;[11.55,11.65],2;
(1)列出频率分布表;
(2)画出频率分布直方图以及频率分布折线图;
(3)据上述图表,估计数据落在[10.95,11.35)范围内的可能性是百分之几?
(4)数据小于11.20的可能性是百分之几?
【解】 (1)频率分布表如下:
分组
频数
频率
[10.75,10.85)
3
0.03
[10.85,10.95)
9
0.09
[10.95,11.05)
13
0.13
[11.05,11.15)
16
0.16
[11.15,11.25)
26
0.26
[11.25,11.35)
20
0.20
[11.35,11.45)
7
0.07
[11.45,11.55)
4
0.04
[11.55,11.65]
2
0.02
合计
100
1.00
(2)频率分布直方图及频率分布折线图,如图.
(3)由上述图表可知数据落在[10.95,11.35)范围内的频率为1-(0.03+0.09)-(0.07+0.04+0.02)=0.75=75%,即数据落在[10.95,11.35)范围内的可能性是75%.
(4)数据小于11.20的可能性即数据小于11.20的频率,设为x,则(x-0.41)÷(11.20-11.15)
=(0.67-0.41)÷(11.25-11.15),
所以x-0.41=0.13,即x=0.54,
从而估计数据小于11.20的可能性是54%.
频率分布表能比较准确地反映样本的频率分布,而频率分布直方图则能直观地反映样本的频率分布,频率分布折线图的优点是它反映了数据的变化趋势. 
 3.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至31日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了如图所示的频率分布直方图.已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:
(1)本次活动共有多少件作品参加评比?
(2)哪组上交的作品数量最多?有多少件?
(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?
解:(1)依题意知第三组的频率为
=.
又因为第三组的频数为12,
所以本次活动的参评作品有=60(件).
(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×=18(件).
(3)第四组的获奖频率是=.
因为第六组上交的作品数量为60×
=3(件).
所以第六组的获奖频率为,
因为=>,所以第六组的获奖率较高.
1.在列频率分布表时,极差、组距、组数有如下关系
(1)若为整数,则=组数;
(2)若不为整数,则的整数部分+1=组数.
2.茎叶图的制作步骤
(1)将数据分为“茎”“叶”两部分;
(2)将最大“茎”与最小“茎”之间的数字按大小顺序排成一列,茎相同者共用一个茎,再画上竖线作为分界线;
(3)将各个数据的“叶”在分界线的一侧对应茎处同行列出.
(1)频率分布直方图中的纵轴不是频率,而是频率/组距.
(2)因为小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
1.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12]内的频数为(  )
A.18           
B.36
C.54
D.72
解析:选B.由0.02+0.05+0.15+0.19=0.41,
所以落在区间[2,10)内的频率为0.41×2=0.82.
所以落在区间[10,12]内的频率为1-0.82=0.18.
所以样本数据落在区间[10,12]内的频数为0.18×200=36.
2.为帮助贫困学生重返校园,班长等20名团员捐出了自己的零花钱,他们的捐款数(单位:元)如下:19,20,25,30,24,23,25,29,27,27,28,28,26,27,21,30,20,19,22,20.班主任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心.制图时先计算最大值与最小值的差是________;若取组距为2,则应分成________组;若第一组的起点定为18.5,则在[26.5,28.5)内的频数为________.
解析:由题意知,极差为30-19=11;由于组距为2,=5.5不是整数,所以应分成6组;捐款数落在[26.5,28.5)内的有27,27,28,28,27共5个,因此频数为5.
答案:11 6 5
3.容量为100的样本数据,按从小到大的顺序分为8组,如下表:
组号
1
2
3
4
5
6
7
8
频数
10
13
14
14
15
13
12
9
则第3组的频数和频率分别是________.
答案:14和0.14
4.调查某校高三年级男生的身高,随机抽取了40名高三男生,实测身高数据(单位:cm)如下:
171
163
163
166
166
168
168
160
168
165
171
169
167
169
151
168
170
168
160
174
165
168
174
159
167
156
157
164
169
180
176
157
162
161
158
164
163
163
167
161
(1)作出频率分布表;
(2)画出频率分布直方图、频率分布折线图.
解:(1)最低身高151
cm,最高身高180
cm,它们的差是180-151=29,即极差为29.确定组距为3,则组数为10,列表如下:
分组
频数
频率(%)
[150.5,153.5)
1
2.5
[153.5,156.5)
1
2.5
[156.5,159.5)
4
10.0
[159.5,162.5)
5
12.5
[162.5,165.5)
8
20.0
[165.5,168.5)
11
27.5
[168.5,171.5)
6
15.0
[171.5,174.5)
2
5.0
[174.5,177.5)
1
2.5
[177.5,180.5]
1
2.5
合计
40
100.0
(2)频率分布直方图及频率分布折线图如图所示:
[A 基础达标]
1.
若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是(  )
A.91.5和91.5   
B.91.5和92
C.91和91.5
D.92和92
解析:选A.将这组数据从小到大排列得,
87,89,90,91,92,93,94,96.
平均数==91.5,中位数为=91.5,故选A.
2.如图是某学校抽取的学生体重的频率分布直方图,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为10,则抽取的学生人数为(  )
A.20
B.30
C.40
D.50
解析:选C.前3组的频率之和等于1-(0.012
5+0.037
5)×5=0.75,第2小组的频率是0.75×=0.25,设样本容量为n,则=0.25,则n=40.所以选C.
3.
如图是歌手大奖赛中,七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则有(  )
A.a1>a2
B.a2=a1
C.a2>a1
D.a1、a2的大小不确定
解析:选C.因为甲、乙分数在70、80、90各分数段的打分须看个位数的和,甲的个位数总和20,乙的个位数字和为25,所以a2>a1.
4.在样本的频率分布直方图中,某个小长方形的面积是其他小长方形面积之和的
,已知样本容量是80,则该组的频数为(  )
A.20
B.16
C.30
D.35
解析:选B.设该组的频数为x,则其他组的频数之和为4x,由样本容量是80,得x+4x=80,解得x=16,即该组的频数为16,故选B.
5.某厂对一批产品进行抽样检测,如图是抽检产品净重(单位:克)的频率分布直方图,样本数据分组为[76,78),[78,80),…,[84,86].若这批产品有120个,估计其中净重大于或等于78克且小于84克的产品的个数是(  )
A.12
B.18
C.25
D.90
解析:选D.净重大于或等于78克且小于84克的频率为(0.100+0.150+0.125)×2=0.75,所以在该范围内的产品个数为120×0.75=90.
6.某班学生某次数学考试的成绩(单位:分)分布如下表:
分数
[0,80)
[80,90)
[90,100)
人数
2
5
6
分数
[100,110)
[110,120)
[120,130)
人数
8
12
6
分数
[130,140)
[140,150]
人数
4
2
那么分数在[100,110)中的频率为________,分数低于110的样本数为________.
解析:[100,110)中的频率为,分数低于110的样本数2+5+6+8=21.
答案: 21
7.为了解某地居民的月收入情况,一个社会调查机构调查了20
000人,并根据所得数据画出样本的频率分布直方图如图.现按月收入分层,用分层抽样的方法在这20
000人中抽出200人作进一步调查,则月收入在[1
500,2
000)(单位:元)的应抽取________人.
解析:月收入在[1
500,2
000)的频率为1-(0.000
2+0.000
5×2+0.000
3+0.000
1)×500=0.2,故应抽取200×0.2=40(人).
答案:40
8.从甲、乙两个班各随机选出15名同学进行随堂测试(满分100分),成绩的茎叶图如图所示,则甲班学生的最高成绩为________分,乙班的及格率是________.
解析:由茎叶图可知,甲班15名同学的最高分是96,乙班同学成绩在60分及以上的共有14人,所以及格率是.
答案:96 
9.在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共100个数据,将数据分组如下表:
纤度
发生次数ni
[1.30,1.34)
4
[1.34,1.38)
25
[1.38,1.42)
30
[1.42,1.46)
29
[1.46,1.50)
10
[1.50,1.54]
2
合计
100
(1)列出频率分布表,并画出频率分布直方图、折线图;
(2)估计纤度落在[1.38,1.50)中的频率及纤度小于1.40的频率是多少.
解:(1)频率分布表见下表,频率分布直方图、折线图如图所示.
纤度i
发生次数ni
fi=发生频率
[1.30,1.34)
4
0.04
[1.34,1.38)
25
0.25
[1.38,1.42)
30
0.30
[1.42,1.46)
29
0.29
[1.46,1.50)
10
0.10
[1.50,1.54]
2
0.02
合计
100
1.00
(2)纤度落在[1.38,1.50)中的频率约为
0.30+0.29+0.10=0.69,
纤度小于1.40的频率约为
0.04+0.25+×0.30=0.44.
10.对某电子元件进行寿命追踪调查,情况如下:
小时数i
[100,200)
[200,300)
[300,400)
[400,500)
[500,600]
发生次数
20
30
80
40
30
(1)列出频率分布表;
(2)画出频率分布直方图和频率分布折线图;
(3)求电子元件寿命在[100,400)h内的频率;
(4)求电子元件寿命在400
h以上的频率.
解:(1)样本的频率分布表:
小时数i
发生次数ni
fi=发生频率
[100,200)
20
0.10
[200,300)
30
0.15
[300,400)
80
0.40
[400,500)
40
0.20
[500,600]
30
0.15
合计
200
1.00
(2)频率分布直方图,频率分布折线图如图所示:
(3)由频率分布表可知,寿命在[100,400)h内的电子元件出现的频率为0.10+0.15+0.40=0.65,故我们估计寿命在[100,400)h的电子元件的频率为0.65.
(4)由频率分布表知,寿命在400
h以上的电子元件的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400
h以上的频率为0.35.
[B 能力提升]
11.某校高中研究性学习小组对本地区2014年至2016年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图,根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭(  )
A.82万盒
B.83万盒
C.84万盒
D.85万盒
解析:选D.三年中该地区每年平均销售盒饭=85(万盒).故选D.
12.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.
解析:甲==24,同理可求乙=23.
答案:24 23
13.为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:千克),并将所得数据分组,画出频率分布直方图(如图所示),
(1)求出各组相应的频率;
(2)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数.
解:(1)由频率分布直方图可得下表
分组
频率
[1.00,1.05)
0.05
[1.05,1.10)
0.20
[1.10,1.15)
0.28
[1.15,1.20)
0.30
[1.20,1.25)
0.15
[1.25,1.30]
0.02
(2)由分层抽样中每个个体被抽到的概率相同知:
设水库中鱼的总条数为N,
则=,即N=2
000,
故水库中鱼的总条数约为2
000条.
14.(选做题)某市2016年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
(1)完成频率分布表;
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.
请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
解:(1)频率分布表:
分组
频数
频率
[41,51)
2
[51,61)
1
[61,71)
4
[71,81)
6
[81,91)
10
[91,101)
5
[101,111]
2
(2)频率分布直方图如图所示:
(3)答对下述两条中的一条即可:
①该市一个月中空气污染指数有2天处于优的水平,占当月天数的;有26天处于良的水平,占当月天数的;处于优或良的天数为28,占当月天数的.说明该市空气质量基本良好.
②轻微污染有2天,占当月天数的;污染指数在80以上的接近轻微污染的天数为15,加上处于轻微污染的天数为17,占当月天数的,超过50%,说明该市空气质量有待进一步改善.
PAGE
1
同课章节目录