2020版高中数学新人教B版必修3第二章统计2.2.1用样本的频率分布估计总体的分布(一)学案(含解析)

文档属性

名称 2020版高中数学新人教B版必修3第二章统计2.2.1用样本的频率分布估计总体的分布(一)学案(含解析)
格式 zip
文件大小 661.5KB
资源类型 教案
版本资源 人教新课标B版
科目 数学
更新时间 2019-06-03 15:31:16

图片预览

文档简介

2.2.1 用样本的频率分布估计总体的分布(一)
学习目标 1.体会分布的意义和作用.2.学会用频率分布表,画频率分布直方图表示样本数据.3.能通过频率分布表或频率分布直方图对数据做出总体统计.
知识点一 用样本估计总体
思考 还记得我们抽样的初衷吗?
答案 用样本去估计总体,为决策提供依据.
梳理 用样本的频率分布估计总体的分布.
知识点二 频率分布表与频率分布直方图
思考1 要做频率分布表,需要对原始数据做哪些工作?
答案 分组,频数累计,计算频数和频率.
思考2 如何决定组数与组距?
答案 若为整数,则=组数.
若不为整数,则+1=组数.
注意:[x]表示不大于x的最大整数.
思考3 同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗?
答案 不同.对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响.
梳理 一般地,频数指某组中包含的个体数,各组频数和=样本容量;频率=,各组频率和等于1.
在频率分布直方图中,纵轴表示,数据落在各小组内的频率用小长方形的面积来表示,各小长方形的面积的总和等于1.
1.频率分布直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值.
( √ )
2.频率分布直方图中小长方形的面积表示该组的个体数.( × )
3.频率分布直方图中所有小长方形面积之和为1.( √ )
题型一 频率分布的理解
例1 关于频率分布直方图,下列说法正确的是(  )
A.直方图中小长方形的高表示取某数的频率
B.直方图中小长方形的高表示该组上的个体在样本中出现的频率
C.直方图中小长方形的高表示该组上的个体在样本中出现的频数与组距的比值
D.直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值
答案 D
解析 注意频率分布直方图和条形图的区别,在直方图中,纵轴(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的小长方形的面积.
反思与感悟 由频率的定义不难得出,各组数据的频率之和为1,因为各组数据的个数之和为样本容量.在列频率分布表时,可以利用这种方法检查是否有数据的丢失.
跟踪训练1 一个容量为20的样本数据,将其分组如下表:
分组
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
[60,70]
频数
2
3
4
5
4
2
则样本在区间(-∞,50)上的频率为(  )
A.0.5 B.0.25 C.0.6 D.0.7
答案 D
解析 样本在区间(-∞,50)上的频率为==0.7.
题型二 频率分布直方图的绘制
例2 某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分):
48 64 52 86 71 48 64 41 86 79
71 68 82 84 68 64 62 68 81 57
90 52 74 73 56 78 47 66 55 64
56 88 69 40 73 97 68 56 67 59
70 52 79 44 55 69 62 58 32 58
根据上面的数据,回答下列问题:
(1) 这次测验成绩的最高分和最低分分别是多少?
(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;
(3)分析频率分布直方图,你能得出什么结论?
解 (1)这次测验成绩的最低分是32分,最高分是97分.
(2)根据题意,列出样本的频率分布表如下:
分组
频数
频率
[30,40)
1
0.02
[40,50)
6
0.12
[50,60)
12
0.24
[60,70)
14
0.28
[70,80)
9
0.18
[80,90)
6
0.12
[90,100]
2
0.04
合计
50
1.00
频率分布直方图如图所示.
(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称的状态,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.
反思与感悟 组距和组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5至12组.
跟踪训练2 一个农技站为了考察某种麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):
6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6
5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8
6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5
6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4
6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4
6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6
5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0
5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7
5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0
6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
根据上面的数据列出频率分布表、绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35cm之间的麦穗所占的百分比.
解 (1)计算极差:7.4-4.0=3.4;
(2)决定组距与组数:
若取组距为0.3,因为≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12;
(3)决定分点:
使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55;
(4)列频率分布表:
分组
频数
频率
[3.95,4.25)
1
0.01
[4.25,4.55)
1
0.01
[4.55,4.85)
2
0.02
[4.85,5.15)
5
0.05
[5.15,5.45)
11
0.11
[5.45,5.75)
15
0.15
[5.75,6.05)
28
0.28
[6.05,6.35)
13
0.13
[6.35,6.65)
11
0.11
[6.65,6.95)
10
0.10
[6.95,7.25)
2
0.02
[7.25,7.55]
1
0.01
合计
100
1.00
(5)绘制频率分布直方图如图.
从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35cm之间的麦穗约占41%.
题型三 频率分布表及频率分布直方图的应用
例3 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:
组号
分组
频数
1
[0,2)
6
2
[2,4)
8
3
[4,6)
17
4
[6,8)
22
5
[8,10)
25
6
[10,12)
12
7
[12,14)
6
8
[14,16)
2
9
[16,18]
2
合计
100
(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;
(2)求频率分布直方图中的a,b的值;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).
解 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.
(2)课外阅读时间落在[4,6)组内的有17人,频率为0.17,所以a===0.085.课外阅读时间落在[8,10)组内的有25人,频率为0.25,所以b===0.125.
(3)样本中的100名学生该周课外阅读时间的平均数在第4组.
反思与感悟 在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.
跟踪训练3 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少?
解 (1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的,
因此第二小组的频率为=0.08.
因为第二小组的频率=,
所以样本容量===150.
(2)由直方图可估计该校全体高一年级学生的达标率约为×100%=88%.
1.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为(  )
A.20 B.30 C.40 D.50
答案 B
解析 样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.
2.已知样本数据:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11.那么频率为0.2的是(  )
A.[5.5,7.5) B.[7.5,9.5)
C.[9.5,11.5) D.[11.5,13.5]
答案 D
解析 列出频率分布表,依次对照就可以找到答案,频率分布表如下:
分组
频数
频率
[5.5,7.5)
2
0.1
[7.5,9.5)
6
0.3
[9.5,11.5)
8
0.4
[11.5,13.5]
4
0.2
合计
20
1.0
从表中可以看出频率为0.2的是[11.5,13.5],故选D.
3.如图是将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,则此班的优秀(120分及以上为优秀)率为________.
答案 30%
解析 优秀率为10×(0.0225+0.005+0.0025)=0.3=30%.
4.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,则估计样本在[40,50),[50,60)内的数据个数之和是________.
答案 21
解析 根据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.
∵样本中数据在[20,60)内的频率为0.6,样本容量为50,
∴=0.6,解得x+y=21.
即样本在[40,50),[50,60)内的数据个数之和为21.
5.暑假期间某班为了增强学生的社会实践能力,把该班学生分成四个小组到一果园帮果农测量果树的产量,某小组来到一片种植苹果的山地,他们随机选取20株作为样本测量每一株的果实产量(单位:kg),获得的数据按照区间[40,45),[45,50),[50,55),[55,60]进行分组,得到如下频率分布表:
分组
[40,45)
[45,50)
[50,55)
[55,60]
合计
频率
0.3
a
0.1
b
c
已知样本中产量在区间[45,50)内的株数是产量在区间[50,60]内的株数的倍.
(1)分别求出a,b,c的值;
(2)作出频率分布直方图.
解 (1)易得c=1.0.
由题意得∴a=0.4,b=0.2.
(2)根据频率分布表画出频率分布直方图,如图所示.
1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.
2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.
3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.
一、选择题
1.观察新生婴儿的体重(单位:g),其频率分布直方图如图所示,则新生婴儿的体重在[2 700,3000)内的频率为(  )
A.0.001 B.0.01
C.0.003 D.0.3
答案 D
解析 频率=×组距,
组距=3000-2700=300,=0.001,
∴频率=0.001×300=0.3.
2.容量为100的样本数据,按从小到大的顺序分为8组,如下表:
组号
1
2
3
4
5
6
7
8
频数
10
13
x
14
15
13
12
9
第三组的频数和频率分别是(  )
A.14和0.14 B.0.14和14
C.和0.14 D.和
答案 A
解析 x=100-(10+13+14+15+13+12+9)=100-86=14,第三组的频率为=0.14.
3.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(  )
A.6 B.8 C.12 D.18
答案 C
解析 志愿者的总人数为=50,
所以第三组人数为50×0.36×1=18,
有疗效的人数为18-6=12.
4.某校为了解高三学生的身体情况,抽取了100名女生的体重.将所得的数据整理后,画出了如图所示的频率分布直方图,则所抽取的女生中体重在[40,45) kg的人数是(  )
A.10 B.2 C.5 D.15
答案 A
解析 由图可知频率=×组距,频率=0.02×5=0.1,∴女生体重在[40,45) kg的人数为0.1×100=10.
5.为了了解某幼儿园儿童的身高情况,抽查该园120名儿童的身高绘制成如图所示的频率分布直方图,则抽查的120名儿童身高大于或等于98cm且小于104cm的有(  )
A.90名 B.75名 C.65名 D.40名
答案 A
解析 由图可知身高大于或等于98cm且小于104cm的儿童的频率为(0.1+0.15+0.125)×2=0.75,抽查的120名儿童有120×0.75=90(名)儿童的身高大于或等于98cm且小于104cm.
6.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n的值为(  )
A.20 B.27 C.6 D.60
答案 D
解析 ∵n·=27,
∴n=60.
7.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为(  )
A.588 B.480 C.450 D.120
答案 B
解析 ∵少于60分的学生人数为600×(0.05+0.15)=120,
∴不少于60分的学生人数为600-120=480.
8.对某种电子元件使用寿命进行跟踪调查,所得样本频率分布直方图如图.由图可知,这一批电子元件中寿命在100~300h的电子元件的数量与寿命在300~600h的电子元件的数量的比是(  )
A.1∶2 B.1∶3 C.1∶4 D.1∶6
答案 C
解析 由题意,寿命在100~300h的电子元件的频率为100×=0.2,寿命在300~600h的电子元件的频率为100×=0.8,则寿命在100~300h的电子元件的数量与寿命在300~600h的电子元件的数量比大约是0.2∶0.8=1∶4.
二、填空题
9.将一个容量为n的样本分成若干组,已知甲组的频数和频率分别为36和,则容量n=________,频率为的乙组的频数是________.
答案 144 24
解析 =,所以n=36×4=144,同理=,x=24.
10.某大学对1000名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图(如图所示),现规定不低于70分为合格,则合格人数是________.
答案 600
解析 由频率分布直方图知合格的频率为(0.035+0.015+0.01)×10=0.6,
故合格人数为1000×0.6=600.
11.下列命题正确的是________.(填序号)
①频率分布直方图中每个小矩形的面积等于相应组的频数;
②频率分布直方图中各小矩形面积之和等于1;
③频率分布直方图中各小矩形的高(平行于纵轴的边)表示频率与组距的比.
答案 ②③
解析 在频率分布直方图中,横轴表示样本数据,纵轴表示.由于小矩形的面积=组距×=频率,所以各小矩形的面积等于相应各组的频率,因此各小矩形面积之和等于1.综上可知②③正确.
12.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为________.
答案 9
解析 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.
13.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.则频率分布直方图中x的值为__________.
答案 0.0044
解析 ∵(0.0024+0.0036+0.0060+x+0.0024+0.0012)×50=1,∴x=0.0044.
三、解答题
14.为加强中学生实践创新能力和团队精神的培养,促进教育教学改革,某市教育局将举办全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了了解成绩情况,从中抽取50名学生的成绩(得分均为整数,满分为100分)进行统计,请你根据尚未完成的频率分布表解答问题:
分组
频数
频率

[60.5,70.5)
a
0.26

[70.5,80.5)
15
c

[80.5,90.5)
18
0.36

[90.5,100.5]
b
d
合计
50
e
(1)求a,b,c,d,e的值;
(2)作出频率分布直方图.
解 (1)根据题意,得分在[60.5,70.5)内的频数是a=50×0.26=13,在[90.5,100.5]内的频数是b=50-13-15-18=4,在[70.5,80.5)内的频率是c==0.30,在[90.5,100.5]内的频率是d==0.08,频率和e=1.
(2)根据频率分布表作出频率分布直方图,如图所示.
四、探究与拓展
15.某市共有5000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:
分组
频数
频率
[80,90)


[90,100)
0.050
[100,110)
0.200
[110,120)
36
0.300
[120,130)
0.275
[130,140)
12

[140,150]
0.050
合计

根据上面的频率分布表,可知①处的数值为________,②处的数值为__________.
答案 3 0.025
解析 由位于[110,120)的频数为36,频率==0.300,得样本容量n=120,所以[130,140)的频率==0.1,
②处的数值=1-0.050-0.200-0.300-0.275-0.1-0.050=0.025;①处的数值为0.025×120=3.