1.5 用样本估计总体 学案1(含答案)

文档属性

名称 1.5 用样本估计总体 学案1(含答案)
格式 zip
文件大小 506.4KB
资源类型 教案
版本资源 北师大版
科目 数学
更新时间 2016-08-16 18:49:52

图片预览

文档简介

1.5
用样本估计总体
学案
[读教材·填要点]
1.用样本估计总体的两种情况
(1)用样本的分布估计总体的分布.
(2)用样本的数字特征估计总体的数字特征.
2.频率分布直方图
在频率分布直方图中,纵轴表示,数据落在各小组内的频率用频率直方图的面积来表示,各小长方形的面积的总和等于1.
3.频率折线图
在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来接近于一条光滑曲线.
[小问题·大思维]
1.将数据的样本进行分组的目的是什么?
提示:从样本中的一个个数字中很难直接看出样本所包含的信息,通过分组,并计算其频率,目的是通过描述样本数据分布的特征,从而估计总体的分布情况.
2.频率分布直方图中,每个小长方形的面积表示什么含义?
提示:表示相应各组的频率.
[研一题]
[例1] 已知一个样本:30,29,26,24,25,27,26,22,24,25,26,28,25,21,23,25,27,29,25,28.
(1)列出样本的频率分布表.
(2)画出频率分布直方图和频率分布折线图.
(3)根据频率分布直方图,估计总体出现在23~28内的频率是多少?
[自主解答] (1)计算极差:30-21=9.
决定组距和组数:取组距为2.
∵=4,∴共分5组.
决定分点,使分点比数据多一位小数.
并把第1小组的分点减小0.5,即分成如下5组:
20.5~22.5,22.5~24.5,24.5~26.5,
26.5~28.5,28.5~30.5.
列出频率分布表如下:
分组
个数累计
频数
频率
20.5~22.5
2
0.1
0.05
22.5~24.5
3
0.15
0.075
24.5~26.5

8
0.4
0.2
26.5~28.5
4
0.2
0.1
28.5~30.5
3
0.15
0.075
合计
20
20
1.00
(2)作出频率分布直方图如下:
取各小长方形上的中点并用线段连接就构成了频率分布折线图,如上图.
(3)由频率分布表和频率分布直方图观察得:
样本值出现在23~28之间的频率为0.15+0.40+0.2=0.75,所以可以估计总体中出现在23~28之间的数的频率约为0.75.
[悟一法]
绘制频率分布直方图的具体步骤:
(1)求极差:
一组数据的最大值与最小值的差称为极差.
(2)决定组距与组数:
数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多,当样本容量不超过120时,按照数据的多少,常分成5~12组.为方便起见,组距的选择应力求“取整”.
(3)将数据分组:
通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.
(4)列频率分布表:
计算各小组的频率,作出频率分布表.
说明:制作好频率分布表以后,可利用各组的频率之和为1来检验该表是否正确.
(5)画出频率分布直方图:
依据频率分布表画出频率分布直方图.
[通一类]
1.下表给出了某校从500名12岁男孩中随机抽选出的120人的身高情况(单位:cm):
身高范围
[122,126)
[126,130)
[130,134)
[134,138)
[138,142)
人数
5
8
10
22
33
身高范围
[142,146)
[146,150)
[150,154)
[154,158)
人数
20
11
6
5
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)估计身高低于134
cm的人数占总人数的百分比.
解:(1)样本频率分布表如下所示:
分组
频数
频率
[122,126)
5
0.04
[126,130)
8
0.07
[130,134)
10
0.08
[134,138)
22
0.18
[138,142)
33
0.28
[142,146)
20
0.17
[146,150)
11
0.09
[150,154)
6
0.05
[154,158)
5
0.04
合计
120
1.00
(2)频率分布直方图如图所示.
(3)由样本频率分布表可知,身高低于134
cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以可以估计身高低于134
cm的人数占总人数的19%.
[研一题]
[例2] 某校开展了一次小制作评比活动,作品上交时间为5月1日至30日.评委会把同学们上交作品的件数按5天一组分组统计,绘制了如图所示的频率分布直方图.已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答有关问题:
(1)本次活动共有多少件作品参加评比?
(2)哪组上交的作品数最多?有多少件?
(3)经过评比,第四组和第六组分别有10件、2件作品获奖,则这两组哪组获奖率较高?
[自主解答] (1)依题意知,第三组的频率为=0.2,
又因为第三组的频数为12,
故本次活动的参评作品有=60件.
(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×=18件.
(3)第四组的获奖率是=.
因为第六组上交的作品数量为60×=3,
所以第六组的获奖率为.
而>,显然第六组的获奖率较高.
[悟一法]
频率分布直方图的性质:
(1)因为小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
(2)在频率分布直方图中,各小矩形的面积之和等于1.
(3)频数/相应的频率=样本容量.
[通一类]
2.(2011·湖北高考)有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图,估计样本数据落在区间[10,12)内的频数为(  )
A.18        
B.36
C.54
D.72
解析:样本数据落在区间[10,12)内的频率为1-(0.02×2+0.05×2+0.15×2+0.19×2)=0.18,所以样本数据落在区间[10,12)内的频数为0.18×200=36.
答案:B
3.为提高公众对健康的自我管理能力和科学认识,某调查机构共调查了200人在一天中的睡眠时间.现将数据整理分组,如下表所示.由于操作不慎,表中A,B,C,D四处数据污损,统计员只记得A处的数据比C处的数据大4,由此可知B处的数据为________.
分组(睡眠时间)
频数
频率
[4,5)
8
0.04
[5,6)
52
0.26
[6,7)
A
B
[7,8)
C
D
[8,9)
20
0.10
[9,10]
4
0.02
合计
200
1
解析:设A处的数据为x,则C处的数据为x-4,则
x+x-4+8+52+20+4=200,
解得x=60,
则B处数据为=0.30.
答案:0.30
[研一题]
[例3] 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的100只日光灯在必须换掉前的使用天数如下表:
天数
151~180
181~210
211~240
241~270
271~300
301~330
331~360
361~390
灯管数
1
11
18
20
25
16
7
2
(1)试估计这种日光灯的平均使用寿命;
(2)若定期更换,可选择多长时间统一更换合适?
[自主解答] (1)各组中值分别是165.5,195.5,225.5,255.5,285.5,315.5,345.5,375.5,由此可算得平均数约为165.5×1%+195.5×11%+225.5×18%+255.5×20%+285.5×25%+315.5×16%+345.5×7%+375.5×2%=268.4≈268(天).
(2)将各组中值对(1)问中的平均数求方差:
×[1×(165.5-268.4)2+11×(195.5-268.4)2+18×(225.5-268.4)2+20×(255.5-268.4)2+25×(285.5-268.4)2+16×(315.5-268.4)2+7×(345.5-268.4)2+2×(375.5-268.4)2]=2
128.59.
故标准差为≈46(天).
答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天,故可在222到314天左右统一更换较合适.
[悟一法]
1.样本的标准差和方差描述了总体数据围绕平均数波动的大小程度,样本的标准差、方差越大,总体数据估计越分散;样本的标准差、方差越小,总体数据估计越集中.特别是当样本的标准差和方差都为0时,则表明总体数据估计没有波动,估计数据全相等.
2.样本的平均数和方差是两个重要的数字特征.在应用平均数和方差解决实际问题时,若平均数不同,则直接应用平均数比较优劣,若平均数相同,则要由方差研究其与平均数的偏离程度.
[通一类]
4.两台机床同时生产直径(单位:cm)为10的圆形截面零件,为了检验产品质量,质量检验员从两台机床的产品中各抽出4件进行测量,结果如下:
机床甲
10
9.8
10
10.2
机床乙
10.1
10
9.9
10
如果你是质量检验员,在收集到上述数据后,你将通过怎样的运算来判断哪台机床生产的零件质量更符合要求?
解:(1)先计算平均直径:
甲=×(10+9.8+10+10.2)=10,
乙=×(10.1+10+9.9+10)=10.
由于甲=乙,因此仅由平均直径不能反映两台机床生产的零件的质量优劣.
(2)再计算方差:
s=×[(10-10)2+(9.8-10)2+(10-10)2+(10.2-10)2]=0.02,
s=×[(10.1-10)2+(10-10)2+(9.9-10)2+(10-10)2]=0.005.
s>s,这说明乙机床生产出的零件直径波动小,因此从产品质量稳定性的角度考虑,乙机床生产的零件质量更符合要求.
中小学生的视力状况受到全社会的广泛关注,某市有关部门从全市6万名高一新生中随机抽取了400名学生,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图,从左至右五个小组的频率之比依次是5∶7∶12∶10∶6.则全市高一新生视力在[3.95,4.25]范围内的学生约有多少人?
[错解] 因为第五小组的频率是0.5,
所以第一小组的频率为0.5×=.
所以全市6万名高一新生中视力在[3.95,4.25]范围内的学生约有60
000×=25
000人.
[错因] 错误原因在于对频率分布直方图理解不正确,图中标注的0.5并不是第五组的频率,0.5×0.3=0.15才是频率.
[正解] 因为第五小组的频率是0.5×0.3=0.15,
所以第一小组的频率是0.15×=0.125,
∴全市6万名高一新生中视力在[3.95,4.25]范围内的学生约有60
000×0.125=7
500人.
1.当收集到的数据量很大时,比较合适的统计图是(  )
A.茎叶图         
B.频率分布直方图
C.频率分布折线统计图
D.频率分布表
解析:当收集到的数据量很大时,一般用频率分布直方图表示.
答案:B
2.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组上的直方图的高为h,则|a-b|=(  )
A.hm         
B.
C.
D.h+m
解析:=h,故|a-b|=组距==.
答案:B
3.为了解一片经济林的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出样本的频率分布直方图(如图所示),那么这100株树木中,底部周长小于110
cm的树有(  )
A.80株
B.70株
C.60株
D.50株
解析:(0.01×10+0.02×10+0.04×10)×100=70(株).
答案:B
4.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n等于________.
解析:∵第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,
∴前三组频数为·n=27,故n=60.
答案:60
5.某社会调查机构就某地居民的月收入调查了10
000人,并根据所得数据画了样本频率分布直方图
(如图所示).
为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10
000人中再用分层抽样方法抽出100人进行调查,则在[2
500,3
000)(单位:元)的月收入段应抽出________人.
解析:100×(0.000
5×500)=25(人).
答案:25
6.如图所示,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下.观察图形,回答下列问题:
(1)79.5至89.5这一组的频数、频率分别是多少?
(2)估计这次环保知识竞赛的及格率(60分及以上为及格).
解:(1)频率为0.025×10=0.25,频数为60×0.25=15.
(2)由频率分布直方图得(0.015+0.025+0.03+0.005)×10=0.75,所以及格率为75%.
一、选择题
1.下列说法不正确的是(  )
A.频率分布直方图中每个小矩形的高就是该组的频率
B.频率分布直方图中各个小矩形的面积之和等于1
C.频率分布直方图中各个小矩形的宽一样大
D.频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的
解析:频率分布直方图的每个小矩形的高=.
答案:A
2.样本容量为100的频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在[6,10)内的频数为a,样本数据落在[2,10)内的频率为b,则a,b分别是(  )
A.32,0.4
B.8,0.1
C.32,0.1
D.8,0.4
解析:由于样本数据落在[6,10)内的频率为0.08×4=0.32,则a=100×0.32=32;由于样本数据落在[2,6)内的频率为0.02×4=0.08,则样本数据落在[2,10)内的频率b=0.08+0.32=0.4.
答案:A
3.将一个容量为50的样本数据分组后,组距与频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),6;[30.5,33.5),3.
则估计小于30的数据大约占总体的(  )
A.94%
B.6%
C.92%
D.12%
解析:由样本的频率分布估计总体的分布.小于30.5的样本频数为3+8+9+11+10+6=47,所以其频率为=94%.小于27.5的样本频数为3+8+9+11+10=41,所以其频率为=82%.因此小于30的样本频率应在82%~94%之间,满足条件的只有92%.
答案:C
4.为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图所示).已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为12,则抽取的学生人数为(  )
A.46
B.48
C.50
D.60
解析:前3个小组的频率和为1-0.037
5×5-0.012
5×5=0.75.又因为前3个小组的频率之比为1∶2∶3,所以第2小组的频率为×0.75=0.25.又知第2小组的频数为12,则=48,即为所抽样本的人数.
答案:B
5.设矩形的长为a,宽为b,其比满足b:a=≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是(  )
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次总体平均数与标准值接近程度相同
D.两个批次总体平均数与标准值接近程度不能确定
解析:甲==0.617,
乙==0.613,
∴甲与0.618更接近.
答案:A
二、填空题
6.(2012·广东高考)由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)
解析:设x1≤x2≤x3≤x4,根据已知条件得到x1+x2+x3+x4=8,且x2+x3=4,所以x1+x4=4,又因为=1,所以(x1-2)2+(x2-2)2=2,又因为x1,x2,x3,x4是正整数,所以(x1-2)2=(x2-2)2=1,所以x1=1,x2=1,x3=3,x4=3.
答案:1,1,3,3
7.《中华人民共和国道路交通安全法》规定;车辆驾驶员血液酒精浓度在20~80
mg/100
mL(不含80)之间,属于酒后驾车;血液酒精浓度在80
mg/100
mL(含80)以上时,属醉酒驾车.据《法制晚报》报道,2011年2月15日至2月28日,全国查处酒后驾车和醉酒驾车共28
800人,如图是对这28
800人酒后驾车血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为________.
解析:(0.01×10+0.005×10)×28
800=4
320.
答案:4
320
8.一组数据中的每一个数据都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是________,________.
解析:由题意得原来数据的平均数是80+1.2=81.2,方差不变,仍是4.4.
答案:81.2 4.4
三、解答题
9.有一个容量为50的样本,数据的分组及各组的频率如下:
[25,30),3;[30,35),8;[35,40),9;[40,45),11;
[45,50),10;[50,55),5;[55,60],4.
(1)列出样本的频率分布表;
(2)画出频率分布直方图及频率分布折线图.
解:(1)频率分布表如下:
分组
频数
频率
[25,30)
3
0.06
[30,35)
8
0.16
[35,40)
9
0.18
[40,45)
11
0.22
[45,50)
10
0.20
[50,55)
5
0.10
[55,60)
4
0.08
合计
50
1.00
(2)频率分布直方图、频率分布折线图如下图所示:
10.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):
甲班:82 84 85 89 79 80 91 89 79 74
乙班:90 76 86 81 84 87 86 82 85 83
(1)求两个样本的平均数;
(2)求两个样本的方差和标准差;
(3)试分析比较两个班的学习情况.
解:(1)甲=(82+84+85+89+79+80+91+89+79+74)=83.2,
乙=(90+76+86+81+84+87+86+82+85+83)=84.
(2)s=[(82-83.2)2+(84-83.2)2+(85-83.2)2+(89-83.2)2+(79-83.2)2+(80-83.2)2+(91-83.2)2+(89-83.2)2+(79-83.2)2+(74-83.2)2]=26.36,
s=[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87-84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13.2,
∴s甲=≈5.13,s乙≈≈3.63.
(3)由于甲<乙,
则甲班比乙班平均水平低.
由于s甲>s乙,
则甲班没有乙班稳定.
∴乙班的总体学习情况比甲班好.