5.1.4 用样本估计总体
课时17 用样本估计总体
知识点一 用样本的数字特征估计总体的数字特征
1.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是( )
A.85,85,85 B.87,85,86
C.87,85,85 D.87,85,90
答案 C
解析 由平均数、中位数、众数的定义可知,平均数==87;因为得85分的有4人,所以众数是85;把成绩由大到小排列为100,95,90,90,85,85,85,85,80,75,故中位数是85.
2.从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人的成绩的标准差为( )
分数
5
4
3
2
1
人数
20
10
30
30
10
A. B. C.3 D.
答案 B
解析 平均数为=3.
故s2=×[20×(5-3)2+10×(4-3)2+30×(3-3)2+30×(2-3)2+10×(1-3)2]=.
故s==.
3.为了鉴定某种节能灯泡的质量,对其中100只节能灯泡的使用寿命进行测量,结果如下表:(单位:小时)
寿命
450
550
600
650
700
只数
20
10
30
15
25
则这些节能灯泡使用寿命的平均数是________.
答案 597.5
解析 这些节能灯泡使用寿命的平均数是
=597.5.
4.高一(3)班有男同学27名,女同学21名.在一次语文测验中,男同学得分的平均数是82,中位数是75,女同学得分的平均数是80,中位数是80.
(1)求这次测验全班成绩的平均数(精确到0.01);
(2)估计全班成绩不超过80分的同学至少有多少人;
(3)分析男同学得分的平均数与中位数相差较大的主要原因.
解 (1)利用平均数计算公式,得
=×(82×27+80×21)≈81.13.
(2)因为男同学得分的中位数是75,
所以至少有14名男生得分不超过75分.
又因为女同学得分的中位数是80,
所以至少有11名女生得分不超过80分.
所以全班至少有25人得分不超过80分.
(3)男同学得分的平均数与中位数相差较大,说明男同学中两极分化现象严重,得分高的和得分低的相差较大.
5.为了普及法律知识,达到“法在心中”的目的,某市法制办组织了一次普法知识竞赛,统计局调查队从甲、乙两单位中各随机抽取了5名职工的成绩,用茎叶图表示如下:
(1)根据图中的数据,分别求出样本中甲、乙两单位职工成绩的平均数和方差,并判断哪个单位职工对法律知识的掌握更为稳定;
(2)求被抽取的这10名职工成绩的平均数和方差.
(分层抽样的平均数和方差公式:
设样本中不同层的平均数分别为1,2,…,n,方差分别为s,s,…,s,相应的权重分别为w1,w2,…,wn,则这个样本的平均数和方差分别为=wii,s2=wi[s+(i-)2],其中为样本平均数.)
解 (1)甲单位5名职工成绩的平均数甲=
=90,乙单位5名职工成绩的平均数乙==90,甲单位5名职工成绩的方差s=×[(87-90)2+(88-90)2+(91-90)2+(91-90)2+(93-90)2]=4.8,乙单位5名职工成绩的方差s=×[(85-90)2+(89-90)2+(91-90)2+(92-90)2+(93-90)2]=8.∵s∴甲单位职工对法律知识的掌握更为稳定.
(2)∵甲单位职工的权重w甲=,乙单位职工的权重w乙=,甲=90分,乙=90分,s=4.8,s=8,由分层抽样求平均数和方差的公式可得,这10名职工成绩的平均数=×90+×90=90,这10名职工成绩的方差s2=w甲[s+(甲-)2]+w乙[s+(乙-)2]=×[4.8+(90-90)2]+×[8+(90-90)2]=6.4.
知识点二 用样本的分布来估计总体的分布
6.样本的频率分布与相应的总体分布的关系是( )
A.样本的频率分布与相应的总体分布是同样的分布
B.样本的频率分布与相应的总体分布是互不相关的两种分布
C.样本的频率分布将随着样本容量的增大更加接近相应的总体分布
D.样本的频率分布的样本容量增大到某一定值时就变成了相应的总体分布
答案 C
解析 样本容量越大,样本的频率分布越接近相应的总体分布.
7.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )
A.90 B.75
C.60 D.45
答案 A
解析 产品净重小于100克的频率为(0.050+0.100)×2=0.300,已知样本中产品净重小于100克的个数是36,设样本容量为n,则=0.300,所以n=120,净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.
8.某校100名学生的数学测试成绩的频率分布直方图如图所示,分数不低于a即为优秀,如果优秀的人数为20,则a的估计值是( )
A.130 B.140
C.133 D.137
答案 C
解析 由已知可以判断a∈(130,140),所以[(140-a)×0.015+0.01×10]×100=20,解得a≈133.故选C.
9.为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午8:00~12:00间各自的车流量(单位:百辆),得如图所示的茎叶图,试求:
(1)甲、乙两个交通站的车流量的极差分别是多少?
(2)甲交通站的车流量在[10,40]间的频率是多少?
(3)甲、乙两个交通站哪个站更繁忙?并说明理由.
解 (1)甲交通站的车流量的极差为73-8=65,乙交通站的车流量的极差为71-5=66.
(2)甲交通站的车流量在[10,40]间的频率为=.
(3)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方,从数据的分布情况来看,甲交通站更繁忙.
10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如下图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.
解 (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,
因此第二小组的频率为=0.08.又频率=,
所以样本容量===150,
即第二小组的频率为0.08,样本容量是150.
(2)由图可估计该学校高一学生的达标率约等于次数落在[110,150]内的频率,又×100%=88%,
即次数落在[110,150]内的频率为88%,
所以估计该学校全体高一学生的达标率是88%.
(3)由已知可得各小组的频数依次为
×150=6,
×150=12,
×150=51,
×150=45,
×150=27,
×150=9,
即各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114.所以跳绳次数的中位数落在第四小组内.
易错点 误将频率分布直方图的纵坐标当作频率
11.中小学生的视力状况受到社会的关注.某市有关部门从全市6万名高一学生中随机抽取400名学生,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示,从左至右五个小组的频率之比为5∶7∶12∶10∶6,则该市6万名高一学生中视力在[3.95,4.25)范围内的学生约有多少人?
易错分析 本题易将该频率分布直方图中的纵坐标(频率与组距的比)看成频率,出现如下错误:由图可知,第五小组的频率为0.5,所以第一小组的频率为0.5×=.
所以该市6万名高一学生中视力在[3.95,4.25)范围内的学生约有60000×=25000(人).
正解 由图可知,第五小组的频率为0.5×0.3=0.15,
所以第一小组的频率为0.15×=0.125.
所以该市6万名高一学生中视力在[3.95,4.25)范围内的学生约有60000×0.125=7500(人).
一、选择题
1.下列说法错误的是( )
A.一个样本的众数、中位数和平均数不可能是同一个数
B.统计中,我们可以用样本平均数去估计总体平均数
C.样本平均数既不可能大于也不可能小于这个样本中的所有数据
D.众数、中位数和平均数从不同的角度描述了一组数据的集中趋势
答案 A
解析 用样本估计总体情况时,在一组数据中,众数、中位数和平均数可能是同一个数,例如:数据10,11,11,11,11,11,12的众数、中位数和平均数都是11.
2.在某次测量中得到的A样本数据如下:2,4,4,6,6,6,8,8,8,9.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征相同的是( )
A.众数 B.平均数
C.中位数 D.标准差
答案 D
解析 根据题意,B样本数据恰好是A样本数据每个都加2后所得,则平均数、众数、中位数都增加2,根据标准差公式可知,标准差不变.故选D.
3.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设
得分值的中位数为me,众数为m0,平均值为,则( )
A.me=m0= B.me=m0<
C.me<m0< D.m0<me<
答案 D
解析 由题目所给的统计图可知,30个数据按大小顺序排列好后,中间两个数为5,6,故中位数为me==5.5.又众数为m0=5,
平均值
=
=≈5.97,∴m0<me<.
4.从甲、乙两种玉米苗中各抽6株,分别测得它们的株高如图所示(单位:cm).根据数据估计( )
A.甲种玉米比乙种玉米不仅长得高而且长得整齐
B.乙种玉米比甲种玉米不仅长得高而且长得整齐
C.甲种玉米比乙种玉米长得高但长势没有乙整齐
D.乙种玉米比甲种玉米长得高但长势没有甲整齐
答案 D
解析 由题中的茎叶图可知,甲种玉米的株高主要集中在20~30 cm段,乙种玉米的株高主要集中在30~40 cm,则甲种玉米的平均株高小于乙种玉米的平均株高,但乙种玉米的株高较分散.故选D.
5.为了解某校学生的视力情况,随机抽查了该校的100名学生,得到如下图所示的频率分布直方图.由于不慎将部分数据丢失,但知道前4组的频数和为40,后6组的频数和为87.设最大频率为a,视力在4.5到5.2之间的学生人数为b,则a,b的值分别为( )
A.0.27,0.96 B.0.27,96
C.27,0.96 D.27,96
答案 B
解析 由频率分布直方图知组距为0.1,由前4组的频数和为40,后6组的频数和为87,知第4组的频数为40+87-100=27,即视力在4.6到4.7之间的频数最大,为27,故最大频率a=0.27.视力在4.5到5.2之间的频率为1-0.01-0.03=0.96,故视力在4.5到5.2之间的学生人数b=0.96×100=96.
二、填空题
6.样本a1,a2,a3,…,a10的平均数为12,样本b1,b2,…,b8的平均数为5,则样本a1,b1,a2,b2,…,a8,b8,a9,a10的平均数为________.
答案
解析 由题知=12,=5,则新样本的平均数为=.
7.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为________.
答案 16
解析 已知样本数据x1,x2,…,x10的标准差为s=8,则s2=64,数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为=16.
8.对某市“四城同创”活动中800名志愿者的年龄抽样调查,统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)年龄组[25,30)对应小矩形的高度为________;
(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)内的人数为________.
答案 (1)0.04 (2)440
解析 (1)设年龄组[25,30)对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.
(2)由(1)得志愿者年龄在[25,35)内的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)内的人数约为0.55×800=440.
三、解答题
9.为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,从两厂各随机选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:
(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均数;
(2)若轮胎的宽度在[194,196]内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个的轮胎相对更好.
解 (1)甲厂10个轮胎宽度的平均数:甲=×(195+194+196+193+194+197+196+195+193+197)=195,乙厂10个轮胎宽度的平均数:乙=×(195+196+193+192+195+194+195+192+195+193)=194.
(2)甲厂10个轮胎中宽度在[194,196]内的数据为195,194,196,194,196,195,
平均数:1=×(195+194+196+194+196+195)=195,
方差:s=×[(195-195)2+(194-195)2+(196-195)2+(194-195)2+(196-195)2+(195-195)2]=,
乙厂10个轮胎中宽度在[194,196]内的数据为195,196,195,194,195,195,
平均数:2=×(195+196+195+194+195+195)=195,
方差:s=×[(195-195)2+(196-195)2+(195-195)2+(194-195)2+(195-195)2+(195-195)2]=,
∵两厂标准轮胎宽度的平均数相等,但乙厂的方差更小,
∴乙厂的轮胎相对更好.
10.对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名学生,得到这M名学生参加社区服务的次数,根据此数据作出频率分布表和频率分布直方图如下:
分组
频数
频率
[10,15)
10
0.25
[15,20)
24
n
[20,25)
m
p
[25,30]
2
0.05
合计
M
1
(1)求出表中M,p及图中a的值;
(2)若该校有高三学生240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数;
(3)估计学生参加社区服务次数的平均数.
解 (1)由分组[10,15)内的频数是10,频率是0.25,知=0.25,所以M=40.
所以10+24+m+2=40,解得m=4,
所以p===0.1,a==0.12.
(2)估计该校高三学生参加社区服务的次数在区间[10,15)内的人数为0.25×240=60.
(3)因为n==0.6,
又12.5×0.25+17.5×0.6+22.5×0.1+27.5×0.05=17.25.
所以估计学生参加社区服务次数的平均数是17.25.
课件51张PPT。课时17 用样本估计总体本课结束