5.1.4 用样本估计总体
知识点一 用样本的数字特征估计总体的数字特征
1.李大伯承包了一个果园,种植了100棵樱桃树,今年已进入收获期,收获时,从中任选并采摘了10棵树的樱桃,分别称得每棵树所产樱桃的质量如下表:
序号
1
2
3
4
5
6
7
8
9
10
质量/千克
14
21
27
17
18
20
19
23
19
22
据调查,市场上今年樱桃的批发价格为每千克15元,用所学的统计知识估计今年此果园樱桃的总产量与按批发价格销售樱桃所得的总收入分别约为( )
A.200千克,3000元
B.1900千克,28500元
C.2000千克,30000元
D.1850千克,27750元
2.有4万个不小于70的两位数,从中随机抽取了3000个数据,统计如下:
数据%
70≤x≤79
80≤x≤89
90≤x≤99
个数
800
1300
900
平均数
78.1
85
91.9
请根据表格中的信息,估计这4万个数据的平均数为( )
A.92.16
B.85.23
C.84.73
D.77.97
3.对甲厂、乙厂、丙厂所生产的袋装食品各抽检了20袋,称得质量如柱形图所示.
据此估计甲厂、乙厂、丙厂质量的标准差,分别用s1,s2,s3表示,则有( )
A.s2>s1>s3
B.s1>s3>s2
C.s3>s1>s2
D.s3>s2>s1
4.为了鉴定某种节能灯泡的质量,对其中100只节能灯泡的使用寿命进行测量,结果如下表:(单位:小时)
寿命
450
550
600
650
700
只数
20
10
30
15
25
则这种节能灯泡使用寿命的平均数是________.
5.样本a1,a2,a3,…,a10的平均数为12,样本b1,b2,…,b8的平均数为5,则样本a1,b1,a2,b2,…,a8,b8,a9,a10的平均数为________.
6.某果园有苹果树100棵,为了估计该果园的苹果总产量,小王先按长势把苹果树分成了A,B,C三个级别,其中A级30棵,B级60棵,C级10棵,然后从A,B,C三个级别的苹果树中分别随机抽取了3棵、6棵、1棵,测出其产量,制成了如下统计表.小李看了这个统计表后马上正确估计出了该果园的苹果总产量,那么小李的估计值是________kg.
苹果树长势
A级
B级
C级
随机抽取棵数
3
6
1
所抽取果树的平均产量/kg
80
75
70
7.从甲、乙两人手工制作的图形产品中,各自随机抽取6件,测得其直径如下(单位:cm):
甲:9.00,9.20,9.00,8.50,9.10,9.20;
乙:8.90,9.60,9.50,8.54,8.60,8.90.
据以上数据估计两人的技术稳定性,结论是__________.
8.甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从甲、乙生产的零件中分别抽取40件、60件,甲的平均尺寸为10,方差为20,乙的平均尺寸为12,方差为40.那么从甲、乙生产的零件中抽取的这100件产品的平均尺寸和方差分别是多少?
9.高一(3)班有男同学27名,女同学21名.在一次语文测验中,男同学得分的平均数是82,中位数是75,女同学得分的平均数是80,中位数是80.
(1)求这次测验全班成绩的平均数(精确到0.01);
(2)估计全班成绩不超过80分的同学至少有多少人;
(3)分析男同学得分的平均数与中位数相差较大的主要原因.
10.为了普及法律知识,达到“法在心中”的目的,某市法制办组织了一次普法知识竞赛,统计局调查队从甲、乙两单位中各随机抽取了5名职工的成绩,用茎叶图表示如下:
(1)根据图中的数据,分别求出样本中甲、乙两单位职工成绩的平均数和方差,并判断哪个单位职工对法律知识的掌握更为稳定;
(2)求被抽取的这10名职工成绩的平均数和方差.
(分层抽样的平均数和方差公式:
设样本中不同层的平均数分别为1,2,…,n,方差分别为s,s,…,s,相应的权重分别为w1,w2,…,wn,则这个样本的平均数和方差分别为=wii,s2=wi[s+(i-)2],其中为样本平均数.)
知识点二 用样本的分布来估计总体的分布
11.样本的频率分布与相应的总体分布的关系是( )
A.样本的频率分布与相应的总体分布是同样的分布
B.样本的频率分布与相应的总体分布是互不相关的两种分布
C.样本的频率分布将随着样本容量的增大更加接近相应的总体分布
D.样本的频率分布的样本容量增大到某一定值时就变成了相应的总体分布
12.在一次模拟考试后,从高三某班随机抽取了20位学生的数学成绩,其分布如下:
分组
[90,100)
[100,110)
[110,120)
[120,130)
[130,140)
[140,150]
频数
1
2
6
7
3
1
分数在130分(包括130分)以上者为优秀,据此估计该班的优秀率约为( )
A.10%
B.20%
C.30%
D.40%
13.为了解工厂的1000名工人的生产情况,从中抽取100名工人进行统计,得到如下频率分布直方图,由此可估计该工厂产量在75件以上(含75件)的工人数为( )
A.50
B.100
C.150
D.250
14.某校为了对九年级学生的体重进行摸底调查,随机抽取了50名学生的体重(kg),将所得数据整理后,画出了频率分布直方图,如图所示.体重在[45,50)内适合跑步训练,体重在[50,55)内适合跳远训练,体重在[55,60]内适合投掷相关方面训练,估计该校九年级学生适合参加跑步、跳远、投掷三项训练的集训人数之比为( )
A.4∶3∶1
B.5∶3∶1
C.5∶3∶2
D.3∶2∶1
15.(多选)为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图.根据统计图的数据,下列结论正确的是( )
A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25
B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5
C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数均为320
D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约为32
16.为了了解某小学学生的身高情况,现随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
17.为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午8:00~12:00间各自的车流量(单位:百辆),得如图所示的茎叶图,试求:
(1)甲、乙两个交通站的车流量的极差分别是多少?
(2)甲交通站的车流量在[10,40]间的频率是多少?
(3)甲、乙两个交通站哪个站更繁忙?并说明理由.
18.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如下图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.
19.从全校参加数学竞赛的学生的成绩中抽取一个样本,考察竞赛的成绩分布,将样本分成5组,绘成频率分布直方图,如图所示,图中从左到右各小组的小矩形的高之比为1∶3∶6∶4∶2,最右边一组的频数是6,请结合频率分布直方图提供的信息,解答下列问题:
(1)样本的容量是多少?
(2)列出频率分布表;
(3)成绩落在哪个范围内的人数最多?并求出该小组的频数,频率.
(4)估计这次竞赛中,成绩不低于60分的学生占总人数的百分比.
易错点 误将频率分布直方图的纵坐标当作频率
中小学生的视力状况受到社会的关注.某市有关部门从全市6万名高一学生中随机抽取400名学生,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示,从左至右五个小组的频率之比为5∶7∶12∶10∶6,则该市6万名高一学生中视力在[3.95,4.25)范围内的学生约有多少人?
一、单项选择题
1.对于用样本分布估计总体分布的过程,下列说法正确的是( )
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确
2.某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机抽取24名笔试者的成绩,如表所示.
分数段
[60,65)
[65,70)
[70,75)
[75,80)
[80,85)
[85,90]
人数
2
3
4
9
5
1
据此估计允许参加面试的分数线大约是( )
A.90
B.85
C.80
D.75
3.设矩形的长为a,宽为b,其比满足b∶a=≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取的两个批次的初加工矩形的宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是( )
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次的总体平均数与标准值接近程度相同
D.两个批次的总体平均数与标准值接近程度不能确定
4.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为m0,平均值为,则( )
A.me=m0=
B.me=m0<
C.me<m0<
D.m0<me<
5.从甲、乙两种玉米苗中各抽6株,分别测得它们的株高如图所示(单位:cm).根据数据估计( )
A.甲种玉米比乙种玉米不仅长得高而且长得整齐
B.乙种玉米比甲种玉米不仅长得高而且长得整齐
C.甲种玉米比乙种玉米长得高但长势没有乙整齐
D.乙种玉米比甲种玉米长得高但长势没有甲整齐
6.为了解某地区1500名高三男生的身体发育情况,抽查了该地区100名年龄为17~18岁的高三男生体重(kg),得到频率分布直方图如图.根据图示,估计该地区高三男生中体重在[56.5,64.5)
kg的学生人数是( )
A.390
B.510
C.600
D.660
7.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.估计这次测试数学成绩的平均分为( )
A.50
B.60
C.72
D.80
8.为了解某校学生的视力情况,随机抽查了该校的100名学生,得到如图所示的频率分布直方图.由于不慎将部分数据丢失,但知道前4组的频数和为40,后6组的频数和为87.设最大频率为a,视力在4.5到5.2之间的学生人数为b,则a,b的值分别为( )
A.0.27,0.96
B.0.27,96
C.27,0.96
D.27,96
二、多项选择题
9.下列说法正确的是( )
A.一个样本的众数、中位数和平均数不可能是同一个数
B.统计中,我们可以用样本平均数去估计总体平均数
C.样本平均数既不可能大于也不可能小于这个样本中的所有数据
D.众数、中位数和平均数从不同的角度描述了一组数据的集中趋势
10.学校为了解新课程标准中提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示.将阅读时间不低于30
min的学生称为阅读霸,则下列结论正确的是( )
A.抽样表明,该校约有一半学生为阅读霸
B.抽取的100名学生中有50名学生为阅读霸
C.抽取的100名学生中有45名学生为阅读霸
D.抽样表明,该校有50名学生为阅读霸
11.统计某校n名学生的某次数学同步练习成绩(满分150分),根据成绩依次分成六组:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],得到频率分布直方图如图所示,若不低于140分的人数为110,则下列说法正确的是( )
A.m=0.031
B.n=800
C.100分以下的人数为60
D.该校成绩在区间[120,140)内的人数占大半
12.某校为了解高二年级学生某次数学考试成绩的分布情况,从该年级的1120名学生中随机抽取了100名学生的数学成绩,发现都在[80,150]内.现将这100名学生的成绩按照[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150]分组后,得到的频率分布直方图如图所示.则下列说法正确的是( )
A.频率分布直方图中a的值为0.040
B.样本数据低于130分的频率为0.7
C.总体的中位数(保留一位小数)估计为123.3分
D.总体分布在[90,100)的频数一定与总体分布在[100,110)的频数相等
三、填空题
13.某地有居民100000户,其中普通家庭99000户,高收入家庭1000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.
14.我国高铁发展迅速,技术先进,经统计在经停某站的高铁列车,有10个车次的正点率为0.97,有20个车次的正点率为0.99,有10个车次的正点率为0.98,则经停该站高铁列车的所有车次的平均正点率估计值为________.
15.为了鼓励市民节约用电,某市实行“阶梯式”电价,将每户居民的月用电量分为两档,月用电量不超过200度的部分按0.5元/度收费,超过200度的部分按0.8元/度收费.某小区共有居民1000户,为了解居民的用电情况,通过抽样,获得了2020年7月份100户居民的用电量,统计分析后得到如图所示的频率分布直方图,则估计该小区1000户居民2020年7月份用电费用不超过260元的户数为________.
16.对某市“四城同创”活动中800名志愿者的年龄抽样调查,统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)年龄组[25,30)对应小矩形的高度为________;
(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)内的人数为________.
四、解答题
17.某校的3000名高三学生参加了某次联考,为了分析此次联考数学学科的情况,现随机从中抽取15名学生的数学成绩(满分:150分),并绘制成如图所示的茎叶图.将成绩低于90分的称为“不及格”,不低于120分的称为“优秀”,其余的称为“良好”.根据样本的数字特征估计总体的情况.
(1)估算此次联考该校高三学生的数学学科的平均成绩;
(2)估算此次联考该校高三学生数学成绩“不及格”和“优秀”的人数各是多少?
(3)在国家扶贫政策的倡导下,该地教育部门提出了教育扶贫活动,要求对此次数学成绩“不及格”的学生分两期进行学业辅导:一期由优秀学生进行一对一帮扶辅导,二期由老师进行集中辅导.根据实践总结,优秀学生进行一对一辅导的转化率为20%;老师集中辅导的转化率为30%,试估算经过两期辅导后,该校高三学生中数学成绩仍然不及格的人数.
注:转化率=×100%.
18.随着教育信息化2.0时代的到来,依托网络进行线上培训越来越便捷,逐步成为实现全民终身学习的重要支撑.最近某高校继续教育学院采用线上和线下相结合的方式开展了一次300名学员参加的“国学经典诵读”专题培训.为了解参训学员对于线上培训、线下培训的满意程度,学院随机选取了50名学员,将他们分成两组,每组25人,分别对线上、线下两种培训进行满意度测评,根据学员的评分(满分100分)绘制了如下茎叶图:
(1)根据茎叶图判断学员对于线上、线下哪种培训的满意度更高?并说明理由;
(2)求50名学员满意度评分的中位数m,并将评分不超过m、超过m分别视为“基本满意”“非常满意”两个等级.利用样本估计总体的思想,估算本次培训共有多少学员对线上培训非常满意?
19.为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,从两厂各随机选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:
(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均数;
(2)若轮胎的宽度在[194,196]内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个的轮胎相对更好.
20.对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名学生,得到这M名学生参加社区服务的次数,根据此数据作出频率分布表和频率分布直方图如下:
分组
频数
频率
[10,15)
10
0.25
[15,20)
24
n
[20,25)
m
p
[25,30]
2
0.05
合计
M
1
(1)求出表中M,p及图中a的值;
(2)若该校有高三学生240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数;
(3)估计学生参加社区服务次数的平均数.
5.1.4 用样本估计总体
知识点一 用样本的数字特征估计总体的数字特征
1.李大伯承包了一个果园,种植了100棵樱桃树,今年已进入收获期,收获时,从中任选并采摘了10棵树的樱桃,分别称得每棵树所产樱桃的质量如下表:
序号
1
2
3
4
5
6
7
8
9
10
质量/千克
14
21
27
17
18
20
19
23
19
22
据调查,市场上今年樱桃的批发价格为每千克15元,用所学的统计知识估计今年此果园樱桃的总产量与按批发价格销售樱桃所得的总收入分别约为( )
A.200千克,3000元
B.1900千克,28500元
C.2000千克,30000元
D.1850千克,27750元
答案 C
解析 样本平均数为(14+21+27+17+18+20+19+23+19+22)÷10=20.由此可估计每棵樱桃树所产樱桃质量平均约为20千克,所以这100棵樱桃树所产樱桃的质量约为20×100=2000千克.根据樱桃批发价格为每千克15元,可得总收入约为15×2000=30000元.
2.有4万个不小于70的两位数,从中随机抽取了3000个数据,统计如下:
数据%
70≤x≤79
80≤x≤89
90≤x≤99
个数
800
1300
900
平均数
78.1
85
91.9
请根据表格中的信息,估计这4万个数据的平均数为( )
A.92.16
B.85.23
C.84.73
D.77.97
答案 B
解析 这3000个数据的平均数为
=85.23.用样本平均数估计总体平均数,可知这4万个数据的平均数约为85.23.故选B.
3.对甲厂、乙厂、丙厂所生产的袋装食品各抽检了20袋,称得质量如柱形图所示.
据此估计甲厂、乙厂、丙厂质量的标准差,分别用s1,s2,s3表示,则有( )
A.s2>s1>s3
B.s1>s3>s2
C.s3>s1>s2
D.s3>s2>s1
答案 C
解析 根据题意,甲厂袋装食品质量的平均数1=×(5×7+5×8+5×9+5×10)=8.5,方差s=×[5×(7-8.5)2+5×(8-8.5)2+5×(9-8.5)2+5×(10-8.5)2]=1.25,标准差s1=;乙厂袋装食品质量的平均数2=×(4×7+6×8+6×9+4×10)=8.5,方差s=×[4×(7-8.5)2+6×(8-8.5)2+6×(9-8.5)2+4×(10-8.5)2]=1.05,标准差s2=;丙厂袋装食品质量的平均数3=×(6×7+4×8+4×9+6×10)=8.5,方差s=×[6×(7-8.5)2+4×(8-8.5)2+4×(9-8.5)2+6×(10-8.5)2]=1.45,标准差s3=.所以s3>s1>s2.故选C.
4.为了鉴定某种节能灯泡的质量,对其中100只节能灯泡的使用寿命进行测量,结果如下表:(单位:小时)
寿命
450
550
600
650
700
只数
20
10
30
15
25
则这种节能灯泡使用寿命的平均数是________.
答案 597.5
解析 这100只节能灯泡使用寿命的平均数是
=597.5,用样本平均数估计总体平均数,可知这种节能灯泡使用寿命的平均数是597.5.
5.样本a1,a2,a3,…,a10的平均数为12,样本b1,b2,…,b8的平均数为5,则样本a1,b1,a2,b2,…,a8,b8,a9,a10的平均数为________.
答案
解析 由题知=12,=5,
则新样本的平均数为=.
6.某果园有苹果树100棵,为了估计该果园的苹果总产量,小王先按长势把苹果树分成了A,B,C三个级别,其中A级30棵,B级60棵,C级10棵,然后从A,B,C三个级别的苹果树中分别随机抽取了3棵、6棵、1棵,测出其产量,制成了如下统计表.小李看了这个统计表后马上正确估计出了该果园的苹果总产量,那么小李的估计值是________kg.
苹果树长势
A级
B级
C级
随机抽取棵数
3
6
1
所抽取果树的平均产量/kg
80
75
70
答案 7600
解析 由题中表格各等级苹果树的平均产量可估算果园的苹果总产量为×100=7600
kg.
7.从甲、乙两人手工制作的图形产品中,各自随机抽取6件,测得其直径如下(单位:cm):
甲:9.00,9.20,9.00,8.50,9.10,9.20;
乙:8.90,9.60,9.50,8.54,8.60,8.90.
据以上数据估计两人的技术稳定性,结论是__________.
答案 甲优于乙
解析 方差越大,数据越不稳定;方差越小,数据越稳定.∵甲=9.00,s≈0.057,乙≈9.01,s≈0.1669,s8.甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从甲、乙生产的零件中分别抽取40件、60件,甲的平均尺寸为10,方差为20,乙的平均尺寸为12,方差为40.那么从甲、乙生产的零件中抽取的这100件产品的平均尺寸和方差分别是多少?
解 由题知甲机床的平均尺寸和方差分别为甲=10,s=20,乙机床的平均尺寸和方差分别为乙=12,s=40,
所以从甲、乙生产的零件中抽出的这100件产品的平均尺寸==11.2,所以方差s2=×=32.96.
9.高一(3)班有男同学27名,女同学21名.在一次语文测验中,男同学得分的平均数是82,中位数是75,女同学得分的平均数是80,中位数是80.
(1)求这次测验全班成绩的平均数(精确到0.01);
(2)估计全班成绩不超过80分的同学至少有多少人;
(3)分析男同学得分的平均数与中位数相差较大的主要原因.
解 (1)利用平均数计算公式,得
=×(82×27+80×21)≈81.13.
(2)因为男同学得分的中位数是75,
所以至少有14名男生得分不超过75分.
又因为女同学得分的中位数是80,
所以至少有11名女生得分不超过80分.
所以全班至少有25人得分不超过80分.
(3)男同学得分的平均数与中位数相差较大,说明男同学中两极分化现象严重,得分高的和得分低的相差较大.
10.为了普及法律知识,达到“法在心中”的目的,某市法制办组织了一次普法知识竞赛,统计局调查队从甲、乙两单位中各随机抽取了5名职工的成绩,用茎叶图表示如下:
(1)根据图中的数据,分别求出样本中甲、乙两单位职工成绩的平均数和方差,并判断哪个单位职工对法律知识的掌握更为稳定;
(2)求被抽取的这10名职工成绩的平均数和方差.
(分层抽样的平均数和方差公式:
设样本中不同层的平均数分别为1,2,…,n,方差分别为s,s,…,s,相应的权重分别为w1,w2,…,wn,则这个样本的平均数和方差分别为=wii,s2=wi[s+(i-)2],其中为样本平均数.)
解 (1)甲单位5名职工成绩的平均数甲==90,乙单位5名职工成绩的平均数乙==90,甲单位5名职工成绩的方差s=×[(87-90)2+(88-90)2+(91-90)2+(91-90)2+(93-90)2]=4.8,乙单位5名职工成绩的方差s=×[(85-90)2+(89-90)2+(91-90)2+(92-90)2+(93-90)2]=8.
∵s∴甲单位职工对法律知识的掌握更为稳定.
(2)∵甲单位职工的权重w甲=,乙单位职工的权重w乙=,甲=90,乙=90,s=4.8,s=8,由分层抽样求平均数和方差的公式可得,这10名职工成绩的平均数=×90+×90=90,这10名职工成绩的方差s2=w甲[s+(甲-)2]+w乙[s+(乙-)2]=×[4.8+(90-90)2]+×[8+(90-90)2]=6.4.
知识点二 用样本的分布来估计总体的分布
11.样本的频率分布与相应的总体分布的关系是( )
A.样本的频率分布与相应的总体分布是同样的分布
B.样本的频率分布与相应的总体分布是互不相关的两种分布
C.样本的频率分布将随着样本容量的增大更加接近相应的总体分布
D.样本的频率分布的样本容量增大到某一定值时就变成了相应的总体分布
答案 C
解析 样本容量越大,样本的频率分布越接近相应的总体分布.
12.在一次模拟考试后,从高三某班随机抽取了20位学生的数学成绩,其分布如下:
分组
[90,100)
[100,110)
[110,120)
[120,130)
[130,140)
[140,150]
频数
1
2
6
7
3
1
分数在130分(包括130分)以上者为优秀,据此估计该班的优秀率约为( )
A.10%
B.20%
C.30%
D.40%
答案 B
解析 由表可知,优秀的人数为3+1=4,则优秀率为=20%,故据此估计该班的优秀率约为20%,故选B.
13.为了解工厂的1000名工人的生产情况,从中抽取100名工人进行统计,得到如下频率分布直方图,由此可估计该工厂产量在75件以上(含75件)的工人数为( )
A.50
B.100
C.150
D.250
答案 C
解析 产量在75件以上(含75件)的频率为0.010×10+0.005×10=0.15,所以该工厂产量在75件以上(含75件)的工人数为1000×0.15=150.故选C.
14.某校为了对九年级学生的体重进行摸底调查,随机抽取了50名学生的体重(kg),将所得数据整理后,画出了频率分布直方图,如图所示.体重在[45,50)内适合跑步训练,体重在[50,55)内适合跳远训练,体重在[55,60]内适合投掷相关方面训练,估计该校九年级学生适合参加跑步、跳远、投掷三项训练的集训人数之比为( )
A.4∶3∶1
B.5∶3∶1
C.5∶3∶2
D.3∶2∶1
答案 B
解析 体重在[45,50)内的频率为0.1×5=0.5,体重在[50,55)内的频率为0.06×5=0.30,体重在[55,60]内的频率为0.02×5=0.1,∵0.5∶0.3∶0.1=5∶3∶1,∴可估计该校九年级学生适合参加跑步、跳远、投掷三项训练的集训人数之比为5∶3∶1,故选B.
15.(多选)为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图.根据统计图的数据,下列结论正确的是( )
A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25
B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5
C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数均为320
D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约为32
答案 ABC
解析 由题图可知中位数是26.25,众数是27.5.1分钟仰卧起坐的次数超过30次的频率为0.2,所以估计该校九年级学生1分钟仰卧起坐的次数超过30次的人数约为320;1分钟仰卧起坐的次数少于20次的频率为0.1,所以估计该校九年级学生1分钟仰卧起坐的次数少于20次的人数约为160.故选ABC.
16.为了了解某小学学生的身高情况,现随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
答案 0.030 3
解析 因为频率分布直方图中各小长方形的面积之和为1,所以10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.由图可知身高在[120,150]内的学生人数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为10,所以从身高在[140,150]内的学生中选取的人数为×10=3.
17.为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午8:00~12:00间各自的车流量(单位:百辆),得如图所示的茎叶图,试求:
(1)甲、乙两个交通站的车流量的极差分别是多少?
(2)甲交通站的车流量在[10,40]间的频率是多少?
(3)甲、乙两个交通站哪个站更繁忙?并说明理由.
解 (1)甲交通站的车流量的极差为73-8=65,乙交通站的车流量的极差为71-5=66.
(2)甲交通站的车流量在[10,40]间的频率为=.
(3)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方,从数据的分布情况来看,甲交通站更繁忙.
18.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如下图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.
解 (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,
因此第二小组的频率为=0.08.
又频率=,
所以样本容量===150,
即第二小组的频率为0.08,样本容量是150.
(2)由图可估计该学校高一学生的达标率约等于次数落在[110,150]内的频率,
又×100%=88%,
即次数落在[110,150]内的频率为88%,
所以估计该学校全体高一学生的达标率是88%.
(3)由已知可得各小组的频数依次为
×150=6,
×150=12,
×150=51,
×150=45,
×150=27,
×150=9,
即各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114.所以跳绳次数的中位数落在第四小组内.
19.从全校参加数学竞赛的学生的成绩中抽取一个样本,考察竞赛的成绩分布,将样本分成5组,绘成频率分布直方图,如图所示,图中从左到右各小组的小矩形的高之比为1∶3∶6∶4∶2,最右边一组的频数是6,请结合频率分布直方图提供的信息,解答下列问题:
(1)样本的容量是多少?
(2)列出频率分布表;
(3)成绩落在哪个范围内的人数最多?并求出该小组的频数,频率.
(4)估计这次竞赛中,成绩不低于60分的学生占总人数的百分比.
解 频率分布直方图中,矩形高之比=面积之比=频数之比=频率之比.
(1)设样本容量为n.
∵最右边一组的频数是6,从左到右各小组的小矩形的高之比为1∶3∶6∶4∶2,
∴(1+3+6+4+2)∶n=2∶6,
解得n=48.
(2)频率分布表如下:
分组
频数
频率
[50,60)
3
[60,70)
9
[70,80)
18
[80,90)
12
[90,100]
6
合计
48
1
(3)成绩落在[70,80)的人数最多,频数为18,频率为.
(4)样本中成绩不低于60分的学生占总人数的×100%=93.75%.由样本估计总体,得这次竞赛中,成绩不低于60分的学生约占总人数的93.75%.
易错点 误将频率分布直方图的纵坐标当作频率
中小学生的视力状况受到社会的关注.某市有关部门从全市6万名高一学生中随机抽取400名学生,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示,从左至右五个小组的频率之比为5∶7∶12∶10∶6,则该市6万名高一学生中视力在[3.95,4.25)范围内的学生约有多少人?
易错分析 本题易将该频率分布直方图中的纵坐标(频率与组距的比)看成频率,出现如下错误:由图可知,第五小组的频率为0.5,所以第一小组的频率为0.5×=.
所以该市6万名高一学生中视力在[3.95,4.25)范围内的学生约有60000×=25000人.
正解 由图可知,第五小组的频率为0.5×0.3=0.15,
所以第一小组的频率为0.15×=0.125.
所以该市6万名高一学生中视力在[3.95,4.25)范围内的学生约有60000×0.125=7500人.
一、单项选择题
1.对于用样本分布估计总体分布的过程,下列说法正确的是( )
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确
答案 C
解析 样本为所研究的具体对象,样本容量越大,越能反映总体情况,估计越精确.
2.某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机抽取24名笔试者的成绩,如表所示.
分数段
[60,65)
[65,70)
[70,75)
[75,80)
[80,85)
[85,90]
人数
2
3
4
9
5
1
据此估计允许参加面试的分数线大约是( )
A.90
B.85
C.80
D.75
答案 C
解析 设24人中按笔试成绩有x人进入面试,=,∴x=6.∴面试分数线为80分.
3.设矩形的长为a,宽为b,其比满足b∶a=≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取的两个批次的初加工矩形的宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是( )
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次的总体平均数与标准值接近程度相同
D.两个批次的总体平均数与标准值接近程度不能确定
答案 A
解析 甲==0.617,乙==0.613,∴甲与0.618更接近.
4.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为m0,平均值为,则( )
A.me=m0=
B.me=m0<
C.me<m0<
D.m0<me<
答案 D
解析 由题目所给的统计图可知,30个数据按大小顺序排列好后,中间两个数为5,6,故中位数为
me==5.5.又众数为m0=5,平均值
=
=≈5.97,∴m0<me<.
5.从甲、乙两种玉米苗中各抽6株,分别测得它们的株高如图所示(单位:cm).根据数据估计( )
A.甲种玉米比乙种玉米不仅长得高而且长得整齐
B.乙种玉米比甲种玉米不仅长得高而且长得整齐
C.甲种玉米比乙种玉米长得高但长势没有乙整齐
D.乙种玉米比甲种玉米长得高但长势没有甲整齐
答案 D
解析 由题中的茎叶图可知,甲种玉米的株高主要集中在20~30
cm,乙种玉米的株高主要集中在30~40
cm,则甲种玉米的平均株高小于乙种玉米的平均株高,但乙种玉米的株高较分散.故选D.
6.为了解某地区1500名高三男生的身体发育情况,抽查了该地区100名年龄为17~18岁的高三男生体重(kg),得到频率分布直方图如图.根据图示,估计该地区高三男生中体重在[56.5,64.5)
kg的学生人数是( )
A.390
B.510
C.600
D.660
答案 C
解析 由题意,得体重在[56.5,64.5)kg的学生频率为(0.03+0.05+0.05+0.07)×2=0.4,故该地区高三男生中体重在[56.5,64.5)kg的频率是0.4,人数为1500×0.4=600.
7.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.估计这次测试数学成绩的平均分为( )
A.50
B.60
C.72
D.80
答案 C
解析 利用组中值估算学生的平均分:45f1+55f2+65f3+75f4+85f5+95f6=45×0.05+55×0.15+65×0.2+75×0.3+85×0.25+95×0.05=72.
8.为了解某校学生的视力情况,随机抽查了该校的100名学生,得到如图所示的频率分布直方图.由于不慎将部分数据丢失,但知道前4组的频数和为40,后6组的频数和为87.设最大频率为a,视力在4.5到5.2之间的学生人数为b,则a,b的值分别为( )
A.0.27,0.96
B.0.27,96
C.27,0.96
D.27,96
答案 B
解析 由频率分布直方图知组距为0.1,由前4组的频数和为40,后6组的频数和为87,知第4组的频数为40+87-100=27,即视力在4.6到4.7之间的频数最大,为27,故最大频率a=0.27.视力在4.5到5.2之间的频率为1-0.01-0.03=0.96,故视力在4.5到5.2之间的学生人数b=0.96×100=96.故选B.
二、多项选择题
9.下列说法正确的是( )
A.一个样本的众数、中位数和平均数不可能是同一个数
B.统计中,我们可以用样本平均数去估计总体平均数
C.样本平均数既不可能大于也不可能小于这个样本中的所有数据
D.众数、中位数和平均数从不同的角度描述了一组数据的集中趋势
答案 BCD
解析 用样本估计总体情况时,在一组数据中,众数、中位数和平均数可能是同一个数,例如:数据10,11,11,11,11,11,12的众数、中位数和平均数都是11,故A错误;统计中,我们可以用样本平均数去估计总体平均数,故B正确;样本平均数既不可能大于也不可能小于这个样本中的所有数据,故C正确;众数、中位数和平均数从不同的角度描述了一组数据的集中趋势,故D正确,故选BCD.
10.学校为了解新课程标准中提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示.将阅读时间不低于30
min的学生称为阅读霸,则下列结论正确的是( )
A.抽样表明,该校约有一半学生为阅读霸
B.抽取的100名学生中有50名学生为阅读霸
C.抽取的100名学生中有45名学生为阅读霸
D.抽样表明,该校有50名学生为阅读霸
答案 AB
解析 根据频率分布直方图可列下表:
阅读时间/min
[0,10)
[10,20)
[20,30)
[30,40)
[40,50)
[50,60]
抽样人数/名
10
18
22
25
20
5
抽取的100名学生中有50名为阅读霸,据此可判断该校约有一半学生为阅读霸.故选AB.
11.统计某校n名学生的某次数学同步练习成绩(满分150分),根据成绩依次分成六组:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],得到频率分布直方图如图所示,若不低于140分的人数为110,则下列说法正确的是( )
A.m=0.031
B.n=800
C.100分以下的人数为60
D.该校成绩在区间[120,140)内的人数占大半
答案 AC
解析 分析可知,10×(m+0.020+0.016+0.016+0.011+0.006)=1,解得m=0.031,故A说法正确;因为不低于140分的频率为0.011×10=0.11,所以n==1000,故B说法错误;因为100分以下的频率为0.006×10=0.06,所以100分以下的人数为1000×0.06=60,故C说法正确;成绩在区间[120,140)内的频率为0.031×10+0.016×10=0.47<0.5,人数占小半,故D说法错误.
12.某校为了解高二年级学生某次数学考试成绩的分布情况,从该年级的1120名学生中随机抽取了100名学生的数学成绩,发现都在[80,150]内.现将这100名学生的成绩按照[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150]分组后,得到的频率分布直方图如图所示.则下列说法正确的是( )
A.频率分布直方图中a的值为0.040
B.样本数据低于130分的频率为0.7
C.总体的中位数(保留一位小数)估计为123.3分
D.总体分布在[90,100)的频数一定与总体分布在[100,110)的频数相等
答案 BC
解析 由频率分布直方图,得(0.005+0.010+0.010+0.015+a+0.025+0.005)×10=1,解得a=0.030,故A错误;样本数据低于130分的频率为1-(0.025+0.005)×10=0.7,故B正确;[80,120)的频率为(0.005+0.010+0.010+0.015)×10=0.4,[120,130)的频率为0.030×10=0.3.∴总体的中位数(保留1位小数)估计为120+×10≈123.3分,故C正确;样本分布在[90,100)的频数一定与样本分布在[100,110)的频数相等,总体分布在[90,100)的频数不一定与总体分布在[100,110)的频数相等,故D错误.故选BC.
三、填空题
13.某地有居民100000户,其中普通家庭99000户,高收入家庭1000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.
答案 5.7%
解析 普通家庭中拥有3套或3套以上住房的大约为99000×=5000户,高收入家庭中拥有3套或3套以上住房的大约为1000×=700户.
所以该地拥有3套或3套以上住房的家庭共约有5000+700=5700户,所占的比例为×100%=5.7%.
14.我国高铁发展迅速,技术先进,经统计在经停某站的高铁列车,有10个车次的正点率为0.97,有20个车次的正点率为0.99,有10个车次的正点率为0.98,则经停该站高铁列车的所有车次的平均正点率估计值为________.
答案 0.9825
解析 总车次:10+20+10=40,则所有车次的平均正点率为=0.9825,故答案为0.9825.
15.为了鼓励市民节约用电,某市实行“阶梯式”电价,将每户居民的月用电量分为两档,月用电量不超过200度的部分按0.5元/度收费,超过200度的部分按0.8元/度收费.某小区共有居民1000户,为了解居民的用电情况,通过抽样,获得了2020年7月份100户居民的用电量,统计分析后得到如图所示的频率分布直方图,则估计该小区1000户居民2020年7月份用电费用不超过260元的户数为________.
答案 900
解析 当用电量为400度时,用电费用为200×0.5+200×0.8=260元,所以此100户居民中用电费用超过260元的户数为0.001×100×100=10,所以此100户居民中用电费用不超过260元的户数为90,所以估计该小区1000户居民2020年7月份用电费用不超过260元的户数为×1000=900.
16.对某市“四城同创”活动中800名志愿者的年龄抽样调查,统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)年龄组[25,30)对应小矩形的高度为________;
(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)内的人数为________.
答案 (1)0.04 (2)440
解析 (1)设年龄组[25,30)对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.
(2)由(1)得志愿者年龄在[25,35)内的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)内的人数约为0.55×800=440.
四、解答题
17.某校的3000名高三学生参加了某次联考,为了分析此次联考数学学科的情况,现随机从中抽取15名学生的数学成绩(满分:150分),并绘制成如图所示的茎叶图.将成绩低于90分的称为“不及格”,不低于120分的称为“优秀”,其余的称为“良好”.根据样本的数字特征估计总体的情况.
(1)估算此次联考该校高三学生的数学学科的平均成绩;
(2)估算此次联考该校高三学生数学成绩“不及格”和“优秀”的人数各是多少?
(3)在国家扶贫政策的倡导下,该地教育部门提出了教育扶贫活动,要求对此次数学成绩“不及格”的学生分两期进行学业辅导:一期由优秀学生进行一对一帮扶辅导,二期由老师进行集中辅导.根据实践总结,优秀学生进行一对一辅导的转化率为20%;老师集中辅导的转化率为30%,试估算经过两期辅导后,该校高三学生中数学成绩仍然不及格的人数.
注:转化率=×100%.
解 (1)因为抽取的15名学生的数学学科的平均成绩为×[1+0+3+5+6+8+0+3+6+8+2+4+6+3+5+(8+2×9+3×10+4×11+3×12+2×13)×10]=112.
所以依此估计此次联考该校高三学生的数学学科的平均成绩为112分.
(2)依题意知,随机抽取的15人中,不及格的人数为1,优秀的人数为5.所以不及格率为,优秀率为.
所以估计在此次联考中该校高三学生数学成绩不及格的人数为3000×=200,
优秀的人数为3000×=1000.
(3)由(2)知,不及格人数为200.
设一期辅导后不及格人数为x,则=,
解得x=160.
设二期辅导后不及格人数为y,则=,
解得y=112.
所以估计经过两次辅导后,该校高三学生中数学成绩仍然不及格的人数为112.
18.随着教育信息化2.0时代的到来,依托网络进行线上培训越来越便捷,逐步成为实现全民终身学习的重要支撑.最近某高校继续教育学院采用线上和线下相结合的方式开展了一次300名学员参加的“国学经典诵读”专题培训.为了解参训学员对于线上培训、线下培训的满意程度,学院随机选取了50名学员,将他们分成两组,每组25人,分别对线上、线下两种培训进行满意度测评,根据学员的评分(满分100分)绘制了如下茎叶图:
(1)根据茎叶图判断学员对于线上、线下哪种培训的满意度更高?并说明理由;
(2)求50名学员满意度评分的中位数m,并将评分不超过m、超过m分别视为“基本满意”“非常满意”两个等级.利用样本估计总体的思想,估算本次培训共有多少学员对线上培训非常满意?
解 (1)对线下培训的满意度更高.理由如下(答出其中任意一种或其他合理理由均可):
(ⅰ)由茎叶图可知,在线上培训中,有72%的学员满意度评分至多79分,在线下培训中,有72%的学员评分至少80分.因此学员对线下培训的满意度更高.
(ⅱ)由茎叶图可知,线上培训满意度评分的中位数为76分,线下培训评分的中位数为85分.因此学员对线下培训的满意度更高.
(ⅲ)由茎叶图可知,线上培训的满意度评分平均分低于80分;线下培训的平均分高于80分,因此学员对线下培训的满意度更高.
(ⅳ)由茎叶图可知,线上培训的满意度评分分布在茎7上的最多,关于茎7大致呈对称分布;线下培训的评分分布在茎8上的最多,关于茎8大致呈对称分布,又两种培训方式评分的分布区间相同,故可以认为线下培训评分比线上培训评分更高,因此学员对线下培训的满意度更高.
(2)由茎叶图知m==79.5.
参加线上培训满意度调查的25名学员中共有7名对线上培训非常满意,频率为,
又本次培训共300名学员,所以对线上培训非常满意的学员约有300×=84人.
19.为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,从两厂各随机选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:
(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均数;
(2)若轮胎的宽度在[194,196]内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个的轮胎相对更好.
解 (1)甲厂10个轮胎宽度的平均数:甲=×(195+194+196+193+194+197+196+195+193+197)=195,乙厂10个轮胎宽度的平均数:乙=×(195+196+193+192+195+194+195+192+195+193)=194.
(2)甲厂10个轮胎中宽度在[194,196]内的数据为195,194,196,194,196,195,
平均数:1=×(195+194+196+194+196+195)=195,
方差:s=×[(195-195)2+(194-195)2+(196-195)2+(194-195)2+(196-195)2+(195-195)2]=,
乙厂10个轮胎中宽度在[194,196]内的数据为195,196,195,194,195,195,
平均数:2=×(195+196+195+194+195+195)=195,
方差:s=×[(195-195)2+(196-195)2+(195-195)2+(194-195)2+(195-195)2+(195-195)2]=,
∵两厂标准轮胎宽度的平均数相等,但乙厂的方差更小,∴乙厂的轮胎相对更好.
20.对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名学生,得到这M名学生参加社区服务的次数,根据此数据作出频率分布表和频率分布直方图如下:
分组
频数
频率
[10,15)
10
0.25
[15,20)
24
n
[20,25)
m
p
[25,30]
2
0.05
合计
M
1
(1)求出表中M,p及图中a的值;
(2)若该校有高三学生240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数;
(3)估计学生参加社区服务次数的平均数.
解 (1)由分组[10,15)内的频数是10,频率是0.25,知=0.25,所以M=40.
所以10+24+m+2=40,解得m=4,
所以p===0.1,a==0.12.
(2)估计该校高三学生参加社区服务的次数在区间[10,15)内的人数为0.25×240=60.
(3)因为n==0.6,
又12.5×0.25+17.5×0.6+22.5×0.1+27.5×0.05=17.25.
所以估计学生参加社区服务次数的平均数是17.25.