专题 《统计与统计案例》讲义
16.1 抽样方法与统计图表
题型一. 抽样方法
1.①某高校为了解学生家庭经济收入情况,从来自城镇的150名学生和来自农村的150名学生中抽取100名学生的样本;
②某车间主任从100件产品中抽取10件样本进行产品质量检验.
I.简单随机抽样法;
Ⅱ.分层抽样法.
上述两问题和两方法配对正确的是( )
A.①配I,②配Ⅱ B.①配Ⅱ,②配Ⅰ C.①配I,②配I D.①配Ⅱ,②配Ⅱ
2.某学校有男学生400名,女学生600名,为了解男女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取男学生40名,女学生60名进行调查,则这种抽样方法是 .
3.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=( )
A.10 B.12 C.13 D.14
4.一个总体的60个个体编号为00,01,…,59,现需从中抽取一容量为6的样本,请从随机数表的倒数第5行(如下,且下一行接在上一行右边)第10列开始,向右读取,直到取足样本,则抽取样本的第五个号码是 .
第五行 95 33 95 22 00 18 74 72 00 18 38 79
58 69 32 81 76 80 26 92 82 80 84 25
题型二.统计图表
1.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论正确的是 .
①月接待游客量逐月增加;
②年接待游客量逐年增加;
③各年的月接待游客量高峰期大致在7,8月;
④各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳.
2.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁﹣18岁的男生体重(kg),得到频率分布直方图如图,根据图可得这100名学生中体重在(56.5,64.5)的学生人数是( )
A.20 B.30 C.40 D.50
3.如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
A.3,5 B.5,5 C.3,7 D.5,7
4.如图所示,样本A和B分别取自两个不同的总体,它们的样本平均数分别为、,样本标准差分别为SA,SB,则( )
A.,SA>SB B.,SA>SB
C.,SA<SB D.,SA<SB
题型三.统计大题
1.为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午8:00~12:00间各自的车流量(单位:百辆),得如图所示的统计图,试求:
(1)甲、乙两个交通站的车流量的极差分别是多少?
(2)甲交通站的车流量在[10,60]间的频率是多少?
(3)甲、乙两个交通站哪个站更繁忙?并说明理由.
2.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
质量指标值分组 [75,85) [85,95) [95,105) [105,115) [115,125)
频数 6 28 36 20 10
(1)作出这些数据的频率分布直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值低于95的产品至多占全部产品25%”的规定?
3.为增强市民的节能环保意识,某市面向全市征召义务宣传志愿者.从符合条件的500名志愿者中随机抽取100名志愿者,其年龄频率分布直方图如图所示,其中年龄分组区间是:第一组第1组[20,25)、第2组[25,30)、第3组[30,35)、第4组[35,40)、第5组[40,45].
(1)求图中x的值并根据频率分布直方图估计这500名志愿者中年龄在[35,40)的人数;
(2)估计抽出的100名志愿者年龄的第50百分位数(精确到0.1)
(3)若在抽出的第2组和第4组志愿者中,采用按比例分配分层抽样的方法抽取5名志愿者参加中心广场的宣传活动,再从这5名中采用简单随机抽样方法选取2名志愿者担任主要负责人.求抽取的2名志愿者中恰好来自同一组的概率.
课后作业. 抽样方法与统计图表
1.某班有50名学生,男女人数不相等.随机询问了该班5名男生和5名女生的某次数学测试成绩,用茎叶图记录如图所示,则下列说法一定正确的是( )
A.这5名男生成绩的标准差大于这5名女生成绩的标准差
B.这5名男生成绩的中位数大于这5名女生成绩的中位数
C.该班男生成绩的平均数大于该班女生成绩的平均数
D.这种抽样方法是一种分层抽样
2.已知样本数据为x1,x2,x3,x4,x5,该样本平均数为5,方差为2,现加入一个数5,得到新样本的平均数为,方差为s2,则( )
A.5,s2>2 B.5,s2<2 C.5,s2<2 D.5,s2>2
3.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1.8,全年比赛进球个数的标准差为0.3.下列说法正确的个数为( )
①甲队技术比乙队好;
②乙队发挥比甲队稳定;
③乙队几乎每场都进球;
④甲队表现时好时坏.
A.1 B.2 C.3 D.4
4.在样本的频率分布直方图中,共有8个小长方形,若最后一个小长方形的面积等于其它7个小长方形的面积和的,且样本容量为200,则第8组的频数为( )
A.40 B.0.2 C.50 D.0.25
5.某单位招聘员工,有200名应聘者参加笔试,随机抽查了其中20名应聘者笔试试卷,统计他们的成绩如下表:
分数段 [60,65) [65,70) [70,75) [75,80) [80,85) [85,90) [90,95)
人数 1 3 6 6 2 1 1
若按笔试成绩择优录取40名参加面试,由此可预测参加面试的分数线为( )
A.70分 B.75分 C.80分 D.85分
6.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为 .
7.某城市一入城交通路段限速50公里/小时,现对某时段通过该交通路段的n辆小汽车车速进行统计,并绘制成频率分布直方图(如图).若这n辆小汽车中,速度在40~50公里/小时之间的车辆有150辆.
(1)求n的值;
(2)估计这n辆小汽车车速的中位数;
(3)根据交通法规定,小车超速在规定时速10%以内(含10%)不罚款,超过时速规定10%以上,需要罚款.试根据频率分布直方图,估计某辆小汽车在该路段被罚款的概率.
8.某快餐连锁店招聘外卖骑手,该快餐连锁店外卖覆盖A,B两个区域,骑手入职只能选择其中一个区域.其中区域A无底薪,外卖业务每完成一单提成5元;区域B规定每日底薪150元,外卖业务的前35单没有提成,从第36单开始,每完成一单提成8元.为激励员工,快餐连锁店还规定,凡当日外卖业务超过55单的外卖骑手可额外获得“精英骑手”奖励50元.该快餐连锁店记录了骑手每天的人均业务量,整理得到如图所示的两个区域外卖业务量的频率分布直方图.
(1)从以往统计数据看,新入职骑手选择区域A的概率为0.6,选择区域B的概率为0.4,
(ⅰ)随机抽取一名骑手,求该骑手获得当日“精英骑手”奖励的概率;
(ⅱ)若新入职的甲.乙、丙三名骑手分别到该快餐连锁店应聘,三人区域选择相互独立,求至少有两名骑手选择区域A的概率;
(2)若仅从人均日收入的角度考虑,新聘骑手应选择入职哪一区域?请说明你的理由(同组中的每个数据用该组区间的中点值代替).专题 《统计与统计案例》讲义
16.1 抽样方法与统计图表
题型一. 抽样方法
1.①某高校为了解学生家庭经济收入情况,从来自城镇的150名学生和来自农村的150名学生中抽取100名学生的样本;
②某车间主任从100件产品中抽取10件样本进行产品质量检验.
I.简单随机抽样法;
Ⅱ.分层抽样法.
上述两问题和两方法配对正确的是( )
A.①配I,②配Ⅱ B.①配Ⅱ,②配Ⅰ C.①配I,②配I D.①配Ⅱ,②配Ⅱ
【解答】解:①、总体中个体明显分层两层:来自城镇的学生和来自农村的学生,故用分层抽样来抽取样本;
②,总体中个体的数目是100,不是很大,故用简单分层抽样来抽取样本.
故选:B.
2.某学校有男学生400名,女学生600名,为了解男女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取男学生40名,女学生60名进行调查,则这种抽样方法是 分层抽样 .
【解答】解:总体由男生和女生组成,比例为400:600=4:6,所抽取的比例也是4:6,故这种抽样方法是分层抽样
故答案为:分层抽样
3.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=( )
A.10 B.12 C.13 D.14
【解答】解:∵甲、乙、丙三个车间生产的产品件数分别是120,80,60,
∴甲、乙、丙三个车间生产的产品数量的比依次为6:4:3,
丙车间生产产品所占的比例,
因为样本中丙车间生产产品有3件,占总产品的,
所以样本容量n=313;
故选:C.
4.一个总体的60个个体编号为00,01,…,59,现需从中抽取一容量为6的样本,请从随机数表的倒数第5行(如下,且下一行接在上一行右边)第10列开始,向右读取,直到取足样本,则抽取样本的第五个号码是 17 .
第五行 95 33 95 22 00 18 74 72 00 18 38 79
58 69 32 81 76 80 26 92 82 80 84 25
【解答】解:根据题意,60个个体编号为00,01,…,59,现从中抽取一容量为6的样本,
从随机数表的倒数第5行第10列开始,向右读取
01,87(舍去),47,20,01(舍去),83(舍去),87(舍去),95(舍去),
86(舍去),93(舍去),28,17,68(舍去),02共6个;
所以抽取样本的号码是01,47,20,28,17,02.
故答案为:17.
题型二.统计图表
1.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论正确的是 ②③④ .
①月接待游客量逐月增加;
②年接待游客量逐年增加;
③各年的月接待游客量高峰期大致在7,8月;
④各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳.
【解答】解:对于A,由折线图的变化趋势可得,月接待游客量有增有减,故选项A错误;
对于B,由折线图的变化趋势可得,年接待游客量逐年增加,故选项B正确;
对于C,由折线图可得,各年的月接待游客量高峰期大致在7,8月,故选项C正确;
对于D,由折线图可得,各年1月至6月的月接待游客量相对于7月至12月,
波动性更小,变化比较平稳,故选项D正确.
故答案为:②③④.
2.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁﹣18岁的男生体重(kg),得到频率分布直方图如图,根据图可得这100名学生中体重在(56.5,64.5)的学生人数是( )
A.20 B.30 C.40 D.50
【解答】解:由频率直方图得,体重在(56.5,64.5)的频率为0.03×2+0.05×2+0.05×2+0.07×2=0.4,
∴所求人数为100×0.4=40.
故选:C.
3.如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
A.3,5 B.5,5 C.3,7 D.5,7
【解答】解:由已知中甲组数据的中位数为65,
故乙组数据的中位数也为65,
即y=5,
则乙组数据的平均数为:66,
故x=3,
故选:A.
4.如图所示,样本A和B分别取自两个不同的总体,它们的样本平均数分别为、,样本标准差分别为SA,SB,则( )
A.,SA>SB B.,SA>SB
C.,SA<SB D.,SA<SB
【解答】解:∵样本A的数据均不大于10,
而样本B的数据均不小于10,
显然,
由图可知A中数据波动程度较大,
B中数据较稳定,
∴sA>sB.
故选:B.
题型三.统计大题
1.为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午8:00~12:00间各自的车流量(单位:百辆),得如图所示的统计图,试求:
(1)甲、乙两个交通站的车流量的极差分别是多少?
(2)甲交通站的车流量在[10,60]间的频率是多少?
(3)甲、乙两个交通站哪个站更繁忙?并说明理由.
【解答】解:(1)甲交通站的车流量的极差为73﹣8=65(百辆),乙交通站的车流量的极差为71﹣5=66(百辆);
(2)甲交通站的车流量在[10,60]间的频率为.
(3)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方,从数据的分布情况来看,甲交通站更繁忙.
2.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
质量指标值分组 [75,85) [85,95) [95,105) [105,115) [115,125)
频数 6 28 36 20 10
(1)作出这些数据的频率分布直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值低于95的产品至多占全部产品25%”的规定?
【解答】解:(1)由已知作出频率分布表为:
质量指标值分组 [75,85) [85,95) [95,105) [105,115) [115,125)
频数 6 28 36 20 10
频率 0.06 0.28 0.36 0.20 0.10
由频率分布表作出这些数据的频率分布直方图为:
(2)质量指标值的样本平均数为:
80×0.06+90×0.28+100×0.36+110×0.20+120×0.10=100;
质量指标值的样本方差为:
s2=(﹣20)2×0.06+(﹣10)2×0.28+02×0.36+102×0.20+202×0.10=112;
所以这种产品质量指标值的平均数的估计值为100,方差的计值为112;
(3)∵0.06+0.28=0.34>0.25,
∴不符合规定.
3.为增强市民的节能环保意识,某市面向全市征召义务宣传志愿者.从符合条件的500名志愿者中随机抽取100名志愿者,其年龄频率分布直方图如图所示,其中年龄分组区间是:第一组第1组[20,25)、第2组[25,30)、第3组[30,35)、第4组[35,40)、第5组[40,45].
(1)求图中x的值并根据频率分布直方图估计这500名志愿者中年龄在[35,40)的人数;
(2)估计抽出的100名志愿者年龄的第50百分位数(精确到0.1)
(3)若在抽出的第2组和第4组志愿者中,采用按比例分配分层抽样的方法抽取5名志愿者参加中心广场的宣传活动,再从这5名中采用简单随机抽样方法选取2名志愿者担任主要负责人.求抽取的2名志愿者中恰好来自同一组的概率.
【解答】解:(1)因为小矩形的面积等于频率,
所以 除[35,40)外的频率和为0.7,
所以x0.06,
故在500名志愿者中年龄在[35,40)的人数为0.06×5×500=150;
(2)前两个分组的频率和为(0.01+0.04)×5=0.25,
前三个分组的频率和为(0.01+0.04+0.07)×5=0.6,
所以第50百分位数在[30,45)之间,
第50百分位数为3032.09;
(3)用分层抽样的方法,从中选5名,
则其中第二组的人有2名,第四组的人有3名,
所以从中抽取的2名志愿者中恰来自同一组额概率为.
课后作业. 抽样方法与统计图表
1.某班有50名学生,男女人数不相等.随机询问了该班5名男生和5名女生的某次数学测试成绩,用茎叶图记录如图所示,则下列说法一定正确的是( )
A.这5名男生成绩的标准差大于这5名女生成绩的标准差
B.这5名男生成绩的中位数大于这5名女生成绩的中位数
C.该班男生成绩的平均数大于该班女生成绩的平均数
D.这种抽样方法是一种分层抽样
【解答】解:这5名男生成绩的方差为,
女生的方差为,
男生方差大于女生方差,
所以男生标准差大于女生标准差,所以A对;
这5名男生成绩的中位数是90,
5名女生成绩的中位数93,所以B错;
该班男生和女生成绩的平均数可通过样本估计,
但不能通过样本计算得到平均数准确值,所以C错;
若抽样方法是分层抽样,因为男生女生不等,
所以分别抽取的人数不等,所以D错.
故选:A.
2.已知样本数据为x1,x2,x3,x4,x5,该样本平均数为5,方差为2,现加入一个数5,得到新样本的平均数为,方差为s2,则( )
A.5,s2>2 B.5,s2<2 C.5,s2<2 D.5,s2>2
【解答】解:∵样本数据为x1,x2,x3,x4,x5,该样本平均数为5,方差为2,
现加入一个数5,得到新样本的平均数为,方差为s2,
∴,
方差为s2[5×2+0]2.
故选:B.
3.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1.8,全年比赛进球个数的标准差为0.3.下列说法正确的个数为( )
①甲队技术比乙队好;
②乙队发挥比甲队稳定;
③乙队几乎每场都进球;
④甲队表现时好时坏.
A.1 B.2 C.3 D.4
【解答】解:∵甲队平均每场进球数为3.2,乙队平均每场进球数为1.8,
∴甲队技术比乙队好,故①正确,
∵甲全年比赛进球个数的标准差为3;
乙全年比赛进球个数的标准差为0.3.
∴乙队发挥比甲队稳定,故②正确,
乙队标准差为0.3,说明每次进球数均值,乙队几乎每场都进球,甲队标准差为3,说明甲队表现时好时坏,故③④正确,
总上可知有4种说法正确,
故选:D.
4.在样本的频率分布直方图中,共有8个小长方形,若最后一个小长方形的面积等于其它7个小长方形的面积和的,且样本容量为200,则第8组的频数为( )
A.40 B.0.2 C.50 D.0.25
【解答】解:在样本的频率分布直方图中,共有8个小长方形,
若最后一个小长方形的面积等于其它7个小长方形的面积和的,
则第8组的频率为,
∵样本容量为200,∴第8组的频数为:20040.
故选:A.
5.某单位招聘员工,有200名应聘者参加笔试,随机抽查了其中20名应聘者笔试试卷,统计他们的成绩如下表:
分数段 [60,65) [65,70) [70,75) [75,80) [80,85) [85,90) [90,95)
人数 1 3 6 6 2 1 1
若按笔试成绩择优录取40名参加面试,由此可预测参加面试的分数线为( )
A.70分 B.75分 C.80分 D.85分
【解答】解:由题意得在抽查的20名应试者能能被录取的人数为:
204人,
∴预测参加面试的分数线为80分.
故选:C.
6.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为 12 .
【解答】解:由频率分布直方图得第一组与第二组的频率和为:
1﹣(0.36+0.16+0.08)=0.4,
∵第一组与第二组共有20人,
∴样本单元数n50人,
∵第三组的频率为0.36,∴第三组共有:50×0.36=18人,
∵第三组没有疗效的有6人,
∴第三组中有疗效的人数为:18﹣6=12人.
故答案为:12.
7.某城市一入城交通路段限速50公里/小时,现对某时段通过该交通路段的n辆小汽车车速进行统计,并绘制成频率分布直方图(如图).若这n辆小汽车中,速度在40~50公里/小时之间的车辆有150辆.
(1)求n的值;
(2)估计这n辆小汽车车速的中位数;
(3)根据交通法规定,小车超速在规定时速10%以内(含10%)不罚款,超过时速规定10%以上,需要罚款.试根据频率分布直方图,估计某辆小汽车在该路段被罚款的概率.
【解答】解:(1)由直方图可知,车速在40~50公里/小时之间的频率为0.3,
所以,解得n=500,
即n的值为500.
(2)设这n辆小汽车车速的中位数为x,
则0.008×10+0.024×10+0.03×(x﹣40)=0.5,
解得x=46,
所以可以估计这n辆小汽车车速的中位数为46.
(3)由交通法规可知,小车速度在55公里/小时以上需要罚款,
由直方图可知,小车速度在50~60公里/小时之间的有500×0.28=140辆,
由统计的有关知识,可以认为车速在55~60公里/小时之间的有70辆,
又小车速度在60~70公里/小时之间的有500×0.10=50辆,
所以这500辆小车中,有70+50=120辆小车超速10%以上,
故可以估计某辆小汽车在该路段被罚款的概率P.
8.某快餐连锁店招聘外卖骑手,该快餐连锁店外卖覆盖A,B两个区域,骑手入职只能选择其中一个区域.其中区域A无底薪,外卖业务每完成一单提成5元;区域B规定每日底薪150元,外卖业务的前35单没有提成,从第36单开始,每完成一单提成8元.为激励员工,快餐连锁店还规定,凡当日外卖业务超过55单的外卖骑手可额外获得“精英骑手”奖励50元.该快餐连锁店记录了骑手每天的人均业务量,整理得到如图所示的两个区域外卖业务量的频率分布直方图.
(1)从以往统计数据看,新入职骑手选择区域A的概率为0.6,选择区域B的概率为0.4,
(ⅰ)随机抽取一名骑手,求该骑手获得当日“精英骑手”奖励的概率;
(ⅱ)若新入职的甲.乙、丙三名骑手分别到该快餐连锁店应聘,三人区域选择相互独立,求至少有两名骑手选择区域A的概率;
(2)若仅从人均日收入的角度考虑,新聘骑手应选择入职哪一区域?请说明你的理由(同组中的每个数据用该组区间的中点值代替).
【解答】解:(1)(i)设“随机抽取一名骑手是区域A骑手”为事件M,骑手获得”精英骑手“奖励为事件N,
则P(M)=0.6,P()=0.4,结合频率分布直方图知,P(N|M)=0.3,P(N|)=0.2,
所以P(N)=P(M)P(N)|M)+P()P(N|)=0.6×0.3+0.4×0.2=0.26,
因此该骑手获得当日“精英骑手”奖励的概率为0.26;
(ii)设X=选择区域A的骑手人数,则X~B(3,0.6),
P(X≥2)=P(X=2)+P(X=3)0.62×0.4+0.63=0.648,
故至少有两名骑手选择区域A的概率0.648;
(2)设Y1=区域A骑手日工资,则随机变量Y1分布列为
Y1 100 150 200 250 350 400
P 0.05 0.1 0.25 0.3 0.2 0.1
E(Y1)=100×0.05+150×0.1+200×0.25+250×0.3+350×0.2+400×0.1=255,
设Y2=区域B骑手日工资,则随机变量Y2分布列为
Y2 150 190 270 400 480
P 0.25 0.25 0.3 0.15 0.05
E(Y2)=150×0.25+190×0.25+270×0.3+400×0.15+480×0.05=250.
因为E(Y1)>E(Y2),所以新聘骑手应选择区域A.