2018年高考数学一轮复习真题精讲精练(2013-2017):
9.2 用样本估计总体
考纲剖析
1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会他们各自的特点.
2.理解样本数据标准差的意义和作用,会计算数据标准差.
3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.
4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解样本估计总体的思想.
5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
知识回顾
1.频率分布直方图
(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.
(2)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用 表示,各小长方形的面积总和等于 .
(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为 ,它能够更加精细的反映出总体在各个范围内取值的百分比.
(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.
2.用样本的数字特征估计总体的数字特征
(1)众数、中位数、平均数
①众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.
②中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
③平均数:样本数据的算术平均数,即= 在频率分布直方图中,中位数左边和右边的直方图的面积 .
(2)样本方差、标准差
标准差s= .
其中xn是 ,n是 ,是 .
标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.
精讲方法
一、用样本估计总体
(一)频率分布直方图在总体估计中的应用
频率分布直方图反映样本的频率分布
(1)频率分布直方图中横坐标表示组距,纵坐标表示,频率= .
(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.
(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.
(4)众数为最高矩形中点的横坐标.
(5)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.
(二)用样本的分布估计总体
茎叶图刻画数据的优点
(1)所有的数据信息都可以从茎叶图中得到.
(2)茎叶图便于记录和表示,且能够展示数据的分布情况.
注:当数据是两位有效数字时,用茎叶图显得容易、方便.而当样本数据较大和较多时,用茎叶图表示,就显得不太方便.
(三)用样本的数字特征估计总体的数字特征
(1)运用方差解决问题时,注意到方差越大,波动越大,越不稳定;方差越小,波动越小,越稳定.
(2)平均数与方差都是重要的数字特征,是对总体的一种简单的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.
(3)平均数、方差的公式推广
①若数据的平均数为,那么的平均数是.
②数据的方差为.
a.
b.数据的方差也为;
c.数据的方差为.
小结
1.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.
2.众数、中位数、平均数的异同
(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
(2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动,而中位数和众数都不具备此性质.
(3)众数体现各数据出现的频率,当一组数据中有若干数据多次出现时,众数往往更能反映问题.
(4)中位数仅与数据的排列位置有关,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.
例题精讲
考点一 频率分布直方图的应用
【例题1】(2017湖南衡阳八中二模)根据国家环保部新修订的《环境空气质量标准》规定:居民区PM2.5的年平均浓度不得超过35微克/立方米,PM2.5的24小时平均浓度不得超过75微克/立方米.我市环保局随机抽取了一居民区2016年20天PM2.5的24小时平均浓度(单位:微克/立方米)的监测数据,数据统计如表:
组别
PM2.5浓度(微克/立方米)
频数(天)
频率
第一组
(0,25]
3
0.15
第二组
(25,50]
12
0.6
第三组
(50,75]
3
0.15
第四组
(75,100]
2
0.1
(1)将这20天的测量结果按上表中分组方法绘制成的样本频率分布直方图如图. ①求频率分布直方图中a的值;②求样本平均数,并根据样本估计总体的思想,从PM2.5的年平均浓度考虑,判断该居民区的环境质量是否需要改善?并说明理由.
(2)将频率视为概率,对于2016年的某3天,记这3天中该居民区PM2.5的24小时平均浓度符合环境空气质量标准的天数为X,求X的分布列.
【答案】(1)解:①由第四组的频率为1﹣(0.006+0.024+0.006)×25=0.1, 得25a=0.1,解得a=0.004;②去年该居民区PM2.5年平均浓度为:12.5×0.15+37.5×0.6+62.5×0.15+87.5×0.1=42.5(微克/立方米);因为42.5>35,所以去年该居民区PM2.5年平均浓度不符合环境空气质量标准,故该居民区的环境需要改进(2)解:由题意可得: PM2.5的24小时平均浓度符合环境空气质量标准的概率为0.9,X的可能取值为0,1,2,3;P(X=k)= ?(1﹣0.9)3﹣k?0.9k , 可得P(X=0)=0.001,P(X=1)=0.027,P(X=2)=0.243,P(X=3)=0.729;X的分布列为:
X
0
1
2
3
P
0.001
0.027
0.243
0.729
【考点】频率分布直方图,离散型随机变量及其分布列
【解析】【分析】(1)(1)①估计频率和为1求出a的值;②利用频率分布直方图求出年平均浓度,与35比较即可得出结论;(2)由题意得PM2.5的24小时平均浓度符合环境空气质量标准的概率为0.9,X的可能取值为0,1,2,3;计算P(X=k)= ?0.13﹣k?0.9k , 写出分布列.
【变式训练1】(2017云南保山腾冲八中一模)根据微信同程旅游的调查统计显示,参与网上购票的1000位购票者的年龄(单位:岁)情况如图所示.
(1)已知中间三个年龄段的网上购票人数成等差数列,求a,b的值;
(2)为鼓励大家网上购票,该平台常采用购票就发放酒店入住代金券的方法进行促销,具体做法如下:年龄在[30,50)岁的每人发放20元,其余年龄段的每人发放50元,先按发放代金券的金额采用分层抽样的方式从参与调查的1000位网上购票者中抽取5人,并在这5人中随机抽取3人进行回访调查,求此3人获得代金券的金额总和为90元的概率.
考点二 茎叶图的应用
【例题2】(2017山东莱芜二模)已知函数 ,现有一组数据(数据量较大),从中随机抽取10个,绘制所得的茎叶图如图所示,且茎叶图中的数据的平均数为2.(茎叶图中的数据均为小数,其中茎为整数部分,叶为小数部分)
(Ⅰ)现从茎叶图的数据中任取4个数据分别替换m的值,求至少有2个数据使得函数f(x)没有零点的概率;(Ⅱ)以频率估计概率,若从该组数据中随机抽取4个数据分别替换m的值,记使得函数f(x)没有零点的个数为ξ,求ξ的分布列及数学期望.
【答案】解:(Ⅰ)根据茎叶图中的数据,计算平均数为 = ×(0.3+0.1×a+0.5+1.4+1.9+1.8+2.3+3.2+3.4+4.5)=2,解得a=7;从茎叶图10个数据中任取4个,有 =210种不同的取法;函数f(x)=x2+ 中,△=2(m﹣1)2﹣m=2m2﹣5m+2,令△<0,解得 <m<2,∴满足函数f(x)没有零点的数据是0.7,1.4,1.8,1.9共4个;用抽出的4个数分别替换m的值,至少有2个数据使得函数f(x)没有零点的概率为P=1﹣ ﹣ = ;(Ⅱ)满足函数f(x)没有零点的数据有4个,∴ξ的所有可能取值分别为0,1,2,3,4;则P(ξ=0)= = ,P(ξ=1)= = ,P(ξ=2)= = ,P(ξ=3)= = ,P(ξ=4)= = ;∴ξ的分布列为:
ξ
0
1
2
3
4
P
??
??
??
??
??
数学期望为Eξ=0× +1× +2× +3× +4× = =1.6
【考点】茎叶图,离散型随机变量及其分布列,离散型随机变量的期望与方差
【解析】【分析】(Ⅰ)根据茎叶图中的数据,利用平均数的定义列方程求出a的值;利用判别式△<0求出函数f(x)没有零点时m的取值范围,再利用对立事件的概率公式计算所求的概率值;(Ⅱ)根据题意知ξ的所有可能取值,求出对应的概率,写出ξ的分布列,计算数学期望值.21·cn·jy·com
【变式训练2】(安徽蚌埠2016-2017三模)当今信息时代,众多中小学生也配上了手机.某机构为研究经常使用手机是否对学习成绩有影响,在某校高三年级50名理科生第人的10次数学考成绩中随机抽取一次成绩,用茎叶图表示如图:
(1)根据茎叶图中的数据完成下面的2×2列联表,并判断是否有95%的把握认为经常使用手机对学习成绩有影响?
及格(60及60以上)
不及格
合计
很少使用手机
经常使用手机
合计
(2)从50人中,选取一名很少使用手机的同学(记为甲)和一名经常使用手机的同学(记为乙)解一道函数题,甲、乙独立解决此题的概率分别为P1 , P2 , P2=0.4,若P1﹣P2≥0.3,则此二人适合为学习上互帮互助的“对子”,记X为两人中解决此题的人数,若E(X)=1.12,问两人是否适合结为“对子”? 参考公式及数据: ,其中n=a+b+c+d21*cnjy*com
P(K2≥k0)
0.10
0.05
0.025
k0
2.706
3.841
5.024
考点三 样本的数字特征
【例题3】(2017山东莱芜二模)某产品的三个质量指标分别为x,y,z,用综合指标S=x+y+z评价该产品的等级.若S≤4,则该产品为一等品.现从一批该产品中,随机抽取10件产品作为样本,其质量指标列表如下:
产品编号
A1
A2
A3
A4
A5
质量指标(x,y,z)
(1,1,2)
(2,1,1)
(2,2,2)
(1,1,1)
(1,2,1)
产品编号
A6
A7
A8
A9
A10
质量指标(x,y,z)
(1,2,2)
(2,1,1)
(2,2,1)
(1,1,1)
(2,1,2)
(Ⅰ)利用上表提供的样本数据估计该批产品的一等品率;(Ⅱ)在该样品的一等品中,随机抽取2件产品,(i)用产品编号列出所有可能的结果;(ii)设事件B为“在取出的2件产品中,每件产品的综合指标S都等于4”,求事件B发生的概率.
【答案】解:(Ⅰ)计算10件产品的综合指标S,如下表:
产品编号
A1
A2
A3
A4
A5
A6
A7
A8
A9
A10
S
4
4
6
3
4
5
4
5
3
5
其中S≤4的有A1 , A2 , A4 , A5 , A7 , A9共6件,故样本的一等品率为.从而可估计该批产品的一等品率为0.6;(Ⅱ)(i)在该样本的一等品种,随机抽取2件产品的所有可能结果为{A1 , A2},{A1 , A4},{A1 , A5},{A1 , A7},{A1 , A9},{A2 , A4},{A2 , A5},{A2 , A7},{A2 , A9},{A4 , A5},{A4 , A7},{A4 , A9},{A5 , A7},{A5 , A9},{A7 , A9}共15种.(ii)在该样本的一等品种,综合指标S等于4的产品编号分别为A1 , A2 , A5 , A7 . 则事件B发生的所有可能结果为{A1 , A2},{A1 , A5},{A1 , A7},{A2 , A5},{A2 , A7},{A5 , A7},共6种.所以p(B)=. 【来源:21cnj*y.co*m】
【考点】用样本的数字特征估计总体的数字特征,古典概型及其概率计算公式
【分析】(Ⅰ)用综合指标S=x+y+z计算出10件产品的综合指标并列表表示,则样本的一等品率可求;?????????? ? (Ⅱ)(i)直接用列举法列出在该样品的一等品中,随机抽取2件产品的所有等可能结果;?? ? ? ? ? (ii)列出在取出的2件产品中,每件产品的综合指标S都等于4的所有情况,然后利用古典概型概率计算公式求解.
【变式训练3】某城市100户居民的月平均用电量(单位:度)以[160,180),[180,200),[200,220),[220,240)[240,260),[260,280),[280,300]分组的频率分布直方图如图(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则越平均用电量在[220,240)的用户中应抽取多少户?
真题精析
一、单选题
1.(2013?辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是(?? ) 21教育网
A.?45????????????????????????????????????????B.?50????????????????????????????????????????C.?55???????????????????????????????????????D.?60
2.(2014?山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(?? )
A.?6??????????????????????????????????????????B.?8??????????????????????????????????????????C.?12??????????????????????????????????????????D.?18
3.(2014?广东)已知某地区中小学学生的近视情况分布如图1和图2所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为(?? )
A.?200,20????????????????????????????B.?100,20????????????????????????????C.?200,10????????????????????????????D.?100,10
4.(2013?福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为(?? )
A.?588??????????????????????????????????????B.?480??????????????????????????????????????C.?450??????????????????????????????????????D.?120
5.(2016?山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
A.?56???????????????????????????????????????B.?60???????????????????????????????????????C.?120??????????????????????????????????????D.?140
6.(2017·山东)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
A.?3,5???????????????????????????????????B.?5,5???????????????????????????????????C.?3,7???????????????????????????????????D.?5,7
7.(2013?重庆)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为(?? ) 【版权所有:21教育】
A.?2,5???????????????????????????????????B.?5,5???????????????????????????????????C.?5,8???????????????????????????????????D.?8,8
8.(2015·湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)如图I所示 若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数为(??? )
A.?3??????????????????????????????????????????B.?4??????????????????????????????????????????C.?5??????????????????????????????????????????D.?6
9.(2015·湖北)我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254内夹谷28粒,则这批米内夹谷约为(???)
A.?134石???????????????????????B.?169石 ??????????????????????C.?338石??????????????????????????????D.?1365石
二、填空题
10.(2014?江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm.
11.(2013?湖北)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示: (Ⅰ)直方图中x的值为________;(Ⅱ)在这些用户中,用电量落在区间[100,250)内的户数为________.
三、综合题
12.(2013?新课标Ⅱ)经销商经销某种农产品,在一个销售季度内,每售出1t该产品获利润500元,未售出的产品,每1t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130t该农产品.以x(单位:t,100≤x≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润.
(1)将T表示为x的函数;
(2)根据直方图估计利润T不少于57000元的概率;
(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,并以需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若x∈[100,110))则取x=105,且x=105的概率等于需求量落入[100,110)的频率,求T的数学期望.
13.(2013?广东)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.
(1)根据茎叶图计算样本均值;
(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?
(3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率.
14.(2015新课标II)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度平分如下:A地区:62? 73? 81? 92? 95? 85? 74? 64? 53? 76???????????? 78? 86 ?95? 66? 97? 78? 88? 82? 76? 89B地区:73? 83? 62? 51? 91? 46? 53? 73? 64? 82??????????? 93? 48? 65? 81? 74? 56? 54? 76? 65? 79
(1)(I)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可)
(2)(II)根据用户满意度评分,将用户的满意度从低到高分为三个等级:
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
记时间C:“A地区用户的满意度等级高于B地区用户的满意度等级”,假设两地区用户的评价结果相互独立。根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率。
15.(2016?四川)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5)分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.
16.(2017?北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…[80,90],并整理得到如下频率分布直方图: (Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
17.(2017?新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下: (Ⅰ)记A表示时间“旧养殖法的箱产量低于50kg”,估计A的概率;(Ⅱ)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50kg
箱产量≥50kg
旧养殖法
新养殖法
(Ⅲ)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.附:
P(K2≥K)
0.050
0.010
0.001
K
3.841
6.635
10.828
K2= .
18.(2017?新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图: (Ⅰ)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;(Ⅱ)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50kg????????
???????? 箱产量≥50kg
旧养殖法
?????????
? 新养殖法
??????????
(Ⅲ)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:
P(K2≥k)??
0.050
0.010??????????
0.001???????????
K
3.841?????
6.635????
10.828???
K2= .
19.(2017?新课标Ⅰ卷)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).(12分)
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ﹣3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望; 21教育名师原创作品
(2)一天内抽检零件中,如果出现了尺寸在(μ﹣3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)试说明上述监控生产过程方法的合理性;(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得 = =9.97,s= = ≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.用样本平均数 作为μ的估计值 ,用样本标准差s作为σ的估计值 ,利用估计值判断是否需对当天的生产过程进行检查?剔除( ﹣3 +3 )之外的数据,用剩下的数据估计μ和σ(精确到0.01).附:若随机变量Z服从正态分布N(μ,σ2),则P(μ﹣3σ<Z<μ+3σ)=0.9974,0.997416≈0.9592, ≈0.09.
模拟题精练
一、单选题
1.(2017四川成都实验中学一模)利用计算机产生120个随机正整数,其最高位数字(如:34的最高位数字为3,567的最高位数字为5)的频数分布图如图所示,若从这120个正整数中任意取出一个,设其最高位数字为d(d=1,2,…,9)的概率为P,下列选项中,最能反映P与d的关系的是(?? )
A.?P=lg(1+ )????????????????????B.?P= ???????????????????C.?P= ??????????????????????D.?P= ×
2.(2017陕西延安黄陵中学高考考前模拟)如图所示茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为17,乙组数据的平均数为17.4,则x、y的值分别为(?? )
A.?7、8????????????????????????????????????B.?5、7????????????????????????????????????C.?8、5????????????????????????????????????D.?7、7
3.(北京丰台2016-2017学年二模)某校高一1班、2班分别有10人和8人骑自行车上学,他们每天骑行路程(单位:千米)的茎叶图如图所示:则1班10人每天骑行路程的极差和2班8人每天骑行路程的中位数分别是(?? )
A.?14,9.5?????????????????????????????????B.?9,9?????????????????????????????????C.?9,10?????????????????????????????????D.?14,9
(2017山西省名校押题卷)为了解甲、乙两厂产品的质量,从甲厂生产的产品中随机抽取3件样品,从乙厂生产的产品中随机抽取4件样品,测量产品中某种元素的含量(单位:毫克),如图是测量数据的茎叶图.若它们的中位数相同,平均数也相同,则图中的m,n的比值 =(?? )
A.?1??????????????????????????????????????????B.???????????????????????????????????????????C.???????????????????????????????????????????D.?
5.(2017全国100所名校冲刺卷)2017年3月2日至16日,全国两会在北京召开,甲、乙两市近5年与会代表名额数统计如图所示,设甲、乙的数据平均数分别为 , ,中位数分别为y1 , y2 , 则(?? )
A.?> ,y1>y2??????????B.?> ,y1=y2??????????C.?< ,y1=y2??????????D.?< ,y1<y2
6.(2017山东青岛二模)一个公司有8名员工,其中6名员工的月工资分别为5200,5300,5500,6100,6500,6600,另两名员工数据不清楚,那么8位员工月工资的中位数不可能是(?? )
A.?5800???????????????????????????????????B.?6000???????????????????????????????????C.?6200???????????????????????????????????D.?6400
7.(辽宁辽南2017年一模)设样本数据x1 , x2 , …,x10的均值和方差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,10),则y1 , y2 , …,y10的均值和方差分别为( )
A.?1+a,4??????????????????????????????B.?1+a,4+a??????????????????????????????C.?1,4??????????????????????????????D.?1,4+a
8.(2017黑龙江鸡西虎林模拟)一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{an},若a3=8,且a1 , a3 , a7成等比数列,则此样本的平均数和中位数分别是(?? )
A.?13,12??????????????????????????????B.?13,13??????????????????????????????C.?12,13??????????????????????????????D.?13,14
9.(2017甘肃张掖高台一中四模)一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{an},若a3=8,且a1 , a3 , a7成等比数列,则此样本的平均数和中位数分别是(?? )
A.?13,12??????????????????????????????B.?13,13??????????????????????????????C.?12,13??????????????????????????????D.?13,14
10.(2017广西柳州、钦州一模试)甲、乙、丙三名同学6次数学测试成绩及班级平均分(单位:分)如表:
第一次
第二次
第三次
第四次
第五次
第六次
甲
95
87
92
93
87
94
乙
88
80
85
78
86
72
丙
69
63
71
71
74
74
全班
88
82
81
80
75
77
下列说法错误的是(?? )
A.?甲同学的数学学习成绩高于班级平均水平,且较稳定B.?乙同学的数学成绩平均值是81.5C.?丙同学的数学学习成绩低于班级平均水平D.?在6次测验中,每一次成绩都是甲第一、乙第二、丙第三www.21-cn-jy.com
(北京海淀2016-2017二模)北京市2016年12个月的PM2.5平均浓度指数如图所示.由图判断,四个季度中PM2.5的平均浓度指数方差最小的是(?? )21·世纪*教育网
A.?第一季度????????????????????????B.?第二季度????????????????????????C.?第三季度?????????????????????????D.?第四季度www-2-1-cnjy-com
12.(2017山东k12教育打靶卷)若x1 , x2 , …,x2017的平均数为4,标准差为3,且yi=﹣3(xi﹣2),i=x1 , x2 , …,x2017 , 则新数据y1 , y2 , …,y2017的平均数和标准差分别为(?? ) 21*cnjy*com
A.?﹣6???? 9??????????????????????B.?﹣6??? 27?????????????????????????C.?﹣12??? 9????????????????????????D.?﹣12??? 27
13.(2017四川成都实验中学一模)一个样本a,3,5,7的平均数是b,且a,b分别是数列{2n﹣2}(n∈N*)的第2项和第4项,则这个样本的方差是(?? )
A.?3??????????????????????????????????????B.?4????????????????????????????????????????C.?5???????????????????????????????????????D.?6
14.(2017河北衡水中学猜题卷)某样本中共有5个个体,其中四个值分别为0,1,2,3,第五个值丢失,但该样本的平均值为1,则样本方差为(?? )
A.?2????????????????????????????????????????B.????????????????????????????????????????C.???????????????????????????????????D.?
15.(2017内蒙古包头十校联考模拟)在某中学举行的环保知识竞赛中,将三个年级参赛的学生的成绩进行整理后分为5组,绘制出如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是(?? )
A.?15???????????????????????????????????????B.?18?????????????????????????????????????C.?20???????????????????????????????????????D.?25
16.为了估计某水池中鱼的尾数,先从水池中捕出2000尾鱼,并给每尾鱼做上标记(不影响存活),然后放回水池,经过适当的时间,再从水池中捕出500尾鱼,其中有标记的鱼为40尾,根据上述数据估计该水池中鱼的尾数为(????)
A.?10000????????????????????????????????B.?20000????????????????????????????????C.?25000????????????????????????????????D.?30000
二、填空题
17.(2017天津南开模拟)某人5次下班途中所花的时间(单位:分钟)分别为m,n,5,6,4.已知这组数据的平均数为5,方差为2,则|m﹣n|的值为________.
18.(2017浙江宁波十校联考模拟)定义:函数f(x)在闭区间[a,b]上的最大值与最小值之差为函数f(x)的极差,若定义在区间[﹣2b,3b﹣1]上的函数f(x)=x3﹣ax2﹣(b+2)x是奇函数,则a+b=________,函数f(x)的极差为________.
三、解答题
19.(2017四川成都实验高级中学一模)某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[40,50),[50,60),…,[80,90),[90,100].
(Ⅰ)求频率分布直方图中a的值;(Ⅱ)估计该企业的职工对该部门评分不低于80的概率;(Ⅲ)从评分在[40,60)的受访职工中,随机抽取2人,求此2人的评分都在[40,50)的概率.
20.(2017青海西宁二模)为选拔选手参加“中国汉字听写大全”,某中学举行了一次“汉字听写大赛”活动.为了了解本次竞赛学生的成绩情况,从中抽取了部分学生的分数作为样本(样本容量为n)进行统计.按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出频率分布直方图,并作出样本分数的茎叶图(图中仅列出了得分在[50,60),[90,100]的数据).
(Ⅰ)求样本容量n和频率分布直方图中的x、y的值;(Ⅱ)在选取的样本中,从竞赛成绩在80分以上(含80分)的学生中随机抽取2名学生参加“中国汉字听写大会”,每次抽取1人,求在第1次抽取的成绩低于90分的前提下,第2次抽取的成绩仍低于90分的概率.
21.(2017四川成都实验中学一模)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
质量指标值分组
[75,85)
[85,95)
[95,105)
[105,115)
[115,125)
频数
6
26
38
22
8
(1)作出这些数据的频数分布直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中间值来代表这种产品质量的指标值); 【出处:21教育名师】
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的85%”的规定?
22.(2017山西太原三模)网购是当前民众购物的新方式,某公司为改进营销方式,随机调查了100名市民,统计其周平均网购的次数,并整理得到如下的频数分布直方图.这100名市民中,年龄不超过40岁的有65人将所抽样本中周平均网购次数不小于4次的市民称为网购迷,且已知其中有5名市民的年龄超过40岁.
(1)根据已知条件完成下面的2×2列联表,能否在犯错误的概率不超过0.10的前提下认为网购迷与年龄不超过40岁有关?
网购迷
非网购迷
合计
年龄不超过40岁
________??
________
________
年龄超过40岁
________
________
________
合计
________
________
________
(2)若从网购迷中任意选取2名,求其中年龄丑啊过40岁的市民人数ξ的分布列与期望. 附: ;
P(K2≥k0)
0.15
0.10
0.05
0.01
k0
2.072
2.706
3.841
6.635
23.(2016-2017辽宁营口大石桥二中模拟)某市为增强市民的环境保护意识,面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45],得到的频率分布直方图如图所示. 2·1·c·n·j·y
(1)若从第3,4,5组中用分层抽样的方法抽取6名志愿者参广场的宣传活动,应从第3,4,5组各抽取多少名志愿者? 2-1-c-n-j-y
(2)在(1)的条件下,该市决定在第3,4组的志愿者中随机抽取2名志愿者介绍宣传经验,求第4组至少有一名志愿者被抽中的概率.
24.(福建泉州2016-2017适应性卷)据统计,某物流公司每天的业务中,从甲地到乙地的可配送的货物量X(40≤X<200,单位:件)的频率分布直方图,如图所示,将频率视为概率,回答以下问题.
(1)求该物流公司每天从甲地到乙地平均可配送的货物量;
(2)该物流公司拟购置货车专门运营从甲地到乙地的货物,一辆货车每天只能运营一趟,每辆车每 趟最多只能装载40 件货物,满载发车,否则不发车.若发车,则每辆车每趟可获利1000 元;若未发车,则每辆车每天平均亏损200 元.为使该物流公司此项业务的营业利润最大,该物流公司应该购置几辆货车?
25.(2017重庆渝中区巴蜀中学三诊)渝州集团对所有员工进行了职业技能测试从甲、乙两部门中各任选10名员工的测试成绩(单位:分)数据的茎叶图如图所示.
(1)若公司决定测试成绩高于85分的员工获得“职业技能好能手”称号,求从这20名员工中任选三人,其中恰有两人获得“职业技能好能手”的概率;
(2)公司结合这次测试成绩对员工的绩效奖金进行调整(绩效奖金方案如表),若以甲部门这10人的样本数据来估计该部门总体数据,且以频率估计概率,从甲部门所有员工中任选3名员工,记绩效奖金不小于3a的人数为ξ,求ξ的分布列及数学期望.
?分数
[60,70)
[70,80)
[80,90)
[90,100]
?奖金
?a
?2a
?3a
?4a
26.(2017重庆预测卷)某高中学校为了了解在校学生的身体健康状况,从全校学生中,随机抽取12名进行体质健康测试,测试成绩(百分制)以茎叶图形式表示如图:
(1)将频率视为概率,根据样本估计总体的思想,在该校学生中任选3人进行体质健康测试,求至少有1人成绩是“优良”的概率;
(2)从抽取的12人中随机选取3人,记ξ表示成绩“优良”的学生人数,求ξ的分布列及期望.
27.(2017安徽蚌埠二模)某学校高一、高二、高三三个年级共有300名教师,为调查他们的备课时间情况,通过分层抽样获得了20名教师一周的备课时间,数据如下表(单位:小时):
高一年级
7
7.5
8
8.5
9
高二年级
7
8
9
10
11
12
13
高三年级
6
6.5
7
8.5
11
13.5
17
18.5
(1)试估计该校高三年级的教师人数;
(2)从高一年级和高二年级抽出的教师中,各随机选取一人,高一年级选出的人记为甲,高二年级选出的人记为乙,假设所有教师的备课时间相对独立,求该周甲的备课时间不比乙的备课时间长的概率; 21世纪教育网版权所有
(3)再从高一、高二、高三三个年级中各随机抽取一名教师,他们该周的备课时间分别是8、9、10(单位:小时),这三个数据与表格中的数据构成的新样本的平均数记为 ,表格中的数据平均数记为 ,试判断 与 的大小.(结论不要求证明)
28.(2017押题预测卷 )“中国人均读书4.3本(包括网络文学和教科书),比韩国的11本、法国的20本、日本的40本、犹太人的64本少得多,是世界上人均读书最少的国家.”这个论断被各种媒体反复引用.出现这样的统计结果无疑是令人尴尬的,而且和其他国家相比,我国国民的阅读量如此之低,也和我国是传统的文明古国、礼仪之邦的地位不相符.某小区为了提高小区内人员的读书兴趣,特举办读书活动,准备进一定量的书籍丰富小区图书站,由于不同年龄段需看不同类型的书籍,为了合理配备资源,现对小区内看书人员进行年龄调查,随机抽取了一天 名读书者进行调查,将他们的年龄分成6段: , , , , , 后得到如图所示的频率分布直方图.问:21cnjy.com
(1)估计在40名读书者中年龄分布在 的人数;
(2)求40名读书者年龄的平均数和中位数;
(3)若从年龄在 的读书者中任取2名,求这两名读书者年龄在 的人数 的分布列及数学期望.
2018年高考数学一轮复习真题精讲精练(2013-2017):
9.2 用样本估计总体(答案)
知识回顾
1.频率分布直方图
(2)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.
(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比.
(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.
2.用样本的数字特征估计总体的数字特征
(1)众数、中位数、平均数
①众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.
②中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
③平均数:样本数据的算术平均数,即=(x1+x2+…+xn).在频率分布直方图中,中位数左边和右边的直方图的面积相等.
(2)样本方差、标准差
标准差s= .
其中xn是样本数据的第n项,n是样本容量,是平均数.
标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.
精讲方法
一、用样本估计总体
(一)频率分布直方图在总体估计中的应用
频率分布直方图反映样本的频率分布
(1)频率分布直方图中横坐标表示组距,纵坐标表示,频率=组距×.
例题精讲
考点一 频率分布直方图的应用
【变式训练1】(2017云南保山腾冲八中一模)根据微信同程旅游的调查统计显示,参与网上购票的1000位购票者的年龄(单位:岁)情况如图所示.
(1)已知中间三个年龄段的网上购票人数成等差数列,求a,b的值;
(2)为鼓励大家网上购票,该平台常采用购票就发放酒店入住代金券的方法进行促销,具体做法如下:年龄在[30,50)岁的每人发放20元,其余年龄段的每人发放50元,先按发放代金券的金额采用分层抽样的方式从参与调查的1000位网上购票者中抽取5人,并在这5人中随机抽取3人进行回访调查,求此3人获得代金券的金额总和为90元的概率.
【答案】(1)解:由题意可得 , 解得a=0.035,b=0.025(2)解:利用分层抽样从样本中抽取5人, 其中年龄在[30,50)为3人,其余年龄段的为2人;随机抽取3人,有 =10种,此3人获得代金券的金额总和为90元,则需要2个20元和1个50元,有 ? =6种,所以此3人获得代金券的金额总和为90元的概率为P= =0.6
【考点】频率分布直方图,列举法计算基本事件数及事件发生的概率
【解析】【分析】(1)频率分布直方图中,频率=组距×纵坐标及频率和为1,列方程组求解即可;(2)利用分层抽样原理得出分别抽取的人数,根据抽取情况及代金卷总和为90元,利用古典概型概率公式求解即可.
考点二 茎叶图的应用
【变式训练2】(安徽蚌埠2016-2017三模)当今信息时代,众多中小学生也配上了手机.某机构为研究经常使用手机是否对学习成绩有影响,在某校高三年级50名理科生第人的10次数学考成绩中随机抽取一次成绩,用茎叶图表示如图:
(1)根据茎叶图中的数据完成下面的2×2列联表,并判断是否有95%的把握认为经常使用手机对学习成绩有影响?
及格(60及60以上)
不及格
合计
很少使用手机
经常使用手机
合计
(2)从50人中,选取一名很少使用手机的同学(记为甲)和一名经常使用手机的同学(记为乙)解一道函数题,甲、乙独立解决此题的概率分别为P1 , P2 , P2=0.4,若P1﹣P2≥0.3,则此二人适合为学习上互帮互助的“对子”,记X为两人中解决此题的人数,若E(X)=1.12,问两人是否适合结为“对子”? 参考公式及数据: ,其中n=a+b+c+d
P(K2≥k0)
0.10
0.05
0.025
k0
2.706
3.841
5.024
【答案】(1)解:由题意得列联表为
及格
不及格
合计
很少使用手机
20
7
27
经常使用手机
10
13
23
合计
30
20
50
由联列表可得: ,所以有95%的把握认为经常使用手机对学习有影响;(2)解:依题意:解决此题的人数X的可能取值为0,1,2, 可得X的分布列为
X
0
1
2
P
(1﹣P1)(1﹣P2)
(1﹣P1)P1+P2(1﹣P2)
P1?P2
数学期望为E(X)=P1+P2=1.12,∴P1=1.12﹣0.4=0.72,∴P1﹣P2=0.32≥0.3,所以二人适合结为“对子”.
【考点】茎叶图,独立性检验的应用
【解析】【分析】(1)由题意计算对应数据,填写列联表,由联列表中数据计算K2 , 对照临界值得出结论;(2)依题意知X的可能取值,写出X的分布列,计算数学期望,求出P1的值,从而得出结论.
考点三 样本的数字特征
【变式训练3】某城市100户居民的月平均用电量(单位:度)以[160,180),[180,200),[200,220),[220,240)[240,260),[260,280),[280,300]分组的频率分布直方图如图(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则越平均用电量在[220,240)的用户中应抽取多少户?
【答案】解:(1)由直方图的性质可得(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1,解方程可得x=0.0075,∴直方图中x的值为0.0075;(2)月平均用电量的众数是=230,∵(0.002+0.0095+0.011)×20=0.45<0.5,∴月平均用电量的中位数在[220,240)内,设中位数为a,由(0.002+0.0095+0.011)×20+0.0125×(a﹣220)=0.5可得a=224,∴月平均用电量的中位数为224;(3)月平均用电量为[220,240)的用户有0.0125×20×100=25,月平均用电量为[240,260)的用户有0.0075×20×100=15,月平均用电量为[260,280)的用户有0.005×20×100=10,月平均用电量为[280,300)的用户有0.0025×20×100=5,∴抽取比例为=,∴月平均用电量在[220,240)的用户中应抽取25×=5户
【考点】用样本的数字特征估计总体的数字特征
【解析】【分析】(1)由直方图的性质可得(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1,解方程可得;???????????? (2)由直方图中众数为最高矩形上端的中点可得,可得中位数在[220,240)内,设中位数为a,解方程? (0.002+0.0095++0.011)×20+0.0125×(a﹣220)=0.5可得;??????????? (3)可得各段的用户分别为25,15,10,5,可得抽取比例,可得要抽取的户数。
真题精析
一、单选题
1.(2013?辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是(?? )
A.?45?????????????????????????????????????????B.?50?????????????????????????????????????????C.?55?????????????????????????????????????????D.?60
【答案】B
【考点】频率分布直方图
【解析】【解答】解:∵成绩低于60分有第一、二组数据, 在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20,则成绩低于60分的频率P=(0.005+0.010)×20=0.3,又∵低于60分的人数是15人,则该班的学生人数是 =50.故选:B.【分析】由已知中的频率分布直方图,我们可以求出成绩低于60分的频率,结合已知中的低于60分的人数是15人,结合频数=频率×总体容量,即可得到总体容量.
2.(2014?山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(?? )
A.?6??????????????????????????????????????????B.?8??????????????????????????????????????????C.?12??????????????????????????????????????????D.?18
【答案】C
【考点】频率分布直方图
【解析】【解答】解:由直方图可得分布在区间第一组与第二组共有20人,分布在区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人,第三组的频率为0.36,所以第三组的人数:18人, 第三组中没有疗效的有6人,第三组中有疗效的有12人.故选:C.【分析】由频率= 以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案;
3.(2014?广东)已知某地区中小学学生的近视情况分布如图1和图2所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为(?? )
A.?200,20????????????????????????????B.?100,20????????????????????????????C.?200,10????????????????????????????D.?100,10
【答案】A
【考点】频率分布直方图
【解析】【解答】解:由图1知:总体个数为3500+2000+4500=10000, ∴样本容量=10000×2%=200,分层抽样抽取的比例为 ,∴高中生抽取的学生数为40,∴抽取的高中生近视人数为40×50%=20.故选:A.【分析】根据图1可得总体个数,根据抽取比例可得样本容量,计算分层抽样的抽取比例,求得样本中的高中学生数,再利用图2求得样本中抽取的高中学生近视人数.
4.(2013?福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为(?? ) 2·1·c·n·j·y
A.?588??????????????????????????????????????B.?480??????????????????????????????????????C.?450??????????????????????????????????????D.?120
【答案】B
【考点】频率分布直方图
【解析】【解答】解:根据频率分布直方图, 成绩不低于60(分)的频率为1﹣10×(0.005+0.015)=0.8.由于该校高一年级共有学生600人,利用样本估计总体的思想,可估计该校高一年级模块测试成绩不低于60(分)的人数为600×0.8=480人.故选B.【分析】根据频率分布直方图,成绩不低于60分的频率,然后根据频数=频率×总数可求出所求.
5.(2016?山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
A.?56???????????????????????????????????????B.?60???????????????????????????????????????C.?120??????????????????????????????????????D.?140
【答案】D
【考点】频率分布直方图
【解析】【解答】解:自习时间不少于22.5小时的频率为:(0.16+0.08+0.04)×2.5=0.7,故自习时间不少于22.5小时的频率为:0.7×200=140,故选:D【分析】根据已知中的频率分布直方图,先计算出自习时间不少于22.5小时的频率,进而可得自习时间不少于22.5小时的频数.;本题考查的知识点是频率分布直方图,难度不大,属于基础题目.
6.(2017·山东)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
A.?3,5???????????????????????????????????B.?5,5???????????????????????????????????C.?3,7???????????????????????????????????D.?5,7
【答案】A
【考点】茎叶图,众数、中位数、平均数
【解析】【解答】解:由已知中甲组数据的中位数为65,故乙组数据的中位数也为65,即y=5,则乙组数据的平均数为:66,故x=3,故选:A.【分析】由已知有中这两组数据的中位数相等,且平均值也相等,可得x,y的值.
7.(2013?重庆)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为(?? )
A.?2,5???????????????????????????????????B.?5,5???????????????????????????????????C.?5,8???????????????????????????????????D.?8,8
【答案】C
【考点】茎叶图
【解析】【解答】解:乙组数据平均数=(9+15+18+24+10+y)÷5=16.8; ∴y=8;甲组数据可排列成:9,12,10+x,24,27.所以中位数为:10+x=15,∴x=5.故选:C.【分析】求乙组数据的平均数就是把所有乙组数据加起来,再除以5.找甲组数据的中位数要把甲组数据按从小到大的顺序排列,位于最中间的一个数为中位数.据此列式求解即可.
8.(2015·湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)如图I所示 若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数为(??? )
A.?3??????????????????????????????????????????B.?4??????????????????????????????????????????C.?5??????????????????????????????????????????D.?6
【答案】B
【考点】茎叶图
【解析】【解答】根据茎叶图中的数据,得成绩在区间[139, 151]上的运动员人数是20,用系统抽样方法从35人中抽取7人,成绩在区间[139, 151]上的运动员应抽取7X=4(人):故选B.【分析】系统抽样是指当总体中个数较多时,将总体分成均衡的几部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本的抽样方法,其实质为等距抽样. 茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.缺点为不能直接反映总体的分布情况. 由数据集中情况可以估计平均数大小,再根据其分散程度可以估测方差大小.
9.(2015·湖北)我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254内夹谷28粒,则这批米内夹谷约为(???)
A.?134石???????????????????????B.?169石 ??????????????????????C.?338石??????????????????????????????D.?1365石
【答案】B
【考点】用样本的频率分布估计总体分布,用样本的数字特征估计总体的数字特征,随机抽样和样本估计总体的实际应用 21世纪教育网版权所有
【解析】?【解答】依题意,这批米内夹谷约为石,选B.?【点评】《九章算术》是中国古代第一部数学专著,是算经十书中最重要的一种.该书内容十分丰富,系统总结了战国、秦、汉时期的数学成就.本题“米谷粒分”是我们统计中的用样本估计总体问题.
二、填空题
10.(2014?江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm.
【答案】24
【考点】频率分布直方图
【解析】【解答】解:由频率分布直方图知:底部周长小于100cm的频率为(0.015+0.025)×10=0.4, ∴底部周长小于100cm的频数为60×0.4=24(株).故答案为:24.【分析】根据频率=小矩形的面积=小矩形的高×组距底部求出周长小于100cm的频率,再根据频数=样本容量×频率求出底部周长小于100cm的频数.
11.(2013?湖北)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示: (Ⅰ)直方图中x的值为________;(Ⅱ)在这些用户中,用电量落在区间[100,250)内的户数为________.
【答案】0.0044;70
【考点】频率分布直方图
【解析】【解答】解:(Ⅰ)依题意及频率分布直方图知,0.0024×50+0.0036×50+0.0060×50+x×50+0.0024×50+0.0012×50=1,解得x=0.0044.(II)样本数据落在[100,150)内的频率为0.0036×50=0.18,样本数据落在[150,200)内的频率为0.006×50=0.3.样本数据落在[200,250)内的频率为0.0044×50=0.22,故在这些用户中,用电量落在区间[100,250)内的户数为(0.18+0.30+0.22)×100=70.故答案为:0.0044;70.
三、综合题
12.(2013?新课标Ⅱ)经销商经销某种农产品,在一个销售季度内,每售出1t该产品获利润500元,未售出的产品,每1t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130t该农产品.以x(单位:t,100≤x≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润.
(1)将T表示为x的函数;
(2)根据直方图估计利润T不少于57000元的概率;
(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,并以需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若x∈[100,110))则取x=105,且x=105的概率等于需求量落入[100,110)的频率,求T的数学期望.
【答案】(1)解:由题意得,当x∈[100,130)时,T=500x﹣300(130﹣x)=800x﹣39000, 当x∈[130,150)时,T=500×130=65000,∴T= .(2)解:由(1)知,利润T不少于57000元,当且仅当120≤x≤150. 由直方图知需求量X∈[120,150]的频率为0.7,所以下一个销售季度的利润T不少于57000元的概率的估计值为0.7.(3)解:依题意可得T的分布列如图,
T
45000
53000
61000
65000
p
0.1
0.2
0.3
0.4
所以ET=45000×0.1+53000×0.2+61000×0.3+65000×0.4=59400.
【考点】频率分布直方图,用样本的频率分布估计总体分布,离散型随机变量的期望与方差
【解析】【分析】(1)由题意先分段写出,当x∈[100,130)时,当x∈[130,150)时,和利润值,最后利用分段函数的形式进行综合即可.(2)由(1)知,利润T不少于57000元,当且仅当120≤x≤150.再由直方图知需求量X∈[120,150]的频率为0.7,利用样本估计总体的方法得出下一个销售季度的利润T不少于57000元的概率的估计值.(3)利用利润T的数学期望=各组的区间中点值×该区间的频率之和即得.
13.(2013?广东)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.
(1)根据茎叶图计算样本均值;
(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?
(3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率.
【答案】(1)解:样本均值为 (2)解:抽取的6名工人中有2名为优秀工人,所以12名工人中有4名优秀工人(3)解:设“从该车间12名工人中,任取2人,恰有1名优秀工人”为事件A, 所以 ,即恰有1名优秀工人的概率为
【考点】茎叶图,众数、中位数、平均数,古典概型及其概率计算公式
【解析】【分析】(1)茎叶图中共同的数字是数字的十位,这是解决本题的突破口,根据所给的茎叶图数据,代入平均数公式求出结果;(2)先由(1)求得的平均数,再利用比例关系即可推断该车间12名工人中有几名优秀工人的人数;(3)设“从该车间12名工人中,任取2人,恰有1名优秀工人”为事件A,结合组合数利用概率的计算公式即可求解事件A的概率.
14.(2015新课标II)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度平分如下:A地区:62? 73? 81? 92? 95? 85? 74? 64? 53? 76???????????? 78? 86 ?95? 66? 97? 78? 88? 82? 76? 89B地区:73? 83? 62? 51? 91? 46? 53? 73? 64? 82??????????? 93? 48? 65? 81? 74? 56? 54? 76? 65? 79
(1)(I)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可)
(2)(II)根据用户满意度评分,将用户的满意度从低到高分为三个等级:
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
记时间C:“A地区用户的满意度等级高于B地区用户的满意度等级”,假设两地区用户的评价结果相互独立。根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率。
【答案】(1)(Ⅰ)两地区用户满意度评分的茎叶图如下 通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)故P(C)=x+x=0.48
【考点】茎叶图,互斥事件与对立事件,相互独立事件
【解析】【解答】(II)记CA1表示事件:“A地区用户满意度等级为满意或非常满意”CA2表示事件:“A地区用户满意度等级为非常满意”CB1表示事件:“B地区用户满意度等级为不满意”CB2表示事件:“B地区用户满意度等级为满意”则CA1与CB1独立,CA2与CB2独立,CB1与CB2互斥,C=CB1CA1CB2CA2P(C)=P(CB1CA1CB2CA2)=P(CB1CA1)+P(CB2CA2)=P(CB1)P(CA1)+P(CB2)P(CA2)由所给数据得CA1 , CA2,CB1,CB2发生的概率为,,,,故P(CA1)=,P(CA2)=,P(CB1)=,P(CB2)=故P(C)=x+x=0.48【分析】本题考查茎叶图、互斥事件和独立事件,根据茎叶的密集程度比较平均值大小,如果密集主干部位在高位,那么平均值大;方差看它们数字偏离程度,偏离越大则方差大.读懂所求概率事件包含的含义,利用分类讨论思想将事件分解为几个互斥的情况来求概率
15.(2016?四川)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5)分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.
【答案】(1)解:∵0.5×(0.08+0.16+0.4+0.52+0.12+0.08+0.04+2a)=1,∴a=0.3(2)解:由图可得月均用水量不低于3吨的频率为:0.5×(0.12+0.08+0.04)=0.12,由30×0.12=3.6得:全市居民中月均用水量不低于3吨的人数约为3.6万(3)解:由图可得月均用水量低于2.5吨的频率为:0.5×(0.08+0.16+0.3+0.4+0.52)=0.73<85%;月均用水量低于3吨的频率为:0.5×(0.08+0.16+0.3+0.4+0.52+0.3)=0.88>85%;则x=2.5+0.5× =2.9吨
【考点】频率分布直方图,用样本的数字特征估计总体的数字特征
【解析】【分析】(1)根据各组的累积频率为1,构造方程,可得a值;(2)由图可得月均用水量不低于3吨的频率,进而可估算出月均用水量不低于3吨的人数;(3)由图可得月均用水量低于2.5吨的频率及月均用水量低于3吨的频率,进而可得x值.本题考查的知识点是频率分布直方图,用样本估计总体,难度不大,属于基础题.
16.(2017?北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…[80,90],并整理得到如下频率分布直方图: (Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例. 21·世纪*教育网
【答案】解:(Ⅰ)由频率分布直方图知:分数小于70的频率为:1﹣(0.04+0.02)×10=0.4故从总体的400名学生中随机抽取一人,估计其分数小于70的概率为0.4;(Ⅱ)已知样本中分数小于40的学生有5人,故样本中分数小于40的频率为:0.05,则分数在区间[40,50)内的频率为:1﹣(0.04+0.02+0.02+0.01)×10﹣0.05=0.05,估计总体中分数在区间[40,50)内的人数为400×0.05=20人,(Ⅲ)样本中分数不小于70的频率为:0.6,由于样本中分数不小于70的男女生人数相等.故分数不小于70的男生的频率为:0.3,由样本中有一半男生的分数不小于70,故男生的频率为:0.6,即女生的频率为:0.4,即总体中男生和女生人数的比例约为:3:2.
【考点】频率分布直方图,用样本的频率分布估计总体分布,古典概型及其概率计算公式
【解析】【分析】(Ⅰ)根据频率=组距×高,可得分数小于70的概率为:1﹣(0.04+0.02)×10;(Ⅱ)先计算样本中分数小于40的频率,进而计算分数在区间[40,50)内的频率,可估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.进而得到答案.
17.(2017?新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下: (Ⅰ)记A表示时间“旧养殖法的箱产量低于50kg”,估计A的概率;(Ⅱ)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50kg
箱产量≥50kg
旧养殖法
新养殖法
(Ⅲ)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.附:
P(K2≥K)
0.050
0.010
0.001
K
3.841
6.635
10.828
K2= .
【答案】解:(Ⅰ)根据题意,由旧养殖法的频率分布直方图可得: P(A)=(0.012+0.014+0.024+0.034+0.040)×5=0.62;(Ⅱ)根据题意,补全列联表可得:【来源:21·世纪·教育·网】
箱产量<50kg
箱产量≥50kg
总计
旧养殖法
62
38
100
新养殖法
34
66
100
总计
96
104
200
则有K2= ≈7.853>6.635,故有99%的把握认为箱产量与养殖方法有关;(Ⅲ)由频率分布直方图可得:旧养殖法100个网箱产量的平均数 1=(27.5×0.012+32.5×0.014+37.5×0.024+42.5×0.034+47.5×0.040+52.5×0.032+57.5×0.032+62.5×0.012+67.5×0.012)×5=5×9.42=47.1;新养殖法100个网箱产量的平均数 2=(37.5×0.004+42.5×0.020+47.5×0.044+52.5×0.068+57.5×0.046+62.5×0.010+67.5×0.008)×5=5×10.47=52.35;比较可得: 1< 2 , 故新养殖法更加优于旧养殖法.
【考点】频率分布直方图,独立性检验,独立性检验的应用
【解析】【分析】(Ⅰ)根据题意,由旧养殖法的频率分布直方图计算可得答案; (Ⅱ)由频率分布直方图可以将列联表补全,进而计算可得K2= ≈7.853>6.635,与附表比较即可得答案;(Ⅲ)由频率分布直方图计算新旧养殖法产量的平均数,比较即可得答案.
18.(2017?新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图: (Ⅰ)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;(Ⅱ)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50kg????????
???????? 箱产量≥50kg
旧养殖法
?????????
? 新养殖法
??????????
(Ⅲ)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:
P(K2≥k)??
0.050
0.010??????????
0.001???????????
K
3.841?????
6.635????
10.828???
K2= .
【答案】解:(Ⅰ)记B表示事件“旧养殖法的箱产量低于50kg”,C表示事件“新养殖法的箱产量不低于50kg”,由P(A)=P(BC)=P(B)P(C),则旧养殖法的箱产量低于50kg:(0.012+0.014+0.024+0.034+0.040)×5=0.62,故P(B)的估计值0.62,新养殖法的箱产量不低于50kg:(0.068+0.046+0.010+0.008)×5=0.66,故P(C)的估计值为,则事件A的概率估计值为P(A)=P(B)P(C)=0.62×0.66=0.4092;∴A发生的概率为0.4092;(Ⅱ)2×2列联表:【出处:21教育名师】
?箱产量<50kg
? 箱产量≥50kg
?总计
?旧养殖法
?62
?38
?100
?新养殖法
?34
?66
?100
?总计
?96
?104
?200
则K2= ≈15.705,由15.705>6.635,∴有99%的把握认为箱产量与养殖方法有关;(Ⅲ)由题意可知:方法一: =5×(37.5×0.004+42.5×0.020+47.5×0.044+52.5×0.068+57.5×0.046+62.5×0.010+67.5×0.008),=5×10.47,=52.35(kg).新养殖法箱产量的中位数的估计值52.35(kg)方法二:由新养殖法的箱产量频率分布直方图中,箱产量低于50kg的直方图的面积:(0.004+0.020+0.044)×5=0.034,箱产量低于55kg的直方图面积为:(0.004+0.020+0.044+0.068)×5=0.68>0.5,故新养殖法产量的中位数的估计值为:50+ ≈52.35(kg),所以新养殖法箱产量的中位数的估计值52.35(kg).
【考点】频率分布直方图,用样本的数字特征估计总体的数字特征,独立性检验,相互独立事件的概率乘法公式
【解析】【分析】(Ⅰ)由题意可知:P(A)=P(BC)=P(B)P(C),分布求得发生的频率,即可求得其概率;(Ⅱ)完成2×2列联表:求得观测值,与参考值比较,即可求得有99%的把握认为箱产量与养殖方法有关:(Ⅲ)根据频率分布直方图即可求得其平均数.
19.(2017?新课标Ⅰ卷)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).(12分)
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ﹣3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ﹣3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)试说明上述监控生产过程方法的合理性;(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得 = =9.97,s= = ≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.用样本平均数 作为μ的估计值 ,用样本标准差s作为σ的估计值 ,利用估计值判断是否需对当天的生产过程进行检查?剔除( ﹣3 +3 )之外的数据,用剩下的数据估计μ和σ(精确到0.01).附:若随机变量Z服从正态分布N(μ,σ2),则P(μ﹣3σ<Z<μ+3σ)=0.9974,0.997416≈0.9592, ≈0.09. 【来源:21cnj*y.co*m】
【答案】(1)解:由题可知尺寸落在(μ﹣3σ,μ+3σ)之内的概率为0.9974,则落在(μ﹣3σ,μ+3σ)之外的概率为1﹣0.9974=0.0026,因为P(X=0)= ×(1﹣0.9974)0×0.997416≈0.9592,所以P(X≥1)=1﹣P(X=0)=0.0408,又因为X~B(16,0.0026),所以E(X)=16×0.0026=0.0416;(2)(ⅰ)由(1)知尺寸落在(μ﹣3σ,μ+3σ)之外的概率为0.0026,由正态分布知尺寸落在(μ﹣3σ,μ+3σ)之外为小概率事件,因此上述监控生产过程方法合理;(ⅱ)因为用样本平均数 作为μ的估计值 ,用样本标准差s作为σ的估计值 ,且 = =9.97,s= = ≈0.212,所以 ﹣3 =9.97﹣3×0.212=9.334, +3 =9.97+3×0.212=10.606,所以9.22?( ﹣3 +3 )=(9.334,10.606),因此需要对当天的生产过程进行检查,剔除( ﹣3 +3 )之外的数据9.22,则剩下的数据估计μ= =10.02,将剔除掉9.22后剩下的15个数据,利用方差的计算公式代入计算可知σ2≈0.008,所以σ≈0.09.
【考点】用样本的数字特征估计总体的数字特征,离散型随机变量的期望与方差,二项分布与n次独立重复试验的模型,正态分布曲线的特点及曲线所表示的意义
【解析】【分析】(1.)通过P(X=0)可求出P(X≥1)=1﹣P(X=0)=0.0408,利用二项分布的期望公式计算可得结论;(2.)(ⅰ)由(1)及知落在(μ﹣3σ,μ+3σ)之外为小概率事件可知该监控生产过程方法合理;(ⅱ)通过样本平均数 、样本标准差s估计 、 可知( ﹣3 +3 )=(9.334,10.606),进而需剔除( ﹣3 +3 )之外的数据9.22,利用公式计算即得结论.
模拟题精练
一、单选题
1.(2017四川成都实验中学一模)利用计算机产生120个随机正整数,其最高位数字(如:34的最高位数字为3,567的最高位数字为5)的频数分布图如图所示,若从这120个正整数中任意取出一个,设其最高位数字为d(d=1,2,…,9)的概率为P,下列选项中,最能反映P与d的关系的是(?? )
A.?P=lg(1+ )??????????????????????B.?P= ??????????????????????C.?P= ??????????????????D.?P= ×
【答案】A
【考点】频率分布直方图
【解析】【解答】解:当d=5时,其概率为P= = , 对于B,P= ,对于C,P=0,对于D,P= ,故B,C,D均不符合,故选:A.【分析】利用排除法,即可判断.
2.(2017陕西延安黄陵中学高考考前模拟)如图所示茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为17,乙组数据的平均数为17.4,则x、y的值分别为(?? )
A.?7、8????????????????????????????????????B.?5、7????????????????????????????????????C.?8、5????????????????????????????????????D.?7、7
【答案】D
【考点】茎叶图
【解析】【解答】解:∵组数据的中位数为17,∴x=7, ∵乙组数据的平均数为17.4,∴ (9+16+16+10+y+29)=17.4,得80+y=87,则y=7,故选:D.【分析】根据中位数和平均数的公式分别进行计算即可.
3.(北京丰台2016-2017学年二模)某校高一1班、2班分别有10人和8人骑自行车上学,他们每天骑行路程(单位:千米)的茎叶图如图所示:则1班10人每天骑行路程的极差和2班8人每天骑行路程的中位数分别是(?? )
A.?14,9.5?????????????????????????????????B.?9,9?????????????????????????????????C.?9,10?????????????????????????????????D.?14,9
【答案】A
【考点】茎叶图
【解析】【解答】解:根据茎叶图中数据,计算1班的极差为22﹣8=14; 2班的中位数为 =9.5.故选:A.【分析】根据茎叶图中的数据,计算1班的极差和2班的中位数即可.
(2017山西省名校押题卷)为了解甲、乙两厂产品的质量,从甲厂生产的产品中随机抽取3件样品,从乙厂生产的产品中随机抽取4件样品,测量产品中某种元素的含量(单位:毫克),如图是测量数据的茎叶图.若它们的中位数相同,平均数也相同,则图中的m,n的比值 =(?? )
A.?1??????????????????????????????????????????B.???????????????????????????????????????????C.???????????????????????????????????????D.?
【答案】D
【考点】茎叶图,众数、中位数、平均数
【解析】【解答】解:根据茎叶图,得; 乙的中位数是33,∴甲的中位数也是33,即m=3;甲的平均数是 = (27+39+33)=33,乙的平均数是 = (20+n+32+34+38)=33,∴n=8;∴ = .故选:D.【分析】根据茎叶图,利用中位数相等,求出m的值,利用平均数相等,求出n的值.
5.(2017全国100所名校冲刺卷)2017年3月2日至16日,全国两会在北京召开,甲、乙两市近5年与会代表名额数统计如图所示,设甲、乙的数据平均数分别为 , ,中位数分别为y1 , y2 , 则(?? )
A.?> ,y1>y2??????????B.?> ,y1=y2?????????C.?< ,y1=y2??????????D.?< ,y1<y2
【答案】B
【考点】茎叶图
【解析】【解答】解:由茎叶图知甲的最高分为27,最低分为13,则 = =17.8,中位数y1=14; 由茎叶图知乙的最高分为22,最低分为10,则 = =15.4,中位数y2=14,所以 > ,y1=y2 . 故选:B.【分析】根据茎叶图分别判断甲、乙的最高分和最低分,利用平均数公式及中位数的定义分别求出甲、乙的平均数与中位数,可得答案.
6.(2017山东青岛二模)一个公司有8名员工,其中6名员工的月工资分别为5200,5300,5500,6100,6500,6600,另两名员工数据不清楚,那么8位员工月工资的中位数不可能是(?? )
A.?5800???????????????????????????????????B.?6000???????????????????????????????????C.?6200???????????????????????????????????D.?6400
【答案】D
【考点】众数、中位数、平均数
【解析】【解答】解:∵一个公司有8名员工,其中6名员工的月工资分别为5200,5300,5500,6100,6500,6600, ∴当另外两名员工的工资都小于5300时,中位数为 =5400,当另外两名员工的工资都大于6500时,中位数为 =6300,∴8位员工月工资的中位数的取值区间为[5400,6300],∴8位员工月工资的中位数不可能是6400.故选:D.【分析】由已知能求出8位员工月工资的中位数的取值区间为[5400,6300],由此能求出结果.
7.(辽宁辽南2017年一模)设样本数据x1 , x2 , …,x10的均值和方差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,10),则y1 , y2 , …,y10的均值和方差分别为( )
A.?1+a,4??????????????????????????????B.?1+a,4+a??????????????????????????????C.?1,4????????????????????????????D.?1,4+a
【答案】A
【考点】众数、中位数、平均数,极差、方差与标准差
【解析】【解答】解:方法1:∵yi=xi+a,∴E(yi)=E(xi)+E(a)=1+a,方差D(yi)=D(xi)+E(a)=4.方法2:由题意知yi=xi+a,则 = (x1+x2+…+x10+10×a)= (x1+x2+…+x10)= +a=1+a,方差s2= [(x1+a﹣( +a)2+(x2+a﹣( +a)2+…+(x10+a﹣( +a)2]= [(x1﹣ )2+(x2﹣ )2+…+(x10﹣ )2]=s2=4.故答案为:A.【分析】记住方法1的解题公式可以减少计算量.
8.(2017黑龙江鸡西虎林模拟)一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{an},若a3=8,且a1 , a3 , a7成等比数列,则此样本的平均数和中位数分别是(?? )
A.?13,12??????????????????????????????B.?13,13??????????????????????????????C.?12,13??????????????????????????????D.?13,14
【答案】B
【考点】等差数列与等比数列的综合,众数、中位数、平均数
【解析】【解答】解:设公差为d,由a3=8,且a1 , a3 , a7成等比数列,可得64=(8﹣2d)(8+4d)=64+16d﹣8d2 , 即,0=16d﹣8d2 , 又公差不为0,解得d=2 此数列的各项分别为4,6,8,10,12,14,16,18,20,22,故样本的中位数是13,平均数是13故答案为B【分析】由题设条件,一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{an},若a3=8,且a1 , a3 , a7成等比数列,设出公差为d,用公差与a3=8表示出a1 , a7再由等比数列的性质建立方程求出公差,即可得到样本数据,再由公式求出样本的平均数和中位数【版权所有:21教育】
9.(2017甘肃张掖高台一中四模)一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{an},若a3=8,且a1 , a3 , a7成等比数列,则此样本的平均数和中位数分别是(?? )
A.?13,12??????????????????????????????B.?13,13??????????????????????????????C.?12,13????????????????????????????D.?13,14
【答案】B
【考点】等差数列与等比数列的综合,众数、中位数、平均数
【解析】【解答】解:设公差为d,由a3=8,且a1 , a3 , a7成等比数列,可得64=(8﹣2d)(8+4d)=64+16d﹣8d2 , 即,0=16d﹣8d2 , 又公差不为0,解得d=2 此数列的各项分别为4,6,8,10,12,14,16,18,20,22,故样本的中位数是13,平均数是13故答案为B【分析】由题设条件,一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{an},若a3=8,且a1 , a3 , a7成等比数列,设出公差为d,用公差与a3=8表示出a1 , a7再由等比数列的性质建立方程求出公差,即可得到样本数据,再由公式求出样本的平均数和中位数
10.(2017广西柳州、钦州一模试)甲、乙、丙三名同学6次数学测试成绩及班级平均分(单位:分)如表:
第一次
第二次
第三次
第四次
第五次
第六次
甲
95
87
92
93
87
94
乙
88
80
85
78
86
72
丙
69
63
71
71
74
74
全班
88
82
81
80
75
77
下列说法错误的是(?? )
A.?甲同学的数学学习成绩高于班级平均水平,且较稳定B.?乙同学的数学成绩平均值是81.5C.?丙同学的数学学习成绩低于班级平均水平D.?在6次测验中,每一次成绩都是甲第一、乙第二、丙第三
【答案】D
【考点】众数、中位数、平均数
【解析】【解答】解:由统计表知: 甲同学的数学学习成绩高于班级平均水平,且较稳定,故A 正确;乙同学的数学成绩平均值是: (88+80+85+78+86+72)=81.5,故B正确;丙同学的数学学习成绩低于班级平均水平,故C正确;在6次测验成绩是甲第一、丙第二、乙第三,故D错误.故选:D.【分析】由统计表利用平均数能求出结果.
(北京海淀2016-2017二模)北京市2016年12个月的PM2.5平均浓度指数如图所示.由图判断,四个季度中PM2.5的平均浓度指数方差最小的是(?? )
A.?第一季度?????????????????????????B.?第二季度?????????????????????????C.?第三季度????????????????????D.?第四季度
【答案】B
【考点】极差、方差与标准差
【解析】【解答】解:根据图中数据知,第一季度的数据是72.25,43.96,93.13; 第二季度的数据是66.5,55.25,58.67;第三季度的数据是59.36,38.67,51.6;第四季度的数据是82.09,104.6,168.05;观察得出第二季度的数据波动性最小,所以第二季度的PM2.5平均浓度指数方差最小.故选:B.【分析】根据方差是描述数据波动性大小的量,由图得出第二季度中PM2.5的平均浓度指数方差最小.
12.(2017山东k12教育打靶卷)若x1 , x2 , …,x2017的平均数为4,标准差为3,且yi=﹣3(xi﹣2),i=x1 , x2 , …,x2017 , 则新数据y1 , y2 , …,y2017的平均数和标准差分别为(?? )
A.?﹣6???? 9???????????????????????????B.?﹣6??? 27???????????????????????????C.?﹣12??? 9???????????????????????????D.?﹣12??? 27
【答案】A
【考点】极差、方差与标准差
【解析】【解答】解:x1 , x2 , …,x2017的平均数为 =4,标准差为s=3, 且yi=﹣3(xi﹣2),i=x1 , x2 , …,x2017 , ∴新数据y1 , y2 , …,y2017的平均数是 =﹣3( ﹣2)=﹣3×(4﹣2)=﹣6;方差为(﹣3)2?s2=9×32=81,标准差为 =9;综上,新数据的平均数和标准差分别为﹣6和9.故选:A.【分析】利用平均数及标准差的定义与性质即可求解.21·cn·jy·com
13.(2017四川成都实验中学一模)一个样本a,3,5,7的平均数是b,且a,b分别是数列{2n﹣2}(n∈N*)的第2项和第4项,则这个样本的方差是(?? )
A.?3???????????????????????????????????????????B.?4???????????????????????????????????????????C.?5???????????????????????????????????????????D.?6
【答案】C
【考点】极差、方差与标准差
【解析】【解答】解:∵样本a,3,5,7的平均数是b,且a,b分别是数列{2n﹣2}(n∈N*)的第2项和第4项, ∴a=22﹣2=1,b=24﹣2=4,∴S2= [(1﹣4)2+(3﹣4)2+(5﹣4)2+(7﹣4)2]=5,故选:C.【分析】由已知条件求出a=1,b=4,由此能求出S2 .
14.(2017河北衡水中学猜题卷)某样本中共有5个个体,其中四个值分别为0,1,2,3,第五个值丢失,但该样本的平均值为1,则样本方差为(?? )
A.?2????????????????????????????????????????B.?????????????????????????????????????????C.??????????????????????????????????D.?21*cnjy*com
【答案】A
【考点】极差、方差与标准差
【解析】【解答】解:设丢失的数据为a,则这组数据的平均数是 ×(a+0+1+2+3)=1,解得a=﹣1,根据方差计算公式得s2= ×[(﹣1﹣1)2+(0﹣1)2+(1﹣1)2+(2﹣1)2+(3﹣1)2]=2.故选:A.【分析】根据平均数公式先求出a,再计算它们的方差.
15.(2017内蒙古包头十校联考模拟)在某中学举行的环保知识竞赛中,将三个年级参赛的学生的成绩进行整理后分为5组,绘制出如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是(?? )
A.?15?????????????????????????????????????????B.?18?????????????????????????????????????????C.?20???????????????????????????????????????D.?25
【答案】A
【考点】用样本的数字特征估计总体的数字特征
【解析】【解答】解:根据频率分布直方图,得;第二小组的频率是0.04×10=0.4,频数是40,∴样本容量是 =100;∴成绩在80~100分的频率是(0.01+0.005)×10=0.15,对应的频数(学生人数)是100×0.15=15.故选:A.【分析】根据频率分布直方图,结合频率、频数与样本容量的关系,求出结果即可.
16.为了估计某水池中鱼的尾数,先从水池中捕出2000尾鱼,并给每尾鱼做上标记(不影响存活),然后放回水池,经过适当的时间,再从水池中捕出500尾鱼,其中有标记的鱼为40尾,根据上述数据估计该水池中鱼的尾数为(????)
A.?10000????????????????????????????????B.?20000????????????????????????????????C.?25000????????????????????????????????D.?30000
【答案】C
【考点】用样本的数字特征估计总体的数字特征
【解析】【解答】设估计该水池中鱼的尾数为, 根据题意可得, 解得。故C正确。
二、填空题
17.(2017天津南开模拟)某人5次下班途中所花的时间(单位:分钟)分别为m,n,5,6,4.已知这组数据的平均数为5,方差为2,则|m﹣n|的值为________.
【答案】4
【考点】众数、中位数、平均数,极差、方差与标准差
【解析】【解答】解:由题意可得:m+n+5+6+4=25, m+n=10,根据方差公式得(m﹣5)2+(n﹣5)2=8,设m=5+t,n=5﹣t,则2t2=8,解得t=±2,∴|m﹣n|=2|t|=4,故答案为:4.【分析】利用平均数、方差的概念列出关于m,n的方程组,解这个方程组,利用整体思想,只要求出|m﹣n|即可,故可设m=5+t,n=5﹣t,求解即可.
18.(2017浙江宁波十校联考模拟)定义:函数f(x)在闭区间[a,b]上的最大值与最小值之差为函数f(x)的极差,若定义在区间[﹣2b,3b﹣1]上的函数f(x)=x3﹣ax2﹣(b+2)x是奇函数,则a+b=________,函数f(x)的极差为________.
【答案】1;4
【考点】极差、方差与标准差
【解析】【解答】解:∵定义在区间[﹣2b,3b﹣1]上的函数f(x)=x3﹣ax2﹣(b+2)x是奇函数, ∴ ,解得a=0,b=1,∴a+b=1,∴f(x)=x3﹣3x,区间[﹣2b,3b﹣1]即为[﹣2,2].f′(x)=3x2﹣3,由f′(x)=0,得x=±1,∵f(﹣2)=(﹣2)3﹣3×(﹣2)=﹣2,f(﹣1)=(﹣1)3﹣3×(﹣1)=2,f(1)=13﹣3×1=﹣2,f(2)=23﹣3×2=2,∴f(x)max=2,f(x)min=﹣2,∴函数f(x)的极差为:2﹣(﹣2)=4.故答案为:1,4.【分析】由定义在区间[﹣2b,3b﹣1]上的函数f(x)=x3﹣ax2﹣(b+2)x是奇函数,列出方程组,能求出a=0,b=1,从而a+b=1,f(x)=x3﹣3x,由此利用导数的性质能求出函数f(x)的极差.
三、解答题
19.(2017四川成都实验高级中学一模)某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[40,50),[50,60),…,[80,90),[90,100].
(Ⅰ)求频率分布直方图中a的值;(Ⅱ)估计该企业的职工对该部门评分不低于80的概率;(Ⅲ)从评分在[40,60)的受访职工中,随机抽取2人,求此2人的评分都在[40,50)的概率.
【答案】解:(Ⅰ)因为(0.004+a+0.018+0.022×2+0.028)×10=1,所以a=0.006. (Ⅱ)由所给频率分布直方图知,50名受访职工评分不低于80的频率为(0.022+0.018)×10=0.4.所以该企业职工对该部门评分不低于80的概率的估计值为0.4.(Ⅲ)受访职工中评分在[50,60)的有:50×0.006×10=3(人),记为A1 , A2 , A3;受访职工中评分在[40,50)的有:50×0.004×10=2(人),记为B1 , B2 , 从这5名受访职工中随机抽取2人,所有可能的结果共有10种,它们是Ω={(A1 , A2),(A1 , A3),(A2 , A3),(A1 , B1),(A1 , B2),(A2 , B1),(A2 , B2),(A3 , B1),(A3 , B2),(B1 , B2)}.又因为所抽取2人的评分都在[40,50)的结果有1种,即(B1 , B2),故所求的概率为P=
【考点】频率分布直方图,列举法计算基本事件数及事件发生的概率
【解析】【分析】(Ⅰ)利用频率分布直方图中的信息,所有矩形的面积和为1,得到a;(Ⅱ)对该部门评分不低于80的即为90和100,的求出频率,估计概率;(Ⅲ)求出评分在[40,60]的受访职工和评分都在[40,50]的人数,随机抽取2人,列举法求出所有可能,利用古典概型公式解答.
20.(2017青海西宁二模)为选拔选手参加“中国汉字听写大全”,某中学举行了一次“汉字听写大赛”活动.为了了解本次竞赛学生的成绩情况,从中抽取了部分学生的分数作为样本(样本容量为n)进行统计.按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出频率分布直方图,并作出样本分数的茎叶图(图中仅列出了得分在[50,60),[90,100]的数据).
(Ⅰ)求样本容量n和频率分布直方图中的x、y的值;(Ⅱ)在选取的样本中,从竞赛成绩在80分以上(含80分)的学生中随机抽取2名学生参加“中国汉字听写大会”,每次抽取1人,求在第1次抽取的成绩低于90分的前提下,第2次抽取的成绩仍低于90分的概率.
【答案】解:(Ⅰ)由题意可知,样本容量 , , x=0.100﹣0.004﹣0.010﹣0.016﹣0.040=0.030.(Ⅱ)由题意可知,分数在[80,90)内的学生有:0.010×10×50=5人,分数在[90,100)内的学生有2人;设A={第1次抽取的成绩低于90分},B={第2次抽取的成绩仍低于90分},则 , ,∴ .
【考点】频率分布直方图,列举法计算基本事件数及事件发生的概率
【解析】【分析】(Ⅰ)由样本容量和频数频率的关系易得答案;(Ⅱ)由题意可知,分数在[80,90)内的学生有:0.010×10×50=5人,分数在[90,100)内的学生有2人,利用条件概率公式可得结论.
21.(2017四川成都实验中学一模)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
质量指标值分组
[75,85)
[85,95)
[95,105)
[105,115)
[115,125)
频数
6
26
38
22
8
(1)作出这些数据的频数分布直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中间值来代表这种产品质量的指标值);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的85%”的规定?
【答案】(1)解:由已知作出频率分布表为:
?质量指标值分组
[75,85)
[85,95)
[95,105)
[105,115)
[115,125)
?频数
?6
?26
?38
?22
?8
?频率
?0.06
?0.26
?0.38
?0.22
?0.08
由频率分布表作出这些数据的频率分布直方图为 (2)解:质量指标值的样本平均数为 = =100, 质量指标值的样本方差为s2=(﹣20)2×0.06+(﹣10)2×0.26+0×0.38+102×0.22+202×0.08=104,∴这种产品质量指标的平均数估计值为100,方差的估计值为104(3)解:依题意 =68%<80%. ∴该企业生产的这种产品不符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定
【考点】频率分布直方图
【解析】【分析】(1)由已知作出频率分布表,由此能作出作出这些数据的频率分布直方图.(2)由频率分布直方图能求出质量指标值的样本平均数及方差.(3)质量指标值不低于95的产品所占比例的估计值.由于该估计值小于0.8,故不能认为该企业生产的这种产品“质量指标值不低于95 的产品至少要占全部产品80%的规定.
22.(2017山西太原三模)网购是当前民众购物的新方式,某公司为改进营销方式,随机调查了100名市民,统计其周平均网购的次数,并整理得到如下的频数分布直方图.这100名市民中,年龄不超过40岁的有65人将所抽样本中周平均网购次数不小于4次的市民称为网购迷,且已知其中有5名市民的年龄超过40岁.
(1)根据已知条件完成下面的2×2列联表,能否在犯错误的概率不超过0.10的前提下认为网购迷与年龄不超过40岁有关?
网购迷
非网购迷
合计
年龄不超过40岁
________??
________
________
年龄超过40岁
________
________
________
合计
________
________
________
(2)若从网购迷中任意选取2名,求其中年龄丑啊过40岁的市民人数ξ的分布列与期望. 附: ;
P(K2≥k0)
0.15
0.10
0.05
0.01
k0
2.072
2.706
3.841
6.635
【答案】(1)解:20;45;65;5;30;35;25;75;100 假设网购迷与年龄不超过40岁没有关系,则 3.297>2.706,所以可以在犯错误的概率不超过0.10的前提下认为网购迷与年龄不超过40岁有关(2)解:由频率分布直方图可知,网购迷共有25名, 由题意得年龄超过40的市民人数ξ的所有取值为0,1,2,,,,∴ξ的分布列为21cnjy.com
ξ
0
1
2
P
??
??
??
数学期望值为
【考点】频率分布直方图,独立性检验的应用
【解析】【解答】解:(1)由题意可得列联表如下:
网购迷
非网购迷
合计
年龄不超过40岁
20
45
65
年龄超过40岁
5
30
35
合计
25
75
100
【分析】(1)由题意填写列联表,计算观测值,对照临界值得出结论;(2)由频率分布直方图,结合题意知ξ的所有取值,计算对应的概率,写出分布列,计算数学期望值.www.21-cn-jy.com
23.(2016-2017辽宁营口大石桥二中模拟)某市为增强市民的环境保护意识,面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45],得到的频率分布直方图如图所示. www-2-1-cnjy-com
(1)若从第3,4,5组中用分层抽样的方法抽取6名志愿者参广场的宣传活动,应从第3,4,5组各抽取多少名志愿者?
(2)在(1)的条件下,该市决定在第3,4组的志愿者中随机抽取2名志愿者介绍宣传经验,求第4组至少有一名志愿者被抽中的概率.
【答案】(1)解: 第3组的人数为0.3×100=30,第4组的人数为0.2×100=20,第5组的人数为0.1×100=10. 因为第3,4,5组共有60名志愿者,所以利用分层抽样的方法在60名志愿者中抽取6名志愿者,每组抽取的人数分别为:第3组: ×6=3; 第4组: ×6=2; 第5组: ×6=1.所以应从第3,4,5组中分别抽取3人,2人,1人;(2)解: 记第3组的3名志愿者为A1 , A2 , A3 , 第4组的2名志愿者为B1 , B2 , .则从5名志愿者中抽取2名志愿者有: (A1 , A2),(A1 , A3),(A1 , B1),(A1 , B2),(A2 , A3),(A2 , B1),(A2 , B2),(A3 , B1),(A3 , B2),(B1 , B2)共有10种.其中第4组的2名志愿者B1 , B2至少有一名志愿者被抽中的有:(A1 , B1),(A1 , B2),(A2 , B1),(A2 , B2),(A3 , B1),(A3 , B2),(B1 , B2),共有7种所以第4组至少有一名志愿者被抽中的概率为 .
【考点】频率分布直方图,等可能事件的概率
【解析】【分析】(1)先分别求出这3组的人数,再利用分层抽样的方法即可得出答案;(2)从5名志愿者中抽取2名志愿者有10种情况,其中第4组的2名志愿者B1 , B2至少有一名志愿者被抽中有7种情况,再利用古典概型的概率计算公式即可得出.
24.(福建泉州2016-2017适应性卷)据统计,某物流公司每天的业务中,从甲地到乙地的可配送的货物量X(40≤X<200,单位:件)的频率分布直方图,如图所示,将频率视为概率,回答以下问题.
(1)求该物流公司每天从甲地到乙地平均可配送的货物量;
(2)该物流公司拟购置货车专门运营从甲地到乙地的货物,一辆货车每天只能运营一趟,每辆车每 趟最多只能装载40 件货物,满载发车,否则不发车.若发车,则每辆车每趟可获利1000 元;若未发车,则每辆车每天平均亏损200 元.为使该物流公司此项业务的营业利润最大,该物流公司应该购置几辆货车?
【答案】(1)解:在区间[120,160)的频率为 , 该物流公司每天从甲地到乙地平均可配送的货物量: (2)解:从甲地到乙地的可配送货物量X在[40,80),[80,120),[120,160),[160,200)的概率分别为 . 设运输公司每天的营业利润为Y.①若购置1辆车,则Y的值为1000;②若购置2辆车,则Y的可能取值为2000,800,其分而列为
Y
2000
800
P
??
??
故 ;③若购置3辆车,则Y的可能取值为3000,1800,600,其分布列为
Y
3000
1800
600
P
??
??
??
故 ;④若购置4辆车,则Y的可能取值为4000,2800,1600,400其分布列为
Y
4000
2800
1600
400
P
??
??
??
??
故 ;因为2400>2350>1850>1000,所以为使运输公司每天的营业利润最大,该公司应购置3辆车
【考点】频率分布直方图,离散型随机变量及其分布列
【解析】【分析】(1)计算配送量X在[120,160)上的概率,使用组中值代替各小组的平均值,利用加权平均数公式计算;(2)设每天的营业利润为Y,对购置车辆数进行依次讨论,分别计算E(Y),根据E(Y)的大小关系作出结论.
25.(2017重庆渝中区巴蜀中学三诊)渝州集团对所有员工进行了职业技能测试从甲、乙两部门中各任选10名员工的测试成绩(单位:分)数据的茎叶图如图所示.
(1)若公司决定测试成绩高于85分的员工获得“职业技能好能手”称号,求从这20名员工中任选三人,其中恰有两人获得“职业技能好能手”的概率;
(2)公司结合这次测试成绩对员工的绩效奖金进行调整(绩效奖金方案如表),若以甲部门这10人的样本数据来估计该部门总体数据,且以频率估计概率,从甲部门所有员工中任选3名员工,记绩效奖金不小于3a的人数为ξ,求ξ的分布列及数学期望.
?分数
[60,70)
[70,80)
[80,90)
[90,100]
?奖金
?a
?2a
?3a
?4a
【答案】(1)解:0名员工中85(分)以上有5人, (2)解:甲部门中任选一人绩效工资不低于3a的概率为 , 所以ξ的可能取值为ξ=0,1,2,3;; ; ; ,ξ的分布列为:
ξ
0
1
2
3
P
??
??
??
??
ξ的期望为
【考点】茎叶图,离散型随机变量及其分布列,离散型随机变量的期望与方差
【解析】【分析】(1)利用古典概型的概率公式求解即可.(2)求出ξ的可能取值为ξ=0,1,2,3;求出概率,得到分布列,然后求解期望即可.
26.(2017重庆预测卷)某高中学校为了了解在校学生的身体健康状况,从全校学生中,随机抽取12名进行体质健康测试,测试成绩(百分制)以茎叶图形式表示如图:
(1)将频率视为概率,根据样本估计总体的思想,在该校学生中任选3人进行体质健康测试,求至少有1人成绩是“优良”的概率;
(2)从抽取的12人中随机选取3人,记ξ表示成绩“优良”的学生人数,求ξ的分布列及期望.
【答案】(1)解:抽取的12人中成绩是“优良”的有9人,频率是 = , 依题意知,从该校学生中任选1人,成绩是“优良”的概率为 ;设事件A表示“在该校学生中任选3人进行体质健康测试,求至少有1人成绩是优良”,则P(A)=1﹣ ? =1﹣ = ,即至少有1人成绩是“优良”的概率为 (2)解:由题意可知,ξ的可能取值为0,1,2,3; 则P(ξ=0)= = ,P(ξ=1)= = ,P(ξ=2)= = = ,P(ξ=3)= = = ;则ξ的分布列为,
ξ
0
1
2
3
P
??
??
??
??
数学期望为E(ξ)=0× +1× +2× +3× =
【考点】茎叶图,离散型随机变量的期望与方差
【解析】【分析】(1)计算抽取的12人中成绩是“优良”的频率,用频率估计概率,再用对立事件的概率公式计算所求的概率值;(2)由题意知ξ的可能取值,计算对应的概率值写出ξ的分布列,计算数学期望值.2-1-c-n-j-y
27.(2017安徽蚌埠二模)某学校高一、高二、高三三个年级共有300名教师,为调查他们的备课时间情况,通过分层抽样获得了20名教师一周的备课时间,数据如下表(单位:小时): 21*cnjy*com
高一年级
7
7.5
8
8.5
9
高二年级
7
8
9
10
11
12
13
高三年级
6
6.5
7
8.5
11
13.5
17
18.5
(1)试估计该校高三年级的教师人数;
(2)从高一年级和高二年级抽出的教师中,各随机选取一人,高一年级选出的人记为甲,高二年级选出的人记为乙,假设所有教师的备课时间相对独立,求该周甲的备课时间不比乙的备课时间长的概率; 21教育网
(3)再从高一、高二、高三三个年级中各随机抽取一名教师,他们该周的备课时间分别是8、9、10(单位:小时),这三个数据与表格中的数据构成的新样本的平均数记为 ,表格中的数据平均数记为 ,试判断 与 的大小.(结论不要求证明)
【答案】(1)解:抽出的20位教师中,来自高三年级的有8名, 根据分层抽样方法,高三年级的教师共有300× =120(人).(2)解:从高一、高二年级分别抽取一人,共有35种基本结果, 其中甲该周备课时间比乙长的结果有:(7.5,7),(8,7),(8.5,7),(8.5,8),(9,7),(9,8),共6种,故该周甲的备课时间不比乙的备课时间长的基本结果有35﹣6=29种,∴该周甲的备课时间不比乙的备课时间长的概率P= .(3)解: < 21教育名师原创作品
【考点】极差、方差与标准差,列举法计算基本事件数及事件发生的概率
【解析】【分析】(1)抽出的20位教师中,来自高三年级的有8名,根据分层抽样方法,能求出高三年级的教师共有多少人.(2)从高一、高二年级分别抽取一人,共有35种基本结果,利用列举法求出该周甲的备课时间不比乙的备课时间长的基本结果种数,由此能求出该周甲的备课时间不比乙的备课时间长的概率.(3)利用平均数定义能判断 与 的大小.
28.(2017押题预测卷 )“中国人均读书4.3本(包括网络文学和教科书),比韩国的11本、法国的20本、日本的40本、犹太人的64本少得多,是世界上人均读书最少的国家.”这个论断被各种媒体反复引用.出现这样的统计结果无疑是令人尴尬的,而且和其他国家相比,我国国民的阅读量如此之低,也和我国是传统的文明古国、礼仪之邦的地位不相符.某小区为了提高小区内人员的读书兴趣,特举办读书活动,准备进一定量的书籍丰富小区图书站,由于不同年龄段需看不同类型的书籍,为了合理配备资源,现对小区内看书人员进行年龄调查,随机抽取了一天 名读书者进行调查,将他们的年龄分成6段: , , , , , 后得到如图所示的频率分布直方图.问:
(1)估计在40名读书者中年龄分布在 的人数;
(2)求40名读书者年龄的平均数和中位数;
(3)若从年龄在 的读书者中任取2名,求这两名读书者年龄在 的人数 的分布列及数学期望.
【答案】(1)由频率分布直方图知年龄在[40,70)的频率为 ,所以 40名读书者中年龄分布在[40,70)的人数为40×0.75=30.(2)设中位数为x,则 ,解得x=55,即40名读书者年龄的中位数为55.(3)年龄在[20,30)的读书者有 人,年龄在[30,40)的读书者有0.01×10×40=4人,所以X的所有可能取值是 0,1,2. , , ,X的分布列如下:
X
0
1
2
P
数学期望
【考点】频率分布直方图,用样本的数字特征估计总体的数字特征,离散型随机变量的期望与方差,超几何分布的应用
【解析】【分析】本题主要考查频率分布直方图的识别与计算、样本的数字特征、超几何分布,随机变量的期望,以及考查识图能力、审读能力、获取信息的能力、分类讨论思想.