人教A版2019高中数学必修第二册第九章学案 Word版含解析

文档属性

名称 人教A版2019高中数学必修第二册第九章学案 Word版含解析
格式 DOC
文件大小 3.2MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2021-02-27 09:37:38

图片预览

文档简介

9.1 随机抽样
9.1.1 简单随机抽样
新课程标准 新学法解读
1.通过实例,了解简单随机抽样的含义及其解决问题的过程,掌握两种简单随机抽样方法:抽签法和随机数法. 2.会计算样本均值和总体均值,了解样本与总体的关系. 1.熟练掌握简单随机抽样的两种方法之间的差异分析与优缺点判断.
2.通过设计抽签法或随机数法完成抽样,体会简单随机抽样的必要性和重要性.
1.在简单随机抽样中,某一个个体被抽到的可能性(  )
A.与第几次抽样有关,第一次抽到的可能性最大
B.与第几次抽样有关,第一次抽到的可能性最小
C.与第几次抽样无关,每一次抽到的可能性相等
D.与第几次抽样无关,与样本量也无关
解析:选C 由简单随机抽样的定义知C正确,故选C.
2.下列调查:①每隔5年进行人口普查;②报社等进行舆论调查;③灯泡使用寿命的调查;④对入学报名者的学历检查;⑤从20台电视机中抽出3台进行质量检查,其中属于抽样调查的是(  )
A.①②③      B.②③⑤
C.②③④ D.①③⑤
解析:选B ①④属于普查,不属于抽样调查.故选B.
3.一个总体中含有100个个体,以简单随机抽样方法从该总体中抽取一个容量为5的简单随机样本,则指定的某个个体被抽到的可能性为________.
解析:因为是简单随机抽样,故每个个体被抽到的概率都相等,所以指定的某个个体被抽到的可能性为.
答案:
4.从一批零件中抽取10个零件,测得它们的长度(单位:cm)如下:
22.36 22.35 22.33 22.35 22.37 22.34 22.38
22.36 22.32 22.35
由此估计这批零件的平均长度.
在此统计活动中:
(1)总体为:________________________;
(2)个体为:________________________;
(3)样本为:________________________;
(4)样本量为:________________.
答案:(1)这批零件的长度 (2)每个零件的长度
(3)抽取的10个零件的长度 (4)10
5.一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均数为________.
解析:=≈4.55.
答案:4.55
1.简单随机抽样有如下四个特征
(1)它要求被抽取样本的总体的个数确定,且较少,个体之间差异不明显.
(2)它是从总体中逐个抽取.
(3)它是一种不放回抽取.
(4)它是一种等概率抽样.不仅每次从总体中抽取一个个体时,各个个体被抽到的概率都相等,而且在整个抽样过程中,各个个体被抽到的概率也相等,从而保证了这种抽样方法的公平性.
2.抽签法与随机数法的异同点
相同点 ①都属于简单随机抽样,并且要求被抽取样本的总体的个体数有限;
②都是从总体中逐个不放回地进行抽取
不同点 ①抽签法比随机数法操作简单;
②随机数法更适用于总体中个体数较多的时候,而抽签法适用于总体中个体数较少的情况,所以当总体中的个体数较多时,应当选用随机数法,可以节约大量的人力和制作号签的成本
3.样本平均数和总体平均数的区别与联系
平均数的意义:平均数反映一组数据的平均水平.我们把样本中所有个体的平均数称为样本平均数;把总体中所有个体的平均数称为总体平均数.随机样本的容量越大,样本平均数就越接近总体平均数.必要时,可以用样本平均数来估计总体平均数.
区别:总体平均数即为研究对象的全部的平均数(总体均值),是一个常量,而样本平均数是指从总体中抽出的一部分个体的平均数,不同样本的平均数往往是不同的,由于样本的选取是随机的,因此样本平均数(样本均值)也具有随机性.
联系:(1)大部分样本平均数离总体平均数不远,在总体平均数附近波动,可以用样本平均数来估计总体平均数.
(2)随机样本的容量越大,样本平均数就越接近总体平均数.
简单随机抽样的概念
[例1]  下列抽取样本的方法是简单随机抽样吗?为什么?
(1)从无限多个个体中抽取50个个体作为样本;
(2)箱子里共有100个零件,今从中选取10个零件进行检验,在抽样操作时,从中任意地拿出一个零件进行质量检验后再把它放回箱子里;
(3)从50个个体中一次性抽取5个个体作为样本;
(4)一彩民选号,从装有36个大小、形状都相同的号签的箱子中无放回的抽取6个号签.
[解] (1)不是简单随机抽样,因为被抽取的样本的总体的个数是无限的而不是有限的;
(2)不是简单随机抽样,因为它是有放回的抽样;
(3)不是简单随机抽样,因为它是一次性抽取,而不是“逐个”抽取;
(4)是简单随机抽样,因为总体中的个体是有限的,并且是从总体中逐个抽取、不放回的、等概率的抽样.
简单随机抽样的判断方法
判断所给的抽样是否为简单随机抽样的依据是简单随机抽样的四个特征:
上述四点特征,如果有一点不满足,就不是简单随机抽样.    
[变式训练]
下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数张高考试卷中抽取50张试卷作为样本;
(2)质量监督部门从180种儿童玩具中选出18种玩具进行质量检验,在抽样操作过程中,从中任取一种玩具检验后再放回;
(3)国家跳水队挑出最优秀的10名跳水队员,备战奥运会;
(4)用抽签法从10件产品中选取3件进行质量检验.
解:(1)不是简单随机抽样,因为样本总体数目不确定;
(2)不是简单随机抽样,因为简单随机抽样要求逐个不放回地抽取样本;
(3)不是简单随机抽样,因为这10名跳水队员是挑选出来的最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等概率抽样”的要求;
(4)是简单随机抽样,因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等概率的抽样.
抽签法和随机数法
[例2]  (1)上海某中学从40名学生中选1人作为上海男篮啦啦队的成员,采用下面两种选法,则抽签法的序号是________.
①将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选;
②将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为啦啦队成员.
(2)某家具厂要为育才小学一年级新生制作新课桌椅,他们要事先了解全体一年级学生的平均身高,以便设定可调节课桌椅的标准高度. 已知育才小学一年级有165名学生,如果通过简单随机抽样的方法调查一年级学生的平均身高,需抽取16人,需怎样抽取?
[解析] (1)①满足抽签法的特征,是抽签法;②不是抽签法,因为抽签法要求所有的号签编号互不相同,而②中39个白球无法相互区分.
[答案] ①
(2)①先给165名学生编号,如编号为1~165;
②准备10个大小、质地一样的小球,小球上分别写上数字0,1,2,3,4,5,6,7,8,9,把它们放入一个不透明的袋中;
③从袋中有放回的摸取3次,每次摸取前充分搅拌,并把第一、二、三次摸到的数字分别作为百、十、个位数,这样就生成一个三位随机数;
④如果这个三位数在1~165范围内,就代表对应编号的学生被抽中,如果编号有重复就剔除编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的人数.
1.一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.抽签法一般适用于总体中个体数不多的情形.
2.随机数法生成随机数的方法:
(1)用随机试验生成随机数;
(2)用信息技术生成随机数:
①用计算器生成随机数;
②用电子表格软件生成随机数;
③用R统计软件生成随机数.    
[变式训练]
1.总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法:从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为(   )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
A.08 B.07
C.02 D.01
解析:选D 从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字开始向右读,第一个数为65,不符合条件,第二个数为72,不符合条件,第三个数为08,符合条件,以下符合条件的数字依次为02,14,07,01,故第5个数为01.故选D.
2.某校高一年级有43名足球运动员,要从中抽出5人调查学习负担情况,用抽签法设计一个抽样方案.
解:第一步:编号,把43名运动员编号为1~43;
第二步:制签,做好大小、形状相同的号签,分别写上这43个数;
第三步:搅拌,将这些号签放在暗箱中,进行均匀搅拌;
第四步:抽签入样,每次从中抽取一个,连续抽取5次(不放回抽取),从而得到容量为5的简单随机样本.
用样本平均数估计总体平均数
[例3]  某校为调查全校学生的睡眠时间,从全体学生中用随机数法抽取了一个容量为100的简单随机样本,他们的睡眠时间如下表(单位:h):
睡眠 时间 [6,6.5) [6.5,7) [7,7.5) [7.5,8) [8,8.5) [8.5,9) 合

人数 5 17 33 37 6 2 100
试计算这100名学生的平均睡眠时间并由此估计该校学生的日平均睡眠时间.
[解] 以睡眠区间的平均值为睡眠时间,则这100名学生的日平均睡眠时间为=1/100×(5×6.25+17×6.75+33×7.25+37×7.75+6×8.25+2×8.75)= 1/100×739=7.39(h).
所以估计该校学生的日平均睡眠时间约为7.39 h.
用样本平均数估计总体平均数的步骤
(1)求样本平均数;
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,y3,…,yn,
则称==i.
(2)用样本平均数去估计总体平均数,即≈.    
[变式训练]
1.某校为了了解学生课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用如图所示的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间,由此估计该校学生的日平均阅读时间约为(  )
A.0.6小时 B.0.9小时
C.1.0小时 D.1.5小时
解析:选B 欲求平均每人的课外阅读时间,用50人所用的总时间除以50即可,而50人所用时间可由统计图表计算,=(5×0+20×0.5+10×1.0+10×1.5+5×2.0)=0.9(小时),即该校学生日平均阅读时间约为0.9小时.故选B.
2.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:
甲 27 38 30 37 35 31
乙 35 29 40 34 30 36
分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数并判断选谁参加比赛比较合适?
解:甲==33.
乙==34.因为甲<乙,故选乙参加比赛较合适.
A级——学考合格性考试达标练
1.在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是(  )
A.总体        B.个体
C.样本量 D.从总体中抽取的一个样本
解析:选A 5 000名居民的阅读时间的全体是总体,每名居民的阅读时间是个体,200是样本量.故选A.
2.抽签法中确保样本代表性的关键是(  )
A.制签 B.搅拌均匀
C.逐一抽取 D.抽取不放回
解析:选B 逐一抽取、抽取不放回是简单随机抽样的特点,但不是确保代表性的关键,一次抽取与有放回抽取也不影响样本的代表性,制签也一样.故选B.
3.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性,“第二次被抽到”的可能性分别是(  )
A., B.,
C., D.,
解析:选A 简单随机抽样中每个个体被抽取的概率都相等,都为.故选A.
4.某中学高一年级有400人,高二年级有320人,高三年级有280人,若每人被抽到的可能性都为0.2,用随机数法在该中学抽取容量为n的样本,则n等于(  )
A.80 B.160
C.200 D.280
解析:选C 由题意可知,=0.2,解得n=200.故选C.
5.已知总样本量为108,若用随机数法抽取一个容量为10的简单随机样本,下列对总体的编号正确的是(  )
A.1,2,…,108 B.01,02,…,108
C.00,01,…,107 D.001,002,…,108
解析:选D 用随机数法选取样本时,样本的编号位数要一致.故选D.
6.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为________.
解析:根据分层随机抽样的概念知=,解得N=808.
答案:808
7.用抽签法进行抽样有以下几个步骤:①制签;②抽签;③将签摇匀;④编号;⑤将抽取的号码对应的个体取出,组成样本.这些步骤的正确顺序为________(填序号).
解析:由抽签法的步骤知,正确顺序为④①③②⑤.
答案:④①③②⑤
8.某高校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班有50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是________分.
解析:由题意得,该校数学建模兴趣班的平均成绩是=85(分).
答案:85
9.现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个样本量为6的样本进行质量检验.如何用随机数法设计抽样方案?
解:第一步,将元件的编号调整为010,011,012,…,099,100,…,600.
第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第6行第7个数9.
第三步,从数9开始,向右读,每次读取三位,凡不在010~600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到544,354,378,520,384,263.
第四步,与以上这6个号码对应的6个元件就是所要抽取的对象.
10.从A,B两个班中各抽取10名学生参加技能测试,成绩如下表(单位:分):
A班 67 72 93 69 86 84 45 77 88 91
B班 78 96 56 83 86 48 98 67 62 72
试估计哪个班的技能成绩较好.
解:分别计算两班成绩的平均数,得
A=×(67+72+93+69+86+84+45+77+88+91)=77.2(分).
B=×(78+96+56+83+86+48+98+67+62+72)=74.6(分).
由此估计:甲班平均分约为77.2分,乙班平均分约为74.6分,77.2>74.6,
由此估计A班的技能平均水平高于B班.
B级——面向全国卷高考高分练
1.下列抽样试验中,适合用抽签法的有(  )
A.从某厂生产的3 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3 000件产品中抽取10件进行质量检验
解析:选B 个体数和样本容量较小时适合用抽签法,排除A、D;C中甲、乙两厂生产的两箱产品质量可能差别较大,也不适用.故选B.
2.从一群游戏的小孩中随机抽出k人,一人分一个苹果,让他们返回继续游戏.过了一会儿,再从中任取m人,发现其中有n个小孩曾分过苹果,估计参加游戏的小孩的人数为(  )
A. B.k+m-n
C. D.不能估计
解析:选C 设参加游戏的小孩有x人,则=,x=.故选C.
3.已知样本x1,x2,…,xn的平均数为x;样本y1,y2,…,ym的平均数为y(x≠y),若样本x1,x2,…,xn,y1,y2,…,ym的平均数z=ax+(1-a)y,其中0A.n=m B.n≥m
C.nm
解析:选C 由题意得z=(nx+my)=x+y,∴a=,
∵0又n,m∈N*,∴2n∴n4.采用抽签法从含有3个个体的总体{1,3,8}中抽取一个样本量为2的样本,则所有可能的样本是________.
解析:从三个总体中任取两个即可组成样本,
∴所有可能的样本为{1,3},{1,8},{3,8}.
答案:{1,3},{1,8},{3,8}
5.已知下列抽取样本的方式:
①从无限多个个体中抽取100个个体作为样本;
②盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出1个零件进行质量检验后再把它放回盒子里;
③从20件玩具中一次性抽取3件进行质量检验;
④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
其中,不是简单随机抽样的是________(填序号).
解析:①不是简单随机抽样,因为被抽取的总体的个体数是无限的,而不是有限的;②不是简单随机抽样,因为它是放回抽样;③不是简单随机抽样,因为这是“一次性”抽取,而不是“逐个”抽取;④不是简单随机抽样,因为指定个子最高的5名同学是56名同学中特指的,不存在随机性,不是等概率抽样.
答案:①②③④
6.用简单随机抽样的方法从含有6个个体的总体中,抽取一个样本量为2的样本,某一个个体a“第一次被抽到的概率”、“第二次被抽到的概率”、“在整个抽样过程中被抽到的概率”分别是________、________、________.
解析:从6个个体中抽1个个体,每个个体被抽到的概率均为,与抽取的次数无关,第二次被抽到的概率仍为.但由于在整个抽样过程中是从6个个体中抽2个样本,故个体a被抽到的概率为.
答案:  
7.某鱼塘去年向鱼塘投入了一批5 000条鱼苗,为了了解这批鱼苗的生长情况,从鱼塘中捕捞了20条,称得它们的质量如下(单位:kg):
1.1 1.0 1.1 1.0 1.1 1.3 1.2 1.1 1.1 1.2
1.1 1.1  1.0 1.2 1.2 1.2 1.1 1.2 1.1 1.1
已知这批鱼苗的成活率是80%,现在的市场价是每千克5.5元,请你帮忙计算一下,现在全部出售的毛收入会是多少?(对数据分析、整理,利用频数进行计算样本平均数,注意计算技巧)
解:这组数据的平均数为:
(1.0×3+1.1×10+1.2×6+1.3×1) ÷ 20≈1.12(kg),
估计鱼塘中鱼的平均重量为1.12千克/条.
5.5×5 000×80%×1.12=24 640 (元).
答:这批鱼现在全部出售的毛收入是24 640元.
C级——拓展探索性题目应用练
 为宣传节约用水,小明随机调查了某小区部分家庭5月份的用水情况,并将收集的数据整理成如下统计图.
(1)小明一共调查了多少户家庭?
(2)求所调查家庭5月份用水量的平均数;
(3)若该小区有400户居民,请你估计这个小区5月份的用水量.
解:(1)1+1+3+6+4+2+2+1=20(户).
答:小明一共调查了20户家庭.
(2)(1×1+1×2+3×3+4×6+5×4+6×2+7×2+8×1)÷20=4.5(吨).
答:所调查家庭5月份用水量的平均数为4.5吨.
(3)400×4.5=1 800(吨).
答:估计这个小区5月份的用水量为1 800吨.
9.1.2 分层随机抽样
9.1.3 获取数据的途径
新课程标准 新学法解读
1.通过实例,了解分层抽样的特点和适用范围,了解分层随机抽样的必要性,掌握各层样本量比例分配的方法. 2.结合具体实例,掌握分层随机抽样的样本均值.
3.知道获取数据的基本途径,包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等. 1.要熟练掌握分层随机抽样的概念、步骤及特点.
2.会利用比例分配的分层随机抽样对差异明显的总体进行抽样,并掌握求解相关数据常用的方法.
1.为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,且男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是(  )
A.简单随机抽样    B.按性别分层随机抽样
C.按学段分层随机抽样 D.随机数法抽样
解析:选C 依据题意,了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,且男女生视力情况差异不大,故要了解该地区学生的视力情况,应按学段分层随机抽样.故选C.
2.某单位有职工160人,其中业务员104人,管理人员32人,后勤服务人员24人,现用比例分配的分层随机抽样法从中抽取一容量为20的样本,则抽取管理人员有(  )
A.3人 B.4人
C.7人 D.12人
解析:选B 由=,设管理人员x人,则=,得x=4.故选B.
3.某工厂生产A,B,C三种不同型号的产品,产品的数量之比依次为3∶4∶7.现在按分层随机抽样的方法抽取一个容量为n的样本,样本中A号产品有15件,那么样本量n为(  )
A.50 B.60
C.70 D.80
解析:选C 由分层随机抽样定义知=,∴n=70,故选C.
4.某公司生产三种型号的轿车,产量分别是1 200辆,6 000 辆和2 000辆,为检验该公司的产品质量,现用分层随机抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取________辆、________辆、________辆.
解析:三种型号的轿车共9 200辆,抽取样本量为46辆,则按=的比例抽样,所以依次应抽取1 200×=6(辆),6 000×=30(辆),2 000×=10(辆).
答案:6 30 10
5.某学校高一年级在校人数为600人,其中男生320人,女生280人,为了解学生身高发展情况,按分层随机抽样的方法抽取50名男生身高为一个样本,其样本平均数为170.2 cm,抽取50名女生身高为一个样本,其样本平均数为162.0 cm,则该校高一学生的平均身高的估计值为________.
解析:由题意可知,=170.2,=162.0
且M=320,N=280
所以样本平均数=+=×170.2+×162.0≈166.4(cm)
故该校高一学生的平均身高的估计值为166.4 cm.
答案:166.4 cm
1.分层随机抽样的实施步骤
第一步,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体;
第二步,在每个子总体中独立地进行简单随机抽样;
第三步,把所有子总体中抽取的样本合在一起作为总样本.
2.分层随机抽样适用于总体中个体之间差异较大的情形
3.在比例分配的分层抽样中需注意两点
(1)抽样比=.
(2)可以直接用样本平均数估计总体平均数.
4.分层随机抽样下总体平均数的估计
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n.我们用X1,X2,…,XM表示第1层各个个体的变量值,用x1,x2,…,xm表示第1层样本的各个个体的变量值;用Y1,Y2,…,YN表示第2层各个个体的变量值,用y1,y2,…,yn表示第2层样本的各个个体的变量值,则第1层的总体平均数和样本平均数分别为
==i,
==i.
第2层的总体平均数和样本平均数分别为
==i,
  ==i.
总体平均数和样本平均数分别为
=,=.
在比例分配的分层随机抽样中,
==,
+=+=.
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数.
分层随机抽样的概念
[例1] (1)下列问题中,最适合用分层随机抽样抽取样本的是(  )
A.从10名同学中抽取3人参加座谈会
B.红星中学共有学生1 600名,其中男生840名,防疫站对此校学生进行身体健康调查,抽取一个容量为200的样本
C.从1 000名工人中,抽取100人调查上班途中所用时间
D.从生产流水线上,抽取样本检查产品质量
(2)分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层抽样为保证每个个体等概率抽样,必须进行(  )
A.每层等概率抽样
B.每层可以不等概率抽样
C.所有层按同一抽样比等概率抽样
D.所有层抽个体数量相同
[解析] (1)A中总体所含个体无差异且个数较少,适合用简单随机抽样;C和D中总体所含个体无差异且个数较多,不适合用简单随机抽样和分层随机抽样;B中总体所含个体差异明显,适合用分层随机抽样.
(2)保证每个个体等概率的被抽取是三种基本抽样方式的共同特征,为了保证这一点,分层抽样时必须在所有层都按同一抽样比等概率抽取.
[答案] (1)B (2)C
分层随机抽样的特点
(1)适用于总体由差异明显的几部分组成的情况;
(2)更充分地反映了总体的情况;
(3)等概率抽样,每个个体被抽到的概率都相等.    
[变式训练]
 某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适(  )
A.抽签法      B.简单随机抽样法
C.分层随机抽样法 D.随机数法
解析:选C 总体由差异明显的三部分构成,应选用分层随机抽样.故选C.
比例分配的分层抽样的运用
[例2] 某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人.教育部门为了了解在职人员对学校机构改革的意见,要从中抽取一个容量为20的样本,请利用分层随机抽样的方法抽取,写出抽样过程.
[解] 由题意知,该抽样为比例分配的分层随机抽样,抽样过程如下:
第一步,确定抽样比,样本量与总样本量的比为=;
第二步,确定分别从三类人员中抽取的人数,从行政人员中抽取16×=2(人);从教师中抽取112×=14(人);从后勤人员中抽取32×=4(人);
第三步,采用简单随机抽样的方法,抽取行政人员2人,教师14人,后勤人员4人;
第四步,把抽取的个体组合在一起构成所需样本.
确定比例分配的分层随机抽样中各层个体数的方法
(1)先计算出抽样比=,获得各层抽样数的百分比;
(2)按抽样比确定每层需要抽取的个体数:
抽样比×该层个体数目=×该层个体数目.    
[变式训练]
  一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?
解:由题意知,该抽样为比例分配的分层随机抽样,抽取步骤如下:
(1)分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.
(2)确定每层抽取个体的个数.抽样比为=,则在不到35岁的职工中抽取125×=25(人);在35岁至49岁的职工中抽取280×=56(人);在50岁及50岁以上的职工中抽取95×=19(人).
(3)在各层按随机数法抽取样本.
(4)汇总每层抽样,组成样本.
A级——学考合格性考试达标练
1.某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从中抽取一个容量为36的样本,则适合的抽样方法是(  )
A.抽签法随机抽样
B.随机数法随机抽样
C.直接运用分层随机抽样
D.先从老年人中剔除1人,再用分层随机抽样
解析:选C 因为总体由差异明显的三部分组成,所以考虑用分层随机抽样.故选C.
2.在1 000个球中有红球50个,从中抽取100个进行分析,如果用比例分配的分层随机抽样的方法对球进行抽样,则应抽红球(  )
A.33个        B.20个
C.5个 D.10个
解析:选C 样本抽样比为,设应抽红球x个,则=,故x=5.故选C.
3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层随机抽样抽取容量为30的样本,则抽取的各职称的人数分别为(  )
A.5,10,15 B.3,9,18
C.3,10,17 D.5,9,16
解析:选B 高级、中级、初级职称的人数所占的比例分别为=10%,=30%,=60%,则所抽取的高级、中级、初级职称的人数分别为10%×30=3(人),30%×30=9(人),60%×30=18(人).故选B.
4.某工厂生产的A,B,C三种不同型号的产品数量之比为2∶3∶5,为研究这三种产品的质量,现用分层抽样的方法从该工厂生产的A,B,C三种产品中抽出样本量为n的样本,若样本中A型产品有10件,则n的值为(  )
A.15 B.25
C.50 D.60
解析:选C 由分层抽样的特征知=,解得n=50.故选C.
5.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样和分层随机抽样两种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,则(  )
A.p1p2C.p1=p2 D.p1,p2没有关系
解析:选C 不管是简单随机抽样还是分层随机抽样,它们都是等概率抽样,每个个体被抽中的概率均为.故选C.
6.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层随机抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.
解析:设应从高二年级抽取x名学生,则x∶50=3∶10.解得x=15.
答案:15
7.在120个零件中,一级品24个,二级品36个,三级品60个,用分层随机抽样的方法从中抽取容量为20的样本,则每个个体被抽取的可能性是________.
解析:在分层抽样中,每个个体被抽取的可能性相等,且为. 所以每个个体被抽取的可能性是=.
答案:
8.已知样本数据x1,x2,…,xn的均值=5,则样本数据2x1+1,2x2+1,…,2xn+1的均值为________.
解析:由条件知==5,
则所求均值0===2+1=2×5+1=11.
答案:11
9.某市化工厂三个车间共有工人1 000名,各车间男、女工人数如下表:
第一车间 第二车间 第三车间
女工 173 100 y
男工 177 x z
已知在全厂工人中随机抽取1名,抽到第二车间男工的可能性是0.15.
(1)求x的值;
(2)现用分层随机抽样的方法在全厂抽取50名工人,问应在第三车间抽取多少名?
解:(1)由=0.15,得x=150.
(2)∵第一车间的工人数是173+177=350(人),第二车间的工人数是100+150=250(人),
∴第三车间的工人数是1 000-350-250=400(人).
设应从第三车间抽取m名工人,则由=,
得m=20.
∴应在第三车间抽取20名工人.
10.某班有40名男生,20名女生,已知男女身高有明显不同,现欲调查平均身高,准备抽取,采用比例分配分层随机抽样方法,抽取男生1名,女生1名,你认为这种做法是否妥当?如果让你来调查,你准备怎样做?
解:这种做法不妥当.原因:取样比例数过小,很难准确反映总体情况,况且男、女身高差异较大,抽取人数相同,也不合理.
考虑到本题的情况,可以采用分层随机抽样,可抽取抽样比为.
男生抽取40×=8(名),女生抽取20×=4(名),各自用抽签法或随机数法抽取组成样本.
B级——面向全国卷高考高分练
1.已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,则样本量和抽取的高中生近视人数分别为(  )
A.200,20 B.100,20
C.200,10 D.100,10
解析:选A 该地区中小学生总人数为3 500+2 000+4 500=10 000(人),则样本量为10 000×2%=200(人),其中抽取的高中生近视人数为2 000×2%×50%=20(人).故选A.
2.某校老年、中年和青年教师的人数如表所示,采用分层随机抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为(  )
类别 人数
老年教师 900
中年教师 1 800
青年教师 1 600
合计 4 300
A.90 B.100
C.180 D.300
解析:选C 设该样本中的老年教师人数为x,由题意及比例分配分层随机抽样的特点得=,故x=180.故选C.
3.在分层随机抽样中,每层中的样本抽取应采用简单随机抽样,如:在第一层中应从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的概率为(  )
A. B.
C. D.
解析:选C 根据题意,=,解得n=28.
故在整个抽样过程中每个个体被抽到的概率为=.故选C.
4.某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20 000人,其中各种态度对应的人数如下表所示:
最喜爱 喜爱 一般 不喜欢
4 800 7 200 6 400 1 600
电视台为了了解观众的具体想法和意见,打算从中抽取100人进行详细的调查,为此要进行分层随机抽样,那么在分层随机抽样时,每类人中应抽取的人数分别为(  )
A.25,25,25,25 B.48,72,64,16
C.20,40,30,10 D.24,36,32,8
解析:选D 因为抽样比为=,所以每类人中应抽取的人数分别为4 800×=24(人),7 200×=36(人),6 400×=32(人),1 600×=8(人).故选D.
5.为了了解高一、高二、高三年级学生的身体状况,现用分层随机抽样的方法抽取一个容量为1 200的样本,三个年级学生人数之比依次为k∶5∶3,已知高一年级共抽取了240人,则高三年级抽取的人数为________人.
解析:因为高一年级抽取学生的比例为=,所以=,解得k=2,故高三年级抽取的人数为1 200×=360(人).
答案:360
6.已知标有1~20号的小球20个,若我们的目的是估计总体号码的平均数,即20个小球号码的平均数.试验者从中抽取4个小球,以这4个小球号码的平均数估计总体号码的平均数,按下面方法抽样(按小号到大号排序):
(1)以编号2为起点,系统抽样抽取4个球,则这4个球的编号的平均数为________;
(2)以编号3为起点,系统抽样抽取4个球,则这4个球的编号的平均数为________.
解析:20个小球分4组,每组5个.
(1)若以2号为起点,则另外三个球的编号依次为7,12,17,则这4个小球编号平均数为=9.5.
(2)若以3号为起点,则另外三个球的编号依次为8,13,18,则这4个小球编号平均数为=10.5.
答案:(1)9.5 (2)10.5
7.某县共有5个乡镇,人口3万人,其人口比例为3∶2∶5∶2∶3,从3万人中抽取一个容量为300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.
解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用比例分配分层随机抽样的方法.
具体过程如下:
(1)将3万人分为5层,其中一个乡镇为一层.
(2)按照样本量的比例求得各乡镇应抽取的人数分别为60人、40人、100人、40人、60人.
(3)按照各层抽取的人数随机抽取各乡镇应抽取的样本.
(4)将300人合到一起,即得到一个样本.
C级——拓展探索性题目应用练
 某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%,登山组的职工占参加活动总人数的,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层的职工对本次活动的满意程度,现用比例分配分层随机抽样的方法从参加活动的全体职工中抽取容量为200的样本.试求:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
解:(1)设登山组人数为x,游泳组中,青年人、中年人、老年人各占比例分别为a,b,c,
则有=47.5%,=10%.
解得b=50%,c=10%.
故a=1-50%-10%=40%.
即游泳组中,青年人、中年人、老年人各占比例分别为40%,50%,10%.
(2)游泳组中,抽取的青年人人数为200××40%=60(人);
抽取的中年人人数为200××50%=75(人);
抽取的老年人人数为200××10%=15(人).
9.2 用样本估计总体
9.2.1 总体取值规律的估计
9.2.2 总体百分位数的估计
新课程标准 新学法解读
1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性. 2.结合实例,掌握用样本估计总体的取值规律.
3.理解百分位数的统计含义,能用样本百分位数估计总体百分位数. 1.会根据频率分布表估计总体,会利用频率分布直方图估计总体.
2.对于频率分布直方图的相关问题需要重点掌握,了解其综合应用问题是本部分内容的难点.
3.学会计算样本百分位数,会对总体百分位数做出合理估计.
1.某班学生在一次数学考试中各分数段以及人数的成绩分布为:
[0,80),2人;[80,90),6人;[90,100),4人;[100,110),10人;[110,120),12人;[120,130),5人;[130,140),4人;[140,150],2人.那么分数在[100,130)中的频数以及频率分别为(  )
A.27,0.56       B.20,0.56
C.27,0.60 D.13,0.29
解析:选C 由[100,130)中的人数为10+12+5=27(人),得频数为27,频率为=0.60.
2.一个容量为80的样本中,数据的最大值为152,最小值为60,组距为10,应将样本数据分为(  )
A.10组 B.9组
C.8组 D.7组
解析:选A 由题意知,=9.2,故应分成10组.
3.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)内的汽车有(  )
A.30辆
B.40辆
C.60辆
D.80辆
解析:选C 由直方图知,时速在[50,60)内的频率为0.03×10=0.3,故此段内汽车有200×0.3=60辆.
4.一个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为(  )
A.2 B.4
C.6 D.8
解析:选B 频率=,则频数=频率×样本量=0.125×32=4.
5.某中学甲、乙两名同学最近几次的数学考试成绩情况如下:
甲的得分:95,81,75,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
则甲得分的第50百分位数为________;乙得分的第75百分位数为_______.
解析:把甲的得分由小到大排列为65,71,75,76,81,88,89,94,95,107,110.
把乙的得分由小到大排列为79,83,86,88,93,98,98,99,101,103,114.
由11×50%=5.5,可知甲得分的第50百分位数为6项数据,据此可得甲得分的第50百分位数为88;由11×75%=8.25,可知乙得分的第75百分位数为第9项数据,据此可得乙得分的第75百分位数为101.
答案:88 101
1.绘制频率分布直方图的步骤
(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.
(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.
[说明] 频数分布直方图的纵坐标是频数,每一组数对应的矩形的高度与频数成正比;频率分布直方图的纵坐标是,每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等于这一组数对应的频率,所有矩形的面积之和为1.
2.条形图、折线图及扇形图
(1)条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.
(2)折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图.
(3)扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.
3.百分位数
(1)一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算一组几个数据第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
(3)四分位数
即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数.
其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
绘制频率分布直方图
[例1] 一个农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):
6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6
5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8
6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5
6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4
6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4
6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6
5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0
5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7
5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0
6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
根据上面的数据列出频率分布表,绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35 cm之间的麦穗所占的百分比.
[解] (1)计算极差:7.4-4.0=3.4.
(2)决定组距与组数:若取组距为0.3,因为≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12.
(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.
(4)列频率分布表:
分组 频数 频率
[3.95,4.25) 1 0.01
[4.25,4.55) 1 0.01
[4.55,4.85) 2 0.02
[4.85,5.15) 5 0.05
[5.15,5.45) 11 0.11
[5.45,5.75) 15 0.15
[5.75,6.05) 28 0.28
[6.05,6.35) 13 0.13
[6.35,6.65) 11 0.11
[6.65,6.95) 10 0.10
[6.95,7.25) 2 0.02
[7.25,7.55] 1 0.01
合计 100 1.00
(5)绘制频率分布直方图如图.
从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm之间的麦穗约占41%.
绘制频率分布直方图应注意的2个问题
(1)在绘制出频率分布表后,画频率分布直方图的关键就是确定小矩形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“频率/组距”所占的比例来定高.如我们预先设定以“”为一个单位长度,代表“0.1”,则若一个组的为0.2,则该小矩形的高就是“”(占两个单位长度),如此类推.
(2)数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.    
[变式训练]
 某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分):
48 64 52 86 71 48 64 41 86 79
71 68 82 84 68 64 62 68 81 57
90 52 74 73 56 78 47 66 55 64
56 88 69 40 73 97 68 56 67 59
70 52 79 44 55 69 62 58 32 58
根据上面的数据,回答下列问题:
(1)这次测验成绩的最高分和最低分分别是多少?
(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图.
解:(1)这次测验成绩的最低分是32分,最高分是97分.
(2)根据题意,列出样本的频率分布表如下:
分组 频数 频率
[30,40) 1 0.02
[40,50) 6 0.12
[50,60) 12 0.24
[60,70) 14 0.28
[70,80) 9 0.18
[80,90) 6 0.12
[90,100] 2 0.04
合计 50 1.00
频率分布直方图如图所示.
频率分布直方图的应用
[例2] 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:
组号 分组 频数
1 [0,2) 6
2 [2,4) 8
3 [4,6) 17
4 [6,8) 22
5 [8,10) 25
6 [10,12) 12
7 [12,14) 6
8 [14,16) 2
9 [16,18] 2
合计 100
  
(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;
(2)求频率分布直方图中的a,b的值;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.
[解] (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),
所以样本中的学生一周课外阅读时间少于12小时的频率是1-=0.9.
故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.
(2)课外阅读时间落在[4,6)组内的有17人,频率为0.17,所以a===0.085.
课外阅读时间落在[8,10)组内的有25人,频率为0.25,所以b===0.125.
(3)同一组中的每个数据用该组区间的中点值代替,则数据的平均数为:
1×0.06+3×0.08+5×0.17+7×0.22+9×0.25+11×0.12+13×0.06+15×0.02+17×0.02=7.68(小时)
所以样本中的100名学生该周课外阅读时间的平均数在第4组.
频率分布直方图的性质
(1)每个小矩形的面积表示样本数据落在该组内的频率.
(2)所有小矩形的面积和等于1.
(3)利用一组的频数和频率,可以求样本量.    
[变式训练]
 某电子商务公司对10 000名网络购物者2019年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a=________;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________人.
解析:(1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.
(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.
因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000(人).
答案:(1)3 (2)6 000
总体百分位数的估计
[例3] (1)为了解毕业生工作情况,某高校对12名应届毕业生起始月薪作了统计如下:
毕业生 起始月薪 毕业生 起始月薪
1 2
3
4
5
6 2 850
2 950
3 050
2 880
2 755
2 710 7
8
9
10
11
12 2 890
3 130
2 940
3 325
2 920
2 880
则第85百分位数是________.
(2)考察某校高二年级男生的身高,随机抽取40名高二男生,实测身高数据(单位:cm)如下:
171 163 163 166 166 168 168 160 168 165 171 169 167 169 151 168 170 160 168 174 165 168 174 159 167 156 157 164 169 180 176 157 162 161 158 164 163 163 167 161
请估计该校高二年级男生身高的第25,50,75百分位数.
[解析] (1)首先对数据排序:2 710 2 755 2 850 2 880 2 880 2 890 2 920 2 940 2 950 3 050 3 130 3 325
所以i=12×85%=10.2.
即第85百分位数是3 130.
[答案] 3 130
(2)把这40名男生的身高数据按从小到大排序,可得
151 156 157 157 158 159 160 160 161 161 162 163 163 163 163 164 164 165 165 166 166 167 167 167 168 168 168 168 168 168 169 169 169 170 171 171 174 174 176 180
由25%×40=10,50%×40=20,57%×40=30,可知样本数据的第25百分位数为161.5,第50百分位数为166,第75百分位数为168.5.
据此可估计该校高二男生身高的第25,50,75百分位数分别约为161.5,166和168.5.
总体百分位数估计需要注意的两个问题
(1)总体百分位估计的基础是样本百分位数的计算,因此计算准确是关键;
(2)由于样本量比较少,因此对总体的估计可能存在误差,因此对总体百分位数的估计一般是估计值而非精确值.    
[变式训练]
 某良种培育基地正在培育一种小麦新品种A,将其种植了25亩,所得亩产数据(单位:千克)如下:
421, 399, 445,359, 415, 443,367,454,368,375, 392, 400, 423,405,412, 427,414, 423, 430, 388,430, 357,434, 445, 451
试估计该品种小麦亩产的第80,95百分位数.
解:将25个样本数据按从小到大排序,可得
357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454
由80%×25=20,95%×25=23.75,可知样本数据的第80百分位数为438.5,第95百分位数为第24项数据,为451. 据此估计该品种小麦亩产的第80,95百分位数分别约为438.5和451.
A级——学考合格性考试达标练
1.从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8,其累计频率为0.4,则这个样本的容量是(  )
A.20         B.40
C.70 D.80
解析:选A 由已知不超过70分的人数为8,累计频率为0.4,则这个样本量n==20.故选A.
2.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为(  )
A.20 B.30
C.40 D.50
解析:选B 样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.故选B.
3.如图是某班50名学生期中考试数学成绩的频率分布直方图,其中成绩分组区间是[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于(  )
A.0.120 B.0.180
C.0.012 D.0.018
解析:选D 由图可知纵坐标表示频率/组距,故x=0.1-0.054-0.010-0.006×3=0.018.故选D.
4.某地农村2004年到2019年间人均居住面积的统计图如图所示,则增长最多的5年为(  )
A.2004年~2009年     B.2009年~2014年
C.2014年~2019年 D.无法从图中看出
解析:选C 2004年~2009年的增长量为3.1,2009年~2014年的增长量为3.2,2014年~2019年的增长量为3.8.故选C.
5.观察下图所示的统计图,下列结论正确的是(  )
A.甲校女生比乙校女生多
B.乙校男生比甲校男生少
C.乙校女生比甲校男生少
D.甲、乙两校女生人数无法比较
解析:选D 图中数据只是百分比,甲、乙两个学校的学生人数不知道,因此男生、女生的具体人数也无法得知.故选D.
6.900,920,920,930,930的20%分位数是________.
解析:因为5×20%=1,所以该组数据的20%分位数是=910.
答案:910
7.某校高三(1)班共有40名学生,他们每天自主学习的时间全部在180分钟到330分钟之间,按他们学习时间的长短分5个组统计,得到如下频率分布表:
第一组 [180,210) 4 0.10
第二组 [210,240) 8 s
第三组 [240,270) 12 0.30
第四组 [270,300) 10 0.25
第五组 [300,330] 6 t
则分布表中s,t的值分别为________,________.
解析:s==0.2,t=1-0.1-s-0.3-0.25=0.15.
答案:0.20 0.15
8.甲、乙两个城市2019年4月中旬,每天的最高气温统计图如图所示,这9天里,气温比较稳定的城市是________.
解析:从折线统计图中可以很清楚的看到乙城市的气温变化较大,而甲城市气温相对来说较稳定,变化基本不大.
答案:甲
9.某班50名同学参加数学测验,成绩的分组及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图.
解:(1)频率分布表如下:
分组 频数 频率
[40,50) 2 0.04
[50,60) 3 0.06
[60,70) 10 0.20
[70,80) 15 0.30
[80,90) 12 0.24
[90,100] 8 0.16
(2)频率分布直方图如下:
10.调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:
171 163 163 166 166 168 168 160 168 165
171 169 167 169 151 168 170 168 160 174
165 168 174 159 167 156 157 164 169 180
176 157 162 161 158 164 163 163 167 161
试估计该校高三年级男生的身高数据的30%分位数.
解:按从小到大排列原始数据
151 156 157 157 158 159 160 160 161 161
162 163 163 163 163 164 164 165 165 166
166 167 167 167 168 168 168 168 168 168
169 169 169 170 171 171 174 174 176 180
i=40×30%=12为整数.
又因第12项与第13项数据都是163,所以他们的平均数也为163.
所以估计该校高三年级男生的身高数据的30%分位数约为163.
B级——面向全国卷高考高分练
1.将容量为100的样本数据,按由小到大排列分成8个小组,如下表所示:
组号 1 2 3 4 5 6 7 8
频数 10 13 14 14 15 13 12 9
第3组的频率和累积频率为(  )
A.0.14和0.37     B.和
C.0.03和0.06 D.和
解析:选A 由表可知,第三小组的频率为=0.14,累积频率为=0.37.故选A.
2.某工厂对一批元件进行抽样检测.经检测,抽出的元件的长度(单位:mm)全部介于93至105之间.将抽出的元件的长度以2为组距分成6组:[93,95),[95,97),[97,99),[99,101),[101,103),[103,105],得到如图所示的频率分布直方图.若长度在[97,103)内的元件为合格品,根据频率分布直方图,估计这批元件的合格率是(  )
A.80% B.90%
C.20% D.85.5%
解析:选A 由频率分布直方图可知元件长度在[97,103)内的频率为1-(0.027 5+0.027 5+0.045 0)×2=0.8,故这批元件的合格率为80%.故选A.
3.在样本的频率分布直方图中,某个小长方形的面积是其他小长方形面积之和的 ,已知样本量是80,则该组的频数为(  )
A.20 B.16
C.30 D.35
解析:选B 设该组的频数为x,则其他组的频数之和为4x,由样本量是80,得x+4x=80,解得x=16,即该组的频数为16.故选B.
4.某厂对一批产品进行抽样检测,如图是抽检产品净重(单位:克)的频率分布直方图,样本数据分组为[76,78),[78,80),…,[84,86].若这批产品有120个,估计其中净重大于或等于78克且小于84克的产品的个数是(  )
A.12 B.18
C.25 D.90
解析:选D 净重大于或等于78克且小于84克的频率为(0.100+0.150+0.125)×2=0.75,所以在该范围内的产品个数为120×0.75=90.故选D.
5.如图是根据某中学为地震灾区捐款的情况而制作的统计图.已知该校在校学生3 000人,根据统计图计算该校共捐款________元.
解析:根据统计图,得高一人数为3 000×32%=960(人),
捐款960×15=14 400(元);
高二人数为3 000×33%=990(人),捐款990×13=12 870(元);
高三人数为3 000×35%=1 050(人),捐款1 050×10=10 500(元).
所以该校学生共捐款14 400+12 870+10 500=37 770(元).
答案:37 770
6.5,6,7,8,9,10,11,12,13,14的25%分位数为________,75%分位数为________,90%分位数为________.
解析:由于共有10个数字,则10×25%=2.5,10×75%=7.5,10×90%=9.故25%分位数为7,75%分位数为12,90%分位数为=13.5.
答案:7 12 13.5
7.某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图(如图所示).
分组
频数 频率
一组 0≤t<5 0 0
二组 5≤t<10 10 0.10
三组 10≤t<15 10 ②
四组 15≤t<20 ① 0.50
五组 20≤t≤25 30 0.30
合计
100 1.00
解答下列问题:
(1)这次抽样的样本量是多少?
(2)在表中填写出缺失的数据并补全频率分布直方图;
(3)旅客购票用时的平均数可能落在哪一组?
解:(1)样本量是100.
(2)第四组的频数 ①=100-30-10-10=50,
第三组的频率 ②=1.00-0.30-0.50-0.10=0.10.
所补频率分布直方图如图中的阴影部分.
(3)设旅客平均购票用时为t min,则有
≤t<

即15≤t<20.所以旅客购票用时的平均数可能落在第四组.
C级——拓展探索性题目应用练
 为了了解某片经济林的生长情况,随机测量其中的100棵树的底部周长,得到如下数据(单位:cm):
135 98 102 110 99 121 110 96 100 103
125 97 117 113 110 92 102 109 104 112
109 124 87 131 97 102 123 104 104 128
105 123 111 103 105 92 114 108 104 102
129 126 97 100 115 111 106 117 104 109
111 89 110 121 80 120 121 104 108 118
129 99 90 99 121 123 107 111 91 100
99 101 116 97 102 108 101 95 107 101
102 108 117 99 118 106 119 97 126 108
123 119 98 121 101 113 102 103 104 108
(1)列出频率分布表;
(2)画出频率分布直方图及频率折线图;
(3)估计该片经济林中底部周长小于100 cm的树占多少,底部周长不小于120 cm的树占多少.
解:(1)这组数据的最大的数为135,最小的数为80,最大的数与最小的数的差为55,可将该组数据分为11组,组距为5.
频率分布表如下:
底部周长分组 频数 频率
[80,85) 1 0.01 0.002
[85,90) 2 0.02 0.004
[90,95) 4 0.04 0.008
[95,100) 14 0.14 0.028
[100,105) 24 0.24 0.048
[105,110) 15 0.15 0.030
[110,115) 12 0.12 0.024
[115,120) 9 0.09 0.018
[120,125) 11 0.11 0.022
[125,130) 6 0.06 0.012
[130,135] 2 0.02 0.004
(2)频率分布直方图和频率折线图如下图所示.
(3)从频率分布表得,样本中底部周长小于100 cm的频率为0.01+0.02+0.04+0.14=0.21,样本中底部周长不小于120 cm的频率为0.11+0.06+0.02=0.19.所以估计该片经济林中底部周长小于100 cm的树占21%,底部周长不小于120 cm的树占19%.
9.2.3 总体集中趋势的估计
新课程标准 新学法解读
结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义. 阅读教材并通过复习回顾初中学习的众数、中位数、平均数概念,明确它们的统计含义.
1.一组数据:85,88,73,88,79,85,其众数是(  )
A.88        B.73
C.88,85 D.85
解析:选C 该组数据85,88,73,88,79,85有两个众数,它们是88,85.故选C.
2.已知数据-3,-2,0,6,6,13,20,35,则它的中位数和众数各是(  )
A.6和6 B.3和6
C.6和3 D.9.5和6
解析:选A ∵从小到大排列的这8个数,排在中间的两个数都是6,∴中位数是6;∵6出现的次数最多,∴众数是6,故选A.
3.已知一组数据从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么这组数据的众数为(  )
A.5 B.6
C.4 D.5.5
解析:选B 由题意得(4+x)=5,得x=6.
4.已知一组数据0,2,x,4,5的众数是4,那么这组数据的平均数是________.
解析:∵数据0,2,x,4,5的众数是4,∴x=4,
∴这组数据的平均数是×(0+2+4+4+5)=3.
答案:3
5.一组数据1,10,5,2,x,2,且2解析:根据题意知,该组数据的众数是2,则中位数是2÷=3,把这组数据从小到大排列为1,2,2,x,5,10,则=3,解得x=4,所以这组数据的平均数为=×(1+2+2+4+5+10)=4.
答案:4
1.众数、中位数、平均数的理解
(1)一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.
[说明] 如果有几个数据出现的次数相同,并且比其他数据出现的次数都多,那么这几个数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数.
(2)如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称xn+1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称为这组数的中位数.
(3)如果给定的一组数是x1,x2,…,xn,则这组数的平均数为=(x1+x2+…+xn).
众数、中位数、平均数都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.
2.众数、中位数、平均数的比较
名称 优点 缺点
众 数 ①体现了样本数据的最大集中点;
②容易计算 ①它只能表达样本数据中很少的一部分信息;
②无法客观地反映总体的特征
中 位
数 ①不受少数几个极端数据(即排序靠前或靠后的数据)的影响;
②容易计算,便于利用中间数据的信息 对极端值不敏感
平 均
数 代表性较好,是反映数据集中趋势的量.一般情况下,可以反映出更多的关于样本数据全体的信息 任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
众数、中位数、平均数的计算
[例1] 某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):
甲群:13,13,14,15,15,15,15,16,17,17;
乙群:54,3,4,4,5,6,6,6,6,56.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?
(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?
[解] (1)甲群市民年龄的平均数为
=15(岁),
中位数为15岁,众数为15岁.
平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.
(2)乙群市民年龄的平均数为
=15(岁),
中位数为6岁,众数为6岁.
由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.
平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.    
[变式训练]
如果5个数x1,x2,x3,x4,x5的平均数是7,那么x1+1,x2+1,x3+1,x4+1,x5+1这5个数的平均数是(  )
A.5 B.6
C.7 D.8
解析:选D 法一(定义法):依题意x1+x2+…+x5=35,所以(x1+1)+(x2+1)+…+(x5+1)=40,故所求平均数为=8.
法二(性质法):显然新数据(记为yi)与原有数据的关系为yi=xi+1(i=1,2,3,4,5),故新数据的平均数为+1=8.
总体集中趋势的估计
[例2] 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)求这次测试数学成绩的众数、中位数、平均分;
(2)估计该校参加高二年级学业水平测试的学生的众数、中位数和平均数.
[解] (1)①由题图知众数为=75.
②由题图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.
③由题图知这次数学成绩的平均分为:
×0.005×10+×0.015×10+×0.02×10+×0.03×10+×0.025×10+×0.005×10=72.
(2)由于数据是来自高二年级全部参加学业水平测试的学生的简单随机样本,所以可以估计高二年级参加学业水平测试的学生的众数是75,中位数是73.3,平均分是72.
用频率分布直方图估计众数、中位数、平均数
(1)众数:取最高小长方形底边中点的横坐标作为众数.
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.
(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.    
[变式训练]
 为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,
则:(1)这20名工人中一天生产该产品的数量在[55,75)的人数是________;
(2)这20名工人中一天生产该产品的数量的中位数为________;
(3)这20名工人中一天生产该产品的数量的平均数为________.
解析:(1)(0.04×10+0.025×10)×20=13.
(2)因为0.2+0.4>0.5,所以中位数一定在[55,65]之间,设中位数为x,则0.2+(x-55)×0.04=0.5,x=62.5.
(3)平均数为0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64.
答案:(1)13 (2)62.5 (3)64
A级——学考合格性考试达标练
1.下列说法中,不正确的是(  )
A.数据2,4,6,8的中位数是4,6
B.数据1,2,2,3,4,4的众数是2,4
C.一组数据的平均数、众数、中位数有可能是同一个数据
D.8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是
解析:选A 数据2,4,6,8的中位数为=5,显然A是错误的,B、C、D都是正确的.故选A.
2.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各1人,则该小组成绩的平均数、众数、中位数分别是(  )
A.85分,85分,85分    B.87分,85分,86分
C.87分,85分,85分 D.87分,85分,90分
解析:选C 由题意知,该学习小组共有10人,
因此众数和中位数都是85(分),
平均数为=87(分).故选C.
3.某班50名学生的一次安全知识竞赛成绩分布如表所示:(满分10分)
成绩(分) 0 1 2 3 4 5 6 7 8 9 10
人数(人) 0 0 0 1 0 1 3 5 6 19 15
这次安全知识竞赛成绩的众数是(  )
A.5分 B.6分
C.9分 D.10分
解析:选C 根据众数是一组数据中出现次数最多的进行判断,由表中数据可知成绩9分出现了19次,最多,所以众数是9分. 故选C.
4.统计学校排球队员的年龄,发现有12、13、14、15等四种年龄,统计结果如下表:
年龄(岁) 12 13 14 15
人数(个) 2 4 6 8
根据表中信息可以判断该排球队员年龄的平均数、众数、中位数分别为(  )
A.13,15,14 B.14,15,14
C.13.5,15,14 D.15,15,15
解析:选B 排球队员年龄的平均数
==14,故平均数是14,15出现了8次,出现的次数最多,故众数是15.从小到大排列后,排在10、11两个位置的数是14,14,故中位数是14. 故选B.
5.某市4月份日平均气温统计图情况如图所示,则在日平均气温这组数据中,众数和中位数分别是(  )
A.13,13 B.13,13.5
C.13,14 D.16,13
解析:选C ∵这组数据中,13出现了10次,出现次数最多,∴众数为13,∵第15个数和第16个数都是14,∴中位数是14.故选C.
6.某医院急救中心随机抽取20位病人等待急诊的时间记录如下表:
等待时间 (分钟) [0,5) [5,10) [10,15) [15,20) [20,25]
频数 4 8 5 2 1
用上述分组资料计算出病人平均等待时间的估计值=________.
解析:=(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5.
答案:9.5
7.若有一个企业,70%的员工年收入1万元,25%的员工年收入3万元,5%的员工年收入11万元,则该企业员工的年收入的平均数是________万元,中位数是________万元,众数是________万元.
解析:年收入的平均数是1×70%+3×25%+11×5%=2(万元).因为70%的员工年收入1万元,其他的只占30%,所以年收入的中位数、众数都为1万元.
答案:2 1 1
8.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现在用分层抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为________件;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为________小时.
解析:由分层抽样可知,第一分厂应抽取100×50%=50(件).由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命为1 020×50%+980×20%+1 030×30%=1 015(小时).
答案:50 1 015
9.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.
求:(1)高一参赛学生的成绩的众数、中位数;
(2)高一参赛学生的平均成绩.
解:(1)由题图可知众数为65,
因为第一个小矩形的面积为0.3,
所以设中位数为60+x,则0.3+x×0.04=0.5,得x=5,
所以中位数为60+5=65.
(2)依题意,平均成绩为55×0.03×10+65×0.04×10+75×0.015×10+85×0.01×10+95×0.005×10=67,故平均成绩约为67.
10.甲、乙、丙三个家电厂家在广告中都声称,他们的某品牌节能灯在正确使用的情况下,使用寿命都不低于8年.后来质量检测部门对他们的产品进行抽查,抽查的各8个产品使用寿命的统计结果如下(单位:年):
甲厂:6,6,6,8,8,9,9,12;
乙厂:6,7,7,7,9,10,10,12;
丙厂:6,8,8,8,9,9,10,10.
(1)把以上三组数据的平均数、众数、中位数填入下表:
平均数 众数 中位数
甲厂


乙厂


丙厂


(2)估计这三个厂家的推销广告分别利用了哪一种统计量;
(3)如果你是顾客,应该选哪个厂家的节能灯?为什么?
解:(1)甲厂:8,6,8;乙厂:8.5,7,8;
丙厂:8.5,8,8.5.
(2)甲厂利用了平均数或中位数;乙厂利用了平均数或中位数;丙厂利用了平均数或众数或中位数.
(3)选丙厂的节能灯.因为无论从哪种统计量来看,与其他两个厂家相比,丙厂水平都比较高或持平.
B级——面向全国卷高考高分练
1.抽样调查了某班30位女生所穿鞋子的尺码,数据如下(单位:码).在这组数据的平均数、中位数和众数中,鞋厂最感兴趣的是(  )
码号 33 34 35 36 37
人数 7 6 15 1 1
A.平均数       B.中位数
C.众数 D.无法确定
解析:选C 由于众数是数据中出现最多的数,故鞋厂最感兴趣的是销售量最多的鞋号即这组数据的众数.故选C.
2.某校举行“社会主义核心价值观”演讲比赛,学校对30名参赛选手的成绩进行了分组统计,结果如下表:
分数 x(分) 4≤x<5 5≤x<6 6≤x<7 7≤x<8 8≤x<9 9≤x<10
频数 2 6 8 5 5 4
由上可知,参赛选手分数的中位数所在的分数段为(  )
A.5≤x<6 B.6≤x<7
C.7≤x<8 D.8≤x<9
解析:选B 共有30个数,中位数是第15,16个数的平均数,而第15,16个数所在分数段均为6≤x<7,所以参赛选手分数的中位数所在的分数段为6≤x<7.故选B.
3.假期里小菲和小琳结伴去超市买水果,三次购买的草莓价格和数量如下表,从平均价格看,买得比较划算的是(  )
价格/(元/kg) 12 10 8 合计/kg
小菲购买的数量/kg 2 2 2 6
小琳购买的数量/kg 1 2 3 6
A.一样划算 B.小菲划算
C.小琳划算 D.无法比较
解析:选C  ∵小菲购买的平均价格是(12×2+10×2+8×2)÷6=10(元/kg),小琳购买的平均价格是(12×1+10×2+8×3)÷6=(元/kg),∴小琳划算.故选C.
4.某学校对100间学生公寓的卫生情况进行综合评比,考核分数分为A,B,C,D四个等级,其中分数在[60,70)内为D等级,分数在[70,80)内为C等级,分数在[80,90)内为B等级,分数在[90,100]内为A等级.考核评估后,得其频率分布折线图如图所示,估计这100间学生公寓评估得分的平均数是(  )
A.80.25 B.80.45
C.80.5 D.80.65
解析:选C 由折线图可知,A等级分数在[90,100]内的频率为0.025×10=0.25,B等级分数在[80,90)内的频率为0.020×10=0.20,C等级分数在[70,80)内的频率为0.040×10=0.40,D等级分数在[60,70)内的频率为0.015×10=0.15,则其评估得分的平均数为65×0.15+75×0.40+85×0.20+95×0.25=80.5.故选C.
5.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有(  )
A.a>b>c        B.b>c>a
C.c>a>b D.c>b>a
解析:选D 将数据从小到大排列为10,12,14,14,15,15,16,17,17,17,则平均数a=(10+12+14×2+15×2+16+17×3)=14.7,中位数b=15,众数c=17,
显然a<b<c.故选D.
6.有13位同学参加学校组织的才艺表演比赛,已知他们所得的分数互不相同,共设7个获奖名额,某同学知道自己的比赛分数后,要判断自己能否获奖,在这13名同学成绩的统计量中只需知道一个量,它是__________(填“众数”“中位数”或“平均数”).
解析:因为7位获奖者的分数肯定是13名参赛选手中最高的,所以把13个不同的分数按从小到大排序,只要知道自己的分数和中位数就可以知道是否获奖了.
答案:中位数
7.某中学开展演讲比赛活动,高一(1)、高一(2)班根据初赛成绩各选出5名选手参加复赛,两个班各选出的5名选手的复赛成绩(满分为100分)如下图所示.
(1)根据上图填写下表:
平均分(分) 中位数(分) 众数(分)
高一(1)班 85
85
高一(2)班 85 80
(2)结合两班复赛成绩的平均数和中位数,分析哪个班级的复赛成绩较好;
(3)如果在每班参加复赛的选手中分别选出2人参加决赛,你认为哪个班的实力更强一些?说明理由.
解:(1)85 100
(2)∵两班的平均数相同,高一(1)班的中位数高,
∴高一(1)班的复赛成绩好些;
(3)∵高一(1)、高一(2)班前两名选手的平均分分别为92.5分,100分,∴在每班参加复赛的选手中分别选出2人参加决赛,高一(2)班的实力更强一些.
C级——拓展探索性题目应用练
在喜迎“中华人民共和国成立70周年”之际,某校举办校园唱红歌比赛,选出10名同学担任评委,并事先拟定从如下四种方案中选择合理方案来确定演唱者的最后得分(每个评委打分最高10分).
方案1:所有评委给分的平均分;
方案2:在所有评委中,去掉一个最高分和一个最低分,再计算剩余评委的平均分;
方案3:所有评委给分的中位数;
方案4:所有评委给分的众数.
为了探究上述方案的合理性,
先对某个同学的演唱成绩进行统计实验,下图是这个同学的得分统计图:
(1)分别按上述四种方案计算这个同学演唱的最后得分;
(2)根据(1)中的结果,请用统计的知识说明哪些方案不适合作为这个同学演唱的最后得分?
解:(1)方案1:最后得分为×(3.2+7.0+7.8+3×8+3×8.4+9.8)=7.7;
方案2:最后得分为×(7.0+7.8+3×8+3×8.4)=8;
方案3:最后得分为8;
方案4:最后得分为8和8.4;
(2)因为方案1中的平均数受极端数值的影响,不适合作为这个同学演讲的最后得分,所以方案1不适合作为最后得分的方案.因为方案4中的众数有两个,众数失去了实际意义,所以方案4不适合作为最后得分的方案.
9.2.4 总体离散程度的估计
新课程标准 新学法解读
结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义. 1.方差、标准差是本节学习的重点,必须掌握相关的计算方法并能正确求解.
2.能够根据实际问题的需求,选择恰当的抽样方法获取样本数据,并从中提取需要的参数估计总体.
1.下列说法中正确的个数为(  )
①数据的极差越小,样本数据分布越集中、稳定;
②数据的平均数越小,样本数据分布越集中、稳定;
③数据的标准差越小,样本数据分布越集中、稳定;
④数据的方差越小,样本数据分布越集中、稳定.
A.1        B.2
C.3 D.4
解析:选C 由数据的极差、标准差、方差的定义可知,它们都可以影响样本数据的分布和稳定性,而数据的平均数则与之无关,故②不正确,①③④正确.
2.现有10个数,其平均数为3,且这10个数的平方和是100,那么这组数据的标准差是(  )
A.1 B.2
C.3 D.4
解析:选A 由s2=-2,得s2=×100-32=1,∴s=1.
3.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为(  )
A.9.4,0.484      B.9.4,0.016
C.9.5,0.04 D.9.5,0.016
解析:选D ==9.5,
s2=(0.12×4+0.22)=0.016.
4.国家射击队要从甲、乙、丙、丁四名队员中选出一名选手去参加射击比赛,四人的平均成绩和方差如下表:
甲 乙 丙 丁
平均成绩 8.5 8.8 8.8 8
方差s2 3.5 3.5 2.1 8.7
则应派________参赛最为合适.
解析:由表可知,丙的平均成绩较高,且发挥比较稳定,应派丙去参赛最合适.
答案:丙
5.用一组样本数据8, x, 10, 11, 9来估计总体的标准差,若该组样本数据的平均数为10,则总体标准差s=______.
解析:∵该组样本数据的平均数为10,∴(8+x+10+11+9)÷5=10,∴x=12,∴s2=(4+4+0+1+1)=2,∴s=.
答案:
1.方差(标准差)
如果x1,x2,…,xn的平均数为,则方差可用s2表示.
s2=(xi-)2,如果a,b为常数,则ax1+b,ax2+b,…,axn+b的方差为s2a2.
方差的算术平方根为标准差,用s表示,即s=.
2.对方差、标准差的理解
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
(2)标准差、方差的取值范围:[0,+∞).
标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.
(3)标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.
(4)标准差的单位与样本数据一致.
(5)方差s2=-2.
标准差、方差、极差的计算
[例1] 某班20位女同学平均分为甲、乙两组,她们的劳动技术课考试成绩如下(单位:分):
甲组:60,90,85,75,65,70,80,90,95,80;
乙组:85,95,75,70,85,80,85,65,90,85.
试分别计算两组数据的极差、方差和标准差.
[解] 甲组:最高分为95分,最低分为60分,极差为95-60=35(分),
平均分为甲=×(60+90+85+75+65+70+80+90+95+80)=79(分),
方差为s=×[(60-79)2+(90-79)2+(85-79)2+(75-79)2+(65-79)2+(70-79)2+(80-79)2+(90-79)2+(95-79)2+(80-79)2]=119,
标准差为s甲= =≈10.91(分).
乙组:最高分为95分,最低分为65分,极差为95-65=30(分),
平均分为乙=×(85+95+75+70+85+80+85+65+90+85)=81.5(分),
方差为s=×[(85-81.5)2+(95-81.5)2+(75-81.5)2+(70-81.5)2+(85-81.5)2+(80-81.5)2+(85-81.5)2+(65-81.5)2+(90-81.5)2+(85-81.5)2]=75.25,
标准差为s乙= =≈8.67(分).
计算标准差的5步骤
(1)求出样本数据的平均数.
(2)求出每个样本数据与样本平均数的差xi-(i=1,2,…,n).
(3)求出xi-(i=1,2,…,n)的平方值.
(4)求出上一步中n个平方值的平均数,即为样本方差.
(5)求出上一步中平均数的算术平方根,即为样本标准差.    
[变式训练]
1.一组样本数据a,3,5,7的平均数是b,且a,b是方程x2-5x+4=0的两根,则这个样本的方差是(  )
A.3         B.4
C.5 D.6
解析:选C  x2-5x+4=0的两根为1,4,当a=1时,a,3,5,7的平均数是4;当a=4时,a,3,5,7的平均数不是1,所以a=1,b=4,s2=×[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5.
2.一农场在同一块稻田中种植一种水稻,其连续8年的产量(单位:kg)如下:450,430,460,440,450,440,470,460,则该组数据的方差为________.
解析:根据题意知,该组数据的平均数为=×(450+430+460+440+450+440+470+460)=450,
所以该组数据的方差为s2=×[(450-450)2+(430-450)2+(460-450)2+(440-450)2+(450-450)2+(440-450)2+(470-450)2+(460-450)2]=150.
答案:150
总体离散程度的估计
[例2] 甲、乙两名战士在相同条件下各打靶10次,每次命中的环数分别是:
甲:8,6,7,8,6,5,9,10,4,7;
乙:6,7,7,8,6,7,8,7,9,5.
(1)分别计算以上两组数据的平均数;
(2)分别求出两组数据的方差;
(3)根据计算结果,估计两名战士的射击情况.若要从这两人中选一人参加射击比赛,选谁去合适?
[解] (1)甲=×(8+6+7+8+6+5+9+10+4+7)=7(环),
乙=×(6+7+7+8+6+7+8+7+9+5)=7(环).
(2)由方差公式s2=[(x1-)2+(x2-)2+…+(xn-)2],得s=3,s=1.2.
(3) 甲=乙,说明甲、乙两战士的平均水平相当.
又s>s,说明甲战士射击情况波动比乙大.
因此,乙战士比甲战士射击情况稳定.从成绩的稳定性考虑,应选择乙参加比赛.
研究两个样本的波动情况或比较它们的稳定性、可靠性等性能好坏的这类题,先求平均数,比较一下哪一个更接近标准,若平均数相等,则再比较两个样本方差的大小来作出判断.    
[变式训练]
 甲、乙两机床同时加工直径为100 cm的零件,为检验质量,从中抽取6件,测量数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算说明哪台机床加工零件的质量更稳定.
解:(1)甲=[99+100+98+100+100+103]=100,
乙=[99+100+102+99+100+100]=100,
s=[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
s=[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)由(1)知甲=乙,比较它们的方差,∵s>s,
故乙机床加工零件的质量更稳定.
A级——学考合格性考试达标练
1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是(  )
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
解析:选B 标准差能反映一组数据的稳定程度.故选B.
2.某高三学生在连续五次月考中的数学成绩(单位:分)为:90,90,93,94,93,则该学生在这五次月考中数学成绩数据的平均数和方差分别为(  )
A.92,2.8       B.92,2
C.93,2 D.93,2.8
解析:选A 该学生在这五次月考中数学成绩数据的平均数为=×(90+90+93+94+93)=92,
方差为s2=×[(90-92)2+(90-92)2+(93-92)2+(94-92)2+(93-92)2]=2.8.故选A.
3.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本方差为(  )
A.    B.    C.    D.2
解析:选D 由题可知样本的平均数为1,
所以=1,解得a=-1,
所以样本的方差为
s2=[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.故选D.
4.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有引起大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是(  )
A.甲地:总体均值为3,中位数为4
B.乙地:总体均值为1,总体方差大于0
C.丙地:中位数为2,众数为3
D.丁地:总体均值为2,总体方差为3
解析:选D 根据信息可知,连续10天内,每天新增的疑似病例不能超过7人,选项A中,中位数为4,可能存在大于7的数;同理,在选项C中也有可能;选项B中的总体方差大于0,叙述不明确,如果方差太大,也有可能存在大于7的数;选项D中,根据方差公式,如果有大于7的数存在,那么方差不可能为3.故选D.
5.北京市2017年12个月的PM2.5平均浓度指数如图所示.由图判断,四个季度中PM2.5的平均浓度指数方差最小的是(  )
A.第一季度 B.第二季度
C.第三季度 D.第四季度
解析:选B 由图可知,第二季度的数据波动性最小,所以第二季度的PM2.5平均浓度指数方差最小.故选B.
6.小明5次上学途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为________.
解析:由题意可得x+y=20,(x-10)2+(y-10)2=8,
设x=10+t,y=10-t,则t2=4,|t|=2,故|x-y|=2|t|=4.
答案:4
7.已知总体的各个个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,21,且总体的中位数为10,若要使该总体的方差最小,则ab=________.
解析:由题意得a+b=10×2=20,要使该总体的方差最小,方差化简后即满足(a-10)2+(b-10)2最小,故a=b=10,ab=100.
答案:100
8.已知一组正数x1,x2,x3,x4的方差s2=(x+x+x+x-16),则数据x1+2,x2+2,x3+2,x4+2的平均数为________.
解析:设正数x1,x2,x3,x4的平均数为,则s2=[(x1-)2+(x2-)2+(x3-)2+(x4-)2],得s2=(x+x+x+x)-2,又已知s2=(x+x+x+x-16)=(x+x+x+x)-4,所以2=4,所以=2,故[(x1+2)+(x2+2)+(x3+2)+(x