2021-2022学年新教材高中数学第六章统计学案(含解析)(7份打包)北师大版必修第一册

文档属性

名称 2021-2022学年新教材高中数学第六章统计学案(含解析)(7份打包)北师大版必修第一册
格式 zip
文件大小 3.1MB
资源类型 教案
版本资源 北师大版(2019)
科目 数学
更新时间 2022-03-22 08:58:15

内容文字预览

普查和抽查 总体和样本
新课程标准解读 核心素养
1.知道获取数据的基本途径,包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等 数学抽象
2.了解总体、样本、样本量的概念,了解数据的随机性 数据分析
“九五”期间关于抽查方法的研究与应用在我国开展得如火如荼.例如,交通部建立了统计抽查系统,交通运输的大量统计数据已基本由抽查方法获得.并且许多行业对本部门关心的问题进行抽查,不少部门就公众关注的热点问题开展公众调查,有的报刊还定期刊登公众调查的调查报告.我国90年代初成立了不少市场调查公司,经过几年的大浪淘沙,现在全国生存下来的公司经营状况不错.网上调查、电话调查在我国也健康发展.有关抽样调查的理论,如非抽样误差控制的研究也得到统计界的广泛重视.抽样调查在生产、生活中的作用非常大.
[问题] 你知道获取数据的途经有哪些吗?
                                    
                                    
                                    
知识点一 获取数据的途径
1.直接获取与间接获取数据
(1)直接获取是指通过社会调查或观察、试验等途径获取数据.直接获取的数据称为直接数据或一手数据;
(2)间接获取是指借助各种媒介,包括报纸杂志、统计报表和年鉴、广播、电视或互联网等获取数据.间接获取的数据称为间接数据或二手数据.
1.在直接获取数据时,应注意数据来源的广泛性、代表性、均衡性.
2.如果需要获取的数据较多,可考虑间接获取数据,恰当地运用间接数据往往能够节约大量的时间和费用.    
2.普查与抽查
(1)普查是为了掌握调查对象的整体情况,对全体调查对象进行研究的一种调查方式;
(2)从全体调查对象中,按照一定的方法抽取一部分对象作为代表进行调查分析,并以此推断全体调查对象的状况.这种抽取一部分对象的调查方式叫作抽样调查,简称抽查.
1.下列是间接获取数据的方法有________.(填序号)
①访问调查;②查阅文献;③电话调查;④座谈会;⑤个别深度访问;⑥网上调查.
解析:由直接获取和间接获取的概念,知①③④⑤属于直接获取数据的方法,②⑥属于间接获取数据的方法.
答案:②⑥
2.为了准确地调查我国某一时期的全国总人口、各民族人口、城乡人口、各种受教育程度的人口、流动人口等多方面的情况,需要用________的方法进行调查.(填“抽样调查”或“普查”)
解析:普查是为了掌握调查对象的整体情况,对全体调查对象进行研究的一种调查方式.要准确地调查多方面的情况,应当用普查的方法进行调查.
答案:普查
知识点二 总体和样本
1.总体
一般地,当问题明确后,调查对象的范围也就随之确定,调查对象的全体称为总体.
2.样本和样本容量
在进行抽样调查时,从总体中抽取的部分称为样本,其过程称为抽样,样本中个体的数目称为样本容量,简称样本量.
3.总体的分布:总体中各类数据的百分比.
在抽样调查时,要尽可能地使得样本分布与总体分布相同.    
 从集合的角度看总体和样本,它们各有什么意义?
提示:总体就是全集,样本就是一个子集.
1.为了了解一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是(  )
A.总体         B.个体
C.总体的一个样本 D.样本容量
解析:选C 研究对象是这批零件的长度,总体是这批零件的长度,个体是每个零件的长度,样本是抽取的200个零件的长度,样本容量是200.
2.从一批零件中抽取10个,测得它们的长度(单位:cm)如下:
22.36 22.35 22.33 22.35 22.37
22.34 22.38 22.36 22.32 22.35
在此统计活动中:
(1)总体为:______________________;
(2)个体为:______________________;
(3)样本为:______________________;
(4)样本容量为:__________________.
答案:(1)这批零件的长度 (2)每个零件的长度
(3)抽取的10个零件的长度 (4)10
普查和抽查的选用问题
[例1] (链接教科书第146页例2)你认为下列调查用普查还是用抽样调查?并说明理由:
(1)调查某种绿豆的发芽率;
(2)调查《新闻联播》在某省的收视率;
(3)调查某批飞机零件的合格率;
(4)调查全国观众对中央电视台《春节联欢晚会》的满意程度.
[解] (1)的调查若用普查,付出的代价较大,故采用抽样调查;
(2)的调查对象的数量太多,普查难以完成,故采用抽样调查;
(3)中要求每个零件必须检查,否则易发生重大事故,故采用普查;
(4)的调查对象的数量太多,普查难以完成,故采用抽样调查.
1.判断是否采用普查获取有关信息的方法
(1)分析调查对象的性质,判断是否必须了解每一个个体的相关信息;
(2)确定总体个数,依此来判断采取普查是否可行.
2.根据调查问题的特点设计抽样调查的不同方案,应遵循以下原则:
(1)要考虑如何合理地获取样本,以确保其典型性、代表性.即抽取的部分个体具有广泛的代表性,能很好地代表总体;
(2)要考虑如何保证调查内容的真实性.
[提醒] 一般若需要调查所有对象,则选用普查的方式;若调查具有破坏性或无法实现,则选用抽查的方法.    
[跟踪训练]
 下列调查方式合适的是(  )
A.为了了解炮弹的杀伤力,采用普查的方式
B.为了了解全国中学生的睡眠状况,采用普查的方式
C.为了了解人们保护水资源的意识,采用抽样调查的方式
D.检查一批待售袋装牛奶的细菌是否超标,采用普查的方式
解析:选C 了解炮弹杀伤力的过程中具有破坏性,所以采用抽查的方式,故A选项错误;了解全国中学生的睡眠状况,工作量大,所以采用抽查的方式,故B选项错误;了解人们保护水资源的意识,工作量大,所以采用抽查的方式,故C选项正确;检查一批待售袋装牛奶中的细菌是否超标,具有毁损性,所以采用抽查的方式,故D选项错误.故选C.
抽取样本设计合理性问题
[例2] (链接教科书第148页例3、例4) 为调查某小区平均每户居民的月用水量,下面是2名同学设计的方案:
学生甲:我把这个小区用水量调查表放在互联网上,只要登录网站的人就可以看到这张表,他们填的表可以很快地反馈到我的电脑中,这样就可以很快估算出小区平均每户居民的月用水量;
学生乙:我给我们居民小区的每一个住户发一张用水量调查表,大概需要一周左右的时间就可以统计出小区平均每户居民的月用水量.
请你分析上述2名学生设计的调查方案,他们能够准确地获得平均每户居民的月用水量吗?为什么?
[解] 学生甲的方案得到的样本不能够反映不上网的居民的用水情况,它是一种方便样本,所得到的样本代表性差,不能准确地获得平均每户居民的月用水量.学生乙的方案实际上是普查,花费的人力、物力更多一些,但是只要统计过程不出错,就可以准确地得到平均每户居民的月用水量.
分析各个方案是否合理,要从各方案中所得的样本是否具有代表性及获取样本的工作量大小两个方面来考虑.    
[跟踪训练]
某校有高中学生900人,校医务室想对全体高中学生的身高情况做一次调查,为了不影响正常教学活动,准备抽取50名学生作为调查对象.校医务室从高一年级中抽取50名学生的身高来估计全校高中学生的身高,你认为这样的调查结果是否可信?
解:不可信.因为学生的身高会随着年龄的增长而增高,校医务室想了解全校高中学生的身高情况,在抽样时应当关注高中各年级学生的身高,并且还要分性别进行抽查.如果只抽取高一年级的学生,结果一定是片面的,所以调查结果不可信.
总体、样本概念辨析题
[例3] (多选)为确保食品安全,某市质检部门检查1 000袋方便面的质量,抽查总量的2%,在这个问题中,下列说法正确的是(  )
A.总体是指这1 000袋方便面的质量
B.个体是1袋方便面
C.样本是按2%抽取的20袋方便面
D.样本容量为20
[解析] 由题意知总体是指这1 000袋方便面的质量,A说法正确;个体是指1袋方便面的质量,B说法错误;样本是指按照2%抽取的20袋方便面的质量,C说法错误;样本容量为20,D说法正确.故选A、D.
[答案] AD
此类题目要正确理解总体与个体的概念,要弄明白概念的实质,并注意样本与样本容量的不同,其中样本容量为数目,无单位.    
[跟踪训练]
某校有1 740名学生,其中有1 000名男生,740名女生,为了了解全校1 740名学生的身高情况,从中抽取174名学生进行测量,下列最具有代表性的样本为(  )
A.174名男生的身高情况
B.174名女生的身高情况
C.100名男生的身高情况和74名女生的身高情况
D.100名男生和74名女生
解析:选C 由题意知总体是全校1 740名学生的身高情况,在抽取样本时,要尽可能地使得样本的分布与总体的分布相同.易知只有C选项符合题意.
1.(多选)下列说法正确的是(  )
A.普查是对所有的对象进行调查
B.样本不一定是从总体中抽取的,没有抽取的个体也可能是样本
C.当调查的对象很少时,普查是很好的调查方式,但当调查的对象很多时,普查要耗费大量的人力、物力和财力
D.普查不是在任何情况下都能实现的
解析:选ACD 因为样本必须是从总体中抽取的,没有抽取的个体不是样本,所以B的说法不正确.故选A、C、D.
2.医生要检验病人血液中血脂的含量,采取的调查方法应该是(  )
A.普查
B.抽查
C.既不能普查也不能抽查
D.普查与抽查都可以
解析:选B 医生要检验病人血液中血脂的含量,不可能将病人的所有血液都抽出来检查,因此不能用普查,只需抽出适量的血液作为样本来检验即可.
3.下面的四个问题中,可以用抽查方法的是(  )
A.检验10名参加计算机水平测试学生的成绩
B.银行对10万元现钞的真假进行检验
C.跳伞运动员检查20个伞包及伞的质量
D.检验一批汽车的防碰撞性能
解析:选D 根据抽查与普查的概念可知:A项,人数较少,可以普查;B项,10万元现钞的真假检验必须普查,不能放过任何一张假钞;C项,伞包及伞的质量决定人的生命,必须普查;D项,防碰撞性能的检验会对产品产生破坏,应采用抽查的方法.故选D.
4.为了了解全校1 740名学生的身高情况,从中抽取140名学生进行测量,下列说法正确的是(  )
A.总体是1 740 B.个体是每名学生
C.样本是140名学生 D.样本容量是140
解析:选D 本题考查的对象是1 740名学生的身高情况,故总体是1 740名学生的身高情况,个体是每名学生的身高情况,样本是140名学生的身高情况,样本容量是140.故选D.
5.国家统计局、国家残联决定对国家残疾人生活、就业等情况进行调查,小明设计的调查方案是在国家残联的网站上设立一个调查表,根据网站上的数据进行分析.你认为小明的方案________(填“合理”或“不合理”).
解析:很多残疾人不具有上网条件,因此获取的数据不具有代表性.
答案:不合理
PAGE
7简单随机抽样
新课程标准解读 核心素养
通过实例,了解简单随机抽样的含义及其解决问题的过程,掌握两种简单随机抽样方法:抽签法和随机数法 数学抽象
2020年11月第七次全国人口普查全面展开,人口普查的工作量是何等的巨大,那么一般的统计工作如何进行调查呢?仍然使用普查的方法吗?
[问题] 有一种调查的方法比较科学,那就是抽样调查,那么如何进行抽样呢?
                                    
                                    
                                    
知识点 简单随机抽样
1.随机抽样
在抽样调查中,每个个体被抽到的可能性均相同的抽样方法.
2.简单随机抽样
一般地,从N(N为正整数)个不同个体构成的总体中,逐个不放回地抽取n(1≤n3.抽签法
(1)定义:先把总体中的N(N为正整数)个个体编号,并把编号依次分别写在形状、大小相同的签上(签可以是纸条、卡片或小球等),再将这些号签放在同一个不透明的箱子里搅拌均匀.每次随机地从中抽取一个,然后将箱中余下的号签搅拌均匀,再进行下一次抽取.如此下去,直至抽到预先设定的样本容量;
(2)抽签法的具体步骤:
①给总体中的每个个体编号;
②抽签.
4.随机数法
(1)定义:先把总体中的N个个体依次编码为0,1,2,…,N-1,然后利用工具(转盘或摸球、随机数表、科学计算器或计算机)产生0,1,2,…,N-1中的随机数,产生的随机数是几,就选第几号个体,直至选到预先设定的样本容量;
(2)利用随机数表进行抽样的具体步骤:
①给总体中的每个个体编号;
②在随机数表中随机抽取某行某列作为抽样的起点,并规定读取方法;
③依次从随机数表中抽取样本号码,凡是抽到编号范围内的号码,就是样本的号码,并剔除相同的号码,直至抽满为止.
抽签法与随机数表法的异同点
抽签法 随机数表法
不同点 ①抽签法比随机数表法简单;②抽签法适用于总体中的个体数相对较少的情况 ①随机数表法要求编号的位数相同;②随机数表法适用于总体中的个体数相对较多的情况
相同点 ①都是简单随机抽样,并且要求被抽取样本的总体的个数有限;②都是从总体中逐个不放回地抽取
    
用随机数表进行简单随机抽样的规则是什么?
提示:(1)定方向:读数的方向(向左、向右、向上或向下都可以).
(2)读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,若得到的号码不在编号中或已被选用,则跳过,直到选满所需号码为止.
1.对于简单随机抽样,每个个体被抽到的机会(  )
A.相等        B.不相等
C.不确定 D.与抽取的次数有关
解析:选A 由简单随机抽样的概念可知,每个个体被抽到的机会相等,与抽取的次数无关.
2.某学校数学组要从11名数学老师中推选3名老师参加市里举办的教学能手比赛,制作了11个签,抽签中确保公平性的关键是(  )
A.制签 B.搅拌均匀
C.逐一抽取 D.抽取不放回
解析:选B 利用抽签法要做到搅拌均匀才具有公平性.
3.某班对八校联考成绩进行分析,利用随机数表法抽取样本时,先将70个同学按01,02,03,…,70进行编号,然后从随机数表第9行第9列的数开始向右读,则选出的第7个个体是(  )
(注:下为随机数表的第8行和第9行)
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
A.07 B.44
C.15 D.51
解析:选B 找到第9行第9列数开始向右读,符合条件的是29,64,56,07,52,42,44,故选出的第7个个体是44.
简单随机抽样的概念辨析
[例1] 下面的抽样方法是简单随机抽样吗?为什么?
(1)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签;
(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出1个零件进行质量检验后,再把它放回箱子里.
[解] (1)是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等机会的抽样.
(2)不是简单随机抽样.因为它是有放回抽样.
简单随机抽样的判断方法
判断所给的抽样是否为简单随机抽样的依据是简单随机抽样的四个特征:
[提醒] 教科书中简单随机抽样单指不放回简单随机抽样.    
[跟踪训练]
 (多选)已知下列抽取样本的方式,其中,不是简单随机抽样的是(  )
A.从无限多个个体中抽取100个个体作为样本
B.盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出1个零件进行质量检验后再把它放回盒子里
C.从20件玩具中一次性抽取3件进行质量检验
D.某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛
解析:选ABCD A中不是简单随机抽样,简单随机抽样中总体的个数是有限的,而题中是无限的;B中不是简单随机抽样,简单随机抽样是不放回地抽取,而题中是放回地抽取;C中不是简单随机抽样,简单随机抽样是逐个抽取,而题中是一次性抽取;D中不是简单随机抽样,原因是个子最高的5名同学是56名同学中特定的,不存在随机性,不是等可能抽样.故选A、B、C、D.
抽签法的应用
[例2] 某单位对口支援西部开发,现从报名的18名志愿者中选取6人组成志愿小组到西藏工作3年,请用抽签法设计抽样方案.
[解] 方案如下:
第一步,将18名志愿者编号,号码为:01,02,03,…,18.
第二步,将号码分别写在相同的纸条上,揉成团,制成号签.
第三步,将得到的号签放到一个不透明的盒子中,充分搅匀.
第四步,从盒子中依次取出6个号签,并记录上面的编号.
第五步,所得号码对应的志愿者就是志愿小组的成员.
抽签法的5个步骤
    
[跟踪训练]
 甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个入样,请用抽签法设计抽样方案?
解:第一步:将30个篮球,编号为01,02,…,30;
第二步,将以上30个编号分别写在外观、质地等无差别的小纸条上,揉成小球状,制成号签;
第三步,把号签放入一个不透明的盒子中,充分搅拌;
第四步, 从盒子中不放回地逐个抽取3个号签,并记录上面的号码;
第五步,找出与所得号码对应的篮球.
随机数表法及应用
[例3] (链接教科书第154页例1)现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检测,如何用随机数表法设计抽样方案?
[解] 第一步,将元件的编号调整为010,011,012,…,099,100,…,600.
第二步,在随机数表中任取一数作为开始,任选一方向作为读数方向.
第三步,从选中的数开始,按上步选取方向,每次读取三位,凡不在010~600中的跳过去不读,前面已经读过的数也跳过去不读,读满6个数为止.
第四步,以上选出的号码对应的元件就是要抽取的对象.
随机数表法抽样应抓住3个关键点
(1)编号:这里的所谓编号,实际上是总体中的每个个体对应一个编号,且每个编号位数相同;
(2)确定读数方向和规则:为了保证选取数字的随机性,应在面对随机数表之前就指出开始数字的纵横位置,然后确定读数方向;
(3)获取样本:读数在总体编号内的取出,而读数不在总体编号内的和已取出的舍去,依次下去,直至得到容量为n的样本.    
[跟踪训练]
总体由编号为00,01,02,…,18,19的20个个体组成.利用下面的随机数表选取6个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为________.
78 16 65 72 08 02 63 14 07 02 43 69 97 28 01 98
32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
解析:从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字组成的两位数中,小于20的编号依次为08,02,14,07,02,01,04,…,其中第2个编号和第5个编号都是02,重复.可知对应的数值为08,02,14,07,01,04,…,则第6个个体的编号为04.
答案:04
1.下列问题中,最适合用简单随机抽样的方法抽样的是(  )
A.某报告厅有32排座位,每排有40个座位,座位号是1至40.某次报告会坐满了观众,报告会结束以后为听取观众的意见,要留下32名观众进行座谈
B.从10台冰箱中抽取3台进行质量检验
C.某学校有教职工160人,其中行政人员16人,教师112人,后勤人员32人.教育部门为了解大家对学校机构改革的意见,要从中抽取20人
D.某乡农田有山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩,现抽取农田480亩估计全乡农田平均产量
解析:选B 对于A,总体容量较大,用简单随机抽样法比较麻烦;对于B,总体容量较少,用简单随机抽样法比较方便;对于C,由于教职工对这一问题的看法可能差异较大,不宜采用简单随机抽样法;对于D,总体容量较大,且各类农田的差别很大,不宜采用简单随机抽样法.故选B.
2.下列抽样实验中,适合用抽签法的有(  )
A.从某厂生产的3 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两工厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3 000件产品中抽取10件进行质量检验
解析:选B A、D两项总体容量较大,不适合用抽签法;对C项甲、乙两厂生产的产品质量可能差异明显.
3.某工厂的质检人员利用随机数表产生随机数的方法对生产的100件产品进行检验,对这100件产品采用下列编号方法:①01,02,…,100;②001,002,…,100;③00,01,…,99.其中正确的是(  )
A.①② B.①③
C.②③ D.③
解析:选C 利用随机数表产生随机数的方法抽取样本,总体中各个个体的编号必须位数相同,这样便于读数,故②③正确.
4.用随机数法从100名学生(其中男生25人)中抽取20人参加评教,某男生被抽到的机会是(  )
A. B.
C. D.
解析:选C 用随机数法进行抽样,每个学生被抽到的机会都相等,均为=.
PAGE
7分层随机抽样
新课程标准解读 核心素养
1.理解分层随机抽样的概念 数学抽象
2.掌握分层随机抽样的步骤,会利用分层随机抽样从总体中抽取样本 数学运算
3.能解决分层随机抽样中的计算问题 数学运算
4.能综合运用简单随机抽样与分层随机抽样解决相关问题 数学抽象
某电视台在互联网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数分别为:很喜欢4 800人,喜欢3 600人,一般1 800人,不喜欢1 800人.电视台为进一步了解观众的具体想法和意见,打算从这12 000人中抽取60人进行更为详细的调查.
[问题] 你认为应采取什么样的抽样方法呢?
                                    
                                    
                                    
知识点 分层随机抽样
将总体按其属性特征分成互不交叉的若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的个体,这种抽样方法通常叫作分层随机抽样.
关于分层随机抽样应注意的问题
(1)分层随机抽样中分多少层,如何分层要视具体情况而定,总的原则是每层内样本的差异要小,不同层之间样本的差异要大,且互不重叠;
(2)每一层抽取的个体数由样本容量乘以这一层的个体数在总体中所占的比例得到;
(3)各层抽样可以按简单随机抽样进行.    
如何理解“在每个类型中按照所占比例”?
提示:从N个个体中抽取n个个体,若将总体分为A,B,C三层,含有的个体数目分别是x,y,z,在A,B,C三层应抽取的个体数目分别是a,b,c,那么===.
1.某地区的高一新生中,来自东部地区的学生有2 400人,中部地区的学生有1 600人,西部地区的学生有1 000人.计划从中选取100人调查学生的视力情况,现已了解到来自东部、中部、西部三个地区学生的视力情况有较大差异,而这三个地区男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是(  )
A.抽签法 B.按性别分层随机抽样
C.随机数法 D.按地区分层随机抽样
解析:选D 由于该地区东部、中部、西部三个地区学生的视力情况有较大差异,故按地区分层随机抽样.故选D.
2.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,拟采用分层随机抽样的方法从他们中抽取一个容量为42的样本,则老年人、中年人、青年人分别应抽取的人数是(  )
A.7,11,18 B.6,12,18 
C.6,13,17  D.7,14,21
解析:选D 由题意,该单位老年人、中年人、青年人的人数比为1∶2∶3.由分层随机抽样的特点知,老年人应抽取的人数为×42=7,中年人应抽取的人数为×42=14,青年人应抽取的人数为×42=21,故选D.
3.为了落实“回天计划”,政府准备在回龙观、天通苑地区各建一所体育文化公园.针对公园中的体育设施需求,某社区采用分层抽样的方法对21岁至65岁的居民进行了调查.已知该社区21岁至35岁的居民有840人,36岁至50岁的居民有700人,51岁至65岁的居民有560人.若从36岁至50岁的居民中随机抽取了100人,则这次抽样调查抽取的总人数是________.
解析:这次抽样调查抽取的总人数是=300.
答案:300
分层随机抽样的概念
[例1] 下列问题中,最适合用分层随机抽样抽取样本的是(  )
A.从10名同学中抽取3人参加座谈会
B.红星中学共有学生1 600名,其中男生840名,防疫站对此校学生进行身体健康调查,抽取一个容量为200的样本
C.从1 000名工人中,抽取100人调查上班途中所用时间
D.从生产流水线上,抽取样本检查产品质量
[解析] A中总体所含个体无差异且个数较少,适合用简单随机抽样;C和D中总体所含个体无差异且个数较多,不适合分层随机抽样;B中总体所含个体差异明显,适合用分层随机抽样.
[答案] B
分层随机抽样的前提和遵循的两条原则
(1)前提:分层随机抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取;
(2)遵循的两条原则:①每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
②每层样本量与每层个体数量的比等于抽样比.    
[跟踪训练]
 某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适(  )
A.抽签法         B.简单随机抽样法
C.分层随机抽样法 D.随机数法
解析:选C 总体由差异明显的三部分构成,应选用分层随机抽样.故选C.
分层随机抽样中的相关计算问题
[例2] (链接教科书第156页例3)一个总体分为A,B,C三层,其个体数之比为5∶3∶2.若用分层随机抽样方法抽取容量为100的样本,则应从C中抽取________个个体.
[解析] 因为A,B,C三层个体数之比为5∶3∶2,又总体中每个个体被抽到的概率相等,所以分层随机抽样应从C中抽取100×=20个个体.
[答案] 20
[母题探究]
1.(变条件,变设问)若把本例个体数之比改为2∶3∶4,现用分层随机抽样方法抽出一个容量为n的样本,其中A层中的个体数为16,那么此样本容量为n=________.
解析:由于A层中的样本数为16,A层中的个体所占的比例为,故样本容量n=16÷=72.
答案:72
2.(变设问)若本例中的条件不变,问应从A中抽取多少个个体?
解:因为A,B,C三层个体数之比为5∶3∶2,
又总体中每个个体被抽到的概率相等,
所以分层随机抽样应从A中抽取100×=50个个体.
1.一个总体中有N个个体,用分层随机抽样的方法从中抽取一个容量为n的样本,若第i层的个体数为Ni,则第i层被抽取的个体数ni=·Ni.等式中含有四个量,已知其中任意三个量,就能求出第四个量.
2.在分层随机抽样中,注意以下关系:
(1)=;
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.    
[跟踪训练]
1.一支田径队有男运动员63人,女运动员45人,用分层随机抽样的方法从全体运动员中抽取一个容量为24的样本,则样本中女运动员人数是(  )
A.14 B.12
C.10 D.8
解析:选C 由题知样本中女运动员人数是24×=10.故选C.
2.某林场共有白猫与黑猫1 000只,其中白猫比黑猫多400只,为调查猫的生长情况,采用分层随机抽样的方法抽取一个容量为n的样本,若样本中黑猫有6只,则n=________.
解析:由题意,白猫、黑猫分别有700,300只,由分层随机抽样的特点,得=,解得n=20.
答案:20
分层抽样方案设计
[例3] (链接教科书第156页例4,157页例5)有以下两个案例:
案例一:从同一批次同类型号的10袋牛奶中抽取3袋分别检测三聚氰胺的含量;
案例二:某公司有员工800人,其中具有高级职称的有160人,具有中级职称的有320人,具有初级职称的有200人,其他人员120人,从中抽取容量为40的样本,了解他们的收入情况.
(1)你认为这两个案例分别应采用怎样的抽样方式较为合适?
(2)在你使用的分层随机抽样案例中写出抽样过程.
[解] (1)案例一用简单随机抽样,案例二用分层随机抽样.
(2)①分层,将总体分为具有高级职称、中级职称、初级职称及其他人员四层;
②确定抽样比q==;
③按抽样比确定各层应分别抽取的人数为8,16,10,6;
④按简单随机抽样的方法在各层确定相应的样本;
⑤汇总构成一个容量为40的样本.
分层随机抽样实施的五个步骤
(1)将总体按一定标准进行分层;
(2)计算;
(3)利用乘每层的个体数量确定每层抽取的个体数;
(4)在每一层进行抽样(可用简单随机抽样);
(5)最后将每一层抽取的样本汇总成总样本.    
[跟踪训练]
某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表所示:
很喜爱 喜爱 一般 不喜爱
2 435 4 567 3 926 1 072
电视台为了进一步了解观众的具体想法和意见,打算从中再抽取60人进行更为详细的调查,应怎样进行抽样?
解:采用分层随机抽样的方法,抽样比为=.
持“很喜爱”态度的有2 435人,应抽取2 435×≈12(人);
持“喜爱”态度的有4 567人,应抽取4 567×≈23(人);
持“一般”态度的有3 926人,应抽取3 926×≈20(人);
持“不喜爱”态度的有1 072人,应抽取1 072×≈5(人).
因此,采用分层随机抽样的方法在“很喜爱”“喜爱”“一般”“不喜爱”的人中应分别抽取12人、23人、20人、5人.
1.(多选)对下面三个事件最适宜采用的抽样方法判断正确的是(  )
①从某厂生产的3 000件产品中抽取600件进行质量检验;
②在一次诗词朗读比赛中,有10人的成绩在91~100分,40人的成绩在81~90分,10人的成绩低于80分,现在从中抽取12人的成绩了解有关情况;
③运动会服务人员为参加400 m决赛的6名同学安排跑道.
A.①②适宜采用分层随机抽样
B.②③适宜采用分层随机抽样
C.②适宜采用分层随机抽样
D.③适宜采用简单随机抽样
解析:选CD ①从某厂生产的3 000件产品中抽取600件进行质量检验,不满足分层随机抽样的方法;②总体由差异明显且互不重叠的几部分组成,若要从中抽取12人的成绩了解有关情况,适合采用分层随机抽样的方法;③运动会服务人员为参加400 m决赛的6名同学安排跑道,具有随机性,适合用简单随机抽样,故选C、D.
2.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区进行调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区采用分层随机抽样的方法抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为(  )
A.101 B.808
C.1 212 D.2 012
解析:选B 由题意,得=,解得N=808.
3.已知A,B,C三个社区的居民人数分别为600,1 200,1 500,现从中抽取一个样本量为n的样本,若从C社区抽取了15人,则n=(  )
A.33 B.18
C.27 D.21
解析:选A 由题意,知应采用分层随机抽样的方法,则=,解得n=33.故选A.
4.某单位工作人员的构成如图所示,现采用分层随机抽样的方法抽取工作人员进行薪资情况调查.若管理人员抽取了6人,则抽到的讲师人数为________.
解析:由题意,设抽到的讲师人数为x,则=,解得x=9.
答案:9
PAGE
7从频数到频率 频率分布直方图
新课程标准解读 核心素养
能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性 数据分析、直观想象
与传统相机比较,在数码相机中,有一种十分实用的功能,这就是直方图显示功能.直方图就是通过在LCD上显示出来的曝光量柱形图来确定照片曝光量大小的工具,通过直方图的横轴和纵轴我们可以直观地看出拍摄的照片的曝光情况,在拍摄时能给摄影者带来很大的方便.
[问题] 你会画这样的柱形图吗?
                                    
                                    
                                    
知识点一 从频数到频率
1.频率表示频数与总数的比值.
2.频率反映了相对总数而言的相对强度,其所携带的总体信息远超过频数.在实际问题中,如果总体容量比较小,频数也可以较客观地反映总体分布;当总体容量较大时,频率就更能客观地反映总体分布.
 容量为100的样本数据被分为6组,如表:
组号 1 2 3 4 5 6
频数 14 17 18 20 x 15
第5组的频率是(  )
A.0.15          B.0.16
C.0.18 D.0.20
答案:B
知识点二 频率分布直方图
1.定义:频率分布直方图中每个小矩形的底边长是该组的组距,每个小矩形的高是该组的频率与组距的比,从而每个小矩形的面积等于该组的频率,即每个小矩形的面积=组距×=频率.我们把这样的图叫作频率分布直方图.
2.频率分布直方图与频率的关系
频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小.
3.频率分布直方图的好处
(1)能清楚直观地显示各组频率分布情况及各组频率之间的差别;
(2)当考虑数据落在若干个组内的频率之和时,可以用相应矩形面积之和来表示.
4.画频率分布直方图的步骤
(1)计算极差;(2)确定组距与组数;(3)分组;(4)列表;(5)画频率分布直方图.
5.频率折线图
在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
频率分布直方图应关注的问题
(1)一般地,样本容量越大,所分组数越多,为方便起见,组距的选择力求“取整”,当样本容量不超过120时,按照数据的多少,通常分成5~12组;
(2)画频率分布直方图时,同一组数据,分组时组距要相等,每个矩形的高与频率成正比,这点应特别注意.    
 频数分布直方图与频率分布直方图有什么不同?
提示:频数分布直方图能使我们清楚地知道数据分布在各个小组的个数,而频率分布直方图则是从各小组数据在所有数据中所占的比例大小的角度来表示数据分布的规律.
 对某活动中800名志愿者的年龄抽样调查,统计后得到频率分布直方图(如图),但是年龄组[25,30)的数据不慎丢失,依据此图回答以下问题:
(1)年龄组[25,30)对应小矩形的高度为________;
(2)据此估计本次活动中志愿者年龄在[25,35)内的人数为________.
解析:(1)设年龄组[25,30)对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.
(2)由(1)得志愿者年龄在[25,35)内的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)内的人数约为0.55×800=440.
答案:(1)0.04 (2)440
知识点三 其他统计图表
统计图表 主要应用
扇形图 直观描述各类数据占总数的比例
条形图 直观描述不同类别或分组数据的频数和频率
几种表示样本分布的方法的比较
表示样本分布的方法 优点 缺点
频率分布表 在数量表示上比较确切 不够直观、形象,损失了样本的一些信息,分析数据分布的总体态势不够方便
频率分布直方图 能够很容易地表示大量数据,非常直观地表示数据分布的情况,能看到在频率分布表中看不清楚的数据模式 从直方图本身不能得出原始的数据内容,把数据表示成直方图后,原有的数据信息被抹掉了
折线图 反映了数据的变化趋势 原有的具体数据信息被抹掉了
条形图 能够使人们一眼看出各个数量的多少,易于比较数据之间的差别 不能直观地看出各部分占总体的百分比
扇形图 能反映部分与整体的关系,可以清楚地看出各部分所占的百分比 不能看出各部分的数量
 要反映某市一周内每天的最高气温的变化情况,宜采用(  )
A.条形统计图 B.扇形统计图
C.折线统计图 D.频率分布直方图
解析:选C 描述数据随时间的变化趋势宜采用折线统计图.
频数与频率的有关计算
[例1] 已知一个容量是40的样本,把它分成六组,第一组到第四组的频数分别是5,6,7,10,第五组的频率是0.2,那么第六组的频数是________,频率是________.
[解析] 因为频率=,所以频数=频率×样本容量,因为第五组的频率是0.2,所以频数是0.2×40=8,第六组的频数是40-(5+6+7+10+8)=4,所以第六组的频率是=0.1.
[答案] 4 0.1
频数与频率的求解策略
对于频数与频率的问题,首先要明确几个等量关系,即各组的频数之和等于样本容量,各组的频率之和为1,频率=.在解题过程中,要明确频数、频率以及样本容量之间的关系,弄清已知、未知,选择合适的公式进行解题.    
[跟踪训练]
一个容量为20的样本数据,分组后组距与频数如下表:
组距 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]
频数 2 3 4 5 4 2
则样本数据在区间[10,50)上的频率为________.
解析:区间[10,50)包括四部分的数据,在这四部分上的数据的频数和是2+3+4+5=14,样本容量为20,所以样本数据在区间[10,50)上的频率为=0.7.
答案:0.7
频率分布直方图、频率折线图的画法
[例2] (链接教科书第161页例3)为了了解某片经济林的生长情况,随机测量其中的100棵树的底部周长,得到如下数据(单位:cm):
135 98 102 110 99 121 110 96 100 103
125 97 117 113 110 92 102 109 104 112
109 124 87 131 97 102 123 104 104 128
105 123 111 103 105 92 114 108 104 102
129 126 97 100 115 111 106 117 104 109
111 89 110 121 80 120 121 104 108 118
129 99 90 99 121 123 107 111 91 100
99 101 116 97 102 108 101 95 107 101
102 108 117 99 118 106 119 97 126 108
123 119 98 121 101 113 102 103 104 108
(1)列出频率分布表;
(2)画出频率分布直方图及频率折线图;
(3)估计该片经济林中底部周长小于100 cm的树占多少,底部周长不小于120 cm的树占多少.
[解] (1)这组数据的最大的数为135,最小的数为80,最大的数与最小的数的差为55,可将该组数据分为11组,组距为5.
频率分布表如下:
底部周长分组 频数 频率
[80,85) 1 0.01 0.002
[85,90) 2 0.02 0.004
[90,95) 4 0.04 0.008
[95,100) 14 0.14 0.028
[100,105) 24 0.24 0.048
[105,110) 15 0.15 0.030
[110,115) 12 0.12 0.024
[115,120) 9 0.09 0.018
[120,125) 11 0.11 0.022
[125,130) 6 0.06 0.012
[130,135] 2 0.02 0.004
(2)频率分布直方图和频率折线图如图所示.
(3)从频率分布表得,样本中底部周长小于100 cm的频率为0.01+0.02+0.04+0.14=0.21,样本中底部周长不小于120 cm的频率为0.11+0.06+0.02=0.19.所以估计该片经济林中底部周长小于100 cm的树占21%,底部周长不小于120 cm的树占19%.
绘制频率分布直方图应注意的2个问题
(1)在绘制出频率分布表后,画频率分布直方图的关键就是确定小矩形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“频率/组距”所占的比例来定高.如我们预先设定以“”为一个单位长度,代表“0.1”,则若一个组的为0.2,则该小矩形的高就是“”(占两个单位长度),如此类推;
(2)数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~120个左右时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.    
[跟踪训练]
 有一容量为50的样本,数据的分组及各组的频数如下:
[10,15),4;[15,20),5;[20,25),10;[25,30),11;[30,35),9;[35,40),8;[40,45],3.
(1)求出样本中各组的频率;
(2)画出频率分布直方图及频率折线图.
解:(1)由所给的数据,可得下表:
分组 频数 频率
[10,15) 4 0.08
[15,20) 5 0.10
[20,25) 10 0.20
[25,30) 11 0.22
[30,35) 9 0.18
[35,40) 8 0.16
[40,45] 3 0.06
(2)频率分布直方图如图①所示,频率折线图如图②所示.
频率分布直方图的应用
[例3] (链接教科书第163页思考交流)为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少?
[解] (1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为=0.08.
又因为第二小组频率=,
所以样本容量===150.
(2)由题图可估计该校高一学生的达标率约为
×100%=88%.
[母题探究]
1.(变设问)若本例条件不变,试求样本中不达标的学生人数.
解:由达标率为88%,样本容量为150,不达标的学生频率为1-0.88=0.12.所以样本中不达标的学生人数为150×0.12=18.
2.(变设问)若本例条件不变,试求第三小组的频数.
解:第三小组的频率为=0.34.
又因为样本容量为150.
所以第三小组的频数为150×0.34=51.
由频率分布直方图进行相关计算时,需掌握下列关系式:
(1)×组距=频率;
(2)=频率,此关系式的变形为:=样本容量,样本容量×频率=频数.    
[跟踪训练]
 某电子商务公司对10 000名网络购物者2020年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a=________;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.
解析:(1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.
(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.
因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.
答案:(1)3 (2)6 000
统计图的综合应用
[例4] 如图是根据某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,试根据折线统计图反映的信息,绘制该市3月1日到10日最低气温(单位:℃)的扇形统计图和条形统计图.
[解] 该城市3月1日至10日的最低气温(单位:℃)情况如下表:
日期/日 1 2 3 4 5 6 7 8 9 10
最低气温/℃ -3 -2 0 -1 1 2 0 -1 2 2
其中最低气温为-3 ℃的有1天,占10%;最低气温为-2 ℃的有1天,占10%;最低气温为-1 ℃的有2天,占20%;最低气温为0 ℃的有2天,占20%;最低气温为1 ℃的有1天,占10%;最低气温为2 ℃的有3天,占30%,扇形统计图和条形统计图如图所示.
1.条形图是用一个单位长度表示一定的数量或频率,根据数量的多少或频率的大小画成长短不同的矩形条,条形图能清楚地表示出每个项目的具体数目或频率.
2.扇形图是用整个圆面积表示总数(100%),用圆内的扇形面积表示各个部分所占总数的百分数.
3.在画折线图时,要注意明确横轴、纵轴的实际含义.    
[跟踪训练]
1.如图是根据某中学为地震灾区捐款的情况而制作的统计图.已知该校在校学生3 000人,根据统计图计算该校共捐款________元.
解析:根据统计图,得
高一人数为3 000×32%=960,捐款960×15=14 400(元);
高二人数为3 000×33%=990,捐款990×13=12 870(元);
高三人数为3 000×35%=1 050,捐款1 050×10=10 500(元).
所以该校学生共捐款14 400+12 870+10 500=37 770(元).
答案:37 770
2.甲、乙两个城市2021年4月中旬,每天的最高气温统计图如图所示,这9天里,气温比较稳定的城市是________.
解析:从折线统计图中可以很清楚的看到乙城市的气温变化较大,而甲城市气温相对来说较稳定,变化基本不大.
答案:甲
1.从一堆苹果中任取了20个,并得到它们的质量(单位:克)数据分布表如下:
分组 [100,110] (110,120] (120,130] (130,140] (140,150] (150,160]
频数 1 3 4 6 4 2
根据频数分布表,可以估计在这堆苹果中,质量大于130克的苹果数约占苹果总数的(  )
A.10%         B.30%
C.60% D.80%
解析:选C 根据频数分布表可知,===0.6,所以质量大于130克的苹果数约占苹果总数的60%.故选C.
2.有一个容量为200的样本,样本数据分组为[50,70),[70,90),[90,110),[110,130),[130,150],其频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在区间[90,110)内的频数为(  )
A.48 B.60
C.64 D.72
解析:选B 由(0.005 0+0.007 5+0.010 0+0.012 5+a)×20=1,解得a=0.015,所以样本数据落在区间[90,110)内的频率为0.015×20=0.3,所以样本数据落在区间[90,110)内的频数为200×0.3=60,故选B.
3.某班全体学生英语测试成绩(单位:分)的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是(  )
A.45 B.50
C.55 D.60
解析:选B 根据频率分布直方图,可知低于60分的人数的频率是(0.005+0.010)×20=0.3,所以该班的学生人数是=50.
4.(多选)如图给出的是某高校土木工程系大四55名学生期末考试专业成绩的频率折线图,其中组距为10,且本次考试中最低分为50分,最高分为100分.根据图中所提供的信息,下列结论中正确的是(  )
A.成绩是75分的人数为20
B.成绩是100分的人数比成绩是50分的人数多
C.成绩落在[70,90)内的人数为35
D.成绩落在[70,80)内的人数为20
解析:选CD 成绩落在[70,80)内的人数为10××55=20,不能说成绩是75分的人数为20,所以A错误,D正确;从频率折线图看不出成绩是100分的人数比成绩是50分的人数多,只能看出成绩落在[50,60)内的人数和成绩落在[90,100]内的人数相等,所以B错误;成绩落在[70,90)内的人数为×55=35,所以C正确.
5.交通管理部门为了解某一段公路上小汽车的行驶速度,随机抽取了200辆通过这一段公路的小汽车,其速度的频率分布直方图如图所示,则这200辆汽车中在该路段上行驶速度低于60 km/h的有________辆.
解析:由频率分布直方图,可知该路段上行驶速度低于60 km/h的有200×(0.01+0.03)×10=80(辆).
答案:80
PAGE
13样本的数字特征
新课程标准解读 核心素养
1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义 数据分析
2.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义 数学运算、数据分析
藏宝图只能够标出宝藏所在的具体位置及路线图,但真正探索宝藏的秘密还有很多工作要做,同样杂乱无章的数据仅用统计图表来分析显然是不全面的,不同的数字特征往往具有不同的意义和作用.
[问题] 你知道平均数、中位数、众数所代表的含义吗?
                                    
                                    
                                    
知识点一 平均数、中位数、众数
1.平均数:平均数是指一组数据的平均值.
2.中位数:将一组数据按从小到大的顺序排列后,“中间”的那个数据.
3.众数:一组数据中出现次数最多的数据.
4.平均数、中位数、众数都刻画了一组数据(样本)的“中心”位置,通常称它们为数据的集中趋势参数.
5.在统计中,平均数是最常用的量.如数据中个别数据特别大或特别小时,用中位数会更合理.
众数、中位数、平均数的比较
名称 优点 缺点
众数 ①体现了样本数据的最大集中点;②容易计算 ①它只能表达样本数据中很少的一部分信息;②无法客观地反映总体的特征
中位数 ①不受少数几个极端数据(即排序靠前或靠后的数据)的影响;②容易计算,便于利用中间数据的信息 对极端值不敏感
平均数 代表性较好,是反映数据集中趋势的量.一般情况下,可以反映出更多的关于样本数据的信息 任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
    
1.中位数一定是样本数据中的一个数吗?
提示:不一定.一组数据按大小顺序排列后,如果有奇数个数据,处于中间位置的数据就是中位数;如果有偶数个数据,则取中间两个数据的平均数才是中位数.
2.一组数据的众数可以有几个?中位数是否也具有相同的结论?
提示:一组数据的众数可能有一个,也可能有多个,中位数只有唯一一个.
1.某射击小组有20人,教练将他们某次射击的数据绘制成如下表格,则这组数据的众数和中位数分别是(  )
环数 5 6 7 8 9 10
人数 1 2 7 6 3 1
A.7,7          B.8,7.5
C.7,7.5 D.8,6
解析:选C 从表中数据可知7环有7人,人数最多,所以众数是7;中位数是将数据从小到大排列,第10个与第11个数据的平均数,第10个数是7,第11个数是8,所以中位数是=7.5.
2.已知一组数据的平均数是x,众数是m,中位数是n,将每个数据加上3后得到一组新数据,则这组新数据的平均数、众数、中位数分别为________.
解析:根据平均数的计算公式可得平均数变为x+3.因为原众数为m,原中位数为n,每个数据加上3后,m会变为m+3,n会变为n+3,所以众数变为m+3,中位数变为n+3.
答案:x+3,m+3,n+3
知识点二 极差、方差和标准差
1.极差:数据中最大值和最小值的差.
2.方差:方差刻画的是数据偏离平均数的离散程度.
3.标准差:方差的算术平方根s==eq \r(\f((x1-)2+(x2-)2+…+(xn-)2,n)),称之为标准差.
1.标准差、方差描述了一组数据围绕着平均数波动的大小,标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
2.标准差、方差为0时,表明样本数据全相等,数据没有波动幅度和离散性.
3.标准差的大小不会超过极差.    
1.方差和标准差的取值范围是什么?
提示:标准差、方差的取值范围是[0,+∞).
2.方差和标准差是如何反映一组数据的离散程度的?
提示:标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
某校一名篮球运动员在五场比赛中所得分数分别为8,9,10,13,15,则该运动员在这五场比赛中得分的平均值为________,方差为________,标准差为________.
解析:依题意知,运动员在5次比赛中的分数依次为8,9,10,13,15,其平均数为=11.
由方差公式得s2=[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=(9+4+1+4+16)=6.8.
s==.
答案:11 6.8 
平均数、众数、中位数的计算
[例1] 某工厂人员及周工资构成如表:
人员 经理 管理人员 高级技工 工人 学徒 合计
周工资/元 2 200 1 250 1 220 1 200 490
人数 1 6 5 10 1 23
(1)求工厂人员周工资的众数、中位数、平均数;
(2)平均数能客观地反映该工厂的工资水平吗?为什么?
[解] (1)由题中表格可知周工资的众数为1 200元,中位数为1 220元,平均数为(2 200+1 250×6+1 220×5+1 200×10+490)÷23=1 230(元).
(2)虽然平均数为1 230元,但从题干表格中所列出的数据可见,只有经理和6名管理人员的周工资在平均数以上,其余的人的周工资都在平均数以下,故用平均数不能客观真实地反映该厂的工资水平.
平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.
[提醒] 如果样本平均数大于样本中位数,说明数据中存在较大的极端值.    
[跟踪训练]
1.某射击运动员进行打靶练习,已知打十枪的靶数分别为9,10,7,8,10,10,6,8,9,7,设其平均数为a,中位数为b,众数为c,则有(  )
A.a>b>c       B.c>a>b
C.b>c>a D.c>b>a
解析:选D 平均数a=×(9+10+7+8+10+10+6+8+9+7)=8.4,中位数b=8.5,众数c=10,因此c>b>a,故选D.
2.已知样本数据x1,x2,…,xn的平均值=5,则样本数据2x1+1,2x2+1,…,2xn+1的平均值为________.
解析:由条件知==5,则所求平均值0==
=2+1=2×5+1=11.
答案:11
由频率分布直方图求平均数、中位数和众数
[例2] 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)求这次测试数学成绩的众数;
(2)求这次测试数学成绩的中位数.
[解] (1)由题图知众数为=75(分).
(2)由题图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.故这次测试数学成绩的中位数为73.3分.
[母题探究]
1.(变设问)若本例的条件不变,求数学成绩的平均分.
解:由题图知这次数学成绩的平均分为×0.005×10+×0.015×10+×0.02×10+×0.03×10+×0.025×10+×0.005×10=72(分).
2.(变设问)若本例条件不变,求80分以下的学生人数.
解:[40,80)分的频率为(0.005+0.015+0.020+0.030)×10=0.7,
所以80分以下的学生人数为80×0.7=56.
众数、中位数、平均数与频率分布直方图的联系
(1)众数:众数在样本数据的频率分布直方图中,就是最高矩形的底边中点的横坐标;
(2)中位数:在样本中,有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值;
(3)平均数:用频率分布直方图估计平均数时,平均数等于频率分布直方图中每个小矩形的面积乘以每个小矩形底边中点的横坐标之和.    
[跟踪训练]
某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.
求:(1)高一参赛学生成绩的众数、中位数;
(2)高一参赛学生的平均成绩.
解:(1)用频率分布直方图中最高矩形所在的区间的中点值作为众数的近似值,得众数为65分,又∵第一个小矩形的面积为0.3,设第二个小矩形底边的一部分长为x,则x×0.04=0.2,得x=5,∴中位数为60+5=65(分).
(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67(分),∴平均成绩约为67分.
极差、方差、标准差的计算及应用
[例3] (链接教科书第168页例3)从甲、乙两名学生中选拔一人参加射击比赛,对他们的射击水平进行了测试,两人在相同条件下各射击10次,命中的环数如下:
甲:7,8,6,9,6,5,9,9,7,4.
乙:9,5,7,8,7,6,8,6,7,7.
(1)分别计算甲、乙两人射击命中环数的极差、众数和中位数;
(2)分别计算甲、乙两人射击命中环数的平均数、方差、标准差;
(3)比较两人的成绩,然后决定选择哪一个人参赛.
[解] (1)对于甲:极差是9-4=5,众数是9,中位数是7;
对于乙:极差是9-5=4,众数是7,中位数是7.
(2)甲==7,
s=×[(7-7)2+(8-7)2+(6-7)2+(9-7)2+(6-7)2+(5-7)2+(9-7)2+(9-7)2+(7-7)2+(4-7)2]=2.8,
s甲=eq \r(s)=≈1.673.
乙==7,
s=×[(9-7)2+(5-7)2+(7-7)2+(8-7)2+(7-7)2+(6-7)2+(8-7)2+(6-7)2+(7-7)2+(7-7)2]=1.2,
s乙=eq \r(s)=≈1.095.
(3)∵甲=乙,s甲>s乙,
∴甲、乙两人的平均成绩相等,乙的成绩比甲的成绩稳定一些,从成绩的稳定性考虑,可以选择乙参赛.
在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度.在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中、越稳定.    
[跟踪训练]
甲、乙两位同学进行投篮比赛,每人玩5局.每局在指定线外投篮,若第1次不进,则再投第2次,依此类推,但最多只能投6次.当投进时,该局结束,并记下投篮的次数;若第6次投不进,该局也结束,记为“×”.在每局中, 第1次投进得6分,第2次投进得5分,第3次投进得4分,…,第6次投进得1分,若第6次投不进,得0分.两人的投篮情况如下:
第1局 第2局 第3局 第4局 第5局
甲 5次 × 4次 5次 1次
乙 × 2次 4次 2次 ×
请判断哪位同学投篮的水平较高.
解:甲同学投篮的水平较高.理由如下:
依题意,甲、乙两位同学的得分情况如下表:
第1局 第2局 第3局 第4局 第5局
甲 2 0 3 2 6
乙 0 5 3 5 0
通过计算,可得甲==2.6(分),
乙==2.6(分),
s=[(2-2.6)2+(0-2.6)2+(3-2.6)2+(2-2.6)2+(6-2.6)2]=3.84,
s=[(0-2.6)2+(5-2.6)2+(3-2.6)2+(5-2.6)2+(0-2.6)2]=5.04,
所以甲=乙,s故甲同学投篮的水平较高.
1.(多选)下列对一组数据的分析,说法正确的是(  )
A.数据极差越小,样本数据分布越集中、稳定
B.数据平均数越小,样本数据分布越集中、稳定
C.数据标准差越小,样本数据分布越集中、稳定
D.数据方差越小,样本数据分布越集中、稳定
解析:选ACD 极差反映了最大值与最小值差的情况,极差越小,数据越集中.方差、标准差是用来衡量一组数据波动大小的量,方差、标准差越大,表明这组数据偏离平均数越大,即波动越大,数据越不稳定.方差、标准差较小的数据波动较小,稳定程度较高.平均数越小,说明数据整体上偏小,不能反映数据稳定与否.故选A、C、D.
2.已知一组数据x1,x2,x3,x4,x5的平均数是2,方差是,那么另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数和方差分别为(  )
A.2, B.2,1
C.4, D.4,3
解析:选D 由题意得数据x1,x2,x3,x4,x5的平均数x=2,方差s2=,所以数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为x′=3x-2=3×2-2=4,方差为s′2=9s2=9×=3.
3.如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是(  )
A.12.5,12.5
B.12.5,13
C.13,12.5
D.13,13
解析:选B 众数是频率分布直方图中最高矩形的底边中点的横坐标.∵中间的一个矩形最高,10与15的平均数是12.5,∴众数是12.5.
中位数是把频率分布直方图分成两个面积相等部分的平行于纵轴的直线与横轴交点的横坐标.∵第一个矩形的面积是0.2,第三个矩形的面积是1-(0.04+0.10)×5=0.3,∴中位数线将第二个矩形分成3∶2两部分,∴中位数是13.故选B.
4.一组数据1,10,5,2,x,2,且2解析:根据题意知,该组数据的众数是2,则中位数是2÷=3,把这组数据从小到大排列为1,2,2,x,5,10,则=3,解得x=4,所以这组数据的平均数为x=×(1+2+2+4+5+10)=4.
答案:4
5.在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
成绩(单位:m) 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90
人数 2 3 2 3 4 1 1 1
分别求这些运动员成绩的众数、中位数与平均数.
解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70.
这组数据的平均数是x=(1.50×2+1.60×3+…+1.90×1)=≈1.69(m).
故17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.
PAGE
9分层随机抽样的均值与方差 百分位数
新课程标准解读 核心素养
1.结合实例,能用样本估计总体的取值规律.掌握分层随机抽样的均值与方差 数据分析
2.结合实例,能用样本估计百分位数,理解百分位数的统计含义 数据运算、数据分析
甲班和乙班各有学生20人、40人,甲班的数学成绩的平均数为80分,方差为2,乙班的数学成绩的平均数为82分,方差为4.
[问题] 甲班和乙班这60人的数学成绩的平均分是=81分吗?方差是=3吗?为什么?
                                    
                                    
                                    
知识点一 分层随机抽样的均值与方差
1.分层随机抽样的平均数
(1)一般地,将样本a1,a2,…,am和样本b1,b2,…,bn合并成一个新样本,则这个新样本的平均数为=·+·.
于是,当已知上述两层构成的新样本中每层的平均数分别为1和2时,可得这个新样本的平均数为1+2.记w1=,w2=,则这个新样本的平均数为w11+w22,其中w1,w2称为权重.
(2)设样本中不同层的平均数和相应权重分别为1,2,…,n和w1,w2,…,wn,则这个样本的平均数为w11+w22+…+wnn.为了简化表示,引进求和符号,记作w11+w22+…+wnn=ii.
2.分层随机抽样的方差
设样本中不同层的平均数分别为1,2,…,n,方差分别为s,s,…,s,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=i[s+(i-)2],其中为这个样本的平均数.
 已知某省二、三、四线城市数量之比为1∶3∶6,2020年8月份调查得知该省所有城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.8万元/平方米,三、四线城市房价的方差分别为10,8,则二线城市的房价的方差为________.
解析:设二线城市的房价的方差为s2,由题意可知20=[s2+(1.2-2.4)2]+[10+(1.2-1.8)2]+[8+(1.2-0.8)2],
解得s2=118.52,即二线城市的房价的方差为118.52.
答案:118.52
知识点二 百分位数
1.p分位数
一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点:总体数据中的任意一个数小于或等于它的可能性是p.
2.四分位数
25%,50%,75%分位数是三个常用的百分位数.把总体数据按照从小到大排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是.因此这三个百分位数也称为总体的四分位数.
3.计算p分位数的一般步骤
第1步,按照从小到大排列原始数据;
第2步,计算i=np;
第3步,若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数.
1.某班级人数为50,班主任老师说“90%的同学能够考取本科院校”,这里的“90%”是百分位数吗?
提示:不是.是指能够考取本科院校的同学占同学总数的百分比.
2.“这次数学测试成绩的70%分位数是85分”这句话是什么意思?
提示:有70%的同学数学测试成绩小于或等于85分.
1.下列关于一组数据的50%分位数的说法正确的是(  )
A.50%分位数就是中位数
B.总体数据中的任意一个数小于它的可能性一定是50%
C.它一定是这组数据中的一个数据
D.它适用于总体是离散型的数据
解析:选A 由百分位数的意义可知选项B、C、D错误.
2.5,6,7,8,9,10,11,12,13,14的25%分位数为________,75%分位数为________,90%分位数为________.
解析:由于共有10个数字,则10×25%=2.5,10×75%=7.5,10×90%=9.故25%分位数为7,75%分位数为12,90%分位数为=13.5.
答案:7 12 13.5
分层随机抽样背景下的样本数字特征估计
[例1] (链接教科书第171页例6)工厂为了解每个工人对某零件的日加工量,统计员分别从两车间抽取了甲、乙两人日加工量的两个样本.抽到甲的一个样本容量为10,样本平均数为5,方差为1;乙的一个样本容量为12,样本平均数为6,方差为2.现将这两组样本合在一起,求合在一起后的样本的平均数与方差.
[解] 设抽到甲的一个样本数据为x1,x2,…,x10;乙的一个样本数据为y1,y2,…,y12,
由题意知=i=5,方差s2=(xi-5)2=1,
=i=6,方差t2=(yi-6)2=2,
则合在一起后的样本容量为22,
w甲=,w乙=,
样本平均数为=w甲+w乙=×5+×6≈5.55,
样本方差为b2=w甲[s2+(-)2]+w乙[t2+(-)2]=+≈1.79.
求分层随机抽样背景下的样本平均数、方差
设样本中不同分层的平均数、方差和相应权重分别为1,2,…n、s,s,…,s和w1,w2,…,wn,则样本平均数=w11+w22+…+wnn=ii.
样本方差s2=i[s+(i-)2].    
[跟踪训练]
 在某学校为了调查高一年级学生每周的锻炼时间(单位:h),甲同学抽取了一个容量为10的样本,并算得样本的平均数为5,方差为9;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为16.已知甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,求合在一起后的样本均值与样本方差.
解:由题意知,甲同学抽取的样本容量m=10,样本平均值为=5,样本方差为s2=9;乙同学抽取的样本容量n=8,样本平均值为=6,样本方差t2=16.故合在一起后的样本平均值为w甲+w乙=×5+×6≈5.44.样本方差为w甲[s2+(5-5.44)2]+w乙[t2+(6-5.44)2]=[9+0.442]+[16+0.562]≈12.36.
百分位数的计算
[例2] (链接教科书第174页例7)从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,
8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的25%,75%,95%分位数;
(2)请你找出珍珠质量较小的前15%的珍珠质量;
(3)若用25%,50%,95%分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.
[解] (1)将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,
则25%分位数是=8.15,
75%分位数是=8.75,
95%分位数是第12个数据为9.9.
(2)因为共有12个数据,所以12×15%=1.8,则15%分位数是第2个数据为7.9.
即产品质量较小的前15%的产品有2个,它们的质量分别为7.8 g,7.9 g.
(3)由(1)可知珍珠质量的25%分位数是8.15 g,50%分位数为8.5 g,95%分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于或等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.
计算百分位数时,可先将这组数据按从小到大的顺序排列,再根据定义计算.    
[跟踪训练]
 某校年级组长为了解本校高三学生一模考试的数学成绩(单位:分),随机抽取30名学生的一模数学成绩,如下所示:
110 144 125 63 89 121 145 123 74 96
97 142 115 68 83 116 139 124 85 98
132 147 128 133 99 117 107 113 96 141
估计该校高三学生一模数学成绩的25%分位数为________分,50%分位数为________分.
解析:把这30名学生的数学成绩按从小到大的顺序排列,得63,68,74,83,85,89,96,96,97,98,99,107,110,113,115,116,117,121,123,124,125,128,132,133,139,141,142,144,145,147.因为30×25%=7.5,30×50%=15,所以这30名学生一模数学成绩的25%分位数为96分,50%分位数为=115.5(分).据此可以估计本校高三学生一模数学成绩的25%分位数为96分,50%分位数为115.5分.
答案:96 115.5
百分位数的应用
[例3] 某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式;
(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b的值;
(3)根据(2)中求得的数据计算用电量的75%分位数.
[解] (1)当0≤x≤200时,y=0.5x;
当200当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140.
所以y与x之间的函数解析式为
y=
(2)由(1)可知,当y=260时,x=400,即用电量不超过400千瓦时的占80%,
结合频率分布直方图可知
解得a=0.001 5,b=0.002 0.
(3)设75%分位数为m,
因为用电量低于300千瓦时的所占比例为(0.001+0.002+0.003)×100=60%,
用电量不超过400千瓦时的占80%,
所以75%分位数m在[300,400)内,所以0.6+(m-300)×0.002=0.75,
解得m=375千瓦时,即用电量的75%分位数为375千瓦时.
[母题探究]
(变设问)根据本例(2)中求得的数据计算用电量的15%分位数.
解:设15%分位数为x,
因为用电量低于100千瓦时的所占比例为0.001×100=10%,
用电量不超过200千瓦时的占30%,
所以15%分位数x在[100,200)内,所以0.1+(x-100)×0.002=0.15,
解得x=125千瓦时,即用电量的15%分位数为125千瓦时.
根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算,其次估计百分位数在哪一组,再应用方程的思想方法,设出百分位数,解方程可得.    
[跟踪训练]
 某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄分成5组(第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45]),得到如图所示的频率分布直方图,已知第一组有5人.
(1)求x;
(2)求抽取的x人的年龄的50%分位数(结果保留整数);
(3)以下是参赛的10人的成绩:90,96,97,95,92,92,98,88,96,99,求这10人成绩的20%分位数和平均数,以这两个数据为依据,评价参赛人员对“中国梦”的伟大构想的认知程度,并谈谈你的感想.
解:(1)第一组频率为0.01×5=0.05,所以x==100.
(2)由题图可知年龄低于30岁的所占比例为40%,年龄低于35岁的所占比例为70%,所以抽取的x人的年龄的50%分位数在[30,35)内,由30+5×=≈32(岁),所以抽取的x人的年龄的50%分位数为32岁.
(3)把参赛的10人的成绩按从小到大的顺序排列:
88,90,92,92,95,96,96,97,98,99,
计算10×20%=2,所以这10人成绩的20%分位数为=91(分),
这10人成绩的平均数为(88+90+92+92+95+96+96+97+98+99)=94.3(分).
评价:从百分位数和平均数来看,参赛人员的认知程度很高.
感想:略(结合本题和实际,符合社会主义核心价值观即可).
1.期中考试后,班长算出了全班40人数学成绩的平均分为M,如果把M当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均数为N,那么等于(  )
A.          B.1
C. D.2
解析:选B 平均数是用所有数据的和除以数据的总个数而得到的.设40位同学的成绩为xi(i=1,2,…,40),则M=,N==M,故=1.
2.下列一组数据的25%分位数是(  )
2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6
A.3.2 B.3.0
C.4.4 D.2.5
解析:选A 把这组数据按照由小到大排列,可得:2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,
由i=10×25%=2.5,不是整数,则第3个数据3.2,是25%分位数.
3.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,50%分位数为b,则有(  )
A.a=13.7,b=15.5 B.a=14,b=15
C.a=12,b=15.5 D.a=14.7,b=15
解析:选D 把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a=×(10+12+14+14+15+15+16+17+17+17)=14.7,50%分位数为b==15.
4.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示.估计棉花纤维的长度的90%分位数是(  )
A.32.5 mm B.33 mm
C.33.5 mm D.34 mm
解析:选A 棉花纤维的长度在30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在35 mm以下的比例为85%+10%=95%,
因此,90%分位数一定位于[30,35]内,由30+5×=32.5(mm),
可以估计棉花纤维的长度的90%分位数是32.5 mm.
PAGE
9章末复习与总结
一、数学抽象
学生能更好地理解数学概念、命题、方法和体系,能通过抽象、概括去认识、理解、把握事物的数学本质,能逐渐养成一般性思考问题的习惯.在本章中,数学抽象主要体现在随机抽样中.
随机抽样  
[例1] 问题:①某小区有800户家庭,其中高收入家庭200户,中等收入家庭480户,低收入家庭120户,为了了解有关家用轿车购买力的某个指标,要从中抽取一个容量为100的样本;②从10名学生中抽取3人参加座谈会.方法:(1)简单随机抽样;(2)分层随机抽样.则问题与方法配对正确的是(  )
A.①(1),②(2)        B.①(2),②(1)
C.①(1),②(1) D.①(2),②(2)
[解析] 问题①中的总体是由差异明显的几部分组成的,故可采用分层随机抽样方法;问题②中总体的个数较少,故可采用简单随机抽样.故匹配正确的是B.
[答案] B
二、数学运算
数学运算是解决数学问题的基本手段,是计算机解决问题的基础.在本章中,数学运算主要体现在计算百分位数、平均数、中位数、方差和标准差中.
百分位数的计算
[例2] 已知甲、乙两组数据(从小到大的顺序排列):
甲组:27,28,39,40,m,50;
乙组:24,n,34,43,48,52.
若这两组数据的30%分位数、80%分位数分别相等,则等于(  )
A.   B.   C.   D.
[解析] 因为30%×6=1.8,80%×6=4.8,所以30%分位数为n=28,80%分位数为m=48,所以==.
[答案] A
平均数、中位数的计算
[例3] 统计局就某地居民的月收入(单位:元)情况调查了10 000人,并根据所得数据画出了样本频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组表示月收入在[2 500,3 000)内.
(1)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层随机抽样的方法抽出100人作进一步分析,则月收入在[4 000,4 500)内的应抽取多少人?
(2)根据频率分布直方图估计样本数据的中位数;
(3)根据频率分布直方图估计样本数据的平均数.
[解] (1)因为(0.000 2+0.000 4+0.000 3+0.000 1)×500=0.5,所以a==0.000 5.又0.000 5×500=0.25,所以月收入在[4 000,4 500)内的频率为0.25,所以100人中月收入在[4 000,4 500)内的人数为0.25×100=25.
(2)因为0.000 2×500=0.1,0.000 4×500=0.2,0.000 5×500=0.25,0.1+0.2=0.3<0.5,0.1+0.2+0.25=0.55>0.5,所以中位数在区间[3 500,4 000)内,
所以样本数据的中位数是
3 500+=3 900.
(3)样本数据的平均数为(2 750×0.000 2+3 250×0.000 4+3 750×0.000 5+4 250×0.000 5+4 750×0.000 3+5 250×0.000 1)×500=3 900.
三、数据分析
数据分析是指针对研究对象获取数据,运用数学方法对数据进行整理、分析和推断,形成关于研究对象知识的素养.
数据分析过程主要包括:收集数据,整理数据,提取信息,构建模型,进行推断,获得结论.在本章中,数据分析主要体现在频率分布直方图及总体集中趋势的估计中.
频率分布直方图及应用
[例4] 为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下60株树木底部周长的50%分位数和75%分位数吗?
[解] 由题意知分别落在各区间上的频数为
在[80,90)上有60×0.15=9,
在[90,100)上有60×0.25=15,
在[100,110)上有60×0.3=18,
在[110,120)上有60×0.2=12,
在[120,130]上有60×0.1=6,
从以上数据可知50%分位数一定落在区间[100,110)上,
由100+10×=100+≈103.3(cm);
75%分位数一定落在区间[110,120)上,
由110+10×=110+=112.5(cm);
综上可知,50%分位数和75%分位数分别估计为103.3 cm,112.5 cm.
[例5] 从高三参加数学竞赛的学生中抽取50名学生的成绩,成绩的分组及各组的频数如下(单位:分):
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图和频率分布折线图;
(3)估计成绩在[60,90)分的学生比例;
(4)估计成绩在80分以下的学生比例.
[解] (1)频率分布表如下:
成绩分组 频数 频率
[40,50) 2 0.04
[50,60) 3 0.06
[60,70) 10 0.20
[70,80) 15 0.30
[80,90) 12 0.24
[90,100] 8 0.16
合计 50 1.00
(2)频率分布直方图和频率分布折线图如图所示:
(3)样本中所求学生的比例为0.20+0.30+0.24=0.74=74%.由样本估计总体,成绩在[60,90)分的学生约占74%.
(4)样本所求学生的比例为1-(0.24+0.16)=1-0.4=0.6=60%.
由样本估计总体,成绩在80分以下的学生约占60%.
数据的集中趋势和离散程度的估计
[例6] 设有两组数据x1,x2,…,xn与y1,y2,…,yn,它们的平均数分别是和,则新的一组数据2x1-3y1+1,2x2-3y2+1,…,2xn-3yn+1的平均数是(  )
A.2-3       B.2-3+1
C.4-9 D.4-9+1
[解析] 设zi=2xi-3yi+1(i=1,2,…,n),
则=(z1+z2+…+zn)=(x1+x2+…+xn)-(y1+y2+…+yn)+=2-3+1.
[答案] B
[例7] 某样本数据的频率分布直方图如图所示,则依据图形中的数据,可以估计总体的平均数与中位数分别是________,________.
[解析] 第1组的频率为0.04×5=0.2,第2组的频率为0.1×5=0.5,则第3组的频率为1-0.2-0.5=0.3,估计总体平均数为7.5×0.2+12.5×0.5+17.5×0.3=13.由题意知,中位数在第2组内,设为10+x,则有0.1x+0.2=0.5,解得x=3,从而中位数是13.
[答案] 13 13
[例8] 为了迎接2022年北京冬奥会,北京某城区举行“奥运知识”演讲比赛,中学组根据初赛成绩在高一、高二年级中分别选出10名同学参加决赛,这些选手的决赛成绩如图所示.
团体成绩 众数 极差 平均数 方差
高一年级 22 39.6
高二年级 85.7 27.8
(1)请把上边的表格填写完整;
(2)考虑平均数与方差,你认为哪个年级的团体成绩更好些?
[解] (1)高一年级的成绩为80,87,89,80,88,99,80,77,91,86;
高二年级的成绩为85,97,85,87,85,88,77,87,78,88.
由此可知高一年级成绩的众数是80,平均数=85+(-5+2+4-5+3+14-5-8+6+1)=85.7;
高二年级成绩的众数是85,极差是20.
(2)因为两个年级的得分的平均数相同,高二年级成绩的方差小,说明高二年级的成绩偏离平均数的程度小,所以高二年级的团体成绩更好些.
PAGE
5