新人教A版必修第二册 第九章 统计 课件(7份打包)

文档属性

名称 新人教A版必修第二册 第九章 统计 课件(7份打包)
格式 zip
文件大小 7.7MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2023-11-12 16:10:08

文档简介

(共44张PPT)
9.1.1 简单随机抽样
预 学 案
共 学 案
预 学 案
一、全面调查与抽样调查
1.全面调查(普查):对________调查对象都进行调查的方法,称为全面调查,又称普查.
总体:调查对象的________.
个体:组成总体的________调查对象.
2.抽样调查:根据一定目的,从总体中抽取________个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法.
样本:从总体中抽取的________个体.
样本量:样本中包含的________.
每一个
全体
每一个
一部分
那部分
个体数
【即时练习】 某校期末考试后,为了分析该校高一年级1 000名学生的成绩,从中抽取了100名学生的成绩单进行调查.就这个问题来说,下面说法正确的是(  )
A.1 000名学生是总体 B.每名学生是个体
C.100名学生的成绩是一个个体 D.样本的容量是100
答案:D
解析:由随机抽样的基本概念可得,D正确.故选D.
二、简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n相等
相等
放回
【即时练习】 下列抽样方法是简单随机抽样的是(  )
A.从100个学生家长中一次性随机抽取10人做家访
B.从38本教辅参考资料中有放回地随机抽取3本作为教学参考
C.从偶数集中一次性抽取20个进行奇偶性分析
D.某参会人员从最后一排20个座位中随机选择一个坐下
答案:D
解析:A选项错在“一次性”抽取;B选项错在“有放回”抽取;C选项错在“一次性”“总体容量无限”.故正确选项为D.
三、简单随机抽样的方法
1.抽签法:先给总体中的N个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个________的盒里,充分搅拌.最后从盒中________地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体.
2.随机数法:先把总体中的个体编号,用随机数工具产生与总体中个体数量相等的整数随机数,把产生的随机数作为抽中的编号,并剔除重复的编号,直到抽足样本所需要的个体数.
不透明
不放回
【即时练习】 判断正误(正确的画“√”,错误的画“×”)
(1)在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取有关,第一次抽到的可能性最大.(  )
(2)抽签法中,先抽的人抽中的可能性大.(  )
(3)在使用随机数法时,各个个体的编号位数要相同.(  )
×
×

四、用样本的平均数估计总体的平均数
1.总体平均数:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称=___________________为总体均值,又称总体平均数.
2.样本平均数:如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称==为________,又称样本平均数.

样本均值
【即时练习】 某学校抽取100位老师的年龄,得到如下数据:
估计这个学校老师的平均年龄为________岁.
年龄(单位:岁) 32 34 38 40 42 43 45 46 48
频数 2 4 20 20 26 10 8 6 4
41
解析:=×(32×2+34×4+38×20+40×20+42×26+43×10+45×8+46×6+48×4)≈41(岁),即这个学校老师的平均年龄约为41岁.
微点拨
(1)全面调查的优点是精确,缺点是不易操作,需要耗费巨大的人力、物力.
(2)抽样调查的优点是花费少,效率高,易操作,缺点是不够精确.
(3)区别总体与个体,样本与样本容量.
微点拨
(1)简单随机抽样必须具备的几个特点:
①被抽取样本的总体中的个体数N是有限的.
②抽取的样本个体数n小于或等于总体中的个体数N.
③每个个体入样的可能性均为.
(2)除非特殊声明,本章所称的简单随机抽样指不放回简单随机抽样.
微点拨
(1)当总体个数较少时采用抽签法.(2)产生随机数的方式有多种:①用随机试验生成随机数;②用信息技术生成随机数:(ⅰ)用计算器生成随机数,(ⅱ)用电子表格软件生成随机数,(ⅲ)用R统计软件生成随机数.
(3)如果生成的随机数有重复,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的数量.
微点拨
(1)不同样本的平均数不同,即样本的平均数具有随机性;
(2)大部分样本平均数离总体平均数不远,在总体平均数附近波动;
(3)增加样本容量可以提高估计效果.
共 学 案
【学习目标】 (1)了解简单随机抽样的含义.(2)掌握两种简单随机抽样方法:抽签法和随机数法.(3)了解样本均值与总体均值的关系,会计算样本均值.
题型 1 全面调查与抽样调查
【问题探究1】 为了解我校高一学生的体重指数,对全校1 000名高一学生进行调查分析,测量其身高和体重,计算其体重指数.
(1)像这样,对每一名学生都进行调查的方法称为什么?
(2)全校1 000名高一学生和每一名学生分别称为什么?
(3)如果从全校1 000名高一学生中抽取200名进行身高和体重测量登记,计算其体重指数,并以此估计全校高一学生的体重指数,这种调查方法称为什么?
(4)在(3)中抽取的200名高一学生称为什么?数字200又是什么?
提示:(1)全面调查,又称普查.
(2)总体,个体.
(3)抽样调查.
(4)样本,样本量.
例1 一名交警在高速公路上随机观测6辆车的行驶速度,然后做了一份报告,调查结果如下:
(1)交警采取的是________调查方式.
(2)为了强调调查目的,这次调查的样本是______________,个体是________________.
车序号 1 2 3 4 5 6
速度/(km/h) 66 65 71 54 69 58
抽样
6辆车的行驶速度
每一辆车的行驶速度
解析:(1)交警采取的是抽样调查,调查对象的指标是车的行驶速度.
(2)这次调查的样本是6辆车的行驶速度,个体是每一辆车的行驶速度.
学霸笔记:一般地,如果调查对象比较少,容易调查,则适合普查;如果调查对象较多或者具有破坏性,则适合抽样调查.
跟踪训练1 (多选)下列调查方式不合适的是(  )
A.为了了解某型号炮弹的杀伤力,采用普查的方式
B.为了了解全国中学生的睡眠状况,采用普查的方式
C.为了了解人们保护水资源的意识,采用抽查的方式
D.对“神舟十号”零部件的检查,采用抽查的方式
答案:ABD
解析:了解炮弹的杀伤力,采用普查方式就全销毁了,只能采用抽查方式;了解全国学生睡眠状况,采用普查方式费时费力,也是不必要的,应采用抽查方式;了解人们保护水资源的意识,采用普查方式费时费力,也是不必要的,应采用抽查方式;对于航天器零部件的检查,必须做到万无一失,应当采用普查的方式.故选ABD.
题型 2 简单随机抽样
【问题探究2】 假设口袋中有红球和白球共1 000个,除颜色外,小球的大小、质地完全相同.你能通过抽样调查的方法估计袋中红球所占的比例吗?
提示:我们可以从袋中随机地摸出一个球,记录颜色后放回,摇匀后再摸出一个球,如此重复,即可用红球出现的频率估计出红球的比例,也可以采用不放回地摸球去估计红球的比例.
例2 下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数个个体中抽取50个个体作为样本;
(2)质量监督部门从180种儿童玩具中选出18种玩具进行质量检验,在抽样过程中,从中任取一种玩具检验后再放回;
(3)国家跳水队挑出最优秀的10名跳水队员,备战2024年法国巴黎奥运会;
(4)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地逐个抽出7个号签.
解析:(1)不是简单随机抽样,因为简单随机抽样要求被抽取的样本总体的个数是有限的.
(2)不是简单随机抽样,因为简单随机抽样要求逐个不放回地抽取.
(3)不是简单随机抽样,因为这10名跳水队员是挑选出来的(最优秀的),每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能性”的要求.
(4)是简单随机抽样,因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.
学霸笔记:判断一个抽样方法是否属于简单随机抽样,只需要对简单随机抽样的4个特征(有限性、逐一性、不放回性、等可能性)进行验证,若全部满足,则该抽样方法为简单随机抽样,若有其中一条不满足,则不是简单随机抽样.
跟踪训练2 下列问题中最适合用简单随机抽样方法的是(  )
A.某学校有学生1 320人,卫生部门为了了解学生身体发育情况,准备从中抽取一个容量为300的样本
B.为了准备省政协会议,某政协委员计划从1 135个村庄中抽取50个进行收入调查
C.从全班30名学生中,任意选取5名进行家访
D.为了解某地区癌症的发病情况,从该地区的5 000人中抽取200人进行统计
答案:C
解析:对于A,不同年级的学生身体发育情况差别较大,适合用分层抽样,A不是;对于B,总体容量较大,并且各村庄人口、地域、发展等方面的差异,不宜用简单随机抽样,B不是;对于C,总体容量较小,个体之间无明显差异,适宜用简单随机抽样;对于D,总体容量较大,不同年龄的人癌症的发病情况不同,不宜用简单随机抽样,D不是.故选C.
题型 3 简单随机抽样的方法
【问题探究3】 3月15日是国际消费者权益日,有人举报某个体经商户出售的某品牌的节能灯是假的,工商局的质检员对该个体经商户出售的某品牌的节能灯进行检测.
(1)上述检测用什么方法比较好?
(2)在上述的事例中,质检人员在对某个体经商户所销售的节能灯进行抽检和对生产厂家所生产的节能灯进行抽检采取的方式一样吗?
提示:(1)由于个体经商户购进的节能灯数量不会很多,可以采取抽签法抽取产品进行检测.
(2)不一样,个体经商户销售的节能灯数量较少,可用抽签法(抓阄法),而生产厂家生产的节能灯太多,可用计算机按生产批号进行抽取.
例3 某卫生单位为了支援抗震救灾,要在50名志愿者中选取10人组成医疗小组去参加救治工作,请分别用抽签法和随机数法设计抽样方案.
解析:抽签法:
第一步,将50名志愿者编号,号码为01,02,03,…,50.
第二步,将号码分别写在相同的纸条上,揉成团,制成号签.
第三步,将得到的号签放到一个不透明的盒子中,充分搅匀.
第四步,从盒子中依次不放回地取出10个号签,并记录上面的编号.
第五步,与所得号码对应的志愿者就是医疗小组成员.
随机数法:
(1)将50名志愿者编号,号码为01,02,03,…,50.
(2)准备10个大小,质地均匀的小球,小球上分别写上数字0,1,2,…,9.
(3)把小球放入一个不透明的容器中,搅拌均匀,从容器中有放回地抽取2次,并把第一次、第二次抽到的小球上的数字分别作为十位、个位数字,这样就生成了一个随机数,如果这个随机数在1~50范围内,就代表了对应编号的志愿者被抽中,否则舍弃编号.
(4)重复抽取随机数,直到抽中10名志愿者为止.
题后师说
1.利用抽签法抽取样本的步骤
2.利用随机数法抽取样本的步骤
(1)编号:将每个个体编号,各号数的位数相同.
(2)选起始号码:任取某行、某组的某数为起始号码.
(3)确定读数方向:一般从左到右读取.
跟踪训练3 (1)下列抽样试验中,适合用抽签法的是(  )
A.从某厂生产的3 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3 000件产品中抽取10件进行质量检验
答案:B
解析:A中总体容量较大,样本量也较大,不适宜用抽签法;B中总体容量较小,样本量也较小,可用抽签法;C中甲、乙两厂生产的两箱产品有明显区别,不能用抽签法;D中虽然样本量较小,但总体容量较大,不适宜用抽签法.故选B.
(2)国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的未来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一名学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第三个号码为(  )
随机数表如下:
0154 3287 6595 4287 5346
7953 2586 5741 3369 8324
4597 7386 5244 3578 6241
A.13 B.24
C.33 D.36
答案:D
解析:根据随机数表的读取方法,第2行第4列的数为3,每次从左向右选取两个数字,所以第一组数字为32,作为第一个号码;第二组数字58,舍去;第三组数字65,舍去;第四组数字74,舍去;第五组数字13,作为第二个号码;第六组数字36,作为第三个号码,所以选取的第三个号码为36,故选D.
题型 4 用样本平均数估计总体平均数
【问题探究4】 在某地居民家庭年均收入调查中,小芳和小丽分别独立进行了简单随机抽样调查,小芳调查的样本平均数为4万,样本量为200;小丽调查的样本平均数为3.6万,样本量为500,你更愿意把哪个值作为总体平均数的估计?
提示:样本量越大,样本平均数就越接近总体的平均数,所以我们选用小丽调查的平均数作为总体的平均数.
例4 某工厂人员及工资构成如下:
(1)求该工厂所有人员的平均工资.
(2)工资的平均数能反映该厂的工资水平吗?为什么?
人员 经理 管理人员 高级技工 工人 学徒
月工资 10 000 5 000 4 000 3 000 2 000
人数 1 6 5 20 1
解析:(1)所有人员的平均工资=≈3 697.
(2)不能,因为大部分人员的工资不到平均工资,基本在平均工资以下.
学霸笔记:(1)在简单随机抽样中,我们常用样本均值去估计总体均值;
(2)总体均值是一个确定的数,样本均值具有随机性;
(3)一般情况,样本容量越大,估计值越准确.
跟踪训练4 在某次测量中,甲工厂生产的某产品的A样本数据如下:43,50,45,55,60.若乙工厂生产的该产品的B样本数据恰好是由A样本数据中的每个数都增加5后得到的,则B样本的均值为________.据此,可以估计乙工厂生产的该产品的总体均值为________.
解析:B样本数据的均值为A样本数据的均值加上5;
即=+5,
=(43+50+45+55+60)+5=55.6,
所以B样本数据的均值为55.6,
用B样本数据的均值估计乙工厂生产的该产品的总体均值,所以乙工厂生产的该产品的总体均值为55.6.
55.6
55.6
随堂练习
1.以下问题不适合用全面调查的是(  )
A.调查某班学生每周课前预习的时间
B.调查某中学在职教师的身体健康状况
C.调查全国中小学生课外阅读情况
D.调查某校篮球队员的身高
答案:C
解析:由于C中全国中小学生人数众多,全面调查费时费力,不适合全面调查,但ABD中的某班学生、某中学在职教师、某校篮球队员人数不多可进行全面调查.故选C.
2.在简单随机抽样中,某一个个体被抽到的可能性(  )
A.与第几次抽样有关,第一次抽到的可能性大一些
B.与第几次抽样无关,每次抽到的可能性都相等
C.与第几次抽样有关,最后一次抽到的可能性要大些
D.与第几次抽样无关,每次都是等可能地抽取,但各次抽取的可能性不一定
答案:B
解析:在简单随机抽样中,每一个个体被抽到的可能性都相等,与第几次抽样无关,故A,C,D不正确,B正确.故选B.
3.某学校数学组要从11名数学老师中推选3名老师参加市里举办的教学能手比赛,制作了11个形状、大小相同的签,抽签中确保公平性的关键是(  )
A.制签 B.搅拌均匀
C.逐一抽取 D.抽取后不放回
答案:B
解析:确保公平性要保证每个签抽到是等概率的,因此抽签法要做到搅拌均匀,才具有公平性.故选B.
4.从一个篮球训练营中抽取10名学员进行投篮比赛,每人投10次,统计出该10名学员投篮投中的次数,4个投中5次,3个投中6次,2个投中7次,1个投中8次.试估计该训练营投篮投中的比例为________.
0.6
解析:10名学员投中的平均次数为=6,所以投中的比例约为=0.6.
课堂小结
1.全面调查和抽样调查.
2.简单随机抽样及其方法(抽签法、随机数法).
3.用样本平均数估计总体平均数.(共33张PPT)
9.1.2~9.1.3 分层随机抽样 获取数据的途径
预 学 案
共 学 案
预 学 案
一、分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行___________,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为______________.每一个子总体称为________,在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为________.
简单随机抽样
分层随机抽样

比例分配
【即时练习】 判断正误(正确的画“√”,错误的画“×”)
(1)简单随机抽样和分层随机抽样都是等可能抽样.(  )
(2)分层随机抽样是按一定的比例从各层抽取个体组成样本的抽样.(  )
(3)在分层随机抽样时,每层可以不等可能抽样.(  )


×
二、用分层随机抽样的平均数估计总体的平均数
如果总体分为两层,两层包含的个体数分别为M,N,两层抽取的样本量分别为m,n,两层的样本平均数分别为,两层的总体平均数分别为,总体平均数为,样本平均数为.
则=______+______.
=______+______.
【即时练习】 某校高二年级化生史组合只有2个班,且每班50人,在一次数学测试中,从两个班各抽取了20名学生的数学成绩进行分析,统计得,在该次测试中,两班中各抽取的20名学生的平均成绩分别为110分和106分,则该组合学生的平均成绩约为________分.
108
解析:根据题意知,样本容量为40,则这40名学生的平均成绩为×110+×106=108分,所以该组合学生的平均成绩约为108分.
三、获取数据的途径
获取数据的基本途径有__________________、__________________、__________________、__________________等.
通过调查获取数据
通过试验获取数据
通过观察获取数据
通过查询获得数据
【即时练习】 “中国天眼”为500米口径球面射电望远镜,是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是(  )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
答案:C
解析:“中国天眼”主要是通过观察获取数据.故选C.
微点拨
(1)分层随机抽样分层的原则是每层内样本的差异要尽可能小,而层与层之间的差异要尽可能大.
(2)根据实际情况,可对每层所抽取的数目进行适当的调整.比如,如果计算出的层内抽样数不是整数,可以进行一定的技术处理,将结果取成整数等.
微点拨
设有N个个体的总体可划分成n个有明显差异的部分,抽取的样本中不同层的平均数分别为,对应各层的样本数分别为f1,f2,…,fn,则样本平均数为=
微点拨
在应用四种途径获取数据时,要清楚数据的类型,选择适当的获取途径.
共 学 案
【学习目标】 (1)理解并掌握分层随机抽样,会用分层随机抽样从总体中抽取样本.(2)利用分层随机抽样的方法解决实际问题.(3)了解获取数据的途径,并学会简单应用.
题型 1 分层随机抽样
【问题探究1】 某市为调查中小学生的近视情况,在全市范围内分别对小学生、初中生、高中生三个群体抽样,进而了解中小学生的总体情况和三个群体近视情况的差异大小.
(1)上述问题中样本总体有什么特征?
(2)若采用抽签法会出现什么结果?
(3)为使抽取的样本更合理,更有代表性,有更好的抽样方法解决该问题吗?
提示:(1)此总体,小学生、初中生、高中生三个群体在年龄、体质等方面存在着明显的差异.
(2)抽取的样本可能集中于某一个群体,不具有代表性.
(3)有,可分不同的群体抽取.
例1 某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人.教育部门为了了解在职人员对学校机构改革的意见,要从中抽取一个容量为20的样本,请利用分层随机抽样的方法抽取,写出抽样过程.
解析:抽样过程如下:
第一步,确定抽样比,样本容量与总体容量的比为=.
第二步,确定分别从三类人员中抽取的人数,从行政人员中抽取16×=2(人);从教师中抽取112×=14(人);从后勤人员中抽取32×=4(人).
第三步,采用简单随机抽样的方法,抽取行政人员2人,教师14人,后勤人员4人.
第四步,把抽取的个体组合在一起构成所需样本.
题后师说
分层随机抽样的步骤
跟踪训练1 (1)下列问题中,最适合用分层随机抽样抽取样本的是(  )
A.从10名同学中抽取3人参加座谈会
B.某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本
C.从1 000名工人中,抽取100名调查上班途中所用时间
D.从生产流水线上,抽取样本检查产品质量
答案:B
解析:A中总体个体无明显差异且个数较少,适合用简单随机抽样;C和D中总体个体无明显差异且个数较多,不适合用分层随机抽样;B中总体个体差异明显,适合用分层随机抽样.故选B.
(2)在中国共产主义青年团建团100周年之际,某高中学校计划选派60名团员参加“文明劝导”志愿活动,高一、高二、高三年级的团员人数分别为100,200,300,若按分层抽样的方法选派,则高一年级需要选派的人数为________.
10
解析:依题意可知高一年级需要选派的人数为×60=10人.
题型 2 用分层抽样的样本平均数估计总体平均数
【问题探究2】 在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n.我们用X1,X2,…,XM表示第1层各个个体的变量值,用x1,x2,…,xm表示第1层样本的各个个体的变量值;用Y1,Y2,…,YN表示第2层各个个体的变量值,用y1,y2,…,yn表示第2层样本的各个个体的变量值.则第1层的总体平均数和样本平均数和第2层的总体平均数和样本平均数,该如何计算?
提示:==
==
==
==
例2 某地区有居民600户,其中普通家庭450户、高收入家庭150户.为了调查该地区居民奶制品月消费支出,决定采用分层随机抽样的方法,按普通家庭、高收入家庭进行分层,得到普通家庭、高收入家庭的奶制品平均月消费支出分别为40元和90元.
(1)如果在各层中按比例分配样本,总样本量为60,那么在普通家庭、高收入家庭中分别抽取了多少户?在这种情况下,请估计该地区全体居民奶制品的平均月消费支出.

解析:设在普通家庭、高收入家庭中分别抽取了m,n户,则==,解得m=45,n=15.
样本平均数=×40+×90=52.5(元).
在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数,即在普通家庭、高收入家庭中分别抽取了45户、15户,估计该地区全体居民奶制品的平均月消费支出为52.5元.
(2)如果从普通家庭、高收入家庭中抽取的样本量分别为30和30,那么在这种情况下,抽取的这60户居民奶制品的平均月消费支出是多少?用这60户居民奶制品的平均月消费支出估计该地区全体居民奶制品的平均月消费支出合理吗?如果不合理,那该怎样估计较合理?
解析:抽取的这60户居民奶制品的平均月消费支出是×40+×90=65(元).
因为在该地区居民中,普通家庭户数是高收入家庭户数的3倍,而抽取的普通家庭的样本量与高收入家庭的样本量相等,所以用这60户居民奶制品的平均月消费支出估计该地区全体居民奶制品的平均月消费支出不合理.应该用抽取的普通家庭奶制品的平均月消费支出40元估计该地区全体普通家庭奶制品的平均月消费支出,用抽取的高收入家庭奶制品的平均月消费支出90元估计该地区全体高收入家庭奶制品的平均月消费支出,得到该地区全体居民奶制品的平均月消费支出为×40+×90=52.5(元).
这样估计较合理.
学霸笔记:(1)在比例分配的分层随机抽样中,我们可以直接用样本平均数=估计总体平均数.
(2)在非比例分配的分层随机抽样中,如果层数分为2层,由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此我们用估计总体平均数.
跟踪训练2 某校高二有重点班学生400人,普通班学生800人,为调查总体学生数学成绩的平均值,按比例分配进行分层抽样,从重点班抽出20人,从普通班抽出40人,通过计算重点班平均成绩125分,普通班平均成绩95分,则高二总体数学成绩平均值为(  )
A.110 B.125
C.95 D.105
答案:D
解析:总体数学成绩平均值为=105.
题型 3 获取数据的途径
【问题探究3】 我们日常中有哪些获取数据的方法和途径呢?
提示:通过调查获取数据、通过试验获取数据、通过观察获取数据、通过查询获得数据等.
例3 粮食安全是每一个国家必须高度关注的问题,在现有条件下,降雨量对粮食生产的影响是非常大的,某次降雨之后该地气象台播报说本次降雨量是该地有气象记录以来最大的一次,气象台获取这些数据的途径是(  )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
答案:C
解析:该地的气象记录和本次降雨量数据都是通过观察获取数据的.
学霸笔记:选择获取数据的途径主要是根据所要研究问题的类型,以及获取数据的难易程度.有的数据可以有多种获取途径,有的数据只能通过一种途径获取,选择合适的方法和途径能够更好地提高数据的可靠性.
跟踪训练3 为了研究近年我国高等教育发展状况,小明需要获取近年来我国大学生入学人数的相关数据,他获取这些数据的途径最好是(  )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
答案:D
解析:因为近年来我国大学生入学人数的相关数据有所存储,所以小明获取这些数据的途径最好是通过查询获得数据.
随堂练习
1.若要研究某城市家庭的收入情况,获取数据的途径应该是(  )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
答案:A
解析:因为要研究的是某城市家庭的收入情况,所以通过调查获取数据.
2.某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适(  )
A.抽签法 B.随机数法
C.简单随机抽样法 D.分层随机抽样法
答案:D
解析:总体由差异明显的三部分构成,应选用分层随机抽样法.
3.某林场有树苗30 000棵,其中松树苗4 000棵.为调查树苗的生长情况,采用分层随机抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为(  )
A.30   B.25   
C.20 D.15
答案:C
解析:样本中松树苗为4 000×=4 000×=20(棵).
4.分层随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为________.
6
解析:=×3+×8=6.
课堂小结
1.分层随机抽样及其应用.
2.用分层随机抽样的样本平均数估计总体平均数.
3.获取数据的途径.(共39张PPT)
9.2.1 总体取值规律的估计
预 学 案
共 学 案
预 学 案
一、频率分布直方图
画频率分布直方图的步骤
1.求极差:极差为一组数据中最大值与最小值的______.
2.决定组距与组数
将数据分组时,一般取________组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.
3.将数据分组

等长
4.列频率分布表
各小组的频率=.
5.画频率分布直方图
纵轴表示实际上就是频率分布直方图中各小长方形的______,小长方形的面积=____________=________.
高度
组距×
频率
【即时练习】 
1.判断正误(正确的画“√”,错误的画“×”)
(1)频率分布直方图中小长方形的高度表示该组上的个体在样本中出现的频率与组距的比值.(  )
(2)频率分布直方图中小长方形的面积表示该组的个体数.(  )
(3)频率分布直方图中所有小长方形面积之和为1.(  )
(4)样本容量越大,用样本的频率分布去估计总体的频率分布就越准确.(  )

×


2.一个容量为100的样本,其数据的分组与各组的频数如下:
则样本数据落在[10,40)内的频率为(  )
A.0.13 B.0.39
C.0.52 D.0.64
分组 [0,10) [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]
频数 12 13 24 15 16 13 7
答案:C
解析:由频数分布表知:样本数据落在[10,40)内的频率为=0.52.故选C.
二、其他统计图表
统计图表 主要应用
扇形图 直观描述各类数据占总数的比例
条形图和直方图 直观描述不同类别或分组数据的频数和频率
折线图 描述数据随时间的变化趋势
【即时练习】 已知某地区中小学生人数和近视情况分别如图①和图②所示,则该地区初中生近视人数为(  )
A.350 B.450
C.1 000 D.1 350
答案:D
解析:依题意,该地区初中生有4 500人,而该地区初中生的近视率为30%,所以该地区初中生近视人数为4 500×30%=1 350.故选D.
微点拨
(1)组距是指每个小组的两个端点之间的距离.为了方便起见,组距的选择应力求“取整”.极差、组距、组数有如下关系:
①若为整数,则=组数;
②若不为整数,则[]+1=组数.([x]表示不大于x的最大整数)
(2)组数与样本容量有关,一般地,样本容量越大,分的组数也就越多.当样本容量不超过100时,常分成5~12组.
(3)为方便起见,往往按等距分组,或者除了第一和最后的两段,其他各段按等距分组.
微点拨
(1)条形图是用一个单位长度表示一定的数量或频率,根据数量的多少或频率的大小画成长短不同的矩形条,条形图能清楚地表示出每个项目的具体数目或频率.
(2)扇形图是用整个圆面积表示总数(100%),用圆内的扇形面积表示各个部分所占总数的百分数.
(3)在画折线图时,要注意明确横轴、纵轴的实际含义.
共 学 案
【学习目标】 (1)会画频率分布直方图;能通过频率分布直方图估计总体的取值规律.(2)在问题情境中会用统计图分析样本数据;能从统计图表中获取有价值的信息,估计总体分布的规律.
【问题探究】 给出以下44个数据:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48
(1)上述44个数据中最大值与最小值的差是多少?
(2)若将上述数据分成下列几组:[41.5,45.5),[45.5,49.5),[49.5,53.5),[53.5,57.5),[57.5,61.5),[61.5,65.5),[65.5,69.5],则数据落在各个小组的个数是多少?
(3)我们初中学过的频数分布直方图和频数分布表能清楚地表示数据分布在各个小组的个数,那么如何刻画样本观测数据落在各个小组的比例大小呢?
提示:(1)69-42=27.
(2)数据落在各个小组的个数依次是2,7,8,16,5,4,2.
(3)利用频率分布表和频率分布直方图.
题型 1 频率分布直方图的画法
例1 调查某校高一年级男生的身高,随机抽取40名高一男生,实测身高数据(单位: cm)如下:
171 163 163 166 166 168 168 160 168 165 171 169 167 169 151 168 170 168 160 174 165 168 174 158 167 156 157 164 169 180 176 157 162 161 158 164 163 163 167 161
(1)作出频率分布表;
(2)画出频率分布直方图.
解析:(1)最低身高151 cm,最高身高180 cm,它们的差是180-151=29,即极差为29;确定组距为4,组数为8,频率分布表如下:
分组 频数 频率
[150.5,154.5) 1 0.025
[154.5,158.5) 5 0.125
[158.5,162.5) 5 0.125
[162.5,166.5) 10 0.250
[166.5,170.5) 13 0.325
[170.5,174.5) 4 0.100
[174.5,178.5) 1 0.025
[178.5,182.5] 1 0.025
合计 40 1.000
(2)频率分布直方图如下.
题后师说
绘制频率分布直方图的策略
跟踪训练1 对某电子元件进行寿命追踪调查,情况如下.
(1)列出频率分布表;
(2)画出频率分布直方图.
寿命/h 100~200 200~300 300~400 400~500 500~600
个数 20 30 80 40 30
解析:(1)根据题目中的数据,计算每一小组的频率,
完成频率分布表如下:
分组 频数 频率
100~200 20 0.10
200~300 30 0.15
300~400 80 0.40
400~500 40 0.20
500~600 30 0.15
合计 200 1.00
(2)画出频率分布直方图如下:
题型 2 频率分布直方图的应用
例2 为了解某校高一年级学生的体能情况,随机抽取部分高一年级学生进行一分钟跳绳测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本量是多少?
(2)若次数在110以上(含110)为达标,
则估计该校全体高一年级学生的达标
率是多少?
解析:(1)频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小,因此,第二小组的频率为=0.08.
又因为第二小组的频率=,
所以样本量===150.
(2)由频率分布直方图,可估计该校高一年级学生的达标率为×100%=88%.
一题多变 本例条件不变,求样本中次数在130以上(含130)的学生人数.
解析:次数在130以上(含130)的学生人数为×150=36.
学霸笔记:由频率分布直方图进行相关计算时,需掌握下列关系式:
(1)小长方形的面积=组距×=频率;
(2)各小长方形的面积之和等于1;
(3)=频率,此关系式的变形为=样本容量,样本容量×频率=频数.
跟踪训练2 某学校为了调查高一年级600名学生年平均阅读名著的情况,通过抽样,获得了100名学生年平均阅读名著的数量(单位:本),将数据按照[0,5),[5,10),[10,15),[15,20),[20,25]分成5组,制成了如图所示的频率分布直方图,则图中a的值为________;估计高一年级年平均阅读名著的数量不少于10本的人数为________.
0.03
150
解析:由直方图知:(0.07+0.08+a+0.014+0.006)×5=(0.17+a)×5=1,
所以a=0.03,
则高一年级年平均阅读名著的数量不少于10本的人数为(0.03+0.014+0.006)×5×600=150(人).
题型 3 其他统计图表的应用
例3 (多选)某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种的参保客户进行抽样调查,得出如下统计图例,
则以下四个选项正确的是(  )
A.18~29周岁人群参保总费用最少
B.30周岁以上的参保人群约占参保人群的20%
C.54周岁以上的参保人数最少
D.丁险种更受参保人青睐
答案:CD
解析:对A:由不同年龄段人均参保费用图可知,18~29周岁人群人均参保费用最少,但是这类人所占比例为20%,所以总费用不一定最少,故A错误;对B:由扇形图可知,30周岁以上的参保人数约占总参保人数的80%,故B错误;对C:由扇形图可知,54周岁以上的参保人数最少,故选项C正确;对D:由柱状图可知,丁险种参保比例最高,故选项D正确.故选CD.
学霸笔记:(1)在条形统计图中,各个矩形图的宽度没有严格要求,但高度必须以数据为准,它直观反映了各部分在总体中所占比重的大小.实际问题中,我们需根据需要进行分组,横轴上的分组越细,对数据的刻画(描述)就越精确.
(2)扇形统计图表示总体的各部分之间的百分比关系,但不同总量下的扇形统计图,其不同的百分比不可以作为比较的依据.
(3)在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.
跟踪训练3 (多选)学校为了解本校学生上学的交通方式,在全校范围内进行了随机调查,将学生上学的交通方式归为四类方式:A—结伴步行,B—自行乘车,C—家人接送,D—其他方式.并把收集的数据整理分别绘制成柱形图和扇形图,下面的柱形图和扇形图只给出了部分统计信息,
则根据图中信息,下列说法正确的是(  )
A.扇形图中B的占比最大
B.结伴步行上学的有30人
C.无法计算扇形图中A的占比
D.估计该校学生上学交通方式为A和C的人数占学生总人数的一半
答案:ABD
解析:因为D的人数为18,且D占比为15%,
所以总人数为=120(人),
所以A组人数为120-42-30-18=30(人),故B正确;
对于A:由于B组人数最多,故在扇形图中B的占比最大,故A正确;
对于C:A组30人,占比为=0.25=25%,故C错误;
对于D:A和C的人数和为60人,总人数为120,占学生总人数的一半,故D正确.故选ABD.
随堂练习
1.关于频率分布直方图中的有关数据,下列说法正确的是(  )
A.直方图的高表示该组上的个体在样本中出现的频率与组距的比值
B.直方图的高表示该组上的个体在样本中出现的频率
C.直方图的高表示取某数的频率
D.直方图的高表示该组上的个体数与组距的比值
答案:A
解析:因为在频率分布直方图中,直方图的高表示该组上的个体在样本中的频率与组距的比值,小矩形的面积表示该组上的个体在样本中出现的频率.
2.某学校团委对全校学生阅读兴趣调查的数据进行整理,欲反映学生感兴趣的各类图书所占百分比,最适合的统计图是(  )
A.条形统计图 B.频率分布直方图
C.折线统计图 D.扇形统计图
答案:D
解析:欲反映学生感兴趣的各类图书所占百分比,最适合的统计图是扇形统计图.
3.(多选)如图给出的是某高校土木工程系大四55名学生期末考试专业成绩的频率折线图,其中组距为10,且本次考试中最低分为50分,最高分为100分.
根据图中所提供的信息,下列结论中正确的是(  )
A.成绩是75分的人数为20
B.成绩是100分的人数比成绩是50分的人数多
C.成绩落在[70,90)内的人数为35
D.成绩落在[70,80)内的人数为20
答案:CD
解析:成绩落在[70,80)内的人数为10××55=20,不能说成绩是75分的人数为20,所以A错误,D正确;从频率折线图看不出成绩是100分的人数比成绩是50分的人数多,只能看出成绩落在[50,60)内的人数和成绩落在[90,100]内的人数相等,所以B错误;成绩落在[70,90)内的人数为×55=35,所以C正确.故选CD.
4.某高校调查了400名学生每周的自习时间(单位:时),将收集到的自习时间分成5组:[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30](自习时间均在[17.5,30]内),制成了如图所示的频率分布直方图,则这400名学生中每周的自习时间不少于22.5小时的人数是________.
280
解析:由频率分布直方图知,这400名学生中每周的自习时间不少于22.5小时的人数为:400×(0.16+0.08+0.04)×2.5=280.
课堂小结
1.频率分布直方图的画法.
2.频率分布直方图的应用.
3.其他统计图表的应用.(共24张PPT)
9.2.2 总体百分位数的估计
预 学 案
共 学 案
预 学 案
百分位数
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有________的数据小于或等于这个值,且至少有__________的数据大于或等于这个值.
2.计算第p百分位数的步骤
第1步,按从________到________排列原始数据.
第2步,计算i=________.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为________数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的________.
p%
(100-p)%


n×p%
第j项
平均数
3.四分位数
常用的分位数有第25百分位数、第50百分位数、第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第________百分位数也称为第一四分位数或下四分位数等,第________百分位数也称为第三四分位数或上四分位数等.
25
75
【即时练习】 
1.判断正误(正确的画“√”,错误的画“×”)
(1)50%分位数就是中位数.(  )
(2)若一组样本数据各不相等,则其75%分位数大于25%分位数.(  )
(3)若一组样本数据的10%分位数是23,则在这组数据中有10%的数据大于23.(  )


×
2.1,2,3,4,5,5这组数据的第50百分位数是(  )
A.3   B.3.5    
C.4   D.5
答案:B
解析:将数据从小到大排列为1,2,3,4,5,5.
而6×0.5=3,所以第50百分位数是=3.5.故选B.
微点拨
分位数概念辨析
将总体数据从小到大排列.
(1)将范围或者说区间(0,1)两等分的数是,所以总体数据总处于中间位置的那个数据叫做(=50%)分位数,二分位数只有这一个数据,这个数据也是中位数,也是50%分位数.
(2)将范围或者说区间(0,1)三等分的数是,所以总体数据总处于对应位置的数据叫做分位数,这两个数据都称为三分位数.
(3)将范围或者说区间(0,1)四等分的数是,所以总体数据总处于对应位置的数据叫做分位数,也就是25%,50%,75%分位数.这三个数据都称为四分位数.
共 学 案
【学习目标】 (1)结合实例,理解百分位数的定义.(2)会求一组数据的第p百分位数.
【问题探究】 如果该市政府希望使80%的居民用户生活用水费支出不受影响,根据教材9.2.1节中100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?
提示:把100个样本数据按从小到大排序,得到第80个和第81个数据分别为13.6和13.8.可以发现,在区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数=13.7,并称此数为这组数据的第80百分位数,或80%分位数.
题型 1 百分位数的计算
例1 某中学高二(1)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:
甲:95,81,75,91,86,89,71,65,76,88,94,110,107.
乙:83,86,93,99,88,103,98,114,98,79,78,106,101.
计算出学生甲、乙的25%分位数和50%分位数.
解析:把甲、乙两名学生的数学成绩从小到大排序,可得
甲:65,71,75,76,81,86,88,89,91,94,95,107,110.
乙:78,79,83,86,88,93,98,98,99,101,103,106,114.
由13×25%=3.25,13×50%=6.5,
可得数据的25%分位数为第4项数据,50%分位数为第7项数据;
即学生甲的25%分位数为76,50%分位数为88;
学生乙的25%分位数为86,50%分位数为98.
学霸笔记:
百分位数的两个注意点
(1)求百分位数时,一定要将数据按照从小到大的顺序排列.
(2)第p百分位数的特点是:总体中任一个数小于或等于它的可能性是p%.
跟踪训练1 某校高一年级15个班参加朗诵比赛的得分如下:
91 89 90 92 94 87 93 96 91 85 89
93 88 98 93
求这组数据的40%分位数、70%分位数.
解析:将数据从小到大依次排列如下:
85,87,88,89,89,90,91,91,92,93,93,93,94,96,98,
而15×40%=6,15×70%=10.5,
故这组数据的40%分位数是×(90+91)=90.5,
这组数据的70%分位数是93.
题型 2 百分位数在统计图表中的应用
例2 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图.
估计参赛学生的成绩的25%,90%分位数.
解析:由直方图得,从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.
成绩在60分以下的学生所占比例为30%>25%,
所以25%分位数一定位于[50,60)内.
由50+10×≈58.3,可以估计参赛学生的成绩的25%分位数为58.3;
成绩在80分以下的学生所占比例为30%+40%+15%=85%<90%,
成绩在90分以下的学生所占比例为30%+40%+15%+10%=95%>90%,
所以90%分位数一定位于[80,90)内.
由80+10×=85,可以估计参赛学生的成绩的90%分位数为85.
学霸笔记:
根据频率分布直方图求第p百分位数的步骤
(1)确定百分位数所在的区间[a,b).
(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+(b-a)×.
跟踪训练2 某工厂对一批产品进行了抽样检测,如图是根据抽样检测后的产品净重数据绘制的频率分布直方图,其中产品净重的范围是[96,106](单位:g),样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].
试估计样本数据的第70百分位数.
解析:由直方图得,从左到右的第一、二、三、四、五小组的频率分别是0.10、0.20、0.30、0.25、0.15.
净重在102 g以下的产品所占比例为10%+20%+30%=60%<70%,
净重在104 g以下的产品所占比例为10%+20%+30%+25%=85%>70%,
所以70%分位数一定位于[102,104)内.
由102+2×=102.8,可以估计样本数据的第70百分位数为102.8.
随堂练习
1.关于百分位数的说法中,正确的是(  )
A.百分位数一定是数据中的某一项
B.恰好有k%的数据比第k百分位数小
C.某样本的第k百分位数一定是整体的第k百分位数
D.一组数据中不同的百分位数可能相等
答案:D
解析:对A,百分位数的计算结果可能是数据中的某一项,也有可能是某两个数据的平均数,故A错误;对B,第k百分位数为数据中的某一项,也有可能是某两个数据的平均数,恰有k%的数据,若此数据与下个数据相等,则k%的数据不一定比第k百分位数小,故B错误;对C,样本的第k百分位数计算结果和整体的第k百分位数计算结果不一定是同一个数据,故C错误;对D,根据百分位数的定义,可知一组数据中不同的百分位数可能相等,故D正确.
2.已知一组数据为85,87,88,90,92,则这组数据的第60百分位数为(  )
A.87.5   B.88
C.89   D.91
答案:C
解析:5×60%=3,因为3为整数,故选取88和90的平均数作为第60百分位数,即=89.
3.数据1,2,3,4,5,6,7,8,9,10的上四分位数为(  )
A.2    B.2.5
C.7.5   D.8
答案:D
解析:10×=7.5,所以上四分位数是第8个数,为8.
4.下表所给数据的第85百分位数为________.
3130
解析:排序:2 710 2 755 2 850 2 880 2 880 2 890 2 920 2 940 2 950 3 050 3 130 3 325
计算i:
i=n=×12=10.2,
即第85百分位数是3 130.
课堂小结
1.百分位数的定义.
2.由样本数据求百分位数.
3.由统计图表求百分位数.(共30张PPT)
9.2.3 总体集中趋势的估计
预 学 案
共 学 案
预 学 案
一、众数、中位数、平均数
1.众数:一组数据中出现次数________的数.
2.中位数:把一组数据按____________________的顺序排列,处在________位置的数(或中间两个数的________)叫做这组数据的中位数.
3.平均数:如果n个数x1,x2,…,xn,那么=________________叫做这n个数的平均数.
最多
从小到大(或从大到小)
中间
平均数
(x1+x2+…+xn)
【即时练习】 某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各1人,则该小组成绩的平均数、众数、中位数分别是(  )
A.85分、85分、85分 B.87分、85分、86分
C.87分、85分、85分 D.87分、85分、90分
答案:C
解析:由题意知,该学习小组共有10人,因此众数和中位数都是85,平均数为=87.
二、频率分布直方图中的众数、中位数、平均数
1.样本平均数:可以用每个小矩形底边中点的________与小矩形________的乘积之和近似代替.
2.在频率分布直方图中,中位数左边和右边的直方图的面积应________.
3.将________小矩形所在的区间________作为众数的估计值.
横坐标
面积
相等
最高
中点
【即时练习】 在某时段由50辆车通过一个雷达测速点,工作人员将测得的车速绘制成如图所示的条形统计图,则这50辆车的车速的众数(单位:km/h)为(  )
A.60     B.50     C.40     D.15
答案:C
解析:由条形图知:50个数据出现次数最多的为40,
所以众数为40.故选C.
微点拨
平均数、众数和中位数描述了数据的集中趋势,数值型数据可用平均数、中位数描述集中趋势;分类型数据常用众数描述集中趋势.

微点拨
利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.
共 学 案
【学习目标】 (1)会求样本数据的众数、中位数、平均数.(2)理解用样本的数字特征、频率分布直方图估计总体的集中趋势.
【问题探究】 现从甲、乙、丙三个厂家生产的同一种耐用家电产品中,各抽取8件产品,对其使用寿命进行跟踪调查,其结果如下:(单位:年)
甲:3,4,5,6,8,8,8,10;乙:4,6,6,6,8,9,12,13;丙:3,3,4,7,9,10,11,12.
三个厂家广告中都称其产品的使用寿命为8年,利用所学知识,你能说明为什么吗?
提示:三个厂家是从不同角度进行了说明,以宣传自己的产品.其中甲:众数为8年;乙:平均数为8年;丙:中位数为8年.
题型 1 众数、中位数、平均数的计算
例1 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
分别求这些运动员成绩的众数、中位数与平均数.
成绩(单位:m) 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90
人数 2 3 2 3 4 1 1 1
解析:因为成绩为1.75 m的人数为4,最多,所以17名运动员的成绩的众数为:1.75 m.
根据中位数的定义可知,把17名运动员的成绩从小到大排列,第9个运动员的成绩为中位数,所以17名运动员的成绩的中位数为:1.70 m.
17名运动员的成绩的平均数为:≈1.69 m.
所以这些运动员成绩的众数为1.75 m,中位数为1.70 m,平均数约为1.69 m.
学霸笔记:众数是出现次数最多的数;计算中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据相关数据的总数是奇数还是偶数而定;平均数一般是根据公式来计算.
跟踪训练1 已知一组数据5,2,x,5,8,9,且5A.6 B.6.5
C.7 D.7.5
答案:A
解析:∵5题型 2 众数、中位数、平均数的应用
例2 甲、乙、丙三家电子厂商在广告中都声称,他们的某型电子产品在正常情况下的待机时间都是12 h,质量检测部门对这三家销售产品的待机时间进行了抽样调查,统计结果(单位:h)如下:
甲:8,9,9,9,9,11,13,16,17,19;
乙:10,10,12,12,12,13,14,16,18,19;
丙:8,8,8,10,11,13,17,19,20,20.
(1)分别求出以上三组数据的平均数、众数、中位数.
(2)这三个厂商的推销广告分别利用了上述哪一种数据来表示待机时间?
(3)如果你是顾客,会选择哪个厂商的产品?为什么?
解析: (1)根据平均数的计算公式可知:
甲厂数据的平均数是=12;
乙厂数据的平均数是=13.6;
丙厂数据的平均数是=13.4.
甲厂,乙厂,丙厂的众数分别是9,12,8.
甲厂数据的中位数为=10,乙厂数据的中位数为=12.5,丙厂数据的中位数为=12.
(2)甲厂用平均数作为该电子产品的待机时间,乙厂用众数作为该电子产品的待机时间,丙厂用中位数作为该电子产品的待机时间.
(3)我会选乙厂的产品因为乙厂产品的平均数最大,众数最大,中位数最大,所以待机时间更长些,稳定性也较好.
学霸笔记:(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.
跟踪训练2 某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄(单位:岁)如下:
甲群:13,13,14,15,15,15,15,16,17,17;
乙群:54,3,4,4,5,5,6,6,6,57.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?
(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?
解析:(1)甲群市民年龄的平均数为=15(岁),
中位数为15岁,众数为15岁,平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.
(2)乙群市民年龄的平均数为=15(岁),
中位数为5.5岁,众数为6岁.
由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.
题型 3 利用频率分布直方图求众数、中位数、平均数
例3 某城市正在进行创建文明城市的活动,为了解居民对活动的满意程度,相关部门组织部分居民对本次活动进行打分(分数为正整数,满分100分).现从所有有效数据中随机抽取一个容量为100的样本,统计发现分数均在[40,100],将样本数据整理得到如下频率分布直方图.
(1)求a的值;
(2)根据频率分布直方图,估计该城市居民
打分的众数、中位数(保留一位小数)及平均
数(同一组中的数据用该组区间的中点值为
代表).
解析:(1)由频率分布直方图可知(0.004+0.006+a+0.03+0.024+0.016)×10=1,解得a=0.02.
(2)由频率分布直方图可知众数为=75;
由(0.004+0.006+0.02)×10=0.3<0.5,(0.004+0.006+0.02+0.03)×10=0.6>0.5,
所以中位数位于[70,80)之间,设中位数为x,则(0.004+0.006+0.02)×10+(x-70)×0.03=0.5,
解得x=≈76.7;
平均数为0.04×45+0.06×55+0.2×65+0.3×75+0.24×85+0.16×95=76.2.
学霸笔记:(1)众数即为出现次数最多的数,所以它的频率最大,在最高的小矩形中,中位数即为从小到大中间的数(或中间两数的平均数).平均数约为每个小矩形底边中点的横坐标与小矩形面积的乘积之和.
(2)用频率分布直方图求得的众数、中位数不一定是样本中的具体数.
跟踪训练3 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:高一参赛学生的成绩的众数、中位数.
解析:用频率分布直方图中最高矩形所在的区间的中点值作为众数的近似值,
得众数为=65,
因为0.03×10=0.3<0.5,(0.03+0.04)×10=0.7>0.5,
所以中位数在60~70之间,设中位数为x,
则0.3+0.04(x-60)=0.5,解得x=65,所以中位数为65.
随堂练习
1.在一次体育测试中,某班的6名同学的成绩(单位:分)分别为66,83,87,83,77,96.关于这组数据,下列说法错误的是(  )
A.众数是83 B.中位数是83
C.极差是30 D.平均数是83
答案:D
解析:由于83出现的次数最多,所以众数是83,故A说法正确;把数据66,83,87,83,77,96按从小到大排列为66,77,83,83,87,96,中间两个数为83,83,所以中位数是83,故B说法正确;极差是96-66=30,故C说法正确;由于平均数为(66+83+87+83+77+96)÷6=82,故D说法错误.
2.北京冬奥会已于2022年2月4日至2月20日顺利举行,这是中国继北京奥运会,南京青奥会后,第三次举办的奥运赛事.之前,为助力冬奥,提高群众奥运法律知识水平和文明素质,某市有关部门开展冬奥法律知识普及类线上答题,共计30个题目,每个题目2分,满分60分,现从参与线上答题的市民中随机抽取1 000名,将他们的作答成绩分成6组,并绘制了如图所示的频率分布直方图.
若同一组中的数据用该组区间中点值为代表,可估计这次线上答题成绩的平均数为(  )
A.33   B.34
C.35   D.36
答案:B
解析:由题图,0.05×5+0.1×15+0.2×25+0.3×35+0.25×45+0.1×55=34.故选B.
3.我国冰雪健儿自1992年实现冬奥奖牌数0的突破,到北京冬奥会结束,共获得77块奖牌.现将1992年以来我国冬奥会获得奖牌数量统计如下表:
则1992年以来我国获得奖牌数的中位数为(  )
A.8   B.9 C.10   D.11
年份 1992 1994 1998 2002 2006 2010 2014 2018 2022
奖牌数 3 3 8 8 11 11 9 9 15
答案:B
解析:将自1992年以来我国冬奥会获得奖牌数从小到大排列为:3,3,8,8,9,9,11,11,15,所以1992年以来我国获得奖牌数的中位数为9.
4.已知一组数据的频率分布直方图如下.则众数是__________,中位数是__________,平均数是__________.
解析:因为最高矩形横坐标的中点为65,所以众数为65;
设中位数为60+x,则0.030×10+0.04x=0.5,解得x=5,所以中位数为65;
平均数=(55×0.030+65×0.040+75×0.015+85×0.010+95×0.005)×10=67.
65
65
67
课堂小结
1.众数、中位数、平均数的计算.
2.众数、中位数、平均数的应用.
3.频率分布直方图中的众数、中位数、平均数.(共29张PPT)
9.2.4 总体离散程度的估计
预 学 案
共 学 案
预 学 案
方差、标准差
1.假设一组数据为x1,x2,…,xn,则这组数据的平均数=,
方差为s2=______________,标准差s=______________.
2.如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为
,则称S2=______________为总体方差,S=为总体标准差.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=.
3.如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,
则称s2=_____________为样本方差,s=为样本标准差.
【即时练习】 
1.判断正误(正确的画“√”,错误的画“×”)
(1)数据的极差越小,样本数据分布越集中、稳定.(  )
(2)数据的方差越大,样本数据分布越集中、稳定.(  )
(3)数据的标准差越小,数据分布越集中、波动幅度越小.(  )
(4)在实际问题中要做出有效决策时,主要参照样本数据的平均数和标准差或方差.(  )

×


2.已知有样本数据2、4、5、6、8,则该样本的方差为(  )
A.5     B.4
C.2     D.0
答案:B
解析:平均数为=5.
该样本的方差为=4.
故选B.
微点拨
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
(2)标准差、方差的取值范围:[0,+∞).
标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.
(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.
共 学 案
【学习目标】 (1)理解方差、标准差的含义,会计算方差和标准差.(2)掌握求分层随机抽样总样本的平均数及方差的方法.
【问题探究】 有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
(1)甲、乙两人本次射击的平均成绩分别为多少环?
(2)观察下图中两人成绩的频率分布条形图,你能说明其水平差异在哪里吗?
(3)对于甲、乙的射击成绩,除了画出频率分布条形图比较外,还有没有其他方法来说明两组数据的离散程度?
提示:(1)=×(7+8+7+9+5+4+9+10+7+4)=7,=×(9+5+7+8+7+6+8+6+7+7)=7.
(2)直观上看,还是有差异的.甲成绩比较分散,乙成绩相对集中.
(3)还经常用甲、乙的极差与平均数一起比较说明数据的分散程度.甲命中环数的极差=10-4=6,乙命中环数的极差=9-5=4.极差在一定程度上表明了样本数据的离散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.
题型 1 方差、标准差的计算
例1 甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
解析:(1)=(99+100+98+100+100+103)=100,
=(99+100+102+99+100+100)=100.
=[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
=[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)两台机床所加工零件的直径的平均值相同,又,所以乙机床加工零件的质量更稳定.
学霸笔记:研究两个样本的波动情况或比较它们的稳定性、可靠性等性能好坏的这类题,先求平均数,比较一下哪一个更接近标准,若平均数相等,则再比较两个样本方差的大小来作出判断.
跟踪训练1 对划艇运动员甲、乙在相同的条件下进行了6次测试,测得他们每次的最大速度(m/s)如下:
甲:27,38,30,37,35,31
乙:33,29,38,34,28,36
根据以上数据,试判断他们谁的成绩比较稳定.
解析:=×(27+38+30+37+35+31)=33,
=×[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]=×94≈15.7,
=×(33+29+38+34+28+36)==33,
=×[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]=×76≈12.7.
所以=.
这说明甲、乙两运动员的最大速度的平均值相同,但乙的成绩比甲的稳定.
题型 2 方差、标准差与统计图表的综合应用
例2 甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.
(1)分别求出两人得分的平均数与方差;
(2)根据图形和(1)中计算结果,对两人的训练成绩作出评价.
解析:(1)由图可得甲、乙两人五次测试的成绩分别为甲:10,13,12,14,16;
乙:13,14,12,12,14.
==13,
==13,
=×[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
=×[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
学霸笔记:根据折线统计图研究样本数据的数字特征与横坐标和纵坐标的统计意义有关,但一般情况下,整体分布位置较高的平均数大,数据波动性小的方差小.
跟踪训练2 甲、乙、丙三位同学在一项集训中的40次测试分数都在[50,100]内,将他们的测试分数分别绘制成频率分布直
方图,如图所示,记甲、乙、丙的分数标准差分别为
s1,s2,s3,则它们的大小关系为(  )
A.s1>s2>s3 B.s1>s3>s2
C.s3>s1>s2 D.s3>s2>s1
答案:B
解析:根据频率分布直方图中的数据信息知乙同学的测试分数比较集中,则s2最小;甲同学的测试分数比较分散,则s1最大,综合可得s1>s3>s2,故选B.
题型 3 分层抽样的方差
例3 在一个文艺比赛中,8名专业人士和12名观众代表各组成一个评判小组,给参赛选手打分.在给某选手的打分中,专业人士打分的平均数和标准差分别为47.4和3.7,观众代表打分的平均数和标准差为56.2和11.8,试根据这些数据计算这名选手得分的平均数和标准差.
解析:把专业人士打分样本记为x1,x2,x3,…,x8其平均数记为,方差记为,
把观众代表打分样本记为y1,y2,y3,…,y12,其平均数记为,方差记为,
把总体数据的平均数记为,方差记为s2,
则总样本平均数为=×47.4+×56.2=52.68,
总样本方差为
s2=

=×{8×[3.72+(47.4-52.68)2]+12×[11.82+(56.2-52.68)2]}=107.6,
总样本标准差s=10.37,
所以计算这名选手得分的平均数为52.68,标准差为10.37.
题后师说
计算分层抽样的方差s2的步骤
跟踪训练3 已知某省二、三、四线城市数量之比为1∶3∶6,2023年8月份调查得知该省所有城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.8万元/平方米,三、四线城市房价的方差分别为10,8,求二线城市房价的方差.
解析:设二线城市的房价的方差为s2,由题意可知20=[s2+(1.2-2.4)2]+×[10+(1.2-1.8)2]+×[8+(1.2-0.8)2],
解得s2=118.52,即二线城市房价的方差为118.52.
随堂练习
1.下列数字特征不能反映样本数据的分散程度、波动情况的是(  )
A.极差 B.平均数
C.方差 D.标准差
答案:B
解析:对于A,极差表示一组数据最大值与最小值的差,极差越大数据越分散,极差越小数据越集中,故极差能反映样本数据的离散程度大小,故不选A;对于B,平均数是表示一组数据集中趋势的量数,是指在一组数据中所有数据之和再除以这组数据的个数,它是描述数据集中位置的一个统计量,故平均数不能反映样本数据的分散程度、波动情况,故选B;对于C,方差反映了一组数据的波动大小,方差越大,波动性越大,反之也成立,即方差能反映样本数据的离散程度大小,故不选C;对于D,标准差是方差的算术平方根,标准差也能反映样本数据的离散程度大小,故不选D.
2.甲、乙两名同学参加了一次篮球比赛的全部7场比赛,平均每场得分都是16分,标准差分别为3.5和4.62,则甲、乙两名同学在这次篮球比赛中,发挥更稳定的是(  )
A.甲 B.乙
C.甲、乙相同 D.不能确定
答案:A
解析:因甲、乙平均每场得分相同,都是16分,而甲的标准差3.5小于乙的标准差4.62,
即甲每场比赛的得分波动较乙的小,甲发挥更稳定.故选A.
3.一组数据6,7,8,8,9,10的方差是(  )
A.8 B.9
C. D.
答案:D
解析:数据6,7,8,8,9,10的平均数为==8,
所以所求方差为s2=[(6-8)2+(7-8) 2+(8-8) 2+(8-8) 2+(9-8) 2+(10-8)2]=.故选D.
4.某人任意统计5次上班步行到单位所花的时间(单位:分)分别为8,12,10,11,9.则这组数据的标准差为________.
解析:由题意得,这组数据的平均数==10,
所以标准差s==.
课堂小结
1.方差、标准差的计算及应用.
2.分层随机抽样的方差的求解.(共27张PPT)
章末复习课
 ·
 ·
考点一 抽样方法
1.两种抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数法;当总体中个体差异较显著时,可采用分层随机抽样.
2.通过对两种抽样方法的考查,提升学生的数据分析素养.
例1 (1)总体由编号为01,02,…,29,30的30个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为(  )
7816 1572 0802 6315 0216 4319 9714 0198
3204 9234 4936 8200 3623 4869 6938 7181
A.02 B.15
C.16 D.19
答案:D
解析:由题意,依次取到的编号为16、15、08、02、19,
所以第5个个体的编号为19.故选D.
(2)已知树人中学高一年级总共有学生n人,其中男生550人,按男生、女生进行分层,并按比例分配抽取名学生参加湿地保护知识竞赛,已知参赛学生中男生比女生多10人,则n=(  )
A.1 100 B.1 000
C.900 D.800
答案:B
解析:由已知可得参赛的男生有550×=55(人),
故参赛的女生有55-10=45(人),
参赛人数共55+45=100(人),
所以高一年级总人数为100×10=1 000(人),
即n=1 000,故选B.
跟踪训练1 (1)下列抽取样本的方式是简单随机抽样的有(  )
A.某连队从200名官兵中,挑选出50名最优秀的官兵赶赴某地参加救灾工作
B.箱子中有100支铅笔,从中选10支进行试验,在抽样操作时,从中任意拿出一支检测后再放回箱子
C.从50个个体中一次性抽取8个个体作为样本
D.从2 000个灯泡中不放回地逐个抽取20个进行质量检查
答案:D
解析:对A:由于挑选出50名最优秀的官兵,不具备随机性,故不是简单随机抽样,A错误;对B:简单随机抽样要求是不放回,而选项中从中任意拿出一支铅笔检测后再放回箱子,是有放回的抽样,所以不是简单随机抽样,B错误;对C:简单随机抽样要求是逐个抽取,而选项中从50个个体中一次性抽取8个个体作为样本,不是逐个抽取,所以不是简单随机抽样,C错误;对D:从2 000个灯泡中不放回地逐个抽取20个进行质量检查,是简单随机抽样,D正确.
(2)某学校有高中学生1 000人,其中高一年级,高二年级的人数分别为400,320,为调查学生睡眠时间,现采用比例分配的分层随机抽样的方法从中抽取一个样本,如果抽取高一年级学生的人数为20,那么应抽取高三年级学生的人数为________.
14
解析:由题设,抽取的样本人数为20÷=50(人),
所以抽取高三年级学生的人数为50×=14(人).
考点二 用样本的取值规律估计总体的取值规律
1.根据样本容量的大小,我们可以选择利用样本的频率分布表、频率分布直方图、频率折线图、条形图、扇形图对总体情况作出估计.
2.通过对统计图表的考查,提升学生的数据分析和数学运算素养.
例2 特岗教师是中央实施的一项对中西部地区农村义务教育的特殊政策,通过公开招聘高校毕业生到中西部地区“两基”攻坚县、县以下农村学校任教,进而提高农村教师队伍的整体素质,促进城乡教育均衡发展.某市招聘特岗教师需要进行笔试和面试,一共有600名应聘者参加笔试考试,从中随机抽取了100名应聘者,记录他们的笔试分数,将数据分成7组:[20,30),[30,40),…,[80,90].得到如图所示频率分布直方图.
(1)若该市计划168人进入面试,请估计参
加面试的最低分数线;
(2)已知样本中笔试分数低于40分的有
5人,试估计总体中笔试分数在[40,50)
内的人数.
解析:(1)根据题意,得进入面试的频率P==0.28,
由频率分布直方图可知,笔试分数位于[70,80)、[80,90]的频率分别为0.4、0.2,
所以设参加面试的最低分数线x∈[70,80),
得(80-x)×0.04+0.2=P,解得x=78,
故参加面试的最低分数线约为78.
(2)样本中笔试分数不低于50分的频率为:0.1+0.2+0.4+0.2=0.9.
样本中笔试分数低于40分的频率为:=0.05.
所以样本中笔试分数在[40,50)内的频率为:1-0.05-0.9=0.05.
故总体中笔试分数在[40,50)内的人数约为600×0.05=30(人).
跟踪训练2 (1)某校的体能测试结果分为优秀、良好、合格、不合格四个等级,已知甲、乙两个班的体能测试结果数据分别用条形图和扇形图描述,如图所示,若乙班的学生人数为50人,
则下列结论不正确的是(  )
A.甲、乙两个班共有学生100人
B.乙班体能测试等级不合格的人数为5人
C.体能测试等级为良好以上(包含良好)的人数甲班与乙班一样
D.体能测试等级为合格的人数甲班比乙班多
答案:D
解析:对于A,由甲班体能测试等级条形图可知甲班人数有8+22+14+6=50(人),
故甲、乙两个班共有学生100人,故A正确;
对于B,由乙班体能测试等级扇形图可知,
乙班体能测试等级不合格的人数为50×10%=5(人),故B正确;
对于C,甲班体能测试等级为良好以上(包含良好)的人数为8+22=30(人),
乙班体能测试等级为良好以上(包含良好)的人数为48%×50+12%×50=30(人),
故体能测试等级为良好以上(包含良好)的人数甲班和乙班一样,C正确;
对于D,甲班体能测试合格等级的人数为14,
乙班合格等级的人数为(1-48%-12%-10%)×50=15,故D不正确.故选D.
(2)(多选)某市教体局对全市高三年级学生的身高进行抽样调查,随机抽取了100名学生,他们的身高都处在A,B,C,D,E五个层级内,根据抽样结果得到如图所示的统计图,则下列叙述正确的是(  )
A.样本中女生人数少于男生人数
B.样本中B层人数最多
C.样本中E层男生人数为6
D.样本中D层男生人数多于女生
答案:BC
解析:对于A,由女生身高情况条形图可得女生人数为9+24+15+9+3=60(人),
则男生人数为100-60=40(人),所以女生人数多于男生人数,故A错误;
对于B,在女生身高情况条形图中,B层人数最多,在男生身高情况扇形图中,B层比例最高,人数最多,所以样本中B层人数最多,故B正确;
对于C,由男生身高情况扇形图可得E层人数为40×15%=6(人),故C正确;
对于D,由女生身高情况条形图可得D层人数为9人,
由男生身高情况扇形图可得D层人数为40×20%=8(人),男生少于女生,故D错误.故选BC.
考点三 样本的百分位数
1.一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.通过样本百分数的计算及应用,提升学生的数据分析和数学运算素养.
例3 某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示.估计棉花纤维的长度的样本数据的80%分位数是(  )
A.28 mm B.28.5 mm
C.29 mm D.29.5 mm
答案:C
解析:棉花纤维的长度在25 mm以下的比例为(0.01+0.01+0.04+0.06)×5=0.6=60%,
在30 mm以下的比例为60%+25%=85%,因此,80%分位数一定位于[25,30)内,
因为25+5×=29,所以估计棉花纤维的长度的样本数据的80 %分位数是29 mm.故选C.
跟踪训练3 (多选)某校高一年级15个班参加合唱比赛,得分从小到大排序依次为:85,85,86,87,88,89,90,91,91,91,92,93,94,96,98.则(  )
A.这组数据的40%分位数是90
B.这组数据的80%分位数是93.5
C.这组数据的下四分位数是86
D.这组数据的上四分位数是93
答案:BD
解析:对于A,因为15×40%=6,所以这组数据的40%分位数是第6个数和第7个数的平均数,即=89.5,所以A错误;
对于B,因为15×80%=12,所以这组数据的80%分位数是第12个数和第13个数的平均数,即=93.5,所以B正确;
对于C,因为这组数共有15个数,所以这组数排列后的第4个数87为这组数据的下四分位数,所以C错误;
对于D,因为这组数共有15个数,所以这组数排列后的第12个数93为这组数据的上四分位数,所以D正确.故选BD.
考点四 用样本的集中趋势、离散程度估计总体
1.为了从整体上更好地把握总体的规律,我们可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征作出估计;用方差s2反映样本数据分散程度的大小.
2.通过样本数据的众数、中位数、平均数及方差的计算方法,提升学生的数据分析和数学运算素养.
例4 随着2022年卡塔尔世界杯的举行,世界各地又掀起了新一轮足球热.被用做正规大型赛事的足球大小为周长68.5 cm~69.5 cm之间,甲,乙两个工厂都一直为大型赛事生产足球,随机从两个工厂生产的足球中各抽取50个做产品检测,足球周长(单位: cm)的频数分布表如下表所示,且已知甲工厂生产的50个足球周长的平均值约为69 cm.
(1)求m,n的值;
(2)如果用甲,乙两个工厂生产的足球的周长的平均值和方差分析甲,乙两个工厂的生产水平,哪个工厂的水平更高一些呢?
足球周长 [68.5,68.7) [68.7,68.9) [68.9,69.1) [69.1,69.3) [69.3,69.5]
频数 (甲工厂) 6 8 20 m n
频数 (乙工厂) 5 5 26 13 1
解析:
(1)
即解得
即m,n的值为12,4.
(2)因为=69,=×(68.6×5+68.8×5+69×26+69.2×13+69.4×1)=69,
所以=.
又因为=×20+(69.2-69)2×12+(69.4-69)2×4]=0.048,
=[(68.6-69)2×5+(68.8-69)2×5+(69-69)2×26+(69.2-69)2×13+(69.4-69)2×1]=0.033 6,即.
甲、乙两个工厂生产的足球的周长的平均值均约为69 cm,乙工厂生产的足球的周长的方差略小于甲工厂生产的足球的周长的方差,所以乙工厂的水平更高一些.
跟踪训练4 某市有210名初中生参加数学竞赛预赛,随机调阅了60名学生的答卷,成绩如下表:
(1)求样本的平均成绩和标准差(精确到0.01分);
(2)若规定预赛成绩在7分或7分以上的学生参加复赛,试估计有多少名学生可以进入复赛.
成绩 1分 2分 3分 4分 5分 6分 7分 8分 9分 10分
人数 0 0 0 6 15 21 12 3 3 0
解析:(1)平均成绩为(4×6+5×15+6×21+7×12+8×3+9×3)=6,
方差s2=[6×(4-6)2+15×(5-6)2+21×(6-6)2+12×(7-6)2+3×(8-6)2+3×(9-6)2]=1.5,
所以标准差s≈1.22,
故样本的平均成绩为6分,标准差约为1.22分.
(2)在60名选手中,有12+3+3=18(名)学生预赛成绩在7分或7分以上,所以估计210人中有×210=63(名)学生的预赛成绩在7分或7分以上,故大约有63名学生可以进入复赛.