2021_2022学年新教材高中数学第九章统计课件(8份打包)新人教A版必修第二册

文档属性

名称 2021_2022学年新教材高中数学第九章统计课件(8份打包)新人教A版必修第二册
格式 zip
文件大小 7.5MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2021-05-12 08:40:10

文档简介

(共46张PPT)
9.1.1 简单随机抽样
课标定位
素养阐释
1.了解总体、样本、样本量的概念,了解数据的随机性.
2.通过实例,了解简单随机抽样的含义及其解决问题的过程.
3.掌握两种简单随机抽样方法:抽签法和随机数法.
4.会计算样本均值和样本方差,了解样本与总体的关系.
5.培养数学抽象、数学建模和数学运算素养.
自主预习·新知导学
合作探究·释疑解惑








自主预习·新知导学
一、全面调查与抽样调查的含义
【问题思考】
1.为了解我校高一学生的体重指数,对全校1
000名高一学生进行调查分析,测量其身高和体重,计算其体重指数.
(1)像这样,对每一名学生都进行调查的方法称为什么?
提示:全面调查,又称普查.
(2)全校1
000名高一学生和每一名学生分别称为什么?
提示:总体,个体.
(3)如果从全校1
000名高一学生中抽取200名进行身高和体重测量登记,计算其体重指数,并以此估计全校高一学生的体重指数,这种调查方法称为什么?
提示:抽样调查.
(4)在(3)中抽取的200名高一学生称为什么?数字200又是什么?
提示:样本,样本量.
2.填空:
(1)全面调查的定义:对每一个调查对象都进行调查的方法,称为全面调查,又称普查.在一个调查中,我们把调查对象的全体称为总体,组成总体的每一个调查对象称为个体.为了强调调查目的,也可以把调查对象的某些指标的全体作为总体,每一个调查对象的相应指标作为个体.
(2)抽样调查的定义:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.我们把从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本容量,简称样本量.调查样本获得的变量值称为样本的观测数据,简称样本数据.
3.做一做:某学校为了解高一1
200名新入学学生的数学成绩,从中抽取了100名学生进行调查分析,在这个问题中,被抽取的100名学生是(  )
A.总体
B.样本
C.个体
D.样本量
解析:根据定义,被抽取的100名学生是样本.
答案:B
二、简单随机抽样
【问题思考】
1.高一(1)班班主任为了了解本班学生的体重指数,想从全班45名学生中抽取15名进行身高和体重测量登记,计算其体重指数,如何合理又快捷地抽取这20名学生,你有哪些方法呢?
提示:用抽签法或随机数法.
2.填空:
(1)简单随机抽样的定义:一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n(2)常用的简单随机抽样的方法:抽签法和随机数法.
(3)抽签法:先给总体中的N个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.
(4)随机数法:先给总体中的N个个体编号,用随机数工具产生1~N范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需要的个体数.
(5)产生随机数的方法
3.做一做:在放回简单随机抽样中,每次抽取时某一个个体被抽到的概率(  )
A.与第几次抽样有关,第一次抽到的概率要大些
B.与第几次抽样无关,每次抽到的概率都相等
C.与第几次抽样有关,最后一次抽到的概率要大些
D.每个个体被抽到的概率无法确定
解析:在放回简单随机抽样中,每次抽取时各个个体被抽到的概率都相等,与第几次抽样无关.
答案:B
三、总体均值与样本均值
【问题思考】
1.填空:
2.做一做:已知某同学5次数学成绩分别是:121,127,123,124,
125,则他这5次数学成绩的平均成绩是     .?
答案:124
【思考辨析】
判断下列说法是否正确,正确的在后面的括号内画“√”,错误的画“×”.
(1)调查某批袋装牛奶(总体)的细菌超标情况,可以用全面调查.(
×
)
(2)简单随机抽样可以用在任何调查中.(
×
)
(3)用抽签法抽取样本时,编号问题可视情况而定,若已有编号如考号、学号、标签号码等,可不必重新编号.(

)
(4)用简单随机抽样方法抽取样本时,样本量越大越好.(
×
)
(5)我们可以用样本中的比例p估计总体中的比例P.(

)
合作探究·释疑解惑
探究一
探究二
探究三
探究一
简单随机抽样的有关概念
【例1】
(1)在“世界读书日”前夕,为了了解某地5
000名居民4月18日这天的阅读时间,从中抽样调查了200名居民,对他们这天的阅读时间进行统计分析.在这个问题中,调查的总体是     ,个体是     ,样本是     ,调查的变量是     .?
(2)下面的抽样方法是简单随机抽样吗?为什么?
①某连队从200名党员官兵中,挑选出50名最优秀的官兵参加抗震救灾工作;
②一彩民选号,从装有36个大小、形状都相同的号签的盒子中随机逐个抽取6个号签;
③从无限多个个体中抽取100个个体作为样本.
分析:(1)总体、个体、样本和调查的变量?依据定义判断.
(2)判断抽取样本的方式是不是简单随机抽样?与简单随机抽样的几个特点是否完全符合.
解:(1)某地5
000名居民构成调查的总体,每一名居民是个体,被抽取的200名居民构成样本,居民4月18日这天的阅读时间是调查的变量.
(2)①不是简单随机抽样.因为50名官兵是从中挑选出来的,是最优秀的,每个个体被抽到的概率不同,不符合简单随机抽样中“等概率抽样”的要求.
②是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中随机逐个抽取,是等概率的抽样.
③不是简单随机抽样.因为被抽取样本的总体的个体数是无限的,而不是有限的.
简单随机抽样的判断方法
判断所给抽样是不是简单随机抽样,关键是看它们是否符合简单随机抽样的三个特点:总体的个数有限;随机性;等概率抽样.
【变式训练1】
下列抽样方法不是简单随机抽样的是(  )
A.某班45名同学,指定个子最高的5人参加某活动
B.小乐从玩具箱中的10件外观、质地完全相同的玩具中随意拿出一件玩,玩后放回,再随机拿出一件,连续拿出四件
C.从8台型号相同的电脑中逐个不放回地随机抽取2台,进行质量检验
D.从20个相同的零件中一次性随机抽出3个进行质量检查
解析:根据简单随机抽样的三个特点,可知A不符合等概率抽样,即每个个体被抽到的概率相等.D中的“一次性随机抽出3个”与“逐个不放回地随机抽取3个”是等价的,B,C,D都符合简单随机抽样的特点.故选A.
答案:A
探究二
简单随机抽样的应用
【例2】
要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请分别用抽签法和随机数法抽样,并写出抽样过程.
解:用抽签法,步骤如下:
①将30辆汽车编号,号码是1,2,3,…,30;
②将1~30这30个编号写在外观、质地等无差别的小纸片上作为号签;
③将写好的小纸片放在一个不透明的盒里,充分搅拌;
④从盒中不放回地逐个抽取3个号签,并记录上面的编号;
⑤与号签上的编号对应的3辆汽车就是要抽取的样本.
用随机数法,步骤如下:
①将30辆汽车编号,号码是1,2,3,…,30;
②进入计算器的计算模式,调出生成随机数的函数并设置参数,如RandInt#(1,30),按“=”键3次,得到3个1~30范围内的整数随机数,若这3个随机数有重复,剔除重复的编号,继续按“=”键,直到生成3个不同的随机数;(本步还可以用其他方式生成随机数)
③把产生的随机数作为抽中的编号,与编号对应的3辆汽车就是要抽取的样本.
1.利用抽签法抽取样本时应注意以下问题:(1)编号时,若已有编号(如学号,标号等),则可不必重新编号;(2)号签的外观、质地等无差别;(3)号签必须要充分搅拌;(4)要不放回地逐个抽取.
2.利用随机数法抽取样本的步骤:
(1)编号:给含有N个个体的总体编号,常按1~N进行编号.
(2)生成不相同的随机数:用信息技术如计算器或电子表格软件或R
统计软件等生成随机数,也可以用随机试验生成随机数.
(3)把产生的随机数作为抽中的编号,与编号对应的个体就是要抽取的样本.
【变式训练2】
某卫生单位为了支援抗震救灾,要从18名志愿者中抽取6人组成医疗小组去参加救治工作,请用抽签法设计抽样方案.
解:方案如下:
第一步,将18名志愿者编号,号码为1,2,3,…,18.
第二步,将1~18这18个编号写在外观、质地等无差别的小纸片上作为号签.
第三步,将写好的小纸片放在一个不透明的盒里,充分搅拌.
第四步,从盒子中不放回地逐个抽取6个号签,并记录上面的编号.
第五步,与号签上的编号对应的志愿者就是医疗小组成员.
探究三
总体平均数的估计
【例3】
从甲、乙两种玉米苗中通过简单随机抽样各抽取10株,分别测得它们的株高(单位:cm)如下:
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
试估计这两种玉米苗哪种长得高.
在简单随机抽样中,我们常用样本平均数去估计总体平均数,所以估计乙种玉米苗长得高.
1.平均数的计算:一般是根据公式来计算.
2.在简单随机抽样中,我们常用样本平均数去估计总体平均数,用样本中的比例估计总体中的比例.
【变式训练3】
射箭运动员小亮在某次测试中射箭20次,测试成绩如下表:
则小亮的平均成绩为     .?
答案:8.5




用分类讨论思想求平均数
【典例】
某班4个小组的人数为10,10,x,8,已知该组数据的中位数与平均数相等,求这组数据的平均数.
分析:x的大小未知,可根据x的取值不同分别找出中位数.
1.当在数据中含有未知数x,且题目与该组数据的中位数有关时,需根据x的取值分情况讨论.
2.分类讨论时要做到全面合理,不重不漏.
3.培养逻辑推理和数学运算素养.
【变式训练】
已知由正整数组成的一组数据1,x,y,3,其平均数和中位数都是2,则这组数据为         .(从小到大排列)?
解析:因为平均数是2,所以x+y=4,又因为x,y为正整数,所以x,y的取值为1,3或2,2.
当x,y取1,3时,符合题意;当x,y取2,2时,也符合题意;所以这组数据为1,1,3,3或1,2,2,3.
答案:1,1,3,3或1,2,2,3




1.在以下调查中,适合用普查的是(  )
A.调查一批小包装饼干的卫生是否达标
B.调查一批袋装牛奶的质量
C.调查一个班级每天完成家庭作业所需要的时间
D.调查一批绳索的抗拉强度是否达到要求
解析:A,B,D选项的调查,对于个体具有破坏性,不适合用普查.
答案:C
2.从某批零件中抽取50个,再从50个中抽出40个进行合格检查,发现合格品有36个,则该产品的合格率约为(  )
A.36%
B.72%
C.90%
D.25%
解析:被抽取的样本的合格率为
,可以估计该产品的合格率为90%.
答案:C
2.从某批零件中抽取50个,再从50个中抽出40个进行合格检查,发现合格品有36个,则该产品的合格率约为(  )
A.36%
B.72%
C.90%
D.25%
解析:被抽取的样本的合格率为,可以估计该产品的合格率为90%.
答案:C
3.某校有60个班,每班45人,要求从每班随机派3人参加“学生代表大会”,在这个问题中,样本量是     .?
解析:每班抽取3人,共抽取180人.
答案:180
4.某医院急诊中心关于病人等待急诊的时间记录如下:
则病人候诊时间的平均数为     .?
答案:13(共50张PPT)
9.1.2 分层随机抽样
9.1.3 获取数据的途径
课标定位
素养阐释
1.通过实例,了解分层随机抽样的特点和适用范围.
2.了解分层随机抽样的必要性.
3.掌握各层样本量比例分配的方法.
4.结合具体实例,掌握分层随机抽样的样本均值和样本方差.
5.知道获取数据的基本途径,包括统计报表和年鉴、社会调查、试验设计、普查和抽查、互联网等.
6.提升数学抽象、数学建模和数学运算素养.
自主预习·新知导学
合作探究·释疑解惑








自主预习·新知导学
一、分层随机抽样的含义
【问题思考】
1.某地区有高中生7
100人,初中生10
900人,小学生11
000人.当地教育部门为了了解本地区中小学生的近视率及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查.
(1)你认为应当怎样抽取样本?
提示:应分高中、初中、小学三个层次进行抽取.
(2)在高中、初中、小学三部分学生中都按1%的比例抽取,应各抽取多少人?
提示:高中生抽取7
100×1%=71(人),
初中生抽取10
900×1%=109(人),
小学生抽取11
000×1%=110(人).
2.填空:
(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
(2)分配比例:在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,则分配比例为
3.做一做:已知某单位有职工120人,其中男职工90人,现采用样本量比例分配的分层随机抽样的方法(按男、女分层)抽取一个样本,若已知样本中有27名男职工,则分配比例为(  )
答案:B
二、分层随机抽样的样本均值与总体均值
【问题思考】
3.做一做:在某校高一年级的800名学生中,男生有360名,女生有440名.现采用样本量比例分配的分层随机抽样方法,从中抽取样本量为60的样本,计算出男生样本的平均数为171
cm,女生样本的平均数为160
cm,则总样本的平均数为     .?
答案:164.95
cm
三、获取数据的途径
【问题思考】
1.统计学是通过收集数据和分析数据来认识未知现象的,你知道哪些获取数据的途径?
提示:统计报表和年鉴、社会调查、试验设计、普查和抽查、互联网等.
2.填空:
获取数据的一些基本途径:
(1)通过调查获取数据,如抽样调查或普查的方法获取数据.
(2)通过试验获取数据.
(3)通过观察获取数据.
(4)通过查询获取数据.
【思考辨析】
判断下列说法是否正确,正确的在后面的括号内画“√”,错误的画“×”.
(1)在分层随机抽样中,每层抽取的样本量都一样.(
×
)
(2)在比例分配的分层随机抽样中,每层样本量都与层的大小成比例.(

)
(3)在样本量比例分配的分层随机抽样中,各层的抽样比等于
(

)
(4)在分层随机抽样中,我们直接用样本平均数估计总体平均数.(
×
)
(5)从互联网上查找的数据,质量参差不齐,应该根据问题背景知识“清洗”数据,去伪存真后,再进行数据分析.(

)
合作探究·释疑解惑
探究一
探究二
探究三
探究一
分层随机抽样的概念
【例1】
下列问题中,最适合用分层随机抽样抽取样本的是
(  )
A.从10名同学中抽取3人参加座谈会
B.某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本
C.从1
000名工人中,抽取100名调查上班途中所用时间
D.在某地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务等情况
解析:B中总体个体差异较大,适合用分层随机抽样;A,C和D中总体个体差异不大,不适合用分层随机抽样.
答案:B
分层随机抽样的前提和遵循的两条原则
(1)前提:分层随机抽样使用的前提是总体可以分层,层与层之间差异较大,而层内个体间差异较小.
(2)遵循的两条原则:
①按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,即遵循不重复、不遗漏的原则;
②在每个子总体中独立地进行简单随机抽样,即各层遵循等概率抽样的原则.
【变式训练1】
某学院有四个饲养房,分别养有18,54,24,48只白鼠供试验用,某项试验需抽取24只白鼠,你认为最合适的抽样方法为(  )
A.在每个饲养房中各抽取6只
B.把所有白鼠都加上编有不同号码的颈圈,用简单随机抽样的方法确定24只
C.在四个饲养房分别随手抽取3,9,4,8只
D.先确定在这四个饲养房应分别抽取3,9,4,8只,再由各饲养房自己加号码颈圈,用简单随机抽样法确定各自要抽取的对象
解析:A中对四个饲养房平均摊派,但由于各饲养房所养数量不一,反而造成了各个个体被入选概率的不均衡,是错误的方法;B中保证了各个个体被入选概率的相等,但由于没有注意到在四个不同环境中会产生不同差异,不如采取分层抽样可靠性高,且统一编号统一选择加大了工作量;C中总体采用了分层随机抽样,但在每个层次中没有考虑到个体的差异(如健壮程度,灵活程度),貌似随机,实则各个个体被抽取到的概率不等,故选D.
答案:D
探究二
分层随机抽样的应用
【例2】
某企业三月中旬生产A,B,C三种产品共3
000件,根据样本量比例分配的分层随机抽样的结果,企业统计员制作了如下的统计表格:
由于不小心,表格中A,C产品的有关数据已被污染看不清楚了,统计员只记得A产品的样本量比C产品的样本量多10,根据以上信息,可得C产品的数量是     件.?
答案:800
若本例中条件不变,则A产品的数量为     .?
解析:设A产品的样本量为x,则x+x-10=300-130=170,得x=90,
答案:900
【变式训练2】
一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及以上的有95人,为了了解与身体状况有关的某项指标,要从所有职工中抽取100名职工作为样本,因职工年龄与这项指标有关,故采用分层随机抽样方法抽取,如果按各年龄段所占的比例进行分配,那么各年龄段应该抽取多少人?
探究三
分层随机抽样的样本均值与总体均值
【例3】
某地区有居民600户,其中普通家庭450户、高收入家庭150户.为了调查该地区居民奶制品月消费支出,决定采用分层随机抽样的方法,按普通家庭、高收入家庭进行分层,得到普通家庭、高收入家庭的奶制品平均月消费支出分别为40元和90元.
(1)如果在各层中按比例分配样本,总样本量为60,那么在普通家庭、高收入家庭中分别抽取了多少户?在这种情况下,请估计该地区全体居民奶制品的平均月消费支出.
(2)如果从普通家庭、高收入家庭中抽取的样本量分别为30和30,那么在这种情况下,抽取的这60户居民奶制品的平均月消费支出是多少?用这60户居民奶制品的平均月消费支出估计该地区全体居民奶制品的平均月消费支出合理吗?如果不合理,那该怎样估计较合理?
(2)抽取的这60户居民奶制品的平均月消费支出是
因为在该地区居民中,普通家庭户数是高收入家庭户数的3倍,而抽取的普通家庭的样本量与高收入家庭的样本量相等,所以用这60户居民奶制品的平均月消费支出估计该地区全体居民奶制品的平均月消费支出不合理.应该用抽取的普通家庭奶制品的平均月消费支出40元估计该地区全体普通家庭的平均月消费支出,用抽取的高收入家庭的平均月消费支出90元估计该地区全体高收入家庭的平均月消费支出,得到该地区全体居民奶制品的平均月消费支出为
这样估计较合理.
【变式训练3】
某地区有高中生7
200人,初中生11
800人,小学生12
000人.当地教育部门为了了解本地区中小学生的近视率,决定采用分层随机抽样的方法,按高中生、初中生、小学生进行分层,得到高中生、初中生、小学生的近视率分别为80%,70%和36%.
(1)如果在各层中按比例分配样本,总样本量为310,那么在高中生、初中生、小学生中分别抽取了多少人?在这种情况下,请估计该地区全体中小学生的近视率.
(2)如果从高中生、初中生、小学生中抽取的样本量分别为60,100和150,那么在这种情况下,抽取的样本的近视率是多少?该地区全体中小学生的近视率约为多少?
在比例分配的分层随机抽样中,我们直接用样本平均数估计总体平均数,所以可以估计该地区全体中小学生的近视率为59%.




忽视样本均值估计总体均值的条件而致误
【典例】
某地区有居民800户,其中普通家庭640户、高收入家庭160户.现从普通家庭中以简单随机抽样的方式抽取30户,得到他们的月均用电量为90
kW·h,从高收入家庭中以简单随机抽样的方式抽取20户,得到他们的月均用电量为200
kW·h,依据这些数据并结合所掌握的统计知识,估计该地区全体居民的月均用电量是     .?
错解:因为样本平均数是
,所以用样本平均数估计总体平均数,得该地区全体居民的月均用电量是134
kW·h.
答案:134
kW·h
以上解答过程中都有哪些错误?出错的原因是什么?你如何改正?你如何防范?
提示:错解中直接用样本平均数估计总体平均数,忽视了它成立的条件是在样本量比例分配的分层随机抽样中,而本题不是比例分配的分层随机抽样.
正解:用月均用电量90
kW·h估计640户普通家庭的月均用电量,用月均用电量200
kW·h估计160户高收入家庭的月均用电量,得到总体平均数的估计值为
答案:112
kW·h
1.明确用样本平均数估计总体平均数的前提条件.
2.掌握比例分配和非比例分配的分层随机抽样的总体平均数的估计值的处理方法.
【变式训练】
某地区有居民6
000户,其中城镇居民2
000户、农村居民4
000户.现从城镇居民中以简单随机抽样方式抽取100户,得到他们的月均用水量为12
t,从农村居民中以简单随机抽样方式抽取200户,得到他们的月均用水量为6
t,依据这些数据并结合所掌握的统计知识,估计该地区全体居民的月均用水量是     .?
答案:8
t




1.某校高三年级有男生500人,女生400人.为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是(  )
A.简单随机抽样法
B.抽签法
C.随机数法
D.分层随机抽样法
答案:D
2.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件、80件、60件.为了解它们的产品质量是否存在显著差异,用比例分配的分层随机抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n等于(  )
A.9
B.10
C.12
D.13
答案:D
3.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用比例分配的分层抽样方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为(  )
A.6
B.8
C.10
D.12
解析:设在高二年级学生中抽取的人数为x,则
,解得x=8.
答案:B
4.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用比例分配的分层随机抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取     名学生.?
答案:60
5.某地有居民100
000户,其中普通家庭99
000户、高收入家庭1
000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户、高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是     .?
答案:5.7%(共56张PPT)
9.2.1 总体取值规律的估计
课标定位
素养阐释
1.结合实例,能用样本估计总体的取值规律.
2.会列频率分布表,画频率分布直方图.
3.能根据频率分布表和频率分布直方图观测数据的分布规律.
4.了解不同的统计图在表示数据上有什么不同的特点.
5.加强直观想象、数学建模和数学运算素养.
自主预习·新知导学
合作探究·释疑解惑








自主预习·新知导学
一、频率分布直方图
【问题思考】
1.给出以下44个数据:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,
51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,
64,46,54,48
(1)上述44个数据中最大值与最小值的差是多少?
提示:69-42=27.
(2)若将上述数据分成下列几组:[41.5,45.5),[45.5,49.5),
[49.5,53.5),[53.5,57.5),[57.5,61.5),[61.5,65.5),[65.5,69.5],则数据落在各个小组的个数是多少?
提示:各小组中数据的个数依次是2,7,8,16,5,4,2.
(3)在直角坐标系中,能否将各组统计的数据直观地表示出来?
提示:可以.
2.填空:频率分布直方图
(1)绘制步骤:①求极差,即一组数据中的最大值与最小值的差.
②决定组距与组数.组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数也越多.当样本量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”.
③将数据分组.
④列频率分布表.计算各小组的频率,第i组的频率是
(2)意义:各小长方形的面积表示相应各组的频率,频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小,各小长方形的面积的总和等于
1
.
(3)总体取值规律的估计:我们可以用样本观测数据的频率分布估计总体的取值规律.
(4)频率分布直方图的特征:当频率分布直方图的组数少、组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原始数据信息;当频率分布直方图的组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则,不容易从中看出总体数据的分布特点.
解析:(1)各小矩形面积的和等于各组频率的和1.
(2)该组的频率是
答案:(1)C (2)A
二、其他统计图及其选择
【问题思考】
1.在初中我们学习过哪些统计图?
提示:条形图、扇形图、折线图、频数分布直方图等.
2.填空:(1)不同的统计图在表示数据上有不同的特点.如扇形图主要用于直观描述各类数据占总数的比例,条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,折线图主要用于描述数据随时间的变化趋势.
(2)不同的统计图适用的数据类型也不同.如条形图适用于描述离散型的数据,直方图适用于描述连续型数据.
3.做一做:在第十六届亚运会中,各个国家和地区代表队金牌获得情况的条形统计图如图所示.
第十六届亚运会各个国家和地区代表队金牌获得情况统计图
?
从图中可以得出中国代表队所获得金牌数占全部金牌数的比例约是(  )
A.41.7%
B.59.8%
C.67.3%
D.34.4%
解析:金牌总数为477,我国获得199块金牌,所占比例为
答案:A
【思考辨析】
判断下列说法是否正确,正确的在后面的括号内画“√”,错误的画“×”.
(1)频率分布直方图的组数越多,越能看出总体数据的分布特点.(
×
)
(2)频率分布直方图中小长方形的高度就是对应组的频率.
(
×
)
(3)同一组数据,组数不同,得到的频率分布直方图的形状也不同.(

)
(4)条形图和直方图只能用于直观描述不同分组数据的频率.(
×
)
合作探究·释疑解惑
探究一
探究二
探究三
探究一
频率分布表和频率分布直方图
【例1】
调查某校高一年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:
171 163 163 166 166 168 168 160 168 165 171 169 167 169 151 168 170 168 160 174 165 168 174 158 167 156 157 164 169 180 176 157 162 161 158 164 163 163 167 161
(1)作出频率分布表;
(2)画出频率分布直方图.
分析:找出此组数据的最大值和最小值,确定分组的组距和组数,列出频数分布表,再由频率分布表绘制频率分布直方图.
解:(1)最低身高151
cm,最高身高180
cm,它们的差是180-151=29,即极差为29;
确定组距为4,组数为8,频率分布表如下:
(2)频率分布直方图如下.
1.在列频率分布表时,极差、组距、组数有如下关系:
2.组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本量不超过100,则按照数据的多少常分为5~12组,一般样本量越大,所分组数越多.
【变式训练1】
微信是现代生活进行信息交流的重要工具,随机对使用微信的60人进行了统计,得到数据统计表如下所示,每天使用微信时间在2
h以上的人被定义为“微信达人”,不超过2
h的人被定义为“非微信达人”.已知“非微信达人”与“微信达人”人数比恰为3∶2.
确定x,y,p,q的值,并补全频率分布直方图.
探究二
频率分布直方图的应用
【例2】
为了解某校高一年级学生的体能情况,抽取部分学生进行一分钟跳绳测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
?
(1)第二小组的频率是多少?样本量是多少?
(2)若次数在110以上(含110)为达标,则该校全体高一年级学生的达标率是多少?
解:(1)频率分布直方图以面积的形式反映了数据落在各个小组的频率大小,
频率分布直方图的性质:
(1)因为小长方形的面积=
=频率,所以各小长方形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小.
(2)在频率分布直方图中,各小长方形的面积的总和等于1.
(4)在频率分布直方图中,各小长方形的面积之比等于频率之比,各小长方形的高度之比也等于频率之比.
【变式训练2】
从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350
kW·h之间,频率分布直方图如图所示.
(1)直方图中x的值为     ;?
(2)在这些用户中,用电量落在区间[100,250)内的户数为
     .?
解析:(1)由频率分布直方图中各小长方形的总面积为1,
得(0.002
4+0.003
6+0.006
0+0.002
4+0.001
2+x)×50=1,
得x=0.004
4.
(2)用电量在[100,250)内的频率为
(0.003
6+0.006
0+0.004
4)×50=0.7,
因此用电量在区间[100,250)内的户数为0.7×100=70.
答案:(1)0.004
4 (2)70
探究三
其他统计图的应用
【例3】
家庭过期药品属于“国家危险废物”,处理不当将污染环境,危害健康.某市药监部门为了解市民家庭处理过期药品的方式,决定对全市家庭作一次简单随机抽样调査.
(1)下列选取样本的方法最合理的一种是     .(只需填上正确答案的序号)?
①在市中心某个居民区以家庭为单位随机抽取;②在全市医务工作者中以家庭为单位随机抽取;③在全市常住人口中以家庭为单位随机抽取.
(2)本次抽样调査发现,接受调査的家庭都有过期药品,现将有关数据呈现如图:
?
①m=     ,
n=     ;?
②补全条形统计图;
③根据调査数据,你认为该市市民家庭处理过期药品最常见的方式是什么?
④家庭过期药品的正确处理方式是送回收点,若该市有180万户家庭,请估计有多少户家庭处理过期药品的方式是送回收点.
解:(1)根据抽样调查时选取的样本需具有代表性,可知所给选取样本的方法最合理的一种是③.
(2)①抽样调査的家庭总户数为:80÷8%=1
000(户),
②方式C户数为:
1
000-(80+510+200+60+50)=100,
条形统计图补充如图:
③根据调査数据,即可知道该市市民家庭处理过期药品最常见的方式是方式B.
④180×10%=18(万户).
若该市有180万户家庭,估计有18万户家庭处理过期药品的方式是送回收点.
各类统计图的特点:
条形统计图反映分组数据的频数和频率,扇形统计图反映各组数据占总数的比例,折线统计图反映数据随时间的变化趋势.
【变式训练3】
某厂生产一种产品,图①是该厂第一季度三个月产量的统计图,图②是这三个月的产量与第一季度总产量的比例分布统计图,统计员在制作图①,图②时漏填了部分数据.根据上述信息,回答下列问题:
(1)该厂第一季度哪一个月的产量最高?     月;?
(2)该厂一月份产量占第一季度总产量的     %;?
(3)该厂质检科从第一季度的产品中随机抽样,抽检结果发现样品的合格率为98%.请你估计该厂第一季度生产了多少件合格的产品?(写出解答过程)
解:(1)由条形图可知,三月的产量最高;
(2)该厂一月份产量占第一季度总产量的1-38%-32%=30%;
(3)该厂第一季度共生产1
900÷38%=5
000(件)产品.
因为合格率为98%,所以合格的产品有5
000×98%=4
900(件).
答:该厂第一季度大约生产了4
900件合格的产品.




错把纵坐标当作频率而致误
【典例】
有一个容量为200的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间[10,12]上的频数为     .?
错解:设样本数据落在区间[10,12]上的频率为x,则0.02+0.05+0.15+0.19+x=1,解得x=0.59,所以样本数据落在区间[10,12]上的频数为0.59×200=118.
答案:118
以上解答过程中都有哪些错误?出错的原因是什么?你如何改正?你如何防范?
提示:在求解过程中,把频率分布直方图的纵轴含义误认为频率.
正解:设样本数据落在区间[10,12]上的频率为x.
则(0.02+0.05+0.15+0.19)×2+x=1,解得x=0.18.
所以样本数据落在区间[10,12]上的频数为0.18×200=36.
答案:36
1.明确频率分布直方图纵轴的含义.
2.提高识图能力,在频率分布直方图中每个小矩形的高为
【变式训练】
为了解今年某校高三毕业班准备报考飞行员学生的体重(单位:kg)情况,将所得的数据整理后,画出了频率分布直方图,如图所示.已知图中从左到右的前三个小组的频率之比为1∶2∶3,其中第2小组的频数为12.则该校报考飞行员的总人数为     .?
解析:设该校报考飞行员的总人数为n,
第一小组的频率为a,则有a+2a+3a+(0.013+0.037)×5=1,
解得a=0.125,
所以第2小组的频率为0.25.
又因为第2小组的频数为12,
答案:48




1.在频率分布直方图中,小长方形的面积等于(  )
A.组距
B.频率
C.组数
D.频数
解析:根据小长方形的宽及高的意义,可知小长方形的面积为一组样本数据的频率.
答案:B
2.已知一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为(  )
A.10组
B.9组
C.8组
D.7组
答案:B
3.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),
[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组,下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(  )
?
A.6
B.8
C.12
D.18
解析:第一组与第二组的频率之和为(0.24+0.16)×1=0.4,第三组的频率为0.36×1=0.36,设第三组有疗效的为x人,
答案:C
4.今年5月某教育网开通了网上教学,某校高一(8)班班主任为了了解学生上网学习时间,对本班40名学生某天上网学习时间进行了调查,将数据(取整数)整理后,绘制出的频率分布直方图如图所示.
已知从左到右各个小组的频率分别是0.15,0.25,
0.35,0.20,0.05,则根据直方图所提供的信息,这一天上网学习时间在99.9~
119.9
min之间的学生人数是     人,如果只用这40名学生这一天上网学习的时间作为样本去推断该校高一年级全体学生该天的上网学习时间,这样推断是否合理?
     (填“合理”或“不合理”)?
解析:频数=样本量×频率=40×0.35=14(人).
因为该样本的选取只在高一(8)班,不具有代表性,所以这样推断不合理.
答案:14 不合理
5.为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表和频率分布直方图(如下图),解答下列问题:
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频率分布直方图.
解:(1)
(2)频率分布直方图如图所示:(共34张PPT)
9.2.2 总体百分位数的估计
课标定位
素养阐释
1.结合实例,能用样本估计总体的百分位数.
2.理解百分位数的统计含义.
3.会求样本数据的第p百分位数.
4.发展数据分析、数学建模和数学运算素养.
自主预习·新知导学
合作探究·释疑解惑








自主预习·新知导学
百分位数
【问题思考】
1.给出以下10个数据:49,64,50,48,65,52,56,46,54,51,
(1)请将上述10个数据按从小到大排序;
提示:46,48,49,50,51,52,54,56,64,65.
(2)上述数据的中位数是多少?
(3)在上述10个数据中,有多少个数据不超过51.5,所占的百分比是多少?
提示:5个,所占的百分比是50%.
2.填空:
(1)第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有
p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算第p百分位数的步骤:第1步,按从小到大排列原始数据.第2步,计算i=
n×p%
.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
(3)四分位数:常用的分位数有第25百分位数、第50百分位数、第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
3.做一做:
已知一组数据:125,121,123,125,127,129,125,128,130,129,126,
124,125,127,126.则这组数据的第25百分位数和第80百分位数分别是(  )
A.125 128
B.124 128
C.125 129
D.125 128.5
解析:把这15个数据按从小到大排序,可得121,123,124,125,
125,125,125,126,126,127,127,128,129,129,130,由25%×15=
3.75,80%×15=12,可知数据的第25百分位数为第4项数据为125,第80百分位数为第12项与第13项数据的平均数,即
答案:D
【思考辨析】
判断下列说法是否正确,正确的在后面的括号内画“√”,错误的画“×”.
(1)一组数据有80个,按从小到大排序,第80百分位数为第64项数据.(
×
)
(2)上四分位数就是第25百分位数.(
×
)
(3)一组数据从小到大排列有25个,第三四分位数为第19项数据.(

)
合作探究·释疑解惑
探究一
探究二
探究一
百分位数在具体数据中的应用
【例1】
某中学从高一年级中抽取了30名男生,测量其体重(单位:kg),数据如下:
62 60 59 59 59 58 58 57 57 57
56 56 56 56 56 56 55 55 55 54
54 54 53 53 52 52 51 50 49 48
(1)求这30名男生体重的25%,75%分位数;
(2)估计本校高一男生体重的第80百分位数.
分析:根据计算第p百分位数的步骤进行.
解:将所给数据按从小到大排序,可得
48 49 50 51 52 52 53 53 54 54
54 55 55 55 56 56 56 56 56 56
57 57 57 58 58 59 59 59 60 62
(1)由25%×30=7.5,75%×30=22.5,可知它们的25%,75%分位数分别是第8,23项数据,分别为53,57.
(2)由80%×30=24,可知第80百分位数为第24项与第25项数据的平均数,即
据此可以估计本校高一男生体重的第80百分位数为58.
计算第p百分位数的步骤:         
(1)按从小到大排列原始数据.
(2)计算i=n×p%.
(3)若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
【变式训练1】
一组数据分别是3.65,3.68,3.68,3.72,3.73,
3.75,3.80,3.80,3.81,3.83,求它们的75%,50%分位数.
解:这组数据已经按从小到大排序,共有10项.
由75%×10=7.5,50%×10=5,可得75%分位数是第8项数据3.80,50%分位数是第5项和第6项数据的平均数,为
探究二
百分位数在统计表或统计图中的应用
【例2】
某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成的频率分布直方图如图所示.
?
估计参赛学生的成绩的25%,90%分位数.
分析:根据累计频率计算,把每组中的数看成均匀分布.
解:由频率分布直方图得,从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.
成绩在60分以下的学生所占比例为30%>25%,
所以25%分位数一定位于[50,60)内.
可以估计参赛学生的成绩的25%分位数为58.3;
成绩在80分以下的学生所占比例为30%+40%+15%=85%<90%,
成绩在90分以下的学生所占比例为30%+40%+15%+10%=95%>90%,
所以90%分位数一定位于[80,90)内.
可以估计参赛学生的成绩的90%分位数为85.
频率分布表和频率分布直方图与原始数据相比,它们损失了一些信息.计算第p百分位数的值,根据累计频率先推算这个值所在的区间,再把区间内的数据看成均匀分布,估计这个值.
【变式训练2】
某工厂对一批产品进行了抽样检测,下图是根据抽样检测后的产品净重数据绘制的频率分布直方图,其中产品净重的范围是[96,106](单位:g),样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].
?
试估计样本数据的第70百分位数.
解:由频率分布直方图得,从左到右的第一、二、三、四、五小组的频率分别是0.10,0.20,0.30,0.25,0.15.
净重在102
g以下的产品所占比例为10%+20%+30%=60%<70%,
净重在104
g以下的产品所占比例为10%+20%+30%+25%=85%>70%,
所以70%分位数一定位于[102,104)内.
可以估计样本数据的第70百分位数为102.8.




对求第p百分位数的步骤不明确而致误
【典例】
从某城市随机抽取14台自动售货机,对其销售额进行统计,数据如下:
8,8,10,12,22,23,20,23,32,34,31,34,42,43.
则这14台自动售货机的销售额的第50,80百分位数分别为
   、   .?
错解:因为14×50%=7,14×80%=11.2≈11,所以第50,80百分位数分别是第7,11项,分别为20,31.
答案:20 31
以上解答过程中都有哪些错误?出错的原因是什么?你如何改正?你如何防范?
提示:上述错解有3处错误,第一,没有把数据按从小到大排序;第二,14×50%=7,为整数,此百分位数应为第7项和第8项数据的平均数;第三,14×80%=11.2,不能四舍五入,此百分位数应取第12项数据.
正解:把14台自动售货机的销售额按从小到大排序,得8,8,10,12,20,22,23,23,31,32,34,34,42,43.
因为14×50%=7,14×80%=11.2,
所以第50百分位数是第7项和第8项数据的平均数,
答案:23 34
1.明确求第p百分位数的步骤.
2.注意n×p%的值是整数和非整数时的百分位数的取值情况.
【变式训练】
已知一组数据4.3,6.5,7.8,6.2,9.6,15.9,7.6,8.1,
10,12.3,11,3,则它们的75%分位数是    .?
解析:把数据从小到大排序,得3,4.3,6.2,6.5,7.6,7.8,8.1,9.6,10,11,
12.3,15.9,共有12个数.
因为12×75%=9,所以75%分位数是第9项和第10项数据的平均数,
答案:10.5




1.已知一组数据为6,47,49,15,42,41,7,39,43,40,36,则这组数据的下四分位数是(  )
A.47
B.49
C.7
D.15
解析:由小到大排列的结果:6,7,15,36,39,40,41,42,43,47,49,一共11项.
下四分位数即第25百分位数,由11×25%=2.75,得下四分位数是第3项数据15.
答案:D
2.一样本的频率分布直方图如图所示,样本数据共分3组,分别为[5,10),[10,15),[15,20].
?
估计样本数据的第60百分位数是   .?
解析:第1组[5,10)的频率为0.04×(10-5)=0.20;
第2组[10,15)的频率为0.10×5=0.50;
答案:14
3.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:h)的数据,整理得到数据分组及频数分布表.
(1)求这100名学生的一周课外阅读时间的四分位数;
(2)估计本校学生的一周课外阅读时间的第90百分位数.
解:由频数分布表得,从小到大的第1,2,3,4,5,6,7,8,9组数据的频率分别为0.06,0.08,0.17,0.22,0.25,0.12,0.06,0.02,0.02.
(1)前2组数据的频率之和为0.06+0.08=0.14,前3组数据的频率之和为0.06+0.08+0.17=0.31,前4组数据的频率之和为0.31+0.22=0.53,前5组数据的频率之和为0.53+0.25=0.78.
第三四分位数即第75百分位数在第5组[8,10)内,
所以四分位数分别为5.29,7.73,9.76.
(2)因为前6组数据的频率之和为0.78+0.12=0.90,所以第90百分位数为12.
据此可以估计本校学生的一周课外阅读时间的第90百分位数为12.(共37张PPT)
9.2.3 总体集中趋势的估计
课标定位
素养阐释
1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数).
2.会求样本数据的平均数、中位数、众数并理解它们的意义和作用.
3.理解集中趋势参数的统计含义.
4.培养直观想象、数学建模和数学运算素养.
自主预习·新知导学
合作探究·释疑解惑




自主预习·新知导学
平均数、中位数、众数
【问题思考】
1.在初中我们已经学均数、中位数、众数的知识,利用已有知识,回答下列问题:
(1)如果5个数x1,x2,x3,x4,x5的平均数为7,那么x1+1,x2+1,x3+1,
x4+1,x5+1这5个数的平均数是多少?
(2)一组数据12,15,24,25,31,31,31,36,36,37,39,44,49,50的中位数是多少?众数是多少?
②特征:样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变,这是中位数不具有的性质.所以与中位数比较,平均数反映出样本数据中的更多
信息,但平均数受样本中的极端值的影响较大,使平均数在估计总体时可靠性降低.
(2)中位数
①定义:一组数据按从小到大的顺序排成一列,处于中间位置的数称为这组数据的中位数.在频率分布直方图中,中位数左边和右边的直方图的面积相等.
②特征:一组数据的中位数是唯一的,中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变.
(3)众数
①定义:一组数据中出现次数最多的数称为这组数据的众数.在频率分布直方图中,众数是最高矩形的底边的中点.
②特征:一组数据中的众数可能不止一个.众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少一部分,对极端值也不敏感.
(4)一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
(5)平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.
一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的,那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”,那么平均数大于中位数;如果直方图在左边“拖尾”,那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.
3.做一做:
(1)一个样本数据如下:5.3,5.2,5.1,5,3.3,4,4.5,3.2,4.5,则该样本的众数和中位数分别为(  )
A.4.5和5
B.4.5和4
C.4.5和4.5
D.4.5和4.75
(2)已知一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均值为(  )
A.4.55
B.4.5
C.12.5
D.1.64
解析:(1)将样本数据按从小到大的顺序排列:
3.2,3.3,4,4.5,4.5,5,5.1,5.2,5.3,
故众数为4.5,中位数为4.5.
答案:(1)C (2)A
【思考辨析】
判断下列说法是否正确,正确的在后面的括号内画“√”,错误的画“×”.
(1)若数据个数为偶数,则中位数是按从小到大顺序排列的最中间的那两个数.(
×
)
(2)在频率分布直方图中,众数是最高矩形的底边的中点.(

)
(3)因为样本平均数与每一个样本数据有关,所以用平均数能更好地反映数据的集中趋势.(
×
)
(4)在一组数据中,众数只有一个.(
×
)
合作探究·释疑解惑
探究一
探究二
探究三
探究一
平均数、中位数、众数在具体数据中的应用
【例1】
高一(3)班有男同学27名,女同学21名,在一次语文测验中,男同学的平均分是82分,中位数是75分,女同学的平均分是80分,中位数是80分.
(1)求这次测验全班的平均分(精确到0.01分);
(2)估计全班成绩在80分以下(含80分)的同学至少有多少人;
(3)分析男同学的平均分与中位数相差较大的主要原因.
分析:根据平均数和中位数的定义解决.
(2)因为男同学成绩的中位数是75分,
所以至少有14人得分不超过75分.
又因为女同学成绩的中位数是80分,
所以至少有11人得分不超过80分.
所以估计全班至少有25人得分低于80分(含80分).
(3)男同学的平均分与中位数的差别较大,说明男同学的成绩中两极分化现象严重,分数高的和低的相差较大.
若样本平均数大于样本中位数,则说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.中位数、平均数都是描述数值型数据的集中趋势的量,其中样本平均数的大小与每一个样本数据有关,任何一个数据的改变都会引起平均数的改变;但中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变.
【变式训练1】
某工厂人员及周工资构成如下表:
(1)求工厂人员周工资的众数、中位数、平均数;
(2)平均数能客观地反映该工厂的工资水平吗?为什么?
解:(1)由题中表格可知,众数为1
200,中位数为1
220,平均数为(2
200+1
250×6+1
220×5+1
200×10+490)÷23=1
230.
(2)虽然平均数为1
230元/周,但从题干表格中所列出的数据可见,只有经理和6名管理人员的周工资在平均数以上,其余17人的周工资都在平均数以下,故用平均数不能客观真实地反映该厂的工资水平.
探究二
在频率分布直方图中求平均数、中位数、众数
【例2】
某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
?
(1)求这次测试数学成绩的众数;
(2)求这次测试数学成绩的中位数;
(3)求这次测试数学成绩的平均分.
分析:利用频率分布直方图求众数、中位数、平均数,众数、中位数分别是频率分布直方图中最高的小矩形的中间值、累计频率为0.5时所对应的样本数据的值,平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
本例条件不变,试估计80分以上的学生人数.
解:[80,90)分的频率为0.025×10=0.25,
频数为0.25×80=20.
[90,100)分的频率为0.005×10=0.05,
频数为0.05×80=4.
所以估计80分以上的学生人数为20+4=24.
1.众数、中位数、平均数与频率分布表、频率分布直方图的关系
(1)众数:众数一般用频率分布表中频率最高的一小组的组中值来表示,即在样本数据的频率分布直方图中,最高矩形的底边中点的横坐标.
(2)中位数:在频率分布表中,中位数是累计频率(样本数据小于某一数值的频率叫作该数值点的累计频率)为0.5时所对应的样本数据的值,而在样本中有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(3)平均数:平均数在频率分布直方图中可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.平均数是频率分布直方图的“重心”.
2.利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.
【变式训练2】
某中学举行电脑知识竞赛,现将高一参赛学生的成绩整理后分成五组,绘制成频率分布直方图如图所示.已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.
求:(1)高一参赛学生的成绩的众数、中位数;
(2)高一参赛学生的平均成绩.
解:(1)由题图可知众数为65.
因为第一个小矩形的面积为0.3,
第二个小矩形的面积为0.4,0.3+0.4>0.5,因此中位数位于第二个小矩形内.
所以设中位数为60+x,
则0.3+x×0.04=0.5,得x=5,
所以中位数为60+5=65.
(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,
故平均成绩约为67.




1.奥运会体操比赛的计分规则为:当评委亮分后,其成绩先去掉一个最高分,去掉一个最低分,再计算剩下分数的平均值,这是因为(  )
A.减少计算量
B.避免故障
C.剔除异常值
D.活跃赛场气氛
解析:因为在体操比赛的评分中使用的是平均分,所以计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,防止个别裁判的人为因素给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量公平.
答案:C
2.已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是(  )
A.平均数>中位数>众数
B.平均数<中位数<众数
C.中位数<众数<平均数
D.众数=中位数=平均数
答案:D
3.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,则由此求出的平均数与实际平均数的差是
(  )
A.3.5
B.-3
C.3
D.-0.5
答案:B
4.若已知某组数据的频率分布直方图如图所示,则估计该组数据的众数为      ,中位数为      .?
解析:由于众数是样本中出现次数最多的数,由直方图可估计为15.5.中位数是样本中的中间数据,由于样本数据在区间[13,14)的频率为0.02,在区间[14,15)内的频率为0.18,在区间[15,16)内的频率为0.36,0.02+0.18+0.36>0.5,所以中位数落在区间[15,16)内,设中位数为x,
5.某水厂为了了解某小区居民的用水情况,随机抽查了该小区10户家庭的月用水量,结果如下:
(1)计算这10户家庭该月平均用水量;
(2)如果该小区有500户家庭,根据上面的计算结果,估计该小区居民每月共用水多少立方米?(共44张PPT)
9.2.4 总体离散程度的估计
课标定位
素养阐释
1.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差).
2.会求样本数据的方差、标准差、极差.
3.理解离散程度参数的统计含义.
4.培养直观想象、数学建模和数学运算素养.
自主预习·新知导学
合作探究·释疑解惑








自主预习·新知导学
极差、方差、标准差
【问题思考】
1.甲、乙两位射击运动员在一次射击测试中各射靶10次,每次命中的环数分别是:
甲:7,8,7,9,5,4,9,10,7,4
乙:9,5,7,8,7,6,8,6,7,7
(2)甲、乙两位射击运动员命中环数的中位数分别是多少?能否由中位数判断两人的射击水平?
提示:中位数都是7,由于中位数相等,故无法判断.
(3)甲、乙两位射击运动员命中环数的众数分别是多少?能否由众数判断两人的射击水平?
提示:众数都是7,由于众数相等,故无法判断.
(4)观察上述两组数据,你认为哪个人的射击水平更稳定?
提示:从数字分布来看,甲命中的环数较分散,乙命中的环数较集中,故乙的射击水平更稳定.
2.填空:
(1)极差
①定义:一组数据中最大值与最小值的差.
②特征:用极差是一种简单的度量数据离散程度的方法,极差在一定程度上刻画了数据的离散程度.但因为极差只使用了数据中最大、最小两个值的信息,对其他数据的取值情况没有涉及,所以极差所含的信息量很少.
④特征:标准差、方差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.
3.做一做:
(1)甲、乙两位同学都参加了由学校举办的7场篮球比赛,平均得分均为16分,标准差分别为5.09和3.72,则甲、乙两同学在这次篮球比赛活动中,发挥得更稳定的是(  )
A.甲
B.乙
C.甲、乙相同
D.不能确定
(2)某学员在一次射击测试中射靶6次,命中环数为:9,5,8,4,6,10,则命中环数的极差为    ;命中环数的方差为    .
解析:(1)方差或标准差越小,数据的离散程度越小,表明发挥得越稳定.
因为5.09>3.72,所以选B.
(2)由极差的定义知,极差为10-4=6.由平均数、方差公式知,平均数为
【思考辨析】
判断下列说法是否正确,正确的在后面的括号内画“√”,错误的画“×”.
(1)极差对一组数据中的极端值非常敏感.(

)
(2)方差与原始数据的单位一致.(
×
)
(3)标准差、方差越小,数据的离散程度越大,即数据离平均数波动的幅度越大.(
×
)
(4)平均数和标准差一起能反映数据取值的更多信息.(

)
合作探究·释疑解惑
探究一
探究二
探究三
探究一
标准差与方差的应用
【例1】
甲、乙两机床同时加工直径为100
cm的零件,为检验质量,从中抽取6件测量数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的极差、平均数及方差;
(2)根据计算说明哪台机床加工零件的质量更稳定.
分析:(1)利用极差、平均数和方差的公式计算.
(2)先比较平均数的大小,再比较方差的大小.
在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差):方差大说明取值离散程度大,方差小说明取值离散程度小或者取值集中、稳定.
【变式训练1】
对划艇运动员甲、乙在相同的条件下进行了6次测试,测得他们每次的最大速度(单位:m/s)如下:
甲:27,38,30,37,35,31
乙:33,29,38,34,28,36
根据以上数据,试判断他们谁的成绩比较稳定.
探究二
用平均数和标准差分析数据
【例2】
某校代表队20名同学在一次英语听力比赛中的成绩(单位:分)如下:56,68,68,64,65,70,72,73,71,71,76,76,77,80,86,
88,89,80,82,88.
本例条件不变,求有多少名同学的成绩在以平均数为中心、2倍标准差的范围内.
【变式训练2】
某农场计划种植某种新品种作物,为此对这种作物进行田间试验.先选取一大块地,再把这一大块地分成50(n>10)小块地种植新品种作物,试验结束后随机抽取了10小块地的每公顷产量(单位:kg/hm2):403,397,390,408,404,388,
400,412,406,392.求:
(1)10小块地的每公顷产量的样本平均数和样本方差;
(2)能否说明这50小块地的每公顷产量都在以平均数为中心、2倍标准差的范围之内?
解:(1)10小块地的每公顷产量的样本平均数和样本方差分别为:
这10小块地的每公顷产量都在以平均数为中心、2倍标准差的范围之内.但抽样具有随机性,不能说明这50小块地的每公顷产量也都在以平均数为中心、2倍标准差的范围之内.
探究三
用样本平均数和样本标准差估计总体
【例3】
某高校欲了解在校学生用于课外进修(如各种考证辅导班、外语辅导班等)的开支,在全校8
000名学生中用分层随机抽样抽取了一个200人的样本,根据统计,本科生人数为全校学生数的70%,调查最近一个学期课外进修支出(单位:元)的结果如下:
试估计全校学生用于课外进修的平均开支和开支的方差.
由于分层随机抽样按比例分配,所以可以估计全校学生用于课外进修的平均开支为276.2元,开支的方差为1
484.76.
1.计算样本平均数、样本方差直接利用公式,注意公式的变形,样本方差
2.在按比例分配的分层随机抽样中,我们可以用样本平均数和样本方差估计总体平均数和总体方差.
【变式训练3】
在一个文艺比赛中,8名专业人士和12名观众代表各组成一个评判小组,给参赛选手打分.在给某选手的打分中,专业人士打分的平均数和标准差分别为47.4和3.7,观众代表打分的平均数和标准差为56.2和11.8,试根据这些数据计算这名选手得分的平均数和标准差.
总样本标准差s≈10.37.
所以计算这名选手得分的平均数为52.68分,标准差约为10.37.




方差、标准差混淆而致误
【典例】
从某项综合能力测试中抽取100人的成绩,统计如表所示,则这100人成绩的标准差为     .?
以上解答过程中都有哪些错误?出错的原因是什么?你如何改正?你如何防范?
提示:错解中求的是方差,而不是标准差.
1.理解方差的加权形式的计算公式.
2.注意方差和标准差的区别与联系,审清题意.  




1.下列说法正确的是(  )
A.在两组数据中,平均数较大的一组方差较大
B.平均数反映数据的集中趋势,方差则反映数据的离散程度
C.方差的求法是求出各个数据与平均值的差的平方后再求和
D.在记录两个人射击环数的两组数据中,方差大的表示射击水平高
解析:A中平均数和方差是数据的两个特征,不存在这种关系;C中求和后还需取平均数;D中方差越大,射击越不平稳,水平越低.
答案:B
2.某校举行元旦诗歌朗诵比赛,七位评委为某位选手打出的分数为79,84,84,86,84,87,93,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为(  )
A.84,4.84
B.84,1.6
C.85,1.6
D.85,0.4
答案:C
答案:B
4.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是
     .?
答案:0.1
5.抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:
则成绩较为稳定的那位运动员成绩的方差为     .?
答案:2(共15张PPT)
9.3 统计案例
公司员工的肥胖情况调查分析
课标定位
素养阐释
1.了解数据分析的意义.
2.了解统计分析报告的主要组成部分.
3.会选择合适的图表描述和表达实际问题的样本数据.
4.会从实际问题的样本数据中提取刻画其特征的量(如中位数、均值、方差等).
5.经历数据分析的全过程,提升数学运算、数学建模、逻辑推理和直观想象的数学素养.
一、数据分析简介
1.数据分析的含义
数据分析是指针对研究对象获取数据,运用数学方法对数据进行整理、分析和推断,形成关于研究对象知识的素养.
数据分析是研究随机现象的重要数学技术,是大数据时代数学应用的主要方法,也是“互联网+”相关领域的主要数学方法,数据分析已经深入到科学、技术、工程和现代社会生活的各个方面.
2.数据分析的过程
数据分析的基本过程包括:收集数据、整理数据、提取信息、构建模型、进行推断、获得结论.
3.统计分析报告的主要组成部分(以调查公司员工的肥胖情况为例)
(1)标题
(2)前言
简单交代调查的目的、方法、范围等背景情况,使读者了解调查的基本情况.
(3)主体
展示数据分析的全过程:首先要明确所关心的问题是什么,说明数据蕴含的信息;根据数据分析的需要,说明如何选择合适的图表描述和表达数据;从样本数据中提取能刻画其特征的量,如均值、方差等,用于比较男、女员工在肥胖状况上的差异;通过样本估计总体的统计规律,分析公司员工胖瘦程度的整体情况.
(4)结尾
对主体部分的内容进行概括,结合控制体重的一般方法(可以查阅有关文献),提出控制公司员工体重的建议.
二、数据分析例题
【例题】
近年来,青少年视力水平的下降已经引起全社会的关注.为了使学生意识到保护视力的重要性,某中学开展了一次中小学生视力测试,采用如下的国际标准视力表测试学生的视力,以五分记录,得到全校学生的视力数据.
按照简单随机抽样从一至九年级中每个年级各抽查一个班级,得分在5.0及以上的是合格,低于5.0的是不合格,得到的数据统计如下:
请你根据给出的数据信息回答下列问题:
(1)填写下表中未完成部分的数据;
(2)试比较小学(一至五年级)、初中(六至九年级)在视力状况上的差异;
(3)试分析初中学生视力比小学学生视力下降的原因;
(4)提出保护视力的建议.
解:(1)92.00% 91.67% 75.00% 78.95%
(2)通过对以上学生视力的数据分析发现,小学的大部分学生的视力都处于正常水平,视力都能保持在5.0以上,初中学生视力的不合格率明显高于小学.从整体测得的结果来看,小学学生视力的平均合格率要高于初中学生.
(3)分析其主要原因可能有以下几点:第一,初中学生平时的学习任务相对繁重,导致用眼过多而造成视力正常率较低;第二,初中学生对手机还有电脑的使用较多;第三,初中学生对眼保健操的重视程度不够;第四,初中学生平常的学习行为以及座位没有及时更换.
(4)①适当减轻学生的作业负担,尽量让学生当堂消化掉所学知识,以免回家熬夜学习;
②通过家校联合的方式来监督学生对手机、电脑的使用,禁止学生带手机进入校园;
③加强对学生做眼保健操的监督力度,要让学生将眼保健操视为眼睛的“一日三餐”一样,使做眼保健操成为学生的一种习惯.
【变式训练】
某市2013年4月和2018年4月30天的空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
2013年4月:
61,76,70,56,81,91,125,161,105,81,88,67,101,115,159,91,77,
86,81,83,82,82,64,79,86,85,42,56,49,45;
2018年4月:
35,54,80,86,72,85,58,72,102,53,10,66,56,36,18,25,23,40,60,
89,88,54,79,14,16,40,59,67,108,62.
根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,空气质量为良;在101~150之间时,空气质量为轻度污染;在151~200之间时,空气质量为中度污染.请你依据所给数据和上述标准,回答下列问题:
(1)请根据2013年4月30天的数据完成下表中未完成部分的数据;
(2)请根据上面的数据和(1)中表的信息,对该市2013年4月的空气质量给出一个简短评价;
(3)请根据2018年4月的空气质量状况,分析政府对大气污染的治理效果.
解:(1)4 0.1 0.13 0.07
(2)答对下述两条中的一条即可.
①该市一个月中空气污染指数有3天处于优的水平,占当月天数的0.1,有21天处于良的水平,占当月天数的0.7,处于优或良的天数共有24天,占当月天数的0.6,说明该市空气质量一般.
②轻度污染有4天,占当月天数的0.13,有2天处于中度污染,占当月天数的0.07,污染指数在80以上的接近轻度污染的天数有12天,加上处于轻度和中度污染的天数,共有18天,占当月天数的0.6,超过50%,说明该市空气质量有待进一步改善.
(3)2018年4月的30天中,空气污染指数有10天处于优的水平,占当月天数的0.33,有18天处于良的水平,占当月天数的0.6,有2天处于轻度污染,占当月天数的0.07,而且处于优或良的天数共有28天,占当月天数的0.93,说明该市政府对大气污染的治理效果很明显.(共74张PPT)
第4课时 统计
知识梳理·构建体系
专题归纳·核心突破
知识梳理·构建体系
知识网络
要点梳理
知识网络
要点梳理
1.总体、个体、变量、样本、样本量的含义是什么?请完成下表:
2.简单随机抽样的方法有哪些?具体操作过程是什么?请完成下表:
3.在样本量按比例分配的分层随机抽样中怎样确定分配比例?怎样用样本平均数估计总体平均数?
在分层随机抽样中,如果层数为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n.
(1)在样本量按比例分配的分层随机抽样中,分配比例为
(2)用X1,X2,…,XM表示第1层各个个体的变量值,用x1,x2,…,xm表示第1层样本的各个个体的变量值;用Y1,Y2,…,YN表示第2层各个个体的变量值,用y1,y2,…,yn表示第2层样本的各个个体的变量值.
总体平均数和样本平均数分别为
(2)特征:各小长方形的面积表示相应各组的频率,频率分布直方图以面积的形式反映数据落在各个小组的频率的大小,各小长方形的面积的总和等于
1
.
5.第p百分位数的定义及计算步骤是什么?
(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有
p%
的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算第p百分位数的步骤:第1步,按从小到大排列原始数据.第2步,计算i=
n×p%
.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
(3)四分位数:常用的分位数有第25百分位数,第50百分位数,第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
6.刻画总体集中趋势的常用统计量有哪些?它们各自的特征是什么?请完成下表:
7.刻画总体离散程度的常用统计量有哪些?它们各自的特征是什么?请完成下表:
【思考辨析】
判断下列说法是否正确,正确的在它后面的括号里画“√”,错误的画“×”.
(1)检测一批种子的发芽率,可以用全面调查.(
×
)
(2)用简单随机抽样抽取样本时,一般都得先对所有个体编号.
(

)
(3)在简单随机抽样中,我们常用样本平均数去估计总体平均数.(

)
(4)分层随机抽样都是分两层.(
×
)
(5)在比例分配的分层随机抽样中,我们可以用样本平均数估计总体平均数.(

)
(6)通过频率分布表和频率分布直方图,可以知道数据落在各个小组的比例大小.(

)
(7)频率分布直方图中分组越多,越容易看出总体数据的分布特点.(
×
)
(8)若一组数据有60个数,则第60百分位数是36个数.(
×
)
(9)对一个单峰的频率分布直方图,如果直方图在右边“拖尾”,那么平均数大于中位数.(

)
(10)方差刻画数据的集中趋势,平均数刻画数据的离散程度.
(
×
)
专题归纳·核心突破
专题整合
高考体验
专题一 随机抽样
【例1】
某单位有2
000名职工,在管理、技术开发、营销、生产各部门中,职工年龄分布如下表所示.
(1)若要抽取40人调查身体状况,则应怎样抽样?
(2)若要召开一个25人的讨论单位发展和薪金调整方面的座谈会,则应怎样抽选出席人?
(3)若要抽取20人调查对广州亚运会举办情况的了解,则应怎样抽样?
分析:(1)身体状况与年龄有关,考虑分层抽样;(2)座谈会与各部门有关,考虑分层抽样;(3)可认为亚运会是大众体育盛会,调查一个单位人员对其情况的了解,可用简单随机抽样.
解:(1)按老年、中年、青年分层,用比例分配的分层抽样法抽取,分配比例为
故老年人、中年人、青年人分别抽取4人、12人、24人.
(2)按管理、技术开发、营销、生产分层,用比例分配的分层抽样法抽取.分配比例为
故管理、技术开发、营销、生产分别抽取2人、4人、6人、13人.
(3)用随机数法:
对全部2
000人随机编号,号码是1,2,3,…,2
000.利用信息技术生成20个不同的随机数,把产生的随机数作为抽中的编号,与编号对应的20人就是要抽取的样本.
研究统计问题的基本思想方法就是从总体中抽取样本,用样本估计总体,因此选择适当的抽样方法抽取具有代表性的样本对整个统计问题起着至关重要的作用.本题审题的关键有两点,一是对图表中的人员分类情况和数据要审视清楚;二是对样本的功能要审视准确.
【变式训练1】
某网站就观众对2019年春晚小品类节目的喜爱程度进行网上调查,其中持各种态度的人数如下表:
现用样本量比例分配的分层随机抽样的方法从所有参与网上调查的观众中抽取了一个容量为n的样本.若从不喜欢小品的观众中抽取的人数为5,求n的值.
专题二 总体取值规律与百分位数的估计
【例2】
某中学高一女生共有450人,为了了解高一女生的身高情况,随机抽取部分高一女生测量身高(单位:cm),所得数据整理后列出频率分布表如右.
(1)求出表中字母m,n,M,N所对应的数值;
(2)在给出的直角坐标系中画出频率分布直方图;
(3)估计该校高一女生身高在149.5~165.5
cm范围内有多少人?
(4)估计该校高一女生身高的第80百分位数.
分析:(1)利用频率分布表的特征求出m,n,M,N;(2)根据画频率分布直方图的步骤画出频率分布直方图;(3)利用样本所占的比例估计总体的分布;(4)利用样本的百分位数估计总体的百分位数.
落在区间165.5~169.5内数据频数m=50-(8+6+14+10+8)=4,
频率为n=0.08,总频率N=1.00.
(2)
(3)该校高一女生身高在149.5~165.5
cm之间的比例为0.12+0.28+0.20+0.16=0.76,则该校高一女生身高在此范围内的人数约为450×0.76=342(人).
(4)由频率分布表知,前四组的频率之和为0.16+0.12+0.28+0.20=0.76,前五组的频率之和为0.76+0.16=0.92,所以样本数据的第80百分位数一定在第五组[161.5,165.5)内,

,估计该校高一女生身高的第80百分位数约为162.5.
与频率分布直方图有关问题的常见类型及解题策略
(1)已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率之和等于1就可求出其他数据.
(2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.
(3)已知频率分布直方图,估计总体的第p百分位数,可利用累计频率估计第p百分位数所在的小组,再把本组数据看成均匀分布计算.
【变式训练2】
某校高三年级有500名学生,为了了解数学学科的学习情况,现从中随机抽取若干名学生在一次测试中的数学成绩(满分为150分),制成如右频率分布表:
(1)表格中①②③④处的数值分别为       、
       、       、       ;?
(2)在图中画出[85,155]的频率分布直方图;
(3)根据题中信息估计总体数学成绩的60%分位数.
②处应填1-0.050-0.1-0.275-0.300-0.200-0.050=0.025,
①处应填0.025×40=1.
(2)频率分布直方图如图所示.
(3)由频率分布表知,
前四组的频率之和为0.025+0.050+0.200+0.300=0.575,
前五组的频率之和为0.575+0.275=0.850,
所以样本数据的60%分位数在第五组[125,135)内,

,
估计总体数学成绩的60%分位数约为125.9.
专题三 总体集中趋势与离散程度的估计
【例3】
甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图所示.
(1)填写下表.
(2)请从以下四个不同的角度对这次测试进行分析.
①从平均数和方差分析偏离程度;
②从平均数和中位数分析谁的成绩好些;
③从平均数和命中9环以上(包括9环)的次数分析谁的成绩好些;
④从折线图上两人射击命中环数及走势分析谁更有潜力.
分析:由上图可知甲、乙射靶10次命中的环数,根据中位数、平均数、方差的定义及计算公式可分别求得甲、乙两人的中位数、平均数及方差,通过比较它们的大小,可以分析出甲、乙两人成绩的偏离程度、集中趋势、成绩的好坏及有无潜力等问题.
甲的射靶环数按从小到大的顺序排列为5,6,6,7,7,7,7,8,8,9,
所以中位数为7.于是填充后的表格如下表所示.
(2)①甲、乙的平均数相同,均为7,但
,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.
②甲、乙平均水平相同,而乙的中位数比甲大,可见乙射靶环数的优秀次数比甲多.
③甲、乙平均水平相同,而乙命中9环以上(包括9环)的次数比甲多2次,可见乙的射靶成绩比甲好.
④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上下波动不大,说明乙的状态在提升,有潜力可挖.
1.本例由图转化成数,由数填表,由表读数,体现了转化与化归思想.
2.平均数、中位数和众数从不同角度刻画了数据的集中趋势;极差、方差和标准差刻画了数据的离散程度,一组数据的方差或标准差越大,说明这组数据的离散程度越大.
3.在实际问题中,仅靠平均数不能完全反映问题还要研究标准差,平均数和标准差一起能反映数据取值的更多信息.通过样本数据落在以平均数为中心、1倍或2倍标准差的范围内的个数,估计总体数据的分布规律.
【变式训练3】
从高三年级抽出50名学生参加数学竞赛,由成绩得到频率分布直方图如图所示.
?
试利用频率分布直方图求:
(1)这50名学生成绩的众数与中位数;
(2)这50名学生的平均成绩.
解:(1)在频率分布直方图中,众数是高度最高的小长方形的底边中点的横坐标,所以众数应为75.在频率分布直方图中,中位数的左右两边频率相等,也就是左右两边小矩形的面积和相等,都等于0.5.
从左向右数,前三个小矩形面积的和为0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,
第四个小矩形面积为0.03×10=0.3,
则前四个小矩形面积的和为0.3+0.3>0.5,
所以中位数位于第四个小矩形内.
设中位数在第四个小矩形内的底边长为x,高为0.03,
则0.03x=0.2得x≈6.7,
故中位数约为70+6.7=76.7.
(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积,求和即可.
因此平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)≈74.
考点一 随机抽样
1.(2018·全国Ⅲ高考改编)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层随机抽样,则最合适的抽样方法是       .?
解析:由题意,不同年龄段客户对其服务的评价有较大差异,故采取分层随机抽样法.
答案:分层随机抽样
2.(2017·江苏高考改编)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用样本量比例分配的分层随机抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取
       件.?
答案:18
考点二 总体取值规律与百分位数的估计
3.(2018·全国Ⅰ高考)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
建设前经济收入构成比例
建设后经济收入构成比例
则下面结论中不正确的是(  )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
解析:设建设前经济收入为1,则建设后经济收入为2,建设前种植收入为0.6,建设后种植收入为2×0.37=0.74,故A不正确;建设前的其他收入为0.04,养殖收入为0.3,建设后其他收入为0.1,养殖收入为0.6,故B,C正确;建设后养殖收入与第三产业收入的总和所占比例为58%,故D正确,故选A.
答案:A
4.(2019·全国Ⅲ高考)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位.阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为(  )
A.0.5
B.0.6
C.0.7
D.0.8
解析:由题意得,阅读过《西游记》的学生人数为90-80+60=70,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为
.故选C.
答案:C
5.(2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),
…,[80,90],并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的可能性大小;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
解:(1)由频率分布直方图知,分数小于70的频率为1-(0.04+0.02)
×10=0.4,故从总体400名学生中随机抽取1人,其分数小于70的可能性大小为0.4.
(2)由频率分布直方图知分数在50~90之间的人数为100×(0.01+0.02+0.04+0.02)×10=90(人),
由于分数小于40的学生有5人,所以分数在区间[40,50)内的人数为100-90-5=5(人).
(3)由频率分布直方图知分数不小于70的共60人,由已知得男女各占30人,从而样本中男生有60人,女生有40人,故总体中男生与女生的比例为
考点三 总体集中趋势与离散程度的估计
6.(2017·全国Ⅰ高考)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是(  )
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
解析:标准差和方差可刻画样本数据的稳定程度,故选B.
答案:B
7.(2019·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是     .?
8.(2019·全国Ⅱ高考)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为    .?
解析:由题意,得经停该高铁站的列车的正点数约为10×0.97+
20×0.98+10×0.99=39.2,其中车次数为10+20+10=40,所以经停该站高铁列车所有车次的平均正点率的估计值为
答案:0.98
9.(2019·全国Ⅱ高考)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是(  )
A.中位数
B.平均数
C.方差
D.极差
解析:设9位评委的评分按从小到大排列为x1答案:A
10.(2019·全国Ⅱ高考)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
解:(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
11.(2019·全国Ⅲ高考改编)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中一、A组小鼠给服甲离子溶液,二、B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
甲离子残留百分比直方图
乙离子残留百分比直方图
已知乙离子残留在小鼠体内的百分比不低于5.5的频率是0.7.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
解:(1)由已知得0.70=(a+0.20+0.15)×1,
故a=0.35.
b=1-(0.05+0.15+0.35+0.20+0.15)×1=0.10.
(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
12.(2018·全国Ⅰ高考改编)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
使用了节水龙头50天的日用水量频数分布表
(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图:
(2)计算该家庭使用节水龙头后,
日用水量小于0.35
m3的频率;
(3)估计该家庭使用节水龙头后,
一年能节省多少水?(一年按365
天计算,同一组中的数据以这组
数据所在区间中点的值作代表)
解:(1)
(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35
m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,
因此该家庭使用节水龙头后日用水量小于0.35
m3的频率为0.48.