(共27张PPT)
章末总结
第九章统计
一
二
三
教学目标
理解抽样方法与数据获取
会计算样本的数据特征
会看图(频率分布直方图),估计数据特征
教学目标
复习回顾1 理解抽样方法与数据获取
问题1 抽样的方法有哪些?
方法 内容 特征
简单随机抽样 包括放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.
抽签法 编号、放在一个不透明的盒里,充分搅拌.最后从盒中不放回地抽取号签
随机数法 编号、产生随机数,把产生的随机数作为抽中的编号,并剔除重复的编号,直到抽足样本所需要的个体数.
分层随机抽样 一个或多个变量把总体划分成若干个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本。
问题2 获取数据的基本途径有哪些?
(1)通过调查获取数据;(2)通过观察获取数据;
(3)通过试验获取数据;(4)通过查询获取数据.
问题3 常用的统计图表有哪些?
扇形图、条形图、频数分布直方图、折线图、频率分布直方图.
复习回顾1 理解抽样方法与数据获取
测
(概念辨析)
【答案】C
【答案】BD
测
考点一:理解抽样方法与分析数据(概念辨析)
【答案】10
答案是:169 ,105, 071, 286,443.
测
考点一:理解抽样方法与分析数据(统计图表)
【答案】C
测
考点一:理解抽样方法与分析数据(统计图表)
【答案】BD
测
【答案】AC
考点一:理解抽样方法与分析数据(统计图表)
【详解】
解:①从折线统计图能看出世界人口的变化情况,故①正确;
②从条形统计图中可得到:2050年非洲人口大约将达到18亿,故②错;
③从扇形统计图中能够明显的得到结论:2050年亚洲人口比其他各洲人口的总和还要多,故③正确;
④由上述三幅统计图并不能得出从1957年到2050年中哪个洲人口增长速度最慢,故④错误.
因此正确的命题有①③.
故选:AC.
复习回顾2 计算样本的数据特征
问题4 如何求取一组数据的第p百分位数?
第一步
第二步
第三步
按从小到大排列原始数据
计算i=n×p%.
若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第项与第(i+1)项数据的平均数.
计算一组n个数据的第p百分位数步骤:
总体百分位数的估计
问题5 什么数据特征是描述总体集中的趋势?
平均数、众数和中位数都描述了数据的集中趋势
众数:一组数据中出现次数最多的数.
中位数:一组数据按大小顺序依次排序后,当数据个数是奇数时,处在最中间的数是中位数;当数据个数是偶数时,最中间两个数的平均数是中位数.
平均数:
总体集中趋势的估计
复习回顾2 计算样本的数据特征
加权平均数与频率平均数
加权平均数
一般地,如果在n个数中, 出现的频数为, 出现的频数为,…, 出现的频数为(其中),那么
叫做这个数的频数平均数,也称为加权平均数.
频率平均数
一般地,若数据的频率分别,则这个n个数的频率平均数的计算公式为
复习回顾2 计算样本的数据特征
问题6 什么数据特征是描述总体数据的离散程度?
平均数、极差、方差、标准差!
问题8 如何计算方差、标准差?
一组数据是x1,x2,…,xn,用 表示这组数据的平均数,这组数据的方差为____________
标准差为
复习回顾2 计算样本的数据特征
特征:
标准差和方差刻画了数据的______程度或波动幅度.
标准差(或方差)越大,数据的离散程度越____,越不稳定;
标准差(或方差)越小,数据的离散程度越____,越稳定.
在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用_______.
离散
大
小
标准差
问题7 方差、标准差的特征是什么?
标准差与方差的取值范围
复习回顾2 计算样本的数据特征
测
考点二:计算样本的数据特征
测
【答案】C
【答案】A
复习回顾2 计算样本的数据特征
测
【答案】ABCD
【答案】(1)中位数为15岁,众数为15岁,平均数15岁,它们都能较好地反映甲群市民的年龄特征;
(2)中位数为5.5岁,众数为6岁,平均数15岁,中位数和众数能较好地反映乙群市民的年龄特征.
复习回顾2 计算样本的数据特征
测
复习回顾2 计算样本的数据特征
测
【答案】BD
复习回顾2 计算样本的数据特征
问题8 如何画频率分布直方图?
(1)求极差;
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表;
(5)画频率分布直方图.
复习回顾3 看图(频率分布直方图),估计数据特征
复习回顾3 看图(频率分布直方图),估计数据特征
平均数 中位数 众数
在频率分布直方图中的含义
特点
优点 缺点 每个小矩形面积乘以小矩形底边中点的横坐标之和
与每一个数据有关,任何一个数的改变都会引起它的改变
把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标
只利用了样本数据中间位置的一个或两个值,并未利用其他数据
最高矩形底边中点的横坐标
只利用了出现次数最多的那个值的信息
受极端数据的影响较大.
代表了样本数据更多的信息.
只能表达样本数据中的少量信息.
容易计算,不受少数几个极端值的影响.
问题9 如何在频率分布直方图估计总体数据特征?
测
考点三:看图估计数据
测
测
【答案】(1)58;
(2)众数7,中位数2,平均数7.16
考点三:看图估计数据
测
考点三:看图估计数据
测
小结第九章章末复习
理解抽样方法与分析数据
(概念辨析)
1.(2022·全国·高一课前预习)在以下调查中,不适合用普查的是( )
A.调查一批小包装饼干的卫生是否达标 B.调查一批袋装牛奶的质量
C.调查一个班级每天完成家庭作业所需要的时间 D.调查一批绳索的抗拉强度是否达到要求
2.(2022·全国·高一课前预习)粮食安全是每一个国家必须高度关注的问题,在现有条件下,降雨量对粮食生产的影响是非常大的,某次降雨之后该地气象台播报说本次降雨量是该地有气象记录以来最大的一次,气象台获取这些数据的途径是( )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
3.(2022·山西运城·高一阶段练习)为了了解某市初三毕业生身高情况,从毕业生中随机抽查了1000名学生的身高进行统计分析,在这个问题中,下列说法正确的是( )
A.总体指的是该市初三毕业的全体学生 B.个体指的是每一名学生的身高
C.样本指的是1000名学生 D.样本是指1000名学生的身高
4.(2022·山西·高一阶段练习)某高中共有学生1000人,其中高一和高二各有400人,现采用分层抽样的方法抽取容量为25的样本,那么高二抽取的人数为___________.
5.(2021·湖南永州·高一期末)某校共有男女学生共有人,采用分层抽样的方法抽取容量为人的样本,样本中男生有人,则该校女生人数是( )
A. B. C. D.
6.(2022·四川省峨眉第二中学校高二阶段练习(文))假设从高一年级全体同学(500人)中随机抽出60人参加一项活动,利用随机数法抽取样本时,先将500名同学按000,001,…,499进行编号,如果从随机数表第8行第11列的数开始,按三位数连续向右读取,最先抽出的5名同学的号码是(下面摘取了此随机数表第7行和第8行)( )
84421 75331 57245 50688 77047 44767 21763 35025 83921 20676 63016 37859 16955 56719 98105 07175 12867 35807 44395 23879
(统计图表)
7.(2022·河南·模拟预测)某公司生产的一种产品按照质量由高到低分为A,B,C,D四级,为了增加产量、提高质量,该公司改进了一次生产工艺,使得生产总量增加了一倍.为了解新生产工艺的效果,对改进生产工艺前、后的四级产品的占比情况进行了统计,绘制了如下扇形图:
根据以上信息:下列推断合理的是( )
A.改进生产工艺后,A级产品的数量没有变化
B.改进生产工艺后,D级产品的数量减少
C.改进生产工艺后,C级产品的数量减少
D.改进生产工艺后,B级产品的数量增加了不到一倍
8.(2021·湖南师大附中高一期末)中兴 华为事件暴露了我国计算机行业中芯片 软件两大短板,为防止“卡脖子”事件的再发生,科技专业人才就成了决胜的关键.为了解我国在芯片 软件方面的潜力,某调查机构对我国若干大型科技公司进行调查统计,得到了这两个行业从业者的年龄分布的饼形图和“90后”从事这两个行业的岗位分布雷达图,则下列说法中正确的是( )
A.芯片、软件行业从业者中,"90后”占总人数的比例超过60%
B.芯片、软件行业中从事技术、设计岗位的"90后”人数超过总人数的25%
C.芯片、软件行业从事技术岗位的人中,“90后”比“80后”多
D.芯片、软件行业中,“90后”从事市场岗位的人数比“80前”的总人数多
9.(2022·山东·济南一中高一阶段练习)根据关于世界人口变化情况的三幅统计图(如图所示),有下列四个结论:
①从折线统计图能看出世界人口的变化情况;
②2050年非洲人口将达到大约15亿;
③2050年亚洲人口比其他各洲人口的总和还要多;
④从1957年到2050年各洲中北美洲人口增长速度最慢.
其中所有正确结论的编号是( )
① B.②
C.③ D.④
考点二:计算样本的数据特征
(百分位数)
10.(2022·湖南娄底·高二学业考试)某校为了了解学生对“中国梦”伟大构想的认知程度,举办了一次“一带一路”知识竞赛,满分100分,以下数据为参加竞赛决赛的15名同学的成绩(单位:分):68,60,62,76,78,69,70,71,84,74,46,88,73,80,81.则这15人成绩的第80百分位数是
11.(2022·全国·高三专题练习)某班班主任为了了解该班学生寒假期间做家务劳动的情况,随机抽取该班名学生,调查得到这名学生寒假期间做家务劳动的天数分别是,,,,,,,,,,,,,,,这组数据的中位数和众数分别是( )
A., B., C., D.,
12.(2022·全国·高一课时练习)下列命题中不正确的是( )
A.一组数据1,2,3,3,4,5的众数大于中位数
B.数据6,5,4,3,3,3,2,2,2,1的分位数为5
C.若甲组数据的方差为5,乙组数据为5,6,9,10,5,则这两组数据中较稳定的是乙
D.为调查学生每天平均阅读时间,某中学从在校学生中,利用分层抽样的方法抽取初中生20人,高中生10人.经调查,这20名初中生每天平均阅读时间为60分钟,这10名高中生每天平均阅读时间为90分钟,那么被抽中的30名学生每天平均阅读时间为70分钟
13.(2022·吉林·长春市第二实验中学高一期中)某人射箭10次,射中的环数依次为:8,7,8,9,7,6,9,8,10,8关于这组数据,下列说法正确的是( )
A.这组数据的众数是8 B.这组数据的平均数是8
C.这组数据的中位数是8 D.这组数据的方差是
14.(2022·全国·高一课前预习)某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄(单位:岁)如下:
甲群 13,13,14,15,15,15,15,16,17,17;
乙群 54,3,4,4,5,5,6,6,6,57.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?
(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?
15.(2022·全国·高一单元测试)某医院急救中心关于病人等待急诊的时间记录如下表:
等待时间/分
频数
用上述分组资料计算出病人平均等待时间的估计值________,病人等待时间标准差的估计值________.
16.(2022·云南·曲靖一中高二期中)已知样本数据的均值和标准差都是10,下列判断正确的是( )
A.样本数据均值和标准差都等于10;
B.样本数据均值等于31、标准差等于30;
C.样本数据的标准差等于0.1,方差等于1;
D.样本数据的标准差等于2、方差等于4;
考点三:看图估计数据
17.某单位工会有500位会员,利用“健步行”开展全员参与的“健步走奖励”活动.假设通过简单随机抽样,获得了50位会员5月10日的走步数据如下:(单位:万步)
1.1 1.4 1.3 1.6 0.3 1.6 0.9 1.4 1.4 0.9
1.4 1.2 1.5 1.6 0.9 1.2 1.2 0.5 0.8 1.0
1.4 0.6 1.0 1.1 0.6 0.8 0.9 0.8 1.1 0.4
0.8 1.4 1.6 1.2 1.0 0.6 1.5 1.6 0.9 0.7
1.3 1.1 0.8 1.0 1.2 0.6 0.5 0.2 0.8 1.4
(1)写出,,的值;
(2)①绘制频率分布直方图;
②假设同一组中的每个数据可用该组区间的中点值代替,试估计该单位所有会员当日步数的平均值;
(3)根据以上50个样本数据,估计这组数据的第70百分位数.你认为如果定1.3万步为健步走获奖标准,一定能保证该单位至少的工会会员当日走步获得奖励吗 说明理由.
18.某校为了解全校高中学生五一假期参加实践活动的情况,抽查了100名学生,统计他们假期参加实践活动的时间,绘成的频率分布直方图如图所示.
(1)求这100名学生中参加实践活动时间在6~10小时的人数;
(2)估计这100名学生参加实践活动时间的众数、中位数和平均数.
【答案】(1)58;(2)众数7,中位数2,平均数7.16
19.某大学为了解学生对两家餐厅的满意度情况,从在两家餐厅都用过餐的学生中随机抽取了100人,每人分别对这两家餐厅进行满意指数打分(满意指数是指学生对餐厅满意度情况的打分,分数设置为分.根据打分结果按,分组,得到如图所示的频率分布直方图,其中餐厅满意指数在中有30人.
(1)求餐厅满意指数频率分布直方图中的值;
(2)利用样本估计总体的思想,估计餐厅满意指数和餐厅满意指数的平均数及方差(同一组中的数据用该组区间中点值作代表);