4.1样本的数字特征4.2分层随机抽样的均值与方差4.3百分位数课件(共33张PPT)

文档属性

名称 4.1样本的数字特征4.2分层随机抽样的均值与方差4.3百分位数课件(共33张PPT)
格式 zip
文件大小 1.1MB
资源类型 教案
版本资源 北师大版(2019)
科目 数学
更新时间 2022-10-15 15:19:19

图片预览

内容文字预览

(共33张PPT)
§4 用样本估计总体的数字特征
4.1 样本的数字特征
4.2 分层随机抽样的均值与方差
4.3 百分位数
核心知识目标 核心素养目标
1.会求样本的平均数、中位数、众数、极差、方差、标准差,理解它们的意义和作用.
2.会用分层随机抽样的均值与方差公式简化运算.
3.选取恰当的样本数字特征来估计总体,从而正确地对实际问题做出
决策. 1.通过合理选取、认真计算样本的数字特征,培养学生耐心细致、严谨认真的科学态度.
2.经历用统计的方法解决实际问题的过程,培养数学抽象、数学运算、数据分析的学科素养.
知识探究·素养培育
探究点一
样本的数字特征
[问题1] 我们在初中已经学过样本的平均数、中位数、众数、极差、方差,平均数、中位数和众数从不同角度反映了数据的集中趋势,极差和方差都刻画数据的离散程度.
在以上5个特征数中,哪些特征数与样本的每一个数字都有关系 哪些特征数只与样本的个别数字有关 哪个特征数的单位与样本数据的单位不一致
提示:平均数、方差与样本的每一个数字都有关系;
中位数、众数、极差只与样本的个别数字有关;
方差单位与样本数据的单位不一致,单位是样本原始数据单位的平方.
知识点1:给定一组数据x1,x2,…,xn,
极差:数据中 与 的差,从最值方面刻画数据的离散程度;
最大值
最小值
众数:数据中 最多的数据,反映一组数据的多数水平.
从小到大
出现次数
[例1] 甲、乙两台机床同时生产一种零件,在10天中,两台机床每天生产的次品数分别为
甲:0,0,1,2,0,0,3,0,4,0;
乙:2,0,2,0,2,0,2,0,2,0.
(1)分别求两组数据的众数、中位数,根据计算结果比较两台机床性能;
(2)分别求两组数据的平均数和标准差,根据计算结果比较两台机床性能.
变式训练1-1:已知一组数据按从小到大的顺序排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么这组数据的众数是   ,平均数是   .
答案:6 5
方法总结
(1)平均数与每一个数据都有关,可以反映更多的总体信息,是使用最多的一个特征数,但是受极端值的影响较大;中位数是数据的数据量的等分线,不受极端值的影响;众数只能体现数据的最大集中点,一般无法客观反映总体特征.当平均数大于中位数时,说明数据中存在较大的极端值(例如例1中的甲样本数据),反之说明数据中存在较小的极端值.
(2)比较两组数据的差异,有时要剔除极端值,然后比较它们的平均数和方
差,如果平均数相差不大,就进一步比较它们的方差(或标准差),然后根据具体情况确定它们的优劣并做出适当地预测或选择.
(3)样本容量越大,样本所包含的总体信息就越多,估计的合理性就越充分.
探究点二
分层随机抽样的平均数
权重
[思考2] 分层随机抽样的平均数公式与加权平均数公式有什么关系
[例2] “新冠肺炎”席卷全球,我国医务工作者为了打好这次疫情阻击战,充分发挥优势,很快抑制了病毒,据统计老年患者治愈率为71%,中年患者治愈率为85%,青年患者治愈率为91%.如果某医院有30名老年患者,40名中年患者,50名青年患者,则估计该医院的平均治愈率是(  )
(A)86% (B)83% (C)90% (D)84%
方法总结
计算分层随机抽样的平均数的两种方法
探究点三
分层随机抽样的方差
提示:假命题.反例:数据组1,1的方差为0,数据组2,2,2的方差也是0,它们组成的新数据组为1,1,2,2,2,这组数据的方差显然不是0.
[例3] 数学考试中,有一道选做题,学生可以从题目甲和乙中任选一题作答,满分10分.某高三年级共有1 000名学生参加了某次数学考试,为了了解学生的作答情况,计划从该年级1 000名考生的数学成绩中随机抽取一个容量为10的样本,若采用分层随机抽样,按照学生选择甲或乙的情况将成绩分为两层.已知该校共有600名考生选择了甲,400名考生选择了乙,在选取的样本
中,选择甲的平均得分为6分,方差为2,选择乙的平均得分为5分,方差为
0.75.用样本估计该校1 000名考生选做题得分的平均数和得分的方差.
变式训练3-1:已知一组数据x1,x2,x3的平均数是5,方差是4,则由2x1+1,
2x2+1,2x3+1,11这4个数据组成的新的一组数据的方差是(  )
(A)16 (B)14 (C)12 (D)8
方法总结
计算分层随机抽样的方差的两种方法
(1)设出各层中的样本数,依次利用方差的定义式计算,这个方法比较
复杂.
探究点四
百分位数
提示:总体数据中的任意一个数小于或等于它的中位数的可能性是50%.
[问题4] 当总体是连续变量时,总体中的中位数有什么特点
知识点4:p分位数
一般地,当总体是 时,给定一个百分数p∈ ,总体的p分位数有这样的特点:总体数据中的任意一个数 它的可能性是p.
25%,50%,75%分位数是三个常用的百分位数,也称为总体的 ,其他常用的百分位数有1%,5%,10%,90%,95%,99%.
连续变量
(0,1)
小于或等于
四分位数
[思考3] 总体的p分位数通常是未知的,用p分位数去估计它时,估计的准确率与样本容量有什么关系
提示:样本的容量越大,估计越准确.
[例4] 一组数据按由小到大的顺序排列为0,0,0,0,1,2,2,2,3,3,5,6,7,8,
9,10,求该组数据的四分位数和90%分位数.
变式训练4-1:高二(1)班7人宿舍中每个同学的身高(单位:cm)分别为170,
168,172,172,175,176,180,则这7人身高的40%分位数为(  )
(A)168 (B)170 (C)172 (D)171
解析:这7人的身高从小到大排列为168,170,172,172,175,176,180,
7×40%=2.8,
所以第3个数据172为这7人身高的40%分位数.
故选C.
方法总结
计算一组n个数据的p分位数的一般步骤
第一步,按照从小到大排列原始数据.
第二步,计算i=np.
第三步,若i不是整数,大于i的最小的整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数.
拓展探索素养培优
样本特征数之间的综合关系
[典例] 在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10日,每天新增疑似病例不超过7人”.过去10日,a,b,c,d四地新增疑似病例数据信息如下:
甲地:总体平均数为3,中位数为4;
乙地:总体平均数为1,总体方差大于0;
丙地:中位数为2,众数为3;
丁地:总体平均数为2,总体方差为3.
则甲,乙,丙,丁四地中,一定没有发生大规模群体感染的地方是(  )
(A)甲 (B)乙 (C)丙 (D)丁
试题情境:多个样本特征数.
必备知识:平均数、方差、众数、中位数的计算.
关键能力:数据运算能力,逻辑推理能力.
学科素养:数学运算,数据分析.
解析:对于甲地,总体平均数为3,中位数为4,平均数与中位数不能限制极端值的出现,因而有可能出现新增疑似病例超过7人的情况,例如0,0,0,
0,4,4,4,4,4,10,显然这组数据的平均数为3,中位数为4,所以甲地不符合要求.对于乙地,总体平均数为1,总体方差大于0,没有给出方差具体的大小,如果方差很大有可能出现新增疑似病例超过7人的情况,例如0,0,0,0,0,0,0,0,0,10,显然这组数据的平均数为1,总体方差大于0,所以乙地不符合要求.对于丙地,中位数为2,众数为3,众数与中位数不能限制极端值的大小,因而有可能出现新增疑似病例超过7人的情况,例如0,0,0,0,2,2,3,3,3,10,显然中位数为2,众数为3,所以丙地不符合要求.
[素养演练] 四名同学各掷一枚均匀骰子5次,分别记录每次骰子出现的点数.根据下面四名同学的统计结果,可以判断出一定没有出现点数6的是(  )
(A)平均数为2,方差为2.4
(B)中位数为3,众数为2
(C)平均数为3,中位数为2
(D)中位数为3,方差为2.8
备用例题
(A)6,6 (B)9,2 (C)9,6 (D)9,4
[例2] 为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是(  )
(A)x1,x2,…,xn的平均数
(B)x1,x2,…,xn的标准差
(C)x1,x2,…,xn的最大值
(D)x1,x2,…,xn的中位数
解析:一组数据的方差与标准差反映了这组数据的稳定程度.故选B.