6.4.1—6.4.3用样本估计总体的数字特征课件(共60张PPT) 2023-2024学年高一数学北师大版(2019)必修一

文档属性

名称 6.4.1—6.4.3用样本估计总体的数字特征课件(共60张PPT) 2023-2024学年高一数学北师大版(2019)必修一
格式 pptx
文件大小 7.7MB
资源类型 试卷
版本资源 北师大版(2019)
科目 数学
更新时间 2024-05-07 11:20:03

图片预览

内容文字预览

(共60张PPT)
§4 用样本估计总体的数字特征
4.1 样本的数字特征
4.2 分层随机抽样的均值与方差
4.3 百分位数
1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义,提升数学运算、数据分析的核心素养.
2.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),提升数学运算、数据分析的核心素养.
3.理解百分位数的统计含义,能够用样本估计百分位数,提升数学抽象与数学运算的核心素养.
学习目标
1
知识梳理
自主探究
问题1:我们在初中已经学过样本的平均数、中位数、众数、极差、方差,平均数、中位数和众数从不同角度反映了数据的集中趋势,极差和方差都刻画数据的离散程度.
在以上5个特征数中,哪些特征数与样本的每一个数字都有关系 哪些特征数只与样本的个别数字有关
提示:平均数、方差与样本的每一个数字都有关系;
中位数、众数、极差只与样本的个别数字有关.
1.样本的数字特征
众数:一组数据中 最多的数据,反映一组数据的多数水平.
思考1:一组数据的中位数唯一吗 是不是数据中的数
提示:一组数据的中位数只有唯一一个,不一定是数据中的数.
出现次数
2.分层随机抽样的平均数
权重
思考2:分层随机抽样的平均数公式与加权平均数公式有什么关系
提示:假命题.反例:数据组1,1的方差为0,数据组2,2,2的方差也是0,它们组成的新数据组为1,1,2,2,2,这组数据的方差显然不是0.
3.分层随机抽样的方差
4.百分位数
一般地,当总体是 时,给定一个百分数p∈ ,总体的p分位数有这样的特点:总体数据中的任意一个数 .
它的可能性是p.
25%,50%,75%分位数是三个常用的百分位数,也称为总体的
.其他常用的百分位数有1%,5%,10%,90%,95%,99%.
思考3:总体的p分位数通常是未知的,用样本的p分位数去估计它时,估计的准确率与样本容量有什么关系
提示:样本容量越大,估计越准确.
连续变量
(0,1)
小于或等于
四分位数
(1)一组数据的众数可能有一个,也可能有多个,若数据中有两个或两个以上出现的最多,且出现次数一样多,则这些数据都是众数.
(2)在实际的比赛中,去掉一个最高分与一个最低分的目的是消除极端分数对比赛的影响.
(3)标准差、方差的意义.
①标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小;
②标准差、方差的取值范围:[0,+∞);
③当一组数据都相等时,该组数据的方差是0,说明该组数据没有波动.
(4)关于平均数、方差的有关性质及规律.
②数据x1,x2,…,xn与数据x1+a,x2+a,…,xn+a的方差相等;
③若x1,x2,…,xn的方差为s2,那么ax1,ax2,…,axn的方差为a2s2.
2
师生互动
合作探究
样本的数字特征
[例1]在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示.
成绩 (单位:m) 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90
人数 2 3 2 3 4 1 1 1
分别求出这些运动员成绩的众数、中位数与平均数.
(1)在一组数据中求中位数的方法是从小到大排列后,最中间一个或两个数的平均数;在一组数据中出现次数最多的数即是众数.
(2)根据统计图表中的数据研究中位数、众数、平均数问题,首先要根据统计图表的特征从统计图表中提取数据后求解.
(3)标准差(方差)的两个作用.
①判断数据的离散程度.标准差(方差)较大,说明数据的离散程度较大,标准差(方差)较小,说明数据的离散程度较小;
②在实际应用中,常常把平均数与方差或标准差结合起来进行决策.在平均数相等的情况下,比较方差或标准差来确定稳定性.
针对训练:(1)有13名同学参加百米竞赛,预赛成绩各不相同,要取前6名参加决赛,小明同学已经知道了自己的成绩,为了判断自己是否能进入决赛,他还需要知道13名同学成绩的(  )
A.平均数 B.众数
C.中位数 D.方差

解析:(1)把13名同学的成绩按由大到小排列,取成绩靠前的6个成绩进入决赛,即最中间一个数之前的6个成绩进入决赛,13个同学的成绩按由大到小排列时,最中间一个数即是中位数.故选C.
(2)在一次数学测试中,高二某班40名学生成绩的平均分为82,方差为10.2,则下列四个数中不可能是该班数学成绩的是(  )
A.100 B.85
C.65 D.55

分层随机抽样的平均数与方差
[例2] 为了解某班学生每周购买零食的支出情况,利用分层随机抽样的方法抽取了15人进行调查,调查结果如表所示,则估算全班学生每周购买零食的支出的方差是
(  )
人数 平均支出/元 方差
男生 9 40 6
女生 6 35 4
A.10.3 B.11.2 C.12 D.13.4

针对训练:为了调查公司员工的健康状况,用分层随机抽样的方法抽取样本,若样本中有20名男员工,30名女员工,且男员工的平均体重为70 kg,标准差为4,女员工的平均体重为50 kg,标准差为6,则所抽取样本的方差为    .
124
百分位数
[例3] (1)如表是某校校级联欢晚会比赛中12个班级的得分情况,则得分的30%分位数是(  )
班级得分 7 8 9 10 11 13 14
频数 2 1 2 3 1 2 1
A.11 B.10.5
C.9.5 D.9

解析:(1)12×30%=3.6,
把12个班级的得分按照从小到大排序为7,7,8,9,9,10,
10,10,11,13,13,14,
可得30%分位数是第4个得分数,即9.故选D.
(2)为了了解居民用电情况,通过抽样,获得了某城市100户居民的月平均用电量(单位:kW·h),以[160,180),
[180,200),[200,220),[220,240),[240,260),[260,280),
[280,300]分组的频率分布直方图如图所示.该样本数据的55%分位数大约是(  )
A.220 B.224
C.228 D.230

解析:(2)由频率分布直方图的性质可得(0.002+
0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1,
解得x=0.007 5,
由已知,设该样本数据的55%分位数大约是a,
由(0.002+0.009 5+0.011)×20+0.012 5×(a-220)=
0.55,解得a=228.故选C.
计算一组n个数据的p分位数的一般步骤
第一步,按照从小到大排列原始数据;
第二步,计算i=np;
第三步,若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数.
针对训练:(1)抽样统计甲射击运动员10次的训练成绩分别为86,85,88,86,90,89,88,87,85,92,则这10次成绩的80%分位数为
(  )
A.88.5 B.89 C.91 D.89.5

(2)某校为了解学生的课外锻炼身体的情况,随机抽取了部分学生,对他们一周的课外锻炼时间进行了统计,统计数据如表所示.
锻炼时间/h 7 8 9 10 11
人数 6 10 9 8 7
则该校学生一周进行课外锻炼的时间的40%分位数是
(  )
A.8.5 B.8 C.7 D.9

频率分布直方图中样本数字特征的计算方法
(1)中位数:中位数在频率分布直方图左右两边直方图的面积应相等,也就是累积频率为0.5时对应的样本数据,求解时常借助比例法求解.
(2)百分位数:首先理解频率分布直方图中各组数据频率的计算方法,估计百分位数在哪一组,再应用方程的思想方法及比例法,设出百分位数,利用比例列方程求解.
(3)平均数:用频率分布直方图估计平均数时,平均数等于频率分布直方图中每个小矩形的面积乘每个小矩形底边中点的横坐标之和.
(4)方差:先利用组中值乘频率(即每个小矩形的面积)求和得平均数,再将平均数减去每组的组中值平方后乘该组的频率求和.
典例探究:从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如图频率分布直方图.根据频率分布直方图估计这种产品质量指标值的50%分位数、平均数及方差
(同一组中的数据用该组区间的中点值作代表).
应用探究:(1)对某小区100户居民的月均用水量进行统计,得到样本的频率分布直方图如图,则估计此样本的中位数为(  )
A.2.5 B.2.02
C.2 D.2.25

解析:(1)中位数是频率为0.5的分界点,由频率分布直方图可知前4组的频率之和为(0.08+0.16+0.30+
0.44)×0.5=0.49,因此中位数出现在第5组,设中位数为x,则(x-2)×0.5=0.01,则x=2.02.故选B.
(2)某班50名学生一次调研考试的数学成绩(满分:100分)的频率分布直方图如图所示,则这50名学生的数学成绩的方差为    .
84
解析:(2)由题意可知这50名学生的数学成绩的平均数为65×0.2+75×0.3+85×0.4+95×0.1=79,
方差s2=(65-79)2×0.2+(75-79)2×0.3+(85-79)2×
0.4+(95-79)2×0.1=84.
1.数据:1,1,3,3,4的众数和中位数分别是(   )
A.1和3,3 B.3,2
C.1或3,2 D.3,3

1
2
3
4
解析:因为1和3都出现了2次且次数最多,所以众数为1和3,中位数为3.故选A.
2.射击队要从甲、乙、丙、丁四名队员中选出一名选手去参加射击比赛,四人成绩的平均数和方差如表,根据表格中数据判断,参赛较为合适的是(   )
1
2
3
4
A.甲 B.乙 C.丙 D.丁

解析:由表可知,乙和丙的平均成绩较高,但丙发挥比较稳定,应选丙去参赛更合适.故选C.
1
2
3
4
3.对于考试成绩的统计,如果甲的成绩处在95%分位数上,则下列说法正确的是(   )
A.甲得了95分
B.甲答对了95%的试题
C.可能有95%的参加考试者得到了和甲一样或还要低的
分数
D.甲排名在第95名
1
2
3
4

解析:95%分位数是指把总体数据从小到大排序后,总体数据中的任意一个数小于或等于它的可能性是95%.
故选C.
1
2
3
4
4.某学生一周每日睡眠时间分别是7,6,8,7,5,9,7(单位:h),则该组数据的方差为    .
1
2
3
4

[例2] 样本数为9的四组数据,其平均数都是5,条形图如图所示,则标准差最小的一组是(  )
A.第一组 B.第二组
C.第三组 D.第四组


[例4] (多选题)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”,根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是(  )
A.甲地:中位数为2,众数为3
B.乙地:总体平均数为1,中位数为1
C.丙地:极差为3,80%分位数为4
D.丁地:总体平均数为2,总体方差为3



[例5] 从某校高一新生中随机抽取一个容量为20的身高样本,由于污染有一个数据模糊不清,设为x,其余19个数据排序如下(单位:cm):152,155,158,164,164,165,
165,165,166,167,168,168,169,170,170,170,171,174,
175.若样本数据的90%分位数为173,求x的值.