第6章 统计§6.4.1 用样本估计总体数字特征-样本的数字特征 课件(共28张PPT)

文档属性

名称 第6章 统计§6.4.1 用样本估计总体数字特征-样本的数字特征 课件(共28张PPT)
格式 pptx
文件大小 4.8MB
资源类型 试卷
版本资源 北师大版(2019)
科目 数学
更新时间 2025-12-30 10:11:43

图片预览

文档简介

(共28张PPT)
北师大版(2019)高中数学必修第一册
第6章 统计
现在你以母校而自豪,
将来母校因你更光荣!
§6.4.1 用样本估计总体数字特征-样本的数字特征
2 抽样的基本方法
统计是一门用科学的方法收集、整理、分析数据,提取有用的信息,作出推断和决策的学科。
1.3 总体与样本
2.1 简单随机抽样
1 获取数据的途径
整理数据
分析数据
作出推断
收集数据
1.1 直接获取与间接获取
1.2 普查与抽查
2.2 分层随机抽样
3 用样本估计总体分布
3.1 从频数到频率
3.2 频率分布直方图
4 用样本估计总体的数字特征
4.1 样本的数字特征
4.2 分层随机抽样的均值与方差
4.3 百分位数
统计的基本过程:
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.
(2)中位数:一组数据按大小依次排列后处在最中间位置的数(或最中间两个数据的平均数).
(1)众数:一组数据中出现次数最多的数.
(3)平均数:一组数据的算术平均数.
一组11个样本数据为:19,23,12,15,14,17,10,12,18,12,27
排序后为:10,12,12,12,14,15,17,18,19,23,27
众数为12
中位数为15
下面我们通过具体实例进一步了解这些量的意义,探究它们之间的联系与区别,并根据样本的集中趋势估计总体的集中趋势.
易错点:求中位数时需先把一组数据按从小到大(或从大到小)的顺序排列,再找中间位置的数或中间两数的平均数.
解:把这组数据按从小到大排列为:10,12,12,14,14,14,17,18,19,23,27,则可知其众数为14,
中位数为14.
例2.一组样本数据为:19,23,12,14,14,17,10,12,18,14,27,则这组数据的众数和中位数分别为( )
A.14,14  B.12,14 C.14,15.5 D.12,15.5
6
A
例1 一组数据4,6,5,8,7,6,那么这组数据的平均数为__.
平均数是频率分布直方图的“重心”等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。
月均用水量/t
频率/组距
0.02
1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
0
0.04
0.06
0.08
0.1
0.12
0.077
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
平均数的估计
中位数的估计
在频率分布直方图中,中位数左边和右边的直方图的面积各为0.5, 即在直方图中位数左右的面积相等.
月均用水量/t
频率/组距
0.02
1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
0
0.04
0.06
0.08
0.1
0.12
0.077
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
由频率分布直方图求平均数、众数、中位数
众数的估计
众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标.
月均用水量/t
频率/组距
0.02
1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
0
0.04
0.06
0.08
0.1
0.12
0.077
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
由频率分布直方图求平均数、众数、中位数
例3.已知200辆汽车通过某一段公路时的时速的频率分布直方图,如图所示,该图的众数为____,平均数为____,中位数为_____.
65
62
62.5
平均数为45×0.1+55×0.3+65×0.4+75×0.2=62
设中位数为m,则0.1+0.3+(m-60)×0.04=0.5,解得m=62.5
用频率分布直方图估计众数、中位数、平均数
众数:最高矩形的中点
特点:反映样本数据的最大集合点
忽视了其他数据,无法客观的反映总体特征
中位数:中位数左右两边的直方图面积相等
特点:不受少数几个极端值的影响
平均数:直方图的“重心”,各组组中值与频率乘积之和
特点:和每一个样本数据都有关,可以反映更多的关于样本
数据的信息离平均数越远的数据对平均数影响越大(可靠性低)
中位数:中位数左边的直方图面积和右边的直方图面积相等
例4.在一次体育测试中,某班的6名同学的成绩(单位:分)分别为66,83,87,83,77,96. 关于这组数据,下列说法错误的是 ( )
A.众数是83 B.中位数是83 C.极差是30 D.平均数是83

解 由于83出现的次数最多,所以众数是83,故A说法正确;
把数据66,83,87,83,77,96按从小到大排列为66,77,83,83,87,96,中间两个数为83,83,所以中位数是83,故B说法正确;
极差是96-66=30,故C说法正确;
由于平均数为(66+83+87+83+77+96)÷6=82,故D说法错误,故选D.
解(1)由图知众数为
(2)设中位数为x,由图知前三个矩形面积之和为0.4,
第四个矩形面积为0.3
0.3+0.4>0.5,因此中位数位于第四个矩形内
得:0.4+0.03(x-70)=0.5,所以x≈73.3.
(4)若例3条件不变,求80分以下的学生人数.
[40,80)分的频率为:(0.005+0.015+0.020+0.030)×10=0.7,
所以80分以下的学生人数为80×0.7=56.
由频率分布直方图估计平均数、中位数、众数
在频率分布直方图中,我们无法知道每组数据是如何分布的,故通常假设它们在组内均匀分布。
1.平均数是直方图中每个小矩形底边中点的横坐标与小矩形的面积的乘积之和(组中值与频率积的和)
2.中位数左边和右边的直方图面积相等,各为0.5
3.众数是直方图中最高矩形的中点的横坐标
A
根据众数、中位数、平均数的含义,B,C,D均正确.
BD
解析 由题图知,A组的6个数从小到大排列为2.5,2.5,5,7.5,10,10;B组的6个数从小到大排列为6,6,6,7.5,7.5,9,
平均数、中位数的大小与数据分布形态
平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关(如下图)
(1)直方图形状对称:平均数和中位数应该大体上差不多;
(2)直方图右边“拖尾”:平均数大于中位数;
(3)直方图左边“拖尾”:平均数小于中位数.
与中位数相比,平均数总在直方图的“长尾巴”那边
由频率分布直方图估计平均数、中位数、众数
例题9.
设中位数为m,则0.1+(m-30)×0.03=0.5,解得m=130/3.
例题10.如果一组数据的中位数比平均数小很多,则下面叙述一定错误的是( ).
A.数据中可能有异常值 B.这组数据是近似对称的
C.数据中可能有极端大的值 D.数据中众数可能和中位数相同
B
中位数和平均数比较接近
C
例题11.华为、抖音海外版事件暴露了我国计算机行业中芯片、软件两大短板,为防止“卡脖子” 事件的再次发生,科技专业人才就成了决胜的关键. 为了解我国在芯片、软件方面的潜力,某调查机构对我国若干大型科技公司进行调查统计,得到了这两个行业从业者的年龄分布的饼形图和“90后”从事这两个行业的岗位分布雷达图,则下列说法中不一定正确的是( )
A.芯片、软件行业从业者中,“90后”占总人数的比例超过50%
B.芯片、软件行业中从事技术、设计岗位的“90后”人数超过总人数的25%
C.芯片、软件行业从事技术岗位的人中,“90后”比“80后”多
D.芯片、软件行业中,“90后”从事市场岗位的人数比“80前”的总人数多
55%×(37%+13%)=27.5%
占总人数的55%×14%=7.7%
占总人数的5%
55%×37%=20.35%
解 对于选项A,芯片、软件行业从业者中“90后”占总人数的55%,故选项A正确;
对于选项B,芯片、软件行业中从事技术、设计岗位的“90后”占总人数的(37%+13%)×55%=27.5%,故选项B正确;
对于选项C,芯片、软件行业中从事技术岗位的“90后”占总人数的37%×55%=20.35%,“80后”占总人数的40%,但从事技术的“80后”占总人数的百分比不知道,无法确定二者人数多少,故选项C错误;
对于选项D,芯片、软件行业中从事市场岗位的
“90后”占总人数的14%×55%=7.7%,“80前”占总人数的5%,故选项D正确.
【例11】某调查机构对我国若干大型科技公司进行调查统计,得到了这两个行业从业者的年龄分布的饼形图和“90后”从事这两个行业的岗位分布雷达图,则下列说法中不一定正确的是( )
A.芯片、软件行业从业者中,“90后”占总人数的比例超过50%
B.芯片、软件行业中从事技术、设计岗位的“90后”人数超过总人数的25%
C.芯片、软件行业从事技术岗位的人中,“90后”比“80后”多
D.芯片、软件行业中,“90后”从事市场岗位的人数比“80前”的总人数多
例题12.(多选题)某综艺节目为比较甲、乙两名选手的各项能力(每项能力的指标值满分均为5分,分值高者为优),绘制如图所示的六维能力雷达图,图中点A表示甲的创造能力指标值为4,点B表示乙的空间能力指标值为3,则下列叙述正确的是(   )
A.乙的记忆能力优于甲 B.乙的观察能力优于创造能力
C.甲的六大能力整体水平优于乙 D.甲的六大能力比乙较均衡
BCD
2.方差
在刻画样本数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般采用标准差
从数学角度考虑,有时也可以用标准差的平方——方差来替代标准差作为测量数据分散程度的工具。
现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的,如何求总体的标准差和平均数 -------通常采用样本的平均数和标准差去估计总体的平均数与标准差,只要样本的代表性好,这样做就是合理的.
标准差与方差:
1、标准差是样本数据到平均数的一种平均距离。一般用s表示。它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。
C
例题16.小吴一星期的总开支分布如图(1)所示,一星期的食品开支如图(2)所示,则小吴一星期的鸡蛋开支占总开支的百分比为( )
A.1% B.2% C.3% D.5%
食品开支占总开支的30%
样本方差、样本标准差的定义
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为 ,则称 s2=_______________为样本方差,s=________为样本标准差 .
(4)特征:
标准差和方差刻画了数据的______程度或波动幅度.
标准差(或方差)越大,数据的离散程度越____,越不稳定;
标准差(或方差)越小,数据的离散程度越____,越稳定.
在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用_______.
离散


标准差
数据x1,x2,…,xn的方差为s2,数据y1,y2,…,yn的方差为s2y,a,b为常数.
(1)如果y1=x1+b,y2=x2+b,…,yn=xn+b,那么s2y=s2x;
(2)如果=,=,…,=,那么s2y=a2s2x.
(3)如果=+b,=+b,…,=+b,那么s2y=a2s2x.
总体离散程度的估计
方差与标准差的性质
0.9
例题18.下列数字特征不能反映样本数据的分散程度、波动情况的是
A.极差 B.平均数 C.方差 D.标准差

例题19.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为

例题20.样本数均为9的四组数据,它们的平均数都是5,条形图如图所示,则标准差最大的一组是(  )
A.第一组   B.第二组 C.第三组 D.第四组
D
例题21.为评估一种农作物的种植效果,选了块地做实验田. 这块地的亩产量(单位:kg)分别为,,…,,下面给出的指标中可用来评估这种农作物
亩产量稳定程度的是( ).
A.,,…,的平均数 B.,,…,的标准差
C.,,…,的最大值 D.,,…,的中位数
B

例题23.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数为____,方差为_____.
5
答案:∵-1,0,4,x,7,14的中位数为5,
D
例题24.已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是(  )
A.平均数>中位数>众数 B.平均数<中位数<众数
C.中位数<众数<平均数 D.众数=中位数=平均数
解析 由题设,这8个数据中,50出现的次数最多,知众数为50.
因此众数,中位数,平均数都相等.
下课
再见
感谢各位同学配合!
本课结束