数据的直观表示 用样本估计总体
最新课程标准
用样本估计总体 ①结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.②结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.③结合实例,能用样本估计总体的取值规律.
新知初探·自主学习——突出基础性
知识点 数据的直观表示
1.柱形图:能够反映样本的频率分布规律的直方图.
2.频率分布折线图:将频率分布直方图中各相邻的矩形的________的中点顺次连接起来,就得到频率分布折线图.
3.扇形图可以形象地表示出各部分数据在全部数据中所占的比例情况.
4.茎叶图的画法步骤
第一步:将每个数据分为茎(高位)和叶(低位)两部分;
第二步:将最小茎与最大茎之间的数按大小次序排成一列;
第三步:将各个数据的叶依次写在其茎的两侧.
5.频数(率)分布直方图
绘制频率分布直方图的步骤
状元随笔
表示频率分布的几种方法的优点与不足
优点 不足
频率分布表 表示数量较确切 分析数据分布的总体态势不方便
频率分布直方图 表示数据分布情况非常直观 原有的具体数据信息被抹掉了
频率分布折线图 能反映数据的变化趋势 不能显示原有数据信息
基础自测
1.(多选)关于频率分布直方图中的有关数据,下列说法错误的是( )
A.直方图的高表示该组上的个体在样本中出现的频率与组距的比值
B.直方图的高表示该组上的个体在样本中出现的频率
C.直方图的高表示取某数的频率
D.直方图的高表示该组上的个体数与组距的比值
2.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40,0.125,则n的值为( )
A.640 B.320 C.240 D.160
3.甲、乙两个班各随机选出15名同学进行测验,所得成绩的茎叶图如图.从图中看,________班的平均成绩较高.
课堂探究·素养提升——强化创新性
题型1 频率分布直方图、频率分布折线图的绘制[经典例题]
例1 在拜登上任之前的美国历届总统中,就任时年龄最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年龄最大的是特朗普,他于2016年就任,当时70岁.下面按时间顺序(从1789年的华盛顿到2016年的特朗普,共45任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,47,70.
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图;
(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.
状元随笔
方法归纳
绘制频率分布直方图应注意的问题
(1)在绘制出频率分布表后,画频率分布直方图的关键就是确定小矩形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“”所占的比例来定高.如我们预先设定以“”为1单位长度,代表“0.1”,则若一个组的为0.2,则该小矩形的高就是“”(占两个单位长度),依此类推.
(2)数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.
跟踪训练1 有一个容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20),17.
(1)列出样本的频率分布表;
(2)画出频率分布直方图和频率分布折线图;
(3)求样本数据不足0的频率.
①求极差.
②组距及组数.
③分组.
④列表.
⑤画直方图.
题型2 频率分布直方图的应用[经典例题]
例2 已知某市2015年全年空气质量等级如表1所示.
表1
空气质量等级(空气质量指数(AQI)) 频数 频率
优(AQI≤50) 83 22.8%
良(50
轻度污染(100中度污染(150重度污染(200严重污染(AQI>300) 14 3.8%
合计 365 100%
2016年5月和6月的空气质量指数如下:
5月 240 80 56 53 92 126 45 87 56 60
191 62 55 58 56 53 89 90 125 124
103 81 89 44 34 53 79 81 62 116
88
6月 63 92 110 122 102 116 81 163 158 76
33 102 65 53 38 55 52 76 99 127
120 80 108 33 35 73 82 90 146 95
选择合适的统计图描述数据,并回答下列问题:
(1)分析该市2016年6月的空气质量情况.
(2)比较该市2016年5月和6月的空气质量,哪个月的空气质量较好?
(3)比较该市2016年6月与该市2015年全年的空气质量,2016年6月的空气质量是否好于2015年?
【解析】 (1)根据该市2016年6月的空气质量指数和空气质量等级分级标准,可以画出该市这个月的不同空气质量等级的频数与频率分布表(表2).
表2
空气质量等级 合计
优 良 轻度污染 中度污染 重度污染 严重污染
天数 4 15 9 2 0 0 30
比例 13.33% 50% 30% 6.67% 0 0 100%
从表中可以看出,“优”“良”的天数达19天,占了整月的63.33%,没有出现“重度污染”和“严重污染”.
我们可以用条形图和扇形图对数据作出直观的描述,如图1和图2.从条形图中可以看出,在前三个等级的占绝大多数,空气质量等级为“良”的天数最多,后三个等级的天数很少.从扇形图中可以看出,空气质量为“良”的天数占了总天数的一半,大约有三分之二为“优”“良”,大多数是“良”和“轻度污染”.因此,整体上6月的空气质量不错.
我们还可以用折线图展示空气质量指数随时间的变化情况,如图3.容易发现,6月的空气质量指数在100附近波动.
(2)根据该市2016年5月的空气质量指数和空气质量分级标准,可以画出该市这个月的不同空气质量等级的频数和频率分布表(表3).
表3
空气质量等级 合计
优 良 轻度污染 中度污染 重度污染 严重污染
天数 3 21 5 1 1 0 31
频率 10% 68% 16% 3% 3% 0 100%
为了便于比较,我们选用复合条形图,将两组数据同时反映到一个条形图上.通过条形图中柱的高低,可以更直观地进行两个月的空气质量的比较(下图).
由表3和图4可以发现,5月空气质量为“优”和“良”的总天数比6月多.所以,从整体上看,5月的空气质量略好于6月,但5月有重度污染,而6月没有.
(3)把2016年6月和2015年全年的空气质量进行比较,由于一个月和一年的天数差别很大,所以直接通过频数比较没有意义,应该转化成频率分布进行比较.可以通过二者的空气质量指数的频率分布直方图或空气质量等级的频率分布条形图进行比较(图5).
通过图5可以看出,虽然2016年6月的空气质量为“优”的频率略低于2015年,但“良”的频率明显高于2015年,而且2016年6月中度以上的污染天气频率明显小于2015年.所以从整体上看,2016年6月的空气质量要好于2015年全年的空气质量.
方法归纳
频率分布直方图的意义
(1)频率分布直方图以面积的形式反映了数据落在各组内频率大小.
(2)在频率分布直方图中,各小矩形的面积之和等于1.
(3)频数/相应的频率=样本容量.
跟踪训练2 从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示),由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
状元随笔
题型3 茎叶图[教材P81例1]
例3 为了快速了解某学校学生体重(单位:kg)的大致情况,随机抽取了10名学生称重,得到的数据整理成茎叶图如图所示.估计这个学校学生体重的平均数和方差.
教材反思
茎叶图中的三个关注点
(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.
(2)重复出现的数据要重复记录,不能遗漏.
(3)给定两组数的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.
跟踪训练3 某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为( )
A.117 B.118 C.118.5 D.119.5
5.1.3 数据的直观表示
5.1.4 用样本估计总体
新知初探·自主学习
知识点
2.上底边
5.最大值与最小值的差 k 不小于k的最小整数 左闭右开 闭 分组 频数累计 频数 频率 1 样本容量 1 各小长方形的面积 1
[基础自测]
1.解析:直方图的高表示频率与组距的比值,直方图的面积为频率.
答案:BCD
2.解析:依题意得=0.125,∴n==320.
答案:B
3.解析:结合茎叶图中成绩的情况可知,乙班平均成绩较高.
答案:乙
课堂探究·素养提升
例1 【解析】 (1)以4为组距,列频率分布表如下:
分组 频数 频率
[42,46) 2 0.044 4
[46,50) 7 0.155 5
[50,54) 8 0.177 8
[54,58) 16 0.355 6
[58,62) 5 0.111 1
[62,66) 4 0.088 9
[66,70] 3 0.066 7
合计 45 1.000 0
画出相应的频率分布直方图和频率分布折线图,如图所示.
(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁及45岁以下和65岁以上就任的总统所占的比例相对较小.
跟踪训练1 解析:(1)频率分布表如下:
分组 频数 频率
[-20,-15) 7 0.035
[-15,-10) 11 0.055
[-10,-5) 15 0.075
[-5,0) 40 0.2
[0,5) 49 0.245
[5,10) 41 0.205
[10,15) 20 0.1
[15,20] 17 0.085
合计 200 1.00
(2)频率分布直方图和频率分布折线图如图所示:
(3)样本数据不足0的频率为:
0.035+0.055+0.075+0.2=0.365.
跟踪训练2 解析:因为频率分布直方图中各小长方形的面积之和为1,所以10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.由图可知身高在[120,150]内的学生人数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为10,所以从身高在[140,150]内的学生中选取的人数为×10=3.
答案:0.030 3
例3 【解析】 将样本中的每一个数都减去50,可得-5,-1,-3,-1,-4,-4,1,8,9,10,
这组数的平均数为=1,
方差为=30.4.
因此可估计这个学校学生体重平均数为51,方差为30.4.
跟踪训练3 解析:22次考试中,所得分数最高的为98,最低的为56,所以极差为98-56=42,将分数从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+76=118.
答案:B.
12(共37张PPT)
5.1.3 数据的直观表示
5.1.4 用样本估计总体
最新课程标准
用样本估计总体 ①结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.②结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.③结合实例,能用样本估计总体的取值规律.
新知初探·自主学习
课堂探究·素养提升
新知初探·自主学习
知识点 数据的直观表示
1.柱形图:能够反映样本的频率分布规律的直方图.
2.频率分布折线图:将频率分布直方图中各相邻的矩形的________的中点顺次连接起来,就得到频率分布折线图.
3.扇形图可以形象地表示出各部分数据在全部数据中所占的比例情况.
4.茎叶图的画法步骤
第一步:将每个数据分为茎(高位)和叶(低位)两部分;
第二步:将最小茎与最大茎之间的数按大小次序排成一列;
第三步:将各个数据的叶依次写在其茎的两侧.
上底边
5.频数(率)分布直方图
绘制频率分布直方图的步骤
最大值与最小值的差
k
不小于k的最小整数
左闭右开
闭
分组
频数累计
频数
频率
1
样本容量
1
各小长方
形的面积
1
状元随笔
表示频率分布的几种方法的优点与不足
优点 不足
频率分布表 表示数量较确切 分析数据分布的总体态势不方便
频率分布直方图 表示数据分布情况非常直观 原有的具体数据信息被抹掉了
频率分布折线图 能反映数据的变化趋势 不能显示原有数据信息
基础自测
1.(多选)关于频率分布直方图中的有关数据,下列说法错误的是( )
A.直方图的高表示该组上的个体在样本中出现的频率与组距的比值
B.直方图的高表示该组上的个体在样本中出现的频率
C.直方图的高表示取某数的频率
D.直方图的高表示该组上的个体数与组距的比值
解析:直方图的高表示频率与组距的比值,直方图的面积为频率.
答案:BCD
2.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40,0.125,则n的值为( )
A.640 B.320 C.240 D.160
解析:依题意得=0.125,∴n==320.
答案:B
3.甲、乙两个班各随机选出15名同学进行测验,所得成绩的茎叶图如图.从图中看,________班的平均成绩较高.
解析:结合茎叶图中成绩的情况可知,乙班平均成绩较高.
乙
课堂探究·素养提升
题型1 频率分布直方图、频率分布折线图的绘制[经典例题]
例1 在拜登上任之前的美国历届总统中,就任时年龄最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年龄最大的是特朗普,他于2016年就任,当时70岁.下面按时间顺序(从1789年的华盛顿到2016年的特朗普,共45任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,47,70.
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图;
(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.
【解析】 (1)以4为组距,列频率分布表如下:
分组 频数 频率
[42,46) 2 0.044 4
[46,50) 7 0.155 5
[50,54) 8 0.177 8
[54,58) 16 0.355 6
[58,62) 5 0.111 1
[62,66) 4 0.088 9
[66,70] 3 0.066 7
合计 45 1.000 0
画出相应的频率分布直方图和频率分布折线图,如图所示.
(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁及45岁以下和65岁以上就任的总统所占的比例相对较小.
状元随笔
方法归纳
绘制频率分布直方图应注意的问题
(1)在绘制出频率分布表后,画频率分布直方图的关键就是确定小矩形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“”所占的比例来定高.如我们预先设定以“”为1单位长度,代表“0.1”,则若一个组的为0.2,则该小矩形的高就是“”(占两个单位长度),依此类推.
(2)数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.
跟踪训练1 有一个容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20),17.
(1)列出样本的频率分布表;
(2)画出频率分布直方图和频率分布折线图;
(3)求样本数据不足0的频率.
①求极差.
②组距及组数.
③分组.
④列表.
⑤画直方图.
解析:(1)频率分布表如下:
分组 频数 频率
[-20,-15) 7 0.035
[-15,-10) 11 0.055
[-10,-5) 15 0.075
[-5,0) 40 0.2
[0,5) 49 0.245
[5,10) 41 0.205
[10,15) 20 0.1
[15,20] 17 0.085
合计 200 1.00
(2)频率分布直方图和频率分布折线图如图所示:
(3)样本数据不足0的频率为:
0.035+0.055+0.075+0.2=0.365.
题型2 频率分布直方图的应用[经典例题]
例2 已知某市2015年全年空气质量等级如表1所示.
表1
空气质量等级(空气质量指数(AQI)) 频数 频率
优(AQI≤50) 83 22.8%
良(50轻度污染(100中度污染(150重度污染(200严重污染(AQI>300) 14 3.8%
合计 365 100%
2016年5月和6月的空气质量指数如下:
5月 240 80 56 53 92 126 45 87 56 60
191 62 55 58 56 53 89 90 125 124
103 81 89 44 34 53 79 81 62 116 88
6月 63 92 110 122 102 116 81 163 158 76
33 102 65 53 38 55 52 76 99 127
120 80 108 33 35 73 82 90 146 95
选择合适的统计图描述数据,并回答下列问题:
(1)分析该市2016年6月的空气质量情况.
(2)比较该市2016年5月和6月的空气质量,哪个月的空气质量较好?
(3)比较该市2016年6月与该市2015年全年的空气质量,2016年6月的空气质量是否好于2015年?
【解析】 (1)根据该市2016年6月的空气质量指数和空气质量等级分级标准,可以画出该市这个月的不同空气质量等级的频数与频率分布表(表2).
空气质量等级 合计
优 良 轻度污染 中度污染 重度污染 严重污染
天数 4 15 9 2 0 0 30
比例 13.33% 50% 30% 6.67% 0 0 100%
从表中可以看出,“优”“良”的天数达19天,占了整月的63.33%,没有出现“重度污染”和“严重污染”.
我们可以用条形图和扇形图对数据作出直观的描述,如图1和图2.从条形图中可以看出,在前三个等级的占绝大多数,空气质量等级为“良”的天数最多,后三个等级的天数很少.从扇形图中可以看出,空气质量为“良”的天数占了总天数的一半,大约有三分之二为“优”“良”,大多数是“良”和“轻度污染”.因此,整体上6月的空气质量不错.
我们还可以用折线图展示空气质量指数随时间的变化情况,如图3.容易发现,6月的空气质量指数在100附近波动.
(2)根据该市2016年5月的空气质量指数和空气质量分级标准,可以画出该市这个月的不同空气质量等级的频数和频率分布表(表3).
空气质量等级 合计
优 良 轻度污染 中度污染 重度污染 严重污染
天数 3 21 5 1 1 0 31
频率 10% 68% 16% 3% 3% 0 100%
表3
为了便于比较,我们选用复合条形图,将两组数据同时反映到一个条形图上.通过条形图中柱的高低,可以更直观地进行两个月的空气质量的比较(下图).
由表3和图4可以发现,5月空气质量为“优”和“良”的总天数比6月多.所以,从整体上看,5月的空气质量略好于6月,但5月有重度污染,而6月没有.
(3)把2016年6月和2015年全年的空气质量进行比较,由于一个月和一年的天数差别很大,所以直接通过频数比较没有意义,应该转化成频率分布进行比较.可以通过二者的空气质量指数的频率分布直方图或空气质量等级的频率分布条形图进行比较(图5).
通过图5可以看出,虽然2016年6月的空气质量为“优”的频率略低于2015年,但“良”的频率明显高于2015年,而且2016年6月中度以上的污染天气频率明显小于2015年.所以从整体上看,2016年6月的空气质量要好于2015年全年的空气质量.
方法归纳
频率分布直方图的意义
(1)频率分布直方图以面积的形式反映了数据落在各组内频率大小.
(2)在频率分布直方图中,各小矩形的面积之和等于1.
(3)频数/相应的频率=样本容量.
跟踪训练2 从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示),由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
0.030
3
解析:因为频率分布直方图中各小长方形的面积之和为1,所以10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.由图可知身高在[120,150]内的学生人数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为10,所以从身高在[140,150]内的学生中选取的人数为×10=3.
状元随笔
题型3 茎叶图[教材P81例1]
例3 为了快速了解某学校学生体重(单位:kg)的大致情况,随机抽取了10名学生称重,得到的数据整理成茎叶图如图所示.估计这个学校学生体重的平均数和方差.
【解析】 将样本中的每一个数都减去50,可得-5,-1,-3,-1,-4,-4,1,8,9,10,
这组数的平均数为=1,
方差为=30.4.
因此可估计这个学校学生体重平均数为51,方差为30.4.
教材反思
茎叶图中的三个关注点
(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.
(2)重复出现的数据要重复记录,不能遗漏.
(3)给定两组数的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.
跟踪训练3 某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为( )
A.117 B.118 C.118.5 D.119.5
答案:B.
解析:22次考试中,所得分数最高的为98,最低的为56,所以极差为98-56=42,将分数从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+76=118.数据的数字特征
最新课程标准
1.结合实例,理解最值、平均值、众数、极差、方差、标准差的含义.
2.结合实例,能用样本估计百分位数,理解百分位数的统计含义.
新知初探·自主学习——突出基础性
知识点一 最值
一组数据的最值指的是其中的最大值与最小值.
状元随笔 最值反应的是这组数最极端的情况.一般地,最大值用max表示,最小值用min表示.
知识点二 百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
状元随笔 可以通过下面的步骤计算一组n个数据的第p百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
知识点三 众数、中位数、平均数的概念
1.众数:一组数据中,____________的数据是众数.
2.中位数:把一组数据按照________排成一列,把处在______的数据(或________________)叫做这组数据的中位数.
3.平均数:如果有n个数x1,x2,x3,…,xn,那么这n个数的平均数为________________________________.
状元随笔 对众数、中位数、平均数的理解
(1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
(2)众数考查各个数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中部分数据多次重复出现时,其众数往往更能反映问题.
(3)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能在所给的数据中,也可能不在所给的数据中.
(4)实际问题中求得的平均数、众数和中位数应带上单位.
知识点四 极差、方差与标准差
1.一组数的极差指的是这组数的最大值减去最小值所得的差.
2.如果x1,x2,…,xn的平均数为,则方差可用求和符号表示为.
3.方差的算术平方根称为标准差.
状元随笔 对方差与标准差概念的理解
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
(2)标准差、方差的取值范围:[0,+∞).
标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.
(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.
基础自测
1.求下列一组数据1,2,2,3,4,4,5,6,6,7的第30百分位数( )
A.2 B.3
C.4 D.2.5
2.已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是( )
A.平均数>中位数>众数
B.平均数<中位数<众数
C.中位数<众数<平均数
D.众数=中位数=平均数
3.已知一组数据为-3,5,7,x,11,且这组数的众数为5,那么该组数据的中位数是( )
A.7 B.5
C.6 D.11
4.已知五个数据3,5,7,4,6,则该样本的标准差为________.
课堂探究·素养提升——强化创新性
题型1 百分位数[教材P64例1]
例1 计算甲、乙两组数的25%分位数与75%分位数.
序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
甲组 1 2 2 2 2 3 3 3 5 5 6 6 8 8 9 10 10 12 13 13
乙组 0 0 0 0 1 1 2 3 4 5 6 6 7 7 10 14 14 14 14 15
教材反思
求总体百分位数的估计,首先要从小到大排列数据,然后计算出i=n×p%,当i不是整数要取整,当i是整数,则百分位数为第i项与第(i+1)项数据的平均数.
跟踪训练1 某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:
甲:95,81,75,91,86,89,71,65,76,88,94,110,107.
乙:83,86,93,99,88,103,98,114,98,79,78,106,101.
计算出学生甲、乙的第25,50的百分位数.
题型2 众数、中位数、平均数的应用[经典例题]
例2 某公司的33名员工的月工资(以元为单位)如下:
职务 董事长 副董事长 董事 总经理 经理 管理员 职员
人数 1 1 2 1 5 3 20
月工资 5 500 5 000 3 500 3 000 2 500 2 000 1 500
(1)求该公司员工月工资的平均数、中位数、众数;(精确到1元)
(2)假设副董事长的月工资从5 000元提升到20 000元,董事长的月工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又分别是多少?(精确到1元)
(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.
方法归纳
(1)平均数计算方法
①定义法:n个数据a1,a2,…,an的平均数=.
②利用加权平均数公式:
在n个数据中,如果x1出现f1次,x2出现f2次,…,xk出现fk次(f1+f2+…+fk=n),则这n个数的平均数为:=.
③当数据较大时,用公式=′+a简化计算.
(2)中位数的求法
①当数据个数为奇数时,中位数是按从小到大(或从大到小)的顺序依次排列的中间那个数.
②当数据个数为偶数时,中位数为按从小到大(或从大到小)的顺序依次排列的最中间的两个数的平均数.
跟踪训练2 某中学高三年级从甲、乙两个班级各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)如表,其中甲班学生成绩的平均分是85分,乙班学生成绩的中位数是83分,则x+y的值为________.
题型3 标准差、方差的应用[经典例题]
例3 甲、乙两机床同时加工直径为100 mm的零件,为检验质量,各从中抽取6件测量,数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
【解析】 (1)=(99+100+98+100+100+103)=100,
=(99+100+102+99+100+100)=100.
=[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
=[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)两台机床所加工零件的直径的平均值相同,又,
所以乙机床加工零件的质量更稳定.
方法归纳
在实际应用中,常常把平均数与标准差结合起来进行决策,在平均值相等的情况下,比较方差或标准差以确定稳定性.
跟踪训练3 在本例中,若甲机床所加工的6个零件的数据全都加10,那么所得新数据的平均数及方差分别是多少?
5.1.2 数据的数字特征
新知初探·自主学习
知识点三
1.重复出现次数最多
2.大小顺序 最中间 两个数据的平均数
3. (x1+x2+…+xn)=i
[基础自测]
1.解析:这组数据共10个,10×30%=3即第30百分位数是第3项数据和第4项数据的平均数2.5.
答案:D
2.解析:平均数、中位数、众数皆为50,故选D.
答案:D
3.解析:由这组数据的众数为5,可知x=5,把这组数据由小到大排列为-3,5,5,7,11,则可知中位数为5.
答案:B
4.解析:因为=×(3+5+7+4+6)=5,
所以s==.
答案:
课堂探究·素养提升
例1 【解析】 因为数据个数为20,而且20×25%=5,20×75%=15.
因此,甲组数的25%分位数为==2.5;
甲组数的75%分位数为==9.5.
乙组数的25%分位数为==1;
乙组数的75%分位数为==12.
跟踪训练1 解析:把甲、乙两名学生的数学成绩从小到大排序,可得
甲:65,71,75,76,81,86,88,89,91,94,95,107,110.
乙:78,79,83,86,88,93,98,98,99,101,103,106,114.
由13×25%=3.25,13×50%=6.5.
可得数据的第25,50百分位数为第4,7项数据,
即学生甲的第25,50的百分位数为76,88.
学生乙的第25,50的百分位数为86,98.
例2 【解析】 (1)平均数是=
≈2 091(元),
中位数是1 500元,众数是1 500元.
(2)新的平均数是′=
≈3 288(元),
中位数是1 500元,众数是1 500元.
(3)在这个问题中,中位数和众数都能反映出这个公司员工的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数偏差较大,所以平均数不能反映这个公司员工的工资水平.
跟踪训练2 解析:因为甲班学生成绩的平均分是85,所以=85,解得x=5,又因为乙班学生成绩的中位数是83,所以y=3,所以x+y=8.
答案:8
跟踪训练3 解析:甲的数据为99+10,100+10,98+10,100+10,100+10,103+10,平均数为100+10=110,
方差仍为 [(109-110)2+(110-110)2+(108-110)2+(110-110)2+(110-110)2+(113-110)2]=..
8(共27张PPT)
5.1.2 数据的数字特征
最新课程标准
1.结合实例,理解最值、平均值、众数、极差、方差、标准差的含义.
2.结合实例,能用样本估计百分位数,理解百分位数的统计含义.
新知初探·自主学习
课堂探究·素养提升
新知初探·自主学习
知识点一 最值
一组数据的最值指的是其中的最大值与最小值.
状元随笔 最值反应的是这组数最极端的情况.一般地,最大值用max表示,最小值用min表示.
知识点二 百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
状元随笔 可以通过下面的步骤计算一组n个数据的第p百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
知识点三 众数、中位数、平均数的概念
1.众数:一组数据中,_______________的数据是众数.
2.中位数:把一组数据按照________排成一列,把处在______的数据(或________________)叫做这组数据的中位数.
3.平均数:如果有n个数x1,x2,x3,…,xn,那么这n个数的平均
数为________________________________.
重复出现次数最多
大小顺序
最中间
两个数据的平均数
状元随笔 对众数、中位数、平均数的理解
(1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
(2)众数考查各个数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中部分数据多次重复出现时,其众数往往更能反映问题.
(3)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能在所给的数据中,也可能不在所给的数据中.
(4)实际问题中求得的平均数、众数和中位数应带上单位.
知识点四 极差、方差与标准差
1.一组数的极差指的是这组数的最大值减去最小值所得的差.
2.如果x1,x2,…,xn的平均数为,则方差可用求和符号表示为
.
3.方差的算术平方根称为标准差.
状元随笔 对方差与标准差概念的理解
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
(2)标准差、方差的取值范围:[0,+∞).
标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.
(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.
基础自测
1.求下列一组数据1,2,2,3,4,4,5,6,6,7的第30百分位数( )
A.2 B.3
C.4 D.2.5
解析:这组数据共10个,10×30%=3即第30百分位数是第3项数据和第4项数据的平均数2.5.
答案:D
2.已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是( )
A.平均数>中位数>众数
B.平均数<中位数<众数
C.中位数<众数<平均数
D.众数=中位数=平均数
解析:平均数、中位数、众数皆为50,故选D.
答案:D
3.已知一组数据为-3,5,7,x,11,且这组数的众数为5,那么该组数据的中位数是( )
A.7 B.5
C.6 D.11
解析:由这组数据的众数为5,可知x=5,把这组数据由小到大排列为-3,5,5,7,11,则可知中位数为5.
答案:B
4.已知五个数据3,5,7,4,6,则该样本的标准差为________.
解析:因为=×(3+5+7+4+6)=5,
所以s==.
答案:
课堂探究·素养提升
题型1 百分位数[教材P64例1]
例1 计算甲、乙两组数的25%分位数与75%分位数.
序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
甲组 1 2 2 2 2 3 3 3 5 5 6 6 8 8 9 10 10 12 13 13
乙组 0 0 0 0 1 1 2 3 4 5 6 6 7 7 10 14 14 14 14 15
【解析】 因为数据个数为20,而且20×25%=5,20×75%=15.
因此,甲组数的25%分位数为==2.5;
甲组数的75%分位数为==9.5.
乙组数的25%分位数为==1;
乙组数的75%分位数为==12.
教材反思
求总体百分位数的估计,首先要从小到大排列数据,然后计算出i=n×p%,当i不是整数要取整,当i是整数,则百分位数为第i项与第(i+1)项数据的平均数.
跟踪训练1 某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:
甲:95,81,75,91,86,89,71,65,76,88,94,110,107.
乙:83,86,93,99,88,103,98,114,98,79,78,106,101.
计算出学生甲、乙的第25,50的百分位数.
解析:把甲、乙两名学生的数学成绩从小到大排序,可得
甲:65,71,75,76,81,86,88,89,91,94,95,107,110.
乙:78,79,83,86,88,93,98,98,99,101,103,106,114.
由13×25%=3.25,13×50%=6.5.
可得数据的第25,50百分位数为第4,7项数据,
即学生甲的第25,50的百分位数为76,88.
学生乙的第25,50的百分位数为86,98.
题型2 众数、中位数、平均数的应用[经典例题]
例2 某公司的33名员工的月工资(以元为单位)如下:
职务 董事长 副董事长 董事 总经理 经理 管理员 职员
人数 1 1 2 1 5 3 20
月工资 5 500 5 000 3 500 3 000 2 500 2 000 1 500
(1)求该公司员工月工资的平均数、中位数、众数;(精确到1元)
(2)假设副董事长的月工资从5 000元提升到20 000元,董事长的月工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又分别是多少?(精确到1元)
(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.
【解析】 (1)平均数是=
≈2 091(元),
中位数是1 500元,众数是1 500元.
(2)新的平均数是′=
≈3 288(元),
中位数是1 500元,众数是1 500元.
(3)在这个问题中,中位数和众数都能反映出这个公司员工的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数偏差较大,所以平均数不能反映这个公司员工的工资水平.
方法归纳
(1)平均数计算方法
①定义法:n个数据a1,a2,…,an的平均数=.
②利用加权平均数公式:
在n个数据中,如果x1出现f1次,x2出现f2次,…,xk出现fk次(f1+f2+…+fk=n),则这n个数的平均数为:=.
③当数据较大时,用公式=′+a简化计算.
(2)中位数的求法
①当数据个数为奇数时,中位数是按从小到大(或从大到小)的顺序依次排列的中间那个数.
②当数据个数为偶数时,中位数为按从小到大(或从大到小)的顺序依次排列的最中间的两个数的平均数.
跟踪训练2 某中学高三年级从甲、乙两个班级各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)如表,其中甲班学生成绩的平均分是85分,乙班学生成绩的中位数是83分,则x+y的值为________.
解析:因为甲班学生成绩的平均分是85,所以=85,解得x=5,又因为乙班学生成绩的中位数是83,所以y=3,所以x+y=8.
答案:8
题型3 标准差、方差的应用[经典例题]
例3 甲、乙两机床同时加工直径为100 mm的零件,为检验质量,各从中抽取6件测量,数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
【解析】 (1)=(99+100+98+100+100+103)=100,
=(99+100+102+99+100+100)=100.
=[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
=[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)两台机床所加工零件的直径的平均值相同,又,
所以乙机床加工零件的质量更稳定.
方法归纳
在实际应用中,常常把平均数与标准差结合起来进行决策,在平均值相等的情况下,比较方差或标准差以确定稳定性.
跟踪训练3 在本例中,若甲机床所加工的6个零件的数据全都加10,那么所得新数据的平均数及方差分别是多少?
解析:甲的数据为99+10,100+10,98+10,100+10,100+10,103+10,平均数为100+10=110,
方差仍为 [(109-110)2+(110-110)2+(108-110)2+(110-110)2+(110-110)2+(113-110)2]=..第2课时 分层抽样
新知初探·自主学习——突出基础性
知识点 分层抽样
一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的、互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称为分层抽样).
状元随笔 应用分层抽样的前提条件
①总体可以分层,层与层之间有明显区别,而层内个体间差异较小.②每层中所抽取的个体差异可按各层个体在总体中所占的比例抽取.③分层抽样要求对总体的情况有一定的了解,明确分层的界限和数目.
基础自测
1.某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适( )
A.抽签法 B.简单随机抽样法
C.分层抽样法 D.随机数表法
2.某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( )
A.100 B.150
C.200 D.250
3.甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层抽样法抽取一个容量为90的样本,应在这三校分别抽取学生( )
A.30人,30人,30人
B.30人,45人,15人
C.20人,30人,10人
D.30人,50人,10人
4.一个班共有54人,其中男同学、女同学比为5∶4,若抽取9人参加教改调查会,则每个男同学被抽取的可能性为________,每个女同学被抽取的可能性为________.
课堂探究·素养提升——强化创新性
题型1 分层抽样的概念[经典例题]
例1 某中学有老年教师20人,中年教师65人,青年教师95人.为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是( )
A.抽签法 B.简单随机抽样
C.分层抽样 D.随机数表法
有明显差异用分层抽样.
【解析】 各部分之间有明显的差异是分层抽样的依据.
【答案】 C
方法归纳
各部分之间有明显的差异是分层抽样的依据,至于各层内用什么方法抽样是灵活的,可用简单随机抽样,也可采用系统抽样.分层抽样中,无论哪一层的个体,被抽中的机会均等,体现了抽样的公平性.
跟踪训练1 (1)某市有四所重点大学,为了解该市大学生的课外书籍阅读情况,采用下列哪种方法抽取样本最合适(四所大学图书馆的藏书有一定的差距)( )
A.抽签法 B.随机数表法
C.简单随机法 D.分层抽样法
关键看是否有明显差异.
(2)某校高三年级有男生800人,女生600人,为了解该年级学生的身体健康情况,从男生中任意抽取40人,从女生中任意抽取30人进行调查.这种抽样方法是( )
A.简单随机法 B.抽签法
C.随机数表法 D.分层抽样法
分层抽样中的相关运算[经典例题]
例2 某市有大型超市200家,中型超市400家,小型超市1 400家.为掌握各类超市的营业情况,现按分层抽样的方法抽取一个容量为100的样本,应抽取中型超市________家.
状元随笔
方法归纳
分层抽样中有关抽样比的计算方法
对于分层抽样中的比值问题,常利用以下关系式巧解:
(1)=;
(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.
对于分层抽样中求某层个体数,或某层要抽取的样本个体数,都可以通过上面两个等量关系求解.
跟踪训练2 某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍,为了解职工的身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为________.
状元随笔
题型3 分层抽样的应用[经典例题]
例3 某家电视台在因特网上征集某电视节目现场参与的观众,报名的总人数为12 000人,分别来自4个城区,其中东城区2 400人,西城区4 600人,南城区3 800人,北城区1 200人,从中抽取60人参加现场的节目,应当如何抽取?写出抽取过程.
(1)分多少层.
(2)比例是多少.
(3)每层抽多少.
方法归纳
(1)如果总体中的个体有差异时,就用分层抽样抽取样本,用分层抽样抽取样本时,要把性质、结构相同的个体,组成一层.
(2)每层中所抽取的个体数应按各层个体数在总体中所占的比例抽取,也就是各层抽取的比例都等于样本容量在总体中的比例,即抽样比=.这样抽取能使所得到的样本结构与总体结构相同,可以提高样本对总体的代表性.
跟踪训练3 在100个产品中,有一等品20个,二等品30个,三等品50个,现要抽取一个容量为30的样本,请说明抽样过程.
由题知有明显差异,利用分层抽样抽样.
第2课时 分层抽样
[基础自测]
1.解析:总体由差异明显的三部分组成,应选用分层抽样.
答案:C
2.解析:法一:由题意可得=,解得n=100,故选A.
法二:由题意,抽样比为=,总体容量为3 500+1 500=5 000,故n=5 000×=100.
答案:A
3.解析:先求抽样比==,再各层按抽样比分别抽取,甲校抽取3 600×=30(人),乙校抽取5 400×=45(人),丙校抽取1 800×=15(人),故选B.
答案:B
4.解析:男、女每人被抽取的可能是相同的,因为男同学共有54×=30(人),女同学共有54×=24(人),
所以每个男同学被抽取的可能性为=,每个女同学被抽取的可能性为=.
答案:
课堂探究·素养提升
跟踪训练1 解析:(1)因为学校图书馆的藏书对学生课外书籍阅读影响比较大,因此采取分层抽样.(2)总体中个体差异比较明显,且抽取的比例也符合分层抽样.
答案:(1)D (2)D
例2 【解析】 依据题意,可得抽样比为=,故应抽取中型超市400×=20(家).
【答案】 20
跟踪训练2 解析:设该单位老年职工人数为x,由题意得3x=430-160,解得x=90.则样本中的老年职工人数为90×=18.
答案:18
例3 【解析】 采用分层抽样的方式抽取参加现场节目的观众,步骤如下:
第一步,分层.按城区分为四层:东城区、西城区、南城区、北城区.
第二步,确定抽样比.样本容量n=60,总体容量N=12 000,故抽样比k===.
第三步,按比例确定每层抽取个体数.在东城区抽取2 400×=12(人),在西城区抽取4 600×=23(人),在南城区抽取3 800×=19(人),在北城区抽取1 200×=6(人).
第四步,在各层分别用简单随机抽样法抽取样本.将各城区抽取的观众合在一起组成样本.
跟踪训练3 解析:先将产品按等级分成三层;第一层,一等品20人;第二层,二等品30个;第三层,三等品50个.然后确定每一层抽取的个体数,因为抽样比为=,所以应在第一层中抽取产品20×=6(个),在第二层中抽取产品30×=9(个),在第三层中抽取产品50×=15(个).分别给这些产品编号并贴上标签,用抽签法或随机数表法在各层中抽取,得到一等品6个,二等品9个,三等品15个,这样就通过分层抽样得到了一个容量为30的样本.
6(共23张PPT)
第2课时 分层抽样
新知初探·自主学习
课堂探究·素养提升
新知初探·自主学习
知识点 分层抽样
一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的、互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称为分层抽样).
状元随笔 应用分层抽样的前提条件
①总体可以分层,层与层之间有明显区别,而层内个体间差异较小.②每层中所抽取的个体差异可按各层个体在总体中所占的比例抽取.③分层抽样要求对总体的情况有一定的了解,明确分层的界限和数目.
基础自测
1.某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适( )
A.抽签法 B.简单随机抽样法
C.分层抽样法 D.随机数表法
解析:总体由差异明显的三部分组成,应选用分层抽样.
答案:C
2.某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( )
A.100 B.150
C.200 D.250
解析:法一:由题意可得=,解得n=100,故选A.
法二:由题意,抽样比为=,总体容量为3 500+1 500=5 000,故n=5 000×=100.
答案:A
3.甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层抽样法抽取一个容量为90的样本,应在这三校分别抽取学生( )
A.30人,30人,30人
B.30人,45人,15人
C.20人,30人,10人
D.30人,50人,10人
解析:先求抽样比==,再各层按抽样比分别抽取,甲校抽取3 600×=30(人),乙校抽取5 400×=45(人),丙校抽取1 800×=15(人),故选B.
答案:B
4.一个班共有54人,其中男同学、女同学比为5∶4,若抽取9人参加教改调查会,则每个男同学被抽取的可能性为________,每个女同学被抽取的可能性为________.
解析:男、女每人被抽取的可能是相同的,因为男同学共有54×=30(人),女同学共有54×=24(人),
所以每个男同学被抽取的可能性为=,每个女同学被抽取的可能性为=.
课堂探究·素养提升
题型1 分层抽样的概念[经典例题]
例1 某中学有老年教师20人,中年教师65人,青年教师95人.为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是( )
A.抽签法 B.简单随机抽样
C.分层抽样 D.随机数表法
有明显差异用分层抽样.
【解析】 各部分之间有明显的差异是分层抽样的依据.
【答案】 C
方法归纳
各部分之间有明显的差异是分层抽样的依据,至于各层内用什么方法抽样是灵活的,可用简单随机抽样,也可采用系统抽样.分层抽样中,无论哪一层的个体,被抽中的机会均等,体现了抽样的公平性.
跟踪训练1 (1)某市有四所重点大学,为了解该市大学生的课外书籍阅读情况,采用下列哪种方法抽取样本最合适(四所大学图书馆的藏书有一定的差距)( )
A.抽签法 B.随机数表法
C.简单随机法 D.分层抽样法
关键看是否有明显差异.
解析:(1)因为学校图书馆的藏书对学生课外书籍阅读影响比较大,因此采取分层抽样.
答案:D
(2)某校高三年级有男生800人,女生600人,为了解该年级学生的身体健康情况,从男生中任意抽取40人,从女生中任意抽取30人进行调查.这种抽样方法是( )
A.简单随机法 B.抽签法
C.随机数表法 D.分层抽样法
答案:D
解析:(2)总体中个体差异比较明显,且抽取的比例也符合分层抽样.
题型2 分层抽样中的相关运算[经典例题]
例2 某市有大型超市200家,中型超市400家,小型超市1 400家.为掌握各类超市的营业情况,现按分层抽样的方法抽取一个容量为100的样本,应抽取中型超市________家.
【解析】 依据题意,可得抽样比为=,故应抽取中型超市400×=20(家).
【答案】 20
状元随笔
方法归纳
分层抽样中有关抽样比的计算方法
对于分层抽样中的比值问题,常利用以下关系式巧解:
(1)=;
(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.
对于分层抽样中求某层个体数,或某层要抽取的样本个体数,都可以通过上面两个等量关系求解.
跟踪训练2 某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍,为了解职工的身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为________.
解析:设该单位老年职工人数为x,由题意得3x=430-160,解得x=90.则样本中的老年职工人数为90×=18.
答案:18
状元随笔
题型3 分层抽样的应用[经典例题]
例3 某家电视台在因特网上征集某电视节目现场参与的观众,报名的总人数为12 000人,分别来自4个城区,其中东城区2 400人,西城区4 600人,南城区3 800人,北城区1 200人,从中抽取60人参加现场的节目,应当如何抽取?写出抽取过程.
(1)分多少层.
(2)比例是多少.
(3)每层抽多少.
【解析】 采用分层抽样的方式抽取参加现场节目的观众,步骤如下:
第一步,分层.按城区分为四层:东城区、西城区、南城区、北城区.
第二步,确定抽样比.样本容量n=60,总体容量N=12 000,故抽样比k===.
第三步,按比例确定每层抽取个体数.在东城区抽取2 400×=12(人),在西城区抽取4 600×=23(人),在南城区抽取3 800×=19(人),在北城区抽取1 200×=6(人).
第四步,在各层分别用简单随机抽样法抽取样本.将各城区抽取的观众合在一起组成样本.
方法归纳
(1)如果总体中的个体有差异时,就用分层抽样抽取样本,用分层抽样抽取样本时,要把性质、结构相同的个体,组成一层.
(2)每层中所抽取的个体数应按各层个体数在总体中所占的比例抽取,也就是各层抽取的比例都等于样本容量在总体中的比例,即抽样比=.这样抽取能使所得到的样本结构与总体结构相同,可以提高样本对总体的代表性.
跟踪训练3 在100个产品中,有一等品20个,二等品30个,三等品50个,现要抽取一个容量为30的样本,请说明抽样过程.
由题知有明显差异,利用分层抽样抽样.
解析:先将产品按等级分成三层;第一层,一等品20人;第二层,二等品30个;第三层,三等品50个.然后确定每一层抽取的个体数,因为抽样比为=,所以应在第一层中抽取产品20×=6(个),在第二层中抽取产品30×=9(个),在第三层中抽取产品50×=15(个).分别给这些产品编号并贴上标签,用抽签法或随机数表法在各层中抽取,得到一等品6个,二等品9个,三等品15个,这样就通过分层抽样得到了一个容量为30的样本.
数据的收集
最新课程标准
1.获取数据的基本途径及相关概念:①知道获取数据的基本途径,包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等.②了解总体、样本、样本量的概念,了解数据的随机性.2.抽样:①简单随机抽样 通过实例,了解简单随机抽样的含义及其解决问题的过程,掌握两种简单随机抽样方法:抽签法和随机数法.会计算样本均值和样本方差,了解样本与总体的关系.②分层随机抽样 通过实例,了解分层随机抽样的特点和适用范围,了解分层随机抽样的必要性,掌握各层样本量比例分配的方法.结合具体实例,掌握分层随机抽样的样本均值和样本方差.③抽样方法的选择 在简单的实际情境中,能根据实际问题的特点,设计恰当的抽样方法解决问题.
第1课时 总体与样本、简单随机抽样
新知初探·自主学习——突出基础性
知识点一 总体与样本
所考察问题涉及的对象全体是________,总体中每个对象都是________,抽取的部分对象组成总体的一个样本,一个样本中包含的个体数目是________容量.
知识点二 简单随机抽样
1.简单随机抽样的意义
一般地,简单随机抽样(也称为纯随机抽样)就是从总体中不加任何分组、划类、排队等,完全随机地抽取个体.简单随机抽样是其它各种抽样形式的基础.通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法.
2.简单随机抽样的分类
简单随机抽样
状元随笔
(1)对总体、个体、样本、样本容量的认识
总体:统计中所考察对象的全体叫做总体.
个体:总体中的每一个考察对象叫做个体.
样本:从总体中抽取的一部分个体叫做样本.
样本容量:样本的个体的数目叫做样本容量.
(2)简单随机抽样必须具备的几个特点
①被抽取样本的总体中的个体数N是有限的.
②抽取的样本个体数n小于或等于总体中的个体数N.
③样本中的每个个体都是逐个不放回抽取的.
④每个个体入样的可能性均为.
基础自测
1.某校期末考试后,为了分析该校高一年级1000名学生的成绩,从中抽取了100名学生的成绩单进行调查.就这个问题来说,下面说法正确的是( )
A.1000名学生是总体
B.每名学生是个体
C.100名学生的成绩是一个个体
D.样本的容量是100
2.为了了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60m;从南方抽取了200个男孩,平均身高为1.50m,由此可推断我国13岁男孩的平均身高为( )
A.1.54mB.1.55m
C.1.56mD.1.57m
3.某种福利彩票的中奖号码是从1~36个号码中选出7个号码来按规则确定中奖情况.这种从36个号码中选7个号码的抽样方法是________.
课堂探究·素养提升——强化创新性
题型1 简单随机抽样的概念[经典例题]
例1 下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数个个体中抽取50个个体作为样本;
(2)质量监督部门从180种儿童玩具中选出18种玩具进行质量检验,在抽样过程中,从中任取一种玩具检验后再放回;
(3)某社区组织100名党员研读《十九大报告》,学习十九大精神;
(4)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地逐个抽出7个号签.
方法归纳
简单随机抽样的四个特征
跟踪训练1 下列抽样方式是否是简单随机抽样?
(1)在某车间包装一种产品,在自动包装的传送带上每隔30分钟抽一包产品,检验其质量是否合格;
(2)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
利用简单随机抽样逐个判断.
题型2 抽签法的应用[经典例题]
例2 要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程.
按照抽签法的步骤:“编号,制号签,搅拌均匀,随机抽取,得号码”的步骤进行.
方法归纳
抽签法的优点:简单易行.当总体的个数不多时,使总体处于“搅拌均匀”的状态比较容易,这时,每个个体都有均等的机会被抽中,从而能够保证样本的代表性.缺点:仅适用于个体数较少的总体.当总体容量非常大时,费时费力又不方便.况且,如果号签搅拌不均匀,可能导致抽样不公平.
跟踪训练2 第十三届中国(徐州)国际园林博览会于2021年9月开幕.为做好徐州园博园运营管理工作,2022年春节期间,还需要从30名大学生中随机抽取8人作为志愿者,请写出抽取样本的过程.
总体中的个体数有限,可以采用简单易行的抽签法,按照抽签法的步骤进行即可.
随机数表法的应用[经典例题]
例3 某车间工人加工了一批零件共40件.为了了解这批零件的质量情况,要从中抽取10件进行检验,如何采用随机数表法抽取样本,写出抽样步骤.
【解析】 抽样步骤是:
第一步,先将40件零件编号,可以编号为00,01,02,…,38,39.
第二步,在随机数表中任选一个数作为开始,例如从教材附表的随机数表中的第8行第9列的数0开始.为便于说明,我们将随机数表中的第6行到第10行分别摘录如下:
6606574717 3407276850 3669736170 6581339885 1119929170
8105010805 4557182405 3530342814 8879907439 2340309732
8326977602 0205165692 6855574818 7305385247 1862388579
6357332135 0532547048 9055857518 2846828709 8340125624
7379645753 0352964778 3580834282 6093520344 3527388435
第三步,从选定的数0开始向右读下去,得一个两位数字号码02,将它取出;继续向右读,得到02,由于前面已经取出,将它去掉;继续下去,去掉重复的号码,又得到05,16,18,38,33,21,35,32,28.至此,10个样本号码已经取满,于是,所要抽取的样本号码是02,05,16,18,38,33,21,35,32,28.与这10个号码对应的零件即是抽取的样本个体.
方法归纳
在随机数表法抽样的过程中要注意:
(1)编号要求位数相同,读数时应结合编号特点进行读取,如:编号为两位,则两位、两位地读取;编号为三位,则三位、三位地读取.
(2)第一个数字的抽取是随机的.
(3)读数的方向是任意的,且事先定好.
跟踪训练3 有一批机器,编号为1,2,3,…,112.请用随机数法抽取10台入样,写出抽样过程.
抽随机数表法抽样步骤逐一抽样.
第1课时 总体与样本、简单随机抽样
新知初探·自主学习
知识点一
总体 个体 样本
知识点二
2.抽签法 随机数法
[基础自测]
1.解析:由随机抽样的基本概念可得,选D.
答案:D
2.解析:==1.56(m).
答案:C
3.解析:符合抽签法的特点:个体数较少;样本容量小.
答案:抽签法
课堂探究·素养提升
例1 【解析】 (1)不是简单随机抽样,因为简单随机抽样要求被抽取样本的总体的个数是有限的.
(2)不是简单随机抽样,因为简单随机抽样要求逐个不放回地抽取.
(3)不是简单随机抽样,因为这100名党员是挑选出来的,该社区每个人被抽到的可能性不同,不符合简单随机抽样中“等可能性”的要求.
(4)是简单随机抽样,因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.
跟踪训练1 解析:由简单随机抽样的特点可知,(1)(2)均不是简单随机抽样.
例2 【解析】 利用抽签法,步骤如下:
(1)将30辆汽车编号,号码是1,2,…,30;
(2)将号码分别写在一张纸条上,揉成团,制成号签;
(3)将得到的号签放入一个不透明的袋子中,并搅拌均匀;
(4)从袋子中依次抽取3个号签,并记录上面的编号;
(5)所得号码对应的3辆汽车就是要抽取的对象.
跟踪训练2 解析:抽样过程如下:
第一步,先将30名大学生进行编号,从1到30.
第二步,将编号写在形状、大小相同的号签上.
第三步,将号签放到一个不透明的盒子中搅拌均匀,然后从盒子中逐个抽取8个号签.
第四步,将与号签上的编号对应的大学生抽出,即得样本.
跟踪训练3 解析:方法一:第一步,将原来的编号调整为001,002,003,…,112.
第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第14行第7个数“0”,向右读.
第三步,从“0”开始,向右读,每次读取三位,凡不在001~112中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到020,086,013,110,089,021,180,098,027,002.
第四步,对应原来编号为20,86,13,110,89,21,80,98,27,2的机器便是要抽取的对象.
方法二:第一步,将原来的编号调整为101,102,103,…,212.
第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第9行第7个数“1”,向右读.
第三步,从“1”开始,向右读,每次读取三位,凡不在101~212中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到173,119,170,187,186,125,140,109,184,178.
第四步,对应原来编号为73,19,70,87,86,25,40,9,84,78的机器便是要抽取的对象.
7(共24张PPT)
第1课时 总体与样本、简单随机抽样
新知初探·自主学习
课堂探究·素养提升
新知初探·自主学习
知识点一 总体与样本
所考察问题涉及的对象全体是________,总体中每个对象都是________,抽取的部分对象组成总体的一个样本,一个样本中包含的个体数目是________容量.
总体
个体
样本
知识点二 简单随机抽样
1.简单随机抽样的意义
一般地,简单随机抽样(也称为纯随机抽样)就是从总体中不加任何分组、划类、排队等,完全随机地抽取个体.简单随机抽样是其它各种抽样形式的基础.通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法.
2.简单随机抽样的分类
简单随机抽样
抽签法
随机数法
状元随笔
(1)对总体、个体、样本、样本容量的认识
总体:统计中所考察对象的全体叫做总体.
个体:总体中的每一个考察对象叫做个体.
样本:从总体中抽取的一部分个体叫做样本.
样本容量:样本的个体的数目叫做样本容量.
(2)简单随机抽样必须具备的几个特点
①被抽取样本的总体中的个体数N是有限的.
②抽取的样本个体数n小于或等于总体中的个体数N.
③样本中的每个个体都是逐个不放回抽取的.
④每个个体入样的可能性均为.
基础自测
1.某校期末考试后,为了分析该校高一年级1 000名学生的成绩,从中抽取了100名学生的成绩单进行调查.就这个问题来说,下面说法正确的是( )
A.1 000名学生是总体
B.每名学生是个体
C.100名学生的成绩是一个个体
D.样本的容量是100
解析:由随机抽样的基本概念可得,选D.
答案:D
2.为了了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60 m;从南方抽取了200个男孩,平均身高为1.50 m,由此可推断我国13岁男孩的平均身高为( )
A.1.54 m B.1.55 m
C.1.56 m D.1.57 m
解析:==1.56(m).
答案:C
3.某种福利彩票的中奖号码是从1~36个号码中选出7个号码来按规则确定中奖情况.这种从36个号码中选7个号码的抽样方法是________.
解析:符合抽签法的特点:个体数较少;样本容量小.
答案:抽签法
课堂探究·素养提升
题型1 简单随机抽样的概念[经典例题]
例1 下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数个个体中抽取50个个体作为样本;
(2)质量监督部门从180种儿童玩具中选出18种玩具
进行质量检验,在抽样过程中,从中任取一种玩具
检验后再放回;
(3)某社区组织100名党员研读《十九大报告》,学习
十九大精神;
(4)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地逐个抽出7个号签.
【解析】 (1)不是简单随机抽样,因为简单随机抽样要求被抽取样本的总体的个数是有限的.
(2)不是简单随机抽样,因为简单随机抽样要求逐个不放回地抽取.
(3)不是简单随机抽样,因为这100名党员是挑选出来的,该社区每个人被抽到的可能性不同,不符合简单随机抽样中“等可能性”的要求.
(4)是简单随机抽样,因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.
方法归纳
简单随机抽样的四个特征
跟踪训练1 下列抽样方式是否是简单随机抽样?
(1)在某车间包装一种产品,在自动包装的传送带上每隔30分钟抽一包产品,检验其质量是否合格;
(2)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
利用简单随机抽样逐个判断.
解析:由简单随机抽样的特点可知,(1)(2)均不是简单随机抽样.
题型2 抽签法的应用[经典例题]
例2 要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程.
按照抽签法的步骤:“编号,制号签,搅拌均匀,随机抽取,得号码”的步骤进行.
【解析】 利用抽签法,步骤如下:
(1)将30辆汽车编号,号码是1,2,…,30;
(2)将号码分别写在一张纸条上,揉成团,制成号签;
(3)将得到的号签放入一个不透明的袋子中,并搅拌均匀;
(4)从袋子中依次抽取3个号签,并记录上面的编号;
(5)所得号码对应的3辆汽车就是要抽取的对象.
方法归纳
抽签法的优点:简单易行.当总体的个数不多时,使总体处于“搅拌均匀”的状态比较容易,这时,每个个体都有均等的机会被抽中,从而能够保证样本的代表性.缺点:仅适用于个体数较少的总体.当总体容量非常大时,费时费力又不方便.况且,如果号签搅拌不均匀,可能导致抽样不公平.
跟踪训练2 第十三届中国(徐州)国际园林博览会于2021年9月开幕.为做好徐州园博园运营管理工作,2022年春节期间,还需要从30名大学生中随机抽取8人作为志愿者,请写出抽取样本的过程.
总体中的个体数有限,可以采用简单易行的抽签法,按照抽签法的步骤进行即可.
解析:抽样过程如下:
第一步,先将30名大学生进行编号,从1到30.
第二步,将编号写在形状、大小相同的号签上.
第三步,将号签放到一个不透明的盒子中搅拌均匀,然后从盒子中逐个抽取8个号签.
第四步,将与号签上的编号对应的大学生抽出,即得样本.
题型3 随机数表法的应用[经典例题]
例3 某车间工人加工了一批零件共40件.为了了解这批零件的质量情况,要从中抽取10件进行检验,如何采用随机数表法抽取样本,写出抽样步骤.
【解析】 抽样步骤是:
第一步,先将40件零件编号,可以编号为00,01,02,…,38,39.
第二步,在随机数表中任选一个数作为开始,例如从教材附表的随机数表中的第8行第9列的数0开始.为便于说明,我们将随机数表中的第6行到第10行分别摘录如下:
66 06 57 47 17 34 07 27 68 50 36 69 73 61 70 65 81 33 98 85 11 19 92 91 70
81 05 01 08 05 45 57 18 24 05 35 30 34 28 14 88 79 90 74 39 23 40 30 97 32
83 26 97 76 02 02 05 16 56 92 68 55 57 48 18 73 05 38 52 47 18 62 38 85 79
63 57 33 21 35 05 32 54 70 48 90 55 85 75 18 28 46 82 87 09 83 40 12 56 24
73 79 64 57 53 03 52 96 47 78 35 80 83 42 82 60 93 52 03 44 35 27 38 84 35
第三步,从选定的数0开始向右读下去,得一个两位数字号码02,将它取出;继续向右读,得到02,由于前面已经取出,将它去掉;继续下去,去掉重复的号码,又得到05,16,18,38,33,21,35,32,28.至此,10个样本号码已经取满,于是,所要抽取的样本号码是02,05,16,18,38,33,21,35,32,28.与这10个号码对应的零件即是抽取的样本个体.
方法归纳
在随机数表法抽样的过程中要注意:
(1)编号要求位数相同,读数时应结合编号特点进行读取,如:编号为两位,则两位、两位地读取;编号为三位,则三位、三位地读取.
(2)第一个数字的抽取是随机的.
(3)读数的方向是任意的,且事先定好.
跟踪训练3 有一批机器,编号为1,2,3,…,112.请用随机数法抽取10台入样,写出抽样过程.
抽随机数表法抽样步骤逐一抽样.
解析:方法一:第一步,将原来的编号调整为001,002,003,…,112.
第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第14行第7个数“0”,向右读.
第三步,从“0”开始,向右读,每次读取三位,凡不在001~112中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到020,086,013,110,089,021,180,098,027,002.
第四步,对应原来编号为20,86,13,110,89,21,80,98,27,2的机器便是要抽取的对象.
方法二:第一步,将原来的编号调整为101,102,103,…,212.
第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第9行第7个数“1”,向右读.
第三步,从“1”开始,向右读,每次读取三位,凡不在101~212中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到173,119,170,187,186,125,140,109,184,178.
第四步,对应原来编号为73,19,70,87,86,25,40,9,84,78的机器便是要抽取的对象.