新人教版高中数学必修第二册-第九章 统计 课件(13份打包)

文档属性

名称 新人教版高中数学必修第二册-第九章 统计 课件(13份打包)
格式 zip
文件大小 10.9MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2025-06-24 13:09:08

文档简介

(共38张PPT)
9.2.1 总体取值规律的估计
预 学 案
一、频率分布直方图
画频率分布直方图的步骤
1.求极差:极差为一组数据中最大值与最小值的______.
2.决定组距与组数
将数据分组时,一般取________组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.
3.将数据分组

等长
4.列频率分布表
各小组的频率=.
5.画频率分布直方图
纵轴表示实际上就是频率分布直方图中各小长方形的______,小长方形的面积=____________=________.
高度
组距×
频率
练习 
1.判断正误(正确的画“√”,错误的画“×”)
(1)频率分布直方图中小长方形的高度表示该组上的个体在样本中出现的频率与组距的比值.(  )
(2)频率分布直方图中小长方形的面积表示该组的个体数.(  )
(3)频率分布直方图中所有小长方形面积之和为1.(  )
(4)样本容量越大,用样本的频率分布去估计总体的频率分布就越准确.(  )

×


2.一个容量为100的样本,其数据的分组与各组的频数如下:
则样本数据落在[10,40)内的频率为(  )
A.0.13 B.0.39
C.0.52 D.0.64
分组 [0,10) [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]
频数 12 13 24 15 16 13 7
答案:C
解析:由频数分布表知:样本数据落在[10,40)内的频率为=0.52.故选C.
二、其他统计图表
统计图表 主要应用
扇形图 直观描述各类数据占总数的比例
条形图和直方图 直观描述不同类别或分组数据的频数和频率
折线图 描述数据随时间的变化趋势
练习 已知某地区中小学生人数和近视情况分别如图①和图②所示,则该地区初中生近视人数为(  )
A.350 B.450
C.1 000 D.1 350
答案:D
解析:依题意,该地区初中生有4 500人,而该地区初中生的近视率为30%,所以该地区初中生近视人数为4 500×30%=1 350.故选D.
微点拨
(1)组距是指每个小组的两个端点之间的距离.为了方便起见,组距的选择应力求“取整”.极差、组距、组数有如下关系:
①若为整数,则=组数;
②若不为整数,则[]+1=组数.([x]表示不大于x的最大整数)
(2)组数与样本容量有关,一般地,样本容量越大,分的组数也就越多.当样本容量不超过100时,常分成5~12组.
(3)为方便起见,往往按等距分组,或者除了第一和最后的两段,其他各段按等距分组.
微点拨
(1)条形图是用一个单位长度表示一定的数量或频率,根据数量的多少或频率的大小画成长短不同的矩形条,条形图能清楚地表示出每个项目的具体数目或频率.
(2)扇形图是用整个圆面积表示总数(100%),用圆内的扇形面积表示各个部分所占总数的百分数.
(3)在画折线图时,要注意明确横轴、纵轴的实际含义.
共 学 案
【学习目标】 (1)会画频率分布直方图;能通过频率分布直方图估计总体的取值规律.(2)在问题情境中会用统计图分析样本数据;能从统计图表中获取有价值的信息,估计总体分布的规律.
【问题探究】 给出以下44个数据:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48
(1)上述44个数据中最大值与最小值的差是多少?
(2)若将上述数据分成下列几组:[41.5,45.5),[45.5,49.5),[49.5,53.5),[53.5,57.5),[57.5,61.5),[61.5,65.5),[65.5,69.5],则数据落在各个小组的个数是多少?
(3)我们初中学过的频数分布直方图和频数分布表能清楚地表示数据分布在各个小组的个数,那么如何刻画样本观测数据落在各个小组的比例大小呢?
提示:(1)69-42=27.
(2)数据落在各个小组的个数依次是2,7,8,16,5,4,2.
(3)利用频率分布表和频率分布直方图.
题型 1 频率分布直方图的画法
例1 调查某校高一年级男生的身高,随机抽取40名高一男生,实测身高数据(单位: cm)如下:
171 163 163 166 166 168 168 160 168 165 171 169 167 169 151 168 170 168 160 174 165 168 174 158 167 156 157 164 169 180 176 157 162 161 158 164 163 163 167 161
(1)作出频率分布表;
(2)画出频率分布直方图.
解析:(1)最低身高151 cm,最高身高180 cm,它们的差是180-151=29,即极差为29;确定组距为4,组数为8,频率分布表如下:
分组 频数 频率
[150.5,154.5) 1 0.025
[154.5,158.5) 5 0.125
[158.5,162.5) 5 0.125
[162.5,166.5) 10 0.250
[166.5,170.5) 13 0.325
[170.5,174.5) 4 0.100
[174.5,178.5) 1 0.025
[178.5,182.5] 1 0.025
合计 40 1.000
(2)频率分布直方图如下.
绘制频率分布直方图的策略
训练1 对某电子元件进行寿命追踪调查,情况如下.
(1)列出频率分布表;
(2)画出频率分布直方图.
寿命/h 100~200 200~300 300~400 400~500 500~600
个数 20 30 80 40 30
解析:(1)根据题目中的数据,计算每一小组的频率,
完成频率分布表如下:
分组 频数 频率
100~200 20 0.10
200~300 30 0.15
300~400 80 0.40
400~500 40 0.20
500~600 30 0.15
合计 200 1.00
(2)画出频率分布直方图如下:
题型 2 频率分布直方图的应用
例2 为了解某校高一年级学生的体能情况,随机抽取部分高一年级学生进行一分钟跳绳测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本量是多少?
(2)若次数在110以上(含110)为达标,
则估计该校全体高一年级学生的达标
率是多少?
解析:(1)频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小,因此,第二小组的频率为=0.08.
又因为第二小组的频率=,
所以样本量===150.
(2)由频率分布直方图,可估计该校高一年级学生的达标率为×100%=88%.
一题多变 本例条件不变,求样本中次数在130以上(含130)的学生人数.
解析:次数在130以上(含130)的学生人数为×150=36.
笔记:由频率分布直方图进行相关计算时,需掌握下列关系式:
(1)小长方形的面积=组距×=频率;
(2)各小长方形的面积之和等于1;
(3)=频率,此关系式的变形为=样本容量,样本容量×频率=频数.
训练2 某学校为了调查高一年级600名学生年平均阅读名著的情况,通过抽样,获得了100名学生年平均阅读名著的数量(单位:本),将数据按照[0,5),[5,10),[10,15),[15,20),[20,25]分成5组,制成了如图所示的频率分布直方图,则图中a的值为________;估计高一年级年平均阅读名著的数量不少于10本的人数为________.
0.03
150
解析:由直方图知:(0.07+0.08+a+0.014+0.006)×5=(0.17+a)×5=1,
所以a=0.03,
则高一年级年平均阅读名著的数量不少于10本的人数为(0.03+0.014+0.006)×5×600=150(人).
题型 3 其他统计图表的应用
例3 (多选)某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种的参保客户进行抽样调查,得出如下统计图例,
则以下四个选项正确的是(  )
A.18~29周岁人群参保总费用最少
B.30周岁以上的参保人群约占参保人群的20%
C.54周岁以上的参保人数最少
D.丁险种更受参保人青睐
答案:CD
解析:对A:由不同年龄段人均参保费用图可知,18~29周岁人群人均参保费用最少,但是这类人所占比例为20%,所以总费用不一定最少,故A错误;对B:由扇形图可知,30周岁以上的参保人数约占总参保人数的80%,故B错误;对C:由扇形图可知,54周岁以上的参保人数最少,故选项C正确;对D:由柱状图可知,丁险种参保比例最高,故选项D正确.故选CD.
笔记:(1)在条形统计图中,各个矩形图的宽度没有严格要求,但高度必须以数据为准,它直观反映了各部分在总体中所占比重的大小.实际问题中,我们需根据需要进行分组,横轴上的分组越细,对数据的刻画(描述)就越精确.
(2)扇形统计图表示总体的各部分之间的百分比关系,但不同总量下的扇形统计图,其不同的百分比不可以作为比较的依据.
(3)在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.
训练3 (多选)学校为了解本校学生上学的交通方式,在全校范围内进行了随机调查,将学生上学的交通方式归为四类方式:A—结伴步行,B—自行乘车,C—家人接送,D—其他方式.并把收集的数据整理分别绘制成柱形图和扇形图,下面的柱形图和扇形图只给出了部分统计信息,
则根据图中信息,下列说法正确的是(  )
A.扇形图中B的占比最大
B.结伴步行上学的有30人
C.无法计算扇形图中A的占比
D.估计该校学生上学交通方式为A和C的人数占学生总人数的一半
答案:ABD
解析:因为D的人数为18,且D占比为15%,
所以总人数为=120(人),
所以A组人数为120-42-30-18=30(人),故B正确;
对于A:由于B组人数最多,故在扇形图中B的占比最大,故A正确;
对于C:A组30人,占比为=0.25=25%,故C错误;
对于D:A和C的人数和为60人,总人数为120,占学生总人数的一半,故D正确.故选ABD.
随堂练习
1.关于频率分布直方图中的有关数据,下列说法正确的是(  )
A.直方图的高表示该组上的个体在样本中出现的频率与组距的比值
B.直方图的高表示该组上的个体在样本中出现的频率
C.直方图的高表示取某数的频率
D.直方图的高表示该组上的个体数与组距的比值
答案:A
解析:因为在频率分布直方图中,直方图的高表示该组上的个体在样本中的频率与组距的比值,小矩形的面积表示该组上的个体在样本中出现的频率.
2.某学校团委对全校学生阅读兴趣调查的数据进行整理,欲反映学生感兴趣的各类图书所占百分比,最适合的统计图是(  )
A.条形统计图 B.频率分布直方图
C.折线统计图 D.扇形统计图
答案:D
解析:欲反映学生感兴趣的各类图书所占百分比,最适合的统计图是扇形统计图.
3.(多选)如图给出的是某高校土木工程系大四55名学生期末考试专业成绩的频率折线图,其中组距为10,且本次考试中最低分为50分,最高分为100分.
根据图中所提供的信息,下列结论中正确的是(  )
A.成绩是75分的人数为20
B.成绩是100分的人数比成绩是50分的人数多
C.成绩落在[70,90)内的人数为35
D.成绩落在[70,80)内的人数为20
答案:CD
解析:成绩落在[70,80)内的人数为10××55=20,不能说成绩是75分的人数为20,所以A错误,D正确;从频率折线图看不出成绩是100分的人数比成绩是50分的人数多,只能看出成绩落在[50,60)内的人数和成绩落在[90,100]内的人数相等,所以B错误;成绩落在[70,90)内的人数为×55=35,所以C正确.故选CD.
4.某高校调查了400名学生每周的自习时间(单位:时),将收集到的自习时间分成5组:[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30](自习时间均在[17.5,30]内),制成了如图所示的频率分布直方图,则这400名学生中每周的自习时间不少于22.5小时的人数是________.
280
解析:由频率分布直方图知,这400名学生中每周的自习时间不少于22.5小时的人数为:400×(0.16+0.08+0.04)×2.5=280.
课堂小结
1.频率分布直方图的画法.
2.频率分布直方图的应用.
3.其他统计图表的应用.(共33张PPT)
章末复习
第九章 统 计
NEI RONG SUO YIN
内容索引
知识网络
考点突破
随堂演练
1
知识网络
PART ONE
2
考点突破
PART TWO
一、抽样方法的选取及应用
1.两种抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数法;当总体中个体差异较显著时,可采用分层随机抽样.
2.掌握两种抽样方法,提升数据分析素养.
例1 (1)一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其他人员120人.为了解职工收入情况,决定采用分层随机抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是
A.12,24,15,9 B.9,12,12,7
C.8,15,12,5 D.8,16,10,6

(2)某企业三月中旬生产A,B,C三种产品共3 000件,根据分层随机抽样的结果,企业统计员制作了如下的表格:
产品类别 A B C
产品数量(件) 1 300
样本数量(件) 130
由于不小心,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产品的样本数量比C产品的样本数量多10,根据以上信息,可得C产品的数量是______件.
800
解析 设C产品的样本数量为n,则A产品的样本数量为n+10,
反思感悟
跟踪训练1 (1)以下抽样方法是简单随机抽样的是
A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确
定号码的后四位为2709的为三等奖
B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量
是否合格
C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改
革的意见
D.用抽签方法从10件产品中选取3件进行质量检验

解析 选项A,B不是简单随机抽样,因为抽取的个体间的间隔是固定的;
选项C不是简单随机抽样,因为总体的个体有明显的层次;
选项D是简单随机抽样.
(2)某校为了了解学生学习的情况,采用分层随机抽样的方法从高一1 000人,高二1 200人,高三n人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n等于
A.860 B.720
C.1 020 D.1 040

解析 分层随机抽样是按比例抽样的,
二、频率分布直方图
1.根据样本容量的大小,我们可以选择利用样本的频率分布表、频率分布直方图、频率折线图对总体情况作出估计.
2.掌握频率分布直方图的绘制及应用,提升数据分析和数学运算素养.
例2 为了解高一年级学生的智力水平,某校按1∶10的比例对700名高一学生按性别分别进行“智力评分”抽样检查,测得“智力评分”的频数分布表如表1、表2.
表1:男生“智力评分”频数分布表
智力评分(分) [160,165) [165,170) [170,175)
频数 2 5 14
智力评分(分) [175,180) [180,185) [185,190]
频数 13 4 2
表2:女生“智力评分”频数分布表
智力评分(分) [150,155) [155,160) [160,165)
频数 1 7 12
智力评分(分) [165,170) [170,175) [175,180]
频数 6 3 1
(1)求高一年级的男生人数,并完成下面男生“智力评分”的频率分布直方图;
解 样本中男生人数是40,由抽样比例是1∶10可得高一年级男生人数是400,
男生“智力评分”的频率分布直方图如图所示.
(2)估计该校高一年级学生“智力评分”在[165,175)内的人数.
解 样本中“智力评分”在[165,175)内的频数为28,
所以估计该校高一年级学生“智力评分”在[165,175)内的学生人数为28×10=280.
反思感悟
跟踪训练2 某电子商务公司对10 000名网络购物者2018年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a=____;
3
解析 由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.
6 000
解析 消费金额在区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,
故在[0.5,0.9]内的频率为1-0.4=0.6.
因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.
三、总体集中趋势的估计
1.为了从整体上更好地把握总体的规律,我们可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征作出估计;用方差s2反映样本数据分散程度的大小.
2.掌握样本数据的众数、中位数、平均数及方差的计算方法,提升数据分析和数学运算素养.
例3 某工厂36名工人的年龄数据如下表:
工人编号 年龄 工人编号 年龄 工人编号 年龄 工人编号 年龄
 01  40  10  36  19  27  28  34
 02  44  11  31  20  43  29  39
 03  40  12  38  21  41  30  43
 04  41  13  39  22  37  31  38
 05  33  14  43  23  24  32  42
 06  40  15  45  24  42  33  53
 07  45  16  39  25  37  34  37
 08  42  17  38  26  44  35  49
 09  43  18  36  27  42  36  39
利用随机抽样法抽取容量为9的样本,其年龄数据为44,40,36,43,36,37,44,43,37.
即40,40,41,…,39,共23人.
反思感悟
通常我们用样本的平均数和方差(标准差)来近似代替总体的平均数和方差(标准差),呈现样本数据的集中趋势及波动大小,从而实现对总体的估计.
(1)一般情况下,需要将平均数和标准差结合,得到更多样本数据的信息,从而对总体作出较好的估计.因为平均数容易掩盖一些极端情况,使我们对总体作出片面的判断,而标准差较好地避免了极端情况.
(2)若两组数据的平均数差别很大,也可以只比较平均数,估计总体的平均水平,从而作出判断.
跟踪训练3 某汽车租赁公司为了调查A型汽车与B型汽车的出租情况,现随机抽取这两种车各50辆,分别统计每辆车在某个星期内的出租天数,统计数据如下表:
出租天数 3 4 5 6 7
车辆数 3 30 5 7 5
A型汽车
B型汽车
出租天数 3 4 5 6 7
车辆数 10 10 15 10 5
(1)试根据上面的统计数据,判断这两种车在某个星期内的出租天数的方差的大小关系(只需写出结果);
解 由数据的离散程度,可以看出B型汽车在某个星期内出租天数的方差较大.
(2)如果A型汽车与B型汽车每辆车每天出租获得的利润相同,该公司需要购买一辆汽车,请你根据所学的统计知识,给出建议应该购买哪一种车,并说明你的理由.
出租天数 3 4 5 6 7
车辆数 3 30 5 7 5
A型汽车
B型汽车
出租天数 3 4 5 6 7
车辆数 10 10 15 10 5
答案一:一辆A型汽车在某个星期内出租天数的平均值为4.62,B型汽车在某个星期内出租天数的平均值为4.8,选择B型汽车的出租车的利润较大,应该购买B型汽车.
答案二:一辆A型汽车在某个星期内出租天数的平均值为4.62,B型汽车在某个星期内出租天数的平均值为4.8,而B型汽车出租天数的方差较大,所以应该购买A型汽车.
3
随堂演练
PART THREE
1.某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是
A.抽签法
B.随机数法
C.分层随机抽样法
D.其他方法

1
2
3
4
5
2.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为
A.8 B.16
C.18 D.32
1
2
3
4
5

解析 已知样本数据x1,x2,…,x10的标准差为s=8,
则s2=64,数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,
1
2
3
4
5
3.样本a,3,5,7的平均数是b,且a,b是方程x2-5x+4=0的两根,则这个样本的方差是
A.3 B.4
C.5 D.6

解析 x2-5x+4=0的两根是1,4.
当a=1时,a,3,5,7的平均数是4;
当a=4时,a,3,5,7的平均数不是1.
1
2
3
4
5
4.数据4.7,4.8,5.1,5.4,5.5,3.8,2.4,7.9,8.3的80%分位数是________.
7.9
解析 把这组数据从小到大排列得2.4,3.8,4.7,4.8,5.1,5.4,5.5,7.9,8.3,
由9×80%=7.2可知,该组数据的80%分位数是第8项数据为7.9.
1
2
3
4
5
5.某公司为了了解广告投入对销售收益的影响,在若干地区各投入4万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从0开始计数的.
(1)根据频率分布直方图计算图中各小长方形的宽度;
解 设各小长方形的宽度为m,
由频率分布直方图知各小长方形面积之和为1,
可知(0.08+0.10+0.14+0.12+0.04+0.02)m=0.5m=1,
故m=2.
(2)估计该公司在若干地区各投入4万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值).
解 由(1)知各小组依次是[0,2),[2,4),[4,6),[6,8),[8,10),[10,12],
其中点分别为1,3,5,7,9,11,
对应的频率分别为0.16,0.20,0.28,0.24,0.08,0.04,
故可估计平均值为1×0.16+3×0.20+5×0.28+7×0.24+9×0.08+11×0.04=5.
1
2
3
4
5(共29张PPT)
第3课时 总体集中趋势的估计
第九章 9.2 用样本估计总体
学习目标
XUE XI MU BIAO
1.掌握求样本数据的众数、中位数、平均数.
2.理解用样本的数字特征、直方图估计总体的集中趋势.
NEI RONG SUO YIN
内容索引
知识梳理
题型探究
随堂演练
1
知识梳理
PART ONE
1.众数:一组数据中出现次数 的数.
2.中位数:把一组数据按 的顺序排列,处在 位置的数(或中间两个数的 )叫做这组数据的中位数.
3.平均数:如果n个数x1,x2,…,xn,那么 = 叫做这n个数的平均数.
思考 平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点?
答案 平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大.
知识点一 众数、中位数、平均数
最多
从小到大(或从大到小)
中间
平均数
1.平均数、中位数和众数等都是刻画 的量,它们从不同角度刻画了一组数据的集中趋势.
2.一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用 、 ;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用 .
知识点二 总体集中趋势的估计
“中心位置”
平均数
中位数
众数
1.样本平均数:可以用每个小矩形底边中点的 与小矩形 的乘积之和近似代替.
2.在频率分布直方图中,中位数左边和右边的直方图的面积应 .
3.将 小矩形所在的区间 作为众数的估计值.
知识点三 频率分布直方图中平均数、中位数、众数的求法
横坐标
面积
相等
最高
中点
思考辨析 判断正误
SI KAO BIAN XI PAN DUAN ZHENG WU
1.中位数是一组数据中间的数.(  )
2.众数是一组数据中出现次数最多的数.(  )
3.平均数反映了一组数据的平均水平,任何一个样本数据的改变都会引起平均数的变化.(  )
4.一组数据中,有一半的数据不大于中位数,而另一半则不小于中位数,中位数反映了一组数据的中心的情况.中位数不受极端值的影响.(  )

×


2
题型探究
PART TWO
例1 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
一、众数、中位数、平均数的计算
成绩(单位:m) 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90
人数 2 3 2 3 4 1 1 1
分别求这些运动员成绩的众数、中位数与平均数.
解 在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.
上面表里的17个数据可看成是按从小到大的顺序排列的,
其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70.
故17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.
反思感悟
平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.
跟踪训练1 某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数、众数、中位数分别为
A.85,85,85 B.87,85,86
C.87,85,85 D.87,85,90

二、平均数、中位数、众数的应用
例2 某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):
甲群 13,13,14,15,15,15,15,16,17,17;
乙群 54,3,4,4,5,5,6,6,6,57.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?
其中哪个统计量能较好地反映甲群市民的年龄特征?
中位数为15岁,众数为15岁.
平均数、中位数和众数相等,
因此它们都能较好地反映甲群市民的年龄特征.
(2)乙群市民年龄的平均数、中位数和众数各是多少岁?
其中哪个统计量能较好地反映乙群市民的年龄特征?
中位数为5.5岁,众数为6岁.
由于乙群市民大多数是儿童,
所以中位数和众数能较好地反映乙群市民的年龄特征,
而平均数的可靠性较差.
反思感悟
众数、中位数、平均数的意义
(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.
跟踪训练2 (2019·安徽期末)某公司为了了解一年内的用水情况,抽取了10天的用水量如表所示:
用水量/t 22 38 40 41 44 50 95
天数 1 1 1 2 2 1 2
(1)在这10天中,该公司用水量的平均数是多少?每天用水量的中位数是多少?
(2)你认为应该用平均数和中位数中的哪一个来描述该公司每天的用水量?
用水量/t 22 38 40 41 44 50 95
天数 1 1 1 2 2 1 2
解 平均数受数据中的极端值(2个95)影响较大,使平均数在估计总体时可靠性降低,10天的用水量有8天都在平均值以下,故用中位数描述每天的用水量更合适.
三、利用频率分布直方图估计总体的集中趋势
例3 某校从参加高一年级期末考试的学生中抽出60名,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后画出如图所示的频率分布直方图.观察图中的信息,回答下列问题:
(1)估计这次考试的物理成绩的众数m与中位数n(结果保留一位小数);
解 众数是频率分布直方图中最高小矩形中点的横坐标,所以众数为m=75.0.
前3个小矩形面积为0.01×10+0.015×10+0.015×10=0.4<0.5,
前4个小矩形的面积为0.4+0.03×10=0.7>0.5,
(2)估计这次考试的物理成绩的及格率(60分及以上为及格)和平均分.
解 依题意,60及60以上的分数在第三、四、五、六组,频率为(0.015+0.03+0.025+0.005)×10=0.75,所以,估计这次考试的物理成绩的及格率是75%.
利用组中值估算抽样学生的平均分45×f1+55×f2+65×f3+75×f4+85×f5+95×f6=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
估计这次考试物理成绩的平均分是71分.
反思感悟
利用频率分布直方图求众数、中位数以及平均数的方法
(1)众数即为出现次数最多的数,所以它的频率最大,在最高的小矩形中.中位数即为从小到大中间的数(或中间两数的平均数).平均数为每个小矩形中点的横坐标与小矩形面积乘积之和.
(2)用频率分布直方图求得的众数、中位数不一定是样本中的具体数.
跟踪训练3 我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.估计居民月均用水量的中位数.
解 由(0.08+0.16+a+0.42+0.50+a+0.12+0.08+0.04)×0.5=1,解得a=0.30.
设中位数为x吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.
而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.
所以2≤x<2.5.
由0.50×(x-2)=0.5-0.48,解得x=2.04.
故可估计居民月均用水量的中位数为2.04吨.
3
随堂演练
PART THREE
1.在一次体育测试中,某班的6名同学的成绩(单位:分)分别为66,83,87,83,77,96.关于这组数据,下列说法错误的是
A.众数是83 B.中位数是83
C.极差是30 D.平均数是83

1
2
3
4
5
解析 由于83出现的次数最多,所以众数是83,故A说法正确;
把数据66,83,87,83,77,96按从小到大排列为66,77,83,83,87,96,中间两个数为83,83,所以中位数是83,故B说法正确;
极差是96-66=30,故C说法正确;
由于平均数为(66+83+87+83+77+96)÷6=82,故D说法错误,故选D.
2.(多选)下列关于平均数、中位数、众数的说法中错误的是
A.中位数可以准确地反映出总体的情况
B.平均数可以准确地反映出总体的情况
C.众数可以准确地反映出总体的情况
D.平均数、中位数、众数都有局限性,都不能准确地反映出总体的情况
1
2
3
4
5



1
2
3
4
5
3.一组样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x等于
A.21 B.22
C.20 D.23

1
2
3
4
5
4.某鞋店试销一种新女鞋,销售情况如下表:
鞋号 34 35 36 37 38 39 40 41
日销量/双 2 5 9 16 9 5 3 2
如果你是鞋店经理,那么下列统计量中对你来说最重要的是
A.平均数 B.众数
C.中位数 D.极差

解析 鞋店经理最关心的是哪个鞋号的鞋销量最大,由表可知,鞋号为37的鞋销量最大,共销售了16双,所以这组数据最重要的是众数.
5.某班全体学生参加物理测试成绩的频率分布直方图如图所示,则估计该班物理测试的平均成绩是______.
1
2
3
4
5
68
解析 平均成绩就是频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标再求和,
即0.005 ×20×30+0.010×20×50+0.020×20×70+0.015×20×90=68(分).
1.知识清单:
中位数、众数、平均数的计算及应用.
2.方法归纳:数据分析统计.
3.常见误区:求中位数时需先把一组数据按从小到大(或从大到小)的顺序排列,再找中间位置的数或中间两数的平均数.
课堂小结
KE TANG XIAO JIE(共28张PPT)
9.2.4 总体离散程度的估计
预 学 案
方差、标准差
1.假设一组数据为x1,x2,…,xn,则这组数据的平均数=,
方差为s2=______________,标准差s=______________.
2.如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为
,则称S2=______________为总体方差,S=为总体标准差.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=.
3.如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,
则称s2=_____________为样本方差,s=为样本标准差.
练习 
1.判断正误(正确的画“√”,错误的画“×”)
(1)数据的极差越小,样本数据分布越集中、稳定.(  )
(2)数据的方差越大,样本数据分布越集中、稳定.(  )
(3)数据的标准差越小,数据分布越集中、波动幅度越小.(  )
(4)在实际问题中要做出有效决策时,主要参照样本数据的平均数和标准差或方差.(  )

×


2.已知有样本数据2、4、5、6、8,则该样本的方差为(  )
A.5     B.4
C.2     D.0
答案:B
解析:平均数为=5.
该样本的方差为=4.
故选B.
微点拨
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
(2)标准差、方差的取值范围:[0,+∞).
标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.
(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.
共 学 案
【学习目标】 (1)理解方差、标准差的含义,会计算方差和标准差.(2)掌握求分层随机抽样总样本的平均数及方差的方法.
【问题探究】 有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
(1)甲、乙两人本次射击的平均成绩分别为多少环?
(2)观察下图中两人成绩的频率分布条形图,你能说明其水平差异在哪里吗?
(3)对于甲、乙的射击成绩,除了画出频率分布条形图比较外,还有没有其他方法来说明两组数据的离散程度?
提示:(1)=×(7+8+7+9+5+4+9+10+7+4)=7,=×(9+5+7+8+7+6+8+6+7+7)=7.
(2)直观上看,还是有差异的.甲成绩比较分散,乙成绩相对集中.
(3)还经常用甲、乙的极差与平均数一起比较说明数据的分散程度.甲命中环数的极差=10-4=6,乙命中环数的极差=9-5=4.极差在一定程度上表明了样本数据的离散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.
题型 1 方差、标准差的计算
例1 甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
解析:(1)=(99+100+98+100+100+103)=100,
=(99+100+102+99+100+100)=100.
=[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
=[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)两台机床所加工零件的直径的平均值相同,又,所以乙机床加工零件的质量更稳定.
笔记:研究两个样本的波动情况或比较它们的稳定性、可靠性等性能好坏的这类题,先求平均数,比较一下哪一个更接近标准,若平均数相等,则再比较两个样本方差的大小来作出判断.
训练1 对划艇运动员甲、乙在相同的条件下进行了6次测试,测得他们每次的最大速度(m/s)如下:
甲:27,38,30,37,35,31
乙:33,29,38,34,28,36
根据以上数据,试判断他们谁的成绩比较稳定.
解析:=×(27+38+30+37+35+31)=33,
=×[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]=×94≈15.7,
=×(33+29+38+34+28+36)==33,
=×[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]=×76≈12.7.
所以=.
这说明甲、乙两运动员的最大速度的平均值相同,但乙的成绩比甲的稳定.
题型 2 方差、标准差与统计图表的综合应用
例2 甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.
(1)分别求出两人得分的平均数与方差;
(2)根据图形和(1)中计算结果,对两人的训练成绩作出评价.
解析:(1)由图可得甲、乙两人五次测试的成绩分别为甲:10,13,12,14,16;
乙:13,14,12,12,14.
==13,
==13,
=×[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
=×[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
笔记:根据折线统计图研究样本数据的数字特征与横坐标和纵坐标的统计意义有关,但一般情况下,整体分布位置较高的平均数大,数据波动性小的方差小.
训练2 甲、乙、丙三位同学在一项集训中的40次测试分数都在[50,100]内,将他们的测试分数分别绘制成频率分布直
方图,如图所示,记甲、乙、丙的分数标准差分别为
s1,s2,s3,则它们的大小关系为(  )
A.s1>s2>s3 B.s1>s3>s2
C.s3>s1>s2 D.s3>s2>s1
答案:B
解析:根据频率分布直方图中的数据信息知乙同学的测试分数比较集中,则s2最小;甲同学的测试分数比较分散,则s1最大,综合可得s1>s3>s2,故选B.
题型 3 分层抽样的方差
例3 在一个文艺比赛中,8名专业人士和12名观众代表各组成一个评判小组,给参赛选手打分.在给某选手的打分中,专业人士打分的平均数和标准差分别为47.4和3.7,观众代表打分的平均数和标准差为56.2和11.8,试根据这些数据计算这名选手得分的平均数和标准差.
解析:把专业人士打分样本记为x1,x2,x3,…,x8其平均数记为,方差记为,
把观众代表打分样本记为y1,y2,y3,…,y12,其平均数记为,方差记为,
把总体数据的平均数记为,方差记为s2,
则总样本平均数为=×47.4+×56.2=52.68,
总样本方差为
s2=

=×{8×[3.72+(47.4-52.68)2]+12×[11.82+(56.2-52.68)2]}=107.6,
总样本标准差s=10.37,
所以计算这名选手得分的平均数为52.68,标准差为10.37.
计算分层抽样的方差s2的步骤
训练3 已知某省二、三、四线城市数量之比为1∶3∶6,2023年8月份调查得知该省所有城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.8万元/平方米,三、四线城市房价的方差分别为10,8,求二线城市房价的方差.
解析:设二线城市的房价的方差为s2,由题意可知20=[s2+(1.2-2.4)2]+×[10+(1.2-1.8)2]+×[8+(1.2-0.8)2],
解得s2=118.52,即二线城市房价的方差为118.52.
随堂练习
1.下列数字特征不能反映样本数据的分散程度、波动情况的是(  )
A.极差 B.平均数
C.方差 D.标准差
答案:B
解析:对于A,极差表示一组数据最大值与最小值的差,极差越大数据越分散,极差越小数据越集中,故极差能反映样本数据的离散程度大小,故不选A;对于B,平均数是表示一组数据集中趋势的量数,是指在一组数据中所有数据之和再除以这组数据的个数,它是描述数据集中位置的一个统计量,故平均数不能反映样本数据的分散程度、波动情况,故选B;对于C,方差反映了一组数据的波动大小,方差越大,波动性越大,反之也成立,即方差能反映样本数据的离散程度大小,故不选C;对于D,标准差是方差的算术平方根,标准差也能反映样本数据的离散程度大小,故不选D.
2.甲、乙两名同学参加了一次篮球比赛的全部7场比赛,平均每场得分都是16分,标准差分别为3.5和4.62,则甲、乙两名同学在这次篮球比赛中,发挥更稳定的是(  )
A.甲 B.乙
C.甲、乙相同 D.不能确定
答案:A
解析:因甲、乙平均每场得分相同,都是16分,而甲的标准差3.5小于乙的标准差4.62,
即甲每场比赛的得分波动较乙的小,甲发挥更稳定.故选A.
3.一组数据6,7,8,8,9,10的方差是(  )
A.8 B.9
C. D.
答案:D
解析:数据6,7,8,8,9,10的平均数为==8,
所以所求方差为s2=[(6-8)2+(7-8) 2+(8-8) 2+(8-8) 2+(9-8) 2+(10-8)2]=.故选D.
4.某人任意统计5次上班步行到单位所花的时间(单位:分)分别为8,12,10,11,9.则这组数据的标准差为________.
解析:由题意得,这组数据的平均数==10,
所以标准差s==.
课堂小结
1.方差、标准差的计算及应用.
2.分层随机抽样的方差的求解.(共23张PPT)
9.2.2 总体百分位数的估计
预 学 案
百分位数
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有________的数据小于或等于这个值,且至少有__________的数据大于或等于这个值.
2.计算第p百分位数的步骤
第1步,按从________到________排列原始数据.
第2步,计算i=________.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为________数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的________.
p%
(100-p)%


n×p%
第j项
平均数
3.四分位数
常用的分位数有第25百分位数、第50百分位数、第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第________百分位数也称为第一四分位数或下四分位数等,第________百分位数也称为第三四分位数或上四分位数等.
25
75
练习 
1.判断正误(正确的画“√”,错误的画“×”)
(1)50%分位数就是中位数.(  )
(2)若一组样本数据各不相等,则其75%分位数大于25%分位数.(  )
(3)若一组样本数据的10%分位数是23,则在这组数据中有10%的数据大于23.(  )


×
2.1,2,3,4,5,5这组数据的第50百分位数是(  )
A.3   B.3.5    
C.4   D.5
答案:B
解析:将数据从小到大排列为1,2,3,4,5,5.
而6×0.5=3,所以第50百分位数是=3.5.故选B.
微点拨
分位数概念辨析
将总体数据从小到大排列.
(1)将范围或者说区间(0,1)两等分的数是,所以总体数据总处于中间位置的那个数据叫做(=50%)分位数,二分位数只有这一个数据,这个数据也是中位数,也是50%分位数.
(2)将范围或者说区间(0,1)三等分的数是,所以总体数据总处于对应位置的数据叫做分位数,这两个数据都称为三分位数.
(3)将范围或者说区间(0,1)四等分的数是,所以总体数据总处于对应位置的数据叫做分位数,也就是25%,50%,75%分位数.这三个数据都称为四分位数.
共 学 案
【学习目标】 (1)结合实例,理解百分位数的定义.(2)会求一组数据的第p百分位数.
【问题探究】 如果该市政府希望使80%的居民用户生活用水费支出不受影响,根据教材9.2.1节中100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?
提示:把100个样本数据按从小到大排序,得到第80个和第81个数据分别为13.6和13.8.可以发现,在区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数=13.7,并称此数为这组数据的第80百分位数,或80%分位数.
题型 1 百分位数的计算
例1 某中学高二(1)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:
甲:95,81,75,91,86,89,71,65,76,88,94,110,107.
乙:83,86,93,99,88,103,98,114,98,79,78,106,101.
计算出学生甲、乙的25%分位数和50%分位数.
解析:把甲、乙两名学生的数学成绩从小到大排序,可得
甲:65,71,75,76,81,86,88,89,91,94,95,107,110.
乙:78,79,83,86,88,93,98,98,99,101,103,106,114.
由13×25%=3.25,13×50%=6.5,
可得数据的25%分位数为第4项数据,50%分位数为第7项数据;
即学生甲的25%分位数为76,50%分位数为88;
学生乙的25%分位数为86,50%分位数为98.
笔记:
百分位数的两个注意点
(1)求百分位数时,一定要将数据按照从小到大的顺序排列.
(2)第p百分位数的特点是:总体中任一个数小于或等于它的可能性是p%.
训练1 某校高一年级15个班参加朗诵比赛的得分如下:
91 89 90 92 94 87 93 96 91 85 89
93 88 98 93
求这组数据的40%分位数、70%分位数.
解析:将数据从小到大依次排列如下:
85,87,88,89,89,90,91,91,92,93,93,93,94,96,98,
而15×40%=6,15×70%=10.5,
故这组数据的40%分位数是×(90+91)=90.5,
这组数据的70%分位数是93.
题型 2 百分位数在统计图表中的应用
例2 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图.
估计参赛学生的成绩的25%,90%分位数.
解析:由直方图得,从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.
成绩在60分以下的学生所占比例为30%>25%,
所以25%分位数一定位于[50,60)内.
由50+10×≈58.3,可以估计参赛学生的成绩的25%分位数为58.3;
成绩在80分以下的学生所占比例为30%+40%+15%=85%<90%,
成绩在90分以下的学生所占比例为30%+40%+15%+10%=95%>90%,
所以90%分位数一定位于[80,90)内.
由80+10×=85,可以估计参赛学生的成绩的90%分位数为85.
笔记:
根据频率分布直方图求第p百分位数的步骤
(1)确定百分位数所在的区间[a,b).
(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+(b-a)×.
训练2 某工厂对一批产品进行了抽样检测,如图是根据抽样检测后的产品净重数据绘制的频率分布直方图,其中产品净重的范围是[96,106](单位:g),样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].
试估计样本数据的第70百分位数.
解析:由直方图得,从左到右的第一、二、三、四、五小组的频率分别是0.10、0.20、0.30、0.25、0.15.
净重在102 g以下的产品所占比例为10%+20%+30%=60%<70%,
净重在104 g以下的产品所占比例为10%+20%+30%+25%=85%>70%,
所以70%分位数一定位于[102,104)内.
由102+2×=102.8,可以估计样本数据的第70百分位数为102.8.
随堂练习
1.关于百分位数的说法中,正确的是(  )
A.百分位数一定是数据中的某一项
B.恰好有k%的数据比第k百分位数小
C.某样本的第k百分位数一定是整体的第k百分位数
D.一组数据中不同的百分位数可能相等
答案:D
解析:对A,百分位数的计算结果可能是数据中的某一项,也有可能是某两个数据的平均数,故A错误;对B,第k百分位数为数据中的某一项,也有可能是某两个数据的平均数,恰有k%的数据,若此数据与下个数据相等,则k%的数据不一定比第k百分位数小,故B错误;对C,样本的第k百分位数计算结果和整体的第k百分位数计算结果不一定是同一个数据,故C错误;对D,根据百分位数的定义,可知一组数据中不同的百分位数可能相等,故D正确.
2.已知一组数据为85,87,88,90,92,则这组数据的第60百分位数为(  )
A.87.5   B.88
C.89   D.91
答案:C
解析:5×60%=3,因为3为整数,故选取88和90的平均数作为第60百分位数,即=89.
3.数据1,2,3,4,5,6,7,8,9,10的上四分位数为(  )
A.2    B.2.5
C.7.5   D.8
答案:D
解析:10×=7.5,所以上四分位数是第8个数,为8.
4.下表所给数据的第85百分位数为________.
3130
解析:排序:2 710 2 755 2 850 2 880 2 880 2 890 2 920 2 940 2 950 3 050 3 130 3 325
计算i:
i=n=×12=10.2,
即第85百分位数是3 130.
课堂小结
1.百分位数的定义.
2.由样本数据求百分位数.
3.由统计图表求百分位数.(共29张PPT)
9.2.3 总体集中趋势的估计
预 学 案
一、众数、中位数、平均数
1.众数:一组数据中出现次数________的数.
2.中位数:把一组数据按____________________的顺序排列,处在________位置的数(或中间两个数的________)叫做这组数据的中位数.
3.平均数:如果n个数x1,x2,…,xn,那么=________________叫做这n个数的平均数.
最多
从小到大(或从大到小)
中间
平均数
(x1+x2+…+xn)
练习 某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各1人,则该小组成绩的平均数、众数、中位数分别是(  )
A.85分、85分、85分 B.87分、85分、86分
C.87分、85分、85分 D.87分、85分、90分
答案:C
解析:由题意知,该学习小组共有10人,因此众数和中位数都是85,平均数为=87.
二、频率分布直方图中的众数、中位数、平均数
1.样本平均数:可以用每个小矩形底边中点的________与小矩形________的乘积之和近似代替.
2.在频率分布直方图中,中位数左边和右边的直方图的面积应________.
3.将________小矩形所在的区间________作为众数的估计值.
横坐标
面积
相等
最高
中点
练习 在某时段由50辆车通过一个雷达测速点,工作人员将测得的车速绘制成如图所示的条形统计图,则这50辆车的车速的众数(单位:km/h)为(  )
A.60     B.50     C.40     D.15
答案:C
解析:由条形图知:50个数据出现次数最多的为40,
所以众数为40.故选C.
微点拨
平均数、众数和中位数描述了数据的集中趋势,数值型数据可用平均数、中位数描述集中趋势;分类型数据常用众数描述集中趋势.

微点拨
利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.
共 学 案
【学习目标】 (1)会求样本数据的众数、中位数、平均数.(2)理解用样本的数字特征、频率分布直方图估计总体的集中趋势.
【问题探究】 现从甲、乙、丙三个厂家生产的同一种耐用家电产品中,各抽取8件产品,对其使用寿命进行跟踪调查,其结果如下:(单位:年)
甲:3,4,5,6,8,8,8,10;乙:4,6,6,6,8,9,12,13;丙:3,3,4,7,9,10,11,12.
三个厂家广告中都称其产品的使用寿命为8年,利用所学知识,你能说明为什么吗?
提示:三个厂家是从不同角度进行了说明,以宣传自己的产品.其中甲:众数为8年;乙:平均数为8年;丙:中位数为8年.
题型 1 众数、中位数、平均数的计算
例1 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
分别求这些运动员成绩的众数、中位数与平均数.
成绩(单位:m) 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90
人数 2 3 2 3 4 1 1 1
解析:因为成绩为1.75 m的人数为4,最多,所以17名运动员的成绩的众数为:1.75 m.
根据中位数的定义可知,把17名运动员的成绩从小到大排列,第9个运动员的成绩为中位数,所以17名运动员的成绩的中位数为:1.70 m.
17名运动员的成绩的平均数为:≈1.69 m.
所以这些运动员成绩的众数为1.75 m,中位数为1.70 m,平均数约为1.69 m.
笔记:众数是出现次数最多的数;计算中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据相关数据的总数是奇数还是偶数而定;平均数一般是根据公式来计算.
训练1 已知一组数据5,2,x,5,8,9,且5A.6 B.6.5
C.7 D.7.5
答案:A
解析:∵5题型 2 众数、中位数、平均数的应用
例2 甲、乙、丙三家电子厂商在广告中都声称,他们的某型电子产品在正常情况下的待机时间都是12 h,质量检测部门对这三家销售产品的待机时间进行了抽样调查,统计结果(单位:h)如下:
甲:8,9,9,9,9,11,13,16,17,19;
乙:10,10,12,12,12,13,14,16,18,19;
丙:8,8,8,10,11,13,17,19,20,20.
(1)分别求出以上三组数据的平均数、众数、中位数.
(2)这三个厂商的推销广告分别利用了上述哪一种数据来表示待机时间?
(3)如果你是顾客,会选择哪个厂商的产品?为什么?
解析: (1)根据平均数的计算公式可知:
甲厂数据的平均数是=12;
乙厂数据的平均数是=13.6;
丙厂数据的平均数是=13.4.
甲厂,乙厂,丙厂的众数分别是9,12,8.
甲厂数据的中位数为=10,乙厂数据的中位数为=12.5,丙厂数据的中位数为=12.
(2)甲厂用平均数作为该电子产品的待机时间,乙厂用众数作为该电子产品的待机时间,丙厂用中位数作为该电子产品的待机时间.
(3)我会选乙厂的产品因为乙厂产品的平均数最大,众数最大,中位数最大,所以待机时间更长些,稳定性也较好.
笔记:(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.
训练2 某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄(单位:岁)如下:
甲群:13,13,14,15,15,15,15,16,17,17;
乙群:54,3,4,4,5,5,6,6,6,57.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?
(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?
解析:(1)甲群市民年龄的平均数为=15(岁),
中位数为15岁,众数为15岁,平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.
(2)乙群市民年龄的平均数为=15(岁),
中位数为5.5岁,众数为6岁.
由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.
题型 3 利用频率分布直方图求众数、中位数、平均数
例3 某城市正在进行创建文明城市的活动,为了解居民对活动的满意程度,相关部门组织部分居民对本次活动进行打分(分数为正整数,满分100分).现从所有有效数据中随机抽取一个容量为100的样本,统计发现分数均在[40,100],将样本数据整理得到如下频率分布直方图.
(1)求a的值;
(2)根据频率分布直方图,估计该城市居民
打分的众数、中位数(保留一位小数)及平均
数(同一组中的数据用该组区间的中点值为
代表).
解析:(1)由频率分布直方图可知(0.004+0.006+a+0.03+0.024+0.016)×10=1,解得a=0.02.
(2)由频率分布直方图可知众数为=75;
由(0.004+0.006+0.02)×10=0.3<0.5,(0.004+0.006+0.02+0.03)×10=0.6>0.5,
所以中位数位于[70,80)之间,设中位数为x,则(0.004+0.006+0.02)×10+(x-70)×0.03=0.5,
解得x=≈76.7;
平均数为0.04×45+0.06×55+0.2×65+0.3×75+0.24×85+0.16×95=76.2.
笔记:(1)众数即为出现次数最多的数,所以它的频率最大,在最高的小矩形中,中位数即为从小到大中间的数(或中间两数的平均数).平均数约为每个小矩形底边中点的横坐标与小矩形面积的乘积之和.
(2)用频率分布直方图求得的众数、中位数不一定是样本中的具体数.
训练3 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:高一参赛学生的成绩的众数、中位数.
解析:用频率分布直方图中最高矩形所在的区间的中点值作为众数的近似值,
得众数为=65,
因为0.03×10=0.3<0.5,(0.03+0.04)×10=0.7>0.5,
所以中位数在60~70之间,设中位数为x,
则0.3+0.04(x-60)=0.5,解得x=65,所以中位数为65.
随堂练习
1.在一次体育测试中,某班的6名同学的成绩(单位:分)分别为66,83,87,83,77,96.关于这组数据,下列说法错误的是(  )
A.众数是83 B.中位数是83
C.极差是30 D.平均数是83
答案:D
解析:由于83出现的次数最多,所以众数是83,故A说法正确;把数据66,83,87,83,77,96按从小到大排列为66,77,83,83,87,96,中间两个数为83,83,所以中位数是83,故B说法正确;极差是96-66=30,故C说法正确;由于平均数为(66+83+87+83+77+96)÷6=82,故D说法错误.
2.北京冬奥会已于2022年2月4日至2月20日顺利举行,这是中国继北京奥运会,南京青奥会后,第三次举办的奥运赛事.之前,为助力冬奥,提高群众奥运法律知识水平和文明素质,某市有关部门开展冬奥法律知识普及类线上答题,共计30个题目,每个题目2分,满分60分,现从参与线上答题的市民中随机抽取1 000名,将他们的作答成绩分成6组,并绘制了如图所示的频率分布直方图.
若同一组中的数据用该组区间中点值为代表,可估计这次线上答题成绩的平均数为(  )
A.33   B.34
C.35   D.36
答案:B
解析:由题图,0.05×5+0.1×15+0.2×25+0.3×35+0.25×45+0.1×55=34.故选B.
3.我国冰雪健儿自1992年实现冬奥奖牌数0的突破,到北京冬奥会结束,共获得77块奖牌.现将1992年以来我国冬奥会获得奖牌数量统计如下表:
则1992年以来我国获得奖牌数的中位数为(  )
A.8   B.9 C.10   D.11
年份 1992 1994 1998 2002 2006 2010 2014 2018 2022
奖牌数 3 3 8 8 11 11 9 9 15
答案:B
解析:将自1992年以来我国冬奥会获得奖牌数从小到大排列为:3,3,8,8,9,9,11,11,15,所以1992年以来我国获得奖牌数的中位数为9.
4.已知一组数据的频率分布直方图如下.则众数是__________,中位数是__________,平均数是__________.
解析:因为最高矩形横坐标的中点为65,所以众数为65;
设中位数为60+x,则0.030×10+0.04x=0.5,解得x=5,所以中位数为65;
平均数=(55×0.030+65×0.040+75×0.015+85×0.010+95×0.005)×10=67.
65
65
67
课堂小结
1.众数、中位数、平均数的计算.
2.众数、中位数、平均数的应用.
3.频率分布直方图中的众数、中位数、平均数.(共35张PPT)
第1课时 总体取值规律的估计
第九章 9.2 用样本估计总体
学习目标
XUE XI MU BIAO
1.掌握频率分布表的作法以及频率分布直方图的画法.
2.掌握用频率分布直方图估计总体.
NEI RONG SUO YIN
内容索引
知识梳理
题型探究
随堂演练
1
知识梳理
PART ONE
作频率分布直方图的步骤
1.求极差:极差为一组数据中最大值与最小值的 .
2.决定组距与组数
将数据分组时,一般取 组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.
3.将数据分组
4.列频率分布表
知识点 频率分布直方图

等长
思考 要做频率分布表,需要对原始数据做哪些工作?
答案 分组,频数累计,计算频数和频率.
高度
思考辨析 判断正误
SI KAO BIAN XI PAN DUAN ZHENG WU
1.频率分布直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值.(  )
2.频率分布直方图中小长方形的面积表示该组的个体数.(  )
3.频率分布直方图中所有小长方形面积之和为1.(  )
4.样本容量越大,用样本的频率分布去估计总体的频率分布就越准确.(  )

×


2
题型探究
PART TWO
例1 一个容量为100的样本,其数据的分组与各组的频数如下:
一、频率分布概念的理解
分组 [0,10) [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]
频数 12 13 24 15 16 13 7
则样本数据落在[10,40)上的频率为
A.0.13 B.0.39
C.0.52 D.0.64

解析 由题意可知样本数据落在[10,40)的频数为13+24+15=52,
反思感悟
频率分布是指各个小范围内的样本数据所占比例的大小.
跟踪训练1 容量为100的某个样本,数据拆分为10组,若前七组频率之和为0.79,而剩下的三组的频率依次相差0.05,则剩下的三组中频率最大的一组频率为_______.
0.12
解析 设剩下的三组中频率最大的一组的频率为x,
则另两组的频率分别为x-0.05,x-0.1,
而由频率和为1得0.79+(x-0.05)+(x-0.1)+x=1,
解得x=0.12.
二、画频率分布直方图
例2 为了了解中学生身体发育情况,对某中学15岁的60名女生的身高(单位:cm)进行了测量,结果如下:
154 159 166 169 159 156 166 162 158 159
156 166 160 164 160 157 151 157 161 162
158 153 158 164 158 163 158 153 157 168
162 159 154 165 166 157 155 146 151 158
160 165 158 163 163 162 161 154 165 161
162 159 157 159 149 164 168 159 153 160
列出样本的频率分布表,绘出频率分布直方图.
解 第一步,求极差:上述60个数据中最大为169,最小为146.
故极差为169-146=23(cm).
第二步,确定组距和组数,可取组距为3 cm,
第三步,分组[145.5,148.5),[148.5,151.5),[151.5,154.5),[154.5,157.5),[157.5,160.5),[160.5,163.5),[163.5,166.5),[166.5,169.5].
第四步,列频率分布表:
分组 频数 频率
[145.5,148.5) 1 0.017
[148.5,151.5) 3 0.050
[151.5,154.5) 6 0.100
[154.5,157.5) 8 0.133
[157.5,160.5) 18 0.300
[160.5,163.5) 11 0.183
[163.5,166.5) 10 0.167
[166.5,169.5] 3 0.050
合计 60 1.000
第五步,根据上述数据绘制频率分布直方图:
反思感悟
(1)分点的决定方法:若数据为整数,则减去0.5作为分点数;若数据是小数点后一位的数,则减去0.05作为分点数;依次类推.
(2)画频率分布直方图中小矩形的高的方法:①小矩形的高= ;②假设频数为1的小矩形的高为h,则频数为k的小矩形的高为kh.
跟踪训练2 为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行了一次测量,所得数据整理后列出的频率分布表如下:
分组 频数 频率
[145.5,149.5) 1 0.02
[149.5,153.5) 4 0.08
[153.5,157.5) 20 0.40
[157.5,161.5) 15 0.30
[161.5,165.5) 8 0.16
[165.5,169.5] m n
合计 M N
(1)求出表中m,n,M,N所表示的数分别是多少;
∴m=2,M=1+4+20+15+8+2=50.
(2)画出频率分布直方图;
解 作出直角坐标系,组距为4,纵轴表示 ,横轴表示身高,画出频率分布直方图如图所示.
(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5 cm以上的频率.
解 由频率分布直方图可知,样本中身高在[153.5,157.5)范围内的人数最多,且身高在161.5 cm以上的频率为0.16+0.04=0.2,由此可估计全体女生中身高在[153.5,157.5)范围内的人数最多,九年级学生中女生的身高在161.5 cm以上的频率为0.2.
分组 频数 频率
[145.5,149.5) 1 0.02
[149.5,153.5) 4 0.08
[153.5,157.5) 20 0.40
[157.5,161.5) 15 0.30
[161.5,165.5) 8 0.16
[165.5,169.5] m n
合计 M N
三、频率分布直方图的应用
例3 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
解 频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的,
(2)若次数在110以上(含110次)为达标,则该校高一年级全体学生的达标率约是多少?
解 由直方图可估计该校高一年级全体学生的达标率约为 ×100%=88%.
反思感悟
(1)频率分布直方图的性质
①因为小矩形的面积=组距× =频率,所以各小矩形的面积表示相应各组
的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
②在频率分布直方图中,各小矩形的面积之和等于1.
③ =样本容量.
(2)频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.
跟踪训练3 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:
组号 分组 频数
1 [0,2) 6
2 [2,4) 8
3 [4,6) 17
4 [6,8) 22
5 [8,10) 25
6 [10,12) 12
7 [12,14) 6
8 [14,16) 2
9 [16,18] 2
合计 100
(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的比例;
解 根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),
组号 分组 频数
1 [0,2) 6
2 [2,4) 8
3 [4,6) 17
4 [6,8) 22
5 [8,10) 25
6 [10,12) 12
7 [12,14) 6
8 [14,16) 2
9 [16,18] 2
合计 100
所以样本中的学生一周课外阅读时间少于12小时的频率是1- =0.9.
故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的比例为0.9.
(2)求频率分布直方图中的a,b的值;
课外阅读时间落在[8,10)组内的有25人,频率为0.25,
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).
解 样本中的100名学生该周课外阅读时间的平均数在第4组.
3
随堂演练
PART THREE
1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确

解析 由用样本估计总体的性质可得.
1
2
3
4
5
2.一个容量为20的样本数据,分组与频数如下表:
1
2
3
4
5
则样本在[10,50)内的频率为
A.0.5 B.0.24
C.0.6 D.0.7
分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]
频数 2 3 4 5 4 2

解析 因为样本在[10,50)内的频数为2+3+4+5=14,样本容量为20,
3.某校为了了解高三学生的身体状况,抽取了100名女生的体重.将所得的数据整理后,画出了如图的频率分布直方图,则所抽取的女生中体重在40~45 kg的人数是
A.10 B.2 C.5 D.15

解析 由题图及频率= ×组距,知体重在40~45 kg的女生的频率=0.02×5=0.1.
∴女生中体重在40~45 kg的人数为0.1×100=10.
1
2
3
4
5
1
2
3
4
5
4.某地政府调查了工薪阶层1 000人的月工资,并根据调查结果画出如图所示的频率分布直方图,为了了解工薪阶层对月工资的满意程度,要用分层抽样的方法从调查的1 000人中抽出100人做电话询访,则月工资在区间[30,35)内的工薪阶层应抽出________人.
15
解析 月工资落在区间[30,35)内的频率为1-(0.02+0.04+0.05+0.05+0.01)×5=0.15,
所以月工资在区间[30,35)内的应抽出100×0.15=15(人).
5.为了解今年某校高三毕业班准备报考飞行员学生的体重(单位:千克)情况,将所得的数据整理后,画出了频率分布直方图,如图所示,已知图中从左到右的前三个小组的频率之比为1∶2∶3,其中第2小组的频数为12.则该校报考飞行员的总人数为_____.
48
解析 设报考飞行员的总人数为n,
设第一小组的频率为a,
则有a+2a+3a+(0.013+0.037)×5=1,
解得a=0.125,
所以第2小组的频率为0.25.
又第2小组的频数为12,
1
2
3
4
5
1.知识清单:
(1)频数与频率.
(2)频率分布表.
(3)频率分布直方图.
2.方法归纳:图表识别、数据分析.
3.常见误区:频率分布直方图中小矩形的高以及小矩形的面积代表的意义易错.
课堂小结
KE TANG XIAO JIE(共26张PPT)
9.1.2 分层随机抽样
9.1.3 获取数据的途径
第九章 9.1 随机抽样
学习目标
XUE XI MU BIAO
1.理解分层随机抽样的概念.
2.掌握用分层随机抽样从总体中抽取样本.
3.掌握两种抽样的区别与联系.
4.了解获取数据的一些基本途径.
NEI RONG SUO YIN
内容索引
知识梳理
题型探究
随堂演练
1
知识梳理
PART ONE
一般地,按 变量把总体划分成若干个 ,每个个体_________
一个子总体,在每个子总体中独立地进行 ,再把所有子总体中抽取的样本合在一起作为 ,这样的抽样方法称为分层随机抽样.
(1)每一个子总体称为层,在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为 .
知识点一 分层随机抽样
一个或多个
子总体
属于且仅
属于
简单随机抽样
总样本
比例分配
思考 分层随机抽样的总体具有什么特点?
答案 个体之间差异较大.
获取数据的基本途径有 、 、__________
、 等.
知识点二 获取数据的途径
通过调查获取数据
通过试验获取数据
通过观察
获取数据
通过查询获得数据
思考辨析 判断正误
SI KAO BIAN XI PAN DUAN ZHENG WU
1.简单随机抽样和分层随机抽样都是等可能抽样.(  )
2.分层随机抽样是按一定的比例从各层抽取个体组成样本的抽样.(  )
3.在分层随机抽样时,每层可以不等可能抽样.(  )
4.通过网络查询的数据是真实的数据.(  )

×
×

2
题型探究
PART TWO
例1 某中学有老年教师20人,中年教师65人,青年教师95人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是
A.抽签法 B.随机数法
C.分层随机抽样 D.其他抽样方法
一、对分层随机抽样的理解

解析 由于老年人、中年人和青年人的身体情况会有明显的差异,所以要用分层随机抽样.故选C.
反思感悟
使用分层随机抽样的前提
分层随机抽样的适用前提条件是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.
跟踪训练1 分层随机抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体被等可能抽取,必须进行
A.每层等可能抽样
B.每层可以不等可能抽样
C.所有层按同一抽样比等可能抽样
D.所有层抽取个体数量相同

解析 保证每个个体等可能的被抽取是两种基本抽样方式的共同特征,
为了保证这一点,分层随机抽样时必须在所有层都按同一抽样比等可能抽样.
二、分层随机抽样的应用
例2 某市的3个区共有高中学生20 000人,且3个区的高中学生人数之比为2∶3∶5,现要从所有学生中抽取一个容量为200的样本,调查该市高中学生的视力情况.(1)试写出抽样过程;
解 ①由于该市高中学生的视力有差异,按3个区分成三层,用分层随机抽样法抽取样本.
②确定每层抽取的个体数,在3个区分别抽取的学生人数之比也是2∶3∶5,
③在各层分别按简单随机抽样法抽取样本.
④综合每层抽样,组成容量为200的样本.
(2)若样本中3个区的高中学生的平均视力分别为4.8,4.8,4.6,试估计该市高中学生的平均视力.
所以估计该市高中学生的平均视力约为4.7.
反思感悟
在分层随机抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体容量之比.
跟踪训练2 一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?
解 用分层随机抽样来抽取样本,步骤如下:
(1)分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.
(3)在各层分别按随机数法抽取样本.
(4)汇总每层抽样,组成样本.
三 获取数据的途径
例3 为了缓解城市的交通拥堵情况,某市准备出台限制私家车的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果会怎样?
解 一个城市交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益.
为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.
调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.
因此,在调查时,要对生活在该城市的所有市民进行随机抽样调查,不要只关注到拥有私家车的市民.
反思感悟
在统计活动中,尤其是大型的统计活动,为避免一些外界因素的干扰,通常需要确定调查的对象、调查的方法和策略,需要精心设计前期的准备工作和收集数据的方法,然后对数据进行分析,得到统计推断.
跟踪训练3 为了创建“和谐平安”校园,某校决定在开学前将学校的电灯电路使用情况进行检查,以便排除安全隐患,该校应该怎样进行调查?
解 由于一个学校的电灯电路数目不算大,且对创建“和谐平安”校园来说,必须排除任一潜在或已存在的安全隐患,故必须用普查的方式.
3
随堂演练
PART THREE
1.某校高三年级有男生500人,女生400人,为了解该年级学生的体重状况,从男生中随机抽取25人,从女生中随机抽取20人进行调查.这种抽样方法是
A.分层随机抽样 B.抽签法
C.随机数法 D.其他随机抽样
解析 从男生500人中抽取25人,从女生400人中抽取20人,抽取的比例相同,因此用的是分层随机抽样.
1
2
3
4
5

2.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层随机抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n等于
A.9 B.10
C.12 D.13

1
2
3
4
5
1
2
3
4
5
3.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层随机抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为
A.6 B.8
C.10 D.12

1
2
3
4
5
4.为了了解某市2019年高考各高中学校本科上线人数,收集数据进行统计,其中获取数据的途径采用什么样的方法比较合适
A.通过调查获取数据
B.通过试验获取数据
C.通过观察获取数据
D.通过查询获取数据

1
2
3
4
5
5.某校高二年级化生史组合只有2个班,且每班50人,在一次数学测试中,从两个班抽取了20名学生的数学成绩进行分析,统计得在该次测试中,两班中各抽取的20名学生的平均成绩分别为110分和106分,则该组合学生的平均成绩约为_______分.
108
所以估计该组合学生的平均分约为108分.
1.知识清单:
(1)分层随机抽样.
(2)获取数据的途径.
2.方法归纳:数据分析.
3.常见误区:在分层随机抽样中,每个个体被抽到的可能性相等,与层数及分层无关,每一层的抽样一般采用简单随机抽样.
课堂小结
KE TANG XIAO JIE(共43张PPT)
9.1.1 简单随机抽样
预 学 案
一、全面调查与抽样调查
1.全面调查(普查):对________调查对象都进行调查的方法,称为全面调查,又称普查.
总体:调查对象的________.
个体:组成总体的________调查对象.
2.抽样调查:根据一定目的,从总体中抽取________个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法.
样本:从总体中抽取的________个体.
样本量:样本中包含的________.
每一个
全体
每一个
一部分
那部分
个体数
练习 某校期末考试后,为了分析该校高一年级1 000名学生的成绩,从中抽取了100名学生的成绩单进行调查.就这个问题来说,下面说法正确的是(  )
A.1 000名学生是总体 B.每名学生是个体
C.100名学生的成绩是一个个体 D.样本的容量是100
答案:D
解析:由随机抽样的基本概念可得,D正确.故选D.
二、简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n相等
相等
放回
练习 下列抽样方法是简单随机抽样的是(  )
A.从100个学生家长中一次性随机抽取10人做家访
B.从38本教辅参考资料中有放回地随机抽取3本作为教学参考
C.从偶数集中一次性抽取20个进行奇偶性分析
D.某参会人员从最后一排20个座位中随机选择一个坐下
答案:D
解析:A选项错在“一次性”抽取;B选项错在“有放回”抽取;C选项错在“一次性”“总体容量无限”.故正确选项为D.
三、简单随机抽样的方法
1.抽签法:先给总体中的N个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个________的盒里,充分搅拌.最后从盒中________地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体.
2.随机数法:先把总体中的个体编号,用随机数工具产生与总体中个体数量相等的整数随机数,把产生的随机数作为抽中的编号,并剔除重复的编号,直到抽足样本所需要的个体数.
不透明
不放回
练习 判断正误(正确的画“√”,错误的画“×”)
(1)在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取有关,第一次抽到的可能性最大.(  )
(2)抽签法中,先抽的人抽中的可能性大.(  )
(3)在使用随机数法时,各个个体的编号位数要相同.(  )
×
×

四、用样本的平均数估计总体的平均数
1.总体平均数:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称=___________________为总体均值,又称总体平均数.
2.样本平均数:如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称==为________,又称样本平均数.

样本均值
练习 某学校抽取100位老师的年龄,得到如下数据:
估计这个学校老师的平均年龄为________岁.
年龄(单位:岁) 32 34 38 40 42 43 45 46 48
频数 2 4 20 20 26 10 8 6 4
41
解析:=×(32×2+34×4+38×20+40×20+42×26+43×10+45×8+46×6+48×4)≈41(岁),即这个学校老师的平均年龄约为41岁.
微点拨
(1)全面调查的优点是精确,缺点是不易操作,需要耗费巨大的人力、物力.
(2)抽样调查的优点是花费少,效率高,易操作,缺点是不够精确.
(3)区别总体与个体,样本与样本容量.
微点拨
(1)简单随机抽样必须具备的几个特点:
①被抽取样本的总体中的个体数N是有限的.
②抽取的样本个体数n小于或等于总体中的个体数N.
③每个个体入样的可能性均为.
(2)除非特殊声明,本章所称的简单随机抽样指不放回简单随机抽样.
微点拨
(1)当总体个数较少时采用抽签法.(2)产生随机数的方式有多种:①用随机试验生成随机数;②用信息技术生成随机数:(ⅰ)用计算器生成随机数,(ⅱ)用电子表格软件生成随机数,(ⅲ)用R统计软件生成随机数.
(3)如果生成的随机数有重复,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的数量.
微点拨
(1)不同样本的平均数不同,即样本的平均数具有随机性;
(2)大部分样本平均数离总体平均数不远,在总体平均数附近波动;
(3)增加样本容量可以提高估计效果.
共 学 案
【学习目标】 (1)了解简单随机抽样的含义.(2)掌握两种简单随机抽样方法:抽签法和随机数法.(3)了解样本均值与总体均值的关系,会计算样本均值.
题型 1 全面调查与抽样调查
【问题探究1】 为了解我校高一学生的体重指数,对全校1 000名高一学生进行调查分析,测量其身高和体重,计算其体重指数.
(1)像这样,对每一名学生都进行调查的方法称为什么?
(2)全校1 000名高一学生和每一名学生分别称为什么?
(3)如果从全校1 000名高一学生中抽取200名进行身高和体重测量登记,计算其体重指数,并以此估计全校高一学生的体重指数,这种调查方法称为什么?
(4)在(3)中抽取的200名高一学生称为什么?数字200又是什么?
提示:(1)全面调查,又称普查.
(2)总体,个体.
(3)抽样调查.
(4)样本,样本量.
例1 一名交警在高速公路上随机观测6辆车的行驶速度,然后做了一份报告,调查结果如下:
(1)交警采取的是________调查方式.
(2)为了强调调查目的,这次调查的样本是______________,个体是________________.
车序号 1 2 3 4 5 6
速度/(km/h) 66 65 71 54 69 58
抽样
6辆车的行驶速度
每一辆车的行驶速度
解析:(1)交警采取的是抽样调查,调查对象的指标是车的行驶速度.
(2)这次调查的样本是6辆车的行驶速度,个体是每一辆车的行驶速度.
笔记:一般地,如果调查对象比较少,容易调查,则适合普查;如果调查对象较多或者具有破坏性,则适合抽样调查.
训练1 (多选)下列调查方式不合适的是(  )
A.为了了解某型号炮弹的杀伤力,采用普查的方式
B.为了了解全国中学生的睡眠状况,采用普查的方式
C.为了了解人们保护水资源的意识,采用抽查的方式
D.对“神舟十号”零部件的检查,采用抽查的方式
答案:ABD
解析:了解炮弹的杀伤力,采用普查方式就全销毁了,只能采用抽查方式;了解全国学生睡眠状况,采用普查方式费时费力,也是不必要的,应采用抽查方式;了解人们保护水资源的意识,采用普查方式费时费力,也是不必要的,应采用抽查方式;对于航天器零部件的检查,必须做到万无一失,应当采用普查的方式.故选ABD.
题型 2 简单随机抽样
【问题探究2】 假设口袋中有红球和白球共1 000个,除颜色外,小球的大小、质地完全相同.你能通过抽样调查的方法估计袋中红球所占的比例吗?
提示:我们可以从袋中随机地摸出一个球,记录颜色后放回,摇匀后再摸出一个球,如此重复,即可用红球出现的频率估计出红球的比例,也可以采用不放回地摸球去估计红球的比例.
例2 下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数个个体中抽取50个个体作为样本;
(2)质量监督部门从180种儿童玩具中选出18种玩具进行质量检验,在抽样过程中,从中任取一种玩具检验后再放回;
(3)国家跳水队挑出最优秀的10名跳水队员,备战2024年法国巴黎奥运会;
(4)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地逐个抽出7个号签.
解析:(1)不是简单随机抽样,因为简单随机抽样要求被抽取的样本总体的个数是有限的.
(2)不是简单随机抽样,因为简单随机抽样要求逐个不放回地抽取.
(3)不是简单随机抽样,因为这10名跳水队员是挑选出来的(最优秀的),每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能性”的要求.
(4)是简单随机抽样,因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.
笔记:判断一个抽样方法是否属于简单随机抽样,只需要对简单随机抽样的4个特征(有限性、逐一性、不放回性、等可能性)进行验证,若全部满足,则该抽样方法为简单随机抽样,若有其中一条不满足,则不是简单随机抽样.
训练2 下列问题中最适合用简单随机抽样方法的是(  )
A.某学校有学生1 320人,卫生部门为了了解学生身体发育情况,准备从中抽取一个容量为300的样本
B.为了准备省政协会议,某政协委员计划从1 135个村庄中抽取50个进行收入调查
C.从全班30名学生中,任意选取5名进行家访
D.为了解某地区癌症的发病情况,从该地区的5 000人中抽取200人进行统计
答案:C
解析:对于A,不同年级的学生身体发育情况差别较大,适合用分层抽样,A不是;对于B,总体容量较大,并且各村庄人口、地域、发展等方面的差异,不宜用简单随机抽样,B不是;对于C,总体容量较小,个体之间无明显差异,适宜用简单随机抽样;对于D,总体容量较大,不同年龄的人癌症的发病情况不同,不宜用简单随机抽样,D不是.故选C.
题型 3 简单随机抽样的方法
【问题探究3】 3月15日是国际消费者权益日,有人举报某个体经商户出售的某品牌的节能灯是假的,工商局的质检员对该个体经商户出售的某品牌的节能灯进行检测.
(1)上述检测用什么方法比较好?
(2)在上述的事例中,质检人员在对某个体经商户所销售的节能灯进行抽检和对生产厂家所生产的节能灯进行抽检采取的方式一样吗?
提示:(1)由于个体经商户购进的节能灯数量不会很多,可以采取抽签法抽取产品进行检测.
(2)不一样,个体经商户销售的节能灯数量较少,可用抽签法(抓阄法),而生产厂家生产的节能灯太多,可用计算机按生产批号进行抽取.
例3 某卫生单位为了支援抗震救灾,要在50名志愿者中选取10人组成医疗小组去参加救治工作,请分别用抽签法和随机数法设计抽样方案.
解析:抽签法:
第一步,将50名志愿者编号,号码为01,02,03,…,50.
第二步,将号码分别写在相同的纸条上,揉成团,制成号签.
第三步,将得到的号签放到一个不透明的盒子中,充分搅匀.
第四步,从盒子中依次不放回地取出10个号签,并记录上面的编号.
第五步,与所得号码对应的志愿者就是医疗小组成员.
随机数法:
(1)将50名志愿者编号,号码为01,02,03,…,50.
(2)准备10个大小,质地均匀的小球,小球上分别写上数字0,1,2,…,9.
(3)把小球放入一个不透明的容器中,搅拌均匀,从容器中有放回地抽取2次,并把第一次、第二次抽到的小球上的数字分别作为十位、个位数字,这样就生成了一个随机数,如果这个随机数在1~50范围内,就代表了对应编号的志愿者被抽中,否则舍弃编号.
(4)重复抽取随机数,直到抽中10名志愿者为止.
1.利用抽签法抽取样本的步骤
2.利用随机数法抽取样本的步骤
(1)编号:将每个个体编号,各号数的位数相同.
(2)选起始号码:任取某行、某组的某数为起始号码.
(3)确定读数方向:一般从左到右读取.
训练3 (1)下列抽样试验中,适合用抽签法的是(  )
A.从某厂生产的3 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3 000件产品中抽取10件进行质量检验
答案:B
解析:A中总体容量较大,样本量也较大,不适宜用抽签法;B中总体容量较小,样本量也较小,可用抽签法;C中甲、乙两厂生产的两箱产品有明显区别,不能用抽签法;D中虽然样本量较小,但总体容量较大,不适宜用抽签法.故选B.
(2)国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的未来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一名学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第三个号码为(  )
随机数表如下:
0154 3287 6595 4287 5346
7953 2586 5741 3369 8324
4597 7386 5244 3578 6241
A.13 B.24
C.33 D.36
答案:D
解析:根据随机数表的读取方法,第2行第4列的数为3,每次从左向右选取两个数字,所以第一组数字为32,作为第一个号码;第二组数字58,舍去;第三组数字65,舍去;第四组数字74,舍去;第五组数字13,作为第二个号码;第六组数字36,作为第三个号码,所以选取的第三个号码为36,故选D.
题型 4 用样本平均数估计总体平均数
【问题探究4】 在某地居民家庭年均收入调查中,小芳和小丽分别独立进行了简单随机抽样调查,小芳调查的样本平均数为4万,样本量为200;小丽调查的样本平均数为3.6万,样本量为500,你更愿意把哪个值作为总体平均数的估计?
提示:样本量越大,样本平均数就越接近总体的平均数,所以我们选用小丽调查的平均数作为总体的平均数.
例4 某工厂人员及工资构成如下:
(1)求该工厂所有人员的平均工资.
(2)工资的平均数能反映该厂的工资水平吗?为什么?
人员 经理 管理人员 高级技工 工人 学徒
月工资 10 000 5 000 4 000 3 000 2 000
人数 1 6 5 20 1
解析:(1)所有人员的平均工资=≈3 697.
(2)不能,因为大部分人员的工资不到平均工资,基本在平均工资以下.
笔记:(1)在简单随机抽样中,我们常用样本均值去估计总体均值;
(2)总体均值是一个确定的数,样本均值具有随机性;
(3)一般情况,样本容量越大,估计值越准确.
训练4 在某次测量中,甲工厂生产的某产品的A样本数据如下:43,50,45,55,60.若乙工厂生产的该产品的B样本数据恰好是由A样本数据中的每个数都增加5后得到的,则B样本的均值为________.据此,可以估计乙工厂生产的该产品的总体均值为________.
解析:B样本数据的均值为A样本数据的均值加上5;
即=+5,
=(43+50+45+55+60)+5=55.6,
所以B样本数据的均值为55.6,
用B样本数据的均值估计乙工厂生产的该产品的总体均值,所以乙工厂生产的该产品的总体均值为55.6.
55.6
55.6
随堂练习
1.以下问题不适合用全面调查的是(  )
A.调查某班学生每周课前预习的时间
B.调查某中学在职教师的身体健康状况
C.调查全国中小学生课外阅读情况
D.调查某校篮球队员的身高
答案:C
解析:由于C中全国中小学生人数众多,全面调查费时费力,不适合全面调查,但ABD中的某班学生、某中学在职教师、某校篮球队员人数不多可进行全面调查.故选C.
2.在简单随机抽样中,某一个个体被抽到的可能性(  )
A.与第几次抽样有关,第一次抽到的可能性大一些
B.与第几次抽样无关,每次抽到的可能性都相等
C.与第几次抽样有关,最后一次抽到的可能性要大些
D.与第几次抽样无关,每次都是等可能地抽取,但各次抽取的可能性不一定
答案:B
解析:在简单随机抽样中,每一个个体被抽到的可能性都相等,与第几次抽样无关,故A,C,D不正确,B正确.故选B.
3.某学校数学组要从11名数学老师中推选3名老师参加市里举办的教学能手比赛,制作了11个形状、大小相同的签,抽签中确保公平性的关键是(  )
A.制签 B.搅拌均匀
C.逐一抽取 D.抽取后不放回
答案:B
解析:确保公平性要保证每个签抽到是等概率的,因此抽签法要做到搅拌均匀,才具有公平性.故选B.
4.从一个篮球训练营中抽取10名学员进行投篮比赛,每人投10次,统计出该10名学员投篮投中的次数,4个投中5次,3个投中6次,2个投中7次,1个投中8次.试估计该训练营投篮投中的比例为________.
0.6
解析:10名学员投中的平均次数为=6,所以投中的比例约为=0.6.
课堂小结
1.全面调查和抽样调查.
2.简单随机抽样及其方法(抽签法、随机数法).
3.用样本平均数估计总体平均数.(共24张PPT)
第4课时 总体离散程度的估计
第九章 9.2 用样本估计总体
学习目标
XUE XI MU BIAO
1.理解方差、标准差的含义,会计算方差和标准差.
2.掌握求分层随机抽样总样本的平均数及方差的方法.
NEI RONG SUO YIN
内容索引
知识梳理
题型探究
随堂演练
1
知识梳理
PART ONE
1.假设一组数据为x1,x2,…xn,则这组数据的平均数 = ,方差
为s2= ,标准差s= .
2.如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为 ,则称S2
= 为总体方差,S= 为总体标准差.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,
其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2= .
知识点 方差、标准差
3.如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为 ,则称s2=
为样本方差,s= 为样本标准差.
4.标准差刻画了数据的 或 ,标准差 ,数据的离散程度越大;标准差 ,数据的离散程度越小.
思考 方差、标准差有什么区别?
答案 在刻画数据的分散程度上,方差和标准差是一样的,但解决实际问题中,一般多采用标准差.
离散程度
波动幅度
越大
越小
思考辨析 判断正误
SI KAO BIAN XI PAN DUAN ZHENG WU
1.数据的极差越小,样本数据分布越集中、稳定.(  )
2.数据的方差越大,样本数据分布越集中、稳定.(  )
3.数据的标准差越小,数据分布越集中、波动幅度越小.(  )
4.在实际问题中要做出有效决策时,主要参照样本数据的平均数和标准差或方差.
(  )

×


2
题型探究
PART TWO
例1 某班20位女同学平均分为甲、乙两组,她们的劳动技术课考试成绩如下(单位:分):
甲组 60,90,85,75,65,70,80,90,95,80;
乙组 85,95,75,70,85,80,85,65,90,85.
(1)试分别计算两组数据的极差、方差和标准差;
一、方差、标准差的计算与应用
解 甲组:最高分为95分,最低分为60分,极差为95-60=35(分),
乙组:最高分为95分,最低分为65分,极差为95-65=30(分),
(2)哪一组的成绩较稳定?
解 由于乙组的方差(标准差)小于甲组的方差(标准差),
因此乙组的成绩较稳定.
从(1)中得到的极差也可看出乙组的成绩比较稳定.
反思感悟
在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度.在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中、越稳定.
跟踪训练1 从甲、乙两种玉米苗中各抽取10株,分别测得它们的株高如下(单位:cm):
甲 25 41 40 37 22 14 19 39 21 42
乙 27 16 44 27 44 16 40 40 16 40
求:(1)哪种玉米苗长得高?
(2)哪种玉米苗长得齐?
二、分层随机抽样的方差
例2 甲、乙两支田径队体检结果为:甲队的体重的平均数为60 kg,方差为200,乙队体重的平均数为70 kg,方差为300,又已知甲、乙两队的队员人数之比为1∶4,那么甲、乙两队全部队员的平均体重和方差分别是什么?
反思感悟
分层随机抽样的方差
跟踪训练2 某培训机构在假期招收了A,B两个数学补习班,A班10人,B班30人,经过一周的补习后进行了一次测试,在该测试中,A班的平均成绩为130分,方差为115,B班的平均成绩为110分,方差为215.求在这次测试中全体学生的平均成绩和方差.
∴全体学生的平均成绩为115分.
=85+180=265.
3
随堂演练
PART THREE
1.下列数字特征不能反映样本数据的分散程度、波动情况的是
A.极差 B.平均数
C.方差 D.标准差

1
2
3
4
5
2.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为
1
2
3
4
5

3.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为
分数 5 4 3 2 1
人数 20 10 30 30 10

1
2
3
4
5
1
2
3
4
5
4.已知甲、乙两地人口之比为2∶3,其中甲地人均年收入为8万元,乙地人均年收入为10万元,则甲乙两地的人均年收入为______万元.
9.2
5.现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的标准差是____.
1
2
3
4
5
2
1.知识清单:
(1)方差、极差的计算与应用.
(2)分层随机抽样的方差.
2.方法归纳:数据统计、数据分析.
课堂小结
KE TANG XIAO JIE(共31张PPT)
9.1.1 简单随机抽样
第九章 9.1 随机抽样
学习目标
XUE XI MU BIAO
1.了解随机抽样的必要性和重要性.
2.理解随机抽样的目的和基本要求.
3.理解简单随机抽样中的抽签法、随机数法.
4.掌握用样本的平均数估计总体的平均数.
NEI RONG SUO YIN
内容索引
知识梳理
题型探究
随堂演练
1
知识梳理
PART ONE
1.全面调查(普查):对 调查对象都进行调查的方法,称为全面调查,又称普查.
总体:调查对象的 .
个体:组成总体的 调查对象.
2.抽样调查:根据一定目的,从总体中抽取 个体进行调查,并以此为依据对总体的情况作出 和 的调查方法.
样本:从总体中抽取的 个体.
样本量:样本中包含的 .
知识点一 全面调查(普查)、抽样调查
每一个
全体
每一个
一部分
估计
推断
那部分
个体数
1.定义:一般地,设一个总体含有N(N为正整数)个个体,从中 n(1≤n的,且每次抽取时总体内 样本的各个个体被抽到的概率都 ,我们把这样的抽样方法叫做不放回简单随机抽样. 简单随机抽样和________
简单随机抽样统称为简单随机抽样,通过简单随机抽样获得的样本称为____________
.
2.方法:抽签法和随机数法.
知识点二 简单随机抽样
逐个抽取
样本
放回
各个个体
相等
不放回
未进入
相等
放回
不放回
简单随机
样本
1.抽签法:把总体中的N个个体 ,把所有 写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为 ,将号签放在一个不透明容器中,______
后,每次从中不放回地抽取一个号签,连续抽取n次,使与号签上的编号对应的个体进入样本,就得到一个容量为n的样本.
2.随机数法
(1)用随机试验生成随机数
(2)用信息技术生成随机数:①用 生成随机数;②用 软件生成随机数;③用 软件生成随机数.
知识点三 抽签法、随机数法
编号
编号
号签
充分
搅拌
计算器
电子表格
R统计
知识点四 用样本平均数估计总体平均数
思考辨析 判断正误
SI KAO BIAN XI PAN DUAN ZHENG WU
1.简单随机抽样包括有放回的抽样和不放回的抽样.(  )
2.简单随机抽样中每个个体被抽到的机会相等.(  )
3.某班有40名学生,指定个子最高的5名同学参加学校组织的篮球赛,是简单随机抽样.(  )
4.从高一(1)班抽取10人,若这10人的平均视力为4.8,则该班所有学生的平均视力一定是4.8.(  )

×
×

2
题型探究
PART TWO
例1 (1)(多选)下列4个抽样中,为简单随机抽样的是
A.从无数个个体中抽取50个个体作为样本
B.仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查
C.一彩民选号,从装有36个大小、形状都相同的号签的盒子中不放回地逐个抽出
6个号签
D.箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中
任意取出1个零件进行质量检验后,再把它放回箱子里
一、简单随机抽样的理解


解析 根据简单随机抽样的特点逐个判断.
A项不是简单随机抽样.因为简单随机抽样要求被抽取的样本总体的个数是有限的.
B项不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.
C项是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.
D项是放回简单随机抽样.综上,只有CD是简单随机抽样.
(2)在简单随机抽样中,某一个个体被抽到的可能性
A.与第几次抽样有关,第一次抽到的可能性大一些
B.与第几次抽样无关,每次抽到的可能性都相等
C.与第几次抽样有关,最后一次抽到的可能性要大些
D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不一定

解析 在简单随机抽样中,每一个个体被抽到的可能性都相等,与第几次抽样无关,故A,C,D不正确,B正确.
反思感悟
简单随机抽样必须具备下列特点
(1)被抽取样本的总体中的个体数N是有限的.
(2)抽取的样本是从总体中逐个抽取的.
(3)简单随机抽样是一种等可能的抽样.
如果3个特征有一个不满足,就不是简单随机抽样.
跟踪训练1 (1)从某年级的500名学生中抽取60名学生进行体重的统计分析,下列说法正确的是
A.500名学生是总体
B.每个学生是个体
C.抽取的60名学生的体重是一个样本
D.抽取的60名学生的体重是样本量

解析 由题意可知在此简单随机抽样中,总体是500名学生的体重,A错;
个体是每个学生的体重,B错;
样本量为60,D错.
(2)从总体容量为N的一批零件中,通过简单随机抽样抽取一个容量为30的样本,若每个零件被抽到的可能性为0.25,则N的值为
A.120 B.200
C.150 D.100

解析 因为从含有N个个体的总体中通过简单随机抽样抽取一个容量为30的样本时,
二、抽签法和随机数法
例2 某卫生单位为了支援抗震救灾,要在50名志愿者中选取10人组成医疗小组去参加救治工作,请分别用抽签法和随机数法设计抽样方案.
解 抽签法:
第一步,将50名志愿者编号,号码为01,02,03,…,50.
第二步,将号码分别写在相同的纸条上,揉成团,制成号签.
第三步,将得到的号签放到一个不透明的盒子中,充分搅匀.
第四步,从盒子中依次不放回地取出10个号签,并记录上面的编号.
第五步,与所得号码对应的志愿者就是医疗小组成员.
随机数法:
(1)将50名志愿者编号,号码为01,02,03,…,50.
(2)准备10个大小,质地均匀的小球,小球上分别写上数字0,1,2,…,9.
(3)把小球放入一个不透明的容器中,搅拌均匀,从容器中有放回地抽取2次,并把第一次、第二次抽到的小球上的数字分别作为十位、个位数字,这样就生成了一个随机数,如果这个随机数在1~50范围内,就代表了对应编号的志愿者被抽中,否则舍弃编号.
(4)重复抽取随机数,直到抽中10名志愿者为止.
反思感悟
(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.一般地,当样本容量和总体容量较小时,可用抽签法.
(2)当总体容量较大、样本容量不大时,用随机数法抽取样本较好.
跟踪训练2 (1)抽签法确保样本具有代表性的关键是
A.制签 B.搅拌均匀
C.逐一抽取 D.抽取不放回

解析 若样本具有很好的代表性,则每一个个体被抽取的机会相等,故需要对号签搅拌均匀.
(2)使用简单随机抽样从1 000件产品中抽出50件进行某项检查,合适的抽样方法是
A.抽签法 B.随机数法
C.随机抽样法 D.以上都不对

解析 由于总体相对较大,样本量较小,故采用随机数法较为合适.
三、用样本的平均数估计总体的平均数
例3 为了调查某校高一学生每天午餐消费情况,从该校高一学生中抽查了20名学生,通过调查这20名学生每天午餐消费数据如下(单位:元)
8 10 6 6 8 12 15 6 8 6 10 8 8 15 6 8 10 8 8 10
试估计该校高一学生每天午餐的平均费用,以及午餐费用不低于10元的比例.
所以估计该校高一全体学生每天午餐的平均费用为8.8元.
在全体学生中,午餐费用不低于10元的比例约为0.35.
反思感悟
当总体容量很大时,一般用样本的平均数估计总体的平均数,用样本中某类个体所占的比例估计该类个体在总体中所占的比例.
跟踪训练3 为了了解某校高三学生每天的作业量,通过简单随机抽样从该校高三学生中抽取了60名学生,通过调查发现这60名学生每天完成作业平均用时2小时,则可以推测该校高三学生每天完成作业所需时间的平均数
A.一定为2小时 B.高于2小时
C.低于2小时 D.约为2小时

3
随堂演练
PART THREE
1.(多选)下列抽查,适合抽样调查的是
A.调查黄河的水质情况
B.调查某化工厂周围5个村庄是否受到污染
C.调查某药品生产厂家一批药品的质量情况
D.进行某一项民意测验

解析 A项因为无法对所有的黄河水质进行全面调查,所以只能采取抽样调查的方式;
B项适合全面调查;
C项对药品的质量检验具有破坏性,所以只能采取抽样调查;
D项由于民意测验的特殊性,不可能也没必要对所有的人都进行调查,因此也是采用抽样调查的方式.
1
2
3
4
5


2.下列抽样方法是简单随机抽样的是
A.从平面直角坐标系中抽取5个点作为样本
B.某饮料公司从仓库中的1 000箱饮料中一次性抽取20箱进行质量检查
C.某连队从200名战士中,挑选出50名最优秀的战士去参加抢险救灾活动
D.从10个手机中逐个不放回地随机抽取2个进行质量检验(假设10个手机已编好号,
对编号随机抽取)

1
2
3
4
5
解析 选项A中,平面直角坐标系中有无数个点,这与要求总体中的个体数有限不相符,故错误;
选项B中,一次性抽取不符合简单随机抽样逐个抽取的特点,故错误;
选项C中,50名战士是最优秀的,不符合简单随机抽样的等可能性,故错误.
1
2
3
4
5
3.下列抽样试验中,适合用抽签法的是
A.从某厂生产的3 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3 000件产品中抽取10件进行质量检验

解析 个体数和样本容量较小时适合用抽签法,排除A,D;
C中甲、乙两厂生产的两箱产品质量可能差别较大,也不适用,故选B.
1
2
3
4
5
4.一个总体中含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的
样本,则指定的某个个体被抽到的可能性为_____.
解析 因为是简单随机抽样,
故每个个体被抽到的机会相等,
所以指定的某个个体被抽到的可能性为 .
1
2
3
4
5
5.从一个篮球训练营中抽取10名学员进行投篮比赛,每人投10次,统计出该10名学员投篮投中的次数,4个投中5次,3个投中6次,2个投中7次,1个投中8次.试估计该训练营投篮投中的比例为______.
0.6
1.知识清单:
(1)简单随机抽样.
(2)抽签法,随机数法.
(3)用样本平均数估计总体平均数.
2.方法归纳:数据分析.
3.常见误区:在简单随机抽样中,每个个体被抽取的可能性是相等的.
课堂小结
KE TANG XIAO JIE(共32张PPT)
9.1.2~9.1.3 分层随机抽样 获取数据的途径
预 学 案
一、分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行___________,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为______________.每一个子总体称为________,在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为________.
简单随机抽样
分层随机抽样

比例分配
练习 判断正误(正确的画“√”,错误的画“×”)
(1)简单随机抽样和分层随机抽样都是等可能抽样.(  )
(2)分层随机抽样是按一定的比例从各层抽取个体组成样本的抽样.(  )
(3)在分层随机抽样时,每层可以不等可能抽样.(  )


×
二、用分层随机抽样的平均数估计总体的平均数
如果总体分为两层,两层包含的个体数分别为M,N,两层抽取的样本量分别为m,n,两层的样本平均数分别为,两层的总体平均数分别为,总体平均数为,样本平均数为.
则=______+______.
=______+______.
练习 某校高二年级化生史组合只有2个班,且每班50人,在一次数学测试中,从两个班各抽取了20名学生的数学成绩进行分析,统计得,在该次测试中,两班中各抽取的20名学生的平均成绩分别为110分和106分,则该组合学生的平均成绩约为________分.
108
解析:根据题意知,样本容量为40,则这40名学生的平均成绩为×110+×106=108分,所以该组合学生的平均成绩约为108分.
三、获取数据的途径
获取数据的基本途径有__________________、__________________、__________________、__________________等.
通过调查获取数据
通过试验获取数据
通过观察获取数据
通过查询获得数据
练习 “中国天眼”为500米口径球面射电望远镜,是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是(  )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
答案:C
解析:“中国天眼”主要是通过观察获取数据.故选C.
微点拨
(1)分层随机抽样分层的原则是每层内样本的差异要尽可能小,而层与层之间的差异要尽可能大.
(2)根据实际情况,可对每层所抽取的数目进行适当的调整.比如,如果计算出的层内抽样数不是整数,可以进行一定的技术处理,将结果取成整数等.
微点拨
设有N个个体的总体可划分成n个有明显差异的部分,抽取的样本中不同层的平均数分别为,对应各层的样本数分别为f1,f2,…,fn,则样本平均数为=
微点拨
在应用四种途径获取数据时,要清楚数据的类型,选择适当的获取途径.
共 学 案
【学习目标】 (1)理解并掌握分层随机抽样,会用分层随机抽样从总体中抽取样本.(2)利用分层随机抽样的方法解决实际问题.(3)了解获取数据的途径,并学会简单应用.
题型 1 分层随机抽样
【问题探究1】 某市为调查中小学生的近视情况,在全市范围内分别对小学生、初中生、高中生三个群体抽样,进而了解中小学生的总体情况和三个群体近视情况的差异大小.
(1)上述问题中样本总体有什么特征?
(2)若采用抽签法会出现什么结果?
(3)为使抽取的样本更合理,更有代表性,有更好的抽样方法解决该问题吗?
提示:(1)此总体,小学生、初中生、高中生三个群体在年龄、体质等方面存在着明显的差异.
(2)抽取的样本可能集中于某一个群体,不具有代表性.
(3)有,可分不同的群体抽取.
例1 某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人.教育部门为了了解在职人员对学校机构改革的意见,要从中抽取一个容量为20的样本,请利用分层随机抽样的方法抽取,写出抽样过程.
解析:抽样过程如下:
第一步,确定抽样比,样本容量与总体容量的比为=.
第二步,确定分别从三类人员中抽取的人数,从行政人员中抽取16×=2(人);从教师中抽取112×=14(人);从后勤人员中抽取32×=4(人).
第三步,采用简单随机抽样的方法,抽取行政人员2人,教师14人,后勤人员4人.
第四步,把抽取的个体组合在一起构成所需样本.
分层随机抽样的步骤
训练1 (1)下列问题中,最适合用分层随机抽样抽取样本的是(  )
A.从10名同学中抽取3人参加座谈会
B.某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本
C.从1 000名工人中,抽取100名调查上班途中所用时间
D.从生产流水线上,抽取样本检查产品质量
答案:B
解析:A中总体个体无明显差异且个数较少,适合用简单随机抽样;C和D中总体个体无明显差异且个数较多,不适合用分层随机抽样;B中总体个体差异明显,适合用分层随机抽样.故选B.
(2)在中国共产主义青年团建团100周年之际,某高中学校计划选派60名团员参加“文明劝导”志愿活动,高一、高二、高三年级的团员人数分别为100,200,300,若按分层抽样的方法选派,则高一年级需要选派的人数为________.
10
解析:依题意可知高一年级需要选派的人数为×60=10人.
题型 2 用分层抽样的样本平均数估计总体平均数
【问题探究2】 在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n.我们用X1,X2,…,XM表示第1层各个个体的变量值,用x1,x2,…,xm表示第1层样本的各个个体的变量值;用Y1,Y2,…,YN表示第2层各个个体的变量值,用y1,y2,…,yn表示第2层样本的各个个体的变量值.则第1层的总体平均数和样本平均数和第2层的总体平均数和样本平均数,该如何计算?
提示:==
==
==
==
例2 某地区有居民600户,其中普通家庭450户、高收入家庭150户.为了调查该地区居民奶制品月消费支出,决定采用分层随机抽样的方法,按普通家庭、高收入家庭进行分层,得到普通家庭、高收入家庭的奶制品平均月消费支出分别为40元和90元.
(1)如果在各层中按比例分配样本,总样本量为60,那么在普通家庭、高收入家庭中分别抽取了多少户?在这种情况下,请估计该地区全体居民奶制品的平均月消费支出.

解析:设在普通家庭、高收入家庭中分别抽取了m,n户,则==,解得m=45,n=15.
样本平均数=×40+×90=52.5(元).
在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数,即在普通家庭、高收入家庭中分别抽取了45户、15户,估计该地区全体居民奶制品的平均月消费支出为52.5元.
(2)如果从普通家庭、高收入家庭中抽取的样本量分别为30和30,那么在这种情况下,抽取的这60户居民奶制品的平均月消费支出是多少?用这60户居民奶制品的平均月消费支出估计该地区全体居民奶制品的平均月消费支出合理吗?如果不合理,那该怎样估计较合理?
解析:抽取的这60户居民奶制品的平均月消费支出是×40+×90=65(元).
因为在该地区居民中,普通家庭户数是高收入家庭户数的3倍,而抽取的普通家庭的样本量与高收入家庭的样本量相等,所以用这60户居民奶制品的平均月消费支出估计该地区全体居民奶制品的平均月消费支出不合理.应该用抽取的普通家庭奶制品的平均月消费支出40元估计该地区全体普通家庭奶制品的平均月消费支出,用抽取的高收入家庭奶制品的平均月消费支出90元估计该地区全体高收入家庭奶制品的平均月消费支出,得到该地区全体居民奶制品的平均月消费支出为×40+×90=52.5(元).
这样估计较合理.
笔记:(1)在比例分配的分层随机抽样中,我们可以直接用样本平均数=估计总体平均数.
(2)在非比例分配的分层随机抽样中,如果层数分为2层,由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此我们用估计总体平均数.
训练2 某校高二有重点班学生400人,普通班学生800人,为调查总体学生数学成绩的平均值,按比例分配进行分层抽样,从重点班抽出20人,从普通班抽出40人,通过计算重点班平均成绩125分,普通班平均成绩95分,则高二总体数学成绩平均值为(  )
A.110 B.125
C.95 D.105
答案:D
解析:总体数学成绩平均值为=105.
题型 3 获取数据的途径
【问题探究3】 我们日常中有哪些获取数据的方法和途径呢?
提示:通过调查获取数据、通过试验获取数据、通过观察获取数据、通过查询获得数据等.
例3 粮食安全是每一个国家必须高度关注的问题,在现有条件下,降雨量对粮食生产的影响是非常大的,某次降雨之后该地气象台播报说本次降雨量是该地有气象记录以来最大的一次,气象台获取这些数据的途径是(  )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
答案:C
解析:该地的气象记录和本次降雨量数据都是通过观察获取数据的.
笔记:选择获取数据的途径主要是根据所要研究问题的类型,以及获取数据的难易程度.有的数据可以有多种获取途径,有的数据只能通过一种途径获取,选择合适的方法和途径能够更好地提高数据的可靠性.
训练3 为了研究近年我国高等教育发展状况,小明需要获取近年来我国大学生入学人数的相关数据,他获取这些数据的途径最好是(  )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
答案:D
解析:因为近年来我国大学生入学人数的相关数据有所存储,所以小明获取这些数据的途径最好是通过查询获得数据.
随堂练习
1.若要研究某城市家庭的收入情况,获取数据的途径应该是(  )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
答案:A
解析:因为要研究的是某城市家庭的收入情况,所以通过调查获取数据.
2.某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适(  )
A.抽签法 B.随机数法
C.简单随机抽样法 D.分层随机抽样法
答案:D
解析:总体由差异明显的三部分构成,应选用分层随机抽样法.
3.某林场有树苗30 000棵,其中松树苗4 000棵.为调查树苗的生长情况,采用分层随机抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为(  )
A.30   B.25   
C.20 D.15
答案:C
解析:样本中松树苗为4 000×=4 000×=20(棵).
4.分层随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为________.
6
解析:=×3+×8=6.
课堂小结
1.分层随机抽样及其应用.
2.用分层随机抽样的样本平均数估计总体平均数.
3.获取数据的途径.(共32张PPT)
第2课时 总体取值规律的估计、
总体百分位数的估计
第九章 9.2 用样本估计总体
学习目标
XUE XI MU BIAO
1.掌握从常见统计图表中获取有用的信息,体会统计数学在实际生活中的
应用.
2.通过实例,理解百分位数的含义.
NEI RONG SUO YIN
内容索引
知识梳理
题型探究
随堂演练
1
知识梳理
PART ONE
扇形图主要用于直观描述各类数据占总数的 ,条形图和直方图主要用于直观描述不同类别或分组数据的 和 ,条形图适用于描述 数据,直方图适用于描述 数据.折线图主要用于描述数据随 的变化趋势.
知识点一 常见统计图表的特点与区别
比例
频数
频率
离散型
连续型
时间
1.百分位数定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据 这个值,且至少有 的数据 这个值.
2.常用的百分位数
(1)四分位数: , , .
(2)其它常用的百分位数:第1百分位数, ,第95百分位数, .
3.计算一组n个数据的第p百分位数的一般步骤如下:
第1步,按 排列原始数据;
第2步,计算i= ;
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为 ;若i是整数,则第p百分位数为第i项与第 项数据的 .
知识点二 百分位数
小于或等于
(100-p)%
大于或等于
第25百分位数
第50百分位数
第75百分位数
第5百分位数
第99百分位数
从小到大
n×p%
第j项数据
(i+1)
平均数
思考辨析 判断正误
SI KAO BIAN XI PAN DUAN ZHENG WU
1.为了更清楚地反映学生在这学期多次考试中数学成绩情况,可以选用折线统计图
(  )
2.50%分位数就是中位数.(  )
3.100个数据的80%分位数是85,那么这100个数据中一定有80个数小于或等于85.
(  )

×

2
题型探究
PART TWO
例1 (1)(多选)下列说法中,正确的是
A.可以很清楚地表示出各部分同总体之间关系的统计图是条形统计图
B.能清楚地反映出数量增减变化的统计图是折线统计图
C.为了清楚地知道你的各科成绩,你可以选择制作条形统计图
D.为了清楚地反映出全校人数同各年级人数之间的关系,应选择扇形统计图
一、几种常见统计图表的特点



(2)给出如图所示的三幅统计图及四个命题:
①从折线统计图能看出世界人口的变化情况;
②2050年非洲人口将达到大约15亿;
③2050年亚洲人口比其他各洲人口的总和还要多;
④从1957年到2050年各洲中北美洲人口增长速度最慢.
其中命题正确的有
A.①② B.①③ C.①④ D.②④

解析 ①从折线统计图能看出世界人口的变化情况,故①正确;
②从条形统计图中可得:2050年非洲人口大约将达到18亿,故②错误;
③从扇形统计图中能够明显地得到结论:2050年亚洲人口比其他各洲人口的总和还要多,故③正确;
④由题中三幅统计图并不能得出从1957年到2050年中哪个洲人口增长速度最慢,故④错误.
因此正确的命题有①③.故选B.
反思感悟
扇形图、条形图、折线图的特点
(1)扇形图用扇形的面积表示部分在总体中所占百分比,易于显示每组数据相对于总数的大小.
(2)条形图能够显示每组中的具体数据,易于比较数据之间的差别.
(3)折线图易于显示数据的变化趋势.
跟踪训练1 (1)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)的柱形图.以下结论不正确的是
A.逐年比较,2008年减少二氧化硫排放量的效果最显著
B.2007年我国治理二氧化硫排放显现成效
C.2006年以来我国二氧化硫年排放量呈减少趋势
D.2006年以来我国二氧化硫年排放量呈增加趋势

解析 从2006年,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A选项正确;
2007年二氧化硫排放量较2006年降低了很多,B选项正确;
虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,C选项正确,D选项错误,故选D.
(2)下面的统计图反映了我国与“一带一路”沿线部分地区的贸易情况,2011~2016年我国与东南亚地区和东欧地区的贸易额统计图如图所示
(以上数据摘自《“一带一路”贸易合作大数据报告(2017)》).
根据统计图提供的信息,下列推断不合理的是
A.与2015年相比,2016年我国与东欧地区的贸易额有所增长
B.2011~2016年,我国与东南亚地区的贸易额逐年增长
C.2011~2016年,我国与东南亚地区的贸易额的平均值超过4 200亿美元
D.2016年我国与东南亚地区的贸易额比我国与东欧地区的贸易额的3倍还多

二、几种常见的统计图表的应用
例2 为了解某地区机动车拥有量对道路通行的影响,学校九年级社会实践小组对2012年~2019年机动车拥有量、车辆经过人民路路口和学校门口的堵车次数进行调查统计,并绘制成如图统计图:
根据统计图,回答下列问题:
(1)写出2018年机动车的拥有量,分别计算2012年~2019年在人民路路口和学校门口堵车次数的平均数;
解 2018年机动车的拥有量为3.4万辆.
人民路路口的堵车次数平均数为(54+82+86+98+124+156+196+164)÷8=120(次),
学校门口的堵车次数平均数为(65+85+121+144+128+108+77+72)÷8=100(次)
(2)根据统计数据,结合生活实际,对机动车拥有量与人民路路口和学校门口堵车次数,说说你的看法.
解 答案不唯一,如:2012年~2015年,随着机动车拥有量的增加,对道路的影响加大,年堵车次数也增加;尽管2019年机动车拥有量比2018年增加,由于进行了交通综合治理,人民路路口堵车次数反而降低明显.
反思感悟
利用统计图表解决实际生活中的问题,要认真观察、分析、研究统计图表,结合统计图表的各自特点,充分利用统计思想、数形结合的思想解决问题.
跟踪训练2 如图所示的是某粮店的大米、面粉、小米、玉米面的销售情况统计图,观察图形,你能从中得到哪些信息?如果你是这家粮店的老板,你会怎么做?
解 由扇形图可知
(1)面粉的销售量最大,需多进货;
(2)小米的销售量最小,需少进货;
(3)大米的销售量仅次于面粉的销售量,也应多进货.
三、百分位数
例3 从某公司生产的产品中,任意抽取12件,得到它们的质量(单位:kg)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0,
分别求出这组数据的25%,75%,95%分位数.
解 将所有数据从小到大排列,
得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,
所以12×25%=3,12×75%=9,12×95%=11.4,
95%分位数是第12个数据为9.9.
反思感悟
计算一组n个数据的第p百分位数的一般步骤:
第1步:按照从小到大排列原始数据;
第2步:计算i=n×p%;
第3步:若i不是整数,大于i的比邻整数为j,则第p百分位数为第j项数据,若i是整数,则第p百分位数为第i项和第(i+1)项数据的平均数.
跟踪训练3 某歌手电视大奖赛中,七位评委对某选手打出如下分数:7.9,8.1,8.4,8.5,
8.5,8.7,9.9,则其50%分位数为______.
8.5
解析 ∵7×50%=3.5,
∴其50%分位数是第4个数据为8.5.
3
随堂演练
PART THREE
1.需要清楚地表示每个项目的具体数目应选择
A.折线统计图
B.扇形统计图
C.条形统计图
D.以上三者均可以

1
2
3
4
5
2.下列关于50%分位数的说法正确的是
A.50%分位数不是中位数
B.总体数据中的任意一个数小于它的可能性一定是50%
C.它是四分位数
D.它只适用于总体是离散型的数据
1
2
3
4
5

解析 由百分位数的意义可知选项A,B,D错误.
3.二十四节气是中国劳动人民长期经验积累的结晶,它与白昼时长密切相关.当春分、秋分时,昼夜时长大致相等;当夏至时,白昼时长最长.根据右图,在下列选项中白昼时长低于11小时的节气是
A.惊蛰 B.小满
C.立秋 D.大寒
1
2
3
4
5

解析 本题考查统计图,根据统计图易得大寒节气的白昼时长低于11小时,故选D.
1
2
3
4
5
4.下列一组数据的25%分位数是
2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6
A.3.2 B.3.0
C.4.4 D.2.5

解析 把该组数据按照由小到大排列,
可得2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,
由i=10×25%=2.5,不是整数,
则第3个数据3.2是25%分位数.
5.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现在用分层随机抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为______;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为______小时.
1
2
3
4
5
50
1 015
解析 由分层随机抽样可知,第一分厂应抽取100×50%=50(件).
由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命为1 020×50%+980×20%+1 030×30%=1 015(小时).
1.知识清单:
(1)几种常见的统计图表.
(2)百分位数.
2.方法归纳:数据分析、数形结合.
3.常见误区:求第p百分位数时,应先将数据从小到大排列.
课堂小结
KE TANG XIAO JIE