新人教A版必修第二册2024春高中数学第9章统计9.2用样本估计总体 课件(4份打包)

文档属性

名称 新人教A版必修第二册2024春高中数学第9章统计9.2用样本估计总体 课件(4份打包)
格式 zip
文件大小 4.0MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2024-03-12 23:28:03

文档简介

(共37张PPT)
第九章 统计
9.2 用样本估计总体
9.2.1 总体取值规律的估计
学习任务 1.理解并掌握统计图表的画法及应用.(直观想象)
2.结合实例,能用样本估计总体的取值规律.(数据分析)
必备知识·情境导学探新知
01
情境1 某工厂生产一批产品,经调查只有10个不合格品.
情境2 某工厂生产一批产品,经调查产品不合格率为1%.
上面哪一种情境能更好地反映工厂的生产情况?
知识点1 频率分布直方图
画频率分布直方图的步骤
(1)求极差:极差为一组数据中______与______的差.
(2)决定组距与组数:当样本容量不超过100时,常分成_____组,为了方便起见,一般取等长组距,并且组距应力求“取整”.
(3)将数据分组.
最大值
最小值
5~12
(4)列频率分布表:一般分四列:分组、________、频数、____.其中频数合计应是样本容量,频率合计是_.
(5)画频率分布直方图:横轴表示分组,纵轴表示.小长方形
的面积=组距×=____.各小长方形的面积总和等于1.
频数累计
频率
1
频率
知识点2 其他统计图表
统计图表 主要应用
扇形图 直观描述各类数据占总数的比例
条形图和直方图 直观描述不同类别或分组数据的频数和频率
折线图 描述数据随时间的变化趋势
1.如图所示是一个容量为1 000的样本频率分布直方图.
(1)样本数据落在范围[5,9)的频率为________;
(2)样本数据落在范围[9,13)的频数为________.
0.32
360
2.下列四个图中,用来表示不同品种的奶牛的平均产奶量最为合适的是________.(填序号)

关键能力·合作探究释疑难
02
类型1 频率分布直方图的画法
类型2 频率分布直方图的应用
类型3 其他统计图表
类型1 频率分布直方图的画法
【例1】 为了了解中学生身体发育情况,对某中学15岁的60名女生的身高(单位:cm)进行了测量,结果如下:
154 159 166 169 159 156 166
162 158 159 156 166 160 164
160 157 151 157 161 162 158
153 158 164 158 163 158 153
157 168 162 159 154 165 166
157 155 146 151 158 160 165
158 163 163 162 161 154 165
161 162 159 157 159 149 164
168 159 153 160
列出样本的频率分布表,绘出频率分布直方图.
[解] 第一步,求极差:上述60个数据中最大为169,最小为146.故极差为169-146=23(cm).
第二步,确定组距和组数:可取组距为3 cm,
则组数为=7 ,可将全部数据分为8组.
第三步,分组:[145.5,148.5),[148.5,151.5),[151.5,154.5),[154.5,157.5),[157.5,160.5),[160.5,163.5),[163.5,166.5),[166.5,169.5].
第四步,列频率分布表:
分组 频率累计 频数 频率
[145.5,148.5) 一 1 0.017
[148.5,151.5) 3 0.050
[151.5,154.5) 正一 6 0.100
[154.5,157.5) 正 8 0.133
[157.5,160.5) 正正正 18 0.300
[160.5,163.5) 正正一 11 0.183
[163.5,166.5) 正正 10 0.167
[166.5,169.5] 3 0.050
合计 60 1.000
第五步,根据上述数据绘制频率分布直方图.
反思领悟 绘制频率分布直方图的注意点
(1)各组频率的和等于1,因此,各小矩形的面积的和也等于1.
(2)横轴表示样本数据,纵轴表示,这样每一组的频率可以用该组的组距为底、为高的小矩形的面积表示.
(3)画频率分布直方图的关键是确定矩形的高,一般地,频率分布直方图中两坐标轴上的单位长度不一致.
[跟进训练]
1.从某校高三学生中抽取50名参加数学竞赛,成绩(单位:分)分组及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)估计成绩在[60,90)的学生比例.
[解] (1)频率分布表如下,
成绩分组 频数累计 频数 频率
[40,50) 2 0.04
[50,60) 3 0.06
[60,70) 正正 10 0.2
[70,80) 正正正 15 0.3
[80,90) 正正 12 0.24
[90,100] 正 8 0.16
合计 50 1.00
(2)频率分布直方图如图所示.
(3)学生成绩在[60,90)的频率为(0.2+0.3+0.24)×100%=74%,所以估计成绩在[60,90)的学生比例为74%.
类型2 频率分布直方图的应用
【例2】 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
[解] 频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为=0.08.
又因为第二小组的频率=,
所以样本容量==150.
(2)若次数在110次以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
[解] 由频率分布直方图可估计该校高一年级学生的达标率为×100%=88%.
发现规律 频率分布直方图具备的性质
(1)因为小长方形的面积=组距×=____,所以各小长方形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
(2)在频率分布直方图中,各小长方形的面积之和等于_.
(3)样本容量=.
频率
1
[跟进训练]
2.某校100名学生期中考试语文成绩(单位:分)的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值;
[解] 依题意得,10×(2a+0.02+0.03+0.04)=1,解得a=0.005.
(2)若这100名学生的语文成绩在某些分数段的人数x与数学成绩相应分数段的人数y之比如下表所示,求数学成绩在[50,90)之外的人数.
分数段 [50,60) [60,70) [70,80) [80,90)
x∶y 1∶1 2∶1 3∶4 4∶5
[解] 数学成绩在[50,60)之间的人数为100×0.05=5,数学成绩在[60,70)之间的人数为100×0.4×=20,数学成绩在[70,80)之间的人数为100×0.3×=40,数学成绩在[80,90)之间的人数为100×0.2×=25,所以数学成绩在[50,90)之外的人数为100-5-20-40-25=10.
类型3 其他统计图表
【例3】 (1)如图所示的是某学校某年级的三个班和该年级在一学期内的六次数学测试的平均成绩y关于测试序号x的图象,为了容易看出一个班级的成绩变化,将离散的点用虚线连接,根据图象,给出下列结论:
①一班成绩始终高于年级平均水平,整体成绩比较好;
②二班成绩不够稳定,波动程度较大;
③三班成绩虽然多次低于年级平均水平,
但在稳步提升.
其中正确结论的个数为(  )
A.0   B.1   C.2   D.3

D 由题图可知,一班每次考试的平均成绩都在年级平均成绩之上,故①正确;二班平均成绩的图象高低变化明显,成绩不稳定,波动程度较大,故②正确;三班平均成绩的图象呈上升趋势,并且图象的大部分都在年级平均成绩图象的下方,故③正确.故选D.
(2)已知某地区中小学生人数和近视情况分别如图(1)和图(2)所示,为了解该地区中小学生的近视形成原因,用按比例分配分层随机抽样的方法抽取了2%的学生进行调查,
则样本容量和抽取的高中生近视人
数分别为________和________.
200 20 该地区中小学生总人数为3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为
2 000×2%×50%=20.
200
20
反思领悟 不同的统计图适用的数据类型也不同.例如,条形图适用于描述离散型的数据,直方图适用描述连续型数据等.因此,在解决问题的过程中,要根据实际问题的特点,选择恰当的统计图对数据进行可视化描述,以使我们能通过图形直观地发现样本数据的分布情况,进而估计总体的分布规律.
[跟进训练]
3.如图是根据某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,试根据折线统计图反映的信息,绘制该市3月1日到10日最低气温(单位:℃)的扇形统计图.
[解] 该城市3月1日至10日的最低气温(单位:℃)情况如下表:
其中最低气温为-3 ℃的有1天,占10%,最低气温为-2 ℃的
有1天,占10%,最低气温为-1℃的有2天,占20%,最低气温
为0 ℃的有2天,占20%,最低气温为1 ℃的有1天,占10%,
最低气温为2 ℃的有3天,占30%,扇形统计图如图所示.
日期 1 2 3 4 5 6 7 8 9 10
最低气温(℃) -3 -2 0 -1 1 2 0 -1 2 2
学习效果·课堂评估夯基础
03
1
2
3
4
1.某集团董事长想了解集团旗下五个超市的销售情况,通知五个超市经理把最近一周内的销售金额统计上报,要求既要反映一周内每天销售金额的多少,又要反映一周内每天销售金额的变化情况和趋势,则最好选用的统计图表为(  )
A.频率分布直方图  B.折线统计图
C.扇形统计图   D.统计表
B [折线统计图的一个显著特点就是能反映统计量的变化趋势,所以既要反映一周内每天销售金额的多少,又要反映一周内每天销售金额的变化情况和趋势,则最好选用的统计图表为折线统计图,故选B.]

1
2
3
4

2.如图是甲、乙、丙、丁四组人数的扇形统计图
的部分结果,根据扇形统计图的情况可以知道丙、
丁两组人数和为(  )
A.250   B.150
C.400   D.300
A [甲组人数是120,占30%,则总人数是=400(人).则乙组人数是400×7.5%=30(人),则丙、丁两组人数和为400-120-30=250.]
1
2
3
4
3.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出(单位:元)在[50,60]内的学生有30人,则n的值为(  )
A.100   B.1 000   C.90   D.900

A [由题意可知,前三组的频率之和为(0.01+0.024+0.036)×10=0.7,∴支出在[50,60]内的频率为1-0.7=0.3,∴n==100.]
1
2
3
4
4.小张刚参加工作时,月工资为5 000元,各种用途占比统计如图(1)所示的条形图.后来他加强了体育锻炼,目前月工资的各种用途占比统计如图(2)所示的折线图,
已知目前的月就医费比刚参加
工作时少200元,则目前小张的
月工资为________元.
5 500 [小张刚参加工作时,月工资为5 000元,小张每月就医费为5 000×15%=750(元),又已知目前的月就医费比刚参加工作时少200元,即550元,则目前小张的月工资为=5 500(元).]
5 500
回顾本节知识,自主完成以下问题:
1.画频率分布直方图的步骤是什么?
[提示] 绘制频率分布直方图的步骤如下:
①求极差;②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.
2.频率分布直方图具备哪些性质?
[提示] ①因为小矩形的面积=组距×=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小;
②在频率分布直方图中,各小矩形的面积之和等于1;
③=样本容量.
3.常用的统计图有哪几种?这些统计图对于数据分析能够起到什么作用?
[提示] 统计图有条形图、扇形图、折线图、频率分布直方图;从统计图中可以获取有用的数据信息,并能直观、准确地理解相关的结果.(共29张PPT)
第九章 统计
9.2 用样本估计总体
9.2.2 总体百分位数的估计
学习任务 结合实例,能用样本估计百分位数,理解百分位数的统计含义.(数学抽象、数学运算)
必备知识·情境导学探新知
01
某省数学考试结果揭晓,0.8%的同学需要补考.
问题:那么如何确定需要补考的分数线呢?
知识点 百分位数
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有____的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
思考 1.“这次数学测试成绩的第70百分位数是85分”,这句话是什么意思?
[提示] 有70%的同学数学测试成绩小于或等于85分.
p%
2.计算一组n个数据的第p百分位数的步骤
第1步,按________排列原始数据.
第2步,计算i=______.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第_项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的______.
从小到大
n×p%
j
平均数
思考 2.某组数据的第p百分位数在此组数据中一定存在吗?为什么?
[提示] 不一定.因为按照计算第p百分位数的步骤,第2步计算所得的i=n×p%,如果是整数,则第p百分位数为第i项与第(i+1)项数据的平均数,若第i项与第(i+1)项数据不相等,则第p百分位数在此组数据中就不存在.
3.四分位数
____,____,____这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
25%
50%
75%
数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的第30百分位数是_____.
8.4 [因为8×30%=2.4,故第30百分位数是第三项数据8.4.]
8.4
关键能力·合作探究释疑难
02
类型1 一组数据的第p百分位数
类型2 频率分布直方图计算百分位数
类型1 一组数据的第p百分位数
【例1】 从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的第25,75,95百分位数;
[解] 将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,则第25百分位数是=8.15,第75百分位数是=8.75,第95百分位数是第12个数据为9.9.
(2)请你找出珍珠质量较小的前15%的珍珠质量.
[解] 因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.
即产品质量较小的前15%的产品有2个,它们的质量分别为7.8 g,7.9 g.
反思领悟 百分位数是用于衡量数据位置的度量,它提供了有关数据在最小值与最大值之间位置的信息.需注意,在求百分位数时,一定要将数据按照从小到大的顺序排列.
[跟进训练]
1.已知甲、乙两组按顺序排列的数据:甲组:27,28,37,m,40,50;乙组:24,n,34,43,48,52;若这两组数据的第30百分位数、第50百分位数分别对应相等,则等于(  )
A.   B.   C.   D.

B [因为30%×6=1.8,50%×6=3,所以第30百分位数为n=28,第50百分位数为,所以m=40,所以,故选B.]
类型2 频率分布直方图计算百分位数
【例2】 为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下60株树木的第50百分位数和第75百分位数吗?
[解] 由题意知分别落在各区间上的频数
在[80,90)上为60×0.015×10=9,
在[90,100)上为60×0.025×10=15,
在[100,110)上为60×0.030×10=18,
在[110,120)上为60×0.020×10=12,
在[120,130]上为60×0.010×10=6.
从以上数据可知第50百分位数一定落在区间[100,110)上,由100+10×≈103.3;
第75百分位数一定落在区间[110,120)上,由110+10×=112.5.
综上可知,第50百分位数和第75百分位数分别为103.3 cm,112.5 cm.
发现规律 频率分布直方图中第p百分位数的计算
(1)确定百分位数所在的区间[a,b).
(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为_________________.
[跟进训练]
2.某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的第________百分位数.
30 [因为[20,40),[40,60)的频率为(0.005+0.01)×20=0.3,所以60分为成绩的第30百分位数.]
30
3.某省教育厅为了了解和掌握2023年高考考生的实际答卷情况,随机地取出了100名考生的数学成绩(单位:分),将数据分成了11组,制成了如图所示的频率分布表:
(1)求样本数据的第60,80百分位数;
分组 频数 频率
[80,85) 1 0.01
[85,90) 2 0.02
[90,95) 4 0.04
[95,100) 14 0.14
[100,105) 24 0.24
[105,110) 15 0.15
[110,115) 12 0.12
[115,120) 9 0.09
[120,125) 11 0.11
[125,130) 6 0.06
[130,135] 2 0.02
合计 100 1
[解] 从频率分布表得,前六组的频率之和为
0.01+0.02+0.04+0.14+0.24+0.15=0.60,
前七组的频率之和为0.60+0.12=0.72,
前八组的频率之和为0.72+0.09=0.81,
前九组的频率之和为0.81+0.11=0.92.
由前六组的频率之和为0.60,得样本数据的第60百分位数为110,样本数据的第80百分位数一定在第八组[115,120)内,由115+5×≈119.4,估计样本数据的第80百分位数约为119.4.
(2)估计2023年高考考生的数学成绩的90%分位数.
[解] 由前八组的频率之和为0.81,前九组的频率之和为0.92,知90%分位数一定在第九组[120,125)内,由120+5×≈124.1,估计2023年高考考生的数学成绩的90%分位数为124.1分.
学习效果·课堂评估夯基础
03
1
2
3
4
1.对于考试成绩的统计,如果你的成绩处在第95百分位数上,以下说法正确的是(  )
A.你得了95分
B.你答对了95%的试题
C.95%的参加考试者得到了和你一样的考分或还要低的分数
D.你排名在第95名
C [第95百分位数是指把数据从小到大排序,有至少95%数据小于或等于这个数,至少有5%的数据大于或等于这个值,只有C正确.]

1
2
3
4

2.已知一组数据按从小到大排列为1,1,2,2,3,3,4,5,7,7,8,10,那么数据的25%分位数、75%分位数分别是(  )
A.3,9  B.2,7  C.9,3  D.7,2
B [因为这组数据有12个数,所以12×25%=3,12×75%=9,所以数据的25%分位数是=2,数据的75%分位数是=7.故选B.]
1
2
3
4
3.某组数据的中位数是2 023,那么它的第50百分位数是_______.
2 023 [某组数据的中位数是2 023,第50百分位数就是中位数,它的第50百分位数是2 023.]
2 023
1
2
3
4
4.某市举行“中学生诗词大赛”,某校有1 000名学生参加了比赛,从中抽取100名学生,统计他们的成绩(单位:分),并进行适当的分组(每组为左闭右开的区间),得到的频率分布直方图如图所示,则估计该校学生成绩的80%分位数为________.
122
1
2
3
4
122 [根据频率分布直方图可知,成绩在130分以下的学生所占比例为1-0.005 0×20=0.9,成绩在110分以下的学生所占比例为1-(0.012 5+0.005 0)×20=0.65,因此80%分位数一定位于[110,130)内,由110+20×=122,故可估计该校学生成绩的80%分位数为122.]
回顾本节知识,自主完成以下问题:
1.百分位数告诉我们什么信息?
[提示] 对于无大量重复的数据,第p百分位数将它分为两个部分,大约有p%的数据项的值比第p百分位数小,而大约有(100-p)%的数据项的值比第p百分位数大.
2.计算第p百分位数时应注意什么?
[提示] 对于数据型的第p百分位数计算时应注意以下两点:
(1)求百分位数时,一定要将数据按照从小到大的顺序排列;
(2)计算i=n×p%后要弄清i是整数还是非整数.
对于由频率分布直方图求百分位数时应注意频率分布直方图中小矩形的面积,就是数据确定在哪个区间.(共37张PPT)
第九章 统计
9.2 用样本估计总体
9.2.3 总体集中趋势的估计
学习任务 1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数).(数学抽象、数据分析)
2.理解集中趋势参数的统计含义.(直观想象)
必备知识·情境导学探新知
01
甲、乙两位同学相约晚上在某餐馆吃饭.他们分别在A,B两个网站查看同一家餐馆的好评率.甲在网站A查到的好评率是98%,而乙在网站B查到的好评率是85%.综合考虑这两个网站的信息,应该如何得到这家餐馆的总好评率?
知识点 众数、中位数、平均数
1.众数、中位数和平均数的定义
(1)众数:一组数据中____________的数.
(2)中位数:一组数据按大小顺序排列后,处于____位置的数.如果个数是偶数,则取____两个数据的平均数.
(3)平均数:一组数据的__除以数据个数所得到的数.
出现次数最多
中间
中间

思考 1.中位数一定是样本数据中的一个数吗?
[提示] 不一定.一组数据按大小顺序排列后,如果有奇数个数据,处于中间位置的数是中位数;如果有偶数个数据,则中间两个数据的平均数是中位数.
思考 2.一组数据的众数一定唯一吗?
[提示] 不一定,数据的众数可能有一个,也可能有多个.
2.频率分布直方图中的众数、中位数、平均数
(1)单峰频率分布直方图中的平均数与中位数
①如果直方图的形状是____的,那么平均数与中位数大体上差不多.
②如果直方图在____“拖尾”,那么平均数大于中位数;如果直方图在____“拖尾”,那么平均数小于中位数,也就是说,和中位数相比,平均数总是在“长尾巴”那边.
(2)在频率分布直方图中,众数是____矩形底边中点的横坐标;中位数左边和右边的直方图的面积应该____;样本平均数的估计值等于频率分布直方图中每个小矩形底边中点的______与小矩形的____的乘积之和.
对称
右边
左边
最高
相等
横坐标
面积
思考辨析(正确的打“√”,错误的打“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势. (  )
(2)样本的平均数是频率分布直方图中最高长方形的中点对应的数据. (  )
(3)若改变一组数据中其中的一个数,则这组数据的平均数、中位数、众数都会发生改变. (  )

×
×
关键能力·合作探究释疑难
02
类型1 一组数据的平均数、中位数和众数
类型2 频率分布直方图中的平均数、中位数和众数
类型3 平均数、中位数和众数的实际应用
类型1 一组数据的平均数、中位数和众数
【例1】 已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有(  )
A.a>b>c   B.a>c>b
C.c>a>b   D.c>b>a
D [由题意得a=(16+18+15+11+16+18+18+17+15+13)==15.7,中位数为16,众数为18,则b=16,c=18,∴c>b>a.]

反思领悟 平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据相关数据的总数是奇数还是偶数而定;众数是看出现次数最多的数.
[跟进训练]
1.(1)已知一组数据x1,x2,x3,x4,x5的平均数是2,那么另一组数据2x1-3,2x2-3,2x3-3,2x4-3,2x5-3的平均数为(  )
A.1   B.2   C.3   D.4
A 因为一组数据x1,x2,x3,x4,x5的平均数是2,所以另一组数据2x1-3,2x2-3,2x3-3,2x4-3,2x5-3的平均数为2×2-3=1.故选A.

(2)某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个,命中个数如下所示:
甲:20,22,27,8,12,13,37,25,24,26;
乙:14,9,13,18,19,20,23,21,21,11.
则下面结论中正确的是________(填序号).
①甲的极差是29;②乙的众数是21;③甲的平均数为21.4;④甲的中位数是24.
①②③
①②③ 把两组数据按从小到大的顺序排列,得
甲:8,12,13,20,22,24,25,26,27,37
乙:9,11,13,14,18,19,20,21,21,23
故甲的最大值为37,最小值为8,则极差为29,所以①正确;乙中出现最多的数据是21,所以②正确;甲的平均数为×(8+12+13+20+22+24+25+26+27+37)=21.4,所以③正确;甲的中位数为×(22+24)=23,故④不正确.
类型2 频率分布直方图中的平均数、中位数和众数
【例2】 某校从参加高一年级期末考试的学生中抽出60名,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后,画出如图所示的频率分布直方图.观察图中的信息,回答下列问题:
(1)估计这次考试的物理成绩的
众数m与中位数n(结果保留一位
小数);
[解] 众数是频率分布直方图中最高小矩形底边中点的横坐标,所以众数为m=75.0.
前3个小矩形面积和为0.01×10+0.015×10+0.015×10=0.4<0.5,
前4个小矩形面积和为0.4+0.03×10=0.7>0.5,
所以中位数n=70+≈73.3.
(2)估计这次考试的物理成绩的及格率(60分及以上为及格)和平均分.
[解] 依题意,60及60以上的分数在第三、四、五、六组,频率和为(0.015+0.03+0.025+0.005)×10=0.75,所以估计这次考试的物理成绩的及格率是75%.
利用组中值估算抽样学生的平均分为45×f1+55×f2+65×f3+75×f4+85×f5+95×f6=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
所以估计这次考试的物理成绩的平均分是71分.
反思领悟 用频率分布直方图估计众数、中位数、平均数
(1)众数:取最高小长方形底边中点的横坐标作为众数.
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.
(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
[跟进训练]
2.某中学举行电脑知识竞赛,现将高一参
赛学生的成绩进行整理后分成五组绘制成
如图所示的频率分布直方图.
求:(1)成绩的众数、中位数的估计值;
[解] 由图可知众数的估计值为65分.
设中位数为x,又∵第一个小矩形的面积为0.3,
则0.3+(x-60)×0.04=0.5,得x=65.
∴中位数的估计值为65分.
(2)平均成绩的估计值(同一组中的数据用该组区间的中点值作代表).
[解] 依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67(分),
∴平均成绩的估计值为67分.
类型3 平均数、中位数和众数的实际应用
【例3】 (源自湘教版教材)某公司全体职工的月工资如下:
(1)试求出该公司月工资数据中的众数、中位数和平均数;
月工 资/元 18 000 12 000 8 000 6 000 4 000 2 500 2 000 1 500 1 200
人数 1 (总经理) 2 (副总经理) 3 4 10 20 22 12 6
[解] 在上述80个数据中,2 000出现了22次,出现的次数最多,因此这组数据的众数是2 000.
把这80个数据按从小到大的顺序排列后,位于中间的数是2 000,2 500,因此这组数据的中位数是=2 250.
这组数据的平均数为=3 115.
(2)你认为用平均数、中位数或众数中的哪一个更能反映该公司的工资水平?
[解] 由于大多数员工的月工资达不到平均数3 115,显然用平均数作为该公司员工月工资的代表值并不合适;众数2 000及中位数2 250在一定程度上代表了大多数人的工资水平,较能反映月工资水平的实际情况.
(3)对于职工月工资数据的平均数、中位数和众数,你认为该公司总经理、普通员工及应聘者将分别关注哪一个?说说你的理由.
[解] 公司总经理最关心的是月工资的总额,所以他关注的是平均数;普通员工关注的是自己的收入在本公司职工群体中的位置,中位数能帮助职工了解自己的工资收入处于什么样的水平;应聘者最想知道公司发给大多数员工的工资数额,这也是一般应聘者将会拿到的工资,因此应聘者关注的是该公司月工资的众数.
反思领悟 平均数、中位数、众数应用问题的两个关注点
(1)平均数与每一个数据都有关,可以反映更多的总体信息,但受极端值的影响大;中位数是样本数据所占频率的等分线,不受几个极端值的影响;众数只能体现数据的最大集中点,无法客观反映总体特征.
(2)当平均数大于中位数时,说明数据中存在许多较大的极端值.
[跟进训练]
3.如表是五年级两个班各11名同学1分钟仰卧起坐的成绩(单位:次):
(1)这两组数据的平均数,中位数和众数各是多少?
(2)你认为哪个数表示两个班的成绩更合适?
一班 19 33 26 29 28 33 34 35 33 33 30
二班 25 27 29 28 29 30 29 35 29 30 29
[解] (1)一班平均数:(19+33+26+29+28+33+34+35+33+33+30)÷11=333÷11≈30.27(次),
一班数据从小到大排列为:19,26,28,29,30,33,33,33,33,34,35,所以一班中位数为33次,
33出现的次数最多,众数是33次;
二班平均数:(25+27+29+28+29+30+29+35+29+30+29)÷11=320÷11≈29.09(次),
二班数据从小到大排列为:25,27,28,29,29,29,29,29,30,30,35,所以二班的中位数是29次,
29出现的次数最多,所以二班的众数是29次.
(2)运用平均数表示两个班的成绩更合适.
学习效果·课堂评估夯基础
03
1
2
3
4
1.(多选)在一次体育测试中,某班6名同学的成绩(单位:分)分别为66,83,87,83,77,96.关于这组数据,下列说法正确的是(  )
A.众数是83   B.中位数是83
C.极差是30   D.平均数是83
ABC [由于83出现的次数最多,所以众数是83,故A正确;把数据按从小到大排列为66,77,83,83,87,96,中间两个数为83,83,所以中位数是83,故B正确;极差是96-66=30,故C正确;由于平均数为(66+83+87+83+77+96)÷6=82,故D错误.]



1
2
3
4

2.下列关于平均数、中位数、众数的说法中正确的是(  )
A.中位数可以准确地反映出总体的情况
B.平均数可以准确地反映出总体的情况
C.众数可以准确地反映出总体的情况
D.平均数、中位数、众数都有局限性,都不能准确地反映出总体的情况
D [中位数不受少数极端值的影响,对极端值的不敏感也会成为缺点,故A错误;平均数可以较好地反映样本数据全体的信息,但是样本数据质量较差时,使用平均数描述数据的中心位置就可能会与实际情况产生较大差异,故B错误;众数体现了样本数据的最大集中点,但对其他数据信息的忽略使得无法客观反映总体特征,故C错误;综上可知,D正确.]
1
2
3
4
3.已知一组数据按从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么数据的众数是______,平均数是______.
6 5 [因为-1,0,4,x,6,15的中位数是5,所以(4+x)=5,x=6.所以这组数据的众数是6,平均数是(-1+0+4+6+6+15)=5.]
6
5
1
2
3
4
4.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)这次测试数学成绩的众数为________;
75 由题干图知众数为=75.
75
1
2
3
4
(2)这次测试数学成绩的中位数为________;
 由题干图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x=.
1
2
3
4
(3)这次测试数学成绩的平均分为________.
72 由题干图知这次数学成绩的平均数为:×0.005×10+×0.015×10+×0.02×10+×0.03×10+×0.025×10+×0.005×10=72.
72
回顾本节知识,自主完成以下问题:
1.在频率分布直方图中,如何确定众数、中位数和平均数?
[提示] 在频率分布直方图中,众数是最高小矩形底边的中点所对应的数据;中位数左边和右边的直方图的面积应该相等;平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
2.众数、中位数和平均数的各有哪些优缺点?
[提示] 
名称 优点 缺点
平均数 与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感 任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
名称 优点 缺点
中位数 不受少数几个极端数据(即排序靠前或靠后的数据)的影响 对极端值不敏感
众数 体现了样本数据的最大集中点 众数只能传递数据中的信息的很少一部分,对极端值不敏感(共35张PPT)
第九章 统计
9.2 用样本估计总体
9.2.4 总体离散程度的估计
学习任务 1.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差).(数学抽象、数据分析)
2.理解离散程度参数的统计含义.(直观想象)
必备知识·情境导学探新知
01
甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是:
甲:8,6,7,8,6,5,9,10,4,7;
乙:6,7,7,8,6,7,8,7,9,5.
经过计算可知甲、乙的命中环数的平均数都是7环.
问题:若从二人中选一人去参加射击大赛,只用平均数能否作出选择?
知识点 方差、标准差
1.一组数据x1,x2,…,xn的方差和标准差
数据x1,x2,…,xn的方差为=,
标准差为.
2.总体方差和标准差
(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,
…,YN,总体的平均数为,则称S2=为总体方差,S=为总体标准差.
(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,
2,…,k),则总体方差为S2=.
3.样本方差和标准差
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为
,则称s2=为样本方差,s=为样本标准差.
4.标准差的意义
标准差刻画了数据的________或________,标准差越大,数据的离散程度越__;标准差越小,数据的离散程度越__.
离散程度
波动幅度


5.分层随机抽样的方差
设样本容量为n,平均数为,其中两层的个体数量分别为n1,n2,两层的平均数分别为,方差分别为,则这个样本的方差为s2=_________________________________.
1.思考辨析(正确的打“√”,错误的打“×”)
(1)若一组数据的值大小相等,没有波动变化,则标准差为0. (  )
(2)标准差、方差的取值范围为[0,+∞). (  )
(3)标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散. (  )
(4)一般情况下数据中绝大部分数据落在内,也有可能落在外. (  )
(5)计算分层随机抽样中总样本的平均数与方差时,必须已知各层的权重. (  )


×


2.已知一个样本中的数据为1,2,3,4,5,则该样本的方差为_______;标准差为________.
3.某班为了了解学生每周购买零食的支出情况,利用分层随机抽样抽取了一个15人的样本统计如下:
则全班学生每周购买零食的平均费用为_______;方差为_______.
性别 学生数 平均支出(元) 方差
男生 9 40 6
女生 6 35 4
2
38
11.2
关键能力·合作探究释疑难
02
类型1 方差和标准差的性质与计算
类型2 方差和标准差的应用
类型3 分层随机抽样的方差
类型1 方差和标准差的性质与计算
【例1】 (1)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为s2,则(  )
A.=4,s2<2  B.=4,s2>2
C.>4,s2<2   D.>4,s2>2

A 因为某7个数的平均数为4,所以这7个数的和为4×7=28,因为加入一个新数据4,所以=4.又因为这7个数的方差为2,且加入一个新数据4,所以这8个数的方差s2=<2.故选A.
(2)若40个数据的平方和是56,平均数是,则这组数据的方差是________,标准差是________.
0.9  由方差公式s2=,
得s2==.
由已知得n=.
∴s2==0.9,s=.
0.9
反思领悟 方差和标准差的计算技巧与性质
(1)方差的计算
①基本公式:s2=2+2+…+].
②简化计算公式:s2=-,即方差等于原数据平方的平均数减去平均数的平方.
(2)方差和标准差的性质
若把一组数据的每一个数变为原来的k倍并加上或减去常数a,则它的标准差变为原来的k倍,方差变为原来的k2倍,而与a的大小无关.
[跟进训练]
1.(1)(多选)下列四个选项中,正确的是(  )
A.极差与方差都反映了数据的集中程度
B.方差是没有单位的统计量
C.标准差比较小时,数据比较分散
D.只有两个数据时,极差是标准差的2倍

AD 设两个数据分别为x1,x2,则极差等于标准差等于,故D正确.由定义可知A正确,B,C错误.

(2)样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本的方差为________.
2 由平均数为1可得=1,解得a=-1.所以样本的方差s2==2.
2
类型2 方差和标准差的应用
【例2】 为响应“绿色出行”号召,某市先后推出了“共享单车”和“新能源分时租赁汽车”,并计划在甲、乙两个工厂选择一个工厂生产汽车轮胎,现分别从甲、乙两厂各随机选取10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:
(1)分别计算甲、乙两厂
提供的10个轮胎宽度的
平均数;
[解] 甲厂提供的10个轮胎宽度的平均数为×(195+194+196+193+194+197+196+195+193+197)=195.
乙厂提供的10个轮胎宽度的平均数为×(195+196+193+192+195+194+195+192+195+193)=194.
(2)轮胎的宽度在[194,196]内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个工厂会被选择.
[解] 甲厂提供的10个轮胎的宽度在[194,196]内的数据为195,194,196,194,196,195,共6个,标准轮胎宽度的平均数为=195,方差为×(0+1+1+1+1+0)=.
乙厂提供的10个轮胎的宽度在[194,196]内的数据为195,196,195,194,195,195,共6个,标准轮胎宽度的平均数为=195,方差为×(0+1+0+1+0+0)=.
由于甲、乙两厂标准轮胎宽度的平均数相等,但乙的方差更小,所以乙厂的轮胎会被选择.
反思领悟 在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度.在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,离散程度越小,数据越集中,越稳定.
[跟进训练]
2.汽车行业是碳排放量比较大的行业之一,某检测单位对甲、乙两类MI型品牌的新车各抽取了5辆进行CO2排放量检测,记录如下(单位:g/km),则甲、乙两品牌汽车CO2的排放量稳定性更好的是(  )
A.甲   B.乙
C.甲、乙相同   D.无法确定

甲 80 110 120 140 150
乙 100 120 100 120 160
B [甲类品牌汽车的CO2排放量的平均值
=120(g/km),
甲类品牌汽车的CO2排放量的方差
×[(80-120)2+(110-120)2+(120-120)2+(140-120)2+(150-120)2]=600.
乙类品牌汽车的CO2排放量的平均值
=120(g/km),
乙类品牌汽车的CO2排放量的方差
×[(100-120)2+(120-120)2+(100-120)2+(120-120)2+(160-120)2]=480,
所以.
故选B.]
类型3 分层随机抽样的方差
【例3】 某市教育部门采用分层随机抽样的方法从甲、乙、丙三个学校选取了100名学生的某次考试数学成绩(单位:分),并制成如下表格:
试估计这次考试数学成绩的平均数与方差.
学校 学生数 平均数 方差
甲 40 98 10
乙 30 92 12
丙 30 95 15
[解] 由题意可得,样本平均数(40×98+30×92+30×95)=95.3(分),方差s2={40×[10+(98-95.3)2]+30×[12+(92-95.3)2]+30×[15+(95-95.3)2]}=18.31,所以估计这次考试数学成绩的平均数为95.3分,方差为18.31.
反思领悟 分层随机抽样的方差
设样本中不同层的平均数分别为,…,,方差分别为,…,,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=   (为样本的平均数).
[跟进训练]
3.甲、乙两支田径队体检结果为:甲队体重的平均数为60 kg,方差为200,乙队体重的平均数为70 kg,方差为300,又已知甲、乙两队的队员人数之比为1∶4,求甲、乙两队全部队员的平均体重和方差.
[解] 由题意可知=60,甲队队员在所有队员中所占权重为=70,乙队队员在所有队员中所占权重为,则甲、乙两队全部队员的平均体重为×60+×70=68 kg,甲、乙两队全部队员的体重的方差为s2=[200+(60-68)2]+[300+(70-68)2]=296.
学习效果·课堂评估夯基础
03
1
2
3
4
1.甲、乙、丙、丁四名射手在选拔赛中所得的平均环数及其方差s2如表所示,则选送决赛的最佳人选应是(  )
A.甲   B.乙   C.丙   D.丁

B [∵>,且,故应选择乙进入决赛.]
项目 甲 乙 丙 丁
7 8 8 7
s2 6.3 6.3 7 8.7
1
2
3
4

2.已知一组数据x1,x2,x3,x4,x5的平均数是3,方差是,那么另一组数据2x1-1,2x2-1,2x3-1,2x4-1,2x5-1的平均数、方差分别是(  )
A.5,  B.5,2  C.3,2  D.3,
B [因为数据x1,x2,x3,x4,x5的平均数是3,方差是,所以
,因此数据2x1-1,2x2-1,2x3-1,2x4-1,2x5-1的平均数为-1=5,方差为====2.故选B.]
1
2
3
4
3.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4,
则:(1)平均命中环数为________;
(2)命中环数的标准差为________.
(1)7 (2)2 [(1)=7.
(2)∵s2=×[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴s=2.]
7
2
1
2
3
4
4.在对某中学高一学生体重的调查中,采取按样本量比例分配的分层随机抽样,已知抽取了男生30人,其平均数和方差分别为55和15,抽取了女生20人,其平均数和方差分别为45和20.根据以上数据估计该校高一学生体重的总样本的平均数为________,方差为________.
51 41 [总样本的平均数为45=51,总样本的方差为[15+(55-51)2]+[20+(45-51)2]=41.]
51
41
回顾本节知识,自主完成以下问题:
1.描述数据的离散程度的量有哪些?分别如何描述的?
[提示] 数据的离散程度可以通过极差、方差或标准差来描述.
(1)极差是数据的最大值与最小值的差.它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.
(2)方差则反映了一组数据围绕平均数波动的大小.为了得到以样本数据的单位表示的波动幅度通常用标准差.在平均数相同的情况下,方差(或标准差)越大,离散程度越大,数据波动性越大,稳定性差;方差(或标准差)越小,数据越集中、越稳定.
2.如何计算一组数据的方差或标准差?
[提示] (1)公式法:s2=2+2+…+]=-;
(2)性质法:若x1,x2,…,xn的方差为s2,则mx1+a,mx2+a,…,mxn+a的方差为m2s2.
3.如何计算分层随机抽样的方差?
[提示] 计算分层随机抽样的方差s2的步骤
(1)分层随机抽样中两组数据x,y的抽样比例是;
(2)总体均值为;
(3)总体方差s2=+]+·+].