第九章 统计
9.2 用样本估计总体
9.2.3 总体集中趋势的估计
9.2.4 总体离散程度的估计
学习目标
素养要求
1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义
数据分析、数学运算
2.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义
数据分析、数学运算
3.结合实例,能用样本估计总体的取值规律
数据分析
| 自学导引 |
众数、中位数、平均数的定义
最多
中间
平均数
2.三种数字特征与频率分布直方图的关系
最高长方形
众数
众数是____________的中点所对应的数据,表示样本数据的中心值
中位数
(1)在频率分布直方图中,中位数左边和右边的直方图面积______,由此可以估计中位数的值,但是有偏差;
(2)表示样本数据所占频率的等分线
平均数
(1)平均数等于每个小矩形的面积乘_______________________之和;
(2)平均数是频率分布直方图的重心,是频率分布直方图的平衡点
相等
小矩形底边中点的横坐标
【预习自测】判断下列命题是否正确.(正确的画“√”,错误的画“×”)
(1)一个样本的众数、平均数和中位数都是唯一的. ( )
(2)样本的平均数是频率分布直方图中最高长方形的中点对应的数据. ( )
(3)若改变一组数据中一个数,则这组数据的平均数、中位数、众数都会发生改变. ( )
【答案】(1)× (2)× (3)×
【解析】(1)一个样本的平均数和中位数是唯一的.若数据中有两个或两个以上出现得最多,且出现次数一样多,则这些数据都叫众数,若一组数据中每个数据出现的次数一样多,则没有众数,可见一个样本的众数可能多个,也可能没有.
(2)样本的平均数等于每个小矩形的面积乘小矩形底边中点的横坐标之和.
(3)若改变一组数据中的一个数,则这组数据的平均数一定会改变,而中位数与众数可能不变.
1.总体方差与总体标准差
如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数
为,则称S2=________________为总体方差,S=____为总体标准差.与总体均值类似,总体方差也可以写成加权的形式.如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现
的频数为fi(i=1,2,…,k),则总体方差为S2=________________.
方差与标准差
【预习自测】
1.判断判断下列命题是否正确.(正确的画“√”,错误的画“×”)
(1)数据5,4,4,3,5,2的众数为4. ( )
(2)数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半. ( )
(3)方差与标准差具有相同的单位. ( )
(4)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变. ( )
【答案】(1)× (2)√ (3)× (4)√
【解析】(1)该数据中的众数应为4和5.
(3)二者单位不一致.
(4)平均数也应减去该常数,方差不变.
2.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是_______.
【答案】0.1
| 课堂互动 |
某工厂人员及月工资构成如下:
题型1 众数、中位数、平均数的计算及应用
人员
经理
管理人员
高级技工
工人
学徒
合计
月工资/元
22 000
2 500
2 200
2 000
1 000
29 700
人数
1
6
5
10
1
23
合计
22 000
15 000
11 000
20 000
1 000
69 000
(1)指出这个表格中的众数、中位数、平均数;
(2)这个表格中,平均数能客观地反映该工厂的月工资水平吗?为什么?
素养点睛:本题考查了数学抽象与数据分析的核心素养.
解:(1)由表格可知,众数为2 000元.
把23个数据按从小到大(或从大到小)的顺序排列,排在中间的数应是第12个数,其值为2 200,故中位数为2 200元.
平均数为69 000÷23=3 000(元).
(2)虽然平均数为3 000元/月,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.
众数、中位数、平均数之间的关系
(1)如果样本平均数大于样本中位数,说明数据中存在较大的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中的极端数据信息,帮助我们作出决策.
(2)众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各个数据的重心.
1.(2020年张家口期末)已知甲组数据:156,170+a,165,174,162,乙组数据:159,178,160+b,161,167,其中a,b∈{x∈N|x≤9}.若这两组数据的中位数相等,平均数也相等,则a+b= ( )
A.8 B.10
C.11 D.12
【答案】A
【解析】根据题意,甲组数据:156,170+a,165,174,162,其中位数必为165,则乙组数据:159,178,160+b,161,167的中位数也为165,则有160+b=165,解可得b=5;又由两组数据的平均数相等,则有(156+170+a+165+174+162)=(159+178+165+161+167),解得a=3,则a+b=3+5=8;故选A.
从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.
由于一些数据丢失,试利用频率分
布直方图求:
(1)这50名学生成绩的众数与中位数;
(2)这50名学生的平均成绩.
素养点睛:本题考查了数据分析和数学抽象的核心素养.
题型2 利用频率分布直方图求众数、中位数、平均数
解:(1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为75.
由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将所有小矩形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标所对应的成绩即为所求.
频率分布直方图的数字特征
(1)众数:众数一般用频率分布表中频率最高的一组的组中值来显示,即在样本数据的频率分布直方图中,最高矩形的底边中点的横坐标;
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;
(3)平均数:平均数在频率分布表中等于每组中值与对应频率之积的和.
2.(2020年山西高三月考)某次考试后,对全班同学的数学成绩进行整理,并得到如表:
分数段
[70,90)
[90,110)
[110,130)
[130,150]
人数
5
15
20
10
将以上数据绘制成频率分布直方图后,可估计出本次考试数学成绩的中位数是 ( )
A.110 B.115
C.120 D.125
【答案】B
【解析】由题意得,频率分布直方图中四个小矩形的面积从左向右依次为0.1,0.3,0.4,0.2,∴中位数位于第3个小矩形处,而前两个小矩形面积之积为0.4,故第三个小矩形在中位数左侧的面积为0.1,故中位数在区间[110,130)的靠左的四等分点处,故中位数为115.故选B.
甲、乙两机床同时加工直径为100 cm的零件,为检验质量,从中抽取6件测量数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算说明哪台机床加工零件的质量更稳定.
素养点睛:本题考查了数学运算与数学抽象的核心素养.
题型3 标准差、方差的计算及应用
用样本的标准差、方差估计总体的方法
(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似值.实际应用中,需先分析平均水平,当所得数据的平均数相等时,再计算标准差(方差)分析稳定情况.
(2)标准差、方差的取值范围是[0,+∞).
(3)因为标准差与原始数据的单位相同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.
3.样本数为9的四组数据,它们的平均数都是5,条形图如图所示,则标准差最大的一组是( )
A.第一组
B.第二组
C.第三组
D.第四组
【答案】D
甲、乙两种冬小麦实验品种连续5年的平均单位面积产量如下(单位:t/km2):
易错警示 忽略方差的统计意义致误
品种
第1年
第2年
第3年
第4年
第5年
甲
9.8
9.9
10.1
10
10.2
乙
9.4
10.3
10.8
9.7
9.8
若某村要从中引进一种冬小麦大量种植,给出你的建议.
易错防范:平均数反映的是样本的平均水平,方差和标准差则反映了样本的波动、离散程度.对于形如“谁最适合”“谁更稳定”的题目,除了比较数据的平均值之外,还要比较方差或标准差的大小,做出更合理的判断.
| 素养达成 |
1.一组数据中的众数可能不止一个,平均数与中位数是唯一的,求中位数时,必须先排序.
2.利用频率分布直方图求数字特征
(1)众数是最高的矩形的底边的中点.
(2)中位数左右两边直方图的面积应相等.
(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
3.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差(体现数学运算的核心素养).
1.一组数据的方差一定是 ( )
A.正数 B.负数
C.任意实数 D.非负数
【答案】D
【解析】方差可为0和正数.
2.对于数据3,3,2,3,6,3,10,3,6,3,2,有下列结论:
①这组数据的众数是3;
②这组数据的众数与中位数的数值不相等;
③这组数据的中位数与平均数的数值相等;
④这组数据的平均数与众数的数值相等.
其中正确的结论的个数为 ( )
A.1 B.2
C.3 D.4
【答案】A
3.某校初三年级有400名学生,随机抽查了40名学生测试1分钟仰卧起坐的成绩(单位:次),将数据整理后绘制成如图所示的频率分布直方图.用样本估计总体,下列结论正确的是 ( )
A.该校初三学生1分钟仰卧起坐的次数的中位数为25
B.该校初三学生1分钟仰卧起坐的次数的众数为24
C.该校初三学生1分钟仰卧起坐的次数超过30的人数约有80
D.该校初三学生1分钟仰卧起坐的次数少于20的人数约为8
【答案】C
【解析】第一组数据的频率为0.02×5=0.1,第二组数据的频率为0.06×5=0.3,第三组数据的频率为0.08×5=0.4,∴中位数在第三组内,设中位数为25+x,则x×0.08=0.5-0.1-0.3=0.1,∴x=1.25,∴中位数为26.25,故A错误;第三组数据所在的矩形最高,第三组数据的中间值为27.5,∴众数为27.5,故B错误;1分钟仰卧起坐的次数超过30的频率为0.2,∴超过30次的人数为400×0.2=80,故C正确;1分钟仰卧起坐的次数少于20的频率为0.1,∴1分钟仰卧起坐的次数少于20的人数为400×0.1=40,故D错误.故选C.
4.某校100名高二学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)图中a的值为________;
(2)根据频率分布直方图,估计这100名学生语文成绩的平均分为________.
【答案】(1)0.02 (2)73分
【解析】(1)依题意,10×(2×0.005+a+0.03+0.04)=1,解得a=0.02.
(2)这100名学生语文成绩的平均分为55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73(分).
5.甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.
(1)分别求出两人得分的平均数与方差;
(2)根据图和(1)中的计算结果,对两人的训练成绩作出评价.
| 课后提能训练 |