(共40张PPT)
第六章
统计
§4 用样本估计总体的数字特征
4.1 样本的数字特征
1.会求样本的众数、中位数、平均数、极差、方差、标准差.(数学运算)
2.能用样本的数字特征估计总体的数字特征,并做出合理的解释和决策.(数据分析)
1.极差怎么计算?
[答案] 用数据中的最大值减去最小值.
2.何为众数?
[答案] 一组数据中出现次数最多的数据,可以不唯一.
3.一组数据的中位数唯一吗?
[答案] 唯一.若数据有偶数个,则中位数等于中间两个数据的平均数;若数据有奇数个,
则中位数为居中的那个数据.
4.极差、方差、标准差刻画一组数据的什么数字特征?
[答案] 刻画一组数据的离散程度.
5.平均数、中位数、标准差有单位吗?
[答案] 与所给数据的单位相同,若所给数据不带单位,则平均数、中位数、标准差也
无单位.
1.判断下列结论是否正确.(正确的打“√”,错误的打“×”)
(1) 平均数反映了一组数据的平均水平,任何一个样本数据的改变都会引起平均数
的变化.( )
√
(2) 一组数据的众数的大小只与这组数据中的部分数据有关.( )
√
(3) 数据的极差越小,样本数据分布越集中、稳定.( )
√
(4) 数据的方差越小,样本数据分布越集中、稳定.( )
√
2.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原
始评分中去掉1个最高分和1个最低分,得到7个有效评分.7个有效评分与9个原始评分
相比,一定不变的数字特征是( ) .
A
A.中位数 B.平均数 C.方差 D.极差
[解析] 设9位评委的评分按从小到大的顺序排列为,,,, ,, ,则
原始评分的中位数为,去掉最低分和最高分后,剩余,,, , ,中
位数仍为 ,故A正确;平均数受极端值影响较大,故平均数不一定相同,进而方差
也不一定相同,故B,C错误;原极差,后来的极差 ,显然极差可
能变小,故D错误.
3.10名工人某天生产同一类型零件,生产的件数分别是10,12,14,14,15,15,16,
17,17,17,记这组数据的平均数为,中位数为,众数为 ,则( ) .
D
A. B. C. D.
[解析] 平均数 ,
中位数,众数,故 .
4.某学员在一次射击测试中射靶10次,命中环数分别为7,8,7,9,5,4,9,10,7,4.
求:(1)平均命中环数;
(2)命中环数的标准差.
[解析] (1)平均命中环数 (环).
(2)由题意知,方差
, 标准差 (环).
探究1 众数、中位数和平均数
现从甲、乙、丙三个厂家生产的同一种产品中,各抽取8件产品,对其使用寿命
(单位:年)进行跟踪调查,其结果如下:
甲:3,4,5,6,8,8,8,10.
乙:4,6,6,6,8,9,12,13.
丙:3,3,4,7,9,10,11,12.
问题1: 三家广告中都称其产品的使用寿命为8年,利用初中所学的知识,你能说明为
什么吗?
[答案] 三个厂家从不同角度进行了说明,以宣传自己的产品.其中甲:众数为8;乙:
平均数为8;丙:中位数为8.
问题2: 众数能传递数据中的很多信息吗?对极端值是否敏感?
[答案] 不能,众数只能传递数据中的信息的很少一部分,对极端值也不敏感.
问题3: 初中学过的平均数、中位数、众数是刻画什么的?
[答案] 平均数、中位数、众数都是刻画“中心位置”的量,它们从不同的角度刻画了一
组数据的集中趋势.
1.集中趋势参数:众数、中位数和平均数刻画了一组数据的“中心”位置,是描述数据
的集中趋势的统计量.
2.平均数、中位数和众数的概念
(1)平均数:这组数据的平均值.
(2)中位数:一般地,将这组数据按从小到大的顺序排列后,“中间”的那个数据为这
组数据的中位数,它使数据被分成的两部分的数据量是一样的.
(3)众数:这组数据中出现次数最多的数据(可能有多个).
例1 (改编)为加强学生身体素质教育,学校倡导学
生在课外积极参加体育锻炼,为检验成果,从高一年
级随机选取30人进行引体向上测试,得分(十分制)
情况如图所示.
(1)试结合图象分析得分的平均数、众数、中位数,
并比较它们的大小关系.
(2)若去掉两个最大值和两个最小值,平均数和中位数如何变化
[解析] (1)平均数为
(分), 众数为5分,中位数为(分),故平均数中位数 众数.
(2)去掉两个最大值和两个最小值后,平均数为 (分),变
小,中位数还是5.5分,保持不变.
方法总结
如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说
明数据中存在许多较小的极端值.中位数、平均数都是描述数值型数据的集中趋势的量,
其中样本平均数的大小与每一个样本数据有关,所以任何一个数据的改变都会引起平
均数的改变;但中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数
据,所以不是任何一个样本数据的改变都会引起中位数的改变.
巩固训练 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩单位:
如表所示:
成绩 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90
人数 2 3 2 3 4 1 1 1
分别求这些运动员成绩的众数、中位数与平均数.
[解析] 在这17个数据中, 出现了4次,出现的次数最多,即这组数据的众数是
.表中的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最
中间的一个数据,即这组数据的中位数是 .这组数据的平均数为 .
故17名运动员成绩的众数、中位数、平均数依次为,, .
探究2 极差、方差、标准差
甲、乙两名射击运动员在相同条件下各射靶10次,每次命中的环数分别如下:
甲:8,6,7,8,6,5,9,10,4,7.
乙:6,7,7,8,6,7,8,7,9,5.
问题1: 甲、乙两名射击运动员命中环数的平均数, 各是多少?
[答案] 环, 环.
问题2: 由, 能否判断两人的射击水平?
[答案] 由于 环,所以不能判断两人的射击水平.
问题3: 观察上述两组数据,你认为哪个人的射击水平更稳定?
[答案] 从数字分布来看,甲命中的环数较分散,乙命中的环数较集中.故乙的射击水
平更稳定.
极差和方差都刻画了数据的离散程度.
(1)极差是数据中最大值和最小值的差,它计算简单,但没有充分利用其他数据.
(2)方差刻画的是数据偏离平均数的离散程度,由于方差的单位是原始数据单
位的平方,为此,计算方差的算术平方根,得 ,
称 为标准差.
例2 从甲、乙两种玉米苗中各抽10株,分别测得它们的株高单位: 如下:
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
问:(1)哪种玉米苗长得高?
(2)哪种玉米苗长得齐?
[解析] (1) ,
,
,即乙种玉米苗长得高.
(2)
,
,
,即甲种玉米苗长得齐.
方法总结
计算方差、标准差的步骤:(1)算出样本数据的平均数 ;(2)算出每个样本
数据与样本数据平均数的差: ;(3)算出(2)中
的平方;(4)算出(3)中 个平方数的平均数,即得样本方差;
(5)算出(4)中方差的算术平方根,即得样本标准差.
巩固训练 甲、乙两机床同时加工直径为 的零件,为检验质量,各从中抽取6件
进行测量,数据如下:
甲:99,100,98,100,100,103.
乙:99,100,102,99,100,100.
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
[解析] (1) ,
,
.
(2)两台机床所加工零件的直径的平均值相同,又 ,所以乙机床加工零件的
质量更稳定.
探究3 样本数字特征的综合应用
问题1: 如何根据频率分布直方图估计中位数?
[答案] 在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估
计中位数的值.
问题2: 如何根据频率分布直方图估计众数?
[答案] 众数的估计值为最高矩形的中点的横坐标.
问题3: 如何根据频率分布直方图估计平均数?
[答案] 平均数的估计值等于频率分布直方图中每个小矩形的面积与小矩形底边中点的
横坐标之积的总和.
1.平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与
小矩形的面积的乘积之和近似代替.
2.中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
3.众数:众数的估计值为最高小矩形底边的中点所对应的数据.
4.标准差(或方差)越小,数据越稳定在平均数附近.当时,每一个样本数据均为 .
特别提醒:平均数、方差公式的推广
(1)若数据,, ,的平均数为,那么,, ,
,的平均数是 .
(2)若数据,, ,的平均数为,方差为 ,则
① ;
②数据,, ,的方差也为 ;
③数据,, ,的方差为 ;
④数据,, ,的方差也为,标准差为 .
例3 已知某学校的初中、高中年级的在校学生人
数之比为 ,该校为了解学生课后做作业的时
间,采用分层随机抽样的方法在初中、高中年级
的在校学生中共抽取了100名学生,调查了他们课
后做作业的时间,并根据调查结果绘制了频率分
布直方图,如图所示.
(1)在抽取的100名学生中,初中、高中年级各抽取的人数是多少?
(2)根据频率分布直方图,估计学生做作业时间的中位数和平均数.(同一组中的数
据用该组区间的中点值作代表)
[解析] (1)因为初中、高中年级的在校学生人数之比为 ,又采用分层随机抽样
的方法抽取了100人,所以在抽取的100人中,初中年级抽取的人数为 ,
高中年级抽取的人数为 .
(2)设学生做作业时间的中位数为 ,
则,解得 ,故估计学生做作业时间的中
位数为 .
设学生做作业时间的平均数为 ,
则 ,
故估计学生做作业时间的平均数为 .
方法总结
(1)利用直方图求得的众数、中位数、平均数均为估计值,与实际数据可能不
一致.
(2)在解决本题时,需要选择运算方法,掌握运算法则,求得运算结果,并根
据结果进行合理推断,获得结论.这些都是数学核心素养的内涵所在.
巩固训练 某校为了对学生的阅读素养进行检测,随机抽取了 名学生进行阅读素养评
分.规定采用百分制计分方法,现将所得的成绩按照 ,,
, 分成6组,并根据所得数据作出了如图所示的频数与频率的统计表和
频率分布直方图.由于一些特殊原因,统计表和直方图都已残缺,请对照图表中现有信
息回答问题.
分组 频数 频率
5
25
0.30
合计 1
(1)求出表中,及图中, 的值.
(2)估计该校学生阅读素养成绩的中位数及平均数.(同一组中的数据用该组区间的
中点值作代表)
[解析] (1)由频率分布直方图可得的频率为 ,
又由统计表得 的频数为5,
所以,所以, ,又由
,解得 .
(2)因为的频率为, 的频率为
,
所以估计该校学生阅读素养成绩的中位数为 (分).
估计该校学生阅读素养成绩的平均数为
(分).
1.已知16位参加百米半决赛的同学的成绩各不相同,按成绩取前8位进入决赛.如果小
刘知道了自己的成绩后,要判断能否进入决赛,那么其他15位同学成绩的下列数据,
能使他得出结论的是( ) .
C
A.平均数 B.极差 C.中位数 D.众数
[解析] 判断是否能进入决赛,只要判断是否是前8名即可,所以只要知道其他15位同
学的成绩是不是有8位高于他,也就是把其他15位同学的成绩排列后比较第8位的成绩,
其成绩高于这个成绩就能进入决赛,低于这个成绩就不能进入决赛,则这个第8位的
成绩就是这15位同学成绩的中位数.
2.已知一组数据的平均数是,标准差是 ,若将这组数据中的每一个数据都加上60,
得到一组新数据,则新数据的平均数和标准差分别为( ) .
D
A.57.2和3.6 B.57.2和56.4 C.62.8和63.6 D.62.8和3.6
[解析] 一组数据中的每一个数据都加上60后,新数据的平均数为 ,而
标准差保持不变,仍为3.6.
3.(多选题)某运动员10次射击成绩(单位:环)为7,8,9,7,4,8,9,9,7,2,
则下列关于这组数据的描述正确的是( ) .
ABD
A.众数为7和9 B.极差为7 C.中位数为7 D.方差为4.8
[解析] 将10次射击成绩(单位:环)从小到大排列为2,4,7,7,7,8,8,9,9,9,
对于选项A,因为这组数据中7和9都出现了3次,其余数出现次数小于3次,所以众数
为7和9,故选项A正确;对于选项B,这组数据中最大的数为9,最小的数为2,故极差
为7,故选项B正确;对于选项C,易知中位数为 ,故选项C错误;对于选项D,
因为 ,所以方差,故选项D正确.故选 .
4.若五个数 ,0,1,2,3的平均数为1,则这五个数的方差等于___.
2
[解析] 由,0,1,2,3的平均数为1,得,再将代入方差公式,得 .