14.4.1 用样本估计总体的集中趋势参数(课件 学案 练习)高中数学苏教版(2019)必修 第二册

文档属性

名称 14.4.1 用样本估计总体的集中趋势参数(课件 学案 练习)高中数学苏教版(2019)必修 第二册
格式 zip
文件大小 8.0MB
资源类型 教案
版本资源 苏教版(2019)
科目 数学
更新时间 2025-09-16 07:05:41

文档简介

(共48张PPT)
14.4 用样本估计总体
14.4.1 用样本估计总体的集中
趋势参数
探究点一 平均数的计算与应用
探究点二 众数与中位数的计算
探究点三 平均数、中位数、众数的应用
探究点四 根据频率分布直方图估计总体
的集中趋势
【学习目标】
1.结合具体实例,经历用样本估计总体的集中趋势参数(平均数、
中位数、众数)的过程,并理解集中趋势参数的统计含义.
2.结合具体实例,认识样本与总体的关系,逐步建立用样本估计总
体的思想,尝试运用统计语言描述总体的特征.
知识点一 平均数
1.平均数概念:一般地,我们把总体中所有数据的算术平均数称为总
体均值,它通常可以代表总体的水平.在进行统计分析时,我们经常
用样本平均数估计总体均值.
2.平均数的计算
(1)如果有个数据,, ,,那么称为这 个
数据,, ,的平均数,一般记为 ___________.
(2)加权平均数:一般地,若取值为,, ,的频数分别为 ,
, , ,则这组数据的平均数为_______________.
(3)一般地,若取值为,, ,的频率分别为,, , ,则其
平均数为 .
(4)分层抽样中的样本平均数:
如果将总体分为层,第层抽取的样本为,, ,,第 层的样
本量为,样本平均数为,,2, ,.记 ,则所有数据
的样本平均数 .
【诊断分析】判断正误.(正确的打“√”,错误的打“×”)
(1)总体平均数是总体的一项重要特征.( )

[解析] 总体平均数是总体的一项重要特征.
(2)对于一组数据,样本平均数与总体平均数 一定相等.( )
×
[解析] 由于样本是总体中的部分数据,随着选取样本的不同,样本平均
数也不一定相同,但总体平均数是一个确定的数值,故两者不一定相等.
(3)对于同一个总体,选取不同的样本,样本平均数也不同.( )
×
[解析] 对于同一个总体而言,选取不同的样本,其平均数不一定相
同,也不一定不同.
知识点二 众数与中位数
1.众数:一般地,我们将一组数据中出现__________的那个数据叫作
该组数据的众数.
次数最多
2.中位数:一般地,将一组数据按照从小到大的顺序排成一列,如果
数据的个数为奇数,那么排在________的数据就是这组数据的中位
数;如果数据的个数为偶数,那么,排在正中间的两个数据的_____
___即为这组数据的中位数.
平均数、众数和中位数都是刻画数据集中趋势的度量值.
正中间
平均数
【诊断分析】判断正误.(正确的打“√”,错误的打“×”)
(1)中位数是一组数据中间的数.( )
×
(2)众数是一组数据中出现次数最多的数.( )

(3)平均数不一定是原数据中的数.( )

(4)中位数一定是原数据中的数.( )
×
探究点一 平均数的计算与应用
例1(1)某学校为了调查高一年级学生的体育锻炼情况,从甲、乙、
丙3个班中,用简单随机抽样的方法获得了部分学生一周的锻炼时间
(单位: ),数据整理后如下表所示:
甲 6 6.5 7 7.5 8 - - -
乙 6 7 8 9 10 11 12 -
丙 3 4.5 6 7.5 9 10.5 12 13.5
则估计该校高一年级学生一周的平均锻炼时间为____ .
8.2
[解析] 样本中甲、乙、丙三个班级的平均锻炼时间分别为



则样本平均数为 ,
故估计该校高一年级学生一周的平均锻炼时间为 .
(2)[2024·天津河东区期末] 某校组织“校
园安全”知识测试,随机调查600名学生,
将他们的测试成绩按照[50,60),
[60,70),[70,80),[80,90),
分成五组,得到如图所示的频率
79.5
分布直方图,若每组数据以所在区间的中点值为代表,则估计这600名
学生成绩的平均数为_____.
[解析] 由题图知
,解得 ,
所以估计这600名学生成绩的平均数为 .
变式(1) [2024·宿迁期末]已知样本数据,, ,
的平均数为5,则,,, 的平均数
为( )
A.6 B.7 C.15 D.16
[解析] 设样本数据,,,的平均数为,则 ,
,,的平均数为,解得 ,
所以,,,的平均数为 .
故选B.

(2)有4万个不小于70的两位数,从中随机抽取了3000个数据,统
计如下表:
个数 800 1300 900
平均数 78.1 85 91.9
请根据表格中的信息,估计这4万个数据的平均数为_______.
[解析] 这3000个数据的平均数为 ,
用样本平均数估计总体平均数,可估计这4万个数据的平均数为85.23.
[素养小结]
(1)给定一组数据,要求其平均数可直接套用公式,若这组数据都在
某一数据附近波动,可用平均数的简化公式计算,若这组数据某些数
多次出现,可用加权平均数公式计算.
(2)在频率分布表中,平均数可用各组区间的中点值与对应频率之积
的和进行估计.
探究点二 众数与中位数的计算
例2 在一次中学生田径运动会上,参加男子跳高比赛的17名学生的成
绩如下表所示:
1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90
人数 2 3 2 3 4 1 1 1
则这17名学生成绩的众数、中位数与平均数分别为_______________
__ _(结果保留至小数点后两位).
,,
[解析] 在这17个数据中,1.75出现了4次,出现的次数最多,即这组数据
的众数是1.75.
表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据
1.70是最中间的一个数据,即这组数据的中位数是1.70.
这组数据的平均数 .
故这17名学生成绩的众数、中位数分别为, ,平均数约为1.69.
变式(1) 已知一组数据:96,97,95,99,96,98,100,97,98,
96,则下列说法不正确的是( )
A.这组数据的中位数是97 B.这组数据的众数是96
C.这组数据的平均数是97 D.这组数据的极差是5

[解析] 由题意,这组数据从小到大排列为95,96,96,96,97,97,
98,98,99,100,共10个数据,所以这组数据的中位数是
,故A中说法正确;
在这组数据中,96出现的次数最多,所以这组数据的众数是96,故B中
说法正确;
这组数据的平均数是

故C中说法不正确;
这组数据的极差是 ,故D中说法正确.故选C.
(2)已知一组数据5,2,,5,8,9,且 .若该组数据的
众数是中位数的 ,则该组数据的平均数为( )
A.6 B.6.5 C.7 D.7.5
[解析] , 这组数据从小到大排列为2,5,5, ,8,9,
则该组数据的众数是5,
又该组数据的众数是中位数的, 该组数据的中位数是6,即,
解得 ,
则该组数据的平均数为 ,故选A.

[素养小结]
求中位数时,要将这组数据按从小到大的顺序排成一列,取中间的
一个数或中间两个数的平均数作为中位数.
探究点三 平均数、中位数、众数的应用
例3 某公司销售部有销售人员15人,销售部为了制定某种商品的月
销售定额,统计了这15人某月的销售量如下:
销售量(件) 1800 510 250 210 150 120
人数 1 1 3 5 3 2
(1)求这15位销售人员该月销售量的平均数、中位数及众数.
解:这15位销售人员该月销售量的平均数是
,
表中的数据是按从大到小的顺序排列的,处于中间位置的是210,所
以中位数是210,
而210出现了5次,次数最多,所以众数是210.
(2)假设销售部负责人把每位销售人员的月销售定额制定为320件,
你认为是否合理,为什么?如果不合理,请你制定一个较为合理的
月销售定额.
解:不合理.
因为15人中有13人的销售量不到320件,320虽是所给一组数据的平
均数,但它却不能很好地反映销售人员的一般水平.
销售定额制定为210件合适些,因为210既是中位数,又是众数,且
是大部分人能达到的定额.
变式 下表是某校高一年级两个班各11名同学1分钟仰卧起坐的成绩
(单位:次):
一班 20 34 26 29 28 34 35 36 34 34 31
二班 26 28 30 28 30 31 30 36 30 31 30
解:一班数据的平均数为 ,
一班数据从小到大排列为20,26,28,29,31,34,34,34,34,35,36,所以一班数据的中位数为34,
34出现的次数最多,所以一班数据的众数为34.
(1)这两组数据的平均数,中位数和众数各是多少?
二班数据的平均数为 ,
二班数据从小到大排列为26,28,28,30,30,30,30,30,31,31,36,所以二班数据的中位数为30,
30出现的次数最多,所以二班数据的众数为30.
(2)你认为用哪个数表示两个班的成绩更合适?
解:用平均数表示两个班的成绩更合适.
[素养小结]
平均数、中位数和众数的优缺点
名称 优点 缺点
众数 ①体现了样本数据的最 大集中点; ②容易计算 ①它只能表达样本数据中很少的一
部分信息;
②有时无法客观地反映总体特征
中位 数 ①不受数据组中极端值 的影响; ②容易计算,便于利用 中间数据的信息 对极端值不敏感
名称 优点 缺点
平均 数 能较好地反映样本数据 全体的信息 ①任何一个数据的改变都会引起平
均数的改变
②数据越“离群”,对平均数的影响
越大
续表
探究点四 根据频率分布直方图估计总体的集中趋势
例4 [2024·南京期末] 从全校学生的期末
考试成绩(均为整数)中随机抽取一个
样本,将样本分成5组,绘成频率分布直
方图,如图中从左到右各小组的小矩形
(1)求样本容量;
解:根据题意,样本容量为 .
的高的比为 ,最左边的一组频数是6.
(2)求 这一组的频数及频率;
解:这一组的频率为 ,所以频数为
.
(3)估计这组样本数据的众数和中位数(每组数据以所在区间的中
点值为代表).
解:根据频率分布直方图,可估计这组
样本数据的众数为 .
成绩在内的频率为,成绩在内的频率为 ,成
绩在内的频率为,设中位数为,则 ,
所以,解得 ,
故估计这组样本数据的中位数为113.
变式 (多选题)[2024 江苏连云港高级中学月考] 从参加环保知
识竞赛的学生中抽出60名学生,将其成绩(均为整数)整理后作出
频率分布直方图,如图所示,则下列说法正确的是(每组数据以所
在区间的中点值为代表)( )
A. 这一组的频数是15
B.估计这组数据的众数是74.5
C.估计这组数据的平均数是72.5
D.估计这组数据的中位数约是72.8



[解析] 对于A,因为 这一组的
频率是 ,所
以 这一组的频数是
,故A正确;
对于B, 一组的频率最大,人数最多,所以估计这组数据的
众数是 ,故B正确;
对于C,估计这组数据的平均数是
,故C错误;
对于D,前3组的频率之和为,前4组的频率之和为 ,所以中位数在区间内,设中位数为 ,则
,解得 ,所以估计这组数据的中位数约是,故D正确.故选 .
[素养小结]
用频率分布表或频率分布直方图求数字特征:
(1)众数是最高的小长方形的底边的中点对应的数据.
(2)中位数左右两侧直方图的面积相等.
(3)平均数等于每个小长方形的面积乘小长方形底边中点的横坐标
的和.
(4)利用直方图求得的众数、中位数、平均数均为近似值,往往与实
际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.
1.一组数据的平均数、中位数都是唯一的,众数不一定唯一,可以有一
个,也可以有多个,还可以没有.如果有两个数据出现的次数相同,并且
比其他数据出现的次数都多,那么这两个数据都是这组数据的众数.众
数一定是原数据中的数,平均数和中位数都不一定是原数据中的数.
2.中位数仅与数据排列位置有关,某些数据的变动对中位数没有影响,
中位数可能在所给数据中(数据个数为奇数或数据个数为偶数且中
间两数相等),也可能不在所给的数据中(数据个数为偶数且中间两
数不相等).当一组数据的个别数据变动较大时,可以用中位数描述其
集中趋势.
3.众数考查各数据出现的频率,大小只与这组数据中的部分数据有关,
当一组数据中有多个数据多次重复出现时,众数往往更能反映问题.
4.总体平均数是总体的一项重要特征.另外,某类个体在总体中所占的
比例也是人们关心的一项总体特征,例如全部产品中合格品所占的比
例、赞成某项政策的人在整个人群中所占的比例等.
1.众数、中位数、平均数的实际意义
平均数是统计中最常用的数据代表值,比较可靠和稳定,因为它与每一
个数据都有关,反映出来的信息也最充分.平均数既可以描述一组数据
本身的整体平均情况,也可以用来作为不同组数据比较的一个标准,它
在生活中应用最广泛.
中位数作为一组数据的代表,可靠性比较差,因为它只利用了部分数据.
但当一组数据的个别数据偏大或偏小时,用中位数来描述该组数据的
集中趋势就比较合适.
众数作为一组数据的代表,可靠性也比较差,因为它也只利用了部分数
据.在一组数据中,如果个别数据有很大的波动,且某个数据出现的次数
最多,此时用众数表示这组数据的集中趋势就比较合适.
在实际中,经常用平均数、中位数或者众数进行一些判断.
例1(1)(多选题)如图所示,下列频率分布直方图显示了三种不
同的分布形态.图①形成对称形态,图②形成“右拖尾”形态,图③形
成“左拖尾”形态,根据所给图作出以下判断,正确的是( )



A.图①的平均数中位数 众数
B.图②的平均数 众数 中位数
C.图②的众数 中位数 平均数
D.图③的平均数 中位数 众数



[解析] 图①的频率分布直方图是对称的,所以平均数中位数 众数,
故A正确;
图②众数最小,“右拖尾”平均数大于中位数,故B错误,C正确;
图③“左拖尾”众数最大,平均数小于中位数,故D正确.故选 .



(2)(多选题)某市举办了普法知识竞赛,从
参赛者中随机抽取1000人,统计成绩后,画出频
率分布直方图如图所示,则( )
A.
B.估计样本中普法知识竞赛成绩的平均数为85分
C.估计样本中普法知识竞赛成绩的众数为95分
D.估计样本中普法知识竞赛成绩的中位数为88分


[解析] 对于A,由频率分布直方图可知,
,解得 ,所以A正确;
对于B,估计样本中普法知识竞赛成绩的平均数为
, 所以B错误;
对于C,估计样本中普法知识竞赛成绩的众数为95分,所以C正确;
对于D,因为前3组的频率和为 ,前4组的频率
和为 ,所以中位数在80到90之间,设中位数为 ,则
,解得 ,所以D错误.故选 .
2.分层抽样的样本平均数的计算
例2(1) [2024·甘肃天水一中高一月考]在某学校的期中考试中,高
一、高二、高三年级的参考人数分别为600,800,600.现用分层抽样的
方法从三个年级中抽取样本,经计算得高一、高二、高三年级数学成
绩的样本平均数分别为93,81,99,则全校学生数学成绩的平均数为
( )
A.92 B.91 C.90 D.89
[解析] 由题意,全校学生数学成绩的平均数为
.故选C.

(2)[2024·江苏南通期中]采用分层抽样的方法对某校共600名高三
年级学生的身高(单位:厘米)进行调查,得到该年级男生、女生
和全体学生的平均身高分别为,, ,则该年级的男
生人数为( )
A.315 B.320 C.325 D.330
[解析] 设该年级的男生人数为,则女生人数为 ,则
,即
,即,
所以 . 故选C.
√14.4 用样本估计总体
14.4.1 用样本估计总体的集中趋势参数
【课前预习】
知识点一
2.(1) (2)
诊断分析
(1)√ (2)× (3)× [解析] (1)总体平均数是总体的一项重要特征.
(2)由于样本是总体中的部分数据,随着选取样本的不同,样本平均数也不一定相同,但总体平均数是一个确定的数值,故两者不一定相等.
(3)对于同一个总体而言,选取不同的样本,其平均数不一定相同,也不一定不同.
知识点二
1.次数最多 2.正中间 平均数
诊断分析
(1)× (2)√ (3)√ (4)×
【课中探究】
探究点一
例1 (1)8.2 (2)79.5 [解析] (1)样本中甲、乙、丙三个班级的平均锻炼时间分别为×(6+6.5+7+7.5+8)=7(h),×(6+7+8+9+10+11+12)=9(h),×(3+4.5+6+7.5+9+10.5+12+13.5)=8.25(h),则样本平均数为=8.2,故估计该校高一年级学生一周的平均锻炼时间为8.2 h.
(2)由题图知10×(x+0.015+0.020+0.030+0.025)=1,解得x=0.010,所以估计这600名学生成绩的平均数为55×0.1+65×0.15+75×0.2+85×0.3+95×0.25=79.5.
变式 (1)B (2)85.23 [解析] (1)设样本数据x1,x2,…,xn的平均数为,则2x1+1,2x2+1,…,2xn+1的平均数为2+1=5,解得=2,所以3x1+1,3x2+1,…,3xn+1的平均数为3+1=3×2+1=7.故选B.
(2)这3000个数据的平均数为=85.23,用样本平均数估计总体平均数,可估计这4万个数据的平均数为85.23.
探究点二
例2 1.75,1.70,1.69 [解析] 在这17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70.这组数据的平均数=×(1.50×2+1.60×3+1.65×2+1.70×3+1.75×4+1.80×1+1.85×1+1.90×1)=≈1.69.故这17名学生成绩的众数、中位数分别为1.75,1.70,平均数约为1.69.
变式 (1)C (2)A [解析] (1)由题意,这组数据从小到大排列为95,96,96,96,97,97,98,98,99,100,共10个数据,所以这组数据的中位数是×(97+97)=97,故A中说法正确;在这组数据中,96出现的次数最多,所以这组数据的众数是96,故B中说法正确;这组数据的平均数是×(95+96+96+96+97+97+98+98+99+100)=97.2,故C中说法不正确;这组数据的极差是100-95=5,故D中说法正确.故选C.
(2)∵5探究点三
例3 解:(1)这15位销售人员该月销售量的平均数是=320,
表中的数据是按从大到小的顺序排列的,处于中间位置的是210,所以中位数是210,
而210出现了5次,次数最多,所以众数是210.
(2)不合理.
因为15人中有13人的销售量不到320件,320虽是所给一组数据的平均数,但它却不能很好地反映销售人员的一般水平.
销售定额制定为210件合适些,因为210既是中位数,又是众数,且是大部分人能达到的定额.
变式 解:(1)一班数据的平均数为(20+34+26+29+28+34+35+36+34+34+31)÷11=341÷11=31,一班数据从小到大排列为20,26,28,29,31,34,34,34,34,35,36,
所以一班数据的中位数为34,34出现的次数最多,所以一班数据的众数为34.
二班数据的平均数为(26+28+30+28+30+31+30+36+30+31+30)÷11=330÷11=30,二班数据从小到大排列为26,28,28,30,30,30,30,30,31,31,36,
所以二班数据的中位数为30,30出现的次数最多,所以二班数据的众数为30.
(2)用平均数表示两个班的成绩更合适.
探究点四
例4 解:(1)根据题意,样本容量为6÷=48.
(2)[105.5,120.5)这一组的频率为=,所以频数为48×=18.
(3)根据频率分布直方图,
可估计这组样本数据的众数为=113.
成绩在[75.5,90.5)内的频率为,成绩在[90.5,105.5)内的频率为,成绩在[105.5,120.5)内的频率为,设中位数为x,则x∈[105.5,120.5),所以++(x-105.5)×=,解得x=113,
故估计这组样本数据的中位数为113.
变式 ABD [解析] 对于A,因为[79.5,89.5)这一组的频率是(89.5-79.5)×0.025=0.25,所以[79.5,89.5)这一组的频数是60×0.25=15,故A正确;对于B,[69.5,79.5)一组的频率最大,人数最多,所以估计这组数据的众数是=74.5,故B正确;对于C,估计这组数据的平均数是44.5×0.1+54.5×0.15+64.5×0.15+74.5×0.3+84.5×0.25+94.5×0.05=70.5,故C错误;对于D,前3组的频率之和为0.4,前4组的频率之和为0.7,所以中位数在区间[69.5,79.5)内,设中位数为x,则(x-69.5)×0.03=0.1,解得x≈72.8,所以估计这组数据的中位数约是72.8,故D正确.故选ABD.14.4 用样本估计总体
14.4.1 用样本估计总体的集中趋势参数
1.A [解析] 众数是在一组数据中出现次数最多的数,所以一定会在原始数据中出现.故选A.
2.B [解析] 由小到大排列为1,2,4,5,6,6,8,15,所以中位数为=5.5,众数为6.故选B.
3.D [解析] 由题意得=3,故x1+x2+x3+x4+x5=15,则=
==10.故选D.
4.B [解析] 因为样本数据a1,a2,…,a10的平均数为,所以=,即a1+a2+…+a10=10,同理可得,b1+b2+…+b10=10,所以样本数据a1,b1,a2,b2,…,a10,b10的平均数为=(+),故选B.
5.C [解析] 若这100个数都是8,则这100个数据的中位数是8,故A错误;因为100为偶数,所以第50个和第51个数据的平均数为中位数,故C正确,B,D不正确.故选C.
6.D [解析] 由题意得,这组数据的平均数为=,除m外,将数据按从小到大的顺序排列可得1,2,2,2,6,8,结合m的任意性可知中位数为2,则=2×2,解得m=7.故选D.
7.D [解析] 由题意知,众数m0=5;中位数是第15个数与第16个数的平均数,由表知将数据从小到大排列后的第15个数是5,第16个数是6,所以中位数me==5.5;平均数x=×(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈6.∴m08.BCD [解析] 对于A,中位数是3,则这5个数从小到大排列后,第3个数是3,第1,2个数是2才能使众数为2,所以第1个数不是1,选项A错误;对于B,有可能出现点数1,例如1,2,5,6,6,选项B正确;对于C,有可能出现点数1,例如1,1,1,2,5,选项C正确;对于D,有可能出现点数1,例如1,4,5,5,5,选项D正确.故选BCD.
9.AB [解析] 依题意得(0.015+0.025+0.035+0.005+2a)×10=1,解得a=0.010.对于A,估计该样本的众数为75,故A正确;对于B,估计该样本的平均数为45×0.1+55×0.15+65×0.25+75×0.35+85×0.1+95×0.05=68.5,故B正确;对于C,∵10×(0.010+0.015+0.025)=0.5,∴估计该样本的中位数为70,故C错误;对于D,估计该校学生中成绩超过80分的占(0.010+0.005)×10×100%=15%,故D错误.故选AB.
10.95 [解析] 设20名女生的平均成绩为分,由题意得50×92=30×90+20×,∴=95,即20名女生的平均成绩为95分.
11.324 [解析] 依题意高一年级女生的近视人数为1250×60%-390=360,则高一年级近视学生的平均度数为×300+×350=324.
12.91 [解析] 92+89+88+93+91+89+92+94=728=91×8,而91×7=637,728-637=91,因此去掉的两个数的和是182,观察这8个数中最大和最小的数,去掉的两个数是88和94,不见的分是91.
13.解:(1)若x为这组数据的一个众数,则x的可能取值为164,165,168,170,
即x的取值集合为{164,165,168,170}.
(2)若x=174,则估计该校高一年级新生的平均身高为×(152+155+158+164+164+165+165+165+166+167+168+168+169+170+170+170+171+174+174+175)=166.5(cm).
14.解:(1)由(0.2+0.8+0.6+a+0.1)×0.5=1,解得a=0.3.
(2)估计该样本数据的平均数=0.1×0.25+0.4×0.75+0.3×1.25+0.15×1.75+0.05×2.25=1.075.
由0.5×(0.2+0.8)=0.5×(0.6+0.3+0.1)=0.5,
估计该样本数据的中位数为1.
(3)不一定.
理由:①不知道各批鱼的汞含量分布是否都和这批鱼相同;②样本指标只能作为估计值.(理由说明一点就可以)
15.7.8 [解析] 这组数据共五个数,中位数为8,则从小到大排列时,8的前面有两个数,后面也有两个数,又唯一的众数为9,所以有两个9,其余数字均只出现过一次,则最大数字为9,又极差为3,所以最小数字为6,所以这组数据为6,7,8,9,9,则平均数为=7.8.
16.[3,5] [解析] 根据题意,实数1,5,x,y的平均数为4,则有1+5+x+y=4×4,即x+y=10.分6种情况讨论:①若该四个数按从小到大的顺序排列,1,5位于中间,则x,y位于两侧,此时中位数是3;②若该四个数按从小到大的顺序排列,1,x位于中间,则5,y位于两侧,此时x≤5,y≤1,不符合题意;③若该四个数按从小到大的顺序排列,1,y位于中间,则x,5位于两侧,此时y≤5,x≤1,不符合题意;④若该四个数按从小到大的顺序排列,5,x位于中间,则1,y位于两侧,则有1≤x≤5,故∈[3,5];⑤若该四个数按从小到大的顺序排列,5,y位于中间,则x,1位于两侧,此时1≤y≤5,故∈[3,5];⑥若该四个数按从小到大的顺序排列,x,y位于中间,则1,5位于两侧,可知x=y=5,故=5,此时中位数是5.综上这四个数的中位数的取值范围是[3,5].14.4 用样本估计总体
14.4.1 用样本估计总体的集中趋势参数
【学习目标】
  1.结合具体实例,经历用样本估计总体的集中趋势参数(平均数、中位数、众数)的过程,并理解集中趋势参数的统计含义.
  2.结合具体实例,认识样本与总体的关系,逐步建立用样本估计总体的思想,尝试运用统计语言描述总体的特征.
◆ 知识点一 平均数
1.平均数概念:一般地,我们把总体中所有数据的算术平均数称为总体均值,它通常可以代表总体的水平.在进行统计分析时,我们经常用样本平均数估计总体均值.
2.平均数的计算
(1)如果有n个数据a1,a2,…,an,那么称为这n个数据a1,a2,…,an的平均数,一般记为=    .
(2)加权平均数:一般地,若取值为x1,x2,…,xn的频数分别为f1,f2,…,fn,则这组数据的平均数为      .
(3)一般地,若取值为x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均数为x1p1+x2p2+…+xnpn.
(4)分层抽样中的样本平均数:
如果将总体分为k层,第j层抽取的样本为xj1,xj2,…,,第j层的样本量为nj,样本平均数为,j=1,2,…,k.记
【诊断分析】 判断正误.(正确的打“√”,错误的打“×”)
(1)总体平均数是总体的一项重要特征. (  )
(2)对于一组数据,样本平均数与总体平均数一定相等. (  )
(3)对于同一个总体,选取不同的样本,样本平均数也不同. (  )
◆ 知识点二 众数与中位数
1.众数:一般地,我们将一组数据中出现    的那个数据叫作该组数据的众数.
2.中位数:一般地,将一组数据按照从小到大的顺序排成一列,如果数据的个数为奇数,那么排在    的数据就是这组数据的中位数;如果数据的个数为偶数,那么,排在正中间的两个数据的    即为这组数据的中位数.
平均数、众数和中位数都是刻画数据集中趋势的度量值.
【诊断分析】 判断正误.(正确的打“√”,错误的打“×”)
(1)中位数是一组数据中间的数. (  )
(2)众数是一组数据中出现次数最多的数. (  )
(3)平均数不一定是原数据中的数. (  )
(4)中位数一定是原数据中的数. (  )
◆ 探究点一 平均数的计算与应用
例1 (1)某学校为了调查高一年级学生的体育锻炼情况,从甲、乙、丙3个班中,用简单随机抽样的方法获得了部分学生一周的锻炼时间(单位:h),数据整理后如下表所示:
甲 6 6.5 7 7.5 8 - - -
乙 6 7 8 9 10 11 12 -
丙 3 4.5 6 7.5 9 10.5 12 13.5
则估计该校高一年级学生一周的平均锻炼时间为    h.
(2)[2024·天津河东区期末] 某校组织“校园安全”知识测试,随机调查600名学生,将他们的测试成绩按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五组,得到如图所示的频率分布直方图,若每组数据以所在区间的中点值为代表,则估计这600名学生成绩的平均数为    .
变式 (1)[2024·宿迁期末] 已知样本数据2x1+1,2x2+1,…,2xn+1的平均数为5,则3x1+1,3x2+1,…,3xn+1的平均数为 (  )                 
A.6 B.7
C.15 D.16
(2)有4万个不小于70的两位数,从中随机抽取了3000个数据,统计如下表:
数据x 70≤x≤79 80≤x≤89 90≤x≤99
个数 800 1300 900
平均数 78.1 85 91.9
请根据表格中的信息,估计这4万个数据的平均数为    .
[素养小结]
(1)给定一组数据,要求其平均数可直接套用公式,若这组数据都在某一数据附近波动,可用平均数的简化公式计算,若这组数据某些数多次出现,可用加权平均数公式计算.
(2)在频率分布表中,平均数可用各组区间的中点值与对应频率之积的和进行估计.
◆ 探究点二 众数与中位数的计算
例2 在一次中学生田径运动会上,参加男子跳高比赛的17名学生的成绩如下表所示:
成绩(单位:m) 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90
人数 2 3 2 3 4 1 1 1
则这17名学生成绩的众数、中位数与平均数分别为    (结果保留至小数点后两位).
变式 (1)已知一组数据:96,97,95,99,96,98,100,97,98,96,则下列说法不正确的是 (  )
A.这组数据的中位数是97
B.这组数据的众数是96
C.这组数据的平均数是97
D.这组数据的极差是5
(2)已知一组数据5,2,x,5,8,9,且5A.6 B.6.5
C.7 D.7.5
[素养小结]
求中位数时,要将这组数据按从小到大的顺序排成一列,取中间的一个数或中间两个数的平均数作为中位数.
◆ 探究点三 平均数、中位数、众数的应用
例3 某公司销售部有销售人员15人,销售部为了制定某种商品的月销售定额,统计了这15人某月的销售量如下:
销售量(件) 1800 510 250 210 150 120
人数 1 1 3 5 3 2
(1)求这15位销售人员该月销售量的平均数、中位数及众数.
(2)假设销售部负责人把每位销售人员的月销售定额制定为320件,你认为是否合理,为什么 如果不合理,请你制定一个较为合理的月销售定额.
变式 下表是某校高一年级两个班各11名同学1分钟仰卧起坐的成绩(单位:次):
一班 20 34 26 29 28 34 35 36 34 34 31
二班 26 28 30 28 30 31 30 36 30 31 30
(1)这两组数据的平均数,中位数和众数各是多少
(2)你认为用哪个数表示两个班的成绩更合适
[素养小结]
平均数、中位数和众数的优缺点
名称 优点 缺点
众数 ①体现了样本数据的最大集中点; ②容易计算 ①它只能表达样本数据中很少的一部分信息; ②有时无法客观地反映总体特征
中位数 ①不受数据组中极端值的影响; ②容易计算,便于利用中间数据的信息 对极端值不敏感
平均数 能较好地反映样本数据全体的信息 ①任何一个数据的改变都会引起平均数的改变 ②数据越“离群”,对平均数的影响越大
◆ 探究点四 根据频率分布直方图估计总体的集中趋势
例4 [2024·南京期末] 从全校学生的期末考试成绩(均为整数)中随机抽取一个样本,将样本分成5组,绘成频率分布直方图,如图中从左到右各小组的小矩形的高的比为2∶3∶6∶4∶1,最左边的一组频数是6.
(1)求样本容量;
(2)求[105.5,120.5)这一组的频数及频率;
(3)估计这组样本数据的众数和中位数(每组数据以所在区间的中点值为代表).
变式 (多选题)[2024·江苏连云港高级中学月考] 从参加环保知识竞赛的学生中抽出60名学生,将其成绩(均为整数)整理后作出频率分布直方图,如图所示,则下列说法正确的是(每组数据以所在区间的中点值为代表) (  )
A.[79.5,89.5)这一组的频数是15
B.估计这组数据的众数是74.5
C.估计这组数据的平均数是72.5
D.估计这组数据的中位数约是72.8
[素养小结]
用频率分布表或频率分布直方图求数字特征:
(1)众数是最高的小长方形的底边的中点对应的数据.
(2)中位数左右两侧直方图的面积相等.
(3)平均数等于每个小长方形的面积乘小长方形底边中点的横坐标的和.
(4)利用直方图求得的众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.14.4 用样本估计总体
14.4.1 用样本估计总体的集中趋势参数
一、选择题
1.下列数字特征一定会在原始数据中出现的是 (  )                 
A.众数 B.中位数
C.平均数 D.都不会
2.样本数据2,1,4,5,6,6,15,8的中位数和众数分别是 (  )
A.5,6 B.5.5,6
C.6,6 D.5.5,5
3.样本中共有5个个体,其值分别为x1,x2,x3,x4,x5.若该样本的平均数为3,则3x1+1,3x2+1,3x3+1,3x4+1,3x5+1的平均数为 (  )
A.1 B.3
C.9 D.10
4.样本数据a1,a2,…,a10的平均数为,样本数据b1,b2,…,b10的平均数为,则样本数据a1,b1,a2,b2,…,a10,b10的平均数为 (  )
A.+ B.(+)
C.2(+) D.(+)
5.已知100个数据的中位数是8,则下列说法正确的是 (  )
A.这100个数据中一定有且仅有50个数小于或等于8
B.把这100个数据从小到大排列后,8是第50个数据
C.把这100个数据从小到大排列后,8是第50个和第51个数据的平均数
D.把这100个数据从小到大排列后,8是第50个和第49个数据的平均数
6.[2024·扬州模拟] 某同学测得连续7天的最低气温分别为1,2,2,m,6,2,8(单位℃),若这组数据的平均数是中位数的2倍,则m= (  )
A.2 B.3
C.6 D.7
7.为了普及环保知识,增强环保意识,某中学随机抽取30名学生参加环保知识竞赛,得分(满分为10分)的频数分布表如表:
得分 3 4 5 6 7 8 9 10
频数 2 3 10 6 3 2 2 2
设得分的中位数为me,众数为m0,平均数为x,则 (  )
A.me=m0=x B.me=m0C.me8.(多选题)掷骰子5次,分别记录每次骰子出现的点数,根据这5次的统计结果,下列选项中有可能出现点数1的是 (  )
A.中位数是3,众数是2
B.平均数是4,中位数是5
C.极差是4,平均数是2
D.平均数是4,众数是5
9.(多选题)[2024·常州期末] 一条青果巷,半部常州史!这个“江南名士第一巷”,不仅历史文化底蕴深厚,而且红色文化资源密集.基于此,某中学积极响应,举行了一次“红色青果”知识竞赛.学校在竞赛后,随机抽查了100人的成绩整理后得到如图所示的频率分布直方图,则下列结论正确的有(同一组中的数据以该组区间的中点值为代表) (  )
A.估计该样本的众数为75
B.估计该样本的平均数为68.5
C.估计该样本的中位数为75
D.估计该校学生中成绩超过80分的占20%
二、填空题
10.[2024·深圳中学高一期末] 某班有50名学生,该班一次数学测试的平均成绩是92分,如果30名男生的平均成绩为90分,那么20名女生的平均成绩为    分.
11.[2024·邯郸期末] 某校高一年级有1250人,全年级学生的近视率为60%,男生中有390人近视.学校医务室计划通过抽样的方法估计高一年级所有近视学生的平均度数.现从近视的学生中通过分层抽样的方法得到容量为100的样本,样本中男生的平均度数为300度,女生的平均度数为350度,则估计高一年级近视学生的平均度数为    度.
12.9名评委对某参赛选手打分,记分员在去掉一个最高分和一个最低分后算出平均分为91,复核员在复核时发现只有8个评委的给分:92,89,88,93,91,89,92,94,还有一个评委的给分不见了,假设记分员的计算准确,则另一个分数为    .
三、解答题
13.从某校高一年级新生中随机抽取一个容量为20的身高样本,数据如下(单位:cm,数据间无大小顺序要求):
152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,x,174,175.
(1)若x为这组数据的一个众数,求x的取值集合;
(2)若x=174,试估计该校高一年级新生的平均身高.
14.[2024·江苏无锡期末] 有一种鱼的身体吸收汞,一定量的身体中汞的含量超过其体重的1.0×10-6的鱼被人食用后就会对人体产生危害.在100条鱼的样本中发现汞含量(乘百万分之一)统计得到频率分布直方图,如图所示.
(1)求频率分布直方图中a的值.
(2)请估计该样本数据的平均数和中位数(同一组数据以该组区间的中点值为代表).
(3)从实际情况看,许多鱼汞含量超标的原因是这些鱼在出售之前没有被检测过,你认为每批这种鱼的平均汞含量都比1.0×10-6大吗 请说明理由.
15.某射击运动员连续射击5次,命中的环数(环数为整数)形成的一组数据中,中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为    .
16.[2024·上海青浦区期中] 已知实数1,5,x,y的平均数为4,则这四个数的中位数的取值范围是    .