(共39张PPT)
第九章 统计
9.2 用样本估计总体
9.2.3 总体集中趋势的估计
新课程标准解读 学科核心素养
结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数). 数据分析、数学运算
理解集中趋势参数的统计含义. 数学运算、数学建模
教材梳理 明要点
现从甲、乙、丙三个厂家生产的同一种家电产品中,各抽取8件产品,对其使用寿命进行跟踪调查,其结果如下(单位:年):甲:3,4,5,6,8,8,8,10;乙:4,6,6,6,8,9,12,13;丙:3,3,4,7,9,10,11,12.
问题
三家广告中都称其产品的使用寿命为8年,利用初中所学的知识,你能说明为什么吗?
?情境导入
[提示]
[提示]
甲厂家电的使用寿命是样本数据的众数,乙厂家电的使用寿命是样本数据的平均数,丙厂家电的使用寿命是样本数据的中位数.
知识点一 众数、中位数、平均数的定义
1.众数:一组数据中出现次数_______的数.
2.中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在_______位置的数(或中间两个数的_________).
3.平均数:一组数据的_____除以数据个数所得到的数.
?新知初探
最多
中间
平均数
和
知识点二 总体集中趋势的估计
1.平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.
2.对一个单峰的频率分布直方图来说,如果直方图的形状是对称的(图①),那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”(图②),那么平均数大于中位数;如果直方图在左边“拖尾”(图③),那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.
3.在频率分布直方图中,_______是最高矩形底边中点的横坐标,_________左边和右边的直方图的小矩形的面积应该_______,_______ ______的估计值等于频率分布直方图中每个小矩形底边中点的横坐标与小矩形的面积的乘积之和.
[提醒]
众数
中位数
相等
样本平
均数
[提醒]
(2)平均数、中位数、众数之间的区别:①一组数据中的平均数、中位数都是唯一的;②众数一定是原数据中的数,平均数和中位数都不一定是原数据中的数;③众数可以有一个,也可以有多个,也可以没有.如果在一组数据中有两个或两个以上的数据出现的次数相同,并且比其他数据出现的次数都多,那么这几个数据都是这组数据的众数.
1.一组数据30,29,28,27,26,24,23,22的中位数为( )
A.26 B.27
C.26和27 D.26.5
【答案】 D
?预习自测
2.一组数据a,0,1,2,3,若该组数据的平均数为1,则a=( )
A.0 B.2
C.1 D.-1
【答案】 D
3.已知一组数据:15,17,14,10,15,17,17,16,14,12,则该组数据的众数是________.
【答案】 17
【解析】 10,12,16各出现1次,14,15各出现了2次,17出现的次数为3次,是最多的,故众数为17.
题型探究 提技能
【答案】 ①②
题型一
众数、中位数、平均数的计算
【解析】 把两组数据按从小到大的顺序分别排列,得
甲:8,12,13,20,22,24,25,26,27,37
乙:9,11,13,14,18,19,20,21,21,23
[方法总结1]
[方法总结1]
平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的,计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.
1
给定一组数据15,17,14,10,12,17,17,16,14,12,设这组数据的平均数为a,中位数为b,众数为c,则( )
A.a>b>c B.c>b>a
C.c>a>b D.b>c>a
【答案】 B
题型二
利用频率分布直方图估计总体的集中趋势
(2)由题图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03×(x-70),所以x≈73.3,即这80名学生的数学成绩的中位数为73.3分.
(4)分数在[40,80)内的频率为(0.005+0.015+0.020+0.030)×10=0.7,所以样本中80分以下的学生人数为80×0.7=56.
[方法总结2]
[方法总结2]
用频率分布直方图估计众数、中位数、平均数
(1)众数:取最高小长方形底边中点的横坐标作为众数;
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数;
(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
2
(多选)随着生活水平的不断提高,我国居民的平均身高也在增长.某市为了调查本市小学一年级男生身高情况,从某小学一年级随机抽取了100名同学进行身高测量,得到频率分布直方图(如图),其中右侧三组小长方形面积满足2S2=S1+S3.则下列说法正确的是( )
A.身高在[130,140)范围内的频率为0.18
B.身高的众数的估计值为115 cm
C.身高的中位数的估计值为125 cm
D.身高的平均数的估计值为121.8 cm,
【答案】 ABD
3.据了解,某公司的33名职工月工资(单位:元)如下:
题型三
平均数、中位数、众数的应用
职务 董事长 副董事长 董事 总经理 经理 管理员 职员
人数 1 1 2 1 5 3 20
工资 11 000 10 000 9 000 8 000 6 500 5 500 4 000
(1)求该公司职工月工资的平均数、中位数、众数(精确到元);
(2)假设副董事长的工资从10 000元提升到20 000元,董事长的工资从11 000元提升到30 000元,那么新的平均数、中位数、众数又是多少(精确到元)
(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.
(3)在这个问题中,中位数和众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能准确反映这个公司员工的工资水平.
[方法总结3]
[方法总结3]
众数、中位数、平均数的意义
(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大;
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.
3
下面是某快餐店所有工作人员一周的收入表(每个岗位仅有一人):
(1)计算所有人员的周平均收入;
(2)这个平均收入能反映打工人员的周收入的一般水平吗?为什么?
(3)去掉老板的收入后,再计算平均收入,这能代表打工人员的周收入的水平吗?
老板 大厨 二厨 采购员 杂工 服务生 会计
6 000元 900元 700元 800元 640元 640元 820元
随堂检测 重反馈
1.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是( )
A.85,85,85 B.87,85,86
C.87,85,85 D.87,85,90
【答案】 C
【解析】 从小到大列出所有数学成绩:75,80,85,85,85,85,90,90,95,100,观察知众数和中位数均为85,计算得平均数为87.故选C.
2.跳水比赛共有7名裁判分别给出某选手的原始评分,评定该选手的成绩时,从7个原始评分中去掉1个最高分、1个最低分,得到5个有效评分.5个有效评分与7个原始评分相比,一定不会改变的数字特征是( )
A.众数 B.平均数
C.中位数 D.极差
【答案】 C
【解析】 从7个原始评分去掉1个最高分、1个最低分,得到5个有效评分,其平均数、极差、众数都可能会发生改变,不变的数字特征是中位数.故选C.
3.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30).根据直方图,这200名学生中每周的自习时间的平均数是( )
A.23.75
B.23.875
C.24.25
D.23.25
【答案】 B
【解析】 平均数为18.75×0.02×2.5+21.25×0.10×2.5+23.75× 0.16×2.5+26.25×0.08×2.5+28.75×0.04×2.5=23.875.故选B.
4.(多选)已知一组数据为-2,6,8,x,12,且这组数据的众数为6,那么下列说法正确的是( )
A.数据的中位数是6 B.数据的平均数是6
C.x=6 D.x=8
【答案】 ABC
5.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为165,那么由此求出的平均数与实际平均数的差是________.
【答案】 2第九章 9.2 9.2.3
课时跟踪检测
A组·基础巩固
1.已知一组数据x1,x2,x3,x4,x5的平均数是2,那么另一组数据2x1-3,2x2-3,2x3-3,2x4-3,2x5-3的平均数为( )
A.1 B.2
C.3 D.4
【答案】 A
【解析】 因为一组数据x1,x2,x3,x4,x5的平均数是2,所以另一组数据2x1-3,2x2-3,2x3-3,2x4-3,2x5-3的平均数为2×2-3=1.故选A.
2.某射击小组有20人,教练将他们某次射击的数据绘制成如下表格,则这组数据的众数和中位数分别是( )
环数 5 6 7 8 9 10
人数 1 2 7 6 3 1
A.7,7 B.8,7.5
C.7,7.5 D.8,6
【答案】 C
【解析】 由表格可知,射中7环的有7人,人数最多,所以这组数据的众数为7;这组数据按照从小到大顺序排列,则第10个数据是7,第11个数据是8,所以中位数为=7.5.故选C.
3.下面是某实验中学某班第一小组5位同学的立定跳远、跳绳、800 m跑的成绩折线图(如图所示),则这5位同学立定跳远的中位数,跳绳的平均数,800 m跑的众数分别是( )
A.1.98,131,3.88 B.1.87,130,3.88
C.1.98,130,3.88 D.1.98,130,3.65
【答案】 C
【解析】 由图中数据,可得立定跳远的中位数为1.98,跳绳的平均数为×[(130-1)+(130+5)+(130-7)+(130+2)+(130+1)]=×130×5=130,800 m跑的众数为3.88.故选C.
4.如图,是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,记由该直方图得到的数学考试成绩的众数、中位数和平均数分别为a,b,c,则( )
A.b>c>a B.a>b>c
C.>b D.>c
【答案】 A
【解析】 由频率分布直方图可知:众数a==75;中位数应落在[70,80)区间内,则有0.004×10+0.018×10+0.04×(b-70)=0.5,解得b=77;平均数c=0.004×10×+0.018×10×+0.04×10×+0.032×10 ×+0.006×10×=2.2+11.7+30+27.2+5.7=76.8.所以b>c>a.故选A.
5.(多选)小华所在的班级共有50名学生,一次体检测量了全班学生的身高,由此求得该班学生的平均身高是1.65米,而小华的身高是1.66米,则下列说法正确的是( )
A.1.65米是该班学生身高的平均水平
B.班上比小华高的学生人数不会超过25
C.这组身高数据的中位数不一定是1.65米
D.这组身高数据的众数不一定是1.65米
【答案】 ACD
【解析】 由平均数所反映的意义知A选项正确;由中位数与平均数的关系确定C选项正确;由众数与平均数的关系确定D选项正确;由于平均数受一组数据中的极端值的影响,故B选项错误.因此选ACD.
6.(多选)下列关于平均数、中位数、众数的说法中错误的是( )
A.中位数可以准确地反映出总体的情况
B.平均数可以准确地反映出总体的情况
C.众数可以准确地反映出总体的情况
D.平均数、中位数、众数都有局限性,都不能准确地反映出总体的情况
【答案】 ABC
【解析】 中位数不受少数极端值的影响,对极端值的不敏感也会成为缺点,故A错误;平均数较好地反映样本数据全体的信息,但是样本数据质量较差时使用平均数描述数据的中心位置就会与实际情况产生较大差异,故B错误;众数体现了样本数据的最大集中点,但对其他数据信息的忽略使得无法客观反映总体特征,故C错误;由以上理由可知D正确.故选ABC.
7.2021年电影《长津湖》累计票房逾57亿,该片点燃了每个人心中对英雄的崇敬之情,也更加显示出如今和平生活的来之不易.某影院记录了观看此片的70位观众的年龄,其中年龄位于区间[10,20)的有10位,位于区间[20,30)的有20位,位于区间[30,40)的有25位,位于区间[40,50]的有15位,则这70位观众年龄的众数的估计值为________.
【答案】 35
【解析】 由于25>20>15>10,故众数位于区间[30,40),所以众数的估计值为=35.
8.一组数据1,10,5,2,x,2,且2<x<5,若该数据的众数是中位数的倍,则该数据的平均数为________.
【答案】 4
【解析】 根据题意知,该组数据的众数是2,则中位数是2÷=3,把这组数据从小到大排列为1,2,2,x,5,10,则=3,解得x=4,所以这组数据的平均数为=×(1+2+2+4+5+10)=4.
9.某学校为了解师生党史的学习情况,用分层随机抽样的方式从4 600名师生中抽取200名师生进行党史知识测试,得到如图所示的频率分布直方图,其中分组的区间为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则200名师生测试成绩的中位数是________.(结果保留整数部分)
【答案】 72
【解析】 由频率分布直方图知前三组频率之和为10×(0.01+0.015+0.02)=0.45<0.5,前四组频率之和10×(0.01+0.015+0.02+0.03)=0.75>0.5,所以中位数在第四组,设中位数为m,则0.45+(m-70)×0.03=0.5,解得m≈72.
10.甲、乙、丙三个厂家在广告中都声称,他们生产的同一品牌节能灯在正确使用的情况下,使用寿命都不低于8年.后来质量检测部门对他们的产品进行抽查,抽查的各8个产品使用寿命的统计结果如下(单位:年):
甲厂:6,6,6,8,8,9,9,12;
乙厂:6,7,7,7,9,10,10,12;
丙厂:6,8,8,8,9,9,10,10.
(1)把以上三组数据的平均数、众数、中位数填入下表:
平均数 众数 中位数
甲厂
乙厂
丙厂
(2)估计这三个厂家的推销广告分别利用了哪一种统计量;
(3)如果你是顾客,应该选哪个厂家的节能灯?为什么?
【解析】 (1)甲厂:8,6,8;乙厂:8.5,7,8;丙厂:8.5,8,8.5.
(2)甲厂利用了平均数或中位数;乙厂利用了平均数或中位数;丙厂利用了平均数或众数或中位数.
(3)选丙厂的节能灯.因为无论从哪种统计量来看,与其他两个厂家相比,丙厂水平都比较高或持平.
B组·综合运用
11.“小康县”的经济评价标准为:①年人均收入不低于7 000元;②年人均食品支出(单位:元)不高于年人均收入的35%.某县有40万人,年人均收入如表所示,年人均食品支出如图所示,则该县( )
年人均收入/元 0 2 000 4 000 6 000 8 000 10 000 12 000 16 000
人数/万人 6 3 5 5 6 7 5 3
A.是小康县
B.达到标准①,未达到标准②,不是小康县
C.达到标准②,未达到标准①,不是小康县
D.两个标准都未达到,不是小康县
【答案】 B
【解析】 由图表可知年人均收入为(2 000×3+4 000×5+6 000×5+8 000×6+10 000×7+12 000×5+16 000×3)÷40=7 050(元),达到了标准①;年人均食品支出为(1 400×3+2 000×5+2 400×13+3 000×10+3 600×9)÷40=2 695(元),则年人均食品支出占年人均收入的×100%≈38.2%>35%,未达到标准②,所以该县不是小康县.
12.某市政府部门为了解该市的“全国文明城市”创建情况,在该市的12个区县(市)中随机抽查了甲、乙两县,考核组对他们的创建工作进行量化考核.在这两个县的量化考核分数(均为整数)中各随机抽取20个,得到如图所示的统计图(用频率分布直方图估计总体时,同一组中的数据用该组区间的中点值作代表).关于甲、乙两县的量化考核分数,下列结论正确的是( )
A.甲县量化考核分数的平均数小于乙县量化考核分数的平均数
B.甲县量化考核分数的中位数小于乙县量化考核分数的中位数
C.甲县量化考核分数的众数不小于乙县量化考核分数的众数
D.甲县量化考核分数不低于80的个数多于乙县
【答案】 C
【解析】 由题中条形图知甲县量化考核分数的平均数为×(57×2+58×1+59×1+67×1+68×2+69×2+79×6+87×1+88×2+89×1+98×1)=74.8,中位数为79,众数为79,量化考核分数不低于80的个数为1+2+1+1=5.由题中频率分布直方图知乙县量化考核分数的平均数为(55×0.02+65×0.025+75×0.03+85×0.02+95×0.005)×10=71.5,中位数为70+=,众数为75,量化考核分数不低于80的个数为(0.02+0.005)×10×20=5.综上,A、B、D错误,C正确.
13.(多选)某班班主任为了了解该班学生寒假期间做家务劳动的情况,随机抽取该班15名学生,调查得到这15名学生寒假期间做家务劳动的天数分别是8,18,15,20,16,20,19,18,19,10,6,20,20,23,25,则下列结论正确的是( )
A.这组数据的中位数是18
B.这组数据的众数是20
C.若在记录数据时漏掉了一个数据,则新数据的众数是20
D.若在记录数据时漏掉了一个数据,则新数据的中位数是19
【答案】 BC
【解析】 将这组数据按从小到大的顺序排列得6,8,10,15,16,18,18,19,19,20,20,20,20,23,25,根据中位数和众数的定义,可得数据的中位数和众数分别是19和20,故A错误,B正确;若在记录数据时漏掉了一个数据,则新数据中出现次数最多的数仍然是20,故C正确;若在纪录数据时漏掉的数据大于或等于19,则新数据的中位数是18.5,故D错误.故选BC.
14.某校高一年级举行了一次数学竞赛,为了解本次竞赛学生的成绩情况,从中抽取了部分学生的分数(得分取正整数,满分为100)作为样本(样本容量为n)进行统计,按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出频率分布直方图(如图所示),已知得分在[50,60),[90,100]内的频数分别为8,2.
(1)求样本容量n和频率分布直方图中的x,y的值;
(2)估计本次竞赛学生成绩的众数、中位数、平均数.
【解析】 (1)由题意可知,样本容量n==50,
y==0.004,
x=0.1-0.016-0.040-0.010-0.004=0.030.
(2)由题中频率分布直方图可知,本次竞赛学生成绩的众数约为75.
设中位数为m,∵(0.016+0.030)×10<0.5<(0.016+0.030+0.040)×10,则m∈[70,80),∴(0.016+0.030)×10+(m-70)×0.040=0.5,
解得m=71,即本次竞赛学生成绩的中位数约为71.
本次竞赛学生成绩的平均数约为55×0.16+65×0.3+75×0.4+85×0.1+95×0.04=70.6.
C组·拓展提升
15.已知一组数据丢失了其中一个,剩下的六个数据分别是4,4,7,4,8,10,若这组数据的平均数与众数的和是中位数的2倍,则丢失数据的所有可能值组成的集合为________.
【答案】 {-9,5,33}
【解析】 设丢失的数据为x,则这七个数据的平均数为,众数是4,因为这组数据的平均数与众数的和是中位数的2倍,若x≤4,则中位数为4,此时+4=2×4,解得x=-9;若4<x<7,则中位数为x,此时+4=2x,解得x=5;若x≥7,则中位数为7,此时+4=2×7,解得x=33.综上可知,丢失数据的所有可能的取值为-9,5,33,其构成的集合为{-9,5,33}.
16.随着移动互联网的发展,与餐饮美食相关的手机软件层出不穷,现从某市使用A和B两款订餐软件的商家中分别随机抽取100个,对它们的“平均送达时间”进行统计,得到频率分布直方图如图所示(同一组中的数据用该组区间的中点值为代表):
(1)使用A款订餐软件的商家中“平均送达时间”不超过30分钟的商家有多少个?
(2)试估计该市使用A款订餐软件的商家的“平均送达时间”的众数和中位数(结果保留一位小数);
(3)如果以“平均送达时间”的平均数作为决策依据,从A和B两款订餐软件中选择一款订餐,你会选择哪款?
【解析】 (1)使用A款订餐软件的商家中“平均送达时间”不超过30分钟的商家共有100×(0.006+0.034)×10=40(个).
(2)依题图可得,使用A款订餐软件的商家中“平均送达时间”的众数为55 min,
由频率分布直方图可知中位数在[30,40)内,
设中位数为x min,则(0.006+0.034)×10+(x-30)×0.012=0.5,解得x≈38.3.
(3)使用A款订餐软件的商家中“平均送达时间”的平均数为15×0.06+25×0.34+35×0.12+45×0.04+55×0.4+65×0.04=40 min,
使用B款订餐软件的商家中“平均送达时间”的平均数为15×0.04+25×0.2+35×0.56+45×0.14+55×0.04+65×0.02=35 min,
因为40>35,所以选B款订餐软件订餐.
21世纪教育网(www.21cnjy.com)