2021-2022学年新教材高中数学第14章统计 14.4 用样本估计总体课件+学案(6份打包)苏教版必修第二册

文档属性

名称 2021-2022学年新教材高中数学第14章统计 14.4 用样本估计总体课件+学案(6份打包)苏教版必修第二册
格式 zip
文件大小 10.8MB
资源类型 教案
版本资源 苏教版(2019)
科目 数学
更新时间 2022-04-16 07:25:21

文档简介

(共45张PPT)
14.4 用样本估计总体
14.4.1 用样本估计总体的集中趋势参数
基础认知·自主学习
【概念认知】
平均数、中位数、众数的定义
(1)平均数、均值
①(算术)平均数:一组数据的和除以数据个数所得到的数.
②总体均值:一般地,我们把总体中所有数据的___________,称为总体的均
值.
③一个平均数的计算公式
一般地,若取值为x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均数为
x1p1+x2p2+…+xnpn.
算术平均数
(2)众数
一般地,我们将一组数据中出现次数_____的那个数据叫作该组数据的众数.
(3)中位数
一般地,将一组数据按照从小到大的顺序排成一列,如果数据的个数为奇数,
那么排在_______的数据就是这组数据的中位数;如果数据的个数为偶数,那
么,排在正中间的_________________即为这组数据的中位数.
最多
正中间
两个数据的平均数
学情诊断·课时测评
销售量 1 800 510 250 210 150 120
人数 1 1 3 5 3 2
测试项目 测试成绩
甲 乙 丙
教学能力 85 73 73
科研能力 70 71 65
组织能力 64 72 84用样本估计总体的集中趋势参数
平均数、中位数、众数的定义
(1)平均数、均值
①(算术)平均数:一组数据的和除以数据个数所得到的数.
②总体均值:一般地,我们把总体中所有数据的算术平均数,称为总体的均值.
③一个平均数的计算公式
一般地,若取值为x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均数为x1p1+x2p2+…+xnpn.
(2)众数
一般地,我们将一组数据中出现次数最多的那个数据叫作该组数据的众数.
(3)中位数
一般地,将一组数据按照从小到大的顺序排成一列,如果数据的个数为奇数,那么排在正中间的数据就是这组数据的中位数;如果数据的个数为偶数,那么,排在正中间的两个数据的平均数即为这组数据的中位数.
1.奥运会体操比赛的计分规则为:当评委亮分后,其成绩先去掉一个最高分,去掉一个最低分,再计算剩下分数的平均值,这是因为(  )
A.减少计算量
B.避免故障
C.剔除异常值
D.活跃赛场气氛
【解析】选C.因为在体操比赛的评分中使用的是平均分,记分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量公平.
2.已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是(  )
A.平均数>中位数>众数
B.平均数<中位数<众数
C.中位数<众数<平均数
D.众数=中位数=平均数
【解析】选D.众数、中位数、平均数都是50.
3.(教材练习改编)某厂抽查了某节能灯泡的使用寿命数据如下:
寿命/天 450 550 600 650 700
只数 20 10 30 15 25
则这些节能灯泡使用寿命的平均数是________.
【解析】这些节能灯泡使用寿命的平均数是
=597.5(天).
答案:597.5天
4.一组样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x等于________.
【解析】根据题意知,中位数22=,则x=21.
答案:21
5.某学校抽查了某班级某月5天的用电量,数据如表(单位:度):
度数 9 10 11
天数 3 1 1
(1)求这个班级这5天用电量的平均数;
(2)求这个班级这5天用电量的众数、中位数;
(3)学校共有36个班级,若该月按22天计,试估计该校该月的总用电量.
【解析】(1)因为(9×3+10×1+11×1)÷5=9.6(度),
所以这个班级这5天用电量的平均数为9.6度.
(2)这个班级这5天用电量的众数是9度,中位数是9度.
(3)因为9.6×36×22=7 603.2(度),
所以估计该校该月的总用电量为7 603.2度.
一、单选题
1.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是 (  )
A.3.5 B.3 C.-0.5 D.-3
【解析】选D.因为错将其中一个数据105输入为15,所以此时求出的数与实际的数的差是15-105=-90,因此平均数之间的差是-90÷30=-3.
2.已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有(  )
A.a>b>c B.a>c>b
C.c>a>b D.c>b>a
【解析】选D.由题意得a=(16+18+15+11+16+18+18+17+15+13)==15.7,中位数为16,众数为18,则b=16,c=18,所以c>b>a.
3.设矩形的长为a,宽为b,其比满足b∶a=≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数与标准值0.618比较,正确的结论是(  )
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次总体平均数与标准值接近程度相同
D.两个批次总体平均数与标准值接近程度不能确定
【解析】选A.计算可得甲批次样本的平均数为0.617,乙批次样本的平均数为0.613,由此估计两个批次的总体平均数分别为0.617,0.613,则甲批次的总体平均数与标准值更接近.
4.某排球队12名队员的年龄如表所示:
年龄/岁 18 19 20 21 22
人数 1 4 3 2 2
则该队队员年龄的众数与中位数分别是(  )
A.19岁,19岁 B.19岁,20岁
C.20岁,20岁 D.20岁,22岁
【解析】选B.由众数的定义可知,数据19出现的次数最多,达4次,12个数据中,由小到大排列后第6个与第7个位置上的数都是20,这两个数的平均数也是20.所以该队队员年龄的众数与中位数分别是19岁,20岁.
5.为了了解某校九年级1 600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据直方图的数据,下列结论错误的是(  )
A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25
B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5
C.该校九年级学生1分钟仰卧起坐的次数超过30次的约有320人
D.该校九年级学生1分钟仰卧起坐的次数少于20次的约有32人
【解析】选D.频率分布直方图中,中位数是频率为0.5的分界点的横坐标,由频率分布直方图可知前2组的频率和为×5=0.4,因此中位数出现在第3组.设中位数为x,则×0.08=0.1,x=26.25,所以A正确;众数是指样本中出现频率最高的数,在频率分布直方图中通常取纵坐标最高的一组区间的中点,所以众数为=27.5,所以B正确;仰卧起坐次数超过30的频率为0.04×5=0.2,所以频数为1 600×0.2=320人,所以C正确;仰卧起坐的次数少于20次的人数约有0.02×5×1 600=160,所以D错误.
二、多选题
6.已知一组数据:12,5,9,5,14,则下列说法正确的是(  )
A.平均数是9 B.中位数是9
C.众数是5 D.均值为5
【解析】选ABC.数据描述类的题目,主要考查了平均数、中位数、众数的计算,题目数据比较简单,先从简单的众数入手,C是正确的,其次从小到大排列:5,5,9,12,14,B是正确的,再算平均数,所以A也正确,均值实际上是平均数,所以选项D错误.
7.小华所在的年级一班共有50名学生,一次体检测量了全班学生的身高,由此求得该班学生的平均身高是1.65米,而小华的身高是1.66米,则下列说法正确的是(  )
A.1.65米是该班学生身高的平均水平
B.班上比小华高的学生人数不会超过25人
C.这组身高数据的中位数不一定是1.65米
D.这组身高数据的众数不一定是1.65米
【解析】选ACD.本题考查了一组数据中的中位数、平均数、众数的概念及三者的求法,由平均数所反映的意义知A选项正确,由中位数与平均数的关系确定C选项正确,由众数与平均数的关系确定D选项正确,由于平均数受一组数据中的极端值的影响,故B选项错误.
三、填空题
8.已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________.
【解析】=6.
答案:6
9.某商场一天中售出某品牌运动鞋20双,其中各种尺码鞋的销量如表所示:
鞋的尺码(单位:cm) 23.5 24 24.5 25 25.5 26
销售量(单位:双) 3 4 4 7 1 1
则这20双鞋的尺码组成的一组数据中,众数是________,中位数是________,在众数和中位数中,商场最感兴趣的是________.
【解析】因为这组数据中,25出现的次数最多,所以这组数据的众数是25;将该组数据从小到大排列后,处于中间位置的是第10个数和第11个数,均为24.5,故该组数据的中位数是24.5;在众数和中位数中,商场最感兴趣的是众数.
答案:25 24.5 众数
四、解答题
10.某公司销售部有销售人员15人,为了制定某种商品的月销售定额,统计了这15人某月的销售量如表:
销售量 1 800 510 250 210 150 120
人数 1 1 3 5 3 2
(1)求这15位销售人员该月销售量的平均数、中位数及众数;
(2)假设销售部负责人把每位销售人员的月销售定额定为320件,你认为是否合理,为什么?如果不合理,请你制定一个较合理的销售定额.
【解析】(1)平均数为×(1 800×1+510×1+250×3+210×5+150×3+120×2)=320,中位数为210,众数为210.
(2)不合理.因为15人中有13人的销售量达不到320件,也就是说,320虽是这一组数据的平均数,但它却不能反映销售人员的一般水平.销售定额为210件合理些,这是由于210既是中位数,又是众数,是绝大部分人都能达到的销售量.
11.某校欲招聘一名数学教师,学校对甲、乙、丙三位候选人进行了三项能力测试,各项测试成绩满分均为100分,根据结果择优录用.三位候选人的各项测试成绩如表所示:
测试项目 测试成绩
甲 乙 丙
教学能力 85 73 73
科研能力 70 71 65
组织能力 64 72 84
(1)如果根据三项测试的平均成绩,谁将被录用,说明理由;
(2)根据实际需要,学校将教学、科研和组织三项能力测试得分按5∶3∶2的比例确定每人的成绩,谁将被录用,说明理由.
【解析】(1)甲的平均成绩为(85+70+64)÷3=73,
乙的平均成绩为(73+71+72)÷3=72,
丙的平均成绩为(73+65+84)÷3=74,
所以候选人丙将被录用.
(2)甲的测试成绩为:(85×5+70×3+64×2)÷(5+3+2)=76.3,
乙的测试成绩为:(73×5+71×3+72×2)÷(5+3+2)=72.2,
丙的测试成绩为:(73×5+65×3+84×2)÷(5+3+2)=72.8,
所以候选人甲将被录用.
一、选择题
1.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为me,众数为mo,平均数为,则(  )
A.me=mo= B.me=mo<
C.me【解析】选D.由题图可知,30名学生的得分情况依次为:2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数,即me=5.5,5出现的次数最多,故mo=5,=×[2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10]≈5.97.于是得mo2.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各1人,则该小组成绩的平均数、众数、中位数分别是(  )
A.85分、85分、85分
B.87分、85分、86分
C.87分、85分、85分
D.87分、85分、90分
【解析】选C.由题意知,该学习小组共有10人,因此众数和中位数都是85分,
平均数为=87分.
3.(多选)下列各选项不正确的是(  )
A.中位数是一组数据中间的数
B.众数是一组数据中出现次数最多的数,给定一组数据,它可有多个众数,也可能没有众数
C.一个样本的众数、平均数和中位数都是唯一的
D.若改变一组数据中其中的一个数,则这组数据的平均数、中位数、众数都会发生改变
【解析】选ACD.A.由中位数的定义可知,中位数与一组数据个数的奇偶性有关.
B.由众数的定义可知,众数是一组数据中出现次数最多的数.在数据1,1,1,2,2,2,3中就有两个众数1和2;在数据1,3,4,6,8,2中就没有众数.
C.由众数的定义可知,一个样本的众数可能有一个,也可能有多个.
D.若改变一组数据中的一个数,则这组数据的平均数一定会改变,而中位数与众数可能不变.
二、填空题
4.已知一组数据按从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么这组数据的众数是________,平均数是________.
【解析】因为中位数为5,
所以=5,即x=6.
所以该组数据的众数为6,
平均数为=5.
答案:6 5
5.某高校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班有50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是________分.
【解析】由题意得,该校数学建模兴趣班的平均成绩是=85(分).
答案:85
6.某住宅小区6月份随机抽查了该小区6天的用水量(单位:吨),结果分别是30,34,32,37,28,31,那么,请你估计该小区6月份(30天)的总用水量约是________吨.
【解析】(30+34+…+31)÷6=32(吨),所以估计该小区6月份(30天)的总用水量约是32×30=960(吨).
答案:960
7.从甲、乙、丙三个厂家生产的同一种产品中分别抽取8件产品,对其使用寿命(单位:年)进行追踪调查的结果如下:甲:3,4,5,6,8,8,8,10;乙:4,6,6,6,8,9,12,13;丙:3,3,4,7,9,10,11,12.
三个厂家广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数.
甲:________,乙:________,丙:________.
【解析】对甲分析:8出现的次数最多,故运用了众数;对乙分析:8既不是众数,也不是中位数,求平均数可得,平均数=×(4+6+6+6+8+9+12+13)=8,故运用了平均数;对丙分析:共8个数据,最中间的是7和9,故其中位数是8,即运用了中位数.
答案:众数 平均数 中位数
三、解答题
8.下面是某快餐店所有工作人员一周的收入表:
老板 大厨 二厨 采购员 杂工 服务生 会计
3 000元 450元 350元 400元 320元 320元 410元
(1)计算所有人员的周平均收入;
(2)这个平均收入能反映打工人员的周收入的一般水平吗?为什么?
(3)去掉老板的收入后,再计算平均收入,这能代表打工人员的周收入的水平吗?
【解析】(1)周平均收入1=(3 000+450+350+400+320+320+410)=750(元).
(2)这个平均收入不能反映打工人员的周收入水平,可以看出打工人员的收入都低于平均收入,因为老板收入特别高,这是一个异常值,对平均收入产生了较大的影响,并且他不是打工人员.
(3)去掉老板的收入后的周平均收入2=(450+350+400+320+320+410)=375(元).
这能代表打工人员的周收入水平.
PAGE
8(共61张PPT)
14.4.2 用样本估计总体的离散程度参数
基础认知·自主学习
学情诊断·课时测评
平均数 方差 中位数 命中9环及以上
甲 7 1.2 1
乙 5.4 3
平均数 方差 中位数 命中9环及以上
甲 7 1.2 7 1
乙 7 5.4 7.5 3用样本估计总体的离散程度参数
1.一组数据的极差、样本方差、样本标准差
(1)一组数据的极差
我们把一组数据的最大值与最小值的差称为极差.
(2)样本方差和样本标准差
设一组样本数据x1,x2,…,xn,其平均数为,则称s2=为这个样本的方差.其算术平方根s=为样本的标准差,分别简称样本方差、样本标准差.
(3)一个方差的计算公式
一般地,若取值为x1,x2,…,xn的频率分别为p1,p2,…,pn,则其方差为p1(x1―)2+p2(x2-)2+…+pn(xn-)2.
2.分层抽样数据的方差
一般地,如果总体分为k层,第j层抽取的样本为xj1,xj2,…,,第j层的样本量为nj,样本平均数为j,样本方差为s,j=1,2,…,k.记=n,那么,所有数据的样本方差为==.
1.某校为了丰富校园文化,举行初中生书法大赛,决赛设置了6个获奖名额,共有11名选手进入决赛,选手决赛得分均不相同.若知道某位选手的决赛的得分,要判断他是否获奖,只需知道这11名学生决赛得分的(  )
A.中位数  B.平均数
C.众数  D.方差
【解析】选A.由中位数的概念,即最中间一个或两个数据的平均数;可知11人成绩的中位数是第6名的得分.根据题意可得:参赛选手要想知道自己是否能进入前6名,只需要了解自己的得分以及全部得分的中位数,比较即可.
2.在某项体育比赛中,七位裁判为一选手打出的分数如下:90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为(  )
A.92,2 B.92,2.8
C.93,2 D.93,2.8
【解析】选B.去掉一个最高分95与一个最低分89后,所得的5个数分别为90,90,93,94,93,
所以==92,
s2===2.8.
3.(教材练习改编)已知数据x1,x2,x3,…,xn是上海普通职工n(n≥3,n∈N*)个人的年收入,设这n个数据的中位数为x,平均数为y,方差为z,如果再加上世界首富的年收入xn+1,则这n+1个数据中,下列说法正确的是(  )
A.年收入平均数大大增大,中位数一定变大,方差可能不变
B.年收入平均数大大增大,中位数可能不变,方差变大
C.年收入平均数大大增大,中位数可能不变,方差也不变
D.年收入平均数可能不变,中位数可能不变,方差可能不变
【解析】选B.插入大的极端值,平均数增加,中位数可能不变,方差也因为数据更加分散而变大.
4.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为________.
分数 5 4 3 2 1
人数 20 10 30 30 10
【解析】因为这100人成绩的平均数
===3,
所以这100人成绩的方差s2=×[20×22+10×12+30×02+30×12+10×22]==,
所以标准差s=.
答案:
5.甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
【解析】(1)甲的平均数甲=(99+100+98+100+100+103)=100,
乙的平均数乙=(99+100+102+99+100+100)=100.
s=[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
s=[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)两台机床所加工零件的直径的平均值相同,
又s>s,所以乙机床加工零件的质量更稳定.
一、单选题
1.下列说法正确的是(  )
A.在两组数据中,平均数较大的一组极差较大
B.平均数反映数据的集中趋势,方差反映数据波动的大小
C.方差的求法是求出各个数据与平均值的差的平方后再求和
D.在记录两个人射击环数的两组数据中,方差大说明射击水平稳定
【解析】选B.平均数表示一组数据的集中趋势,平均数的大小并不能说明该组数据极差的大小,所以A错误;方差公式s2=,所以C错误;方差大说明射击水平不稳定,所以D错误.
2.已知数据x1,x2,…,xn的平均数为,方差为s2,则2x1+3,2x2+3,…,2xn+3的平均数和方差分别为(  )
A.和s2 B.2+3和4s2
C.2+3和s2 D.2+3和4s2+12s+9
【解析】选B.因为数据x1,x2,…,xn的平均数为,方差为s2,所以2x1+3,2x2+3,…,2xn+3的平均数和方差分别为2+3和4s2.
3.现有10个数,其平均数为3,且这10个数的平方和是100,那么这组数据的标准差是(  )
A.1  B.2 C.3  D.4
【解析】选A.由s2= eq \b\lc\(\rc\)(\a\vs4\al\co1(x+x+…+x)) -2,得s2=×100-32=1,即标准差s=1.
4.下列各组数中方差最小的是(  )
A.1,2,3,4,5 B.2,2,2,4,5
C.3,3,3,3,3 D.2,3,2,3,2
【解析】选C.对于选项A:平均数为(1+2+3+4+5)=3,方差为s2=[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2;对于选项B:平均数为(2+2+2+4+5)=3,方差为s2=[(2-3)2+(2-3)2+(2-3)2+(4-3)2+(5-3)2]=1.6;
对于选项C:平均数为(3+3+3+3+3)=3,方差为s2=[(3-3)2+(3-3)2+(3-3)2+(3-3)2+(3-3)2]=0;
对于选项D:平均数为(2+3+2+3+2)=2.4;
方差为s2=[(2-2.4)2+(3-2.4)2+(2-2.4)2+(3-2.4)2+(2-2.4)2]=0.24.
因为0<0.24<1.6<2,所以选项C中的数据方差最小.
5.甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为甲,乙,标准差分别为s甲,s乙,则(  )
A.甲<乙,s甲s乙
C.甲>乙,s甲乙,s甲>s乙
【解析】选C.由题图知,甲同学除第二次考试成绩略低于乙同学外,其他考试成绩都远高于乙同学,可知甲>乙.题图中数据显示甲同学的成绩比乙同学稳定,所以s甲二、多选题
6.一组数据的平均数是,标准差是s,将这组数据中的每个数据都乘以2,所得到的一组新数据的平均值和标准差分别是(  )
A. B.2 C.s D.2s
【解析】选BD.设该组数据为x1,x2,…,xn,都乘以2后的新数据为2x1,2x2,…,2xn.
由题意知=,则=2.
又s=,
所以=2s.
7.如图为某市2020年国庆节7天假期的楼房认购量与成交量的折线图,小明同学根据折线图对这7天的认购量(单位:套)与成交量(单位:套)作出如下判断,则判断错误的为(  )
A.日成交量的中位数是16
B.日成交量超过日平均成交量的有2天
C.10月7日认购量的增幅大于10月7日成交量的增幅
D.日认购量的方差大于日成交量的方差
【解析】选ABC.7天假期的楼房认购量为:91,100,105,107,112,223,276;
成交量为:8,13,16,26,32,38,166.
对于A,日成交量的中位数是26,故A错误;
对于B,因为日平均成交量为=,
日成交量超过日平均成交量的只有10月7日1天,故B错误;
对于C,10月7日认购量的增幅为≈146%,10月7日成交量的增幅为≈337%,即10月7日认购量的增幅小于10月7日成交量的增幅,故C错误;
对于D,因为日认购量的数据分布较分散些,方差大些,故D正确.
三、填空题
8.一组数据按从小到大的顺序排列为1,2,2,x,5,10,其中x≠5,已知该组数据的中位数是众数的倍,则该组数据的标准差为________.
【解析】由题意,可得该组数据的众数为2,所以=×2=3,解得x=4,
故该组数据的平均数为=4.
所以该组数据的方差为×[(1-4)2+(2-4)2+(2-4)2+(4-4)2+(5-4)2+(10-4)2]=9,即标准差为3.
答案:3
9.对一个做直线运动的质点的运动过程观测了8次,得到如表所示的数据.
观测序号i 1 2 3 4 5 6 7 8
观测数据ai 40 41 43 43 44 46 47 48
上述统计数据的平均数是______,方差是______.
【解析】上述统计数据的平均数=×(40+41+43+43+44+46+47+48)=44,
方差=×[(40-44)2+(41-44)2+(43-44)2+(43-44)2+(44-44)2+(46-44)2+(47-44)2+(48-44)2]=7.
答案:44 7
四、解答题
10.某学校有高中学生500人,其中男生320人,女生180人.有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的平均数为173.5 cm,方差为17 cm2,女生样本的平均数为163.83 cm,方差为30.03 cm2.
(1)根据以上信息,能够计算出总样本的平均数和方差吗?为什么?
(2)如果已知男、女样本量按比例分配,你能计算出总样本的平均数和方差各为多少吗?
(3)如果已知男、女的样本量都是25,你能计算出总样本的平均数和方差各为多少吗?它们分别作为总体平均数和方差的估计合适吗?为什么?
【解析】(1)不能,因为本题没有给出男、女生的样本量,或者男、女生样本量的比例,故无法计算出总样本的平均数和方差.
(2)总样本的平均数为×173.5+×163.83≈170.02(cm).
总样本的方差为×[17+(173.5-170.02)2]+×[30.03+(163.83-170.02)2]≈43.24(cm2).
(3)总样本的平均数为×173.5+×163.83≈168.67(cm).
总样本的方差为×[17+(173.5-168.67)2]+×
[30.03+(163.83-168.67)2]≈46.89(cm2).
不能作为总体平均数和方差的估计,因为此分层抽样中,每个个体被抽到的可能性不完全相同,因而样本的代表性差.
11.某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:
甲 127 138 130 137 135 131
乙 133 129 138 134 128 136
求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛.
【解析】设甲、乙两人成绩的平均数分别为甲,乙,则甲=130+(-3+8+0+7+5+1)=133,乙=130+(3-1+8+4-2+6)=133,s=[(-6)2+52+(-3)2+42+22+(-2)2]=,s=[02+(-4)2+52+12+(-5)2+32]=.因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适.
一、选择题
1.已知一组数据x1,x2,x3的平均数是5,方差是4,则由2x1+1,2x2+1,2x3+1,11这4个数据组成的新的一组数据的方差是(  )
A.16 B.14 C.12 D.8
【解析】选C.由已知得x1+x2+x3=15,2+2+2=12,
则新数据的平均数为(2x1+1+2x2+1+2x3+1+11)=11,
所以方差为[(2x1+1-11)2+(2x2+1-11)2+(2x3+1-11)2+(11-11)2]=[4(x1-5)2+4(x2-5)2+4(x3-5)2]=(x1-5)2+(x2-5)2+(x3-5)2=12.
2.已知样本数据为x1,x2,x3,x4,x5,该样本平均数为5,方差为2,现加入一个数5,得到新样本的平均数为,方差为s2,则(  )
A.>5,s2>2 B.=5,s2<2
C.<5,s2<2 D.=5,s2>2
【解析】选B.因为x1,x2,x3,x4,x5的平均数为5,方差为2,
则加入5后平均数为:=×(5×5+5)=5,
方差为:s2==<2.
3.若某同学连续3次考试的名次(3次考试均没有出现并列名次的情况)不超过3,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续3次考试名次的数据,推断一定是尖子生的是(  )
A.甲同学:平均数为2,众数为1
B.乙同学:平均数为2,方差小于1
C.丙同学:中位数为2,众数为2
D.丁同学:众数为2,方差大于1
【解析】选B.甲同学:若平均数为2,众数为1,则有一次名次应为4,故排除A;乙同学:平均数为2,设乙同学3次考试的名次分别为x1,x2,x3,则方差s2=[(x1-2)2+(x2-2)2+(x3-2)2]<1,则(x1-2)2+(x2-2)2+(x3-2)2<3,所以x1,x2,x3均不大于3,符合题意;丙同学:中位数为2,众数为2,有可能是2,2,4,不符合题意;丁同学:有可能是2,2,6,不符合题意.
4.(多选)如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB,则(  )
A.A>B B.AC.sA>sB D.sA【解析】选BC.A=(2.5+10+5+7.5+2.5+10)=6.25,
B=(15+10+12.5+10+12.5+10)=≈11.67.
s=[(2.5-6.25)2+(10-6.25)2+(5-6.25)2+(7.5-6.25)2+(2.5-6.25)2+(10-6.25)2]≈9.90,
s=[(15-11.67)2+(10-11.67)2+(12.5-11.67)2+(10-11.67)2+(12.5-11.67)2+(10-11.67)2]≈3.47.
故A<B,sA>sB.
二、填空题
5.有一笔统计资料,共有11个数据如下(不完全以大小排列):2,4,4,5,5,6,7,8,9,11,a,已知这组数据的平均数为6,则这组数据的方差为________.
【解析】因为这组数据的平均数为(2+4+4+5+5+6+7+8+9+11+a)=(61+a)=6,
所以a=5.方差s2==6.
答案:6
6.已知一组数据x1,x2,x3,x4,x5的平均数=2,方差s2=,那么另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为________,方差为________.
【解析】平均数为′=3-2=3×2-2=4,方差为s′2=9s2=9×=3.
答案:4 3
7.已知k1,k2,…,kn的方差为5,则3(k1-4),3(k2-4),…,3(kn-4)的方差为________.
【解析】设k1,k2,…,kn的平均数为,则3(k1-4),3(k2-4),…,3(kn-4)的平均数为3(-4),
所以s2===9×=9×5=45.
答案:45
8.某医院急救中心随机抽取20位病人等待急诊的时间记录如表:
等待时间/分钟 [0,5) [5,10) [10,15) [15,20) [20,25]
频数 4 8 5 2 1
用上述分组资料计算出病人平均等待时间的估计值=________,病人等待时间方差的估计值s2=________.
【解析】=×(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5(分钟),s2=×[(2.5-9.5)2×4+(7.5-9.5)2×8+(12.5-9.5)2×5+(17.5-9.5)2×2+(22.5-9.5)2×1]=28.5(分钟2).
答案:9.5分钟 28.5分钟2
三、解答题
9.某班40人随机分成两组,第1组15人,第2组25人,两组学生一次数学考试的成绩(单位:分)情况如表:
组别 平均分 标准差
第1组 84 6
第2组 80 4
求全班学生这次数学考试的平均成绩和方差.
【解析】由题意,知第1组这次数学考试的平均分1=84(分),方差s=62=36(分2),
第2组这次数学考试的平均分2=80(分),方差s=42=16(分2),
故全班学生这次数学考试的平均成绩=×84+×80=81.5(分),
方差s2=×[36+(84-81.5)2]+×[16+(80-81.5)2]=27.25(分2).
10.甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:
(1)填写下表:
平均数 方差 中位数 命中9环及以上
甲 7 1.2 1
乙 5.4 3
(2)请从四个不同的角度对这次测试进行分析:
①结合平均数和方差分析偏离程度;
②结合平均数和中位数分析谁的成绩好些;
③结合平均数和命中9环以上的次数分析谁的成绩好些;
④从折线图上两人射击命中环数及走势分析谁更有潜力.
【解析】(1)乙的打靶环数依次为2,4,6,8,7,7,8,9,9,10,所以乙=×(2+4+6+8+7+7+8+9+9+10)=7;乙的打靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数为=7.5;甲的打靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7. 于是填充后的表格如表所示:
平均数 方差 中位数 命中9环及以上
甲 7 1.2 7 1
乙 7 5.4 7.5 3
(2)①甲、乙的平均数相同,均为7,但s<s,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.
②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙的打靶成绩比甲好.
③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的打靶成绩比甲好.
④从题干折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.
11.为选派一名学生参加全市实践活动技能竞赛,A,B两位同学在学校的学习基地现场进行加工直径为20 mm的零件测试,他俩各加工的10个零件直径的相关数据如图所示(单位:mm):
A,B两位同学各加工的10个零件直径的平均数与方差如表:
平均数 方差
A 20 0.016
B 20 s
根据测试得到的有关数据,试解答下列问题:
(1)计算s,结合平均数与方差,说明谁的成绩好些;
(2)结合图中折线走势情况,你认为派谁去参赛较合适?请说明你的理由.
【解析】(1)s=×[5×(20-20)2+3×(19.9-20)2+(20.1-20)2+(20.2-20)2]=0.008,
所以s>s,所以在平均数相同的情况下,B的波动较小,所以B的成绩好些.
(2)从题干图中折线趋势可知:
尽管A的成绩前面起伏大,但后来逐渐稳定,误差小,预测A的潜力大,所以派A去参赛较合适.
PAGE
12(共49张PPT)
14.4.3 用频率直方图估计总体分布
基础认知·自主学习
【概念认知】
频率直方图
(1)我们将_____________的长度称为全距,___________的长度称为组距.
(2)把横轴均分成若干段,每一段对应的长度称为组距,然后以此段为底作矩
形,它的高等于该组的 ,这样得出一系列的矩形,每个矩形的面积恰好是
该组的_____,这些矩形就构成了直方图,我们将这种直方图称为频率直方图.
整个取值区间
分成的区间
频率
分组 频数 频率
[0,30] 3 0.03
(30,60] 3 0.03
(60,90] 37 0.37
(90,120] m n
(120,150] 15 0.15
合计 M N
学情诊断·课时测评
分组 频数 频率
[0,0.5) 4 0.04
[0.5,1) 8 0.08
[1,1.5) 15 0.15
[1.5,2) 22 0.22
[2,2.5) 25 0.25
[2.5,3) 14 0.14
[3,3.5) 6 0.06
[3.5,4) 4 0.04
[4,4.5) 2 0.02
合计 100 1
质量指标值分组 [75,85) [85,95) [95,105) [105,115) [115,125]
频数 6 26 38 22 8
分组 频数累计 频数 频率
[120.5,122.5)
[122.5,124.5)
[124.5,126.5)
[126.5,128.5)
[128.5,130.5]
合计用频率直方图估计总体分布
频率直方图
(1)我们将整个取值区间的长度称为全距,分成的区间的长度称为组距.
(2)把横轴均分成若干段,每一段对应的长度称为组距,然后以此段为底作矩形,它的高等于该组的,这样得出一系列的矩形,每个矩形的面积恰好是该组的频率,这些矩形就构成了直方图,我们将这种直方图称为频率直方图.
1.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为(  )
A.20  B.30 C.40  D.50
【解析】选B.样本数据落在[15,20]内的频数为:100×[1-5×(0.04+0.10)]=30.
2.(教材练习改编)某商场在五一促销活动中,对5月1日9时至14时的销售额进行统计,其频率直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为(  )
A.6万元 B.8万元
C.10万元 D.12万元
【解析】选C.设11时至12时的销售额为x万元,由于频率分布直方图中各小组的组距相同,故各小矩形的高度之比等于频率之比,也等于销售额之比,所以9时至10时的销售额与11时至12时的销售额的比为=,所以有=,解得x=10.
3.某中学随机抽取部分高一学生调查其上学路上所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中上学路上所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].
(1)频率分布直方图中x的值为________;
(2)如果上学路上所需时间不少于1小时的学生可申请在学校住宿,若招生1 200名,估计新生中可以申请住校的学生有________名.
【解析】(1)由频率分布直方图,可得20x+0.025×20+0.006 5×20+0.003×2×20=1所以x=0.012 5.
(2)新生上学路上所需时间不少于1小时的频率为0.003×2×20=0.12,因为1 200×0.12=144,所以1 200名新生中约有144名学生可以申请住校.
答案:(1)0.012 5 (2)144
4.某校高二期末统一测试,随机抽取一部分学生的数学成绩,分组统计如表.
(1)求出表中m,n,M,N的值,并根据表中所给数据在给出的坐标系中画出频率直方图;
分组 频数 频率
[0,30] 3 0.03
(30,60] 3 0.03
(60,90] 37 0.37
(90,120] m n
(120,150] 15 0.15
合计 M N
(2)若全校参加本次考试的学生有600人,试估计这次测试中全校成绩在90分以上的人数.
【解析】(1)由频率分布表得M==100,
所以m=100-(3+3+37+15)=42,n==0.42,
N=0.03+0.03+0.37+0.42+0.15=1.
频率直方图如图所示.
(2)由题意知,全校成绩在90分以上的学生的人数约为×600=342.
一、单选题
1.下列说法不正确的是(  )
A.频率分布直方图中每个小矩形的高就是该组的频率
B.频率分布直方图中各个小矩形的面积之和等于1
C.频率分布直方图中各个小矩形的宽一样大
D.频率分布折线图是依次连接频率分布直方图的每个小矩形上边的中点得到的
【解析】选A.频率分布直方图中每个小矩形的高=.
2.有一个容量为45的样本数据,数据的分组及各组的频数如下:(12.5,15.5],3;(15.5,18.5],8;(18.5,21.5],9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的(  )
A.91% B.92%
C.95% D.30%
【解析】选A.不大于27.5的样本数为3+8+9+11+10=41,约占总体的百分比为×100%≈91%.
3.某班的全体学生参加英语测试,成绩的频率直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是(  )
A.45 B.50 C.55 D.60
【解析】选B.设该班的学生人数为n,
则20×(0.005+0.01)n=15,n=50.
4.某工厂对一批元件进行抽样检测.经检测,抽出的元件的长度(单位:mm)全部在93至105之间.将抽出的元件的长度以2为组距分成6组:[93,95),[95,97),[97,99),[99,101),[101,103),[103,105],得到如图所示的频率直方图.若长度在[97,103)内的元件为合格品,根据频率直方图,估计这批元件的合格率是(  )
A.80% B.90%
C.20% D.85.5%
【解析】选A.由频率分布直方图可知元件长度在[97,103)内的频率为1-(0.027 5+0.027 5+0.045 0)×2=0.8,故这批元件的合格率为80%.
5.对某小区100户居民的月均用水量进行统计,得到样本的频率直方图如图所示,则估计此样本的众数、中位数分别为(  )
A.2.25,2.5 B.2.25,2.02
C.2,2.5 D.2.5,2.25
【解析】选B.众数是指样本中出现频率最高的数,在频率直方图中通常取该组区间的中点,所以众数为=2.25.中位数是频率为0.5的分界点,由频率直方图,可知前4组的频率和为(0.08+0.16+0.30+0.44)×0.5=0.49,因此中位数出现在第5组,设中位数为x,则(x-2)×0.5=0.01,解得x=2.02.
二、多选题
6.在某次高中学科竞赛中,4 000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点值作代表,则下列说法正确有(  )
A.成绩在[70,80)分的考生人数最多
B.不及格的考生人数为1 000
C.考生竞赛成绩的平均分为70.5分
D.考生竞赛成绩的中位数为75分
【解析】选ABC.A选项,由频率直方图可得成绩在[70,80)的频率最高,因此考生人数最多,故A正确;B选项,由频率直方图可得成绩在[40,60)的频率为0.25,因此,不及格的人数为4 000×0.25=1 000,故B正确;C选项,由频率直方图可得平均分为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5(分),故C正确;D选项,因为成绩在[40,70)的频率为0.45,成绩在[70,80)的频率为0.3,所以中位数为70+10×≈71.67(分),故D错误.
7.某班进行了一次数学测试,全班学生的成绩都落在区间[50,100]内,其成绩的频率直方图如图所示,则该班学生这次数学测试成绩的中位数和众数的估计值为(  )
A.81.5 B.75 C.81.25 D.85
【解析】选CD.因为(0.005+0.015+0.025)×10=0.45<0.5,(0.005+0.015+0.025+0.040)×10=0.85>0.5,所以该班学生这次数学测试成绩的中位数落在[80,90)内.设中位数为x,因为(0.005+0.015+0.025)×10+0.04×(x-80)=0.5,所以所求中位数为x=81.25.众数为85.
三、填空题
8.某校从参加高一年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的部分频率直方图.在统计方法中,同一组数据常用该组区间的中点值作为代表,观察图形的信息,据此估计本次考试的平均分为________.
【解析】在频率直方图中,所有小长方形的面积和为1,设[70,80)的小长方形面积为x,则(0.01+0.015×2+0.025+0.005)×10+x=1,
解得x=0.3,即该组数据的频率为0.3,
所以本次考试的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
答案:71
四、解答题
9.某地区100位居民的人均月用水量(单位:t)的分组及各组的频数如下:
[0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;[2,2.5),25;
[2.5,3),14;[3,3.5),6;[3.5,4),4;[4,4.5),2.
(1)列出样本的频率分布表;
(2)画出频率分布直方图,并根据直方图估计这组数据的平均数、中位数、众数;
(3)当地政府制定了人均月用水量为3t的标准,若超出标准加倍收费,当地政府说,85%以上的居民不超过这个标准,这个解释对吗?为什么?
【解析】(1)频率分布表
分组 频数 频率
[0,0.5) 4 0.04
[0.5,1) 8 0.08
[1,1.5) 15 0.15
[1.5,2) 22 0.22
[2,2.5) 25 0.25
[2.5,3) 14 0.14
[3,3.5) 6 0.06
[3.5,4) 4 0.04
[4,4.5) 2 0.02
合计 100 1
(2)频率分布直方图如图:
众数:2.25,中位数:2.02,平均数:2.02.
(3)人均月用水量在3t以上的居民所占的比例为6%+4%+2%=12%,即大约有12%的居民月用水量在3 t以上,88%的居民月用水量在3t以下,因此政府的解释是正确的.
10.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
质量指标值分组 [75,85) [85,95) [95,105) [105,115) [115,125]
频数 6 26 38 22 8
(1)根据上表作出这些数据的频率直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?
【解析】(1)频率直方图如图.
(2)质量指标值的样本平均数为80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.
质量指标值的样本方差为s2=(80-100)2×0.06+(90-100)2×0.26+(100-100)2×0.38+(110-100)2×0.22+(120-100)2×0.08=104.
所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.
(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.
一、选择题
1.某养猪场定购了一批仔猪,从中随机抽查了100头仔猪的体重(单位:斤),经数据处理得到如图①的频率直方图,其中体重最轻的14头仔猪的体重的茎叶图如图②,为了将这批仔猪分栏喂养,需计算频率直方图中的一些数据,其中a+b的值为(  )
A.0.144 B.0.152
C.0.76 D.0.076
【解析】选B.由题意得c+d=×=0.024且[2(c+d)+a+b]×5=1.所以2×0.024+a+b=0.2.所以a+b=0.152.
2.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率直方图如图,
则这20名工人中一天生产该产品的数量的中位数为(  )
A.65 B.64 C.62.5 D.60
【解析】选C.设20名工人中一天生产该产品的数量的中位数为x,则0.2+(x-55)×0.04=0.5,x=62.5.
3.(多选)某次考试中,某班级的数学成绩统计图如下(每组数据包含左端点,不包含右端点).则下列说法错误的是(  )
A.分数在70~80的人数最多
B.该班的总人数为40
C.分数在90~100的人数最少
D.及格(≥60分)的人数是26
【解析】选ABC.从表中可以看出,分数在70~80的有14人,人数最多,所以选项A正确;该班共有4+12+14+8+2=40人,所以选项B正确;从表中可以看出,分数在90~100的有2人,人数最少,所以选项C正确;及格(≥60分)的人数为12+14+8+2=36人,所以选项D错误.
二、填空题
4.将容量为n的样本数据分成6组,绘制频率分布直方图,若第一组至第六组的数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.
【解析】设第一组至第六组数据的频率分别为2x,3x,4x,6x,4x,x,
则2x+3x+4x+6x+4x+x=1,解得x=,
所以前三组数据的频率分别是,,,故前三组数据的频数之和等于n=27,解得n=60.
答案:60
5.某电子商务公司对10 000名网络购物者2018年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率直方图如图所示.
(1)直方图中的a=________;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.
【解析】(1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.
(2)消费金额在区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故消费金额在区间[0.5,0.9]内的频率为1-0.4=0.6.
因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.
答案:(1)3 (2)6 000
6.为了解本市居民的生活成本,甲、乙、丙三名同学利用假期分别对三个社区进行了“家庭每月日常消费额”的调查.他们将调查所得到的数据分别绘制成频率分布直方图(如图所示),记甲、乙、丙所调查数据的标准差分别为s1,s2,s3,则它们的大小关系为__________.(用“>”连接)
【解析】甲数据的平均值为甲=1 250×0.000 6×500+1 750×0.000 4×500+2 250×0.000 2×500+2750×0.0002×500+3250×0.0006×500=2200,同理,乙数据的平均值为乙=2150,丙数据的平均值为丙=2250,可见甲、乙、丙三者的平均值都处在频率分布直方图的最中间一列,此时,若越靠近中间列所占的频率越大,则相应的方差越小,明显丙的中间列及附近列所占的频率最大,其次是乙,甲中间列及附近列所占的频率最小,故s1>s2>s3.
答案:s1>s2>s3
三、解答题
7.(2019·全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每组小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值.
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
【解析】(1)由已知得0.70=a+0.20+0.15,故a=0.35.
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
8.已知一组数据:
125 121 123 125 127 129 125 128 130 129
126 124 125 127 126 122 124 125 126 128
(1)填写下面的频率分布表:
分组 频数累计 频数 频率
[120.5,122.5)
[122.5,124.5)
[124.5,126.5)
[126.5,128.5)
[128.5,130.5]
合计
(2)作出频率分布直方图;
(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数.
【解析】(1)频率分布表如下:
分组 频数累计 频数 频率
[120.5,122.5) 2 0.1
[122.5,124.5) 3 0.15
[124.5,126.5) 8 0.4
[126.5,128.5) 4 0.2
[128.5,130.5] 3 0.15
合计 20 1
(2)
(3)在[124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5,图中虚线对应的数据是124.5+2×=125.75.使用“组中值”求平均数:=121.5×0.1+123.5×0.15+125.5×0.4+127.5×0.2+129.5×0.15=125.8.
PAGE
13(共45张PPT)
14.4.4 百 分 位 数
基础认知·自主学习
1.k百分位数的定义
一般地,一组数据的k百分位数是这样一个值pk,它使得这组数据中至少有____
的数据小于或等于pk且至少有(100-k)%的数据大于或等于pk.
k%
从小到大
学情诊断·课时测评
日期 10月1日 10月2日 10月3日 10月4日 10月5日 10月6日 10月7日
旅游人数(万) 1.5 2.2 2.2 3.8 1.5 2.2 0.6
一次购物量 1至4件 5至8件 9至12件 13至16件 17件及以上
顾客数(人) x 30 25 y 10
结算时间(分钟/人) 1 1.5 2 2.5 3百分位数
1.k百分位数的定义
一般地,一组数据的k百分位数是这样一个值pk,它使得这组数据中至少有k%的数据小于或等于pk且至少有(100-k)%的数据大于或等于pk.
2.计算有n个数据的大样本的k百分位数的步骤
第1步,将所有数值按从小到大顺序排列;
第2步,计算k·;
第3步,如果结果为整数,那么k百分位数位于第k·位和下一位之间,通常取这两个位置上数值的平均数为k百分位数;
第4步,如果k·不是整数,那么将其向上取整(即其整数部分加上1),在该位置上的数值即为k百分位数.
3.四分位数
中位数即为50百分位数,我们也把中位数、25百分位数和75百分位数称为四分位数.
1.下列一组数据的25百分位数是(  )
2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6
A.3.2 B.3.0
C.4.4 D.2.5
【解析】选A.把这组数据按照由小到大的顺序排列,可得:2.1,3.0,3.2,3.4,3.8, 4.0,4.2,4.4,5.3,5.6,
由i=10×25%=2.5,不是整数,
则第3个数据3.2,是25百分位数.
2.(教材练习改编)高二(1)班7人宿舍中每个同学的身高分别为170,168,172,172,175,176,180,则这7人身高数据的40百分位数为(  )
A.168 B.170
C.172 D.171
【解析】选C.把7人的身高从小到大排列,可得
168,170,172,172,175,176,180,
7×40%=2.8,
即第3个数据172为所求的40百分位数.
3.已知甲、乙两组数据(从小到大的顺序排列):
甲组:27,28,39,40,m,50
乙组:24,n,34,43,48,52
若这两组数据的30百分位数、80百分位数分别相等,则等于(  )
A. B.
C. D.
【解析】选A.因为30%×6=1.8,80%×6=4.8,所以30百分位数为n=28,80百分位数为m=48,所以==.
4.(1)班级人数为50的班主任老师说“90%的同学能够考取本科院校”,这里的“90%”是百分位数吗?
(2)“这次数学测试成绩的70百分位数是85分”这句话是什么意思?
【解析】(1)不是.是指能够考取本科院校的同学占同学总数的百分比.
(2)有70%的同学数学测试成绩小于或等于85分.
5.从高三抽出50名学生参加数学竞赛,由成绩得到如图的频率直方图.试利用频率直方图求这50名学生成绩的75百分位数.
【解析】由题意可知,前四个小矩形的面积之和为0.6,前五个小矩形的面积之和为0.84>0.75,
所以75百分位数位于第五个小矩形内.
由80+×10=86.25,
故75百分位数为86.25.
一、单选题
1.以下数据为参加数学竞赛决赛的15人的成绩:78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的80百分位数是(  )
A.90 B.90.5 C.91 D.91.5
【解析】选B.把成绩按从小到大的顺序排列为:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的80百分位数是=90.5.
2.已知100个数据的75百分位数是9.3,则下列说法正确的是(  )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数
【解析】选C.因为100×75%=75,为整数,所以第75个数据和第76个数据的平均数为75百分位数,是9.3.
3.某射手在一次训练中12次射击的成绩分别为
9.6,9.7,9.0,9.1,9.4,9.4, 9.8,9.9,9.4,9.6,9.6,9.7,则该射手这次射击的成绩的75百分位数是(  )
A.9.5 B.9.6 C.9.7 D.9.8
【解析】选C.将这12个数从小到大排列:
9.0,9.1,9.4,9.4,9.4,9.6,9.6,9.6,9.7,9.7,9.8,9.9,这组数据有12个数,因为12×75%=9,所以这组数据的75百分位数是第9个数据与第10个数据的平均数,即=9.7.
4.某校调查某班30名同学所穿的鞋的尺码如表所示:
码号 33 34 35 36 37
人数 7 6 14 1 2
则这组数据的25百分位数是(  )
A.33 B.34 C.35 D.36
【解析】选B.因为30×25%=7.5,所以这组数据的25百分位数为34.
5.一次数学测试中,高一(1)班某小组12名学生的成绩分别是:58分、67分、73分、74分、76分、82分、82分、87分、90分、92分、93分、98分,则这次测试该小组12名学生成绩的75百分位数是(  )
A.88分 B.89分 C.90分 D.91分
【解析】选D.因为12×75%=9,所以这组数据的75百分位数为=91(分).
6.某市2019年5月份某一周的日最高气温(单位:℃)分别为25,28,30,29,31,32,28,则这周的日最高气温的75百分位数为(  )
A.28 ℃ B.29 ℃ C.31 ℃ D.32 ℃
【解析】选C.将数据由小到大排列为25,28,28,29,30,31,32,因为7×75%=5.25,所以这周的日最高气温的75百分位数为31 ℃.
二、多选题
7.下列关于一组数据的50百分位数的说法不正确的是(  )
A.50百分位数就是中位数
B.总体数据中的任意一个数小于它的可能性一定是50%
C.总体数据中的任意一个数大于它的可能性一定是50%
D.它一定是这组数据中的一个数据
【解析】选BCD.由百分位数的意义可知选项B,C,D错误.
8.某班8名学生的体重(单位:kg)分别是:42,48,40,47,43,58,47,45,则下列结论正确的是(  )
A.极差是18 B.25百分位数是42.5
C.中位数是46 D.平均数是47
【解析】选ABC.因为所给数据的最大值是58,最小值是40,所以极差是58-40=18.将所给数据按从小到大的顺序排列是40,42,43,45,47,47,48,58.因为这组数据共8个,处于中间位置的是第4个数和第5个数,故这组数据的中位数是=46.因为8×25%=2,所以这组数据的25百分位数是=42.5.平均数是46.25.
三、填空题
9.某学习小组10名同学在一次数学测试中的得分分别为85,78,66,91,67,78,67,87,96,88,则这10名同学成绩的60百分位数为________.
【解析】这组数据按照从小到大排列后为66,67,67,78,78,85,87,88,91,96,10×60%=6,所以这10名同学成绩的60百分位数为=86.
答案:86
10.一组样本数据的频率直方图如图所示,试估计此样本数据的50百分位数为________.
【解析】样本数据低于10的比例为0.08 +0.32=0.40,样本数据低于14的比例为0.40 +0.36=0.76,所以此样本数据的50百分位数在[10,14]内,估计此样本数据的50百分位数为10+×4=.
答案:
四、解答题
11.为了了解市民的环保意识,某校高一(1)班50名学生在6月5日(世界环境日)这一天调查了各自家庭丢弃旧塑料袋的情况,有关数据如表:
每户丢弃旧塑料袋个数 2 3 4 5
户数 6 17 15 12
(1)求这50户居民6月5日这一天丢弃旧塑料袋的平均数、中位数;
(2)求这50户居民6月5日这一天丢弃旧塑料袋的75百分位数.
【解析】(1)平均数=×(2×6+3×17+4×15+5×12)==3.66.中位数是4.
(2)因为50×75%=37.5,所以这50户居民6月5日这一天丢弃旧塑料袋的75百分位数是4.
12.根据新修订的《环境空气质量标准》指出空气质量指数在0~50,各类人群可正常活动.某市环保局在2019年对该市进行为期一年的空气质量检测,得到每天的空气质量指数,从中随机抽取50个作为样本进行分析报告,样本数据分组区间为[0,10),[10,20),[20,30),[30,40),[40,50),由此得到样本的空气质量指数频率直方图,如图.
(1)求a的值;
(2)根据样本数据,试估计这一年度的空气质量指数的80百分位数.
【解析】(1)由题意,得10×(0.032+0.03+a+0.01+0.008)=1.解得a=0.02.
(2)因为(0.01+0.02+0.032)×10=0.62<0.8,
0.62+0.03×10=0.92>0.8,所以80百分位数应位于[30,40)内.
由30+10×=36,可以估计这一年度的空气质量指数的80百分位数为36.
一、选择题
1.某公园对“十一”黄金周7天假期的游客人数进行了统计,如表所示:
日期 10月1日 10月2日 10月3日 10月4日 10月5日 10月6日 10月7日
旅游人数(万) 1.5 2.2 2.2 3.8 1.5 2.2 0.6
则该公园“十一”黄金周七天假期游客人数的平均数和25百分位数分别是(  )
A.2万、1.5万 B.2万、2.2万
C.2.2万、2.2万 D.2万、1.85万
【解析】选A.游客人数的平均数=×(1.5+2.2+2.2+3.8+1.5+2.2+0.6)=2(万).将数据由小到大排列得:0.6,1.5,1.5,2.2,2.2,2.2,3.8,因为7×25%=1.75,所以这组数据的25百分位数为1.5万.
2.在某次考试中,10名同学的得分如下:84,77,84,83,68,78,70,85,79,95.则这一组数据的众数、中位数和75百分位数分别为(  )
A.84,68,83 B.84,78,83
C.84,81,84 D.78,81,84
【解析】选C.将所给数据按从小到大的顺序排列是68,70,77,78,79,83,84,84,85,95,显然众数为84,而本组数据共10个,中间两个数是79,83,它们的平均数为81,即中位数为81.因为10×75%=7.5,所以这一组数据的75百分位数为84.
3.某项测试成绩满分为10分,现随机抽取30名学生参加测试,得分如图所示,假设得分值的中位数为m1,60百分位数为m2,众数为m3,则(  )
A.m1C.m3【解析】选B.由题图知m3=5;
由中位数的定义,知第15个数与第16个数的平均数为m1==5.5;由百分位数的定义,且30×60%=18,则第18个数与第19个数的平均数为m2==6.故m34.(多选)甲乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则(  )
A.甲成绩的平均数等于乙成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的80百分位数等于乙的成绩的80百分位数
D.甲的成绩的极差大于乙的成绩的极差
【解析】选AC.由题图可知,甲成绩的平均为6,乙成绩的平均数为6,所以A选项正确;甲的成绩的中位数为6,乙的成绩的中位数为5,所以B选项错误;甲的成绩的80百分位数为(7+8)÷2=7.5,乙的成绩的80百分位数(6+9)÷2=7.5,所以二者相等,所以C选项正确;甲的成绩的极差为4,乙的成绩的极差也为4,所以D选项错误.
二、填空题
5.数据148,149,154,154,155,155,157,157,158,159,161,161,162,163的25百分位数为________,75百分位数为________.
【解析】因为14×25%=3.5,14×75%=10.5,所以这组数据的25百分位数为第4个数据154,75百分位数为第11个数据161.
答案:154 161
6.近年来,某市私家车数量持续增长,2015年至2019年该市私家车数量依次为15,19,22,26,30(单位:万辆),则该组数据的中位数是________,10百分位数是________,20百分位数是________.
【解析】这组数据从小到大排列后,22处于最中间的位置,故这组数据的中位数是22.因为5×10%=0.5,所以该组数据的10百分位数是15,因为5×20%=1,所以该组数据的20百分位数是=17.
答案:22 15 17
7.某校从高一年级中随机抽取部分学生,将他们的期末数学测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率直方图.据此统计,期末数学测试成绩不少于60百分位数的分数至少为________.
【解析】因为(0.005+0.015+0.03)×10=0.5,
0.5+0.025×10=0.75>0.6,
故60百分位数应位于第四小组内.
由70+10×=74,得期末数学测试成绩不少于60百分位数的分数至少为74分.
答案:74
8.已知30个数据的60百分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是________.
【解析】由于30×60%=18,设第19个数据为x,则(7.8+x)÷2=8.2,解得x=8.6,即第19个数据是8.6.
答案:8.6
三、解答题
9.某超市为了解顾客的购物量及结算时间等信息,安排一名员工随机收集了100位顾客的相关数据:
一次购物量 1至4件 5至8件 9至12件 13至16件 17件及以上
顾客数(人) x 30 25 y 10
结算时间(分钟/人) 1 1.5 2 2.5 3
已知这100位顾客中的一次购物量超过8件的顾客占55%.请确定x,y的值,并计算顾客一次购物的结算时间的80百分位数.
【解析】由已知,得25+y+10=55,x+y=35,
所以x=15,y=20.
可知:将这100位顾客购物结算时间从小到大排列,第80个数据和第81个数据都是2.5,
所以顾客一次购物的结算时间的80百分位数为2.5.
10.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:高一参赛学生成绩的60百分位数.
【解析】由题图可知,第1个小矩形的面积为0.3,第2个小矩形的面积为0.4,则60百分位数一定位于[60,70)内,由60+10×=67.5,可以估计高一参赛学生成绩的60百分位数约为67.5.
PAGE
9