9.2用样本估计总体 课件(3份打包)

文档属性

名称 9.2用样本估计总体 课件(3份打包)
格式 zip
文件大小 1.9MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2022-05-29 03:35:24

文档简介

(共26张PPT)
9.2.2 总体百分位数的估计
[目标导航]
核心知识目标 核心素养目标
1.理解百分位数的统计含义. 2.结合实例,能用样本估计百分位. 1.在百分位数的计算过程中,培养数学运算和数据分析的核心素养.
2.通过百分位数的应用过程中,要把实际问题转化为数学问题,加强学生的数学建模、数学运算和数据分析的核心素养.
新知探究·素养启迪
课堂探究·素养培育
新知探究·素养启迪
1.第p百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有
的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤
第1步:按 排列原始数据;
第2步:计算i= ;
第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第 项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的 .
p%
从小到大
n×p%
j
平均数
3.四分位数
这三个分位数把一组数据由小到大排列后的数据分成四等份,因此称为四分位数.
25%,50%,75%
小试身手
1.某病患者8人的潜伏期(单位:天)分别为2,3,3,4,7,8,10,18,则它们的50百分位数是(   )
(A)4或7 (B)4
(C)7 (D)5.5
D
D
2.数据13,14,16,17,19,23,27,30的第70百分位数是(   )
(A)14 (B)17 (C)19 (D)23
解析:因为8×70%=5.6,故70%分位数是第6项数据23.故选D.
3.已知100个数据的第55百分位数是10,则下列说法正确的是(   )
(A)这100个数据中一定有55个数小于或等于10
(B)把这100个数据从小到大排列后,10是第55个数据
(C)把这100个数据从小到大排列后,10是第55个数据和第56个数据的平均数
(D)把这100个数据从小到大排列后,10是第54个数据和第55个数据的平均数
解析:因为100×55%=55为整数,所以第55个数据和第56个数据的平均数为第55百分位数,是10.故选C.
C
答案:81
4.某同学在7天内每天参加体育锻炼的时间(单位:分钟)如下65,65,66,74,
73,81,85,则它们的第三四分位数是    .
解析:从小到大排序为65,65,66,73,74,81,85,第三四分位数即75%分位数,7×75%=5.25,所以第三四分位数是第6项数据81.
课堂探究·素养培育
探究点一
求数据的第p百分位数
[例1] 抽查30袋洗衣粉,测量它们的净重如下(单位:g)
482 485 485 508 508 509 497 497
498 499 500 485 486 488 490 501
502 505 490 491 492 493 495 495
495 496 500 506 508 509
估计第25,75百分位数.
解:把30个数据从小到大排列为
482 485 485 485 486 488 490 490
491 492 493 495 495 495 496 497
497 498 499 500 500 501 502 505
506 508 508 508 509 509
由25%×30=7.5,75%×30=22.5,
可知样本数据的第25,75百分位数,分别为第8,23项数据,
所以估计30袋洗衣粉第25,75百分位数分别为490,502.
方法技巧
求一组数据的百分位时,一定要先将该组数据按照从小到大的顺序排列.
即时训练1-1:已知一组数据按从小到大排列为0,0,0,0,1,2,2,2,3,3,5,6,7,
8,9,10,那么数据的25%分位数是    ,数据的75%分位数是    .
答案:0.5 6.5
[备用例1] 学校庆国庆唱红歌比赛,12名评委对高一(5)班评分如下:
90 94 95 98 99 92 93 95 90 92 96 96
估计第30,80百分位数.
解:将12个分数从小到大排列为
90 90 92 92 93 94 95 95 96 96 98 99
由30%×12=3.6,80%×12=9.6,
可知样本数据的第30,80百分位数分别为第4,10项数据,
所以所求第30,80百分位数分别为92,96.
根据频率分布直方图求数据的第p百分位数
探究点二
[例2] 某中学举行电脑知识竞赛,现将高一参赛学生的成绩(单位:分)进行整理后分成五组绘制成如图所示的频率分布直方图.
估计参赛学生的成绩的25%,90%分位数.
变式训练2-1:本例中,计算学生成绩的75%分位数.
方法技巧
根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算方法,其次估计百分位数在哪一组,再应用方程的思想方法及比例法,设出百分位数,利用比例列方程求解.
即时训练2-1:为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图所示.
估计样本数据的75%分位数为    .
答案:71
[备用例2] 为了解学生在课外读物方面的支出情况(单位:元),抽取了100个同学进行调查,结果显示这些同学的支出都在[10,50),其中支出在[30,50)的同学有67人,其频率分布直方图如图所示,估计学生课外读物支出的样本数据的65%分位数.
课堂达标
AC
1.(多选题)下列说法正确的是(   )
(A)若一组样本数据各不相等,则其第35百分位数大于第25百分位数
(B)若一组样本数据的第20百分位数是70,则在这组数据中有20%的数据大于70
(C)若一组样本数据的第20百分位数是35,则在这组数据中至少有80%的数据大于或等于35
(D)求一组数据的百分位数,可以将该组数据杂乱无章的排列
解析:根据百分位数的概念,选项AC正确;B错误.若一组样本数据的第20百分位数是70,则在这组数据中有20%的数据小于或等于70;D错误.求一组数据的百分位数,必须将该组数据按照从小到大的顺序排列.故选AC.
B
2.高二(1)班7人宿舍中每个同学的身高(单位:cm)分别为170,168,172,172,
175,176,180,求这7人身高的第60百分位数为(   )
(A)168 (B)175 (C)172 (D)176
解析:将7人的身高从低到高排列:168,170,172,172,175,176,180.
因为7×60%=4.2,所以第5个数据为所求的第60百分位数,
即这7人的第60百分位数为175.故选B.
3.某学校组织学生参加数学测试,成绩(单位:分)的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的第    百分位数.
解析:因为[20,40),[40,60)的频率为(0.005+0.01)×20=0.3,所以60分为成绩的第30百分位数.
答案:30
4.某良种培育基地正在培育一种小麦新品种,种植了25亩,所得亩产量数据(单位:千克)如下:357,359,367,368,375,388,392,399,400,405,412,414,
415,421,423,423,427,430,430,434,443,445,445,451,454.样本数据的30%分位数为    .
答案:399
解析:将这25个数按从小到大排列为357,359,367,368,375,388,392,399,
400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454.
由30%×25=7.5,所以样本数据的30%分位数为第 8个数字,即399.(共38张PPT)
9.2.3 总体集中趋势的估计
[目标导航]
核心知识目标 核心素养目标
1.了解数据的平均数、中位数和众数的概念. 2.会求数据的平均数、中位数和众数. 1.通过平均数、中位数和众数的运算,培养学生的数学运算和数据分析的核心素养.
2.通过平均数、中位数和众数的应用,强化学生的数学建模、数学运算和数据分析的核心素养.
新知探究·素养启迪
课堂探究·素养培育
新知探究·素养启迪
xn+1
频数
次数最多
2.众数、中位数和平均数的比较
名称 优点 缺点
平均数 平均数与每一个样本数据有关,对数据有“取齐”的作用,代表了一组数据的数值平均水平 样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变.数据越“极端”,对平均数的影响越大,因此一般的比赛记分中,常去掉“最高分”与“最低分”
中位数 中位数仅与数据的排列位置有关.某些数据的变动对中位数没有影响,不受少数几个极端数据的影响,中位数只有唯一一个 对极端值不敏感
众数 众数反映各数据出现的频率,其大小只与这组数据中的部分数据有关,它是样本数据的最大集中点 一组数据的众数可能有一个,也可能有多个,若数据中有两个或两个以上出现得最多,且出现次数一样多,则这些数据都是众数,若一组数据中每个数据出现的次数一样多,则没有众数,可见一个样本的众数可能多个,也可能没有
3.中位数、平均数与频率分布直方图的关系
一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的
(图(1)),那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”(图(2)),那么平均数大于中位数;如果直方图在左边“拖尾”(图(3)),那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.
小试身手
1.一组样本数据为:18,22,11,13,13,16,9,11,18,13,26,则这组数据的众数为(   )
(A)11 (B)12 (C)13 (D)18
C
解析:把这组数据按从小到大排列为9,11,11,13,13,13,16,18,18,22,26,则可知其众数为13.故选C.
C
2.(2020·北京高一期末)已知一组数据:1,2,2,3,3,3,则这组数据的中位数是(   )
3.假期里小菲和小琳结伴去超市买水果,三次购买的草莓价格和数量如表,从平均价格看,买得比较划算的是(   )
C
价格/(元/kg) 12 10 8 合计
小菲购买的数量/kg 2 2 2 6
小琳购买的数量/kg 1 2 3 6
(A)一样划算 (B)小菲划算
(C)小琳划算 (D)无法比较
答案:62
4.在某市2021年“创建文明城市”知识竞赛中,考评组从中抽取200份试卷进行分析,其分数的频率分布直方图如图所示,则这200份试卷的平均分数为    分.
解析:根据频率分布直方图可知平均分数为
45×0.01×10+55×0.03×10+65×0.04×10+75×0.02×10=62(分).
课堂探究·素养培育
探究点一
样本数据的平均数、中位数和众数
[例1] 某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):
甲群:13,13,14,15,15,15,15,16,17,17;
乙群:54,3,4,4,5,6,6,6,6,56.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁 其中哪个统计量能较好地反映甲群市民的年龄特征
[例1] 某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):
甲群:13,13,14,15,15,15,15,16,17,17;
乙群:54,3,4,4,5,6,6,6,6,56.
(2)乙群市民年龄的平均数、中位数和众数各是多少岁 其中哪个统计量能较好地反映乙群市民的年龄特征
方法技巧
(1)平均数与每一个数据都有关,可以反映更多的总体信息,但受极端值的影响大;中位数不受几个极端值的影响;众数只能体现数据的最大集中点,无法客观反映总体特征.
(2)当平均数大于中位数时,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.
(3)求样本数据的中位数和众数时,把数据按照从小到大的顺序排列后,按照其求法进行.
即时训练1-1:奥运会体操比赛的计分规则为:当评委亮分后,其成绩先去掉一个最高分,去掉一个最低分,再计算剩下分数的平均值,这是因为(  )
(A)减少计算量 (B)避免故障
(C)剔除异常值 (D)活跃赛场气氛
解析:因为在体操比赛的评分中使用的是平均分,计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量公平.故选C.
即时训练1-2:(1)(多选题)小华所在的年级一班共有50名学生,一次体检测量了全班学生的身高,由此求得该班学生的平均身高是1.65米,而小华的身高是1.66米,则下列说法正确的是(  )
(A)1.65米是该班学生身高的平均水平
(B)班上比小华高的学生人数不会超过25人
(C)这组身高数据的中位数不一定是1.65米
(D)这组身高数据的众数不一定是1.65米
解析:(1)由平均数所反映的意义知A选项正确,由中位数与平均数的关系确定C选项正确,由众数与平均数的关系确定D选项正确,由于平均数受一组数据中的极大、小值的影响,故B选项错误.故选ACD.
答案:(1)ACD
(2)已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数为    .
答案:(2)5
[备用例1] 高一(3)班有男同学27名,女同学21名,在一次语文测验中,男同学的平均分是82分,中位数是75分,女同学的平均分是80分,中位数是80分.
(1)求这次测验全班的平均分(精确到0.01);
[备用例1] 高一(3)班有男同学27名,女同学21名,在一次语文测验中,男同学的平均分是82分,中位数是75分,女同学的平均分是80分,中位数是80分.
(2)估计全班成绩在80分以下(含80分)的同学至少有多少人;
解:(2)因为男同学成绩的中位数是75分,
所以至少有14人得分不超过75分.
又因为女同学成绩的中位数是80分,
所以至少有11人得分不超过80分.
所以估计全班至少有25人得分低于80分(含80分).
[备用例1] 高一(3)班有男同学27名,女同学21名,在一次语文测验中,男同学的平均分是82分,中位数是75分,女同学的平均分是80分,中位数是80分.
(3)分析男同学的平均分与中位数相差较大的主要原因.
解:(3)男同学的平均分与中位数的差别较大,说明男同学的成绩中两极分化现象严重,分数高的和低的相差较大.
 由频率分布直方图求平均数、中位数和众数
探究点二
[例2] 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)求这次测试数学成绩的众数;
[例2] 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(2)求这次测试数学成绩的中位数.
解:(2)由题干图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,设为x,得0.1=
0.03×(x-70),所以x≈73.3,即这次测试数学成绩的中位数约为73.3分.
变式训练2-1:若例2的条件不变,求数学成绩的平均分.
变式训练2-2:若例2条件不变,求80分以下的学生人数.
解:分数在[40,80)内的频率为(0.005+0.015+0.020+0.030)×10=0.7,
所以80分以下的学生人数为80×0.7=56.
方法技巧
用频率分布直方图估计总体数字特征的方法
(1)众数:最高小长方形底边中点的横坐标.
(2)中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.
(3)平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.
即时训练2-1:(1)200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的众数、中位数的估计值为(  )
(A)62 km,62.5 km (B)65 km,62 km
(C)65 km,62.5 km (D)62.5 km,62.5 km
答案:(1)C
(2)为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图.
则①这20名工人中一天生产该产品的数量在[55,75)的人数是    ;
②这20名工人中一天生产该产品的数量的中位数为    ;
③这20名工人中一天生产该产品的数量的平均数为    .
解析:(2)①(0.04×10+0.025×10)×20=13.
②因为0.2+0.4>0.5,所以中位数一定在[55,65]之间,设中位数为x,则0.2+(x-55)×
0.04=0.5,解得x=62.5.
③平均数为0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64.
答案:(2)13 62.5 64
[备用例2] 一批乒乓球,随机抽取100个进行检查,球的直径频率分布直方图如图.试估计这个样本的众数、中位数和平均数.
探究点三 对实际问题的决策
解:(1)由题可得条形图如图所示.
[例3] 小亮从自家苹果园中一棵树上任取了20个苹果,并得到它们的质量(单位:克)数据分布表如下:
分组 90~ 100 100~ 110 110~ 120 120~ 130 130~ 140 140~
150
频数 1 2 3 10 3 1
(1)请根据这些数据画出该样本的条形统计图.
解:(2)根据已知数据和(1)中的频数分布直方图知,质量最多的是120~130克,共10个,所以用众数作为该果园苹果的规格比较合适.
由该果园苹果树的年龄不同,苹果树上的苹果数存在差距,所以不能用这棵苹果树上的苹果质量估计该苹果园苹果规格的合理性.
[例3] 小亮从自家苹果园中一棵树上任取了20个苹果,并得到它们的质量(单位:克)数据分布表如下:
分组 90~ 100 100~ 110 110~ 120 120~ 130 130~ 140 140~
150
频数 1 2 3 10 3 1
(2)如果用一个量来代表该树上苹果的规格,那么在中位数、平均数和众数中,哪个量合适 试讨论表中的数据,估计该苹果园苹果规格的合理性.
方法技巧
平均数反映出样本数据的较多信息,对样本中的极端值更加敏感.
平均数、中位数和众数都是刻画“中心位置”的量,从不同的角度刻画了一组数据的集中趋势.
解:(1)这组数据的平均数没有实际意义,对专卖店经营没有任何参考价值.
即时训练3-1:某电冰箱专卖店出售容积为182 L,185 L,228 L,268 L四种型号的同一品牌的冰箱,每出售一台,售货员就做一个记录,月底得到一组由15个268,66个228,18个185和11个182组成的数据.
(1)这组数据的平均数有实际意义吗
(2)这组数据的中位数、众数分别是多少
解:(2)这组数据共有110个,中位数为228,众数为228.
(3)专卖店总经理关心的是中位数还是众数
解:(3)专卖店总经理最关心的是众数,众数是228,说明容积为228 L型号的冰箱销售量最大,它能为专卖店带来较多的利润,所以这种型号的冰箱要多进些.
[备用例3] 某工厂人员及周工资构成如表:
人员 经理 管理人员 高级技工 工人 学徒 合计
周工 资/元 2 200 1 250 1 220 1 200 490
人数 1 6 5 10 1 23
(1)求工厂人员工资的众数、中位数、平均数.
解:(1)由题中表格可知众数为1 200,中位数为1 220,平均数为(2 200+
1 250×6+1 220×5+1 200×10+490)÷23=1 230(元/周).
[备用例3] 某工厂人员及周工资构成如表:
人员 经理 管理人员 高级技工 工人 学徒 合计
周工 资/元 2 200 1 250 1 220 1 200 490
人数 1 6 5 10 1 23
(2)平均数能客观地反映该工厂的工资水平吗 为什么
解:(2)虽然平均数为1 230元/周,但从题干表格中所列出的数据可见,只有经理和6名管理人员的周工资在平均数以上,其余人的周工资都在平均数以下,故用平均数不能客观真实地反映该厂的工资水平.
课堂达标
C
1.在描述一组数据的集中趋势时,应用最广泛的是(   )
(A)众数 (B)中位数
(C)平均数 (D)全体数据
解析:由于平均数反映的是这组数据的平均大小,使用最广泛.故选C.
D
2.下列说法正确的是(   )
(A)一个样本的众数、平均数和中位数都是唯一的
(B)样本的平均数是频率分布直方图中最高长方形的中点对应的数据
(C)若改变一组数据中其中的一个数,则这组数据的平均数、中位数、众数都会发生改变
(D)一组数据的数字特征在原始数据中出现的是众数
解析:由于一个样本的平均数和中位数是唯一的.一个样本的众数可能多个,也可能没有,因此A错误;频率分布直方图中样本的平均数等于每个小矩形的面积乘小矩形底边中点的横坐标之和,因此B错误;若改变一组数据中的一个数,则这组数据的平均数一定会改变,而中位数与众数可能不变.
由于众数是在一组数据中出现次数最多的数,所以一定会在原始数据中出现.故选D.
3.统计学校排球队员的年龄,发现有12,13,14,15四种年龄,统计结果如下表:
年龄/岁 12 13 14 15
人数/个 2 4 6 8
根据表中信息可以判断该排球队员年龄的平均数、众数、中位数分别为
(   )
(A)13,15,14 (B)14,15,14
(C)13.5,15,14 (D)15,15,15
B
4.(2020·江苏泰州期中)有5个数据分别为2,4,5,6,8,则这5个数据的平均数是    .
答案:5(共57张PPT)
9.2 用样本估计总体
9.2.1 总体取值规律的估计
[目标导航]
核心知识目标 核心素养目标
1.了解极差的概念. 2.会求一组数据的极差,能决定一组数据组距与组数、将数据分组、列频率分布表,画频率分布直方图. 3.结合实例,能用样本估计总体的取值规律. 1.在学习绘制频率分布直方图的过程中,培养学生直观想象、数据分析的核心素养.
2.通过应用频率分布直方图等统计图表估计总体的取值规律,培养学生直观想象、数据分析和数学建模的核心素养.
新知探究·素养启迪
课堂探究·素养培育
新知探究·素养启迪
画频率分布直方图的步骤
(1)求极差:极差为一组数据中最大值与最小值的差.
(2)决定组距与组数:分组时根据问题的需要可以先确定组距,也可以先确定组数.
(3)将数据分组:分组时可以使第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值.
小试身手
1.下列关于频率分布直方图的说法正确的是(   )
(A)频率分布直方图的高表示取某数的频率
(B)频率分布直方图的高表示该组上的个体在样本中出现的频率
(C)频率分布直方图的高表示取某组上的个体在样本中出现的频数与组距的比值
(D)频率分布直方图的高表示取该组上的个体在样本中出现的频率与组距的比值
D
解析:要注意频率分布直方图的特点.在直方图中,纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积.故选D.
C
2.将容量为100的样本数据按由小到大排列分成8个小组,如表所示,但第6组被墨汁污染,则第6组的频率为(   )
组号 1 2 3 4 5 6 7 8
频数 10 13 14 20 13 12 9
(A)0.14 (B)0.12 (C)0.09 (D)0.10
3.(2020·广东东莞高一期末)2020年6月初,某市采取了鼓励地摊经济的做法,该市各区的地摊的摊位数和食品摊位比例分别如图1、图2所示,现用分层随机抽样的方法抽取5%的摊位进行调查,则抽取的样本量与A区被抽取的食品摊位数分别为(   )
(A)210,24 (B)210,50
(C)1 500,24 (D)1 500,50
解析:样本量为(1 000+800+1 000+1 400)×5%=210,A区被抽取的食品摊位数1 000×0.48×5%=24.故选A.
A
答案:50
4.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是    .
解析:设该班人数为n,则20×(0.005+0.01)n=15,n=50.
课堂探究·素养培育
探究点一
频率分布概念的理解
[例1] (1)已知样本10,8,10,8,6,13,11,10,12,7,9,8,12,9,11,12,9,10,
11,10,那么频率为0.2的范围是(  )
(A)5.5~7.5 (B)7.5~9.5
(C)9.5~11.5 (D)11.5~13.5
解析:(1)共20个数据,频率为0.2,在此范围内的数据有4个,只有在11.5~13.5范围内有4个数据:13,12,12,12.故选D.
答案:(1)D 
答案:(2)25 0.56
(2)某班学生在一次数学考试中各分数段以及人数的成绩分布为[0,80),2人;
[80,90),6人;[90,100),4人;[100,110),8人;[110,120),12人;[120,130),
5人;[130,140),6人;[140,150],2人.那么分数在[100,130)中的频数为
    ,频率为    .
方法技巧
频率概念的理解
将一批数据按照要求分成若干组,各组内数据的个数,叫做该组的频数,每组的频数除以样本容量的商叫做该组的频率,频率反映每组数据在样本中所占比例的大小.
即时训练1-1:一个容量为100的样本,其数据的分组与各组的频数如下:
组别 [0,10) [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]
频数 12 13 24 15 16 13 7
则样本数据落在[10,40)上的频率为(  )
(A)0.13 (B)0.39 (C)0.52 (D)0.64
[备用例1] (1)从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8,其累计频率为0.4,则样本量是(  )
(A)20 (B)40 (C)70 (D)80
答案:(1)A
(2)容量为100的某个样本,将数据分为10组,并填写频率分布表,若前七组频率之和为0.79,而剩下的三组的频率依次相差0.05,则剩下的三组中频率最大的一组频率为    .
答案:(2)0.12
解析:(2)设剩下的三组中频率最大的一组的频率为x,则另两组的频率分别为x-0.05,x-0.1,而由频率和为1得0.79+(x-0.05)+(x-0.1)+x=1,解得x=0.12.
频率分布直方图的绘制
探究点二
[例2] 从某校高三学生中抽取50名参加数学竞赛,成绩分组(单位:分)及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
解:(1)频率分布表如下:
(1)列出样本的频率分布表(含累积频率);
成绩分组 频数 频率 累积频率
[40,50) 2 0.04 0.04
[50,60) 3 0.06 0.1
[60,70) 10 0.2 0.3
[70,80) 15 0.3 0.6
[80,90) 12 0.24 0.84
[90,100] 8 0.16 1.00
合计 50 1.00
[例2] 从某校高三学生中抽取50名参加数学竞赛,成绩分组(单位:分)及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
解:(2)频率分布直方图如图所示.
(2)画出频率分布直方图;
[例2] 从某校高三学生中抽取50名参加数学竞赛,成绩分组(单位:分)及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
解:(3)学生成绩在[60,90)分的频率为0.2+0.3+0.24=0.74=74%,所以估计成绩在[60,90)分的学生比例为74%.
(3)估计成绩在[60,90)分的学生比例.
方法技巧
绘制频率分布直方图应注意的问题
(1)首先画频率分布表,画表格时数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.
即时训练2-1:为增强市民节能环保意识,某市面向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄(单位:岁)情况如表所示:
分组/岁 频数 频率
[20,25) 5 0.05
[25,30) ① 0.20
[30,35) 35 ②
[35,40) 30 0.30
[40,45] 10 0.10
合计 100 1.00
(1)频率分布表中的①②位置应填什么数据
即时训练2-1:为增强市民节能环保意识,某市面向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄(单位:岁)情况如表所示:
分组/岁 频数 频率
[20,25) 5 0.05
[25,30) ① 0.20
[30,35) 35 ②
[35,40) 30 0.30
[40,45] 10 0.10
合计 100 1.00
(2)补全如图所示的频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在[30,35)岁的人数.
[备用例2] 为考查某校高二男生的体重,随机抽取44名高二男生,实测体重数据(单位:kg)如下:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,
56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48
将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.
频率分布直方图和频率分布折线图如图所示.
探究点三  频率分布表及频率分布直方图的应用
探究角度1 求频率分布直方图纵坐标中的参数
[例3] 高二年级某班有50人,某次数学测验的分数(单位:分)在[50,100]内,现将这次数学测验的分数分成如下5个组:[50,60),[60,70),…,[90,100],绘制成如图所示的频率分布直方图,则图中的a值为(  )
(A)0.032 (B)0.16
(C)0.32 (D)0.016
解析:根据频率和为1得2a×10=1-(0.008+0.032+0.028)×10=0.32,解得a=0.016.故选D.
方法技巧
即时训练3-1:某校从高二年级学生中随机抽取60名学生,将期中考试的政治成绩(均为整数)分成六段:[40,50),[50,60),[60,70),…,[90,100]后得到如图所示的频率分布直方图,则a=   .
解析:由题意可得(0.01+0.015×2+a+0.025+0.005)×10=1,解得a=0.03.
答案:0.03
[备用例3] 某校高三年级文科学生600名,从参加期末考试的学生中随机抽出某班学生(该班共有50名同学),并统计了他们的数学成绩(成绩均为整数且满分为150分),数学成绩分组及各组频数如下表,则a=    ,b=    .
分组 频数 频率
[45,60) 2 0.04
[60,75) 4 0.08
[75,90) 8 0.16
[90,105) 11 0.22
[105,120) 15 0.30
[120,135) a b
[135,150] 4 0.08
合计 50 1
解析:因为频率总和是1,所以b=1-(0.04+0.08+0.16+0.22+0.30+0.08)=
0.12.所以第6行的频数为50×0.12=6.所以a,b的值分别为6,0.12.
答案:6 0.12
探究角度2 根据频率分布直方图(表)求样本数据在某一区间内的频率(数)
[例4] 如图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在(2,10)内的频数约为    .
解析:观察直方图易得数据落在(2,10)内的频率为数据落在(2,6)与(6,10)频率之和.根据频率=组距×矩形的高,可得样本数据落在(2,10)内的频率约为0.02×4+0.08×4=0.4.因此频数为200×0.4=80.
答案:80
方法技巧
(1)根据频率分布直方图(表)求样本数据在某一区间内的频率就是样本数据在该区间内的各组频率的和,而求解相应的频数还要根据频率乘以样本容量.
(2)若所求区间包含频率分布直方图中非分组的端点,可以利用“比例法”求解.
即时训练4-1:某校从参加高一年级期末考试的学生中抽出60名学生,将其成绩(均为整数)分成六段(单位:分):[40,50),[50,60),…,[90,100],然后画出如图所示的频率分布直方图,则分数在[60,88)的人数为   .
答案:39
探究角度3 巧用各个矩形面积的和为1解题
答案:200
方法技巧
由于频率分布直方图的所有矩形的面积的和为1,因此涉及各矩形面积之间的关系时,可利用此性质解题.
探究点四  折线图、条形图、扇形图及应用
[例6] 家庭过期药品属于“国家危险废物”,处理不当将污染环境,危害健康.某市药监部门为了解市民家庭处理过期药品的方式,决定对全市家庭作一次简单随机抽样调査.
(1)下列选取样本的方法最合理的一种是  .(只需填上正确答案的序号)
①在市中心某个居民区以家庭为单位随机抽取;②在全市医务工作者中以家庭为单位随机抽取;③在全市常住人口中以家庭为单位随机抽取.
解:(1)根据抽样调查时选取的样本需具有代表性,可知下列选取样本的方法最合理的一种是③.
(2)本次抽样调査发现,接受调査的家庭都有过期药品,现将有关数据呈现如图所示.
[例6] 家庭过期药品属于“国家危险废物”,处理不当将污染环境,危害健康.某市药监部门为了解市民家庭处理过期药品的方式,决定对全市家庭作一次简单随机抽样调査.
①m=    ,n=    .
(2)本次抽样调査发现,接受调査的家庭都有过期药品,现将有关数据呈现如图所示.
[例6] 家庭过期药品属于“国家危险废物”,处理不当将污染环境,危害健康.某市药监部门为了解市民家庭处理过期药品的方式,决定对全市家庭作一次简单随机抽样调査.
②补全条形统计图.
解:②C类户数为1 000-(80+510+200+60+50)=100,
补全的条形统计图如图所示.
(2)本次抽样调査发现,接受调査的家庭都有过期药品,现将有关数据呈现如图所示.
[例6] 家庭过期药品属于“国家危险废物”,处理不当将污染环境,危害健康.某市药监部门为了解市民家庭处理过期药品的方式,决定对全市家庭作一次简单随机抽样调査.
③根据调査数据,你认为该市市民家庭处理过期药品最常见的方式是什么
解:③根据调査数据,即可知道该市市民家庭处理过期药品最常见的方式是B类直接抛弃.
(2)本次抽样调査发现,接受调査的家庭都有过期药品,现将有关数据呈现如图所示.
[例6] 家庭过期药品属于“国家危险废物”,处理不当将污染环境,危害健康.某市药监部门为了解市民家庭处理过期药品的方式,决定对全市家庭作一次简单随机抽样调査.
④家庭过期药品的正确处理方式是送回收点,若该市有180万户家庭,请估计有多少户家庭处理过期药品的方式是送回收站.
解:④180×10%=18(万户).
若该市有180万户家庭,估计有18万户家庭处理过期药品的方式是送回收站.
方法总结
(1)条形图是用一个单位长度表示一定的数量或频率,根据数量的多少或频率的大小画成长短不同的矩形条,条形图能清楚地表示出每个项目的具体数目或频率.
(2)扇形图是用整个圆面积表示总数(100%),用圆内的扇形面积表示各个部分所占总数的百分数.
(3)折线统计图反映数据随时间的变化趋势.
即时训练6-1:(2020·陕西榆林高一月考)为了了解学生在家主动锻炼身体的情况,某校随机抽查了部分学生,对他们每天的运动时间进行调查,并将调查统计的结果分为四类:每天运动时间t≤20分钟的学生记为A类,20分钟t≤60分钟记为C类,t>60分钟记为D类.收集的数据绘制如图两幅不完整的统计图,请根据图中提供的信息,解答下列问题.
(1)这次共抽取了    名学生进行调查统计,抽查的学生每天的运动时间的中位数落在    类.
解:(1)这次共抽取了15÷30%=50名学生进行调查统计,抽查的学生每天的运动时间的中位数落在B类.
即时训练6-1:(2020·陕西榆林高一月考)为了了解学生在家主动锻炼身体的情况,某校随机抽查了部分学生,对他们每天的运动时间进行调查,并将调查统计的结果分为四类:每天运动时间t≤20分钟的学生记为A类,20分钟t≤60分钟记为C类,t>60分钟记为D类.收集的数据绘制如图两幅不完整的统计图,请根据图中提供的信息,解答下列问题.
(2)将条形统计图补充完整,并求扇形统计图中D类所对应的扇形圆心角的度数.
即时训练6-1:(2020·陕西榆林高一月考)为了了解学生在家主动锻炼身体的情况,某校随机抽查了部分学生,对他们每天的运动时间进行调查,并将调查统计的结果分为四类:每天运动时间t≤20分钟的学生记为A类,20分钟t≤60分钟记为C类,t>60分钟记为D类.收集的数据绘制如图两幅不完整的统计图,请根据图中提供的信息,解答下列问题.
(3)学校要求学生在家主动锻炼身体的时间必须超过20分钟才能达标,若该校共有
3 000名学生,请你估计该校达标学生约有多少人
[备用例4] (1)(多选题)调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图和“90后”从事互联网行业岗位分布条形图,则下列结论中一定正确的是(  )
(A)互联网行业从业人员中“90后”占一半以上
(B)互联网行业中从事技术岗位的“90后”人数超过总人数的20%
(C)互联网行业中从事运营岗位的“90后”人数比80前少
(D)互联网行业中从事运营岗位的“90后”人数比80后多
解析:(1)设整个行业人数为1,因为互联网行业从业人员中“90后”占56 %,故A正确;
互联网行业中从事技术岗位的“90后”人数为1×0.56×0.396≈0.22=22 %,故B正确;
互联网行业中从事运营岗位的“90后”人数为1×0.56×0.17≈0.1>0.03,
故C错误;
互联网行业中从事运营岗位的“90后”人数0.1<0.41,故D错误.故选AB.
(2)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2017年1月至2019年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论错误的是(  )
(A)月接待游客量逐月增加
(B)年接待游客量逐年增加
(C)各年的月接待游客量高峰期大致在7,8月
(D)各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
解析:(2)观察折线图可知月接待游客量每年7,8月份明显高于12月份,且折线图呈现增长趋势,高峰都出现在7,8月份,1月至6月的月接待游客量相对于7月至12月波动性更小.因此对于选项A,由题图易知月接待游客量每年7,8月份明显高于12月份,故A错;
对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;
对于选项C,D,由题图可知显然正确.故选A.
[备用例5] (1)某中学初中部共有120名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为(  )
(A)128 (B)144 (C)174 (D)167
解析:(1)初中部女教师有120×70%=84(人),高中部女教师有150×(1-60%)=
150×40%=60(人),则女教师共有84+60=144(人).故选B.
(2)某位教师2018年的家庭总收入为80 000元,各种用途占比统计如图1所示的折线图.2019年收入的各种用途占比统计如图2所示的条形图,已知2019年的就医费用比2018年增加了4 750元,则该教师2019年的家庭总收入为(  )
(A)100 000元 (B)95 000元
(C)90 000元 (D)85 000元
课堂达标
C
1.从一堆苹果中任取10个,称得它们的质量(单位:克)如下:
125 120 122 105 130 114 116 95 120 134
则样本数据落在[114.5,124.5)内的频率为(   )
(A)0.2 (B)0.3
(C)0.4 (D)0.5
A
2.已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,则样本量和抽取的高中生近视人数分别为(   )
(A)200,20 (B)100,20
(C)200,10 (D)100,10
解析:该地区中小学生总人数为3 500+2 000+4 500=10 000(人),则样本量为10 000×2%=200(人),其中抽取的高中生近视人数为2 000×2%×
50%=20(人).故选A.
3.一组数据3,-1,0,2,x的极差为5,则x=    .
解析:由x-(-1)=5,得x=4,由3-x=5,
得x=-2,故x的值为4或-2.
答案:4或-2
4.(2020·河南焦作高二期中)某村有农户200户,他们2018年的家庭收入经过统计整理得到如图所示的频率分布直方图.当地政策规定,若家庭收入不足1.5万元,则可以享受一定的国家扶贫政策,则该村享受国家扶贫政策的有    户.
答案:10
解析:该村享受国家扶贫政策的有0.01×5×200=10(户).