(共33张PPT)
5.3.2 事件之间的关系与运算
新知初探·自主学习
课堂探究·素养提升
【课程标准】
了解随机事件的并、交与互斥的含义,能结合实例进行随机事件的并、交运算.
新知初探·自主学习
教 材 要 点
知识点一 事件的关系与运算
定义 表示法 图示
事件的关系 包含关系 一般地,对于事件A与事件B,如果事件A发生,则事件B________,这时称事件B包含事件A(或称事件A包含于事件B) ______ (或______)
相等关系 特别地,如果事件B包含事件A,事件A也包含事件B,则称事件A与事件B相等 A=B
一定发生
B A
A B
事件的关系 事件互斥 若A∩B为_________,则称事件A与事件B互斥 若________,则A与B互斥
事件对立 若A∩B为___________,A∪B为________,那么称事件A与事件B互为对立事件 若A∩B= ,且A∪B=U,则A与B对立
不可能事件
A∩B=
不可能事件
必然事件
事件的运算 并事件 若某事件发生当且仅当___________________________,则称此事件为事件A与事件B的并事件(或和事件) ________(或________)
交事件 若某事件发生当且仅当___________________,则称此事件为事件A与事件B的交事件(或积事件) ________(或________)
事件A与事件B中至少有一个发生
A∪B
A+B
事件A发生且事件B发生
A∩B
AB
知识点二 事件的互斥与对立
1.给定事件A,B,若事件A与B不能________,则称A与B互斥,记作AB= (或A∩B= ).
2.互斥事件的概率加法公式:若A与B 互斥(即A∩B= ),则:P(A+B)=__________.
3.若A∩B为不可能事件,A∪B为必然事件,那么称事件A与事件B互为对立事件,其含义是:事件A与事件B在任何一次试验中有且仅有一个发生.事件A的对立事件记为:.
则:P(A)+P()=________.
同时发生
P(A)+P(B)
1
状元随笔 互斥事件与对立事件的区别与联系
两个事件A与B是互斥事件,有如下三种情况:
(1)若事件A发生,则事件B就不发生;
(2)若事件B发生,则事件A就不发生;
(3)事件A、B都不发生.
两个事件A、B是对立事件,仅有前两种情况.因此,互斥未必对立,但对立一定互斥.
基 础 自 测
1.对同一事件来说,若事件A是必然事件,事件B是不可能事件,则事件A与事件B的关系是( )
A.互斥不对立 B.对立不互斥
C.互斥且对立 D.不互斥、不对立
答案:C
解析:必然事件与不可能事件不可能同时发生,但必有一个发生,故事件A与事件B的关系是互斥且对立.
2.抽查10件产品,记事件A为“至少有2件次品”,则A的对立事件为( )
A.至多有2件次品 B.至多有1件次品
C.至多有2件正品 D.至少有2件正品
答案:B
解析:至少有2件次品包含2,3,4,5,6,7,8,9,10件次品,共9种结果,故它的对立事件为含有1或0件次品,即至多有1件次品.
3.某人打靶两次,事件A为只有一次中靶,事件B为两次都中靶,则A+B为_____________.
至少有一次中靶
解析:A+B为并事件即至少有一次中靶.
4.一批产品共有100件,其中5件是次品,95件是合格品.从这批产品中任意抽取5件,现给出以下四个事件:
事件A:恰有一件次品; 事件B:至少有两件次品;
事件C:至少有一件次品; 事件D:至多有一件次品.
并给出以下结论:①A∪B=C;②B∪D是必然事件;③A∩B=C;④A∩D=C.
其中正确结论的序号是( )
A.①② B.③④ C.①③ D.②③
答案:A
解析:事件A∪B:至少有一件次品,即事件C,所以①正确;事件A∩B= ,③不正确;事件B∪D:至少有两件次品或至多有一件次品,包括了所有情况,所以②正确;事件A∩D:恰有一件次品,即事件A,所以④不正确.
课堂探究·素养提升
题型1 事件的关系判断[经典例题]
例1 在掷骰子的试验中,可以定义许多事件.例如,事件C1={出现1点},事件C2={出现2点},事件C3={出现3点},事件C4={出现4点},事件C5={出现5点},事件C6={出现6点},事件D1={出现的点数不大于1},事件D2={出现的点数大于3},事件D3={出现的点数小于5},事件E={出现的点数小于7},事件F={出现的点数为偶数},事件G={出现的点数为奇数},请根据上述定义的事件,回答下列问题:
(1)请举出符合包含关系、相等关系的事件;
(2)利用和事件的定义,判断上述哪些事件是和事件.
【解析】 (1)若事件C1,C2,C3,C4发生,则事件D3必发生,所以C1 D3,C2 D3,C3 D3,C4 D3.
同理可得,事件D2包含事件C4,C5,C6;事件E包含事件C1,C2,C3,C4,C5,C6;
事件F包含事件C2,C4,C6;
事件G包含事件C1,C3,C5.
易知事件C1与事件D1相等,即C1=D1.
(2)因为事件D2={出现的点数大于3}={出现4点或出现5点或出现6点},
所以D2=C4∪C5∪C6 (或D2=C4+C5+C6).
同理可得,D3=C1+C2+C3+C4,E=C1+C2+C3+C4+C5+C6,F=C2+C4+C6,G=C1+C3+C5.
故事件D2,D3,E,F,G为和事件.
方法归纳
(1)包含关系、相等关系的判定
①事件的包含关系与集合的包含关系相似;
②两事件相等的实质为相同事件,即同时发生或同时不发生.
(2)事件间运算方法
①利用事件间运算的定义.列出同一条件下的试验所有可能出现的结果,分析并利用这些结果进行事件间的运算;
②利用Venn图,借助集合间运算的思想,分析同一条件下的试验所有可能出现的结果,把这些结果在图中列出,进行运算.
跟踪训练1 盒子里有6个红球,4个白球,现从中任取3个球,设事件A={3个球中有1个红球,2个白球},事件B={3个球中有2个红球,1个白球},事件C={3个球中至少有1个红球},事件D={3个球中既有红球又有白球}.则:
(1)事件D与事件A,B是什么样的运算关系?
(2)事件C与事件A的积事件是什么事件?
解析:(1)对于事件D,可能的结果为1个红球2个白球或2个红球1个白球,故D=A+B.
(2)对于事件C,可能的结果为1个红球2个白球,2个红球1个白球或3个红球,故CA=A.
题型2 互斥事件与对立事件的判断(数学抽象)
例2 某小组有3名男生和2名女生,从中任选2名同学参加演讲比赛,判断下列每对事件是不是互斥事件,如果是,再判断它们是不是对立事件:
(1)“恰有1名男生”与“恰有2名男生”;
(2)“至少有1名男生”与“全是男生”;
(3)“至少有1名男生”与“全是女生”;
(4)“至少有1名男生”与“至少有1名女生”.
判断的依据是互斥事件、对立事件的定义.
【解析】 从3名男生和2名女生中任选2人有如下三种结果:2名男生,2名女生,1男1女.
(1)“恰有1名男生”指1男1女,与“恰有2名男生”不能同时发生,它们是互斥事件;但是当选取的结果是2名女生时,该两事件都不发生,所以它们不是对立事件.
(2)“至少有1名男生”包括2名男生和1男1女两种结果,与事件“全是男生”可能同时发生,所以它们不是互斥事件.
(3)“至少有1名男生”与“全是女生”不可能同时发生,所以它们互斥,由于它们必有一个发生,所以它们是对立事件.
(4)“至少有1名女生”包括1男1女与2名女生两种结果,当选出的是1男1女时,“至少有1名男生”与“至少有1名女生”同时发生,所以它们不是互斥事件.
方法归纳
要判断两个事件是不是互斥事件,只需要找出各个事件包含的所有结果,看它们之间能不能同时发生,在互斥的前提下,看两个事件中是否必有一个发生,可判断是否为对立事件.注意辨析“至少”“至多”等关键词语的含义,知道它们对事件结果的影响.必要时可以把具体的事件列举出来,更易于分辨.
跟踪训练2 从一批产品中取出三件产品,设A表示“三件产品全不是次品”,B表示“三件产品全是次品”,C表示“三件产品至少有一件是次品”,则下列结论正确的是( )
A.A与C互斥
B.任何两个均互斥
C.B与C互斥
D.任何两个均不互斥
先弄清每个事件的情况,再判断两者之间的关系.
答案:A
解析:由题意可知,事件A与事件C不可能同时发生,故A与C互斥,选A.
题型3 事件的运算[经典例题]
例3 如图是某班级50名学生订阅数学、语文、英语学习资料的情况,其中A表示订阅数学学习资料的学生,B表示订阅语文学习资料的学生,C表示订阅英语学习资料的学生.
(1)从这个班任意选择一名学生,用自然语言描述1,4,5,8各区域所代表的事件;
(2)用A,B,C表示下列事件:
①恰好订阅一种学习资料;
②没有订阅任何学习资料.
【解析】 (1)由图可知:
区域1表示该生数学、语文、英语三种资料都订阅;
区域4表示该生只订阅数学、语文两种资料;
区域5表示该生只订阅了语文资料;
区域8表示该生三种资料都未订阅.
(2)①“恰好订阅一种学习资料”包括:只订阅数学为:A;只订阅语文:B;只订阅英语:C,并且这三种事件互斥,所以“恰好订阅一种学习资料”用A,B,C表示为:ABC.
②“没有订阅任何学习资料” 用A,B,C表示为:.
状元随笔 (1)由图可得出1,4,5,8各区域所代表的事件;
(2)由事件的关系与运算求解即可.
跟踪训练3 生产某种产品需要2道工序,设事件A=“第一道工序加工合格”,事件B=“第二道工序加工合格”,用A,B表示下列事件:C=“产品合格”,D=“产品不合格”.
解析:产品合格即两道工序都合格,所以C=AB.
产品不合格即两道工序至少有一道工序不合格,
所以D=AB+.
题型4 概率公式的应用[数学抽象、数学运算]
例4 在数学考试中,小明的成绩在90分(含90分)以上的概率是0.18,在80分~89分(包括89分,下同)的概率是0.51,在70分~79分的概率是0.15,在60分~69分的概率是0.09,在60分以下的概率是0.07,计算:
(1)小明在数学考试中取得80分以上的成绩的概率;
(2)小明数学考试及格的概率.
解析】 分别记小明的成绩“在90分以上”“在80分~89分”“在70分~79分”“在60分~69分”为事件B,C,D,E,这四个事件彼此互斥.
(1)小明的成绩在80分以上的概率是
P(B∪C)=P(B)+P(C)=0.18+0.51=0.69.
(2)记小明考试及格为事件A,则不及格为事件;
方法一 小明数学考试及格的概率是
P(A)=P(B∪C∪D∪E)=P(B)+P(C)+P(D)+P(E)=0.18+0.51+ 0.15+0.09=0.93.
方法二 小明数学考试不及格的概率是P()=0.07,所以小明数学考试及格的概率是P(A)=1-P()=1-0.07=0.93.
状元随笔 小明的成绩在80分以上可以看作是互斥事件“80分~89分”“90分以上”的并事件,小明数学考试及格可看作是“60分~69分”“70分~79分”“80分~89分”“90分以上”这几个彼此互斥事件的并事件,又可看作是“不及格”这一事件的对立事件.
方法归纳
互斥事件、对立事件概率的求解方法
(1)互斥事件的概率的加法公式P(A+B)=P(A)+P(B).
(2)对于一个较复杂的事件,一般将其分解成几个简单的事件,当这些事件彼此互斥时,原事件的概率就是这些简单事件的概率的和.
(3)当求解的问题中有“至多”“至少”“最少”等关键词语时,常常考虑其反面,通过求其反面,转化为所求问题.
跟踪训练4 从甲地到乙地沿某条公路行驶一共200公里,遇到红灯个数的概率如表所示:
(1)求表中字母a的值;
(2)求至少遇到4个红灯的概率;
(3)求至多遇到5个红灯的概率.
红灯个数 0 1 2 3 4 5 6个及6个以上
概率 0.02 0.1 a 0.35 0.2 0.1 0.03
解析:(1)由题意可得0.02+0.1+a+0.35+0.2+0.1+0.03=1,解得a=0.2.
(2)设事件A为遇到红灯的个数为4,事件B为遇到红灯的个数为5,事件C为遇到红灯的个数为6个及6个以上,则事件“至少遇到4个红灯”为A∪B∪C,因为事件A,B,C互斥,所以P(A∪B∪C)=P(A)+P(B)+P(C)=0.2+0.1+0.03=0.33,即至少遇到4个红灯的概率为0.33.
(3)设事件D为遇到6个及6个以上红灯,则至多遇到5个红灯为事件.
则P()=1-P(D)=1-0.03=0.97.
方法归纳
事件间的运算方法
(1)利用事件间运算的定义,列出同一条件下的试验所有可能出现的结果,分析并利用这些结果进行事件间的运算.
(2)利用Venn图,借助集合间运算的思想,分析同一条件下的试验所有可能出现的结果,把这些结果在图中列出,进行运算.(共55张PPT)
5.1.3 数据的直观表示
新知初探·自主学习
课堂探究·素养提升
【课程标准】
能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.
新知初探·自主学习
教 材 要 点
知识点一 柱形图(也称为条形图)
作用 形象地比较各种数据之间的________
特征 (1)一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例
(2)每一矩形都是等宽的
数量关系
知识点二 折线图
知识点三 扇形图(也称为饼图、饼形图)
作用 形象地表示出各部分数据在全部数据中所占的________
特征 每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比
作用 形象地表示数据的________
特征 一条轴上显示的通常是时间,另一条轴上是对应的数据
变化趋势
比例情况
知识点四 茎叶图
茎叶图的画法步骤:
第一步:将每个数据分为茎(高位)和叶(低位)两部分;
第二步:将最小茎与最大茎之间的数按大小次序排成一列;
第三步:将各个数据的叶依次写在其茎的两侧.
作用 (1)如果每一行的数都是按从大到小(或从小到大)顺序排列,则从中可以方便地看出这组数的最值、中位数等数字特征
(2)可以看出一组数的分布情况,可能得到一些额外的信息
(3)比较两组数据的________或________程度
特征 所有的茎都竖直排列,而叶沿水平方向排列
集中
分散
知识点五 画频数分布直方图与频率分布直方图的步骤
最大值与最小值的差
k
不小于k的最小整数
左闭右开
闭
分组
频数累计
频数
频率
合计
样本容量
1
各小长方形的面积
1
频数分布直方图 纵坐标是频数,每一组数对应的矩形的_________成正比
频率分布直方图 纵坐标是________,每一组数对应的矩形高度与频率成正比,每个矩形的面积等于这一组数对应的频率,所有矩形的面积之和为____
高度与频数
1
知识点六 频数分布折线图和频率分布折线图
把频数分布直方图和频率分布直方图中每个矩形上面一边的中点用线段连接起来,且画成与横轴相交.
状元随笔 表示频率分布的几种方法的优点与不足
优点 不足
频率分布表 表示数量较确切 分析数据分布的总体态势不方便
频率分布直方图 表示数据分布情况非常直观 原有的具体数据信息被抹掉了
频率分布折线图 能反映数据的变化趋势 不能显示原有数据信息
基 础 自 测
1.(多选)关于频率分布直方图中的有关数据,下列说法错误的是( )
A.直方图的高表示该组上的个体在样本中出现的频率与组距的比值
B.直方图的高表示该组上的个体在样本中出现的频率
C.直方图的高表示取某数的频率
D.直方图的高表示该组上的个体数与组距的比值
答案:BCD
解析:直方图的高表示频率与组距的比值,直方图的面积为频率.
2.甲、乙两个班各随机选出15名同学进行测验,所得成绩的茎叶图如图.从图中看,________班的平均成绩较高.
乙
解析:结合茎叶图中成绩的情况可知,乙班平均成绩较高.
3.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
A.167 B.137
C.123 D.93
答案:B
解析:110×70%+150×40%=77+60=137.
4.某市4月份日平均气温统计图如图所示,则在日平均气温这组数据中,众数和中位数分别是( )
A.13,13 B.13,13.5
C.13,14 D.16,13
答案:C
解析:这组数据中,13出现了10次,出现次数最多,所以众数为13,排序后第15个数和第16个数都是14,所以中位数是14.
课堂探究·素养提升
题型1 频率分布直方图、频率分布折线图的绘制及频率分布直方图的应用[经典例题]
例1 在拜登上任之前的美国历届总统中,就任时年龄最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年龄最大的是特朗普,他于2016年就任,当时70岁.下面按时间顺序(从1789年的华盛顿到2016年的特朗普,共45任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,47,70.
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图;
(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况;
【解析】 (1)以4为组距,列频率分布表如下:
分组 频数 频率
[42,46) 2 0.044 4
[46,50) 7 0.155 5
[50,54) 8 0.177 8
[54,58) 16 0.355 6
[58,62) 5 0.111 1
[62,66) 4 0.088 9
[66,70] 3 0.066 7
合计 45 1.000 0
画出相应的频率分布直方图和频率分布折线图,如图所示.
(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁及45岁以下和65岁以上就任的总统所占的比例相对较小.
状元随笔
(3)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的统计图如图所示,则以下四种说法中,正确的个数为( )
①甲的成绩的平均数等于乙的成绩的平均数
②甲的成绩的中位数大于乙的成绩的中位数
③甲的成绩的方差小于乙的成绩的方差
④甲的成绩的极差等于乙的成绩的极差
A.1 B.2 C.3 D.4
【答案】 D
【解析】在①中,=×(5+5+5+6+9)=6,=×(4+5+6+7+8)=6,故甲的成绩的平均数等于乙的成绩的平均数,故①正确;在②中,甲的成绩的中位数为6,乙的成绩的中位数为5,故甲的成绩的中位数大于乙的成绩的中位数,故②正确;在③中,甲的成绩的方差为×(22×2+12×2)=2,乙的成绩的方差为×(12×3+32×1)=2.4,故甲的成绩的方差小于乙的成绩的方差,故③正确;在④中,甲的成绩的极差为4,乙的成绩的极差也为4,故甲的成绩的极差等于乙的成绩的极差,故④正确,故正确的个数为4.
状元随笔 根据频数计算平均数、中位数、方差、极差,判断结果.
(4)20名学生某次数学考试成绩(单位:分)的频率分布直方图如图:
①求频率分布直方图中a的值;
②分别求出成绩落在[50,60)与[60,70)中的学生人数.
【解析】①据直方图知组距为10,由(2a+3a+7a+6a+2a)×10=1,解得a==0.005.
②成绩落在[50,60)中的学生人数为2×0.005×10×20=2人.
成绩落在[60,70)中的学生人数为3×0.005×10×20=3人.
状元随笔 求出第一个和第二个小矩形的面积(即频率),再计算学生人数.
方法归纳
绘制频率分布直方图应注意的问题
(1)在绘制出频率分布表后,画频率分布直方图的关键就是确定小矩形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“”所占的比例来定高.如我们预先设定以“ ”为1单位长度,代表“0.1”,则若一个组的为0.2,则该小矩形的高就是“ ”(占两个单位长度),依此类推.
(2)数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.
频率分布直方图的意义
(1)频率分布直方图以面积的形式反映了数据落在各组内频率大小.
(2)在频率分布直方图中,各小矩形的面积之和等于1.
(3)频数/相应的频率=样本容量.
跟踪训练1 (1)有一个容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20],17.
①列出样本的频率分布表;
②画出频率分布直方图和频率分布折线图;
③求样本数据不足0的频率.
解析:(1)①频率分布表如下:
分组 频数 频率
[-20,-15) 7 0.035
[-15,-10) 11 0.055
[-10,-5) 15 0.075
[-5,0) 40 0.2
[0,5) 49 0.245
[5,10) 41 0.205
[10,15) 20 0.1
[15,20] 17 0.085
合计 200 1.00
②频率分布直方图和频率分布折线图如图所示:
③样本数据不足0的频率为:
0.035+0.055+0.075+0.2=0.365.
(2)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示),由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
0.030
3
解析:因为频率分布直方图中各小长方形的面积之和为1,所以10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.由图可知身高在[120,150]内的学生人数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为10,所以从身高在[140,150]内的学生中选取的人数为×10=3.
状元随笔 (1)①求极差;②组距及组数;③分组;④列表;⑤画直方图.
(2)
题型2 柱形图、扇形图及其应用[直观想象]
例2 (1)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例。
则下列叙述中错误的是( )
A.是否倾向选择生育二胎与户籍有关
B.是否倾向选择生育二胎与性别无关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
【答案】 C
【解析】 由题图,可得是否倾向选择生育二胎与户籍有关、与性别无关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中,男性人数为60×60%=36(人),女性人数为40×60%=24(人),不相同.
(2)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
【答案】 A
【解析】 设新农村建设前的收入为M,而新农村建设后的收入为2M,
则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A项符合题意;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项不符合题意;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,所以增加了一倍,所以C项不符合题意;新农村建设后,养殖收入与第三产业收入的总和占经济收入为30%+28%=58%>50%,所以超过了经济收入的一半,所以D项不符合题意.
状元随笔 (1)根据柱形图的构成特点读取图中信息,逐个判断,对于C,D要注意计算.
(2)根据饼图的构成特点读取图中信息,逐个计算作出判断.
方法归纳
1.画柱形图的步骤和注意问题
(1)步骤:第一步确定坐标系中横轴和纵轴上坐标的意义,第二步确定横轴上各部分的间距及位置,第三步根据统计结果绘制柱形图.
(2)注意问题:在柱形图中,各个矩形图的宽度没有严格要求,但高度必须以数据为准,它直观反映了各部分在总体中所占比重的大小.
2.画扇形图的步骤和注意问题
(1)步骤:第一步计算各部分所占百分比以及对应圆心角的度数;第二步在圆中按照上述圆心角画出各个扇形并恰当标注.
(2)注意问题:扇形图表示总体的各部分之间的百分比关系,但不同总量下的扇形统计图,其不同的百分比不可以作为比较的依据.
跟踪训练2 (1)如图是某手机商城中A,B,C三种品牌的手机各季度销量的百分比条形图,根据该图,以下结论中一定正确的是( )
A.四个季度中,每季度B品牌和C品牌总销量之和均不低于A品牌的销量
B.B品牌第二季度的销量小于第三季度的销量
C.第一季度销量最大的为C品牌,销售最小的为B品牌
D.A品牌的全年销售量最大
答案:D
解析:对于A,第四季度中,A品牌销量大于50%,B品牌和C品牌总销量之和小于50%,故A错误;
对于B,因为B品牌每个季度的销量不确定,所以无法判断,故B错误;
对于C,第一季度销量最大的是A品牌,故C错误;
对于D,由图知,四个季度A品牌的销量都最大,所以A品牌的全年销量最大,故D正确.
(2)某班级在一次数学竞赛中为全班学生设置了一等奖、二等奖、三等奖以及参与奖,各个奖品的单价分别为:一等奖18元、二等奖8元、三等奖4元、参与奖2元,获奖人数的分配情况如图,则以下说法不正确的是( )
A.获得参与奖的人数最多
B.各个奖项中参与奖的总费用最高
C.购买每件奖品费用的平均数为4元
D.购买的三等奖的奖品件数是一、二等奖的奖
品件数和的二倍
.
.
.
答案:B
解析:由题意,设全班人数为a,由扇形统计图可知,一等奖占5%,二等奖占10%,三等奖占30%,
参与奖占55%.获得参与奖的人数最多,故A正确;各奖项的费用:一等奖5%a×18=0.9a,二等奖10%a×8=0.8a,三等奖占30%a×4=1.2a,参与奖占55%a×2=1.1a,
可知各个奖项中三等奖的总费用最高,故B错误;
平均费用5%×18+10%×8+30%×4+55%×2=4元,故C正确;
一等奖奖品数为5%a,二等奖奖品数为10%a,三等奖奖品数为30%a,故D正确.
题型3 折线图及其应用[数据分析]
例3 某工厂一年中各月份的收入、支出情况的统计图如图所示,则下列说法中错误的是( )
A.收入最高值与收入最低值的比是3∶1
B.结余最高的月份是7月份
C.1至2月份的收入的变化率与4至5月份的收入的变化率相同
D.前6个月的平均收入为40万元
状元随笔 读取折线图的信息,逐项判断.
【答案】 D
【解析】 由题图可知,收入最高值为90万元,收入最低值为30万元,其比是3∶1,故A正确,不符合题意;
由题图可知,结余最高为7月份,为80-20=60(万元),故B正确,不符合题意;
由题图可知,1至2月份的收入的变化率与4至5月份的收入的变化率相同,故C正确,不符合题意;
由题图可知,前6个月的平均收入为(40+60+30+30+50+60)=45(万元),故D错误,符合题意.
方法归纳
绘制折线图的步骤和注意问题
(1)步骤:先整理和观察数据统计表,建立直角坐标系,用两坐标轴上的点分别表示数据,再描出数据的相应点,顺次连接相邻的点,得到一条折线.
(2)注意问题:画折线统计图时,横轴、纵轴表示的实际含义要标明确.
跟踪训练3 (多选)某班三位同学的数学测试成绩及班级平均分的关系图如图所示
其中说法正确的是( )
A.王伟同学的数学学习成绩高于班级平均水平,且较稳定
B.张诚同学的数学学习成绩波动较大
C.赵磊同学的数学学习成绩低于班级平均水平
D.在6次测试中,每一次成绩都是王伟第1,张诚第2,赵磊第3
答案:ABC
解析:从题图中看出王伟同学的数学学习成绩始终高于班级平均水平,学习情况比较稳定而且成绩优秀.张诚同学的数学成绩不稳定,总是在班级平均水平上下波动,而且波动幅度较大.赵磊同学的数学学习成绩低于班级平均水平,但他的成绩曲线呈上升趋势,表明他的数学成绩在稳步提高,第6次测试张诚没有赵磊的成绩好.
题型4 茎叶图及其应用[数据分析]
例4 某篮球运动员的投篮命中率为50%,他想提高自己的投篮水平,制定了一个夏季训练计划.为了了解训练效果,执行训练计划前,他统计了10场比赛的得分,计算出得分的中位数为15分,平均得分为15分,得分的方差为46.3.执行训练后也统计了10场比赛的得分,成绩茎叶图如图所示:
(1)请计算该篮球运动员执行训练计划后统计的10场比赛得分的中位数、平均得分与方差;
(2)如果仅从执行训练计划前后统计的各10场比赛得分数据分析,你认为训练计划对该运动员的投篮水平的提高是否有帮助?为什么?
【解析】 (1)训练后得分的中位数为:=14.5(分);
平均得分为:
=15(分);
方差为:[(8-15)2+(9-15)2+(12-15)2+(14-15)2+(14-15)2+(15-15)2+(16-15)2+(18-15)2+(21-15)2+(23-15)2]=20.6.
(2)尽管中位数训练后比训练前稍小,但平均得分一样,训练后方差20.6小于训练前方差46.3,说明训练后得分稳定性提高了,这是投篮水平提高的表现.故此训练计划对该篮球运动员的投篮水平的提高有帮助.
状元随笔 (1)由茎叶图能计算该篮球运动员执行训练计划后统计的10场比赛得分的中位数,根据平均数公式可得平均得分,由方差公式可得方差;
(2)尽管中位数训练后比训练前稍小,但平均得分一样,训练后方差小于训练前方差说明训练后得分稳定性提高了,由此能求出结果.
方法归纳
茎叶图中的三个关注点
(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.
(2)重复出现的数据要重复记录,不能遗漏.
(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.
跟踪训练4 为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:
服用A药的20位患者日平均增加的睡眠时间:
0.6,1.2,2.7,1.5,2.8,1.8,2.2,2.3,3.2,3.5,
2.5,2.6,1.2,2.7,1.5,2.9,3.0,3.1,2.3,2.4
服用B药的20位患者日平均增加的睡眠时间:
3.2,1.7,1.9,0.8,0.9,2.4,1.2,2.6,1.3,1.4,
1.6,0.5,1.8,0.6,2.1,1.1,2.5,1.2,2.7,0.5
根据两组数据完成如图所示的茎叶图,从茎叶图看,哪种药的疗效更好?
解析:由观测结果可绘制茎叶图如图所示:
从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上,而B药疗效的试验结果有的叶集中在茎0,1上,由此可看出A药的疗效更好.(共31张PPT)
5.1.2 数据的数字特征
新知初探·自主学习
课堂探究·素养提升
【课程标准】
(1)结合实例,理解最值、平均值、众数、极差、方差、标准差的含义.
(2)结合实例,能用样本估计百分位数,理解百分位数的统计含义.
新知初探·自主学习
教 材 要 点
知识点一 最值
一组数据的最值指的是其中的最大值与最小值.
状元随笔 最值反应的是这组数最极端的情况.一般地,最大值用max表示,最小值用min表示.
知识点二 平均数
(1)定义:如果给定的一组数是x1,x2,…,xn,则这组数的平均数为=________________.
这一公式在数学中常简记为=_________.
(2)求和符号∑具有的性质
①=;
②=k;
③=nt.
(3)如果x1,x2,…,xn的平均数为,且a,b为常数,则ax1+b,ax2+b,…,axn+b的平均数是________.
(x1+x2+…+xn)
a+b
知识点三 中位数、百分位数、众数的概念
1.中位数
(1)如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称________为这组数的中位数;
(2)如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称________为这组数的中位数.
xn+1
2.百分位数
(1)定义:一组数的p%(p∈(0,100))分位数指的是满足下列条件的一个数值:至少有________的数据不大于该值,且至少有_________的数据不小于该值.
(2)计算方法:
设一组数按照从小到大排列后为x1,x2,…,xn,计算i=np%的值,如果i不是整数,设i0为大于i的最小整数,取________为p%分位数;如果i是整数,取________为p%分位数.
规定:0分位数是x1(即最小值),100%分位数是xn(即最大值)
p%
(100-p)%
xi0
状元随笔 中位数和百分位数的关系是什么?
提示:中位数是50%分位数.
3.众数
一组数据中,某个数据出现的次数称为这个数据的频数,出现次数________的数据称为这组数据的众数.
最多
状元随笔 对众数、中位数、平均数的理解
(1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
(2)众数考查各个数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中部分数据多次重复出现时,其众数往往更能反映问题.
(3)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能在所给的数据中,也可能不在所给的数据中.
(4)实际问题中求得的平均数、众数和中位数应带上单位.
知识点四 极差、方差与标准差
1.一组数的极差指的是这组数的最大值减去最小值所得的差.
2.如果x1,x2,…,xn的平均数为,则方差可用求和符号表示为s2=.
3.方差的算术平方根称为标准差.
状元随笔 对方差与标准差概念的理解
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
(2)标准差、方差的取值范围:[0,+∞).
标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.
(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.
基 础 自 测
1.求下列一组数据1,2,2,3,4,4,5,6,6,7的第30百分位数( )
A.2 B.3
C.4 D.2.5
答案:D
解析:这组数据共10个,10×30%=3即第30百分位数是第3项数据和第4项数据的平均数2.5.
2.已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是( )
A.平均数>中位数>众数
B.平均数<中位数<众数
C.中位数<众数<平均数
D.众数=中位数=平均数
答案:D
解析:平均数、中位数、众数皆为50,故选D.
3.已知一组数据为-3,5,7,x,11,且这组数的众数为5,那么该组数据的中位数是( )
A.7 B.5
C.6 D.11
答案:B
解析:由这组数据的众数为5,可知x=5,把这组数据由小到大排列为-3,5,5,7,11,则可知中位数为5.
4.已知五个数据3,5,7,4,6,则该样本的标准差为________.
解析:因为=×(3+5+7+4+6)=5,
所以s= =.
课堂探究·素养提升
题型1 最值、平均数、众数[数学抽象、数学运算]
例1 某公司员工的月工资情况如下所示:
(1)分别计算该公司员工月工资的最值、平均数和众数;
(2)你认为用哪个数来代表该公司员工的月工资更合理?
月工资/元 80 000 50 000 40 000 20 000 10 000 8 000 7 000
员工/人 1 2 5 8 20 12 2
【解析】 (1)该公司员工月工资的最大值为80 000元,最小值为7 000元,众数为10 000元.平均数为×(80 000×1+50 000×2+40 000×5+20 000×8+10 000×20+8 000×12+7 000×2)=17 000(元).
(2)用众数,因为最大值为80 000元且只有一个,无法代表该公司员工的月工资,平均数受到最大值的影响,也无法代表该公司员工的月工资,每月拿10 000元的员工最多,众数代表该公司员工的月工资最合理.
状元随笔 (1)依据最值、众数的定义及平均数的计算公式求值.
(2)根据第(1)问的计算结果和实际意义作答.
方法归纳
(1)最值和众数的求法
在样本数据中出现次数最多的数据即为众数,最大的数是最大值,最小的数是最小值.
(2)求平均数的步骤
①求和:数据x1,x2,…,xn的和为x1+2+…+xn.
②求平均数:和除以数据的个数n,即x1,x2,…,xn的平均数为(x1+x2+…+xn).
跟踪训练1 (1)已知一组数据4,2a,3-a,5,6的平均数为4,则a的值是________;
解析:由=4可知a=2.
2
(2)某校在一次考试中,甲、乙两班学生的数学成绩统计如下:
选用平均数与众数评估这两个班的成绩.
分数 人数 班级 50 60 70 80 90 100
甲班 1 6 12 11 15 5
乙班 3 5 15 3 13 11
解析:甲班平均数为(50×1+60×6+70×12+80×11+90×15+100×5)=79.6(分),
乙班平均数为(50×3+60×5+70×15+80×3+90×13+100×11)=80.2(分),从平均分看成绩较好的是乙班;
甲班众数为90分,乙班众数为70分,从众数看成绩较好的是甲班.
题型2 中位数、百分位数的计算[数学运算、数据分析]
例2 近年来,某市私家车数量持续增长,2015年至2019年该市私家车数量依次为15,19,22,26,30(单位:万辆),则
(1)该组数据的中位数是______;
(2)10%分位数是______,20%分位数是______.
22
15
17
【解析】 (1)这组数据从小到大排列后,22处于最中间的位置,故这组数据的中位数是22.
(2)因为5×10%=0.5,所以该组数据的10%分位数是15,因为5×20%=1,所以该组数据的20%分位数是=17.
状元随笔 (1)排序并数出数据总数,依据中位数的定义计算.
(2)依据百分位数的定义计算.
方法归纳
(1)求中位数的一般步骤
①把数据按大小顺序排列.
②找出排列后位于中间位置的数据,即为中位数.若中间位置有两个数据,则求出这两个数据的平均数作为中位数.
(2)求百分位数的一般步骤
①排序:按照从小到大排列:x1,x2,…,xn.
②计算:求i=np%的值.
③求值:
分类 p%分位数
i不是整数 ,其中i0为大于i的最小整数
i是整数
跟踪训练2 以下数据为参加数学竞赛决赛的15人的成绩:
78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,
则这15人成绩的80%分位数是( )
A.90 B.90.5
C.91 D.91.5
答案:B
解析:把成绩按从小到大的顺序排列为:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的80%分位数是=90.5.
题型3 标准差、方差的应用[经典例题]
例3 甲、乙两机床同时加工直径为100 mm的零件,为检验质量,各从中抽取6件测量,数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
【解析】 (1)=(99+100+98+100+100+103)=100,
=(99+100+102+99+100+100)=100.
=[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
=[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)两台机床所加工零件的直径的平均值相同,又,
所以乙机床加工零件的质量更稳定.
方法归纳
在实际应用中,常常把平均数与标准差结合起来进行决策,在平均值相等的情况下,比较方差或标准差以确定稳定性.
跟踪训练3 在例3中,若甲机床所加工的6个零件的数据全都加10,那么所得新数据的平均数及方差分别是多少?
解析:甲的数据为99+10,100+10,98+10,100+10,100+10,103+10,平均数为100+10=110,
方差仍为[(109-110)2+(110-110)2+(108-110)2+(110-110)2+(110-110)2+(113-110)2]=.(共41张PPT)
5.1.1 数据的收集
新知初探·自主学习
课堂探究·素养提升
【课程标准】
(1)获取数据的基本途径及相关概念:
①知道获取数据的基本途径,包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等.
②了解总体、样本、样本量的概念,了解数据的随机性.
(2)抽样:
①简单随机抽样 通过实例,了解简单随机抽样的含义及其解决问题的过程,掌握两种简单随机抽样方法:抽签法和随机数表法.会计算样本均值和样本方差,了解样本与总体的关系.
②分层随机抽样 通过实例,了解分层随机抽样的特点和适用范围,了解分层随机抽样的必要性,掌握各层样本量比例分配的方法.结合具体实例,掌握分层随机抽样的样本均值和样本方差.
③抽样方法的选择 在简单的实际情境中,能根据实际问题的特点,设计恰当的抽样方法解决问题.
新知初探·自主学习
教 材 要 点
知识点一 总体与样本
所考察问题涉及的对象全体是________,总体中每个对象都是________,抽取的部分对象组成总体的一个样本,一个样本中包含的个体数目是________容量.
知识点二 简单随机抽样
1.简单随机抽样的意义:一般地,简单随机抽样(也称为纯随机抽样)就是从总体中不加任何分组、划类、排队等,完全随机地抽取个体.简单随机抽样是其它各种抽样形式的基础.通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法.
2.简单随机抽样的分类
简单随机抽样
总体
个体
样本
抽签法
随机数表法
状元随笔 (1)对总体、个体、样本、样本容量的认识
总体:统计中所考察对象的全体叫做总体.
个体:总体中的每一个考察对象叫做个体.
样本:从总体中抽取的一部分个体叫做样本.
样本容量:样本的个体的数目叫做样本容量.
(2)简单随机抽样必须具备的几个特点
①被抽取样本的总体中的个体数N是有限的.
②抽取的样本个体数n小于或等于总体中的个体数N.
③样本中的每个个体都是逐个不放回抽取的.
④每个个体入样的可能性均为.
3.随机数表法进行简单随机抽样的步骤
编号
任意
规则
编号
状元随笔 用随机数表法进行简单随机抽样的规则
(1)定方向:读数的方向(向左、向右、向上或向下都可以).
(2)读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,若得到的号码不在编号中或已被选用,则跳过,直到选满所需号码为止.
知识点三 分层抽样
1.分层抽样的定义
一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的、互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称分层抽样)
注意:分层抽样又称类型抽样,应用分层抽样应遵循以下要求:
(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则.
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等.
2.分层抽样的步骤:
(1)分层:按某种特征将总体分成若干部分.
(2)按比例确定每层抽取个体的个数.
(3)各层分别按简单随机抽样的方法抽取.
(4)综合每层抽样,组成样本.
状元随笔 应用分层抽样法的前提条件
①总体可以分层,层与层之间有明显区别,而层内个体间差异较小.②每层中所抽取的个体差异可按各层个体在总体中所占的比例抽取.③分层抽样要求对总体的情况有一定的了解,明确分层的界限和数目.
基 础 自 测
1.某校期末考试后,为了分析该校高一年级1 000名学生的成绩,从中抽取了100名学生的成绩单进行调查.就这个问题来说,下面说法正确的是( )
A.1 000名学生是总体
B.每名学生是个体
C.100名学生的成绩是一个个体
D.样本的容量是100
答案:D
解析:由随机抽样的基本概念可得,选D.
2.某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适( )
A.抽签法 B.简单随机抽样法
C.分层抽样法 D.随机数表法
答案:C
解析:总体由差异明显的三部分组成,应选用分层抽样.
3.某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( )
A.100 B.150
C.200 D.250
答案:A
解析:方法一:由题意可得=,解得n=100,故选A.
方法二:由题意,抽样比为=,总体容量为3 500+1 500=5 000,故n=5 000×=100.
4.甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层抽样法抽取一个容量为90的样本,应在这三校分别抽取学生( )
A.30人,30人,30人
B.30人,45人,15人
C.20人,30人,10人
D.30人,50人,10人
答案:B
解析:先求抽样比==,再各层按抽样比分别抽取,甲校抽取3 600×=30(人),乙校抽取5 400×=45(人),丙校抽取1 800×=15(人),故选B.
课堂探究·素养提升
题型1 简单随机抽样的概念[经典例题]
例1 下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数个个体中抽取50个个体作为样本;
(2)质量监督部门从180种儿童玩具中选出18种玩具进行质量检验,在抽样过程中,从中任取一种玩具检验后再放回;
(3)某社区组织100名党员研读《十九大报告》,学习十九大精神;
(4)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地逐个抽出7个号签.
【解析】 (1)不是简单随机抽样,因为简单随机抽样要求被抽取样本的总体的个数是有限的.
(2)不是简单随机抽样,因为简单随机抽样要求逐个不放回地抽取.
(3)不是简单随机抽样,因为这100名党员是挑选出来的,该社区每个人被抽到的可能性不同,不符合简单随机抽样中“等可能性”的要求.
(4)是简单随机抽样,因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.
方法归纳
简单随机抽样的四个特征
跟踪训练1 下列抽样方式是否是简单随机抽样?
(1)在某车间包装一种产品,在自动包装的传送带上每隔30分钟抽一包产品,检验其质量是否合格;
(2)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
解析:由简单随机抽样的特点可知,(1)(2)均不是简单随机抽样.(1)总体个数不是有限的.(2)不符合“等可能性”的要求.
题型2 简单随机抽样的应用[经典例题]
例2 (1)要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程;
(2)某车间工人加工了一批零件共40件.为了了解这批零件的质量情况,要从中抽取10件进行检验,如何采用随机数表法抽取样本,写出抽样步骤.
【解析】 (1)利用抽签法,步骤如下:
①将30辆汽车编号,号码是1,2,…,30;
②将号码分别写在一张纸条上,揉成团,制成号签;
③将得到的号签放入一个不透明的袋子中,并搅拌均匀;
④从袋子中依次抽取3个号签,并记录上面的编号;
⑤所得号码对应的3辆汽车就是要抽取的对象.
(2)抽样步骤是:
第一步,先将40件零件编号,可以编号为00,01,02,…,38,39.
第二步,在随机数表中任选一个数作为开始,例如从教材附表的随机数表中的第8行第9列的数0开始.为便于说明,我们将随机数表中的第6行到第10行分别摘录如下:
66 06 57 47 17 34 07 27 68 50 36 69 73 61 70 65 81 33 98 85 11 19 92 91 70
81 05 01 08 05 45 57 18 24 05 35 30 34 28 14 88 79 90 74 39 23 40 30 97 32
83 26 97 76 02 02 05 16 56 92 68 55 57 48 18 73 05 38 52 47 18 62 38 85 79
63 57 33 21 35 05 32 54 70 48 90 55 85 75 18 28 46 82 87 09 83 40 12 56 24
73 79 64 57 53 03 52 96 47 78 35 80 83 42 82 60 93 52 03 44 35 27 38 84 35
第三步,从选定的数0开始向右读下去,得一个两位数字号码02,将它取出;继续向右读,得到02,由于前面已经取出,将它去掉;继续下去,去掉重复的号码,又得到05,16,18,38,33,21,35,32,28.至此,10个样本号码已经取满,于是,所要抽取的样本号码是02,05,16,18,38,33,21,35,32,28.与这10个号码对应的零件即是抽取的样本个体.
状元随笔 (1)总体中的个体数有限,可以采用简单易行的抽签法,按照抽签法的步骤进行即可.
抽签法:按照抽签法的步骤:“编号,制号签,搅拌均匀,随机抽取,得号码”进行.
(2)
方法归纳
(1)抽签法的优点:简单易行.当总体的个数不多时,使总体处于“搅拌均匀”的状态比较容易,这时,每个个体都有均等的机会被抽中,从而能够保证样本的代表性.缺点:仅适用于个体数较少的总体.当总体容量非常大时,费时费力又不方便.况且,如果号签搅拌不均匀,可能导致抽样不公平.
(2)在随机数表法抽样的过程中要注意:
①编号要求位数相同,读数时应结合编号特点进行读取,如:编号为两位,则两位、两位地读取;编号为三位,则三位、三位地读取.
②第一个数字的抽取是随机的.
③读数的方向是任意的,且事先定好.
跟踪训练2 (1)第十三届中国(徐州)国际园林博览会于2021年9月开幕.为做好徐州园博园运营管理工作,2022年春节期间,还需要从30名大学生中随机抽取8人作为志愿者,请写出抽取样本的过程;
(2)有一批机器,编号为1,2,3,…,112.请用随机数法抽取10台入样,写出抽样过程.
解析:(1)抽样过程如下:
第一步,先将30名大学生进行编号,从1到30.
第二步,将编号写在形状、大小相同的号签上.
第三步,将号签放到一个不透明的盒子中搅拌均匀,然后从盒子中逐个抽取8个号签.
第四步,将与号签上的编号对应的大学生抽出,即得样本.
(2)方法一:第一步,将原来的编号调整为001,002,003,…,112.
第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第14行第7个数“0”,向右读.
第三步,从“0”开始,向右读,每次读取三位,凡不在001~112中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到020,086,013,110,089,021,080,098,027,002.
第四步,对应原来编号为20,86,13,110,89,21,80,98,27,2的机器便是要抽取的对象.
方法二:第一步,将原来的编号调整为101,102,103,…,212.
第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第9行第7个数“1”,向右读.
第三步,从“1”开始,向右读,每次读取三位,凡不在101~212中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到173,119,170,187,186,125,140,109,184,178.
第四步,对应原来编号为73,19,70,87,86,25,40,9,84,78的机器便是要抽取的对象.
题型3 分层抽样的概念及计算[经典例题]
例3 (1)某中学有老年教师20人,中年教师65人,青年教师95人.为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是( )
A.抽签法 B.简单随机抽样
C.分层抽样 D.随机数表法
【答案】 C
【解析】 各部分之间有明显的差异是分层抽样的依据.
(2)某市有大型超市200家,中型超市400家,小型超市1 400家.为掌握各类超市的营业情况,现按分层抽样的方法抽取一个容量为100的样本,应抽取中型超市________家.
20
【解析】 依据题意,可得抽样比为=,故应抽取中型超市400×=20(家).
状元随笔 (1)有明显差异用分层抽样.
(2)
方法归纳
(1)各部分之间有明显的差异是分层抽样的依据,至于各层内用什么方法抽样是灵活的,可用简单随机抽样,也可采用系统抽样.分层抽样中,无论哪一层的个体,被抽中的机会均等,体现了抽样的公平性.
(2)分层抽样中有关抽样比的计算方法
对于分层抽样中的比值问题,常利用以下关系式巧解:
①=;
②总体中某两层的个体数之比=样本中这两层抽取的个体数之比.
对于分层抽样中求某层个体数,或某层要抽取的样本个体数,都可以通过上面两个等量关系求解.
跟踪训练3 (1)某市有四所重点大学,为了解该市大学生的课外书籍阅读情况,采用下列哪种方法抽取样本最合适(四所大学图书馆的藏书有一定的差距)( )
A.抽签法 B.随机数表法
C.简单随机法 D.分层抽样法
答案:D
解析:因为学校图书馆的藏书对学生课外书籍阅读影响比较大,因此采取分层抽样.
(2)某校高三年级有男生800人,女生600人,为了解该年级学生的身体健康情况,从男生中任意抽取40人,从女生中任意抽取30人进行调查.这种抽样方法是 ( )
A.简单随机法 B.抽签法
C.随机数表法 D.分层抽样法
关键看是否有明显差异
答案:D
解析:总体中个体差异比较明显==,且抽取的比例也符合分层抽样.
(3)某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍,为了解职工的身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为________.
18
解析:设该单位老年职工人数为x,由题意得3x=430-160,解得x=90.则样本中的老年职工人数为90×=18.
题型4 分层抽样的概念及应用
例4 某家电视台在因特网上征集某电视节目现场参与的观众,报名的总人数为12 000人,分别来自4个城区,其中东城区2 400人,西城区4 600人,南城区3 800人,北城区1 200人,从中抽取60人参加现场的节目,应当如何抽取?写出抽取过程.
【解析】 采用分层抽样的方式抽取参加现场节目的观众,步骤如下:
第一步,分层.按城区分为四层:东城区、西城区、南城区、北城区.
第二步,确定抽样比.样本容量n=60,总体容量N=12 000,故抽样比k===.
第三步,按比例确定每层抽取个体数.在东城区抽取2 400×=12(人),在西城区抽取4 600×=23(人),在南城区抽取3 800×=19(人),在北城区抽取1 200×=6(人).
第四步,在各层分别用简单随机抽样法抽取样本.将各城区抽取的观众合在一起组成样本.
状元随笔 由题知有明显差异,利用分层抽样抽样.
(1)分多少层.
(2)比例是多少.
(3)每层抽多少.
方法归纳
(1)如果总体中的个体有差异时,就用分层抽样抽取样本,用分层抽样抽取样本时,要把性质、结构相同的个体,组成一层.
(2)每层中所抽取的个体数应按各层个体数在总体中所占的比例抽取,也就是各层抽取的比例都等于样本容量在总体中的比例,即抽样比=.这样抽取能使所得到的样本结构与总体结构相同,可以提高样本对总体的代表性.
跟踪训练4 在100个产品中,有一等品20个,二等品30个,三等品50个,现要抽取一个容量为30的样本,请说明抽样过程.
解析:先将产品按等级分成三层;第一层,一等品20个;第二层,二等品30个;第三层,三等品50个.然后确定每一层抽取的个体数,因为抽样比为=,所以应在第一层中抽取产品20×=6(个),在第二层中抽取产品30×=9(个),在第三层中抽取产品50×=15(个).分别给这些产品编号并贴上标签,用抽签法或随机数表法在各层中抽取,得到一等品6个,二等品9个,三等品15个,这样就通过分层抽样得到了一个容量为30的样本.