第二章 2.1 2.1.1
一、选择题
1.下面的抽样方法是简单随机抽样的是( )
A.在某年明信片销售活动中,规定每100万张为一个开奖组,用随机抽取的方式确定号码的后四位为270 9的为三等奖
B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,检验其质量是否合格
C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见
D.用抽签法从10件产品中抽取3件进行质量检验
[答案] D
2.某校有40个班,每班50人,每班选派3人参加“学代会”,在这个问题中样本容量是( )
A.40 B.50
C.120 D.150
[答案] C
3.关于简单随机抽样的特点,有以下几种说法,其中不正确的是( )
A.要求总体中的个体数有限
B.从总体中逐个抽取
C.这是一种不放回抽样
D.每个个体被抽到的机会不一样,与先后顺序有关
[答案] D
[解析] 简单随机抽样,除具有A、B、C三个特点外,还具有:是等可能抽样,各个个体被抽取的机会相等,与先后顺序无关.
4.用随机数法从100名学生(男生30人)中抽取10人,则某女生被抽到的可能性为( )
A. B.
C. D.
[答案] D
5.(2013~2014·聊城高一检测)某校高一共有10个班,编号1至10,某项调查要从中抽取三个班作为样本,现用抽签法抽取样本,每次抽取一个号码,共抽3次,设五班第一次抽到的可能性为a,第二次被抽到的可能性为b,则( )
A.a=,b= B.a=,b=
C.a=,b= D.a=,b=
[答案] C
[解析] 由简单随机抽样的定义知,每个个体在每次抽取中都有相同的可能性被抽到,故五班在每次抽样中被抽到的可能性都是.
6.(2013·江西高考)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为( )
7816
6572
0802
6314
0702
4369
9728
0198
3204
9234
4935
8200
3623
4869
6938
7481
A.08 B.07
C.02 D.01
[答案] D
[解析] 由题意知选定的第一个数为65(第1行的第5列和第6列),按由左到右选取两位数(大于20的跳过、重复的不选取),前5个个体编号为08,02,14,07,01.故选出来的第5个个体的编号为01.
二、填空题
7.(2013~2014·潍坊高一检测)用简单随机抽样的方法从含n个个体的总体中,逐个抽取一个容量为3的样本,对其中个体a在第一次就被抽取的概率为,那么n=________.
[答案] 8
[解析] 在第一次抽样中,每个个体被抽到的概率均为=,所以n=8.
8.某中学高一年级有700人,高二年级有600人,高三年级有500人,以每人被抽取的机会为0.03,从该中学学生中用简单随机抽样的方法抽取一个样本,则样本容量n为________.
[答案] 54
[解析] n=(700+600+500)×0.03=54
9.2010年3月,山西曝出问题疫苗事件,山西药监局对某批次疫苗进行检验,现将从800支疫苗中抽取60支,在利用随机数表抽取样本时,将800支疫苗按000,001,…,799进行编号,如果从随机数表第8行第7列的数开始向右读,请你依次写出最先检验的5支疫苗的编号是________(下面摘取了随机数表的第7行至第9行).
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 217633 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 8673 58 07 44 39 52 38 79
33 2112 34 29 78 64 56 07 82 52 42 07 44 38 15 5100 13 42 99 66 02 79 54
[答案] 785,567,199,507,175
[解析] 从第8行第7列的数7开始向右读数,得到一个三位数785,因为785<799,所以将785取出,再向右读数,得到一个三位数916.因为916>799,所以将它去掉,再向右读数,得到一个三位数95 5.因为955>799,所以将它去掉,再向右读数,得到一个三位数567.因为567<799,所以将567取出.按照这种方法再向右读数,又取出199,507,175,这就找出最先检验的5支疫苗的编号,即785,567,199,507,175.
三、解答题
10.上海某中学从40名学生中选1名作为上海男篮拉拉队的成员,采用下面两种方法:
方法一 将这40名学生从1~40进行编号,相应的制作写有1~40的40个号签,把这40个号签放在一个暗箱中搅拌均匀,最后随机地从中抽取1个号签,与这个号签对应的学生幸运入选.
方法二 将39个白球与一个红球混合放在一个暗箱中搅拌均匀,让40名学生逐一从中摸取一个球,摸到红球的学生成为拉拉队的成员.
试问这两种方法是否都是抽签法?为什么?这两种方法有何异同?
[解析] 抽签法抽样时给总体中的N个个体编号各不相同,由此可知方法一是抽签法,方法二不是抽签法.因为抽签法要求所有的号签编号互不相同,而方法二中39个白球无法相互区分.
这两种方法的相同之处在于每名学生被选中的机会都相等.
11.(2013~2014·上海高一检测)2011年5月,西部志愿者计划开始报名,上海市闸北区共有50名志愿者参与了报名,现要从中随机抽出6人参加一项活动,请用抽签法进行抽样,并写出过程.
[解析] 第一步,将50名志愿者编号,号码为1,2,3,…,50.
第二步,将号码分别写在一张纸条上,揉成团,制成号签.
第三步,将所有号签放入一个不透明的箱子中,充分搅匀.
第四步,一次取出1个号签,连取6次,并记录其编号.
第五步,将对应编号的志愿者选出即可.
12.为制定本市初中七、八、九年级学生校服的生产计划,有关部门准备对180名初中男生的身高进行调查,现有三种调查方案:
A.测量少年体校中180名男子篮球、排球队员的身高;
B.查阅有关外地180名男生身高的统计资料;
C.在本市的市区和郊县各任选一所完全中学、两所初级中学,在这所学校有关的年级(1)班中,用抽签的方法分别选出10名男生,然后测量他们的身高.
为了达到估计本市初中这三个年级男生身高分布的目的,你认为采用上述哪一种调查方案比较合理,为什么?
[分析] 根据每种调查方案所提供的资料逐一分析,看哪一种调查方案合理.
[解析] A中少年体校的男子篮球、排球运动员的身高一定高于一般的情况,因此测量的结果不公平,无法用测量的结果去估计总体的结果;B中用外地学生的身高也不能准确的反映本地学生身高的实际情况;而C中的抽样方法符合随机抽样,因此用C方案比较合理.
课件57张PPT。成才之路 · 数学路漫漫其修远兮 吾将上下而求索人教A版 · 必修3 统计第二章2.1 随机抽样第二章2.1.1 简单随机抽样
●课标展示
1.理解并掌握简单随机抽样的定义、特点和适用范围.
2.掌握两种简单随机抽样的步骤,并能用简单随机抽样方法抽取样本.●温故知新
旧知再现
1.初中我们学习了样本的有关知识,知道了总体、个体、样本、样本容量、平均数、方差、标准差、众数、中位数等概念,下面我们对这些概念进行回顾:
(1)总体:我们所要考察对象的_______叫做总体,其中每一个考察对象叫做_______.
(2)样本:从总体中抽出的若干个个体组成的_______叫做总体的一个样本,样本中个体的________叫做样本容量.全体个体集合数量(3)个体:总体中的每个________叫做个体.
(4)样本容量:样本中个体的_______叫做样本容量.
(5)平均数:一组数据的和与这组数据的个数的_______.
(6)方差:各个数据与平均数差的平方和,与这组数据的个数的商.
(7)标准差:方差的算术平方根.
(8)众数:一组数据出现次数________的数据.
(9)中位数:一组数据按从小到大排成一列处于_______位置的数.元素数目商最多中间新知导学
1.简单随机抽样
(1)定义:一般地,设一个总体含有N个个体,从中_____________地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都________,就把这种抽样方法叫做简单随机抽样.
(2)说明:我们所讨论的简单随机抽样都是__________的抽样,即抽取到某个个体后,该个体不再__________总体中.常用到的简单随机抽样方法有两种:_________ (抓阄法)和__________.逐个不放回相等不放回放回抽签法随机数法[破疑点] 简单随机抽样具有下列特点:
①简单随机抽样要求总体中的个体数N是有限的.
②简单随机抽样抽取样本的容量n小于或等于总体中的个体数N.
③简单随机抽样中的每个个体被抽到的可能性均为.
④当总体中的个体无差异且个体数目较少时,采用简单随机抽样抽取样本.
⑤逐个抽取即每次仅抽取一个个体.
⑥简单随机抽样是不放回的抽样,即抽取的个体不再放回总体.
2.抽签法
一般地,抽签法就是把总体中的N个个体________,把号码写在______上,将号签放在一个容器中,搅拌_______后,每次从中抽取________号签,连续抽取n次,就得到一个容量为______的样本.
编号号签均匀一个n
[归纳总结] 抽签法抽取样本的步骤:
①将总体中的个体编号为1~N.
②将所有编号1~N写在形状、大小相同的号签上.
③将号签放在一个不透明的容器中,搅拌均匀.
④从容器中每次抽取一个号签,并记录其编号,连续抽取n次.
⑤从总体中将与抽取到的签的编号相一致的个体取出.
操作要点是:编号、写签、搅匀、抽取样本.
3.随机数法
随机数法即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.
用随机数表法抽取样本的步骤:
①将总体中的个体________.
②在随机数表中__________数作为开始.
③规定一个方向作为从选定的数读取数字的_______.编号任选一个方向
④开始读取数字,若不在编号中,则_______,若在编号中则________,依次取下去,直到取满为止.(相同的号只计一次)
⑤根据选中的号码抽取样本.
操作要点是:编号、选起始数、读数、获取样本.
[破疑点] 虽然产生随机数的方法很多,但在高中数学中,仅学习用随机数表产生随机数来抽样,即随机数表法.跳过取出
4.抽签法与随机数法的异同点
剖析:相同点:(1)都是简单随机抽样,并且要求被抽取样本的总体所含的个体是有限的;(2)都是从总体中逐个地、不放回地抽取.
不同点:(1)抽签法比随机数法简单;(2)随机数法更适用于总体中的个体数较多的时候,而抽签法适用于总体中的个体数相对较少的情况,所以当总体中的个体数较多时,应当选用随机数法,这样可以节约大量的人力和制作号签的成本.
●自我检测
1.(2013~2014北京林业大学附中)在简单随机抽样中,某一个个体被抽中的可能性( )
A.与第几次抽样无关,第一次抽中的可能性要大些
B.与第几次抽样无关,每次抽中的可能性都相等
C.与第几次抽样有关,最后一次抽中的可能性要大些
D.每个个体被抽中的可能性无法确定
[答案] B
[解析] 在简单随机抽样中,每一个个体被抽中的可能性都相等,与第几次抽样无关.
2.抽签法中确保样本代表性的关键是( )
A.制签 B.搅拌均匀
C.逐一抽取 D.抽取不放回
[答案] B
3.用随机数表法进行抽样,有以下几个步骤:①将总体中的个体编号;②获取样本号码;③选定随机数表开始的数字,这些步骤的先后顺序应该是________.(填序号)
[答案] ①③②
4.为了检验某种产品的质量,决定从1001件产品中抽取10件进行检查,用随机数表法抽取样本的过程中,所编的号码的位数最少是________位.
[答案] 四
[解析] 由于所编号码的位数和读数的位数要一致,因此所编号码的位数最少是四位,从0000到1000,或者是从0001到1001等.简单随机抽样的概念 ●典例探究
C.某学校有在编人员160人.其中行政人员16人,教师112人,后勤人员32人,教育部门为了了解学校机构改革意见,要从中抽取一个容量为20的样本
D.某乡农田有山地8000亩,丘陵12000亩,平地24000亩,洼地4000亩,现抽取农田480亩估计全乡农田平均产量
[解析] 根据简单随机抽样的特点进行判断.
A的总体容量较大,用简单随机抽样法比较麻烦;B的总体容量较小,用简单随机抽样法比较方便;C中,由于学校各类人员对这一问题的看法可能差异很大,不宜采用简单随机抽样法;D中,总体容量较大,且各类田地的产量差别很大,也不宜采用简单随机抽样法.
[答案] B 本题中易错选A,其原因忽视了简单随机抽样适用于总体容量较小的总体. 规律总结:1.如果一个总体满足下列两个条件,那么可用简单随机抽样抽取样本:
①总体中的个体之间无差异:
②总体个数不多.2.判断所给的抽样是否为简单随机抽样的依据是简单随机抽样的四个特征:
上述四点特征,如果有一点不满足,就不是简单随机抽样(1)(2013~2014·孝感高一检测)现从80件产品中随机抽出20件进行质量检验,下列说法正确的是( )
A.80件产品是总体 B.20件产品是样本
C.样本容量是80 D.样本容量是20
(2)下列提取样本的方法是简单随机抽样吗?为什么?
①从无限多个个体中抽取50个个体作为样本.
②箱子里共有100个零件,今从中选取10个零件进行检验,在抽样操作时,从中任意地拿出一个零件进行质量检验后再把它放回箱子里.
③从50个个体中一次性抽取5个个体作为样本.
④一彩民选号,从装有36个大小、形状都相同的号签的箱子中逐个不放回地抽取6个号签.
[分析] 1.统计中的总体、个体、样本、样本容量的概念是什么?
2.若抽取样本的方式是简单随机抽样,它应具备哪些特点?[解析] (1)总体是80件产品的质量;样本是抽取的20件产品的质量,总体容量是80;样本容量是20.
(2)①不是简单随机抽样,因为被抽取的样本的总体的个数是无限的而不是有限的.
②不是简单随机抽样,因为它是有放回抽样.
③不是简单随机抽样,因为它是一次性抽取,而不是逐个抽取.
④是简单随机抽样,因为总体中的个体是有限的,并且是从总体中逐个抽取、不放回、等可能的抽样.
[答案] (1)D抽签法的应用[解析] 第一步,将30名学生进行编号,号码为:01,02,…,30.
第二步,用相同的纸条做成30个号签,在每个号签上写上这些编号.
第三步,将得到的号签放入一个不透明的容器中,并充分搅匀.
第四步,从容器中依次抽取6个号签,并记录上面的编号.
第五步,所得号码对应的6名学生就是要抽取的对象. 规律总结:一般地,当总体容量和样本容量都较小时可用抽签法.在用抽签法解决问题的过程中,为了使每一个个体被抽到的可能性相等,要特别注意每一次抽签前要将号签搅匀,这样才能保证抽样的公平性.
利用抽签法抽取样本时应注意以下问题:
①编号时,如果已有编号(如学号,标号等),可不必重新编号.
②号签要求大小、形状完全相同.
③号签要搅拌均匀.
④要逐一不放回地抽取. 某大学为了支援西部教育事业,现从报名的18名志愿者中选取6人组成志愿小组,请用抽签法确定志愿小组成员,并写出抽样步骤.[解析] 抽样步骤是:
第一步,将18名志愿者编号,号码是01,02,…,18;
第二步,将号码分别写在同样的小纸片上,揉成团,制成号签;
第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀;
第四步,从袋子中依次抽取6个号签,并记录上面的编号;
第五步,与所得号码对应的志愿者就是志愿小组的成员.[解析] 抽样步骤是:
第一步,先将40件零件编号,可以编为00,01,02,…,38,39.
第二步,在随机数表中任选一个数作为开始,例如从教材附表的随机数表中的第8行第9列的数5开始.为便于说明,我们将随机数表中的第6行至第10行摘录如下:随机数表法的应用16 22 77 94 39 49 54 43 54 82 17 37 93 23 78
87 35 20 96 43 84 26 34 91 64
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67
21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75
12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38
15 51 00 13 42 99 66 02 79 54
57 60 86 32 44 09 47 27 96 54 49 17 46 09 62
90 52 84 77 27 08 02 73 43 28
第三步,从选定的数5开始向右读下去,得到一个两位数字号码59,由于59>39,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34.至此,10个样本号码已经取满,于是,所要抽取的样本号码是16,19,10,12,07,39,38,33,21,34.与这10个号码对应的零件即是抽取的样本个体.
规律总结:在随机数表法抽样的过程中要注意:
①编号要求位数相同.
②第一个数字的选取是随机的.
③读数的方向是任意的,且事先定好. (2013~2014·烟台高一检测)假设要抽查某种品牌的850颗种子的发芽率,抽取60颗进行实验.利用随机数表抽取种子时,先将850颗种子按001,002,…,850进行编号,如果从随机数表第8行第2列的数3开始向右读,请你依次写出最先检测的4颗种子的编号________.
(下面摘取了随机数表第7行至第9行)
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67
21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75
12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38
15 51 00 13 42 99 66 02 79 54
[解析] 第8行第2列的数3开始向右读第一个小于850的数字是301,
第二个数字是637,也符合题意,
第三个数字是859,大于850,舍去,
第四个数字是169,符合题意,
第五个数字是555,符合题意,
故答案为:301,637,169,555.
[答案] 301,637,169,555[错解] 选择A、B、C中的一个[错因分析] 对于选项A、B处对总体、个体、样本的概念把握不准,误将考察的对象当作运动员;对于选项C处把个体和样本混淆致误.
[正解] 选D.根据统计的相关概念并结合题意可得,此题的总体、个体、样本这三个概念的考察对象都是运动员的身高,而不是运动员,并且一个个体是指一名运动员的身高,选项A,B表达的对象都是运动员,选项C未将个体和样本理解透彻.在这个问题中,总体是240名运动员的身高,个体是每个运动员的身高,样本是40名运动员的身高,样本容量是40.因此选D.[防范措施] 1.明确相关概念
对总体、个体、样本、样本容量的概念要熟练把握,要明确总体与样本的包含关系及样本与样本容量的区别,如本例选项C,是对概念把握不准.
2.注意考察对象
解决考查总体、个体、样本、样本容量的概念问题时,关键是明确考察对象,根据相关的概念可知总体、个体与样本的考察对象是相同的,如本例中选项A,B表达的对象都是运动员的身高而不是运动员.从某年级500名学生中抽取60名学生进行体重的统计分析,下列说法正确的是( )
A.500名学生是总体
B.每个被抽查的学生是样本
C.抽取的60名学生的体重是一个样本
D.抽取的60名学生的体重是样本容量[解析]
[答案] C
1.为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是( )
A.总体是240 B.个体是每一名学生
C.样本是40名学生 D.样本容量是40
[答案] D
[解析] 总体、个体、样本中的对象都是身高,故只有D正确.
2.下面的抽样方法是简单随机抽样的是( )
A.从无数个个体中抽取50个个体作为样本
B.从含有50个个体的总体里一次性抽取5个个体作为样本
C.某班有40名同学,指定个子最高的5名同学参加篮球比赛
D.一彩民从装有30个大小、形状都相同的号签的盒子中无放回地抽取7个号签
[答案] D
[解析] A错,简单随机抽样中,总体中的个体数不能是无限的;B错,简单随机抽样的定义的要求是“逐个抽取”,不能“一次性”抽取;C错,指定5人参赛,每个个体被抽到的机会不均等,不是简单随机抽样;D对,符合简单随机抽样的定义和特征.
3.用随机数法进行抽样有以下几个步骤:
①将总体中的个体编号 ②获取样本号码
③选定开始的数字 ④选定读数的方向
⑤抽取样本
这些步骤的先后顺序应为( )
A.①②③④⑤ B.①③④②⑤
C.③②⑤①④ D.⑤④③①②
[答案] B
4.某市为了了解本市4 600名高三理科毕业生的数学成绩,要从中抽取200名进行数据分析,那么这次考察的总体为________,样本容量为________.
[答案] 4 600名高三理科毕业生的数学成绩 200
5.某工厂的质检人员对生产的100件产品,采用随机数表法抽取10件进行检查,对100件产品采用下面的编号方法:①1,2,3,…,100;②001,002,003,…,100;③00,01,02,…,99.其中最恰当的编号是________.
[错解] 因为是对100件产品编号,则编号为1,2,3,…,100,所以①最恰当.
[错因分析] 用随机数表法抽样时,如果所编号码的位数不相同,那么无法在随机数表中读数,因此,所编号码的位数要相同.
[正解] 只有编号时数字位数相同,才能达到随机等可能抽样.所以①不恰当.②③的编号位数相同,都可以采用随机数表法,但②中号码是三位数,读数费时,所以③最恰当.
6.某校高一年级有36名足球运动员,要从中抽出7人调查学习负担情况.试用两种简单随机抽样方法分别取样.
[解析] 方法一(抽签法)
第一步,将36名足球运动员进行编号,分别为1,2,3,…,36;
第二步,将36个号码分别写在相同的纸片上,揉成团,制成号签;
第三步,将号签放入一个不透明的盒子里,充分搅拌,依次抽取7个号签,并记录上面的号码;
第四步,与这7个号码对应的足球运动员就是要抽取的样本.方法二(随机数表法)
第一步,将36名足球运动员进行编号,分别为00,01,02,03,…,35;
第二步,在随机数表中任选一数作为开始数字,任选一方向作为读数方向.比如,选第4行第9个数字“2”,方向向右读;
第三步,从“2”开始,向右读,每次读取两位,凡不在00~35中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到26,27,31,05,03,15,12.
第四步,将与这7个号码26,27,31,05,03,15,12相对应的足球运动员选出,就构成了我们所要的样本.第二章 2.1 2.1.2
一、选择题
1.某校高三年级有12个班,每个班随机的按1~50号排学号,为了了解某项情况,要求每班学号为20的同学去开座谈会,这里运用的是( )
A.抽签法 B.随机数表法
C.系统抽样法 D.以上都不是
[答案] C
2.从2007名学生中选取50名参加全国数学联赛,若采用下面的方法选取:先用简单随机抽样从2007人中剔除7人,剩下的2000人再按系统抽样的方法抽取,则每人入选的可能性( )
A.不全相等 B.均不相等
C.都相等,且为 D.都相等,且为
[答案] C
3.用系统抽样法(按等距离的规则)从160名学生中抽取容量为20的样本,将这160名学生从1到160编号.按编号顺序平均分成20段(1~8号,9~16号,…,153~160号),若第16段应抽出的号码为125,则第1段中用简单随机抽样确定的号码是( )
A.7 B.5
C.4 D.3
[答案] B
[解析] 用系统抽样知,每段中有8人,第16段应为从121到128这8个号码,125是其中的第5个号码,所以第一段中被确定的号码是5.
4.有20位同学,编号从1至20,现在从中抽取4人进行问卷调查,若用系统抽样方法,则所抽的编号可能为( )
A.5,10,15,20 B.2,6,10,14
C.2,4,6,8 D.5,8,9,14
[答案] A
[解析] 根据系统抽样的特点,所选号码应是等距的,且每组都有一个,B、C中的号码虽然等距,但没有后面组中的号码;D中的号码不等距,且有的组没有被抽到,所以只有A组的号码符合要求.
5.(2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为( )
A.7 B.9
C.10 D.15
[答案] C
[解析] 从960人中用系统抽样方法抽取32人,则抽样距为k==30,
因为第一组号码为9,
则第二组号码为9+1×30=39,…,
第n组号码为9+(n-1)×30=30n-21,
由451≤30n-21≤750,即15≤n≤25,所以n=16,17,…,25,共有25-16+1=10(人).
6.(2010·湖北)将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从495到600在第Ⅲ营区,三个营区被抽中的人数依次为( )
A.26,16,8 B.25,17,8
C.25,16,9 D.24,17,9
[答案] B
[解析] 依题意及系统抽样的意义可知,将这600名学生按编号依次分成50组,每组有12名学生,第k(k∈N*)组抽中的号码是3+12(k-1).
令3+12(k-1)≤300得k≤,因此第Ⅰ营区被抽中的人数是25;
令300<3+12(k-1)≤495得<k≤42,因此第Ⅱ营区被抽中的人数是42-25=17.
从而第Ⅲ营区被抽中的人数是50-42=8.
二、填空题
7.从高三(八)班42名学生中,抽取7名学生了解本次考试数学成绩状况,已知本班学生学号是1~42号,现在该班数学老师已经确定抽取6号,那么,用系统抽样法确定其余学生号码为________.
[答案] 12,18,24,30,36,42
8.某学校有学生4 022人.为调查学生对2012年伦敦奥运会的了解状况,现用系统抽样的方法抽取一个容量为30的样本,则分段间隔是________.
[答案] 134
[解析] 由于不是整数,所以应从4 022名学生中用简单随机抽样剔除2名,则分段间隔是=134.
9.一个总体中的100个个体的编号分别为0,1,2,3,…,99,依次将其分成10个小段,段号分别为0,1,2,…,9.现要用系统抽样的方法抽取一个容量为10的样本,规定如果在第0段随机抽取的号码为l,那么依次错位地取出后面各段的号码,即第k段中所抽取的号码的个位数为l+k或l+k-10(l+k≥10),则当l=6时,所抽取的10个号码依次是________.
[答案] 6,17,28,39,40,51,62,73,84,95
[解析] 在第0段随机抽取的号码为6,则由题意知,在第1段抽取的号码应是17,在第2段抽取的号码应是28,依次类推,故正确答案为6,17,28,39,40,51,62,73,84,95.
三、解答题
10.某集团有员工1 019人,其中获得过国家级表彰的有29人,其他人员990人.该集团拟组织一次出国学习,参加人员确定为:获得过国家级表彰的人员5人,其他人员30人.如何确定人选?
[解析] 获得过国家级表彰的人员选5人,适宜使用抽签法;其他人员选30人,适用使用系统抽样法.
(1)确定获得过国家级表彰的人员人选:
①用随机方式给29人编号,号码为1,2,…,29;
②将这29个号码分别写在一个小纸条上,揉成小球,制成号签;
③将得到的号签放入一个不透明的袋子中,搅拌均匀;
④从袋子中逐个抽取5个号签,并记录上面的号码;
⑤从总体中将与抽取的号签的号码相一致的个体取出,人选就确定了.
(2)确定其他人员人选:
第一步:将990人其他人员重新编号(分别为1,2,…,990),并分成30段,每段33人;
第二步,在第一段1,2,…,33这33个编号中用简单随机抽样法抽出一个(如3)作为起始号码;
第三步,将编号为3,36,69,…,960的个体抽出,人选就确定了.
(1)、(2)确定的人选合在一起就是最终确定的人选.
11.一个总体中的1000个个体编号为0,1,2,…,999,并依次将其分为10个小组,组号为0,1,2,…,9.要用系统抽样方法抽取一个容量为10的样本,规定如果在第0组随机抽取的号码为x,那么依次错位地得到后面各组的号码,即第k组中抽取的号码的后两位数为x+33k的后两位数.
(1)当x=24时,写出所抽取样本的10个号码;
(2)若所抽取样本的10个号码中有一个的后两位数是87,求x的取值范围.
[解析] (1)当x=24时,按规则可知所抽取样本的10个号码依次为:24,157,290,323,456,589,622,755,888,921.
(2)当k=0,1,2,…,9时,33k的值依次为0,33,66,99,132,165,198,231,264,297.
又抽取样本的10个号码中有一个的后两位数是87,从而x可以为87,54,21,88,55,22,89,56,23,90.
∴x的取值范围是{21,22,23,54,55,56,87,88,89,90}.
12.下面给出某村委调查本村各户收入情况所作的抽样,阅读并回答问题:
本村人口:1 200人,户数300,每户平均人口数4人;
应抽户数:30户;
抽样间隔:=40;
确定随机数字:取一张人民币,编码的后两位数为12;
确定第一样本户:编码的后两位数为12的户为第一样本户;
确定第二样本户:12+40=52,52号为第二样本户;
……
(1)该村委采用了何种抽样方法?
(2)抽样过程中存在哪些问题,并修改.
(3)何处是用简单随机抽样.
[解析] (1)系统抽样.
(2)本题是对某村各户进行抽样,而不是对某村人口抽样,抽样间隔为=10,其他步骤相应改为确定随机数字:取一张人民币,编码的后两位数为02(或其他00~09中的一个);确定第一样本户:编号为02的户为第一样本户;确定第二样本户:02+10=12,编号为12的户为第二样本户;….
(3)确定随机数字用的是简单随机抽样,取一张人民币,编码的后两位数为02.
课件56张PPT。成才之路 · 数学路漫漫其修远兮 吾将上下而求索人教A版 · 必修3 统计第二章2.1 随机抽样第二章2.1.2 系统抽样
●课标展示
1.理解系统抽样的定义、适用条件及其步骤.
2.会利用系统抽样取样本.
●温故知新
旧知再现
1.对于简单随机抽样,下列说法中正确的是( )
①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概率进行分析;②它是从总体中逐个地进行抽取,以便在抽样实践中进行操作;③它是一种不放回抽样;④它是一种等概率抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的概率相等,而且在整个抽样过程中,各个个体被抽取的概率也相等,从而保证了这种抽样方法的公平性.
A.①②③ B.①②④
C.①③④ D.①②③④
[答案] D2.下列抽样方法是简单随机抽样的是( )
A.将10个大小相同、质量不相等的小球放入黑筒中搅拌均匀后,逐个地抽取5个小球
B.从50个零件中有放回地抽取5个做质量检验
C.从实数中逐个抽取10个做奇偶性分析
D.某运动员从8个跑道中随机选取一个跑道
[解析] 由于小球质量不等,导致每个小球被抽到的机会不等,所以选项A错;选项B错在“有放回”抽取;选项C错在总体容量无限.
[答案] D
3.一个总体的60个个体编号为00,01,02,…,59,现需从中抽取一个容量为8的样本,请从下面随机数表的第2行第6列的0开始,依次向右读,每次读取两位,凡不在00~59中的数跳过不读,前面已经读过的也跳过去不读,直到取足样本,则抽取样本的号码是________.
95 33 95 22 00 18 74 72 00 18 38 79 58 69 32
81 76 80 26 92 82 80 84 25 39 90 84 60 79 80
24 36 59 87 38 82 07 53 89 35 96 35 23 79 18
05 98 90 07 35 46 40 62 98 80 54 97 20 56 95
15 74 80 08 32 16 64 70 50 80 67 72 16 42 79
20 31 89 03 43 38 46 82 68 72 32 14 82 99 70
80 60 47 18 97 63 49 30 21 30 71 59 73 05 50
[答案] 02,28,08,42,53,46,07,43
新知导学
1.系统抽样
(1)定义:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成________的若干部分,然后按照预先制定的________,从每一部分抽取________个体,得到所需要的样本,这种抽样的方法叫做系统抽样.均衡规则一个(2)步骤:
(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整数倍即为抽样编号.
(4)在每段上仅抽一个个体,所分的组数(即段数)等于样本容量.
(5)第一步编号中,有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等,不再重新编号.
2.系统抽样与简单随机抽样的区别与联系
[破疑点] 面对实际问题,能准确地选择一种合理的抽样方法,对初学者来说至关重要.可采用以下原则:(1)当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法(也可用随机数表法);(2)当总体容量较大,样本容量较小时可用随机数表法;(3)当总体容量较大,样本容量也较大时也可用系统抽样.●自我检测
1.下列问题中,最适合用系统抽样抽取样本的是( )
A.从10名学生中,随机抽2名学生参加义务劳动
B.从全校3 000名学生中,随机抽100名学生参加义务劳动
C.从某市30 000名学生中,其中小学生有14 000人,初中生有10 000人,高中生有6 000人,抽取300名学生了解该市学生的近视情况
D.从某班周二值日小组6人中,随机抽取1人擦黑板
[答案] B
[解析] A错,总体中个体无差异,但个数较少,宜用简单随机抽样;B对,总体中个体无差异,个数较多,且样本容是较大,宜用系统抽样;C错,总体中个体有差异,不适合用系统抽样;D错,总体容量较小,样本容量也较小,宜用简单随机抽样.
规律总结:本题中易错认为A、D也适合用系统抽样,其原因是不明确系统抽样适用于总体中个体数目较多的情况.
2.中央电视台动画城节目为了对本周的热心小观众给予奖励,要从已确定编号的一万名小观众中抽出十名幸运小观众.现采用系统抽样法抽样,其组容量为( )
A.10 B.100
C.1 000 D.10 000
[答案] C
[解析] 依题意,要抽十名幸运小观众,所以要分成十个组,每个组容量为10 000÷10=1 000,即分段间隔.
3.(2013~2014·北京大学附中高考一轮单元复习精品练习)有20位同学,编号从1至20,现在从中抽取4人做问卷调查,用系统抽样方法确定所抽的编号可能为( )
A.5,10,15,20 B.2,6,10,14
C.2,4,6,8 D.5,8,11,14
[答案] A系统抽样概念的理解 ●典例探究
C.搞某项市场调查,规定在商店门中随机地抽一个人进行询问,直到调查到事先规定的调查人数为止
D.某电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈
[解析] 本题C显然不是系统抽样,因为事先不知道总体数量,抽样方法也不能保证每个个体等可能入样,总体也没有分成均衡的几部分,故C不是系统抽样.
[答案] C 规律总结: 某市场想通过检查发票及销售记录的2%来快速估计每月的销量总额.采取如下方法:从某本发票的存根中随机抽一张,如15号,然后按顺序往后将65号,115号,165号,…抽出,发票上的销售额组成一个调查样本.这种抽取样本的方法是( )
A.抽签法 B.随机数法
C.系统抽样法 D.其他的抽样方法
[答案] C
[解析] 上述抽样方法是将发票平均分成若干组,每组50张,从第一组中抽取15号,以后各组抽取15+50n(n∈N)号,符合系统抽样的特点.系统抽样方案的设计 [解析] (1)对全体学生的数学成绩进行编号:1,2,3,…,15 000.
(2)分段:由于样本容量与总体容量的比是1?100,所以我们将总体平均分为150个部分,其中每一部分包含100个个体.
(3)在第一部分即1号到100号用简单随机抽样,抽取一个号码,比如是56.
(4)以56作为起始数,然后顺次抽取156,256,356,…,14 956,这样就得到一个容量为150的样本. 规律总结:利用系统抽样的两个关键步骤
[特别提醒] 将总体平分组时,应先考虑总体容量N是否被样本容量n整除.(1)(2013~2014·河北省衡水一中月考)将参加数学竞赛的1000名学生编号如下000,001,002,…,999,打算从中抽取一个容量为50的样本,按系统抽样方法分成50个部分,第一组编号000,001,…,019,如果在第一组随机抽取的号码为015,则第30个号码为________.
[答案] 595
[解析] 本题考查系统抽样的特点.由题意知,抽取的号码为20×30-5=595.(2)为了了解高二2 013名学生中使用数学教辅的情况,请你用系统抽样抽取一个容量为50的样本.不同抽样方法的正确选取与比较
[分析] 根据题目特点选择合理的抽样方法实施抽样过程.
[解析] (1)①将703件产品以随机方式编号;
②从总体中剔除3件(可用随机数表法),将剩下的700件产品重新编号(号码为1,2,…,700),并分成70段;
③在第一段1,2,…,10这10个编号中用简单随机抽样抽出一个(如4)作为起始号码;
④将编号为4,14,24,…,694的个体抽出,组成样本.
(2)第一步,将703件产品以随机方式编号,号码为001,002,…,703;
第二步,在随机数表中随机地确定一个数作为开始,如,从第8行第29列的数“7”开始,任选一个方向作为读数方向,如,向右读;
第三步,从数“7”开始向右读,每次读三位,凡不在001~703中的数跳过去不读,遇到已经读过的数也跳过去,便可依次得到286,443,387,211,234,297,560;
这7个号码就是所要抽取的7个样本个体的号码.(3)第一步,将30件产品以随机方式编号,号码为1,2,…,30;
第二步,将这30个号码分别写在一个大小、形状都一样的30张小纸条上,揉成小球,制成号签;
第三步,将得到的号签放入一个不透明的袋子中,充分搅拌;
第四步,从袋子中逐个抽取4个号签,并记录上面的号码;
第五步,从总体中将与抽到的号签上的号码相一致的个体取出. 规律总结:根据实际问题,准确地选取一种合理的抽样方法,可采用以下原则:
(1)当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法(也可用随机数法);
(2)当总体容量较大,样本容量较小时,可用随机数法;
(3)当总体容量较大,样本容量也较大时,可用系统抽样法. 某工厂有一线职工650人,管理人员25人,现从一线职工中抽取25人,从管理人员中抽取2人到外单位进行参观学习,在这个抽样过程中,最适合的抽样方法为( )
A.随机数表法 抽签法
B.随机数表法
C.系统抽样法 抽签法
D.抽签法
[答案] C
[解析] 一线职工650人,从中抽取25人,总体容量和样本容量都比较大,宜采用系统抽样法;从25名管理人员中,抽取2人,宜采用抽签法,故选C.[错解] 选A或D[错因分析] 对于选项A误认为剔除14人,被抽取到的机会就不相等了,错选A;
对于选项D认为被抽取的机促进相等,但利用了剔除后的数据计算,错选D.[防范措施] 1.明确系统抽样的操作要领
系统抽样操作要领是先将个体数较多的总体分成均衡的若干部分,然后按照预先指定的规则,从每一部分中抽取一个个体,得到所需样本.系统抽样是等距离抽样,每个个体被抽到的机会是相等的,如本题中2000人要分为50段.
2.对系统抽样合理分段
在系统抽样过程中,为将整个编号分段,要确定分段间隔,当在系统抽样过程中比值不是整数时,要从总体中剔除一些个体(用简单随机抽样),但每一个个体入样的机会仍然相等.如本题中剔除14人后,每个人被抽取的可能性不变.(2013·陕西高考)某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )
A.11 B.12
C.13 D.14[答案] B
1.系统抽样适用的总体应是( )
A.容量较小的总体
B.总体容量较大
C.个体数较多但均衡无差异的总体
D.任何总体
[答案] C
[解析] 系统抽样的适用范围应是总体中的个体数目较多且无差异.2.下列问题中,最适合用系统抽样抽取样本的是( )
A.从10名学生中,随机抽取2名学生参加义务劳动
B.从全校3000名学生中,随机抽取100名学生参加义务劳动
C.从某市30000名学生中,其中小学生有14000人,初中生有10000人,高中生有6000人,抽取3000名学生以了解该市学生的近视情况
D.从某班周二值日小组6人中,随机抽取1人擦黑板
[答案] B
[解析] A项中总体个体无差异,但个数较少,适合用简单随机抽样;同样D项中也适合用简单随机抽样;C项中总体中个体有差异不适合用系统抽样;B项中,总体中有3000个个体,个数较多且无差异,适合用系统抽样.
3.为了了解参加一次知识竞赛的1252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本.那么总体中应随机剔除的个体数目是( )
A.2 B.4
C.5 D.6
[答案] A
4.某中学从已编号(1~60)的60个班级中,随机抽取6个班级进行卫生检查,用每部分选取的号码间隔一样的系统抽样方法确定所选的6个班级的编号可能是( )
A.6,16,26,36,46,56
B.3,10,17,24,31,38
C.4,11,18,25,32,39
D.5,14,23,32,41,50
[答案] A
5.若总体中含有1 645个个体,按0001至1645进行编号,采用系统抽样的方法从中抽取容量为35的样本,则编号后确定编号分为________段,分段间隔k=________,每段有________个个体.若第5段抽取的号码为190,则第1段应抽取的号码为________.
[答案] 35 47 47 2
6.某单位共有在岗职工624人,为了调查工人上班时,从离开家到来到单位的路上平均所用时间,决定抽取24名工人调查这一情况,如何采用系统抽样方法完成这一抽样?[解析] 第一步,将624名在岗职工随机的编号:1,2,3,…,624;
第二步,由于样本容量与总体容量的比是1?26,所以我们将总体平均分成24个部分,其中每一部分包含26个个体;
第三步,在第一部分,即1号到26号用简单随机抽样,抽取一个号码,比如是8;
第四步,以8作为起始数,然后顺次抽取34、60、86、112、138、164、190、216、242、268、294、320、346、372、398、424、450、476、502、528、554、580、606,这样就得到一个容量为24的样本.第二章 2.1 2.1.3
一、选择题
1.(2013~2014·石家庄高一检测)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区有10个特大型销售点,要从中抽取7个销售点调查其销售收入和售后服务等情况,记这项调查为②,则完成①②这两项调查宜采用的抽样方法依次为( )
A.分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法
[答案] B
[解析] 由调查①可知个体差异明显,故宜用分层抽样;调查②中个体较少,故宜用简单随机抽样.
2.某学院有四个饲养房,分别养有18、54、24、48只白鼠供试验用,某项试验需抽取24只白鼠,你认为最合适的抽样方法为( )
A.在每个饲养房中各抽取6只
B.把所有白鼠都加上编有不同号码的颈圈,用随机抽样的方法确定24只
C.在四个饲养房分别随手抽取3、9、4、8只
D.先确定在这四个饲养房应分别抽取3、9、4、8只,再由各饲养房自己加号码颈圈,用简单随机抽样法确定各自要抽取的对象
[答案] D
[解析] 依据公平性原则,根据实际情况确定适当的取样方法是本题的灵魂.A中对四个饲养房平均摊派,但由于各饲养房所养数量不一,反而造成了各个个体被入选几率的不均衡,是错误的方法;B中保证了各个个体被入选几率的相等,但由于没有注意到处在四个不同环境中会产生不同差异,不如采取分层抽样可靠性高,且统一编号统一选择加大了工作量;C中总体采用了分层抽样,但在每个层次中没有考虑到个体的差异(如健壮程度,灵活程度),貌似随机,实则各个个体被抽取到的几率不等,故选D.
3.(2010·重庆高考)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为7人,则样本容量为( )
A.7 B.15
C.25 D.35
[答案] B
[解析] 由题意知,青年职工人数∶中年职工人数∶老年职工人数=350∶250∶150=7∶5∶3.由样本中的青年职工为7人,得样本容量为15.
4.(2013~2014·北京师大附中月考)某橘子园有平地和山地共120亩,现在要估计平均亩产量,按一定的比例用分层抽样的方法共抽取10亩进行调查,如果所抽山地的亩数是平地亩数的2倍多1,则这个橘子园的平地与山地的亩数分别为( )
A.45,75 B.40,80
C.36,84 D.30,90
[答案] C
[解析] 本题考查分层抽样方法.根据条件知所抽山地的亩数为7,所抽平地的亩数为3,则橘子园中山地的亩数为84,平地的亩数为36,故选C.
5.某校共有学生2000名,各年级男、女生人数如下表所示:
一年级
二年级
三年级
女生
373
380
y
男生
377
370
z
现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( )
A.24 B.18
C.16 D.12
[答案] C
[解析] 一年级的学生人数为373+377=750,二年级的学生人数为380+270=750,于是三年级的学生人数为2000-750-750=500,那么三年级应抽取的人数为500×=16.
6.(2013~2014·河北衡水中学高一调研)某初级中学有270人,其中七年级108人,八、九年级各81人.现在要抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系经抽样三种方案,将学生按年级从低到高的顺序依次统一编号为1,2,…,270.如果抽得的号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270.
则下列结论正确的是( )
A.②③都不可能为系统抽样 B.②④都不可能为分层抽样
C.①④都可能为系统抽样 D.①③都能为分层抽样
[答案] D
[解析] 因为一、二、三年级的人数之比为108∶81∶81=4∶3∶3,又因为共抽取10人,根据系统抽样和分层抽样的特点可知,①②③都可能为分层抽样,②④不可能为系统抽样,①③可能为系统抽样,故选D.
二、填空题
7.防疫站对学生进行身体健康调查.红星中学共有学生1600名,采用分层抽样法抽取一个容量为200的样本.已知女生比男生少抽了10人,则该校的女生人数应是________.
[答案] 760
[解析] 设该校的女生人数是x,则男生人数是1 600-x,抽样比是=,则x=(1 600-x)-10,解得x=760.
8.某地有居民100000户,其中普通家庭99 000户,高收入家庭1 000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.
[答案] 5.7%
[解析] 该地拥有3套或3套以上住房的家庭可以估计有99 000×+1 000×=5 700户,所以所占比例的合理估计是5 700÷100 000=5.7%.
9.(09·广东文)某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.
[答案] 37 20
[解析] 由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第8组抽出的号码为22+(8-5)×5=37.
40岁以下年龄段的职工数为200×0.5=100,则应抽取的人数为×100=20人.
三、解答题
10.一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.
[分析] 采用分层抽样的方法.
[解析] 因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而应采用分层抽样的方法.具体过程如下:
(1)将3万人分成5层,一个乡镇为一层.
(2)按照各乡镇的人口比例随机抽取各乡镇的样本:
300×=60(人),300×=40(人),
300×=100(人),300×=40(人),
300×=60(人).
各乡镇分别用分层抽样抽取的人数分别为60,40,100,40,60.
(3)将抽取的这300人组到一起,即得到一个样本.
11.为了对某课题进行讨论研究,用分层抽样的方法从三所高校A、B、C的相关人员中,抽取若干人组成研究小组,有关数据见下表(单位:人)
高校
相关人数
抽取人数
A
x
1
B
36
y
C
54
3
(1)求x,y;
(2)若从高校B相关的人中选2人作专题发言,应采用什么抽样法,请写出合理的抽样过程.
[解析] (1)分层抽样是按各层相关人数和抽取人数的比例进行的,所以有:=?x=18,=?y=2,故x=18,y=2.
(2)总体容量和样本容量较小,所以应采用抽签法,过程如下:
第一步,将36人随机的编号,号码为1,2,3,…,36;
第二步,将号码分别写在相同的纸片上,揉成团,制成号签;
第三步,将号签放入一个不透明的容器中,充分搅匀,依次抽取2个号码,并记录上面的编号;
第四步,把与号码相对应的人抽出,即可得到所要的样本.
12.为了考察某校的教学水平,将对这个学校高三年级的部分学生的本学年考试成绩进行考察,为了全面地反映实际情况,采取以下三种方式进行抽查:(已知该校高三年级共有20个教学班,并且每个班内的学生已经按随机方式编好了学号,假定该校每班学生人数都相同)
(1)从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的学习成绩;
(2)每个班都抽取1人,共计20人,考察这20个学生的成绩;
(3)把学生按成绩分成优秀、良好、普通三个级别,从其中共抽取100名学生进行考察.(已知若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人)
根据上面的叙述,试回答下列问题.
(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?
(2)上面三种抽取方式中各自采用何种抽取样本的方法?
(3)试分别写出上面三种抽取方式各自抽取样本的步骤.
[分析] 本题目主要考查数理统计中一些基本的概念和基本方法.做这种题目时,应该注意叙述的完整和条理.
[解析] (1)这三种抽取方式中,其总体都是指该校高三全体学生本年度的考试成绩,个体都是指高三年级每个学生本年度的考试成绩.其中第一种抽取方式中样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第二种抽取方式中样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第三种抽取方式中样本为所抽取的100名学生本年度的考试成绩,样本容量为100.
(2)上面三种抽取方式中,第一种方式采用的方法是简单随机抽样法;第二种方式采用的方法是系统抽样法和简单随机抽样法;第三种方式采用的方法是分层抽样法和简单随机抽样法.
(3)第一种方式抽样的步骤如下:
第一步,首先在这20个班中用抽签法任意抽取一个班.
第二步,然后从这个班中按学号用随机数表法或抽签法抽取20名学生,考察其考试成绩.
第二种方式抽样的步骤如下:
第一步,首先在第一个班中,用简单随机抽样法任意抽取某一学生,记其学号为a.
第二步,在其余的19个班中,选取学号为a的学生,共计19人.
第三种方式抽样的步骤如下:
第一步,分层.
因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应该把全体学生分成三个层次.
第二步,确定各个层次抽取的人数.
因为样本容量与总体的个体数比为:100∶1 000=1∶10,所以在每个层次抽取的个体数依次为,,,即15,60,25.
第三步,按层次分别抽取:
在优秀生中用简单随机抽样法抽取15人;
在良好生中用系统抽样法抽取60人;
在普通生中用简单随机抽样法抽取25人.
课件62张PPT。成才之路 · 数学路漫漫其修远兮 吾将上下而求索人教A版 · 必修3 统计第二章2.1 随机抽样第二章2.1.3 分层抽样
●课标展示
1.理解分层抽样的定义及其步骤.
2.掌握分层抽样的适用条件,能利用分层抽样抽取样本.
●温故知新
旧知再现
1.简单随机抽样和系统抽样两种抽样方法都适合总体中个体分布较为均匀的总体的抽样问题,简单随机抽样适合个体________的总体的抽样,而系统抽样适合个体_______的总体的抽样.
较少较多
但是,当总体中的个体之间差异较大,分成具有明显差异的几部分时,如果利用上述两种抽样的方法都不能保证抽出的样本具有很好的代表性,这就迫切需要一种更为合理的抽样方法,就是本节要学习的__________抽样.在学习过程中,一是要把握分层抽样方法的特点;二是要与前面的两种抽样方法对比学习,加深对三种抽样方法的理解.分层2.某厂共有64名员工,准备选择4人参加技术评估.现将这64名员工编号,准备运用系统抽样的方法抽取,已知8号,24号,56号在样本中,那么样本中还有一个员工的编号是( )
A.35 B.40
C.45 D.50
[答案] B
3.将参加数学夏令营的100名同学编号为001,002,…,100.现采用系统抽样方法抽取一个容量为25的样本,且第一段中随机抽得的号码为004,则在046至078号中,被抽中的人数为
[答案] 8
[解析] 抽样距为4,第一个号码为004,故001~100中是4的整数倍的数被抽出,在046至078号中有048,052,056, 060,064,068,072,076,共8个.
新知导学
1.分层抽样
(1)定义:一般地,在抽样时,将总体分成__________的层,然后按照一定的_______,从各层_______地抽取一定数量的个体,将各层取出的个体__________作为样本,这种抽样的方法是一种分层抽样.
互不交叉比例独立合在一起
(2)步骤:
①分层:按__________将总体分成若干部分(层);
②按__________确定每层抽取个体的个数;
③各层分别按______________或__________的方法抽取样本;
④综合每层抽样,组成样本.某种特征抽样比简单随机抽样系统抽样[破疑点] 分层抽样又称类型抽样,应用分层抽样应遵循以下要求:
(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,遵循不重复、不遗漏的原则.
(2)分层抽样为保证每个个体都等可能入样,需遵循在各层中进行简单随机抽样或系统抽样,每层样本数量与每层个体数量的比和样本容量与总体容量的比相等.
(3)当总体由差异明显的几部分组成时,往往采用分层抽样.2.三种抽样方法的区别与联系
为了方便使用,这里以表格的形式给出三种抽样方法的对比:
●自我检测
1.某校高三年级有男生500人,女生400人.为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )
A.简单随机抽样法 B.抽签法
C.随机数表法 D.分层抽样法
[答案] D
[解析] 样本由差异明显的几部分组成,抽取的比例由每层个体占总体的比例确定,即为分层抽样法.
2.有一批产品,其中一等品10件,二等品25件,次品5件.用分层抽样从这批产品中抽出8件进行质量分析,则抽样比为________.
[答案] 1?5?2
[解析] 一、二、三等品的比例为10?25?5=1?5?2,故抽样比为1?5?2.
3.(2014·天津)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4?5?5?6,则应从一年级本科生中抽取________名学生.
[答案] 60分层抽样的概念 ●典例探究 (2)下列问题中,最适合用分层抽样抽取样本的是( )
A.从10名同学中抽取3人参加座谈会
B.某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本
C.从1000名工人中,抽取100名调查上班途中所用时间
D.从生产流水线上,抽取样本检查产品质量
[分析] 1.分层抽样是等可能抽样吗?
2.分层抽样的适用范围是什么?[答案] (1)C (2)B 规律总结:分层抽样的前提和遵循的两条原则
(1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取.
(2)遵循的两条原则:
①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
②分层抽样为保证每个人体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比. (1)(2014·湖南)对一个容器为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2、p3,则( )
A.p1=p2<p3 B.p2=p3<p1
C.p1=p3<p2 D.p1=p2=p3
(2)(2013·湖南)某学校有男、女学生各500名.为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )
A.抽签法 B.随机数法
C.系统抽样法 D.分层抽样法
[答案] (1)D (2)D
[解析] (1)根据随机抽样的原理可得简单随查抽样,分层抽样,系统抽样都必须满足每个个体被抽到的概率相等,即p1=p2=p3,故选D.
(2)由于被抽取的个体的属性具有明显差异,所以宜采用分层抽样法.分层抽样各层中样本容量的计算 [答案] D 规律总结: (1)(2014·重庆)某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( )
A.100 B.150
C.200 D.250
(2)(2014·江西)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测,若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.
[答案] (1)A (2)1800[分析] 分层抽样中各层抽取个体数依各层个体数之比来分配,确定各层抽取的个体数之后,可采用简单随机抽样或系统抽样在各层中抽取个体.分层抽样的操作步骤
[解析] 三部分所含个体数之比为112∶16∶32=7∶1∶2,设三部分各抽个体数为7x,x,2x,则由7x+x+2x=20得x=2.故业务人员、管理人员、后勤服务人员抽取个体数分别为14,2和4.对112名业务人员按系统抽样分成14个部分,其中每个部分包括8个个体,对每个部分利用简单随机抽样抽取个体.若将160名人员依次编号为1,2,3,…,160.那么在1~112名业务人员中第一部分的个体编号为1~8.从中随机取一个号码,如它是4号,那么可以从第4号起,每隔8个抽取1个号码,这样得到112名业务人员被抽出的14个号码依次为4,12,20,28,36, 44,52,60,68,76,84,92,100,108.
再用抽签法可抽出管理人员和服务人员的号码.
将以上各层抽出的个体合并起来,就得到容量为20的样本. 规律总结:分层抽样的注意事项
分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:
(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,各层之间的样本差异要大,且互不重叠.
(2)为了保证每个个体等可能入样,所有层应采用同一抽样比,等可能抽样.
(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.
[特别提醒] 保证每个个体等可能入样是简单随机抽样、系统抽样、分层抽样共同的特征,为了保证这一点所有层按同一抽样比,等可能抽样.某政府机关有在编人员100人,其中科级以上干部10人,科员70人,办事员20人.上级机关为了了解他们对政府机构改革的看法,要从中抽取一个容量为20的样本,试确定用何种方法抽取,并写出具体的抽样过程.三种抽样方法的比较 [分析] 根据小学、初中、高中三个学段学生的视力差异性比较大和男女生视力差异性不大可确定抽样方法.
[解析] 由于该地区的中小学生人数比较多,不能采用简单随机抽样,所以排除选项A;由于该地区小学、初中、高中三个学段学生的视力情况有较大差异,可采取按照学段进行分层抽样,而男女生视力情况差异不大,不能按照性别进行分层抽样,所以排除B和D.
[答案] C 规律总结:抽样方法的选取方法
(1)若总体由差异明显的几个层次组成,则选用分层抽样.
(2)若总体没有差异明显的层次,则考虑采用简单随机抽样或系统抽样.
当总体容量较小时宜用抽签法;当总体容量较大,样本容量较小时宜用随机数表法;当总体容量较大,样本容量也较大时宜用系统抽样. 某社区有700户家庭,其中高收入家庭225户,中等收入家庭400户,低收入家庭75户.为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本,记作①;某中学高二年级有12名篮球运动员,要从中选出3人调查投篮命中率情况,记作②;从某厂生产的802辆轿车中抽取40辆测试某项性能,记作③.为完成上述三项抽样,则应采取的抽样方法是( )
A.①简单随机抽样,②系统抽样,③分层抽样
B.①分层抽样,②简单随机抽样,③系统抽样
C.①简单随机抽样,②分层抽样,③系统抽样
D.①分层抽样,②系统抽样,③简单随机抽样
[答案] B
[解析] 对于①,总体由高收入家庭、中等收入家庭和低收入家庭差异明显的三部分组成,而所调查的指标与收入情况密切相关,所以应采用分层抽样;
对于②,总体中的个体数较少,而且所调查内容对12名调查对象是平等的,应采用简单随机抽样;
对于③,总体中的个体数较多,且个体之间差异不明显,样本中个体数也较多,应采用系统抽样. 规律总结:抽样方法的选择要结合三种抽样方法的特点去比较,明确它们各自的特点以及在抽样过程中的可操作性,由明显差异的几部分组成时,要选用分层抽样. [错解] 按分层抽样的要求,可先从老年人中用随机抽样法剔除2人,使三个群体的人数比为3∶5∶2,则共抽20人进行调查,三组中各抽取人数为6人,10人,4人;但由于老年组中先剔除2人,没有参与后面的抽取,因此每人抽中机会不相等.
[错因分析] 由于剔除的2位老人是随机剔除的,因而老年人中每人被抽中的机会仍相等.
[正解] 先从老年人中随机剔除2人,余下的三个群体人数比为3∶5∶2,从三组中各抽取人数分别为6人,10人,4人.每人被抽中的机会相等.某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下表所示:
电视台为了进一步了解观众的具体想法和意见,打算从中再抽取60人进行更为详细的调查,各种态度应抽取的人数分别为________.[分析] 总体中人数较多且观众寺不同的态度→应采用分层抽样的方法
[答案] 12、23、20、5 规律总结:
1.分层抽样适合的总体是( )
A.总体容量较多 B.样本容量较多
C.总体中个体有差异 D.任何总体
[答案] C
2.(2013·湖南高考 )某学校有男、女学生各500名.为了解男女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )
A.抽签法 B.随机数法
C.系统抽样法 D.分层抽样法
[答案] D
3.(2011·福建高考)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( )
A.6 B.8
C.10 D.12
[答案] B
4.(2013·湖南)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=( )
A.9 B.10
C.12 D.13
[分析] 利用抽样比等于某层抽取的个体数与该层的个体总数之比,列方程可求出n.
[答案] D
[答案] A6.一个单位有职工160人,其中业务人员120人,管理人员16人,后勤服务人员24人.为了了解职工的家庭收入情况,要从中抽取一个容量为20的样本,请确定抽样方法,并简述抽样过程.
[分析] 由于不同层次人员的收入有着较大的差异,因此宜采用分层抽样抽取样本.
[解析] 用分层抽样抽取样本,步骤是:
(1)分层,分成三层:业务人员120人,管理人员16人,后勤服务人员24人.第二章 2.2 2.2.1
一、选择题
1.下列关于频率分布直方图的说法正确的是( )
A.直方图的高表示取某数的频率
B.直方图的高表示该组上的个体在样本中出现的频率
C.直方图的高表示取某组上的个体在样本中出现的频数与组距的比值
D.直方图的高表示取该组上的个体在样本中出现的频率与组距的比值
[答案] D
[解析] 要注意频率直方图的特点.在直方图中,纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积.
[点评] 注意区别直方图与条形图.
2.下列说法正确的是( )
A.对于样本数据增加时,频率分布表不能增加变化
B.对于样本数据增加时,茎叶图不能增加变化
C.对于样本数据增加时,频率折线图不会跟着变化
D.对于样本数据增加时,频率分布直方图变化不太大
[答案] D
3.一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为( )
A.10组 B.9组
C.8组 D.7组
[答案] B
[解析] 根据列频率分布表的步骤,==8.9.所以分为9组较为恰当.
4.(2013·福建卷)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示提频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测度成绩不低于60分的学生人数为( )
A.588 B.480
C.450 D.120
[答案] B
[解析] 本题考查频率分布直方图及频数的求法.成绩在[40,60)的频率P1=(0.005+0.015)×10=0.2,则成绩不少于60分的频率P2=1-0.2=0.8,所以可估计成绩不少于60分的学生人数为600×0.8=480,故选B.
5.(2013~2014·湖北武汉调研)某学校随机抽取20个班,调查各班中有网购经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )
[答案] A
[解析] 本题考查茎叶图与频率分布直方图.根据茎叶图可作频率分布表,如下:
分组
频数
频率
[0,5)
1
0.05
[5,10)
1
0.05
[10,15)
4
0.2
[15,20)
2
0.1
[20,25)
4
0.2
[25,30)
3
0.15
[30,35)
3
0.15
[35,40]
2
0.1
合计
20
1
再作频率分布直方图,故选A.
6.(2013~2014·河北省唐山一中月考)某校100名学生的数学测试成绩的频率分布直方图如图所示,分数不低于a即为优秀,如果优秀的人数为20,则a的估计值是( )
A.130 B.140
C.133 D.137
[答案] C
[解析] 本题考查频率分布直方图.由已知可以判断a∈(130,140),所以[(140-a)×0.015+0.01×10]×100=20,解得a≈133,故选C.
二、填空题
7.今年5月海淀区教育网开通了网上教学,某校高一年级(8)班班主任为了了解学生上网学习时间,对本班40名学生某天上网学习时间进行了调查,将数据(取整数)整理后,绘制出如图所示频率分布直方图,已知从左到右各个小组的频率分别是0.15,0.25,0.35,0.20,0.05,则根据直方图所提供的信息,这一天上网学习时间在100~119分钟之间的学生人数是________人,如果只用这40名学生这一天上网学习时间作为样本去推断该校高一年级全体学生该天的上网学习时间,这样推断是否合理?________(填“合理”或“不合理”)
[答案] 14 不合理
[解析] 由频数=样本容量×频率=40×0.35=14(人)
因为该样本的选取只在高一(8)班,不具有代表性,所以这样推断不合理.
8.青年歌手大奖赛共有10名选手参赛,并请了7名评委.如图所示的茎叶图是7名评委给参加最后决赛的两位选手甲、乙评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为________、________.
[答案] 84.2分 85分
[解析] 甲的成绩去掉一个最高分92分和一个最低分75分后,甲的剩余数据的平均成绩为84.2分;乙的成绩去掉一个最高分93分和一个最低分79分后,乙的剩余数据的平均成绩为85分.
9.图1是某工厂2010年9月份10个车间产量统计条形图,条形图从左到右表示各车间的产量依次记为A1,A2,…,A10(如A3表示3号车间的产量为950件).图2是统计图1中产量在一定范围内车间个数的一个算法流程图.那么运行该算法流程后输出的结果是________.
[答案] 4
[解析] 通过算法流程图可知,它的功能是统计产量超过950件的车间数,所以通过条形统计图可知产量超过950件的车间数为4个,所以最后输出的结果是4.
三、解答题
10.有关部门从甲、乙两个城市所有的自动售货机中随机抽取了16台,记录了上午8∶00~11∶00之间各自的销售情况(单位:元)
甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;
乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.
试用两种不同的方式分别表示上面的数据,并简要说明各自的优点.
[解析] 方法一:从题目中的数不易直接看出各自的分布情况,为此,我们将以上数据用条形统计图表示.如图:
方法二:茎叶图如图,两竖线中间的数字表示甲、乙销售额的十位数,两边的数字表示甲、乙销售额的个位数.
从方法一可以看出条形统计图能直观地反映数据分布的大致情况,并且能够清晰地表示出各个区间的具体数目;从方法二可以看出,用茎叶图表示有关数据,对数据的记录和表示都带来方便.
11.(2013~2014·合肥高二检测)为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8∶00~10∶00间各自的点击量,得如图所示的茎叶图,根据茎叶图回答下列问题.
(1)甲、乙两个网站点击量的极差分别是多少?
(2)甲网站点击量在[10,40]间的频率是多少?
(3)甲、乙两网站哪个更受欢迎?并说明理由.
[解析] (1)甲网站的极差为:73-8=65,乙网站的极差为:71-5=66.
(2)=≈0.286.
(3)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.
12.某电视台为宣传本省,随机对本省内15~65岁的人群抽取了n人,回答问题“本省内著名旅游景点有哪些”统计结果如图表所示.
组号
分组
回答正确的人数
回答正确的人数占本组的频率
第1组
[15,25)
a
0.5
第2组
[25,35)
18
x
第3组
[35,45)
b
0.9
第4组
[45,55)
9
0.36
第5组
[55,65]
3
y
(1)分别求出a、b、x、y的值;
(2)从第2、3、4组回答正确的人中用分层抽样的方法抽取6人,求第2、3、4组每组各抽取多少人?
[解析] (1)由频率表中第4组数据可知,第4组总人数为=25,再结合频率分布直方图可知
n==100,
∴a=100×0.01×10×0.5=5,
b=100×0.03×10×0.9=27,
x==0.9,y==0.2.
(2)第2、3、4组回答正确的共有54人.
∴利用分层抽样在54人中抽取6人,每组分别抽取的人数为:第2组:×6=2(人);第3组:×6=3(人);第4组:×6=1(人).
课件74张PPT。成才之路 · 数学路漫漫其修远兮 吾将上下而求索人教A版 · 必修3 统计第二章2.2 用样本估计总体第二章2.2.1 用样本的频率分布估计总体分布
●课标展示
1.了解分析数据的方法,知道估计总体频率分布的方法.
2.了解频率分布折线图和总体密度曲线,会画频率分布直方图和茎叶图.
3.理解频率分布直方图和茎叶图及其应用.
●温故知新
旧知再现
1.一个单位有职工160人,其中有业务人员112人,管理人员16人,后勤服务人员32人,为了了解职工的某种情况要从中抽取一个容量为20的样本,用分层抽样的方法抽取样本,需抽取后勤人员_____人.
4
2.在初中,我们已经学习过把样本数据表示成频数分布_____和频数分布_____这样的图表形式,从图表上直观地看出样本数据的分布情况,进而估计出总体的分布情况.本节在初中学过的内容和方法的基础上,介绍了一些新的概念,如频率分布折线图及总体密度曲线等,要仔细去体会、理解,还增加了利用频率分布直方图估计众数、中位数及平均数的方法,使我们在失去原始数据的情形下,也能借助于频率分布直方图估计样本的这些数字特征.表图新知导学
1.分析数据的方法
(1)借助于图形.
用图将各个数据画出来,作图可以达到两个目的,一是从数据中__________;二是利用图形__________.
(2)借助于表格.
用紧凑的表格改变数据的______方式,为我们提供______ 数据的新方式.提取信息传递信息构成解释2.频率分布直方图
(1)绘制步骤:
①求_________,即一组数据中的最大值与最小值的差.
②决定________与________.组距与组数的确定没有具体的标准,一般来说,数据分组的组数与样本容量有关,样本容量越大,所分组数越_______.当样本容量不超过100时,按照数据的多少,常分为5~12组.
极差组距组数多
③将数据__________.
④列出__________表.
⑤画出频率分布直方图.其中横轴表示________,纵轴表示______________的比.分组频率分布数据频率与组距(2)意义:频率分布直方图中,每个小矩形的面积表示相应组的_______,所有小矩形的面积的总和等于_____.
(3)频率分布的估计:频率分布是指各个小组数据在容量中所占_______的大小,可以用______的频率分布估计总体的频率分布,频率分布表是反映样本的频率分布的表格.通过频率分布直方图和频率分布表可以看到样本的频率分布.频率1比例样本
[破疑点] 频率分布直方图的特征:直观、形象地反映了样本的分布规律;可以大致估计出总体的分布.但是从频率分布直方图中得不出原始的数据内容,把数据绘制成频率分布直方图后,原有的具体数据信息就被抹掉了.
3.频率分布折线图和总体密度曲线
(1)类似于频数分布折线图,连接频率分布直方图中各个小长方形上端的中点,就得到频率分布折线图.
一般地,当总体中的个体数较多时,抽样时样本容量就不能太小.例如,如果要抽样调查一个省乃至全国的居民的月均用水量,那么样本容量就应比调查一个城市的时候大.可以想像,随着样本容量的增加.作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
[破疑点] 频率分布折线图反映了数据的变化趋势.总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.
(2)估计方法:实际上,尽管有些总体密度曲线是客观存在的,但是在实际应用中我们并不知道它的具体表达形式,需要用__________来估计.由于样本是随机的,不同的样本得到的频率分布折线图_________;即使对于同一个样本,不同的分组情况得到的频率分布折线图也不同.频率分布折线图是随__________和分组情况的变化而变化的,因此不能用样本的________________得到准确的总体密度曲线.样本不同样本容量频率分布折线图4.茎叶图
(1)制作方法:将所有两位数的十位数字作为______,个位数字作为_____,茎相同者共用一个茎,茎按从__________的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).
(2)优缺点:在样本数据______时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时_______,这对数据的记录和表示都能带来方便.但是当样本数据______时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长.茎叶小到大较少记录较多
[破疑点] 茎叶图的特征:统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;茎叶图中的数据可以随时记录,随时添加,方便记录与表示.但是茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两位以上的数据虽然能够记录,但是没有表示两位数记录那么直观、清晰.
5.规律总结
[总结1] 估计总体分布的步骤是:
(1)选择适当的抽样方法从总体中抽取样本,即收集数据.
(2)利用样本数据画出统计图或计算数字特征.
(3)结合统计图分析样本取值的分布规律.
(4)用样本取值的分布规律估计总体分布,由于是用科学抽样抽取的样本,那么样本与总体取值的分布规律近似,有时也可看成相同.
(5)利用总体分布解决有关问题.
[总结2] 频率分布表、频率分布直方图、频率分布折线图和茎叶图的比较1.四种图表的区别与联系这四种图表都是描述样本数据分布情况,估计总体频率分布规律的,其联系如下:2.四种图表的优缺比较●自我检测
1.在2010年第十六届亚运会中,各个国家和地区金牌获得情况的条形统计图,如图所示.
第十六届亚运会各个国家和地区金牌获得情况统计图从图中可以看出中国是亚洲第一体育强国,中国所获得金牌数占全部金牌数的比例约是( )
A.41.7% B.59.8%
C.67.3% D.94.8%
[答案] A[答案] C[答案] A
4.对于样本频率分布折线图与总体密度曲线的关系,下列说法中正确的是( )
A.频率分布折线图与总体密度曲线无关
B.频率分布折线图就是总体密度曲线
C.样本容量很大的频率分布折线图就是总体密度曲线
D.如果样本容量无限增大、分组的组距无限减小,那么频率分布折线图就会无限接近总体密度曲线
[答案] D
[解析] 总体密度曲线通常是用样本频率分布估计出来的.而频率分布折线图在样本容量无限增大,分组的组距无限减小的情况下会无限接近于一条光滑曲线,这条光滑曲线就是总体密度曲线.故选D.
规律总结:总体密度曲线有如下特征:
(1)随着样本容量的不断增加,分组不断加密,频率折线就会越来越光滑,最终形成总体密度曲线.
(2)并非所有的总体都有密度曲线,如一些离散型总体就没有.
5.没有信息的损失,所有的原始数据都可以从图中得到的统计图是( )
A.总体密度曲线 B.茎叶图
C.频率分布折线图 D.频率分布直方图
[答案] B
[解析] 所有的统计图中,仅有茎叶统计图完好无损地保存着所有原始数据的信息.494 498 493 505 496 492 485 483 508 511
495 494 483 485 511 493 505 488 501 491
493 509 509 512 484 509 510 495 497 498
504 498 483 510 503 497 502 511 497 500绘制频率分布直方图 ●典例探究 493 509 510 493 491 497 515 503 515 518
510 514 509 499 493 499 509 492 505 489
494 501 509 498 502 500 508 491 509 509
499 495 493 509 496 509 505 499 486 491
492 496 499 508 485 498 496 495 496 505
499 505 496 501 510 496 487 511 501 496
(1)列出样本的频率分布表;
(2)画频率分布直方图及频率分布折线图;
(3)估计净重在494.5~506.5 g之间的频率.(2)频率分布直方图及频率分布折线图如下图:
(3)净重在494.5~506.5 g之间的频率为0.21+0.14+0.09=0.44. 规律总结:绘制频率分布直方图的注意事项
(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.
(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率. 为了解某中学高一年级男生的体重情况,抽取了同年级40名男生的体重,数据如下(单位:千克):
62 60 59 59 59 58 58 57 57 57 57 56
56 56 56 56 56 56 55 55 55 55 54 54
54 54 53 53 52 52 52 52 52 51 51 51
50 50 49 48
列出样本的频率分布表,绘出频率分布直方图,并估计体重在58千克以上的男生比例.(4)列出频率分布表如下:利用频率分布直方图解题 规律总结:由频率分布直方图进行相关计算时,需掌握下列关系式: (2014·高考山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组,下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A.6 B.8
C.12 D.18[答案] C茎叶图的画法及应用[分析] 规律总结:绘制茎叶图的注意事项
(1)绘制茎叶图关键是分清茎和叶.一般地说,当数据是两位数时,十位上的数字为“茎”,个位上的数字为“叶”;如果是小数,通常把整数部分作为“茎”,小数部分作为“叶”.解题时要根据数据的特点合理地选择茎和叶.
(2)应用茎叶图对两组数据进行比较时,要从数据分布的对称性、中位数、稳定性等几方面来比较.
(3)茎叶图只适用于样本数据较少的情况. 在某电脑杂志的一篇文章中,每个句子的字数如下
10,28,31,17,23,27,18,15,26,24,20,
19,36,27,14,25,15,22,11,24,27,17.
在某报纸的一篇文章中,每个句子的字数如下:
27,39,33,24,28,19,32,41,33,27,35,
12,36,41,27,13,22,23,18,46,32,22.
(1)画出两组数据的茎叶图;
(2)比较分析两组数据,能得出什么结论?
[解析] (1)依题意,画出茎叶图如下图所示:
(2)电脑杂志文章中每个句子的字数集中在10~30之间,中位数为22.5,而报纸文章中每个句子的字数集中在20~40之间,中位数为27.5.还可以看出,电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.这与电脑杂志作为科普读物需要简明、通俗易懂的要求相吻合.为了解今年某校高三毕业班准备报考飞行员学生的体重(单位:千克)情况,将所得的数据整理后,画出了频率分布直方图,如图所示,已知图中从左到右的前三个小组的频率之比为1∶2∶3,其中第2小组的频数为12.则该校报考飞行员的总人数为________.[答案] 481.在用样本的频率分布估计总体的频率分布的过程中,下列说法正确的是( )
A.总体的容量越大,估计越准确
B.总体的容量越小,估计越准确
C.样本的容量越大,估计越准确
D.样本的容量越小,估计越准确
[答案] C
[解析] 根据样本的频率分布可知,样本的频率分布反映的是总体中部分个体的频率分布,只有当样本的容量越大时,估计才越准确. 规律总结:虽然样本的容量越大,估计越准确,但是获得比较大的样本需要花费更大的人力、物力和财力.因此,在用样本的频率分布估计总体的频率分布时,获得好的样本是至关重要的.
2.在频率颁布表中,下列说法正确的是( )
A.起始点不同,不影响分组数
B.分组数越多,就越能反映总体的情况
C.各组频率之和一定是1
D.不同起始点的频率分布表,各组频率一定不同
[答案] C
3.下列关于茎叶图的叙述正确的是( )
A.茎叶图可以展示未分组的原始数据,它与频率分布表以及频率分布直方图的处理方式不同
B.对于重复的数据,只算一个
C.茎叶图中的叶是“茎”十进制的上一级单位
D.制作茎叶图的程序是:第1步画出茎;第2步画出叶;第3步将“叶子”任意排列
[答案] A
4.已知样本10,8,6,10,8,13,11,10,12,7,8,9,11,9,11,12,9,10, 11,12,那么频率为0.2的范围为( )
A.5.5~7.5 B.7.5~9.5
C.9.5~11.5 D.11.5~13.5
[答案] D[解析] 列频率分布表如下:
5.(2013~2014·山东寿光高三抽测)为了解某小区老年人在一天中锻炼身体的时间,随机调查了50人,根据调查数据,画出了锻炼时间在0~2小时的样本频率分布直方图(如图).则50人中锻炼身体的时间在区间[0.5,1.5)小时的人数是________.
[答案] 35[解析] 锻练时间在[0.5,1.5)小时的频率为(0.8+0.6)×0.5=0.7,频数为:50×0.7=35(人)6.某篮球运动员在2014赛季各场比赛得分情况如下:
12,15,24,25,31,31,36,36,37,39,44,49,50.
制作茎叶图,并分析这个运动员的整体水平及发挥的稳定程度.
[解析] 该运动员得分茎叶图如下:
从这张图中可以粗略地看出,该运动员得分大多能在20分到40分之间,且分布较为对称,集中程度高,说明其发挥比较稳定.
第二章 2.2 2.2.2
一、选择题
1.某校高一、高二年级各有7个班参加歌咏比赛,他们的得分的茎叶图如图所示,对这组数据分析正确的是( )
A.高一的中位数大,高二的平均数大
B.高一的平均数大,高二的中位数大
C.高一的平均数、中位数都大
D.高二的平均数、中位数都大
[答案] A
[解析] 由茎叶图可以看出,高一的中位数为93,高二的中位数为88,所以高一的中位数大.由计算得,高一的平均数为91,高二的平均数为92,所以高二的平均数大.
2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为mo,平均值为,则( )
A.me=mo= B.me=mo<
C.me<mo< D.mo<me<
[答案] D
[解析] 由条件统计图可知,30名学生的得分依次为2个3分,3个4分,10个5分,6个6分,3个7分,2个8分,2个9分,2个10分.
中位数为第15,16个数(分别为5,6)的平均数,即me=5.5,5出现次数最多,故mo=5,=
≈5.97.于是得mo<me<.
3.(2013·安徽)某班级有50名学生,其中有30名男生和20名女生.随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( )
A.这种抽样方法是一种分层抽样
B.这种抽样方法是一种系统抽样
C.这五名男生成绩的方差大于这五名女生成绩的方差
D.该班男生成绩的平均数小于该班女生成绩的平均数
[答案] C
[分析] 根据抽样方法的概念可判断选项A,B;分别把数据代入方差和平均数的公式可判断选项C,D.
[解析] 若抽样方法是分层抽样,男生、女生应分别抽取6人、4人,所以A错;由题目看不出是系统抽样,所以B错;这五名男生成绩的平均数1==90,
这五名女生成绩的平均数2==91,
故这五名男生成绩的方差为[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8,这五名女生成绩的方差为[(88-91)2×2+(93-91)2×3]=6,所以这五名男生成绩的方差大于这五名女生成绩的方差,但该班男生成绩的平均数不一定小于女生成绩的平均数,所以D错.
4.(2013·重庆)如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )
A.2,5 B.5,5
C.5,8 D.8,8
[答案] C
[分析] 观察茎叶图,由中位数的概念可得x的值,由平均数的计算公式可得y的值.
[解析] 由于甲组的中位数是15,可得x=5,由于乙组数据的平均数为16.8,得y=8.
5.(2013·山东)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
则7个剩余分数的方差为( )
A. B.
C.36 D.
[答案] B
[分析] 根据茎叶图和平均数的计算公式求出x,然后根据方差的计算公式计算方差
[解析] 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x=91×7,解得x=4.故s2=[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=.
6.(2013~2014·四川省绵阳中学期末检测)在某地区某高传染性病毒流行期间,为了建立指标来显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5”,根据连续7天的新增病例数计算,下列各选项中,一定符合上述指标的是( )
①平均数x≤3;②标准差s≤2;③平均数x≤3且标准差s≤2;④平均数x≤3且极差小于或等于2;⑤众数等于1且极差小于或等于4.
A.①② B.③④
C.③④⑤ D.④⑤
[答案] D
[解析] 本题考查平均数、标准差、极差、众数的统计意义.假设连续7天新增病例数为0,3,3,3,3,3,6,易知满足平均数x≤3且标准差x≤2,但是不符合指标,所以①②③错误.若极差等于0或1,在平均数x≤3的条件下显然符合指标;若极差等于2,则极小值与极大值的组合可能有:(1)0,2;(2)1,3;(3)2,4;(4)3,5;(5)4,6.在平均数x≤3的条件下,只有(1)(2)(3)成立,且显然符合指标,所以④正确.又易知⑤正确,故选D.
二、填空题
7.由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)
[答案] 1,1,3,3
[解析] 不妨设x1≤x2≤x3≤x4,
得:x2+x3=4,x1+x2+x3+x4=8?x1+x4=4
s2=1?(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2=4?
①如果有一个数为0或4;则其余数为2,不合题意; ②只能取|x1-2|=1;得:这组数据为1,1,3,3.
8.某学员在一次射击测试中射靶6次,命中环数如下:
9,5,8,4,6,10
则(1)平均命中环数为________;
(2)命中环数的标准差为________.
[答案] (1)7 (2)
[分析] 直接把数据代入平均数和标准差计算的公式可解.
[解析] (1)由公式知,平均数为(9+5+8+4+6+10)=7.
(2)由标准差公式知,s2=(4+4+1+9+1+9)=.
9.如图是一次考试结果的频数分布直方图,根据该图可估计,这次考试的平均分数为________
[答案] 46
[解析] 根据频数分布直方图,可估计有4人成绩在[0,20)之间,其考试分数之和为4×10=40;有8人成绩在[20,40)之间,其考试分数之和为8×30=240;有10人成绩在[40,60)之间,其考试分数之和为10×50=500;有6人成绩在[60,80)之间,其考试分数之和为6×70=420;有2人成绩在[80,100)之间,其考试分数之和为2×90=180,由此可知,考生总人数为4+8+10+6+2=30,考虑总成绩为40+240+500+420+180=1 380,平均数==46.
三、解答题
10.(2013·新课标全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:
服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4
服用B药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5
(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?
(2)根据两组数据绘制茎叶图,从茎叶图看,哪咱药的疗效更好?
[解析] (1)设A药观测数据的平均数为,B药观测数据的平均数为.由观测结果可得
=×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,
=×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.
由以上计算结果可得>,因此可看出A药的疗效更好.
(2)由观测结果可绘制如下茎叶图:
从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上,而B药疗效的试验结果有的叶集中在茎0,1上,由此可看出A药的疗效更好.
[名师点睛] 从平均数上分析,甲、乙中平均数大的效果较好;从茎叶图上分析,要看甲、乙的叶在哪些茎上分布的比率大.如果甲的叶在某茎上分布的比率大,且该茎所对应的数据较大,那么甲的效果就较好.
11.某学校高一(1)班和高一(2)班各有49名学生,两班在一次数学测验中的成绩统计如下:
班级
平均分
众数
中位数
标准差
(1)班
79
70
87
19.8
(2)班
79
70
79
5.2
(1)请你对下面的一段话给予简要分析:
高一(1)班的小刚回家对妈妈说:“昨天的数学测验,全班平均分为79分,得70分的人最多,我得了85分,在班里算上上游了!”
(2)请你根据表中的数据,对这两个班的数学测验情况进行简要分析,并提出建议.
[分析] (1)根据平均数、中位数、众数所反映的情况来分析;(2)结合方差的意义来提出建议.
[解析] (1)由于(1)班49名学生数学测验成绩的中位数是87,则85分排在全班第25名之后,所以从位次上看,不能说85分是上游,成绩应该属于中游.
但也不能以位次来判断学习的好坏,小刚得了85分,说明他对这段的学习内容掌握得较好,从掌握学习的内容上讲,也可以说属于上游.
(2)①班成绩的中位数是87分,说明高于87分(含87)的人数占一半以上,而平均分为79分,标准差又很大,说明低分也多,两极分化严重,建议加强对学习困难的学生的帮助.
②班的中位数和平均数都是79分,标准差又小,说明学生之间差别较小,学习很差的学生少,但学习优异的也很少,建议采取措施提高优秀率.
12.(2014·全国高考卷Ⅰ)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:
质量指标值分组
[75,85)
[85,95)
[95,105)
[105,115)
[115,125)
频数
6
26
38
22
8
(1)在答题卡上作出这些数据的频率分布直方图:
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?
[解析] (1)
(2)质量指标值的样本平均数为
=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.
质量指标值的样本方差为
s2=(-20)2×0.06+(-10)2×0.26+0×0.38+(10)2×0.22+(20)2×0.08=104.
(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品“质量指标值不低于95的产品至少要占全部产品80%”的规定.
课件68张PPT。成才之路 · 数学路漫漫其修远兮 吾将上下而求索人教A版 · 必修3 统计第二章2.2 用样本估计总体第二章2.2.2 用样本的数字特征估计总体的数字特征
●课标展示
1.掌握众数、中位数、平均数、标准差、方差的定义和特征.
2.会求众数、中位数、平均数、标准差、方差,并能用来解决有关问题.
●温故知新
旧知再现
1.在初中,我们已经学过平均数描述了数据的__________平均水平,定量地反映了数据的集中趋势所处的水平.我们也知道可以用样本的平均数去估计总体的平均水平,而样本数据的方差、标准差则反映了数据的离散程度.方差或标准差越__________小,数据越集中,总体越均衡;方差或标准差越__________大,数据越分散,总体越不均衡.
而中位数则是指样本数据按从小到大(或从大到小)的顺序排列后,处于__________中间位置的一个量,当样本数据个数为奇数时,__________中间一个数据就是中位数,它是样本数据;当样本数据个数为偶数时,中位数则是中间两个数据的__________平均数,当这两个数据相等时,中位数是样本数据,否则它不是样本数据,众数则是指在样本数据中出现次数__________最多的数据,众数不一定__________唯一.
2.(2012·陕西卷)对某商店一个月内每天的顾客人数进行统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )
A.46、45、56 B.46、45、53
C.47、45、56 D.45、47、53
[答案] A
[解析] 本题考查样本数据的中位数、众数及极差.根据茎叶图可知样本总共有30个数据,中位数为46,出现次数最多的是45,最大数与最小数的差为68-12=56,故选A.
新知导学
1.众数
(1)定义:一组数据中出现次数__________最多的数称为这组数据的众数.
(2)特征:一组数据中的众数可能__________不止一个,也可能没有,反映了该组数据的__________集中趋势.
[破疑点] 众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.2.中位数
(1)定义:一组数据按从小到大的顺序排成一列,处于__________中间位置的数称为这组数据的中位数.
(2)特征:一组数据中的中位数是__________唯一的,反映了该组数据的__________集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积__________相等.
[破疑点] 中位数不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.(2)特征:平均数对数据有“取齐”的作用,代表该组数据的__________.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的______,但平均数受数据中__________的影响较大,使平均数在估计总体时可靠性降低.平均水平信息极端值4.标准差
(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s表示,通常用以下公式来计算
s=_________________________________________.
可以用计算器或计算机计算标准差.
(2)特征:标准差描述一组数据围绕__________波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较______;标准差较小,数据的离散程度较_______.平均数大小5.方差
(1)定义:标准差的平方,
即s2=______________________________________.
(2)特征:与__________的作用相同,描述一组数据围绕平均数波动程度的大小.
(3)取值范围:__________ .标准差[0,+∞)6.用样本估计总体
现实中的总体所包含的个体数往往很多,总体的平均数、众数、中位数、标准差、方差是不知道的,因此,通常用________的平均数、众数、中位数、标准差、方差来估计.这与上一节用________的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.样本样本 规律总结:用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数;用样本标准差估计总体标准差,样本容量越大,估计就越精确.
●自我检测
1.下列刻画一组数据离散程度的是( )
A.平均数 B.方差
C.中位数 D.众数
[答案] B
2.下列判断正确的是( )
A.样本平均数一定小于总体平均数
B.样本平均数一定大于总体平均数
C.样本平均数一定等于总体平均数
D.样本容量越大,样本平均数越接近总体平均数
[答案] D
3.在某次考试中,10名同学得分如下:84,77,84,83,68, 78,70,85,79,95.则这一组数据的众数和中位数分别为( )
A.84,68 B.84,78
C.84,81 D.78,81
[答案] C
4.在某项体育比赛中,七位裁判为一选手打出的分数如下:
90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )
A.92,2 B.92,2.8
C.93,2 D.93,2.8
[答案] B中位数、众数、平均数的应用 ●典例探究
(1)求该公司的职工月工资的平均数、中位数、众数.
(2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又是什么?(精确到1元)
(3)你认为哪个统计量更能反映这个公司职工的工资水平?结合此问题谈一谈你的看法.
[分析] 利用平均数、中位数、众数的定义求解即可. 规律总结:关于众数、中位数、平均数的几个问题
(1)一组数据中的众数可能不止一个,如果两个数据出现的次数相同,并且比其他数据出现的次数都多,那么这两个数据都是这组数据的众数.
(2)一组数据中的中位数是唯一的,求中位数时,必须先将这组数据按从小到大(或从大到小)的顺序排列.
(3)由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具备的性质. 某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):
甲群 13,13,14,15,15,15,16,17,17;
乙群 54,3,4,4,5,5,6,6,6,57.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映甲群市民的年龄特征?
(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映乙群市民的年龄特征?标准差、方差的应用 规律总结:用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.(1)(2013·湖北高考)某学员在一次射击测试中射靶10次,命中环数如下:
7,8,7,9,5,4,9,10,7,4
则①平均命中环数为________.
②命中环数的标准差为________.
(2)从甲、乙两种玉米的苗中各抽10株,分别测它们的株高如下:(单位:cm)
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
问:①哪种玉米的苗长得高?
②哪种玉米的苗长得齐?
[分析] 1.求方差的第一步求什么?其公式是什么?
2.什么是标准差?如何求?
3.判断数据波动大小的特征数是什么?如何判断?[答案] (1)①7 ②2 (2)①乙种玉米的苗长得高,②甲种玉米的苗长得齐.频率分布直方图与数字特征的综合应用 A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差(2)某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
①求这次测试数学成绩的众数.
②求这次测试数学成绩的中位数.
③求这次测试数学成绩的平均分.
[分析] 1.如何利用条形图求众数、中位数、平均数?
2.如何利用频率分布直方图求众数、中位数、平均数?[答案] (1)C 规律总结:众数、中位数、平均数与频率分布表、频率分布直方图的关系
(1)众数:众数一般用频率分布表中频率最高的一小组的组中值来有示,即在样本数据的频率分布直方图中,最高矩形的底边中点的横坐标.
(2)中位数:在频率分布表中,中位数是累计频率(样本数据小于某一数值的频率叫作该数值点的累计频率)为0.5时所对应的样本数据的值,而在样本中有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.
求:(1)高一参赛学生的成绩的众数、中位数.
(2)高一参赛学生的平均成绩.
[解析] (1)用叔率分布直方图中最高矩形所在的区间的中点值作为众数的近似值,得众数为65,又因为第一个小矩形的面积为0.3,所以设第二个小矩形底边的一部分长为x,则x×0.04=0.2,得x=5,所以中位数为60+5=65.
(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,所以平均成绩约为67.
[错因分析] 这种评价是不合理的,尽管平均分是反映一组数据平均水平的重要特征,但任何一个数据的改变都会引起民它的变化,而中位数则不受某些极端值的影响.本题中的5个成绩从小到大排列为:45,93,95,96,98;中位数是95,较为合理地反映了小明的数学水平,因而应该用中位数来衡量小明的数学成绩.
[正解] 小明5次考试成绩,从小到大排列为45,93,95,96, 98,中位数是95,应评定为“优秀”.(2013~2014·天津高一检测)一次数学知识竞赛中,两组学生成绩如下表:
已经算得两个组的平均分都是80分,请根据你所学过的统计知识,进一步判断这两个组这次竞赛中成绩谁优谁次,并说明理由.
(3)甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.
(4)从成绩统计表看,甲组成绩大于或等于90分的人数为20人,乙组成绩大于或等于90分的人数为24人,所以乙组成绩在高分阶段的人数多,同时,乙组得满分的比甲组得满分的多6人,从这一角度看,乙组成绩较好.1.甲、乙两中学生在一年里学科平均分相等,但他们的方差不相等,正确评价他们的学习情况是( )
A.因为他们平均分相等,所以学习水平一样
B.成绩平均分虽然一样,方差较大的,说明潜力大,学习态度端正
C.表面上看这两个学生平均成绩一样,但方差小的成绩稳定
D.平均分相等,方差不等,说明学习不一样,方差较小的同学,学习成绩不稳定,忽高忽低
[答案] C2.在某次测量中得到的A样本数据如下:82,84,84,86,86, 86,88,88,88,88,若样本B数据恰好是样本A都加上2后所得数据,则A、B两样本的下列数字特征对应相同的是( )
A.众数 B.平均数
C.中位数 D.标准差
[答案] D
[解析] B样本数据恰好是A样本数据加上2后所得的众数、中位数、平均数比原来的都多2,而标准差不变.
3.如图,是某篮球运动员在一个赛季的30场比赛中得分的茎叶图,则得分的中位数与众数分别为( )
A.3与3 B.23与3
C.3与23 D.23与23
[答案] D
[解析] 中位数是指一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数),从茎叶图中可知中位数为23;众数是指一组数据中出现次数最多的数,从茎叶图中可知23出现了3次,次数最多,因此众数也是23,所以选D.
4.(2013~2014·沈阳铁路实验中学期末考试)已知样本9,10,11,x,y的平均数是10,方差是2,则xy=( )
A.98 B.88
C.76 D.96
[答案] D5.抛硬币20次,正面12次,反面8次.如果抛到正面得3分,抛到反面得1分,则平均得分是________,得分的方差是________.
[答案] 2.2 0.966.从某校参加数学竞赛的试卷中抽取一个样本,考查竞赛的成绩分布,将样本分成6组,得到频率分布直方图如图,从左到右各小组的小长方形的高的比为1∶1∶3∶6∶4∶2,最右边的一组的频数是8.请结合直方图的信息,解答下列问题:
(1)样本容量是多少?
(2)成绩落在哪个范围的人数最多?并求出该小组的频数和频率.
(3)估计这次数学竞赛成绩的众数、中位数和平均数.
第二章 2.3 2.3.1
一、选择题
1.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到的回归直线方程=bx+a,那么下面说法不正确的是( )
A.直线=bx+a必经过点(,)
B.直线=bx+a至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点
C.直线=bx+a的斜率为
D.直线=bx+a和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差yi-(bxi+a)]2是该坐标平面上所有直线与这些点的偏差中最小的直线.
[答案] B
[解析] 由a=-b 知=-b +bx,∴必定过(,)点.
回归直线方程对应的直线是与样本数据距离最小的,但不一定过原始数据点,只须和这些点很接近即可.
2.下列说法正确的是( )
A.对于相关系数r来说,|r|≤1,|r|越接近0,相关程度越大;|r|越接近1,相关程度越小
B.对于相关系数r来说,|r|≥1,|r|越接近1,相关程度越大;|r|越大,相关程度越小
C.对于相关系数r来说,|r|≤1,|r|越接近1,相关程度越大;|r|越接近0,相关程度越小
D.对于相关系数r来说,|r|≥1,|r|越接近1,相关程度越小;|r|越大,相关程度越大
[答案] C
3.(2014·重庆)已知变量x与y正相关,且由观测数手工艺居算得样本的平均数=2.5,=3.5,则由观测的数据得线性回归方程可能为( )
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
[答案] A
[解析] ∵y=bx+a,正相关则b>0,∴排除C,D.∵过中点心(,)=(3,3.5),∴选A.
4.(2014·江西)根据如下样本数据得到的回归方程为=bx+a,则( )
x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
A.a>0,b<0 B.a>0,b>0
C.a<0,b<0 D.a<0,b>0
[答案] A
[解析] 由于x增大y减小知b<0,又x=3时y>0,∴a>0,故选A.
5.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
[答案] B
[分析] 由线性回归方程的图象过样本点的中心,可求得线性回归方程,然后结合该方程对x=6时的销售额作出估计.
[解析] 样本点的中心是(3.5,42),则=-=42-9.4×3.5=9.1,所以线性回归方程是=9.4x+9.1,把x=6代入得=65.5.
6.已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程为=x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( )
A.>b′,>a′ B.>b′,<a′
C.<b′,>a′ D.<b′,<a′
[答案] C
[分析] 先由已知条件分别求出b′,a′的值,再由,的计算公式分别求解,的值,即可作出比较.
[解析] 由两组数据(1,0)和(2,2)可求得直线方程为y=2x-2,从而b′=2,a′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得===,=-=-×=-,
所以<b′,>a′.
二、填空题
7.(2011·辽宁高考)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
[答案] 0.254
[解析] 由于=0.254x+0.321知,当x增加1万元时,年饮食支出y增加0.254万元.
8.某单位为了解用电量y(度)与气温x(℃)之间的关系,随机抽查了某4天的用电量与当天气温,并制作了对照表:
气温(℃)
18
13
10
-1
用电量(度)
24
34
38
64
由表中数据得线性回归方程=x+中=-2,预测当气温为-4℃时,用电量约为________度.
[答案] 68
[解析] ==10,==40,因为回归方程一定过点(,),
所以=+,则=-=40+2×10=60.
则=-2x+60,当x=-4时,=-2×(-4)+60=68.
9.改革开放30年以来,我国高等教育事业迅速发展,对某省1990~2000年考大学升学百分比按城市、县镇、农村进行统计,将1990~2000年依次编号为0~10,回归分析之后得到每年考入大学的百分比y与年份x的关系为:
城市:=2.84x+9.50;
县镇:=2.32x+6.67;
农村:=0.42x+1.80.
根据以上回归直线方程,城市、县镇、农村三个组中,________的大学入学率增长最快.按同样的增长速度,可预测2010年,农村考入大学的百分比为________%.
[答案] 城市 10.2
[分析] 增长速度可根据回归直线的斜率来判断,斜率大的增长速度快,斜率小的增长速度慢.
[解析] 通过题目中所提供的回归方程可判断,城市的大学入学率增长最快;2010年农村考入大学的百分比为0.42×20+1.80=10.2.
三、解答题
10.某种产品的广告费支出x与销售额y之间有如下对应数据(单位:百万元)
x
2
4
5
6
8
y
30
40
60
50
70
(1)画出散点图;
(2)从散点图中判断销售金额与广告费支出成什么样的关系?
[解析] (1)以x对应的数据为横坐标,以y对应的数据为纵坐标,所作的散点图如下图所示:
(2)从图中可以发现广告费支出与销售金额之间具有相关关系,并且当广告费支出由小变大时,销售金额也大多由小变大,图中的数据大致分布在某条直线的附近,即x与y成正相关关系.
11.一台机器由于使用时间较长,生产的零件有一些缺损.按不同转速生产出来的零件有缺损的统计数据如下表所示:
转速x(转/秒)
16
14
12
8
每小时生产有缺损零件数y(个)
11
9
8
5
(1)作出散点图;
(2)如果y与x线性相关,求出回归直线方程;
(3)若实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么,机器的运转速度应控制在什么范围内?
[解析] 先作出散点图,再根据散点图判断y与x呈线性相关,从而建立回归直线方程求解.
解:(1)作散点图如图所示.
(2)由散点图可知y与x线性相关.故可设回归直线方程为=bx+a.
依题意,用计算器可算得:
=12.5,=8.25,=660,iyi=438.
∴b=≈0.73,a=-b≈8.25-0.73×12.5=-0.875.
∴所求回归直线方程为=0.73x-0.875.
(3)令=10,得0.73x-0.875=10,解得x≈15.
即机器的运转速度应控制在15转/秒内.
12.(2013·重庆)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千克)与月储蓄yi(单位:千元)的数据资料,算得i=80,i=20,iyi=184,=720.
(1)求家庭的月储蓄y对月收入x的线性回归方程=x+;
(2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程=x+中,=,=-,
其中,为样本平均值.
[分析] (1)根据线性回归方程求相关的量后,代入公式即可求得回归方程;(2)观察线性回归方程的系数 可判断是正相关还是负相关;(3)将x=7代入线性回归方程即可求得预报变量,即该家庭的月储蓄.
[解析] (1)由题意知n=10,=i==8,=i==2,
又-n2=720-10×82=80,iyi-n =184-10×8×2=24,
由此得===0.3,=-=2-0.3×8=-0.4,
故所求回归方程为=0.3x-0.4.
(2)由于变量y的值随x的值增加而增加(=0.3>0),故x与y之间是正相关.
(3)将x=7代入回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千克).
课件61张PPT。成才之路 · 数学路漫漫其修远兮 吾将上下而求索人教A版 · 必修3 统计第二章2.3 变量间的相关关系第二章2.3.1 变量之间的相关关系
2.3.2 两个变量的线性相关
●课标展示
1.了解相关关系、线性相关、回归直线、最小二乘法的定义.
2.会作散点图,能判断两个变量之间是否具有相关关系.
3.会求回归直线方程,并能用回归直线方程解决有关问题.
●温故知新
旧知再现
1.下列数字特征一定是样本数据中的数据是( )
A.众数 B.中位数
C.标准差 D.平均数
[答案] A
2.已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是( )
A.平均数>中位数>众数
B.平均数<中位数<众数
C.中位数<众数<平均数
D.众数=中位数=平均数
[答案] D
3.某班有48名学生,在一次考试中统计出平均分为70,方差为75,后来发现有2名同学的分数登记错了,甲实际得80分却记成了50分,乙实际得70分却记成了100分,更正后平均数为________,方差为________.
[答案] 70 50
新知导学
1.相关关系
(1)定义:如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的________性,那么这两个变量之间的关系,叫做相关关系.
(2)两类特殊的相关关系:如果散点图中点的分布是从________角到________角的区域,那么这两个变量的相关关系称为正相关,如果散点图中点的分布是从_______角到_______角的区域,那么这两个变量的相关关系称为负相关.随机左下右上左上右下
[归纳总结] 两个变量间的关系分为三类:一类是确定性的函数关系,如正方形的边长与面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这种关系就是相关关系,例如,某位同学的“物理成绩”与“数学成绩”之间的关系,我们称它们为相关关系;再一类是不相关,即两个变量间没有任何关系.2.线性相关
(1)定义:如果两个变量散点图中点的分布从整体上看大致在一条_______附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做___________.距离的平方和 直线回归直线斜率 截距
[破疑点] 线性回归分析涉及大量的计算,形成操作上的一个难点,可以利用计算机非常方便地作散点图、回归直线,并能求出回归直线方程.因此在学习过程中,要重视信息技术的应用.
●自我检测
1.下列语句所表示的事件中的因素不具有相关关系的是( )
A.瑞雪兆丰年 B.上梁不正下梁歪
C.吸烟有害健康 D.喜鹊叫喜,乌鸦叫丧
[答案] D
[解析] 选项A,B,C中描述的变量间都具有相关关系,而选项D是迷信说法,没有科学依据. 规律总结:函数关系是一种确定性关系,相关关系是一种非确定性关系,判断两个变量间的关系是否为相关关系的关键是看这个关系是否具有不确定性.2.观察下列散点图,①正相关,②负相关,③不相关,与下列图形相对应的是( )
A.①②③ B.②③①
C.②①③ D.①③②
[答案] D[答案] D 规律总结:回归直线是对原数量关系的一种拟合,如果两个变量不具有线性相关关系,即使求出回归方程也是毫无意义的,而且由其得到估计和预测的值也是不可信的.变量之间的相关关系的判断 ●典例探究 [分析] 1.判断两个变量之间具有相关关系的关键是什么?
2.利用散点图判断两个变量是否具有相关关系的依据是什么?
[解析] (1)在A中,若b确定,则a,b,c都是常数,Δ=b2-4ac也就唯一确这了,因此,这两者之间是确定性的函数关系;一般来说,光照时间越长,果树亩产量越高;降雪量越大,匀通事故发生率越高;施肥量越多,粮食亩产量越高,所以B,C,D是相关关系.故选A.(2)两次数学考试成绩散点图如图所示,
由散点图可以看出两个变量的对应点集中在一条直线的周围,具有正相关关系.因此,这10名学生的两次数学考试成绩具有相关关系.
[答案] (1)A 规律总结:两个变量x与y相关关系的判断方法:
(1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
(2)表格、关系式法:结合表格或关系式进行判断;
(3)经验法:借助积累的经验进行分析判断.
[特别提醒] 如果所有的样本点都落在某一函数曲线附近,那么变量之间就有相关关系. 对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
[答案] C
[解析] 图(1)中的数据y随着x的增大而减小,因此变量x与变量y负相关;图(2)中的数据随着u的增大,v也增大,因此u与v正相关.回归直线方程 规律总结:求回归直线方程的一般步骤:
①收集样本数据,设为(xi,yi),(i=1,2,…,n)(数据一般由题目给出).
②作出散点图,确定x,y具有线性相关关系. [答案] (1)C (2)15
[错因分析] 在第(1)问中,是否具有线性相关关系,要看大部分点、主流点是否分布在一条直线附近,个别点是不影响“大局的”,所以可断定这两个变量具有线性相关关系.在第(2)问中,381.15只是一个估计值,由它不能断言这个城市患白血病的儿童一定超过380人,如果这个城市的污染很严重,有可能人数远远超过3 80,若这个城市的环境保护得得很好,则人数就有可能远远低于380.1.下列两个变量之间的关系:
①角度和它的余弦值;
②正n边形的边数与内角和;
③家庭的支出与收入;
④某户家庭用电量与电价间的关系.
其中是相关关系的有( )
A.1个 B.2个
C.3个 D.4个
[答案] A2.下列图形中两个变量具有相关关系的是( )
[答案] C
[解析] A是一种函数关系,因为任给一个x都有惟一确定的y和它对应;B也是一种函数关系;C中从散点图可看出所有点看上去都在某条直线附近波动,具有相关关系,而且是一种线性相关;D中所有的点在散点图中没有显示任何关系,因此变量间是不相关的.[答案] D[答案] A
5.现有5组数据A(1,3)、B(2,4)、C(4,5)、D(3,10)、E(10,12),去掉________组数据后,剩下的4组数据的线性相关性最大.
[答案] D[解析] (1)散点图,如图所示.
(3)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35,
故耗能减少了90-70.35=19.65(吨标准煤).