2017_2018学年高中数学第二章统计优化练习(打包6套)新人教A版必修3

文档属性

名称 2017_2018学年高中数学第二章统计优化练习(打包6套)新人教A版必修3
格式 zip
文件大小 462.8KB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2018-08-05 08:38:07

文档简介

2.1.1 简单随机抽样
[课时作业]
[A组 学业水平达标]
1.某市有10万名高中毕业生参加高考,为了解这10万名考生的数学成绩,从中抽取2 000名考生的数学成绩进行统计分析,下列说法中正确的是(  )
A.10万名考生的数学成绩是总体
B.样本容量为2 000名学生的数学成绩
C.每位考生都是总体的一个个体
D.2 000名考生是样本容量
解析:抽取的是数学成绩,不是考生,样本容量是2 000,每位考生的数学成绩是总体的个体.
答案:A
2.为了了解2016年参加市运会的240名运动员的身高情况,从中抽取40名运动员进行测量.下列说法正确的是(  )
A.总体是240名运动员
B.个体是每一个运动员
C.40名运动员的身高是一个个体
D.样本容量是40
解析:根据统计的相关概念并结合题意可得,此题的总体、个体、样本这三个概念的考察对象都是运动员的身高,而不是运动员,并且一个个体是指一名运动员的身高,选项A,B表达的对象都是运动员,选项C未将个体和样本理解透彻.在这个问题中,总体是240名运动员的身高,个体是每个运动员的身高,样本是40名运动员的身高,样本容量是40.因此选D.
答案:D
3.要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,将它们编号为001,002,…,800,利用随机数表法抽取样本,从第7行第1个数8开始,依次向右,再到下一行,继续从左到右,请问选出的第7袋牛奶的标号是(  )
(为了便于说明,下面摘取了随机数表的第6行至第10行)
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28
A.425 B.506
C.704 D.744
解析:从第7行第1个数8开始向右读,第一个数为844,不符合条件,第二个数为217,符合条件,第三个数为533,符合条件,以下依次为:157,245,506,887,704,744,其中887不符合条件,故第7个数为744.
答案:D
4.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性,“第二次被抽到”的可能性分别是(  )
A., B.,
C., D.,
解析:简单随机抽样中每个个体被抽取的机会均等,都为.
答案:A
5.一次体育运动会,某代表团有6名代表参加,欲从中抽取一人检查是否服用兴奋剂,抽检人员将6名队员名字编号为1~6号,然后抛掷一枚骰子,朝上的一面是几就抽检几号对应的队员,问这种抽检方式是简单随机抽样吗?__________(填“是”或“不是”).
解析:抛掷一枚均匀骰子,各面向上的机会是均等的,故每名队员被抽到的机会相等.
答案:是
6.某种福利彩票的中奖号码是从1~36个号码中,选出7个号码来按规则确定中奖情况,这种从36个号码中选7个号码的抽样方法是________.
解析:符合抽签法的特点:①个体数较少;②样本容量小.
答案:抽签法
7.关于简单随机抽样,有下列说法:
①它要求被抽取样本的总体的个数有限;
②它是从总体中逐个地进行抽取;
③它是一种不放回抽样;
④它是一种等可能性抽样,每次从总体中抽取一个个体时,不仅各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.
其中正确的有________(请把你认为正确的所有序号都写上).
解析:由随机抽样的特征可判断.
答案:①②③④
8.现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检验.如何用随机数法设计抽样方案?
解析:第一步,将元件的编号调整为010,011,012,…,099,100,…,600.
第二步,在随机数表中任选一数作为开始,比如,选第6行第7个数9.
第三步,从数9开始,向右读,每次读取三位,凡不在010~600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到544,354,378,520,384,263.
第四步,与以上这6个号码对应的6个元件就是所要抽取的样本.
9.为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,如何用简单随机抽样抽取样本?
(下面抽取了第5行到9行的随机数表)
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28
解析:法一(抽签法)
①将这40件产品编号为1,2,…,40;
②做好大小、形状相同的号签,分别写上这40个号码;
③将这些号签放在一个不透明的容器内,搅拌均匀;
④连续抽取10个号签;
⑤然后对这10个号签对应的产品检验.
法二(随机数表法)
①将40件产品编号,可以编为00,01, 02,…,38,39;
②在随机数表中任选一个数作为开始,例如从第7行第9列的数5开始;
③从选定的数5开始向右读下去,得到一个两位数字号码59,由于59>39,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34,至此,10个样本号码已经取满,于是,所要抽取的样本号码是16,19,10,12,07,39,38,33,21,34.
[B组 应考能力提升]
1.用随机数表法从100名学生(男生25人)中抽选20人,某男学生被抽到的可能性是(  )
A.          B.
C. D.
解析:从个体数为N=100的总体中抽取一个容量为n=20的样本,每个个体被抽到的可能性都是=,故选C.
答案:C
2.某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号001,002,…,699,700.从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第5个样本编号是(  )
33 21 18 34 29 78 64 56 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.697 B.328
C.253 D.007
解析:根据题意依次读取数据到的样本编号为253,313,457,860,736,253,007,328,…,其中860,736大于700,舍去;253重复出现,所以第二个253舍去,所以得到的第5个样本编号为328.
答案:B
3.某大学为了支援我国西部教育事业,决定从2016年应届毕业生报名的18名志愿者中选取6人组成志愿小组.请用抽签法和随机数表法设计抽样方案.
解析:抽签法:
第一步,将18名志愿者编号,号码为1,2,3,…,18.
第二步,将18个号码分别写在18张形状、大小完全相同的纸条上,并揉成团,制成号签.
第三步,将18个号签放入一个不透明的盒子里,充分搅匀.
第四步,从盒子中逐个抽取6个号签,并记录上面的编号.
第五步,与所得号码对应的志愿者,就是志愿小组的成员.
随机数表法:
第一步,将18名志愿者编号,号码为01,02,03,…,18.
第二步,在随机数表中任选一个数字作为开始数字.
第三步,从已选的这个数字开始,向右读,每次读取两位数字,凡不在01~18中的数,或已读过的数,都跳过去不做记录依次可得到6个号码.
第四步,找出与以上号码对应的志愿者,就是志愿小组的成员.
4.从北京某中学40名学生中选1人作为北京男篮的啦啦队队员,采用下面两种方法:
解法一:将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这些号签放在一个暗盒中搅拌均匀,最后随机地从中抽取1个号签,与这个号签号码一致的学生幸运入选.
解法二:将39个白球与1个红球混合放在一个黑暗箱中搅拌均匀,让40名学生逐一从中摸取一个球,摸到红球的学生为啦啦队员.
两种方法是否都是抽签法?为什么?这两种方法有何异同?
解析:解法一是抽签法,解法二不是抽签法,因为抽签法要求所有号签编号互不相同,而方法2中39个白球无法区分,这两种方法相同之处在于每名同学被选中的机会相等.
2.1.2 系统抽样
[课时作业]
[A组 学业水平达标]
1.为了解72名学生的学习情况,采用系统抽样的方法,从中抽取容量为8的样本,则分段的间隔为(  )
A.9 B.8
C.10 D.7
解析:由系统抽样方法知,72人分成8组,故分段间隔为72÷8=9.
答案:A
2.从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为(  )
A.480 B.481
C.482 D.483
解析:∵样本中最小的两个编号为007,032,∴样本的间隔为32-7=25,则样本容量为=20,则对应的号码数x=7+25(n-1),当n=20时,x取最大值为x=7+25×19=482.
答案:C
3.用系统抽样的方法从个体数为1 003的总体中,抽取一个容量为50的样本,在整个抽样过程中每个个体被抽到的可能性是(  )
A. B.
C. D.
解析:根据系统抽样的方法可知,每个个体入样的可能性相同,均为,所以每个个体入样的可能性是.
答案:C
4.为了了解一次期终考试的1 253名学生的成绩,决定采用系统抽样方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目是(  )
A.2 B.3
C.4 D.5
解析:1 253÷50=25……3,故应随机从总体中剔除3个个体.
答案:B
5.某学校高三年级一班共有60名学生,现采用系统抽样的方法从中抽取6名学生做“早餐与健康”的调查,为此将学生编号为1,2,…,60.选取的这6名学生的编号可能是 (  )
A.1,2,3,4,5,6 B.6,16,26,36,46,56
C.1,2,4,8,16,32 D.3,9,13,27,36,54
解析:由系统抽样知识知,所取学生编号之间的间距相等且为10,所以应选B.
答案:B
6.某单位有技术工人36人,技术员24人,行政人员12人,现需从中抽取一个容量为n(4解析:总体容量为72,由题意可知72能被n整除,70能被n+1整除,因为,4答案:6
7.某中学采用系统抽样方法,从该校高一年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号.已知从33~48这16个数中取的数是39,则在第1小组1~16中随机抽到的数是________.
解析:间隔数k==16,即每16人抽取一个人.由于39=2×16+7,所以第1小组中抽取的数为7.
答案:7
8.一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第 1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同,若m=8,则在第8组中抽取的号码是________.
解析:由题意知,m=8,k=8,则m+k=16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.
答案:76
9.从2 000名同学中,抽取一个容量为20的样本,试叙述系统抽样的步骤.
解析:第一步,采用随机的方式给这2 000名同学编号为1,2,3,…,2 000.
第二步,由于=100,所以将总体按编号顺序均分为20段,每一段有100个个体.
第三步,从第一部分的个体的编号为1,2,…,100中随机抽取1个号码,如66号.
第四步,从第66号起,每次增加100,得到容量为20的样本:66,166,266,…,1 966.
10.某校高中三年级的295名学生已经编号为1,2,3,…,295,为了了解学生的学习情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,请写出抽样过程.
解析:按1∶5的比例抽样.
295÷5=59.
第一步,把295名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第二组是编号为6~10的5名学生,依次类推,第59组是编号为291~295的5名学生.
第二步,采用简单随机抽样,从第一组5名学生中随机抽取1名,不妨设其编号为k(1≤k≤5).
第三步,从以后各段中依次抽取编号为k+5i(i=1,2,3,…,58)的学生,再加上从第一段中抽取的编号为k的学生,得到一个容量为59的样本.
[B组 应考能力提升]
1.某校2017届有840名学生,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为(  )
A.11 B.12
C.13 D.14
解析:使用系统抽样方法,从840名学生中抽取42人,即从20人中抽取1人.所以从编号1~480的人中,恰好抽取=24(人),接着从编号481~720共240人中抽取=12人.
答案:B
2.高一(1)班共有56人,学生编号依次为1,2,3,…,56,现用系统抽样,采用等距抽取的方法抽取一个容量为4的样本,已知5,33,47的同学在样本中,那么还有一位同学的编号应为(  )
A.19 B.20
C.29 D.30
解析:根据等距离的特点,已知的数5,33,47中,5和33之间的间距是33与47间距的2倍,因此在5和33之间应有一个数,间距为14,故此数为5+14=19.
答案:A
3.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,则三个营区被抽中的人数依次为__________.
解析:由题意知间隔为=12,故抽到的号码为12k+3(k=0,1,…,49),列出不等式可解得:第Ⅰ营区抽25人,第Ⅱ营区抽17人,第Ⅲ营区抽8人.
答案:25,17,8
4.一个总体中的1 000个个体编号为0,1,2,…,999,并依次将其均分为10个小组,组号为0,1,2,…,9,要用系统抽样方法抽取一个容量为10的样本,规定如果在第0组随机抽取的号码为x,那么依次错位地得到后面各组的号码,即第k组中抽取的号码的后两位数为x+33k的后两位数.
(1)当x=24时,写出所抽取样本的10个号码;
(2)若所抽取样本的10个号码中有一个的后两位数是87,求x的取值范围.
解析:(1)由题意知系统抽样的间隔是100,根据x=24和题意得,24+33×1=57,第二组抽取的号码是157;由24+33×2=90,则在第三组抽取的号码是290……
故依次是24,157,290,323,456,589,622,755,888,921.
(2)由x+33×0=87得x=87,由x+33×1=87得x=54,由x+33×3=187得x=88,…,
依次求得x值可能为21,22,23,54,55,56,87,88,89,90.
5.下面给出某村委会调查本村各户收入情况做的抽样,阅读并回答问题.本村人口数:1 200,户数300,每户平均人口数4人;应抽户数:30;
抽样间隔:=40;
确定随机数字:取一张人民币,后两位数为12;
确定第一样本户:编号12的户为第一样本户;
确定第二样本户:12+40=52,52号为第二样本户
……
(1)该村委会采用了何种抽样方法?
(2)抽样过程存在哪些问题,试修改.
(3)何处是用简单随机抽样?
解析:(1)系统抽样.
(2)本题是对某村各户进行抽样,而不是对某村人口抽样.抽样间隔=10,其他步骤相应改为确定随机数字:取一张人民币,末位数为2.(假设)确定第一样本户:编号02的住户为第一样本户;确定第二样本户:2+10=12,12号为第二样本户.
(3)确定随机数学:取一张人民币,其末位数为2.
2.1.3 分层抽样
[课时作业]
[A组 学业水平达标]
1.在抽样过程中,每次抽取的个体不再放回总体的为不放回抽样,那么分层抽样、系统抽样、简单随机抽样三种抽样中,为不放回抽样的有(  )
A.0个       B.1个
C.2个 D.3个
解析:由三种抽样中均为不放回抽取.
答案:D
2.某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n人中,抽取35人进行问卷调查.已知高二被抽取的人数为13,则n=(  )
A.660 B.720
C.780 D.800
解析:由已知条件,抽样比为=,从而=,解得n=720.
答案:B
3.某城市修建经济适用房.已知甲、乙、丙三个社区分别有低收入家庭360户、270户、180户,若首批经济适用房中有90套住房用于解决住房紧张问题,采用分层抽样的方法决定各社区户数,则应从乙社区中抽取低收入家庭的户数为(  )
A.40 B.36
C.30 D.20
解析:利用分层抽样的比例关系,设从乙社区抽取n户,则=.解得n=30.
答案:C
4.已知某单位有职工120人,其中男职工有90人,现采用分层抽样(按男、女分层)抽取一个样本,若已知样本中有27名男职工,则样本容量为(  )
A.30 B.36
C.40 D.无法确定
解析:设样本容量为n,则=,解得n=36.
答案:B
5.某校高三(1)班有学生54人,高三(2)班有学生42人.现在要用分层抽样的方法从这两个班随机选出16人参加军训表演,则高三(1)班和高三(2)班分别选出的人数是(  )
A.8,8 B.15,1
C.9,7 D.12,4
解析:抽样比为=,故从高三(1)班和高三(2)班分别选出9人和7人.
答案:C
6.某学校共有教师490人,其中不到40岁的有350人,40岁及以上的有140人.为了解普通话在该校教师中的推广普及情况,用分层抽样的方法,从全体教师中抽取一个容量为70的样本进行普通话水平测试,其中在不到40岁的教师中应抽取________人.
解析:350×=50(人).
答案:50
7.某学院的A,B,C三个专业共有1 200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本,已知该学院的A专业有380名学生,B专业有420名学生,则在该学院的C专业应抽取学生________名.
解析:抽样比为=,∴A,B专业共抽取38+42=80名,故C专业抽取120-80=40 名.
答案:40
8.某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为__________人.
解析:由题意得抽样比例为=,故应抽取的男生人数为500×=25.
答案: 25
9.某公司有职工160人,其中有业务人员112人,管理人员16人,后勤服务人员32人,为了了解职工的生活状况,要从中抽取一个容量为20的样本进行调查研究.
(1)用哪种抽样方法较为合适?为什么?
(2)写出抽样过程.
解析:(1)采用分层抽样较为合适.因为业务人员、管理人员、后勤服务人员三类人员的生活状况有明显差异.
(2)三部分所含个体数之比为112∶16∶32=7∶1∶2.
设三部分各抽个体数为7x,x,2x,则由7x+x+2x=20得x=2.
故业务人员、管理人员、后勤服务人员抽取个体数分别为14人,2人和4人.
对每个部分利用简单随机抽样或系统抽样的方法抽取个体.
将160名人员依次编号为1,2,3,…,160.
先用系统抽样的方法抽取业务人员的号码,
在编号为1~112的112名业务人员中第一部分的个体编号为1~8.
从中随机取一个号码,如它是4号,那么可以从第4号起,
按系统抽样每隔8个抽取1个号码,这样得到112名业务人员被抽出的14个号码依次为4,12,20,28,36,44,52,60,68,76,84,92,100,108.
再用抽签法可抽出管理人员和后勤服务人员的号码.
将以上各层抽出的个体合并起来,就得到容量为20的样本.
10.某学校共有教职工900名,分成三个批次进行教育培训,在三个批次中男、女教职工人数如下表所示.已知在全体教职工中随机抽取1名,抽到第二批次中女教职工占16%.
第一批次
第二批次
第三批次
女教职工
196
x
y
男教职工
204
156
z
(1)求x的值;
(2)现用分层抽样的方法在全体教职工中抽取54名做培训效果的调查,问应在第三批次中抽取教职工多少名?
解析:(1)由=0.16,解得x=144.
(2)第三批次的人数为y+z=900-(196+204+144+156)=200.
设应在第三批次中抽取m名,则=,
解得m=12.
所以应在第三批次中抽取12名教职工.
[B组 应考能力提升]
1.某市A,B,C,D四所中学报名参加某高校2017年自主招生考试的学生人数如下表所示:
中学
A
B
C
D
人数
40
30
10
20
该市教委为了解参加考试的学生的学习状况,采用分层抽样的方法从四所中学报名参加考试的学生中随机抽取50名参加问卷调查.则A,B,C,D四所中学抽取的学生人数分别为(  )
A.15,20,10,5    B.15,20,5,10
C.20,15,10,5 D.20,15,5,10
解析:由题意知,四所中学报名参加某高校2016年自主招生考试的学生总人数为100,抽取的学生人数与学生总人数的比值为=,所以应从A,B,C,D四所中学抽取的学生人数分别为20,15,5,10.
答案:D
2.学校为了调查学生的学习情况,决定用分层抽样的方法从高一、高二、高三三个年级的相关学生中抽取若干人,相关数据如下表:
相关学生
抽取人数
高一学生
56
b b
高二学生
a a
3 3
高三学生
35
5
则抽取的总人数为________.
解析:根据分层抽样的概念可知:56∶a∶35=b∶3∶5,可以解得b=8,所以b+3+5=16.
答案:16
3.某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为:120份,180份,240份,x份.因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为__________.
解析:11~12岁回收180份,其中在11~12岁学生问卷中抽取60份,则抽样比为.
∵从回收的问卷中按年龄段分层抽取容量为300的样本,
∴从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷总数为=900(份),则15~16岁回收问卷份数为:x=900-120-180-240=360(份).
∴在15~16岁学生中抽取的问卷份数为360×=120(份).
答案:120
4.为了对某课题进行讨论研究,用分层抽样的方法从三所高校A,B,C的相关人员中,抽取若干人组成研究小组,有关数据见表(单位:人)
高校
相关人数
抽取人数
A
x
1
B
36
y
C
54
3
(1)求x,y;
(2)若从高校B相关的人中选2人作专题发言,应采用什么抽样法,请写出合理的抽样过程.
解析:(1)分层抽样是按各层相关人数和抽取人数的比例进行的,所以有:=?x=18,=?y=2,
故x=18,y=2.
(2)总体容量和样本容量较小,所以应采用抽签法,过程如下:
第一步,将36人随机的编号,号码为1,2,3,…,36;
第二步,将号码分别写在相同的纸片上,揉成团,制成号签;
第三步,将号签放入一个不透明的容器中,充分搅匀,依次抽取2个号码,并记录上面的编号;
第四步,把与号码相对应的人抽出,即可得到所要的样本.
5.某单位最近组织了一次健身活动,活动小组分为登山组和游泳组,且每个职工至多参加其中一组.在参加活
动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%,登山组的职工占参加活动总人数的,且该组中青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层抽样法从参加活动的全体职工中抽取200人进行调查,试确定:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人应分别抽取的人数.
解析:(1)设登山组人数为x,则游泳组人数为3x,再设游泳组中,青年人、中年人、老年人各占比例分别为a,b,c,则有
=47.5%,=10%,
解得b=50%,c=10%,
故a=1-50%-10%=40%.
所以游泳组中,青年人、中年人、老年人各占比例分别为40%,50%,10%.
(2)游泳组中,抽取的青年人人数为200××40%=60(人),抽取的中年人人数为200××50%=75(人),抽取的老年人人数为200××10%=15(人).
2.2.1 用样本的频率分布估计总体分布
[课时作业]
[A组 学业水平达标]
1.频率分布直方图中,小长方形的面积等于(  )
A.组距        B.频率
C.组数 D.频数
解析:根据小长方形的宽及高的意义,可知小长方形的面积为一组样本数据的频率.
答案:B
2.某公司10个销售店某月销售某产品数量(单位:台)的茎叶图如下:
分组成 [11,20),[20,30),[30,39]时,所作的频率分布直方图是(  )
解析:由直方图的纵坐标是频率/组距,排除C和D;又第一组的频率是0.2,直方图中第一组的纵坐标是0.02,排除A,故选B.
答案:B
3.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图.据此可估计该校上学期400名教师中,使用多媒体进行教学次数在[16,30)内的人数为(  )
A.100 B.160
C.200 D.280
解析:由茎叶图可知在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学次数在[16,30)内的人数为400×=160.
答案:B
4.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是(  )
A.56 B.60
C.120 D.140
解析:由直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.故选D.
答案:D
5.学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60]元的同学有30人,则n的值为________.

解析:由频率分布直方图可知支出在[50,60]元的频率为1-10×(0.01+0.024+0.036)=0.3,∵支出在[50,60]元的同学有30人,∴=0.3,∴n=100.
答案:100
6.一次选拔运动员,测得7名选手的身高(单位:cm)分布茎叶图如图,测得平均身高为177 cm,有一名候选人的身高记录不清楚,其末位数记为x,那么x的值是________.
解析:180+181+170+173+178+179+170+x=177×7,即1 231+x=1 239,解得x=8.
答案:8
7.某路段属于限速路段,规定通过该路段的汽车时速不得超过70 km/h,否则视为违规扣分,某天有1 000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图(如图所示),则违规扣分的汽车大约为________辆.
解析:易求得70~80这组的频率为1-0.05-0.18-0.38-0.27=0.12,则违规扣分的汽车大约为0.12×1 000=120(辆).
答案:120
8.某中学某班甲、乙两名同学自进入高中以来每次数学考试成绩情况如下:
甲同学得分:95, 81,75,91,86,89,71,65,76,88,94,110;
乙同学得分:83,86,93,99,88,103,98,114,98,79,101,107.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
解析:甲、乙两人数学成绩的茎叶图如图所示.
从这个茎叶图中可以看出,乙同学发挥较稳定,总体得分情况比甲同学好.
9.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第3组的频数为12,请解答下列问题:
(1)本次活动共有多少件作品参加评比?
(2)哪组上交的作品数最多?有多少件?
(3)经过评比,第4组和第6组分别有10件和2件作品获奖,这两组哪组获奖率较高?
解析:(1)依题意得第3小组的频率为:
=.
又第3小组的频数为12,
故本次活动的参赛作品数为12÷=60(件).
(2)根据频率分布直方图可看出第4组上交的作品数最多,共有:60×=18(件).
(3)第4组获奖率是=.
第6组上交作品数量为:
60×=3(件).
第6组的获奖率为>,∴第6组的获奖率较高.
[B组 应考能力提升]
1.某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是(  )
A.45         B.50
C.55 D.60
解析:∵[20,40),[40,60)的频率和为(0.005+0.01)×20=0.3.
∴该班的学生人数是=50.
答案:B
2.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于(  )
A.0.12 B.0.012
C.0.18 D.0. 018
解析:依题意,0.054×10+10×x+0.01×10+0.006×10×3=1,解得x=0.018.
答案:D
3.为了了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名教师中抽取20名教师,调查他们上学期使用多媒体进行教学的次数,结果用茎叶图表示(如图),据此估计该校上学期200名教师中,使用多媒体进行教学次数在[15,30]内的人数为________.
解析:在抽取的20名教师中,使用多媒体进行教学次数在[15,30]内的人数为10,则在200名教师中,满足条件的人数为200×=100.
答案:100
4.某公司300名员工2016年年薪情况的频率分布直方图如图所示,由图可知,员工中年薪在3.4~3.6万元的共有________人.
解析:由频率分布直方图知年薪低于3.4万元或者高于3.6万元的频率为(0.2+0.8+0.8+1.0+1.0)×0.2=0.76,因此,年薪在3.4到3.6万元间的频率为1-0.76=0.24,所以300名员工中年薪在3.4到3.6万元间的员工人数为300×0.24=72(人).
答案:72
5.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题.
(1)求分数在[50,60]的频率及全班人数;
(2)求分数在[80,90]的频数,并计算频率分布直方图中[80,90]间的矩形的高.
解析:(1)分数在[50,60]的频率为0.008×10=0.08.
由茎叶图知,分数在[50,60]之间的频数为2,
所以全班人数为=25.
(2)分数在[80,90]的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为÷10=0.016.
2.2.2 用样本的数字特征估计总体的数字特征
[课时作业]
[A组 学业水平达标]
1.下列说法不正确的是(  )
A.方差是标准差的平方
B.标准差的大小不会超过极差
C.若一组数据的值大小相等,没有波动变化,则标准差为0
D.标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散
解析:标准差越小,表明各个样本数据在样本平均数周围越集中;标准差越大,表明各个样本数据在样本平均数的周围越分散.
答案:D
2.数学测验中,某小组14名学生分别与全班的平均分85分的差是:2,3,-3,-5,12,12,8,2,-1,4,-10,-2,5,5,这个小组的平均分是(  )
A.97.2       B.87.29
C.92.32 D.82.86
解析:2,3,-3,-5,12,12,8,2,-1,4,-10,-2,5,5的平均数为:(2+3-3-5+12+12+8+2-1+4-10-2+5+5)÷14=≈2.29,故这个小组的平均成绩是85+2.29=87.29(分).故选B.
答案:B
3.一次数学考试后,某老师从自己所带的两个班级中各抽取5人,记录他们的考试成绩,得到如图所示的茎叶图.已知甲班5名同学成绩的平均数为81,乙班5名同学成绩的中位数为73,则x-y的值为(  )
A.2 B.-2
C.3 D.-3
解析:由题意得=81?x=0,易知y=3.
∴x-y=-3,故选D.
答案:D
4.某品牌空调在春节期间举行促销活动,下面的茎叶图表示某专卖店记录的每天销售量的情况(单位:台),则销售量的中位数是(  )
A.13 B.14
C.15 D.16
解析:由茎叶图可知这些数分别为5,8,10,14,16,16,20,23,∴中位数为=15,故选C.
答案:C
5.某项测试成绩满分为10分,现随机抽取30名学生参加测试,得分如图所示,假设得分值的中位数为me,平均值为,众数为m0,则(  )
A.me=m0=        B.me=m0<
C.me<m0< D.m0<me<
解析:由图可知m0=5.
由中位数的定义知应该是第15个数与第16个数的平均值,由图知将数据从小到大排,第15个数是5,第16个数是6,
所以me==5.5.
=(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)≈5.97>5.5,
所以m0<me<,故选D.
答案:D
6.对某商店一段时间内的顾客人数进行了统计,得到了样本的茎叶图(如图所示),则该样本中的中位数为________,众数为________.
解析:将样本数据按大小顺序排列,排在中间位置或中间两个数的平均数是中位数,出现次数最多的是众数,所以根据图中数据可知该样本中的中位数为45,众数为45.
答案:45 45
7.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为________.
解析:由题意知(a+0+1+2+3)=1,
解得a=-1.
所以样本方差为s2=[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.
答案:2
8.若1,2,3,4,m这五个数的平均数为3,则这五个数的方差为________.
解析:由=3得m=5,所以这五个数的方差为[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2.
答案:2
9.如图所示的是甲、乙两人在一次射击比赛中中靶的情况(击中靶中心的圆面为10环,靶中各数字表示该数字所在圆环被击中时所得的环数),每人射击了6次.
甲射击的靶     乙射击的靶
(1)请用列表法将甲、乙两人的射击成绩统计出来;
(2)请用学过的统计知识,对甲、乙两人这次的射击情况进行比较.
解析:(1)甲、乙两人的射击成绩统计表如下:
环数
6
7
8
9
10
甲命中次数
0
0
2
2
2
乙命中次数
0
1
0
3
2
(2)甲=×(8×2+9×2+10×2)=9(环),
乙=×(7×1+9×3+10×2)=9(环),
s=×[(8-9)2×2+(9-9)2×2+(10-9)2×2]=,
s=×[(7-9)2+(9-9)2×3+(10-9)2×2]=1,
因为甲=乙,s所以甲与乙的平均成绩相同,但甲的发挥比乙稳定.
[B组 应考能力提升]
1.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如表:
学生
1号
2号
3号
4号
5号
甲班
6
7
7
8
7
乙班
6
7
6
7
9
则以上两组数据的方差中较小的一个为s2,则s2等于(  )
A. B.
C. D.2
解析:甲=7,s=[(6-7)2+(7-7)2+(7-7)2+(8-7)2+(7-7)2]=,乙=7,s=[(6-7)2+(7-7)2+(6-7)2+(7-7)2+(9-7)2]=,
两组数据的方差中较小的一个为s,即s2=.故选A.
答案:A
2.样本中共有五个个体,其值分别为0,1,2,3,m.若该样本的平均值为1,则其方差为(  )
A. B.
C. D.2
解析:依题意得m=5×1-(0+1+2+3)=-1,样本方差s2=(12+02+12+22+22)=2,即所求的样本方差为2.
答案:D
3.已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m,n的比值=________.
解析:由茎叶图可知甲的数据为27,30+m,39,乙的数据为20+n,32,34,38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m=3.由此可以得出甲的平均数为33,所以乙的平均数也是33,所以有=33,所以n=8,所以=.
答案:
4.农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下(单位:cm):
甲:9,10,11,12,10,20 乙:8,14,13,10,12,21
(1)在给出的方框内绘出所抽取的甲、乙两种麦苗株高的茎叶图;
(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况.
解析:(1)茎叶图如图所示:
(2)甲==12,
乙==13,
s=×[(9-12)2+(10-12)2+(11-12)2+(12-12)2+(10-12)2+(20-12)2]≈13.67,
s=×[(8-13)2+(14-13)2+(13-13)2+(10-13)2+(12-13)2+(21-13)2]≈16.67.
因为甲<乙,所以乙种麦苗平均株高较高,又因为s<s,所以甲种麦苗长的较为整齐.
5.某校对高二年级的男生进行体检,现将高二男生的体重(kg)数据进行整理后分成6组,并绘制部分频率分布直方图(如图所示).已知第三组[60,65)的人数为200.根据一般标准,高二男生体重超过65 kg属于偏胖,低于55 kg属于偏瘦,观察图中的信息,回答下列问题:
(1)求体重在[60,65)内的频率,并补全频率分布直方图;
(2)用分层抽样的方法从偏胖的学生中抽取6人对日常生活习惯及体育锻炼进行调查,则各组应分别抽取多少人?
(3)根据频率分布直方图,估计高二男生的体重的中位数与平均数.
解析:(1)体重在[60,65)内的频率=1-(0.03+0.07+0.03+0.02+0.01)×5=0.2,
则==0.04,补全的频率分布直方图如图所示.
(2)设男生总人数为n,由=0.2,可得n=1 000.
体重超过65 kg的总人数为(0.03+0.02+0.01)×5×1 000=300,
在[65,70)的人数为0.03×5×1 000=150,应抽取的人数为6×=3,
在[70,75)的人数为0.02×5×1 000=100,应抽取的人数为6×=2,
在[75,80]的人数为0.01×5×1 000=50,应抽取的人数为6×=1.
所以在[65,70),[70,75),[75,80]三段应抽取的人数分别为3,2,1.
(3)中位数为60 kg,平均数为
(52.5×0.03+57.5×0.07+62.5×0.04+67.5×0.03+72.5×0.02+77.5×0.01)×5=61.75(kg).
2.3 变量间的相关关系
[课时作业]
[A组 学业水平达标]
1.如图是根据x,y的观测数据(xi,yi)(i=1,2,…,10)得到的散点图,可以判断变量x,y具有线性相关关系的图是(  )
A.①② B.①④
C.②③ D.③④
解析:若变量x,y具有线性相关关系,那么散点就在某条直线附近,从左上到右下,或从左下到右上,故选D.
答案:D
2.已知x,y取值如表:
x
0
1
4
5
6
y
1.3
m
3m
5.6
7.4
画散点图分析可知:y与x线性相关,且求得回归方程为=x+1,则m的值(精确到0.1)为(  )
A.1.5 B.1.6
C.1.7 D.1.8
解析:由题意知,=3.2代入回归方程=x+1可得=4.2,则4m=6.7,解得m=1.675,则精确到0.1后m的值为1.7.故选C.
答案:C
3.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能为(  )
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
解析:依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5),代入A,B得A正确.
答案:A
4.根据如下样本数据得到的回归方程为=x+,则(  )
x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
A.>0,>0 B.>0,<0
C.<0,>0 D.<0,<0
解析:把样本数据中的x,y分别当作点的横,纵坐标,在平面直角坐标系xOy中作出散点图(图略),由图可知<0,>0.故选B.
答案:B
5.登山族为了了解山高y(km)与气温x(℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:
气温(℃)
18
13
10
-1
山高(km)
24
34
38
64
由表中数据,得到线性回归方程=-2x+,由此估计山高为72(km)处气温的度数为(  )
A.-10 B.-8
C.-6 D.-4
解析:因为=10,=40,所以样本中心点为(10,40),因为回归直线过样本中心点,所以40=-20+,即=60,所以线性回归方程为=-2x+60,所以山高为72(km)处气温的度数为-6,故选C.
答案:C
6.下列说法:①回归方程适用于一切样本和总体;
②回归方程一般都有局限性;
③样本取值的范围会影响回归方程的适用范围;
④回归方程得到的预测值是预测变量的精确值.
正确的是________(将你认为正确的序号都填上).
解析:样本或总体具有线性相关关系时,才可求回归方程,而且由回归方程得到的函数值是近似值,而非精确值,因此回归方程有一定的局限性.所以①④错.
答案:②③
7.一般来说,一个人脚掌越长,他的身高就越高,现对10名成年人的脚掌长x与身高y进行测量,得到数据(单位均为cm)如表,作出散点图后,发现散点在一条直线附近,经计算得到一些数据:(xi-)(yi-)=577.5,(xi-)2=82.5;某刑侦人员在某案发现场发现一对裸脚印,量得每个脚印长为26.5 cm,则估计案发嫌疑人的身高为________cm.
解析:回归方程的斜率===7,=24.5,=171.5,截距=-=0,即回归方程为=7x,当x=26.5时,y=185.5.
答案:185.5
8.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为__________cm.
解析:设父亲身高为x cm,儿子的身高为y cm,由题意可列表格如下:
x
173
170
176
y
170
176
182
由表格中数据得=173,=176,iyi=91 362,
=89 805,则
==1,
=- =176-1×173=3,∴=x+3,当x=182时,=185.
答案:185
9.某个服装店经营某种服装,在某周内获纯利y(元),与该周每天销售这种服装件数x之间的一组数据关系见表
已知x=280,y=45 209,xiyi=3 487.
(1)求,;
(2)求回归方程.
解析:(1)=×(3+4+5+6+7+8+9)=6,
=×(66+69+73+81+89+90+91)=.
(2)==,
∴=-×6=,
∴所求回归方程为=x+.
10.由某种设备的使用年限xi(年)与所支出的维修费yi(万元)的数据资料算得如下结果,=90,iyi=112,i=20,i=25.
(1)求所支出的维修费y对使用年限x的线性回归方程=x+;
(2)①判断变量x与y之间是正相关还是负相关;
②当使用年限为8年时,试估计支出的维修费是多少.
(附:在线性回归方程=x+中,=,=-,其中,为样本平均值)
解析:(1)∵i=20,i=25,
∴=i=4,=i=5,
∴===1.2,
=-=5-1.2×4=0.2.
∴线性回归方程为=1.2x+0.2.
(2)①由(1)知=1.2>0,∴变量x与y之间是正相关.
②由(1)知,当x=8时,=9.8,即使用年限为8年时,支出维修费约是9.8万元.
[B组 应考能力提升]
1.某研究机构对儿童记忆能力x和识图能力y进行统计分析,得到如下数据:
记忆能力x
4
6
8
10
识图能力y
3
5
6
8
由表中数据,求得线性回归方程为=x+,若某儿童的记忆能力为12,则他的识图能力为(  )
A.7 B.9.5
C.10 D.12
解析:由表中数据得==7,==,由(,)在直线=x+上,得=-,即线性回归方程为=x-.当x=12时,=×12-=9.5,即他的识图能力为9.5.
答案:B
2.已知x,y的取值如表所示:
x
2
3
4
y
6
4
5
如果y与x线性相关,且线性回归方程为=x+,则的值为(  )
A.-         B.
C.- D.
解析:计算得=3,=5,代入到=x+中,得=-,故选A.
答案:A
3.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:
时间x
1
2
3
4
5
命中率y
0.4
0.5
0.6
0.6
0.4
小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________.
解析:小李这5天的平均投篮命中率
==0.5,可求得小李这5天的平均打篮球时间=3.根据表中数据可求得=0.01,=0.47,故回归直线方程为=0.47+0.01x,将x=6代入得6号打6小时篮球的投篮命中率约为0.53.
答案:0.5 0.53
4.某市居民2012~2016年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如下表所示:
年份
2012
2013
2014
2015
2016
收入x
11.5
12.1
13
13.3
15
支出y
6.8
8.8
9.8
10
12
根据统计资料,居民家庭年平均收入的中位数是__________,家庭年平均收入与年平均支出有__________线性相关关系.
解析:5个x值是按从小到大排列的,因此居民家庭年平均收入的中位数是13万元.
以家庭年平均收入x作为横轴,年平均支出y作为纵轴,描点得到散点图如图所示.

观察散点图,这些点大致分布在一条直线的附近,因此家庭年平均收入与年平均支出有较强的线性相关关系,且各点分布从左下角到右上角的区域,故两变量为正相关.
答案:13 正
5.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;
(3)试根据(2)求出的线性回归方程,预测记忆力为9的同学的判断力.
(相关公式: =,=-x)
解析:(1)如图:
(2)iyi=6×2+8×3+10×5+12×6=158,
==9,==4,
x=62+82+102+122=344,
===0.7,
=-=4-0.7×9=-2.3,
故线性回归方程为=0.7x-2.3.
(3)由回归直线方程预测,记忆力为9的同学的判断力约为4.