2020_2021学年高中数学第二章统计课时素养评价含解析(6份打包)新人教A版必修3

文档属性

名称 2020_2021学年高中数学第二章统计课时素养评价含解析(6份打包)新人教A版必修3
格式 zip
文件大小 1.9MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2021-03-28 10:18:24

文档简介

简单随机抽样
                
(15分钟 30分)
1.用随机数表法进行抽样有以下几个步骤:
①将总体中的个体编号;②获取样本号码;③选定开始的数字;④选定读数的方向.这些步骤的先后顺序应为
(  )
A.①②③④
B.①③④②
C.③②①④
D.④③①②
【解析】选B.由随机数表法的步骤知选项B满足题意.
2.某工厂的质检人员对生产的100件产品,采用随机数表法抽取10件检查,对100件产品采用下面的编号方法:
①1,2,3,…,100;
②001,002,…,100;
③00,01,02,…,99;
④01,02,03,…,100.
其中正确的是
(  )
A.②③④
B.③④
C.②③
D.①②
【解析】选C.根据随机数表的要求,只有编号时数字位数相同,才能达到随机等可能抽样.
3.某校高一共有10个班,编号1至10,某项调查要从中抽取三个班作为样本,现用抽签法抽取样本,每次抽取一个号码,共抽3次,设五班第一次被抽到的可能性为a,第二次被抽到的可能性为b,则
(  )
A.a=,b=
B.a=,b=
C.a=,b=
D.a=,b=
【解析】选D.由简单随机抽样的定义知,每个个体在每次抽取中都有相同的可能性被抽到,故五班在每次抽样中被抽到的可能性都是.
4.某工厂共有n名工人,为了调查工人的健康情况,从中随机抽取20名工人作为调查对象,若每位工人被抽到的可能性为,则n=______.?
【解析】因为简单随机抽样为机会均等的抽样,
所以=,即n=100.
答案:100
【补偿训练】
要检查一个工厂产品的合格率,从1
000件产品中抽出50件进行检查,检查者在其中随机逐个抽取了50件,这种抽样方法可称为______.?
【解析】由简单随机抽样的特点可知,该抽样方法是简单随机抽样.
答案:简单随机抽样
5.某电视台举行颁奖典礼,邀请20名港台、内地艺人演出,其中从30名内地艺人中随机选出10人,从18名香港艺人中随机挑选6人,从10名台湾艺人中随机挑选4人.试用抽签法确定选中的艺人,并确定他们的表演顺序.
【解析】第一步,先确定内地艺人:(1)将30名内地艺人从01到30编号,然后用相同的纸条做成30个号签,在每个号签上写上这些编号,然后放入一个不透明小筒中摇匀,从中抽出10个号签,则相应编号的内地艺人参加演出;
(2)运用相同的办法分别从10名台湾艺人中抽取4人,从18名香港艺人中抽取6人.
第二步,确定演出顺序:确定了演出人员后,再用相同的纸条做成20个号签,上面写上1到20,这20个数字代表演出的顺序,让每个演员抽一张,每人抽到的号签上的数字就是演出顺序,再汇总即可.
【补偿训练】
从60件产品中抽取5件进行检查,请用抽签法抽取产品,并写出抽样过程.
【解析】抽签步骤:
第一步,将60件产品编号,号码是1,2,…,60.
第二步,将号码分别写在同样的纸条上,揉成团,制成号签.
第三步,将号签放入一个不透明的袋子中,并充分搅匀.
第四步,从袋子中依次抽取5个号签,并记录上面的编号.
第五步,与所得号码对应的产品就是要抽取的对象.
                
(15分钟 35分)
一、选择题(每小题5分,共15分)
1.下列抽样方法是简单随机抽样的是
(  )
A.从50个零件中一次性抽取5个做质量检验
B.从50个零件中有放回地抽取5个做质量检验
C.从整数集中逐个抽取10个分析是奇数还是偶数
D.运动员从8个跑道中随机抽取1个跑道
【解析】选D.A项中是一次性抽取5个,不是逐个抽取,则A项不是简单随机抽样;B项中是有放回抽取,则B项也不是简单随机抽样;C项中整数集是无限集,总体容量不是有限的,则C项也不是简单随机抽样;很明显D项是简单随机抽样.
2.从一群做游戏的小孩中随机抽出k人,一人分一个苹果,让他们返回继续做游戏.过了一会儿,再从中任选m人,发现其中有n个小孩曾分过苹果,估计参加游戏的小孩的人数为
(  )
A.
B.k+m-n
C.
D.不能估计
【解析】选C.设做游戏的小孩总数为x人,则:=,
所以x=.
3.下列4个抽样中,简单随机抽样的个数是
(  )
①从无数个个体中抽取50个个体作为样本;
②仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;③盒子中共有80个零件,从中选出5个零件进行质量检验,在进行操作时,从中任意抽出一个零件进行质量检验后把它放回盒子里;
④一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地逐个抽出6个号签.
A.0     B.1     C.2     D.3
【解析】选B.根据简单随机抽样的特点逐个判断.①不是简单随机抽样.因为简单随机抽样要求被抽取的样本总体的个数是有限的.②不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.③不是简单随机抽样.检验后再放回盒子,造成每个零件被抽到的概率不相等且简单随机抽样要求不放回抽样.④是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.综上,只有④是简单随机抽样.
二、填空题(每小题5分,共10分)
4.一个布袋中有6个同样质地的小球,从中不放回地抽取3个小球,则某一特定小球被抽到的可能性是______;第三次抽取时,剩余小球中的某一特定小球被抽到的可能性是______.?
【解析】因为简单随机抽样时某一特定小球被抽到的可能性为=,第三次抽取时,剩余小球中的某一特定小球被抽到的可能性是=.
答案: 
5.为了了解参加运动会的2
000名运动员的年龄情况,从中抽取20名运动员的年龄进行统计分析.就这个问题,下列说法中正确的有______.(填序号)?
①2
000名运动员是总体;
②每个运动员是个体;
③所抽取的20名运动员是一个样本;
④样本容量为20;
⑤这个抽样方法可采用随机数表法抽样;
⑥每个运动员被抽到的机会相等.
【解析】①2
000名运动员不是总体,2
000名运动员的年龄才是总体;②每个运动员的年龄是个体;③抽取的20名运动员的年龄是一个样本.故①②③均错误,正确的说法是④⑤⑥.
答案:④⑤⑥
【补偿训练】
用简单随机抽样的方法从含有6个个体的总体中,抽取一个容量为2的样本,某一个个体a“第一次被抽到的概率”,“第二次被抽到的概率”,“在整个抽样过程中被抽到的概率”分别是______.?
【解析】从6个个体中抽1个个体,每个个体被抽到的概率均为,与抽取的次数无关,第二次被抽到的概率仍为.但由于在整个抽样过程中是从6个个体中抽2个样本,故个体a被抽到的概率为.
答案:,,
三、解答题
6.(10分)某学生在一次理科竞赛中要回答的8道题是这样产生的:从15道物理题中随机抽3道;从20道化学题中随机抽3道;从12道生物题中随机抽2道.选用合适的抽样方法确定这个学生所要回答的三门学科的题的序号(物理题的序号为1~15,化学题的序号为16~35,生物题的序号为36~47).
【解析】方法一(抽签法):
第一步,将试题的序号1~47分别写在纸条上.
第二步,将纸条揉成团,制成号签.
第三步,将物理、化学、生物题的号签分别放在三个不透明的袋子中,充分搅拌.
第四步,从装有物理题的袋子中逐个抽取3个号签,从装有化学题的袋子中逐个抽取3个号签,从装有生物题的袋子中逐个抽取2个号签,并记录所得号签上的序号,这便是所要回答的问题的序号.
方法二:(随机数表法):
第一步,将物理题的序号对应改成01,02,…,15,其余两科题的序号不变.
第二步,在教材所附的随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第10行第11个数0,并向右开始读取.
第三步,从数0开始向右读,每次读取两位,若得到的号码不在01~47中,则跳过,前面已经取出的也跳过.从01~15中选3个号码,从16~35中选3个号码,从36~47中选2个号码.依次可得到09,47,27,17,46,08,02,28.
第四步,对应以上号码找出所要回答的问题的序号.物理题的序号为:2,8,9;化学题的序号为:17,27,28;生物题的序号为:46,47.
【补偿训练】
为了适应新高考改革,尽快推行不分文理科教学,对比目前文理科学生考试情况进行分析,决定从80名文科同学中抽取10人,从300名理科同学中抽取50人进行分析.由于本题涉及文科生和理科生的混合抽取,你能设计合适的抽样方案吗?试一试.
【解析】文科生抽样用抽签法,理科生抽样用随机数表法,抽样过程如下:
(1)先抽取10名文科同学:
①将80名文科同学依次编号为1,2,3,…,80;
②将号码分别写在形状、大小均相同的纸片上,制成号签;
③把80个号签放入一个不透明的容器中,搅拌均匀,每次从中不放回地抽取一个号签,连续抽取10次;
④与号签上号码相对应的10名同学的考试情况就构成一个容量为10的样本.
(2)再抽取50名理科同学:
①将300名理科同学依次编号为001,002,…,300;
②从随机数表中任选一数字作为开始数字,任选一方向作为读数方向,比如从教材附表的第4行第1列的数字1开始向右读(如图所示).每次读取三位,凡不在001~300范围内以及重复的数都跳过去,得到号码125,210,142,188,264,…;
③这50个号码所对应的同学的考试情况就构成一个容量为50的样本.
PAGE系



                
(20分钟 35分)
1.为了了解参加某次知识竞赛的1
252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么从总体中应随机剔除的个体数目为
(  )
A.2
B.3
C.4
D.5
【解析】选A.1
252=50×25+2,故应从总体中随机剔除2个个体.
2.下列说法错误的个数是
(  )
①总体的个体数不多时宜用简单随机抽样法;
②系统抽样中在总体均分后的每一部分进行抽样时,采用的是简单随机抽样;
③百货商场的抽奖活动是抽签法;
④整个系统抽样过程中,每个个体被抽取的机会相等.
A.1
B.2
C.3
D.4
【解析】选A.依题意及简单随机抽样、系统抽样的定义及特点知:①③④是正确的,②不正确.因为系统抽样分组后,在第一组中利用简单随机抽样,其他组加分组间隔即可.
3.在一个个体数目为2
003的总体中,利用系统抽样抽取一个容量为100的样本,则总体中每个个体被抽到的机会为
(  )
A.
B.
C.
D.
【解析】选C.从2
003个个体中抽取100个样本,每个个体被抽到的概率都相等,均为.
4.从编号为0,1,2,…,89的90件产品中,采用系统抽样的方法抽取容量是9的样本.若编号为36的产品在样本中,则该样本中产品的最大编号为______.?
【解析】样本间隔为90÷9=10,设第一个编号为x,
因为编号为36的产品在样本中,所以36=3×10+x.则第一个编号为6,则最大的编号为6+8×10=86.
答案:86
5.人们打桥牌时,将洗好的扑克牌(52张)随机确定一张为起始牌,这时,开始按次序搬牌,对每个人来说,都是从52张总体中抽取一个13张的样本.则这种抽样方法是______.?
【解析】简单随机抽样的实质是逐个地从总体中随机抽取.而这里只是随机确定了起始张,这时其他各张虽然是逐张起牌的,其实各张在谁手里已被确定.所以不是简单随机抽样,根据其等距起牌的特点应将其定位为系统抽样.
答案:系统抽样
【补偿训练】
某班级的54名学生编号为:1,2,3,…,54,为了采集同学们的身高信息,先采用系统抽样的方法抽取一个容量为6的样本,已知样本中含有编号为5,23和41的学生,则样本中剩余三名同学的编号分别为______.?
【解析】根据系统抽样的定义,抽样间距为9,样本中含有编号为5的学生,则应抽取的学生的编号为5,14,23,32,41,50,故应填14,32,50.
答案:14,32,50
6.某装订厂平均每小时装订图书362册,要求检验员每小时抽取40册图书,检验其质量情况,请设计一个抽样方案.
【解析】第一步,将362册图书随机编号;
第二步,用随机数表法从这些书中抽取2册书,不进行检查;
第三步,将剩下的书重新编号(分别为0,1,…,359),并平均分成40段;
第四步,从第一段(编号为0,1,…,8)中用简单随机抽样的方法,抽取1册书,设其编号为k;
第五步,抽取编号分别为k,k+9,k+18,k+27,…,k+39×9的书,这样就抽取了总共有40个个体的样本.
                
(30分钟 60分)
一、选择题(每小题5分,共25分)
1.下列问题中,最适合用系统抽样法抽样的是
(  )
A.从某厂生产的30个零件中随机抽取6个入样
B.一个城市有210家超市,其中大型超市20家,中型超市40家,小型超市150家.为了掌握各超市的营业情况,要从中抽取一个容量为21的样本
C.从参加竞赛的1
500名初中生中随机抽取100人分析试题作答情况
D.从参加期末考试的2
400名高中生中随机抽取10人了解某些情况
【解析】选C.A总体容量较小,样本容量也较小,可采用抽签法;B总体中的个体有明显的层次,不适宜用系统抽样法;C总体容量较大,样本容量也较大,可用系统抽样法;D总体容量较大,样本容量较小,可用随机数表法.
2.为了了解某地参加计算机水平测试的5
008名学生的成绩,从中抽取了200名学生的成绩进行统计分析,运用系统抽样方法抽取样本时,每组的容量

(  )
A.24
B.25
C.26
D.28
【解析】选B.因为5
008=200×25+8,所以每组的容量为25.
3.若采用系统抽样方法从420人中抽取21人做问卷调查,为此将他们随机编号为1,2,…,420,抽取的人的编号在区间[241,360]内的人数是
(  )
A.7
B.6
C.5
D.8
【解析】选B.若采用系统抽样方法从420人中抽取21人做问卷调查,则样本间隔为420÷21=20,则在区间[241,360]内共有360-241+1=120(人),则抽取的人数为:120÷20=6(人).
【补偿训练】
用系统抽样法(按等距离的规则)从160名学生中抽取容量为20的样本,将这160名学生从1到160编号.按编号顺序平均分成20段(1~8号,9~16号,…,153~160号),若第16段应抽出的号码为125,则第1段中用简单随机抽样确定的号码是
(  )
A.7   B.5   C.4   D.3
【解析】选B.由系统抽样知,每段中有8人,第16段应为从121到128这8个号码,125是其中的第5个号码,所以第1段中被确定的号码是5.
4.(2019·全国卷Ⅰ)某学校为了解1
000名新生的身体素质,将这些学生编号为1,2,…,1
000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是(  )
A.8号学生
B.200号学生
C.616号学生
D.815号学生
【解析】选C.由已知将1
000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{an},公差d=10,所以an=6+10(n-1)(n∈N
),
若8=6+10(n-1),则n=1.2,不合题意;若200=6+10(n-1),则n=20.4,不合题意;
若616=6+10(n-1),则n=62,符合题意;若815=6+10(n-1),则n=81.9,不合题意.故选C.
【补偿训练】
将参加数学竞赛决赛的500名同学编号为001,002,…,500,采用系统抽样的方法抽取一个容量为50的样本,且随机抽取的号码为003,这500名学生分别在三个考点考试,从001到200在第一考点,从201到355在第二考点,从356到500在第三考点,则第二考点被抽中的人数为
(  )
A.14
B.15
C.16
D.17
【解析】选C.系统抽样的分段间隔为=10,在随机抽样中,首次抽到003,故可知在001至200中有20人,在201至355中有16人.
5.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为
(  )
A.26,16,8
B.25,17,8
C.25,16,9
D.24,17,9
【解析】选B.依题意及系统抽样可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(k∈N
)组抽中的号码是3+12(k-1).
令3+12(k-1)≤300,得k≤,因此第Ⅰ营区被抽中的人数是25;令300<3+12(k-1)≤495,得二、填空题(每小题5分,共15分)
6.某单位有840名职工,现采用系统抽样的方法抽取42人进行问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落在区间[481,720]内的人数为______.?
【解析】采用系统抽样的方法,从840人中抽取42人,则分段间隔为20,所以从编号落在区间[481,720]内的240人中抽取=12(人).
答案:12
7.为规范学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有
52
名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为
4
的样本,已知
7
号、
33
号、
46
号同学在样本中,那么样本中还有一位同学的编号应是_____.?
【解析】由系统抽样原理知,抽样间隔是相同的,故抽取样本的编号分别为7,7+13,7+13×2,7+13×3.故还有一位同学的编号应是20.
答案:20
8.某单位有职工72人,现需用系统抽样法从中抽取一个样本,若样本容量为n,则不需要剔除个体,若样本容量为n+1,则需剔除2个个体,则n=______.?
【解析】由题意知n为72的约数,n+1为70的约数,其中72的约数有1,2,3,4,6,8,9,12,18,24,36,72,其中加1后能整除70的有1,4,6,9,其中n=1不符合题意,故n=4或6或9.
答案:4或6或9
三、解答题(每小题10分,共20分)
9.某工厂有工人1
007名,现从中抽取100人进行体检,试写出抽样方案.
【解析】用系统抽样的方法抽取样本.
第一步,编号.将1
007名工人编号,号码为0001,0002,…,1007.
第二步,利用随机数表法抽取7个号码,将对应编号的工人剔除.
第三步,将剩余的1
000名工人重新编号,号码为0001,0002,…,1000.
第四步,确定分段间隔k==10,将总体分成100段,每段10名工人.
第五步,在第1段中,利用抽签法或者随机数表法抽取一个号码m.
第六步,利用分段间隔,将m,m+10,m+20,…,m+990共100个号码抽出.
10.某工厂有普通工人1
001人,高级工程师20人,现抽取普通工人40人,高级工程师4人组成代表队参加某项活动,应怎样抽样?
【解析】先抽取普通工人.
(1)将1
001名普通工人用随机方式编号;
(2)从总体中剔除1人(剔除方法可用随机数表法),将剩下的1
000名工人重新编号(分别为0001,0002,…,1000),并平均分成40段,其中每一段包含=25个个体;
(3)在第一段0001,0002,…,0025这25个编号中用简单随机抽样法抽出一个(如0003)作为起始号码;
(4)将编号为0003,0028,0053,…,0978的个体抽出;
再抽取高级工程师.
(5)将20名高级工程师用随机方式编号为1,2,…,20;
(6)将这20个号码分别写在大小、形状相同的小纸条上,揉成小球,制成号签;
(7)将得到的号签放入一个不透明的容器中,充分搅拌均匀;
(8)从容器中逐个抽取4个号签,并记录上面的编号;
(9)从总体中将与所抽号签的编号相一致的个体取出.
以上得到的个体便是代表队成员.
1.一个总体中的80个个体的编号为0,1,2,…,79,并依次将其分为8个组,组号为0,1,…,7,用系统抽样的方法抽取一个容量为8的样本,即规定先在第0组随机抽取一个号码,记为i,依次错位地得到后面各组的号码,即在第k组中抽取个位数字为i+k(当i+k<10时)或i+k-10(当i+k≥10时)的号码.当i=6时,所抽到的8个号码是__________________.?
【解析】由题意得,在第1组抽取的号码的个位数字是6+1=7,故应选17;在第2组抽取的号码的个位数字是6+2=8,故应选28;依次类推,应选39,40,51,62,73.
答案:6,17,28,39,40,51,62,73
2.一个总体中的1
000个个体编号为0,1,2,…,999,并依次将其分为10个小组,组号为0,1,2,…,9.要用系统抽样的方法抽取一个容量为10的样本,规定如果在第0组随机抽取的号码为x,那么依次错位得到后面各组的号码,即第k组抽取的号码的后两位数是x+33k的后两位数.
(1)当x=24时,写出所抽样本的10个号码.
(2)若所抽取样本的10个号码中有一个的后两位数是87,求x的取值范围.
【解析】(1)由题意知此系统抽样的间隔是100,第1组后两位数是24+33=57,所以第1组号码为157;k=2,24+66=90,所以第2组号码为290,以此类推,10个号码为:24,157,290,323,456,589,622,755,888,921.
(2)当k=0,1,2,…,9时,33k的值依次为:0,33,66,99,132,165,198,231,264,297.又因为抽取的10个号码中有一个的后两位数是87,从而x可以是87,54,21,88,55,22,89,56,23,90.所以x的取值范围是{21,22,23,54,55,56,87,88,89,90}.
PAGE分



                
(20分钟 35分)
1.下列问题中,最适合用分层抽样方法抽样的是
(  )
A.某电影院有32排座位,每排有40个座位,座位号是1~40.有一次报告会坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈
B.从10台冰箱中抽出3台进行质量检查
C.某乡农田有山地8
000亩,丘陵12
000亩,平地24
000亩,洼地4
000亩,现抽取农田480亩估计全乡农田平均产量
D.从50个零件中抽取5个做质量检验
【解析】选C.A的总体容量较大,宜采用系统抽样方法;B的总体容量较小,用简单随机抽样法比较方便;C总体容量较大,且各类田地的产量差别很大,宜采用分层抽样方法;D与B类似.
2.共享单车为人们提供了一种新的出行方式,有关部门对使用共享单车人群的年龄分布进行了统计,得到的数据如表所示:
年龄
12~20岁
20~30岁
30~40岁
40岁及以上
比例
14%
45.5%
34.5%
6%
为调查共享单车使用满意率情况,现采用分层抽样的方法从中抽取容量为200的样本进行调查,那么应抽取20~30岁的人数为
(  )
A.12
B.28
C.69
D.91
【解析】选D.由分层抽样的定义得应抽取20~30岁的人数为200×45.5%=91.
3.我国古代数学名著《九章算术》中有如下问题“今有北乡算八千七百五十八,西乡算七千二百三十六,南乡算八千三百五十六,凡三乡,发役三百七十八人,欲以算数多少出之,问各几何?”意思是:北乡有8
758人,西乡有7
236人,南乡有8
356人,现要按人数多少从三乡共征集378人,问从各乡征集多少人?在上述问题中,需从西乡征集的人数约为
(  )
A.102
B.112
C.130
D.136
【解析】选B.因为北乡有8
758人,西乡有7
236人,南乡有8
356人,现要按人数多少从三乡共征集378人,故需从西乡征集的人数是378×≈112.
4.一支田径队有男、女运动员98人,其中男运动员有56人.按男、女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员的人数是______.?
【解析】抽取女运动员的人数为×28=12.
答案:12
5.(2018·全国卷Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是______.?
【解析】根据题干中有大量客户,且不同年龄段客户对其服务的评价有较大差异,可知最合适的抽样方法是分层抽样.
答案:分层抽样
【补偿训练】
为调査某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本,其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生3
000人,则该校学生总人数是______.?
【解析】由题意,其他年级抽取500-200-100=200人,设该校学生总人数为x,则由分层抽样可得=,解得x=7
500.
答案:7
500
6.某市化工厂三个车间共有工人1
000名,各车间男、女工人数如下表:
第一车间
第二车间
第三车间
女工
173
100
y
男工
177
x
z
已知在全厂工人中随机抽取1名,抽到第二车间男工的可能性是0.15.
(1)求x的值.
(2)现用分层抽样的方法在全厂抽取50名工人,问应在第三车间抽取多少名?
【解析】(1)由=0.15,得x=150.
(2)因为第一车间的工人数是173+177=350,第二车间的工人数是100+150=250,
所以第三车间的工人数是1
000-350-250=400.
设应从第三车间抽取m名工人,则由=,得m=20.所以应在第三车间抽取20名工人.
                
(30分钟 55分)
一、选择题(每小题5分,共20分)
1.(2020·天津高一检测)下列问题中,最适合用简单随机抽样方法抽样的

(  )
A.某县从该县中、小学生中抽取200人调查他们的视力情况
B.从15种疫苗中抽取5种检测是否合格
C.某大学共有学生5
600人,其中专科生有1
300人、本科生3
000人、研究生1
300人,现抽取样本容量为280的样本调查学生利用因特网查找学习资料的情况
D.某学校兴趣小组为了了解移动支付在大众中的熟知度,要对岁的人群进行随机抽样调查
【解析】选B.对于选项A:中、小学生有群体差异,宜采用分层抽样;
对于选项B:样本数量较少,宜采用简单随机抽样;
对于选项C:专科生、本科生、研究生有群体差异,宜采用分层抽样;
对于选项D:年龄对于移动支付的了解有较大影响,宜采用分层抽样;
2.问题:①有1
000个乒乓球分别装在3个箱子内,其中红色箱子内有500个,蓝色箱子内有200个,黄色箱子内有300个,现从中抽取一个容量为100的样本;②从20名学生中选出3名参加座谈会.
方法:Ⅰ简单随机抽样;Ⅱ系统抽样;Ⅲ分层抽样.其中问题与方法能配对的

(  )
A.①Ⅰ,②Ⅱ
B.①Ⅲ,②Ⅰ
C.①Ⅱ,②Ⅲ
D.①Ⅲ,②Ⅱ
【解析】选B.对于①,由于箱子颜色差异较为明显,可采用分层抽样法抽取样本;对于②,由于总体容量、样本容量都较小,宜采用简单随机抽样.
3.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本.
①采用随机抽样法,将零件编号为00,01,…,99,抽签取出20个;
②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;
③采用分层抽样法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.对于上述抽样方式,下面说法正确的是
(  )
A.不论哪一种抽样方法,这100个零件中每一个个体被抽到的概率都是
B.①②两种抽样方法中,这100个零件每一个个体被抽到的概率为,③并非如此
C.①③两种抽样方法中,这100个零件中每一个个体被抽到的概率为,②并非如此
D.采用不同的抽样方法,这100个零件中每一个个体被抽到的概率是不同的
【解析】选A.虽然三种抽样方法不同,但最终每个个体被抽取的机会是均等的,这正说明了三种抽样方法的科学性和可行性.
4.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是
(  )
A.4
B.5
C.6
D.7
【解析】选C.分层抽样中,分层抽取时都按相同的抽样比来抽取,本题中抽样比为=,因此植物油类应抽取10×=2(种),果蔬类食品应抽20×=4(种),因此从植物油类和果蔬类食品中抽取的种数之和为2+4=6.
二、填空题(每小题5分,共15分)
5.用分层抽样的方式对某品牌同一批次两种型号的产品进行抽查,已知样本容量为80,其中有50件甲型号产品,乙型号产品总数为1
800,则该批次产品总数为______.?
【解析】样本容量为80,其中有50件甲型号产品,乙型号产品总数为1
800,可得抽样比为=,该批次产品总数为=4
800.
答案:4
800
【补偿训练】
某公司生产三种型号的轿车,产量分别是1
200辆,6
000
辆和2
000辆,为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取______辆、______辆、______辆.?
【解析】三种型号的轿车共9
200辆,抽取样本为46辆,则按=的比例抽样,所以依次应抽取1
200×=6(辆),6
000×=30(辆),2
000×=10(辆).
答案:6 30 10
6.某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为120份,180份,240份,x份.因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为______.?
【解析】11~12岁回收180份,其中在11~12岁学生问卷中抽取60份,则抽样比为=.因为从回收的问卷中按年龄段分层抽取容量为300的样本,所以从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷总数为=900,则15~16岁回收问卷份数为x=900-120-180-240=360.所以在15~16岁学生中抽取的问卷份数为120.
答案:120
7.某高中针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团,已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如表:
高一年级
高二年级
高三年级
泥塑
a
b
c
剪纸
x
y
z
其中x∶y∶z=5∶3∶2,且“泥塑”社团的人数占两个社团总人数的,为了了解学生对两个社团活动的满意程度,从中抽取一个50人的样本进行调查,则从“剪纸”社团的高二年级学生中应抽取______人.?
【解析】方法一:因为“泥塑”社团的人数占两个社团总人数的,故“剪纸”社团的人数占两个社团总人数的,所以“剪纸”社团的人数为800×=320.
因为“剪纸”社团中高二年级人数比例为
==,
所以“剪纸”社团中高二年级人数为320×=96.
由题意知,抽样比为=,所以从“剪纸”社团中高二年级抽取的人数为96×=6.
方法二:因为“泥塑”社团的人数占两个社团总人数的,故“剪纸”社团的人数占两个社团总人数的,
所以抽取的50人的样本中,“剪纸”社团中的人数为50×=20.又“剪纸”社团中高二年级人数比例为==,所以从“剪纸”社团中高二年级抽取的人数为20×=6.
答案:6
三、解答题(每小题10分,共20分)
8.某单位有技师18人、技术员12人、工程师6人.需要从这些人中抽取一个容量为n(n∈N
)的样本,如果采用系统抽样的方法抽取,不用剔除个体;如果采用分层抽样的方法抽取,各层抽取结果都是整数;如果样本容量增加1,则在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n的值.
【解析】依题意,知总体容量为6+12+18=36.
当样本容量是n时,由题意知,系统抽样的间隔为,分层抽样的抽样比是,分层抽样时,抽取工程师的人数为×6=,技术员的人数为×12=,技师的人数为×18=,所以n应是36的约数且是6的倍数,即n的可能取值是6,12,18.
当样本容量为n+1时,系统抽样的间隔为.
因为必须为正整数,
所以n只能取6,即样本容量n=6.
【补偿训练】
  
一个单位有职工160人,其中业务员120人,管理人员16人,后勤服务人员24人.为了了解职工的某种情况,要从中抽取一个容量为20的样本,用分层抽样的方法写出抽取样本的过程.
【解析】因为样本容量与职工总人数的比为20∶160=1∶8,所以业务员、管理人员、后勤服务人员抽取的人数分别为=15,=2,=3.
即分别抽取15人,2人和3人.
抽样步骤:
①确定抽样比为;
②按比例分配各个层所要抽取的个体数,每一层抽取时,可以采用简单随机抽样或系统抽样;
③再将各层抽取的个体合在一起,就是要抽取的样本
9.某中学举行了为期3天的新世纪体育运动会,同时进行全校精神文明擂台赛.为了解这次活动在全校师生中产生的影响,分别在全校500名教职员工、3
000名初中生、4
000名高中生中做问卷调查,如果要在所有答卷中抽出120份用于评估.
(1)应如何抽取才能得到比较客观的评价结论?
(2)要从3
000份初中生的答卷中抽取一个容量为48的样本,如果采用简单随机抽样,应如何操作?
(3)为了从4
000份高中生的答卷中抽取一个容量为64的样本,如何使用系统抽样抽取到所需的样本?
【解析】(1)由于这次活动对教职员工、初中生和高中生产生的影响不会相同,所以应当采取分层抽样的方法进行抽样.
因为样本容量为120,总体个数为500+3
000+4
000=7
500,则抽样比为=,
所以有500×=8,3
000×=48,4
000×=64,所以在教职员工、初中生、高中生中抽取的个体数分别是8,48,64.
分层抽样的步骤是
①分层:分为教职员工、初中生、高中生,共三层;
②确定每层抽取个体的个数:在教职员工、初中生、高中生中抽取的个体数分别是8,48,64;
③各层分别按简单随机抽样或系统抽样的方法抽取样本;
④综合每层抽样,组成样本.
这样便完成了整个抽样过程,就能得到比较客观的评价结论.
(2)由于简单随机抽样有两种方法:抽签法和随机数表法.如果用抽签法,要制作3
000个号签,费时费力,因此采用随机数表法抽取样本,步骤是
①编号:将3
000份答卷都编上号码:0001,0002,0003,…,3000;
②在随机数表上随机选取一个起始位置;
③规定读数方向:向右连续取数字,以4个数为一组,如果读取的4位数大于
3
000,则去掉,如果遇到相同号码则只取一个,这样一直到取满48个号码为止.
(3)由于4
000÷64=62.5不是整数,则应先使用简单随机抽样从4
000名学生中随机剔除32个个体,再将剩余的3
968个个体进行编号:1,2,…,3968,然后将整体分为64个部分,其中每个部分中含有62个个体,如第1部分个体的编号为1,2,…,62.从中随机抽取一个号码,若抽取的是23,则从第23号开始,每隔62个抽取一个,这样得到容量为64的样本:23,85,147,209,271,333,395,457,…,3
929.
1.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1、p2、p3,则
(  )
A.p1=p2B.p2=p3C.p1=p3D.p1=p2=p3
【解析】选D.根据抽样方法的概念可知,简单随机抽样、系统抽样和分层抽样三种抽样方法,每个个体被抽到的概率都是,故p1=p2=p3.
2.为了对某课题进行讨论研究,用分层抽样的方法从三所高校A,B,C的相关人员中,抽取若干人组成研究小组,有关数据见表(单位:人).
高校
相关人数
抽取人数
A
x
1
B
36
y
C
54
3
(1)求x,y;
(2)若从高校B相关的人中选2人进行专题发言,应采用什么抽样方法,请写出合理的抽样过程.
【解析】(1)分层抽样是按各层相关人数和抽取人数的比例进行的,所以有:=,x=18,=,y=2,故x=18,y=2.
(2)总体容量和样本容量较小,所以应采用抽签法,过程如下:
第一步:将36人随机编号,号码为1,2,3,…,36;
第二步:将号码分别写在相同的纸片上,揉成团,制成号签;
第三步:将号签放入一个不透明的容器中,充分搅匀,依次抽取2个号码,并记录上面的编号;
第四步:把与号码相对应的人抽出,即可得到所要的样本.
【补偿训练】
某单位有2
000名职工,老年、中年、青年分布在管理、研发、营销、生产各部门中,如表所示:
职工
管理
研发
营销
生产
小计
老年
40
40
40
80
200
中年
80
120
160
240
600
青年
40
160
280
720
1
200
小计
160
320
480
1
040
2
000
(1)若要抽取40人调查身体情况,则应该怎样抽样?
(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?
(3)若要抽20人调查员工对2020年颁发的《民法典》的了解,则应怎样抽样?
【解析】(1)因为身体状况主要与年龄段有关,所以应按老年、中年、青年分层,采用分层抽样法进行抽样,要抽取40人,应在老年、中年、青年职工中分别随机抽取4,12,24人.
(2)因为出席这样的座谈会的人员应该代表各个部门,所以应按部门分层,采用分层抽样的方法进行抽样,要抽取25人,应在管理、研发、营销、生产各部门的职工中分别随机抽取2,4,6,13人.
(3)员工对2020年颁发的《民法典》的了解与年龄、部门关系不大,总体中的个体数较多,可以用系统抽样进行调查.
PAGE用样本的频率分布估计总体分布
                
(15分钟 30分)
1.将容量为100的样本数据,按由小到大排列分成8个小组,如表所示:
组号
1
2
3
4
5
6
7
8
频数
10
13
14
14
15
13
12
9
第3组的频率和累积频率为
(  )
A.0.14和0.37
B.和
C.0.03和0.06
D.和
【解析】选A.由表可知,第三小组的频率为=0.14,累积频率为=0.37.
2.2020年初新冠肺炎席卷全球,某地教育网开通了网上教学,某校高一年级(8)班班主任为了了解学生上网学习时间,对本班40名学生某天上网学习时间进行了调查,将数据(取整数)整理后,绘制出如图所示频率分布直方图,已知从左到右各个小组的频率分别是0.15,0.25,0.35,0.20,0.05,则根据直方图所提供的信息,这一天上网学习时间在100~119分钟之间的学生人数是______人,如果只用这40名学生这一天上网学习时间作为样本去推断该校高一年级全体学生该天的上网学习时间,这样推断是否合理?______.(填“合理”或“不合理”)?
【解析】频数=样本容量×频率=40×0.35=14(人),因为该样本的选取只在高一(8)班,不具有代表性,所以这样推断不合理.
答案:14 不合理
3.从甲、乙两个班中各随机选出15名同学进行随堂测验,成绩的茎叶图如图所示,则甲、乙两组的最高成绩分别是______,______,从图中看,______班的平均成绩较高.?
【解析】由茎叶图可知,甲班的最高分是96,乙班的最高分是92.甲班的成绩集中在60~80之间,乙班成绩集中在70~90之间,故乙班的平均成绩较高.
答案:96 92 乙
4.如图所示是某公司(共有员工300人)2019年员工年薪情况的频率分布直方图,由此可知,员工中年薪在10万元~12万元之间的共有______人.?
【解析】由所给图形,可知员工中年薪在10万元~12万元之间的频率为1-(0.02+0.08+0.08+0.10+0.10)×2=0.24,所以员工中年薪在10万元~12万元之间的共有300×0.24=72(人).
答案:72
5.如图所示是总体的一个样本频率分布直方图,且在[15,18)内的频数为8.
(1)求样本在[15,18)内的频率;
(2)求样本容量;
(3)若在[12,15)内的小矩形面积为0.06,求在[18,33)内的频数.
【解析】由样本频率分布直方图可知组距为3.
(1)由样本频率分布直方图得样本在[15,18)内的频率为×3=.
(2)因为样本在[15,18)内的频数为8,由(1)可知,样本容量为=8×=50.
(3)因为在[12,15)内的小矩形面积为0.06,故样本在[12,15)内的频率为0.06,故样本在[15,33)内的频数为50×(1-0.06)=47,又在[15,18)内的频数为8,故在[18,33)内的频数为47-8=39.
                
(20分钟 35分)
一、选择题(每小题5分,共15分)
1.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速在[50,60)内的汽车有
(  )
A.30辆
B.40辆
C.60辆
D.80辆
【解析】选B.因为小长方形的面积即为对应的频率,所以时速在[50,60)内的频率为0.2,所以200×0.2=40(辆).
2.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为
(  )
A.100,20
B.200,20
C.200,10
D.100,10
【解析】选B.由题图甲可知学生总人数是10
000,样本容量为10
000×2%=200,抽取的高中生人数是2
000×2%=40,由题图乙可知高中生的近视率为50%,所以高中生的近视人数为40×50%=20.
3.某校举行演讲比赛,9位评委给选手A打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若统计员计算无误,则数字x应该是
(  )
A.5
B.4
C.3
D.2
【解析】选D.去掉最低分87,
去掉最高分94(假设x≤4),
则7×91=80×2+9+8+90×5+2+3+2+1+x,
所以x=2,符合题意.
同理可验证x>4不合题意.
二、填空题(每小题5分,共10分)
4.2020年为了解某校教师在疫情期间使用QQ进行教学的情况,采用简单随机抽样的方法,从该校200名教师中抽取20名,调查了他们上学期使用QQ进行教学的次数,结果用茎叶图表示,如图:
据此可估计该校上学期200名教师中,使用QQ进行教学次数在[15,25)内的人数为______.?
【解析】在抽取的20名教师中,在[15,25)内的人数为6,据此可估计该校上学期200名教师中,使用QQ进行教学的次数在[15,25)内的人数为60.
答案:60
5.为了解某地居民的月收入情况,一个社会调查机构调查了20
000人,并根据所得数据画出样本的频率分布直方图如图所示(最后一组包含两端值,其他组包含最小值,不包含最大值).现按月收入分层,用分层抽样的方法在这20
000人中抽出200人进一步调查,则月收入在[1
500,2
000)(单位:元)内的应抽取______人.?
【解析】月收入在[1
500,2
000)的频率为1-(0.000
2+0.000
5×2+0.000
3+
0.000
1)×500=0.2,故应抽取200×0.2=40(人).
答案:40
【补偿训练】
某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:
品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454
品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430
(1)画出两组数据的茎叶图.
(2)用茎叶图处理现有的数据,有什么优点?
(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
【解析】(1)茎叶图如图所示:
(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.
(3)通过观察茎叶图可以看出:①品种A的亩产量比品种B高;②品种A的亩产量比较分散,故品种A的亩产量稳定性较差.
三、解答题
6.(10分)为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
【解析】(1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为=0.08.
又因为第二小组的频率=,
所以样本容量===150.
(2)由直方图可估计该校高一年级学生的达标率为×100%=88%.
1.如图是根据某中学为地震灾区捐款的情况而制作的统计图.已知该校在校学生3
000人,根据统计图计算该校共捐款_____元.?
【解析】根据统计图,得高一人数为3
000×32%=960,
捐款960×15=14
400(元);
高二人数为3
000×33%=990,
捐款990×13=12
870(元);
高三人数为3
000×35%=1
050,
捐款1
050×10=10
500(元).
所以该校学生共捐款14
400+12
870+10
500=37
770(元).
答案:37
770
2.某高校在2019年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下:
组号
分组
频数
频率
第1组
[160,165)
5
0.05
第2组
[165,170)

0.35
第3组
[170,175)
30

第4组
[175,180)
20
0.20
第5组
[180,185]
10
0.10
合计
100
1.00
(1)请先求出频率分布表中①②处应填写的数据,并完成如图所示的频率分布直方图:
(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3,4,5组中用分层抽样的方法抽取6名学生进入第二轮面试,求第3,4,5组每组各应抽取多少名学生进入第二轮面试.
【解析】(1)由题意可知,第2组的频数为0.35×100=35,第3组的频率为=0.30,故①处填35,②处填0.30.频率分布直方图如图所示.
(2)因为第3,4,5组共有60名学生,所以利用分层抽样在60名学生中抽取6名学生,抽样比为=,故第3组应抽取30×=3(名)学生,第4组应抽取20×=2(名)学生,第5组应抽取10×=1(名)学生,
所以第3,4,5组应抽取的学生人数分别为3,2,1.
PAGE用样本的数字特征估计总体的数字特征
                
(20分钟 35分)
1.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是
(  )
A.85,85,85
B.87,85,86
C.87,85,85
D.87,85,90
【解析】选C.从小到大列出所有数学成绩:75,80,85,85,85,85,90,90,95,100,观察知众数和中位数均为85,计算得平均数为87.
2.(2020·天津高考)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为
(  )
A.10
B.18
C.20
D.36
【解题指南】根据直方图确定直径落在区间[5.43,5.47)内的零件频率,然后结合样本总数计算其个数即可.
【解析】选B.根据直方图,直径落在区间[5.43,5.47)内的零件频率为:(6.25+5.00)×0.02=0.225,则区间[5.43,5.47)内零件的个数为:80×0.225=18.
3.已知一组数据x1,x2,x3,x4,x5的平均数是=2,方差是,那么另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数和方差分别为
(  )
A.2,
B.2,1
C.4,
D.4,3
【解析】选D.平均数为′=3-2=3×2-2=4,方差为s′2=9s2=9×=3.
4.如图是七位评委为某跳水运动员打出的分数的茎叶图,则这组分数的中位数和众数分别是______.?
【解析】把七位评委打出的分数按从小到大的顺序排列为:79,84,84,84,86,87,93,可知众数是84,中位数是84.
答案:84,84
5.已知方差s2=(++…+)-
2,由这个公式计算:若10个数的平均数是3,标准差是2,则方差是______,这10个数据的平方和是______.?
【解析】由方差的算术平方根是标准差知,s2=22=4,
故4=(++…+)-9,
所以++…+=130.
答案:4 130
6.在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
成绩/m
1.50
1.60
1.65
1.70
1.75
1.80
1.85
1.90
人数
2
3
2
3
4
1
1
1
分别求这些运动员成绩的众数、中位数与平均数.
【解析】在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;这组数据的平均数是=(1.50×2+1.60×3+…+1.90×1)=≈1.69(m).
故17名运动员成绩的众数、中位数、平均数依次为1.75
m,1.70
m,1.69
m.
                
(30分钟 60分)
一、选择题(每小题5分,共25分)
1.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则
(  )
A.甲成绩的平均数小于乙成绩的平均数
B.甲成绩的中位数等于乙成绩的中位数
C.甲成绩的方差小于乙成绩的方差
D.甲成绩的极差小于乙成绩的极差
【解析】选C.由图知=6,=6,=2,=2.4.
2.(2020·全国Ⅲ卷)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为
(  )
A.0.01
B.0.1
C.1
D.10
【解析】选C.因为数据axi+b(i=1,2,…,n)的方差是数据xi(i=1,2,…,n)的方差的a2倍,所以所求数据方差为102×0.01=1.
3.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为和,样本标准差分别为sA和sB,则
(  )
A.>,sA>sB
B.<,sA>sB
C.>,sAD.<,sA【解析】选B.由图易得<,又A波动性大,B波动性小,所以sA>sB.
4.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为m0,平均值为,则
(  )
A.me=m0=
B.me=m0<
C.meD.m0【解析】选D.由题目所给的统计图可知,30个数据按大小顺序排列好后,中间两个数为5,6,
故中位数为me==5.5.
又众数为m0=5,
平均值=(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)=.
所以m05.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登错了,甲实得80分,却记了50分,乙得70分却记了100分,更正后平均分和方差分别是
(  )
A.70,75
B.70,50
C.75,1.04
D.65,2.35
【解析】选B.因甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为s2,则由题意可得:
s2=[(x1-70)2+(x2-70)2+…+(80-70)2+(70-70)2+…+(x48-70)2],
而更正前有:75=[(x1-70)2+(x2-70)2+…+(50-70)2+(100-70)2+…+(x48-70)2],
化简整理得s2=50.
二、填空题(每小题5分,共15分)
6.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则
(1)这20名工人中一天生产该产品数量在[55,75)的人数是______.?
(2)这20名工人中一天生产该产品数量的中位数为______.?
(3)这20名工人中一天生产该产品数量的平均数为______.?
【解析】(1)(0.040×10+0.025×10)×20=13.
(2)设中位数为x,则0.2+(x-55)×0.04=0.5,x=62.5.
(3)0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64.
答案:(1)13 (2)62.5 (3)64
7.世界那么大,我想去看看,每年高考结束后,处于休养状态的高中毕业生旅游动机强烈,旅游可支配收入日益增多,可见高中毕业生旅游是一个巨大的市场.为了解高中毕业生每年旅游消费支出(单位:百元)的情况,相关部门随机抽取了某市的1
000名毕业生进行问卷调查,并把所得数据列成如下所示的频数分布表:
组别
[0,20)
[20,40)
[40,60)
[60,80)
[80,100]
频数
2
250
450
290
8
则所得样本的中位数是______(精确到百元).?
【解析】设样本的中位数为x,
则++·=0.5,
解得x≈51,
所得样本中位数为51(百元).
答案:51
8.已知样本9,10,11,x,y的平均数是10,标准差是,则xy=______.?
【解析】由平均数得9+10+11+x+y=50,
所以x+y=20,又由(9-10)2+(10-10)2+(11-10)2+(x-10)2+(y-10)2=()2×5=10,
得x2+y2-20(x+y)=-192,
(x+y)2-2xy-20(x+y)=-192,xy=96.
答案:96
三、解答题(每小题10分,共20分)
9.已知一组数据:
125 121 123 125 127 129 125 128 130 129
126 124 125 127 126 122 124 125 126 128
(1)填写下面的频率分布表:
分组
频数累计
频数
频率
[120.5,122.5)
[122.5,124.5)
[124.5,126.5)
[126.5,128.5)
[128.5,130.5]
合计
(2)作出频率分布直方图.
(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数.
【解析】(1)
分组
频数累计
频数
频率
[120.5,122.5)
2
0.1
[122.5,124.5)
3
0.15
[124.5,126.5)

8
0.4
[126.5,128.5)
4
0.2
[128.5,130.5]
3
0.15
合计
20
1
(2)
(3)在[124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5,事实上,众数的精确值为125.图中虚线对应的数据是124.5+2×=125.75,事实上中位数为125.5.使用“组中值”求平均数:x=121.5×0.1+123.5×0.15+125.5×0.4+127.5×0.2+129.5×0.15=125.8,事实上平均数的精确值为x=125.75.
10.若甲、乙两人数学成绩的茎叶图如图所示:
(1)求出这两名同学的数学成绩的平均数、标准差.
(2)比较两名同学的成绩,谈谈你的看法.
【解析】(1)=(65+70+80+86+89+95+91+94+107+113)=89.
=[(65-89)2+(70-89)2+(80-89)2+(86-89)2+(89-89)2+(95-89)2+(91-89)2+(94-89)2+(107-89)2+(113-89)2]=199.2,
所以s甲≈14.1.
=(79+86+83+88+93+99+98+98+102+114)=94.
=[(79-94)2+(86-94)2+(83-94)2+(88-94)2+(93-94)2+(99-94)2+(98-94)2+(98-94)2+(102-94)2+(114-94)2]=96.8.
所以s乙≈9.8.
(2)由(1)知<且s甲>s乙.
所以乙同学的平均成绩较高且标准差较小,说明乙同学的数学成绩好,且很稳定,故甲同学的数学学习状况不如乙同学的数学学习状况.
1.(2020·全国Ⅲ卷)在一组样本数据中,1,2,3,4出现的频率分别为p1,p2,p3,p4,且pi=1,则下面四种情形中,对应样本的标准差最大的一组是(  )
A.p1=p4=0.1,p2=p3=0.4
B.p1=p4=0.4,p2=p3=0.1
C.p1=p4=0.2,p2=p3=0.3
D.p1=p4=0.3,p2=p3=0.2
【解析】选B.选项A:E(X)=1×0.1+2×0.4+3×0.4+4×0.1=2.5.
所以D(X)=(1-2.5)2×0.1+(2-2.5)2×0.4+(3-2.5)2×0.4+(4-2.5)2×0.1=0.65.
同理选项B:E(X)=2.5,D(X)=1.85;
选项C:E(X)=2.5,D(X)=1.05;
选项D:E(X)=2.5,D(X)=1.45.
2.某校甲班、乙班各有49名学生,两班在一次数学测验中的成绩(满分100分)统计如表:
班级
平均分
众数
中位数
标准差
甲班
79
70
87
19.8
乙班
79
70
79
5.2
(1)请你对下面的一段话给予简要分析:
甲班的小刚回家对妈妈说:“昨天的数学测验,全班平均79分,得70分的人最多,我得了85分,在班里算是上游了!”
(2)请你根据表中数据,对这两个班的测验情况进行简要分析,并提出教学建议.
【解析】(1)由中位数可知,85分排在第25名之后,从名次上讲,85分不算是上游,但也不能单以名次来判断学习成绩的好坏,小刚得了85分,说明他对这阶段的学习内容掌握较好.
(2)甲班学生成绩的中位数为87分,说明高于或等于87分的学生占一半以上,而平均分为79分,标准差很大,说明低分也多,两极分化严重,建议对学习有困难的同学多给一些帮助;
乙班学生成绩的中位数和平均分均为79分,标准差小,说明学生成绩之间差别较小,成绩很差的学生少,但成绩优异的学生也很少,建议采取措施提高优秀率.
PAGE变量之间的相关关系 两个变量的线性相关
                
(20分钟 35分)
1.某公司2011~2016年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如表所示:
年份
2011
2012
2013
2014
2015
2016
利润x
12.2
14.6
16
18
20.4
22.3
支出y
0.62
0.74
0.81
0.89
1
1.11
A.利润中位数是16,x与y有正线性相关关系
B.利润中位数是18,x与y有负线性相关关系
C.利润中位数是17,x与y有正线性相关关系
D.利润中位数是17,x与y有负线性相关关系
【解析】选C.由表知,利润中位数是(16+18)=17,且y随x的增大而增大.
2.已知x,y的取值如表所示,若y与x线性相关,则线性回归方程为=x+6,则的值为
(  )
x
1
2
3
y
6
4
5
A.
B.
C.-
D.-
【解析】选D.因为==2,==5,
故5=×2+6,所以=-.
3.为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为=x+,已知xi=225,yi=1
600,=4.该班某学生的脚长为24厘米,据此估计其身高为
(  )
A.160厘米
B.163厘米
C.166厘米
D.170厘米
【解析】选C.由题意可知=4x+,
又=22.5,=160,因此160=22.5×4+,
解得=70,
所以=4x+70.
当x=24时,=4×24+70=166厘米.
4.下列各组变量中是函数关系的有______;是相关关系的有______;没有关系的是______.(填序号)?
①电压U与电流I;②自由落体运动中位移s与时间t;③粮食产量与施肥量;④人的身高与体重;⑤广告费支出与商品销售额;⑥地球运行的速度与某个人行走的速度.
答案:①② ③④⑤ ⑥
5.(2020·洛阳高一检测)在2019年3月15日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如表所示:
价格x
9
9.5
10
10.5
11
销售量y
11
10
8
6
5
由散点图可知,销售量y与价格x之间有较好的线性相关关系,其线性回归方程是:=-3.2x+(参考公式:回归方程=x+,=-),则=______.?
【解析】由数据表可知:==10;
==8,
所以=-=8-(-3.2)×10=40.
答案:40
6.下表数据是退水温度x(℃)对黄酮延长性y(%)效应的试验结果,y是以延长度计算的,且对于给定的x,y为正态变量,其方差与x无关.
x/℃
300
400
500
600
700
800
y/%
40
50
55
60
67
70
(1)画出散点图.
(2)指出x,y是否线性相关.
(3)若线性相关,求y关于x的线性回归方程;
(4)估计退水温度是1
000℃时,黄酮延长性的情况.
【解析】(1)散点图如图:
(2)由散点图可以看出样本点分布在一条直线的附近,可见y与x线性相关.
(3)列出下表并用科学计算器进行有关计算.
i
1
2
3
4
5
6
xi
300
400
500
600
700
800
yi
40
50
55
60
67
70
xiyi
12
000
20
000
27
500
36
000
46
900
56
000
90
000
160
000
250
000
360
000
490
000
640
000
=550,=57=1
990
000,xiyi=198
400
于是可得
b=
=≈0.058
86,
a=-b≈57-0.058
86×550=24.627.
因此所求的线性回归方程为
=0.058
86x+24.627.
(4)将x=1
000代入线性回归方程得
=0.058
86×1
000+24.627=83.487,
即退水温度是1
000℃时,黄酮延长性大约是83.487%.
                
(30分钟 60分)
一、选择题(每小题5分,共25分)
1.某产品在某零售摊位的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如表所示:
x
16
17
18
19
y
50
34
41
31
由上表可得线性回归方程=x+中的=-4,据此模型预测零售价为15元时,每天的销售量为
(  )
A.51个
B.50个
C.49个
D.48个
【解析】选C.由题意知=17.5,=39,代入线性回归方程得=109,109-15×4=49.
2.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是
(  )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1
cm,则其体重约增加0.85
kg
D.若该大学某女生身高为170
cm,则可断定其体重必为58.79
kg
【解析】选D.为正数,所以两变量具有正的线性相关关系,故A正确;B,C显然正确;若该大学某女生身高为170
cm,则可估计其体重为58.79
kg.
3.根据如下样本数据:
x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
得到的回归方程为=x+,则
(  )
A.>0,>0
B.>0,<0
C.<0,>0
D.<0,<0
【解析】选B.作出散点图如图:
观察图象可知,回归直线=x+的斜率<0,当x=0时,=>0.故>0,<0.
4.已知变量x和y满足关系式y=-0.1x+1,变量y与z正相关,下列结论中正确的是
(  )
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
【解析】选C.因为变量x和y满足关系式y=-0.1x+1,一次项系数-0.1<0,所以x与y负相关;变量y与z正相关,设y=kz(k>0),所以kz=-0.1x+1,得到z=-x+,一次项系数小于0,所以z与x负相关.
5.已知x与y之间的几组数据如表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归方程为=x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是
(  )
A.>b′,>a′
B.>b′,C.a′
D.【解析】选C.由(1,0),(2,2)求b′,a′.
b′==2,a′=0-2×1=-2.
求,时,xiyi=0+4+3+12+15+24=58,
=,=,=1+4+9+16+25+36=91,
所以==,
=-×=-=-,所以a′.
二、填空题(每小题5分,共15分)
6.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x/万元
4
2
3
5
销售额y/万元
49
26
39
54
根据上表可得回归方程=bx+a中的b为9.4,据此模型预报广告费用为6万元时,销售额为______.?
【解析】=(4+2+3+5)=3.5,
=(49+26+39+54)=42,
所以a=-b=42-9.4×3.5=9.1,
所以回归方程为=9.4x+9.1,
令x=6,得=9.4×6+9.1=65.5(万元).
答案:65.5万元
7.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y对总成绩x的回归直线方程为=6+0.4x.由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差______分.?
【解析】令两人的总成绩分别为x1,x2.
则对应的数学成绩估计为1=6+0.4x1,2=6+0.4x2,
所以|1-2|=|0.4(x1-x2)|=0.4×50=20.
答案:20
8.某考察团对全国10个城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程=0.66x+1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费占人均工资收入的百分比约为______.?
【解析】由=0.66x+1.562知,当y=7.675时,x=,所以所求百分比为=≈83%.
答案:83%
三、解答题(每小题10分,共20分)
9.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得xi=80,yi=20,xiyi=184,=720.
(1)求月储蓄y(千元)关于月收入x(千元)的线性回归方程.
(2)若该居民区某家庭的月收入为7千元,预测该家庭的月储蓄为多少元?
【解析】(1)由题意知n=10,=xi=×80=8,
=yi=×20=2,
又-n=720-10×82=80,
xiyi-n
=184-10×8×2=24,
由此得==0.3,=-=2-0.3×8=-0.4,
故所求线性回归方程为=0.3x-0.4.
(2)将x=7代入线性回归方程,可以得到该家庭的月储蓄约为=0.3×7-0.4=1.7(千元).
10.一台机器由于使用时间较长,生产的零件有一些会有缺损,按不同转速生产出来的零件有缺损的统计数据如表所示.
转速x/(转/秒)
16
14
12
8
每小时生产缺损零件数y/个
11
9
8
5
(1)作出散点图;
(2)如果y与x成线性相关关系,求出回归方程;
(3)若实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么,机器的运转速度应控制在什么范围?
【解析】(1)根据表中的数据画出散点图如图所示.
(2)设回归方程为:=x+并列表如下:
i
1
2
3
4
xi
16
14
12
8
yi
11
9
8
5
xiyi
176
126
96
40
=12.5,=8.25,=660,xiyi=438.
所以=≈0.73,
=8.25-0.73×12.5≈-0.88,
所以=0.73x-0.88.
(3)令0.73x-0.88≤10,解得x≤14.9≈15.
故机器的运转速度应控制在15转/秒内.
1.在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,其观测结果如下:
温度x/℃
0
10
20
50
70
溶解度y/g
66.7
76.0
85.0
112.3
128.0
则由此得到回归直线的斜率约为__________.(精确到0.01)
(  )?
A.0.22
B.0.44
C.0.66
D.0.88
【解析】选D.=30,=93.6,=7
900,
xiyi=17
035,所以回归直线的斜率==≈0.88.
2.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x/元
8
8.2
8.4
8.6
8.8
9
销售量y/件
90
84
83
80
75
68
(1)求回归直线方程=x+,其中=-20,=-;
(2)预计在今后的销售中,销售量与单价仍然服从(1)中的关系,并且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应为多少元?(利润=销售收入-成本)
【解析】(1)由于=(8+8.2+8.4+8.6+8.8+9)=8.5,
=(90+84+83+80+75+68)=80,又=-20,
所以=-=80+20×8.5=250,从而回归直线方程为=-20x+250.
(2)设工厂获得的利润为L元,依题意,得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1
000
=-20(x-8.25)2+361.25.
当且仅当x=8.25时,L取得最大值.
故当单价定为8.25元时,工厂可获得最大利润.
PAGE