2018_2019学年高中数学第二章统计检测(打包6套)新人教A版必修3

文档属性

名称 2018_2019学年高中数学第二章统计检测(打包6套)新人教A版必修3
格式 zip
文件大小 747.1KB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2018-10-12 08:01:02

文档简介

2.1.1 简单随机抽样
A级 基础巩固
一、选择题
1.下面抽样方法是简单随机抽样的是(  )
A.从平面直角坐标系中抽取5个点作为样本
B.可口可乐公司从仓库中的1 000箱可乐中一次性抽取20箱进行质量检查
C.某连队从200名战士中,挑选出50名最优秀的战士去参加抢险救灾活动
D.从10个手机中逐个不放回地随机抽取2个进行质量检验(假设10个手机已编好号,对编号随机抽取)
解析:A中平面直角坐标系中有无数个点,这与要求总体中的个体数有限不相符,故错误;B中一次性抽取不符合简单随机抽样逐个抽取的特点,故错误;C中50名战士是最优秀的,不符合简单随机抽样的等可能性,故错误.
答案:D
2.为了了解全校240名高一学生的身高情况,从中抽取40名学生进行测量.下列说法正确的是(  )
A.总体是240名   B.个体是每一个学生
C.样本是40名学生 D.样本容量是40
解析:在这个问题中,总体是240名学生的身高,个体是每个学生的身高,样本是40名学生的身高,样本容量是40.
答案:D
3.从某批零件中抽取50个,然后再从50个中抽出40个进行合格检查,发现合格品有36个,则该批产品的合格率为(  )
A.36% B.72%
C.90% D.25%
解析:×100%=90%.
答案:C
4.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性,“第二次被抽到”的可能性分别是(  )
A., B.,
C., D.,
解析:根据简单随机抽样的定义知个体a两次被抽到的可能性相等,均为.
答案:A
5.某工厂的质检人员对生产的100件产品采用随机数表法抽取10件检查,对100件产品采用下面的编号方法:①01,02,03,…,100;②001,002,003,…,100;③00,01,02,…,99.其中正确的序号是(  )
A.①② B.①③
C.②③ D.③
解析:根据随机数表法的要求,只有编号数字位数相同,才能达到随机等可能抽样.
答案:C
二、填空题
6.用抽签法进行抽样有以下几个步骤:①制签;②抽签;③将签摇匀;④编号;⑤将抽取的号码对应的个体取出,组成样本.这些步骤的正确顺序为________.
解析:由抽签法的步骤知,正确顺序为④①③②⑤.
答案:④①③②⑤
7.齐鲁风采“七乐彩”的中奖号码是从分别标有1,2,…,30的30个小球中逐个不放回地摇出7个小球来按规则确定中奖情况,这种从30个号码中选7个号码的抽样方法是________.
解析:30个小球相当于号签,搅拌均匀后逐个不放回地抽取,是典型的抽签法.
答案:抽签法
8.已知下列抽取样本的方式:
①从无限多个个体中抽取100个个体作为样本;
②盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出1个零件进行质量检验后再把它放回盒子里;
③从20件玩具中一次性抽取3件进行质量检验;
④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
其中,不是简单随机抽样的是________(填序号).
解析:①不是简单随机抽样,因为被抽取的总体的个体数是无限的,而不是有限的;②不是简单随机抽样,因为它是放回抽样;③不是简单随机抽样,因为这是“一次性”抽取,而不是“逐个”抽取;④不是简单随机抽样,因为指定个子最高的5名同学是56名同学中特指的,不存在随机性,不是等可能抽样.
答案:①②③④
三、解答题
9.某卫生单位为了支援抗震救灾,要在18名志愿者中选取6人组成医疗小组去参加救治工作,请用抽签法设计抽样方案.
解:方案如下:
第一步,将18名志愿者编号,号码为01,02,03,…,18.
第二步,将号码分别写在相同的纸条上,揉成团,制成号签.
第三步,将得到的号签放到一个不透明的盒子中,充分搅匀.
第四步,从盒子中依次取出6个号签,并记录上面的编号.
第五步,与所得号码对应的志愿者就是医疗小组成员.
10.现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检验.如何用随机数表法设计抽样方案?
解:第一步,将元件的编号调整为010,011,012,…,099,100,…,600.
第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第6行第7个数9.
第三步,从数9开始,向右读,每次读取三位,凡不在010~600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到544,354,378,520,384,263.
第四步,与以上这6个号码对应的6个元件就是所要抽取的样本.
B级 能力提升
1.(2015·湖北卷)我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为(  )
A.134石 B.169石
C.338石 D.1 365石
解析:254粒和1 534石中夹谷的百分比含量是大致相同的,可据此估计这批米内夹谷的数量.
设1 534石米内夹谷x石,则由题意知=,解得x≈169.故这批米内夹谷约为169石.
答案:B
2.某中学高一年级有400人,高二年级有320人,高三年级有280人,若每人被抽到的可能性为20%,用随机数法在该中学抽取容量为n的样本,则n等于________.
解析:由=20%,解得n=200.
答案:200
3.某电视台举行颁奖典礼,邀请20名港台、内地艺人演出,其中从30名内地艺人中随机选出10人,从18名香港艺人中随机挑选6人,从10名台湾艺人中随机挑选4人.试用抽签法确定选中的艺人,并确定他们的表演顺序.
解:第一步:先确定艺人:(1)将30名内地艺人从01~30编号,然后用相同的纸条做成30个号签,在每个号签上写上这些编号,然后放入一个不透明小筒中摇匀,从中抽出10个号签,则相应编号的艺人参加演出;(2)运用相同的办法分别从10名台湾艺人中抽取4人,从18名香港艺人中抽取6人.
第二步:确定演出顺序:确定了演出人员后,再用相同的纸条做成20个号签,上面写上1~20这20个数字,代表演出的顺序,让每个演员抽一张,每人抽到的号签上的数字就是这位演员的演出顺序,再汇总即可.
2.1.2 系统抽样
A级 基础巩固
一、选择题
1.下列说法错误的个数是(  )
①总体的个体数不多时宜用简单随机抽样法;
②系统抽样中在总体均分后的每一部分进行抽样时,采用的是简单随机抽样;
③百货商场的抽奖活动是抽签法;
④整个系统抽样过程中,每个个体被抽取的机会相等.
A.1    B.2    C.3    D.4
答案:A
2.为了了解参加某次知识竞赛的1 252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么从总体中应随机剔除的个体数目为(  )
A.2 B.3 C.4 D.5
解析:因为1 252=50×25+2,所以应随机剔除2个个体.
答案:A
3.从2 004名学生中选取50名组成参观团,若采用下面的方法选取:先用简单随机抽样从2 004人中剔除4人,剩下的2 000人再按系统抽样的方法进行,则每人入选的概率(  )
A.不全相等 B.均不相等
C.都相等,且为 D.都相等,且为
答案:C
4.要从已编号(1~50)的50枚最新研制的某型号导弹中,随机抽取5枚来进行发射试验,用系统抽样方法确定所选取的5枚导弹的编号可能是(  )
A.5,10,15,20,25 B.3,13,23,33,43
C.1,2,3,4,5 D.2,4,8,16,32
解析:间隔应为=10.
答案:B
5.从2 015名学生中选50人组成参观团,先用简单随机抽样方法剔除15人,再将其余2 000人从0到1 999编号,按系统抽样方法选取,若第一组采用抽签法抽到的号码是30,则最后一组人选的号码是(  )
A.1 990 B.1 991
C.1 989 D.1 988
解析:样本间隔为2 000÷50=40,若第一组采用抽签法抽到的号码是30,则最后一组入选的号码是30+49×40=1 990.
答案:A
二、填空题
6.一个总体中有100个个体,随机编号为00,01,02,…,99,依编号顺序平均分成10个小组,组号依次为1,2,…,10.现用系统抽样的方法抽取一个容量为10的样本,规定如果在第1组中随机抽取的号码为m,那么在第k(k≥2)组中抽取的号码个位数字与k+m的个位数字相同.若m=6,则在第7组中抽取的号码是________.
答案:63
7.采用系统抽样从含有8 000个个体的总体(编号为0000,0001,…,7999)中抽取一个容量为50的样本,则最后一段的编号为________,已知最后一个入样编号是7894,则开头5个入样编号是__________________.
解析:因为8 000÷50=160,所以最后一段的编号为最后160个编号.
从7840到7999共160个编号,从7840到7894共55个数,所以从0000起第55个编号应为0054,然后逐个加上160得,0214,0374,0534,0694.
答案:7840~7999 0054,0214,0374,0534,0694
8.用系统抽样法(按等距离的规则)从160名学生中抽取容量为20的样本,将这160名学生从1到160编号.按编号顺序平均分成20段(1~8号,9~16号,…,153~160号),若第16段应抽出的号码为125,则第1段中用简单随机抽样确定的号码是________.
解析:用系统抽样知,每段中有8人,第16段应为从121到128这8个号码,125是其中的第5个号码,所以第一段中被确定的号码是5.
答案:5
三、解答题
9.某校高中三年级的295名学生已经编号为1,2,…,295,为了了解学生的学习情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.
解:按照1∶5的比例,应该抽取的样本容量为295÷5=59,我们把295名学生分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,第59组是编号为291~295的5名学生.采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k≤5),那么抽取的学生编号为k+5l(l=0,1,2,3…,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,…,288,293.
10.某单位在职职工共624人,为了调查职工用于上班途中的时间,决定抽取10%的职工进行调查,试采用系统抽样方法抽取所需的样本.
解:(1)将624名职工编号,从001至624.
(2)从总体中用随机数法剔除4人,将剩下的620名职工重新编号,从000至619.
(3)分段,取间隔k==10,将总体均分为62组,每组含10名职工.
(4)在第一段000到009这十个编号中用简单随机抽样确定起始号码l.
(5)将为l,l+10,l+20,…,l+610的个体抽出,组成样本.
[B级 能力提升]
1.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为(  )
A.26,16,8 B.25,17,8
C.25,16,9 D.24,17,9
解析:由题意知间隔为=12,故抽到的号码为12k+3(k=0,1,…,49),列出不等式可解得:第Ⅰ营区抽25人,第Ⅱ营区抽17人,第Ⅲ营区抽8人.
答案:B
2.某学校有30个班级,每班50名学生,上级要到学校进行体育达标验收.需要抽取10%的学生进行体育项目的测验.如果按学号用系统抽样法抽取,则只需要在第一个班前________名中随机抽取一名,其他人选就随之确定.
解析:该校共有1 500名学生,需抽取容量为1 500×10%=150的样本.抽样的实施步骤:
可将每个班的学生按学号分成5段,每段10名学生.用简单随机抽样的方法在1~10中抽取一个起始号码l,则每个班的l,10+l,20+l,30+l,40+l(如果l=6,即6,16,26,36,46)号学生入样,即组成一个容量为150的样本.
答案:10
3.一个总体中的1 000个个体编号为0,1,2,…,999,并依次将其分为10个小组,组号为0,1,2,…,9.要用系统抽样方法抽取一个容量为10的样本,规定如果在第0组随机抽取的号码为x,那么依次错位地得到后面各组的号码,即第k组抽取的号码的后两位数是x+33k的后两位数.
(1)当x=24时,写出所抽样本的10个号码;
(2)若所抽取样本的10个号码中有一个的后两位是87,求x的取值范围.
解:(1)由题意知此系统抽样的间隔是100,第1组后两位数是24+33=57,所以第1组号码为157;k=2,24+66=90,所以第2组号码为290,以此类推,10个号码为:24,157,290,323,456,589,622,755,888,921.
(2)当k=0,1,2,…,9时,33k的值依次为:0,33,66,99,132,165,198,231,264,297.又抽取的10个号码中有一个的后两位数是87,从而x可以是87,54,21,88,55,22,89,56,23,90.
所以x的取值范围是{21,22,23,54,55,56,87,88,89,90}.
2.1.3 分层抽样
A级 基础巩固
一、选择题
1.某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是(  )
A.抽签法      B.随机数法
C.系统抽样法 D.分层抽样法
解析:总体(500名学生)中的个体(男、女学生)有明显差异,应采用分层抽样法.
答案:D
2.下列实验中最适合用分层抽样法抽样的是(  )
A.从一箱3 000个零件中抽取5个入样
B.从一箱3 000个零件中抽取600个入样
C.从一箱30个零件中抽取5个入样
D.从甲厂生产的100个零件和乙厂生产的200个零件中抽取6个入样
解析:D中总体有明显差异,故用分层抽样.
答案:D
3.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上(包括50岁)的人,用分层抽样的方法从中抽20人,各年龄段分别抽取的人数为(  )
A.7,5,8 B.9,5,6
C.7,5,9 D.8,5,7
解析:由于样本容量与总体个体数之比为=,故各年龄段抽取的人数依次为45×=9(人),25×=5(人),20-9-5=6(人).
答案:B
4.某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况,从他们中抽取容量为36的样本,最适合抽取样本的方法是(  )
A.简单随机抽样
B.系统抽样
C.先从中年人中剔除1人,再用分层抽样
D.先从老年人中剔除1人,再用分层抽样
解析:总人数为28+54+81=163.样本容量为36,由于总体由差异明显的三部分组成,考虑用分层抽样.若按36∶163取样,无法得到整解,故考虑先剔除1人,抽取比例变为36∶162=2∶9,则中年人取12人,青年人取18人,先从老年人中剔除1人,老年人取6人,组成36的样本.
答案:D
5.已知某单位有职工120人,其中男职工90人,现采用分层抽样的方法(按男、女分层)抽取一个样本,若已知样本中有27名男职工,则样本容量为(  )
A.30 B.36 C.40 D.无法确定
解析:分层抽样中抽样比一定相同,设样本容量为n,由题意得,=,解得n=36.
答案:B
二、填空题
6.(2015·福建卷)某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为______.
解析:设男生抽取x人,则有=,解得x=25.
答案:25
7.在抽样过程中,每次抽取的个体不再放回总体的为不放回抽样.那么分层抽样、系统抽样、简单随机抽样三种抽样中,为不放回抽样的有________个.
解析:这三种抽样都是不放回抽样.
答案:3
8.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.
解析:高二年级学生人数占总数的,样本容量为50,则50×=15.
答案:15
三、解答题
9.某网站针对“2016年法定节假日调休安排”提出的A,B,C三种放假方案进行了问卷调查,调查结果如下:
项目
支持A方案
支持B方案
支持C方案
35岁以下的人数
200
400
800
35岁以上
(含35岁)的人数
100
100
400
(1)从所有参与调查的人中,用分层抽样的方法抽取n人,已知从支持A方案的人中抽取了6人,求n的值;
(2)从支持B方案的人中,用分层抽样的方法抽取5人,这5人中在35岁以上(含35岁)的人数是多少?35岁以下的人数是多少?
解:(1)由题意得
=,
解得n=40.
(2)35岁以下的人数为×400=4,
35岁以上(含35岁)的人数为5-4=1.
10.某市化工厂三个车间共有工人1 000名,各车间男、女工人数见下表:
类别
第一车间
第二车间
第三车间
女工
173
100
y
男工
177
x
z
已知在全厂工人中随机抽取1名,抽到第二车间男工的可能性是0.15.
(1)求x的值;
(2)现用分层抽样的方法在全厂抽取50名工人,问应在第三车间抽取多少名?
解:(1)由=0.15,得x=150.
(2)因为第一车间的工人数是173+177=350,第二车间的工人数是100+150=250,
所以第三车间的工人数是1 000-350-250=400.
设应从第三车间抽取m名工人,则由=,
得m=20.
所以应在第三车间抽取20名工人.
B级 能力提升
1.某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为(  )
A.8 B.11 C.16 D.10
解析:若设高三学生数为x,则高一学生数为,高二学生数为+300,所以有x+++300=3 500,
解得x=1 600.故高一学生数为800,
因此应抽取高一学生数为=8.
答案:A
2.某企业3月中旬生产A、B、C三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:
产品类型
A
B
C
产品数量/件
1 300
样本容量
130
由于不小心,表格中A、C两种产品的有关数据已被污染看不清楚了,统计员只记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是________件.
解析:抽样比为130∶1 300=1∶10,又A产品的样本容量比C产品的样本容量多10,故C产品的数量是[(3 000-1 300)-100]×=800(件).
答案:800
3.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工只能参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%;登山组的职工占参加活动总人数的,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取容量为200的样本.试求:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
解:(1)设登山组人数为x,游泳组中青年人、中年人、老年人所占比例分别为a,b,c,则有=47.5%,=10%,解得b=50%,c=10%,故a=100%-50%-10%=40%,
即游泳组中,青年人、中年人、老年人各占比例分别为40%,50%,10%.
(2)游泳组中,抽取的青年人人数为200××40%=60;
抽取的中年人人数为200××50%=75;
抽取的老年人人数为200××10%=15.
即游泳组中,青年人、中年人、老年人分别应抽取的人数为60,75,15.
2.2.1 用样本的频率分布估计总体分布
A级 基础巩固
一、选择题
1.下列关于频率分布直方图的说法正确的是(  )
A.直方图的高表示取某数的频率
B.直方图的高表示该组上的个体在样本中出现的频率
C.直方图的高表示取某组上的个体在样本中出现的频数与组距的比值
D.直方图的高表示取该组上的个体在样本中出现的频率与组距的比值
答案:D
2.一个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为(  )
A.2      B.4      C.6      D.8
解析:频率=,则频数=频率×样本容量=0.125×32=4.
答案:B
3.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚.如图是某路段的一个检测点对300辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可得出将被处罚的汽车数为(  )
A.30辆 B.40辆 C.60辆 D.80辆
解析:车速大于或等于70 km/h的汽车数为0.02×10×300=60(辆).
答案:C
4.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩(单位:分)分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],加以统计后得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为(  )
A.588 B.480 C.450 D.120
解析:不少于60分的学生的频率为
(0.030+0.025+0.015+0.010)×10=0.8,
所以该模块测试成绩不少于60分的学生人数应为600×0.8=480.
答案:B
5.有一个容量为200的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为(  )
A.18 B.36 C.54 D.72
解析:设样本数据落在区间[10,12)内的频率为2x,则(0.02+0.05+x+0.15+0.19)×2=1,得x=0.09,所以样本数据落在区间[10,12)内的频数为0.09×2×200=36.
答案:B
二、填空题
6.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:
分组/分
频数
频率
[80,90)


[90,100)
0.050
[100,110)
0.200
[110,120)
36
0.300
[120,130)
0.275
[130,140)
12

[140,150]
0.050
合计

根据上面的频率分布表,可以①处的数值为________,②处的数值为________.
解析:由位于[110,120)的频数为36,频率==0.300,得样本容量n=120,
所以[130,140)的频率==0.1,
②处的数值=1-0.050-0.200-0.300-0.275-0.1-0.050=0.025;
①处的数值为0.025×120=3.
答案:3 0.025
7.(2015·湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.
解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,则运动员人数为4.
答案:4
8.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如下:
据此可估计该校上学期200名教师中,使用多媒体进行教学次数在[15,25)内的人数为________.
答案:60
三、解答题
9.某篮球运动员在2015赛季各场比赛得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50.制作茎叶图,并分析这个运动员的整体水平及发挥的稳定程度.
解:该运动员得分茎叶图如下:
从茎叶图中可以粗略地看出,该运动员得分大多能在20分到40分之间,且分布较为对称,集中程度高,说明其发挥比较稳定.
10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:
=0.08.
又因为第二小组的频率=,
所以样本容量===150.
(2)由题意估计该学校高一学生的达标率约为×100%=88%.
B级 能力提升
1.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(  )
A.6    B.8    C.12    D.18
解析:志愿者的总人数为=50,所以第三组的人数为50×0.36=18,有疗效的人数为18-6=12.
答案:C
2.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
解析:因为直方图中的各个矩形的面积之和为1,所以有10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.03.由直方图可知三个区域内的学生总数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为10,所以从身高在[140,150]内抽取的学生人数为×10=3.
答案:0.03 3
3.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8:00~10:00各自的点击量,得到如图所示的茎叶图,根据茎叶图回答下列问题.
(1)甲、乙两个网站点击量的极差分别是多少?
(2)甲网站点击量在[10,40]间的频率是多少?
(3)甲、乙两网站哪个更受欢迎?并说明理由.
解:(1)甲网站的极差为:73-8=65,乙网站的极差为:
71-5=66.
(2)=≈0.286.
(3)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.
2.2.2 用样本的数字特征估计总体的数字特征
A级 基础巩固
一、选择题
一、选择题
1.甲、乙两名篮球运动员在某几场比赛中得分的茎叶图如图所示,则甲、乙两人这几场比赛得分的中位数之和是(  )
A.63     B.64
C.65 D.66
解析:甲、乙两人在这几场比赛中得分的中位数分别是36和27,则中位数之和是36+27=63.
答案:A
2.下列说法中,不正确的是(  )
A.数据2,4,6,8的中位数是4,6
B.数据1,2,2,3,4,4的众数是2,4
C.一组数据的平均数、众数、中位数有可能是同一个数据
D.8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是
解析:数据2,4,6,8的中位数=5,显然的,B、C、D都是正确的.故选A.
答案:A
3.样本a,3,5,7的平均数是b,且a,b是方程x2-5x+4=0的两根,则这个样本的方差是(  )
A.3     B.4     C.5     D.6
解析:x2-5x+4=0的两根是1,4.
当a=1时,a,3,5,7的平均数是4;当a=4时,a,3,5,7的平均数不是1.
所以a=1,b=4.则方差s2=[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5.
答案:C
4.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88,若样本B数据恰好是样本A数据都加上2后所得数据,则A,B两样本的下列数字特征对应相同的是(  )
A.众数 B.平均数
C.中位数 D.标准差
答案:D
5.(2015·山东卷)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;
④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.
其中根据茎叶图能得到的统计结论的编号为(  )
A.①③   B.①④   C.②③   D.②④
解析:由题中茎叶图知,甲==29,
;乙==30,
.所以甲<乙,s甲>s乙.
答案:B
二、填空题
6.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则
(1)这20名工人中一天生产该产品数量在[55,75)的人数是________.
(2)这20名工人中一天生产该产品数量的中位数为________.
(3)这20名工人中一天生产该产品数量的平均数为________.
解析:(1)(0.040×10+0.025×10)×20=13.
(2)设中位数为x,则0.2+(x-55)×0.04=0.5,x=62.5.
(3)0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64.
答案:(1)13 (2)62.5 (3)64
7.若数据k1,k2,…,k6的方差为3,则2(k1-3),2(k2-3),…,2(k6-3)的方差为________.
解析:设k1,k2,…,k6的平均数为,
则[(k1-)2+(k2-)2+…+(k6-)2]=3.
而2(k1-3),2(k2-3),…,2(k6-3)的平均数为2(-3),则所求方差为
[4(k1-)2+4(k2-)2+…+4(k6-)2]=4×3=12.
答案:12
8.若有一个企业,70%的员工年收入1万元,25%的员工年收入3万元,5%的员工年收入11万元,则该企业员工的年收入的平均数是________万元,中位数是________万元,众数是________万元.
解析:年收入的平均数是1×70%+3×25%+11×5%=2(万元).
答案:2 1 1
三、解答题
9.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.
求:(1)高一参赛学生的成绩的众数、中位数;
(2)高一参赛学生的平均成绩.
解:(1)由图可知众数为65,
因为第一个小矩形的面积为0.3,
所以设中位数为60+x,则0.3+x×0.04=0.5,得x=5,
所以中位数为60+5=65.
(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,
故平均成绩约为67.
10.甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定.
品种
第1年
第2年
第3年
第4年
第5年

9.8
9.9
10.1
10
10.2

9.4
10.3
10.8
9.7
9.8
解:甲品种的样本平均数为10,样本方差为
[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02.
乙品种的样本平均数也为10,样本方差为
[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2)+(9.8-10)2]÷5=0.24.
因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.
B级 能力提升
1.有一笔统计资料,共有11个如下数据(不完全以大小排列):2,4,4,5,5,6,7,8,9,11,x,已知这组数据的平均数为6,则这组数据的方差为(  )
A.6    B.    C.66    D.6.5
解析:因为=(2+4+4+5+5+6+7+8+9+11+x)=(61+x)=6,所以x=5.方差为:
s2===6.
答案:A
2.甲、乙两同学在高考前各做了5次立定跳远测试,测得甲的成绩如下(单位:米):2.20,2.30,2.30,2.40,2.30,若甲、乙两人的平均成绩相同,乙的成绩的方差是0.005,那么甲、乙两人成绩较稳定的是________.
解析:求得甲的平均成绩为2.30米,甲的成绩的方差是0.004.由已知得甲、乙平均成绩相同,但甲的成绩的方差比乙的小,所以甲的成绩较稳定.
答案:甲
3.为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下表:
天数/天
151~180
181~210
211~240
241~270
271~300
301~330
331~360
361~390
灯管数/只
1
11
18
20
25
16
7
2
(1)试估计这种日光灯的平均使用寿命;
(2)若定期更换,可选择多长时间统一更换合适?
解:(1)各组的组中值分别为165,195,225,255,285,315,345,375,由此可算得这种日光灯的平均使用寿命约为165×1%+195×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈
268(天).
(2)×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2 128.60.
故标准差为≈46.
估计这种日光灯的平均使用寿命约为268天,标准差约为46天,故在222~314天之间统一更换较合适.
2.3.2 两个变量的线性相关
A级 基础巩固
一、选择题
1.设有一个回归方程为=2-1.5x,则变量x增加1个单位时,y平均(  )
A.增加1.5个单位   B.增加2个单位
C.减少1.5个单位 D.减少2个单位
解析:由于=-1.5<0,故选C.
答案:C
2.已知变量x,y之间具有线性相关关系,其散点图如图所示,则其回归方程可能为(  )
A.=1.5x+2
B.=-1.5x+2
C.=1.5x-2
D.=-1.5x-2
解析:设回归方程为=x+,由散点图可知变量x,y之间负相关,回归直线在y轴上的截距为正数,所以<0,>0,因此方程可能为=-1.5x+2.
答案:B
3.对有线性相关关系的两个变量建立的回归直线方程=+x中,回归系数(  )
A.不能小于0 B.不能大于0
C.不能等于0 D.只能小于0
解析:当=0时,r=0,这时不具有线性相关关系,但能大于0,也能小于0.
答案:C
4.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是(  )
A.=0.4x+2.3    B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
解析:因为变量x和y正相关,则回归直线的斜率为正,故可以排除选项C和D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A和B中的直线方程进行检验,可以排除B,故选A.
答案:A
5.(2015·湖北卷)已知变量x和y满足相关关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是(  )
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
解析:因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=y+,>0,则z=y+=-0.1x++,故x与z负相关.
答案:C
二、填空题
6.已知一个回归直线方程为=1.5x+45,x∈{1,7,5,13,19},则=__________________.
解析:因为=(1+7+5+13+19)=9,且回归直线过样本中心点(,),所以=1.5×9+45=58.5.
答案:58.5
7.对具有线性相关关系的变量x和y,测得一组数据如下表所示.若已求得它们回归直线的斜率为6.5,则这条回归直线的方程为__________________.
x
2
4
5
6
8
y
30
40
60
50
70
解析:设回归直线方程为=x+,则=6.5.易知=50,=5,所以=-=50-32.5=17.5,即回归直线方程为=6.5x+17.5.
答案:=6.5x+17.5
8.某市居民2007~2011年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:
年份
2007
2008
2009
2010
2011
收入x
11.5
12.1
13
13.3
15
支出Y
6.8
8.8
9.8
10
12
根据统计资料,居民家庭年平均收入的中位数是________,家庭年平均收入与年平均支出有________关系.
解析:收入数据按大小排列为11.5,12.1,13,13.3,15,所以中位数为13.从数据变化情况看出,两个变量是正相关的.
答案:13 正相关
三、解答题
9.随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司做了一次抽样调查,并统计得出某款车的使用年限x(单位:年)与所支出的总费用y(单位:万元)有如下的数据资料:
使用年限x
2
3
4
5
6
总费用y
2.2
3.8
5.5
6.5
7.0
若由资料知y对x呈线性相关关系.
(1)试求线性回归方程=x+的回归系数,;
(2)当使用年限为10年时,估计车的使用总费用.
解:(1)列表:
i
1
2
3
4
5
xi
2
3
4
5
6
yi
2.2
3.8
5.5
6.5
7.0
xiyi
4.4
11.4
22.0
32.5
42.0
x
4
9
16
25
36
=4,=5,=112.3
于是===1.23;
=-=5-1.23×4=0.08.
(2)线性回归直线方程是=1.23x+0.08,当x=10年时,=1.23×10+0.08=12.38(万元),即当使用10年时,估计支出总费用是12.38万元.
10.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:
房屋面积x/m2
80
105
110
115
135
销售价格y/万元
18.4
22
21.6
24.8
29.2
(1)画出数据对应的散点图;
(2)求回归方程,并在散点图中加上回归直线;
(3)试预测90 m2的房屋,销售价格约为多少?(精确到0.01)
解:(1)根据表中所列数据可得散点图如下:
由图可见两者之间是线性相关的.
i
1
2
3
4
5
xi
80
105
110
115
135
yi
18.4
22
21.6
24.8
29.2
xiyi
1 472
2 310
2 376
2 852
3 942
x
6 400
11 025
12 100
13 225
18 225
故可求得:=
=≈0.196 2,
=-=23.2-0.196 2×109=1.814 2.
所以,回归方程为=0.196 2x+1.814 2,
回归直线如(1)中图.
(3)把x=90代入上述回归方程=0.196 2x+1.814 2,即y=0.196 2×90+1.814 2≈19.47(万元),即这种90 m2的房屋,销售价格约19.47万元.
B级 能力提升
1.(2014·湖北卷)根据如下样本数据:
x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
得到的回归方程为=bx+a,则(  )
A.a>0,b>0 B.a>0,b<0
C.a<0,b>0 D.a<0,b<0
解析:作出散点图如下图所示:
观察图象可知,回归直线=bx+a的斜率b<0,当x=0时,=a>0.故a>0,b<0.
答案:B
2.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y对总成绩x的回归直线方程为=6+0.4x.由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差________分.
解析:令两人的总成绩分别为x1,x2.
则对应的数学成绩估计为
1=6+0.4x1,2=6+0.4x2,
所以|1-2|=|0.4(x1-x2)|=0.4×50=20.
答案:20
3.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:
摄氏温度/℃
-5
0
4
7
12
15
19
23
27
31
36
热饮杯数
156
150
132
128
130
116
104
89
93
76
54
(1)画出散点图;
(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;
(3)求回归方程;
(4)如果某天的气温是2 ℃,预测这天卖出的热饮杯数.
解:(1)散点图如图所示:
(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.
(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式求出回归方程的系数.利用计算器容易求得回归方程=-2.352x+147.767.
(4)当x=2时,=143.063.因此,某天的气温为2 ℃时,这天大约可以卖出143杯热饮.