2017_2018学年高中数学第二章统计练习(打包9套)新人教B版必修3

文档属性

名称 2017_2018学年高中数学第二章统计练习(打包9套)新人教B版必修3
格式 zip
文件大小 1.9MB
资源类型 教案
版本资源 人教新课标B版
科目 数学
更新时间 2017-10-25 14:10:20

文档简介

第二章
2.1
2.1.3分层抽样
A级 基础巩固
一、选择题
1.某市对大、中、小学生的视力进行抽样分析,其中大、中、小学生的人数比为2∶3∶5,若采用分层抽样的方法抽取一个样本,且中学生中被抽到的人数为150,则抽取的样本容量n等于( C )
A.1
500 
B.1
000 
C.500  
D.150
[解析] 设抽到的大、中、小学生的人数分别为2x,3x,5x,由3x=150,得x=50,所以n=100+150+250=500.
2.某市新上了一批便民公共自行车,有绿色和橙黄色两种颜色,且绿色公共自行车和橙黄色公共自行车的数量比为2∶
1,现在按照分层抽样的方法抽取36辆这样的公共自行车放在某校门口,则其中绿色公共自行车的辆数是( D )
A.8
B.12
C.16
D.24
[解析] 设放在该校门口的绿色公共自行车的辆数是x,则=,解得x=24.
3.某中学三个年级共240人,其中七年级100人,八年级80人,九年级60人,为了了解初中生的视力状况,抽查12人参加体检,应采用( C )
A.简单随机抽样法
B.系统抽样法
C.分层抽样法
D.以上方法都行
[解析] 符合分层抽样的特点.
4.(2015·北京文,4)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( C )
类别
人数
老年教师
900
中年教师
1
800
青年教师
1
600
合计
4
300
A.90
B.100
C.180
D.300
[解析] 由题意,总体中青年教师与老年教师比例为=;设样本中老年教师的人数为x,由分层抽样的性质可得总体与样本中青年教师与老年教师的比例相等,即=,解得x=180.
5.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12、21、25、43,则这四个社区驾驶员的总人数N为( B )
A.101
B.808
C.1
212
D.2
012
[解析] 本题考查了分层抽样知识.
由题意得,=,
解得N=808.
解决本题的关键是分清各层次的比例,属基础题,难度较小.
6.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区有10个特大型销售点,要从中抽取7个销售点调查其销售收入和售后服务等情况,记这项调查为②,则完成①②这两项调查宜采用的抽样方法依次为( B )
A.分层抽样法,系统抽样法
B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法
D.简单随机抽样法,分层抽样法
[解析] 由调查①可知个体差异明显,故宜用分层抽样;调查②中个体较少,故宜用简单随机抽样.
二、填空题
7.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取__60__名学生.
[解析] ∵300×=60,∴取60人.
8.防疫站对学生进行身体健康调查.红星中学共有学生1
600名,采用分层抽样法抽取一个容量为200的样本.已知女生比男生少抽了10人,则该校的女生人数应是__760__.
[解析] 设该校的女生人数是x,则男生人数是1
600-x,抽样比是=,则x=(1
600-x)-10,解得x=760.
三、解答题
9.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12
000人,其中持各种态度的人数如下表:
很喜爱
喜爱
一般
不喜爱
2
435
4
567
3
926
1
072
电视台进一步了解观众的具体想法和意见,打算从中抽取60人进行更为详细的调查,应当怎样进行抽样?
[解析] 可用分层抽样方法,其总体容量为12
000.“很喜爱”占=,应抽取60×487÷2
400≈12(人);“喜爱”占,应抽取60×4
567÷12
000≈23(人);
“一般”占,应抽取60×3
926÷12
000≈20(人);
“不喜爱”占,应抽取60×1
072÷12
000≈5(人).
因此采用分层抽样法在“很喜爱”、“喜爱”、“一般”和“不喜爱”的2
435人、4
567人、3
926人和1
072人中分别抽取12人、23人、20人和5人.
B级 素养提升
一、选择题
1.某市场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是( C )
A.4  
B.5  
C.6  
D.7
[解析] 若采用分层抽样的方法,则植物油类与果蔬类食品分别抽取×10=2,×20=4,
故抽取的两种食品种数之和为6.
2.某中学有高中生3
500人,初中生1
500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( A )
A.100
B.150
C.200
D.250
[解析] 由题意,得抽样比为=,总体容量为3
500+1
500=5
000,故n=5
000×=100.
3.某大学数学系共有本科生5
000人,其中一、二、三、四年级的人数比为4∶3∶2∶1,要用分层抽样的方法从所有本科生中抽取一个容量为200的样本,则应抽取三年级的学生人数为( B )
A.80
B.40
C.60
D.20
[解析] 三年级的学生人数为×5
000=1
000(人)
应抽取三年级的学生人数为×200=40(人).
4.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本.
①采用随机抽样法,将零件编号为00,01,…,99,抽签取出20个;
②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;
③采用分层抽样法,从一级品中随机抽取4个,从二级品中随机抽取6个.从三级品中随机抽取10个,对于上述抽样方式,下面说法正确的是( A )
A.不论哪一种抽样方法,这100个零件中每一个个体被抽到的概率都是
B.①②两种抽样方法中,这100个零件每一个个体被抽到的概率为.③并非如此
C.①③两种抽样方法中,这100个零件中每一个个体被抽到的概率为,②并非如此
D.采用不同的抽样方法,这100个零件中每一个个体被抽到的概率是不同的
[解析] 虽然三抽样方式、方法不同,但最终每个个体被抽取的机会是均等的,这正说明了三种抽样方法的科学性和可行性.
二、填空题
5.某学校高一、高二、高三年级的学生人数之比是3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取__15__名学生.
[解析] 本题考查抽样方法中的分层抽样知识.
∵高一、二、三年级的学生数之比是3∶3∶4,
∴高二年级学生数在三个年级学生总数中所占比例为=,
∴高二年级学生应抽取×50=15人.
对于分层抽样知识关键是求出抽样比,即某层元素在整体中所占比例.
6.课题组进行城市空气质量调查,按地域把24个城市分成甲、乙、丙三组,对应的城市数分别为4,12,8,若用分层抽样抽取6个城市,则丙组中应抽取的城市数为__2__.
[解析] 本题考查抽样方法中的分层抽样.
由于总共24个城市,抽取6个,则丙组中抽取×8=2个.
三、解答题
7.某校按分层抽样的方法从高中三个年级抽取部分学生调查,从三个年级抽取人数的比例为如图所示的扇形面积比,已知高二年级共有学生1
200人,并从中抽取了40人.
(1)该校的总人数为多少?
(2)其他两个年级分别抽取多少人?
(3)在各层抽样中可采取哪种抽样方法?
[解析] 高二年级所占的角度为120°
.
(1)设总人数为n,则=,可知n=3
600,故该校的总人数为3
600.
(2)高一、高二、高三人数所占的比为150∶120∶90=5∶4∶3,可知高一、高三所抽取人数分别为50,30.
(3)在各层抽样中可采取简单随机抽样与系统抽样的方法.
C级 能力拔高
1.为了对某课题进行讨论研究,用分层抽样的方法从三所高校A、B、C的相关人员中,抽取若干人组成研究小组,有关数据见下表(单位:人)
高校
相关人数
抽取人数
A
x
1
B
36
y
C
54
3
(1)求x、y;
(2)若从高校B相关的人中选2人作专题发言,应采用什么抽样法,请写出合理的抽样过程.
[解析] (1)分层抽样是按各层相关人数和抽取人数的比例进行的,所以有:= x=18,= y=2,故x=18,y=2.
(2)总体容量和样本容量较小,所以应采用抽签法,过程如下:
第一步,将36人随机的编号,号码为1,2,3,…,36;
第二步,将号码分别写在相同的纸片上,揉成团,制成号签;
第三步,将号签放入一个不透明的容器中,充分搅匀,依次抽取2个号码,并记录上面的编号;
第四步,把与号码相对应的人抽出,即可得到所要的样本.
2.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层抽样方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
[解析] (1)设登山组人数为x,游泳组中,青年人、中年人、老年人各占比例分别为a、b、c,则有=47.5%,=10%,解得b=50%,c=10%.故a=100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%.
(2)游泳组中,抽取的青年人数为200××40%=60(人),抽取的中年人数为200××50%=75(人);抽取的老年人数为200××10%=15(人).第二章
2.1
2.1.4数据的收集
A级 基础巩固
一、选择题
1.下列问题中符合调查问卷要求的是( C )
A.你们单位有几个大胡子?
B.您对我们厂生产的电视机满意吗?
C.您的体重是多少千克?
D.很多顾客都认为该产品的质量很好,您不这么认为吗?
[解析] A中的“大胡子”概念不明确;B对问题叙述不详细;D引导答题者的答题方向.
2.下面问题可以用普查的方式进行调查的是( C )
A.检验一批钢材的抗拉强度
B.检验海水中微生物的含量
C.检验10件产品的质量
D.检验一批汽车的使用寿命
[解析] A不能用普查的方式调查,因为这种实验具有破坏性;B用普查的方式无法完成;C可以用普查的方式进行调查;D该实验具有破坏性,且需要耗费大量的时间,在实际生产中无法应用.
3.①您所购买的是名牌产品,您认为该产品的知名度
A.很高 
B.一般 
C.很低
②你们家有几个孩子?____________
③你们班有几个大个子同学?____________.
④你认为数学学习
A.较困难
B.较容易
C.没感觉
以上问题符合调查问卷要求的是( D )
A.①  
B.②  
C.③  
D.④
[解析] ①不符合,因为问题有引导受调查者答题的倾向.②不符合,因为“孩子”一词意义含混.③不符合,因为“大个子”一词意义含混,故只有④符合,∴选D.
4.为了了解某年级同学每天参加体育锻炼的时间,比较恰当地收集数据的方法是( B )
A.查阅资料     
B.问卷调查
C.做试验
D.以上均不对
[解析] 问卷调查能达到目的,比较适合.
二、填空题
5.小明对本班同学做调查,提出问题“你考试作弊吗?”这样的问法__不合理__(填“合理”或“不合理”),理由是__考试作弊是一件不光彩的事,这样问很难得到真实答案__.
[解析] 这样的问题没有站在回答者的立场考虑.
6.做饭时为了知道饭煮熟了没有,从饭煲中舀出一勺饭尝尝,这种试验方法__合适__.(填“合适”或“不合适”)
[解析] 舀出的一勺是饭煲中搅拌均匀的全部饭的一部分,从中任意抽取一部分个体作为样本,它们含有与总体基本相同的信息.通过这一勺饭的生熟可以知道饭煲中饭的生熟.
三、解答题
7.请设计一份调查问卷,就消费者对某型号洗衣机在外观、功能、价格、耗电量、节约用水、售后服务等方面的满意程度进行调查.
[解析] 问卷设计如下:
姓名____________工作单位____________
住址____________联系电话____________
为了了解您的要求,进一步提高我们的服务质量,请回答以下问题:
8.设计一份学生食堂饭菜质量、饭菜价格、服务质量、满意程度的调查问卷.
[解析] 设计调查问卷如下:
B级 素养提升
一、选择题
1.某地第一季度应聘和招聘人数排行榜前5个行业的情况列表如下:
行业
计算机
机械
营销
物流
贸易
应聘人数
215
830
200
250
154
676
74
570
65
280
行业
计算机
营销
机械
建筑
化工
招聘人数
124
620
102
935
89
115
76
516
70
436
若用同一行业中应聘人数与招聘人数比值的大小来衡量该行业的就业情况,则根据表中数据,就业形势一定是( B )
A.计算机行业好于化工行业
B.建筑行业好于物流行业
C.机械行业最紧张
D.营销行业比贸易行业紧张
[解析] 从表中可以看出,计算机行业应聘和招聘人数都较多,但录用率约占60%.
化工行业招聘名额虽少,但应聘者也相应较少,且低于招聘人数,故A不正确.相对物流行业,机械行业可能不是最紧张的.
建筑行业应聘人数不多,显然好于物流行业.营销行业招聘比约为1∶1.5,但贸易行业招聘数不详,无法比较.
2.下列调查方式合适的是( D )
A.要了解一批灯泡的使用寿命,采用普查方式
B.要了解收看中央电视台的“法制报道”栏目的情况,采用普查方式
C.为了保证“天宫”一号太空舱发射成功,对重要零件采取抽查方式
D.要了解外国人对“上海世博会”的关注度,可采用抽查方式
[解析] 结合普查及抽查的概念及实际问题的需要可知D正确.
二、填空题
3.经问卷调查,某班同学对摄影分别执“喜欢”、“不喜欢”和“一般”三种态度,其中执“一般”态度的比“不喜欢”的多12人,按分层抽样方法从全班选出部分学生座谈摄影,如果选出的是5位“喜欢”摄影的同学、一位“不喜欢”摄影的同学和3位执“一般”态度的同学,那么全班学生中“喜欢”摄影的比全班人数的一半还多__3__人.
[解析] 由题意知,设三种态度的人数分别为5x、x、3x,则3x-x=12,∴x=6,即人数分别为:30,6,18.∴30-(30+6+18)÷2=3.
4.下列试验适合用抽样调查方法获取数据的序号是__①③④__.
①考察一片草皮的平均高度;
②检查某食品单位职工的身体状况;
③考察参加某次考试的3万考生的数学答题情况;
④检验一个人的血液中白细胞的含量是否正常.
[解析] ①该问题用普查的方法很难实现,适合用抽样调查的方法获取数据;②体检,必须了解每个职工的身体状况,不适合用抽样调查的方法获取数据;③3万考生的答题情况用普查的方法获取数据不合适,适合用抽样调查的方法获取数据;④该问题只能用抽样调查的方法获取数据.
三、解答题
5.请你设计一份关于中学生的课余活动情况的调查问卷.
[解析] 调查问卷设计如下:
姓名:____________ 班级:____________
年龄:____________ 性别:____________
联系电话:____________
(1)你每天的课余时间约为(  )
A.2小时  
B.3小时  
C.3小时以上
(2)你们的课余时间安排是(  )
A.自由活动 
B.组织安排
(3)你的主要娱乐方式是(  )
A.踢足球 
B.打篮球 
C.打羽毛球
D.做游戏   E.其他
(4)你觉得课余活动时间(  )
A.太少  
B.适中  
C.太多
6.某地区公共卫生部门为了调查本地区中学生的吸烟情况,对随机抽出的200名学生进行了调查,调查中使用了两个问题.
问题1:你的父亲阳历生日日期是不是奇数?
问题2:你是否经常吸烟?
请你设计调查问卷进行调查.
[解析] 调查问卷设计如下:
姓名____________所在学校____________
现有一个装有大小、形状和质量完全一样的50个白球和50个红球的袋子,每个被调查者随机从袋中摸取1个球A(摸出的球再放回袋中),摸到白球的学生如实回答第一个问题,摸到红球的学生如实回答第二个问题,回答“是”的人请在问题后面的方框内划“√”,回答“否”的人不用作任何标记.
C级 能力拔高
请设计一份问卷调查你们班同学阅读课外书的情况.
[解析] 调查问卷设计如下:
姓名____________ 所在班级____________
请回答下列问题
(1)你一般在什么时间阅读课外书?
A.每天课间     
B.每天放学回家
C.周末或假期
D.老师安排的阅读课上
(2)你喜欢读的课外书有:
A.散文
B.报告文学
C.小说
D.所学功课的辅导资料
E.其他的
(3)你最喜欢哪一类课外书?____________
(4)你的课外书的来源是
A.同学介绍的
B.老师推荐的
C.在书店中偶然发现的
D.家长推荐的
E.从宣传资料上看到的
(5)你是怎样阅读课外书的?
A.粗略阅读
B.详细阅读
C.大部分是粗略阅读的
D.大部分是详细阅读的
(6)你认为课外阅读和学习的关系是
A.能促进学习
B.与学习没多大关系
C.妨碍学习
(7)你的家长对你阅读课外书持什么态度?
A.支持
B.反对
C.从不过问
(8)你在阅读课外书时遇到哪些困难?____________
(9)你在这方面有什么打算?____________第二章
2.1
2.1.1简单随机抽样
A级 基础巩固
一、选择题
1.在“世界读书日”前夕,为了了解某地5
000名居民某天的阅读时间,从中抽取了200名居名的阅读时间进行统计分析,在这个问题中,5
000名居民的阅读时间的全体是( A )
A.总体
B.个体
C.样本容量
D.从总体中抽取的一个样本
[解析] 由条件知,5
000名居民的阅读时间的全体是总体,其中1名居民的阅读时间是个体;从5
000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200,故选A.
2.从总数为N的一批零件中抽取一个容量为30的样本,若每个零件被抽取的可能性为25%,则N为( D )
A.150  
B.200  
C.100  
D.120
[解析] 由=0.25得N=120.故选D.
3.下列抽样实验中,适合用抽签法的有( B )
A.从某厂生产的3
000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件产品中取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3
000件产品中抽取10件进行质量检验
[解析] A、D中个体的总数较大,不适于用抽签法;C中甲、乙两厂生产的两箱产品性质可能差别较大,因此未达到搅拌均匀的条件,也不适于用抽签法;B中个体数和样本容量较小,且同厂生产的两箱产品,性质差别不大,可以看做是搅拌均了.
4.高三某班有34位同学,座位号记为01,02,…,34,用下面的随机数表选取5组数作为参加青年志愿者活动的五位同学的座号.选取方法是从随机数表第一行的第6列和第7列数字开始,由左到右依次选取两个数字,则选出来的第4个志愿者的座号为( D )
49 54 43 54 82 17 37 93 23 78 87 35 20
96 43 84 26 34 91 64 57 24 55 06 88 77
04 74 47 67 21 76 33 50 25 83 92 12 06
A.23  
B.09  
C.02  
D.16
[解析] 从随机数表第一行的第6列和第7列数字35开始,由左到右依次选取两个数字,不超过34的依次为21,32,09,16,17,第四个志愿者的座号为16.
二、填空题
5.从个体数为N的总体中抽取一个容量为n的样本,采用简单随机抽样的方法,当总体中的个体数不多时,一般采用__抽签法__(填“抽签法”或“随机数表法”)进行抽样.
[解析] 当总体中的个体数不多时,制作号签比较方便,也利于“搅拌均匀”,所以一般采用抽签法进行抽样.
6.为了了解参加运动会的2
000名运动员的年龄情况,从中抽查了100名运动员的年龄,则样本的容量是__100__.
[解析] 样本容量是指样本中个体的个数.
三、解答题
7.某省环保局有各地市报送的空气质量材料15份,为了了解全省的空气质量,要从中抽取一个容量为5的样本,试确定用何种方法抽取,请具体实施操作.
[解析] 总体容量小,样本容量也小,可用抽签法.
步骤如下:
(1)将15份材料用随机方式编号,号码是1、2、3、…、15;
(2)将以上15个号码分别写在15张相同的小纸条上,揉成团,制成号签;
(3)把号签放入一个不透明的容器中,充分搅拌均匀;
(4)从容器中逐个抽取5个号签,每次抽取后要再次搅拌均匀,并记录上面的号码;
(5)找出和所得号码对应的5份材料,组成样本.
8.某车间工人加工了一批零件共40件,为了了解这批零件的质量情况,要从中抽取10件进行检验,如何采用随机数表法抽取样本?写出抽样步骤.
[解析] 抽样步骤是:
第一步,先将40件零件编号,可以编为00,01,02,…,38,39.
第二步,在随机数表中任选一个数作为开始,例如从教材附表的随机数表中的第8行第9列的数5开始.为便于说明,我们将随机数表中的第6行至第10行摘录如下:
16
22
77
94
39 49
54
43
54
82 17
37
93
23
78 87
35
20
96
43 84
26
34
91
64
84
42
17
53
31 57
24
55
06
88 77
04
74
47
67 21
76
33
50
25 83
92
12
06
76
63
01
63
78
59 16
95
55
67
19 98
10
50
71
75 12
86
73
58
07 44
39
52
38
79
33
21
12
34
29 78
64
56
07
82 52
42
07
44
38 15
51
00
13
42 99
66
02
79
54
57
60
86
32
44 09
47
27
96
54 49
17
46
09
62 90
52
84
77
27 08
02
73
43
28
第三步,从选定的数5开始向右读下去,得到一个两位数字号码59,由于59>39,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34.至此,10个样本号码已经取满,于是,所要抽取的样本号码是16,19,10,12,07,39,38,33,21,34.与这10个号码对应的零件即是抽取的样本个体.
B级 素养提升
一、选择题
1.从某批零件中抽取50个,然后再从这50个中抽取40个进行合格检查,发现合格产品有36个,则该产品的合格率为( C )
A.36%
B.72%
C.90%
D.25%
[解析] ×100%=90%.
2.从一群游戏的小孩中随机抽出k人,一人分一个苹果,让他们返回继续游戏,过了一会儿,再从中任取m人,发现其中有n个小孩曾分过苹果,估计参加游戏的小孩的人数为( C )
A.
B.k+m-n
C.
D.不能估计
[解析] 设参加游戏的小孩有x人,则=,x=.
二、填空题
3.要考察某公司生产的500克袋装牛奶的蛋白质含量是否达标,现从800袋牛奶中抽取60袋进行检验,将它们编号为001、002、…、800,利用随机数表法抽取样本,从第6行第1组数开始,依次向右,再到下一行,继续从左到右,每组数取前3位.请问选出的第七袋牛奶的标号是__594__(为了便于说明,下面摘取了随机数表的第6行至第10行).
81500 13219 57941 74927 32798 98600 55225 42059
59408 66368 36016 26247 25965 49487 26968 86021
77681 83458 21540 62651 69424 78197 20643 67297
76413 66306 51671 54964 87683 30372 39469 97434
48306 32560 19098 13843 70490 19383 21278 90912
[解析] 从第6行第1组开始,得到的数依次是132、579、749、327、552、420、594,故第7个数为594.
4.某工厂共有n名工人,为了调查工人的健康情况,从中随机抽取20名工人作为调查对象.若每位工人被抽到的可能性为,则n=__100__.
[解析] 由=,得n=100.
三、解答题
5.从20名学生中抽取5名进行阅卷调查,写出抽取样本的过程.
[解析] 总体和样本数目较小,可采用抽签法进行:
①先将20名学生进行编号,从1编到20;
②把号码写在形状、大小均相同的号签上;
③将号签放在某个箱子中进行充分搅拌,然后依次从箱子中取出5个号签,按这5个号签上的号码取出样品,即得样本.
6.某校有学生1
200人,为了调查某种情况,打算抽取一个样本容量为50的样本,问此样本若采用简单随机抽样将如何获得?
[解析] 解法一:抽签法:首先,把该校学生都编上号码:0001、0002、0003、…、1
200.如用抽签法,则做1
200个形状、大小相同的号签(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌.抽签时,每次从中抽出1个号签,连续抽取50次,就得到一个容量为50的样本.
解法二:随机数表法:首先,把该校学生都编上号码:0001,0002,0003,…,1
200.如用随机数表法,使用各个5位数组的前四位,任意取第5行第4组数开始,依次向后截取,所得数字如下:
9
038、1
212、6
404、5
132、2
298、8
150、1
321、5
794、7
492、3
279、9
860、5
522、4
205、5
940、6
636、3
601、2
624、2
596、4
948、2
696、8
602、7
768、8
345、…
所取录的4位数字如果小于或等于1
200,则对应此号的学生就是被抽取的个体;如果所取录的4位数字大于1
200而小于或等于2
400,则减去1
200剩余数即是被抽取的号码;如果大于2
400而小于3
600,则减去2
400;依次类推.如果遇到相同的号码,则只留第一次取录的数字其余的舍去.经过这样处理,被抽取的学生所对应的号码分别是:
0
638、0
012、0
404、0
332、1
098、0
950、0
121、0
994、0
292、0
879、0
260、0
722、0
605、1
140、0
636、0
001、0
224、0
196、0
148、0
296、0
202、0
568、1
145、…一直到取够50人为止.
C级 能力拔高
为了迎接2018年6月8号至7月8号第21届俄罗斯足球世界杯,现要在全球征集筛选的50个吉祥物中抽取6个参加最后的筛选.每个吉祥物被选中的机会均等,若采用抽签法,该如何进行?
[解析] ①将50个吉祥物标号,号码为01,02,…,50;
②将50个吉祥物的编号分别写在一张小纸条上,并揉成完全相同的小球,制成号签;
③将制成的号签放在一个不透明的容器中,搅拌均匀;
④从容器中逐个抽取6个号签,并记录上面的编号,如:02,21,27,08,46,11;
⑤对应上面6个编号的吉祥物就是参加最后筛选的吉祥物.第二章
2.2
2.2.2用样本的数字特征估计总体
A级 基础巩固
一、选择题
1.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( D )
A.甲地:总体均值为3,中位数为4
B.乙地:总体均值为1,总体方差大于0
C.丙地:中位数为2,众数为3
D.丁地:总体均值为2,总体方差为3
[解析] 根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项A中,中位数为4,可能存在大于7的数;同理,在选项C中也有可能;选项B中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项D中,根据方差公式,如果有大于7的数存在,那么方差不会为3,故选D.
2.某校举行歌咏比赛,7位评委给各班演出的节目评分,去掉一个最高分,再去掉一个最低分后,所得平均数作为该班节目的实际得分.对于某班的演出,7位评委的评分分别为:9.65、9.70、9.68、9.75、9.72、9.65、9.78,则这个班节目的实际得分是( B )
A.9.66
B.9.70
C.9.65
D.9.67
[解析] =(9.65+9.70+9.68+9.75+9.72)=9.70.
3.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为( B )
分数
5
4
3
2
1
人数
20
10
30
30
10
A.
B.
C.3
D.
[解析] ∵=
==3,
∴s2=[(x1-)2+(x2-)2+…+(xn-)2]
=×[20×22+10×12+30×02+30×12+10×22]
==.
∴s=,故选B.
4.样本中共有5个个体,其值分别为a、0、1、2、3.若该样本的平均值为1,则样本的方差为( D )
A.-1
B.0
C.1
D.2
[解析] 由题意得=1,∴a=-1.
∴样本的方差s2
==2.
5.(2016·全国卷Ⅲ理)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是( D )
A.各月的平均最低气温都在0℃以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于20℃的月份有5个
[解析] 由图形可得各月的平均最低气温都在0℃以上,A正确;七月的平均温差约为10℃,而一月的平均温差约为5℃,故B正确;三月和十一月的平均最高气温都在10℃左右,基本相同,C正确;平均最高气温高于20℃时月份只有3个,D错误.
二、填空题
6.下图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为__6.8__.
(注:方差s2=[(x1-)2-(x2-)2+…+(xn-)2],其中为x1,x2,…,xn的平均数)
[解析] 本题考查茎叶图、方差的概念.
由茎叶图知==11,
∴s2=[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8
7.某医院急诊中心其病人等待急诊的时间记录如下:
等待时间(min)
[0,5)
[5,10)
[10,15)
[15,20)
[20,25)
人数
4
8
5
2
1
用上述分组资料计算得病人平均等待时间的估计值=__9.5min__,病人等待时间标准差的估计值s=__5.34min__.
[解析] =(2.5×4+7.5×8+…+22.5×1)=9.5(min);s2=[(2.5-9.5)2×4+(7.5-9.5)2×8+…+(22.5-9.5)2]=28.5,s=≈5.34(min).
三、解答题
8.对划艇运动员甲、乙两人在相同的条件下进行了6次测试,测得他们最大速度(m/s)的数据如下:
甲:27、38、30、37、35、31;
乙:33、29、38、34、28、36.
根据以上数据,试判断他们谁更优秀.
[解析] 这显然是要计算两组数据的与s2,然后加以比较并作出判断.
甲=(27+38+30+37+35+31)==33,
s=[(27-33)2+(38-33)2+…+(31-33)2]
=×94≈15.7;
乙=(33+29+38+34+28+36)==33,
s=[(33-33)2+(29-33)2+…+(36-33)2]
=×76≈12.7.
∴甲=乙,>.说明甲、乙二人的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优秀.
9.为了比较两种治疗失眠症的药(分别称为A药、B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:
服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2
3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1
2.3 2.4
服用B药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3
1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2
2.7 0.5
(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?
(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?
[解析] (1)设A药观测数据的平均数为,B药观测数据的平均数为.
由观测结果可得
=(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3.
=(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.
由以上计算结果可得>,因此可看出A药的疗效更好.
(2)由观测结果可绘制如下茎叶图:
从以上茎叶图可看出,A药疗药的试验结果有的叶集中在茎“2”、“3”上,而B药疗效的试验结果有的叶集中在茎“0”、“1”上,由此可看出A药的疗效更好.
B级 素养提升
一、选择题
1.某校为了了解学生的课外阅读情况,随机抽查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用条形图表示(如图).根据条形图可得这50名学生这一天平均每人的课外阅读时间为( B )
A.0.6
h
B.0.9
h
C.1.0
h
D.1.5
h
[解析] =0.9(h).
2.中央电视台“梦想星搭档”节目中,八组选手获得观众的“赞”数统计如茎叶图所示,由于不慎有两个数残缺,但是统计人员记得这些数据的平均数与方差分别为293与33.5,则所残缺的两个数从小到大分别为( B )
A.0,2
B.1,2
C.2,3
D.4,5
[解析] 设残缺的两个数分别为a与b(0290+=293,
[122+(-3)2+02+12+32+(a-3)2+(b-3)2+(-10)2]=33.5,
a+b=3,由03.某人5次上班途中所花的时间(单位:分钟)分别为x、y、10、11、9.已知这组数据的平均数为10,方差为2,则|x-y|的值为( D )
A.1
B.2
C.3
D.4
[解析] 由题意可得=10,[(x-10)2+(y-10)2+(10-10)2+(11-10)2+(9-10)2]=2,解得x=12,y=8.|x-y|=4,选D.
4.如果数据x1,x2,…,xn的平均数是,方差是s2,则3x1+2,3x2+2,…,3xn+2的平均数和方差分别是( C )
A.和s2
B.3和9s2
C.3+2和9s2
D.3+2和12s2+4
[解析] 3x1+2,3x2+2,…,3xn+2的平均数是3+2,由于数据x1,x2,…,xn的方差为s2,所以3x1+2,3x2+2,…,3xn+2的方差为9s2,所以选择C.
二、填空题
5.如图是一次考试结果的频数分布直方图,根据该图可估计,这次考试的平均分数为__46__.
[解析] 根据频数分布直方图,可估计有4人成绩在[0,20)之间,其考试分数之和为4×10=40;有8人成绩在[20,40)之间,其考试分数之和为8×30=240;有10人成绩在[40,60)之间,其考试分数之和为10×50=500;有6人成绩在[60,80)之间,其考试分数之和为6×70=420;有2人成绩在[80,100)之间,其考试分数之和为2×90=180,由此可知,考生总人数为4+8+10+6+2=30,考试总成绩为40+240+500+420+180=1
380,平均数==46.
6.一个班组共有20名工人,他们的月工资情况如下:
工资xi(元)
1
600
1
440
1
320
1
220
1
150
980
人数ni
2
4
5
5
2
2
则该班组工人月工资的平均数为__1_296__.
[解析] =(1
600×2+1
440×4+1
320×5+1
220×5+1
150×2+980×2)÷20=25
920÷20=1
296.
三、解答题
7.(2016·四川文)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)估计居民月均用水量的中位数.
[解析] (1)由频率分布直方图,可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04,
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.
由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,
解得a=0.30.
(2)由(1)可知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.
由以上样本的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.
(3)设中位数为x吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,
而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,
所以2≤x<2.5.
由0.50×(x-2)=0.5-0.48,解得x=2.04.
故可估计居民月均用水量的中位数为2.04吨.
C级 能力拔高
1.一次数学知识竞赛中,两组学生成绩如下表:
分数
50
60
70
80
90
100
人数
甲组
2
5
10
13
14
6
乙组
4
4
16
2
12
12
已经算得两个组的平均分都是80分,请根据你所学过的统计知识,进一步判断这两个组这次竞赛中成绩谁优谁次,并说明理由.
[解析] (1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.
(2)s=×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=×(2×900+5×400+10×100+13×0+14×100+6×400)=172.
s=×(4×900+4×400+16×100+2×0+12×100+12×400)=256.
因为s<s,所以甲组成绩较乙组成绩稳定.
(3)甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.
(4)从成绩统计表看,甲组成绩大于或等于90分的人数为20人,乙组成绩大于或等于90分的人数为24人,所以乙组成绩在高分阶段的人数多,同时,乙组得满分的比甲组得满分的多6人,从这一角度看,乙组成绩较好.
2.对某校高三年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图如图所示.
分组
频数
频率
[10,15)
10
0.25
[15,20)
24
n
[20,25)
m
p
[25,30]
2
0.05
合计
M
1
(1)求出表中M,p及图中a的值;
(2)若该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数;
(3)估计这次学生参加社区服务人数的众数、中位数以及平均数.
[解析] (1)由分组[10,15)内的频数是10,频率是0.25,知=0.25,所以M=40.
因为频数之和为40,所以10+24+m+2=40,m=4,p===0.10.
因为a是对应分组[15,20)的频率与组距的商,所以a==0.12.
(2)因为该校高三学生有240人,分组在[10,15)内的频率是0.25,
所以估计该校高三学生参加社区服务的次数在此区间内的人数为60.
(3)估计这次学生参加社区服务人数的众数是=17.5.因为n==0.6,
所以样本中位数是15+≈17.1,
估计这次学生参加社区服务人数的中位数是17.1,
样本平均人数是12.5×0.25+17.5×0.6+22.5×0.1+27.5×0.05=17.25,
估计这次学生参加社区服务人数的平均数是17.25.第二章
2.3
2.3.1变量间的相关关系
A级 基础巩固
一、选择题
1.以下关于相关关系的说法正确的个数是( B )
①相关关系是函数关系
②函数关系是相关关系
③线性相关关系是一次函数关系
④相关关系有两种,分别是线性相关关系和非线性相关关系
A.0 
B.1
C.2 
D.3
[解析] 根据相关关系的概念可知,只有④正确,故选B.
2.下列关系属于线性负相关的是( C )
A.父母的身高与子女身高的关系
B.农作物产量与施肥量的关系
C.吸烟与健康的关系
D.数学成绩与物理成绩的关系
[解析] 若以吸烟量为横轴,健康为纵轴画出散点图,则由生活常识知,这些点散布在从左上角到右下角的区域内.
因此,吸烟与健康的关系属于线性负相关.
3.对于给定的两个变量的统计数据,下列说法正确的是( C )
A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
[解析] 给出一组样本数据,总可以作出相应散点图,但不一定分析出两个变量的关系,更不一定符合线性相关或有函数关系.
4.有五组变量:
①汽车的重量和汽车每消耗1
L汽油所行驶的平均路程;
②平均日学习时间和平均学习成绩;
③某人每日吸咽量和其身体健康情况;
④立方体的棱长和体积;
⑤汽车的重量和行驶100
km的耗油量.
其中两个变量成正相关的是( C )
A.①③
B.②④
C.②⑤
D.④⑤
[解析] ②⑤中的两个变量成正相关.
二、填空题
5.有下列关系:
①人的年龄与其拥有的财富之间的关系;
②曲线上的点与该点的坐标之间的关系;
③苹果的产量与气候之间的关系;
④森林中的同一树木,其横截面直径与高度之间的关系;
⑤学生与其学号之间的关系.
其中具有相关关系的是__①③④__.
[解析] ②⑤为确定性关系.
6.据两个变量x、y之间的观测数据画成散点图如图,这两个变量是否具有线性相关关系(答是与否)__否__.
[解析] 如图中的点分布杂乱,两个变量不具有线性相关关系.
三、解答题
7.5名学生的数学和化学成绩见下表:
学生学科
A
B
C
D
E
数学成绩(x)
88
76
73
66
63
化学成绩(y)
78
65
71
64
61
画出散点图,并判断它们之间是否有相关关系.
[解析] 散点图如图所示:
由图可知,它们之间具有相关关系.
8.某公司利润y(单位:千万元)与销售总额x(单位:千万元)之间有如下对应数据:
x
10
15
17
20
25
28
32
y
1
1.3
1.8
2
2.6
2.7
3.3
(1)画出散点图;
(2)判断y与x是否具有线性相关关系.
[解析] (1)散点图如下,
(2)由图知,所有数据点接近直线排列,因此,认为y与x有线性相关关系.
B级 素养提升
一、选择题
1.如下图所示,有5组(x,y)数据,去掉哪一组数据之后,剩下的4组数据成线性相关关系( B )
A.E
B.D
C.B
D.A
[解析] 去掉D组数据之后,剩下的4组数据成线性相关关系.
2.图中的两个变量是相关关系的是( D )
A.①②   
B.①③   
C.②④   
D.②③
[解析] 相关关系所对应的图形是散点图,②③能反映两个变量的变化规律,它们是相关关系,故选D.
二、填空题
3.在下列各量与量的关系中,是相关关系的是__②__.
①正方体的体积与棱长间的关系;
②一块农田的水稻产量与施肥量之间的关系;
③角度和它的余弦值;
④某户家庭用电量与电价间的关系.
[解析] ①是函数关系,其中f(x)=x3,②是相关关系,③是函数关系,④不是函数关系也不是相关关系,因为电价是一个定值.
4.给出下列x、y值的数据如下:
y
3
5
9
17
x
1
2
4
8
则根据数据可以判断x和y的关系是__确定关系__.(填:“确定关系”“相关关系”或者“没有关系”)
[解析] 由表中数据可以得到x、y之间是一种函数关系:y=2x+1,所以x、y是一种确定的关系,即函数关系.
三、解答题
5.某老师为了了解学生的计算能力,对曲胜仁同学进行了10次测试,收集数据如下:
题数x(个)
5
10
15
20
25
30
35
40
45
50
做题时间y(分钟)
9
19
26
37
48
52
61
73
81
89
画出散点图,并判断该同学的做题时间与题数是否有相关关系.若有,是正相关还是负相关?
[解析] 散点图分如图所示
由散点图可见,该同学的做题时间与题数之间具有相关关系且是正相关.
6.对某种珍稀动物胚胎的生长进行研究,测得9~20日龄动物的胚胎的质量如下:
日龄/天
9
10
11
12
13
14
胚重/g
1.656
2.662
3.100
4.579
6.518
7.486
日龄/天
15
16
17
18
19
20
胚重/g
9.948
14.522
15.610
19.914
23.736
26.472
(1)请作出这些数据的散点图;
(2)关于这两个变量的关系,你能得出什么结论?
[解析] (1)以动物胚胎的日龄为x轴,以胚重为y轴,作出散点图如图所示:
(2)从图象观察,许多点在同一曲线附近,且可以看出随着时间的增加,胚重增长得越来越快,所以两变量具有相关关系.
C级 能力拔高
1.以下是某地搜集到的新房屋的销售价格和房屋的面积的数据:
房屋面积(m2)
61
70
115
110
80
135
105
销售价格(万元)
12.2
15.3
24.8
21.6
18.4
29.2
22
画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关.
[解析] 散点图如下:
由散点图知销售价格与房屋面积这两个变量是正相关的关系.
2.某种产品的广告费支出x与销售额y之间有如下对应数据(单位:百万元)
x
2
4
5
6
8
y
30
40
60
50
70
(1)画出散点图;
(2)从散点图中判断销售金额与广告费支出成什么样的关系?
[解析] (1)以x对应的数据为横坐标,以y对应的数据为纵坐标,所作的散点图如下图所示:
(2)从图中可以发现广告费支出与销售金额之间具有相关关系,并且当广告费支出由小变大时,销售金额也大多由小变大,图中的数据大致分布在某条直线的附近,即x与y成正相关关系.第二章
2.2
2.2.1用样本的频率分布估计总体
A级 基础巩固
一、选择题
1.一个容量为80的样本的最大值是140,最小值是51,组距为10,则可以分成( B )
A.10组  
B.9组  
C.8组  
D.7组
[解析] ∵==8.9,∴可分成9组.
2.(2015·湖南文,2)在一次马拉松比赛中,35名运动员的成绩(单位:min)的茎叶图如图所示.
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( B )
A.3
B.4
C.5
D.6
[解析] 成绩在区间[139,151]上的运动员人数是20,用系统抽样方法从35人中抽取7人,成绩在区间[139,151]上的运动员应抽取7×=4(人),故选B.
3.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40)、[40,60)、[60,80)、[80,100].若低于60分的人数是15,则该班的学生人数是( B )
A.45
B.50
C.55
D.60
[解析] 根据频率分布直方图的特点可知,低于60分的频率是(0.005+0.01)×20=0.3,∴该班的学生人数是=50.
4.在样本的频率分布直方图中,共有8个小长方形,若最后一个小长方形的面积等于其他7个小长形的面积和的,且样本容量为200,则第8组的频数为( A )
A.40
B.0.2
C.50
D.0.25
[解析] 设最后一个小长方形的面积为x,则其他7个小长方形的面积为4x,从而x+4x=1,
所以x=0.2.
故第8组的频率为200×0.2=40.
5.一个容量为30的样本数据,分组后组距与频数如下:(10,20],3;(20,30],4;(30,40],6;(40,50],7;(50,60],6;(60,70],4.则样本在区间(0,50]上的频率约为( C )
A.5%
B.25%
C.67%
D.70%
[解析] 样本落在(0,50]上的频数为3+4+6+7=20,所以频率=≈67%.
6.为了解电视对生活的影响,一个社会调查机构就平均每天看电视的时间调查了某地10
000名居民,并根据所得数据画出样本的频率分布直方图(如图所示).为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从这10
000人中再用分层抽样方法抽出100人做进一步调查,则在[2.5,3)(h)时间段内应抽出的人数是( A )
A.25
B.30
C.50
D.75
[解析] 在[2.5,3)上频率为0.5×0.5=0.25,应抽100×0.25=25人,故选A.
二、填空题
7.今年5月海淀区教育网开通了网上教学,某校高一八班班主任为了了解学生上网学习时间,对本班40名学生某天上网学习时间进行了调查,将数据(取整数)整理后,绘制出如图所示频率分布直方图,已知从左到右各个小组的频率分别是0.15,0.25,0.35,0.20,0.05,则根据直方图所提供的信息,这一天上网学习时间在100~119分钟之间的学生人数是__14__人,如果只用这40名学生这一天上网学习时间作为样本去推断该校高一年级全体学生该天上网学习时间,这样推断是否合理?__不合理__(填“合理”或“不合理”)
[解析] 由频数=样本容量×频率=40×0.35=14(人)
因为该样本的选取只在高一(8)班,不具有代表性,所以这样推断不合理.
8.容量为60的样本的频率分布直方图共有n(n>1)个小矩形,若其中一个小矩形的面积等于其余n-1个小距形面积和的,则这个小矩形对应的频数是__10__.
[解析] 设其余n-1个小矩形面积和为x,由题意得x+x=1,
∴x=.∴这个小矩形对应的频数为××60=10.
三、解答题
9.有同一型号的汽车100辆,为了解这种汽车每耗油1L所行路程的情况,现从中随机地抽出10辆,在同一条件下进行耗油1L所行路程的试验,得到如下样本数据(单位:km):13.7、12.7、14.4、13.8、13.3、12.5、13.5、13.6、13.1、13.4,并分组如下:
分组
频数
频率
[12.45,12.95)
[12.95,13.45)
[13.45,13.95)
[13.95,14.45)
合计
10
1.0
(1)完成上面的频率分布表;
(2)根据上表,在坐标系中画出频率分布直方图.
[解析] (1)频率分布表如下:
分组
频数
频率
[12.45,12.95)
2
0.2
[12.95,13.45)
3
0.3
[13.45,13.95)
4
0.4
[13.95,14.45)
1
0.1
合计
10
1.0
(2)频率分布直方图如图所示:
B级 素养提升
一、选择题
1.从一堆苹果中任取10只,称得它们的质量如下(单位:g):
125 120 122 105 130 114 116 95 120 134
则样本数据落在[114.5,124.5)内的频率为( C )
A.0.2
B.0.3
C.0.4
D.0.5
[解析] 该题考查频率的计算公式.
在[114.5,124.5)范围内的频数m=4,样本容量n=10,∴所求频率为=0.4.
2.一个容量为100的样本,其数据的分组与各组的频数如下:
组别
(0,10]
(10,20]
(20,30]
(30,40]
(40,50]
(50,60]
(60,70]
频数
12
13
24
15
16
13
7
则样本数据落在(10,40]上的频率为( C )
A.0.13
B.0.39
C.0.52
D.0.64
[解析] 本小题主要考查统计等基础知识.
在(10,40]上的频率为=0.52,故选C.
3.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50)、[50,60)、[60,70)、[70,80)、[80,90)、[90,100]加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( B )
A.588
B.480
C.450
D.120
[解析] 不少于60分的学生的频率为(0.030+0.025+0.015+0.010)×10=0.8,∴该模块测试成绩不少于60分的学生人数应为600×0.8=480.
4.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( B )
A.0.2
B.0.4
C.0.5
D.0.6
[解析] 由题意知,这10个数据落在区间[22,30)内的有22、22、27、29,共4个,∴其频率为=0.4,故选B.
二、填空题
5.某校开展“爱我海西,爱我家乡”摄影比赛,9位评委给参赛作品A打出的分数如茎叶图所示,记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现一个数字(茎叶图中的x)无法看清.若记分员计算无误,则数字x应该是__1__.
[解析] 若x≤4,则由平均分为91知总分应为91×7=637.故637=89+89+92+93+92+91+90+x,得x=1;若x>4,637≠89+89+92+93+92+91+94=640不合题意.
6.为了解今年某校高三毕业班准备报考飞行员学生的体重(单位:kg)情况,将所得的数据整理后,画出了频率分布直方图,如图所示,已知图中从左到右的前三个小组的频率之比为1∶2∶3,其中第2小组的频数为12.则该校报考飞行员的总人数为__48__.
[解析] 设报考飞行员的总人数为n,
设第一小组的频率为a,则有a+2a+3a+(0.013+0.037)×5=1,
解得a=0.125,
所以第2小组的频率为0.25.
又第2小组的频数为12,
则有0.25=,所以n=48.
三、解答题
7.某市2017年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,
(1)完成频率分布表;
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
[解析] (1)频率分布表:
分组
频数
频率
[41,51)
2
[51,61)
1
[61,71)
4
[71,81)
6
[81,91)
10
[91,101)
5
[101,111)
2
(2)频率分布直方图,如图所示.
(3)答对下述两条中的一条即可:
①该市一个月中空气污染指数有2天处于优的水平,占当月天数的,有26天处于良的水平,占当月天数的,处于优或良的天数共有28天,占当月天数的.说明该市空气质量基本良好.
②轻微污染有2天,占当月天数的.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的,超过50%,说明该市空气质量有待进一步改善.
C级 能力拔高
1.某电视台为宣传本省,随机对本省内15~65岁的人群抽取了n人,回答问题“本省内著名旅游景点有哪些”统计结果如图表所示.
组号
分组
回答正确的人数
回答正确的人数占本组的频率
第1组
[15,25)
a
0.5
第2组
[25,35)
18
x
第3组
[35,45)
b
0.9
第4组
[45,55)
9
0.36
第5组
[55,65]
3
y
(1)分别求出a、b、x、y的值;
(2)从第2、3、4组回答正确的人中用分层抽样的方法抽取6人,求第2、3、4组每组各抽取多少人?
[解析] (1)由频率表中第4组数据可知,第4组总人数为=25,再结合频率分布直方图可知
n==100,
∴a=100×0.01×10×0.5=5,
b=100×0.03×10×0.9=27,
x==0.9,y==0.2.
(2)第2、3、4组回答正确的共有54人.
∴利用分层抽样在54人中抽取6人,每组分别抽取的人数为:第2组:×6=2(人);第3组:×6=3(人);第4组:×6=1(人).
2.2017年高考已经结束,山东省为了了解和掌握高考考生的实际答卷情况,随机地取出了100名考生的数学成绩,数据如下(单位:分)
135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 105 124 87 131 97 102 123 104 104 128 109 123 111 103 105 92 114 108 104 102 129 126 97 100 115 111 106 117 104 109 111 89 110 121 80 120 121 104 108 118 129 99 90 99 121 123 107 111 91 100 99 101 116 97 102 108 101 95 107 101 102 108 117 99 118 106 119 97 126 108 123 119 98 121 101 113 102 103 104 108
(1)列出频率分布表;
(2)画出频率分布直方图和折线图;
(3)估计该省考生数学成绩在[100,120)分之间的比例.
[解析] 100个数据中,最大值为135,最小值为80,极差为135-82=55.
把100个数据分成11组,这时组距===5.
(1)频率分布表如下:
分组
频数
频率
[80,85)
1
0.01
0.002
[85,90)
2
0.02
0.004
[90,95)
4
0.04
0.008
[95,100)
14
0.14
0.028
[100,105)
24
0.24
0.048
[105,110)
15
0.15
0.030
[110,115)
12
0.12
0.024
[115,120)
9
0.09
0.018
[120,125)
11
0.11
0.022
[125,130)
6
0.06
0.012
[130,135]
2
0.02
0.004
合计
100
1
0.2
注:表中加上“”一列,这是为画频率分布直方图准备的,因为它是频率分布直方图的纵坐标.
(2)根据频率分布表中的有关信息画出频率分布直方图及折线图,如图所示.
(3)从频率分布表中可知,这100名考生的数学成绩在[100,120)分之间的频率为0.24+0.15+0.12+0.09=0.60,据此估计该省考生数学成绩在[100,120)分之间的比例为60%(0.60=60%).第二章 统计
学业质量标准检测
本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.满分150分.考试时间120分钟.
第Ⅰ卷(选择题 共60分)
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中只有一个是符合题目要求的)
1.已知x与y之间的一组数据:
x
0
1
2
3
y
1
3
5
7
则y与x的线性回归方程为=x+必过点( D )
A.(2,2)
B.(1,2)
C.(1.5,0)
D.(1.5,4)
[解析] ==1.5,==4.
∵回归直线过样本的中心点(,),∴回归直线过点(1.5,4),故选D.
2.下列哪种工作不能使用抽样方法进行( D )
A.测定一批炮弹的射程
B.测定海洋某一水域的某种微生物的含量
C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度
D.检测某学校全体高三学生的身高和体重的情况
[解析] 抽样是为了用总体中的部分个体(即样本)来估计总体的情况,选项A、B、C都是从总体中抽取部分个体进行检验,选项D是检测全体学生的身体状况,所以,要对全体学生的身体都进行检验,而不能采取抽样的方法.故选D.
3.高一·一班李明同学进行一项研究,他想得到全班同学的臂长数据,他应选择的最恰当的数据收集方法是( A )
A.做试验 
B.查阅资料
C.设计调查问卷
D.一一询问
[解析] 全班人数不是很多,所以做试验最恰当.
4.设有一个回归方程为=2-2.5x,变量x增加一个单位时,变量y( C )
A.平均增加1.5个单位
B.平均增加2个单位
C.平均减少2.5个单位
D.平均减少2个单位
[解析] 因为随变量x增大,y减小,x、y是负相关的,且=-2.5,故选C.
5.学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n且支出在[20,60)元的样本,其频率分布直方图如图所示,根据此图估计学生在课外读物方面的支出费用的中位数为(  )元( C )
A.45
B.
C.
D.46
[解析] 40+10×=.
6.将1
000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,则抽取的第40个号码为( A )
A.0795
B.0780
C.0810
D.0815
[解析] 由题意可知,该抽样为系统抽样,抽样间隔为20,则抽取的第40个号码为0015+20×39=0795,故选A.
7.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为( B )
A.101
B.808
C.1
212
D.2
012
[解析] 根据分层抽样的概念知,=,解得N=808.
8.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( A )
A.91.5和91.5
B.91.5和92
C.91和91.5
D.92和92
[解析] 将这组数据从小到大排列,得87、89、90、91、92、93、94、96.
故平均数==
91.5,中位数为=91.5,故选A.
9.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5~18岁的男生体重(单位:kg),得到频率分布直方图如下:
根据上图可得这100名学生中体重在[56.5,64.5)的学生人数是( C )
A.20
B.30
C.40
D.50
[解析] 由题意,知这100名学生中体重在[56.5,64.5)的学生人数所占频率为(0.03+0.05+0.05+0.07)×2=0.4,所以这100名学生中体重在[56.5,64.5)的学生人数是0.4×100=40.
10.网上大型汽车销售某品牌A型汽车,在2016双十一期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系:
价格(万元)
25
23.5
22
20.5
销售量(辆)
30
33
36
39
已知A型汽车的购买量y与价格x符合如下线性回归方程:=x+80,若A型汽车价格降到19万元,预测月销量大约是( B )
A.39
B.42
C.45
D.50
[解析] =(25+23.5+22+20.5)=22.75,
=(30+33+36+39)=34.5,
∵=x+80,∴34.5=×22.75+80,∴≈-2.
∵x=19,∴y=19×(-2)+80=42.
11.数据5,7,7,8,10,11的标准差是( C )
A.8
B.4
C.2
D.1
[解析] ==8,
标准差S=
=2.
12.设矩形的长为a,宽为b,其比满足b∶a=≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中,下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是( A )
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次总体平均数与标准值接近程度相同
D.两个批次总体平均数与标准值接近程度不能确定
[解析] 本小题主要考查学生的知识迁移能力和统计的有关知识.
甲==0.617,
乙==0.613,
故选A.
第Ⅱ卷(非选择题 共90分)
二、填空题(本大题共4小题,每小题5分,共20分.把答案填写在题中的横线上.)
13.将一个容量为m的样本分成3组,已知第一组频数为8,第二、三组的频率为0.15和0.45,则m=__20__.
[解析] 由题意知第一组的频率为1-(0.15+0.45)=0.4,
∴=0.4,∴m=20.
14.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数.则这10天甲、乙两人日加工零件的平均数分别为__24__和__23__.
[解析] 甲=(10×2+20×5+30×3+17+6+7)=24,乙=(10×3+20×4+30×3+17+11+2)=23.
15.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[45,55)、[55,65)、[65,75)、[75,85)、[85,95),由此得到频率分布直方图如图,则这20名工人中一天生产该产品数量在[55,75)的人数是__13__.
[解析] 由频率分布直方图知[55,75)之间的频率为
(0.040+0.025)×10=0.65,故[55,75)之间的人数为0.65×20=13.
16.某校甲、乙两个班级各有5名编号为1、2、3、4、5的学生进行投篮练习,每人投10次,投中的次数如下表:
学生
1号
2号
3号
4号
5号
甲组
6
7
7
8
7
乙组
6
7
6
7
9
则以上两组数据的方差中较小的一个为s2=  .
[解析] 甲==7,
乙==7.
∴s==,
s==,
则两组数据的方差中较小的一个为s=.
三、解答题(本大题共6个小题,共70分,解答应写出文字说明、证明过程或演算步骤)
17.(本题满分10分)下面的抽样方法是简单随机抽样吗?为什么?
(1)某班有40名同学,指定个子最高的5名同学参加学校组织的篮球赛;
(2)一儿童从玩具箱中的20件玩具中随意拿出一件来玩,玩后放回,再拿一件,连续玩了5件;
(3)从200个灯泡中逐个抽取20个进行质量检查.
[解析] (1)不是简单随机抽样,因为这不是等可能抽样.
(2)不是简单随机抽样,因为它是有放回的抽样.
(3)是简单随机抽样,因为它满足简单随机抽样的几个特点.
18.(本题满分12分)有关部门要了解甲型H1N1流感预防知识在学校的普及情况,制作了一份有10道题的问卷到各学校进行问卷调查.某中学A、B两个班各被随机抽取了5名学生接受问卷调查,A班5名学生得分为:5,8,9,9,9;B班5名学生得分为:6,7,8,9,10.(单位:分)
请你估计A、B两个班中哪个班的问卷得分要稳定一些.
[解析] A班的5名学生的平均得分为(5+8+9+9+9)÷5=8(分),
方差s=×[(5-8)2+(8-8)2+(9-8)2+(9-8)2+(9-8)2]=2.4;
B班的5名学生的平均得分为(6+7+8+9+10)÷5=8(分),
方差s=×[(6-8)2+(7-8)2+(8-8)2+(9-8)2+(10-8)2]=2.
∴s>s.
∴B班的预防知识的问卷得分要稳定一些.
19.(本题满分12分)一箱方便面共有50包,从中用随机抽样方法抽取了10包称量其重量(单位:g)结果为:60.5 61 60 60 61.5 59.5 59.5 58 60 60
(1)指出总体、个体、样本、样本容量;
(2)指出样本数据的众数、中位数、平均数;
(3)求样本数据的方差.
[解析] (1)总体是这50包方便面所有的包重,个体是这一箱方便面中每一包的包重,样本是抽取的10包的包重,样本容量为10.
(2)这组样本数据的众数是60,中位数为60,样本平均数=×(60.5+61+60+60+61.5+59.5+59.5+58+60+60)=60.
(3)样本数据的方差为
s2=[(60.5-60)2+(61-60)2+(60-60)2+(60-60)2+(61.5-60)2+(59.5-60)2+(59.5-60)2+(58-60)2+(60-60)2+(60-60)2]=0.8.
20.(本题满分12分)某班的全体学生共有50人,参加数学测试(百分制)成绩的频率分布直方图如图,数据的分组依次为:[20,40)、[40,60)、[60,80)、[80,100].依此表可以估计这一次测试成绩的中位数为70分.
(1)求表中a、b的值;
(2)请估计该班本次数学测试的平均分.
[解析] (1)由中位数为70可得,
0.005×20+0.01×20+a×10=0.5,
解得a=0.02.
又20(0.005+0.01+0.02+b)=1,
解得b=0.015.
(2)该班本次数学测试的平均分的估计值为30×0.1+50×0.2+70×0.4+90×0.3=68分.
21.(本题满分12分)有一容量为50的样本,数据的分组以及各组的频数如下:
[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;
[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5),4.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)根据频率分布直方图估计,数据落在[15.5,24.5)内的可能性约是多少?
[解析] (1)频率分布表为:
分组
频数
频数
频率
[12.5,15.5)
3
0.06
[15.5,18.5)
8
0.16
[18.5,21.5)
9
0.18
[21.5,24.5)
11
0.22
[24.5,27.5)
10
0.20
[27.5,30.5)
5
0.10
[30.5,33.5)
4
0.08
合计
50
1.00
(2)频率分布直方图如图所示:
(3)数据落在[15.5,24.5)内的可能性为:=0.56.
22.(本题满分12分)以下是某地搜集到的新房屋的销售价格y(单位:万元)和房屋的面积x(单位:m2)的数据:
房屋面积
115
110
80
135
105
销售价格
24.8
21.6
18.4
29.2
22
(1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线;
(3)据(2)的结果估计当房屋面积为150
m2时的销售价格(精确到0.1万元).
[解析] (1)数据对应的散点图如图所示.
(2)=i=109,(xi-)2=1570,=23.2,
(xi-)(yi-)=308.
设所求回归直线方程为=x+,则
==≈0.1962,
=-=23.2-0.1962×109=1.8142.
故所求回时直线方程为=0.1962x+1.8142.回归直线如上图.
(3)由(2)得当x=150时,销售价格的估计值为=0.196×150+1.8142=31.2442≈31.2(万元).第二章
2.1
2.1.2系统抽样
A级 基础巩固
一、选择题
1.为了解1
000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( C )
A.50
B.40
C.25
D.20
[解析] 根据系统抽样的特点可知分段间隔为=25,故选C.
2.采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为( C )
A.7
B.9
C.10
D.15
[解析] 从960人中用系统抽样方法抽取32人,则抽样距为k==30,
因为第一组号码为9,
则第二组号码为9+1×30=39,…,
第n组号码为9+(n-1)×30=30n-21,
由451≤30n-21≤750,即15≤n≤25,所以n=16,17,…,25,共有25-16+1=10(人).
3.湖南卫视《爸爸去哪儿》节目组为热心观众给予奖励,要从2
014名小观众中抽取50名幸运小观众.先用简单随机抽样从2
014人中剔除14人,剩下的2
000人再按系统抽样方法抽取50人,则在2
014人中,每个人被抽取的可能性( C )
A.均不相等
B.不全相等
C.都相等,且为
D.都相等,且为
[解析] 因为在系统抽样中,若所给的总体个数不能被样本容量整除,则应先剔除几个个体,本题先剔除14人,然后再分组,在剔除过程中,每个个体被剔除的机会相等.所以,每个个体被抽到的机会都相等,均为=.
4.下列抽样中不是系统抽样的是( C )
A.从标有1~15号的15个球中,任选3个作样本,按从小号到大号排序,随机选起点i0,以后i0+5,i0+10(超过15则从1再数起)号入样
B.工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品进行检验
C.搞某一市场调查,规定在某一路段随机抽一个人进行询问,直到调查到事先规定调查人数为止
D.电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈
[解析] C中因为事先不知道总体,抽样方法不能保证每个个体按事先规定的可能性入样.故C不是系统抽样.
5.总体容量为203,若采用系统抽样法进行抽样,当抽样间距为多少时不需要剔除个体( D )
A.4
B.5
C.6
D.7
[解析] ∵203被7整除,∴选D.
6.为了检查某超市货架上的奶粉是否含有三聚氰胺,要从编号依次为1到50的袋装奶粉中抽取5袋进行检验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5袋奶粉的编号可能是( D )
A.5、10、15、20、25
B.2、4、8、16、32
C.1、2、3、4、5
D.7、17、27、37、47
[解析] 利用系统抽样,把编号分为5段,每段10袋,每段抽取一袋,号码间隔为10,故选D.
二、填空题
7.高三某班有学生56人,学生编号依次为1、2、3、…、56.
现用系统抽样的方法抽取一个容量为4的样本,已知编号为6、34、48的同学都在样本中,那么样本中另一位同学的编号应该是__20__.
[解析] 由于系统抽样的样本中个体编号是等距的,且间距为56/4=14,所以样本编号应为6、20、34、48.
8.将参加数学夏令营的100名同学编号为001、002、…、100.现采用系统抽样方法抽取一个容量为25的样本,且第一段中随机抽得的号码为004,则在046至078号中,被抽中的人数为__8__.
[解析] 抽样距为4,第一个号码为004,故001~100中是4的整数倍的数被抽出,在046至078号中有048、052、056、060、064、068、072、076,共8个.
三、解答题
9.一个体育代表队有200名运动员,其中两名是种子选手,现从中抽取13人参加某项运动.若种子选手必须参加,请用系统抽样法给出抽样过程.
[解析] (1)将除种子选手以外的198名运动员用随机方式编号,编号为001、002、…、198;
(2)将编号按顺序每18个为一段,分成11段;
(3)在第一段001、002、…、018,这十八个编号中用简单随机抽样法抽出一个(如010)作为起始号码;
(4)将编号为010、028、046、…、190的个体抽出,与种子选手一起参加这项运动.
B级 素养提升
一、选择题
1.某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( B )
A.11
B.12
C.13
D.14
[解析] 根据系统抽样的等可能性可知,每人入选的可能性都是,由题设可知区间[481,720]的人数为240,所以编号落入区间[481,720]的人数为×240=12.
2.用系统抽样的方法从个体数为1
003的总体中,抽取一个容量为50的样本,在整个抽样过程中每个个体被抽到的可能性是( C )
A.
B.
C.
D.
[解析] 根据系统抽样的方法可知,每个个体入样的可能性相同,均为,所以每个个体入样的可能性为.
3.系统抽样又称为等距抽样,从N个个体中抽取n个个体为样本,先确定抽样间隔,即抽样距k=(取整数部分),从第一段1,2,…,k个号码中随机抽取一个入样号码i0,则i0,i0+k,…,i0+(n-1)k号码均入样构成样本,所以每个个体的入样可能性是( A )
A.相等的
B.不相等的
C.与i0有关
D.与编号有关
[解析] 由系统抽样的定义可知,每个个体入样的可能性相等与抽样距无关,也与第一段入样号码无关,系统抽样所得样本的代表性与具体的编号有关,要求编号不能呈现个体特征随编号周期性变化,各个个体入样可能性与编号无关.
4.从编号为1~60的60枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用系统抽样方法抽取5枚导弹的编号可能是( C )
A.1、3、4、7、9、5
B.10、15、25、35、45
C.5、17、29、41、53
D.3、13、23、33、43
[解析] 分段间隔为=12,即相邻两个编号间隔为12,故选C.
二、填空题
5.某学校有学生4
022人.为调查学生对2016年巴西里约奥运会的了解状况,现用系统抽样的方法抽取一个容量为30的样本,则分段间隔是__134__.
[解析] 由于不是整数,所以应从4
022名学生中用简单随机抽样剔除2名,则分段间隔是=134.
6.一个总体中的100个个体的编号分别为0,1,2,3,…,99,依次将其分成10个小段,段号分别为0,1,2,…,9.现要用系统抽样的方法抽取一个容量为10的样本,规定如果在第0段随机抽取的号码为l,那么依次错位地取出后面各段的号码,即第k段中所抽取的号码的个位数为l+k或l+k-10(l+k≥10),则当l=6时,所抽取的10个号码依次是__6,17,28,39,40,51,62,73,84,95__.
[解析] 在第0段随机抽取的号码为6,则由题意知,在第1段抽取的号码应是17,在第2段抽取的号码应是28,依次类推,故正确答案为6,17,28,39,40,51,62,73,84,95.
三、解答题
7.下面给出某村委调查本村各户收入情况所作的抽样,阅读并回答问题:
本村人口:1
200人,户数300,每户平均人口数4人;
应抽户数:30户;
抽样间隔:=40;
确定随机数字:取一张人民币,编码的后两位数为12;
确定第一样本户:编码的后两位数为12的户为第一样本户;
确定第二样本户:12+40=52,52号为第二样本户;
……
(1)该村委采用了何种抽样方法?
(2)抽样过程中存在哪些问题,并修改;
(3)何处是用简单随机抽样.
[解析] (1)系统抽样.
(2)本题是对某村各户进行抽样,而不是对某村人口抽样,抽样间隔为=10,其他步骤相应改为确定随机数字:取一张人民币,编码的后两位数为02(或其他00~09中的一个);确定第一样本户:编号为02的户为第一样本户;确定第二样本户:02+10=12,编号为12的户为第二样本户;….
(3)确定随机数字用的是简单随机抽样,取一张人民币,编码的后两位数为02.
C级 能力拔高
1.一个总体中的1
000个个体编号为0,1,2,…,999,并依次将其分为10个小组,组号为0,1,2,…,9.要用系统抽样方法抽取一个容量为10的样本,规定如果在第0组随机抽取的号码为x,那么依次错位地得到后面各组的号码,即第k组中抽取的号码的后两位数为x+33k的后两位数.
(1)当x=24时,写出所抽取样本的10个号码;
(2)若所抽取样本的10个号码中有一个的后两位数是87,求x的取值范围.
[解析] (1)当x=24时,按规则可知所抽取样本的10个号码依次为:24,157,290,323,456,589,622,755,888,921.
(2)当k=0,1,2,…,9时,33k的值依次为0,33,66,99,132,165,198,231,264,297.
又抽取样本的10个号码中有一个的后两位数是87,从而x可以为87,54,21,88,55,22,89,56,23,90.
∴x的取值范围是{21,22,23,54,55,56,87,88,89,90}.
2.某位同学利用暑假期间准备搞一个社会实践调查,他打算从某小区内的120户居民中选出7户,他使用系统抽样的过程如下:
①编号:将120户居民从“1”到“120”随机地编号;
②决定间隔:因120被7除余1,故可先从总体中随机地剔除1个个体,再将余下的1
19个个体重新随机地编号为1到199号,最后设定间隔为17;
③随意使用一个起点,如38,然后推算出如下编号的居民为样本:38,55,72,89,106,123,140.
由于123和140并不在实际编号内,故他准备重新选取第一个号码,但他爸爸却说没有问题,爸爸的说法有错误吗?需要重新选取号码吗?你帮他解释一下.
[解析] 所谓系统抽样的第一个号码,一般是在第一组内用简单随机抽样的方法选取的一个号码,然后再等距离地抽取,这样就保证了后面所有的号码都在已知的编号内.但在实际应用时却不一定是这样来确定第一个号码的,而是随机确定第一个号码的,如这个学生确定的38,如果这时再等距离地确定后续号码就会使号码超出已编号码,这个时候只要将超过的部分减去若干个间隔,然后再将之放到样本编号之中就可以了.例如,因123-17×7=4,140-17×7=21.故抽取的号码如下:4,21,38,55,72,89.106.因此这个学生的爸爸的说法并没有错.第二章
2.3
2.3.2两个变量的线性相关
A级 基础巩固
一、选择题
1.设一个回归方程为=3+1.2x,则变量x增加一个单位时( A )
A.y平均增加1.2个单位
B.y平均增加3个单位
C.y平均减少1.2个单位
D.y平均减少3个单位
[解析] 由题意可知,变量x每增加一个单位时,y平均增加1.2个单位.
2.某学生4次模拟考试英语作文的减分情况如下表:
第x次考试
1
2
3
4
所减分数y
4.5
4
3
3.5
显然y与x之间有较好的线性相关关系,则其线性回归方程为( D )
A.=0.7x+5.25
B.=-0.6x+5.25
C.=-0.7x+6.25
D.=-0.7x+5.25
[解析] 由于随着x的增大,y减小,所以x与y负相关,所以<0,排除A;由于=(1+2+3+4)=2.5,=(4.5+4+3+2.5)=3.5,所以样本点的中心为(2.5,3.5),将其代入其他三个选项,得直线=-0.7x+5.25通过样本点的中心,故选D.
3.某商店对每天进店人数x与某种商品成交量y(单位:件)进行了统计,得到如下对应数据:
x
10
15
20
25
30
35
40
y
5
6
12
14
20
23
25
由表中数据,得线性回归方程为=x-3.25.如果某天进店人数是75,预测这一天该商品销售的件数为( B )
A.47
B.52
C.55
D.38
[解析] ==25,
==15,
将(,)代入回归方程得15=25-3.25,=0.73.
∴预测这一天该商品销售的件数大约为0.73×75-3.25=51.5,故选B.
4.(2015·湖北文,4)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( C )
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
[解析] 因为变量x和y满足关系y=-0.1x+1,其中-0.1<0,所以x与y成负相关;又因为变量y与z正相关,不妨设z=ky+b(k>0),则将y=-0.1x+1代入即可得到:z=k(-0.1x+1)+b=-0.1kx+(k+b),所以-0.1k<0,所以x与z负相关,综上可知,应选C.
5.某产品的广告费用x与销售额y的统计数据如下表
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( B )
A.63.6万元
B.65.5万元
C.67.7万元
D.72.0万元
[解析] 本题主要考查了回归分析及回归直线方程.
依题意:=3.5,=42,又=9.4,∴42=9.4×3.5+.
∴=9.1,∴=9.4x+9.1,当x=6时,=65.5,故选B.
6.(2017·山东理,5)为了研究某班学生的脚长x(单位:cm)和身高y(单位:cm)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系.设其回归直线方程为=x+.已知i=225,i=1
600,=4.该班某学生的脚长为24,据此估计其身高为( C )
A.160
B.163
C.166
D.170
[解析] ∵i=225,∴=i=22.5.
∵i=1
600,∴=i=160.
又=4,∴=-=160-4×22.5=70.
∴回归直线方程为=4x+70.
将x=24代入上式得=4×24+70=166.
故选C.
二、填空题
7.若施化肥量x与小麦产量y之间的回归直线方程为=250+4x,当施化肥量为50kg时,预计小麦产量为__450kg__.
[解析] 
将x=50代入回归直线方程得=250+4×50=450,故预计小麦产量为450kg.
8.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加__0.254__万元.
[解析] 本小题考查内容为回归直线方程与回归系数的意义.由题意知[0.254(x+1)+0.321]-(0.254x+0.321)=0.254.
三、解答题
9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
8
8.2
8.4
8.6
8.8
9
销量y(件)
90
84
83
80
75
68
(1)求回归直线方程=x+,其中=-20.
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
[解析] (1)由于=(x1+x2+x3+x4+x5+x6)=8.5,
=(y1+y2+y3+y4+y5+y6)=80.
所以=-=80+20×8.5=250,
从而回归直线方程为=-20x+250.
(2)设工厂获得的利润为L元,依题意得
L=x(-20x+250)-4(-20x+250)=-20x2+330x-1
000=-20(x-8.25)2+361.25.
当且仅当x=8.25时,L取得是大值,
故当单价定为8.25元时,工厂可获得最大利润.
B级 素养提升
一、选择题
1.某学生课外活动兴趣小组对两个相关变量收集到5组数据如下表:
x
10
20
30
40
50
y
62

75
81
89
由最小二乘法求得回归方程为=0.67x+54.9,现发现表中有一个数据模糊不清,请推断该数据的值为( C )
A.60
B.62
C.68
D.68.3
[解析] 由题意可得=30,
代入回归方程得=75.
设看不清处的数为a,
则62+a+75+81+89=75×5,∴a=68.
2.某同学对一家超市就“气温与热饮杯的销售量”进行调查,根据统计结果,该生运用所学知识得到气温x℃与当天销售量y(个)之间的线性回归方程为:=-2.352x+147.767,当x=2℃时可卖出热饮杯的杯数约为( D )
A.109
B.128
C.134
D.143
[解析] 把x=2℃代入线性回归方程得=-2.352×2+147.767≈143.故选D.
3.某化工厂为了预测产品的销售量y,需要研究它与某原料有效成分含量x之间的相关关系.现取了8对观测值,计算得i=48,i=144,回归直线方程为=a+2.5x,则当x=10时,y的预测值为( A )
A.28
B.27.6
C.26
D.25
[解析] ===6,
===18,
将(,)代入回归直线方程得
18=a+2.5×6,∴a=3.
∴y的预测值为3+2.5×10=28.
4.下表提供了某场节能降耗技术改造后在生产A产品过程中记录的产量x(t)与相应的生产能耗y(t)的几组对应数据:
x
3
4
5
6
y
2.5
t
4
4.5
根据上表提供的数据,求出y关于x的线性回归方程y=0.7x+0.35,那么表中t的值为( B )
A.1
B.3
C.5
D.7
[解析] ==4.5,
∵回归直线y=0.7x+0.35过点(,),
∴=0.7×4.5+0.35=3.5.
∴==3.5,
∴t=3.
二、填空题
5.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是 =1.23x+0.08 .
[解析] 设回归直线方程为=x+,(,)是样本点的中心.依题意,=1.23,=4,=5,所以=-=0.08,所以回归直线的方程是=1.23x+0.08.
6.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天的气温(如下表),并求得线性回归方程为=-2x+60.
气温(℃)
c
13
10
-1
用电量(度)
24
34
38
d
但后来不小心表中数据c、d丢失,那么由现有数据知2c+d=__100__.
[解析] 由题意得,=(c+13+10-1)=,=(24+34+38+d)=,又线性回归方程为=-2x+60,故-2×+60=,解得2c+d=100.
三、解答题
7.一台机器由于使用时间较长,生产的零件有一些缺损.按不同转速生产出来的零件有缺损的统计数据如下表所示:
转速x(转/秒)
16
14
12
8
每小时生产有缺损零件数y(个)
11
9
8
5
(1)作出散点图;
(2)如果y与x线性相关,求出回归直线方程;
(3)若实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么,机器的运转速度应控制在什么范围内?
[解析] 先作出散点图,再根据散点图判断y与x呈线性相关,从而建立回归直线方程求解.
(1)作散点图如图所示.
(2)由散点图可知y与x线性相关.故可设回归直线方程为=bx+a.
依题意,用计算器可算得:
=12.5,=8.25,=660,iyi=438.
∴b=≈0.73,a=-b≈8.25-0.73×12.5=-0.875.
∴所求回归直线方程为=0.73x-0.875.
(3)令=10,得0.73x-0.875=10,解得x≈15.
即机器的运转速度应控制在15转/秒内.
C级 能力拔高
某地区2010年至2016年农村居民家庭人均纯收入y(单位:千元)的数据如下表
年份
2010
2011
2012
2013
2014
2015
2016
年份代号
1
2
3
4
5
6
7
人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)求y关于t的线性回归方程;
(2)利用(1)中的回归方程,分析2010年至2016年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2018年农村居民家庭人均纯收入,附:回归直线的斜率和截距的最小二乘估计公式分别为:
=,=-.
[解析] (1)由所给数据计算得=(1+2+3+4+5+6+7)=4,
=(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
(ti-)2=9+4+1+0+1+4+9=28,
(ti-)(yi-)=(-3)×(-1.4)+(-2)×(-1)+(-1)(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,
===0.5,
=-=4.3-0.5×4=2.3,
所求回归方程为=0.5t+2.3.
(2)由(1)知,=0.5>0,故2010年至2016年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元,将2018年的年份代号t=9代入(1)中的回归方程,得=0.5×9+2.3=6.8,
故预测该地区2018年农村居民家庭人均纯收人为6.8千元.