第九章 统 计
考试内容
考纲要求
考点1 简单随机抽样
理解
考点2 系统抽样
理解
考点3 分层抽样
理解
考点4 用样本的频率分布估计总体分布
掌握
考点5 用样本的数字特征估计总体的数字特征
应用
考点6 变量之间的相关关系
识记
考点7 两个变量的线性相关
理解
一、随机抽样
1.简单随机抽样:
(1)定义:设一个总体含有N个个体,从中逐个________地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会______的抽样方法.?
(2)分类:______法和________法.?
2.系统抽样:
3.分层抽样:
定义:一般地,在抽样时,将总体分成__________的层,然后按照____________,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.?
二、用样本估计总体
1.用样本的频率分布估计总体分布:
(1)频率分布直方图:
在频率分布直方图中,纵轴表示__________,数据落在各个小组内的频率用频数/样本容量表示,各小长方形的面积总和为________.?
(2)茎叶图:茎是指________的一列数,叶就是从茎的________生长出来的数.一般地,中间的数字表示数据的十位数,旁边的数字分别表示两组数据的个位数.?
2.用样本的数字特征估计总体的数字特征:
众数
一组数据中重复出现次数______的数?
中位数
把一组数据按大小顺序排列,处在________位置的一个数据(或两个数据的平均数)?
平均数
如果有n个数x1,x2,x3,…,xn,那么这n个数的平均数=__________________?
方差
s2=______________________________?
标准差
s=______________________________?
三、变量间的相关关系
1.相关关系的判断:
根据给出的数据作出散点图,然后根据散点图判断两个变量是否具有相关关系.
2.回归直线及方程:
(1)回归直线:如果散点图中点的分布从整体上看大致在________附近,就称这两个变量之间具有__________关系,这条直线叫做回归直线.?
(2)回归方程:__________对应的方程叫做回归直线的方程,简称回归方程.?
热点一 抽样方法
【例1】(1)下列抽取样本的方式属于简单随机抽样的个数为( )
①从无限多个个体中抽取100个个体作为样本;②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;③从20件玩具中一次性抽取3件进行质量检验;④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
A.0
B.1
C.2
D.3
(2)为了对某课题进行研究,分别从A,B,C三所高校中用分层抽样法抽取若干名教授组成研究小组,其中高校A有m名教授,高校B有72名教授,高校C有n名教授(其中0①若A,B两所高校中共抽取3名教授,B,C两所高校中共抽取5名教授,求m,n;
②若高校B中抽取的教授总数是高校A和C中抽取的教授总数的,求三所高校的教授的总人数.
解决分层抽样问题的两种技巧
对于分层抽样中的比值问题,常利用以下关系式巧解.
(1)=.
(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.
热点二 用样本的频率分布估计总体分布
【例2】(1)将容量为100的样本数据,按从小到大的顺序分成8个组,如表:
组号
1
2
3
4
5
6
7
8
频数
9
14
14
13
12
x
13
10
则第六组的频率为( )
A.0.14
B.14
C.0.15
D.15
(2)为了解数学课外兴趣小组的学习情况,从某次测试的成绩中随机抽取20名学生的成绩进行分析,得到如图所示的频率分布直方图.
①根据频率分布直方图估计本次测试成绩的众数;
②从成绩不低于80分的两组学生中任选2人,求选出的2人来自同一组的概率.
在解决与频率分布直方图有关的读图问题时,要注意其纵坐标是,不要误认为是频率.
热点三 用样本的数字特征估计总体的数字特征
【例3】(1)若一组样本数据2,3,7,8,a的平均数为5,则该组数据的方差s2=______.?
(2)一批食品,每袋的标准重量是50
g,为了了解这批食品的实际重量情况,从中随机抽取10袋食品,称出各袋的重量(单位:g),并得到其茎叶图(如图).
①求这10袋食品重量的众数,并估计这批食品实际重量的平均数;
②若某袋食品的实际重量小于或等于47
g,则视为不合格产品,试估计这批食品重量的合格率.
热点四 两个变量间的相关关系
【例4】对于下列表格所示五个散点,已知求得的线性回归方程为=0.8x-155,则实数m的值为______.?
x
196
197
200
203
204
y
1
3
6
7
m
一、选择题
1.打桥牌时,将洗好的扑克牌(52张)随机确定一张为起始牌后,开始按次序搬牌,对任何一家来说,都是从52张总体中抽取一个13张的样本,则这种抽样方法是( )
A.系统抽样
B.分层抽样
C.简单随机抽样
D.非以上三种抽样方法
2.某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽取容量为n的样本,其中甲种产品有18件,则样本容量n=( )
A.54
B.90
C.45
D.126
3.(2019·湖南学业水平考试真题)某班有男生30人,女生20人,现用分层抽样的方法从中抽取10人参加一项活动,则抽取的男生的人数为( )
A.5
B.6
C.7
D.8
4.某学校组织学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15人,则参加英语测试的学生人数是( )
A.45
B.50
C.55
D.60
5.如图是某运动员在某个赛季得分的茎叶统计图,则该运动员得分的中位数
是( )
1
2 5
2
2 3 5 6
3
1
A.2
B.3
C.22
D.23
6.一次选拔运动员,测得7名选手的身高(单位:cm)分布茎叶图如图所示,记录的平均身高为177
cm,有一名候选人的身高记录不清楚,其末位数记为x,那么x的值为( )
18
0
1
17
0
3
x
8
9
A.5
B.6
C.7
D.8
7.若回归直线的方程为=2-1.5x,则变量x增加一个单位时( )
A.y平均减少1.5个单位
B.y平均增加2个单位
C.y平均增加1.5个单位
D.y平均减少2个单位
8.判断如图中的两个变量,具有较强相关关系的是( )
9.一位母亲记录了她儿子3岁到9岁的身高,建立了儿子身高(单位:cm)与年龄的回归方程=7.19x+73.93,用这个方程预测儿子10岁时的身高,则下面的叙述正确的是( )
A.她儿子10岁时的身高一定是145.83
cm
B.她儿子10岁时的身高在145.83
cm以上
C.她儿子10岁时的身高在145.83
cm左右
D.她儿子10岁时的身高在145.83
cm以下
二、填空题
10.已知某商场新进3
000袋奶粉,为检查其三聚氰胺是否超标,现采用系统抽样的方法从中抽取150袋检查,若第一组抽出的号码是11,则第六十一组抽出的号码为________.?
11.如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图所示(各区间均为前闭后开,如[69.5,79.5),则[79.5,89.5)这一组的频数为________.?
12.(2020·湖南学业水平考试真题)某班视力近视的学生有15人,视力正常的学生有30人.为了解该班学生近视形成的原因,拟采用分层抽样的方法抽取部分学生,调查相关信息,则抽取的学生中视力近视与视力正常的人数之比为________.?
13.在如图所示的茎叶图中茎表示数据的整数部分,叶表示数据的小数部分,则比数7.5小的有______个.?
14.正常情况下,年龄在18岁到38岁的人,体重y(kg)对身高x(cm)的回归方程为=0.72x-58.2.张红同学(20岁)身高178
cm,她的体重应该在______kg左右.?
三、解答题
15.已知下列表格中数据的回归直线方程为=3.8x+.
x
2
3
4
5
6
y
251
254
257
262
266
(1)求实数的值;
(2)预测当x=9时y的值.
16.某高级中学共有学生3
000名,各年级男、女生人数如下表:
高一年级
高二年级
高三年级
女生
487
x
y
男生
513
560
z
已知在全校学生中随机抽取1名,抽到高二年级女生的概率是0.18.
(1)问高二年级有多少名女生?
(2)现对各年级用分层抽样的方法在全校抽取300名学生,问应在高三年级抽取多少名学生?
17.为了解今年某校高三毕业班准备报考飞行员学生的体重(单位:千克)情况,将所得的数据整理后,画出了频率分布直方图,如图所示,已知图中从左到右的前三个小组的频率之比为1∶2∶3,其中第2小组的频数为12.试求该校报考飞行员的总人数.
18.为了了解某校高一学生的身体健康状况,随机从甲、乙两个班各抽取了10名学生,测量他们的体重(单位:kg),并获得体重数据的茎叶图.
根据茎叶图,估计这两个班的学生体重的平均值.
19.(2018·湖南学业水平考试真题)某学校为了解学生对食堂用餐的满意度,从全校在食堂用餐的3
000名学生中,随机抽取100名学生对食堂用餐的满意度进行评分.根据学生对食堂用餐满意度的评分,得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)规定:学生对食堂用餐满意度的评分不低于80分为“满意”,试估计该校在食堂用餐的3
000名学生中“满意”的人数.
20.某公司为了了解本公司职员的早餐费用情况,抽样调查了100位职员的早餐日平均费用(单位:元),得到如图所示的频率分布直方图,图中标注a的数字模糊不清.
(1)试根据频率分布直方图求a的值,并估计该公司职员早餐日平均费用的众数;
(2)已知该公司有1
000名职员,试估计该公司有多少职员早餐日平均费用不少于8元?
PAGE第九章 统 计
核心速记·必考点夯基
一、
1.(1)不放回 都相等
(2)抽签 随机数
2.编号 分段间隔k 简单随机抽样 加上k l+k l+2k
3.互不交叉 一定的比例
二、
1.(1) 1 (2)中间 旁边
2.最多 最中间 (x1+x2+…+xn)
[(x1-)2+(x2-)2+…+(xn-)2]
三、
2.(1)一条直线 线性相关
(2)回归直线
典题突破·热考点精练
【例1】(1)A
(2)①因为0②因为高校B中抽取的教授数是高校A和C中抽取的教授数的,
所以(m+n)=72,解得m+n=108,所以三所高校的教授的总人数为m+n+72=180.
【例2】(1)C
(2)①由题图可知,最高的一组成绩为70~80分,所以众数为75.
②P(80~90)=0.015×10=0.15.
n(80~90)=20×P(80~90)=20×0.15=3(人),
P(90~100)=0.010×10=0.10,
n(90~100)=20×P(90~100)=20×0.10=2(人).
将80~90范围内的3人分别记为A1,A2,A3.
90~100范围内的2人分别记为B1,B2.
从5人中任选2人共有A1A2,A1A3,A1B1,A1B2,A2A3,A2B1,A2B2,A3B1,A3B2,B1B2
10种情况,其中两人来自同一组的概率P==.
【例3】【解析】(1)
(2)①由茎叶图知,样本的众数是50
g.
因为=×(45+46+46+49+50×3+51×2+52)=49,
所以估计这批食品实际重量的平均数为49
g.
②由茎叶图知,样本中不合格产品数为3,合格产品数为7.
估计这批食品重量的合格率为.
【例4】8
达标训练·合格考通关
1.A 2.B 3.B 4.B 5.D 6.D
7.A 8.B 9.C 10.1211 11.15
12.1∶2 13.6
14.【解析】用回归方程对身高为178
cm的人的体重进行预测,
当x=178时,=0.72×178-58.2=69.96(kg).
答案:69.96
15.【解析】(1)由题可得=4,=258,由=-,得=242.8.
(2)由(1)得=3.8x+242.8,当x=9时,=3.8×9+242.8=277.
16.【解析】(1)由=0.18得x=540.所以高二年级有540名女生.
(2)高三年级人数为:y+z=3
000-(487+513+540+560)=900.
所以×300=90(人).故应在高三年级抽取90名学生.
17.【解析】设报考飞行员的总人数为n,
设第一小组的频率为a,则有a+2a+3a+(0.013+0.037)×5=1,
解得a=0.125,
所以第2小组的频率为0.25.
又第2小组的频数为12,
则有0.25=,所以n=48.
18.【解析】甲班学生的平均体重为
=49(kg);
乙班学生的平均体重为
=48(kg).
19.【解析】(1)由频率分布直方图的矩形面积和为1可知:(0.040+0.030+0.015
+a+0.005)×10=1,所以a=0.010.
(2)样本中不低于80分的频率为(0.040+0.030)×10=0.7,
由样本估计总体,可得3
000名学生中不低于80分的频率约为0.7,所以满意的人数约为0.7×3
000=2
100.故该校在食堂用餐的3
000名学生中“满意”的人数约为2
100人.
20.【解析】(1)由0.05×2×3+0.10×2×2+a×2=1,得a=0.15,
由频率分布直方图可知,该公司职员早餐日平均费用的众数为=5.
(2)该公司早餐日平均费用不少于8元的人数为(0.05×2+0.05×2)×1
000=
200(名).
即该公司有200名职员早餐日平均费用不少于8元.
PAGE