《数学》必会基础题型——《统计》
知识点1:抽样方法 统计的基本思想:用样本去估计总体。
总体:所要考察对象的全体。
个体:总体中的每一个考察对象。
样本:从总体中抽取的一部分个体叫总体的一个样本。
样本容量:样本中个体的数目。
抽样:从总体中抽取一部分个体作为样本的过程叫抽样。
三种抽样方法对照表:
类别
共同点
各自特点
相互联系
适用范围
简单随
机抽样
抽样过程中每个个体被抽取的概率是相同的
从总体中逐个抽取
总体中的个体数较少,且均匀
系统
抽样
将总体均分成几个部分,按规则在各部分抽取
在第一部分抽样时采用简单随机抽样
总体中的个体数较多,且均匀
分层
抽样
将总体分成几层,分层进行抽取
各层抽样时采用简单随机抽样或系统
总体由差异明显的几部分组成
必会题型:
1.为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是( )
A.总体是240 B.个体是每一个学生 C.样本是40名学生 D.样本容量是40
2.为了正确所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是( )
A.总体 B.个体 C.总体的一个样本 D.样本容量
3.一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是 。
4.下列抽样中不是系统抽样的是( )
A.从标有1~15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样。
B.工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验。
C.搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止。
D.电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈。
5.从学号为0~50的我班50名学生中随机选取5名同学进行考察,采用系统抽样的方法,则所选5名学生的学号可能是( )
A.1,2,3,4,5 B.5,16,27,38,49
C.2, 4, 6, 8,10 D.4,13,22,31,40
知识点2:频率分布直方图
1.频数条形图
星期
一
二
三
四
五
件数
6
2
3
5
1
累计
6
8
11
16
17
例题:下表是某学校一个星期中收交来的失物件数,请将5天中收交来的失物数用条形图表示。
分组
频数
频率
频率/组距
[150.5,152.5)
4
0.04
0.02
[152.5,154.5)
8
0.08
0.04
[154.5,156.5)
8
0.08
0.04
[156.5,158.5)
11
0.11
0.055
[158.5,160.5)
22
0.22
0.11
[160.5,162.5)
19
0.19
0.095
[162.5,164.5)
14
0.14
0.07
[164.5,166.5)
7
0.07
0.035
[166.5,168.5)
4
0.04
0.02
[168.5,170.5]
3
0.03
0.015
合计
100
1
0.5
2.频率分布表
例题:右表是从我校学生中抽取的100名学生身高的频率分布表。
极差:样本数据中的最大值与最小值的差。
组距:一组的两个端点的数的差。
组中值:一组的两个端点的数的和的平均数。
3.频率分布直方图
根据频率分布表作直角坐标系,横轴表示身高,纵轴表示频率/组距。
知识点3:茎叶图
例题:甲、乙两篮球运动员在上赛季每场比赛的得分如下,试比较这两位运动员的得分水平。
甲 12,15,24,25,31,31,36,36,37,39,44,49,50。
乙 8,13,14,16,23,26,28,33,38,39,51
解:画出两人得分的茎叶图。
从这个茎叶图可以看出甲运动员的得分比较对称,平均得分及中位数、众数都是30多分;乙运动员的得分除一个51外,也大致对称,平均得分及中位数、众数都是20多分,因此甲运动员发挥比较稳定,总体得分情况比乙好。
必会题型:
1.在我班的某次数学考试中取出一个容量为20的数据样本,分组与频数为:[10,20]2个,(20,30]3个,(30,40]4个, (40,50]5个, (50,60]4个, (60,70]2个,则整个样本数据在区间上的可能性为 。估计我班这次考试的平均分为 。
2.下表为某校500名12岁男孩中用系统抽样得出的120人的身高。(单位cm)
区间
[122,126)
[126,130)
[130,134)
[134,138)
[138,142)
人数
5
8
10
22
33
区间
[142,146)
[146,150)
[150,154)
[154,158)
人数
20
11
6
5
(1)列出样本频率分布表;
(2)估计身高小于134cm的人数占总人数的百分比;
(3)估计该校12岁男孩的平均身高。
解:(1)样本频率分布表如右:
(2)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%。
(3)平均身高为
知识点4:平均数
1.算术平均数:的平均数为。
睡眠时间
人数
频率
[6,6.5)
5
0.05
[6.5,7)
17
0.17
[7,7.5)
33
0.33
[7.5,8)
37
0.37
[8,8.5)
6
0.06
[8.5,9]
2
0.02
合 计
100
1
2.加权平均数:
若的频率分别为,
则其平均数。
例题:右图是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该学生的日平均睡眠时间。
解法1:该校学生的日平均睡眠时间约为:
解法2:该校学生的日平均睡眠时间约为:
知识点5:标准差
方差:若的平均数为,则方差。
方差的算术平方根称为这组数据的标准差。标准差可以刻画数据的稳定程度。
方差和标准差的意义:标准差是描述样本和总体的波动大小的特征数,标准差大说明数据的离散程度大(波动大);标准差小说明数据的离散程度小(波动小)。
品种
第1年
第2年
第3年
第4年
第5年
甲
9.8
9.9
10.1
10
10.2
乙
9.4
10.3
10.8
9.7
9.8
例题:甲、乙两种水稻品种连续5年的平均单位面积产量如右表,据此估计哪一种水稻品种的产量比较稳定。
必会题型:
1.已知一个样本中的数据有个,个,个,则该样本的平均数是 。
2.若两组数和的样本平均数分别是和,则
①的平均数是 。②的平均数是 。
③的平均数是 。
3.样本的平均数为6,样本的平均数为3,则样本的平均数为 。
组号
1
2
3
4
5
6
7
8
频数
10
13
14
15
13
12
9
4.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 、 。
5.右表为容量100的样本数据分为8组,则第三组的频率为 。
组号
1
2
3
4
5
6
频数
0.05
0.1
a
b
0.2
0.1
变式:右表为容量100的样本分为6组:
已知第3组有20人,则a、b的值分别为 、 。
6.(2009年湖北卷文科)右图是样本容量为200的频率分布直方图,则样本数据落在[6,10]内的频数为 ,数据落在(2,10)内的概率约为 。