2.2用样本估计总体学案(3份)

文档属性

名称 2.2用样本估计总体学案(3份)
格式 zip
文件大小 2.2MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2019-05-21 08:32:30

文档简介

§2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体分布(一)
学习目标 1.学会用频率分布表,画频率分布直方图表示样本数据.2.能通过频率分布表或频率分布直方图对数据做出总体统计.
知识点一 数据分析的基本方法
思考 通过抽样获得的原始数据有什么缺点?
答案 因为通过抽样获得的原始数据多而且杂乱,无法直接从中理解它们的含义,并提取信息,也不便于我们用它来传递信息.
梳理 (1)借助于图形
分析数据的一种基本方法是用图将它们画出来,此方法可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.
(2)借助于表格
分析数据的另一种方法是用紧凑的表格改变数据的排列方式,此方法是通过改变数据的构成形式,为我们提供解释数据的新方式.
知识点二 频率分布表与频率分布直方图
思考 要做频率分布表,需要对原始数据做哪些工作?
答案 分组,频数累计,计算频数和频率.
梳理 (1)频数指某组中包含的个体数,各组频数和等于样本容量;频率=,各组频率和等于1.
(2)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用小长方形的面积来表示,各小长方形的面积的总和等于1.
1.频率分布直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值.
( √ )
2.频率分布直方图中小长方形的面积表示该组的个体数.( × )
3.频率分布直方图中所有小长方形面积之和为1.( √ )
类型一 频率分布概念的理解
例1 一个容量为100的样本,其数据的分组与各组的频数如下:
组别
[0,10)
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
[60,70]
频数
12
13
24
15
16
13
7
则样本数据落在[10,40)上的频率为(  )
A.0.13 B.0.39 C.0.52 D.0.64
考点 频率分布表
题点 求指定组的频率
答案 C
解析 由题意可知频数在[10,40)的有13+24+15=52(个),所以频率为=0.52.故选C.
跟踪训练1 容量为100的某个样本,数据拆分为10组,并填写频率分布表,若前七组频率之和为0.79,而剩下的三组的频率依次相差0.05,则剩下的三组中频率最大的一组频率为________.
考点 频率分布表
题点 求指定组的频率
答案 0.12
解析 设剩下的三组中频率最大的一组的频率为x,则另两组的频率分别为x-0.05,x-0.1,而由频率和为1得0.79+(x-0.05)+(x-0.1)+x=1,解得x=0.12.
类型二 频率分布直方图的绘制
例2 如表所示给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).
区间界限
[122,126)
[126,130)
[130,134)
[134,138)
[138,142)
人数
5
8
10
22
33
区间界限
[142,146)
[146,150)
[150,154)
[154,158]
人数
20
11
6
5
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)估计身高小于134 cm的人数占总人数的百分比.
考点 频率分布直方图
题点 作频率分布直方图
解 (1)样本频率分布表如下:
分组
频数
频率
[122,126)
5
0.04
[126,130)
8
0.07
[130,134)
10
0.08
[134,138)
22
0.18
[138,142)
33
0.28
[142,146)
20
0.17
[146,150)
11
0.09
[150,154)
6
0.05
[154,158]
5
0.04
合计
120
1.00
(2)其频率分布直方图如下:
(3)由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.
反思与感悟 频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.
跟踪训练2 一个农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):
6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6
5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8
6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5
6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4
6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4
6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6
5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0
5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7
5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0
6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
根据上面的数据列出频率分布表,绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35 cm之间的麦穗所占的百分比.
考点 频率分布直方图
题点 作频率分布直方图
解 (1)计算极差:7.4-4.0=3.4.
(2)决定组距与组数:
若取组距为0.3,因为≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12.
(3)决定分点:
使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.
(4)列频率分布表:
分组
频数
频率
[3.95,4.25)
1
0.01
[4.25,4.55)
1
0.01
[4.55,4.85)
2
0.02
[4.85,5.15)
5
0.05
[5.15,5.45)
11
0.11
[5.45,5.75)
15
0.15
[5.75,6.05)
28
0.28
[6.05,6.35)
13
0.13
[6.35,6.65)
11
0.11
[6.65,6.95)
10
0.10
[6.95,7.25)
2
0.02
[7.25,7.55]
1
0.01
合计
100
1.00
(5)绘制频率分布直方图如图.
从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm之间的麦穗约占41%.
类型三 频率分布表及频率分布直方图的应用
例3 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:
组号
分组
频数
1
[0,2)
6
2
[2,4)
8
3
[4,6)
17
4
[6,8)
22
5
[8,10)
25
6
[10,12)
12
7
[12,14)
6
8
[14,16)
2
9
[16,18]
2
合计
100
(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;
(2)求频率分布直方图中的a,b的值;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).
考点 频率分布表
题点 求累计频率
解 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),
所以样本中的学生一周课外阅读时间少于12小时的频率是1-=0.9.
故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.
(2)课外阅读时间落在[4,6)组内的有17人,频率为0.17,所以a===0.085.课外阅读时间落在[8,10)组内的有25人,频率为0.25,所以b===0.125.
(3)样本中的100名学生该周课外阅读时间的平均数在第4组.
反思与感悟 在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.
跟踪训练3 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少?
考点 频率分布直方图
题点 求频率及容量
解 (1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的,
因此第二小组的频率为=0.08.
因为第二小组的频率=,
所以样本容量===150.
(2)由直方图可估计该校全体高一年级学生的达标率约为×100%=88%.

1.从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8,其累计频率为0.4,则这个样本的容量是(  )
A.20 B.40 C.70 D.80
考点 频率分布表
题点 求频数及容量
答案 A
解析 由已知不超过70分的人数为8,累计频率为0.4,则这个样本容量n==20.故选A.
2.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为(  )
A.20 B.30 C.40 D.50
考点 频率分布直方图
题点 求频数及容量
答案 B
解析 样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.
3.统计某校1 000名学生的数学水平测试成绩,得到样本的频率分布直方图如图所示.若满分为100分,规定不低于60分为及格,则及格率是(  )
A.20% B.25% C.60% D.80%
考点 频率分布直方图
题点 求频率和累计频率
答案 D
解析 样本中及格的频率为
(0.025+0.035+0.010+0.010)×10=0.8=80%,由样本估计总体,得及格率是80%.故选D.
4.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,则估计样本在[40,50),[50,60)内的数据个数之和是________.
考点 频率分布表
题点 求频率及容量
答案 21
解析 根据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.
∵样本中数据在[20,60)内的频率为0.6,样本容量为50,
∴=0.6,解得x+y=21.
即样本在[40,50),[50,60)内的数据个数之和为21.
5.如图所示是总体的一个样本频率分布直方图,且在[15,18)内的频数为8.
(1)求样本在[15,18)内的频率;
(2)求样本容量;
(3)若在[12,15)内的小矩形面积为0.06,求在[18,33)内的频数.
考点 频率分布直方图
题点 求频率及容量
解 由样本频率分布直方图可知组距为3.
(1)由样本频率分布直方图得样本在[15,18)内的频率等于×3=.
(2)∵样本在[15,18)内频数为8,由(1)可知,样本容量为=8×=50.
(3)∵在[12,15)内的小矩形面积为0.06,故样本在[12,15)内的频率为0.06,故样本在[15,33)内的频数为50×(1-0.06)=47,又在[15,18)内频数为8,故在[18,33)内的频数为47-8=39.
1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.
2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.
3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.
一、选择题
1.从一堆苹果中任取10个,称得它们的质量如下(单位:克):
125 120 122 105 130 114 116 95 120 134
则样本数据落在[114.5,124.5)内的频率为(  )
A.0.2 B.0.3
C.0.4 D.0.5
考点 频率分布表
题点 求指定组的频率
答案 C
解析 在125,120,122,105,130,114,116,95,120,134这10个数字中,落在[114.5,124.5)内的有116,120,120,122,共4个,
∴样本数据在[114.5,124.5)内的频率为=0.4.故选C.
2.容量为100的样本数据,按从小到大的顺序分为8组,如下表:
组号
1
2
3
4
5
6
7
8
频数
10
13
x
14
15
13
12
9
第三组的频数和频率分别是(  )
A.14和0.14 B.0.14和14
C.和0.14 D.和
考点 频率分布表
题点 求指定组的频率
答案 A
解析 x=100-(10+13+14+15+13+12+9)=100-86=14,第三组的频率为=0.14.
3.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出(单位:元)在[50,60]内的学生有30人,则n的值为(  )
A.100 B.1 000
C.90 D.900
考点 频率分布表
题点 求频数及容量
答案 A
解析 由题意可知,前三组的频率之和为(0.01+0.024+0.036)×10=0.7,
∴支出在[50,60)内的频率为1-0.7=0.3,
∴n==100.
4.某调查机构调查了某地100个新生婴儿的体重,并根据所得数据画出了样本的频率分布直方图(如图所示),则这100个新生婴儿中,体重(单位:kg)在[3.2,4.0)的人数是(  )
A.30 B.40 C.50 D.55
考点 频率分布直方图
题点 求频数及容量
答案 B
解析 在频率分布直方图中小长方形的面积为频率.
在[3.2,3.6)内的频率为0.625×0.4=0.25,频数为0.25×100=25,
在[3.6,4.0)内的频率为0.375×0.4=0.15,频数为0.15×100=15.
则这100个新生婴儿中,体重在[3.2,4.0)内的有25+15=40(人).故选B.
5.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速在[50,60)内的汽车有(  )
A.30辆 B.40辆 C.60辆 D.80辆
考点 频率分布直方图
题点 求频数及容量
答案 C
解析 因为小长方形的面积即为对应的频率,
时速在[50,60)内的频率为0.3,
所以有200×0.3=60(辆).
6.对某种电子元件使用寿命跟踪调查,所得样本频率分布直方图如图.由图可知,这一批电子元件中寿命在100~300 h的电子元件的数量与寿命在300~600 h的电子元件的数量的比是(  )
A.1∶2 B.1∶3
C.1∶4 D.1∶6
考点 频率分布直方图
题点 求频率和累计频率
答案 C
解析 由题意,知数量的比即为所对应的小矩形的面积和之比,即1∶4.
7.为了解某幼儿园儿童的身高情况,抽查该园120名儿童的身高绘制成如图所示的频率分布直方图,则抽查的120名儿童中身高大于或等于98 cm且小于104 cm的有(  )
A.90名 B.75名
C.65名 D.40名
考点 频率分布直方图
题点 求频数及容量
答案 A
解析 由图可知身高大于或等于98 cm且小于104 cm的儿童的频率为(0.1+0.15+0.125)×2=0.75,抽查的120名儿童中有120×0.75=90(名)儿童的身高大于或等于98 cm且小于104 cm.
8.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n的值为(  )
A.20 B.27 C.6 D.60
考点 频率分布直方图
题点 求频数及容量
答案 D
解析 ∵n·=27,
∴n=60.
9.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为(  )
A.588 B.480
C.450 D.120
考点 频率分布直方图
题点 求频数及容量
答案 B
解析 ∵少于60分的学生人数为600×(0.05+0.15)=120,
∴不少于60分的学生人数为480.
二、填空题
10.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.
考点 频率分布直方图
题点 求频数及容量
答案 9
解析 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.
11.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.则频率分布直方图中x的值为 __________.
考点 频率分布直方图
题点 求频率和累计频率
答案 0.004 4
解析 ∵(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,
∴x=0.004 4.
12.已知某一段公路限速70千米/时,现抽取400辆通过这一段公路的汽车的速度,其频率分布直方图如图所示,则这400辆汽车中在该路段超速的有________辆.
考点 频率分布直方图
题点 求频数及容量
答案 80
解析 [70,80)的频率为1-(0.01×10+0.03×10+0.04×10)=0.2,
∴[70,80)内的频数为0.2×400=80.
三、解答题
13.为加强中学生实践创新能力和团队精神的培养,促进教育教学改革,某市教育局将举办全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了解成绩情况,从中抽取50名学生的成绩(得分均为整数,满分为100分)进行统计,请你根据尚未完成的频率分布表解答下列问题:
分组
频数
频率

[60.5,70.5)
a
0.26

[70.5,80.5)
15
c

[80.5,90.5)
18
0.36

[90.5,100.5]
b
d
合计
50
e
(1)求a,b,c,d,e的值;
(2)作出频率分布直方图.
考点 频率分布直方图
题点 作频率分布直方图
解 (1)根据题意,得分在[60.5,70.5)内的频数是a=50×0.26=13,在[90.5,100.5]内的频数是b=50-13-15-18=4,在[70.5,80.5)内的频率是c==0.30,在[90.5,100.5]内的频率是d==0.08,频率和e=1.
(2)根据频率分布表作出频率分布直方图,如图所示.
四、探究与拓展
14.为了解某地居民的月收入情况,一个社会调查机构调查了20 000人,并根据所得数据画出样本的频率分布直方图如图所示(最后一组包含两端值,其他组包含最小值,不包含最大值).现按月收入分层,用分层抽样的方法在这20 000人中抽出200人进一步调查,则月收入在[1 500,2 000)(单位:元)内的应抽取________人.
答案 40
解析 月收入在[1 500,2 000)的频率为1-(0.000 2+0.000 5×2+0.000 3+0.000 1)×500=0.2,故应抽取200×0.2=40(人).
15.如图是根据某中学为地震灾区捐款的情况而制作的统计图.已知该校在校学生3 000人,根据统计图计算该校共捐款________元.
考点 频率分布直方图
题点 求频数及容量
答案 37 770
解析 根据统计图,得
高一人数为3 000×32%=960,
捐款960×15=14 400(元);
高二人数为3 000×33%=990,
捐款990×13=12 870(元);
高三人数为3 000×35%=1 050,
捐款1 050×10=10 500(元).
所以该校学生共捐款14 400+12 870+10 500=37 770(元).
2.2.1 用样本的频率分布估计总体分布(二)
学习目标 1.了解频率分布折线图和总体密度曲线的定义.2.理解茎叶图的概念,会画茎叶图.3.了解频率分布直方图、频率分布折线图、茎叶图的各自特征,学会选择不同的方法分析样本的分布,从而作出总体估计.
知识点一 频率分布折线图和总体密度曲线
1.频率分布折线图
连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
2.总体密度曲线
在样本频率分布直方图中,随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线,它反映了总体在各个范围内取值的百分比.
知识点二 茎叶图
思考 茎叶图是表示样本数据分布情况的一种方法,那么“茎”、“叶”分别指的是哪些数?
答案 茎叶图中,“叶”是数据的最后一个数字,其前面的数字作为“茎”.
梳理 茎叶图
(1)将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).
(2)茎叶图的优点与不足
①优点:一是原始数据信息在图中能够保留,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.
②不足:当样本数据较多时,茎叶图就显得不太方便.
1.频率分布折线图就是总体密度曲线.( × )
2.对于两位数的茎叶图,中间的数字表示十位数,旁边的数字表示个位数.( √ )
3.对于三位数的茎叶图,中间的数字表示百位数,旁边的数字表示十位和个位数.( × )

类型一 茎叶图及其应用

例1 某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产量数据(单位:千克)如下:
品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445, 451,454.
品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416, 422,430.
(1)画出茎叶图;
(2)用茎叶图处理现有的数据,有什么优点?
(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,得出统计结论.
考点 茎叶图
题点 茎叶图的应用
解 (1)茎叶图如图.
(2)样本容量不大,画茎叶图很方便,此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息丢失,而且还可以随时记录新的数据.
(3)通过观察茎叶图可以看出:
①品种A亩产量的平均数比品种B亩产量的平均数大;
②品种A的亩产量波动比品种B的亩产量波动大,故品种A的亩产量稳定性较差.
反思与感悟 (1)画茎叶图时,用中间的数表示数据的十位和百位数,两边的数分别表示两组数据的个位数.要先确定中间的数取数据的哪几位,填写数据时边读边填.比较数据时从数据分布的对称性、中位数、稳定性等几方面来比较.
(2)绘制茎叶图的关键是分清茎和叶,一般地说数据是两位数时,十位数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶.
跟踪训练1 某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:
甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;
乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.
试制作茎叶图来对比描述这些数据.
考点 茎叶图
题点 茎叶图的应用
解 以十位数字为茎,个位数字为叶,制作茎叶图如图:

例2 某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:
A地区:62 73 81 92 95 85 74 64 53 76
78 86 95 66 97 78 88 82 76 89
B地区:73 83 62 51 91 46 53 73 64 82
93 48 65 81 74 56 54 76 65 79
根据两组数据作出两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).
考点 茎叶图
题点 茎叶图的应用
解 两地区用户满意度评分的茎叶图如图:
通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.
反思与感悟 茎叶图可保留原始数据,还可以通过叶的疏密情形,得到样本数据的分布离散情形.
跟踪训练2 某中学甲、乙两名同学最近几次的数学考试成绩情况如下:
甲的得分:95,81,75,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
考点 茎叶图
题点 茎叶图的应用
解 甲、乙两人数学成绩的茎叶图如图所示.
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的;甲同学的得分情况除一个特殊得分外,也大致对称,但分数分布相对于乙来说,趋向于低分阶段.因此乙同学发挥比较稳定,总体得分情况比甲同学好.
类型二 茎叶图与频率分布直方图的综合应用
例3 在某市的青少年才艺表演评比活动中,参赛选手成绩的茎叶图和频率分布直方图都受到不同程度的破坏,可见部分如图所示,据此回答以下问题:
求参赛总人数和频率分布直方图中[80,90)矩形的高,并补全频率分布直方图.
考点 频率分布直方图
题点 频率分布直方图的应用
解 由茎叶图知,分数在[50,60)的频数为2.
由频率分布直方图知,分数在[50,60)的频率为0.008×10=0.08,所以参赛总人数为=25.
所以分数在[80,90)的人数为25-2-7-10-2=4,
所以分数在[80,90)的频率为=0.16,
故频率分布直方图中[80,90)矩形的高为=0.016.
补全频率分布直方图,如图所示.
反思与感悟 茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录,但样本容量较大,或者需要比较三组以上的数据时,使用茎叶图就不合适;而频率分布表和频率分布直方图可以处理样本容量很大的数据,但损失了样本的原始数据,而且必须在完成抽样后才能制作.
跟踪训练3 某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是(  )
考点 用样本的频率分布估计总体分布综合应用
题点 用频率分布直方图估计总体
答案 A
解析 方法一 由题意知样本容量为20,组距为5.
列表如下:
分组
频数
频率

[0,5)
1

0.01
[5,10)
1

0.01
[10,15)
4

0.04
[15,20)
2

0.02
[20,25)
4

0.04
[25,30)
3

0.03
[30,35)
3

0.03
[35,40]
2

0.02
合计
20
1
观察各选项的频率分布直方图知选A.
方法二 由茎叶图知落在区间[0,5)与区间[5,10)上的频数相等,故频率、也分别相等,比较四个选项知A正确,故选A.
1.如果想用统计图来反映各数据的变化趋势,比较合适的统计图是(  )
A.条形图 B.折线图 C.扇形图 D.其他图形
考点 频率分布折线图
题点 频率分布折线图
答案 B
解析 能反映各数据的变化趋势的统计图是折线图.
2.如图是总体密度曲线,下列说法正确的是(  )
A.组距越大,频率分布折线图越接近于它
B.样本容量越小,频率分布折线图越接近于它
C.阴影部分的面积代表总体在(a,b)内取值的百分比
D.阴影部分的平均高度代表总体在(a,b)内取值的百分比
考点 频率分布折线图
题点 频率分布折线图
答案 C
3.从甲、乙两种玉米苗中各抽6株,分别测得它们的株高如图所示(单位:cm).根据数据估计(  )
A.甲种玉米比乙种玉米不仅长得高而且长得整齐
B.乙种玉米比甲种玉米不仅长得高而且长得整齐
C.甲种玉米比乙种玉米长得高但长势没有乙整齐
D.乙种玉米比甲种玉米长得高但长势没有甲整齐
考点 茎叶图
题点 茎叶图的应用
答案 D
解析 由题中的茎叶图可知,甲种玉米的株高集中在20 cm段,乙种玉米的株高集中在30 cm和40 cm段,则甲种玉米的平均株高小于乙种玉米的平均株高,但乙种玉米的株高较分散,故选D.
4.从甲、乙两个城市所有的自动售货机中随机抽取16台,记录了上午8∶00~11∶00之间各自的销售情况(单位:元):
甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;
乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.
试用纵坐标为频数的频数分布直方图与茎叶图的方式分别表示上面的数据,并简要说明各自的优点.
考点 用样本的频率分布估计总体分布综合应用
题点 用频率分布直方图估计总体
解 用频数分布直方图表示如图:
茎叶图如图,两竖线中间的数字表示甲、乙销售额的十位数,两边的数字表示甲、乙销售额的个位数.
可以看出频数分布直方图能直观地反映数据分布的大致情况,并且能够清晰地表示出各个区间的具体数目;而用茎叶图表示有关数据,对数据的记录和表示都带来方便.
1.估计总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.
2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录;而频率分布表和频率分布直方图则损失了样本的原始信息,必须在完成抽样后才能制作.
一、选择题
1.当样本数据增加时,下列说法正确的是(  )
A.频率分布表不会变化
B.茎叶图不会变化
C.频率折线图不会变化
D.频率分布直方图变化不太大
考点 频率分布折线图
题点 频率分布折线图
答案 D
2.在茎叶图中比40大的数据的个数为(  )
A.1 B.4 C.3 D.5
考点 茎叶图
题点 茎叶图的应用
答案 C
3.如图所示,茎叶图表示某城市一台自动售货机在16天内的销售额情况(单位:元),图中的数字7表示的意义是这台自动售货机该天的销售额为(  )
A.7元 B.70元
C.27元 D.72元
考点 茎叶图
题点 茎叶图的应用
答案 C
解析 茎表示的是十位数字,叶表示的是个位数字,故数字7表示27.
4.某校举行演讲比赛,9位评委给选手A打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若统计员计算无误,则数字x应该是(  )
A.5 B.4 C.3 D.2
考点 茎叶图
题点 茎叶图的应用
答案 D
解析 去掉最低分87,去掉最高分94(假设x≤4),则7×91=80×2+9+8+90×5+2+3+2+1+x,
∴x=2,符合题意.
同理可验证x>4不合题意.
5.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为(  )
A.0.2 B.0.4 C.0.5 D.0.6
考点 茎叶图
题点 茎叶图的应用
答案 B
解析 依据茎叶图,在区间[22,30)内频数为4,样本容量为10,故对应的频率为=0.4,故选B.
6.甲、乙两名同学12次考试中数学成绩的茎叶图如图所示,则下列说法正确的是(  )
A.甲同学比乙同学发挥稳定,且平均成绩也比乙同学高
B.甲同学比乙同学发挥稳定,但平均成绩比乙同学低
C.乙同学比甲同学发挥稳定,且平均成绩也比甲同学高
D.乙同学比甲同学发挥稳定,但平均成绩比甲同学低
考点 茎叶图
题点 茎叶图的应用
答案 C
解析 由茎叶图的性质可知乙同学比甲同学发挥稳定,且平均成绩比甲同学高.
7.如图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知(  )
A.甲运动员的成绩好于乙运动员
B.乙运动员的成绩好于甲运动员
C.甲、乙两名运动员的成绩没有明显的差异
D.甲运动员的最低得分为0分
考点 茎叶图
题点 茎叶图的应用
答案 A
解析 从茎叶图上看,由于甲运动员的成绩多数集中在31以上,而乙运动员的成绩集中在12到29之间,所以甲运动员成绩较好.
8.给出如图所示的三幅统计图及四个命题:
①从折线统计图能看出世界人口的变化情况;
②2050年非洲人口将达到大约15亿;
③2050年亚洲人口比其他各洲人口的总和还要多;
④从1957年到2050年各洲中北美洲人口增长速度最慢.
其中命题正确的有(  )
A.①② B.①③
C.①④ D.②④
考点 用样本的频率分布估计总体分布综合应用
题点 用频率分布直方图估计总体
答案 B
解析 ①从折线统计图能看出世界人口的变化情况,故①正确;②从条形统计图中可得:2050年非洲人口大约将达到18亿,故②错误;③从扇形统计图中能够明显地得到结论:2050年亚洲人口比其他各洲人口的总和还要多,故③正确;④由题中三幅统计图并不能得出从1957年到2050年中哪个洲人口增长速度最慢,故④错误.因此正确的命题有①③.故选B.
9.某中学举行了一次“环保知识竞赛”活动.为了了解本次竞赛学生的成绩情况,从中抽取了部分学生的成绩(得分取正整数,满分为100分)作为样本(样本容量为n)进行统计.按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出了频率分布直方图,并作出了分数的茎叶图(图中仅列出得分在[50,60),[90,100]的数据),如图.
则样本容量n和频率分布直方图中x,y的值分别为(  )
A.50,0.030,0.004 B.30,0.040,0.003
C.30,0.030,0.040 D.50,0.300,0.400
考点 频率分布直方图
题点 频率分布直方图的应用
答案 A
解析 由题意可知,样本容量n==50,y==0.004,x=0.100-0.004-0.010-0.016-0.040=0.030.
二、填空题
10.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.
根据茎叶图判断________班的平均身高较高.
考点 茎叶图
题点 茎叶图的应用
答案 乙
解析 由茎叶图可知:甲班身高集中于160~179之间,而乙班身高集中于170~180之间.因此乙班平均身高高于甲班.
11.如图所示是一个班的数学成绩的茎叶图,则优秀率(90分以上)是________,最低分是________.
考点 茎叶图
题点 茎叶图的应用
答案 4% 51
解析 ∵总数为25,∴优秀率为×100%=4%.最低分是91.
12.从甲、乙两个班中各随机选出15名同学进行随堂测验,成绩的茎叶图如图所示,则甲、乙两班的最高成绩分别是______,______.从图中看,________班的平均成绩较高.
考点 茎叶图
题点 茎叶图的应用
答案 96 92 乙
解析 由茎叶图可知,甲班的最高分是96,乙班的最高分是92.甲班的成绩集中在(60,80)内,乙班的成绩集中在(70,90)内,故乙班的平均成绩较高.
三、解答题
13.甲、乙两个网站为了了解各自受欢迎的程度,分别随机选取了14天记录上午8:00~10:00间各自的点击量:
甲:73,24,58,72,64,38,66,70,20,41,55,67,8,25;
乙:12,37,21,5,54,52,61,45,19,6,19,36,42,14.
你能用哪些方法表示上面的数据?你认为甲、乙两个网站哪个更受欢迎?
考点 茎叶图
题点 茎叶图的应用
解 方法一 列频数分布表如下:
点击量的范围
甲的频数
乙的频数
[0,10)
1
2
[10,20)
0
4
[20,30)
3
1
[30,40)
1
2
[40,50)
1
2
[50,60)
2
2
[60,70)
3
1
[70,80]
3
0
由频数分布可以看出,甲网站的点击量多集中在[50,80]上,而乙网站的点击量多集中在[0,60)上,从数据的分布情况来看,甲网站更受欢迎.
方法二 画出茎叶图如图所示.
由茎叶图可以看出,甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方.从数据的分布情况来看,甲网站更受欢迎.
四、探究与拓展
14.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.
考点 频率分布直方图
题点 频率分布直方图的应用
答案 24
解析 底部周长在[80,90)的频率为0.015×10=0.15,
底部周长在[90,100)的频率为0.025×10=0.25,
样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24.
15.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图(如图)表示,据此可估计该校上学期200名教师中,使用多媒体进行教学的次数在[15,25)内的人数为________.
考点 茎叶图
题点 茎叶图的应用
答案 60
解析 由茎叶图,知抽取的20名教师中使用多媒体进行教学的次数在[15,25)内的人数为6,频率为,故200名教师中使用多媒体进行教学的次数在[15,25)内的人数为×200=60.
2.2.2 用样本的数字特征估计总体的数字特征
学习目标 1.理解样本数据标准差的意义和作用,学会计算数据的标准差.2.会用样本的基本数字特征来估计总体的基本数字特征.
知识点一 众数、中位数、平均数
思考 平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点?
答案 平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大.
梳理 众数、中位数、平均数定义
(1)众数:一组数据中出现次数最多的数.
(2)中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.
(3)平均数:如果n个数x1,x2,…,xn,那么=(x1+x2+…+xn)叫做这n个数的平均数.
知识点二 方差、标准差
标准差、方差的概念及计算公式
(1)标准差是样本数据到平均数的一种平均距离,一般用s表示.s= .
(2)标准差的平方s2叫做方差.
s2=[(x1-)2+(x2-)2+…+(xn-)2](xn是样本数据,n是样本容量,是样本平均数).
(3)标准差(或方差)越小,数据越稳定在平均数附近.s=0时,每一组样本数据均为.
知识拓展:平均数、方差公式的推广
(1)若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)设数据x1,x2,…,xn的平均数为,方差为s2,则
a.s2=[(x+x+…+x)-n2];
b.数据x1+a,x2+a,…,xn+a的方差也为s2;
c.数据ax1,ax2,…,axn的方差为a2s2.
1.中位数是一组数据中间的数.( × )
2.众数是一组数据中出现次数最多的数.( √ )
3.一组数据的标准差越小,数据越稳定,且稳定在平均数附近.( √ )
类型一 众数、中位数、平均数的应用

例1 某公司的各层人员及工资数构成如下:
人员:经理1人,周工资22 000元;高层管理人员6人,周工资均为1 800元;高级技工5人,周工资均为1 500元;工人10人,周工资均为1 000元;学徒1人,周工资为500元.
(1)计算该公司员工周工资的众数、中位数、平均数;
(2)这个问题中,平均数能客观地反映这个公司的工资水平吗?
考点 众数、平均数、中位数的综合
题点 具体数据中的众数、平均数、中位数
解 (1)众数为1 000,中位数为1 500,平均数为
≈2 209.
(2)虽然平均数为2 209,但由给出的数据可见,只有经理的周工资在平均数以上,其余的都在平均数以下,故用平均数不能客观地反映该公司的工资水平.
反思与感悟 (1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
(2)众数考查各个数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中部分数据多次重复出现时,众数往往更能反映问题.
(3)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能在所给的数据中,也可能不在所给的数据中.
(4)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动.
(5)因为平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质,也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于全体样本数据的信息.但平均数受数据的极端值的影响较大,使平均数在估计总体时可靠性降低.
跟踪训练1 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
成绩(单位:m)
1.50
1.60
1.65
1.70
1.75
1.80
1.85
1.90
人数
2
3
2
3
4
1
1
1
分别求这些运动员成绩的众数、中位数与平均数.
考点 众数、平均数、中位数的综合
题点 具体数据中的众数、平均数、中位数
解 在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70.这组数据的平均数是=(1.50×2+1.60×3+…+1.90×1)=≈1.69(m).
答 17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.

例2 已知一组数据:
125 121 123 125 127 129 125 128 130 129
126 124 125 127 126 122 124 125 126 128
(1)填写下面的频率分布表:
分组
频数
频率
[121,123)
[123,125)
[125,127)
[127,129)
[129,131]
合计
(2)作出频率分布直方图;
(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数.
考点 众数、平均数、中位数的综合
题点 频率分布直方图中的众数、平均数、中位数
解 (1)频率分布表如下:
分组
频数
频率
[121,123)
2
0.10
[123,125)
3
0.15
[125,127)
8
0.40
[127,129)
4
0.20
[129,131]
3
0.15
合计
20
1.00
(2)频率分布直方图如下:
(3)在[125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得众数126,事实上,众数的精确值为125.图中虚线对应的数据是125+2×=126.25,事实上中位数为125.5.使用“组中值”求平均数:=122×0.1+124×0.15+126×0.4+128×0.2+130×0.15=126.3,
平均数的精确值为=125.75.
反思与感悟 (1)利用频率分布直方图估计数字特征
①众数是最高的矩形的底边中点的横坐标;
②中位数左右两侧直方图的面积相等;
③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(2)利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.
跟踪训练2 一批乒乓球,随机抽取100个进行检查,球的直径频率分布直方图如图.试估计这个样本的众数、中位数和平均数.
考点 众数、平均数、中位数的综合
题点 频率分布直方图中的众数、平均数、中位数
解 众数==40;
中位数为39.99+=39.998;
四个矩形的面积分别是0.02×5=0.1, 0.02×10=0.2, 0.02×25=0.5, 0.02×10=0.2.
平均数为39.96×0.1+39.98×0.2+40×0.5+40.02×0.2=39.996.
类型二 标准差、方差的应用
例3 计算数据89,93,88,91,94,90,88,87的方差和标准差(标准差结果精确到0.1).
考点 方差与标准差
题点 求方差与标准差
解 ①=90+[(-1)+3+(-2)+1+4+0+(-2)+(-3)]=90+×0=90;
②计算xi-(i=1,2,…,8),得各数据为-1,3,-2,1,4,0,-2,-3;
③计算(xi-)2(i=1,2,…,8),得各数据为1,9,4,1,16,0,4,9;
④计算方差:s2=(1+9+4+1+16+0+4+9)==5.5;
⑤计算标准差:s=≈2.3.
所以这组数据的方差为5.5,标准差约为2.3.
反思与感悟 (1)方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.
(2)样本标准差反映了各样本数据围绕样本平均数波动的大小,标准差越小,表明各样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.
(3)若样本数据都相等,则s=0.
(4)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数字特征,而样本数据的离散程度是由标准差来衡量的.
跟踪训练3 某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记录抽查数据如下(单位:kg):
甲:102 101 99 98 103 98 99
乙:110 115 90 85 75 115 110
试计算甲、乙两个车间产品质量的平均数与方差,并说明哪个车间产品比较稳定.
考点 方差与标准差
题点 求方差与标准差
解 甲=(102+101+99+98+103+98+99)=100;
乙=(110+115+90+85+75+115+110)=100;
s=[[(102-100)2+(101-100)2+(99-100)2+(98-100)2+(103-100)2+(98-100)2+(99-100)2]
=(4+1+1+4+9+4+1)≈3.43;
s=[(110-100)2+(115-100)2+(90-100)2+(85-100)2+(75-100)2+(115-100)2+(110-100)2]
=(100+225+100+225+625+225+100)≈228.57.
所以s<s,故甲车间产品较稳定.
1.某市2017年各月的平均气温(℃)数据的茎叶图如图:
则这组数据的中位数是(  )
A.19 B.20 C.21.5 D.23
考点 中位数
题点 求茎叶图中的中位数
答案 B
解析 由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数为20.故选B.
2.设样本数据x1,x2,…,x10的平均数和方差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的平均数和方差分别为(  )
A.1+a,4 B.1+a,4+a
C.1,4 D.1,4+a
考点 平均数
题点 由两组数的关系求平均数和方差
答案 A
解析 ∵x1,x2,…,x10的平均数=1,方差s=4,
且yi=xi+a(i=1,2,…,10),∴y1,y2,…,y10的平均数
=·(y1+y2+…+y10)=·(x1+x2+…+x10+10a)=·(x1+x2+…+x10)+a=+a=1+a,
其方差s=·[(y1-)2+(y2-)2+…+(y10-)2]=[(x1-1)2+(x2-1)2+…+(x10-1)2]=s=4.
故选A.
3.某校从高一年级参加期末考试的学生中抽出60名,其成绩(均为整数)的频率分布直方图如图所示,由此估计此次考试成绩的中位数、众数分别是(  )
A.73.3,75 B.73.3,80
C.70,70 D.70,75
考点 中位数
题点 求频率分布直方图中的中位数
答案 A
解析 由图可知小于70的有24人,大于80的有18人,则在[70,80)之间的有18人,所以中位数落在[70,80)这组内,且为70+≈73.3;众数就是频率分布直方图中最高的矩形底边中点的横坐标,即=75.
4.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为________.
考点 方差与标准差
题点 求标准差
答案 16
解析 设样本数据x1,x2,…,x10的标准差为s,则s=8,
可知数据2x1-1,2x2-1,…,2x10-1的标准差为2s=16.
5.某校医务室抽查了高一10位同学的体重(单位:kg)如下:
74,71,72,68,76,73,67,70,65,74.
(1)求这10个学生体重数据的平均数、中位数、方差、标准差;
(2)估计高一所有学生体重数据的平均数、中位数、方差、标准差.
考点 平均数与方差的综合应用
题点 利用定义求平均数与方差
解 (1)这10个学生体重数据的平均数为=×(74+71+72+68+76+73+67+70+65+74)=71.
这10个学生体重数据从小到大依次为65,67,68,70,71,72,73,74,74,76,位于中间的两个数是71,72,
∴这10个学生体重数据的中位数为=71.5.
这10个学生体重数据的方差为
s2=×[(74-71)2+(71-71)2+(72-71)2+(68-71)2+(76-71)2+(73-71)2+(67-71)2+(70-71)2+(65-71)2+(74-71)2]=11,
这10个学生体重数据的标准差为s==.
(2)由样本估计总体得高一所有学生体重数据的平均数为71,中位数为71.5,方差为11,标准差为.
1.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.
2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.
3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性,用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.
一、选择题
1.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数,众数,中位数分别为(  )
A.85分,85分,85分 B.87分,85分,86分
C.87分,85分,85分 D.87分,85分,90分
考点 众数、平均数、中位数的综合
题点 具体数据中的众数、平均数、中位数
答案 C
解析 平均数为=87,众数为85,中位数为85,故选C.
2.某台机床加工的五批同数量的产品中次品数的频率分布如表:
次品数
0
1
2
3
4
频率
0.5
0.2
0.05
0.2
0.05
则次品数的平均数为(  )
A.1.1 B.3
C.1.5 D.2
考点 平均数
题点 由表或图估计平均数
答案 A
解析 设数据xi出现的频率为pi(i=1,2,…,n),则x1,x2,…,xn的平均数为x1p1+x2p2+…+xnpn=0×0.5+1×0.2+2×0.05+3×0.2+4×0.05=1.1,故选A.
3.样本中共有5个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本的标准差为(  )
A. B.
C.2 D.
考点 方差与标准差
题点 求方差与标准差
答案 D
解析 ∵样本a,0,1,2,3的平均数为1,
∴=1,解得a=-1.
则样本的方差s2=×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,故标准差为.故选D.
4.某省农科所经过5年对甲、乙两棉种的实验研究,将连续5年棉花产量(千克/亩)的统计数据用茎叶图表示,如图所示,则平均产量较高与产量较稳定的分别是(  )
A.甲棉种;甲棉种 B.乙棉种;甲棉种
C.甲棉种;乙棉种 D.乙棉种;乙棉种
考点 用样本数字特征估计总体数字特征
题点 平均数与方差的综合应用
答案 C
解析 根据茎叶图的数据知,甲棉种产量为68,69,70,71,72;乙棉种产量为68,68,69,69,71.
∴甲棉种的平均值甲=×(68+69+70+71+72)=70;
乙棉种的平均值乙=×(68+68+69+69+71)=69.
甲的方差s=×[(68-70)2+(69-70)2+(70-70)2+(71-70)2+(72-70)2]=2,
乙的方差s=×[(68-69)2+(68-69)2+(69-69)2+(69-69)2+(71-69)2]=1.2.
∴甲棉种平均产量较高,乙棉种产量较稳定.故选C.
5.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的众数、中位数的估计值为(  )
A.62,62.5 B.65,62
C.65,62.5 D.62.5,62.5
考点 众数、中位数的综合应用
题点 频率分布直方图中的众数、中位数
答案 C
解析 ∵最高的矩形为第三个矩形,
∴时速的众数的估计值为65.
前两个矩形的面积为(0.01+0.03)×10=0.4.
∵0.5-0.4=0.1,×10=2.5,
∴中位数的估计值为60+2.5=62.5.故选C.
6.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有(  )
A.a>b>c B.b>c>a
C.c>a>b D.c>b>a
考点 众数、平均数、中位数的综合
题点 具体数据中的众数、平均数、中位数
答案 D
解析 由已知得a=×(15+17+14+10+15+17+17+16+14+12)=14.7,
b=×(15+15)=15,c=17,∴c>b>a.故选D.
7.高三学生李丽在一年的五次数学模拟考试中的成绩(单位:分)为:x,y,105,109,110.已知该同学五次数学成绩数据的平均数为108,方差为35.2,则|x-y|的值为(  )
A.15 B.16 C.17 D.18
考点 平均数与方差的综合应用
题点 平均数与方差中的方程问题
答案 D
解析 由题意得,=108, ①
=35.2, ②
由①②解得或
所以|x-y|=18.故选D.
8.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是(  )
A.57.2,3.6 B.57.2,56.4
C.62.8,63.6 D.62.8,3.6
考点 平均数与方差的综合应用
题点 平均数与方差中的方程问题
答案 D
解析 每一个数据都加上60,所得新数据的平均数增加60,而方差保持不变.
9.甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示.若甲、乙两人的平均成绩分别是甲,乙,则下列结论正确的是(  )
A.甲<乙;乙比甲成绩稳定
B.甲>乙;甲比乙成绩稳定
C.甲>乙;乙比甲成绩稳定
D.甲<乙;甲比乙成绩稳定
考点 平均数与方差的综合应用
题点 平均数和方差在决策中的意义
答案 A
解析 甲同学的成绩为78,77,72,86,92,乙同学的成绩为78,82,88,91,95,
所以甲=×(78+77+72+86+92)=81,
乙=×(78+82+88+91+95)=86.8.
所以甲<乙,从叶在茎上的分布情况来看,乙同学的成绩更集中于平均值附近,这说明乙比甲成绩稳定.
二、填空题
10.一组数据2,x,4,6,10的平均数是5,则此组数据的标准差是________.
考点 方差与标准差
题点 求方差与标准差
答案 2
解析 ∵一组数据2,x,4,6,10的平均数是5,
∴2+x+4+6+10=5×5,解得x=3,
∴此组数据的方差s2=×[(2-5)2+(3-5)2+(4-5)2+(6-5)2+(10-5)2]=8,
∴此组数据的标准差s=2.
11.如图所示的茎叶图是甲、乙两组各5名学生的数学竞赛成绩(70分~99分),若甲、乙两组学生的平均成绩一样,则a=________;甲、乙两组学生的成绩相对稳定的是________.
考点 平均数与方差的综合应用
题点 平均数和方差在决策中的意义
答案 5 甲组
解析 由题意可知=
=89,
解得a=5.
因为s=×[(-14)2+(-1)2+0+92+62]=,s=×[(-13)2+(-4)2+0+92+82]=,
所以s<s,故成绩相对整齐的是甲组.
12.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数为________,方差为________.
考点 平均数与方差的综合应用
题点 求平均数与方差
答案 5 
解析 ∵-1,0,4,x,7,14的中位数为5,
∴=5,∴x=6.
∴这组数据的平均数是=5,
这组数据的方差是×(36+25+1+1+4+81)=.
三、解答题
13.现有某城市100户居民的月平均用电量(单位:度)的数据,根据这些数据,以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图所示.
(1)求直方图中x的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)内的用户中应抽取多少户?
考点 用样本的数字特征估计总体的数字特征的综合应用
题点 众数、平均数、中位数的综合应用
解 (1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1得x=0.007 5,
故直方图中x的值是0.007 5.
(2)月平均用电量的众数为=230.
∵(0.002+0.009 5+0.011)×20=0.45<0.5,
∴月平均用电量的中位数在[220,240)内,设中位数为a,
由(0.002+0.009 5+0.011)×20+0.012 5×(a-220)=0.5,得a=224,
即月平均用电量的中位数为224.
(3)月平均用电量在[220,240)内的有0.012 5×20×100=25(户),月平均用电量在[240,260)内的有0.007 5×20×100=15(户),月平均用电量在[260,280)内的有0.005×20×100=10(户),月平均用电量在[280,300]内的有0.002 5×20×100=5(户),
抽取比例为=,
∴月平均用电量在[220,240)内的用户中应抽取25×=5(户).
四、探究与拓展
14.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB,则(  )
A.A>B,sA>sB
B.A<B,sA>sB
C.A>B,sA<sB
D.A<B,sA<sB
考点 平均数与方差的综合应用
题点 平均数与方差的综合应用
答案 B
解析 由题图知,A组的6个数分别为2.5,10,5,7.5,2.5,10;B组的6个数分别为15,10,12.5,10,12.5,10,
所以A==,
B==.
显然A<B.又由图形可知,B组数据的分布比A组的均匀,变化幅度不大,故B组数据比较稳定,方差较小,从而标准差较小,所以sA>sB.
15.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现在用分层抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为________;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为________小时.
考点 平均数
题点 由表或图估计平均数
答案 50 1 015
解析 由分层抽样可知,第一分厂应抽取100×50%=50(件).由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命为1 020×50%+980×20%+1 030×30%=1 015(小时).