12.3用样本分布估计总体分布
第一课时 频率分布表 频率分布直方图 频率折线图
1.频率
当样本量是n的观测数据中有ni个yi时,我们称为fi=是yi出现的频率,简称yi的 频率.
2.频率分布表的制作步骤:
第一步:分段(分组);
第二步:决定各段的长短;
第三步:绘制频率分布表的第一列
第四步:计算每段内数据的个数ni,填入表格的第二列
第五步:计算数据在第一段内的频率fi,填入表格的第三列.
第六步:将第2、第3列之和填入最后一行.
3.频率分布直方图
将观测数据按照制作频率分布表的方法进行分段,计算出数据落入各段的频率fi,将各段的端点画在直角坐标系中的横坐标上,用fi/组距作为纵坐标的高,就得到了由连接长方形构成的图形,把所得到的图形称为数据的频率分布直方图.
4.频率折线图
用d1,d2,…,dk分别表示频率分布直方图中各矩形上边的中点,在直方图的左边延长出一个分段,分段的中点用d0表示,在直方图的右边也延长出一个分段,分段的中点用 dk+1表示.
用直线连接d0,d1,d2,…,dk+1就得到了一条折线,这条折线叫作频率折线图,频率折线图也反映出数据频率分布的规律.
1.抽样时样本的容量越大越好吗?
提示:实际抽样时,样本容量大小应当根据问题的需要来确定,并不一定样本容量越大越好.
2.如何确定组距和组数?
提示:组数=或K=1+4lg n(n为样本量n).
3.频率分布直方图中,每个矩形的高表示什么?
提示:表示每段上数据的频率/组距.
4.频率分布直方图有何作用?
提示:可直观地看到数据的分布情况,矩形越高,表示频率越大.
画频率分布表和频率分布直方图
为了了解中学生的身高情况,对育才中学同龄的50名男学生的身高进行了测量,结果如下:(单位:cm)
列出样本的频率分布表,画出频率分布直方图、频率折线图.
[解] 数据中的最大值为181,最小值为157.这50个数据散布在闭区间[157,181]中,取一个略大的区间(156.5,184.5].
用经验公式计算:
K=1+4lg n=1+4lg 50≈7.
将(156.5,184.5)七等分,排在下表的第一列,计算出数据落在各段的个数ni,填入第二列,计算出数据落入各段的频率.
f1==6%,f2==8%,…,f7==4%.
依次填入第三列,最后将各列之和填入最后一行,得到频率分布表.
身高数i
发生次数ni
fi=发生频率
(156.5,160.5]
3
6%
(160.5,164.5]
4
8%
(164.5,168.5]
12
24%
(168.5,172.5]
12
24%
(172.5,176.5]
13
26%
(176.5,180.5]
4
8%
(180.5,184.5]
2
4%
合计
50
100%
频率分布直方图和折线图
绘制频率分布直方图应注意的2个问题
(1)在绘制出频率分布表后,画频率分布直方图的关键就是确定小矩形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“频率/组距”所占的比例来定高.如我们预先设定以“”为一个单位长度,代表“0.1”,则若一个组的为0.2,则该小矩形的高就是“”(占两个单位长度),如此类推.
(2)数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.
1.有一个容量为50的样本,数据分组及各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5),4.
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)画出数据频率分布折线图.
解:(1)频率分布表为:
分组
发生次数ni
fi=发生频率
[12.5,15.5)
3
0.06
[15.5,18.5)
8
0.16
[18.5,21.5)
9
0.18
[21.5,24.5)
11
0.22
[24.5,27.5)
10
0.20
[27.5,30.5)
5
0.10
[30.5,33.5)
4
0.08
合计
50
1.00
(2)频率分布直方图为:
(3)数据频率分布折线图为:
频率分布直方图的应用
为了解某校高一年级学生的体能情况,抽取部分学生进行一分钟跳绳测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110)为达标,则该校全体高一年级学生的达标率是多少?
[解] (1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为=0.08.
又因为第二小组的频率=,
所以样本容量===150.
(2)由频率分布直方图可估计,该校高一年级学生的达标率为
×100%=88%.
[规律总结]
解决与频率分布直方图有关问题的关系式
(1)×组距=频率.
(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数.
2.20名学生某次数学考试成绩(单位:分)的频率分布直方图如下:
(1)求频率分布直方图中a的值;
(2)分别求出成绩落在[50,60)与[60,70)中的学生人数.
解:(1)由直方图可知,组距为10.
由(2a+3a+7a+6a+2a)×10=1,得a==0.005.
(2)成绩落在[50,60)中的学生人数为2×0.005×10×20=2,
成绩落在[60,70)中的学生人数为3×0.005×10×20=3.
[随堂体验落实]
1.关于频率分布直方图中的数据,下列说法正确的是( )
A.直方图的高度表示所取某区间的频率
B.直方图的高度表示该组内的个体在样本中出现的频率
C.直方图的高度表示该组内的个体数与组距的比值
D.直方图的高度表示该组内的个体在样本中出现的频率与组距的比值
解析:选D 由频率分布直方图的概念可知,选项D正确.
2.将容量为100的样本数据,按从小到大的顺序分成8组,如下表:
组号
1
2
3
4
5
6
7
8
频数
9
14
14
13
12
x
13
10
则第6组的频率为( )
A.0.14 B.14
C.0.15 D.15
解析:选C ∵x=100-(9+2×14+2×13+12+10)=15,
∴频率为=0.15.
3.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.6 B.8
C.12 D.18
解析:选C 由题意知第一组和第二组的频率之和为0.4,故样本容量为=50,第三组的频率为0.36,故第三组的人数为50×0.36=18,故第三组中有疗效的人数为18-6=12.
4.某电子商务公司对10 000名网络购物者2017年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a=________;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.
解析:(1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.
(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.
因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.
答案:(1)3 (2)6 000
5.将一些数据分成5组列出频率分布表,其中第1组的频率是0.1,第4组与第5组的频率之和是0.3,那么第2组与第3组的频率之和是________.
解析:∵各组的频率之和为1,
∴第2组与第3组的频率之和为1-0.1-0.3=0.6.
答案:0.6
6.为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛,为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频率分布表和频率分布直方图,解答下列问题:
学生成绩i
发生次数ni
fi=发生频率
[50,60)
4
0.08
[60,70)
0.16
[70,80)
10
[80,90)
16
0.32
[90,100]
合计
50
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频率分布直方图;
(3)若成绩在[75,85)分的学生为二等奖,问获得二等奖的学生约为多少人?
解:(1)
学生成绩i
发生次数ni
fi=发生频率
[50,60)
4
0.08
[60,70)
8
0.16
[70,80)
10
0.20
[80,90)
16
0.32
[90,100]
12
0.24
合计
50
1.00
(2)频率分布直方图如图所示:
(3)成绩在[75,80)分的学生占70~80分的学生的,
因为成绩在[70,80)分的学生频率为0.2,
所以成绩在[75,80)分的学生频率为0.1;
成绩在[80,85)分的学生占80~90分的学生的,
因为成绩在[80,90)分的学生频率为0.32,
所以成绩在[80,85)分的学生频率为0.16,
所以成绩在[75,85)分的学生频率为0.26,
由于有900名学生参加了这次竞赛,
所以该校获得二等奖的学生约为
0.26×900=234(人).
[感悟高手解题]
[妙解题]
从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
质量指标
值分组
[75,85)
[85,95)
[95,105)
[105,115)
[115,125]
频数
6
26
38
22
8
(1)在下表中作出这些数据的频率分布直方图:
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?
[解] (1)
(2)质量指标值的样本平均数为
=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.
质量指标值的样本方差为
s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.
所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.
(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标不低于95的产品至少要占全部产品的80%”的规定.
一、选择题
1.一个容量为n的样本,分成若干组,已知某组的发生次数和频率分别为40,0.125,则n的值为( )
A.640 B.320
C.240 D.160
解析:选B 由=0.125得n==320.
2.如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据可知,样本数据落在[15,20]内的次数为( )
A.20 B.30
C.40 D.50
解析:选B 由频率分布直方图可知,样本数据落在[15,20]内的频率为1-(0.1+0.04)×5=0.3,则样本数为0.3×100=30.
3.为考察某种皮鞋的各种尺码的销售情况,以某天销售的40双皮鞋为一个样本,把它按尺码分成5组,第3组的频率为0.25,第1,2,4组发生的次数分别为6,7,9,若第5组表示的是40~42码的皮鞋,若售出200双这种皮鞋,则含40~42码的皮鞋为( )
A.50双 B.40双
C.20双 D.30双
解析:选B 40~42码皮鞋数为40-0.25×40-6-7-9=8,故售出200双这种皮鞋,则含40~42码的皮鞋约为×200=40(双).
4.统计某校1 000名学生的数学测试成绩,得到样本频率分布直方图如图所示,若满分为100分,规定不低于60分为及格,则及格率是( )
A.20% B.25%
C.6% D.80%
解析:选D 由频率分布直方图可知不低于60分的频率和为0.25+0.35+2×0.1=0.8,故及格率为80%.
二、填空题
5.某班学生某次数学考试的成绩(单位:分)分布如下表:
分数
[0,80)
[80,90)
[90,100)
人数
2
5
6
分数
[100,110)
[110,120)
[120,130)
人数
8
12
6
分数
[130,140)
[140,150)
人数
4
2
那么分数在[100,110)中的频率为________,分数低于110的样本数为________.
解析:[100,110)中的频率为:,分数低于110的样本数2+5+6+8=21.
答案: 21
6.某个样本容量为100的频率分布直方图如图所示,则在区间[4,5)上的数据的样本数为________.
解析:区间[4,5)上的数据的频率为:1-0.4-0.15-0.10-0.05=0.3,
样本数为100×0.3=30.
答案:30
7.样本容量为200的频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在[6,10)内的样本数为________,数据落在[2,10)内的频率约为________.
解析:由频率分布直方图可知在[6,10)之间的数据的频率为0.32.
则在[6,10)之间的样本数为0.32×200=64.
在[2,10)内的频率为0.08+0.32=0.4.
在[2,10)内的频率约为0.4.
答案:64 0.4
8.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.
解析:由频率分布直方图可得树木底部周长小于100 cm的频率是(0.025+0.015)×10=0.4,又样本容量是60,所以频数是0.4×60=24.
答案:24
三、解答题
9.为增强市民节能环保意识,某市面向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄情况如下表所示:
分组(单位:岁)
频数
频率
[20,25)
5
0.05
[25,30)
①
0.20
[30,35)
35
②
[35,40)
30
0.30
[40,45]
10
0.10
总计
100
1.00
(1)频率分布表中的①②位置应填什么数据?
(2)补全如图所示的频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在[30,35)岁的人数.
解:(1)设年龄在[25,30)岁的频数为x,年龄在[30,35)岁的频率为y.
根据题意可得=0.20,=y,
解得x=20,y=0.35,
故①处应填20,②处应填0.35.
(2)由频率分布表知年龄在[25,30)岁的频率是0.20,组距是5.
所以==0.04.
补全频率分布直方图如图所示:
根据频率分布直方图估计这500名志愿者中年龄在[30,35)岁的人数为
500×0.07×5=175.
10.新华中学高三年级参加市一轮验收考试的同学有1 000人,用系统抽样法抽取了一个容量为200的学生总成绩的样本,分数段及各分数段人数如下(满分750分):
分数段
[250,350)
[350,450)
[450,550)
[550,650)
[650,750]
人数
20
30
80
40
30
(1)列出频率分布表;
(2)画出频率分布直方图;
(3)模拟本科划线成绩为550分,试估计该校的上线人数.
解:(1)频率分布表如下:
分数i
发生次数ni
fi=发生频率
[250,350)
20
0.10
[350,450)
30
0.15
[450,550)
80
0.40
[550,650)
40
0.20
[650,750]
30
0.15
合计
200
1.00
(2)频率分布直方图如下:
(3)由频率分布表知,在样本中成绩在550分以上的人数的频率为0.20+0.15=0.35.
由此可以估计该校本科模拟上线人数约为
0.35×1 000=350(人).
第二课时 数据茎叶图
1.茎叶图
(1)由茎和叶两部分组成,在制作茎叶图的时候要先确定数据的“茎”和“叶”.
(2)从数据的茎叶图可以看出数据的分布形状及数据是否对称,是否集中等分布特性.
2.双茎叶图
(1)定义:表示两组数据的茎叶图.
(2)优点:有利于对这两组数据进行比较.
1.茎叶图有什么优、缺点?
提示:优点:显示了数据的每个原始信息,从茎叶图中可以直观地看到数据的分布情况.
缺点:数据量很大时,茎叶图的效果就不好了,因为这时茎叶图会很长或很宽.
2.茎叶图的茎只能是一位数吗?
提示:不,也可以是两位数或三位数.
制作样本数据的茎叶图
美国NBA篮球赛中甲、乙两篮球运动员上赛季某些场次比赛的得分如下:
甲:12,15,24,25,31,31,36,36,37,39,44,49,50.
乙:8,13,14,16,21,23,24,26,28,33,38,39,51.
制作出两组数据的茎叶图.
[解] 十位数为茎在中间,个位数为叶分列到左、右两侧如图
当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都非常方便,但当样本数据较多时,茎叶图就显得不太方便了.因为数据较多时,枝叶就会很长,需要占据较多的空间.制作茎叶图时,可先根据数据特点,确立树茎,然后确定树叶,二者不可混在一起.
1.在某电脑杂志的一篇文章中,每个句子的字数如下:
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.
在某报纸的一篇文章中,每个句子中所含的字数如下:
27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.
将这两组数据用茎叶图表示.
解:茎叶图如图所示:
茎叶图的应用
某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:
品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,
430,434,443,445,445,451,454
品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,
410,412,415,416,422,430
(1)完成数据的茎叶图;
(2)用茎叶图处理现有的数据,有什么优点?
(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
[解] (1)
(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.
(3)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.
利用茎叶图可以看到数据分布是否整齐,是否集中,还可以看出哪个数据出现的次数多或少,并有利计算均值.
2.从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:
甲品种:271 273 280 285 285 287 292 294 295 301 303 303 307
308 310 314 319 323 325 325 328 331 334 337 352
乙品种:284 292 295 304 306 307 312 313 315 315 316 318 318
320 322 322 324 327 329 331 333 336 337 343 356
由以上数据,得到了如下茎叶图
根据茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论.
解:①甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散(或:乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中(稳定).甲品种棉花的纤维长度的分散程度比乙品种棉花的纤维长度的分散程度更大).②乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近).甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀.
[随堂体验落实]
1.从甲、乙两种树苗中各抽测了10株树苗的高度,其茎叶图如图.根据茎叶图,下列描述正确的是( )
A.甲种树苗的平均高度大于乙种树苗的平均高度,且甲种树苗比乙种树苗长得整齐
B.甲种树苗的平均高度大于乙种树苗的平均高度,但乙种树苗比甲种树苗长得整齐
C.乙种树苗的平均高度大于甲种树苗的平均高度,且乙种树苗比甲种树苗长得整齐
D.乙种树苗的平均高度大于甲种树苗的平均高度,但甲种树苗比乙种树苗长得整齐
解析:选D 根据茎叶图计算得甲种树苗的平均高度为27,而乙种树苗的平均高度为30,但乙种树苗的高度分布不如甲种树苗的高度分布集中.
2.如图是2018年元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的众数和中位数分别为( )
A.84,85 B.84,84
C.85,84 D.85,85
解析:选A 去掉一个最高分93,最低分79,剩下的数为84,84,85,86,87,出现次数最多的为84,中位数为85.
3.如图是2017年青年歌手大奖赛中,七位评委为甲、乙两名选手打出的分数的茎叶图(其中m,n均为数字0~9中的一个),在去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则有( )
A.a1>a2
B.a1,a2的大小与m的值有关
C.a2>a1
D.a1,a2的大小与m,n的值有关
解析:选A 由题意知去掉一个最高分和一个最低分以后,两组数据都有五个数据,
代入数据可以求得
甲的平均分为a1=80+×(1+5+5+m+9)=84+,
乙的平均分为a2=80+×(1+2+4+4+7)=83.6,
∵m≥0,
∴a1>a2.
4.从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示),设甲、乙两组数据的平均数分别为甲,乙,中位数分别为m甲,m乙,则( )
A.甲<乙,m甲>m乙 B.甲<乙,m甲<m乙
C.甲>乙,m甲>m乙 D.甲>乙,m甲<m乙
解析:选B 由茎叶图知,甲的平均数为(5+6+8+10+10+14+18+18+22+25+27+30+30+38+41+43)÷16=21.562 5,
乙的平均数为(10+12+18+20+22+23+23+27+31+32+34+34+38+42+43+48)÷16=28.562 5,
所以甲<乙.
甲的中位数为(18+22)÷2=20,
乙的中位数为(27+31)÷2=29,
所以m甲<m乙.
5.甲、乙两个班各随机选出15名同学进行测验,所得成绩的茎叶图如图.从图中看,________班的平均成绩较高.
解析:结合茎叶图中成绩分布情况可知乙平均成绩较高.
答案:乙
6.甲、乙两人数学成绩的茎叶图如图.
(1)求出这两名同学的数学成绩的平均数、标准差(结果精确到0.1);
(2)比较两名同学的成绩,谈谈看法.
解:由茎叶图可知甲、乙两人的数学成绩分别为:
甲:65,71,75,76,81,86,88,89,91,94,95,107,110.
乙:79,83,86,88,93,98,98,99,101,103,114.
得:(1)甲的平均数甲=(65+71+75+76+81+86+88+89+91+94+95+107+110)≈86.8.
乙的平均数乙=(79+83+86+88+93+98+98+99+101+103+114)≈94.7.
甲的标准差s甲=
≈12.5.
乙的标准差s乙=
≈9.9.
(2)由甲=86.8<乙=94.7,且s甲=12.5>s乙=9.9.
故甲的数学成绩不如乙的数学成绩好,且甲的数学成绩不如乙的数学成绩稳定.
[感悟高手解题]
[妙解题]
在一项农业试验中,A,B两种肥料分别被用于同类橘子树的生长,为了了解这两种肥料的效果,试验人员分别从施用这两种肥料的橘子树中随机抽取了12棵,下表给出了每一棵橘子树的产量(单位:千克):
肥料A 63 , 54 , 19 , 20 , 72 , 92 , 8 , 10 , 22 , 11 , 24 , 5.
肥料B 57 , 86 , 33 , 40 , 59 , 56 , 73 , 25 , 44 , 31 , 64 , 45.
(1)请用茎叶图表示分别施用A,B两种肥料的橘子树的产量,并从图中比较各自平均数的大小;
(2)根据(1)问的茎叶图你认为哪一组数据的标准差更小?
(3)分别计算施用A,B两种肥料的橘子树产量的平均数和标准差,看看与你估计结果是否一致;
(4)你认为哪种肥料对橘子树的产量影响更大?为什么?
[解] (1)用茎叶图表示数据如图所示;
从茎叶图中可以看出:施用肥料A的橘子树的产量分布主要在茎叶图的上方,而施用肥料B的橘子的产量分布主要在茎叶图的中部.由此,可以估计:施用肥料A的橘子树的产量的平均数比B的小.
(2)从茎叶图中可以看出:施用肥料A的橘子树的产量分布相对较散,而施用肥料B的橘子树的产量分布相对比较集中.由此,可以估计:施用肥料B的橘子树的产量的标准差比A的小.
(3)通过计算得到:施用肥料A的橘子树的产量的平均数和标准差分别是33.3,27.9,施用肥料B的橘子树的产量的平均数和标准差分别是51.1,17.3,与估计的结果一致.
(4)施用肥料B对橘子树的产量影响更大,因为产量相对较高且比较稳定.
一、选择题
1.一位同学种了甲、乙两种树苗各一株,分别观察了9次后,得到树苗高度的数据的茎叶图如图(单位:厘米),则甲、乙两种树苗高度的数据的中位数之和是( )
A.44 B.54
C.50 D.52
解析:选B 由茎叶图得甲种树苗的高度中位数为24,乙种树苗高度的中位数为30,故两数之和为24+30=54.
2.如图是在全国少数民族运动会上,七位评委为某民族舞蹈打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )
A. 84,4.84 B.84,1.6
C.85,1.6 D.85,4
解析:选C 5个有效数字为84,84,86,84,87,其平均数为85.
s2=(xi-)2=[3×(84-85)2+(86-85)2+(87-85)2]=1.6.
3.某校举行演讲比赛,9位评委给选手A打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若统计员计算无误,则数字x应该是( )
A.5 B.4
C.3 D.2
解析:选D 经验证x≤4,设含有x的数为y,
则有效数字为88,89,92,y,93,92,91则:
=91,
解得y=92,
∴x=2.
4.甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示,若甲、乙两人的平均成绩分别是甲、乙,则下列结论正确的是( )
A.甲<乙;乙比甲成绩稳定
B.甲>乙;甲比乙成绩稳定
C.甲>乙;乙比甲成绩稳定
D.甲<乙;甲比乙成绩稳定
解析:选A ∵甲==81,
乙==86.8,
∴甲<乙,且乙比甲成绩稳定.
二、填空题
5.如图是CBA篮球联赛中甲乙两名运动员某赛季一些场次得分的茎叶图,则平均得分高的运动员是________.
解析:从茎叶图上可得甲的得分为8,10,15,16,22,23,25,26,27,32,平均值为20.4;乙的得分为8,12,14,17,18,19,21,27,28,29,平均值为19.3.所以平均得分高的运动员为甲.
答案:甲
6.某篮球学校的甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个.命中个数的茎叶图如图所示.则罚球命中率较高的是________运动员.
解析:从茎叶图中可以看到,甲运动员的命中率较高.
答案:甲
7.某校高中年级开设了丰富多彩的校本课程,甲、乙两班各随机抽取了5名学生的学分,用茎叶图表示(如图).若s1,s2分别表示甲、乙两班各自5名学生学分的标准差,则s1________s2.(填“>”、“<”或“=”)
解析:观察茎叶图,甲班5名学生的学分比较集中,乙班5名学生的学分比较分散,那么甲班5名学生的标准小于乙班5名学生的标准差.
答案:<
8.甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图所示(单位:分),则甲班、乙班的最高成绩分别是________,从图中看,________班的平均成绩较高.
解析:由茎叶图知甲班的最高成绩为96分,乙班的最高成绩为92分,再根据茎叶图的分布特点知,乙班的成绩分布集中在下面,故乙班的平均成绩较高.
答案:96,92 乙
三、解答题
9.甲、乙两位学生参加数学竞赛培训,在培训期间,他们参加的5次预赛成绩 记录如下:
甲 82 82 79 95 87
乙 95 75 80 90 85
(1)用茎叶图表示这两组数据;
(2)求两组数据的平均数.
解:(1)作出茎叶图如下:
(2)甲的平均数
1==85,
乙的平均数
2==85.
10.为从甲、乙两名运动员中选拔一人参加2018年世界跳水系列赛跳水项目,对甲、乙两名运动员进行培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取6次,得出茎叶图如图所示.求从平均成绩及发挥稳定性的角度考虑,你认为选派哪名运动员合适?
解:根据茎叶图,可得甲、乙两名运动员的6次预赛成绩如下:
甲:78 79 81 84 93 95
乙:75 80 83 85 92 95
派甲运动员参赛比较合适.理由如下:
甲=(78+79+81+84+93+95)=85,
乙=(75+80+83+85+92+95)=85,
s=[(78-85)2+(79-85)2+(81-85)2+(84-85)2+(93-85)2+(95-85)2]=,
s=[(75-85)2+(80-85)2+(83-85)2+(85-85)2+(92-85)2+(95-85)2]=,
∵甲=乙,s∴甲运动员的成绩较稳定,派甲运动员参赛比较合适.