人教版高中数学必修三第二章统计2.2用样本估计总体(教师版)【优能辅导含答案】

文档属性

名称 人教版高中数学必修三第二章统计2.2用样本估计总体(教师版)【优能辅导含答案】
格式 zip
文件大小 1.9MB
资源类型 教案
版本资源 人教新课标B版
科目 数学
更新时间 2019-08-09 12:41:55

图片预览

文档简介

用样本估计总体



__________________________________________________________________________________
__________________________________________________________________________________

1.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图,理解数形结合的数学思想和逻辑推理的数学方法.
2.通过对样本分析和总体估计的过程,感受数学对实际生活的需要,通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地作出总体估计,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.
3.能利用频率分布直方图估计总体的众数、中位数、平均数;能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法;初步体会、领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、分析、判断,培养学生“实事求是”的科学态度和严谨的工作作风.
4.正确理解样本数据标准差的意义和作用,学会计算数据的标准差;能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识.



1.分析数据的方法
(1)借助于图形.
用图将各个数据画出来,作图可以达到两个目的,一是从数据中__________;二是利用图形__________.
(2)借助于表格.
用紧凑的表格改变数据的______方式,为我们提供_____数据的新方式.
提取信息 传递信息 构成 解释
2.频率分布直方图
(1)绘制步骤:
①求______,即一组数据中的最大值与最小值的差.
②决定______与______.组距与组数的确定没有具体的标准,一般来说,数据分组的组数与样本容量有关,样本容量越大,所分组数越____.当样本容量不超过100时,按照数据的多少,常分为5~12组.
③将数据______.
④列出__________表.
⑤画出频率分布直方图.其中横轴表示_____,纵轴表示_____________的比.
(2)意义:频率分布直方图中,每个小矩形的面积表示相应组的______,所有小矩形的面积的总和等于____.
(3)频率分布的估计:频率分布是指各个小组数据在容量中所占______的大小,可以用______的频率分布估计总体的频率分布,频率分布表是反映样本的频率分布的表格.通过频率分布直方图和频率分布表可以看到样本的频率分布.
极差 组距 组数 多 分组 频率分布 数据 频率与组距 频率 1 比例 样本
3. 频率分布直方图的特征:
直观、形象地反映了样本的分布规律;可以大致估计出总体的分布.但是从频率分布直方图中得不出原始的数据内容,把数据绘制成频率分布直方图后,原有的具体数据信息就被抹掉了.
4.频率分布折线图和总体密度曲线
(1)类似于频数分布折线图,连接频率分布直方图中各个小长方形上端的中点,就得到频率分布折线图.
一般地,当总体中的个体数较多时,抽样时样本容量就不能太小.例如,如果要抽样调查一个省乃至全国的居民的月均用水量,那么样本容量就应比调查一个城市的时候大.可以想像,随着样本容量的增加.作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
频率分布折线图反映了数据的变化趋势.总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.
(2)估计方法:实际上,尽管有些总体密度曲线是客观存在的,但是在实际应用中我们并不知道它的具体表达形式,需要用______来估计.由于样本是随机的,不同的样本得到的频率分布折线图______;即使对于同一个样本,不同的分组情况得到的频率分布折线图也不同.频率分布折线图是随__________和分组情况的变化而变化的,因此不能用样本的___________________得到准确的总体密度曲线.
样本 不同 样本容量 频率分布折线图
5.茎叶图
(1)制作方法:将所有两位数的十位数字作为_____,个位数字作为___,茎相同者共用一个茎,茎按从_________的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).
(2)优缺点:在样本数据_______时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时______,这对数据的记录和表示都能带来方便.但是当样本数据______时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长.
茎 叶 小到大 较少 记录 较多
6. 茎叶图的特征:
统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;茎叶图中的数据可以随时记录,随时添加,方便记录与表示.但是茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两位以上的数据虽然能够记录,但是没有表示两位数记录那么直观、清晰.
7.规律总结
[总结1] 估计总体分布的步骤是:
(1)选择适当的抽样方法从总体中抽取样本,即收集数据.
(2)利用样本数据画出统计图或计算数字特征.
(3)结合统计图分析样本取值的分布规律.
(4)用样本取值的分布规律估计总体分布,由于是用科学抽样抽取的样本,那么样本与总体取值的分布规律近似,有时也可看成相同.
(5)利用总体分布解决有关问题.
[总结2] 频率分布表、频率分布直方图、频率分布折线图和茎叶图的比较
(1)四种图表的区别与联系
名称 区别
频率分布表 从数量上比较准确地反映样本的频率分布规律
频率分布直方图 反映样本的频率分布情况
频率分布折线图 直观地反映了数据的变化趋势
总体密度曲线 虽客观存在,但要准确画出难度较大,只能用样本频率分布估计.样本容量越大,估计越准确

这四种图表都是描述样本数据分布情况,估计总体频率分布规律的,其联系如下:

(2)四种图表的优缺比较
优点 缺点
频率分布表 表示数量较确切 分析数据分布的总体态势不方便
频率分 布直方图 表示数据分布情况非常直观 原有的具体数据信息被抹掉了
频率分布 折线图 能反映数据的变化趋势 不能显示原有数据信息
茎叶图 一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况 样本数据较多或数据位数较多时,不方便表示数据

8.众数
(1)定义:一组数据中出现次数______的数称为这组数据的众数.
(2)特征:一组数据中的众数可能______一个,也可能没有,反映了该组数据的____________.
[破疑点] 众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.
最多 不止 集中趋势
9.中位数
(1)定义:一组数据按从小到大的顺序排成一列,处于______位置的数称为这组数据的中位数.
(2)特征:一组数据中的中位数是______的,反映了该组数据的______________.在频率分布直方图中,中位数左边和右边的直方图的面积______.
[破疑点] 中位数不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.
中间 唯一 集中趋势 相等
10.平均数
(1)定义:一组数据的和与这组数据的个数的商.数据x1,x2,…,xn的平均数为n=_________________.
(2)特征:平均数对数据有“取齐”的作用,代表该组数据的_____________.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的______,但平均数受数据中_________的影响较大,使平均数在估计总体时可靠性降低.
平均水平 信息 极端值
11.标准差
(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s表示,通常用以下公式来计算
s=__________________________.
可以用计算器或计算机计算标准差.
(2)特征:标准差描述一组数据围绕______波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较______;标准差较小,数据的离散程度较______.
平均数 大 小
12.方差
(1)定义:标准差的平方,
即s2=________________________________________.
(2)特征:与____________的作用相同,描述一组数据围绕平均数波动程度的大小.
(3)取值范围:___________.
[(x1-)2+(x2-)2+…+(xn-)2] 标准差 [0,+∞)
数据组x1,x2,…,xn的平均数为,方差为s2,标准差为s,则数据组ax1+b,ax2+b,…,axn+b(a,b为常数)的平均数为a+b,方差为a2s2,标准差为as.
6.用样本估计总体
现实中的总体所包含的个体数往往很多,总体的平均数、众数、中位数、标准差、方差是不知道的,因此,通常用样本的平均数、众数、中位数、标准差、方差来估计.这与用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.
用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数;用样本标准差估计总体标准差,样本容量越大,估计就越精确.

类型一 绘制频率分布直方图
例1:抽查100袋洗衣粉,测量它们的净重如下(单位:g):
494 498 493 505 496 492 485 483 508 511
495 494 483 485 511 493 505 488 501 491
493 509 509 512 484 509 510 495 497 498
504 498 483 510 503 497 502 511 497 500
493 509 510 493 491 497 515 503 515 518
510 514 509 499 493 499 509 492 505 489
494 501 509 498 502 500 508 491 509 509
499 495 493 509 496 509 505 499 486 491
492 496 499 508 485 498 496 495 496 505
499 505 496 501 510 496 487 511 501 496
(1)列出样本的频率分布表;
(2)画频率分布直方图及频率分布折线图;
(3)估计净重在494.5~506.5 g之间的频率.
[解析] (1)在样本数据中,最大值是518,最小值是483,所以极差为35.取组距为4 g,由于=8,故要分成9组.使分点比数据多一位小数,且把第1组的起点稍微减小一点,得分组如下:[482.5,486.5),[486.5,490.5),[490.5,494.5),…,[514.5,518.5].列出频率分布表如下:
分组 频数累计 频数 频率
[482.5,486.5) 8 0.08
[486.4,490.5) 3 0.03
[490.5,494.5) 正正正 17 0.17
[494.5,498.5) 正正正正 21 0.21
[498.5,502.5) 正正 14 0.14
[502.5,506.5) 正 9 0.09
[506.5,510.5) 正正正 19 0.19
[510.5,514.5) 正 6 0.06
[514.5,518.5] 3 0.03
合计 100 1.00

(2)频率分布直方图及频率分布折线图如下图:

(3)净重在494.5~506.5 g之间的频率为0.21+0.14+0.09=0.44.
练习1:为了解某中学高一年级男生的体重情况,抽取了同年级40名男生的体重,数据如下(单位:千克):
62 60 59 59 59 58 58 57 57 57 57 56
56 56 56 56 56 56 55 55 55 55 54 54
54 54 53 53 52 52 52 52 52 51 51 51
50 50 49 48
列出样本的频率分布表,绘出频率分布直方图,并估计体重在58千克以上的男生比例.
[答案] (1)计算极差:62-48=14.
(2)决定组距与组数:取组距为2.
又因为==7,故共分成7组.
(3)将数据分组:以组距为2将数据分组时,可以分成以下7组:
[48,50),[50,52)、[52,54),[54,56),[56,58),[58,60),[60,62].
(4)列出频率分布表如下:
分组 频数 频率
[48,50) 2 0.05
[50,52) 5 0.125
[52,54) 7 0.175
[54,56) 8 0.2
[56,58) 11 0.275
[58,60) 5 0.125
[60,62] 2 0.05
合计 40 1.00

(5)绘出频率分布直方图(如下图所示):

从频率分布表中可看出,样本数据落在58以上的频率为0.125+0.05=0.175,由此可估计,体重在58千克以上的男生比例约为17.5%.
练习2:在2014年第十六届亚运会中,各个国家和地区金牌获得情况的条形统计图,如图所示.
第十六届亚运会各个国家和地区金牌获得情况统计图

从图中可以看出中国是亚洲第一体育强国,中国所获得金牌数占全部金牌数的比例约是(  )
A.41.7% B.59.8% C.67.3% D.34.4%
[答案] D
练习3:频率分布直方图中,各小矩形面积的和等于(  )
A.0 B. C.1 D.不确定
[答案] C
练习4:在画频率分布直方图时,某组的频数为10,样本容量为50,总体容量为600,则该组的频率是(  )
A. B. C. D.不确定
[答案] A
类型二 茎叶图的画法及应用
例2:某中学甲、乙两名同学最近几次的数学考试成绩情况如下:
甲的得分:95,81,75,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
[解析]

[答案] 甲、乙两人数学成绩的茎叶图如图所示.

从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,大多集中在80~100之间,中位数是98分.
甲同学的得分情况除一个特殊得分外,也大致对称,多集中在70~90之间,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此,乙同学发挥比较稳定,总体得分情况比甲同学好.
练习2:在某电脑杂志的一篇文章中,每个句子的字数如下
10,28,31,17,23,27,18,15,26,24,20,
19,36,27,14,25,15,22,11,24,27,17.
在某报纸的一篇文章中,每个句子的字数如下:
27,39,33,24,28,19,32,41,33,27,35,
12,36,41,27,13,22,23,18,46,32,22.
(1)画出两组数据的茎叶图;
(2)比较分析两组数据,能得出什么结论?
[答案] (1)依题意,画出茎叶图如下图所示:

(2)电脑杂志文章中每个句子的字数集中在10~30之间,中位数为22.5,而报纸文章中每个句子的字数集中在20~40之间,中位数为27.5.还可以看出,电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.这与电脑杂志作为科普读物需要简明、通俗易懂的要求相吻合.
类型三 茎叶图与频率分布直方图的综合应用
例3: 某学校随机抽取20个班,调查各班中有网购经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是(  )


[解析] 借助已知茎叶图得出各小组的频数,再由频率=求出各小组的频率,进一步求出并得出答案.
方法一:由题意知样本容量为20,组距为5.
列表如下:
分组 频数 频率
[0,5) 1 0.01
[5,10) 1 0.01
[10,15) 4 0.04
[15,20) 2 0.02
[20,25) 4 0.04
[25,30) 3 0.03
[30,35) 3 0.03
[35,40] 2 0.02
合计 20 1

观察各选择项的频率分布直方图知选A.
方法二:由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、也分别相等.比较四个选项知A正确,故选A.
[答案] A
练习1:某学校为调查高三年级学生的身高情况,按随机抽样的方法抽取80名学生,得到男生身高情况的频率分布直方图1和女生身高情况的频率分布直方图2.已知图1中身高在170 cm~175 cm的人数为16.

问:在抽取的学生中,男、女生各有多少人?
[答案] 因为身高在170 cm~175 cm的男生的频率为0.08×5=0.4,设男生的总人数为n1,则0.4=,解得n1=40,即抽取的学生中,男生的人数为40,女生的人数为80-40=40.
练习2:没有信息的损失,所有的原始数据都可以从图中得到的统计图是(  )
A.总体密度曲线 B.茎叶图
C.频率分布折线图 D.频率分布直方图
[答案] B
类型四 中位数、众数、平均数的应用
例4:据报道,某公司的33名职工的月工资(以元为单位)如下:
职务 董事长 副董事长 董事 总经理 经理 管理员 职员
人数 1 1 2 1 5 3 20
工资 5 500 5 000 3 500 3 000 2 500 2 000 1 500

(1)求该公司的职工月工资的平均数、中位数、众数;
(2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又是什么?(精确到1元)
(3)你认为哪个统计量更能反映这个公司职工的工资水平?结合此问题谈一谈你的看法.
[解析] (1)平均数是
=1 500+
≈1 500+591=2 091(元).
中位数是1 500元,众数是1 500元.
(2)平均数是′=1 500+
≈1 500+1 788=3 288(元).
中位数是1 500元,众数是1 500元.
(3)在这个问题中,中位数或众数均能反映该公司职工的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数偏差较大,所以平均数不能反映这个公司职工的工资水平.
练习1:某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):
甲群 13,13,14,15,15,15,15,16,17,17;
乙群 54,3,4,4,5,5,6,6,6,57.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映甲群市民的年龄特征?
(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映乙群市民的年龄特征?
[答案] (1)甲群市民年龄的平均数为
=15(岁),
中位数为15岁,众数为15岁.
平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.
(2)乙群市民年龄的平均数为
=15(岁),
中位数为5岁,众数为6岁.
由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.
类型五 标准差、方差的应用
从甲、乙两种玉米的苗中各抽10株,分别测它们的株高如下:(单位:cm)
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
问:(1)哪种玉米的苗长得高?
(2)哪种玉米的苗长得齐?
[解析] 看哪种玉米的苗长得高,只要比较甲、乙两种玉米的苗的均高即可;要比较哪种玉米的苗长得齐,只要看两种玉米的苗高的方差即可,因为方差是体现一组数据波动大小的特征数.
(1)甲=(25+41+40+37+22+14+19+39+21+42)=×300=30(cm),
乙=(27+16+44+27+44+16+40+40+16+40)=×310=31(cm).
所以甲<乙.
(2)s=[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=(25+121+100+49+64+256+121+81+81+144)=×1042=104.2(cm2),
s=[(2×272+3×162+3×402+2×442)-10×312]=×1288=128.8(cm2).所以s<s.
[答案] (1)乙种玉米的苗长得高,(2)甲种玉米的苗长得齐.
练习1:甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:
甲的成绩
环数 7 8 9 10
频数 5 5 5 5
乙的成绩
环数 7 8 9 10
频数 6 4 4 6
丙的成绩
环数 7 8 9 10
频数 4 6 6 4

s1,s2,s3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有(  )
A.s3>s1>s2 B.s2>s1>s3 C.s1>s2>s3 D.s2>s3>s1
[答案] B
练习2: 一次数学知识竞赛中,两组学生成绩如下表:
分数 50 60 70 80 90 100
人数 甲组 2 5 10 13 14 6
乙组 4 4 16 2 12 12

已经算得两个组的平均分都是80分,请根据你所学过的统计知识,进一步判断这两个组这次竞赛中成绩谁优谁次,并说明理由.
[答案] (1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.
(2)s=×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=×(2×900+5×400+10×100+13×0+14×100+6×400)=172.
s=×(4×900+4×400+16×100+2×0+12×100+12×400)=256.
因为s<s,所以甲组成绩较乙组成绩稳定.
(3)甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.
(4)从成绩统计表看,甲组成绩大于或等于90分的人数为20人,乙组成绩大于或等于90分的人数为24人,所以乙组成绩在高分阶段的人数多,同时,乙组得满分的比甲组得满分的多6人,从这一角度看,乙组成绩较好.
类型六 频率分布直方图与数字特征的综合应用
例6:(1)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则(  )

A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
(2)某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.

①求这次测试数学成绩的众数.
②求这次测试数学成绩的中位数.
③求这次测试数学成绩的平均分.
[解析] (1)甲=(4+5+6+7+8)=6,
乙=(5×3+6+9)=6,
甲的中位数是6,
乙的中位数是5.
甲的成绩的方差为(22×2+12×2)=2,
乙的成绩的方差为(12×3+32×1)=2.4.
甲的极差是4,乙的极差是4.
所以A,B,D错误,C正确.
(2)①由图知众数为=75.
②由图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.
③由图知这次数学成绩的平均分为:
×0.005×10+×0.015×10+×0.02×10+×0.03×10+×0.025×10+×0.005×10=72.
[答案] (1)C (2)见解析
练习1: 参加市数学调研抽测的某校高三学生成绩分布的茎叶图1和频率分布直方图2均受到不同程度的破坏,但可见部分信息如下,据此解答如下问题:
求参加数学抽测的人数n,抽测成绩的中位数及分数分布在[80,90),[90,100]内的人数.

[答案] 分数在[50,60)内的频率为2,由频率分布直方图可以看出,分数在[90,100]内的同样有2人.
由=10×0.008,得n=25.
由茎叶图可知抽测成绩的中位数为73.
∴分数在[80,90)之间的人数为25-(2+7+10+2)=4.
参加数学竞赛人数n=25,中位数为73,分数在[80,90),[90,100]内的人数分别为4人,2人.

1.在用样本的频率分布估计总体的频率分布的过程中,下列说法正确的是(  )
A.总体的容量越大,估计越准确
B.总体的容量越小,估计越准确
C.样本的容量越大,估计越准确
D.样本的容量越小,估计越准确
[答案] C
2.在频率分布表中,下列说法正确的是(  )
A.起始点不同,不影响分组数
B.分组数越多,就越能反映总体的情况
C.各组频率之和一定是1
D.不同起始点的频率分布表,各组频率一定不同
[答案] C
3.下列关于茎叶图的叙述正确的是(  )
A.茎叶图可以展示未分组的原始数据,它与频率分布表以及频率分布直方图的处理方式不同
B.对于重复的数据,只算一个
C.茎叶图中的叶是“茎”十进制的上一级单位
D.制作茎叶图的程序是:第1步画出茎;第2步画出叶;第3步将“叶子”任意排列
[答案] A
4. 为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组,下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(  )
A.6 B.8 C.12 D.18

[答案] C
5.甲、乙两中学生在一年里学科平均分相等,但他们的方差不相等,正确评价他们的学习情况是(  )
A.因为他们平均分相等,所以学习水平一样
B.成绩平均分虽然一样,方差较大的,说明潜力大,学习态度端正
C.表面上看这两个学生平均成绩一样,但方差小的成绩稳定
D.平均分相等,方差不等,说明学习不一样,方差较小的同学,学习成绩不稳定,忽高忽低
[答案] C
6.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88,若样本B数据恰好是样本A都加上2后所得数据,则A、B两样本的下列数字特征对应相同的是(  )
A.众数 B.平均数
C.中位数 D.标准差
[答案] D
7.如图,是某篮球运动员在一个赛季的30场比赛中得分的茎叶图,则得分的中位数与众数分别为(  )

A.3与3 B.23与3
C.3与23 D.23与23
[答案] D
8. 已知样本9,10,11,x,y的平均数是10,方差是2,则xy=(  )
A.98 B.88
C.76 D.96
[答案] D
9.某篮球运动员在2014赛季各场比赛得分情况如下:
12,15,24,25,31,31,36,36,37,39,44,49,50.
制作茎叶图,并分析这个运动员的整体水平及发挥的稳定程度.
[解析] 该运动员得分茎叶图如下:

从这张图中可以粗略地看出,该运动员得分大多能在20分到40分之间,且分布较为对称,集中程度高,说明其发挥比较稳定.
10.从某校参加数学竞赛的试卷中抽取一个样本,考查竞赛的成绩分布,将样本分成6组,得到频率分布直方图如图,从左到右各小组的小长方形的高的比为1?1?3?6?4?2,最右边的一组的频数是8.请结合直方图的信息,解答下列问题:
(1)样本容量是多少?
(2)成绩落在哪个范围的人数最多?并求出该小组的频数和频率.
(3)估计这次数学竞赛成绩的众数、中位数和平均数.

[解析] (1)从左到右各小组的频率分别为,,,,,,样本容量为=68.
(2)成绩落在70~80之间的人数最多;频率为;频数为68×=24.
(3)众数的估计值是75,中位数的估计值是70+×10=≈75.83.
平均数的估计值是×45+×55+×65+×75+×85+×95=75.

_________________________________________________________________________________
_________________________________________________________________________________

基础巩固(1)
基础巩固
一、选择题
1.下列关于频率分布直方图的说法正确的是(  )
A.直方图的高表示取某数的频率
B.直方图的高表示该组上的个体在样本中出现的频率
C.直方图的高表示取某组上的个体在样本中出现的频数与组距的比值
D.直方图的高表示取该组上的个体在样本中出现的频率与组距的比值
[答案] D
[解析] 要注意频率直方图的特点.在直方图中,纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积.
[点评] 注意区别直方图与条形图.
2.下列说法正确的是(  )
A.对于样本数据增加时,频率分布表不能增加变化
B.对于样本数据增加时,茎叶图不能增加变化
C.对于样本数据增加时,频率折线图不会跟着变化
D.对于样本数据增加时,频率分布直方图变化不太大
[答案] D
3.一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为(  )
A.10组       B.9组
C.8组 D.7组
[答案] B
[解析] 根据列频率分布表的步骤,==8.9.所以分为9组较为恰当.
4. 某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测度成绩不低于60分的学生人数为(  )

A.588 B.480
C.450 D.120
[答案] B
[解析] 本题考查频率分布直方图及频数的求法.成绩在[40,60)的频率P1=(0.005+0.015)×10=0.2,则成绩不少于60分的频率P2=1-0.2=0.8,所以可估计成绩不少于60分的学生人数为600×0.8=480,故选B.
5. 如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为(  )

A.0.2 B.0.4
C.0.5 D.0.6
[答案] B
[解析] 利用频率及茎叶图的知识直接运算求解.由题意知,这10个数据落在区间[22,30)内的有22、22、27、29,共4个,所以其频率为=0.4,故选B.
6. 某校100名学生的数学测试成绩的频率分布直方图如图所示,分数不低于a即为优秀,如果优秀的人数为20,则a的估计值是(  )

A.130 B.140
C.133 D.137
[答案] C
[解析] 本题考查频率分布直方图.由已知可以判断a∈(130,140),所以[(140-a)×0.015+0.01×10]×100=20,解得a≈133,故选C.
二、填空题
7.今年5月海淀区教育网开通了网上教学,某校高一年级(8)班班主任为了了解学生上网学习时间,对本班40名学生某天上网学习时间进行了调查,将数据(取整数)整理后,绘制出如图所示频率分布直方图,已知从左到右各个小组的频率分别是0.15,0.25,0.35,0.20,0.05,则根据直方图所提供的信息,这一天上网学习时间在100~119分钟之间的学生人数是________人,如果只用这40名学生这一天上网学习时间作为样本去推断该校高一年级全体学生该天的上网学习时间,这样推断是否合理?________(填“合理”或“不合理”)

[答案] 14 不合理
[解析] 由频数=样本容量×频率=40×0.35=14(人)
因为该样本的选取只在高一(8)班,不具有代表性,所以这样推断不合理.
8.青年歌手大奖赛共有10名选手参赛,并请了7名评委.如图所示的茎叶图是7名评委给参加最后决赛的两位选手甲、乙评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为________、________.
[答案] 84.2分 85分
[解析] 甲的成绩去掉一个最高分92分和一个最低分75分后,甲的剩余数据的平均成绩为84.2分;乙的成绩去掉一个最高分93分和一个最低分79分后,乙的剩余数据的平均成绩为85分.
三、解答题
9.有关部门从甲、乙两个城市所有的自动售货机中随机抽取了16台,记录了上午8?00~11?00之间各自的销售情况(单位:元)
甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;
乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.
试用两种不同的方式分别表示上面的数据,并简要说明各自的优点.
[解析] 方法一:从题目中的数不易直接看出各自的分布情况,为此,我们将以上数据用条形统计图表示.如图:

方法二:茎叶图如图,两竖线中间的数字表示甲、乙销售额的十位数,两边的数字表示甲、乙销售额的个位数.

从方法一可以看出条形统计图能直观地反映数据分布的大致情况,并且能够清晰地表示出各个区间的具体数目;从方法二可以看出,用茎叶图表示有关数据,对数据的记录和表示都带来方便.
10. 为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8?00~10?00间各自的点击量,得如图所示的茎叶图,根据茎叶图回答下列问题.

(1)甲、乙两个网站点击量的极差分别是多少?
(2)甲网站点击量在[10,40]间的频率是多少?
(3)甲、乙两网站哪个更受欢迎?并说明理由.
[解析] (1)甲网站的极差为:73-8=65,乙网站的极差为:71-5=66.
(2)=≈0.286.
(3)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.
基础巩固(2)
一、选择题
1.对于数据3,3,2,3,6,3,10,3,6,3,2.
①这组数据的众数是3;
②这组数据的众数与中位数的数值都不相等;
③这组数据的中位数与平均数的数值相等;
④这组数据的平均数与众数的值相等.
其中正确的结论的个数(  )
A.1       B.2
C.3 D.4
[答案] A
[解析] 在这11个数据中,数据3出现了6次,概率最高,故众数是3;将这11个数据按从小到大排列得2,2,3,3,3,3,3,3,6,6,10,中间数据是3,故中位数是3;而平均数==4.
2. 若样本数据x1,x2,……,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为(  )
A.8 B.15
C.16 D.32
[答案] C
[解析] 样本数据x1,x2,……,x10,其标准差=8,则Dx=64,而样本数据2x1-1,2x2-1,……,2x10-1的方差D(2x-1)=22Dx=22×64,其标准差为=16.故选C.
3.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如下图所示,假设得分值的中位数为me,众数为mO,平均值为,则(  )

A.me=mO= B.me=mO<
C.me[答案] D
[解析] 由图可知,30名学生的得分情况依次为:2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数,即me=5.5,5出现次数最多,故mO=5,==5.97.
于是mO4.为了稳定市场,确保农民增收,某农产品7个月份的每月市场收购价格与其前三个月的市场收购价格有关,并使其与前三个月的市场收购价格之差的平方和最小,下表列出的是该产品今年前6个月的市场收购价格:
月份 1 2 3 4 5 6
价格(元/担) 68 78 67 71 72 70

则前7个月该产品的市场收购价格的方差为(  )
A. B.
C.11 D.
[答案] B
[解析] 设7月份的市场收购价格为x,则y=(x-71)2+(x-72)2+(x-70)2=3x2-426x+15125,则当x=71时,7月份的市场收购价格与前三个月的市场收购价格之差的平方和最小,则7月份的市场收购价格为71.则计算得前7个月该产品的市场收购价格的平均数是71,方差是.
5. 某班级有50名学生,其中有30名男生和20名女生.随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是(  )
A.这种抽样方法是一种分层抽样
B.这种抽样方法是一种系统抽样
C.这五名男生成绩的方差大于这五名女生成绩的方差
D.该班男生成绩的平均数小于该班女生成绩的平均数
[答案] C
[分析] 根据抽样方法的概念可判断选项A,B;分别把数据代入方差和平均数的公式可判断选项C,D.
[解析] 若抽样方法是分层抽样,男生、女生应分别抽取6人、4人,所以A错;由题目看不出是系统抽样,所以B错;这五名男生成绩的平均数1==90,
这五名女生成绩的平均数2==91,
故这五名男生成绩的方差为[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8,这五名女生成绩的方差为[(88-91)2×2+(93-91)2×3]=6,所以这五名男生成绩的方差大于这五名女生成绩的方差,但该班男生成绩的平均数不一定小于女生成绩的平均数,所以D错.
6. 某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45)岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是(  )

A.31,6岁 B.32.6岁
C.33.6岁 D.36.6岁
[答案] C
[解析] 根据所给的信息可知,在区间[25,30)上的数据的频率为1-(0.01+0.07+0.06+0.02)×5=0.2.故中位数在第3组,且中位数的估计为30+(35-30)×=33.6(岁).
二、填空题
7.由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)
[答案] 1,1,3,3
[解析] 不妨设x1≤x2≤x3≤x4,
得:x2+x3=4,x1+x2+x3+x4=8?x1+x4=4,
s2=1?(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2=4?
①如果有一个数为0或4;则其余数为2,不合题意; ②只能取|x1-2|=1;得:这组数据为1,1,3,3.
8.阶段考试以后,班长算出了全班40个人数学成绩的平均分为M,如果把M当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均分为N,那么MN为________.
[答案] 1
[解析] M=,
N===M,
故MN=1.
三、解答题
9. 为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:
服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2
3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1
2.3 2.4
服用B药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3
1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2
2.7 0.5
(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?
(2)根据两组数据绘制茎叶图,从茎叶图看,哪种药的疗效更好?
[解析] (1)设A药观测数据的平均数为,B药观测数据的平均数为.由观测结果可得
=×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,
=×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.
由以上计算结果可得>,因此可看出A药的疗效更好.
(2)由观测结果可绘制如下茎叶图:

从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上,而B药疗效的试验结果有的叶集中在茎0,1上,由此可看出A药的疗效更好.
[名师点睛] 从平均数上分析,甲、乙中平均数大的效果较好;从茎叶图上分析,要看甲、乙的叶在哪些茎上分布的比率大.如果甲的叶在某茎上分布的比率大,且该茎所对应的数据较大,那么甲的效果就较好.
10.某学校高一(1)班和高一(2)班各有49名学生,两班在一次数学测验中的成绩统计如下:
班级 平均分 众数 中位数 标准差
(1)班 79 70 87 19.8
(2)班 79 70 79 5.2

(1)请你对下面的一段话给予简要分析:
高一(1)班的小刚回家对妈妈说:“昨天的数学测验,全班平均分为79分,得70分的人最多,我得了85分,在班里算上上游了!”
(2)请你根据表中的数据,对这两个班的数学测验情况进行简要分析,并提出建议.
[分析] (1)根据平均数、中位数、众数所反映的情况来分析;(2)结合方差的意义来提出建议.
[解析] (1)由于(1)班49名学生数学测验成绩的中位数是87,则85分排在全班第25名之后,所以从位次上看,不能说85分是上游,成绩应该属于中游.
但也不能以位次来判断学习的好坏,小刚得了85分,说明他对这段的学习内容掌握得较好,从掌握学习的内容上讲,也可以说属于上游.
(2)①班成绩的中位数是87分,说明高于87分(含87)的人数占一半以上,而平均分为79分,标准差又很大,说明低分也多,两极分化严重,建议加强对学习困难的学生的帮助.
②班的中位数和平均数都是79分,标准差又小,说明学生之间差别较小,学习很差的学生少,但学习优异的也很少,建议采取措施提高优秀率.
能力提升(1)
一、选择题
1.一个样本的容量为72,分成5组,已知第一、五组的频数都为8,第二、四组的频率都为,则第三组的频数为(  )
A.16  B.20    
C.24     D.36
[答案] C
[解析] 因为频率=,所以第二、四组的频数都为72×=16.所以第三组的频数为72-2×8-2×16=24.
2.某工厂对一批产品进行了抽样检测,下图是根据抽样检测后的产品净重数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100 g的个数是36,则样本中净重大于或等于98 g并且小于104 g的产品的个数是(  )

A.90 B.75
C.60 D.45
[答案] A
[解析] 由频率分布直方图可知,产品净重小于100g的频率是0.05×2十0.1×2=0.3,所以样本中产品的个数为=120.产品净重大于或等于104 g的频率为0.075×2=0.15.
所以产品净重大于或等丁98 g而小于104 g的频率为1-0.15-0.1=0.75.则净重在此范围内的产品个数为120×0.75=90个.
3.为了解电视对生活的影响,一个社会调查机构就平均每天看电视的时间对某地居民调查了10 000人,并根据所得数据画出样本的频率分布直方图(如图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人做进一步调查.则在[2.5,3]h时间段内应抽出的人数是(  )

A.25 B.30
C.50 D.75
[答案] A
[解析] 抽出的100人中平均每天看电视的时间在[2.5,3](h)时间内的频率是(0.5×0.5=0.25,所以这10 000人中平均每天看电视的时间在[2.5,3](11)时间内的人数是10000×0.25=2500,抽样比是=,则在[2.5,3](h)时间内应抽出的人数是2500×=25.
4.下图是根据《山东统计年鉴2009》中的资料作成的1999年至2008年山东省城镇居民百户家庭人口数的茎叶图,图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1999年至2008年山东省城镇居民百户家庭人口数的平均数为(  )

A.304.6 B.303.6
C.302.6 D.301.6
[答案] B
[解析] 自1999年至2008年百户家庭人口数分别为291,291,295,298,302,306, 310,312,314,317,则平均数为(291+291+295+298+302+306+310+312+314+317)=303.6.
二、填空题
5.某校开展“爱我海西,爱我家乡”摄影比赛,9位评委给参赛作品A打出的分数如茎叶图所示,记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现一个数字(茎叶图中的x)无法看清.若记分员计算无误,则数字x应该是________.

[答案] 1
[解析] 若x≤4,则由平均分为91知总分应为91×7=637.故637=89+89+92+93+92+91+90+x,得x=1;若x>4,637≠89+89+92+93+92+91+94=640不合题意.
6.图1是某工厂2010年9月份10个车间产量统计条形图,条形图从左到右表示各车间的产量依次记为A1,A2,…,A10(如A3表示3号车间的产量为950件).图2是统计图1中产量在一定范围内车间个数的一个算法流程图.那么运行该算法流程后输出的结果是________.


[答案] 4
[解析] 通过算法流程图可知,它的功能是统计产量超过950件的车间数,所以通过条形统计图可知产量超过950件的车间数为4个,所以最后输出的结果是4.
三、解答题
7.某市2010年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸人颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,
(1)完成频率分布表;
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
[解析] (1)频率分布表:
分组 频数 频率
[41,51) 2
[51,61) 1
[61,71) 4
[71,81) 6
[81,91) 10
[91,101) 5
[101,111) 2


(2)频率分布直方图,如图所示.

(3)答对下述两条中的一条即可:
①该市一个月中空气污染指数有2天处于优的水平,占当月天数的,有26天处于良的水平,占当月天数的,处于优或良的天数共有28天,占当月天数的.说明该市空气质量基本良好.
②轻微污染有2天,占当月天数的.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的,超过50%,说明该市空气质量有待进一步改善.
8.某电视台为宣传本省,随机对本省内15~65岁的人群抽取了n人,回答问题“本省内著名旅游景点有哪些”统计结果如图表所示.
组号 分组 回答正确的人数 回答正确的人数占本组的频率
第1组 [15,25) a 0.5
第2组 [25,35) 18 x
第3组 [35,45) b 0.9
第4组 [45,55) 9 0.36
第5组 [55,65] 3 y


(1)分别求出a、b、x、y的值;
(2)从第2、3、4组回答正确的人中用分层抽样的方法抽取6人,求第2、3、4组每组各抽取多少人?
[解析] (1)由频率表中第4组数据可知,第4组总人数为=25,再结合频率分布直方图可知
n==100,
∴a=100×0.01×10×0.5=5,
b=100×0.03×10×0.9=27,
x==0.9,y==0.2.
(2)第2、3、4组回答正确的共有54人.
∴利用分层抽样在54人中抽取6人,每组分别抽取的人数为:第2组:×6=2(人);第3组:×6=3(人);第4组:×6=1(人).
能力提升(2)
一、选择题
1.某校高一、高二年级各有7个班参加歌咏比赛,他们的得分的茎叶图如图所示,对这组数据分析正确的是(  )

A.高一的中位数大,高二的平均数大
B.高一的平均数大,高二的中位数大
C.高一的平均数、中位数都大
D.高二的平均数、中位数都大
[答案] A
[解析] 由茎叶图可以看出,高一的中位数为93,高二的中位数为89,所以高一的中位数大.由计算得,高一的平均数为91,高二的平均数为92,所以高二的平均数大.
2. 如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)

已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为(  )
A.2,5 B.5,5
C.5,8 D.8,8
[答案] C
[分析] 观察茎叶图,由中位数的概念可得x的值,由平均数的计算公式可得y的值.
[解析] 由于甲组的中位数是15,可得x=5,由于乙组数据的平均数为16.8,得y=8.
3. 将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:

则7个剩余分数的方差为(  )
A. B.
C.36 D.
[答案] B
[分析] 根据茎叶图和平均数的计算公式求出x,然后根据方差的计算公式计算方差
[解析] 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x=91×7,解得x=4.故s2=[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=.
4. 在某地区某高传染性病毒流行期间,为了建立指标来显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5”,根据连续7天的新增病例数计算,下列各选项中,一定符合上述指标的是(  )
①平均数x≤3;②标准差s≤2;③平均数x≤3且标准差s≤2;④平均数x≤3且极差小于或等于2;⑤众数等于1且极差小于或等于4.
A.①② B.③④
C.③④⑤ D.④⑤
[解析] 本题考查平均数、标准差、极差、众数的统计意义.假设连续7天新增病例数为0,3,3,3,3,3,6,易知满足平均数x≤3且标准差x≤2,但是不符合指标,所以①②③错误.若极差等于0或1,在平均数x≤3的条件下显然符合指标;若极差等于2,则极小值与极大值的组合可能有:(1)0,2;(2)1,3;(3)2,4;(4)3,5;(5)4,6.在平均数x≤3的条件下,只有(1)(2)(3)成立,且显然符合指标,所以④正确.又易知⑤正确,故选D.
[答案] D
二、填空题
5.某学员在一次射击测试中射靶6次,命中环数如下:
9,5,8,4,6,10
则(1)平均命中环数为________;
(2)命中环数的标准差为________.
[答案] (1)7 (2)
[分析] 直接把数据代入平均数和标准差计算的公式可解.
[解析] (1)由公式知,平均数为(9+5+8+4+6+10)=7.
(2)由标准差公式知,s2=(4+4+1+9+1+9)=.
6.如图是一次考试结果的频数分布直方图,根据该图可估计,这次考试的平均分数为________

[答案] 46
[解析] 根据频数分布直方图,可估计有4人成绩在[0,20)之间,其考试分数之和为4×10=40;有8人成绩在[20,40)之间,其考试分数之和为8×30=240;有10人成绩在[40,60)之间,其考试分数之和为10×50=500;有6人成绩在[60,80)之间,其考试分数之和为6×70=420;有2人成绩在[80,100)之间,其考试分数之和为2×90=180,由此可知,考生总人数为4+8+10+6+2=30,考试总成绩为40+240+500+420+180=1 380,平均数==46.
三、解答题
7. 从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:

质量指标 值分组 [75,85) [85,95) [95,105) [105,115) [115,125]
频数 6 26 38 22 8

(1)在答题卡上作出这些数据的频率分布直方图:

(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?
[解析] (1)

(2)质量指标值的样本平均数为
=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.
质量指标值的样本方差为
s2=(-20)2×0.06+(-10)2×0.26+0×0.38+(10)2×0.22+(20)2×0.08=104.
(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品“质量指标值不低于95的产品至少要占全部产品80%”的规定.
8. 对某校高三年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图如图所示.
分组 频数 频率
[10,15) 10 0.25
[15,20) 24 n
[20,25) m p
[25,30] 2 0.05
合计 M 1


(1)求出表中M,p及图中a的值;
(2)若该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数;
(3)估计这次学生参加社区服务人数的众数、中位数以及平均数.
[解析] (1)由分组[10,15)内的频数是10,频率是0.25,知=0.25,所以M=40.
因为频数之和为40,所以10+24+m+2=40,m=4,p===0.10.
因为a是对应分组[15,20)的频率与组距的商,所以a==0.12.
(2)因为该校高三学生有240人,分组在[10,15)内的频率是0.25,
所以估计该校高三学生参加社区服务的次数在此区间内的人数为60.
(3)估计这次学生参加社区服务人数的众数是=17.5.因为n==0.6,
所以样本中位数是15+≈17.1,
估计这次学生参加社区服务人数的中位数是17.1,
样本平均人数是12.5×0.25+17.5×0.6+22.5×0.1+27.5×0.05=17.25,
估计这次学生参加社区服务人数的平均数是17.25.


7