用样本估计总体
1总体取值规律的估计
① 频率直方图
(1) 画频率直方图的步骤
求极差--决定组距与组数--将数据分组--列频率分布表--画频率分布直方图.
(2) 小长方形的面积=频率
(3) 在直方图中,各小长方形的面积之和等于.
2 总体百分位数的估计
① 第百分位数的概念
一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
② 计算一组个数据的第百分位数
第一步:按从小到大排列原始数据;
第二步:计算;
第三步:若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
③ 四分位数的概念
四分位数:包含第百分位数,第百分位数,第百分位数.
中位数相当于第百分位数,第百分位数也称为第一四分位数或下四分位数,第百分位数也称为第三四分位数或上四分位数.
3 总体集中趋势的估计
一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的,那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”,那么平均数大于中位数;如果直方图在左边“拖尾”,那么平均数小于中位数.
一般地,对数值型数据(如用水量,身高,收入,产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
4 总体离散程度的估计
① 方差,标准差的概念
(1)假设一组数据是,用
这组数据的方差,为了计算方便也可以用
标准差是
② 方差,标准差的意义
方差越大,表明数据波动越大,越不稳定;方差越小,表明数据波动越小,越稳定.
【题型一】常见统计数据
【典题1】 某地一年之内12个月的月降水量从小到大分别为:46,51, 48,53,56, 53,56,64,58,56,66,71,则该地区的月降水量20%分位数和75%分位数为( )
A.51,58 B.51,61 C.52,58 D.52,61
【典题2】甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:下列说法错误的是( )
A.从平均数和方差相结合看,甲波动比较大,乙相对比较稳定
B.从折线统计图上两人射击命中环数走势看,甲更有潜力
C.从平均数和命中9环及9环以上的次数相结合看,甲成绩较好
D.从平均数和中位数相结合看,乙成绩较好
【典题3】 已知的平均数为,标准差为,则的平均数和标准差分别为 .
【典题4】为了解本市居民的生活成本,甲、乙、内三名同学利用假期分别对三个社区进行了“家庭每月日常消费额”的调查.他们将调查所得到的数据分别绘制成频率分布直方图(如图所示),甲、乙、丙所调查数据的标准差分别为,则它们的大小关系为( )
【典题5】在发生某公共卫生事件期间,有专业机构认为该事件在一段事时间内没有发生大规模群体感染的标志是“连续10日,每天新增疑似病例不超过7人”.过去10日,甲、乙、丙、丁四地新增疑似病例数据信息如下:
甲地:中位数为2,众数为3;
乙地:总体平均数为2,总体方差为3;
丙地:总体平均数为1,总体方差大于0;
丁地:总体平均数为3,中位数为4.
则甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是 地
【典题6】(多选) 气象意义上从春季进入夏季的标志为“当且仅当连续天每天日平均温度不低于”.现有甲、乙、丙三地连续天日平均温度的记录数据(数据均为正整数,单位)且满足以下条件:
甲地:个数据的中位数是,众数是;
乙地:个数据的中位数是,平均数是;
丙地:个数据有个是,平均数是,方差是.
根据以上数据,下列统计结论正确的是( )
A.甲地进入了夏季
B.乙地进入了夏季
C.不能确定丙地进入了夏季
D.恰有2地确定进入了夏季
巩固练习
1. (★)以下数据为参加数学竞赛决赛的15人的成绩:(单位:分)
78,70,72,86,88,79,80,81,94,84,56,98,83,90,91.
则这人成绩的第百分位数是 .
2. (★)已知甲、乙两组数据(已按从小到大的顺序排列):
甲组:;乙组:.
若这两组数据的30百分位数、80百分位数分别相等,则等于
3. (★)某同学将全班某次数学考试成绩整理成频率分布直方图后,并将每个小矩形上方线段的中点连接起来得到频率分布折线图(如图所示),据此估计此次考试成绩的众数是( )
A.100 B.110 C.115 D.120
4. (★★) 在某次测量中得到的样本数据如下:80,82,82,84,84,84,84,86,86,86,86.若的样本数据恰好是的样本数据都减去2后得到的数据,则关于,两样本数据特征的下列说法中,正确的是( )
A.样本数据的众数为84 B.样本数据的方差相同
C.样本数据的平均数相同 D.样本数据的中位数相同
5. (★★)下列命题中不正确的是( )
A.一组数据1,2,3,3,4,5的众数大于中位数
B.数据6,5,4,3,3,3,2,2,2,1的85%分位数为5
C.若甲组数据的方差为5,乙组数据为5,6,9,10,5,则这两组数据中较稳定的是乙
D.为调查学生每天平均阅读时间,某中学从在校学生中,利用分层抽样的方法抽取初中生20人,高中生10人.经调查,这20名初中生每天平均阅读时间为60分钟,这10名高中生每天平均阅读时间为90分钟,那么被抽中的30名学生每天平均阅读时间为70分钟
6.(★★) 已知数据是杭州市100个普通职工的2016年10月份的收入(均不超过2万元),设这100个数据的中位数为,平均数为,方差为,如果再加上马云2016年10月份的收入(约100亿元),则相对于,这101个月收入数据( )
A.平均数可能不变,中位数可能不变,方差可能不变
B.平均数大大增大,中位数可能不变,方差也不变
C.平均数大大增大,中位数一定变大,方差可能不变
D.平均数大大增大,中位数可能不变,方差变大
7. (★★) 设样本数据的平均值和方差分别为2和5,若(a为非零实数,),则的均值和方差分别为( )
8. (★★★)(多选) 在全球新型冠状病毒流行期间,为了建立指标显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5人”,根据连续7天的新增病例数计算,下列各项中,一定符合上述指标的是( )
A.平均数
B.标准差
C.平均数且极差小于或等于
D.众数等于且极差小于或等于
9. (★★★) (多选)甲同学投掷骰子5次,并请乙同学将向上的点数记录下来,计算出平均数和方差.由于记录遗失,乙同学只记得这五个点数的平均数为2,方差在区间[1.2,2.4]内,则这五个点数( )
A.众数可能为
B.中位数可能为
C.一定不会出现
D.出现的次数不超过两次
【题型二】频率直方图的运用
【典题1】 某校从参加高一年级期末考试的学生中抽出名学生,将其成绩(均为整数)分成六段后,画出如图所示部分频率分布直方图.观察图形,回答下列问题:
(1) 求第四小组的频率,并补全这个频率分布直方图;
(2) 估计这次考试成绩的中位数(结果取整数值);
(3) 估计这次考试的众数、平均分、方差.
巩固练习
(★)为了了解某种进口茶叶的质量(单位:克),从中抽取若干包进行检查,获得样本的频率分布直方图如图所示.若已知样本中质量在内的茶叶有包,则样本容量为( )
A.150 B.100 C.70 D.50
2. (★★) 某市高三数学抽样考试中,对90分以上(含90分)的成绩进行统计,其频率分布图如图所示,若130~140分数段的人数为90人,则90~100分数段的人数为( )
A.740 B.180 C.720 D.540
3. (★★) 某市要对辖区内的中学教师的年龄进行调查,现从中随机抽出200名教师,已知抽到的教师年龄都在[25,50)岁之间,根据调查结果得出教师的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市辖区内中学教师的年龄的中位数大约是( )
A.37.1岁 B.38.1岁 C.38.7岁 D.43.1岁
4. (★★)(多选) 为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
则下列结论正确的是( )
A.估计该地农户家庭年收入不低于8.5万元的农户比例为30%
B.估计该地农户家庭年收入的第三四分位数为9万元
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地农户家庭年收入的中位数为8万元
5. (★★)(多选)习近平总书记强调,要坚持健康第一的教育理念,加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一和高二年级每周在校体育锻炼时长进行了统计,得到数据(单位:小时)如表:
高一年级在校体育锻炼时长
关于高一和高二年级在校体育锻炼时长,下列说法正确的是( )
A.高一年级时长的众数比高二年级的大
B.高一年级时长的平均数比高二年级的小
C.高一年级时长的中位数比高二年级的大
D.高一年级时长的方差比高二年级的大
6.(★★) 为对考生的月考成绩进行分析,某地区随机抽查了10000名考生的成绩,根据所得数据画了如下的样本频率分布直方图.
(1)求成绩在[600,650)的频率;
(2)根据频率分布直方图算出样本数据的中位数;
(3)为了分析成绩与班级、学校等方面的关系,必须按成绩再从这10000人中用分层抽样方法抽出20人作进一步分析,则成绩在[550,600)的这段应抽多少人?
7.(★★) 某学校1800名学生在一次百米测试中,成绩全部介于13秒与18秒之间,抽取其中50个样本,将测试结果按如下方式分成五组:第一组[13,14],第二组[14,15),第五组[17,18],如图是按上述分组方法得到的频率分布直方图.
(1)若成绩小于15秒认为良好,求该样本在这次百米测试中成绩良好的人数;
(2)请估计学校1800名学生中,成绩属于第四组的人数;
(3)请根据频率分布直方图,求样本数据的众数、中位数、平均数和方差.
中小学教育资源及组卷应用平台
21世纪教育网(www.21cnjy.com)用样本估计总体
1总体取值规律的估计
① 频率直方图
(1) 画频率直方图的步骤
求极差--决定组距与组数--将数据分组--列频率分布表--画频率分布直方图.
(2) 小长方形的面积=频率
(3) 在直方图中,各小长方形的面积之和等于.
2 总体百分位数的估计
① 第百分位数的概念
一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
② 计算一组个数据的第百分位数
第一步:按从小到大排列原始数据;
第二步:计算;
第三步:若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
③ 四分位数的概念
四分位数:包含第百分位数,第百分位数,第百分位数.
中位数相当于第百分位数,第百分位数也称为第一四分位数或下四分位数,第百分位数也称为第三四分位数或上四分位数.
3 总体集中趋势的估计
一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的,那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”,那么平均数大于中位数;如果直方图在左边“拖尾”,那么平均数小于中位数.
一般地,对数值型数据(如用水量,身高,收入,产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
4 总体离散程度的估计
① 方差,标准差的概念
(1)假设一组数据是,用
这组数据的方差,为了计算方便也可以用
标准差是
② 方差,标准差的意义
方差越大,表明数据波动越大,越不稳定;方差越小,表明数据波动越小,越稳定.
【题型一】常见统计数据
【典题1】 某地一年之内12个月的月降水量从小到大分别为:46,51, 48,53,56, 53,56,64,58,56,66,71,则该地区的月降水量20%分位数和75%分位数为( )
A.51,58 B.51,61 C.52,58 D.52,61
【解析】该组数据从小到大排列为:46,48,51,53,53,56,56,56,58,64,66,71
因为,计算结果不是整数,
所以分位数为第项数据,即;
因为,计算结果是整数,
所以分位数为第9项和第10项数据的平均数,即.
【点拨】计算一组个数据的第百分位数的步骤:
(1)按从小到大排列原始数据;
(2)计算;
(3)若不是整数,而大于的比邻整数为,则第百分位数为第项数据;
若是整数,则第百分位数为第项与第项数据的平均数.
【典题2】甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:下列说法错误的是( )
A.从平均数和方差相结合看,甲波动比较大,乙相对比较稳定
B.从折线统计图上两人射击命中环数走势看,甲更有潜力
C.从平均数和命中9环及9环以上的次数相结合看,甲成绩较好
D.从平均数和中位数相结合看,乙成绩较好
【解析】由图可知,甲打靶的成绩为2,4,6,8,7,7,8,9,9,10,
所以甲的平均数为,
甲方差;
乙打靶的成绩分别为9,5,7,8,7,6,8,6,7,7,
乙的平均数为,
乙方差;
所以,从平均数和方差相结合看,甲波动比较大,乙波动比较小,故正确,
(不求方差,看图也可知道甲的波动比乙的要打些)
从折线统计图看,在后半部分,甲呈上升趋势,而乙呈下降趋势,甲更有潜力,故正确,
甲打靶的成绩为2,4,6,7,7,8,8,9,9,10,中位数为7.5,
乙打靶的成绩为5,6,6,7,7,7,7,8,8,9,中位数为7,
甲9环以及9环以上的次数为3次,乙9环以及9环以上的次数为1次,
而二人的平均数相同,故甲成绩更好点,故正确,
甲乙的平均数相同,而甲的中位数大于乙的中位数,故甲的成绩比较好,故错误,
故选:.
【典题3】 已知的平均数为,标准差为,则的平均数和标准差分别为 .
【解析】的平均数为,标准差为,
的平均数为,标准差为:
【点拨】若原有的数据平均数为,方差为,在原数据基础上进行线性变化,则新的平均数为,新的方差为.
【典题4】为了解本市居民的生活成本,甲、乙、内三名同学利用假期分别对三个社区进行了“家庭每月日常消费额”的调查.他们将调查所得到的数据分别绘制成频率分布直方图(如图所示),甲、乙、丙所调查数据的标准差分别为,则它们的大小关系为( )
【解析】根据三个频率分步直方图知,
甲数据的两端数字较多,绝大部分数字都处在两端数据偏离平均数远,最分散,其方差、标准差最大;
丙数据是单峰的每一个小长方形的差别比较小,数字分布均匀,数据不如第一组偏离平均数大,方差比第一组中数据中的方差、标准差小,
而乙数据绝大部分数字都在平均数左右,数据最集中,故其方差、标准差最小,
总上可知,
故选:.
【点拨】根据方差的意义就可以判断方差的大小. 数据波动越大,方差越大;数据波动越小,方差越小.
【典题5】在发生某公共卫生事件期间,有专业机构认为该事件在一段事时间内没有发生大规模群体感染的标志是“连续10日,每天新增疑似病例不超过7人”.过去10日,甲、乙、丙、丁四地新增疑似病例数据信息如下:
甲地:中位数为2,众数为3;
乙地:总体平均数为2,总体方差为3;
丙地:总体平均数为1,总体方差大于0;
丁地:总体平均数为3,中位数为4.
则甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是 地
【解析】(要每天军不超过人方能确定没发生大规模群体感染,即10个数不出现极端数值)
根据题意,依次分析选项:
对于甲地:中位数为2,众数为3,则从小排到大的数据形式是;
有可能出现超过7人的情况,如数据0,0,1,1,2,2,3,3,3,8,
出现了每天新增疑似病例超过人的情况,可能发生大规模群体感染;
② 对于丙地,若要满足题意,则总和是,且不能个数都是,
对于数据8,1,1,0,0,0,0,0,0,0,总体平均数为,总体方差大于,
而出现了每天新增疑似病例超过7人的情况,可能发生大规模群体感染;
③ 对于丁地,平均数与中位数不能限制极端值的出现,则有可能出现超过人的情况,可能发生大规模群体感染,比如0,0,0,0,4,4,,,,;
④ (甲丙丁都排除了,那如何证明乙地是一定没有发生大规模群体感染?用反证法)
对于乙地,假设过去10天新增疑似病例数据存在一个数据,,
而总体平均数为2,则总体方差,故不成立,
故假设不成立,故符合没有发生大规模群体感染的标志,一定没有发生大规模群体感染;
故答案为:乙.
【点拨】
(1)先明确众数、平均数、众数对极端数值的出现影响较小,了解满足各项的要求的数据形
式,再通过举反例进行排除.
(2)当证明含“一定”“唯一”“至多”“至少”等字眼的命题或从正面较难求解的,可尝试间接证明方法--反证法.
【典题6】(多选) 气象意义上从春季进入夏季的标志为“当且仅当连续天每天日平均温度不低于”.现有甲、乙、丙三地连续天日平均温度的记录数据(数据均为正整数,单位)且满足以下条件:
甲地:个数据的中位数是,众数是;
乙地:个数据的中位数是,平均数是;
丙地:个数据有个是,平均数是,方差是.
根据以上数据,下列统计结论正确的是( )
A.甲地进入了夏季
B.乙地进入了夏季
C.不能确定丙地进入了夏季
D.恰有2地确定进入了夏季
【解析】甲地:个数据由小到大排,
则,其中,满足进入夏季的标志;
乙地:将个数据由小到大排,则,其中,
则,而,
故,其中必有一个小于,故不满足一定进入夏季的标志;
丙地:设个数据,且,
由方差公式可知:
,
则,
不妨设,,
则均大于,但不确定是否大于,故不能确定丙地进入夏天.
故选:.
巩固练习
1. (★)以下数据为参加数学竞赛决赛的15人的成绩:(单位:分)
78,70,72,86,88,79,80,81,94,84,56,98,83,90,91.
则这人成绩的第百分位数是 .
【答案】
【解析】该组数据从小到大排列为:
56,70,72,78,79,80,81,83,84,86,88,90,91,94,98.
且,
所以这人成绩的第80百分位数是.
故答案为:.
2. (★)已知甲、乙两组数据(已按从小到大的顺序排列):
甲组:;乙组:.
若这两组数据的30百分位数、80百分位数分别相等,则等于
【答案】
【解析】因为,,
所以乙组的百分位数为,甲组的百分位数为,
则.
3. (★)某同学将全班某次数学考试成绩整理成频率分布直方图后,并将每个小矩形上方线段的中点连接起来得到频率分布折线图(如图所示),据此估计此次考试成绩的众数是( )
A.100 B.110 C.115 D.120
【答案】C
【解析】根据频率分布折线图,得;折线的最高点对应的值是115,
据此估计此次考试成绩的众数是115.故选:C.
4. (★★) 在某次测量中得到的样本数据如下:80,82,82,84,84,84,84,86,86,86,86.若的样本数据恰好是的样本数据都减去2后得到的数据,则关于,两样本数据特征的下列说法中,正确的是( )
A.样本数据的众数为84 B.样本数据的方差相同
C.样本数据的平均数相同 D.样本数据的中位数相同
【答案】
【解析】在某次测量中得到的样本数据如下:.
若的样本数据恰好是的样本数据都减去后得到的数据,
样本数据的众数是和,样本数据的众数是和,故错误;
样本数据的方差相同,故B正确;
样本数据的平均数比样本数据的平均数大,故错误;
样本数据的中位数比样本数据的中位数大,故错误.
故选:.
5. (★★)下列命题中不正确的是( )
A.一组数据1,2,3,3,4,5的众数大于中位数
B.数据6,5,4,3,3,3,2,2,2,1的85%分位数为5
C.若甲组数据的方差为5,乙组数据为5,6,9,10,5,则这两组数据中较稳定的是乙
D.为调查学生每天平均阅读时间,某中学从在校学生中,利用分层抽样的方法抽取初中生20人,高中生10人.经调查,这20名初中生每天平均阅读时间为60分钟,这10名高中生每天平均阅读时间为90分钟,那么被抽中的30名学生每天平均阅读时间为70分钟
【答案】
【解析】选项A:1,2,3,3,4,5的众数为,中位数为,
故相等,所以错误,
选项B:将数据从小到大排列为:1,2,2,2,3,3,3,4,5,6,则它们的分位数为,即为,故正确,
选项:乙组数据的平均值为,
所以方差为
所以这两组数据中较稳定的是乙,故C正确,
选项D:被抽中的30名学生每天平均阅读时间为,故D正确,
故选:A.
6.(★★) 已知数据是杭州市100个普通职工的2016年10月份的收入(均不超过2万元),设这100个数据的中位数为,平均数为,方差为,如果再加上马云2016年10月份的收入(约100亿元),则相对于,这101个月收入数据( )
A.平均数可能不变,中位数可能不变,方差可能不变
B.平均数大大增大,中位数可能不变,方差也不变
C.平均数大大增大,中位数一定变大,方差可能不变
D.平均数大大增大,中位数可能不变,方差变大
【答案】B
【解析】∵数据x1,x2,x3,…,xn是上海普通职工个人的年收入,
而xn+1为世界首富的年收入
则xn+1会远大于x1,x2,x3,…,xn,
故这n+1个数据中,年收入平均数大大增大,
但中位数可能不变,也可能稍微变大,
但由于数据的集中程序也受到xn+1比较大的影响,而更加离散,则方差变大
故选B
7. (★★) 设样本数据的平均值和方差分别为2和5,若(a为非零实数,),则的均值和方差分别为( )
【答案】B
【解析】根据题意,样本x1,x2,…,x10数据的平均值和方差分别为2和5,
则有=(x1+x2+…+x10)=2,
=[(x1﹣2)2+(x2﹣2)2+…+(x10﹣2)2]=5,
对于;
则有=(x1+a+x2+a+…+x10+a)=(x1+x2+…+x10+10a)=2+a,
=[(y1﹣2﹣a)2+(y2﹣2﹣a)2+…+(y10﹣2﹣a)2]=5,
故选:B.
8. (★★★)(多选) 在全球新型冠状病毒流行期间,为了建立指标显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5人”,根据连续7天的新增病例数计算,下列各项中,一定符合上述指标的是( )
A.平均数
B.标准差
C.平均数且极差小于或等于
D.众数等于且极差小于或等于
【答案】
【解析】A错,举反例:0,0,0,0,2,6,6,其平均数,不符合指标,
B错,举反例:0,3,3,3,3,3,6,平均数,且标准差,不符合指标,
C对,若极差等于0或1,在的条件下,显然符合指标;若极差等于2且,
则每天新增感染人数的最小值与最大值有下列可能:(1)0,2,(2)1,3,(3)2,4,符合指标,
D对,若众数等于1且极差小于或等于4,则最大值不超过5,符合指标.
故选:.
9. (★★★) (多选)甲同学投掷骰子5次,并请乙同学将向上的点数记录下来,计算出平均数和方差.由于记录遗失,乙同学只记得这五个点数的平均数为2,方差在区间[1.2,2.4]内,则这五个点数( )
A.众数可能为
B.中位数可能为
C.一定不会出现
D.出现的次数不超过两次
【答案】
【解析】对于A,向上的点数为1,1,1,2,5时,众数为1,平均数为2,
方差为,故A正确;
若中位数为3,设五次数据从小到大为:,,,,,则,
,
,,矛盾,故错误;
若出现了6,则其它四次和为4,即数据为1,1,1,1,6,
方差为 ,矛盾,故C正确;
若出现3次2,则其它2次和为4,这两次为1,4,
方差为,矛盾,故D正确.
故选:.
【题型二】频率直方图的运用
【典题1】 某校从参加高一年级期末考试的学生中抽出名学生,将其成绩(均为整数)分成六段后,画出如图所示部分频率分布直方图.观察图形,回答下列问题:
(1) 求第四小组的频率,并补全这个频率分布直方图;
(2) 估计这次考试成绩的中位数(结果取整数值);
(3) 估计这次考试的众数、平均分、方差.
【解析】(1) 因为各组的频率和等于1,
故第四组的频率:
直方图如右所示.
(2) 成绩在的频率为
成绩在的频率为:,
中位数在内,
设中位数为,
中位数要平分直方图的面积,
解得
即中位数为.
(3) 频率最大的是组,则众数是;
利用组中值估算抽样学生的平均分为:
估计这次考试的平均分是(分).
方差.
【点拨】
① 利用频率之和为1,得到所有矩形面积之和为1;
② 在频率直方图中
众数最高那组的组中值;
平均数每组的组中值每组的面积之和;
方差之和;
中位数:设中位数为,则直线能够把所有矩形的面积平分,即在直线左边的矩形面积为
巩固练习
(★)为了了解某种进口茶叶的质量(单位:克),从中抽取若干包进行检查,获得样本的频率分布直方图如图所示.若已知样本中质量在内的茶叶有包,则样本容量为( )
A.150 B.100 C.70 D.50
【答案】D
【解析】样本中质量在内的茶叶有包,
由频率分布直方图得质量在内的频率为,
样本容量.故选:D.
2. (★★) 某市高三数学抽样考试中,对90分以上(含90分)的成绩进行统计,其频率分布图如图所示,若130~140分数段的人数为90人,则90~100分数段的人数为( )
A.740 B.180 C.720 D.540
【答案】C
【解析】根据频率分布直方图,得,分数段的人数为人,对应的频率是,
样本容量是=1800;分数段的人数.
故选:C.
3. (★★) 某市要对辖区内的中学教师的年龄进行调查,现从中随机抽出200名教师,已知抽到的教师年龄都在[25,50)岁之间,根据调查结果得出教师的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市辖区内中学教师的年龄的中位数大约是( )
A.37.1岁 B.38.1岁 C.38.7岁 D.43.1岁
【答案】B
【解析】根据频率和等于,得;年龄在岁之间的频率为
,
令,解得;
该市辖区内中学教师的年龄的中位数大约岁.
故选:.
4. (★★)(多选) 为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
则下列结论正确的是( )
A.估计该地农户家庭年收入不低于8.5万元的农户比例为30%
B.估计该地农户家庭年收入的第三四分位数为9万元
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地农户家庭年收入的中位数为8万元
【答案】
【解析】对于,该地农户家庭年收入不低于8.5万元的农户比例为,故正确;
对于,该地农户家庭年收入的第三四分位数为万元,
则,
解得,故正确;
对于,该地农户家庭所收入的平均值为:
,故错误;
对于D,设该地农户家庭年收入的中位数为万元,
则,即,
则中位数为7.5,故D错误.
故选:.
5. (★★)(多选)习近平总书记强调,要坚持健康第一的教育理念,加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一和高二年级每周在校体育锻炼时长进行了统计,得到数据(单位:小时)如表:
高一年级在校体育锻炼时长
关于高一和高二年级在校体育锻炼时长,下列说法正确的是( )
A.高一年级时长的众数比高二年级的大
B.高一年级时长的平均数比高二年级的小
C.高一年级时长的中位数比高二年级的大
D.高一年级时长的方差比高二年级的大
【答案】
【解析】对于高一年级,由表可进行下列计算:
时长众数为,时长平均数为,
时长中位数为
时长方差为
;
对于高二年级,由频率分布直方图可进行下列计算:
时长众数为,时长平均数为,
时长中位数为,
时长方差为
.
由上可知:,,,,
故选:.
6.(★★) 为对考生的月考成绩进行分析,某地区随机抽查了10000名考生的成绩,根据所得数据画了如下的样本频率分布直方图.
(1)求成绩在[600,650)的频率;
(2)根据频率分布直方图算出样本数据的中位数;
(3)为了分析成绩与班级、学校等方面的关系,必须按成绩再从这10000人中用分层抽样方法抽出20人作进一步分析,则成绩在[550,600)的这段应抽多少人?
【答案】(1) (2) (3)
【解析】(1)根据频率分布直方图,得;
成绩在的频率为;.
(2)因为
,且,
所以,样本数据的中位数为(分);
(3)成绩在的频率为,
所以名考生中成绩在[550,600)的人数为(人),
再从人用分层抽样方法抽出人,
则成绩在[550,600)的这段应抽取人.
7.(★★) 某学校1800名学生在一次百米测试中,成绩全部介于13秒与18秒之间,抽取其中50个样本,将测试结果按如下方式分成五组:第一组[13,14],第二组[14,15),第五组[17,18],如图是按上述分组方法得到的频率分布直方图.
(1)若成绩小于15秒认为良好,求该样本在这次百米测试中成绩良好的人数;
(2)请估计学校1800名学生中,成绩属于第四组的人数;
(3)请根据频率分布直方图,求样本数据的众数、中位数、平均数和方差.
【答案】(1) (2) (3)
【解析】(1)样本在这次百米测试中成绩良好的人数是:
(人);
(2)学校名学生中,成绩属于第四组的人数(人);
(3)由图可知众数落在第三组,是,
因为数据落在第一、二组的频率
数据落在第一、二、三组的频率,
所以中位数一定落在第三组中,
假设中位数是,所以,
解得中位数.
中小学教育资源及组卷应用平台
21世纪教育网(www.21cnjy.com)