中小学教育资源及组卷应用平台
第14讲 用样本估计总体
一、频率分布直方图
1.计算极差:找出数据的最大值与最小值,计算它们的差.
2.决定组距与组数:.
3.将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.
4.列频率分布表:.
5.绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图.
二、频率分布直方图的特点
1..
2.各个小长方形的面积的总和等于1.
3.平均数:每个小矩形底边中点的横坐标与小矩形的面积的乘积之和.
4.中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等.
5.众数:最高小矩形底边的中点所对应的数据.
三、百分位数的计算
1.一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,
且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤:第1步,按从小到大排列原始数据.第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3.四分位数:.
四、总体离散程度的估计
1.极差是一组数据的最大值和最小值之差,反映一组数据的变动幅度.
2.样本方差,样本标准差.
标准差越大数据离散程度越大;标准差越小,数据离散程度越小.
3..
【课堂训练】
一、单选题
1.已知数据的平均数为,方差为,数据的方差为,则( )
A. B. C. D.与的大小关系无法判断
2.已知一组数据3,5,7,x,10的平均数为6,则这组数据的方差为( )
A. B.6 C. D.5
3.数据,0,1,2,5,6的方差是( )
A.46 B. C. D.
4.如图是6名工人在一天中生产某种零件数量的茎叶图,则这6名工人这一天生产这种零件的平均数为( )
A.16 B.15 C.14 D.13
5.已知样本数据为3,1,3,2,3,2,则这个样本的中位数与众数分别为( )
A.2,3 B.3,3 C.2.5,3 D.2.5,2
6.某高职院校对年单招参考的名学生数学成绩进行统计,得到样本频率分布直方图(如图),则数学成绩在分以下的学生人数是( )
A. B. C. D.
7.某同学从6岁到12岁的年龄与身高的折线图如图所示,根据折线图,下列说法正确的是( )
A.9岁到10岁的身高增长速度最快
B.从6岁到12岁,每年身高平均增长了5cm
C.7岁时,该同学的身高就超过了120cm
D.9岁到12岁比6岁到9岁的身高增长速度更快
8.校园环境对学生的成长是重要的,好的校园环境离不开学校的后勤部门.学校为了评估后勤部门的工作,采用随机抽样的方法调查100名学生对校园环境的认可程度(100分制),评价标准如下:
中位数
评价 优秀 良好 合格 不合格
2023年的一次调查所得的分数频率分布直方图如图所示,则这次调查后勤部门的评价是( )
A.优秀 B.良好 C.合格 D.不合格
9.年月日,习近平总书记在学校考察调研时提出“文明其精神,野蛮其体魄”,“野蛮其体魄”就是强生健体,青少年的体质状况不仅关乎个人成长和家庭幸福,也关乎国家未来和民族希望,为落实《国家学生体质健康标准》达标测试工作,全面提升学生的体质健康水平,某校在高二年级随机抽取部分男生,测试立定跳远项目,依据测试数据绘制了如图所示的频率分布直方图.已知立定跳远以上成绩为及格,以上成绩为优秀,根据图中的样本数据估计该校高二年级男生立定跳远项目的及格率和优秀率分别是( )
A.72.5%,5% B.78.75%,10% C.72.5%,10% D.78.75%,5%
10.设两组数据分别为和,且,则这两组数据相比,不变的数字特征是( )
A.中位数 B.极差 C.方差 D.平均数
11.某校高三年级邀请9位音乐教师担任学校“国庆杯”歌咏比赛的评委.比赛计分办法为工作人员收集所有评委对该班级的评分,把去掉一个最高分和一个最低分后的评分作为有效评分,以有效评分的平均分作为班级得分.采用茎叶图记录甲、乙两个班所有得分(满分为10分),已知甲班得分的中位数和乙班得分的平均数相等,甲班得分的平均数和乙班得分的中位数相等,则( )
A.12 B.13 C.14 D.15
12.已知一组数据的平均数是2,方差是,那么另一组数据的平均数和方差分别为( )
A.2, B.2,1 C.4, D.4,3
二、多选题
13.给定一组数5,5,4,3,3,3,2,2,2,1,则( )
A.平均数为3 B.标准差为
C.众数为2和3 D.第85百分位数为4.5
14.为了了解市民对各种垃圾进行分类的情况,加强垃圾分类宣传的针对性,指导市民尽快掌握垃圾分类的方法,某市垃圾处理厂连续8周对有害垃圾错误分类情况进行了调查.经整理绘制了如图所示的有害垃圾错误分类重量累积统计图,图中横轴表示时间(单位:周)纵轴表示有害垃圾错误分类的累积重量(单位:吨),根据统计图分析,下列结论正确的是( )
A.当时有害垃圾错误分类的重量加速增长
B.当时有害垃圾错误分类的重量匀速增长
C.当时有害垃圾错误分类的重量相对于当时增长了25%
D.当时有害垃圾错误分类的重量相对于当时减少了1.8吨
15.为了普及环保知识,增强环保意识,某学校分别从两个班各抽取位同学分成甲、乙两组参加环保知识测试,得分(十分组)如图所示,则下列描述正确的有( )
A.甲、乙两组成绩的平均分相等 B.甲、乙两组成绩的中位数相等
C.甲、乙两组成绩的极差相等 D.甲组成绩的方差小于乙组成绩的方差
16.下列命题中,真命题的是( )
A.若回归方程,则变量与负相关
B.线性回归分析中决定系数用来刻画回归的效果,若该值越小,则模型的拟合效果越好
C.若样本数据的方差为2,则数据的方差18
D.若与独立,则
17.如图所示是世界人口变化情况的三幅统计图:
下列结论中正确的是( )
A.从折线图能看出世界人口的总量随着年份的增加而增加
B.2050年亚洲人口比其他各洲人口的总和还要多
C.2050年南美洲及大洋洲人口之和与欧洲人口基本持平
D.1957年到2050年各洲中北美洲人口增长速度最慢
18.数据显示,全国城镇非私营单位就业人员平均工资在2011年为40000元,到了2020年,为97379元,比上年增长7.6%.根据下图提供的信息,下面结论中正确的是( )
2011-2020年城镇非私营单位就业人员年平均工资及增速
A.2011年以来,全国城镇非私营单位就业人员平均工资逐年增长
B.工资增速越快,工资的绝对值增加也越大
C.与2011年相比,2019年全国城镇非私营单位就业人员平均工资翻了一番多
D.2018年全国城镇非私营单位就业人员平均工资首次突破90000元
三、填空题
19.对某商店一个月内每天的顾客人数进行了统计,得到的样本数据如下:12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,则该样本的中位数、众数、极差分别为 , , .
20.已知一组样本数据5 2 3 6,则该组数据的第70百分位数为 .
21.某机构开展关于环境保护的知识问卷(满分100分),从中抽取了8份试卷,成绩分别为72,85,80,81,86,81,92,90,则这8份试卷成绩的第60百分位数为 .
22.已知一组数据1,3,9,5,7,则这组数据的标准差为 .
23.从某项综合能力测试中抽取100人的成绩,统计如下表所示.
分数 5 4 3 2 1
人数 20 10 30 30 10
则这100人成绩的标准差为 .
24.某抖音短视频发出后,前五天收到的网友留言条数分别是,则该组数据的方差 ..
25.已知一组数据,,,的方差为,则这组数据,,,的方差为 .
26.已知某八个数据的平均数为5,方差为3,现又新加入一个数据14,此时这九个数据的方差为 .
27.已知数据,,,,的方差为,则数据,,,,的方差为 ;
28.设样本数据的平均数为,方差为,若数据的平均数比方差大4,则的最大值是 .
四、解答题
29.为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机选取了 10个轮胎,将每个轮胎的宽度(单位:mm) 记录下来并绘制出折线图:
(1)分别计算甲、 乙两厂提供10个轮胎宽度的平均值;
(2)轮胎的宽度在[193,195]内,则称这个轮胎是标准轮胎,试比较甲、 乙两厂分别提供的 10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)中小学教育资源及组卷应用平台
第14讲 用样本估计总体
1.C
【分析】利用方差与均值的关系,结合方差公式即可判断的大小.
【详解】由题设,,即,
∴,,即有.
故选:C.
2.C
【分析】先根据平均数公式求出x,再利用方差公式求解.
【详解】由题意得,得
所以这组数据的方差
故选:C
3.B
【分析】先求出数据的平均数,再利用方差公式求解.
【详解】解:由题得数据的平均数为.
所以数据的方差为.
故选:B
4.A
【分析】直接利用平均数公式求解即可.
【详解】这6名工人这一天生产这种零件的平均数为:
,
故选:A.
5.C
【分析】将样本数据从小到大排列即可求得中位数,再找出出现次数最多的数即为众数.
【详解】将样本数据从小到大排列:1,2,2,3,3,3,中位数为,众数为3.
故选:C.
【点睛】本题考查了中位数和众数的概念,属于基础题.
6.D
【分析】根据频率分布直方图可计算得出数学成绩在分以下的学生人数.
【详解】由频率分布直方图可知,数学成绩在分以下的学生人数为.
故选:D.
7.D
【分析】根据折线图整理出年份与对应的身高变化的数据,再逐一分析判断作答.
【详解】由所给折线图可知,6岁到7岁,身高增长了2cm;7岁到8岁,身高增长了3cm;8岁到9岁,身高增长了5cm;
9岁到10岁,身高增长了6 cm;10岁到11岁,身高增长了9 cm;1l岁到12岁,身高增长了3 cm,
因,即10岁到11岁身高增长速度比9岁到10岁的快,A错误;
从6岁到12岁,每年身高平均增长了,B错误;
7岁时,该同学的身高为118 cm,C错误;
6岁到9岁的身高增长速度为,9岁到12岁的身高增长速度为,显然,D正确.
故选:D
8.B
【分析】根据频率分布直方图求解中位数即可得答案.
【详解】解:由频率分布直方图可知,前3组的频率分别为,第4组的频率为
所以,中位数,即满足,对应的评价是良好.
故选:B.
9.B
【解析】计算以上的矩形的面积之和,可得出该校高二年级男生立定跳远项目的及格率,计算以上的矩形的面积之和,可得出该校高二年级男生立定跳远项目的优秀率.
【详解】由题意可知,该校高二年级男生立定跳远项目的及格率为,
该校高二年级男生立定跳远项目的优秀率为.
故选:B.
10.A
【解析】根据统计中的数字特征中位数,极差,方差,平均数进行判断,
【详解】原始中位数为,去掉,后剩余,中位数仍为,A正确;
原始平均数,后来平均数,
平均数受极端值影响较大,∴与不一定相同,D不正确;
,由②易知,C不正确;
原极差,后来极差,显然极差变小,B不正确,
故选:A.
11.D
【分析】结合茎叶图和已知条件,然后分别求出中位数,进而根据平均数即可求出结果.
【详解】由题意可得,每个班级的评分会有9个,其中7个是有效得分通过观察数据可知甲班的无效得分为9.8和6+0.1Z,乙班的无效得分为9.5和7.1.通过分析数据可得,甲班的中位数为8.3,则乙班的平均数为,
则,所以.
同理可得乙班的中位数为8.5,则甲班的平均数,
则,所以,
则,
故选:D.
12.D
【分析】根据平均数、方差的性质计算可得.
【详解】由题意得数据的平均数,方差,
所以数据的平均数为,方差为.
故选:D.
13.AC
【分析】根据平均数的计算公式可判定A;根据方差、标准差的计算公式可判定B;由众数的概念可判定C;由百分位数的概念可判定D.
【详解】由平均数的计算公式,可得数据的平均数为,所以A项正确;
由方差的公式,可得,所以标准差为,所以B项不正确;
根据众数的概念,可得数据的众数为和,所以C项正确;
数据从小到大排序:1,2,2,2,3,3,3,4,5,5,根据百分位数的概念,可得第85百分位数是第9个数据的值,即为5,所以D项不正确.
故选:AC.
14.ABD
【分析】由函数图像,可以读出各段上对于变化状态,逐一判断可得选项.
【详解】解:由统计图可知,第2周增长数量比第1周增长数量明显要多,是加速增长,所以选项A正确;
当时图象是线段,所以是匀速增长,所以选项B正确;
当时增长数量比当时增长数量要少,所以选项C错误;
当时共增长2.4吨,当时共增长0.6吨,所以减少了1.8吨,所以选项D正确.
故选:ABD.
15.BCD
【解析】根据条形统计图计算出甲、乙两组成绩的平均分、中位数、极差与方差,进而可判断各选项的正误.
【详解】对于A选项,甲组成绩的平均数为,
乙组成绩的平均分为,
所以甲组成绩的平均分小于乙组成绩的平均分,A选项错误;
对于B选项,甲、乙两组成绩的中位数都为,B选项正确;
对于C选项,甲、乙两组成绩的极差都为,C选项正确;
对于D选项,甲组成绩的方差为,
乙组成绩的方差为,
所以甲组成绩的方差小于乙组成绩的方差,D选项正确.
故选:BCD.
16.AC
【分析】对于A,结合回归方程的相关性的性质,即可求解;对于B,结合线性回归决定系数的定义,即可求解;对于C,结合方差的线性公式,即可求解;对于D,举反例说明.
【详解】对于A,回归方程为,又,所以变量与负相关,故A正确,
对于B,线性回归分析中决定系数用来刻画回归的效果,若值越大,说明模型的拟合效果越好,故B错误.
对于C,若样本数据的方差为2,则数据的方差,故C正确,
对于D, 掷一枚骰子,设事件A:点数小于3,则;
事件B:点数为偶数,则,
所以,即与独立,
又,,故D错误.
故选:AC.
17.ABC
【分析】根据所给折线图、扇形图以及直方图,分析每个选项中涉及的量的变化,即可得答案.
【详解】对于A,从折线图能看出世界人口的总量随着年份的增加而增加,故A正确;
对于B,从扇形图中能够明显地看出2050年亚洲人口比其他各洲人口的总和还要多,故B正确;
对于C,从条形图中能够明显地看出2050年南美洲及大洋洲人口之和与欧洲人口基本持平,故C正确;
对于D,由题中三幅统计图可看得出北美洲人口数量最少,
并不能得出从1957年到2050年中哪个洲人口增长速度最慢,故D错误.
故选:ABC
18.AC
【分析】由图中数据对各选项逐一分析即可得答案.
【详解】解:对选项A:由图可知,2011年以来,全国城镇非私营单位就业人员平均工资逐年增长,只是每年增速有变化,故选项A正确;
对选项B:工资增速越快,工资的绝对值增加也越大,这是错误的,工资的绝对值的增加还与上一年的工资水平有关系,故选项B错误;
对选项C:根据数据2019年全国城镇非私营单位就业人员平均工资为元,故选项C正确;
对选项D:根据数据2018年全国城镇非私营单位就业人员平均工资为元,所以全国城镇非私营单位就业人员平均工资首次突破90000元应为2019年,故选项D错误.
故选:AC.
19. 46 45 56
【分析】利用中位数、众数、极差的定义求解即可
【详解】一共有30个数据,中位数为第15个数和第16个数的平均数,即中位数为,
这30个数中出现次数最多的为45出现了3次,所以众数为45,
极差为,
故答案为:46,45,56
20.5
【分析】首先计算指数,再由百分位数的定义可得答案.
【详解】解:这组样本数据5 2 3 6,从小到大排列为2、3、5、6,
又,
则该组数据的第70百分位数为第3个数5,
故答案为:5.
21.85
【分析】根据百分位数定义求解即可.
【详解】解:这组数据为:72,80,81,81,85,86,90,92,
因为8×60%=4.8,所以这8份试卷成绩的第60百分位数为85.
故答案为:85.
22.
【分析】先求平均数,再求方差,从而可得标准差.
【详解】这组数据的平均数为,
所以这组数据的方差为,
所以这组数据的标准差为.
故答案为:.
23.
【分析】先求平均数,再利用公式求出方差,最后利用标准差的平方等于方差,即可求出标准差
【详解】改组数的平均数为:,
利用方差公式,得
,
标准差为
故答案为:
24.
【分析】首先计算这组数据的平均数,再计算方差即可.
【详解】因为这组数据为,
所以这组数据的平均数为,
所以这组数据的方差:
,
故答案为:
【点睛】本题主要考查数据的平均数与方差的计算,处理这类问题关键是计算要认真,不能出错.
25.
【分析】利用方差的性质直接求解.
【详解】一组数据,,,的方差为5,
这组数据,,,的方差为:.
【点睛】本题考查方差的性质应用.若的方差为,
则的方差为.
26.
【分析】运用平均数、方差公式计算即可.
【详解】由题意知,这9个数的平均数为,
所以这9个数的方差为.
故答案为:.
27.20
【分析】根据公式计算即可.
【详解】因为数据,,,,的方差为,
所以数据,,,,的方差为.
故答案为:20
28.
【分析】根据平均数和方差的性质,以及二次函数的性质即可解出.
【详解】数据的平均数为,方差为,所以,
,即,则,因为,所以,故当时,的最大值是.
故答案为:.
29.(1)甲、 乙两厂提供10个轮胎宽度的平均值分别为195,194.
(2)从平均数上来看:乙厂提供的 10个轮胎中所有标准轮胎宽度高于甲厂提供的 10个轮胎中所有标准轮胎宽度,但乙厂提供的 10个轮胎中所有标准轮胎宽度方差较大,不够稳定.
【分析】(1)由折线图提供的数据,利用平均数公式代入计算即可;
(2)分别找出甲乙两厂的所有标准轮胎宽度的数据,再分别求出平均值与方差,即可判断.
【详解】(1)由题:甲厂轮胎宽度的平均值为:
;
乙厂轮胎宽度的平均值为:
;
所以甲、 乙两厂提供10个轮胎宽度的平均值分别为195,194.
(2)由题,甲厂提供的 10个轮胎中所有标准轮胎宽度为:
,其平均数为:,
其方差为:;
乙厂提供的 10个轮胎中所有标准轮胎宽度为:
,其平均数为:,
其方差为:;
从平均数上来看:乙厂提供的 10个轮胎中所有标准轮胎宽度高于甲厂提供的 10个轮胎中所有标准轮胎宽度,但乙厂提供的 10个轮胎中所有标准轮胎宽度方差较大,不够稳定.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)