9.2.4 总体离散程度的估计
一、选择题
1.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为 ( )
A.1 B.
C. D.2
2.为评估一种农作物的种植效果,选了n块地作为试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 ( )
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
3.某人参加射击比赛,打了6发子弹,报靶数据如下:7,8,9,10,6,8(单位:环),则下列说法不正确的是 ( )
A.这组数据的平均数是8
B.这组数据的极差是4
C.这组数据的中位数是8
D.这组数据的方差是2
4.[2024·长沙雅礼中学高一月考] 已知样本数据x1,x2,…,x2024的平均数和方差分别为3和56,若yi=2xi+3(i=1,2,…,2024),则y1,y2,…,y2024的平均数和方差分别是 ( )
A.12,115 B.12,224
C.9,115 D.9,224
5.[2024·安徽六安裕安区高一期中] 2023年7月18日,第31届全国青少年爱国主义读书教育活动启动,某校为了迎接此次活动,对本校高一、高二年级学生进行了前期阅读时间抽查,得到日阅读时间(单位:分钟)的统计表如下:
年级 抽查人数 平均时间 方差
高一 40 50 4
高二 60 40 6
则用样本估计总体,估计两个年级学生日阅读时间的方差为 ( )
A.52 B.29.2
C.10 D.6.4
6.[2024·辽宁大连十二中高一月考] 某班在一次考试中的数学平均分为125分,方差为.成绩分析时发现有三名同学的成绩录入有误,A同学实际成绩137分,被错录为118分;B同学实际成绩115分,被错录为103分;C同学实际成绩98分,被错录为129分.更正后重新统计,得到方差为,则与的大小关系为 ( )
A.= B.>
C.< D.不能确定
7.王老师统计了自己三位学生近五次的定时训练成绩,其中1~5号为甲同学近五次成绩,6~10号为乙同学近五次成绩,11~15号为丙同学近五次成绩,相关信息如下:
(1)三人近五次定时训练成绩的平均数如下:
同学 甲 乙 丙
平均数 118 122 121
(2)三人近五次定时训练成绩统计图如图所示.
记甲、乙、丙近五次定时训练成绩的方差分别为,,,根据图表判断,,的大小关系为 ( )
A.<< B.<<
C.<< D.<<
8.(多选题)[2024·江苏无锡天一中学高一期末] 在学校组织的《爱我中华》主题演讲比赛中,有10位评委对每位选手进行评分(评分互不相同),将选手的得分去掉一个最低评分和一个最高评分,则下列结论错误的是 ( )
A.剩下评分的平均数变大
B.剩下评分的极差变小
C.剩下评分的方差变小
D.剩下评分的中位数变大
9.(多选题)2023年8月8日是我国第15个“全民健身日”,“全民健身日”提升了全民健身意识,让健身成为一种习惯和风俗.为倡导健康生活方式,某大学社团联合学生会倡议全校学生参与“每日万步行”健走活动.如图为该校甲、乙两名同学在同一星期内每日步数的折线统计图,则下列说法正确的是 ( )
A.这一星期内甲的日步数的中位数小于乙的日步数的中位数
B.这一星期内甲的日步数的平均数大于乙的日步数的平均数
C.这一星期内乙的日步数的标准差小于甲的日步数的标准差
D.这一星期内乙的日步数的75%分位数是12 400
二、填空题
10.一组数据的方差是4,将这组数据中的每个数据都乘5,所得到的新数据的标准差是 .
11.已知样本数据a1,a2,a3,a4,a5都为正数,其方差s2=(++++-80),则样本数据2a1+3,2a2+3,2a3+3,2a4+3,2a5+3的平均数为 .
12.[2024·江苏无锡天一中学高一期末] 某旅行团共有游客600人,其中男性400人,女性200人.为了获得该团游客的身高信息,采用男、女按比例分配的分层随机抽样的方法抽取样本,并观测样本的指标值(单位: cm),经计算得到男生样本的均值为170,方差为18,女生样本的均值为161,方差为30.根据以上数据,估计该旅行团游客身高的均值为 ;估计该旅行团游客身高的方差为 .
三、解答题
13.从某实验农场种植的甲、乙两种玉米苗中各随机抽取5株,分别测量它们的株高如下(单位: cm):
甲:29,31,30,32,28;
乙:27,44,40,31,43.
请根据平均数和方差的相关知识,解答下列问题:
(1)哪种玉米苗长得高
(2)哪种玉米苗长得齐
14.某校为了解该校高三年级学生的物理成绩,从某次高三年级物理测试中随机抽取12名男生和8名女生的测试试卷,记录其物理成绩(单位:分),其中12名男生的物理成绩分别为72,68,72,76,80,76,72,80,88,68,72,76.
(1)求这12名男生物理成绩的平均数与方差;
(2)经计算得这8名女生物理成绩的平均数=70,方差=23,求这20名学生物理成绩的平均数与方差.
15.(多选题)[2024·河南南阳六校高一期末] 某地环境部门对辖区内甲、乙、丙、丁四个地区的环境治理情况进行检查督导,若一地区连续10天每天的空气质量指数均不大于100,则认为该地区的环境治理达标,否则认为该地区的环境治理不达标.根据连续10天检测所得数据的数字特征推断,环境治理一定达标的地区是 ( )
A.甲地区:平均数为90,方差为10
B.乙地区:平均数为60,众数为50
C.丙地区:中位数为50,极差为70
D.丁地区:极差为20,80%分位数为80
16. 某校有高中生2000人,其中男女生人数之比约为5∶4,为了获得该校全体高中生的身高信息,采取了以下两种方案:
方案一:采用比例分配的分层随机抽样方法,抽取了样本量为n的样本,得到频数分布表和频率分布直方图(如图).
身高(cm) [145,155) [155,165) [165,175) [175,185) [185,195]
频数 m p q 6 4
方案二:采用分层随机抽样方法,抽取了男、女生样本量均为25的样本,计算得到男生样本的平均数为170,方差为16,女生样本的平均数为160,方差为20.
(1)根据图表信息,求n,q并补充完整频率分布直方图,估计该校高中生身高的平均数(同一组中的数据以这组数据所在区间的中点值为代表).
(2)计算方案二中总样本的平均数及方差.
(3)计算两种方案总样本平均数的差,并说明用方案二总样本的平均数作为总体平均数的估计合适吗 为什么 9.2.4 总体离散程度的估计
【学习目标】
1.结合具体实例,经历用样本估计总体的离散程度参数(标准差、方差、极差)的过程,理解离散程度参数的统计含义.
2.经历比例分配的分层随机抽样的样本平均数和方差的推导过程,会求具体问题的样本平均数和样本方差,并能解释它们在实际问题中的意义.
3.结合具体实例,认识样本与总体的关系,逐步建立用样本估计总体的思想,尝试运用统计语言描述总体的特征.
◆ 知识点一 极差
极差:极差为一组数据中最大值与最小值的差.
◆ 知识点二 方差和标准差
1.一组数据的方差和标准差
一组数据x1,x2,…,xn的方差为(xi-)2=-,标准差为.
2.总体方差和总体标准差
(1)总体方差和总体标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称S2=(Yi-)2为总体方差,S=为总体标准差.
(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=fi(Yi-)2.
3.样本方差和样本标准差
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称s2=(yi-)2为样本方差,s=为样本标准差.
4.标准差的意义
标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越 ;标准差越小,数据的离散程度越 .
平均数和标准差一起能反映数据取值的信息.一般情况下数据中大部分落在区间 内,绝大部分数据落在 内.
5.比例分配的分层随机抽样的方差
设样本量为n,样本数据的平均数为,样本分为两层,其中两层的个体数量分别为n1,n2,两层的平均数分别为,,方差分别为,,则这个样本的方差s2= .
【诊断分析】 判断下列说法的正误.(正确的打“√”,错误的打“×”)
(1)若一组数据的值大小相等,没有波动变化,则标准差为0. ( )
(2)标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散. ( )
(3)标准差的大小不会超过极差. ( )
(4)一般情况下数据中绝大部分数据落在[-2s,+2s]内,也有可能落在[-2s,+2s]外. ( )
(5)计算比例分配的分层随机抽样中总样本的平均数与方差时,必须已知各层的权重. ( )
◆ 探究点一 方差、标准差的计算及应用
角度1 方差、标准差的计算
例1 下面的数据是某男运动员跳高的跳跃高度(单位:cm),请计算这组数据的平均数、方差和标准差(精确到小数点后两位).
190.0 190.3 190.5 193.0 193.5
198.1 194.1 197.1 202.9
变式1 电动摩托车的续航里程,是指电动摩托车在蓄电池满电量的情况下一次能行驶的最大距离.为了解某种型号电动摩托车的续航里程,现从某卖场库存电动摩托车中随机抽取5台电动摩托车,在相同条件下进行测试,统计结果如下:
电动摩托车编号 1 2 3 4 5
续航里程(km) 120 125 122 124 124
则这种型号被测试电动摩托车续航里程的方差为 ,标准差为 .
变式2 某高校共有“机器人”兴趣团队20个,将这20个团队分为甲、乙两组,每组10个团队,进行理论和实践操作考试(共150分),甲、乙两组的成绩如下(单位:分):
甲:125,141,140,137,122,114,119,139,121,142;
乙:127,116,144,127,144,116,140,140,116,140.
学校计划从甲、乙两组中选一组参加机器人大赛,从统计学角度分析,若最终选择甲组,理由是什么 若最终选择乙组,理由是什么
[素养小结]
标准差、方差的意义
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.标准差的大小不会超过极差.
(2)标准差、方差的取值范围是[0,+∞).
标准差、方差为0时,样本中的各数据相等,说明数据没有波动幅度,数据没有离散性.
角度2 方差、标准差的性质
例2 (1)某组数据x1,x2,…,xn的平均数为2.5,方差为1.5,求2x1-1,2x2-1,…,2xn-1的方差.
(2)设一组数据x1,x2,…,xn的标准差为sx,另一组数据3x1+a,3x2+a,…,3xn+a的标准差为sy,求sx与sy的关系.
变式 (1)[2024·辽宁大连高一期末] 若x1,x2,…,x10的方差为2,则3x1+1,3x2+1,…,3x10+1的方差是 ( )
A.18 B.7
C.6 D.2
(2)(多选题)有两组样本数据:x1,x2,…,x2024;y1,y2,…,y2024.其中yi=xi+2024(i=1,2,…,2024),则这两组样本数据的 ( )
A.样本平均数相同 B.样本中位数相同
C.样本方差相同 D.样本极差相同
[素养小结]
(1)一组数据中的每一个数都加上或减去同一个常数,所得的一组新数据的方差不变,标准差也不变.
(2)若把一组数据中的每一个数都变为原来的k倍并加上或减去常数a,则所得的一组新数据的标准差变为原来的k倍,方差变为原来的k2倍,而与a的大小无关.
◆ 探究点二 分层随机抽样的方差
例3 [2024·浙江杭州四中高一期中] 为了了解学生躯干、腰、髋等部位关节韧带和肌肉的伸展性、弹性等,某学校对在校1500名学生进行了一次坐位体前屈测试,采用按学生性别比例分配的分层随机抽样方法抽取75人,已知这1500名学生中男生有900人,且抽取的样本中男生所获得成绩的平均数和方差分别为13.2 cm和13.36,女生所获得成绩的平均数和方差分别为15.2 cm和17.56.
(1)求样本中男生和女生应分别抽取多少人
(2)求抽取的总样本的平均数,并估计全体学生的坐位体前屈成绩的方差.
变式 甲、乙两支田径队队员的体检结果为:甲队队员体重的平均数为60 kg,方差为200,乙队队员体重的平均数为70 kg,方差为300.已知甲、乙两队的队员人数之比为1∶4,求甲、乙两队全部队员体重的平均数和方差.
[素养小结]
分层随机抽样的方差:设样本中不同层的平均数分别为,,…,,方差分别为,,…,,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=wi[+(-)2](其中为这个样本的平均数).
拓展 某市新时代文明实践中心承办了该市马拉松志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩(单位:分),并分成五组:第一组[45,55),第二组[55,65),第三组[65,75),第四组[75,85),第五组[85,95],绘制成如图所示的频率分布直方图.已知第一、二组的频率之和为0.3,第一组和第五组的频率相同.
(1)估计这100名候选者面试成绩的平均数(同一组中的数据用该组区间的中点值作代表)和第25百分位数;
(2)现从以上各组中用比例分配的分层随机抽样的方法选取20人担任本市的宣传者,若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为62和40,第四组面试者的面试成绩的平均数和方差分别为80和70,据此估计这次第二组和第四组面试者所有人面试成绩的方差.
◆ 探究点三 数据的数字特征的综合应用
例4 在一次科技知识竞赛中,两组学生的成绩如下表(满分为100分):
成绩(分) 50 60 70 80 90 100
人数 甲组 2 5 10 13 14 6
乙组 4 4 16 2 12 12
请根据你所学过的统计知识,进一步判断这两组学生在这次竞赛中的成绩谁优谁劣,并说明理由.
变式 甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示.
(1)请填写下表:
平均数 方差 中位数 命中9环及 9环以上的次数
甲
乙
(2)请从下列四个不同的角度对这次测试结果进行分析:
①从平均数和方差相结合看(谁的成绩更稳定);
②从平均数和中位数相结合看(谁的成绩好些);
③从平均数和命中9环及9环以上的次数相结合看(谁的成绩好些);
④从折线图上两人射靶命中环数的走势看(谁更有潜力).
[素养小结]
数据分析的要点
(1)要正确处理此类问题,首先要抓住问题中的关键词语,全方位地进行必要的计算、分析,而不能习惯性地仅从样本方差的角度去判断,实际问题中应从实际的角度去分析.
(2)在进行数据分析时,不同的标准没有对和错的问题,也不存在唯一解的问题,而是根据需要来选择“好”的决策,至于决策的好坏,是根据提出的标准而定的.9.2.4 总体离散程度的估计
1.B [解析] 这个样本的平均数=×(1+2+3+4+5)=3,标准差s==.
2.B [解析] 标准差能反映一组数据的稳定程度,故选B.
3.D [解析] 对于A,平均数为=8,故A中说法正确;对于B,极差为10-6=4,故B中说法正确;对于C,数据从小到大排序后为6,7,8,8,9,10,中位数为=8,故C中说法正确;对于D,方差为×[(7-8)2+(8-8)2+(9-8)2+(10-8)2+(6-8)2+(8-8)2]=,故D中说法不正确,故选D.
4.D [解析] 因为样本数据x1,x2,…,x2024的平均数和方差分别为3和56,yi=2xi+3(i=1,2,…,2024),所以y1,y2,…,y2024的平均数为2×3+3=9,方差为22×56=224.故选D.
5.B [解析] 由题意,估计高一、高二学生日阅读时间的平均数=50×+40×=44(分钟),方差s2=[4+(50-44)2]×+[6+(40-44)2]×=29.2.故选B.
6.C [解析] 设班级人数为n(n>0),因为118+103+129=137+115+98,所以更正前后平均分不变,且(118-125)2+(103-125)2+(129-125)2=549<(137-125)2+(115-125)2+(98-125)2=973,所以<.故选C.
7.A [解析] 由统计图知,甲同学成绩的波动幅度最小,丙同学成绩的波动幅度最大,所以<<,故选A.
8.AD [解析] 去掉一个最低评分和一个最高评分后剩下评分的平均数有可能变小,不变或变大,故A中结论错误;剩下评分的极差一定会变小,故B中结论正确;剩下评分的波动性变小,则方差变小,故C中结论正确;剩下评分的中位数不变,故D中结论错误.故选AD.
9.BC [解析] 由折线图可得,甲一星期内的日步数从小到大排列为11 000,11 800,12 200,12 600,13 500,15 400,18 200,所以中位数为12 600;由折线图可得,乙一星期内的日步数从小到大排列为11 800,12 200,12 400,12 600,13 000,13 800,14 000,所以中位数为12 600.故这一星期内甲、乙的日步数的中位数都为12 600,A错误;这一星期内甲的日步数的平均数为为×(11 000+11 800+12 200+12 600+13 500+15 400+18 200)=,这一星期内乙的日步数的平均数为×(11 800+12 200+12 400+12 600+13 000+13 800+14 000)=,因为>,故B正确;由折线图知,甲的波动程度较大,故方差较大,标准差较大,故C正确;乙一星期内的日步数从小到大排列为11 800,12 200,12 400,12 600,13 000,13 800,14 000,因为7×0.75=5.25,所以这一星期内乙的日步数的75%分位数是13 800,故D错误.故选BC.
10.10 [解析] 一组数据的方差是4,将这组数据中的每个数据都乘5,所得到的新数据的方差是52×4=100,故所得新数据的标准差为10.
11.11 [解析] 根据题意,设样本数据a1,a2,a3,a4,a5的平均数为,其方差s2=[(a1-)2+(a2-)2+(a3-)2+(a4-)2+(a5-)2]=(++++-2a1-2a2-2a3-2a4-2a5+5)=(++++-5),又s2=(++++-80),则有5=80,解得=4,则样本数据2a1+3,2a2+3,2a3+3,2a4+3,2a5+3的平均数为2+3=11.
12.167 40 [解析] 由题意可估计该旅行团游客身高的均值=×170+×161=167,估计该旅行团游客身高的方差S2=×{400×[18+(170-167)2]+200×[30+(161-167)2]}=40.
13.解:(1)甲种玉米苗株高的平均数=×(29+31+30+32+28)=×150=30(cm),
乙种玉米苗株高的平均数=×(27+44+40+31+43)=×185=37(cm),
∴<,故乙种玉米苗长得高.
(2)甲种玉米苗株高的方差=×[(29-30)2+(31-30)2+(30-30)2+(32-30)2+(28-30)2]=2,
乙种玉米苗株高的方差=×[(27-37)2+(44-37)2+(40-37)2+(31-37)2+(43-37)2]=46,
∴<,故甲种玉米苗长得齐.
14.解:(1)这12名男生物理成绩的平均数为=×(68×2+72×4+76×3+80×2+88)=75,
方差=×[(68-75)2×2+(72-75)2×4+(76-75)2×3+(80-75)2×2+(88-75)2]=.
(2)这20名学生物理成绩的平均数=+==73,
方差s2=[+(-)2]+[+(-)2]=×+×[23+(70-73)2]=33.
15.AD [解析] 故最大值不大于100,该地区的环境治理达标,故D正确.故选AD.
16.解:(1)因为身高在区间[185,195]内的频率为0.008×10=0.08,频数为4,
所以n==50,故m=0.008×10×50=4,p=0.04×10×50=20,q=50-4-20-6-4=16,
所以身高在区间[165,175)内的频率为=0.32,在区间[175,185)内的频率为=0.12,由此可补充完整频率分布直方图:
由频率分布直方图可知,样本的平均数为150×0.008×10+160×0.04×10+170×0.032×10+180×0.012×10+190×0.008×10=12+64+54.4+21.6+15.2=167.2(cm).
因此可估计该校高中生身高的平均数为167.2 cm.
(2)把男生样本记为x1,x2,…,x25,其平均数记为,方差记为;把女生样本记为y1,y2,…,y25,其平均数记为,方差记为,则总样本平均数=+==165.
因为
(3)两种方案总样本平均数的差为167.2-165=2.2.
用方案二总样本的平均数作为总体平均数的估计不合适,
原因:没有按照等比例进行分层随机抽样,每个个体被抽到的可能性不同,因此样本的代表性比较差.9.2.4 总体离散程度的估计
【课前预习】
知识点二
4.大 小 [-s,+s] [-2s,+2s]
5.[+(-)2]+[+(-)2]
诊断分析
(1)√ (2)× (3)√ (4)√ (5)√ [解析] (2)标准差越大,数据的离散程度越大,数据越分散;标准差越小,数据的离散程度越小,数据越集中.
【课中探究】
探究点一
例1 解:根据题意,9个数据依次为190.0,190.3,190.5,193.0,193.5,198.1,194.1,197.1,202.9,则平均数=×(190.0+190.3+190.5+193.0+193.5+198.1+194.1+197.1+202.9)=190+×(0.3+0.5+3+3.5+8.1+4.1+7.1+12.9)≈194.39,方差s2=×[(190.0-)2+(190.3-)2+…+(202.9-)2]≈16.39,标准差s≈≈4.05.
变式1 [解析] 这种型号被测试电动摩托车续航里程的平均数=120+=123(km),设这种型号被测试电动摩托车续航里程的方差为s2,则s2=×[(120-123)2+(125-123)2+(122-123)2+(124-123)2+(124-123)2]=,标准差为=.
变式2 解:甲组成绩的平均数=×(125+141+140+137+122+114+119+139+121+142)=130,
乙组成绩的平均数=×(127+116+144+127+144+116+140+140+116+140)=131.
甲组数据的方差=×[(125-130)2+(141-130)2+(140-130)2+(137-130)2+(122-130)2+(114-130)2+(119-130)2+(139-130)2+(121-130)2+(142-130)2]=104.2,
乙组数据的方差=×[(127-131)2+(116-131)2+(144-131)2+(127-131)2+(144-131)2+(116-131)2+(140-131)2+(140-131)2+(116-131)2+(140-131)2]=128.8.
选择甲组的理由:甲、乙两组的平均数相差不大,但<,甲组成绩的波动较小.
选择乙组的理由:<,在比赛中,高分团队获胜的概率较大.
例2 解:(1)设x1,x2,…,xn的平均数为,则=(x1+x2+…+xn)=2.5,[(x1-2.5)2+(x2-2.5)2+…+(xn-2.5)2]=1.5,
∴[(2x1-1)+(2x2-1)+…+(2xn-1)]=[2(x1+x2+…+xn)-n]=2×2.5-1=4,
∴[(2x1-1-4)2+(2x2-1-4)2+…+(2xn-1-4)2]=[(2x1-5)2+(2x2-5)2+…+(2xn-5)2]=[(x1-2.5)2+(x2-2.5)2+…+(xn-2.5)2]=4×1.5=6.
(2)设x1,x2,…,xn的平均数为,则3x1+a,3x2+a,…,3xn+a的平均数为3+a.
sy===
==3sx,∴sy=3sx.
变式 (1)A (2)CD [解析] (1)由题意得3x1+1,3x2+1,…,3x10+1的方差是32×2=18.故选A.
(2)根据题意,对于数据x1,x2,…,x2024,假设x1探究点二
例3 解:(1)总体容量为1500,样本容量为75,则抽样比为=,所以样本中男生人数为900×=45,女生人数为(1500-900)×=30.
(2)因为抽取的样本中男生所获得成绩的平均数=13.2(cm),方差=13.36,女生所获得成绩的平均数=15.2(cm),方差=17.56,所以总样本的平均数=×(45×13.2+30×15.2)=14(cm),总样本的方差s2=×{45×[13.36+(13.2-14)2]+30×[17.56+(15.2-14)2]}=×(630+570)=16,所以估计全体学生的坐位体前屈成绩的方差为16.
变式 解:由题意可知=60 kg,甲队队员在所有队员中所占权重为=,=70 kg,乙队队员在所有队员中所占权重为=,则甲、乙两队全部队员体重的平均数=×60+×70=68(kg),甲、乙两队全部队员体重的方差s2=×[200+(60-68)2]+×[300+(70-68)2]=296.
拓展 解:(1)由题意可知解得
可知每组的频率依次为0.05,0.25,0.45,0.2,0.05,
故估计这100名候选者面试成绩的平均数为50×0.05+60×0.25+70×0.45+80×0.2+90×0.05=69.5(分).
由0.05+0.25=0.3>0.25,
设第25百分位数为x,则x∈[55,65),所以0.05+(x-55)×0.025=0.25,解得x=63,故估计第25百分位数为63.
(2)设第二组、第四组的平均数分别为,,方差分别为,,因为两组的频率之比为=,所以估计这次第二组和第四组面试者所有人面试成绩的平均数为==70(分),
故估计这次第二组和第四组面试者所有人面试成绩的方差为s2=[+(-)2]+[+(-)2]=×[40+(62-70)2]+×[70+(80-70)2]=.
探究点三
例4 解:(1)甲组学生成绩的众数为90分,乙组学生成绩的众数为70分,从成绩的众数来看,甲组学生的成绩好些.
(2)=×(50×2+60×5+70×10+80×13+90×14+100×6)=×4000=80(分),=×(50×4+60×4+70×16+80×2+90×12+100×12)=×4000=80(分).=×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172,=×[4×(50-80)2+4×(60-80)2+16×(70-80)2+2×(80-80)2+12×(90-80)2+12×(100-80)2]=256.
∵=,<,∴甲、乙两组学生成绩的平均数相同,但甲组学生的成绩比乙组学生的成绩更为稳定,故甲组学生的成绩好些.
(3)甲、乙两组学生的成绩的中位数、平均数都是80分,其中,甲组学生成绩在80分及以上的有33人,乙组学生成绩在80分及以上的有26人.从这一角度看,甲组学生的成绩较好.
(4)从成绩统计表看,甲组学生成绩大于或等于90分的有20人,乙组学生成绩大于或等于90分的有24人,∴乙组学生成绩集中在高分段的较多.
同时,乙组得满分的人数比甲组得满分的人数多6.从这一角度看,乙组的成绩较好.
变式 解:(1)由题图可知,甲射靶命中的环数分别为9,5,7,8,7,6,8,6,7,7,乙射靶命中的环数分别为2,4,6,8,7,7,8,9,9,10.
甲射靶命中环数的平均数为×(9+5+7+8+7+6+8+6+7+7)=7,方差为×[(9-7)2+(5-7)2+4×(7-7)2+2×(8-7)2+2×(6-7)2]=1.2,中位数是7,命中9环及9环以上的次数为1;
乙射靶命中环数的平均数为×(2+4+6+8+7+7+8+9+9+10)=7,方差为×[(2-7)2+(4-7)2+(6-7)2+2×(8-7)2+2×(7-7)2+2×(9-7)2+(10-7)2]=5.4,中位数是7.5,命中9环及9环以上的次数为3.
可填写表格如下:
平均数 方差 中位数 命中9环及9环以上的次数
甲 7 1.2 7 1
乙 7 5.4 7.5 3
(2)①甲、乙的平均数相同,乙的方差较大,所以甲的成绩更稳定;
②甲、乙的平均数相同,乙的中位数较大,所以乙的成绩好些;
③甲、乙的平均数相同,乙命中9环及9环以上的次数比甲多,所以乙的成绩较好;
④从折线图上看,在后半部分,乙呈上升趋势,而甲起伏不定,且均未超过乙,故乙更有潜力.(共95张PPT)
9.2 用样本估计总体
9.2.4 总体离散程度的估计
探究点一 方差、标准差的计算及应用
探究点二 分层随机抽样的方差
探究点三 数据的数字特征的综合应用
【学习目标】
1.结合具体实例,经历用样本估计总体的离散程度参数(标准差、
方差、极差)的过程,理解离散程度参数的统计含义.
2.经历比例分配的分层随机抽样的样本平均数和方差的推导过程,
会求具体问题的样本平均数和样本方差,并能解释它们在实际问题中
的意义.
3.结合具体实例,认识样本与总体的关系,逐步建立用样本估计总
体的思想,尝试运用统计语言描述总体的特征.
知识点一 极差
极差:极差为一组数据中最大值与最小值的差.
知识点二 方差和标准差
1.一组数据的方差和标准差
一组数据,, ,的方差为 ,标
准差为 .
2.总体方差和总体标准差
(1)总体方差和总体标准差:如果总体中所有个体的变量值分别为
,, ,,总体平均数为,则称 为总体
方差, 为总体标准差.
(2)总体方差的加权形式:如果总体的 个变量值中,不同的值共
有个,不妨记为,, ,,其中 出现的频数为
,则总体方差为 .
3.样本方差和样本标准差
如果一个样本中个体的变量值分别为,, , ,样本平均数
为,则称为样本方差, 为样本标准差.
4.标准差的意义
标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离
散程度越____;标准差越小,数据的离散程度越____.
平均数和标准差一起能反映数据取值的信息.一般情况下数据中大部
分落在区间_____________内,绝大部分数据落在_______________内.
大
小
5.比例分配的分层随机抽样的方差
设样本量为,样本数据的平均数为 ,样本分为两层,其中两层的
个体数量分别为,,两层的平均数分别为, ,方差分别为
,,则这个样本的方差 _______________________________
_____.
【诊断分析】 判断下列说法的正误.(正确的打“√”,错误的打“×”)
(1)若一组数据的值大小相等,没有波动变化,则标准差为0.( )
√
(2)标准差越大,表明各个样本数据在样本平均数周围越集中;标
准差越小,表明各个样本数据在样本平均数周围越分散.( )
×
[解析] 标准差越大,数据的离散程度越大,数据越分散;标准差越小,数
据的离散程度越小,数据越集中.
(3)标准差的大小不会超过极差.( )
√
(4)一般情况下数据中绝大部分数据落在 内,也有
可能落在 外.( )
√
(5)计算比例分配的分层随机抽样中总样本的平均数与方差时,必
须已知各层的权重.( )
√
探究点一 方差、标准差的计算及应用
角度1 方差、标准差的计算
例1 下面的数据是某男运动员跳高的跳跃高度(单位: ),请计
算这组数据的平均数、方差和标准差(精确到小数点后两位).
解:根据题意,9个数据依次为,,, ,
,,,,,则平均数 ,
方差
,
标准差 .
变式1 电动摩托车的续航里程,是指电动摩托车在蓄电池满电量的
情况下一次能行驶的最大距离.为了解某种型号电动摩托车的续航
里程,现从某卖场库存电动摩托车中随机抽取5台电动摩托车,在相
同条件下进行测试,统计结果如下:
电动摩托车编号 1 2 3 4 5
120 125 122 124 124
则这种型号被测试电动摩托车续航里程的方差为___,标准差为_ ___.
[解析] 这种型号被测试电动摩托车续航里程的平均数
,
设这种型号被测试电动摩托车续航里程的方差为 ,则
,
标准差为 .
变式2 某高校共有“机器人”兴趣团队20个,将这20个团队分为甲、
乙两组,每组10个团队,进行理论和实践操作考试(共150分),甲、
乙两组的成绩如下(单位:分)
甲:125,141,140,137,122,114,119,139,121,142;
乙:127,116,144,127,144,116,140,140,116,140.
学校计划从甲、乙两组中选一组参加机器人大赛,从统计学角度分
析,若最终选择甲组,理由是什么?若最终选择乙组,理由是什么?
解:甲组成绩的平均数 ,
乙组成绩的平均数 .
甲组数据的方差
,
乙组数据的方差
.
选择甲组的理由:甲、乙两组的平均数相差不大,但 ,甲组
成绩的波动较小.
选择乙组的理由: ,在比赛中,高分团队获胜的概率较大.
[素养小结]
标准差、方差的意义
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、
方差越大,数据的离散程度越大;标准差、方差越小,数据的离散
程度越小.标准差的大小不会超过极差.
(2)标准差、方差的取值范围是 .
标准差、方差为0时,样本中的各数据相等,说明数据没有波动幅度,
数据没有离散性.
角度2 方差、标准差的性质
例2(1) 某组数据,, ,的平均数为,方差为 ,求
,, , 的方差.
解:设,, ,的平均数为 ,则
,
,
,
.
(2)设一组数据,, ,的标准差为 ,另一组数据
,, ,的标准差为,求与 的关系.
解:设,, ,的平均数为,则,, ,
的平均数为 .
, .
变式(1) [2024· 辽宁大连高一期末]若,, , 的方差为2,
则,, , 的方差是( )
A.18 B.7 C.6 D.2
[解析] 由题意得,, , 的方差是
.故选A.
√
(2)(多选题)有两组样本数据:,, ,;,, , .
其中 ,则这两组样本数据的
( )
A.样本平均数相同 B.样本中位数相同
C.样本方差相同 D.样本极差相同
√
√
[解析] 根据题意,对于数据,, , ,假设
,设其平均数为,中位数为,方差为 ,极
差为,则, ,
,
,
又,设其平均数为,中位数为 ,
方差为,极差为,则数据,, , 的平均数
,
中位数 ,
,方差,故这两组样本数据的方差和极差相同,平均数和中位数不同.故选 .
[素养小结]
(1)一组数据中的每一个数都加上或减去同一个常数,所得的一组
新数据的方差不变,标准差也不变.
(2)若把一组数据中的每一个数都变为原来的 倍并加上或减去常
数,则所得的一组新数据的标准差变为原来的 倍,方差变为原来
的倍,而与 的大小无关.
探究点二 分层随机抽样的方差
例3 [2024·浙江杭州四中高一期中] 为了了解学生躯干、腰、髋等部
位关节韧带和肌肉的伸展性、弹性等,某学校对在校1500名学生进
行了一次坐位体前屈测试,采用按学生性别比例分配的分层随机抽
样方法抽取75人,已知这1500名学生中男生有900人,且抽取的样本
中男生所获得成绩的平均数和方差分别为和 ,女生所
获得成绩的平均数和方差分别为 和17.56.
(1)求样本中男生和女生应分别抽取多少人?
解:总体容量为1500,样本容量为75,则抽样比为 ,
所以样本中男生人数为 ,
女生人数为 .
(2)求抽取的总样本的平均数,并估计全体学生的坐位体前屈成绩
的方差.
解:因为抽取的样本中男生所获得成绩的平均数 ,方
差,女生所获得成绩的平均数 ,方差
,
所以总样本的平均数,总样本的方差 ,
所以估计全体学生的坐位体前屈成绩的方差为16.
变式 甲、乙两支田径队队员的体检结果为:甲队队员体重的平均数
为,方差为200,乙队队员体重的平均数为 ,方差为300.
已知甲、乙两队的队员人数之比为 ,求甲、乙两队全部队员体重
的平均数和方差.
解:由题意可知 ,甲队队员在所有队员中所占权重为
,,乙队队员在所有队员中所占权重为 ,
则甲、乙两队全部队员体重的平均数 ,
甲、乙两队全部队员体重的方差
.
[素养小结]
分层随机抽样的方差:设样本中不同层的平均数分别为, ,
, ,方差分别为,, ,,相应的权重分别为 ,
,, ,则这个样本的方差为
(其中 为这个样本的平均数).
拓展 某市新时代文明实践中心承办
了该市马拉松志愿者选拔的面试工作.
现随机抽取了100名候选者的面试成
绩(单位:分),并分成五组:第一
组,第二组 ,第三组
,第四组 ,第五组
,绘制成如图所示的频率分布直方图.已知第一、二组的频率之
和为 ,第一组和第五组的频率相同.
(1)估计这100名候选者面试成绩的平均数(同一组中的数据用该
组区间的中点值作代表)和第25百分位数;
解:由题意可知
解得
可知每组的频率依次为,,, ,
,
故估计这100名候选者面试成绩的平均数为
(分).
由 ,
设第25百分位数为,则 ,
所以,解得 ,
故估计第25百分位数为63.
(2)现从以上各组中用比例分配的分层随机抽样的方法选取20人担
任本市的宣传者,若本市宣传者中第二组面试者的面试成绩的平均
数和方差分别为62和40,第四组面试者的面试成绩的平均数和方差
分别为80和70,据此估计这次第二组和第四组面试者所有人面试成
绩的方差.
解:设第二组、第四组的平均数分别为, ,方差
分别为,,因为两组的频率之比为 ,所
以估计这次第二组和第四组面试者所有人面试成绩
的平均数为 (分),
故估计这次第二组和第四组面试者所有人面试成绩的方差为
.
探究点三 数据的数字特征的综合应用
例4 在一次科技知识竞赛中,两组学生的成绩如下表(满分为100
分)
成绩(分) 50 60 70 80 90 100
人数 甲组 2 5 10 13 14 6
乙组 4 4 16 2 12 12
请根据你所学过的统计知识,进一步判断这两组学生在这次竞赛中
的成绩谁优谁劣,并说明理由.
解: (1)甲组学生成绩的众数为90分,乙组学生成绩的众数
为70分,从成绩的众数来看,甲组学生的成绩好些.
(2) (分), (分)
,
.
,, 甲、乙两组学生成绩的平均数相同,但甲
组学生的成绩比乙组学生的成绩更为稳定,故甲组学生的成绩好些.
(3)甲、乙两组学生的成绩的中位数、平均数都是80分,其中,甲
组学生成绩在80分及以上的有33人,乙组学生成绩在80分及以上的
有26人.从这一角度看,甲组学生的成绩较好.
(4)从成绩统计表看,甲组学生成绩大于或等于90分的有20人,乙
组学生成绩大于或等于90分的有24人, 乙组学生成绩集中在高分
段的较多.
同时,乙组得满分的人数比甲组得满分的人数多6.从这一角度看,乙
组的成绩较好.
变式 甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如
图所示.
(1)请填写下表:
平均数 方差 中位数 命中9环及9环以上的次数
甲
乙
[解析] 由题图可知,甲射靶命中的环数分别为9,5,7,8,7,6,8,
6,7,7,乙射靶命中的环数分别为2,4,6,8,7,7,8,9,9,10.
甲射靶命中环数的平均数为
,
方差为 ,
中位数是7,
命中9环及9环以上的次数为1;
,
方差为 ,
中位数是 ,
命中9环及9环以上的次数为3.
可填写表格如下:
平均数 方差 中位数 命中9环及9环以上的次数
甲 7 1.2 7 1
乙 7 5.4 7.5 3
(2)请从下列四个不同的角度对这次测试结果进行
分析:
①从平均数和方差相结合看(谁的成绩更稳定);
②从平均数和中位数相结合看(谁的成绩好些);
③从平均数和命中9环及9环以上的次数相结合看(谁的成绩好些);
④从折线图上两人射靶命中环数的走势看(谁更有潜力).
解:①甲、乙的平均数相同,乙的方差较大,所
以甲的成绩更稳定;
②甲、乙的平均数相同,乙的中位数较大,所以
乙的成绩好些;
③甲、乙的平均数相同,乙命中9环及9环以上的
次数比甲多,所以乙的成绩较好;
④从折线图上看,在后半部分,乙呈上升趋势,而甲起伏不定,且均未
超过乙,故乙更有潜力.
[素养小结]
数据分析的要点
(1)要正确处理此类问题,首先要抓住问题中的关键词语,全方位
地进行必要的计算、分析,而不能习惯性地仅从样本方差的角度去
判断,实际问题中应从实际的角度去分析.
(2)在进行数据分析时,不同的标准没有对和错的问题,也不存在
唯一解的问题,而是根据需要来选择“好”的决策,至于决策的好坏,
是根据提出的标准而定的.
1.标准差与方差的统计意义
(1)标准差、方差描述了一组数据围绕平均数波动程度的大小.标准
差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离
散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.
(2)标准差的单位与原数据的单位相同,方差的单位是原数据的单
位的平方,且平方后可能夸大了偏差的程度,所以虽然方差与标准
差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,
一般采用标准差.
(3)标准差(方差)的取值范围为 .若样本数据都相等,
表明数据没有波动幅度,数据没有离散性,则标准差为0.反之,标
准差为0的样本,其中的数据都相等.
2.描述数据离散程度的另一统计量——极差
(1)一组数据中的最大值与最小值的差称为极差.
(2)极差反映了一组数据变化的最大幅度,它对一组数据中的极端
值非常敏感,一般情况下,极差大,则数据较分散,数据的波动性
大;极差小,则数据相对集中,数据的波动性小.极差的计算非常
简单,但极差只考虑了两个极端值,而没有考虑中间的数据,因此
很多时候极差作为数据的离散程度的统计量可靠性较差.
(3)极差的取值范围也是 .标准差的大小不会超过极差.
3.计算标准差的步骤如下:
(1)求样本数据的平均数 ;
(2)求 ;
(3)求 ;
(4)求 ;
(5)求, 即为标准差.
1.平均数、方差、标准差的计算及应用
例1(1) [2024·河南创新发展联盟高一联考]已知样本数据
,,,,, 的平均数为
16,方差为9,则另一组数据,,,,, ,12的方差为
( )
A. B. C. D.7
√
[解析] 设数据,,,,,的平均数为,方差为 ,
由题意得,,所以 ,
,
则,,,,, ,12的平均数为,方差为 .故选C.
(2)(多选题)[2024·甘肃酒泉敦煌中学高一月考] 已知甲组数据
为8,9,11,10,12,乙组数据为 ,8,9,10,15,若甲、乙两组数据的平均数
相同,则( )
A.甲组数据的中位数为10
B.乙组数据的第75百分位数为9.5
C.甲、乙两组数据的极差相同
D.甲组数据的方差小于乙组数据的方差
√
√
[解析] 甲组数据按照从小到大的顺序排列为8,9,10,11,12,则
甲组数据的中位数为10,故A正确;
由题意得甲、乙两组数据的平均数相同,且易知甲组数据的平均数
为10,故乙组数据的平均数也为10,所以,解得
,又 ,乙组数据按照从小到大的顺序排列为8,8,9,
10,15,所以乙组数据的第75百分位数为10,故B错误;
易知甲组数据的极差为4,乙组数据的极差为7, 故C错误;
两组数据的平均数相同,乙组数据的离散程度显然更大,即乙组数据
的方差更大,故D正确.故选 .
2.比例分配的分层随机抽样中样本均值和方差的计算
例2 (多选题)某中学有高三学生500人,其中男生300人,女生200
人,现希望获得全体学生的身高(单位: )信息,按比例分配的
分层随机抽样的方法抽取了容量为50的样本,经计算得到样本中男
生身高的平均数为171,方差为29,女生身高的平均数为161,样本
中所有学生身高的方差为49,下列说法中正确的是( )
A.样本中男生人数为30
B.每个男生被抽到的概率均为
C.样本中学生身高的平均数为167
D.女生身高的样本方差为19
√
√
√
[解析] 对于A选项,因为按比例分配的分层随机抽样的方法抽取了
容量为50的样本,所以样本中男生人数为 ,故A正确;
对于B选项,每个男生被抽到的概率均相等,为 ,故B错误;
对于C选项,易得样本中女生的人数为20,所以样本中学生身高的平
均数为 ,故C正确;
对于D选项,设男生的身高分别为,, ,,平均数, ,女生的身高分别为,, ,,平均数,方差为 ,样本中所有学生的身高的平均数为167,方差 ,
则 ,解得,即女生身高的样本方差为19,故D正确.故选 .
练习册
一、选择题
1.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为( )
A.1 B. C. D.2
[解析] 这个样本的平均数 ,标准差
.
√
2.为评估一种农作物的种植效果,选了块地作为试验田.这 块地的亩
产量(单位:)分别为,, , ,下面给出的指标中可以用来评估
这种农作物亩产量稳定程度的是( )
A.,, ,的平均数 B.,, , 的标准差
C.,, ,的最大值 D.,, , 的中位数
[解析] 标准差能反映一组数据的稳定程度,故选B.
√
3.某人参加射击比赛,打了6发子弹,报靶数据如下:7,8,9,10,
6,8(单位:环),则下列说法不正确的是( )
A.这组数据的平均数是8 B.这组数据的极差是4
C.这组数据的中位数是8 D.这组数据的方差是2
[解析] 对于A,平均数为 ,故A中说法正确;
对于B,极差为 ,故B中说法正确;
对于C,数据从小到大排序后为6,7,8,8,9,10,中位数为 ,故C中说法正确;
对于D,方差为 ,故D中说法不正确,故选D.
√
4.[2024·长沙雅礼中学高一月考]已知样本数据,, , 的
平均数和方差分别为3和56,若 ,则
,, , 的平均数和方差分别是( )
A.12,115 B.12,224 C.9,115 D.9,224
[解析] 因为样本数据,, , 的平均数和方差分别为3和5
6,,所以,, , 的平均
数为,方差为 .故选D.
√
5.[2024·安徽六安裕安区高一期中]2023年7月18日,第31届全国青少
年爱国主义读书教育活动启动,某校为了迎接此次活动,对本校高
一、高二年级学生进行了前期阅读时间抽查,得到日阅读时间
(单位:分钟)的统计表如下:
年级 抽查人数 平均时间 方差
高一 40 50 4
高二 60 40 6
则用样本估计总体,估计两个年级学生日阅读时间的方差为( )
A.52 B.29.2 C.10 D.6.4
√
[解析] 由题意,估计高一、高二学生日阅读时间的平均数
(分钟),方差
.故选B.
6.[2024·辽宁大连十二中高一月考]某班在一次考试中的数学平均分
为125分,方差为.成绩分析时发现有三名同学的成绩录入有误,
同学实际成绩137分,被错录为118分; 同学实际成绩115分,被错
录为103分; 同学实际成绩98分,被错录为129分.更正后重新统计,
得到方差为,则与 的大小关系为( )
A. B. C. D.不能确定
[解析] 设班级人数为 ,因为,所以更正前后平均分不变,且,所以 .故选C.
√
7.王老师统计了自己三位学生近五次的定时训练成绩,其中 号
为甲同学近五次成绩,号为乙同学近五次成绩, 号为
丙同学近五次成绩,相关信息如下:
(1)三人近五次定时训练成绩的平均数如下:
同学 甲 乙 丙
平均数 118 122 121
(2)三人近五次定时训练成绩统计图
如图所示.记甲、乙、丙近五次定时训
练成绩的方差分别为,, ,根
据图表判断,, 的大小关系
为( )
A. B.
C. D.
[解析] 由统计图知,甲同学成绩的波动幅度最小,丙同学成绩的波
动幅度最大,所以 ,故选A.
√
8.(多选题)[2024·江苏无锡天一中学高一期末] 在学校组织的《爱
我中华》主题演讲比赛中,有10位评委对每位选手进行评分
(评分互不相同),将选手的得分去掉一个最低评分和一个最高评分,
则下列结论错误的是( )
A.剩下评分的平均数变大 B.剩下评分的极差变小
C.剩下评分的方差变小 D.剩下评分的中位数变大
[解析] 去掉一个最低评分和一个最高评分后剩下评分的平均数有可
能变小,不变或变大,故A中结论错误;
剩下评分的极差一定会变小,故B中结论正确;
剩下评分的波动性变小,则方差变小,故C中结论正确;
剩下评分的中位数不变,故D中结论错误.故选 .
√
√
9.(多选题)2023年8月8日是我国第15个
“全民健身日”,“全民健身日”提升了全民健
身意识,让健身成为一种习惯和风俗.为倡
导健康生活方式,某大学社团联合学生会倡
A.这一星期内甲的日步数的中位数小于乙的日步数的中位数
B.这一星期内甲的日步数的平均数大于乙的日步数的平均数
C.这一星期内乙的日步数的标准差小于甲的日步数的标准差
D.这一星期内乙的日步数的 分位数是12 400
议全校学生参与“每日万步行”健走活动.如图为该校甲、乙两名同学在
同一星期内每日步数的折线统计图,则下列说法正确的是 ( )
√
√
[解析] 由折线图可得,甲一星期内的日步
数从小到大排列为,, ,
,,, ,所以中位
数为12 600;
由折线图可得,乙一星期内的日步数从小
到大排列为,, ,,, , ,所以中
位数为12 600.故这一星期内甲、乙的日步数的中位数都为 ,A错误;
这一星期内甲的日步数的平均数为为
,这一星期内乙的日步数的平均数为 ,
因为 ,故B正确;
由折线图知,甲的波动程度较大,故
方差较大,标准差较大,故C正确;
乙一星期内的日步数从小到大排列
为,,,,
,, ,因为
,所以这一星期内乙的日步数的分位数是 ,故D错误.故选 .
二、填空题
10.一组数据的方差是4,将这组数据中的每个数据都乘5,所得到的
新数据的标准差是____.
10
[解析] 一组数据的方差是4,将这组数据中的每个数据都乘5,所得
到的新数据的方差是 ,故所得新数据的标准差为10.
11.已知样本数据,,,, 都为正数,其方差
,则样本数据 ,
,,, 的平均数为____.
11
,
又,则有,解得 ,
则样本数据,,,, 的平均数
为 .
[解析] 根据题意,设样本数据,,,,的平均数为 ,
其方差
12.[2024·江苏无锡天一中学高一期末] 某旅行团共有游客600人,其中
男性400人,女性200人.为了获得该团游客的身高信息,采用男、女按比
例分配的分层随机抽样的方法抽取样本,并观测样本的指标值
(单位: ),经计算得到男生样本的均值为170,方差为18,女生样本
的均值为161,方差为30.根据以上数据,估计该旅行团游客身高的均值
为_____;估计该旅行团游客身高的方差为____.
167
40
[解析] 由题意可估计该旅行团游客身高的均值
,
估计该旅行团游客身高的方差 .
三、解答题
13.从某实验农场种植的甲、乙两种玉米苗中各随机抽取5株,分别测
量它们的株高如下(单位: ):
甲:29,31,30,32,28;
乙:27,44,40,31,43.
请根据平均数和方差的相关知识,解答下列问题:
(1)哪种玉米苗长得高?
解:甲种玉米苗株高的平均数
,
乙种玉米苗株高的平均数
,
,故乙种玉米苗长得高.
(2)哪种玉米苗长得齐?
解:甲种玉米苗株高的方差
,
乙种玉米苗株高的方差
,
,故甲种玉米苗长得齐.
14.某校为了解该校高三年级学生的物理成绩,从某次高三年级物理
测试中随机抽取12名男生和8名女生的测试试卷,记录其物理成绩
(单位:分),其中12名男生的物理成绩分别为72,68,72,76,
80,76,72,80,88,68,72,76.
(1)求这12名男生物理成绩的平均数与方差 ;
解:这12名男生物理成绩的平均数为
,
方差 .
(2)经计算得这8名女生物理成绩的平均数,方差 ,
求这20名学生物理成绩的平均数与方差.
解:这20名学生物理成绩的平均数
,
方差 .
15.(多选题)[2024·河南南阳六校高一期末] 某地环境部门对辖区
内甲、乙、丙、丁四个地区的环境治理情况进行检查督导,若一地
区连续10天每天的空气质量指数均不大于100,则认为该地区的环境
治理达标,否则认为该地区的环境治理不达标.根据连续10天检测所
得数据的数字特征推断,环境治理一定达标的地区是( )
A.甲地区:平均数为90,方差为10
B.乙地区:平均数为60,众数为50
C.丙地区:中位数为50,极差为70
D.丁地区:极差为20, 分位数为80
√
√
[解析] 设每天的空气质量指数为 ,10天的空气质量
指数的平均数为,则方差为 ,
对于A,由,得 ,若这10天
中有1天的空气质量指数大于100,则必有 ,矛盾,
所以这10天每天的空气质量指数都不大于100,该地区的环境治理达
标,故A正确;
对于B,假设有8天的空气质量指数为50,有1天的空气质量
指数为140,有1天的空气质量指数为60,此时平均数为60,众数为
50,但该地区的环境治理不达标,故B错误;
对于C,假设第1天的空气质量指数为120,后面9天的空气质量指数为
50,此时中位数为50,极差为70,但该地区的环境治理不达标,故C
错误;
对于D,如果空气质量指数的最大值大于100,根据极差为20,则空气
质量指数的最小值大于80,这与 分位数为80矛盾,故最大值不大
于100,该地区的环境治理达标,故D正确.故选 .
16.某校有高中生2000人,其中男女生人数之比约为 ,为了获得
该校全体高中生的身高信息,采取了以下两种方案:
方案一:采用比例分配的分层随机
抽样方法,抽取了样本量为 的样
本,得到频数分布表和频率分布
直方图(如图).
频数 6 4
方案二:采用分层随机抽样方法,抽取了男、女生样本量均为25的
样本,计算得到男生样本的平均数为170,方差为16,女生样本的
平均数为160,方差为20.
(1)根据图表信息,求, 并补充完整频率分布直方图,估计该校
高中生身高的平均数(同一组中的数据以这组数据所在区间的中点
值为代表).
解:因为身高在区间 内的频率为 ,频数为4,
所以 ,
故 , ,
,
所以身高在区间 内的频率为
,在区间 内的频率为
,由此可补充完整频率分布直方图:
由频率分布直方图可知,样本的平均数为
因此可估计该校高中生身高的平均数为 .
(2)计算方案二中总样本的平均数及方差.
解:把男生样本记为,, ,,其平均数记为,方差记为 ;把女
生样本记为,, ,,其平均数记为,方差记为 ,则总样本平均
数 .
因为 ,
所以 ,
同理可得 ,
所以总样本方差
.
(3)计算两种方案总样本平均数的差,并说明用方案二总样本的平均
数作为总体平均数的估计合适吗?为什么?
解:两种方案总样本平均数的差为 .
用方案二总样本的平均数作为总体平均数的估计不合适,
原因:没有按照等比例进行分层随机抽样,每个个体被抽到的可能性
不同,因此样本的代表性比较差.