14.4.2 用样本估计总体的离散程度参数
一、 单项选择题
1 (2023山东月考)样本中共有5个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本的标准差为( )
A. B. C. 2 D.
2 (2023湖南月考)如果已知一组数据x1,x2,x3,…,xn的方差是2,那么另一组数据5x1+1,5x2+1,5x3+1,…,5xn+1的方差为( )
A. 11 B. 20 C. 50 D. 51
3 (2024上海月考)已知一组样本数据x1,x2,x3,…,x9满足x1A. 平均数 B. 中位数
C. 极差 D. 方差
4 现有5个数,其平均数是1,且这5个数的平方和是20,那么这组数的方差是( )
A. B. C. 3 D. 5
5 (2024新乡二模)已知甲、乙两名篮球运动员在四场小组赛中的得分(单位:分)如下表:
甲 6 12 9 13
乙 8 11 7 14
则这两组数据不同的数字特征是( )
A. 平均数 B. 中位数 C. 方差 D. 极差
6 (2024江西二模)从甲队60人、乙队40人中,按照分层抽样的方法从两队共抽取10人,进行一轮答题.相关统计情况如下:甲队答对题目的平均数为1,方差为1;乙队答对题目的平均数为1.5,方差为0.4,则这10人答对题目的方差为( )
A. 0.8 B. 0.675 C. 0.74 D. 0.82
二、 多项选择题
7 下列说法中,正确的是( )
A. 极差与方差都反映了数据的离散程度
B. 方差是没有单位的统计量
C. 标准差比较小时,数据比较分散
D. 只有两个数据时,极差是标准差的2倍
8 在一次党建活动中,甲、乙、丙、丁四个兴趣小组举行党史知识竞赛,每个小组各派10名同学参赛,记录每名同学失分(均为整数)情况,若该组每名同学失分都不超过7分,则该组为“优秀小组”,已知甲、乙、丙、丁四个小组成员失分数据信息如下,则一定为“优秀小组”的是( )
A. 甲组中位数为2,极差为5
B. 乙组平均数为2,众数为2
C. 丙组平均数为1,方差大于0
D. 丁组平均数为2,方差为3
三、 填空题
9 (2024长沙月考)已知一组数据1,2,4,5,m的平均数为4,则这组数据的方差为________.
10 (2023石家庄正定中学月考)已知数据1,2,a,6的平均数是3,若将这组数据中的每一个数据都加上2 023,得到一组新数据,则新数据的标准差为________.
11 (2024江苏月考)水痘是一种传染性很强的病毒性疾病,容易在春天爆发,市疾控中心为了调查某高校高一年级学生注射水痘疫苗的人数,在高一年级随机抽取了5个班级,每个班级的人数互不相同,若把每个班抽取的人数作为样本数据,已知样本平均数为5,样本方差为4,则样本数据中最大值为________.
四、 解答题
12 (2023苏州月考)甲、乙两名学生在 5次英语测试中的成绩统计如下:
甲:74 85 86 90 93
乙:76 83 85 87 97
现要从中选派一人参加英语口语竞赛,从统计学角度,你认为派哪位学生参加更合适?请说明理由.
13 某单位为了解退休职工生活情况,对50名退休职工做了一次问卷调查,满分100分,并从中随机抽取了10名退休职工的问卷,得分情况统计如下:
分数 77 79 81 84 88 92 93
人数 1 1 1 3 2 1 1
回答以下问题:
(1) 求抽取的10名退休职工问卷得分的平均数 和方差s2;
(2) 10名退休职工问卷得分在 -s与 +s之间有多少人?这些人占 10名退休职工的百分比为多少?
14.4.2 用样本估计总体的离散程度参数
1. D 因为样本a,0,1,2,3的平均数为1,所以(a+0+1+2+3)=1,解得a=-1,则样本的方差s2=×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,故标准差为.
2. C 因为一组数据x1,x2,x3,…,xn的方差是2,所以另一组数据5x1+1,5x2+1,5x3+1,…,5xn+1的方差为52×2=50.
3. D 因为x14. C 设这5个数为x1,x2,…,x5,由题意可知=1,x+x+…+x=20,则这组数的方差是s2=[(x1-)2+(x2-)2+…+(x5-)2]=[(x+x+…+x)-2(x1+x2+…+x5)+52]=×(20-2×1×5+5×12)=3.
5. B 甲组数据的平均数为=10,乙组数据的平均数为=10,故A不符合题意;将甲组数据从小到大排列为6,9,12,13,所以中位数为=10.5;将乙组数据从小到大排列为7,8,11,14,所以中位数为=9.5,故B符合题意;甲组数据的方差为[(6-10)2+(9-10)2+(12-10)2+(13-10)2]=7.5,乙组数据的方差为[(8-10)2+(11-10)2+(7-10)2+(14-10)2]=7.5,故C不符合题意;甲组数据的极差为13-6=7,乙组数据的极差为14-7=7,故D不符合题意.
6. D 根据题意,按照分层抽样的方法从甲队中抽取10×=6(人),从乙队中抽取10×=4(人),这10人答对题目的平均数为(6×1+4×1.5)=1.2,所以这10人答对题目的方差为[6×1+6(1-1.2)2+4×0.4+4(1.5-1.2)2]=0.82.
7. AD 对于A,根据极差、方差的定义可知,极差与方差都反映了数据的离散程度.一般来说,极差、方差越大,稳定性越差,故A正确;对于B,方差的单位是样本数据单位的平方,故B错误;对于C,标准差比较小时,数据比较集中,故C错误;对于D,设两个数据分别为x1,x2,则易得极差等于|x2-x1|,平均数等于,标准差等于=|x2-x1|,即极差是标准差的2倍,故D正确.故选AD.
8. AD 对于A,因为中位数为2,极差为5,故最大值小于等于7,故A正确;对于B,如失分数据分别为0,0,0,2,2,2,2,2,2,8,则满足平均数为2,众数为2,但不满足每名同学失分都不超过7分,故B错误;对于C,如失分数据分别为0,0,0,0,0,0,0,0,1,9,则满足平均数为1,方差大于0,但不满足每名同学失分都不超过7分,故C错误;对于D,利用反证法,假设有一同学失分超过7分,则方差大于×(8-2)2=3.6>3,与题设矛盾,故每名同学失分都不超过7分,故D正确.故选AD
9. 6 因为数据1,2,4,5,m的平均数是4,所以=(1+2+4+5+m)=4,解得m=8,所以这组数据的方差为s2=[(1-4)2+(2-4)2+(4-4)2+(5-4)2+(8-4)2]=6.
10. 因为数据1,2,a,6的平均数是3,所以=3,解得a=3.若将这组数据中每一个数据都加上2 023,则新数据的平均数为 =2 026,方差为s2=×[(2 024-2 026)2+(2 025-2 026)2+(2 026-2 026)2+(2 029-2 026)2]=,所以新数据的标准差为.
11. 8 设五个班抽取的人数分别为a1,a2,a3,a4,a5,则(a1+a2+a3+a4+a5)=5,[(a1-5)2+(a2-5)2+(a3-5)2+(a4-5)2+(a5-5)2]=4,则a1+a2+a3+a4+a5=25,(a1-5)2+(a2-5)2+(a3-5)2+(a4-5)2+(a5-5)2=20,样本数据为整数,根据方差,样本数据中最大值为9,此时样本数据依次为4,4,4,4,9,不满足样本数据互不相同;当样本数据中最大值为8时,样本数据依次为2,4,5,6,8,符合题意.故样本数据中最大值为8.
12. 根据题意,得甲成绩的平均数为1=×(74+85+86+90+93)=85.6,
乙成绩的平均数为2=×(76+83+85+87+97)=85.6,
甲成绩的方差为s=×[(74-85.6)2+(85-85.6)2+(86-85.6)2+(90-85.6)2+(93-85.6)2]=41.84,
乙成绩的方差为s=×[(76-85.6)2+(83-85.6)2+(85-85.6)2+(87-85.6)2+(97-85.6)2]=46.24.
因为甲、乙成绩的平均数相等,且甲成绩的方差小于乙成绩的方差,所以甲的成绩更稳定,故派甲参赛更合适.
13. (1) =×(77+79+81+3×84+2×88+92+93)=85,
s2=×[(77-85)2+(79-85)2+(81-85)2+3×(84-85)2+2×(88-85)2+(92-85)2+(93-85)2]=25.
(2) 由(1)可得s=5,
所以-s=85-5=80,+s=85+5=90,
所以10名退休职工问卷得分在-s与+s之间有6人,占10名退休职工的百分比为60%.