13. 5 统计估计
分层练习
题型 1:总体集中趋势的估计
1.已知一组数据 a1,a2 ,… ,an 的平均数为 6,那么 2a1 + 5,2a2 + 5, ,2an + 5的平均数为 .
2.如图所示的茎叶图记录了甲、乙两支篮球队各 6 名队员某场比赛的得分数据(单位:分).若这两组数
据的中位数相等,且平均值也相等,则 x + y = .
3.某同学 10 次数学检测成绩统计如下:95,97,94,93,95,97,97,96,94,93,设这组数的平均数
为 a,中位数为b ,众数为 c,则 a,b , c的大小为 (用“>”符号连接)
4.如图所示的茎叶图记录了甲、乙两组各 5 名工人某日的产量数据(单位:件).若这两组数据的中位数
相等,且平均值也相等,则 x 和 y 的值分别为 .
甲组 乙组
6 5 9
5 2 6 1 y 7
4 x 7 8
5.由 8 个整数形成的样本数据中,至少有六个互不相同的整数,若平均数、中位数、唯一的众数和全距
(即样本中最大数与最小数之差)都是 8,则可能成为样本数据中的最大整数是 .
题型 2:总体离散程度的估计
6.已知 a为实数,若数据 1,2, a,6 的平均数为 3,则这组数据的标准差为 .
7.某学校为了获得该校全体高中学生的体育锻炼情况,按男、女学生的比例分别抽样调查了 48 名男生和
27 名女生的每周锻炼时间,通过计算得到男生每周锻炼时间的平均数为 7.6 小时,方差为 7.3;女生每周锻
炼时间的平均数为 6.4 小时,方差为 8,则所有样本数据的方差为 .(结果精确到小数点后三位)
8.已知某八个数据的平均数为 5,方差为 3,现又新加入一个数据 14,此时这九个数据的方差
为 .
9.某班共有 40 名学生,其中 23 名男生的身高平均数为173cm ,方差为 28;17 名女生的身高平均数为
162cm;若全班学生的身高方差为 62,则该班级女生身高的方差为 .
10.已知1, x1, x2 , x3, x4 这 5 个数的平均数为 3,方差为 2,则 x1, x2 , x3 , x4 这 4 个数的方差为 .
题型 3:总体百分数的估计
11.某党支部理论学习小组抽取了 10 位党员在该学习平台的学习成绩如下:83,85,88,90,91,91,
92,93,96,97,则这 10 名党员学习成绩的75% 分位数为 .
12.从高三某班抽取 10 名同学,他们的数学成绩如下:102,110,117,120,122,122,122,126,134,
145(单位:分),则这 10 名同学数学成绩的第 70 百分位数是 .
13.某学校为了解该校学生开展志愿者活动的情况,随机抽取了 40 名学生,对他们本学期参与志愿者活动
时长进行了统计,已知统计数据如下表所示:
时长(小时) 7 8 9 10 11
人数(人) 6 10 9 8 7
则该校学生开展志愿者活动时长的第 40 百分位数是 .
14.抗击疫情期间,小志参与了社区志愿者工作.现在要对服务时长排名前20%的志愿者进行表彰.该社
区的志愿者服务时长(单位:小时)如下:
186.0 102.0 22.0 64.0 36.0 68.0 106.0 126.0 110.0 210.0
124.0 226.0 154.0 230.0 58.0 162.0 70.0 162.0 166.0 16.0
根据以上数据,该社区志愿者服务时长的第 80 百分位数是 .(精确到 0.1)
15.16-17 岁未成年人的体重的主要百分位数表(单位:kg).
P1 P5 P10 P25 P50 P75 P90 P95 P99
男 40.1 45.1 47.9 51.5 56.7 63.7 72.4 80.4 95.5
女 38.3 41.2 43.1 46.5 50.5 55.3 61.1 65.4 75.6
表中数据来源:《中国未成年人人体尺寸》(标准号:GB/T26158-2010)
小王同学今年 17 岁,她的体重 50kg,她所在城市女性同龄人约有 4.2 万人.估计小王同学所在的城市有
万女性同龄人的体重一定高于她的体重.(单位:万人,结果保留一位小数)
1
16.从 2,3,4,5,6,7,8,9 中随机取一个数,这个数比 m 大的概率为 ,若 m 为上述数据中的第 x
4
百分位数,则 x 的取值可能为( )
A.50 B.60 C.70 D.80
一、填空题
1.在一次篮球比赛中,某支球队共进行了 8 场比赛,得分分别为 25,29,30,32,37,38,40,42,那么
这组数据的第 65 百分位数为 .
2.已知某组数据为 4,7,8,10,11,则该组数据的方差为 .
3.已知 a为实数,若数据 1,2, a,6 的平均数为 3,则这组数据的标准差为 .
4.一组数据按从小到大的顺序排列如下:9,10,12,15,x,17,y,22,26,经计算,该组数据中位数
是 16,若75% 分位数是 20,则 x + y = .
5.湖州地区甲、乙、丙三所学科基地学校的数学强基小组人数之比为3: 2 :1,三所学校共有数学强基学生
48 人,在一次统一考试中,所有学生的成绩平均分为 117,方差为 21.5.已知甲、乙两所学校的数学强基
小组学生的平均分分别为 118 和 114,方差分别为 15 和 21,则丙学校的学生成绩的方差是 .
6.商场为改进服务质量,提升顾客购物体验,从 2023 年第三季度消费过的顾客中随机抽取部分人进行满
意度问卷调查.并将这部分人满意度的得分分成以下 6 组: 40,50 , 50,60 , × × ×, 90,100 ,统计结果如图所
示.那么该商场顾客满意度得分的第 60 百分位数为 .
7 2
1 2 2
.已知样本数据 a1 a2 a3 a4 a5 都为正数,其方差 s = a1 + a2 + a23 + a24 + a25 -80 ,则样本数据 2a1 + 3、5
2a2 + 3、 2a3 + 3、2a4 +3、 2a5 + 3的平均数为 .
8.为了解某企业员工对习近平新时代中国特色社会主义思想的学习情况,对该企业员工进行问卷调查,已
3
如他们的得分都处在 A,B,C,D 四个区间内,根据调查结果得到下面的统计图.已知该企业男员工占 ,
5
则下列结论中,错误的结论是 .(填序号)
①男、女员工得分在 A 区间的占比相同;
②在各得分区间男员工的人数都多于女员工的人数;
③得分在C 区间的员工最多;
④得分在D区间的员工占总人数的 20%.
9.已知总体的各个个体的值由小到大依次为3,7,a,b,17,20 ,且总体的中位数为 12,若要使该总体的标准差
最小,则 a= .
10.节约用水是中华民族的传统美德,某市政府希望在本市试行居民生活用水定额管理,即确定一个合理
的居民月用水量标准 x (吨),用水量不超过 x 的部分按平价收费,超过 x 的部分按议价收费.为此希望已
经学习过统计的小明,来给出建议.为了了解全市居民用水量的分布情况,小明通过随机走访,获得了 100
位居民某年的月均用水量(单位:吨),将数据按照 0,0.5 , 0.5,1 , , 4,4.5 分成 9 组,制成了如图所示的
频率分布直方图.若该市政府希望使85%的居民每月的用水量不超过标准 x (吨),如果你是小明,你觉得 x
的估计值为 (精确到小数点后 1 位)
11.湖北省中药材研发中心整合省农业科技创新中心、省创新联盟相关资源和力量,为全省中药材产业链
延链、补链、强链提供科技支撑,某科研机构研究发现,某品种中医药的药物成分甲的含量 x(单位:g 与
药物功效 y(单位:药物单位)之间满足 y =15x - 2x2,检测这种药品一个批次的 6 个样本,得到成分甲的
含量 x 的平均值为 5g,标准差为 5 g,则估计这批中医药的药物功效 y 的平均值为 药物单位.
12.在分层抽样时,如果将总体分为 k 层,第 j 层抽取的样本量为 n j ,第 j 层的样本平均数为 x j ,样本方差
k
s2为 j , j = 1, 2,L , k ,.记 n = n j ,则所有数据的样本方差为 s2 = .
j=1
二、单选题
13.现有一组数据不知道其具体个数,只知道该组数据平方后的数据的平均值是 a,该组数据扩大m 倍后的
数据的平均值是b ,则原数据的方差、平方后的数据的方差、扩大m 倍后的数据的方差三个量中,能用 a,b,m
表示的量的个数是( )
A.0 B.1 C.2 D.3
14.甲、乙两同学对同一组数据进行分析,甲同学得到的数据均值为 x ,方差为 S 2 ,乙同学不小心丢掉了
一个数据,得到的均值仍为 x ,方差为 2,则下列判断正确的是( )
A. S 2 = 2 B. S 2 > 2
C. S 2 < 2 D. S 2 与 2 的大小关系无法判断
15.从某中学甲、乙两班各随机抽取 10 名同学,测量他们的身高(单位: cm),所得数据用茎叶图表示如
图,由此可估计甲、乙两班同学的身高情况,则下列结论正确的是( )
A.甲乙两班同学身高的极差相等 B.甲乙两班同学身高的平均值相等
C.甲乙两班同学身高的中位数相等 D.乙班同学身高在175cm 以上的人数较多
16.一组样本数据 x1, x2 , × × ×, xn 的平均数为 x (x 0),标准差为 s .另一组样本数据 xn+1, xn+2,…, x2n 的平均数
为3x ,标准差为 s .两组数据合成一组新数据 x1, x2 , × × ×, xn , xn+1,…, x2n ,新数据的平均数为 y ,标准差为
s ,则( )
A. s > s B. s = s C. s < s D. s 与 s的大小与 n有关
三、解答题
17.下面是甲、乙两名运动员在某次男子 10 米气手枪射击选拔赛中的得分数据(单位:环),
甲 9.6 9.9 9.2 9.4 9.9 10.1 10.2 9.7 9.6 9.3 10.0 10.4 10.1 9.9
乙 10.2 10.7 9.7 10.0 9.1 10.0 8.6 9.8 9.6 9.7 10.9 9.5 10.3 9.2
分别计算两名运动员得分的平均数与标准差,并分析比较两名运动员的射击水平.
18.文明城市是反映城市整体文明水平的综合性荣誉称号,某市为提高市民对文明城市创建的认识,举办
了“创建文明城市”知识竞赛,从所有答卷中随机抽取 100 份作为样本,将样本的成绩(满分 100 分,成绩均
为不低于 40 分的整数)分成六段: 40,50 , 50,60 , × × ×, 90,100 ,得如下图所示的频率分布直方图
(1)求频率分布直方图中 a的值;
(2)若在抽取的 100 份样本中有 20 份样本的数据如下:
44,46,50,52,60,63,66,68,68,72,75,76,79,79,81,82,82,83,90,92
求该组数据(指这 20 分样本构成的数据)的第 75 百分位数;
(3)已知落在 50,60 的平均成绩是 54,方差是 7,落在 60,70 的平均成绩为 66,方差是 4,求这两组成绩的
总平均数和总方差.
19.某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行 10 次配对试验,每次配对试验选用材
质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品
的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为 xi , yi i =1,2,L,10 ,记
zi = xi - yi i =1,2,L,10 .试验结果如下:
试验序号 i 1 2 3 4 5 6 7 8 9 10
伸缩率 xi 545 533 551 522 575 544 541 568 596 548
伸缩率 yi 536 527 543 530 560 533 522 550 576 536
(1)求甲工艺处理后的橡胶产品的伸缩率的中位数和极差;
(2)设 z1, z2 ,L, z10的样本平均数为 z,样本方差为 s2 .判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后
s2
的橡胶产品的伸缩率是否有显著提高(如果 z 2 ,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺
10
处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).
20.某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,
得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值 c,将该指标大于 c 的人判定为阳性,小于或等于 c 的人判
定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为 p(c);误诊率是将未患病者判定为阳
性的概率,记为 q(c).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率 p c = 0.5%时,求临界值 c 和误诊率 q c ;
(2)设函数 f c = p c + q c ,当 c 95,105 时,求 f c 的解析式,并求 f c 在区间 95,105 的最小值.
n
21.(1)设数据 a1, a2,a3,…, a
1
n 的均值为 a s 2
2 2
,方差为 ,请利用已经学过的方差公式:s =
n (ai - a)i=1
1 ns 2 = a2
2
来证明方差第二公式: i - a ;n i=1
(2)已知 n 2, n N, a1, a2,a3,…, an 的方差为s 2a ,其中0< a1 < a2 < a3 <×××< an.
b a1 + a21 = ,b
a2 + a3 a + a
2 = ,…,b n-1 nn-1 = ,b
a
= n
+ a1 2 2
n ,b1,b2,b3,…,bn 的方差为s b .比较s 与2 2 2 2 a
s 2b 大小,并说明理由.13. 5 统计估计
分层练习
题型 1:总体集中趋势的估计
1.已知一组数据 a1,a2 ,… ,an 的平均数为 6,那么 2a1 + 5,2a2 + 5, ,2an + 5的平均数为 .
【答案】17
【分析】根据平均数公式,即可求解.
a + a
【解析】由条件可知, 1 2
+ a3 + ...+ an = 6,
n
2a1 + 5 + 2a2 + 5 + ...+ 2an + 5 2 a1 + a2 + a3 + ...+ a则 = n + 5
n n
= 2 6 + 5 =17 .
故答案为:17
2.如图所示的茎叶图记录了甲、乙两支篮球队各 6 名队员某场比赛的得分数据(单位:分).若这两组数
据的中位数相等,且平均值也相等,则 x + y = .
【答案】9
【分析】根据茎叶图中的数据,分别利用数据的中位数和平均数的公式,列出方程,求得 x, y的值,即可求
解.
7 +12 +16 + 20 + (20 + x) + 31 106 + x
【解析】由平均数的公式得,甲的平均数为 x1 = = ,6 6
8 + 9 +19 + (10 + y) + 27 + 28 101+ y
乙的平均数为 x2 = = ,6 6
106 + x 101+ y
因为甲乙的平均数相等,可得 = ,即 y - x = 5,
6 6
16 + 20 19 +10 + y
又由甲的中位数为 =18,乙的中位数为 ,
2 2
19 +10 + y
因为甲乙的中位数相等,可得 =18,解得 y = 7 ,
2
因为 y - x = 5,所以 x = 2,所以 x + y = 9 .
故答案为:9 .
3.某同学 10 次数学检测成绩统计如下:95,97,94,93,95,97,97,96,94,93,设这组数的平均数
为 a,中位数为b ,众数为 c,则 a,b , c的大小为 (用“>”符号连接)
【答案】 c > a > b
【分析】将数据从小到达的顺序排列,从而求出平均数、中位数、众数,即可比较出它们的大小.
【解析】将数据从小到达的顺序排列,则为93,93,94,94,95,95,96,97,97,97,
93+ 93 + 94 + 94 + 95 + 95 + 96 + 97 + 97 + 97 951
所以平均数为 a = = = 95.1,
10 10
b 95 + 95中位数为 = = 95,众数为 c = 97,
2
所以 c > a > b,
故答案为: c > a > b .
4.如图所示的茎叶图记录了甲、乙两组各 5 名工人某日的产量数据(单位:件).若这两组数据的中位数
相等,且平均值也相等,则 x 和 y 的值分别为 .
甲组 乙组
6 5 9
5 2 6 1 y 7
4 x 7 8
【答案】 x = 3, y = 5
【分析】根据数据中位数,平均数计算即可.
【解析】由题知,乙组的中位数为 65,所以 y = 5,
所以平均数
56 + 62 + 65 + 74 + 70 + x 59 + 61+ 65 + 67 + 78
= ,
5 5
解得 x = 3.
故答案为: x = 3, y = 5
5.由 8 个整数形成的样本数据中,至少有六个互不相同的整数,若平均数、中位数、唯一的众数和全距
(即样本中最大数与最小数之差)都是 8,则可能成为样本数据中的最大整数是 .
【答案】12 或 13
【分析】根据平均数、中位数、唯一的众数和全距求得最大整数的值.
【解析】依题意,平均数=中位数=众数=8,所以偏态系数为 0 ,数据分布对称,
因为存在众数且众数唯一,
所以当有两个 8 时,可设这8个整数为 x1, x2 , x3 ,8,8, x4 , x5 , x6 ,
且 x1 < x2 < x3 < 8 = 8 < x4 < x5 < x6,
ìx6 - x1 = 8
所以 í x + x x =121 6 ,解得 ;
= 8
6
2
当有三个 8 时,可设这8个整数为 x1, x2 , x3 ,8,8,8, x4 , x5或 x1, x2 ,8,8,8, x3 , x4 , x5,
且 x1 < x2 < x3 < x4 < x5 , x5 10, x1 6,
ìx5 - x1 = 8
且 í x1 + x2 + x3 + x4 + x5 ,所以 5,6,7,8,8,8,9,13 ,满足题意, x= 8 5
=13 .
5
所以可能成为样本数据中的最大整数是 12 或 13.
故答案为:12或 13.
题型 2:总体离散程度的估计
6.已知 a为实数,若数据 1,2, a,6 的平均数为 3,则这组数据的标准差为 .
14 1
【答案】 / 14
2 2
【分析】根据平均数、方差公式计算可得.
1
【解析】依题意 1+ 2 + a + 6 = 3,解得 a = 3,
4
1 2 2
所以方差为 é 1- 3 + 2 - 3 + 3
7
- 3 2 + 6 - 3 2 ù = ,4 2
7 14
则标准差为 = .
2 2
14
故答案为:
2
7.某学校为了获得该校全体高中学生的体育锻炼情况,按男、女学生的比例分别抽样调查了 48 名男生和
27 名女生的每周锻炼时间,通过计算得到男生每周锻炼时间的平均数为 7.6 小时,方差为 7.3;女生每周锻
炼时间的平均数为 6.4 小时,方差为 8,则所有样本数据的方差为 .(结果精确到小数点后三位)
【答案】7.884
【分析】根据所有样本数据的方差公式进行求解即可.
48 27
【解析】设所有样本数据的平均数为w = 7.6 + 6.4 = 7.168,
48 + 27 48 + 27
1 2
所以所有样本数据的方差为 48 é 7.3 + 7.6 - 7.168 ù + 27 é 8 + 6.4 - 7.168 2 ù 7.884 ,48 + 27
故答案为:7.884
8.已知某八个数据的平均数为 5,方差为 3,现又新加入一个数据 14,此时这九个数据的方差
为 .
32
【答案】
3
【分析】运用平均数、方差公式计算即可.
1
【解析】由题意知,这 9 个数的平均数为 (8 5 +14) = 6,
9
8
9 2
1 2 32
所以这 个数的方差为 [3 + (6 - 5) ]+ (6 -14) = .
9 9 3
32
故答案为: .
3
9.某班共有 40 名学生,其中 23 名男生的身高平均数为173cm ,方差为 28;17 名女生的身高平均数为
162cm;若全班学生的身高方差为 62,则该班级女生身高的方差为 .
1537
【答案】
40
【分析】求出班级平均身高,然后利用方差的性质可解.
23 173+17 162 6733
【解析】由题意可知,所有学生的平均身高为: = ,设班级女生身高的方差为 x ,
40 40
23 é28 173 6733
2
ù 17 éx 162 6733
2 ù
则 ê + - ÷ ú + ê + -
= 62,
40 ê è 40 ú 40 ê è 40
÷ ú
ú
x 1537 1537所以 = ,即该班级女生身高的方差为 .
40 40
1537
故答案为: .
40
10.已知1, x1, x2 , x3, x4 这 5 个数的平均数为 3,方差为 2,则 x1, x2 , x3 , x4 这 4 个数的方差为 .
5 1
【答案】 /1.25/1
4 4
【分析】根据1, x1, x2 , x3, x4 这 5 个数的平均数求出 x1, x2 , x3 , x4 这 4 个数的平均数,再利用公式计算出
x21 + x
2 + x2 + x22 3 4 = 54 和 x1, x2 , x3 , x4 这 4 个数的方差.
【解析】因为1, x1, x2 , x3, x4 这 5 个数的平均数为 3,方差为 2,
1
所以 x1 + x2 + x3 + x4 +1 = 3,即 x1 + x2 + x3 + x5 4
=14,
所以 x1, x , x , x
1 7
2 3 4 这 4 个数的平均数为 x = x + x + x + x4 1 2 3 4 = ,2
x2 + x2 2 2 2
所以 1 2
+ x3 + x4 +1 - 32 = 2 x2 2 2 2,即 1 + x2 + x3 + x4 = 54 ,5
x 1 2 2 2 2 2 1 7
2
5
所以 1, x2 , x3 , x4 这 4 个数的方差为 x1 + x2 + x3 + x4 - x = 54 -4 4 ÷ =è 2 4
5
故答案为:
4
题型 3:总体百分数的估计
11.某党支部理论学习小组抽取了 10 位党员在该学习平台的学习成绩如下:83,85,88,90,91,91,
92,93,96,97,则这 10 名党员学习成绩的75% 分位数为 .
【答案】93
【分析】由百分位数定义可得答案.
【解析】根据题意,10 个数据从小到大依次为 83,85,88,90,91,91,92,93,96,97,
而10 75% = 7.5 ,
则这 10 名党员学习成绩的75% 分位数为第 8 项数据 93.
故答案为:93.
12.从高三某班抽取 10 名同学,他们的数学成绩如下:102,110,117,120,122,122,122,126,134,
145(单位:分),则这 10 名同学数学成绩的第 70 百分位数是 .
【答案】124
【分析】根据百分位数的计算即可求解.
122 +126
【解析】由于10 70% = 7 ,所以第 70 百分位数为第七个数与第八个数的平均数,即 =124,
2
故答案为:124
13.某学校为了解该校学生开展志愿者活动的情况,随机抽取了 40 名学生,对他们本学期参与志愿者活动
时长进行了统计,已知统计数据如下表所示:
时长(小时) 7 8 9 10 11
人数(人) 6 10 9 8 7
则该校学生开展志愿者活动时长的第 40 百分位数是 .
【答案】8.5
【分析】确定 40 40% =16,第 40 百分位数是第16个数和第17 个数的平均数,计算得到答案.
8 + 9
【解析】 40 40% =16,故第 40 百分位数是第16个数和第17 个数的平均数,即 = 8.5 .
2
故答案为:8.5 .
14.抗击疫情期间,小志参与了社区志愿者工作.现在要对服务时长排名前20%的志愿者进行表彰.该社
区的志愿者服务时长(单位:小时)如下:
186.0 102.0 22.0 64.0 36.0 68.0 106.0 126.0 110.0 210.0
124.0 226.0 154.0 230.0 58.0 162.0 70.0 162.0 166.0 16.0
根据以上数据,该社区志愿者服务时长的第 80 百分位数是 .(精确到 0.1)
【答案】176.0
【分析】 20 80 00 =16,根据百分位数的计算方法可知,把服务时长从小到大排列,计算第 16 和第 17 个
数的平均数作为第 80 百分位数.
【解析】 20 80 00 =16,则把服务时长从小到大排列,选择第 16 个和第 17 个数的平均数作为社区志愿者
166.0 +186.0
服务时长的第 80 百分位数,即 =176.0,
2
故答案为:176.0
15.16-17 岁未成年人的体重的主要百分位数表(单位:kg).
P1 P5 P10 P25 P50 P75 P90 P95 P99
男 40.1 45.1 47.9 51.5 56.7 63.7 72.4 80.4 95.5
女 38.3 41.2 43.1 46.5 50.5 55.3 61.1 65.4 75.6
表中数据来源:《中国未成年人人体尺寸》(标准号:GB/T26158-2010)
小王同学今年 17 岁,她的体重 50kg,她所在城市女性同龄人约有 4.2 万人.估计小王同学所在的城市有
万女性同龄人的体重一定高于她的体重.(单位:万人,结果保留一位小数)
【答案】 2.1
【分析】根据题意,由图表可知,该城市女性同龄人高于小王的50百分位数,由百分位数的定义计算可得
答案.
【解析】根据题意,小王同学今年 17 岁,她的体重 50kg,
由图表可知,小王体重的百分位数是50,
50
所以体重一定高于她的体重的人数有 4.2 = 2.1 (万)
100
故答案为: 2.1
1
16.从 2,3,4,5,6,7,8,9 中随机取一个数,这个数比 m 大的概率为 ,若 m 为上述数据中的第 x
4
百分位数,则 x 的取值可能为( )
A.50 B.60 C.70 D.80
【答案】C
【分析】先求出m ,再结合百分位数的定义,即可求解.
1
【解析】从 2,3,4,5,6,7,8,9 中随机取一个数,这个数比m 大的概率为 ,则m = 7 ,
4
m 为数据 2,3,4,5,6,7,8,9 的第 6 个数,
m 为上述数据中的第 x 百分位数,70% 8 = 5.6,则 x 的取值可能为 70.
故选:C.
一、填空题
1.在一次篮球比赛中,某支球队共进行了 8 场比赛,得分分别为 25,29,30,32,37,38,40,42,那么
这组数据的第 65 百分位数为 .
【答案】38
【分析】根据百分位数的定义即可求解.
【解析】8 65% = 5.2 ,故这组数据的第 65 百分位数为第 6 个数 38,
故答案为:38
2.已知某组数据为 4,7,8,10,11,则该组数据的方差为 .
【答案】6
【分析】利用平均数与方差的计算公式求解即可.
x 4 + 7 + 8 +10 +11【解析】依题意, = = 8,
5
2 1 2 2 2
所以 s = é 4 -8 + 7 -8 + 8 -8 + 10 -8
2 + 11-8 2 ù = 6 .
5
故答案为:6 .
3.已知 a为实数,若数据 1,2, a,6 的平均数为 3,则这组数据的标准差为 .
14 1
【答案】 / 14
2 2
【分析】根据平均数、方差公式计算可得.
1
【解析】依题意 1+ 2 + a + 6 = 3,解得 a = 3,
4
1 2 2 2 2 7
所以方差为 é 1- 3 + 2 - 3 + 3 - 3 + 6 - 3 ù4 = ,2
7 14
则标准差为 = .
2 2
14
故答案为:
2
4.一组数据按从小到大的顺序排列如下:9,10,12,15,x,17,y,22,26,经计算,该组数据中位数
是 16,若75% 分位数是 20,则 x + y = .
【答案】36
【分析】利用中位数和百分位数的定义得到 x =16 , y = 20 ,求出答案.
【解析】一共有 9 个数,故从小到大的第 5 个数为中位数,即 x =16 ,
9 75% = 6.75,故选取第 7 个数为75%分位数,故 y = 20 ,
所以 x + y =16 + 20 = 36 .
故答案为:36
5.湖州地区甲、乙、丙三所学科基地学校的数学强基小组人数之比为3: 2 :1,三所学校共有数学强基学生
48 人,在一次统一考试中,所有学生的成绩平均分为 117,方差为 21.5.已知甲、乙两所学校的数学强基
小组学生的平均分分别为 118 和 114,方差分别为 15 和 21,则丙学校的学生成绩的方差是 .
【答案】12
24 16 8
【分析】计算各校人数,标记平均值和方差,确定w = x + y + z,
48 48 48
s2 1= 24 és2 x + (x -w)2 ù +16 é s2 2y + (y -w) ù + 8 és2z + (z -w)2 ù48 ,计算得到答案.
【解析】甲、乙、丙三所学科基地学校的数学强基小组人数之比为3: 2 :1,
三所学校共有数学强基学生 48 人,
甲校的数学强基小组人数 24;
乙校的数学强基小组人数为 16;
丙校的数学强基小组人数 8,
2
把甲校的数学强基小组学生的平均分记为 x =118,方差记为 sx =15;
2
把乙校的数学强基小组学生的平均分记为 y =114,方差记为 sy = 21;
2
把丙校的数学强基小组学生的平均分记为 z ,方差记为 sz ;
把所有学生的平均分记为w =117 ,方差记为 s2 = 21.5.
根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系,
w 24 x 16 y 8 z 117 24 118 16可得 = + + ,即 = + 114
8
+ z ,解得
48 48 48 48 48 48 z =120
,
s2 1= 24 és2 x + (x -w)2 ù +16 és2 2 2 2 y + (y -w) ù + 8 é sz + (z -w) ù ,48
即 21.5
1
= 24 é 15 + (118 -117)2 ù +16 é21+ (114 -117)2 ù + 8 é s2z + (120 -117)2 ù48 ,
s2解得 z =12 .
故答案为:12.
6.商场为改进服务质量,提升顾客购物体验,从 2023 年第三季度消费过的顾客中随机抽取部分人进行满
意度问卷调查.并将这部分人满意度的得分分成以下 6 组: 40,50 , 50,60 , × × ×, 90,100 ,统计结果如图所
示.那么该商场顾客满意度得分的第 60 百分位数为 .
【答案】75
【分析】利用频率分布直方图每个小矩形面积代表频率表示第 60 百分位数求解即可.
【解析】由图可知,第 1 个小矩形面积为 0.1,第 2 个小矩形面积为 0.15,第,3 个小矩形面积为 0.2,第 4
个小矩形面积为 0.3,
则第 60 百分位数位于 70,80 内,设 60 百分位数为 x ,则有0.1+ 0.15 + 0.2 + x - 70 0.030 = 0.6,
则 x = 75,所以商场顾客满意度得分的第 60 百分位数为 75.
故答案为:75
7.已知样本数据 a1 a2 a3 a4 a s
2 1= a2 + a2 + a2 + a2 + a25 都为正数,其方差 1 2 3 4 5 -80 ,则样本数据 2a1 + 3、5
2a2 + 3、 2a3 + 3、2a4 +3、 2a5 + 3的平均数为 .
【答案】11
【分析】样本数据的平均数结合方差公式可得5x 2 = 80,于是 x = 4,结合平均数的性质分析可得答案.
【解析】根据题意,设样本数据 a1、 a2、a3、 a4、 a5 的平均数为 x ,
2 1
其方差 s = é a1 - x
2 + a - x 2 + a - x 22 3 + a4 - x
2 + a3 - x
2 ù
5
1
= a2 + a2 + a2 + a2 + a2 - 2a x - 2a x - 2a x - 2a x - 2a x + 5x 2
5 1 2 3 4 5 1 2 3 4 5
1
= (a21 + a
2
2 + a
2
3 + a
2
4 + a
2
5 - 5x
2 )
5 ,
s2 1又 = a21 + a2 + a2 + a22 3 4 + a25 -80 ,5
则有5x 2 = 80,解得 x = 4,
则样本数据 2a1 + 3、 2a2 + 3、 2a3 + 3、2a4 +3、 2a5 + 3的平均数为 2x + 3 = 11;
故答案为:11.
8.为了解某企业员工对习近平新时代中国特色社会主义思想的学习情况,对该企业员工进行问卷调查,已
3
如他们的得分都处在 A,B,C,D 四个区间内,根据调查结果得到下面的统计图.已知该企业男员工占 ,
5
则下列结论中,错误的结论是 .(填序号)
①男、女员工得分在 A 区间的占比相同;
②在各得分区间男员工的人数都多于女员工的人数;
③得分在C 区间的员工最多;
④得分在D区间的员工占总人数的 20%.
【答案】②③④
【分析】先求出员工总数和男员工人数,再求出男女员工再各区间的人数,进而可以判断①正确,②③④
错误.
【解析】根据题意,设员工总人数为 n个,
因为女员工人数为 20 + 60 + 70 + 50 = 200,
200 1 3 2所以 = - = ,解得 n = 500 ,
n 5 5
所以男员工人数为500 - 200 = 300,
20
对于①,女员工得分在 A 区间的占比为 =10%,
200
男员工得分在 A 区间的占比为1- 40% - 35% -15% =10%,
故①正确;
对于②,女员工在 A 区间有 20 人, B 区间有 60 人,
C 区间有 70 人,D区间有 50 人;
男员工在 A 区间有300 10% = 30人,
B 区间有300 40% =120 人,C 区间有300 35% =105人,
D区间有300 15% = 45人;
所以D区间男员工少于女员工,故②错误;
对于③, B 区间有30 +120 =180人,C 区间有70 +105 =175人,
所以 B 区间人数比C 区间多,
故③错误;
对于④,D区间有50 + 45 = 95人,
95
所以得分在D区间的员工占总人数的 =19%,
500
故④错误;
综上:①正确,②③④错误,
故答案为:②③④.
9.已知总体的各个个体的值由小到大依次为3,7,a,b,17,20 ,且总体的中位数为 12,若要使该总体的标准差
最小,则 a= .
【答案】12
【分析】根据中位数的定义可得 a + b = 24 ,再根据标准差的定义分析其取最小值时 a的取值即可.
a + b
【解析】由中位数为 12 可得 =12,
2
所以 a + b = 24 ,
3+ 7 + a + b +12 + 20
所以总体的平均数为 =11,
6
要使该总体的标准差最小,
需要 (a -11)2 + (b -11)2 最小,
而 (a -11)2 + (b -11)2 = (a -11)2 + (24 - a -11)2 = 2(a -12)2 + 2,
所以 a =12时总体的标准差最小.
故答案为:12.
10.节约用水是中华民族的传统美德,某市政府希望在本市试行居民生活用水定额管理,即确定一个合理
的居民月用水量标准 x (吨),用水量不超过 x 的部分按平价收费,超过 x 的部分按议价收费.为此希望已
经学习过统计的小明,来给出建议.为了了解全市居民用水量的分布情况,小明通过随机走访,获得了 100
位居民某年的月均用水量(单位:吨),将数据按照 0,0.5 , 0.5,1 , , 4,4.5 分成 9 组,制成了如图所示的
频率分布直方图.若该市政府希望使85%的居民每月的用水量不超过标准 x (吨),如果你是小明,你觉得 x
的估计值为 (精确到小数点后 1 位)
【答案】2.9
【分析】由频率分布直方图解得 a值,估计85%的居民每月的用水量所在区间后可计算 x 的.
【解析】由频率分布直方图知, 0.16 + a + 0.40 + 0.52 + a + 0.12 + 0.08 + 0.04 0.5 = 1 ,
解得 a = 0.34;
计算月均用水量小于 2.5 吨的居民人数所占的百分比为 0.5 0.16 + 0.34 + 0.40 + 0.52 = 0.71,
即 71%的居民月均用水量小于 2.5 吨;
计算月均用水量小于 3 吨的居民人数所占的百分比为 0.5 0.16 + 0.34 + 0.40 + 0.52 + 0.34 = 0.88,
即 88%的居民月均用水量小于 3 吨;
故 2.5 < x < 3,
0.85 - 0.73x 2.5 0.5假设月均用水量平均分布,则 = + 0.5 = 2.9(吨),
0.3
即85%的居民每月用水量不超过标准为 2.9吨.
故答案为:2.9.
11.湖北省中药材研发中心整合省农业科技创新中心、省创新联盟相关资源和力量,为全省中药材产业链
延链、补链、强链提供科技支撑,某科研机构研究发现,某品种中医药的药物成分甲的含量 x(单位:g 与
药物功效 y(单位:药物单位)之间满足 y =15x - 2x2,检测这种药品一个批次的 6 个样本,得到成分甲的
含量 x 的平均值为 5g,标准差为 5 g,则估计这批中医药的药物功效 y 的平均值为 药物单位.
【答案】15
【分析】设 6 个样本中药物成分甲的含量分别为 x1, x2 , x3 , x4 , x5 , x6 .由成分甲的含量 x 的平均值为 5g,标准差
6 6 6
为 5 g,可得 xi = 30, x2i = 180,又由此可得 yi ,后可得答案.
i =1 i =1 i=1
【解析】设 6 个样本中药物成分甲的含量分别为 x1, x2 , x3 , x4 , x5 , x6 ,
6
因为成分甲的含量的平均值为 5g,所以 xi = 5 6 = 30,
i =1
1 6 1 6 6 6
5 g (x - 5)2 = x2 标准差为 ,所以 i i -10 xi +150÷ = 5 x2,可得 i =180.6 i=1 6 è i=1 i=1 i=1
6 6 6
2
又由 y =15x - 2x2,所以 yi =15 xi - 2 xi = 90,
i=1 i=1 i=1
1 6
所以这批中医药的药物功效的平均值为 yi =15.6 i=1
故答案为:15 .
12.在分层抽样时,如果将总体分为 k 层,第 j 层抽取的样本量为 n j ,第 j 层的样本平均数为 x j ,样本方差
k
为 s2j , j = 1, 2,L , k ,.记 n = n j ,则所有数据的样本方差为 s2 = .
j=1
1 k é 2 2【答案】 n s + x - x ùn jj=1 ê j j ú
1 n j
【分析】在分层抽样中先计算第 层抽取的样本均值 x1 = xn j ,再计算总体 k 层的样本均值j j=1
1 k n k n jx =
n ( x
1
j ),即可得出 x = (n j x j ) ;同理,计算第 j 层抽取的样本方差 (x j - x )2n ,进行一系列整理j=1 j=1 j=1 j=1
k n j k
n 2 2 2 1
é 2 ù 1 2 2
得到 js j + n j (x j - x ) ,再计算总体 k 层的样本方差 s = ê (x j - x ) ú = é n js j + n j (x j - x ) ù ,由此得n j=1 j=1 n j=1
答案.
1 n j n j
【解析】解:Q x j = n x j ,\ x j = n j x j .j j=1 j=1
x 1
k n
( x ) 1
k
∴样本均值为 = j = (n xn n j j ) .j=1 j=1 j=1
1 n j n j2 2 2 2
又Q s j = (x j - xn j ) ,\ (x j - x j ) = n js j .j j=1 j=1
计算总体
n j n j n j n j
\ (x - x )2 = (x - x + x - x )2 = (x - x )2 + 2(x - x ) (x - x 2j j j j j j j j j ) + n j (x j - x ) 又
j=1 j=1 j=1 j=1
n j n j
(x j - x j ) = x j - n j x j = n j x j - n j x j = 0 .
j=1 j=1
n j
\ (x 2 2j - x ) = n js j + n j (x j - x )2 .
j=1
k n j k
\s2 1
é ù
= ê (x 1j - x )2 ú =n n
2 2
én js j + n j (x j - x ) ù .
j=1 j=1 j=1
1 k 2 2
故答案为: n és + x - x ùn jj=1 ê j j ú
【点睛】本题主要考查用分层抽样的方法求样本的均值和方差,属于中档题.
二、单选题
13.现有一组数据不知道其具体个数,只知道该组数据平方后的数据的平均值是 a,该组数据扩大m 倍后的
数据的平均值是b ,则原数据的方差、平方后的数据的方差、扩大m 倍后的数据的方差三个量中,能用 a,b,m
表示的量的个数是( )
A.0 B.1 C.2 D.3
【答案】C
【分析】设出原始数据,逐个计算求解即可.
【解析】设该组数据为 x1, x , x × × × x x
x1 + x2 + ×××+ x,则 = n2 3 n .n
x 2 + x 2 2
所以 a 1 2 + ×××+ x= n
mx1 + mx2 + ×××+ mx, n = mx
b
= b ,所以 x = .
n n m
2 x1 - x
2 + x 2 2 2 2s 2 - x + ×××+ xn - x x1 + x2 + ×××+ x
2
n 2x x1 + x2 + ×××+ x原数据的方差 = = - n 1 + x 2n n n
2 2
= a - 2x 2 + x 2 = a b b- x 2 = a - ÷ = a - ,可以用 a,b,m表示.
è m m2
扩大m 倍后的数据的方差:
2 mx1 - mx
2 + mx 2 2 é2 - mx + ×××+ mxn - mx 2 x1 - x
2 + x2 - x
2 + ×××+ xn - x
2 ù
s2 = = m ê ún ê n ú
2
= m2s 21 = m
2 a b - 2 ÷ = m
2a - b2 ,可以用 a,b,m表示.
è m
平方后的数据的方差:
2 2 2x 2 - a + x 2 - a + ×××+ x 2 - a 4 4 4 2a x 2 + x 2 + ×××+ x 2
s 2 1 2 n x1 + x2 + ×××+ x= = n - 1 2 n3 + a
2
n n n
x 4 + x 41 2 + ×××+ x
4 4 4 4
= n 2a2 a2 x1 + x2 + ×××+ x- + = n - a2 .不能用 a,b,m表示.
n n
故选:C.
14.甲、乙两同学对同一组数据进行分析,甲同学得到的数据均值为 x ,方差为 S 2 ,乙同学不小心丢掉了
一个数据,得到的均值仍为 x ,方差为 2,则下列判断正确的是( )
A. S 2 = 2 B. S 2 > 2
C. S 2 < 2 D. S 2 与 2 的大小关系无法判断
【答案】C
nS 2
【分析】根据题设知丢失的数据为 x ,结合方差公式有 = 2,即可得答案.
n -1
【解析】由题意知,丢失的数据为 x ,才可保证甲乙得到的均值相等,
S 2 1= é x - x 2 2 2结合方差公式 1 + x2 - x +L+ xn - x ù , n 2,n
2
2 nS S 2 2(n -1)所以乙所得方差 S = = 2,即 = < 2 .
n -1 n
故选:C
15.从某中学甲、乙两班各随机抽取 10 名同学,测量他们的身高(单位: cm),所得数据用茎叶图表示如
图,由此可估计甲、乙两班同学的身高情况,则下列结论正确的是( )
A.甲乙两班同学身高的极差相等 B.甲乙两班同学身高的平均值相等
C.甲乙两班同学身高的中位数相等 D.乙班同学身高在175cm 以上的人数较多
【答案】D
【分析】根据茎叶图和极差、平均数、中位数等概念逐一计算,即可判断选项是否正确.
【解析】由茎叶图可知,甲班同学身高的极差为182 -157 = 25,乙班同学身高的极差为183-159 = 24,两
班身高极差不相等,故 A 错误;
1
甲班同学身高的平均值为 (157 +158 +163+165 +166 +170 +172 +178 +181+182) =169.2,
10
1
乙班同学身高的平均值为 (159 +162 +165 +167 +171+172 +176 +178 +181+183) =171.4
10
显然,甲乙两班同学身高的平均值不相等,即 B 错误;
166 +170 171+172
根据茎叶图可知,甲班同学身高的中位数为 =168,乙班同学身高的中位数为 =171.5,
2 2
所以,甲乙两班同学身高的中位数不相等,即 C 错误;
由茎叶图可知,甲班同学身高在175cm 以上的人数为 3 人,乙班同学身高在175cm 以上的人数为 4 人,故 D
正确.
故选;D
16.一组样本数据 x1, x2 , × × ×, xn 的平均数为 x (x 0),标准差为 s .另一组样本数据 xn+1, xn+2,…, x2n 的平均数
为3x ,标准差为 s .两组数据合成一组新数据 x1, x2 , × × ×, xn , xn+1,…, x2n ,新数据的平均数为 y ,标准差为
s ,则( )
A. s > s B. s = s C. s < s D. s 与 s的大小与 n有关
【答案】A
【分析】根据平均数、方差(或标准差)的公式分析运算.
1 n 1 n 2 1 n 2 2
【解析】对于数据 x1, x2 , × × ×, xn ,可得 xi = x, xi - x = xi - nx ÷ = s2,n i=1 n i=1 n è i=1
n n
2 2 2所以 xi = nx, xi = n s + x ;
i=1 i=1
2n 2n 2 2n 2
对于数据 x
1 1
n+1, xn+2,…, x2n ,可得 xi = 3x,n n x - 3x
1
= x2 - n 3x 2i n i ÷ = s ,i=n+1 i=n+1 è i=n+1
2n 2n
2 2 2所以 xi = 3nx, xi = n s + 9x ;
i=n+1 i=n+1
对于数据 x1, x2 , × × ×, xn , xn+1,…, x2n ,可得:
1 2n 1 n 2ny 1平均数 = xi = xi + x i ÷ = nx + 3nx = 2x,2n i=1 2n è i=1 i=n+1 2n
1 2n 2 1 2n 2 n 2n 2
标准差 s = xi - y = x2 - 2ny 1= x2i ÷ i + x2i - 2n 2x 2n i=1 2n è i=1 2n ÷è i=1 i=n+1
1 é 2 2ên s + x 2
2 2
+ n s2 + 9x - 2n 2x ù = s22n ú + x ,
注意到 x 0,所以 2s = s2 + x > s .
故选:A.
三、解答题
17.下面是甲、乙两名运动员在某次男子 10 米气手枪射击选拔赛中的得分数据(单位:环),
甲 9.6 9.9 9.2 9.4 9.9 10.1 10.2 9.7 9.6 9.3 10.0 10.4 10.1 9.9
乙 10.2 10.7 9.7 10.0 9.1 10.0 8.6 9.8 9.6 9.7 10.9 9.5 10.3 9.2
分别计算两名运动员得分的平均数与标准差,并分析比较两名运动员的射击水平.
【答案】答案见解析
【分析】根据平均数和方差的计算公式,结合方差的意义进行分析判断即可.
【解析】设甲、乙两名运动员得分的平均数分别为 x1, x2 ,标准差分别为 s1, s2 ,
x 9.6 + 9.9 + 9.2 + 9.4 + 9.9 +10.1+10.2 + 9.7 + 9.6 + 9.3+10 +10.4 +10.1+ 9.91 = 9.8,14
x 10.2 +10.7 + 9.7 +10 + 9.1+10 + 8.6 + 9.8 + 9.6 + 9.7 +10.9 + 9.5 +10.3 + 9.22 = 9.8,14
9.6 - 9.8 2 + 9.9 - 9.8 2 + 9.2 - 9.8 2 +L+ 9.9 - 9.8 2s1 = 0.34,14
10.2 - 9.8 2 + 10.7 - 9.8 2 + 9.7 - 9.8 2 +L+ 9.2 - 9.8 2s2 = 0.59,14
因为 x1 = x2 , s1 < s2 ,
所以甲运动员比乙运动员射击水平稳定.
18.文明城市是反映城市整体文明水平的综合性荣誉称号,某市为提高市民对文明城市创建的认识,举办
了“创建文明城市”知识竞赛,从所有答卷中随机抽取 100 份作为样本,将样本的成绩(满分 100 分,成绩均
为不低于 40 分的整数)分成六段: 40,50 , 50,60 , × × ×, 90,100 ,得如下图所示的频率分布直方图
(1)求频率分布直方图中 a的值;
(2)若在抽取的 100 份样本中有 20 份样本的数据如下:
44,46,50,52,60,63,66,68,68,72,75,76,79,79,81,82,82,83,90,92
求该组数据(指这 20 分样本构成的数据)的第 75 百分位数;
(3)已知落在 50,60 的平均成绩是 54,方差是 7,落在 60,70 的平均成绩为 66,方差是 4,求这两组成绩的
总平均数和总方差.
【答案】(1) a = 0.030
(2)第 75 百分位数为 81.5
(3)总平均数为 62,总方差为 37
【分析】(1)由频率分布直方图的性质即可求解;
(2)由百分位数的定义求解;
(3)求出成绩在 50,60 及 60,70 的人数,利用总平均数和总方差的公式求解.
【解析】(1)∵每组小矩形的面积之和为 1,
∴ 0.005+0.010 +0.020 + a +0.025+0.010 10 =1,
解得: a = 0.030 .
(2)∵ 20 75% = 15,
81+ 82
∴该组数据的第 75 百分位数为第 15 项与第 16 项数据的平均数,即为 = 81.5 .
2
(3)由图可知,成绩在 50,60 的人数为100 0.1 =10,
成绩在 60,70 的人数为100 0.2 = 20,
z 10 54 + 66 20故这两组成绩的总平均数 = = 62,
10 + 20
s2 1这两组成绩的总方差 = [10 (54 - 62)2 +10 7 + 20 (66 - 62)2 + 20 4] = 37 .
10 + 20
所以这两组成绩的总平均数是 62,总方差是 37.
19.某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行 10 次配对试验,每次配对试验选用材
质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品
的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为 xi , yi i =1,2,L,10 ,记
zi = xi - yi i =1,2,L,10 .试验结果如下:
试验序号 i 1 2 3 4 5 6 7 8 9 10
伸缩率 xi 545 533 551 522 575 544 541 568 596 548
伸缩率 yi 536 527 543 530 560 533 522 550 576 536
(1)求甲工艺处理后的橡胶产品的伸缩率的中位数和极差;
(2)设 z1, z2 ,L, z10的样本平均数为 z,样本方差为 s2 .判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后
s2
的橡胶产品的伸缩率是否有显著提高(如果 z 2 ,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺
10
处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).
【答案】(1)中位数:546.5;极差:74
(2)有显著提高
【分析】(1)根据中位数和极差的定义计算即可;
(2)根据平均数与方差公式计算 z 与 s2 ,计算比较大小即可.
【解析】(1)根据表格将这十次试验中甲工艺处理后的橡胶产品的伸缩率按大小顺序排列,可得中位数为
548 + 545
= 546.5,极差位596 - 522 = 74;
2
(2)由表格可知
序号 i 1 2 3 4 5 6 7 8 9 10
zi = xi - yi 9 6 8 -8 15 11 19 18 20 12
10 10
故 zi = xi - yi =10z = 9 + 6 + 8 + -8 +15 +11+19 +18 + 20 +12 =110 z =11,
i=1 i=1
1 10
2
2 2 9 -11 + 6 -11
2 + 8 -11 2 + -8 -11S z z
2 + 15 -11 2
= i - = +10 i=1 10
11-11 2 + 19 -11 2 + 18 -11 2 + 20 -11 2 + 12 -11 2
= 61,
10
2
所以 2 s = 2 6.1 < 6 < z ,
10
显然有显著提高.
20.某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,
得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值 c,将该指标大于 c 的人判定为阳性,小于或等于 c 的人判
定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为 p(c);误诊率是将未患病者判定为阳
性的概率,记为 q(c).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率 p c = 0.5%时,求临界值 c 和误诊率 q c ;
(2)设函数 f c = p c + q c ,当 c 95,105 时,求 f c 的解析式,并求 f c 在区间 95,105 的最小值.
【答案】(1) c = 97.5, q(c) = 3.5% ;
ì-0.008c + 0.82,95 c 100
(2) f (c) = í
0.01c - 0.98,100 c 105
,最小值为0.02.
<
【分析】(1)根据题意由第一个图可先求出 c,再根据第二个图求出 c 97.5的矩形面积即可解出;
(2)根据题意确定分段点100,即可得出 f c 的解析式,再根据分段函数的最值求法即可解出.
【解析】(1)依题可知,左边图形第一个小矩形的面积为5 0.002 > 0.5%,所以95 < c <100,
所以 c - 95 0.002 = 0.5%,解得: c = 97.5,
q c = 0.01 100 - 97.5 + 5 0.002 = 0.035 = 3.5%.
(2)当 c [95,100]时,
f (c) = p(c) + q(c) = (c - 95) 0.002 + (100 - c) 0.01+ 5 0.002 = -0.008c + 0.82 0.02;
当 c (100,105]时,
f (c) = p(c) + q(c) = 5 0.002 + (c -100) 0.012 + (105 - c) 0.002 = 0.01c - 0.98 > 0.02 ,
ì-0.008c + 0.82,95 c 100
故 f (c) = í
0.01c - 0.98,100
,
< c 105
所以 f c 在区间 95,105 的最小值为0.02.
1 n
21 2 2.(1)设数据 a1, a2,a3,…, a 2n 的均值为 a,方差为s ,请利用已经学过的方差公式:s = (a - a)n ii=1
n
s 2 1= a2
2
来证明方差第二公式: i - a ;n i=1
2 2( )已知 n 2, n N, a1, a2,a3,…, an 的方差为s a ,其中0< a1 < a2 < a3 <×××< an.
b a= 1 + a2 b a, = 2
+ a3 a + a a,…,b = n-1 n ,b = n
+ a1 2 2
1 2 n-1 n ,b1,b2,b3,…,bn 的方差为s b .比较s a 与2 2 2 2
s 2b 大小,并说明理由.
2 2
【答案】(1)证明见解析;(2)s b < s a ,理由见解析.
【分析】(1)利用平均数、方差的定义计算推理作答.
2
(2)利用(1)的结论求出s b ,再作差比较大小作答.
n
【解析】(1)依题意, ai = na,
i=1
n n n n
s 2 1
2 2
所以 = (a 1 1i - a)2 = (a2i - 2aai + a ) = ( a2 - 2a a + na ) ,n i=1 n i=1 n i ii=1 i=1
1 n 2 2 1 n 2 1 n2 2 2= ( ai - 2a × na + na ) = ( ai - na ) = ai - a .n i=1 n i=1 n i=1
2 s 2 < s 2( ) b a ,理由如下:
令数据b1,b2,b3,…,bn 的平均数为b ,
b 1
n
b 1 (a1 + a a
n
= = 2 + 2
+ a3 a3 + a4 L a+ + + n-1 + an an + a+ 1 1则 i ) = a = a ,n i=1 n 2 2 2 2 2 n
i
i=1
1 n n-1s 2
2
b2 b 1 [ (ai + ai+1 )2 (an + a
2 n
1 1 2
2
由( )知, b = i - = + ) ]- a ,而s
2 1= a2
n n 2 2 a n i - a ,i=1 i=1 i=1
1 n-1s 2 s 2 [ (ai + ai+1 )2 (an + a1 )2 ] 1
n 1 n-1 a + a a + a n2 i i+1 2 n 1
因此 b - a = + - ai = [ ( ) + ( )2 - a2 ]n i=1 2 2 n i=1 n i=1 2 2 ii=1
1 n-1 a 2 2 2 2
= { [( i + ai+1 )2 ai + ai+1 ] (an + a1 )2 an + a- + - 1 },n i=1 2 2 2 2
2
1 i n -1, i N* a < a (ai + ai+1 )2 ai + a
2
当 时, , - i+1
ai - ai+1 2
i i+1 = -( ) < 0,2 2 2
n-1 a + a a2 + a2 2 2
即 [( i i+1 )2 - i i+1 ] < 0 a,又 ( n + a1 )2 an + a- 1 a - a= -( n 1 )2 < 0,
i=1 2 2 2 2 2
1 n-1 a 2 2 2 2
于是 { [( i + ai+1 )2 ai + ai+1 ] (an + a1 )2 an + a- + - 1 } < 0,即s 2b -s 2 < 0 ,n ai=1 2 2 2 2
s 2 2所以 b < s a .