9.2 用样本估计总体
9.2.1 总体取值规律的估计(1)
一、 单项选择题
1. (2023安阳高一期末)为了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到的频率分布直方图如图所示.由于不慎将部分数据丢失,但知道后5组的频数和为64,最大频率为0.34.设视力在4.6到4.8之间的学生人数为a,则a的值为( )
A. 27 B. 48
C. 54 D. 64
2. 从一堆苹果中任取10个,称得它们的质量如下(单位:g):125,120,122,105,130,114,116,95,120,134,则样本数据落在[114.5,124.5)内的频率为( )
A. 0.2 B. 0.3
C. 0.4 D. 0.5
3. 某市通过统计50个大型社区产生的日均垃圾量,绘制了如图所示的频率分布直方图,数据的分组依次为[4,6),[6,8),[8,10),[10,12),[12,14),[14,16),[16,18).为了鼓励率先实施垃圾分类回收,将日均垃圾量不少于14 t的社区划定为试点社区,则这样的试点社区个数是( )
A. 4 B. 10 C. 19 D. 40
4. (2023徐州高一阶段练习)为了解我校今年报考飞行员的学生的体重情况.将所得的数据整理后,作出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第1小组的频数为4,则我校报考飞行员的学生总人数是( )
A. 40 B. 32 C. 28 D. 24
5. 已知某学校高一年级共有1 000名学生,如图是该校高一年级学生某次体育测试成绩的频率分布直方图,则估计排名第200名的学生的体育测试成绩为( )
A. 89分 B. 88分 C. 87分 D. 86分
6. 在样本的频率分布直方图中,共有9个小长方形,若中间一个长方形的面积等于其他8个小长方形面积的和的,且样本容量为200,则中间一组的频数为( )
A. 0.2 A. 0.25
C. 40 D. 50
二、 多项选择题
7. (2023全国高一专题练习)供电部门对某社区1 000位居民12月份的人均用电情况进行统计后,按人均用电量分为[0,10),[10,20),[20,30),[30,40),[40,50]五组,整理得到如下的频率分布直方图,则下列说法中正确的是( )
A. 12月份人均用电量人数最多的一组有400人
B. 12月份人均用电量在[20,30)内的有300人
C. 12月份人均用电量不低于20 kW·h的有500人
D. 在这1 000位居民中任选1位协助收费,选到的居民用电量在[30,40)一组的概率为
8. 统计某校n名学生的某次数学同步练习成绩(满分150分),根据成绩进行分组(每组为左闭右开的区间),画出的频率分布直方图如图所示.若不低于140分的人数为110,则下列说法中正确的是( )
A. m=0.031
B. n=800
C. 100分以下的人数为60
D. 成绩在区间[120,140)内的人数占大半
三、 填空题
9. (2023绍兴高二期末)某班共有学生40人,将一次数学考试的成绩(单位:分)绘制成如图所示的频率分布直方图,则成绩不低于85分的人数为________.
10. 某企业为了解下属某部门对本企业职工的服务情况,随机调查50名职工,根据这50名职工对该部门的评分,得到的频率分布直方图如图所示,其中样本数据分组区间为[40,50),[50,60),…,[80,90),[90,100],则频率分布直方图中a的值为________.
11. 在样本的频率分布直方图中共有n个小矩形,若中间一个小矩形的面积等于其余(n-1)个小矩形面积之和的,且样本量为3 200,则中间一组的频数为________.
12. (2023福建统考)敬骅小区共有100名住户,该小区用电量(kW·h)的频率分布表如表所示,则用电量在(200,250]的户数为________.
用电量 频率/组距
[0,50] 0
(50,100] 0.002 4
(100,150] 0.003 6
(150,200] 0.005 6
(200,250] 0.004 2
(250,300] 0.003 0
(300,350] 0.001 2
四、 解答题
13. 伴随着科技的迅速发展,国民对“5G”一词越来越熟悉,“5G”全称是第五代移动电话行动通信标准,也称第五代移动通信技术.2017年12月10日,工信部正式对外公布,已向中国电信、中国移动、中国联通发放了5G系统中低频率使用许可.2019年2月18日上海虹桥火车站正式启动5G网络建设.为了了解某市市民对“5G”的关注情况,通过问卷调查等方式对该市300万15~45岁的人口进行统计分析,数据分析结果显示:约60%的市民“掌握一定5G知识(即问卷调查分数在80分以上)”,将这部分市民称为“5G爱好者”.某机构在“5G爱好者”中随机抽取了100人按照年龄分布(如图),其分组区间为[15,20],(20,25],(25,30],(30,35],(35,40],(40,45].
(1) 求频率分布直方图中的a的值;
(2) 估计全市居民中35~45岁的“5G爱好者”的人数;
(3) 若该市政府制定政策:在15~45岁的“5G爱好者”中,按照年龄从小到大,选拔45%的“5G爱好者”进行5G的专业知识深度培养,将当选者称为“5G达人”,按照上述政策及频率分布直方图,估计该市“5G达人”的年龄上限.
14. 某中学有高一年级学生600人,高二年级学生400人参加知识竞赛,现用分层随机抽样的方法从中抽取100名学生,对其成绩进行统计分析,得到如下图所示的频率分布直方图.
(1) 求从该校高一年级、高二年级学生中各抽取的人数;
(2) 根据频率分布直方图,估计该校这1 000名学生中竞赛成绩在60分(含60分)以上的人数.
【答案解析】
9.2 用样本估计总体
9.2.1 总体取值规律的估计(1)
1. C 解析:前两组的频数为100×(0.05+0.11)=16,因为后五组的频数和为64,所以前三组的频数和为36,所以第三组的频数为36-16=20,又最大频率为0.34,故第四组的频数为0.34×100=34,所以a=20+34=54.
2. C 解析:这10个数据中,落在[114.5,124.5)内的有120,122,116,120,共4个,所以样本数据落在[114.5,124.5)内的频率为=0.4.
3. B 解析:日均垃圾量不少于14 t的组为[14,16)和[16,18),频率和为(0.06+0.04)×2=0.20,则试点社区的个数为50×0.20=10.
4. B 解析:由图可知后两个组的频率为(0.013+0.037)×5=0.25,从左到右的前3个小组的频率之比为1∶2∶3,所以第1小组的频率为(1-0.25)×=0.125,第1小组的频数为4,所以报考飞行员的学生人数是4÷0.125=32.
5. B 解析:由题意,得=0.2,[90,95)的频率为0.02×5=0.1,[85,90)的频率为0.05×5=0.25,则第200名在[85,90)中,设分数为x,[x,90)的频率为0.2-0.1=0.1,所以=,所以x=88.
6. D 解析:设中间一组的频率为x,则其他8组的频率为1-x.由题意知x=(1-x),解得x=,所以中间一组的频数为×200=50.
7. ABC 解析:根据频率分布直方图知,12月份人均用电量人数最多的一组是[10,20),有1 000×0.04×10=400(人),故A正确;12月份人均用电量在[20,30)内的人数为1 000×0.03×10=300,故B正确;12月份人均用电量不低于20 kW·h的频率是(0.03+0.01+0.01)×10=0.5,有1 000×0.5=500(人),故C正确;用电量在[30,40)内的有0.01×10×1 000=100(人),所以1 000位居民中任选1位,选到的居民用电量在[30,40)一组的概率为=,故D错误.故选ABC.
8. AC 解析:对于A,由图可知,10×(m+0.020+0.016+0.016+0.011+0.006)=1,解得m=0.031,故A正确;对于B,因为不低于140分的频率为0.011×10=0.11,所以n==1 000,故B错误;对于C,因为100分以下的频率为0.006×10=0.06,所以100分以下的人数为1 000×0.06=60,故C正确;对于D,成绩在区间[120,140)内的频率为0.031×10+0.016×10=0.47<0.5,人数占小半,故D错误.故选AC.
9. 9 解析:由频率分布直方图的频率和为1,可得0.005×10+0.022 5×10+a×10+0.035 0×10+0.007 5×10=1,解得a=0.030,所以成绩不低于85分的人数的频率为×10+0.007 5×10=0.225,故成绩不低于85分的人数为0.225×40=9.
10. 0.006 解析:由频率分布直方图可得(0.004+a+0.018+0.022×2+0.028)×10=1,解得a=0.006.
11. 400 解析:设中间一个小矩形的面积是x,则其余(n-1)个小矩形的面积之和为7x.因为x+7x=1,所以x=.因为样本量为3 200,所以中间一组的频数是3 200×=400.
12. 21 解析:由频率分布表可知,用电量在(200,250]的户数为0.004 2×50×100=21.
13. (1) 依题意,得(0.014+0.04+0.06+a+0.02+0.016)×5=1,解得a=0.05.
(2) 根据题意,得全市15~45岁的“5G爱好者”约有300×60%=180 (万人).
由样本频率分布直方图可知,35~45岁的“5G爱好者”的频率为(0.02+0.016)×5=0.18,
据此可估计全市35~45岁的“5G爱好者”约有180×0.18=32.4(万人).
(3) 样本频率分布直方图中前2组的频率之和为(0.014+0.04)×5=0.27<45%,
前3组频率之和为(0.014+0.04+0.06)×5=0.57>45%,
所以年龄上限在25~30岁之间.
不妨设年龄上限为m岁,
由0.27+(m-25)×0.06=0.45,
解得m=28,
所以估计该市“5G达人”的年龄上限为28岁.
14. (1) 由题意可得,从高一年级学生中抽取100×=60(人),从高二年级学生中抽取100×=40(人).
(2) 由频率分布直方图可得竞赛成绩在60分(含60分)以上的频率为(0.015+0.03+0.025+0.005)×10=0.75,
所以估计该校这1 000名学生中竞赛成绩在60分(含60分)以上的人数为1 000×0.75=750.9.2.1 总体取值规律的估计(2)
一、 单项选择题
1. (2023广西高一期末)已知某地A,B,C三个村的人口户数及贫困情况分别如图1和图2所示,当地政府为巩固拓展脱贫攻坚成果,全面推进乡村振兴,决定采用分层随机抽样的方法抽取20%的户数进行调查,则样本量和抽取C村贫困户的户数分别是( )
A. 150,15 B. 150,20
C. 200,15 D. 200,20
2. 如图是某超市2023年一月份至五月份的营业额与成本数据的折线图,根据该折线图,下列说法中正确的是( )
A. 该超市2023年的前五个月中三月份的利润最高
B. 该超市2023年的前五个月的利润一直呈增长趋势
C. 该超市2023年的前五个月的利润的中位数为0.8万元
D. 该超市2023年前五个月的总利润为3.5万元
3. 如图是某班级的一次考试成绩(得分均为整数)的频数分布直方图(每组包含最小值,不包含最大值),则下列说法中错误的是( )
A. 得分在70~79分的人最多
B. 该班的总人数为40
C. 人数最少的分数段的频数为2
D. 得分及格(大于或等于60分)有12人
4. (2023凉山州高一期末)当今世界面临着百年未有之大变局,中美关系健康稳定发展对维护世界和平、经济复苏等起到积极作用,如图为2007~2022年中国和美国自对方国家的进口额占本国总进口额的比重变化情况图,则下列结论中正确的是( )
A. 从2007年到2022年,中国对美国的出口占比相对较高,中国对美国的出口占美国总进口额的比例一直保持在15%以上
B. 从2007年到2022年,中国自美国的进口额占中国总进口额的比例出现了大幅波动,在2015年,这一比例达到峰值,但在2019年和2021年时分别下降至最低点
C. 美国自中国的进口额占比逐年下降,2018年后美国自中国进口额的比例下降速度加快
D. 中国市场对美国的依赖度正在降低,从长期趋势来看,中国自美国进口额的比例在2015年达到峰值后总体上呈下降趋势 5. 某市2022年12月17日至21日期间空气质量呈现重度及以上污染水平,经市政府批准,该市启动了空气重污染红色预警,期间实行机动车“单双号”限行等措施.某报社会调查中心联合问卷网,对2 400人进行问卷调查,根据调查结果得到的扇形图如图所示,则下列结论中不正确的是( )
A. “不支持”部分所占的比例大约是整体的
B. “一般”部分所占的人数估计是800
C. 扇形图中如果圆的半径为2,则“非常支持”部分扇形的面积是
D. “支持”部分所占的人数估计是1 100
6. 疫情防控期间,我国的三大产业均受到不同程度的影响,其中第三产业中的各个行业都面临着很大的营收压力.2020年7月国家统计局发布了我国上半年国内经济数据,如图所示.图1为国内三大产业比重,图2为第三产业中各行业比重.
下列关于我国2020年上半年经济数据的说法中正确的是( )
A. 第一产业的生产总值与第三产业中“租赁和商务服务业”的生产总值基本持平
B. 第一产业的生产总值超过第三产业中“房地产业”的生产总值
C. 若“住宿和餐饮业”生产总值为7 500亿元,则“金融业”生产总值为32 500亿元
D. 若“金融业”生产总值为41 040亿元,则第二产业生产总值为166 500亿元
二、 多项选择题
7. (2023商丘第一高级中学高一联考)小张于2017年底贷款购置了一套房子,根据家庭收入情况,小张选择了10年期的等额本息的还贷方式(每月还款数额相等),2021年底贷款购置了一辆小汽车,且截至2022年底,他没有再购买第二套房子.如图是2018年和2022年小张的家庭的各项支出占家庭收入的比例分配图.根据以上信息,下列结论中正确的是( )
A. 小张一家2022年的家庭收入比2018年增加了1倍
B. 小张一家2022年的娱乐支出费用为2018年的5倍
C. 小张一家2022年的饮食支出费用低于2018年
D. 小张一家2022年的车贷支出费用小于2018年的饮食支出费用
8. (2023长春第五中学高一期末)某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得到如下的统计图表,则下列结论中正确的是( )
A. 丁险种的参保人数超过五成
B. 41岁以上的参保人数超过总参保人数的五成
C. 18~29岁人群参保的总费用最少
D. 人均参保费用不超过5 000元
三、 填空题
9. (2023六盘山高级中学高一阶段练习)为了解某企业员工对习近平新时代中国特色社会主义思想的学习情况,对该企业员工进行问卷调查,已知他们的得分都处在A,B,C,D四个区间内,根据调查结果得到如下的统计图.已知该企业男员工占,则下列结论中错误的结论是________.(填序号)
①男、女员工得分在A区间的占比相同;
②在各得分区间男员工的人数都多于女员工的人数;
③得分在C区间的员工最多;
④得分在D区间的员工占总人数的20%.
10. 某单位200名职工的年龄分布情况如图所示,现要从中抽取50名职工作样本,若采用分层随机抽样方法,则40~50岁年龄段应抽取________人.
11. 某位教师2017年的家庭总收入为 80 000 元,各种用途占比统计如图1所示,2018年家庭总收入的各种用途占比统计如图2所示.已知2018年的就医费用比2017年的就医费用增加了4 750元,则该教师2018年的旅行费用为________元.
图1
图2
12. 某商场一年中各月份的收入、支出情况的统计如图所示,则下列说法中正确的是________.(填序号)
①支出最高值与支出最低值的比是6∶1;
②第三季度月平均收入为50万元;
③利润最高的月份是2月份.
四、 解答题
13. 某校为了解2023年高一年级学生的课外书籍借阅情况,从中随机抽取调查了40名学生的课外书籍借阅情况,由统计结果列出如下的表格,并绘制成如图所示的扇形统计图,其中科普类书籍的册数占这40名学生借阅总册数的40%.
类别 科普类 教辅类 文艺类 其他
册数 128 m 80 48
(1) 求表格中字母m的值及扇形统计图中“教辅类”所对应的圆心角α的大小;
(2) 若该校2023年高一年级有500名学生,请你估计该年级学生共借阅教辅类书籍约多少册?
14. 某省有关部门号召各中小学要把“每天锻炼一小时”写入课程表,为了响应这一号召,某校围绕着“你最喜欢的体育活动项目是什么?(只写一项)”这一问题,对在校学生进行了随机抽样调查,从而得到一组数据.图1是根据这组数据绘制的条形统计图.请结合统计图回答下列问题:
(1) 该校对多少名学生进行了抽样调查?
(2) 本次抽样调查中,最喜欢篮球活动的有多少人?占被调查人数的百分比是多少?
(3) 若该校九年级共有200名学生,图2是根据各年级学生人数占全校学生总人数的百分比绘制的扇形统计图,请你估计全校学生中最喜欢跳绳活动的人数约为多少?
【答案解析】
9.2.1 总体取值规律的估计(2)
1. D 解析:由图可知样本量为(350+200+450)×20%=1 000×20%=200,C村抽取的户数为×200=40,则抽取C村贫困户的户数为40×0.5=20.
2. D 解析:由折线图可知,前五个月的利润分别为0.5万元、0.7万元、0.8万元、0.5万元、1万元.利润最高的为五月份,故A错误;四月份利润比三月份利润低,不是一直呈增长趋势,故B错误;前五个月的利润按照从小到大的顺序排列后,可知中位数为0.7万元,故C错误;前五个月的总利润为0.5+0.7+0.8+0.5+1=3.5(万元),故D正确.
3. D 解析:对于A,得分在70~79分的人数最多,故A正确;对于B,该班的总人数为40,故B正确;对于C,人数最少的分数段的频数为2,故C正确;对于D,得分及格(≥60分)的有12+14+8+2=36(人),故D错误.
4. D 解析:从2007年到2022年,中国对美国的出口占比相对较高,中国对美国的出口占美国总进口额的比例,2008年为15%,2022年为14.2%,故A错误;从2007年到2022年,中国自美国的进口额占中国总进口额的比例,在2022年时下降至最低点6.5%,故B错误; 美国自中国进口额的比例,2019年为16.3%,2020年为16.5%,故C错误;中国市场对美国的依赖度正在降低,从长期趋势来看,中国自美国进口额的比例在2015年达到峰值后总体上呈下降趋势,故D正确.
5. B 解析:对于A,“不支持”部分所占角度为2π---=,所以比例大约是整体的=,故A正确;对于B,“一般”部分所占比例为=,所以占的人数估计是2 400×=400,故B不正确;对于C,“非常支持”部分所占比例为=,所以面积是×π×22=,故C正确;对于D,“支持”部分所占比例为=,人数为×2 400=1 100,故D正确.
6. D 解析:对于A,57%×6%=3.42%<6%,故A错误;对于B,57%×13%=7.41%>6%,故B错误; 对于C,×16%=40 000(亿元),故C错误;对于D,根据题意,第二产业生产总值为×37%=166 500(亿元),故D正确.
7. AD 解析:对于A,设一年的房贷支出费用为n,则2018年的收入为=,2022年的收入为=,比2018年增加了一倍,故A正确;对于B,2018年的娱乐支出费用为×=,2022年的娱乐支出费用为×=,相当于2018年的10倍,故B错误;对于C,2022年的饮食费用支出为×=,2018年的饮食费用支出为×=,显然2022年高,故C错误;对于D,2022年的车贷支出费用为×=,2018年的饮食支出费用为,所以2022年的车贷支出费用小于2018年的饮食支出费用,故D正确.故选AD.
8. ACD 解析:由参保险种比例图可知,丁险种的参保人数比例为1-0.02-0.04-0.1-0.3=0.54,故A正确;由参保人数比例图可知,41岁以上的参保人数占总参保人数的45%,不到五成,故B错误;由不同年龄段的人均参保费用图及参保人数比例图可知,18~29岁人群参保的总费用最少,故C正确;由不同年龄段的人均参保费用图及参保人数比例图可知,人均参保费用不超过5 000元,故D正确.故选ACD.
9. ②③④ 解析:根据题意,设员工总人数为n,因为女员工人数为20+60+70+50=200,所以=1-=,解得n=500,所以男员工人数为500-200=300.对于①,女员工得分在A区间的占比为=10%,男员工得分在A区间的占比为1-40%-35%-15%=10%,故①正确;对于②,女员工得分在A区间的有20人,B区间的有60人,C区间的有70人,D区间的有50人,男员工得分在A区间的有300×10%=30(人),B区间的有300×40%=120(人),C区间的有300×35%=105(人),D区间的有300×15%=45(人),所以得分在D区间的男员工人数少于女员工人数,故②错误;对于③,得分在B区间的有60+120=180(人),C区间的有70+105=175(人),所以得分在B区间的人数比C区间的多,故③错误;对于④,得分在D区间的有50+45=95(人),所以得分在D区间的员工占总人数的×100%=19%,故④错误.
10. 15 解析:现要从中抽取50名职工作样本,采用分层随机抽样方法,则40~50岁年龄段应抽取50×30%=15(人).
11. 29 750 解析:由题意可知,2017年的就医费用为80 000×10%=8 000(元),则2018年的就医费用为8 000+4 750=12 750(元),2018年的旅行费用为×35%=29 750(元).
12. ①② 解析:对于①,支出最高值是2月份的60万元,支出最低值是5月份的10万元,故支出最高值与支出最低值的比是6∶1,故①正确;对于②,第三季度的7,8,9月的收入分别为40万元,50万元,60万元,故第三季度的月平均收入为=50(万元),故②正确;对于③,利润最高的月份是3月份和10月份,都是30万元,高于2月份的利润20万元,故③错误.
13. (1) 观察统计图表可知,科普类有128册,占40%,
所以借阅总册数为128÷40%=320,
所以m=320-128-80-48=64,
教辅类所对应的圆心角α=360°×=72°.
(2) 设高一年级500名学生借阅教辅类书籍x册.
根据题意得=,解得x=800,
所以估计高一年级500名学生共借阅教辅类书籍800册.
14. (1) 由题意,得4+8+10+18+10=50(名),即该校对50名学生进行了抽样调查.
(2) 本次调查中,最喜欢篮球活动的有18人,×100%=36%,
即最喜欢篮球活动的人数占被调查人数的36%.
(3)1-(30%+26%+24%)=20%,200÷20%=1 000(名),×1 000=160(名),
即估计全校学生中最喜欢跳绳活动的人数约为160.9.2.2 总体百分位数的估计
一、 单项选择题
1. (2023黑龙江联考)某中学举办以“喜迎二十大、永远跟党走、奋进新征程”为主题的演讲比赛,其中9人的比赛成绩依次为:83,85,87,87,88,88,91,93,97(单位:分),则这9人成绩的第80百分位数是( )
A. 87 B. 91 C. 93 D. 95
2. (2023广西高一期末)某市为了了解该市“全民健身运动”的开展情况,从全体市民中随机调查了100位市民每天的健身运动时间(健身运动时间是考查“全民健身运动”情况的重要指标),所得数据都在区间[5,40](单位:min)内,其频率分布直方图如图所示,估计市民健身运动时间的样本数据的第70百分位数是( )
A. 29 min B. 27 min C. 29.5 min D. 30.5 min
3. 高一年级共有1 000名学生参加物理测试,若所有学生成绩(单位:分)的第80百分位数是75,则物理成绩大于或等于75分的学生数至少为( )
A. 200 B. 220 C. 240 D. 260
4. 已知甲、乙两组数据(已按从小到大的顺序排列):甲组:27,28,39,40,m,50;乙组:24,n,34,43,48,52.若这两组数据的第30百分位数、第80百分位数分别相等,则等于( )
A. B. C. D.
5. “幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高.现随机抽取10位居民,他们的幸福感指数为 3,4,5,5,6,7,7,8,9,10,则这组数据的第80百分位数是( )
A. 7.5 B. 8 C. 8.5 D. 9
6. 从某校高一新生中随机抽取一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,x,174,175.若样本数据的第90百分位数是173,则x的值为( )
A. 171 B. 172 C. 173 D. 174
二、 多项选择题
7. 对于考试成绩的统计,若你的成绩处在第95百分位数上,则下列说法中错误的是( )
A. 你得了95分
B. 你答对了95% 的试题
C. 95% 的参加考试者得到了和你一样或比你还要低的分数
D. 你排在第95名
8. (2022·威海期末)某班有n名学生,他们都参加了某次复习检测考试,第i个学生的某科成绩记为Xi(i=1,2,3,…,n),设Pi=该科成绩不超过Xi的该班人数÷n,定义Pi为第i个学生的该科成绩的百分位.现对该班的甲、乙两名同学的该次检测成绩作对比分析,若甲、乙两名同学的各科成绩的百分位如图所示,则下列说法中正确的是( )
A. 甲同学的语文、数学、英语、综合的总分高于乙同学
B. 甲同学的语文、数学、英语成绩都好于乙同学
C. 甲同学的各科成绩都居该班上游(百分位大于66%)
D. 乙同学的语文分数不一定比数学分数高
三、 填空题
9. 一组数1,2,4,5,6,6,7,8,9的75%分位数为________.
10. 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:h)的数据,整理并绘制出如下的频数分布表:
分组 [0,2) [2,4) [4,6) [6,8) [8,10) [10,12) [12,14) [14,16) [16,18] 合计
频数 6 8 17 22 25 12 6 2 2 100
估计本校学生的一周课外阅读时间的第80百分位数为________.(精确到0.1)
11. 河北省九大高峰按照海拔(单位:m)排名依次为小五台山(2 882)、驼梁山(2 281)、雾灵山(2 118)、长城岭(2 100)、白石山(2 096)、野三坡(1 983)、祖山(1 428)、天桂山(1 270)、狼牙山(1 105),则这九大高峰的海拔数据的第70百分位数为________.
12. 小明班上有15名女生,其身高(单位:cm)的第一四分位数为155,后来转走了一位身高为165 cm的女生,则班上女生身高的第一四分位数________.(填“变大”“变小”或“不变”)
四、 解答题
13. 为了有效抗击疫情,保卫师生健康,某校鼓励学生在食堂就餐.为了更好地服务学生,提升食堂的服务水平,学校采用了问卷调查的形式调研了学生对食堂服务的满意程度,满分是100分,将问卷回收并整理评分数据后,把得分分成了5组:[50,60),[60,70),[70,80),[80,90),[90,100],并绘制成如图所示的频率分布直方图.
(1) 计算a的值和样本的平均分;
(2) 为了更全面地了解师生对食堂服务水平的评价,求该样本的第50百分位数(精确到0.01).
14. 为了解学生一周的课外学习时间(单位:h),高一年级某班班主任对本班40名学生某周的课外学习时间进行了调查,将所得数据整理绘制出如图所示的频率分布直方图,根据直方图所提供的信息:
(1) 求该班学生一周的课外学习时间不少于20 h的人数;
(2) 估计这40名同学一周的课外学习时间的25%分位数;
(3) 如果用该班学生一周的课外学习时间作为样本去推断该校高一年级全体学生一周的课外学习时间,这样推断是否合理?说明理由.
【答案解析】
9.2.2 总体百分位数的估计
1. C 解析:因为9×80%=7.2,所以这9人成绩的第80百分位数是第8个数,即为93.
2. B 解析:健身运动时间在30 min以下的频率为(0.01+0.01+0.04+0.06+0.05)×5=0.85,在25 min以下的频率为0.85-0.05×5=0.6,所以70百分位数位于区间[25,30)内.由25+5×=27,可以估计健身运动时间的样本数据的第70百分位数是27 min.
3. A 解析:由题意,得大于或等于75分的学生至少有1 000×(1-80%)=200(人).
4. A 解析:因为×6=1.8,×6=4.8,所以乙组的第30百分位数为n=28,甲组的第80百分位数为m=48,所以==.
5. C 解析:因为10×80%=8,所以第80百分位数是第8个数和第9个数的平均数8.5.
6. B 解析:因为20×90%=18,所以第90百分位数是第18项和第19项数据的平均数,即(x+174)=173,所以x=172.
7. ABD 解析:第95百分位数是指将数据从小到大排序,至少有95%的数据小于或等于这个数.故选ABD.
8. BCD 解析:对于A,甲同学的综合得分低于乙同学,所以甲同学的语文、数学、英语、综合的总分不一定高于乙同学,故A错误;对于B,甲同学的语文、数学、英语成绩都好于乙同学,故B正确;对于C,甲同学的各科成绩百分位均超过66%,所以甲同学的各科成绩都居该班的上游,故C正确;对于D,乙同学的语文分数不一定比数学分数高,故D正确.故选BCD.
9. 7 解析:因为9×0.75=6.75,所以75%分位数为第7个数7.
10. 10.3 解析:因为前5组的频率之和为0.78,前6组的频率之和为0.9,所以第80百分位数为10+2×≈10.3,据此可估计本校学生的一周课外阅读时间的第80百分位数为10.3.
11. 2 118 解析:将这九大高峰的海拔数据按照从小到大的顺序排列,依次为1 105,1 270,1 428,1 983,2 096,2 100,2 118,2 281,2 882,因为70%×9=6.3,所以第70百分位数为第7项数据,即2 118.
12. 不变 解析:当班上有15人时,由15×25%=3.75,知身高的第一四分位数为第4项数据.当转走1人,剩下14人时,由14×25%=3.5,知身高的第一四分位数为第4项数据,所以班上女生身高的第一四分位数不变.
13. (1) 由直方图,得(0.055+0.02+0.015+2a)×10=1,解得a=0.005,
样本平均分为(55×0.005+65×0.055+75×0.02+85×0.015+95×0.005)×10=71(分).
(2) 由(0.005+0.055)×10=0.6>0.5>0.005×10=0.05,
所以第50百分位数在区间[60,70)内,设为x,
则0.005×10+(x-60)×0.055=0.5,
解得x≈68.18.
故该样本的第50百分位数约为68.18分.
14. (1) 由图可知,该班学生一周的课外学习时间不少于20 h的频率为(0.03+0.015)×5=0.225,
则40名学生中一周的课外学习时间不少于20 h的人数为40×0.225=9.
(2) 学习时间在5 h以下的频率为0.02×5=0.1<0.25,
学习时间在10 h以下的频率为0.1+0.04×5=0.3>0.25,
所以25%分位数在(5,10)内,
所以25%分位数为5+5×=8.75,
则这40名同学一周的课外学习时间的25%分位数为8.75.
(3) 不合理,样本的选取只选在高一某班,不具有代表性.9.2.3 总体集中趋势的估计
一、 单项选择题
1. (2023东莞高一期末)平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.下面四幅频率分布直方图中,最能说明平均数大于中位数的是( )
2. 2023年“五一”期间,各大网站纷纷推出各种“优惠券”.在此期间,小明同学对本小区某居民楼的20名住户在假期期间抢得“优惠券”的数量进行调查得到如下表格:
抢得“优惠券”数量(张) [5,15) [15,25) [25,35) [35,45]
人数 2 7 8 3
则该小区50名住户在2023年“五一”期间抢得的“优惠券”的张数约为( )
A. 30 B. 1 500 C. 26 D. 1 300
3. (2023芜湖高一期末)PM 2.5是衡量空气质量的重要指标,下图是某地6月1日至10日的PM 2.5日均值(单位:μg/m3)的折线图,则下列关于这10天PM 2.5日均值的说法中错误的是( )
A. 众数为30 B. 中位数为31.5
C. 平均数小于中位数 D. 极差为109
4. 某班进行了一次数学测试,全班学生的成绩都落在区间[50,100]内,其成绩的频率分布直方图如图所示,则该班学生这次数学测试成绩的中位数的估计值为( )
A. 81.5 B. 82 C. 81.25 D. 82.5
5. 某学习小组在一次数学测验中,成绩为100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各1人,则该小组数学成绩的平均数、众数、中位数分别为( )
A. 85,85,85 B. 87,85,86 C. 87,85,85 D. 87,85,90
6. 下面是某实验中学某班第一小组5位同学的立定跳远、跳绳、800米跑的成绩折线图,则这5位同学立定跳远的中位数,跳绳的平均数,800米跑的众数分别是( )
A. 1.98,131,3.88 B. 1.87,130,3.88
C. 1.98,130,3.88 D. 1.98,130,3.65
二、 多项选择题
7. (2022咸宁期末)近年,随着人工智能,AIoT,云计算等技术的推动,全球数据量正在无限制地扩展和增加.国际数据公司IDC统计了2016~2020年全球每年产生的数据量及其增速,所得结果如图所示,根据该统计图,下列说法中正确的是( )
A. 2016~2020年,全球每年产生的数据量在持续增加
B. 2016~2020年,全球数据量的年平均增长率持续下降
C. 2016~2020年,全球每年产生的数据量的平均数为33.7
D. 2015年,全球产生的数据量超过15 ZB
8. (2023南通期中)某学校共有2 000名男生,为了了解这部分学生的身体发育情况,学校抽查了100名男生的体重情况.根据所得数据绘制样本的频率分布直方图如图所示,则下列结论中正确的是( )
A. 样本的众数为67.5
B. 样本的第80百分位数为72.5
C. 样本的平均值为66
D. 该校男生中低于60 kg的学生大约有300人
三、 填空题
9. 设一组样本数据x1,x2,…,xn的平均数是3,则数据2x1+1,2x2+1,…,2xn+1的平均数为________.
10. (2023合肥一中高一期末)对某中学高一年级学生身高(单位:cm)的调查中,采用分层随机抽样的方法,抽取了男生23人,其身高的平均数为170.6,抽取了女生27人,其身高的平均数为160.6,则可估计高一年级全体学生身高的平均数为________.
11. 上海市普通高中学业水平等级考试成绩共分为五等十一级,各等级换算成分数如下表所示:
等级 A+ A B+ B B- C+ C C- D+ D E
分数 70 67 64 61 58 55 52 49 46 43 40
上海某高中2021届高三(1)班选考物理学业水平等级考试的学生中,有5人取得A+,其他人的成绩至少是B级及以上,平均分是64分,这个班级选考物理学业水平等级考试的人数至少为________.
12. 某学校开展“五四”知识竞赛活动,共有三个问题,其中第1,2题满分都是15分,第3题满分是20分. 每个问题要么得满分,要么得0分.活动结果显示,每个参赛选手至少答对一道题,有6名选手只答对其中一道题,有12名选手只答对其中两道题.答对第1题的人数与答对第2题的人数之和为26,答对第1题的人数与答对第3题的人数之和为24,答对第2题的人数与答对第3题的人数之和为22,则参赛选手中三道题全答对的人数是________,所有参赛选手的平均分是________分.
四、 解答题
13. (2023哈尔滨第四中学高一期末)某学校有学生1 000人,为了解学生对本校食堂服务的满意程度,随机抽取了100名学生对本校食堂服务的满意程度打分,根据这100名学生的打分,绘制了如图所示的频率分布直方图,其中样本数据的分组为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].
(1) 求频率分布直方图中a的值,并估计该校学生满意度打分不低于70分的人数;
(2) 试估计该校学生满意度打分的众数、中位数(中位数保留小数点后2位);
(3) 若采用分层随机抽样的方法,从打分在[40,60)的学生中随机抽取10人了解情况,求在打分[40,50),[50,60)中分别抽取的人数.
14. BMI(身体质量指数)是目前国际上常用的衡量人体胖瘦程度以及是否健康的一个标准,其计算公式是:BMI=.在我国,成人的BMI数值参考标准为:BMI<18.5为偏瘦;18.5≤BMI<24为正常;24≤BMI<28为偏胖;BMI≥28为肥胖.某大学为了解学生的身体肥胖情况,研究人员从学校的学生体检数据中,采用比例分配的分层随机抽样的方法抽取了60名男学生,40名女学生的身高体重数据,计算出他(她)们的BMI,整理得到如下的频率分布表和频率分布直方图.同一组中的数据用该组区间的中点值作代表,用样本估计总体.
分组 频数 频率
[14,18) 15 0.15
[18,22) 40 0.40
[22,26) 30 0.30
[26,30) 10 0.10
[30,34) 5 0.05
合计 100 1.00
(1) 根据BMI及频率分布直方图,估计该校学生为肥胖的百分比;
(2) 已知样本中60名男学生BMI的平均数为μ1=22.8,根据频率分布直方图,估计样本中40名女学生BMI的平均数μ2.
【答案解析】
9.2.3 总体集中趋势的估计
1. A 解析:B,D中图象对称,平均数和中位数相等,A中图象尾巴向右拖,C中图象尾巴靠左拖,故选A.
2. D 解析:由数据可知四个组的频率分别为0.1,0.35,0.4,0.15,所以每人抢得“优惠券”的平均数为0.1×10+0.35×20+0.4×30+0.15×40=26,所以该小区50名住户在2023年“五一”期间抢得的“优惠券”张数约为50×26=1 300.
3. C 解析:由折线图可得,众数为30,故A正确;将折线图中的数字由小到大依次排序为17,25,30,30,31,32,34,38,42,126,处在中间位置的数字是31,32,所以中位数为31.5,故B正确;由折线图可得,平均数为×(17+25+30+30+31+32+34+38+42+126)=40.5>31.5,故C错误;极差为126-17=109,故D正确.
4. C 解析:因为(0.005+0.015+0.025)×10=0.45<0.5,(0.005+0.015+0.025+0.040)×10=0.85>0.5,所以该班学生这次数学测试成绩的中位数落在[80,90)之间.设中位数为x,则0.45+0.04×(x-80)=0.5,解得x=81.25,所以该班学生这次数学测试成绩的中位数的估计值为81.25.
5. C 解析:由题意可知,该小组数学成绩的平均数为=87,成绩排列为75,80,85,85,85,85,90,90,95,100,可得众数为85,中位数为=85.
6. C 解析:由折线图中数据可得立定跳远的中位数为1.98,跳绳的平均数为[(130-1)+(130+5)+(130-7)+(130+2)+(130+1)]÷5==130,800米跑的众数为3.88.
7. ACD 解析:由图可得2016~2020年,全球每年产生的数据量在持续增加,故A正确;2016~2017年,全球数据的年平均增长率由16.13%增长到了44.44%,故B错误;2016~2020年,全球每年产生的数据量的平均数为×(18+26+33+41+50.5)=33.7,故C正确;设2015年全球产生的数据量为x,则=16.13%,解得x=>=15,故D正确.故选ACD.
8. ABD 解析:对于A,由频率分布直方图可得样本的众数为=67.5,故A正确;对于B,因为(0.03+0.05+0.06)×5=0.70<0.8,(0.03+0.05+0.06+0.04)×5=0.90>0.8,所以样本的第80百分数在[70,75)内,设样本的第80百分位数为x,则0.70+(x-70)×0.04=0.8,解得x=72.5,故B正确;对于C,样本的平均值为57.5×0.15+62.5×0.25+67.5×0.30+72.5×0.20+77.5×0.10=66.75,故C错误;对于D,该校男生中低于60 kg的学生大约有2 000×0.03×5=300(人),故D正确.故选ABD.
9. 7 解析:因为样本数据x1,x2,…,xn的平均数是3,所以=3n,所以数据2x1+1,2x2+1,…,2xn+1的平均数=2xi+1)=7.
10. 165.2 解析:由题意可估计高一年级全体学生身高的平均数为=165.2.
11. 15 解析:设取得A成绩的有x人,取得B+成绩的有y人,取得B成绩的有z人,则70×5+67x+64y+61z=64×(5+x+y+z),即z-x=10.又x,y,z∈N,即当且仅当x=0,y=0,z=10时,5+x+y+z取得最小值15,所以这个班级选考物理学业水平等级考试的人数至少为15.
12. 2 29.5 解析:设x1,x2,x3分别表示答对第1题,第2题,第3题的人数,则解得又只答对一题的人数为6,只答对两题的人数为12,设答对三题的人数为x,则全班人数为6+12+x,所以 6×1+12×2+3x=36,解得x=2,所以三道题全答对的人数是2,所有参赛选手的平均分是=×(14×15+12×15+10×20)=29.5(分).
13. (1) 由频率分布直方图可知,
(0.004+a+0.018+0.022×2+0.028)×10=1,
解得a=0.006.
估计该校学生满意度打分不低于70分的人数为1 000×(0.28+0.22+0.18)=680.
(2) 由频率分布直方图可估计打分的众数为75,
因为(0.004+0.006+0.022)×10=0.32<0.5,
(0.004+0.006+0.022+0.028)×10=0.60>0.5,
所以中位数在[70,80)内,设为x,
则0.32+0.028×(x-70)=0.5,
解得x≈76.43,
所以估计打分的中位数为76.43.
(3) 由题意可得打分在[40,60)的学生人数为(0.004+0.006)×10×100=10,
所以在打分[40,50)和[50,60)中抽取的人数分别为4,6.
14. (1) 由频率分布直方图可知28≤BMI<30的频率为×0.025×4=0.05,
所以BMI≥28的频率为0.05+0.012 5×4=0.1,
所以估计该校学生为肥胖的百分比为10%.
(2) 样本的BMI的平均数为16×0.15+20×0.4+24×0.3+28×0.1+32×0.05=22,
则×22.8+μ2=22,
解得μ2=20.8,
所以估计样本中40名女学生BMI的平均数μ2=20.8.9.2.4 总体离散程度的估计
一、 单项选择题
1. 能反映一组数据离散程度的是( )
A. 众数 B. 平均数
C. 中位数 D. 方差
2. (2023淮南第三中学高一期末)已知一组数据x1,x2,…,xn的方差为2,则3x1+4,3x2+4,…,3xn+4的方差为( )
A. 6 B. 10
C. 18 D. 22
3. 从两个班级各随机抽取5名学生测量身高(单位:cm),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高甲,乙及方差s,s的关系为( )
A. 甲>乙,s>s
B. 甲>乙,sC. 甲<乙,sD. 甲<乙,s>s
4. 一组数据按从小到大的顺序排列为1,4,4,x,7,8(其中x≠7),若该组数据的中位数是众数的倍,则该组数据的方差和第60百分位数是( )
A. ,5 B. 5,5
C. ,6 D. 5,6
5. 某人为了检测自己的解题速度,记录了5次解题所花的时间(单位:min)分别为x,y,55,60,50.已知这组数据的平均数为55,方差为,则|x-y|的值为( )
A. 1 B. 2 C. 3 D. 4
6. 若一组数据m,n,-2,1,1,3,4,6,6,7的平均数为3,则这组数据方差的最小值为( )
A. 5 B. 6 C. 7 D. 8
二、 多项选择题
7. (2023宝鸡中学高一阶段练习)下列说法中,正确的是( )
A. 抽样调查具有花费少、效率高的特点
B. 数据2,3,9,5,3,9的中位数为7,众数为3和9
C. 极差和标准差都能描述一组数据的离散程度
D. 数据a1,a2,…,an的方差为s2,则数据2a1,2a2,…,2an的方差为2s2
8. 某高中有学生500人,其中男生300人,女生200人,希望获得全体学生的身高信息,按照分层随机抽样的原则抽取了容量为50的样本,经计算得到男生身高样本均值为170 cm,方差为17 cm2;女生身高样本均值为160 cm,方差为30 cm2,则下列说法中正确的是( )
A. 男生的样本容量为30
B. 每个女生被抽入到样本的概率均为
C. 所有样本的均值为166 cm
D. 所有样本的方差为46.2 cm2
三、 填空题
9. 已知一组数据x1,x2,x3,x4,x5的方差为,则数据2x1,2x2,2x3,2x4,2x5的方差为________.
10. (2023南京燕子矶中学高一期中)甲、乙两支田径队队员的体重(单位:kg)信息如下:甲队体重的平均数为60,方差为200;乙队体重的平均数为68,方差为300.已知甲、乙两队的队员人数之比为1∶3,则关于甲、乙两队全部队员的体重的平均数和方差分别为________.
11. 某校在“全民健身日”举行了投篮活动,每名参赛者投篮10次.投中一次得1分,没投中得0分.活动结束后统计50名参赛者的平均得分为8分,方差为20.后经核实有两名参赛者的分数统计错误,把一个9分错记为7分,一个8分错记为10分,则实际得分的方差为________.
12. 水痘是一种传染性很强的病毒性疾病,易在春天爆发. 市疾控中心为了调查某校高一年级学生注射水痘疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据. 已知样本平均数为7,样本方差为4,则样本数据中的最大值是________.
四、 解答题
13. (2023朝阳高一联考)经过近半个世纪的迅速发展,我国航天事业取得了巨大成就.航天器上的精密零件制造要求极高,某车间使用数控机床制造一种圆形齿轮零件A,该车间负责人每隔一个生产周期对所生产零件的直径进行统计,排查机床可能存在的问题并及时调试维修.已知该负责人在两个相邻生产周期(分别记为周期Ⅰ和周期Ⅱ)中分别随机检查了10枚零件A,测量得到的直径(单位:mm)如下表所示:
周期Ⅰ 4.9 5.1 5.0 5.0 5.1 5.0 4.9 5.2 5.0 4.8
周期Ⅱ 4.8 5.2 5.0 5.0 4.8 4.8 5.2 5.1 5.0 5.1
周期Ⅰ和周期Ⅱ中所生产零件A的直径的样本平均数分别记为和,样本方差分别记为s和s.
(1) 求,的值;
(2) 试推测机床在周期Ⅰ还是在周期Ⅱ出问题的可能性更大.
14. 某市工会组织举行“红心向党”职工歌咏比赛,分初赛、复赛和决赛三个环节,初赛全市职工踊跃参与,通过各单位的初选,最终有2 000名选手进入复赛,经统计,其年龄的频率分布直方图如图所示.
(1) 求直方图中x的值,并估计复赛选手年龄的平均值(同一组中的数据用该区间的中点值作代表,结果保留一位小数);
(2) 根据频率分布直方图估计复赛选手年龄的第75百分位数;
(3) 决赛由8名专业评审、10名媒体评审和12名大众评审分别打分,打分均采用10分制.已知某选手专业得分的平均数和方差分别为1=8.4,s=0.015,媒体得分的平均数和方差分别为2=8.8,s=0.054,大众得分的平均数和方差分别为3=9.4,s=0.064,将这30名评审的平均分作为最终得分,请估计该选手的最终得分和方差(结果保留三位小数).
附:方差s2=xi-)2=-2.
【答案解析】
9.2.4 总体离散程度的估计
1. D 解析:众数代表一组数据的一般水平,平均数表示一组数据的集中趋势,中位数可将数值集合划分为相等的上下两部分,方差能反映一组数据的离散程度,综上,能反映一组数据的离散程度的是方差.
2. C 解析:因为x1,x2,…,xn的方差为2,所以3x1+4,3x2+4,…,3xn+4的方差为32×2=18.
3. C 解析:因为甲=×(169+162+150+160+159)=160,乙=×(180+160+150+150+165)=161,所以甲<乙.方差表示数据的波动,当波动越大时,方差越大,甲班的身高都差不多,波动比较小,而乙班身高差距比较大,波动比较大,所以s>s.
4. C 解析:由题意,得=×4,解得x=6,所以这组数据的平均数是5,s2=×[(5-1)2+(5-4)2+(5-4)2+(5-6)2+(5-7)2+(5-8)2]=,由第p百分位数定义知第60百分位数是6.
5. B 解析:因为这组数据的平均数为55,方差为,所以x+y=110,(x-55)2+(y-55)2=2.设x=55+t,y=55-t,所以2t2=2,即t2=1,则|x-y|=2|t|=2.
6. C 解析:由题意,得m+n-2+1+1+3+4+6+6+7=3×10,得n=4-m,所以这组数据的方差s2=×[(m-3)2+(n-3)2+25+4+4+0+1+9+9+16]==≥7,所以这组数据方差的最小值为7.
7. AC 解析:对于A,抽样调查相比全面调查具有花费少、效率高的特点,故A正确;对于B,数据从小到大排列为2,3,3,5,9,9,所以中位数为=4,众数为3和9,故B错误;对于C,极差和标准差都能描述一组数据的离散程度,故C正确;对于D,数据a1,a2,…,an的方差为s2,则数据2a1,2a2,…,2an的方差为22s2=4s2,故D错误.故选AC.
8. ACD 解析:对于A,50×=30,故A正确;对于B,因为50×=20,所以每个女生被抽入到样本的概率为=,故B错误;对于C,因为所有样本的均值为=166(cm),故C正确;对于D,因为男生的方差为xi-170)2=17,女生方差为yi-160)2=30,所有样本的方差为[xi-166)2+yi-166)2]=[xi-170+4)2+yi-160-6)2]=[xi-170)2+8xi-170)+480+
yi-160)2-12yi-160)+720]=×(510+480+600+720)=46.2(cm2),故D正确.故选ACD.
9. 2 解析:设数据x1,x2,…,x5的平均数为,则方差为[(x1-)2+…+(x5-)2]=,所以(x1-)2+…+(x5-)2=.数据2x1,2x2,…,2x5的平均数为2,则方差为[(2x1-2)2+…+(2x5-2)2]=[(x1-)2+…+(x5-)2]=×=2.
10. 66,287 解析:由题意,得甲、乙两队全部队员的体重的平均数=×60+×68=66,方差s2=×[200+(60-66)2]+×[300+(68-66)2]=287.
11. 19.92 解析:由题意,得平均数不发生变化.设除这2名记错分的另外48名参赛者的分数分别为a1,a2,a3,…,a48.因为[(a1-8)2+(a2-8)2+…+(a48-8)2+(7-8)2+(10-8)2]=20,所以(a1-8)2+(a2-8)2+…+(a48-8)2=995,则实际得分的方差为[(a1-8)2+(a2-8)2+…+(a48-8)2+(9-8)2+(8-8)2]=×996=19.92.
12. 10 解析:设5个班级中抽取的人数分别为a,b,c,d,e,则(a+b+c+d+e)=7,(a-7)2+(b-7)2+(c-7)2+(d-7)2+(e-7)2=20.因为样本数据互不相同,所以必为0+1+1+9+9=20.由|x-7|=3,得x=10或x=4.由|x-7|=1,得x=8或x=6,所以样本数据为4,6,7,8,10,故最大值为10.
13. (1) 由题意,得=(4.8+2×4.9+4×5.0+2×5.1+5.2)=5.0(mm),
=(3×4.8+3×5.0+2×5.1+2×5.2)=5.0(mm).
(2) 由题意,得s=[(4.8-5.0)2+2×(4.9-5.0)2+4×(5.0-5.0)2+2×(5.1-5.0)2+(5.2-5.0)2]=0.012(mm2),
s=[3×(4.8-5.0)2+3×(5.0-5.0)2+2×(5.1-5.0)2+2×(5.2-5.0)2]=0.022(mm2),
因为s14. (1) 由题意,得(0.01+0.015+0.020+2x+0.030+0.035+0.040)×5=1,
解得x=0.025,
复赛选手年龄的平均值=(22.5×0.010+27.5×0.025+32.5×0.035+37.5×0.040+42.5×0.030+47.5×0.025+52.5×0.020+57.5×0.015)×5≈39.6(岁).
(2) 通过计算知第75百分位数落在[45,50)区间内,设为t,
则(0.010+0.025+0.035+0.040+0.030)×5+(t-45)×0.025=0.75,
解得t=47,即第75百分位数为47.
(3) 由s2=xi-)2,
设该名选手最终的平均分为,最终方差为s2,
则=×(8.4×8+8.8×10+9.4×12)≈8.933(分),
s2={8[s+(1-)2]+10[s+(2-)2]+12[s+(3-)2]}
=×{8×[0.015+(8.4-8.933)2]+10×[0.054+(8.8-8.933)2]+12×[0.064+(9.4-8.933)2]}≈0.216.
估计该选手最终得分为8.933分,其得分方差为0.216.