2025北师大版高中数学必修第一册同步练习题--4_1 样本的数字特征(含解析)

文档属性

名称 2025北师大版高中数学必修第一册同步练习题--4_1 样本的数字特征(含解析)
格式 docx
文件大小 713.2KB
资源类型 试卷
版本资源 北师大版(2019)
科目 数学
更新时间 2024-06-18 21:17:59

图片预览

内容文字预览

中小学教育资源及组卷应用平台
2025北师大版高中数学必修第一册
第六章 统计
§4 用样本估计总体的数字特征
4.1 样本的数字特征
基础过关练
题组一 平均数、中位数、众数
1.运动员参加体操比赛,当评委亮分后,往往是先去掉一个最高分和一个最低分,再计算剩下分数的平均值,这是为了(  )
A.减少计算量   B.避免故障
C.剔除异常值   D.活跃赛场气氛
2.共享充电宝是指企业提供给用户的充电租赁设备,使用者可以随借随还,非常方便,某品牌的共享充电宝由甲、乙、丙三家工厂供货,相关统计数据如下表所示:
工厂名称 合格率 供货量占比
甲 99.0% 0.6
乙 98.0% 0.3
丙 98.0% 0.1
则该品牌共享充电宝的平均合格率的估计值为(  )
A.0.975    B.0.980    C.0.986    D.0.988
3.(2024江西上饶广丰中学月考)已知甲、乙两支篮球队各6名队员某场比赛的得分(单位:分)数据从小到大排列如下:
甲队:7,12,12,20,20+x,31;
乙队:8,9,10+y,19,25,28.
这两组数据的中位数相等,且平均数也相等,则x和y的值分别为(  )
A.2和3    B.0和2    C.0和3    D.2和4
4.(多选题)(2024四川雅安名山第三中学月考)为提高疫情防控意识,某学校举办了一次疫情防控知识竞赛(满分100分),并规定成绩不低于90分为优秀.现该校从高一、高二两个年级分别随机抽取了10名参赛学生的成绩(单位:分),如下表所示:
高一 74 78 84 89 89 93 95 97 99 100
高二 77 78 84 87 88 91 94 94 95 96
则下列说法正确的是(  )
A.高一年级所抽取参赛学生成绩的中位数为91分
B.高二年级所抽取参赛学生成绩的众数为94分
C.两个年级所抽取参赛学生的优秀率相同
D.两个年级所抽取参赛学生的平均成绩相同
题组二 极差、方差、标准差
5.(2023河北邯郸涉县第一中学期中)样本中共有5个个体,其中四个个体的值分别为2,2,3,3,第五个个体的值丢失,若该样本的平均数为3,则该样本的方差为(  )
A.1   B.3    
C.   D.
6.(2024湖北武汉外国语学校月考)已知样本数据x1,x2,…,x2 022的平均数和方差分别为3和56,若yi=2xi+3(i=1,2,…,2 022),则y1,y2,…,y2 022的平均数和方差分别是(  )
A.12,115   B.12,224    
C.9,115   D.9,224
7.(2023辽宁大连第八中学月考)已知一组样本数据1,2,m,8的极差为8,若m>0,则其方差为    .
8.(2023湖北襄阳第四中学月考)某中学数学组积极研讨网上教学策略,决定先采用甲、乙两套方案教学,并对分别采用两套方案教学的班级进行了7次测试,各班学生每次的平均成绩统计结果如图所示.
(1)分别计算采用两套方案教学的班级7次测试成绩的平均数和方差,并填写下表(要求写出计算过程):
平均数/分 方差


(2)从下列两个不同的角度对这次方案选择的结果进行分析:
①从平均数和方差相结合看,分析采用哪种方案的班级成绩更好;
②从折线图上采用两种方案班级成绩的走势看,分析哪种方案更有潜力.
题组三 频率分布直方图中的数字特征
9.(2022辽宁联考)某市政府部门为了解该市的“全国文明城市”创建情况,在该市的12个区县(市)中随机抽查了甲、乙两县,考核组对他们的创建工作进行量化考核.在这两个县的量化考核分数(均为整数)中各随机抽取20个,得到如图所示的统计图(用频率分布直方图估计总体时,同一组中的数据用该组区间的中点值作代表).关于甲、乙两县的量化考核分数,下列结论正确的是(  )
A.甲县量化考核分数的平均数小于乙县量化考核分数的平均数
B.甲县量化考核分数的中位数小于乙县量化考核分数的中位数
C.甲县量化考核分数的众数不小于乙县量化考核分数的众数
D.甲县量化考核分数不低于80的个数多于乙县
10.(2023四川成都期中)在某次全校体能测试中,高三某班40名学生体能测试成绩(满分100分)恰在[60,90]内,绘成如下频率分布直方图,下列说法正确的是(  )
A.该班学生体能测试成绩的中位数是75分
B.该班40%的学生体能测试成绩达到优秀(80分及以上为优秀)
C.该班学生体能测试成绩的平均数是77分
D.该班学生体能测试成绩的众数是78分
11.某超市从甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,整理得到甲种酸奶日销售量的频率分布表和乙种酸奶日销售量的频率分布直方图.
甲种酸奶日销售量/箱 频率
[0,10) 0.10
[10,20) 0.20
[20,30) 0.30
[30,40) 0.25
[40,50] 0.15
合计 1
(1)求出频率分布直方图中a的值,并作出甲种酸奶日销售量的频率分布直方图;
(2)记甲种酸奶与乙种酸奶日销售量(单位:箱)的方差分别为,试比较的大小;
(3)试估计乙种酸奶在未来一个月(按30天计算)的销售总量(同一组中的数据用该组区间的中点值作代表).
能力提升练
题组 样本的数字特征及其应用
1.为了普及环保知识,增强环保意识,某大学随机抽取了30名学生参
加环保知识测试,得分情况(十分制)如图所示,假设得分的中位数为m1,众数为m2,平均数为,则(  )
A.m1=m2=   B.m1=m2<
C.m12.(2024湖北恩施州鄂西南三校联盟月考)下列结论中正确的是(  )
A.若数据的频率分布直方图单峰不对称,且在右边“拖尾”,则平均数小于中位数
B.一组数据中的每个数都减去同一个非零常数a,则这组数据的平均数改变,方差改变
C.一个样本的方差s2=+…+],则这组样本数据的总和为60
D.数据a1,a2,a3,…,an的方差为M,则数据2a1,2a2,2a3,…,2an的方差为2M
3.(多选题)(2023四川成都高新一诊模拟)中国营养学会把走路称为“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.甲、乙两人利用手机记录了去年下半年每月的走路里程(单位:千米),现将两人的数据绘制成如图所示的折线图,则下列结论中正确的是(  )
A.甲走路里程的极差为 11千米
B.乙走路里程的中位数是27千米
C.甲下半年每月走路里程的平均数大于乙下半年每月走路里程的平均数
D.甲下半年每月走路里程的标准差大于乙下半年每月走路里程的标准差
4.(2023河南南阳月考)一段时间内没有发生大规模集体流感的标志为“连续10天,每天新增病例不超过7人”.过去10天,甲、乙、丙、丁四地新增病例数据情况如下,则一定符合该标志的是(  )
A.甲地:平均数为3,中位数为4
B.乙地:平均数为1,方差大于0
C.丙地:中位数为2,众数为3
D.丁地:平均数为2,方差为3
5.(2024广西崇左钦州名校联考)某单位举办演讲比赛,最终来自A,B,C,D四个部门共12人进入决赛,把这四个部门进入决赛的人数作为样本数据.已知样本方差为2.5,且样本数据互不相同,则样本数据中的最大值为    .
6.某居民住宅小区图书室准备购买一定数量的书籍,为了满足不同年龄段居民的阅读需求,现随机抽取了40名阅读者进行调查,得到如图所示的频率分布直方图,则这40名阅读者年龄的平均数为    岁,中位数为    岁.(注:同一组中的数据用该组区间的中点值作代表)
7.某学校举办了一场党史知识竞赛活动,共有500名学生参加.为了解本次知识竞赛活动的成绩,从中抽取了50名学生的分数(分数均为整数,满分为100分)进行统计,所有学生的分数都不低于60,将这50名学生的分数进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如下频率分布直方图.
(1)求图中m的值,并估计此次知识竞赛活动学生分数的中位数;
(2)根据频率分布直方图,估计此次知识竞赛活动学生分数的平均数(同一组中的数据用该组区间的中点值作代表).若对分数不低于平均数的同学进行奖励,请估计参赛的500名学生中获奖的人数.
8.(2022江苏南京联考)为了比较两种用复合材料制造的轴承(分别称为类型Ⅰ轴承和类型Ⅱ轴承)的使用寿命,检验了两种类型轴承各30个,它们的使用寿命(单位:百万圈)如表:
类型Ⅰ
6.2 6.4 8.3 8.6 9.4 9.8
10.3 10.6 11.2 11.4 11.6 11.6
11.7 11.8 11.8 12.2 12.3 12.3
12.5 12.5 12.6 12.7 12.8 13.3
13.3 13.4 13.6 13.8 14.2 14.5
类型Ⅱ
8.4 8.5 8.7 9.2 9.2 9.5
9.7 9.7 9.8 9.8 10.1 10.2
10.3 10.3 10.4 10.6 10.8 10.9
11.2 11.2 11.3 11.5 11.5 11.6
11.8 12.3 12.4 12.7 13.1 13.4
根据表中的数据回答下列问题:
(1)对于类型Ⅰ轴承,应该用平均数还是中位数度量其使用寿命分布的中心 说明理由;
(2)若需要使用寿命尽可能大的轴承,从(1)中所选的数字特征的角度判断应选哪种轴承,说明理由;
(3)若需要使用寿命的波动性尽可能小的轴承,应选哪种轴承 说明理由.
答案与分层梯度式解析
第六章 统计
§4 用样本估计总体的数字特征
4.1 样本的数字特征
基础过关练
1.C 在体操比赛的评分中使用的是平均分,记分过程中采用“去掉一个最高分和一个最低分”的方法,就是为了防止个别评委因人为因素而给出过高或过低的分数,对运动员的得分造成较大的影响.
导师点睛 平均数受样本中的每个数据的影响,越“离群”的数据,对平均数的影响越大,这样的数据一般是一组数据中的最大值和最小值.
2.C 由题表中数据可以估计该品牌共享充电宝的平均合格率为99.0%×0.6+98.0%×0.3+98.0%×0.1=0.986.故选C.
3.C 由题意得,甲队得分数据的中位数为=16,故乙队得分数据的中位数为=16,∴y=3,
又,
=17,
∴=17,∴x=0.
故选C.
4.ABC 对于A,高一年级所抽取参赛学生成绩的中位数为=91(分),A正确;
对于B,高二年级所抽取参赛学生的成绩中,94出现了2次,出现次数最多,故众数为94分, B正确;
对于C,高一、高二年级参赛学生中成绩不低于90分的都有5人,故优秀率都为50%,C正确;
对于D,高一年级所抽取参赛学生的平均成绩为
×(74+78+84+89+89+93+95+97+99+100)=89.8(分),
高二年级所抽取参赛学生的平均成绩为
×(77+78+84+87+88+91+94+94+95+96)=88.4(分), D错误.
故选ABC.
5.C 设第五个个体的值为x,则2+2+3+3+x=3×5,即x=5,
则该样本的方差为.故选C.
6.D 设数据x1,x2,…,xn的平均数和方差分别为和s2,则数据ax1+b,ax2+b,…,axn+b的平均数和方差分别为a+b和a2s2,所以y1,y2,…,y2 022的平均数为2×3+3=9,方差为22×56=224.
故选D.
规律总结 一组数据的平均数为,方差为s2,将这组数据分别加上(减去)同一个常数a,所得数据的平均数为-a),方差不变;将这组数据分别乘同一个常数b(b≠0),所得数据的平均数为b,方差为b2s2.
7.答案 
解析 因为该组数据的极差为8,所以m-1=8,解得m=9.
则这组数据的平均数=5,所以这组数据的方差s2=.
8.解析 (1)由题中折线图中的数据可得采用甲方案的班级7次测试成绩的平均数×(109+111+113+115+117+119+121)=115(分),
方差×[(109-115)2+(111-115)2+…+(121-115)2]=16,
采用乙方案的班级7次测试成绩的平均数×(121+115+109+115+113+117+115)=115(分),
方差×[(121-115)2+(115-115)2+…+(115-115)2]=.
填表如下:
平均数/分 方差
甲 115 16
乙 115
(2)①因为,且,
所以采用乙方案的班级成绩更稳定,故采用乙方案的班级成绩更好.
②从折线图的走势上看甲方案更有潜力,
因为采用甲方案的班级成绩稳步提高,而采用乙方案的班级成绩不稳定,忽高忽低.
9.C 由题中条形图知甲县量化考核分数的平均数为×(57×2+58×1+59×1+67×1+68×2+69×2+79×6+87×1+88×2+89×1+98×1)=74.8,中位数为79,众数为79,量化考核分数不低于80的个数为1+2+1+1=5.
由题中频率分布直方图知乙县量化考核分数的平均数为(55×0.02+65×0.025+75×0.03+85×0.02+95×0.005)×10=71.5,中位数为70+,众数为75,量化考核分数不低于80的个数为(0.02+0.005)×10×20=5.
综上,A,B,D错误,C正确.
10.C 设中位数为x分,则0.01×5+0.02×5+0.04×5+(x-75)×0.06=0.5,解得x=77.5,故A错误;
成绩为80分及以上的频率为0.05×5+0.02×5=0.35,所以有35%的学生体能测试成绩达到优秀,故B错误;
=(62.5×0.01+67.5×0.02+72.5×0.04+77.5×0.06+82.5×0.05+87.5×0.02)×5=77(分),故C正确;
众数是77.5分,故D错误.
故选C.
11.解析 (1)由乙种酸奶日销售量的频率分布直方图可得10a=1-(0.020+0.010+0.030+0.025)×10,解得a=0.015.
根据题表中数据可作出甲种酸奶日销售量的频率分布直方图如图所示:
(2)解法一:记甲、乙两种酸奶日销售量的平均数分别为箱,箱,
则=5×0.1+15×0.2+25×0.3+35×0.25+45×0.15=26.5,
=5×0.2+15×0.1+25×0.3+35×0.15+45×0.25=26.5,
所以=(5-26.5)2×0.1+(15-26.5)2×0.2+(25-26.5)2×0.3+(35-26.5)2×0.25+(45-26.5)2×0.15=142.75,
=(5-26.5)2×0.2+(15-26.5)2×0.1+(25-26.5)2×0.3+(35-26.5)2×0.15+(45-26.5)2×0.25=202.75,所以.
解法二:比较两种酸奶的频率分布直方图,数据越集中,则方差越小,由频率分布直方图可得,甲种酸奶对应的数据更集中,故甲的方差小于乙的方差,即.
(3)由(2)得乙种酸奶的平均日销售量为26.5箱,
故乙种酸奶未来一个月的销售总量为26.5×30=795(箱).
能力提升练
1.D 由题图可知,30名学生得分的中位数为5和6的平均数,即m1=5.5;又5出现的次数最多,故m2=5;×(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97.所以m22.C 对于A,频率分布直方图大致如图:
因为在右边“拖尾”,最高峰偏左,所以中位数靠近高峰处,平均数则靠近中点处,所以平均数大于中位数,故A错误;
由平均数和方差的性质知B,D错误;
对于C,由题意可知平均数为3,共有20个数据,所以这组样本数据的总和为3×20=60,故C正确.故选C.
3.ABD 由题图可知,甲各月的走路里程(单位:千米)为31,25,21,24,20,30,
乙各月的走路里程(单位:千米)为29,28,26,28,25,26.
甲走路里程的极差为31-20=11(千米),故A正确;
乙走路里程的中位数是=27(千米),故B正确;
甲下半年每月走路里程的平均数为(千米),
乙下半年每月走路里程的平均数为=27(千米),故C错误;
由题图可知,甲下半年每月走路里程的数据波动程度大于乙下半年每月走路里程的数据波动程度,所以甲下半年每月走路里程的标准差大于乙下半年每月走路里程的标准差,故D正确.
故选ABD.
4.D 对于A,当甲地过去10天每天新增病例人数分别为0,0,0,2,4,4,4,4,4,8时,满足平均数为3,中位数为4,但不满足每天新增病例不超过7人,故A错误;
对于B,当乙地过去10天每天新增病例人数分别为0,0,0,0,0,0,0,0,1,9时,满足平均数为1,方差大于0,但不满足每天新增病例不超过7人,故B错误;
对于C,当丙地过去10天每天新增病例人数分别为0,0,1,1,2,2,3,3,3,8时,满足中位数为2,众数为3,但不满足每天新增病例不超过7人,故C错误;
对于D,若至少有一天新增病例超过7人,则方差大于×(8-2)2=3.6,与题意矛盾,故丁地连续10天每天新增病例不超过7人,故D正确.故选D.
5.答案 5
解析 设样本数据为a,b,c,d,且a则样本平均数为=3,样本方差为,
则(a-3)2+(b-3)2+(c-3)2+(d-3)2=10,
所以(d-3)2≤10,解得d≤+3.
当d=6时,(a-3)2+(b-3)2+(c-3)2=1,因为样本数据互不相同,所以不存在a,b,c使得等式成立.
当d=5时,(a-3)2+(b-3)2+(c-3)2=6,存在a=1,b=2,c=4,使得等式成立,故样本数据中的最大值为5.
6.答案 54;55
解析 由题图得区间[20,30),[30,40),[40,50),[50,60),[60,70),[70,80]对应的频率分别为0.05,0.1,0.2,0.3,0.25,0.1,因为同一组中的数据用该组区间的中点值作代表,
所以这40名阅读者年龄的平均数为25×0.05+35×0.1+45×0.2+55×0.3+65×0.25+75×0.1=54(岁).
前3个区间的频率之和为0.05+0.1+0.2=0.35,前4个区间的频率之和为0.35+0.3=0.65,
故中位数为50+×10=55(岁).
7.解析 (1)由题中频率分布直方图知(0.01+m+0.04+0.02)×10=1,解得m=0.03.
设此次知识竞赛活动学生分数的中位数为x0,
因为数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,所以80由(x0-80)×0.04=0.5-0.4,得x0=82.5,
故估计此次知识竞赛活动学生分数的中位数为82.5.
(2)由题中频率分布直方图及(1)知数据落在[60,70),[70,80),[80,90),[90,100]内的频率分别为0.1,0.3,0.4,0.2,则估计此次知识竞赛活动学生分数的平均数为65×0.1+75×0.3+85×0.4+95×0.2=82.
此次知识竞赛活动学生分数不低于82的频率为0.2+×0.4=0.52,
故估计参赛的500名学生中获奖的人数为500×0.52=260.
8.解析 (1)从题表可以看出类型Ⅰ轴承的使用寿命的数据大多集中在[11.2,13.8]这个区间内,6.2,6.4有严重的偏离,所以不宜使用平均数度量其使用寿命分布的中心,由于极端值的大小对中位数没有影响,所以应使用中位数度量类型Ⅰ轴承的使用寿命分布的中心.
(2)由题表可知,将类型Ⅰ轴承的使用寿命由小到大排序后,排在第15,16个的数据分别是11.8,12.2,故中位数为12百万圈;
将类型Ⅱ轴承的使用寿命由小到大排序后,排在第15,16个的数据分别是10.4,10.6,故中位数为10.5百万圈.
因为12>10.5,所以应选类型Ⅰ轴承.
(3)由题表可得类型Ⅰ中,极差=14.5-6.2=8.3,多数的数据集中在[11.2,13.8]这个区间内,6.2,6.4,8.3,8.6严重偏离分布中心,即波动较大,标准差必定较大,
类型Ⅱ中,极差=13.4-8.4=5,相对较小,数据的分布比较集中、均匀,标准差必定比类型Ⅰ小,
故应选类型Ⅱ轴承.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)