9.2.3 总体集中趋势的估计
9.2.4 总体离散程度的估计
基础过关练
题组一 平均数、中位数、众数
1.(2020广东湛江高一下期末)数据1,1,3,3的众数和中位数分别是 ( )
A.1或3,2 B.3,2 C.1或3,1或3 D.3,3
2.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,则由此求出的平均数与实际平均数的差是 ( )
A.3.5 B.-3 C.3 D.-0.5
3.(2021陕西西安高考第一次质检)某工厂10名工人某天生产同一类型零件,生产的件数分别是10、12、14、14、15、15、16、17、17、17,记这组数据的平均数为a,中位数为b,众数为c,则a,b,c由大到小的顺序为 .
4.在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下:
成绩/m 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90
人数 2 3 2 3 4 1 1 1
分别求这17名运动员成绩的众数、中位数、平均数(保留到小数点后两位),并分析这些数据的含义.
5.高一(1)班有男同学27名、女同学21名,在一次语文测验中,男同学成绩的平均数是82分,中位数是75分,女同学成绩的平均数是80分,中位数是80分.
(1)求这次测验全班成绩的平均数(精确到0.01);
(2)估计全班成绩在80分以下(含80分)的同学至少有多少人;
(3)分析男同学成绩的平均数与中位数相差较大的主要原因.
题组二 频率分布直方图与平均数、中位数、众数
6.某工厂对一批新产品的长度(单位:mm)进行检测,如图是根据检测结果绘制的频率分布直方图,据此估计这批产品的中位数为 ( )
A.20 B.25 C.22.5 D.22.75
7.(2020山东济南历城高一下4月学情检测)对某校高三年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图.
分组 频数 频率
[10,15) 10 0.25
[15,20) 24 n
[20,25) m p
[25,30] 2 0.05
合计 M 1
(1)求出表中M,p及图中a的值;
(2)若该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数;
(3)估计这次学生参加社区服务次数的众数、中位数以及平均数.
题组三 方差与标准差
8.(多选)甲、乙两班举行电脑汉字录入比赛,参赛学生每分钟录入汉字的个数经统计计算后填入下表:
班级 参赛人数 中位数 方差 平均数
甲 55 149 191 135
乙 55 151 110 135
下列结论中正确的是 ( )
A.甲、乙两班学生成绩的平均数相同
B.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)
C.甲班学生的成绩波动比乙班学生的成绩波动大
D.甲班学生成绩的众数小于乙班学生成绩的众数
9.(2020山东师范大学附属中学高一下检测)在某项体育比赛中,七位裁判为某一选手打出的分数如下:90,89,90,95,93,94,93,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为 ( )
A.92,2 B.92,2.8
C.93,2 D.93,2.8
10.某位同学参加歌唱比赛,有9位评委和1位特邀嘉宾打分.歌唱结束后,各评委打的分数的平均数为5,方差为3,特邀嘉宾打的分数为5,设这10个分数的平均数为,方差为s2,则 ( )
A.=5,s2>3 B.=5,s2<3
C.>5,s2<3 D.>5,s2>3
11.若样本数据x1,x2,…,x10的标准差s=8,则数据2x1-1,2x2-1,…,2x10-1的标准差为 ( )
A.8 B.15 C.16 D.32
12.在高一期中考试中,甲、乙两个班的数学分数统计如下表:
班级 人数 平均数 方差
甲 20 2
乙 30 3
其中,则两个班数学分数的方差为 ( )
A.3 B.2 C.2.6 D.2.5
13.(2020江苏扬州高三上期末)若一组样本数据21,19,x,20,18的平均数为20,则该组样本数据的方差为 .
14.甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定.
品种 第1年 第2年 第3年 第4年 第5年
甲 9.8 9.9 10.1 10 10.2
乙 9.4 10.3 10.8 9.7 9.8
能力提升练
题组一 数据集中趋势的估计
1.()为了普及环保知识,增强环保意识,某大学随机抽取了30名学生参加环保知识测试,得分情况(十分制)如图所示,假设得分的中位数为m1,众数为m2,平均数为,则 ( )
A.m1=m2= C.m12.(2020广东广州高一下期末,)某居民住宅小区图书室准备购买一定数量的书籍,为了满足不同年龄段居民的阅读需求,现随机抽取了40名阅读者进行调查,得到如图所示的频率分布直方图.则这40名阅读者年龄(单位:岁)的平均数为 ,中位数为 .(注:同一组中的数据用该组区间的中点值作代表)
3.(2020山东聊城高一下期末,)某山区地方政府为了帮助当地农民实现脱贫致富,大力发展当地的特色黄桃种植产业.为了了解某村黄桃的质量(单位:克)分布规律,现从该村的黄桃树上随机摘下n个黄桃组成样本进行测重,其质量均分布在区间[225,525]内,统计质量的数据作出其频率分布直方图如图所示,已知质量分布在区间[275,325)内的黄桃有16个.
(1)求n的值和质量分布在区间[425,475)内的黄桃个数;
(2)已知该村的黄桃树上大约有10万个黄桃待出售,某电商欲以5元/千克的价格收购该村的黄桃,请估计该村黄桃的销售收入.
题组二 数据离散程度的估计
(多选)(2020山东枣庄高一下期末,)在对某中学高一年级学生身高(单位:cm)的调查中,随机抽取了23名男生、27名女生,23名男生身高(单位:cm)的平均数和方差分别为170和10.84,27名女生身高(单位:cm)的平均数和方差分别为160和28.84,则 ( )
A.总样本中女生身高数据比男生的离散程度小
B.总样本的平均数大于164
C.总样本的方差大于45
D.总样本的标准差大于7
5.(2020湖北武汉华中科技大学附属中学高二上期末,)已知数据-1,1,0,m,3的方差为2,则数据-1,3,1,2m+1,7的方差为 .
6.()在一次高三年级统一考试中,数学试卷有一道满分为10分的选做题,学生可以从A,B两道题目中任选一题作答.某校有900名高三学生参加了本次考试,为了了解该校学生解答该选做题的得分情况,计划从900名学生的选做题成绩中随机抽取一个容量为10的样本.若采用分层随机抽样,按照学生选择A题目或B题目将成绩分为两层,且样本中选择A题目的成绩有8个,平均数为7,方差为4;选择B题目的成绩有2个,平均数为8,方差为1.试用样本估计该校900名学生的选做题得分的平均数与方差.
答案全解全析
基础过关练
1.A 因为1和3都出现了2次且出现次数最多,所以众数为1或3,
中位数为=2,故选A.
2.B 因为在输入的时候将105输成15,减少了90,所以得出的平均数与实际平均数的差为=-3.
3.答案 c>b>a
解析 平均数
a==14.7,
中位数b=15,众数c=17,则c>b>a.
4.解析 在17个数据中,1.75出现了4次,次数最多,
∴众数是1.75 m.
将数据按从小到大的顺序排列,易知中位数是1.70 m.
平均数是×(1.50×2+1.60×3+1.65×2+1.70×3+1.75×4+1.80×1+1.85×1+1.90×1)=≈1.69(m).
∴这17名运动员成绩的众数、中位数、平均数分别是1.75 m,1.70 m,1.69 m.
众数是1.75 m,说明跳1.75 m的人数最多;
中位数是1.70 m,说明跳1.70 m以下和1.70 m以上的人数相等;
平均数是1.69 m,说明所有参赛运动员的平均成绩是1.69 m.
5.解析 (1)这次测验全班成绩的平均数为×(82×27+80×21)≈81.13(分).
(2)因为男同学成绩的中位数是75分,
所以至少有14名男同学的成绩不超过75分.
因为女同学成绩的中位数是80分,
所以至少有11名女同学的成绩不超过80分.
所以估计全班至少有25人的成绩在80分以下(含80分).
(3)男同学成绩的平均数与中位数相差较大,且平均数大于中位数,说明男同学的成绩有数值较大的极端值,两极分化现象严重,成绩高的和低的相差较大.
6.C 易得题图自左至右各小矩形的面积依次为0.1,0.2,0.4,0.15,0.15,设中位数是x,则0.1+0.2+0.08×(x-20)=0.5,解得x=22.5,故选C.
7.解析 (1)由[10,15)内的频数是10,频率是0.25,知=0.25,所以M=40.因为频数之和为40,所以10+24+m+2=40,解得m=4,所以p==0.1.因为a是[15,20)的频率与组距的商,所以a==0.12.
(2)因为该校高三学生有240人,在[10,15)内的频率是0.25,所以估计该校高三学生参加社区服务的次数在此区间内的人数为240×0.25=60.
(3)估计这次学生参加社区服务次数的众数是=0.6,所以样本的中位数是15+≈17.1,估计这次学生参加社区服务次数的中位数是17.1.样本平均数是12.5×0.25+17.5×0.6+22.5×0.1+27.5×0.05=17.25,估计这次学生参加社区服务次数的平均数是17.25.
8.ABC 甲、乙两班学生成绩的平均数都是135,故两班学生成绩的平均数相同,∴A正确;甲、乙两班参赛人数相同,但甲班学生成绩的中位数为149,乙班学生成绩的中位数为151,从而易知乙班学生中每分钟录入汉字的个数≥150个的人数要多于甲班,∴B正确;,∴甲班学生成绩不如乙班学生成绩稳定,即甲班学生的成绩波动较大,∴C正确;由题表看不出两班学生成绩的众数,∴D错误.
9.B 去掉一个最高分95与一个最低分89后,所剩的5个数分别为90,90,93,94,93,其平均数为=92,
方差为=2.8,故选B.
10.B 由题意知×(5+9×5)=5,s2=×(0+9×3)=2.7<3.故选B.
11.C 已知样本数据x1,x2,…,x10的标准差s=8,则s2=64,数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为=2×8=16,故选C.
12.C 由题意可知两个班的数学分数的平均数,
则两个班数学分数的方差s2=×[2+()2]+×[3+()2]=×3=2.6.
13.答案 2
解析 依题意得=20,解得x=22,
则该组样本数据的方差为
=2.
14.解析 甲品种的样本平均数为×(9.8+9.9+10.1+10+10.2)=10,样本方差为×[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]=0.02.
乙品种的样本平均数为×(9.4+10.3+10.8+9.7+9.8)=10,样本方差为×[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244.
因为0.244>0.02,所以由这组数据可以估计甲种水稻的产量比较稳定.
能力提升练
1.D 由题图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m1=5.5;又5出现次数最多,故m2=5;×(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97.所以m22.答案 54;55
解析 由题图得区间[20,30),[30,40),[40,50),[50,60),[60,70),[70,80]对应的频率分别为0.05,0.1,0.2,0.3,0.25,0.1,因为同一组中的数据用该组区间的中点值作代表,
所以这40名阅读者年龄(单位:岁)的平均数为25×0.05+35×0.1+45×0.2+55×0.3+65×0.25+75×0.1=54.
前3个区间的频率之和为0.05+0.1+0.2=0.35,第4个区间的频率为0.3,
故中位数为50+×10=55.
3.解析 (1)因为质量分布在区间[275,325)内的黄桃有16个,
所以=0.003 2,解得n=100.
50×(0.001 0+0.003 2+0.004 8+0.006 0+x+0.001 0)=1,解得x=0.004 0,
则质量分布在区间[425,475)内的黄桃个数为50nx=20.
(2)该村黄桃的单个质量的平均数为
250×0.05+300×0.16+350×0.24+400×0.3+450×0.2+500×0.05=379.5(克),
故该村黄桃的总质量大约为379.5×100 000=37 950(千克),
故估计该村黄桃的销售收入为37 950×5=189 750(元).
4.BC 对于A,因为方差越小,数据的离散程度越小,所以总样本中女生身高数据比男生的离散程度大,所以A错误;对于B,由已知可得总样本的平均数为=164.6,所以B正确;对于C,总样本的方差为×[10.84+(170-164.6)2]+×[28.84+(160-164.6)2]=×50=45.4>45,所以C正确;对于D,总样本的标准差为≈6.7<7,所以D错误.故选BC.
5.答案 8
解析 因为-1=2×(-1)+1,3=2×1+1,1=2×0+1,2m+1=2×m+1,7=2×3+1,
所以数据-1,3,1,2m+1,7的方差为22×2=8.
6.解析 设样本中选择A题目的成绩的平均数为,方差为;
选择B题目的成绩的平均数为,方差为;
总样本的平均数为,方差为s2,
则=7,=4,=8,=1,
所以=7.2,
s2=×{8×[4+(7-7.2)2]+2×[1+(8-7.2)2]}=3.56.
故该校900名学生的选做题得分的平均数约为7.2,方差约为3.56.