[A 基础达标]
1.已知数据x1,x2,x3,…,xn是上海普通职工n(n≥3,n∈N*)个人的年收入,设这n个数据的中位数为x,平均数为y,方差为z,如果再加上世界首富的年收入xn+1,则这n+1个数据中,下列说法正确的是( )
A.年收入平均数大大增大,中位数一定变大,方差可能不变
B.年收入平均数大大增大,中位数可能不变,方差变大
C.年收入平均数大大增大,中位数可能不变,方差也不变
D.年收入平均数可能不变,中位数可能不变,方差可能不变
解析:选B.插入大的极端值,平均数增加,中位数可能不变,方差也因为数据更加分散而变大.
2.在某次高中学科竞赛中,4 000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中有误的是( )
A.成绩在[70,80)分的考生人数最多
B.不及格的考生人数为1 000
C.考生竞赛成绩的平均分为70.5分
D.考生竞赛成绩的中位数为75分
解析:选D.A选项,由频率分布直方图可得成绩在[70,80)的频率最高,因此考生人数最多,故A正确;B选项,由频率分布直方图可得成绩在[40,60)的频率为0.25,因此,不及格的人数为4 000×0.25=1 000,故B正确;C选项,由频率分布直方图可得平均分等于45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,故C正确;D选项,因为成绩在[40,70)的频率为0.45,成绩在[70,80)的频率为0.3,所以中位数为70+10×≈71.67,故D错误.故选D.
3.(2019·广东省惠州市期末考试)某班有50名学生,男女人数不相等.随机询问了该班5名男生和5名女生的某次数学测试成绩,用茎叶图记录如图所示,则下列说法一定正确的是( )
A.这5名男生成绩的标准差大于这5名女生成绩的标准差
B.这5名男生成绩的中位数大于这5名女生成绩的中位数
C.该班男生成绩的平均数大于该班女生成绩的平均数
D.这种抽样方法是一种分层抽样
解析:选A.5名男生成绩的平均数为=90,
5名女生成绩的平均数为=91,
这5名男生成绩的方差为×(22+42+22+42)=8,女生成绩的方差为×(22×3+32×2)=6,男生方差大于女生方差,所以男生标准差大于女生标准差,所以A对;
这5名男生成绩的中位数是90, 5名女生成绩的中位数为93,所以B错;
该班男生和女生成绩的平均数可通过样本估计,但不能通过样本计算得到平均数准确值,所以C错;若抽样方法是分层抽样,因为男生女生不等,所以分别抽取的人数不等,所以D错.故选A..
4.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高为1.60 m;从南方抽取了200个男孩,平均身高为1.50 m.由此可估计我国13岁男孩的平均身高为( )
A.1.57 m B.1.56 m
C.1.55 m D.1.54 m
解析:选B.从北方抽取了300个男孩,平均身高为1.60 m,
从南方抽取了200个男孩,平均身高为1.50 m,
则这500个13岁男孩的平均身高是=1.56,
据此可估计我国13岁男孩的平均身高为1.56 m,故选B.
5.甲、乙两位同学某学科的连续五次考试成绩用茎叶图表示如图所示,则平均分数较高的是________,成绩较为稳定的是________.
解析:甲=70,乙=68,s=×(22+12+12+22)=2,s=×(52+12+12+32)=7.2.
答案:甲 甲
6.某校从高二年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高二年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为________.
答案:480
7.某中学随机抽取部分高一学生调查其上学路上所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中上学路上所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].
(1)频率分布直方图中x的值为________;
(2)如果上学路上所需时间不少于1小时的学生可申请在学校住宿,若招生1 200名,估计新生中可以申请住校的学生有________名.
解析:(1)由频率分布直方图,可得20x+0.025×20+0.006 5×20+0.003×2×20=1,所以x=0.012 5.
(2)新生上学路上所需时间不少于1小时的频率为0.003×2×20=0.12,因为1 200×0.12=144,所以1 200名新生中约有144名学生可以申请住校.
答案:(1)0.012 5 (2)144
8.为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图:
(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);
(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为1,2,估计1-2 的值.
解:(1)设甲校高三年级学生总人数为n.
由题意知=0.05,解得n=600.
样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级这次联考数学成绩的及格率为1-=.
(2)设甲、乙两校样本平均数分别为1′,2′.
根据样本茎叶图可知30(1′-2′)=301′-302′
=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92
=2+49-53-77+2+92=15.
因此1′-2′=0.5.故1-2的估计值为0.5分.
9.某校高二期末统一测试,随机抽取一部分学生的数学成绩,分组统计如下表.
(1)求出表中m,n,M,N的值,并根据表中所给数据在给出的坐标系中画出频率分布直方图;
分组
频数
频率
[0,30]
3
0.03
(30,60]
3
0.03
(60,90]
37
0.37
(90,120]
m
n
(120,150]
15
0.15
合计
M
N
(2)若全校参加本次考试的学生有600人,试估计这次测试中全校成绩在90分以上的人数.
解:(1)由频率分布表得M==100,
所以m=100-(3+3+37+15)=42,n==0.42,
N=0.03+0.03+0.37+0.42+0.15=1.
频率分布直方图如图所示.
(2)由题意,知全校成绩在90分以上的学生的人数约为×600=342.
[B 能力提升]
10.设矩形的长为a,宽为b,其比满足b∶a=≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确的结论是( )
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次总体平均数与标准值接近程度相同
D.两个批次总体平均数与标准值接近程度不能确定
解析:选A.计算可得甲批次样本的平均数为0.617,乙批次样本的平均数为0.613,由此估计两个批次的总体平均数分别为0.617,0.613,则甲批次的总体平均数与标准值更接近.故选A.
11.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
则7个剩余分数的方差为( )
A. B.
C.36 D.
解析:选B.根据茎叶图,去掉1个最低分87,1个最高分99,
则[87+94+90+91+90+(90+x)+91]=91,
所以x=4.
所以s2=[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=.
12.某校从参加高一年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的部分频率分布直方图.在统计方法中,同一组数据常用该组区间的中点值作为代表,观察图形的信息,据此估计本次考试的平均分为________.
解析:在频率分布直方图中,所有小长方形的面积和为1,
设[70,80)的小长方形面积为x,则(0.01+0.015×2+0.025+0.005)×10+x=1,
解得x=0.3,
即该组频率为0.3,
所以本次考试的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
答案:71
13.某地区100位居民的人均月用水量(单位:t)的分组及各组的频数如下:
[0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;[2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4;[4,4.5),2.
(1)列出样本的频率分布表;
(2)画出频率分布直方图,并根据直方图估计这组数据的平均数、中位数、众数;
(3)当地政府制定了人均月用水量为3t的标准,若超出标准加倍收费,当地政府说,85%以上的居民不超过这个标准,这个解释对吗?为什么?
解:(1)频率分布表
分组
频数
频率
[0,0.5)
4
0.04
[0.5,1)
8
0.08
[1,1.5)
15
0.15
[1.5,2)
22
0.22
[2,2.5)
25
0.25
[2.5,3)
14
0.14
[3,3.5)
6
0.06
[3.5,4)
4
0.04
[4,4.5)
2
0.02
合计
100
1
(2)频率分布直方图如图:
众数:2.25,中位数:2.02,平均数:2.02.
(3)人均月用水量在3 t以上的居民所占的比例为6%+4%+2%=12%,即大约有12%的居民月用水量在3 t以上,88%的居民月用水量在3 t以下,因此政府的解释是正确的.
[C 拓展探究]
14.为提倡节能减排,同时减轻居民负担,广州市积极推进“一户一表”工程.非一户一表用户电费采用“合表电价”收费标准:0.65元/度.“一户一表”用户电费采用阶梯电价收取,其11月到次年4月起执行非夏季标准如下:
第一档
第二档
第三档
每户每月用电量
(单位:度)
[0,200]
(200,400]
(400,+∞)
电价(单位:元/度)
0.61
0.66
0.91
例如:某用户11月用电410度,采用合表电价收费标准,应交电费410×0.65=266.5(元),若采用阶梯电价收费标准,应交电费200×0.61+(400-200)×0.66+(410-400)×0.91=263.1(元).
为调查阶梯电价是否能取到“减轻居民负担”的效果,随机调查了该市100户居民的11月用电量,工作人员已经将90户的月用电量填在下面的频率分布表中,最后10户的月用电量(单位:度)为88、268、370、140、440、420、520、320、230、380.
组别
月用电量
频数统计
频数
频率
①
[0,100]
②
(100,200]
③
(200,300]
④
(300,400]
⑤
(400,500]
⑥
(500,600]
合计
(1)完成频率分布表,并绘制频率分布直方图;
(2)根据已有信息,试估计全市住户11月的平均用电量(同一组数据用该区间的中点值作代表);
(3)设某用户11月用电量为x度(x∈N),按照合表电价收费标准应交y1元,按照阶梯电价收费标准应交y2元,请用x表示y1和y2,并求当y2≤y1时,x的最大值,同时根据频率分布直方图估计“阶梯电价”能否给不低于75%的用户带来实惠?
解:(1)频率分布表如下:
组别
月用电量
频数统计
频数
频率
①
[0,100]
4
0.04
②
(100,200]
12
0.12
③
(200,300]
24
0.24
④
(300,400]
30
0.3
⑤
(400,500]
26
0.26
⑥
(500,600]
4
0.04
合计
100
1
频率分布直方图如图:
(2)该100户用户11月的平均用电量
=50×0.04+150×0.12+250×0.24+350×0.3+450×0.26+550×0.04=324(度),
所以估计全市住户11月的平均用电量为324度.
(3)y1=0.65x,
y2=.
由y2≤y1得或
或,
解得x≤≈423.1.
因为x∈N,故x的最大值为423.
根据频率分布直方图,x≤423时的频率为0.04+0.12+0.24+0.3+23×0.002 6=0.759 8>0.75,
故估计“阶梯电价”能给不低于75%的用户带来实惠.
5.1.4 用样本估计总体
考点
学习目标
核心素养
用样本的数字特征估计总体的数字特征
理解用样本的数字特征估计总体的数字特征的方法,会分析实际问题
数学抽象、数学运算
用样本分布估计总体分布
能够利用频率分布直方图、茎叶图等解决统计问题
逻辑推理、数学运算
问题导学
预习教材P77-P83的内容,思考以下问题:
1.如何用样本平均数估计总体平均数?
2.样本方差、标准差公式是什么?它们的区别与联系是什么?
3.在电视大奖赛中,计算评委打分的平均值时,为什么要去掉一个最高分和一个最低分?
4.如何用频率分布直方图估计平均数、中位数、众数?
5.同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗?
1.简单随机抽样的数字特征
一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.
一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.
2.分层抽样的数字特征
我们以分两层抽样的情况为例.假设第一层有m个数,分别为x1,x2,…,xm,平均数为,方差为s2;第二层有n个数,分别为y1,y2,…,yn,平均数为,方差为t2.则=i,s2=(xi-)2,=i,t2=(yi-)2.
如果记样本均值为,样本方差为b2,则可以算出
=(xi+i)=,
b2==[(ms2+nt2)+(-)2].
判断正误(正确的打“√”,错误的打“×”)
(1)样本的平均数描述了样本数据的平均水平.( )
(2)方差越大、数据越集中在平均数左右.( )
(3)中位数是样本数据中最中间位置的数据.( )
答案:(1)√ (2)× (3)×
下列说法不正确的是( )
A.频率分布直方图中每个小矩形的高就是该组的频率
B.频率分布直方图中各个小矩形的面积之和等于1
C.频率分布直方图中各个小矩形的宽一样大
D.频率分布折线图是依次连接频率分布直方图的每个小矩形上边的中点得到的
解析:选A.频率分布直方图中每个小矩形的高=.
如图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知( )
A.甲运动员的成绩好于乙运动员
B.乙运动员的成绩好于甲运动员
C.甲、乙两名运动员的成绩没有明显的差异
D.甲运动员的最低得分为0分
解析:选A.由茎叶图可以看出甲的成绩都集中在30~50分,且高分较多.而乙的成绩只有一个高分52分,其他成绩比较低,故甲运动员的成绩好于乙运动员的成绩.
为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.
解析:60×(0.015+0.025)×10=24.
答案:24
用样本的数字特征估计总体的数字特征
甲、乙两机床同时加工直径为100 cm的零件,为检验质量,从中抽取6件测量数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算说明哪台机床加工零件的质量更稳定.
【解】 (1) 甲=(99+100+98+100+100+103)=100,
乙=(99+100+102+99+100+100)=100,
s=[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
s=[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)由(1)知甲=乙,比较它们的方差,因为s>s,故乙机床加工零件的质量更稳定.
(1)在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差),方差大说明取值分散性大,方差小说明取值分散性小或者取值集中、稳定.
(2)关于统计的有关性质及规律:
①若x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,…,mxn+a的平均数是m+a;
②数据x1,x2,…,xn与数据x1+a,x2+a,…,xn+a的方差相等;
③若x1,x2,…,xn的方差为s2,那么ax1,ax2,…,axn的方差为a2s2.
1.某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:
甲
127
138
130
137
135
131
乙
133
129
138
134
128
136
求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛.
解:设甲、乙两人成绩的平均数分别为甲,乙,
则甲=130+(-3+8+0+7+5+1)=133,
乙=130+(3-1+8+4-2+6)=133,
s=[(-6)2+52+(-3)2+42+22+(-2)2]=,
s=[02+(-4)2+52+12+(-5)2+32]=.
因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适.
2.在对树人中学高一年级学生身高(单位:cm)的调查中,采用分层抽样的方法,抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62,你能由这些数据计算出样本的方差,并对高一年级全体学生身高的方差作出估计吗?
解:把样本中男生的身高记为x1,x2,…,x23,其平均数记为,方差记为s;把样本中女生的身高记为y1,y2,…,y27,其平均数记为,方差记为s,把样本的平均数记为,方差记为s2.
则==165.2,
s2=
=
=51.486 2.
即样本的方差为51.486 2.
因此估计高一年级全体学生身高的方差为51.486 2.
频率分布直方图与数字特征的综合应用
已知一组数据:
125 121 123 125 127 129 125 128 130 129
126 124 125 127 126 122 124 125 126 128
(1)填写下面的频率分布表:
分组
频数累计
频数
频率
[120.5,122.5)
[122.5,124.5)
[124.5,126.5)
[126.5,128.5)
[128.5,130.5]
合计
(2)作出频率分布直方图;
(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数.
【解】 (1)频率分布表如下:
分组
频数累计
频数
频率
[120.5,122.5)
2
0.1
[122.5,124.5)
3
0.15
[124.5,126.5)
8
0.4
[126.5,128.5)
4
0.2
[128.5,130.5]
3
0.15
合计
20
1
(2)
(3)在[124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5,事实上,众数的精确值为125.图中虚线对应的数据是124.5+2×=125.75,事实上,中位数为125.5.使用“组中值”求平均数:=121.5×0.1+123.5×0.15+125.5×0.4+127.5×0.2+129.5×0.15=125.8,事实上,平均数的精确值为=125.75.
(1)利用频率分布直方图求数字特征:
①众数是最高的矩形的底边的中点;
②中位数左右两侧直方图的面积相等;
③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(2)利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.
某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:
(1)高一参赛学生的成绩的众数、中位数;
(2)高一参赛学生的平均成绩.
解:(1)由题图可知众数为65,
又因为第一个小矩形的面积为0.3,
所以设中位数为60+x,则0.3+x×0.04=0.5,得x=5,
所以中位数为60+5=65.
(2)依题意,平均成绩为:
55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,
所以高一参赛学生的平均成绩约为67.
1.甲乙两名学生六次数学测验成绩(百分制)如图所示.
①甲同学成绩的中位数大于乙同学成绩的中位数;
②甲同学的平均分比乙同学高;
③甲同学的平均分比乙同学低;
④甲同学成绩的方差小于乙同学成绩的方差.
上面说法正确的是( )
A.③④ B.①②④
C.②④ D.①③
解析:选A.甲的中位数为81,乙的中位数为87.5,故①错,排除B、D;甲的平均分=(76+72+80+82+86+90)=81,乙的平均分′=(69+78+87+88+92+96)=85,故②错,③对,排除C,故选A.
2.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为( )
A.20 B.30
C.40 D.50
解析:选B.样本数据落在[15,20]内的频数为:
100×[1-5×(0.04+0.10)]=30.
3.如图茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,若乙的平均分是89,则污损的数字是________.
解析:设污损的叶对应的成绩为x,由茎叶图可得,89×5=83+83+87+x+90+99,所以x=3.故污损的数字是3.
答案:3
4.甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:
(1)填写下表:
平均数
方差
中位数
命中9环及以上
甲
7
1.2
1
乙
5.4
3
(2)请从四个不同的角度对这次测试进行分析:
①从平均数和方差结合分析偏离程度;
②从平均数和中位数结合分析谁的成绩好些;
③从平均数和命中9环以上的次数相结合看谁的成绩好些;
④从折线图上两人射击命中环数及走势分析谁更有潜力.
解:(1)乙的打靶环数依次为2,4,6,8,7,7,8,9,9,10.所以乙=(2+4+6+8+7+7+8+9+9+10)=7;乙的打靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是=7.5;甲的打靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:
平均数
方差
中位数
命中9环及以上
甲
7
1.2
7
1
乙
7
5.4
7.5
3
(2)①甲、乙的平均数相同,均为7,但s<s,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.
②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙打靶成绩比甲好.
③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的打靶成绩比甲好.
④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.
[A 基础达标]
1.已知数据x1,x2,x3,…,xn是上海普通职工n(n≥3,n∈N*)个人的年收入,设这n个数据的中位数为x,平均数为y,方差为z,如果再加上世界首富的年收入xn+1,则这n+1个数据中,下列说法正确的是( )
A.年收入平均数大大增大,中位数一定变大,方差可能不变
B.年收入平均数大大增大,中位数可能不变,方差变大
C.年收入平均数大大增大,中位数可能不变,方差也不变
D.年收入平均数可能不变,中位数可能不变,方差可能不变
解析:选B.插入大的极端值,平均数增加,中位数可能不变,方差也因为数据更加分散而变大.
2.在某次高中学科竞赛中,4 000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中有误的是( )
A.成绩在[70,80)分的考生人数最多
B.不及格的考生人数为1 000
C.考生竞赛成绩的平均分为70.5分
D.考生竞赛成绩的中位数为75分
解析:选D.A选项,由频率分布直方图可得成绩在[70,80)的频率最高,因此考生人数最多,故A正确;B选项,由频率分布直方图可得成绩在[40,60)的频率为0.25,因此,不及格的人数为4 000×0.25=1 000,故B正确;C选项,由频率分布直方图可得平均分等于45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,故C正确;D选项,因为成绩在[40,70)的频率为0.45,成绩在[70,80)的频率为0.3,所以中位数为70+10×≈71.67,故D错误.故选D.
3.(2019·广东省惠州市期末考试)某班有50名学生,男女人数不相等.随机询问了该班5名男生和5名女生的某次数学测试成绩,用茎叶图记录如图所示,则下列说法一定正确的是( )
A.这5名男生成绩的标准差大于这5名女生成绩的标准差
B.这5名男生成绩的中位数大于这5名女生成绩的中位数
C.该班男生成绩的平均数大于该班女生成绩的平均数
D.这种抽样方法是一种分层抽样
解析:选A.5名男生成绩的平均数为=90,
5名女生成绩的平均数为=91,
这5名男生成绩的方差为×(22+42+22+42)=8,女生成绩的方差为×(22×3+32×2)=6,男生方差大于女生方差,所以男生标准差大于女生标准差,所以A对;
这5名男生成绩的中位数是90, 5名女生成绩的中位数为93,所以B错;
该班男生和女生成绩的平均数可通过样本估计,但不能通过样本计算得到平均数准确值,所以C错;若抽样方法是分层抽样,因为男生女生不等,所以分别抽取的人数不等,所以D错.故选A..
4.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高为1.60 m;从南方抽取了200个男孩,平均身高为1.50 m.由此可估计我国13岁男孩的平均身高为( )
A.1.57 m B.1.56 m
C.1.55 m D.1.54 m
解析:选B.从北方抽取了300个男孩,平均身高为1.60 m,
从南方抽取了200个男孩,平均身高为1.50 m,
则这500个13岁男孩的平均身高是=1.56,
据此可估计我国13岁男孩的平均身高为1.56 m,故选B.
5.甲、乙两位同学某学科的连续五次考试成绩用茎叶图表示如图所示,则平均分数较高的是________,成绩较为稳定的是________.
解析:甲=70,乙=68,s=×(22+12+12+22)=2,s=×(52+12+12+32)=7.2.
答案:甲 甲
6.某校从高二年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高二年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为________.
答案:480
7.某中学随机抽取部分高一学生调查其上学路上所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中上学路上所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].
(1)频率分布直方图中x的值为________;
(2)如果上学路上所需时间不少于1小时的学生可申请在学校住宿,若招生1 200名,估计新生中可以申请住校的学生有________名.
解析:(1)由频率分布直方图,可得20x+0.025×20+0.006 5×20+0.003×2×20=1,所以x=0.012 5.
(2)新生上学路上所需时间不少于1小时的频率为0.003×2×20=0.12,因为1 200×0.12=144,所以1 200名新生中约有144名学生可以申请住校.
答案:(1)0.012 5 (2)144
8.为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图:
(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);
(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为1,2,估计1-2 的值.
解:(1)设甲校高三年级学生总人数为n.
由题意知=0.05,解得n=600.
样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级这次联考数学成绩的及格率为1-=.
(2)设甲、乙两校样本平均数分别为1′,2′.
根据样本茎叶图可知30(1′-2′)=301′-302′
=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92
=2+49-53-77+2+92=15.
因此1′-2′=0.5.故1-2的估计值为0.5分.
9.某校高二期末统一测试,随机抽取一部分学生的数学成绩,分组统计如下表.
(1)求出表中m,n,M,N的值,并根据表中所给数据在给出的坐标系中画出频率分布直方图;
分组
频数
频率
[0,30]
3
0.03
(30,60]
3
0.03
(60,90]
37
0.37
(90,120]
m
n
(120,150]
15
0.15
合计
M
N
(2)若全校参加本次考试的学生有600人,试估计这次测试中全校成绩在90分以上的人数.
解:(1)由频率分布表得M==100,
所以m=100-(3+3+37+15)=42,n==0.42,
N=0.03+0.03+0.37+0.42+0.15=1.
频率分布直方图如图所示.
(2)由题意,知全校成绩在90分以上的学生的人数约为×600=342.
[B 能力提升]
10.设矩形的长为a,宽为b,其比满足b∶a=≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确的结论是( )
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次总体平均数与标准值接近程度相同
D.两个批次总体平均数与标准值接近程度不能确定
解析:选A.计算可得甲批次样本的平均数为0.617,乙批次样本的平均数为0.613,由此估计两个批次的总体平均数分别为0.617,0.613,则甲批次的总体平均数与标准值更接近.故选A.
11.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
则7个剩余分数的方差为( )
A. B.
C.36 D.
解析:选B.根据茎叶图,去掉1个最低分87,1个最高分99,
则[87+94+90+91+90+(90+x)+91]=91,
所以x=4.
所以s2=[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=.
12.某校从参加高一年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的部分频率分布直方图.在统计方法中,同一组数据常用该组区间的中点值作为代表,观察图形的信息,据此估计本次考试的平均分为________.
解析:在频率分布直方图中,所有小长方形的面积和为1,
设[70,80)的小长方形面积为x,则(0.01+0.015×2+0.025+0.005)×10+x=1,
解得x=0.3,
即该组频率为0.3,
所以本次考试的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
答案:71
13.某地区100位居民的人均月用水量(单位:t)的分组及各组的频数如下:
[0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;[2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4;[4,4.5),2.
(1)列出样本的频率分布表;
(2)画出频率分布直方图,并根据直方图估计这组数据的平均数、中位数、众数;
(3)当地政府制定了人均月用水量为3t的标准,若超出标准加倍收费,当地政府说,85%以上的居民不超过这个标准,这个解释对吗?为什么?
解:(1)频率分布表
分组
频数
频率
[0,0.5)
4
0.04
[0.5,1)
8
0.08
[1,1.5)
15
0.15
[1.5,2)
22
0.22
[2,2.5)
25
0.25
[2.5,3)
14
0.14
[3,3.5)
6
0.06
[3.5,4)
4
0.04
[4,4.5)
2
0.02
合计
100
1
(2)频率分布直方图如图:
众数:2.25,中位数:2.02,平均数:2.02.
(3)人均月用水量在3 t以上的居民所占的比例为6%+4%+2%=12%,即大约有12%的居民月用水量在3 t以上,88%的居民月用水量在3 t以下,因此政府的解释是正确的.
[C 拓展探究]
14.为提倡节能减排,同时减轻居民负担,广州市积极推进“一户一表”工程.非一户一表用户电费采用“合表电价”收费标准:0.65元/度.“一户一表”用户电费采用阶梯电价收取,其11月到次年4月起执行非夏季标准如下:
第一档
第二档
第三档
每户每月用电量
(单位:度)
[0,200]
(200,400]
(400,+∞)
电价(单位:元/度)
0.61
0.66
0.91
例如:某用户11月用电410度,采用合表电价收费标准,应交电费410×0.65=266.5(元),若采用阶梯电价收费标准,应交电费200×0.61+(400-200)×0.66+(410-400)×0.91=263.1(元).
为调查阶梯电价是否能取到“减轻居民负担”的效果,随机调查了该市100户居民的11月用电量,工作人员已经将90户的月用电量填在下面的频率分布表中,最后10户的月用电量(单位:度)为88、268、370、140、440、420、520、320、230、380.
组别
月用电量
频数统计
频数
频率
①
[0,100]
②
(100,200]
③
(200,300]
④
(300,400]
⑤
(400,500]
⑥
(500,600]
合计
(1)完成频率分布表,并绘制频率分布直方图;
(2)根据已有信息,试估计全市住户11月的平均用电量(同一组数据用该区间的中点值作代表);
(3)设某用户11月用电量为x度(x∈N),按照合表电价收费标准应交y1元,按照阶梯电价收费标准应交y2元,请用x表示y1和y2,并求当y2≤y1时,x的最大值,同时根据频率分布直方图估计“阶梯电价”能否给不低于75%的用户带来实惠?
解:(1)频率分布表如下:
组别
月用电量
频数统计
频数
频率
①
[0,100]
4
0.04
②
(100,200]
12
0.12
③
(200,300]
24
0.24
④
(300,400]
30
0.3
⑤
(400,500]
26
0.26
⑥
(500,600]
4
0.04
合计
100
1
频率分布直方图如图:
(2)该100户用户11月的平均用电量
=50×0.04+150×0.12+250×0.24+350×0.3+450×0.26+550×0.04=324(度),
所以估计全市住户11月的平均用电量为324度.
(3)y1=0.65x,
y2=.
由y2≤y1得或
或,
解得x≤≈423.1.
因为x∈N,故x的最大值为423.
根据频率分布直方图,x≤423时的频率为0.04+0.12+0.24+0.3+23×0.002 6=0.759 8>0.75,
故估计“阶梯电价”能给不低于75%的用户带来实惠.
课件34张PPT。第五章 统计与概率第五章 统计与概率√××本部分内容讲解结束按ESC键退出全屏播放