9.2 用样本估计总体
9.2.1 总体取值规律的估计
9.2.2 总体百分位数的估计
基础知识
1.频率分布直方图
(1)频率分布直方图的纵坐标是 ,每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等于这一组数对应的频率,所有矩形的面积之和为 .
(2)除频率分布直方图外,还有其他统计图吗
(3)频率分布直方图的组数对数据分析有何影响
2.百分位数
(1)第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算一组n个数据的第p百分位数的步骤:
第1步,按 排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的 .
基础巩固
一、单选题
1.一组数据为6,47,49,15,42,41,7,39,43,40,36,且这组数据的一个四分位数是15,则它是第 百分位数. ( )
A.15 B.25 C.50 D.75
2.将容量为100的样本数据,按由小到大排列分成8个小组,如表所示:
组号 1 2 3 4 5 6 7 8
频数 10 13 14 14 15 13 12 9
第3组的频率和累积频率为 ( )
A.0.14和0.37 B.和
C.0.03和0.06 D.和
3.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为 ( )
A.6 B.8 C.12 D.18
4.如图是根据某中学为地震灾区捐款的情况而制作的统计图.已知该校在校学生3 000人,根据统计图计算该校捐款总额为 ( )
A.10 500 B.12 870 C.14 400 D.37 770
二、多选题
5.5月6日,小明同学因发热而住院,下图是根据护士为他测量的体温所绘制的体温折线图.
根据图中的信息可得 ( )
A.护士每隔6小时给小明测量一次体温
B.近三天来,小明的最低体温38摄氏度
C.从体温看,小明的病情在不断好转
D.如果连续36小时体温不超过37.2摄氏度的话,可认为基本康复,那么小明最快5月10日凌晨5时出院
6.为了解人们对环保知识的认知情况,某调查机构对A地区随机选取n个居民进行了环保知识问卷调查(满分为100分),并根据问卷成绩(不低于60分记为及格)绘制成如图所示的频率分布直方图(分为[40,50),[50,60),[60,70),[70,80),[80,90),
[90,100)六组),若问卷成绩最后三组频数之和为360,则 ( )
A.n=480
B.问卷成绩在[70,80)内的频率为0.3
C.a=0.030
D.以样本估计总体,若对A地区5 000人进行问卷调查,则约有1 250人不及格
三、填空题
7.已知30个数据的60%分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是 .
8.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,则样本在[40,50),[50,60)内的数据个数之和为 .
四、解答题
9.生产过程中,测得纤维产品的纤度(表示纤细的一种量),共有100个数据,将数据分组如下表:
分组 频数 频率
[1.30,1.34) 4
[1.34,1.38) 25
[1.38,1.42) 30
[1.42,1.46) 29
[1.46,1.50) 10
[1.50,1.54] 2
合计 100
(1)完成频率分布表,并画出频率分布直方图;
(2)估计纤度落在[1.38,1.50)内的可能性及纤度小于1.42的可能性各是多少
10.为了了解学生参加体育活动的情况,某校对学生进行了随机抽样调查,其中一个问题是“你平均每天参加体育活动的时间是多少”,共有4个选项可供选择:
A.1.5小时以上 B.1~1.5小时
C.0.5~1小时 D.0.5小时以下
如图是根据调查结果绘制的两幅不完整的统计图,请你根据统计图中提供的信息解答以下问题:
(1)本次一共调查了多少名学生
(2)在图(1)中将选项B对应的部分补充完整;
(3)若该校有3 000名学生,你估计全校有多少名学生平均每天参加体育活动的时间在0.5小时以下
素养提升
一、选择题
1.下面是两户居民家庭全年各项支出的统计图.
根据统计图,下列对两户教育支出占全年总支出的百分比作出的判断中,正确的是 ( )
A.甲户比乙户大
B.乙户比甲户大
C.甲、乙两户一样大
D.无法确定哪一户大
2.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意程度越高,现随机抽取6位小区居民,他们的幸福感指数分别为5,6,7,8,9,5,则这组数据的第80百分位数是 ( )
A.7 B.7.5 C.8 D.9
二、填空题
3.某学校随机抽取部分新生调查其从家到学校所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].则
(1)图中的x= ;
(2)若从家到学校所需时间不少于1小时的学生可申请在学校住宿,则该校600名新生中估计有 名学生可以申请住宿.
4.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)[25,30)年龄组对应小矩形的高度为 ;
(2)由频率分布直方图估计志愿者年龄的85%分位数为 岁.
三.解答题
5.为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名考生参加了这次竞赛,为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频率分布表和频率分布直方图,解答下列问题:
分组 频数 频率
[50,60) 4 0.08
[60,70) 0.16
[70,80) 10
[80,90) 16 0.32
[90,100]
合计 50
(1)填充频率分布表的空格(将答案直接填在表格内).
(2)补全频率分布直方图.
(3)若成绩在[70,90)分的学生为二等奖,问该校获得二等奖的学生约为多少人
6.从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的第25,50,95百分位数;
(2)请你找出珍珠质量较小的前15%的珍珠质量;
(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.9.2 用样本估计总体
9.2.1 总体取值规律的估计
9.2.2 总体百分位数的估计
基础知识
1.(1) 1
(2)条形图、扇形图、折线图、频数分布直方图.
(3)当组数少、组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原始数据信息;当组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则,不容易看出总体数据的分布特点.
2.(1)p% (2)从小到大 平均数
基础巩固
1.B 由小到大排列的结果:6,7,15,36,39,40,41,42,43,47,49,一共11项.由11×25%=2.75,故第25百分位数是15.
2.A 由表可知,第三小组的频率为=0.14,累积频率为=0.37.
3.C 志愿者的总人数为=50,所以第三组人数为50×0.36×1=18,所以有疗效的人数为18-6=12.
4.D 根据统计图,得高一人数为3 000×32%=960(人),捐款960×15=14 400(元);
高二人数为3 000×33%=990(人),
捐款990×13=12 870(元);
高三人数为3 000×35%=1 050(人),捐款1 050×10=10 500(元).所以该校学生共捐款14 400+12 870+10 500=37 770(元).
5.AC 根据横轴表示的意义,可知护士每隔6小时给小明测量一次体温.
从折线统计图中的最高点和最低点对应的纵轴意义,可知近三天最低体温是36.8摄氏度.
从图中可知小明的体温已经下降,并趋于稳定,因此病情在好转.
5月8日18时小明的体温是37摄氏度.其后的体温未超过37.2摄氏度,自5月8日18时起计算,连续36小时后对应的时间为5月10日凌晨6时.因此小明最快可以在5月10凌晨6时出院.
6.BCD 由(0.010+0.015+0.015+a+0.025+0.005)×10=1,得a=0.030,
n==600,故A不正确,C正确.成绩在[70,80)内的频率为10a=0.3,故B正确.若对A地区5 000人进行问卷调查,则约有5 000×(0.1+0.15)=1 250人不及格,故D正确.
7.解析:由30×60%=18,设第19个数据为x,则=8.2,解得x=8.6,即第19个数据是8.6.
答案:8.6
8.解析:根据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.
因为样本中数据在[20,60)内的频率为0.6,样本容量为50,所以=0.6,
解得x+y=21.即样本在[40,50),[50,60)内的数据个数之和为21.
答案:21
9.解析:(1)频率分布表如下:
分组 频数 频率
[1.30,1.34) 4 0.04
[1.34,1.38) 25 0.25
[1.38,1.42) 30 0.30
[1.42,1.46) 29 0.29
[1.46,1.50) 10 0.10
[1.50,1.54] 2 0.02
合计 100 1.00
频率分布直方图如图所示.
(2)利用样本估计总体,则纤度落在[1.38,1.50)的可能性即为纤度落在[1.38,1.50)的频率,即为0.30+0.29+0.10=0.69=69%.
纤度小于1.42的可能性即为纤度小于1.42的频率,即为0.04+0.25+0.30=0.59=
59%.
10.解析:(1)由图(1)知,选A的人数为60,而图(2)显示,选A的人数占总人数的30%,故本次调查的总人数为60÷30%=200.
(2)由图(2)知,选B的人数占总人数的50%,因此其人数为200×50%=100,图(1)补充如图所示:
(3)根据图(2)知:平均每天参加体育活动的时间在0.5小时以下的人数占统计人数的5%,以此估计得3 000×5%=150(人).
素养提升
1.B 条形统计图反映具体数值,则由图甲可知,甲户教育支出占全年总支出的百分比为1 200÷(1 200+2 000+1 200+1 600)×100%=20%;从扇形统计图乙可知,乙户教育支出占全年总支出的百分比为25%.所以乙户比甲户大.
2.C 该组数据从小到大排列为:5,5,6,7,8,9,且6×80%=4.8.所以第80百分位数是第5个数,即8.
3.解析:(1)由频率分布直方图知20x=1-20×(0.025+0.006 5+0.003+0.003),
解得x=0.012 5.
(2)从家到学校时间不少于1小时的学生的频率为0.003×2×20=0.12,因此估计有0.12×600=72(人)可以申请住宿.
答案:(1)0.012 5 (2)72
4.解析:(1)设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.
(2)由图可知,年龄小于35岁的频率为(0.01+0.04+0.07)×5=0.6,年龄小于40岁的频率为(0.01+0.04+0.07+0.06)×5=0.9,
所以志愿者年龄的85%分位数在[35,40)内,
因此志愿者年龄的85%分位数为35+×5≈39(岁).
答案:(1)0.04 (2)39
5.解析:(1)
分组 频数 频率
[50,60) 4 0.08
[60,70) 8 0.16
[70,80) 10 0.20
[80,90) 16 0.32
[90,100] 12 0.24
合计 50 1.00
(2)频率分布直方图如图所示:
(3)因为成绩在[70,80)间的学生频率为0.20;
成绩在[80,90)间的学生频率为0.32.
所以在[70,90)之间的频率为0.20+0.32=0.52.
又因为900名学生参加竞赛,所以该校获二等奖的学生为900×0.52=468(人).
6.解析:(1)将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,所以12×25%=3,12×50%=6,12×95%=11.4,
则第25百分位数是=8.15,
第50百分位数是=8.5,
第95百分位数是第12个数据为9.9.
(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.
即珍珠质量较小的前15%的珍珠有2个,它们的质量分别为7.8,7.9.
(3)由(1)可知样本数据的第25百分位数是8.15 g,第50百分位数为8.5 g,第95百分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于或等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.