§9.2 用样本估计总体
9.2.1 总体取值规律的估计
第1课时 总体取值规律的估计
1.对于频率分布直方图,下列说法中正确的是( )
A.小长方形的高表示取某数的频率
B.小长方形的高表示该组个体在样本中出现的频数
C.小长方形的高表示该组个体在样本中出现的频率与组距的比
D.小长方形的高表示该组个体在样本中出现的频数与组距的比
2.将样本容量为100的样本数据,按从小到大的顺序分为8组,如表:
组号 1 2 3 4 5 6 7 8
频数 10 13 x 14 15 13 12 9
第三组的频数和频率分别是( )
A.14和0.14 B.0.14和14
C.和0.14 D.和
3.统计某校1 000名学生的数学测试成绩(单位:分),得到样本的频率分布直方图如图所示.若满分为100分,规定不低于60分为及格,则及格率是( )
A.20% B.25% C.60% D.80%
4.在抽查产品尺寸的过程中,将其尺寸分成若干组,[a,b)是其中的一组,该组的频率为m,在频率分布直方图中,该组的小长方形的高为h,则|a-b|等于( )
A.hm B. C. D.h+m
5.学校为了调查学生在课外读物方面的支出情况,抽取了一个样本容量为n的样本,其频率分布直方图如图所示,其中支出(单位:元)在[50,60]内的学生有30人,则n的值为( )
A.100 B.1 000 C.90 D.900
6.(多选)将样本容量为100的样本数据分为4组:[2,6),[6,10),[10,14),[14,18],得到频率分布直方图如图所示,则下列说法中正确的是( )
A.样本数据分布在[6,10)内的频率为0.32
B.样本数据分布在[10,14)内的频数为40
C.样本数据分布在[2,10)内的频数为40
D.估计总体数据大约有10%分布在[10,14)内
7.在样本的频率分布直方图中,共有5个小长方形,已知中间一个小长方形面积是其余4个小长方形面积之和的,且中间一组的频数为10,则样本容量是______.
8.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品个数是________.
9.手机支付也称为移动支付(Mobile Payment),是当今社会比较流行的一种付款方式.某金融机构为了了解移动支付在大众中的熟知度,对15岁到65岁的人群作了问题为“你会使用移动支付吗?”的调查,把回答“会”的100个人按照年龄分成5组,绘制成如图所示的频数分布表和频率分布直方图.
组数 第1组 第2组 第3组 第4组 第5组
分组 [15,25) [25,35) [35,45) [45,55) [55,65]
频数 x 35 y 12 3
(1)求x,y,a的值;
(2)若从第1,3组中用比例分配的分层随机抽样方法抽取5人,求从两组中分别抽取的人数.
10.从全校参加期末考试的试卷中抽取一个样本,考察成绩(均为整数,单位:分)的分布,将样本分成5组,绘成如图所示的频率分布直方图,从左到右各小组的小矩形的高之比为2∶3∶6∶4∶1,最左边的一组频数为6.
(1)求样本容量;
(2)求105.5~120.5这一组的频数及频率;
(3)如果成绩大于120分为优秀,估计这次考试成绩的优秀率.
11.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不低于60分的学生人数为( )
A.588 B.480 C.450 D.120
12.某直播间从参与购物的人群中随机选出200人,并将这200人按年龄分组,得到的频率分布直方图如图所示,则在这200人中年龄在[25,35)的人数n及直方图中a的值是( )
A.n=35,a=0.032 B.n=35,a=0.32
C.n=30,a=0.035 D.n=30,a=0.35
13.(多选)供电部门对某社区1 000位居民12月份人均用电情况进行统计后,按人均用电量分为[0,10),[10,20),[20,30),[30,40),[40,50]五组,整理得到如图所示的频率分布直方图,则有关这1 000位居民,下列说法正确的是( )
A.12月份人均用电量人数最多的一组有400人
B.12月份人均用电量在[20,30)内的有300人
C.12月份人均用电量不低于20度的有500人
D.在这1 000位居民中用比例分配的分层随机抽样方法抽取10位居民协助收费,抽到的居民用电量在[30,40)一组的人数为2
14.某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成如图所示的频率分布直方图,其中,上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].则:
(1)图中的x=________;
(2)若上学所需时间不少于1小时的学生可申请在学校住宿,则该校600名新生中估计有________名学生可以申请住宿.
15.某校高一年级1 000名学生在一次考试中成绩(单位:分)的频率分布直方图如图所示,现用比例分配的分层随机抽样方法从成绩在[40,70)内的学生中共抽取80名学生,则抽取成绩在[50,60)内的学生人数是( )
A.20 B.30 C.40 D.50
16.为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分,单位:分)进行统计.得到如下不完整的频率分布表和频数分布直方图.
分组 频数 频率
[50.5,60.5) 4 0.08
[60.5,70.5) 0.16
[70.5,80.5) 10
[80.5,90.5) 16 0.32
[90.5,100.5]
合计 50
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频数分布直方图;
(3)若成绩在[75.5,85.5)中的学生获得二等奖,问获得二等奖的学生约为多少人?
§9.2 用样本估计总体
9.2.1 总体取值规律的估计
第1课时 总体取值规律的估计
1.C 2.A 3.D 4.B 5.A 6.ABC
7.40
8.90
解析 ∵样本中产品净重小于100克的频率为
(0.050+0.100)×2=0.3,频数为36,
∴样本容量为=120.
∵样本中净重大于或等于98克并且小于104克的产品的频率为
(0.100+0.150+0.125)×2=0.75,
∴样本中净重大于或等于98克并且小于104克的产品个数为
120×0.75=90.
9.解 (1)由题意可知,
x=0.02×10×100=20,
所以y=100-(20+35+12+3)
=30,
所以a=×=0.03.
(2)由(1)知,第1,3组共有50人,
所以抽取的比例为,
则从第1组中抽取的人数为
20×=2,
从第3组中抽取的人数为
30×=3.
10.解 在频率分布直方图中频数之比等于频率之比,且样本的所有频率之和等于1.
(1)小矩形的高之比为频率之比,
∴从左到右各小组的频率之比为
2∶3∶6∶4∶1,
∴最左边的一组所占的频率为=,
∴样本容量===48.
(2)105.5~120.5这一组的频率为=,
∴频数为48×=18.
(3)成绩大于120分的频率为=,
∴考试成绩的优秀率约为×100%=31.25%.
11.B 12.C
13.ABC [根据频率分布直方图知,12月份人均用电量人数最多的一组是[10,20),有1 000×0.04×10=400(人),A正确;12月份人均用电量在[20,30)内的人数为1 000×0.03×10=300,B正确;12月份人均用电量不低于20度的频率是(0.03+0.01+0.01)×10=0.5,有1 000×0.5=500(人),C正确;用电量在[30,40)内的有0.01×10×1 000=100(人),所以在这1 000位居民中用比例分配的分层随机抽样方法抽取10位居民协助收费,抽到的居民用电量在[30,40)一组的人数为×10=1,D错误.]
14.(1)0.012 5 (2)72
解析 (1)由频率分布直方图知
20x=1-20×(0.025+0.006 5+0.003+0.003),
解得x=0.012 5.
(2)上学时间不少于1小时的学生的频率为0.003×2×20=0.12,因此估计该校600名新生中约有0.12×600=72(名)学生可以申请住宿.
15.B [从频率分布直方图可以看出成绩在[40,50),[50,60),[60,70)内的频率之比为
0.005∶0.015∶0.020=1∶3∶4,
所以抽取成绩在[50,60)内的学生人数为80×=30.]
16.解 (1)如下表所示.
分组 频数 频率
[50.5,60.5) 4 0.08
[60.5,70.5) 8 0.16
[70.5,80.5) 10 0.20
[80.5,90.5) 16 0.32
[90.5,100.5] 12 0.24
合计 50 1.00
(2)如图所示.
(3)成绩在[75.5,80.5)中的学生人数约占成绩在[70.5,80.5)中的学生人数的,因为成绩在[70.5,80.5)中的频率为0.2,
所以成绩在[75.5,80.5)中的频率约为0.1.
成绩在[80.5,85.5)中的学生人数约占成绩在[80.5,90.5)中的学生人数的,因为成绩在[80.5,90.5)中的频率为0.32,所以成绩在[80.5,85.5)中的频率约为0.16,
所以成绩在[75.5,85.5)中的频率约为0.26.
由于有900名学生参加了这次竞赛,故该校获得二等奖的学生约为0.26×900=234(人).第2课时 统计图表的识别
1.某商业集团董事长想了解集团旗下五个超市的销售情况,通知五个超市经理把最近一周每天的销售金额统计上报,要求既要反映一周内每天销售金额的多少,又能反映一周内每天销售金额的变化情况和趋势,则最好选用的统计图表为( )
A.频率分布直方图 B.折线统计图
C.扇形统计图 D.统计表
2.已知全国农产品批发价格200指数月度变化情况如图所示,下列选项正确的是( )
A.全国农产品夏季价格比冬季低
B.全国农产品批发价格200指数2023年每个月逐渐增加
C.2023年“菜篮子”产品批发价格指数与农产品批发价格200指数的变化趋势基本保持一致
D.2023年6月农产品批发价格200指数大于116
3.某学校高一甲、乙两班进行了一次数学能力测试.两个班均有40人参加测试,测试成绩分为A,B,C,D四个等级,现将甲、乙两班的成绩分别绘制成如图所示的统计图.根据统计图提供的信息,下列说法错误的是( )
A.甲班D等级的人数最多
B.乙班A等级的人数最少
C.乙班B等级与C等级的人数相同
D.C等级的人数甲班比乙班多
4.如图为我国历次全国人口(单位:万人)普查人口性别构成及总人口性别比(以女性为100,男性对女性的比例)统计图,则下列说法错误的是( )
A.近三次全国人口普查总人口性别比呈递减趋势
B.我国历次全国人口普查总人口数呈逐次递增
C.第五次全国人口普查时,我国总人口数已经突破12亿
D.第七次人口普查时,我国总人口性别比最高
5.(多选)给出如图所示的三幅统计图及四个结论,其中正确的结论有( )
A.从折线图能看出世界人口的变化情况
B.2050年非洲人口将达到大约15亿
C.2050年亚洲人口比其他各洲人口的总和还要多
D.从1957年到2050年各洲中,北美洲人口增长速度最慢
6.(多选)某单位经工会委员会研究决定,2023年职工秋游活动定于9月份组织完成,并从以下五条路线中选择一条路线出游,甲:南国风情东山岛、苏峰山环岛路休闲一日游;乙:网红神仙村、翡翠湾休闲一日游;丙:长泰玛琪雅朵花海、寻梦谷休闲一日游;丁:华安宫畲文化村、二宜楼休闲一日游;戊:平和千年古刹三平寺一日游.该单位对参与选择秋游路线的职工进行抽样调查,并对秋游路线选择结果进行统计,将调查数据整理得到如下统计图:
若用样本估计总体,以下说法正确的是( )
A.29周岁以上参与选择秋游路线的职工人数占总参与人数的75%
B.51周岁以上的职工参与选择秋游路线人数最少
C.30~40周岁的职工可支付旅游费用最少
D.丁路线最受欢迎
7.如图是根据某中学为地震灾区捐款(单位:元)的情况而制作的统计图.已知该校在校学生为3 000人,根据统计图计算该校共捐款________元.
8.某校高一的320名学生,在计算机技能培训前后分别参加了一次水平相同的测试,分数都以统一标准划分成“不合格”“合格”“优秀”三个等级.为了了解计算机技能培训的效果,用抽签的方式得到其中32名学生的两次测试等级,绘制成如图所示的条形图.请结合图中信息回答下列问题:
(1)这32名学生经过培训后,等级“不合格”的百分比由________下降到________;
(2)估计该校高一全体学生中,培训后等级为“合格”和“优秀”的学生共有________名.
9.某省的有关部门要求各中小学要把“每天锻炼一小时”写入课程表,为了响应这一号召,某校围绕着“你最喜欢的体育活动项目是什么?”(只写一项)的问题,对在校学生进行了随机抽样调查,从而得到一组数据.图1是根据这组数据绘制的条形统计图.请结合统计图回答下列问题:
(1)该校对多少名学生进行了抽样调查?
(2)在本次抽样调查中,最喜欢篮球活动的有多少人?占被调查人数的百分比是多少?
(3)若该校九年级共有200名学生,图2是根据各年级学生人数占全校学生总人数的百分比绘制的扇形统计图,请你估计全校学生中最喜欢跳绳活动的人数为多少?
10.为了推进分级诊疗,实现“基层首诊、双向转诊、急慢分治、上下联动”的诊疗模式,某城市自2020年起全面推行家庭医生签约服务.已知该城市居民约有1 000万人,从0岁到100岁的居民年龄结构的频率分布直方图如图1所示.为了解各年龄段居民签约家庭医生的情况,现调查了1 000名年满18周岁的居民,各年龄段被访者签约率如图2所示.
(1)估计该城市50岁及以上且已签约家庭医生的居民人数;
(2)据统计,该城市被访者的签约率约为44%.为把该城市年满18周岁居民的签约率提高到55%以上,应着重提高图2中哪个年龄段的签约率?并根据已有数据陈述理由.
11.为了解我国在芯片、软件方面的潜力,某调查机构对我国若干大型科技公司进行调查统计,得到了这两个行业从业者的年龄分布扇形图和“90后”从事这两个行业的岗位分布雷达图,则下列说法中不一定正确的是( )
A.芯片、软件行业从业者中,“90后”占总人数的比例超过50%
B.芯片、软件行业中从事技术、设计岗位的“90后”人数超过总人数的25%
C.芯片、软件行业从事技术岗位的人中,“90后”比“80后”多
D.芯片、软件行业中,“90后”从事市场岗位的人数比“80前”的总人数多
12.(多选)睡眠很重要,教育部《关于进一步加强中小学生睡眠管理工作的通知》中强调“小学生每天睡眠时间应达到10小时,初中生应达到9小时,高中生应达到8小时”.某机构调查了1万个学生的睡眠时间,利用信息得出如图所示的折线统计图,则以下判断错误的有( )
A.高三年级学生平均学习时间最长
B.中小学生的平均睡眠时间都没有达到《通知》中的标准,其中高中生平均睡眠时间最接近标准
C.大多数年龄段学生平均睡眠时间长于学习时间
D.与高中生相比,大学生平均学习时间大幅下降,释放出的时间基本是在睡眠
13.图1为某省2023年1~4月份快递业务量(单位:万件)统计图,图2为该省2023年1~4月份快递业务收入(单位:万元)统计图,则对统计图理解不正确的是( )
A.2023年1~4月份快递业务量3月份最高,2月份最低,差值接近2 000万件
B.从1~4月份来看,业务量与业务收入有波动,但整体保持高速增长
C.从两图中看,增量与增长速度并不完全一致,但业务量与业务收入变化高度一致
D.2023年1~4月份快递业务量同比增长率均超过50%,在3月份最高,和春节后网购迎来喷涨有关
14.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的扇形图.
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少了
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
15.新能源共享汽车入驻某地一周年以来,因其“绿色出行,低碳环保”的理念而备受人们的喜爱,值此周年之际,某机构为了了解新能源共享汽车使用者的年龄段、使用频率、满意度三个方面的信息,在全市范围内发放5 000份调查问卷,并将回收到的有效问卷3 125份为样本,现从中随机抽取80份,分别对使用者的年龄段、26~35岁使用者的使用频率、26~35岁使用者的满意度进行汇总,得到如下三个表格:
表(一)
使用者年龄段 25岁及以下 26~35岁 36~45岁 46岁及以上
人数 20 40 10 10
表(二)
使用频率 0~6次/月 7~14次/月 15~22次/月 23~31次/月
人数 5 10 20 5
表(三)
满意度 非常满意(9~10) 满意(8~9) 一般(7~8) 不满意(6~7)
人数 15 10 10 5
(1)依据上述表格完成下列三个统计图形;
(2)某城区现有常住人口30万,试估计该城区年龄在26~35岁之间,每月使用新能源共享汽车在7~14次的人数.
第2课时 统计图表的识别
1.B 2.C 3.D 4.D 5.AC
6.BCD [对于A,根据扇形图得,29周岁以下参与选择秋游路线的职工人数占总参与人数的20%,
所以29周岁以上参与选择秋游路线的职工人数占总参与人数的80%,故A错误;
对于B,根据扇形图得,51周岁以上的职工参与选择秋游路线人数占比为10%,对应人数最少,故B正确;
对于C,根据折线图得,30~40周岁的职工可支付旅游费用最少,故C正确;
对于D,根据条形图得,丁路线被选择的占比最高,最受欢迎,故D正确.]
7.37 770 8.(1)75% 25% (2)240
9.解 (1)由图1知,4+8+10+18+10=50(名),即该校对50名学生进行了抽样调查.
(2)在本次抽样调查中,最喜欢篮球活动的有18人,占被调查人数的百分比为×100%=36%.
(3)九年级人数占比为1-(30%+26%+24%)=20%,全校总人数有200÷20%=1 000(人),最喜欢跳绳活动的有×1 000=160(人),即估计全校学生中最喜欢跳绳活动的人数为160.
10.解 (1)估计该城市50~60岁签约的居民有1 000×0.015×10×55.7%=83.55(万人);60~70岁签约的居民有1 000×0.010×10×61.7%=61.7(万人);70~80岁签约的居民有1 000
×0.004×10×70.0%=28(万人);80岁及以上签约的居民有1 000×0.003×10×75.8%=22.74(万人).
故估计该城市50岁及以上且已签约家庭医生的居民有83.55+61.7+28+22.74=195.99(万人).
(2)着重提高30~50岁年龄段的签约率.由题意可估计该城市年龄在10~20岁的居民有
1 000×0.005×10=50(万人);年龄在20~30岁的居民有1 000×0.018×10=180(万人).
所以估计该城市居民年龄在18~30岁的人数大于180万,小于230万,签约率为30.3%;
估计该城市居民年龄在30~50岁的有1 000×0.037×10=370(万人),签约率为37.1%;
估计该城市居民年龄在50岁及以上的有1 000×0.032×10=320(万人),签约率超过55%,上升空间不大.
故由以上数据可知该城市居民在30~50岁这个年龄段的人数约为370万,与其他年龄段相比人数是最多的,且签约率与55%相比较低,
所以为把该城市满18周岁居民的签约率提高到55%以上,应着重提高30~50岁这个年龄段的签约率.
11.C [对于A,芯片、软件行业从业者中,“90后”占总人数的55%,故A正确;
对于B,芯片、软件行业中从事技术、设计岗位的“90后”占总人数的(37%+13%)×55%=27.5%,故B正确;
对于C,芯片、软件行业中从事技术岗位的“90后”占总人数的37%×55%=20.35%,“80后”占总人数的40%,但从事技术岗位的“80后”占总人数的百分比不知道,无法确定两者的人数多少,故C不一定正确;
对于D,芯片、软件行业中从事市场岗位的“90后”占总人数的14%×55%=7.7%,“80前”占总人数的5%,故D正确.]
12.AD [根据题图可知,高三年级学生平均学习时间没有高二年级学生平均学习时间长,A选项错误;
根据题图可知,中小学生的平均睡眠时间都没有达到《通知》中的标准,其中高中生平均睡眠时间最接近标准,B选项正确;
学习时间长于睡眠时间的有初二、初三、高一、高二、高三,占比为,睡眠时间长于学习时间的占比为,C选项正确;
从高三到大学一年级,学习时间减少了9.65-5.71=3.94(小时/天),睡眠时间增加了8.52-7.91=0.61(小时/天),D选项错误.]
13.B [从图1柱形图可得2023年1~4月份快递业务量3月份最高,2月份最低,3月份比2月份高
4 397-2 411=1 986,差值接近2 000万件,故A正确;
从1~4月份来看,业务量与业务收入有波动,结合图1、图2中的柱形图可得业务量与业务收入在2月份和4月份均下降,故B错误;
从两柱状图可得C正确;
从图1中可得2023年1~4月份快递业务量同比增长率均超过50%,在3月份最高,这和春节后网购迎来喷涨有关,故D正确.]
14.A [设新农村建设前的经济收入为m(m>0)元,则新农村建设后的经济收入为2m元.
A选项,0.37×2m-0.60m=0.14m>0,种植收入增加了,故A不正确;
B选项,=1.5>1,其他收入增加了一倍以上,故B正确;
C选项,=1,养殖收入增加了一倍,故C正确;
D选项,新农村建设后,养殖收入与第三产业收入的总和在经济收入中所占的比例为30%+28%=58%>50%,故D正确.]
15.解 (1)根据表中数据得,三个统计图如图所示.
(2)由题中表(一),知样本中26~35岁使用者的人数为40,占总抽取人数的一半,所以用样本估计总体,该城区30万人口中年龄在26~35岁的约有30×=15(万人);
又样本中年龄在26~35岁的使用者每月使用新能源共享汽车在7~14次的有10人,占总抽取人数的,所以用样本估计总体,该城区年龄在26~35岁的15万人中每月使用新能源共享汽车7~14次的约有15×=3.75(万人).
所以估计该城区年龄在26~35岁常住人口中每月使用新能源共享汽车7~14次的人数约为3.75万.