(共72张PPT)
9.2 用样本估计总体
9.2.1 总体取值规律的估计
第九章 统 计
学习指导 核心素养
1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性. 2.结合实例,能用样本估计总体的取值规律. 数据分析:利用频率分布表、频率分布直方图、条形图、扇形图、折线图等对总体进行估计.
01
必备知识 落实
知识点一 频率分布直方图的画法
从某校高三学生中抽取50名参加数学竞赛,成绩分组(单位:分)及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表(含累积频率);
【解】 频率分布表如下:
成绩分组 频数 频率 累积频率
[40,50) 2 0.04 0.04
[50,60) 3 0.06 0.1
[60,70) 10 0.2 0.3
[70,80) 15 0.3 0.6
[80,90) 12 0.24 0.84
[90,100] 8 0.16 1.00
合计 50 1.00
(2)画出频率分布直方图.
【解】 频率分布直方图如图所示.
绘制频率分布直方图时的注意事项
(1)制作好频率分布表后,可以利用各组的频率之和是不是1来检验该表是否正确.
(2)计算极差需要找出这组数据的最大值和最小值,当数据很多时,可选一个数当参照.
(3)将数据分成互不相交的组,目的是要描述数据分布规律,要根据数据的多少来确定分组数目,一般来说,数据越多,分组越多.
(4)频率分布直方图的纵坐标是频率/组距,而不是频率.
为了了解某学校高一年级男生的身高情况,选取一个容量为60的样本(60名男生的身高),分组情况如下(单位:cm):
分组 [147.5,155.5) [155.5,163.5) [163.5,171.5) [171.5,179.5]
频数 6 21 27 m
频率 a 0.1
(1)求出表中a,m的值;
(2)画出频率分布直方图.
解:作出频率分布直方图如图所示.
知识点二 其他统计图表
统计图表 主要应用
扇形图 直观描述各类数据占总数的比例
条形图和直方图 直观描述不同类别或分组数据的频数和频率
折线图 描述数据随时间的变化趋势
(1)(多选)某班级在一次数学竞赛中为全班学生设置了一等奖、二等奖、三等奖以及参与奖,各个奖品的单价分别为一等奖18元、二等奖8元、三等奖4元、参与奖2元,获奖人数的分配情况如图,则以下说法正确的是( )
A.获得参与奖的人数最多
B.各个奖项中参与奖的总费用最高
C.购买每件奖品费用的平均数为4元
D.购买的三等奖的奖品件数是一、二等奖的奖品件数和的2倍
√
√
√
【解析】 设全班人数为a.
由题图可知,一等奖占5%,二等奖占10%,三等奖占
30%,则参与奖占55%,获得参与奖的人数最多,故A正确.
各奖项的费用:一等奖5%a×18=0.9a,二等奖10%a×8=0.8a,三等奖30%a×4=1.2a,参与奖55%a×2=1.1a,可知各个奖项中三等奖的总费用最高,故B错误.
平均费用为5%×18+10%×8+30%×4+55%×2=4(元),故C正确.
一等奖奖品数为5%a,二等奖奖品数为10%a,三等奖奖品数为30%a,故D正确.故选ACD.
(2)某家庭2020年收入的各种用途占比统计如图1所示,2021年收入的各种用途占比统计如图2所示.已知2021年的“旅行”费用比2020年增加了3 500元,则该家庭2021年的“衣食住”费用比2020年增加了( )
A.2 000元 B.2 500元
C.3 000元 D.3 500元
√
【解析】 设该家庭2020年的收入为x元,2021年的收入为y元.由题意得35%y-35%x=3 500,即y-x=10 000,所以2021年的“衣食住”费用比2020年增加了25%y-25%x=2 500(元).
条形图、扇形图和折线图的区别与联系
统计图 区别 联系
条形图 (1)直观反映数据分布的大致情况; (2)清晰地表示各个区间的具体数目; (3)会丢失数据的部分信息 在同一组数据的不同统计图表中,计算出相应组的频数、频率应该相等
扇形图 (1)清楚地看出数据分布的总体趋势及各部分所占总体的百分比; (2)丢失了原来的具体数据 统计图 区别 联系
折线图 (1)表示数据的多少和数量增减变化情况; (2)制作过程类似于函数图象的画法,侧重体现数据的变化规律 在同一组数据的不同统计图表中,计算出相应组的频数、频率应该相等
1.(多选)某网店2021年全年的月收支数据如图所示,则针对2021年这一年的收支情况,下列说法正确的是( )
A.月收入的极差为60万元
B.7月份的利润最大
C.这12个月利润的平均数在30万元以上
D.这一年的总利润超过400万元
√
√
√
解析:由题图可知月收入的极差为90-30=60(万元),
故A正确.
1至12月份的利润(单位:万元)分别为:20,30,20,10,
30,30,60,40,30,30,50,30.其中7月份的利润最大,故B正确.
2.如图是根据某中学为地震灾区捐款的情况而制作的统计图,已知该校在校学生3 000人,根据统计图计算该校共捐款________元.
解析:由题图,得高一人数为3 000×32%=960,
捐款数是960×15=14 400(元);
高二人数为3 000×33%=990,
捐款数是990×13=12 870(元);
高三人数为3 000×35%=1 050,
捐款数是1 050×10=10 500(元).
所以该校学生共捐款14 400+12 870+10 500=37 770(元).
答案:37 770
02
关键能力 提升
考点 频率分布直方图的应用
为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本量是多少?
(2)若次数在110次以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
1.(变设问)在本例条件下,求样本中不达标的学生人数是多少?
解:由例3(1)(2)知达标率为88%,样本量为150,不达标的学生频率为1-0.88=0.12.
所以样本中不达标的学生人数为150×0.12=18.
2.(变设问)在本例条件下,求第三小组的频数是多少?
某校100名学生期中考试语文成绩(单位:分)的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值;
解:依题意得,10×(2a+0.02+0.03+0.04)=1,
解得a=0.005.
(2)若这100名学生的语文成绩在某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.
分数段 [50,60) [60,70) [70,80) [80,90]
x∶y 1∶1 2∶1 3∶4 4∶5
03
课堂巩固 自测
1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )
A.总体容量越大,估计越精确 B.总体容量越小,估计越精确
C.样本容量越大,估计越精确 D.样本容量越小,估计越精确
解析:用样本的频率分布估计总体的频率分布时,在总体一定时,样本的容量越大,估计就越精确.
√
2.一个容量为20的样本数据,将其分组如下表:
则样本在区间(-∞,50)上的频率为( )
A.0.5 B.0.25
C.0.6 D.0.7
分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]
数量 2 3 4 5 4 2
√
3.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.6 B.8 C.12 D.18
√
√
04
课后达标 检测
[A 基础达标]
1.一个频率分布表(样本量为30)不小心被损坏了一部分,只记得样本中数据在[20,60]上的频率为0.8,则估计样本在[40,60]内的频数为( )
A.14 B.15
C.16 D.17
分组 [10,20) [20,30) [30,40)
频数 3 4 5
√
解析:因为一个频率分布表(样本量为30)不小心被损坏了一部分,只记得样本中数据在[20,60]上的频率为0.8,所以样本中数据在[20,60]上的频数为30×0.8=24,所以估计样本在[40,60]内的频数为24-4-5=15.故选B.
2.某中学初中部共有120名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
A.128 B.144
C.174 D.167
解析:初中部女教师有120×70%=84(人),高中部女教师有150×(1-60%)=150×40%=60(人),则该校女教师共有84+60=144(人).
√
3.如图是某中学高一学生体重(单位:kg)的频率分布直方图,已知图中从左到右的前三组的频率之比为1∶2∶3,则第三小组的频率为( )
A.0.125 B.0.250
C.0.375 D.0.500
√
4.我国第七次人口普查的数据于2021年公布,将我国历次人口普查的调查数据整理后得到如图所示的折线图,则下列说法错误的是( )
A.从人口普查结果来看,我国人口总量处于递增状态
B.2000—2020年年均增长率都低于1.5%
C.历次人口普查的年均增长率逐年递减
D.第三次人口普查时,人口年均增长率达到历史最高点
√
解析:由折线统计图可得,所有的增长率均为正数,所以从人口普查结果来看,我国人口总量处于递增状态,故A正确;
2000—2020年年均增长率都低于1.5%,其中2 000最高,增长率为1.07%,故B正确;
年均增长率在1964—1982是逐年递增,1982—2020是逐年递减,故C错误;
第三次(1982年)人口普查时, 人口年均增长率达到历史最高点,故D正确.故选C.
5.(多选)某学校为了调查学生一周在生活方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60]内的学生有60人,则下列说法正确的是( )
A.样本中支出在[50,60]内的频率为 0.03
B.样本中支出不少于40元的人数为132
C.n的值为200
D.若该校有2 000名学生,则约有600人支出在[50,60]内
√
√
√
解析:设[50,60]对应小长方形的高为x,(0.010+0.024+0.036+x)×10=1,解得x=0.03.所以样本中支出在[50,60]内的频率为0.03×10=0.3,A选项错误.
样本中支出不少于40元的人数为200×(0.036+0.03)×10=132,B选项正确.
该校有2 000名学生,则约有2 000×0.3=600人支出在[50,60]内,D选项正确.故选BCD.
6.(多选)某班50名学生期末考试数学成绩(单位:分)的频数分布直方图如图所示(成绩均为整数).对图中提供的信息作出如下判断,其中正确的是( )
A.成绩在49.5~59.5分数段的频数和在89.5~100分数段的频数相等
B.成绩在60分以上(含60分)的频数比成绩在70分以上(含70分)的频数小
C.成绩在80分以上(含80分)的频数为20
D.各组的频数之比依次为1∶1∶4∶3∶1
√
√
√
解析:从频数分布直方图上看,成绩在49.5~59.5分数段的人数与89.5~100分数段的人数相等,故A正确;
成绩在60分以上(含60分)的频数为45,成绩在70分以上(含70分)的频数为40,故B错误;
成绩在80分以上(含80分)的学生有15+5=20(人),故C正确;
各组的频数之比依次为5∶5∶20∶15∶5=1∶1∶4∶3∶1,故D正确.故选ACD.
7.数据65,73,94,63,78,83,86,90,79,84的极差为_______________.
解析:极差为一组数据中最大值与最小值的差,由数据可知,最大值为94,最小值为63,所以极差为94-63=31.
答案:31
8.一组数据共40个,分为6组,第1组到第4组的频数分别为10,5,7,6, 第5组的频率为0.1,则第6组的频数为________.
解析:因为第5组的频率为0.1,故第5组的频数为0.1×40=4,故第6组的频数为40-10-5-7-6-4=8.
答案:8
9.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n等于________.
解析:设第一组至第六组数据的频率分别为2x,3x,4x,6x,4x,x,则2x+3x+4x+6x+4x+x=1,解得x=0.05,所以前三组数据的频率分别是0.1,0.15,0.2,则前三组数据的频数之和等于(0.1+0.15+0.2)n=27,解得n=60.
答案:60
10.对某种品牌的灯泡进行寿命跟踪调查,数据统计如下:
(1)列出频率分布表;
灯泡寿命/h [100,200) [200,300) [300,400) [400,500) [500,600]
个数 320 30 80 40 30
解:频率分布表:
灯泡寿命分组 频数 频率
[100,200) 320 0.64
[200,300) 30 0.06
[300,400) 80 0.16
[400,500) 40 0.08
[500,600] 30 0.06
合计 500 1
(2)画出频率分布直方图.
解:频率分布直方图:
[B 能力提升]
11.小张刚参加工作时月工资为5 000元,各种用途占比统计的条形图如图①.后来他加强了体育锻炼,目前月工资的各种用途占比统计的折线图如图②.已知目前的月就医费比刚参加工作时少200元,则目前小张的月工资为( )
A.5 500元 B.6 000元
C.6 500元 D.7 000元
√
12.(多选)统计某校1 000名学生的某次数学同步练习成绩(满分150分),根据成绩依次分为六组,[90,100),[100,110),[110,120)[120,130),[130,140),[140,150],得到如图所示的频率分布直方图,则下列说法正确的为( )
A.m=0.031 B.m=0.31
C.100分以下的人数为60 D.成绩在区间[120,140)的人数为470
√
√
√
解析:由题得(0.006+0.016+0.02+m+0.016+0.011)×10=1,解得m=0.031,A正确,B错误;
100分以下的人数为1 000×(0.006×10)=60,C正确;
成绩在区间[120,140)的人数为1 000×(0.031+0.016)×10=470,D正确.故选ACD.
13.某市2021年各月平均房价同比(与上一年同月比较)和环比(与相邻上月比较)涨幅情况如图所示,根据此图考虑该市2021年各月平均房价:
①同比涨幅有涨有跌;
②同比涨幅3月份最大,12月份最小;
③1月份最高;
④5月份比9月份高.
其中正确结论为________.(填序号)
解析:根据同比涨幅折线图,可知2021年各月平均房价同比
涨幅有涨有跌,且同比涨幅3月份最大,12月份最小,故①②
均正确;
由环比涨幅折线图可知,前4个月中,虽然折线有下降也有上升,但环比涨幅始终大于0,即房价一直在增长,只是增长幅度有大有小,故1月份房价最高是错误的,故③错误;
设5月份的房价为a,根据环比涨幅折线图,可算得9月份的房价为a(1-0.2%)×1×1×(1+0.2%)=0.999 996a<a,故5月的房价比9月的要高,故④正确.
答案:①②④
14.如图所示的是总体的一个样本频率分布直方图,且在[15,18)内的频数为8.
(1)求样本在[15,18)内的频率;
(2)求样本量;
(3)若在[12,15)内的小长方形面积为0.06,求在[18,33]内的频数.
解:因为在[12,15)内的小长方形的面积为0.06,所以样本在[12,15)内的频率为0.06,故样本在[15,33]内的频数为50×(1-0.06)=47,又在[15,18)内的频数为8,所以在[18,33]内的频数为47-8=39.
[C 拓展冲刺]
15.为了了解学生参加体育活动的情况,学校对学生进行随机抽样调查,其中一个问题是“你平均每天参加体育活动的时间是多少?”.共有4个选项:①1.5小时以上;②1~1.5小时;③0.5~1小时;④0.5小时以下.下图是根据调查结果绘制的两幅不完整的统计图,请你根据统计图提供的信息解答以下问题:
(1)本次一共调查了多少名学生?
解:从题图中知,选①的共60名学生,占总学生
数的百分比为30%,所以总学生数为60÷30%=
200,即本次一共调查了200名学生.
(2)在图(1)中将②对应的部分补充完整;
解:被调查的学生中,
选②的有200-60-30-10=100(名),
补充完整的条形图如图所示.
(3)若该校有3 000名学生,试估计全校学生平均每天参加体育活动的时间在0.5小时以下的人数.
解:3 000×5%=150(名),估计全校有150名学生平均每天参加体育活动的时间在0.5小时以下.中小学教育资源及组卷应用平台
9.2 用样本估计总体
9.2.1 总体取值规律的估计
学习指导 核心素养
1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性. 2.结合实例,能用样本估计总体的取值规律. 数据分析:利用频率分布表、频率分布直方图、条形图、扇形图、折线图等对总体进行估计.
知识点一 频率分布直方图的画法
(1)画频率分布直方图时,纵坐标表示的是频率与组距的比值,而不是频率.
(2)频率分布直方图是以面积的形式反映了数据落在各个小组的频率大小,相应组的频率等于该组上的小长方形的面积,即小长方形的面积=组距×=频率,所以各小长方形的面积的总和等于1,即样本数据落在整个区间的频率为1.
从某校高三学生中抽取50名参加数学竞赛,成绩分组(单位:分)及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表(含累积频率);
(2)画出频率分布直方图.
【解】 (1)频率分布表如下:
成绩分组 频数 频率 累积频率
[40,50) 2 0.04 0.04
[50,60) 3 0.06 0.1
[60,70) 10 0.2 0.3
[70,80) 15 0.3 0.6
[80,90) 12 0.24 0.84
[90,100] 8 0.16 1.00
合计 50 1.00
(2)频率分布直方图如图所示.
绘制频率分布直方图时的注意事项
(1)制作好频率分布表后,可以利用各组的频率之和是不是1来检验该表是否正确.
(2)计算极差需要找出这组数据的最大值和最小值,当数据很多时,可选一个数当参照.
(3)将数据分成互不相交的组,目的是要描述数据分布规律,要根据数据的多少来确定分组数目,一般来说,数据越多,分组越多.
(4)频率分布直方图的纵坐标是频率/组距,而不是频率.
为了了解某学校高一年级男生的身高情况,选取一个容量为60的样本(60名男生的身高),分组情况如下(单位:cm):
分组 [147.5,155.5) [155.5,163.5) [163.5,171.5) [171.5,179.5]
频数 6 21 27 m
频率 a 0.1
(1)求出表中a,m的值;
(2)画出频率分布直方图.
解:(1)由题意得6+21+27+m=60,所以m=6.
a==0.45,所以a=0.45.
(2)作出频率分布直方图如图所示.
知识点二 其他统计图表
统计图表 主要应用
扇形图 直观描述各类数据占总数的比例
条形图和直方图 直观描述不同类别或分组数据的频数和频率
折线图 描述数据随时间的变化趋势
(1)(多选)某班级在一次数学竞赛中为全班学生设置了一等奖、二等奖、三等奖以及参与奖,各个奖品的单价分别为一等奖18元、二等奖8元、三等奖4元、参与奖2元,获奖人数的分配情况如图,则以下说法正确的是( )
A.获得参与奖的人数最多
B.各个奖项中参与奖的总费用最高
C.购买每件奖品费用的平均数为4元
D.购买的三等奖的奖品件数是一、二等奖的奖品件数和的2倍
(2)某家庭2020年收入的各种用途占比统计如图1所示,2021年收入的各种用途占比统计如图2所示.已知2021年的“旅行”费用比2020年增加了3 500元,则该家庭2021年的“衣食住”费用比2020年增加了( )
A.2 000元 B.2 500元
C.3 000元 D.3 500元
【解析】 (1)设全班人数为a.
由题图可知,一等奖占5%,二等奖占10%,三等奖占30%,则参与奖占55%,获得参与奖的人数最多,故A正确.
各奖项的费用:一等奖5%a×18=0.9a,二等奖10%a×8=0.8a,三等奖30%a×4=1.2a,参与奖55%a×2=1.1a,可知各个奖项中三等奖的总费用最高,故B错误.
平均费用为5%×18+10%×8+30%×4+55%×2=4(元),故C正确.
一等奖奖品数为5%a,二等奖奖品数为10%a,三等奖奖品数为30%a,故D正确.故选ACD.
(2)设该家庭2020年的收入为x元,2021年的收入为y元.由题意得35%y-35%x=3 500,即y-x=10 000,所以2021年的“衣食住”费用比2020年增加了25%y-25%x=2 500(元).
【答案】 (1)ACD (2)B
条形图、扇形图和折线图的区别与联系
统计图 区别 联系
条形图 (1)直观反映数据分布的大致情况; (2)清晰地表示各个区间的具体数目; (3)会丢失数据的部分信息 在同一组数据的不同统计图表中,计算出相应组的频数、频率应该相等
扇形图 (1)清楚地看出数据分布的总体趋势及各部分所占总体的百分比; (2)丢失了原来的具体数据
折线图 (1)表示数据的多少和数量增减变化情况; (2)制作过程类似于函数图象的画法,侧重体现数据的变化规律
1.(多选)某网店2021年全年的月收支数据如图所示,则针对2021年这一年的收支情况,下列说法正确的是( )
A.月收入的极差为60万元
B.7月份的利润最大
C.这12个月利润的平均数在30万元以上
D.这一年的总利润超过400万元
解析:选ABC.由题图可知月收入的极差为90-30=60(万元),故A正确.1至12月份的利润(单位:万元)分别为:20,30,20,10,30,30,60,40,30,30,50,30.其中7月份的利润最大,故B正确.易求得总利润为380万元,月平均利润为≈31.7(万元),故C正确,D错误.
2.如图是根据某中学为地震灾区捐款的情况而制作的统计图,已知该校在校学生3 000人,根据统计图计算该校共捐款________元.
解析:由题图,得高一人数为3 000×32%=960,
捐款数是960×15=14 400(元);
高二人数为3 000×33%=990,
捐款数是990×13=12 870(元);
高三人数为3 000×35%=1 050,
捐款数是1 050×10=10 500(元).
所以该校学生共捐款14 400+12 870+10 500=37 770(元).
答案:37 770
考点 频率分布直方图的应用
为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本量是多少?
(2)若次数在110次以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
【解】 (1)频率分布直方图以面积的形式反映数据落在各小组内的频率大小,因此第二小组的频率为=0.08.
又因为第二小组的频率=,
所以样本量===150.
(2)由频率分布直方图可估计该校高一年级学生的达标率为×100%=88%.
1.(变设问)在本例条件下,求样本中不达标的学生人数是多少?
解:由例3(1)(2)知达标率为88%,样本量为150,不达标的学生频率为1-0.88=0.12.
所以样本中不达标的学生人数为150×0.12=18.
2.(变设问)在本例条件下,求第三小组的频数是多少?
解:第三小组的频率为=0.34.
又因为样本量为150,
所以第三小组的频数为150×0.34=51.
频率分布直方图的应用中的计算问题
(1)小长方形的面积=组距×=频率;
(2)各小长方形的面积之和等于1;
(3)=频率,此关系式的变形为=样本量,样本量×频率=频数.
某校100名学生期中考试语文成绩(单位:分)的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值;
(2)若这100名学生的语文成绩在某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.
分数段 [50,60) [60,70) [70,80) [80,90]
x∶y 1∶1 2∶1 3∶4 4∶5
解:(1)依题意得,10×(2a+0.02+0.03+0.04)=1,
解得a=0.005.
(2)数学成绩在[50,60)之间的人数为100×0.05=5,数学成绩在[60,70)之间的人数为100×0.4×=20,数学成绩在[70,80)之间的人数为100×0.3×=40,数学成绩在[80,90)之间的人数为100×0.2×=25,所以数学成绩在[50,90)之外的人数为100-5-20-40-25=10.
1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )
A.总体容量越大,估计越精确 B.总体容量越小,估计越精确
C.样本容量越大,估计越精确 D.样本容量越小,估计越精确
解析:选C.用样本的频率分布估计总体的频率分布时,在总体一定时,样本的容量越大,估计就越精确.
2.一个容量为20的样本数据,将其分组如下表:
分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]
数量 2 3 4 5 4 2
则样本在区间(-∞,50)上的频率为( )
A.0.5 B.0.25
C.0.6 D.0.7
解析:选D.样本在区间(-∞,50)上的频率为==0.7.
3.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.6 B.8
C.12 D.18
解析:选C.设第一、二组的频率之和为(0.24+0.16)×1=0.4,设第三组有疗效的为x人,由已知得=,解得x=12,故选C.
4.某公司2021年在各个项目中总投资500万元,如图是几类项目的投资占比情况,已知在1万元以上的项目投资中,少于3万元的项目投资占,那么不少于3万元的项目投资共有( )
A.56万元 B.65万元
C.91万元 D.147万元
解析:选B.由题图可知,1万元以上的项目投资占1-0.46-0.33=0.21=21%,则投资1万元以上的资金共500×0.21=105(万元).又在1万元以上的项目
投资中,少于3万元的项目投资占,则不少于3万元的项目投资占1-=.故不少于3万元的项目投资为105×=65(万元).
[A 基础达标]
1.一个频率分布表(样本量为30)不小心被损坏了一部分,只记得样本中数据在[20,60]上的频率为0.8,则估计样本在[40,60]内的频数为( )
分组 [10,20) [20,30) [30,40)
频数 3 4 5
A.14 B.15
C.16 D.17
解析:选B.因为一个频率分布表(样本量为30)不小心被损坏了一部分,只记得样本中数据在[20,60]上的频率为0.8,所以样本中数据在[20,60]上的频数为30×0.8=24,所以估计样本在[40,60]内的频数为24-4-5=15.故选B.
2.某中学初中部共有120名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
A.128 B.144
C.174 D.167
解析:选B.初中部女教师有120×70%=84(人),高中部女教师有150×(1-60%)=150×40%=60(人),则该校女教师共有84+60=144(人).
3.如图是某中学高一学生体重(单位:kg)的频率分布直方图,已知图中从左到右的前三组的频率之比为1∶2∶3,则第三小组的频率为( )
A.0.125 B.0.250
C.0.375 D.0.500
解析:选C.由频率分布直方图,知前三组的频率之和为1-(0.012 5+0.037 5)×5=0.750,所以第三小组的频率为0.750×=0.375,故选C.
4.我国第七次人口普查的数据于2021年公布,将我国历次人口普查的调查数据整理后得到如图所示的折线图,则下列说法错误的是( )
A.从人口普查结果来看,我国人口总量处于递增状态
B.2000—2020年年均增长率都低于1.5%
C.历次人口普查的年均增长率逐年递减
D.第三次人口普查时,人口年均增长率达到历史最高点
解析:选C.由折线统计图可得,所有的增长率均为正数,所以从人口普查结果来看,我国人口总量处于递增状态,故A正确;2000—2020年年均增长率都低于1.5%,其中2 000最高,增长率为1.07%,故B正确;年均增长率在1964—1982是逐年递增,1982—2020是逐年递减,故C错误;第三次(1982年)人口普查时, 人口年均增长率达到历史最高点,故D正确.故选C.
5.(多选)某学校为了调查学生一周在生活方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60]内的学生有60人,则下列说法正确的是( )
A.样本中支出在[50,60]内的频率为 0.03
B.样本中支出不少于40元的人数为132
C.n的值为200
D.若该校有2 000名学生,则约有600人支出在[50,60]内
解析:选BCD.设[50,60]对应小长方形的高为x,(0.010+0.024+0.036+x)×10=1,解得x=0.03.所以样本中支出在[50,60]内的频率为0.03×10=0.3,A选项错误.
n==200,C选项正确.
样本中支出不少于40元的人数为200×(0.036+0.03)×10=132,B选项正确.
该校有2 000名学生,则约有2 000×0.3=600人支出在[50,60]内,D选项正确.故选BCD.
6.(多选)某班50名学生期末考试数学成绩(单位:分)的频数分布直方图如图所示(成绩均为整数).对图中提供的信息作出如下判断,其中正确的是( )
A.成绩在49.5~59.5分数段的频数和在89.5~100分数段的频数相等
B.成绩在60分以上(含60分)的频数比成绩在70分以上(含70分)的频数小
C.成绩在80分以上(含80分)的频数为20
D.各组的频数之比依次为1∶1∶4∶3∶1
解析:选ACD.从频数分布直方图上看,成绩在49.5~59.5分数段的人数与89.5~100分数段的人数相等,故A正确;成绩在60分以上(含60分)的频数为45,成绩在70分以上(含70分)的频数为40,故B错误;成绩在80分以上(含80分)的学生有15+5=20(人),故C正确;各组的频数之比依次为5∶5∶20∶15∶5=1∶1∶4∶3∶1,故D正确.故选ACD.
7.数据65,73,94,63,78,83,86,90,79,84的极差为_______________.
解析:极差为一组数据中最大值与最小值的差,由数据可知,最大值为94,最小值为63,所以极差为94-63=31.
答案:31
8.一组数据共40个,分为6组,第1组到第4组的频数分别为10,5,7,6, 第5组的频率为0.1,则第6组的频数为________.
解析:因为第5组的频率为0.1,故第5组的频数为0.1×40=4,故第6组的频数为40-10-5-7-6-4=8.
答案:8
9.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n等于________.
解析:设第一组至第六组数据的频率分别为2x,3x,4x,6x,4x,x,则2x+3x+4x+6x+4x+x=1,解得x=0.05,所以前三组数据的频率分别是0.1,0.15,0.2,则前三组数据的频数之和等于(0.1+0.15+0.2)n=27,解得n=60.
答案:60
10.对某种品牌的灯泡进行寿命跟踪调查,数据统计如下:
灯泡寿命/h [100,200) [200,300) [300,400) [400,500) [500,600]
个数 320 30 80 40 30
(1)列出频率分布表;
(2)画出频率分布直方图.
解:(1)频率分布表:
灯泡寿命分组 频数 频率
[100,200) 320 0.64
[200,300) 30 0.06
[300,400) 80 0.16
[400,500) 40 0.08
[500,600] 30 0.06
合计 500 1
(2)频率分布直方图:
[B 能力提升]
11.小张刚参加工作时月工资为5 000元,各种用途占比统计的条形图如图①.后来他加强了体育锻炼,目前月工资的各种用途占比统计的折线图如图②.已知目前的月就医费比刚参加工作时少200元,则目前小张的月工资为( )
A.5 500元 B.6 000元
C.6 500元 D.7 000元
解析:选A.由题易知,小张刚参加工作时月就医费为5 000×15%=750(元),又已知小张目前的月就医费比刚参加工作时少200元,即为550元,故目前小张的月工资为=5 500(元).
12.(多选)统计某校1 000名学生的某次数学同步练习成绩(满分150分),根据成绩依次分为六组,[90,100),[100,110),[110,120)[120,130),[130,140),[140,150],得到如图所示的频率分布直方图,则下列说法正确的为( )
A.m=0.031
B.m=0.31
C.100分以下的人数为60
D.成绩在区间[120,140)的人数为470
解析:选ACD.由题得(0.006+0.016+0.02+m+0.016+0.011)×10=1,解得m=0.031,A正确,B错误;100分以下的人数为1 000×(0.006×10)=60,C正确;成绩在区间[120,140)的人数为1 000×(0.031+0.016)×10=470,D正确.故选ACD.
13.某市2021年各月平均房价同比(与上一年同月比较)和环比(与相邻上月比较)涨幅情况如图所示,根据此图考虑该市2021年各月平均房价:
①同比涨幅有涨有跌;
②同比涨幅3月份最大,12月份最小;
③1月份最高;
④5月份比9月份高.
其中正确结论为________.(填序号)
解析:根据同比涨幅折线图,可知2021年各月平均房价同比涨幅有涨有跌,且同比涨幅3月份最大,12月份最小,故①②均正确;由环比涨幅折线图可知,前4个月中,虽然折线有下降也有上升,但环比涨幅始终大于0,即房价一直在增长,只是增长幅度有大有小,故1月份房价最高是错误的,故③错误;设5月份的房价为a,根据环比涨幅折线图,可算得9月份的房价为a(1-0.2%)×1×1×(1+0.2%)=0.999 996a<a,故5月的房价比9月的要高,故④正确.
答案:①②④
14.如图所示的是总体的一个样本频率分布直方图,且在[15,18)内的频数为8.
(1)求样本在[15,18)内的频率;
(2)求样本量;
(3)若在[12,15)内的小长方形面积为0.06,求在[18,33]内的频数.
解:由题中样本频率分布直方图可知组距为3.
(1)样本在[15,18)内的频率为×3=.
(2)因为样本在[15,18)内的频数为8,
所以样本量为=8×=50.
(3)因为在[12,15)内的小长方形的面积为0.06,所以样本在[12,15)内的频率为0.06,故样本在[15,33]内的频数为50×(1-0.06)=47,又在[15,18)内的频数为8,所以在[18,33]内的频数为47-8=39.
[C 拓展冲刺]
15.为了了解学生参加体育活动的情况,学校对学生进行随机抽样调查,其中一个问题是“你平均每天参加体育活动的时间是多少?”.共有4个选项:①1.5小时以上;②1~1.5小时;③0.5~1小时;④0.5小时以下.下图是根据调查结果绘制的两幅不完整的统计图,请你根据统计图提供的信息解答以下问题:
(1)本次一共调查了多少名学生?
(2)在图(1)中将②对应的部分补充完整;
(3)若该校有3 000名学生,试估计全校学生平均每天参加体育活动的时间在0.5小时以下的人数.
解:(1)从题图中知,选①的共60名学生,占总学生数的百分比为30%,所以总学生数为60÷30%=200,即本次一共调查了200名学生.
(2)被调查的学生中,选②的有200-60-30-10=100(名),补充完整的条形图如图所示.
(3)3 000×5%=150(名),估计全校有150名学生平均每天参加体育活动的时间在0.5小时以下.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)中小学教育资源及组卷应用平台
9.2 用样本估计总体
9.2.1 总体取值规律的估计
学习指导 核心素养
1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性. 2.结合实例,能用样本估计总体的取值规律. 数据分析:利用频率分布表、频率分布直方图、条形图、扇形图、折线图等对总体进行估计.
知识点一 频率分布直方图的画法
(1)画频率分布直方图时,纵坐标表示的是频率与组距的比值,而不是频率.
(2)频率分布直方图是以面积的形式反映了数据落在各个小组的频率大小,相应组的频率等于该组上的小长方形的面积,即小长方形的面积=组距×=频率,所以各小长方形的面积的总和等于1,即样本数据落在整个区间的频率为1.
从某校高三学生中抽取50名参加数学竞赛,成绩分组(单位:分)及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表(含累积频率);
(2)画出频率分布直方图.
绘制频率分布直方图时的注意事项
(1)制作好频率分布表后,可以利用各组的频率之和是不是1来检验该表是否正确.
(2)计算极差需要找出这组数据的最大值和最小值,当数据很多时,可选一个数当参照.
(3)将数据分成互不相交的组,目的是要描述数据分布规律,要根据数据的多少来确定分组数目,一般来说,数据越多,分组越多.
(4)频率分布直方图的纵坐标是频率/组距,而不是频率.
为了了解某学校高一年级男生的身高情况,选取一个容量为60的样本(60名男生的身高),分组情况如下(单位:cm):
分组 [147.5,155.5) [155.5,163.5) [163.5,171.5) [171.5,179.5]
频数 6 21 27 m
频率 a 0.1
(1)求出表中a,m的值;
(2)画出频率分布直方图.
知识点二 其他统计图表
统计图表 主要应用
扇形图 直观描述各类数据占总数的比例
条形图和直方图 直观描述不同类别或分组数据的频数和频率
折线图 描述数据随时间的变化趋势
(1)(多选)某班级在一次数学竞赛中为全班学生设置了一等奖、二等奖、三等奖以及参与奖,各个奖品的单价分别为一等奖18元、二等奖8元、三等奖4元、参与奖2元,获奖人数的分配情况如图,则以下说法正确的是( )
A.获得参与奖的人数最多
B.各个奖项中参与奖的总费用最高
C.购买每件奖品费用的平均数为4元
D.购买的三等奖的奖品件数是一、二等奖的奖品件数和的2倍
(2)某家庭2020年收入的各种用途占比统计如图1所示,2021年收入的各种用途占比统计如图2所示.已知2021年的“旅行”费用比2020年增加了3 500元,则该家庭2021年的“衣食住”费用比2020年增加了( )
A.2 000元 B.2 500元
C.3 000元 D.3 500元
条形图、扇形图和折线图的区别与联系
统计图 区别 联系
条形图 (1)直观反映数据分布的大致情况; (2)清晰地表示各个区间的具体数目; (3)会丢失数据的部分信息 在同一组数据的不同统计图表中,计算出相应组的频数、频率应该相等
扇形图 (1)清楚地看出数据分布的总体趋势及各部分所占总体的百分比; (2)丢失了原来的具体数据
折线图 (1)表示数据的多少和数量增减变化情况; (2)制作过程类似于函数图象的画法,侧重体现数据的变化规律
1.(多选)某网店2021年全年的月收支数据如图所示,则针对2021年这一年的收支情况,下列说法正确的是( )
A.月收入的极差为60万元
B.7月份的利润最大
C.这12个月利润的平均数在30万元以上
D.这一年的总利润超过400万元
2.如图是根据某中学为地震灾区捐款的情况而制作的统计图,已知该校在校学生3 000人,根据统计图计算该校共捐款________元.
考点 频率分布直方图的应用
为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本量是多少?
(2)若次数在110次以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
1.(变设问)在本例条件下,求样本中不达标的学生人数是多少?
2.(变设问)在本例条件下,求第三小组的频数是多少?
频率分布直方图的应用中的计算问题
(1)小长方形的面积=组距×=频率;
(2)各小长方形的面积之和等于1;
(3)=频率,此关系式的变形为=样本量,样本量×频率=频数.
某校100名学生期中考试语文成绩(单位:分)的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值;
(2)若这100名学生的语文成绩在某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.
分数段 [50,60) [60,70) [70,80) [80,90]
x∶y 1∶1 2∶1 3∶4 4∶5
1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )
A.总体容量越大,估计越精确 B.总体容量越小,估计越精确
C.样本容量越大,估计越精确 D.样本容量越小,估计越精确
2.一个容量为20的样本数据,将其分组如下表:
分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]
数量 2 3 4 5 4 2
则样本在区间(-∞,50)上的频率为( )
A.0.5 B.0.25
C.0.6 D.0.7
3.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.6 B.8
C.12 D.18
4.某公司2021年在各个项目中总投资500万元,如图是几类项目的投资占比情况,已知在1万元以上的项目投资中,少于3万元的项目投资占,那么不少于3万元的项目投资共有( )
A.56万元 B.65万元
C.91万元 D.147万元
[A 基础达标]
1.一个频率分布表(样本量为30)不小心被损坏了一部分,只记得样本中数据在[20,60]上的频率为0.8,则估计样本在[40,60]内的频数为( )
分组 [10,20) [20,30) [30,40)
频数 3 4 5
A.14 B.15
C.16 D.17
2.某中学初中部共有120名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
A.128 B.144
C.174 D.167
3.如图是某中学高一学生体重(单位:kg)的频率分布直方图,已知图中从左到右的前三组的频率之比为1∶2∶3,则第三小组的频率为( )
A.0.125 B.0.250
C.0.375 D.0.500
4.我国第七次人口普查的数据于2021年公布,将我国历次人口普查的调查数据整理后得到如图所示的折线图,则下列说法错误的是( )
A.从人口普查结果来看,我国人口总量处于递增状态
B.2000—2020年年均增长率都低于1.5%
C.历次人口普查的年均增长率逐年递减
D.第三次人口普查时,人口年均增长率达到历史最高点
5.(多选)某学校为了调查学生一周在生活方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60]内的学生有60人,则下列说法正确的是( )
A.样本中支出在[50,60]内的频率为 0.03
B.样本中支出不少于40元的人数为132
C.n的值为200
D.若该校有2 000名学生,则约有600人支出在[50,60]内
6.(多选)某班50名学生期末考试数学成绩(单位:分)的频数分布直方图如图所示(成绩均为整数).对图中提供的信息作出如下判断,其中正确的是( )
A.成绩在49.5~59.5分数段的频数和在89.5~100分数段的频数相等
B.成绩在60分以上(含60分)的频数比成绩在70分以上(含70分)的频数小
C.成绩在80分以上(含80分)的频数为20
D.各组的频数之比依次为1∶1∶4∶3∶1
7.数据65,73,94,63,78,83,86,90,79,84的极差为_______________.
8.一组数据共40个,分为6组,第1组到第4组的频数分别为10,5,7,6, 第5组的频率为0.1,则第6组的频数为________.
9.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n等于________.
10.对某种品牌的灯泡进行寿命跟踪调查,数据统计如下:
灯泡寿命/h [100,200) [200,300) [300,400) [400,500) [500,600]
个数 320 30 80 40 30
(1)列出频率分布表;
(2)画出频率分布直方图.
[B 能力提升]
11.小张刚参加工作时月工资为5 000元,各种用途占比统计的条形图如图①.后来他加强了体育锻炼,目前月工资的各种用途占比统计的折线图如图②.已知目前的月就医费比刚参加工作时少200元,则目前小张的月工资为( )
A.5 500元 B.6 000元
C.6 500元 D.7 000元
12.(多选)统计某校1 000名学生的某次数学同步练习成绩(满分150分),根据成绩依次分为六组,[90,100),[100,110),[110,120)[120,130),[130,140),[140,150],得到如图所示的频率分布直方图,则下列说法正确的为( )
A.m=0.031
B.m=0.31
C.100分以下的人数为60
D.成绩在区间[120,140)的人数为470
13.某市2021年各月平均房价同比(与上一年同月比较)和环比(与相邻上月比较)涨幅情况如图所示,根据此图考虑该市2021年各月平均房价:
①同比涨幅有涨有跌;
②同比涨幅3月份最大,12月份最小;
③1月份最高;
④5月份比9月份高.
其中正确结论为________.(填序号)
14.如图所示的是总体的一个样本频率分布直方图,且在[15,18)内的频数为8.
(1)求样本在[15,18)内的频率;
(2)求样本量;
(3)若在[12,15)内的小长方形面积为0.06,求在[18,33]内的频数.
[C 拓展冲刺]
15.为了了解学生参加体育活动的情况,学校对学生进行随机抽样调查,其中一个问题是“你平均每天参加体育活动的时间是多少?”.共有4个选项:①1.5小时以上;②1~1.5小时;③0.5~1小时;④0.5小时以下.下图是根据调查结果绘制的两幅不完整的统计图,请你根据统计图提供的信息解答以下问题:
(1)本次一共调查了多少名学生?
(2)在图(1)中将②对应的部分补充完整;
(3)若该校有3 000名学生,试估计全校学生平均每天参加体育活动的时间在0.5小时以下的人数.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)