(共70张PPT)
简洁
实用
高效
第九章 统计与成对数据的统计分析
9.1 随机抽样、统计图
数学
内容索引
必备知识回顾
关键能力提升
第一部分
第二部分
考点1 抽样方法
考点2 统计图
01
02
考点3 频率分布直方图
03
课时作业
第三部分
1.了解总体、个体、样本的概念.
2.了解简单随机抽样、分层随机抽样的特点和适用范围,会计算样本均值和方差.
3.能根据实际问题的特点选择恰当的统计图对数据进行可视化描述.
自主学习·基础回扣
必备知识回顾
第
分
部
一
1.总体、个体、样本
调查对象的全体(或调查对象的某些指标的全体)称为____,组成总体的每一个调查对象(或每一个调查对象的相应指标)称为____,在抽样调查中,从总体中抽取的那部分个体称为____,样本中包含的个体数称为________,简称样本量.
2.简单随机抽样
______和________是比较常用的两种方法.
教材回扣
总体
个体
样本
样本容量
抽签法
随机数法
3.分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为____________,每一个子总体称为__.
分层随机抽样
层
4.统计图
(1)常见的统计图有______、______、______、______________等.
(2)作频率分布直方图的步骤
①求____;
②决定____与____;
③将____分组;
④列频率分布表;
⑤画频率分布直方图.
条形图
扇形图
折线图
频率分布直方图
极差
组距
组数
数据
1.利用按比例分配的分层随机抽样要注意按比例抽取,若各层应抽取的个体数不都是整数,可以进行一定的技术处理,比如将结果取成整数等.
2.在按比例分配的分层随机抽样中,以层数是2层为例,如果第1层和第
教材拓展
3.频率分布直方图中纵轴上的数据是各组的频率除以组距,不要和条形图混淆.
1.判断(正确的画“√”,错误的画“×”)
(1)在简单随机抽样中,每个个体被抽到的机会与先后顺序有关.( )
(2)抽签法和随机数法都是简单随机抽样.( )
(3)在按比例分配的分层随机抽样中,每个个体被抽到的可能性与层数及分层有关.( )
(4)在频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越大.( )
基础检测
×
√
×
√
2.为了了解某地参加计算机水平测试的5 000名学生的成绩,从中抽取了200名学生的成绩进行调查分析.在这个问题中,被抽取的200名学生的成绩是( )
A.总体 B.个体
C.样本 D.样本量
解析:由题意可得被抽取的200名学生的成绩是样本.故选C.
C
3.(人教A版必修第二册P185T3(1)改编)已知23名男生的平均身高是170.6 cm,27名女生的平均身高是160.6 cm,则这50名学生的平均身高为__________ cm.
165.2
4.(人教A版必修第二册P198T1改编)为了解某校高三学生参加体育锻炼的情况,现从中抽取了100名学生进行调查,结果显示这些学生每月的锻炼时间(单位:h)在[10,50]内,频率分布直方图如图所示,则锻炼时间在[30,50]内的学生有____人.
67
解析:由频率分布直方图可知,锻炼时间在[10,30)内的人数为100×10×(0.010+0.023)=33,所以锻炼时间在[30,50]内的人数为100-33=67.
互动探究·考点精讲
关键能力提升
第
分
部
二
考点1 抽样方法
【例1】 (1)(2024·陕西西安一模)某高校对中文系新生进行体测,利用随机数表对650名学生进行抽样,先将650名学生进行编号:001,002,…,649,650.从中抽取50个样本,下面提供随机数表的第4行到第6行,若从随机数表中第5行第6列开始从左往右依次读取三个数字,则得到的第6个样本编号是( )
A
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38
12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86
23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75
22 53 55 78 32 45 77 89 23 45
A.623 B.328
C.072 D.457
【解析】 从第5行第6列开始从左往右依次读取三个数字,第一个数是253,第二个数是313,第三个数是457,下一个数是860,不符合要求,下一个数是736,不符合要求,下一个数是253,重复,第四个数是007,第五个数是328,第六个数是623,故A正确.故选A.
(2)(2024·河南驻马店二模)电影《孤注一掷》的上映引发了对电信诈骗问题的热议,也加大了各个社区反电信诈骗的宣传力度.已知某社区共有居民480人,其中老年人200人,中年人200人,青少年80人,若按年龄进行比例分配的分层随机抽样,共抽取36人作为代表,则中年人比青少年多( )
A.6人 B.9人
C.12人 D.18人
B
规律总结
1.简单随机抽样需满足:
(1)被抽取的总体的个体数有限.
(2)等可能抽取.
【对点训练1】 (1)①根据植物的主干高度及生长习性等特征,植物可以分为乔木、灌木和草本植物等类型,某植物园需要对其园中的不同植物的干重(烘干后测定的质量)进行测量;②检测员拟对一批新生产的1 000箱牛奶抽取10箱进行质量检测.上述两项调查应采用的抽样方法分别是( )
A.①用简单随机抽样,②用分层随机抽样
B.①用简单随机抽样,②用简单随机抽样
C.①用分层随机抽样,②用简单随机抽样
D.①用分层随机抽样,②用分层随机抽样
解析:①乔木、灌木、草本植物,分类明显,可以采用分层随机抽样;②并未有明显分层特点,且样本容量较小,可以采用简单随机抽样.故选C.
C
(2)(2024·四川南充二模)某工厂生产A,B,C三种不同型号的产品,它们的产量之比为2∶3∶5,用按比例分配的分层随机抽样的方法抽取一个容量为n的样本.若样本中A型号的产品有30件,则样本容量n为( )
A.150 B.180
C.200 D.250
A
考点2 统计图
【例2】 (1)(多选)在某市九年级举行的一次体育考试中,所有考生成绩(单位:分,满分100分)均在[50,100]内,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五组,甲、乙两班考生的成绩占比如图所示,则下列说法错误的是( )
A.成绩在[70,80)的考生中,甲班人数多于乙班人数
B.甲班成绩在[80,90)内的人数最多
C.乙班成绩在[70,80)内的人数最多
D.甲班成绩的极差比乙班成绩的极差小
ACD
【解析】 由题图知,每一组中的成绩占比都是以各自班级的总人数为基数的,所以每一组中的甲班、乙班人数不能从所占的百分比来判断,故A错误;由题图可知甲班成绩主要集中在[80,90),乙班成绩主要集中在[60,70),故B正确,C错误;由题图可知甲班成绩的极差和乙班成绩的极差的大小无法确定,故D错误.故选ACD.
(2)(多选)某公司经营五种产业,为应对市场变化,在五年前进行了产业结构调整,优化后的产业结构使公司总利润不断增长,今年总利润比五年前增加了一倍,调整前后的各产业利润与总利润的占比如图所示,则下列结论错误的是( )
A.调整后传媒的利润增量小于杂志
B.调整后房地产的利润有所下降
C.调整后试卷的利润增加不到一倍
D.调整后图书的利润增长了一倍以上
ABC
规律总结
统计图的主要应用
(1)扇形图:直观描述各类数据占总数的比例.
(2)折线图:描述数据随时间或其他变量的变化趋势.
(3)条形图和直方图:直观描述不同类别或分组数据的频数和频率.
【对点训练2】 (1)(2024·河北保定二模)下图为2020—2023年某国星级酒店数量、营业收入及餐饮收入比重,根据该图,下列结论错误的是( )
A.2020—2023年某国星级酒店数量逐年减少
B.2020—2023年某国星级酒店营业收入最高不超过2 000亿元
C.2020—2023年某国星级酒店餐饮收入比重最高的是2021年
D.2020—2023年某国星级酒店餐饮收入比重的极差是1.54%
D
解析:2020—2023年某国星级酒店数量依次为8 920家、8 423家、7 676家、7 337,逐年减少,故A正确;2020—2023年某国星级酒店营业收入最高为1 907.77亿元,故B正确;2020—2023年某国星级酒店餐饮收入比重最高的是2021年,故C正确;2020—2023年某国星级酒店餐饮收入比重的极差是41.63%-38.19%=3.44%,故D错误.故选D.
(2)(2024·四川遂宁三模)某调查机构对某地快递行业从业者进行调查统计,得到快递行业从业人员年龄分布扇形图(图1)、“90后”从事快递行业岗位分布条形图(图2),则下列结论中错误的是( )
D
A.快递行业从业人员中,“90后”占一半以上
B.快递行业从业人员中,从事技术岗位的“90后”的人数超过总人数的20%
C.快递行业从业人员中,从事运营岗位的“90后”的人数比“80前”的多
D.快递行业从业人员中,从事技术岗位的“90后”的人数比“80后”的多
解析:由题图可知,快递行业从业人员中,“90后”占总人数的56%,超过一半,A正确;快递行业从业人员中,从事技术岗位的“90后”的人数占总人数的百分比为56%×39.6%=22.176%,超过20%,所以快递行业从业人员中,从事技术岗位的“90后”的人数超过总人数的20%,B正确;快递行业从业人员中,从事运营岗位的“90后”的人数占总人数的百分比为56%×17%=9.52%,超过“80前”的人数占总人数的百分比,C正确;快递行业从业人员中,从事技术岗位的“90后”的人数占总人数的百分比为22.176%,小于“80后”的人数占总人数的百分比,但“80后”从事技术岗位的人数占“80后”人数的百分比未知,D不一定正确.故选D.
考点3 频率分布直方图
【例3】 从某小区抽取100户居民进行月用电量调查,发现其用电量都在50千瓦时至350千瓦时之间,频率分布直方图如图.
(1)直方图中x的值为_____________;
(2)在这些用户中,月用电量落在区间[100,250)内的户数为____.
【解析】 因为数据落在[100,250)内的频率为(0.003 6+0.006 0+0.004 4)×50=0.7,所以所求户数为0.7×100=70.
0.0036
70
规律总结
频率分布直方图的相关结论
(1)频率分布直方图中各小长方形的面积之和为1.
【对点训练3】 (1)(2024·天津武清区模拟)某校高三共有200人参加体育测试,将体测得分情况进行了统计,把得分数据按照[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]分成6组,绘制了如图所示的频率分布直方图.根据规则,82分以上的考生成绩等级为A,则获得A的考生人数约为( )
A.25 B.50
C.75 D.100
B
解析:由题意可知估计获得A的考生人数频率为0.025×(90-82)+0.005×10=0.25,所以获得A的考生人数约为0.25×200=50.故选B.
(2)要调查某地区高中学生身体素质,从高中生中抽取100人进行跳远测试,根据测试成绩制作频率分布直方图如图,现从成绩在[120,140)内的学生中用比例分配的分层随机抽样的方法抽取5人,应从[120,130)内抽取的人数为b,则( )
A.a=0.025,b=2 B.a=0.025,b=3
C.a=0.030,b=4 D.a=0.030,b=3
D
课时作业65
第
分
部
三
1.(6分)现要完成下列2项抽样调查:
①从10盒酸奶中抽取3盒进行食品卫生检查;
②东方中学共有160名教职工,其中教师120名,行政人员16名,后勤人员24名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.
较为合理的抽样方法是( )
A.①抽签法,②分层随机抽样
B.①随机数法,②分层随机抽样
C.①随机数法,②抽签法
D.①抽签法,②随机数法
解析:①总体容量较小,宜用抽签法;②各层间差异明显,宜用分层随机抽样.故选A.
A
2.(6分)总体由编号为00,01,…,28,29的30个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第6列和第7列开始从左往右依次选取两个数字,则选出来的第5个个体的编号为( )
0842 2689 5319 6450 9303
2320 9025 6015 9901 9025
2909 0937 6707 1528 3113
1165 0280 7999 7080 1573
A.19 B.02
C.11 D.16
C
解析:从题干中的随机数表的第1行的第6列和第7列开始从左往右依次选取两个数字,得到的在00~29范围之内的两位数依次是09,09,02,01,19,02,11,…,其中09和02各重复了一次,去掉重复的数字后,前5个编号是09,02,01,19,11,则选出来的第5个个体的编号为11.故选C.
3.(6分)(2024·江西南昌模拟)已知A,B,C三种不同型号的产品数量之比为3∶4∶7,现用比例分配的分层随机抽样的方法抽取容量为N的样本,若样本中B型号产品有20件,则N为( )
A.60 B.70
C.80 D.90
B
4.(6分)从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用比例分配的分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为( )
A.3 B.4
C.5 D.6
A
5.(6分)(2024·四川乐山三模)为了解某中学三个年级的学生对食堂饭菜的满意程度,用比例分配的分层随机抽样的方法抽取30%的学生进行调查,已知该中学学生人数和各年级学生的满意率分别如图1和图2所示,则样本容量和抽取的二年级学生中满意的人数分别为( )
A.800,360 B.600,108
C.800,108 D.600,360
B
6.(6分)当代中国学者测算“一代”平均为25年.另根据国际一家研究机构的研究报告显示,全球家族企业的平均寿命其实只有26年,约占总量的28%的家族企业只能传到第二代,约占总量的14%的家族企业只能传到第三代,约占总量4%的家族企业可以传到第四代甚至更久远(为了研究方便,超过四代的可忽略不计).根据该研究机构的研究报告,可以估计该机构所认为的“一代”大约为( )
A.23年 B.22年
C.21年 D.20年
B
解析:设“一代”为x年,由题意得企业寿命的频率分布表如下:
又因为全球家族企业的平均寿命其实只有26年,所以家族企业的平均寿命为0.54×0.5x+0.28×1.5x+0.14×2.5x+0.04×3.5x=26,解得x≈22.故选B.
家族企业寿命 频率
[0,x] 54%
(x,2x] 28%
(2x,3x] 14%
(3x,4x] 4%
7.(6分)统计某校n名学生的某次数学同步练习成绩(满分150分),根据成绩分成六组:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],绘制频率分布直方图如图所示,若不低于140分的人数为110,则n的值是( )
A.800 B.900
C.1 200 D.1 000
D
8.(6分)(2024·甘肃兰州一模)小李一周的总开支分布如图1所示,其中一周的食品开支如图2所示,则以下叙述错误的是( )
A.小李这一周用于肉蛋奶的支出高于用于娱乐的支出
B.小李这一周用于食品中其他的支出在总支出中是最少的
C.小李这一周用于主食的支出比用于通信的支出高
D.小李这一周用于主食和蔬菜的支出比日常支出高
D
9.(7分)(多选)我国于2016年1月1日正式实施全面二孩政策,为了解户籍、性别对生育二孩选择倾向的影响,某地从育龄群体中随机抽取了容量为200的调查样本,其中城镇户籍与农村户籍各100人,男性120人,女性80人,绘制的不同群体中倾向选择生育二孩与倾向选择不生育二孩的人数比例图如图所示,其中阴影部分表示倾向选择生育二孩的对应比例,则下列叙述正确的是( )
A.是否倾向选择生育二孩与户籍有关
B.是否倾向选择生育二孩与性别无关
C.调查样本中倾向选择生育二孩的群体中,男性人数与女性人数相同
D.倾向选择不生育二孩的群体中,农村户籍人数多于城镇户籍人数
AB
解析:由不同群体中倾向选择生育二孩与倾向选择不生育二孩的人数比例图知,城镇户籍倾向选择生育二孩的比例为40%,农村户籍倾向选择生育二孩的比例为80%,所以是否倾向选择生育二孩与户籍有关,故A正确;男性倾向选择生育二孩的比例为60%,女性倾向选择生育二孩的比例为60%,所以是否倾向选择生育二孩与性别无关,故B正确;男性倾向选择生育二孩的比例为60%,人数为120×60%=72,女性倾向选择生育二孩的比例为60%,人数为80×60%=48,所以调查样本中倾向选择生育二孩的男性人数与女性人数不相同,故C错误;倾向选择不生育二孩的群体中,农村户籍人数为100×(1-80%)=20,城镇户籍人数为100×(1-40%)=60,所以倾向选择不生育二孩的群体中,农村户籍人数少于城镇户籍人数,故D错误.故选AB.
10.(7分)(多选)(2024·吉林长春二模)社区卫生服务中心(站)是我国医疗卫生服务和公共卫生应急管理体系的网底,是政府履行提供基本卫生服务职能的平台.社区卫生服务中心(站)可促进社区居民的基本需求(如疫苗接种、基本诊疗等)就近在社区得到解决,图中记录的是从2010年起十二年间我国社区卫生服务中心(站)的个数,根据此图可得关于这十二年间卫生服务中心(站)个数的结论正确的是( )
A.逐年增多
B.中位数为34 324
C.每年相对于前一年的增量连续增大
D.从2013年到2021年的增幅约为6%
ABD
11.(7分)(多选)某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得出如下的统计图:
用该样本估计总体,以下叙述中正确的是( )
A.54周岁及以上参保人数最少
B.18~29周岁人群参保总费用最少
C.丁险种更受参保人青睐
D.30周岁及以上的人群约占参保人群的20%
AC
解析:设抽查的5个险种参保客户的总人数为a,从扇形图可得到54周岁及以上参保人数占比为8%,人数最少,A正确;18~29周岁人群人均参保费用高于3 500元,故参保总费用高于3 500×20%a=700a(元),54周岁及以上人群人均参保费用为6 000元,故参保总费用为6 000×8%a=480a(元),由于700a>480a,故18~29周岁人群参保总费用不是最少的,B错误;从条形统计图可看出丁险种所占比例为0.55,比其他险种均高,故更受参保人青睐,C正确;30周岁及以上的人群约占参保人群的比例为39%+33%+8%=80%,D错误.故选AC.
12.(6分)某市市场监督管理局组织开展食品安全监督抽检,涉及粮食加工品(252批次)、食用油(240批次)、调味品(180批次)、乳制品(198批次)等20类食品(共2 712批次),要从这2 712批次食品中按照品类分层抽检452批次样品,则乳制品类要被抽检____批次样品.
33
13.(6分)(2024·河北石家庄三模)为了解全市高三学生的体能素质情况,在全市高三学生中随机抽取了1 000名学生进行体能测试,并将这1 000名学生的体能测试成绩整理成如图所示的频率分布直方图,则直方图中实数a的值为__________.
解析:由直方图可知组距为10,所以10×(0.005+a+0.020+0.040+0.020)=1,解得a=0.015.
0.015
14.(6分)下图是一名护士为一位病人测量体温所得数据的折线统计图,以下描述正确的是____.(填上所有正确的序号)
①护士平均每天为病人测量4次体温;②第一天病人病情并未得到有效控制,体温降后复升;③从第二天凌晨起病人体温在一直下降;④病人体温的极差为2.7 ℃.
②④
解析:由题中折线图可知三天总共只有11个数据,所以①不正确;由题中折线图可知第一天病人病情并未得到有效控制,体温降后复升,所以②正确;从第二天凌晨到第三天凌晨病人体温都在下降,但随后有所回升,所以③不正确;病人体温的极差为39.5-36.8=2.7(℃),所以④正确.
15.(6分)自1950年以来,世界卫生组织于每年4月7日庆祝世界卫生日,旨在引起世界各国人民对卫生、健康工作的关注,提高人们对卫生领域的素质和认识,强调健康对于劳动创造和幸福生活的重要性.为了让大家了解更多的健康知识,某中学组织三个年级的学生进行日常卫生知识竞赛,经统计,得到前200名学生分布的饼状图(如图1)和前200名学生中高一学生排名分布的频率条形图(如图2),则下列说法错误的是( )
D
A.成绩在前200名的学生中,高一人数比高二人数多30
B.成绩在第1~50名的学生中,高三最多有32人
C.高一学生成绩在第101~150名的人数一定比高三学生成绩在第1~50名的人数多
D.成绩在第51~100名的学生中,高二人数比高一人数多
解析:由题中饼状图可知,成绩在前200名的学生中高一人数比高二人数多200×(45%-30%)=30,A正确;成绩在第1~50名的学生中,高一人数为200×45%×0.2=18,因此高三最多有32人,B正确;由题中条形图知高一学生的成绩在第101~150名的人数为200×45%×0.4=36,而高三学生的成绩在第1~50名的人数最多为32,故高一学生的成绩在第101~150名的人数一定比高三学生的成绩在第1~50名的人数多,C正确;成绩在第51~100名的学生中,高一人数为200×45%×0.3=27,高二成绩在第51~100名的人数最多为23,即成绩在第51~100名的学生中高一的人数一定比高二的人数多,D错误.故选D.
16.(7分)(多选)如图为某新能源汽车企业2015—2022年及2023年1—9月份的营业额(单位:亿元)、净利润(单位:亿元)及2015—2022年营业额增长率的统计图.已知2023年第二、三、四季度的净利润相比上季度均增长10%,则下列结论正确的是( )
A.2015—2022年营业额逐年增加
B.2022年的净利润超过2017—2021年净
利润的总和
C.2015—2022年营业额增长率最大的是2022年
D.2023年第四季度的净利润比第一季度的净利润多30多亿元
BC