中小学教育资源及组卷应用平台
专题1.8数据的收集整理与描述
【目标导航】
【知识梳理】
1调查收集数据的过程与方法
(1)在统计调查中,我们利用调查问卷收集数据,利用表格整理数据,利用统计图描述数据,通过分析表和图来了解情况.
(2)统计图通常有条形统计图,扇形统计图,折线统计图.
(3)设计调查问卷分以下三步:①确定调查目的;②选择调查对象;③设计调查问题.
(4)统计调查的一般过程:
①问卷调查法-----收集数据;
②列统计表-----整理数据;
③画统计图-----描述数据.
2统计表
统计表可以将大量数据的分类结果清晰,一目了然地表达出来.
统计调查所得的原始资料,经过整理,得到说明社会现象及其发展过程的数据,把这些数据按一定的顺序排列在表格中,就形成“统计表”.统计表是表现数字资料整理结果的最常用的一种表格.
统计表是由纵横交叉线条所绘制的表格来表现统计资料的一种形式.
3全面调查与抽样调查
1、统计调查的方法有全面调查(即普查)和抽样调查.
2、全面调查与抽样调查的优缺点:①全面调查收集的到数据全面、准确,但一般花费多、耗时长,而且某些调查不宜用全面调查.②抽样调查具有花费少、省时的特点,但抽取的样本是否具有代表性,直接关系到对总体估计的准确程度.
3、如何选择调查方法要根据具体情况而定.一般来讲:通过普查可以直接得到较为全面、可靠的信息,但花费的时间较长,耗费大,且一些调查项目并不适合普查.其一,调查者能力有限,不能进行普查.如:个体调查者无法对全国中小学生身高情况进行普查.其二,调查过程带有破坏性.如:调查一批灯泡的使用寿命就只能采取抽样调查,而不能将整批灯泡全部用于实验.其三,有些被调查的对象无法进行普查.如:某一天,全国人均讲话的次数,便无法进行普查.
4总体、个体、样本、样本容量
(1)定义
????
①总体:我们把所要考察的对象的全体叫做总体;
????
②个体:把组成总体的每一个考察对象叫做个体;
????
③样本:从总体中取出的一部分个体叫做这个总体的一个样本;
????
④样本容量:一个样本包括的个体数量叫做样本容量.
(2)关于样本容量
????
样本容量只是个数字,没有单位.
5用样本估计总体
用样本估计总体是统计的基本思想.?
1、用样本的频率分布估计总体分布:
从一个总体得到一个包含大量数据的样本,我们很难从一个个数字中直接看出样本所包含的信息.这时,我们用频率分布直方图来表示相应样本的频率分布,从而去估计总体的分布情况.?
2、用样本的数字特征估计总体的数字特征(主要数据有众数、中位数、平均数、标准差与方差?).
一般来说,用样本去估计总体时,样本越具有代表性、容量越大,这时对总体的估计也就越精确.
6频数与频率
(1)频数是指每个对象出现的次数.
(2)频率是指每个对象出现的次数与总次数的比值(或者百分比).即频率=频数÷总数
一般称落在不同小组中的数据个数为该组的频数,频数与数据总数的比值为频率.频率反映了各组频数的大小在总数中所占的分量.
7频数(率)分布直方图
画频率分布直方图的步骤:
(1)计算极差,即计算最大值与最小值的差.(2)决定组距与组数(组数与样本容量有关,一般来说样本容量越大,分组就越多,样本容量不超过100时,按数据的多少,常分成5~12组).(3)确定分点,将数据分组.(4)列频率分布表.(5)绘制频率分布直方图.
注:①频率分布表列出的是在各个不同区间内取值的频率,频率分布直方图是用小长方形面积的大小来表示在各个区间内取值的频率.直角坐标系中的纵轴表示频率与组距的比值,即小长方形面积=组距×=频率.②各组频率的和等于1,即所有长方形面积的和等于1.③频率分布表在数量表示上比较确切,但不够直观、形象,不利于分析数据分布的总体态势.④从频率分布直方图可以清楚地看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容.
8频数(率)分布折线图
一般利用直方图画频数分布折线图,在频数分布直方图中,把每个小长方形上面的一条边的中点顺次连接起来,得到频数折线图.
注意:折线图要与横轴相交,方法是在直方图的左右两边各延伸一个假想组,并将频数折线两端连接到假想组中点,它主要显示数据的变化趋势.
9条形统计图
(1)定义:条形统计图是用线段长度表示数据,根据数量的多少画成长短不同的矩形直条,然后按顺序把这些直条排列起来.
(2)特点:从条形图可以很容易看出数据的大小,便于比较.
(3)制作条形图的一般步骤:
①根据图纸的大小,画出两条互相垂直的射线.
②在水平射线上,适当分配条形的位置,确定直条的宽度和间隔.
③在与水平射线垂直的射线上,根据数据大小的具体情况,确定单位长度表示多少.
④按照数据大小,画出长短不同的直条,并注明数量.
10折线统计图
(1)定义:折线图是用一个单位表示一定的数量,根据数量的多少描出各点,然后把各点用线段依次连接起来.以折线的上升或下降来表示统计数量增减变化.
(2)特点:折线图不但可以表示出数量的多少,而且能够清楚地表示出数量的增减变化情况.
(3)绘制折线图的步骤
①根据统计资料整理数据.?
②先画纵轴,后画横轴,纵、横都要有单位,按纸面的大小来确定用一定单位表示一定的数量.
③根据数量的多少,在纵、横轴的恰当位置描出各点,然后把各点用线段顺序连接起来.
11扇形统计图
(1)扇形统计图是用整个圆表示总数用圆内各个扇形的大小表示各部分数量占总数的百分数.通过扇形统计图可以很清楚地表示出各部分数量同总数之间的关系.用整个圆的面积表示总数(单位1),用圆的扇形面积表示各部分占总数的百分数.
(2)扇形图的特点:从扇形图上可以清楚地看出各部分数量和总数量之间的关系.
(3)制作扇形图的步骤
①根据有关数据先算出各部分在总体中所占的百分数,再算出各部分圆心角的度数,公式是各部分扇形圆心角的度数=部分占总体的百分比×360°.
②按比例取适当半径画一个圆;按扇形圆心角的度数用量角器在圆内量出各个扇形的圆心角的度数;
④在各扇形内写上相应的名称及百分数,并用不同的标记把各扇形区分开来.
【典例剖析】
【考点1】数据的收集
【例1】(2020秋?南岗区期中)某校六年级共有600名学生,在“世界读书日”前夕,开展了“阅读助我成长”的读书活动.统计了该年级学生在此次活动中课外阅读书籍的数量,并将统计的数据整理成如下不完整的统计表.根据统计表回答下面的问题:
(1)阅读4本书籍的学生有多少人?
(2)该年级全体学生在这次活动中课外阅读书籍的总量是多少本?
阅读量/本
1本
2本
3本
4本
占学生总人数的几分之几
【变式1.1】(2020?海淀区一模)某校举办球赛,分为若干组,其中第一组有A,B,C,D,E五个队.这五个队要进行单循环赛,即每两个队之间要进行一场比赛,每场比赛采用三局两胜制,即三局中胜两局就获胜.每场比赛胜负双方根据比分会获得相应的积分,积分均为正整数.这五个队完成所有比赛后得到如下的积分表.
根据上表回答下列问题:
(1)第一组一共进行了 场比赛,A队的获胜场数x为 ;
(2)当B队的总积分y=6时,上表中m处应填
,n处应填
;
(3)写出C队总积分p的所有可能值为:
.
【变式1.2】(2020春?滨江区期末)某市有9个区,为了解该市初中生的体重情况,有人设计了四种调查方案,你认为比较合理的是( )
A.测试该市某一所中学初中生的体重
B.测试该市某个区所有初中生的体重
C.测试全市所有初中生的体重
D.每区随机抽取5所初中,测试所抽学校初中生的体重
【变式1.3】(2020?安顺)2020年为阻击新冠疫情,某社区要了解每一栋楼的居民年龄情况,以便有针对性进行防疫,一志愿者得到某栋楼60岁以上人的年龄(单位:岁)数据如下:62,63,75,79,68,85,82,69,70.获得这组数据的方法是( )
A.直接观察
B.实验
C.调查
D.测量
【考点2】全面调查与抽样调查
【例2】(2016春?南皮县校级月考)下列调查运用哪种调查方式合适?
(1)调查淮河流域的水污染情况;
(2)调查一个村庄所有家庭的年收入情况;
(3)调查某电视剧的收视率;
(4)调查某一地区市场上奶粉的质量状况;
(5)调查初一二班学生课外时间上网的情况.
【变式2.1】(2020春?鱼台县期末)为了解学生为地震灾区捐款的情况,王老师随机调查了本校10名学生,它们的捐款数为(单位:元)19,20,25,30,100,27,50,21,50,60.在这个问题中,王老师采用的调查方法是
.
【变式2.2】(2019春?顺义区期末)有下列五项调查:①了解一批科学计算器的使用寿命;②了解潮白河水质情况;③了解某种奶制品中蛋白质的含量;④了解某班学生对“社会主义核心价值观”的知晓率;⑤了解一辆大巴车上的游客登上八达岭长城的情况.其中适合用普查方法的是 .(填序号)
【变式2.3】(2020秋?潍城区期中)国务院决定于2020年11月1日零时开展第七次全国人口普查,人口调查采用普查方式的理由是( )
A.人口调查的数目不太大
B.人口调查需要获得全面准确的信息
C.人口调查具有破坏性
D.受条件限制,无法进行抽样调查
【变式2.4】(2020秋?天心区期中)下面的调查方式中,你认为合适的是( )
A.调查市场上酸奶的质量情况,采用抽样调查方式
B.了解长沙市居民日平均用水量,采用全面调查方式
C.乘坐飞机前的安检,采用抽样调查方式
D.某LED灯厂要检测一批灯管的使用寿命,采用全面调查方式
【考点3】总体、个体、样本
【例3】(2020春?灌云县期中)为了考察某市1万名初中生视力情况,从中抽取1000人进行视力检测,这个问题中总体、个体、样本、分别是什么?
【变式3.1】(2020春?高新区期中)今年某校有2000名学生参加线上学习,为了解这些学生的数学成绩,从中抽取100名考生的数学成绩进行统计分析,以下说法正确的是( )
A.2000名学生是总体
B.每位学生的数学成绩是个体
C.这100名学生是总体的一个样本
D.100名学生是样本容量
【变式3.2】(2020秋?开福区校级月考)2020年我市有4.3万名初中毕业生参加升学考试,为了了解这4.3万学生的数学成绩,从中抽取2000名学生的数学成绩进行统计,这个问题中样本是( )
A.4.3万名考生
B.2000名考生
C.4.3万名考生的数学成绩
D.2000名考生的数学成绩
【变式3.3】(2020春?仪征市期中)为了解我市2019年中考数学学科各分数段成绩分布情况,从中抽取150名考生的中考数学成绩进行统计分析,在这个问题中,样本是
.
【变式3.4】(2020春?西岗区期末)为了测算一块600亩试验田里新培育的杂交水稻的产量,随机对其中的50亩杂交水稻的产量进行了检测,在这个问题中,数字50是 .
【考点4】用样本估计总体
【例4】(2020?广东)某中学开展主题为“垃圾分类知多少”的调查活动,调查问卷设置了“非常了解”、“比较了解”、“基本了解”、“不太了解”四个等级,要求每名学生选且只能选其中一个等级,随机抽取了120名学生的有效问卷,数据整理如下:
等级
非常了解
比较了解
基本了解
不太了解
人数(人)
24
72
18
x
(1)求x的值;
(2)若该校有学生1800人,请根据抽样调查结果估算该校“非常了解”和“比较了解”垃圾分类知识的学生共有多少人?
【变式4.1】(2020春?嘉陵区期末)两年前我市有县区申报了长寿之乡,并获认定.上月一所初中七(1)班学生社会实践前往该区一乡镇调研进入老龄化社会的数据.按国际通行标准,当一个国家或地区60及60岁以上人口达到总人口的10%,或65及65岁以上人口达到总人口的7%,这个区域进入老龄化社会.被调查的800人年龄情况统计图如下:
(1)这个乡镇是否进入老龄化社会?请说明理由.
(2)这个乡镇人口约20000人,求年龄不低于70岁的人数.
(3)请你为这个乡镇提一条合理化建议.
【变式4.2】(2020?东海县二模)交警部门在全县范围开展了安全使用电瓶车专项宣传活动,在活动前和活动后分别随机抽取了部分使用电瓶车的市民,就骑电瓶车戴安全头盔情况进行问卷调查,将收集的数据制成如下统计图表.
(1)“活动前骑电瓶车戴安全头盔情况统计表”中a的值为 ;
(2)全县约有30万人使用电瓶车,请估计活动前全县骑电瓶车“都不戴”安全头盔的总人数;
(3)小明认为,宣传活动后骑电瓶车“都不戴”安全头盔的人数为178,比活动前增加了1人,因此交警部门开展的宣传活动没有效果小明分析数据的方法是否合理?为什么?
【变式4.3】(2019秋?庐江县期末)为了估计鱼塘中的鱼数,养鱼老汉首先从鱼塘中打捞n条鱼,并在每一条鱼身上做好记号,然后把这些鱼放归鱼塘,过一段时间,让鱼儿充分游动,再从鱼塘中打捞a条鱼,如果在这a条鱼中有b条是有记号的,那么养鱼老汉就能估计鱼塘中鱼的条数.请写出鱼塘中鱼的条数,并说明理由.
【考点5】频数与频率
【例5】(2020春?安吉县期末)从某服装厂即将出售的一批休闲装中抽检200件,其中不合格的休闲装有15件.
(1)抽检中合格的频数,频率分别是多少?
(2)销售3000套这样的休闲装,大约有多少件不合格的休闲装?
【变式5.1】(2020?秦淮区一模)在某市2019年青少年航空航天模型锦标赛中,各年龄组的参赛人数情况如表所示:
年龄组
13岁
14岁
15岁
16岁
参赛人数
5
19
12
14
若小明所在年龄组的参赛人数占全体参赛人数的38%,则小明所在的年龄组是( )
A.13岁
B.14岁
C.15岁
D.16岁
【变式5.2】(2020秋?西城区校级月考)秋季新学期开学,某中学对初一新生掌握“中学生日常行为规范”的情况进行了知识测试,测试成绩全部合格.现随机抽取了部分学生的成绩制作成如下表格,则b= ,c= .
分数段
频数
频率
60≤x<70
6
a
70≤x<80
20
0.4
80≤x<90
15
b
90≤x<100
c
0.18
【变式5.3】(2018春?淮安区期中)小花最近买了三本课外书,分别是《汉语字典》用A表示,《流行杂志》用B表示和《故事大王》用C表示.班里的同学都很喜欢借阅,在五天内小花做了借书记录如下表:
书名
代号
借阅次数
借阅
频数
星期一
星期二
星期三
星期四
星期五
A
3
2
2
3
4
14
B
4
3
3
2
3
15
C
1
2
3
2
3
11
(1)在表中填写五天内每本书的借阅频数.
(2)计算五天内《汉语字典》的借阅频率.
【变式5.4】(2020春?萧山区校级月考)在某项针对18~35岁的青年人每天发微博数量的调查中,设一个人的“日均发微博条数”为m,规定:当m≥10时为A级,当5≤m<10时为B级,当0≤m<5时为C级.现随机抽取30个符合年龄条件的青年人开展每人“日均发微博条数”的调查,所抽青年人的“日均发微博条数”的数据如下:
11
10
6
15
9
16
13
12
0
8
2
8
10
17
6
13
7
5
7
3
12
10
7
11
3
6
8
14
15
12
(1)求样本数据中为A级的频率;
(2)试估计1000个18~35岁的青年人中“日均发微博条数”为A级的人数.
【考点6】频数(率)分布直方图
【例6】(2020春?黄埔区期末)某校组织全校2000名学生进行了时事知识竞赛.为了解成绩的分布情况,随机抽取了部分学生的成绩(得分取整数,满分为100分),并绘制了频数分布表和频数分布直方图(不完整).
分组
50.5≤x<60.5
60.5≤x<70.5
70.5≤x<80.5
80.5≤x<90.5
90.5≤x<100.5
合计
频数
20
48
a
104
148
400
根据所给信息,回答下列问题:
(1)频数分布表中,a= 80 ;
(2)补全频数分布直方图;
(3)学校将对分数x在90.5≤x<100.5范围内的学生进行奖励,请你估算出全校获奖学生的人数.
【变式6.1】(2020春?邹平市期末)某校初二年级组织400名学生参加了一次数学学科知识大赛.赛后发现所有参赛学生的成绩均不低于60分,为了更好地了解本次大赛的成绩分布情况,随机抽取了40名学生的成绩作为样本,成绩如下:
90,92,81,82,78,95,86,88,72,66,62,68,89,86,93,97,100,73,76,80,77,81,86,89,82,85,71,68,74,98,90,97,100,84,87,73,65,92,92,60
请根据所给信息,解答下列问题:
(1)对上述成绩按下表的分组,完成该频数分布表:
成绩x(分)分组
划记
频数
60≤x<70
6
70≤x<80
8
80≤x<90
14
90≤x≤100
12
(2)根据统计表,在图中画出频数分布直方图;
(3)若成绩在90分以上(包括90分)的为“优”等,请你估计参加这次比赛的400名学生中成绩“优”等的约有多少人?
【变式6.2】(2020秋?大洼区月考)某校为了解本校200名14周岁女生的身体发育状况,任意抽取了20名女生,对其身高进行测量,结果如下:(数据均为整数,单位cm)
154
159
166
169
156
162
158
160
161
158
164
158
153
157
162
165
151
160
158
149
(1)按组距为5将数据分组,则分成 组;
(2)列出频数分布表;画出频数分布直方图;
(3)20人中身高在哪个范围内的人数最多?
(4)该校14周岁女生身体在160cm以上(包括160cm)的大概有多少名?
【变式6.3】(2020春?莱州市期末)某公路上的测速仪,在某一时间段内测得30辆汽车的速度(单位:km/h),其最大值和最小值分别是80,56.为了制作频数直方图,以5为组距,这样,可以把数据分成( )
A.4组
B.5组
C.6组
D.10组
【变式6.4】(2020春?沂水县期末)小文同学统计了他所在小区部分居民每天微信阅读的时间,绘制了直方图.得出了如下结论:①样本中每天阅读微信的时间没人超过1小时,由此可以断定这个小区的居民每天阅读微信时间超过1小时的很少;②样本中每天微信阅读不足20分钟的人数大约占16%;③选取样本的样本容量是60;④估计所有居民每天微信阅读35分钟以上的人数大约占总居民数的一半左右.其中正确的是( )
A.①②③
B.①②④
C.①③④
D.②③④
【考点7】频数(率)分布折线图
【例7】(2020?江西)为积极响应教育部“停课不停学”的号召,某中学组织本校优秀教师开展线上教学,经过近三个月的线上授课后,在五月初复学.该校为了解学生不同阶段学习效果,决定随机抽取八年级部分学生进行两次跟踪测评,第一次是复学初对线上教学质量测评,第二次是复学一个月后教学质量测评.根据第一次测试的数学成绩制成频数分布直方图(图1).
复学一个月后,根据第二次测试的数学成绩得到如下统计表:
成绩
30≤x<40
40≤x<50
50≤x<60
60≤x<70
70≤x<80
80≤x<90
90≤x≤100
人数
1
3
3
8
15
m
6
根据以上图表信息,完成下列问题:
(1)m= ;
(2)请在图2中作出两次测试的数学成绩折线图,并对两次成绩作出对比分析(用一句话概述);
(3)某同学第二次测试数学成绩为78分.这次测试中,分数高于78分的至少有 人,至多有 人;
(4)请估计复学一个月后该校800名八年级学生数学成绩优秀(80分及以上)的人数.
【变式7.1】(2017春?海陵区校级月考)有大小两个转盘,其中黑色区域都是中心角为90°的扇形,为了探究指针落在黑色区域的频率,甲乙两人分别转动两转盘,记录下表(A:指针落在大转盘的黑色区域频数;B:大转盘中的频率;C:指针落在小转盘的黑色区域频数;D:小转盘中相应频率)
次数
25
50
75
100
125
150
175
200
225
A
8
15
21
26
32
36
44
51
57
B
0.32
0.30
0.28
0.26
0.256
0.24
0.251
0.255
0.253
C
8
13
21
26
32
37
43
49
55
D
0.32
0.26
0.28
0.26
0.256
0.247
0.246
0.245
0.244
(1)将B、D两空格填写完整;
(2)分别绘出指针落在大小转盘中黑色区域的频率折线图;
(3)比较25次与50次的大小频率之差及200与225次之间大小转盘两频率之差;
(4)从(3)中频率之差及折线统计图中的变化趋势,你能总结出什么规律?
【变式7.2】(2020春?博白县期末)如图是某景点6月份内1~10日每天的最高温度折线统计图,由图信息可知该景点这10天中,气温26℃出现的频率是 .
【变式7.3】(2019秋?泉州期末)如图为某一试验结果的频率随机试验次数变化趋势图,则下列试验中不符合该图的是( )
A.掷一枚普通正六面体骰子,出现点数不超过2
B.掷一枚硬币,出现正面朝上
C.从装有2个黑球、1个白球的不透明布袋中随机摸出一球为白球
D.从分别标有数字1,2,3,4,5,6,7,8,9的九张卡片中,随机抽取一张卡片所标记的数字不小于7
【考点8】条形统计图
【例8】(2020春?铜陵期末)为积极响应垃圾分类活动,某学校开展了主题为“打造无废校园,助力无废城市”的宣传活动.为了解学生对垃圾分类知识的掌握情况,该校环保社团成员在校园内随机抽取了部分学生进行问卷调査,将他们的得分按优秀、良好、合格、不合格四个等级进行统计,并绘制了如图不完整的统计表和条形统计图.
等级
频数
频率
优秀
19
38%
良好
m
44%
合格
7
n%
不合格
2
4%
(1)本次调查随机抽取了 名学生;表中m= ,n= ;
(2)补全条形统计图;
(3)垃圾分类节约资源,还地球一个碧海蓝天,写一句关于垃圾分类的宣传标语,要求20字以内;
(4)若全校有1500名学生,请你估计该校掌握垃圾分类知识达到“优秀”和“良好”等级的学生共有多少人?
【变式8.1】(2020春?泸县期末)数学老师布置10道选择题作为课堂练习,学习委员将全班同学的答题情况绘制成条形图,根据统计图可知,答对8道题的同学的频率是 .
【变式8.2】(2020?哈尔滨)为了丰富同学们的课余生活,冬威中学开展以“我最喜欢的课外活动小组”为主题的调查活动,围绕“在绘画、剪纸、舞蹈、书法四类活动小组中,你最喜欢哪一类?(必选且只选一类)”的问题,在全校范围内随机抽取部分学生进行问卷调查,将调查结果整理后绘制成如图所示的不完整的条形统计图,其中最喜欢绘画小组的学生人数占所调查人数的30%.请你根据图中提供的信息回答下列问题:
(1)在这次调查中,一共抽取了多少名学生?
(2)请通过计算补全条形统计图;
(3)若冬威中学共有800名学生,请你估计该中学最喜欢剪纸小组的学生有多少名.
【变式8.3】(2020春?哈尔滨期末)疫情期间某校想了解六年级学生在家运动的情况,随机抽取该校六年级的若干名学生进行调查,调查内容是“你在家的体育活动项目是什么?(只写一项)”的问题,从而得到一组数据,如图是根据这组数据绘制的条形统计图、请结合统计图回答下列问题:
(1)此次调查采取的调查方式是 抽样调查 ;(填“全面调查”或“抽样调查”)
(2)该校对多少名学生进行了调查?
(3)若该校六年级共有500名学生,请你估计该校六年级学生中在家参与跳绳活动的有多少名学生?
【考点9】折线统计图
【例9】(2020秋?南岗区校级月考)下面是公司去年每月收入和支出情况统计图,请根据统计图填空并回答问题.
(1) 月收入和支出相差最小. 月收入和支出相差最大.
(2)12月收入和支出相差 万元.
(3)去年平均每月支出 万元.
【变式9.1】(2020秋?沙坪坝区校级月考)嘉陵江为长江上游支流,因流经陕西风县东北嘉陵谷而得名.干流流经陕西省、甘肃省、四川省、重庆市,在重庆朝天门汇入长江,嘉陵江的警戒水位是237.1米,上周星期日的嘉陵江水位刚好达到警戒水位,如表记录的是本周内的水位变化情况.(正号表示水位比前一天上升,负号表示水位比前一天下降)
星期
一
二
三
四
五
六
日
水位变化(米)
+0.20
+0.80
﹣0.35
+0.30
+0.25
﹣0.30
﹣0.60
(1)本周哪一天河流的水位最高?最高水位是多少米?
(2)本周日与上周日相比,水位是增加了还是减少了?如果是增加了,求出增加了多少米,如果是减少了,求出减少了多少米?
(3)以警戒水位作为0点,用折线统计图表示本周的水位情况.
【变式9.2】(2020春?定襄县期末)太原市某校积极开展中学社会实践活动,决定成立文明宣传、环境保护、交通监督三个志愿队伍,每名学生最多选择一个队伍.为了解学生的选择意向,随机抽取七年级(1)(2)(3)(4)四个班,共200名学生进行调查,将调查得到的数据进行整理,绘制成如图所示两幅不完整的统计图,根据统计图提供的信息解答下列
问题:
(1)求扇形统计图中,交通监督所占的百分比;
(2)求(4)班选择环境保护志愿者队伍的学生人数,补全折线统计图;
(3)若该校共有3000人,请你估计该校学生选择文明宣传志愿者队伍的人数.
【变式9.3】(2020?大兴区一模)新冠肺炎疫情暴发后,一场同时间赛跑、与病魔较量的战役随即打响.在疫情防控一线,除了广大医务工作者义无反顾、日夜奋战之外,在另一条战线上,科研人员也在加班加点、紧急攻关.全国科技战线积极响应党中央号召,科技、卫健等12个部门组成科研攻关组,短短一个月的时间内就取得了积极进展.3月13日0﹣24时,31个省(自治区、直辖市)和新疆生产建设兵团新增确诊病例11例(数据不含港澳台),新增疑似病例17例(数据不含港澳台).
如图是根据国家卫健委关于新型冠状病毒肺炎通报的数据(数据不含港澳台)绘制的统计图:
根据以上信息,回答下列问题:
(1)下列推断合理的是 .
①2月15日武汉新增确诊病例约为1500例;
②从2月23日起到3月13日止,武汉每日新增确诊病例都在500例以下;
③从2月23日起到3月13日止,全国每日新增疑似病例逐渐减少.
④3月13日湖北新增疑似病例不超过17例.
(2)结合本题的信息及当前防疫形势,说说你的感受.
【考点10】扇形统计图
【例10】(2020春?安新县期末)2019年底至2020年初我国爆发了新冠肺炎疫情,为了增加学生对疫情和新冠肺炎预防知识的了解,某学校利用网络开展了相关知识的宣传教育活动,为了解这次的宣传效果,学校从全校3600名学生中随机抽取200名学生进行知识测试(满分100分,得分均为整数),并根据这200人的测试成绩,绘制了统计图表:
200名学生成绩的频数表
等级
成绩/分
频数/人
E
50≤a<60
20
D
60≤a<70
30
C
70≤a<80
m
B
80≤a<90
n
A
90≤a≤100
30
(1)m= 40 ,n= 80 ;
(2)成绩最好的等级A所占的百分比 15% ;等级E在扇形图中所对应的圆心角的度数为 36° ;
(3)如果80分以上(包括80分)为优秀,请估计全校3600名学生中成绩优秀的人数.
【变式10.1】(2020春?濮阳期末)某中学组织学生参加预防新冠知识网络测试小明对七年级一班全体学生的测试成绩进行统计,并绘制了如图不完整的频数分布表和扇形统计图:
组别
分数段(x)
频数
A
0≤x<60
2
B
60≤x<70
5
C
70≤x<80
17
D
80≤x<90
a
E
90≤x≤100
b
根据图表中的信息解答下列问题:
(1)七年级一班学生的人数为 ,频数分布表中a的值为 .
(2)已知该市共有9000名中学生参加这次安全知识测试,若规定80分以上(含80分)为优秀,估计该市本次测试成绩达到优秀的人数;
(3)小明通过该市教育网站搜索发现,全市参加本次测试的中学生中,成绩达到优秀有5632人.请你用所学统计知识简要说明实际优秀人数与估计人数出现较大偏差的原因.
【变式10.2】(2019秋?道外区期末)学校图书馆有励志、文学、科技及漫画四类图书.为了了解学生上周图书借阅情况(每人仅限借阅一本),图书管理员统计后绘制了如图不完整的扇形统计图,请根据图中所给信息解答以下问题:
(1)借阅人数最少的是 类图书;
(2)求借阅文学类图书人数是多少?
(3)如果借阅漫画类图书的人数占全校学生总人数的2%,那么全校学生总人数是多少?
【变式10.3】(2020春?白云区期末)某中学开展主题为“垃圾分类知多少”的专题调查活动,采取随机抽样的方式进行问卷调查,问卷调查的结果分为“非常了解”、“比较了解”、“基本了解”、“不太了解”四个等级,调查结果统计如表:
等级
非常了解
比较了解
基本了解
不太了解
人数
50
110
36
4
百分比
25%
m
18%
2%
(1)本次问卷调查抽取的样本容量为 ,表中m= %;
(2)求“非常了解”对应扇形的圆心角度数,并补全如图的扇形统计图.
【变式10.4】(2020春?绥棱县期末)如图是星光电器厂职工学历情况统计图.
(1)该厂大专以上学历(包括大专)的职工占百分之几?
(2)本科学历的职工比中专学历的职工多120人,本科学历的职工有多少人?
【考点11】数据的收集与整理综合问题
【例11】(2020春?瑞安市月考)未成年人思想道德建设越来越受到社会的关注.某青少年研究机构随机调查了某校100名学生寒假花零花钱的数量(钱数取整数元),以便引导学生树立正确的消费观,根据调查数据制成了如下的频数分布表(部分空格未填).
某校100名学生寒假花零花钱数量的频数分布表
分组
组中值
频数
频率
0.5﹣50.5
25.5
10
0.1
50.5﹣100.5
75.5
20
0.2
100.5﹣150.5
125.5
25
0.25
150.5﹣200.5
175.5
30
0.3
200.5﹣250.5
225.5
10
0.1
250.5﹣300.5
275.5
5
0.05
合计
100
1.00
(1)完成该频数分布表;
(2)把频数分布直方图补全;
(3)研究认为应对消费200元以上的学生提出勤俭节约的建议,试估计应对该校1800学生中约多少名学生提出该项建议?
【变式11.1】(2020秋?西城区校级月考)小明、小聪参加了100m跑的5期集训,每期集训结束时进行测试,根据他们的集训时间和测试成绩绘制成如图两个统计图.根据图中的信息,有如下四个推断:
①这五期集训共有56天;
②小明5次测试的平均成绩(时间)超过11.6秒;
③这5次测试成绩中,有3次小聪比小明好;
④从五期集训来看,集训时间越长,所测试出的成绩就越好.
其中合理推断的序号为( )
A.①
B.①②
C.①②③
D.①②③④
【变式11.2】(2020秋?漳平市期中)从全校1200名学生中随机选取一部分学生一周上网时间进行调查,调查情况:A:上网时间≤1小时;B:1小时<上网时间≤4小时;C:4小时<上网时间≤7小时;D:上网时间>7小时.统计结果制成了如图统计图:
(1)参加调查的学生有 人,在扇形统计图中,D类学生所占扇形的圆心角度数为 ;
(2)请将条形统计图补全;
(3)请估计全校一周上网时间不超过7小时的学生人数.
【变式11.3】(2020春?崇川区校级月考)为了了解南通市80万市民“获取新闻的最主要途径”,某市记者开展了一次调查,根据调查结果绘制了如下尚不完整的统计图.
根据以上信息解答下列问题:
(1)这次调查适合采用 的调查方式(填“全面调查”或“抽样调查”);
(2)这次调查样本容量是 .
(3)扇形统计图中,“电视”所对应的圆心角的度数是 ;
(4)条形统计图中“报纸”对应的人数是 ;
(5)南通市约有80万人,请估计其中将“电脑和手机上网”作为“获取新闻的最主要途径”的总人数.
21世纪教育网(www.21cnjy.com)中小学教育资源及组卷应用平台
专题1.8数据的收集整理与描述
【目标导航】
【知识梳理】
1调查收集数据的过程与方法
(1)在统计调查中,我们利用调查问卷收集数据,利用表格整理数据,利用统计图描述数据,通过分析表和图来了解情况.
(2)统计图通常有条形统计图,扇形统计图,折线统计图.
(3)设计调查问卷分以下三步:①确定调查目的;②选择调查对象;③设计调查问题.
(4)统计调查的一般过程:
①问卷调查法-----收集数据;
②列统计表-----整理数据;
③画统计图-----描述数据.
2统计表
统计表可以将大量数据的分类结果清晰,一目了然地表达出来.
统计调查所得的原始资料,经过整理,得到说明社会现象及其发展过程的数据,把这些数据按一定的顺序排列在表格中,就形成“统计表”.统计表是表现数字资料整理结果的最常用的一种表格.
统计表是由纵横交叉线条所绘制的表格来表现统计资料的一种形式.
3全面调查与抽样调查
1、统计调查的方法有全面调查(即普查)和抽样调查.
2、全面调查与抽样调查的优缺点:①全面调查收集的到数据全面、准确,但一般花费多、耗时长,而且某些调查不宜用全面调查.②抽样调查具有花费少、省时的特点,但抽取的样本是否具有代表性,直接关系到对总体估计的准确程度.
3、如何选择调查方法要根据具体情况而定.一般来讲:通过普查可以直接得到较为全面、可靠的信息,但花费的时间较长,耗费大,且一些调查项目并不适合普查.其一,调查者能力有限,不能进行普查.如:个体调查者无法对全国中小学生身高情况进行普查.其二,调查过程带有破坏性.如:调查一批灯泡的使用寿命就只能采取抽样调查,而不能将整批灯泡全部用于实验.其三,有些被调查的对象无法进行普查.如:某一天,全国人均讲话的次数,便无法进行普查.
4总体、个体、样本、样本容量
(1)定义
????
①总体:我们把所要考察的对象的全体叫做总体;
????
②个体:把组成总体的每一个考察对象叫做个体;
????
③样本:从总体中取出的一部分个体叫做这个总体的一个样本;
????
④样本容量:一个样本包括的个体数量叫做样本容量.
(2)关于样本容量
????
样本容量只是个数字,没有单位.
5用样本估计总体
用样本估计总体是统计的基本思想.?
1、用样本的频率分布估计总体分布:
从一个总体得到一个包含大量数据的样本,我们很难从一个个数字中直接看出样本所包含的信息.这时,我们用频率分布直方图来表示相应样本的频率分布,从而去估计总体的分布情况.?
2、用样本的数字特征估计总体的数字特征(主要数据有众数、中位数、平均数、标准差与方差?).
一般来说,用样本去估计总体时,样本越具有代表性、容量越大,这时对总体的估计也就越精确.
6频数与频率
(1)频数是指每个对象出现的次数.
(2)频率是指每个对象出现的次数与总次数的比值(或者百分比).即频率=频数÷总数
一般称落在不同小组中的数据个数为该组的频数,频数与数据总数的比值为频率.频率反映了各组频数的大小在总数中所占的分量.
7频数(率)分布直方图
画频率分布直方图的步骤:
(1)计算极差,即计算最大值与最小值的差.(2)决定组距与组数(组数与样本容量有关,一般来说样本容量越大,分组就越多,样本容量不超过100时,按数据的多少,常分成5~12组).(3)确定分点,将数据分组.(4)列频率分布表.(5)绘制频率分布直方图.
注:①频率分布表列出的是在各个不同区间内取值的频率,频率分布直方图是用小长方形面积的大小来表示在各个区间内取值的频率.直角坐标系中的纵轴表示频率与组距的比值,即小长方形面积=组距×=频率.②各组频率的和等于1,即所有长方形面积的和等于1.③频率分布表在数量表示上比较确切,但不够直观、形象,不利于分析数据分布的总体态势.④从频率分布直方图可以清楚地看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容.
8频数(率)分布折线图
一般利用直方图画频数分布折线图,在频数分布直方图中,把每个小长方形上面的一条边的中点顺次连接起来,得到频数折线图.
注意:折线图要与横轴相交,方法是在直方图的左右两边各延伸一个假想组,并将频数折线两端连接到假想组中点,它主要显示数据的变化趋势.
9条形统计图
(1)定义:条形统计图是用线段长度表示数据,根据数量的多少画成长短不同的矩形直条,然后按顺序把这些直条排列起来.
(2)特点:从条形图可以很容易看出数据的大小,便于比较.
(3)制作条形图的一般步骤:
①根据图纸的大小,画出两条互相垂直的射线.
②在水平射线上,适当分配条形的位置,确定直条的宽度和间隔.
③在与水平射线垂直的射线上,根据数据大小的具体情况,确定单位长度表示多少.
④按照数据大小,画出长短不同的直条,并注明数量.
10折线统计图
(1)定义:折线图是用一个单位表示一定的数量,根据数量的多少描出各点,然后把各点用线段依次连接起来.以折线的上升或下降来表示统计数量增减变化.
(2)特点:折线图不但可以表示出数量的多少,而且能够清楚地表示出数量的增减变化情况.
(3)绘制折线图的步骤
①根据统计资料整理数据.?
②先画纵轴,后画横轴,纵、横都要有单位,按纸面的大小来确定用一定单位表示一定的数量.
③根据数量的多少,在纵、横轴的恰当位置描出各点,然后把各点用线段顺序连接起来.
11扇形统计图
(1)扇形统计图是用整个圆表示总数用圆内各个扇形的大小表示各部分数量占总数的百分数.通过扇形统计图可以很清楚地表示出各部分数量同总数之间的关系.用整个圆的面积表示总数(单位1),用圆的扇形面积表示各部分占总数的百分数.
(2)扇形图的特点:从扇形图上可以清楚地看出各部分数量和总数量之间的关系.
(3)制作扇形图的步骤
①根据有关数据先算出各部分在总体中所占的百分数,再算出各部分圆心角的度数,公式是各部分扇形圆心角的度数=部分占总体的百分比×360°.
②按比例取适当半径画一个圆;按扇形圆心角的度数用量角器在圆内量出各个扇形的圆心角的度数;
④在各扇形内写上相应的名称及百分数,并用不同的标记把各扇形区分开来.
【典例剖析】
【考点1】数据的收集
【例1】(2020秋?南岗区期中)某校六年级共有600名学生,在“世界读书日”前夕,开展了“阅读助我成长”的读书活动.统计了该年级学生在此次活动中课外阅读书籍的数量,并将统计的数据整理成如下不完整的统计表.根据统计表回答下面的问题:
(1)阅读4本书籍的学生有多少人?
(2)该年级全体学生在这次活动中课外阅读书籍的总量是多少本?
阅读量/本
1本
2本
3本
4本
占学生总人数的几分之几
【分析】(1)根据各组频率之和为1,即可求出阅读量为4本所占的几分之几,进而求出相应的人数;
(2)求出阅读量为1本,2本、3本、4本的人数,即可求出阅读总数量.
【解析】(1)600×(1)=60(人),
答:阅读4本书籍的学生有60人;
(2)1×(600)+2×(600)+3×(600)+4×(600)=1380(本),
答:该年级全体学生在这次活动中课外阅读书籍的总量是1380本.
【变式1.1】(2020?海淀区一模)某校举办球赛,分为若干组,其中第一组有A,B,C,D,E五个队.这五个队要进行单循环赛,即每两个队之间要进行一场比赛,每场比赛采用三局两胜制,即三局中胜两局就获胜.每场比赛胜负双方根据比分会获得相应的积分,积分均为正整数.这五个队完成所有比赛后得到如下的积分表.
根据上表回答下列问题:
(1)第一组一共进行了 10 场比赛,A队的获胜场数x为 3 ;
(2)当B队的总积分y=6时,上表中m处应填 0:2 ,n处应填 2:0 ;
(3)写出C队总积分p的所有可能值为: 9或10 .
【分析】(1)按照5个队中每个队都要和另外4个队进行一场比赛,而A与B和B与A属于同一场比赛,列式计算或直接从表中数一下即可得比赛场数;根据表中比赛结果可直接得出A队的获胜场数x的值;
(2)每场比赛的结果有四种:0:2,1:2,2:1,2:0,设以上四种得分为a,b,c,d,且a<b<c<d,根据E和A的总分可得关于a,b,c,d的等式,化简即可得出a,b,c,d的值,设m对应的积分为x,根据题意得关于x的方程,解得x的值,则可得答案;
(3)C队胜2场,分两种情况:当C、B的结果为2:0时;当C、B的结果为2:1时,分别计算出p的值即可.
【解析】(1)∵10(场),
∴第一组一共进行了10场比赛;
∵每场比赛采用三局两胜制,A、B的结果为2:1,A、C的结果为2:0,A、E的结果为2:0,
∴A队的获胜场数x为3;
故答案为:10,3;
(2)由题可知:每场比赛的结果有四种:0:2,1:2,2:1,2:0,
根据题意可知每种结果都会得到一个正整数积分,设以上四种得分为a,b,c,d,且a<b<c<d,
根据E的总分可得:a+c+b+c=9,
∴a=1,b=2,c=3,
根据A的总分可得:c+d+b+d=13,
∴d=(13﹣c﹣b)÷2
=(13﹣3﹣2)÷2
=4,
设m对应的积分为x,
当y=6时,b+x+a+b=6,即2+x+1+2=6,
∴x=1,
∴m处应填0:2;
∴B:C=0:2,
∴C:B=2:0,
∴n处应填2:0;
(3)∵C队胜2场,
∴分两种情况:当C、B的结果为2:0时,
p=1+4+3+2=10;
当C、B的结果为2:1时,
p=1+3+3+2=9;
∴C队总积分p的所有可能值为9或10.
故答案为:9或10.
【变式1.2】(2020春?滨江区期末)某市有9个区,为了解该市初中生的体重情况,有人设计了四种调查方案,你认为比较合理的是( )
A.测试该市某一所中学初中生的体重
B.测试该市某个区所有初中生的体重
C.测试全市所有初中生的体重
D.每区随机抽取5所初中,测试所抽学校初中生的体重
【分析】利用抽样调查的中样本的代表性即可作出判断.
【解析】某市有9个区,为了解该市初中生的体重情况,设计了四种调查方案.
比较合理的是:每区随机抽取5所初中,测试所抽学校初中生的体重,
故选:D.
【变式1.3】(2020?安顺)2020年为阻击新冠疫情,某社区要了解每一栋楼的居民年龄情况,以便有针对性进行防疫,一志愿者得到某栋楼60岁以上人的年龄(单位:岁)数据如下:62,63,75,79,68,85,82,69,70.获得这组数据的方法是( )
A.直接观察
B.实验
C.调查
D.测量
【分析】直接利用调查数据的方法分析得出答案.
【解析】一志愿者得到某栋楼60岁以上人的年龄(单位:岁)数据如下:62,63,75,79,68,85,82,69,70.
获得这组数据的方法是:调查.
故选:C.
【考点2】全面调查与抽样调查
【例2】(2016春?南皮县校级月考)下列调查运用哪种调查方式合适?
(1)调查淮河流域的水污染情况;
(2)调查一个村庄所有家庭的年收入情况;
(3)调查某电视剧的收视率;
(4)调查某一地区市场上奶粉的质量状况;
(5)调查初一二班学生课外时间上网的情况.
【分析】根据普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果比较近似进行判断即可.
【解析】(1)调查淮河流域的水污染情况适合采用抽样调查的方式;
(2)调查一个村庄所有家庭的年收入情况适合采用全面调查的方式;
(3)调查某电视剧的收视率适合采用抽样调查的方式;
(4)调查某一地区市场上奶粉的质量状况适合采用抽样调查的方式;
(5)调查初一二班学生课外时间上网的情况适合采用全面调查的方式.
【变式2.1】(2020春?鱼台县期末)为了解学生为地震灾区捐款的情况,王老师随机调查了本校10名学生,它们的捐款数为(单位:元)19,20,25,30,100,27,50,21,50,60.在这个问题中,王老师采用的调查方法是 抽样调查 .
【分析】抽样调查就是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象做出估计和推断的一种调查方法.
【解析】为了解学生为地震灾区捐款的情况,王老师随机调查了本校10名学生,王老师采用的调查方法是抽样调查.
故答案为:抽样调查.
【变式2.2】(2019春?顺义区期末)有下列五项调查:①了解一批科学计算器的使用寿命;②了解潮白河水质情况;③了解某种奶制品中蛋白质的含量;④了解某班学生对“社会主义核心价值观”的知晓率;⑤了解一辆大巴车上的游客登上八达岭长城的情况.其中适合用普查方法的是 ④⑤ .(填序号)
【分析】由普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果比较近似.
【解析】适合普查的方法是④了解某班学生对“社会主义核心价值观”的知晓率;⑤了解一辆大巴车上的游客登上八达岭长城的情况;
故答案为:④⑤.
【变式2.3】(2020秋?潍城区期中)国务院决定于2020年11月1日零时开展第七次全国人口普查,人口调查采用普查方式的理由是( )
A.人口调查的数目不太大
B.人口调查需要获得全面准确的信息
C.人口调查具有破坏性
D.受条件限制,无法进行抽样调查
【分析】根据普查得到的调查结果比较准确即可得出答案.
【解析】国务院决定于2020年11月1日零时开展第七次全国人口普查,人口调查采用普查方式的理由是:人口调査需要获得全面准确的信息;
故选:B.
【变式2.4】(2020秋?天心区期中)下面的调查方式中,你认为合适的是( )
A.调查市场上酸奶的质量情况,采用抽样调查方式
B.了解长沙市居民日平均用水量,采用全面调查方式
C.乘坐飞机前的安检,采用抽样调查方式
D.某LED灯厂要检测一批灯管的使用寿命,采用全面调查方式
【分析】由普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果比较近似.
【解析】A.调查市场上酸奶的质量情况,适合采用抽样调查方式,故本选项符合题意;
B.了解长沙市居民日平均用水量,适合采用抽样调查方式,故本选项不符合题意;
C.乘坐飞机前的安检,适合采用全面调查方式,故本选项不符合题意;
D.某LED灯厂要检测一批灯管的使用寿命,适合采用抽样调查方式,故本选项不符合题意;
故选:A.
【考点3】总体、个体、样本
【例3】(2020春?灌云县期中)为了考察某市1万名初中生视力情况,从中抽取1000人进行视力检测,这个问题中总体、个体、样本、分别是什么?
【分析】总体是指考查的对象的全体,个体是总体中的每一个考查的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目.我们在区分总体、个体、样本、样本容量,这四个概念时,首先找出考查的对象.从而找出总体、个体.再根据被收集数据的这一部分对象找出样本,最后再根据样本确定出样本容量.
【解析】总体:某市1万名初中生视力情况;
个体:每个初中生的视力情况;
样本:抽取的1000初中生═视力情况.
【变式3.1】(2020春?高新区期中)今年某校有2000名学生参加线上学习,为了解这些学生的数学成绩,从中抽取100名考生的数学成绩进行统计分析,以下说法正确的是( )
A.2000名学生是总体
B.每位学生的数学成绩是个体
C.这100名学生是总体的一个样本
D.100名学生是样本容量
【分析】总体是指考查的对象的全体,个体是总体中的每一个考查的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目.
【解析】A、2000名学生的数学成绩是总体,故选项不合题意;
B、每位学生的数学成绩是个体,故选项符合题意;
C、这100名学生的数学成绩是总体的一个样本,故选项不合题意;
D、样本容量是100,故选项不合题意;
故选:B.
【变式3.2】(2020秋?开福区校级月考)2020年我市有4.3万名初中毕业生参加升学考试,为了了解这4.3万学生的数学成绩,从中抽取2000名学生的数学成绩进行统计,这个问题中样本是( )
A.4.3万名考生
B.2000名考生
C.4.3万名考生的数学成绩
D.2000名考生的数学成绩
【分析】根据样本的定义:从总体中取出的一部分个体叫做这个总体的一个样本,依此即可求解.
【解析】2020年我市有4.3万名初中毕业生参加升学考试,为了了解这4.3万学生的数学成绩,从中抽取2000名学生的数学成绩进行统计,这个问题中样本是2000名考生的数学成绩.
故选:D.
【变式3.3】(2020春?仪征市期中)为了解我市2019年中考数学学科各分数段成绩分布情况,从中抽取150名考生的中考数学成绩进行统计分析,在这个问题中,样本是 被抽取150名考生的中考数学成绩 .
【分析】总体是指考查的对象的全体,个体是总体中的每一个考查的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目.我们在区分总体、个体、样本、样本容量,这四个概念时,首先找出考查的对象.从而找出总体、个体.再根据被收集数据的这一部分对象找出样本,最后再根据样本确定出样本容量.
【解析】为了解我市2019年中考数学学科各分数段成绩分布情况,从中抽取150名考生的中考数学成绩进行统计分析,在这个问题中,样本是被抽取150名考生的中考数学成绩.
故答案为:被抽取150名考生的中考数学成绩.
【变式3.4】(2020春?西岗区期末)为了测算一块600亩试验田里新培育的杂交水稻的产量,随机对其中的50亩杂交水稻的产量进行了检测,在这个问题中,数字50是 样本容量 .
【分析】根据总体:我们把所要考察的对象的全体叫做总体;样本:从总体中取出的一部分个体叫做这个总体的一个样本;样本容量:一个样本包括的个体数量叫做样本容量可得答案.
【解析】为了测算一块600亩试验田里新培育的杂交水稻的产量,随机对其中的50亩杂交水稻的产量进行了检测,在这个问题中,数字50是样本容量.
故答案为:样本容量.
【考点4】用样本估计总体
【例4】(2020?广东)某中学开展主题为“垃圾分类知多少”的调查活动,调查问卷设置了“非常了解”、“比较了解”、“基本了解”、“不太了解”四个等级,要求每名学生选且只能选其中一个等级,随机抽取了120名学生的有效问卷,数据整理如下:
等级
非常了解
比较了解
基本了解
不太了解
人数(人)
24
72
18
x
(1)求x的值;
(2)若该校有学生1800人,请根据抽样调查结果估算该校“非常了解”和“比较了解”垃圾分类知识的学生共有多少人?
【分析】(1)根据四个等级的人数之和为120求出x的值;
(2)用总人数乘以样本中“非常了解”和“比较了解”垃圾分类知识的学生占被调查人数的比例.
【解析】(1)x=120﹣(24+72+18)=6;
(2)18001440(人),
答:根据抽样调查结果估算该校“非常了解”和“比较了解”垃圾分类知识的学生共有1440人.
【变式4.1】(2020春?嘉陵区期末)两年前我市有县区申报了长寿之乡,并获认定.上月一所初中七(1)班学生社会实践前往该区一乡镇调研进入老龄化社会的数据.按国际通行标准,当一个国家或地区60及60岁以上人口达到总人口的10%,或65及65岁以上人口达到总人口的7%,这个区域进入老龄化社会.被调查的800人年龄情况统计图如下:
(1)这个乡镇是否进入老龄化社会?请说明理由.
(2)这个乡镇人口约20000人,求年龄不低于70岁的人数.
(3)请你为这个乡镇提一条合理化建议.
【分析】(1)分别求得60及60岁以上人口占的百分比和65
及65
岁以上人口占的百分比后与标准对比即可确定答案;
(2)用样本估计总体即可确定答案;
(3)根据老龄社会提出合理的意见或建议即可.
【解析】(1)60及60岁以上人口占的百分比是
(50+40+20)÷800
=13.75%;
65
及65
岁以上人口占的百分比是
(40+20)÷800
=7.5%;
60及60岁以上人口达到人口总数的13.75%,超过了10%.
65及65岁以上人口达到人口总数的7.5%,超过了7%.
∴该乡镇进入了老龄化社会;
(2)年龄不低于70岁的人数约为20000500(人);
(3)该乡镇进入了老龄化社会,可为老年人添置更多的锻炼设施.行政部门可为年轻人组织敬老孝亲专题活动;
【变式4.2】(2020?东海县二模)交警部门在全县范围开展了安全使用电瓶车专项宣传活动,在活动前和活动后分别随机抽取了部分使用电瓶车的市民,就骑电瓶车戴安全头盔情况进行问卷调查,将收集的数据制成如下统计图表.
(1)“活动前骑电瓶车戴安全头盔情况统计表”中a的值为 510 ;
(2)全县约有30万人使用电瓶车,请估计活动前全县骑电瓶车“都不戴”安全头盔的总人数;
(3)小明认为,宣传活动后骑电瓶车“都不戴”安全头盔的人数为178,比活动前增加了1人,因此交警部门开展的宣传活动没有效果小明分析数据的方法是否合理?为什么?
【分析】(1)用1000减去A、B、D的人数即可求出a的值;
(2)用该市的总人数乘以“都不戴”安全帽的人数所占的百分比即可;
(3)分别求出宣传活动前后骑电瓶车“都不戴”安全帽所占的百分比,再进行比较,即可得出小明的分析不合理.
【解析】(1)a=1000﹣68﹣245﹣177=510(人);
故答案为:510;
(2)估计活动前全市骑电瓶车“都不戴”安全帽的总人数为305.31(万人);
(3)小明的分析不合理.
宣传活动后骑电瓶车“都不戴”安全帽所占的百分比为100%=8.9%,
活动前“都不戴”安全帽所占的百分比为100%=17.7%,
由于8.9%<17.7%,
因此交警部门开展的宣传活动有效果.
【变式4.3】(2019秋?庐江县期末)为了估计鱼塘中的鱼数,养鱼老汉首先从鱼塘中打捞n条鱼,并在每一条鱼身上做好记号,然后把这些鱼放归鱼塘,过一段时间,让鱼儿充分游动,再从鱼塘中打捞a条鱼,如果在这a条鱼中有b条是有记号的,那么养鱼老汉就能估计鱼塘中鱼的条数.请写出鱼塘中鱼的条数,并说明理由.
【分析】首先求出有记号的b条鱼在a条鱼中所占的比例,然后根据用样本中有记号的鱼所占的比例等于鱼塘中有记号的鱼所占的比例,即可求得鱼的总条数.
【解析】∵打捞a条鱼,发现其中带标记的鱼有b条,
∴有标记的鱼占,
∵共有n条鱼做上标记,
∴鱼塘中估计有n(条).
【考点5】频数与频率
【例5】(2020春?安吉县期末)从某服装厂即将出售的一批休闲装中抽检200件,其中不合格的休闲装有15件.
(1)抽检中合格的频数,频率分别是多少?
(2)销售3000套这样的休闲装,大约有多少件不合格的休闲装?
【分析】(1)利用频数和频率定义进行计算;
(2)利用样本估计总体的方法进行计算即可.
【解析】(1)合格的频数为200﹣15=185,
频率:185÷200=0.925;
(2)3000225(件).
答:大约有225件不合格的休闲装.
【变式5.1】(2020?秦淮区一模)在某市2019年青少年航空航天模型锦标赛中,各年龄组的参赛人数情况如表所示:
年龄组
13岁
14岁
15岁
16岁
参赛人数
5
19
12
14
若小明所在年龄组的参赛人数占全体参赛人数的38%,则小明所在的年龄组是( )
A.13岁
B.14岁
C.15岁
D.16岁
【分析】根据各年龄组的参赛人数情况表进行计算即可.
【解析】根据各年龄组的参赛人数情况表可知:
总参赛人数为:5+19+12+14=50,
19÷50=38%,
则小明所在的年龄组是14岁.
故选:B.
【变式5.2】(2020秋?西城区校级月考)秋季新学期开学,某中学对初一新生掌握“中学生日常行为规范”的情况进行了知识测试,测试成绩全部合格.现随机抽取了部分学生的成绩制作成如下表格,则b= 0.3 ,c= 9 .
分数段
频数
频率
60≤x<70
6
a
70≤x<80
20
0.4
80≤x<90
15
b
90≤x<100
c
0.18
【分析】根据频数、频率与总数之间的关系分别进行求解即可.
【解析】抽取的学生总数是:20÷0.4=50(人),
b0.3;c=50×0.18=9;
故答案为:0.3,9.
【变式5.3】(2018春?淮安区期中)小花最近买了三本课外书,分别是《汉语字典》用A表示,《流行杂志》用B表示和《故事大王》用C表示.班里的同学都很喜欢借阅,在五天内小花做了借书记录如下表:
书名
代号
借阅次数
借阅
频数
星期一
星期二
星期三
星期四
星期五
A
3
2
2
3
4
14
B
4
3
3
2
3
15
C
1
2
3
2
3
11
(1)在表中填写五天内每本书的借阅频数.
(2)计算五天内《汉语字典》的借阅频率.
【分析】(1)从星期一到星期五的借阅次数的和就是频数;
(2)求得借阅三种书的频数的总和,然后利用频率公式即可求解.
【解析】(1)填表如下:
书名
代号
借阅次数
借阅
频数
星期一
星期二
星期三
星期四
星期五
A
3
2
2
3
4
14
B
4
3
3
2
3
15
C
1
2
3
2
3
11
(2)总数是14+15+11=40,则五天内《汉语字典》的借阅频率是:.
【变式5.4】(2020春?萧山区校级月考)在某项针对18~35岁的青年人每天发微博数量的调查中,设一个人的“日均发微博条数”为m,规定:当m≥10时为A级,当5≤m<10时为B级,当0≤m<5时为C级.现随机抽取30个符合年龄条件的青年人开展每人“日均发微博条数”的调查,所抽青年人的“日均发微博条数”的数据如下:
11
10
6
15
9
16
13
12
0
8
2
8
10
17
6
13
7
5
7
3
12
10
7
11
3
6
8
14
15
12
(1)求样本数据中为A级的频率;
(2)试估计1000个18~35岁的青年人中“日均发微博条数”为A级的人数.
【分析】(1)先找出数据中A级的频数,用频数÷总数即可求得频率;
(2)用总人数×频率即可估算A级的人数.
【解析】(1)m≥10的人数有15人,
则频率;
(2)1000500(人),
即1000个18~35岁的青年人中“日均发微博条数”为A级的人数为500人.
【考点6】频数(率)分布直方图
【例6】(2020春?黄埔区期末)某校组织全校2000名学生进行了时事知识竞赛.为了解成绩的分布情况,随机抽取了部分学生的成绩(得分取整数,满分为100分),并绘制了频数分布表和频数分布直方图(不完整).
分组
50.5≤x<60.5
60.5≤x<70.5
70.5≤x<80.5
80.5≤x<90.5
90.5≤x<100.5
合计
频数
20
48
a
104
148
400
根据所给信息,回答下列问题:
(1)频数分布表中,a= 80 ;
(2)补全频数分布直方图;
(3)学校将对分数x在90.5≤x<100.5范围内的学生进行奖励,请你估算出全校获奖学生的人数.
【分析】(1)根据各组频数之和为400即可求出a的值;
(2)求出a的值即可补全频数分布直方图;
(3)样本中获奖学生数占调查人数的,因此估计总体2000人的是获奖的人数.
【解析】(1)a=400﹣148﹣104﹣48﹣20=80,
故答案为:80;
(2)补全频数分布直方图如下:
(3)2000740(人),
答:全校2000名学生中获奖的大约有740人.
【变式6.1】(2020春?邹平市期末)某校初二年级组织400名学生参加了一次数学学科知识大赛.赛后发现所有参赛学生的成绩均不低于60分,为了更好地了解本次大赛的成绩分布情况,随机抽取了40名学生的成绩作为样本,成绩如下:
90,92,81,82,78,95,86,88,72,66,62,68,89,86,93,97,100,73,76,80,77,81,86,89,82,85,71,68,74,98,90,97,100,84,87,73,65,92,92,60
请根据所给信息,解答下列问题:
(1)对上述成绩按下表的分组,完成该频数分布表:
成绩x(分)分组
划记
频数
60≤x<70
6
70≤x<80
8
80≤x<90
14
90≤x≤100
12
(2)根据统计表,在图中画出频数分布直方图;
(3)若成绩在90分以上(包括90分)的为“优”等,请你估计参加这次比赛的400名学生中成绩“优”等的约有多少人?
【分析】(1)由已知数据即可填表;
(2)由(1)中所求数据补全图形即可;
(3)总人数乘以样本中90≤x≤100的频率即可得.
【解析】(1)频数分布表:
成绩x(分)分组
划记
频数
60≤x<70
6
70≤x<80
8
80≤x<90
14
90≤x≤100
12
(2)某区初二年级40名学生数学学科知识大赛成绩统计图:
(3)估计参加这次比赛的400名学生中成绩“优”等的约有400120人.
【变式6.2】(2020秋?大洼区月考)某校为了解本校200名14周岁女生的身体发育状况,任意抽取了20名女生,对其身高进行测量,结果如下:(数据均为整数,单位cm)
154
159
166
169
156
162
158
160
161
158
164
158
153
157
162
165
151
160
158
149
(1)按组距为5将数据分组,则分成 5 组;
(2)列出频数分布表;画出频数分布直方图;
(3)20人中身高在哪个范围内的人数最多?
(4)该校14周岁女生身体在160cm以上(包括160cm)的大概有多少名?
【分析】(1)根据题目中的数据,找出最大值与最小值,然后作差,再除以组距,即可得到相应的组数;
(2)根据题目中的数据,可以列出频数分布表;画出频数分布直方图;
(3)根据频数分布表可以得到20人中身高在哪个范围内的人数最多;
(4)根据频数分布表,可以计算出该校14周岁女生身体在160cm以上(包括160cm)的大概有多少名.
【解析】(1)169﹣149=20,
20÷5=4,
故按组距为5将数据分组,则分成5组,
故答案为:5;
(2)频数分布表如下图所示,
分组
划记
频数
145≤x<150
1
150≤x<155
3
155≤x<160
7
160≤x<165
6
165≤x<170
3
合计
20
20
频数分布直方图如右图所示;
(3)20人中身高在155≤x<160的人数最多;
(4)20090(名),
即该校14周岁女生身体在160cm以上(包括160cm)的大概有90名.
【变式6.3】(2020春?莱州市期末)某公路上的测速仪,在某一时间段内测得30辆汽车的速度(单位:km/h),其最大值和最小值分别是80,56.为了制作频数直方图,以5为组距,这样,可以把数据分成( )
A.4组
B.5组
C.6组
D.10组
【分析】根据题目中的数据,可以计算出该组数据可以分为几组,本题得以解决.
【解析】(80﹣56)÷5
=24÷5
=4…4,
故可以把数据分成5组,
故选:B.
【变式6.4】(2020春?沂水县期末)小文同学统计了他所在小区部分居民每天微信阅读的时间,绘制了直方图.得出了如下结论:①样本中每天阅读微信的时间没人超过1小时,由此可以断定这个小区的居民每天阅读微信时间超过1小时的很少;②样本中每天微信阅读不足20分钟的人数大约占16%;③选取样本的样本容量是60;④估计所有居民每天微信阅读35分钟以上的人数大约占总居民数的一半左右.其中正确的是( )
A.①②③
B.①②④
C.①③④
D.②③④
【分析】根据题意和频数分布直方图中的数据,可以判断各个小题中的说法是否正确,本题得以解决.
【解析】由直方图可得,
样本中每天阅读微信的时间没人超过1小时,由此可以断定这个小区的居民每天阅读微信时间超过1小时的很少,故①正确;
样本中每天微信阅读不足20分钟的人数大约占:(4+8)÷(4+8+14+20+16+12)×100%≈16%,故②正确;
选取样本的样本容量是:4+8+14+20+16+12=74,故③错误;
(10+16+12)÷74≈0.51,
即所有居民每天微信阅读35分钟以上的人数大约占总居民数的一半左右,故④正确:
故选:B.
【考点7】频数(率)分布折线图
【例7】(2020?江西)为积极响应教育部“停课不停学”的号召,某中学组织本校优秀教师开展线上教学,经过近三个月的线上授课后,在五月初复学.该校为了解学生不同阶段学习效果,决定随机抽取八年级部分学生进行两次跟踪测评,第一次是复学初对线上教学质量测评,第二次是复学一个月后教学质量测评.根据第一次测试的数学成绩制成频数分布直方图(图1).
复学一个月后,根据第二次测试的数学成绩得到如下统计表:
成绩
30≤x<40
40≤x<50
50≤x<60
60≤x<70
70≤x<80
80≤x<90
90≤x≤100
人数
1
3
3
8
15
m
6
根据以上图表信息,完成下列问题:
(1)m= 14 ;
(2)请在图2中作出两次测试的数学成绩折线图,并对两次成绩作出对比分析(用一句话概述);
(3)某同学第二次测试数学成绩为78分.这次测试中,分数高于78分的至少有 20 人,至多有 34 人;
(4)请估计复学一个月后该校800名八年级学生数学成绩优秀(80分及以上)的人数.
【分析】(1)根据前后两次抽取的人数一样多,可以计算出m的值;
(2)根据直方图中的数据和表格中的数据,可以将图2中的图补充完整,然后即可写出成绩的变化情况;
(3)根据表格中的数据,可以得到分数高于78分的至少有多少人,至多有多少人;
(4)根据表格中的数据,可以计算出复学一个月后该校800名八年级学生数学成绩优秀(80分及以上)的人数.
【解析】(1)m=(2+8+10+15+10+4+1)﹣(1+3+3+8+15+6)=14,
故答案为:14;
(2)折线图如下图所示,
复学后,学生的成绩总体上有了明显的提升;
(3)某同学第二次测试数学成绩为78分.这次测试中,分数高于78分的至少有14+6=20(人),至多有14+6+(15﹣1)=34(人),
故答案为:20,34;
(4)800320(人),
答:复学一个月后该校800名八年级学生数学成绩优秀(80分及以上)的有320人.
【变式7.1】(2017春?海陵区校级月考)有大小两个转盘,其中黑色区域都是中心角为90°的扇形,为了探究指针落在黑色区域的频率,甲乙两人分别转动两转盘,记录下表(A:指针落在大转盘的黑色区域频数;B:大转盘中的频率;C:指针落在小转盘的黑色区域频数;D:小转盘中相应频率)
次数
25
50
75
100
125
150
175
200
225
A
8
15
21
26
32
36
44
51
57
B
0.32
0.30
0.28
0.26
0.256
0.24
0.251
0.255
0.253
C
8
13
21
26
32
37
43
49
55
D
0.32
0.26
0.28
0.26
0.256
0.247
0.246
0.245
0.244
(1)将B、D两空格填写完整;
(2)分别绘出指针落在大小转盘中黑色区域的频率折线图;
(3)比较25次与50次的大小频率之差及200与225次之间大小转盘两频率之差;
(4)从(3)中频率之差及折线统计图中的变化趋势,你能总结出什么规律?
【分析】(1)根据“频率=频数÷总次数”逐一计算即可补全表格;
(2)以横轴为次数、纵轴为频率,用点分别表示表格中数据,大转盘用实线依次连接,小转盘用虚线依次连接即可得;
(3)根据表格中的数据即可得;
(4)根据折线统计图知,最后随次数的增加而稳定的常数即可得.
【解析】(1)将B、D两空格填写完整如下:
次数
25
50
75
100
125
150
175
200
225
A
8
15
21
26
32
36
44
51
57
B
0.32
0.30
0.28
0.26
0.256
0.24
0.251
0.255
0.253
C
8
13
21
26
32
37
43
49
55
D
0.32
0.26
0.28
0.26
0.256
0.247
0.246
0.245
0.244
(2)折线统计图如下:
(3)大转盘中25次与50次的大小频率之差为0.02,200与225次之间的大小频率之差为0.002;
小转盘中25次与50次的大小频率之差为0.06,200与225次之间的大小频率之差为0.001;
(4)随着次数的增多,大小转盘的频率都逐渐稳定在0.25左右.
【变式7.2】(2020春?博白县期末)如图是某景点6月份内1~10日每天的最高温度折线统计图,由图信息可知该景点这10天中,气温26℃出现的频率是 0.3 .
【分析】首先分析出气温26℃出现的天数是3天,再根据频率=所求天数与总天数之比作答即可.
【解析】温26℃出现的天数是3天,
气温26℃出现的频率是:3÷10=0.3.
故答案为0.3.
【变式7.3】(2019秋?泉州期末)如图为某一试验结果的频率随机试验次数变化趋势图,则下列试验中不符合该图的是( )
A.掷一枚普通正六面体骰子,出现点数不超过2
B.掷一枚硬币,出现正面朝上
C.从装有2个黑球、1个白球的不透明布袋中随机摸出一球为白球
D.从分别标有数字1,2,3,4,5,6,7,8,9的九张卡片中,随机抽取一张卡片所标记的数字不小于7
【分析】根据试验结果的频率变化趋势,可以得到该事件发生的概率为,然后从选项中选取概率步数三分之一的即可.
【解析】根据实验频率可以估计该事件发生的概率为,
掷一枚普通正六面体骰子,出现点数不超过2的概率为,因此选项A不符合题意;
掷一枚硬币,出现正面朝上的概率为,因此选项B符合题意;
从装有2个黑球、1个白球的不透明布袋中随机摸出一球为白球的概率为,因此选项C不符合题意;
从标有数字1,2,3,4,5,6,7,8,9的九张卡片中,随机抽取一张卡片所标记的数字不小于7的概率为,因此选项D不符合题意;
故选:B.
【考点8】条形统计图
【例8】(2020春?铜陵期末)为积极响应垃圾分类活动,某学校开展了主题为“打造无废校园,助力无废城市”的宣传活动.为了解学生对垃圾分类知识的掌握情况,该校环保社团成员在校园内随机抽取了部分学生进行问卷调査,将他们的得分按优秀、良好、合格、不合格四个等级进行统计,并绘制了如图不完整的统计表和条形统计图.
等级
频数
频率
优秀
19
38%
良好
m
44%
合格
7
n%
不合格
2
4%
(1)本次调查随机抽取了 50 名学生;表中m= 22 ,n= 14 ;
(2)补全条形统计图;
(3)垃圾分类节约资源,还地球一个碧海蓝天,写一句关于垃圾分类的宣传标语,要求20字以内;
(4)若全校有1500名学生,请你估计该校掌握垃圾分类知识达到“优秀”和“良好”等级的学生共有多少人?
【分析】(1)用优秀的人数除以优秀的人数所占的百分比即可得到抽查的人数,然后即可计算出m、n的值;
(2)根据(1)中m的值,可以将条形统计图补充完整;
(3)本题答案不唯一,只要合理即可;
(4)根据频数分布表中的数据,即可计算出该校掌握垃圾分类知识达到“优秀”和“良好”等级的学生共有多少人.
【解析】(1)本次调查随机抽取了19÷38%=50名学生,
m=50×44%=22,n%100%=14%,
故答案为:50,22,14;
(2)由(1)知,m=22,
补全的条形统计图如右图所示;
(3)如果你能做好垃圾分类,那么地球就会给你一个碧海蓝天;
(4)1500×(38%+44%)=1230(人),
答:该校掌握垃圾分类知识达到“优秀”和“良好”等级的学生共有1230人.
【变式8.1】(2020春?泸县期末)数学老师布置10道选择题作为课堂练习,学习委员将全班同学的答题情况绘制成条形图,根据统计图可知,答对8道题的同学的频率是 0.4 .
【分析】先根据统计图得出全班学生的总人数,再用答对8题的人数除以总人数可得其频率.
【解析】∵全班学生人数为4+20+18+8=50,
∴答对8道题的同学的频率是20÷50=0.4,
故答案为:0.4.
【变式8.2】(2020?哈尔滨)为了丰富同学们的课余生活,冬威中学开展以“我最喜欢的课外活动小组”为主题的调查活动,围绕“在绘画、剪纸、舞蹈、书法四类活动小组中,你最喜欢哪一类?(必选且只选一类)”的问题,在全校范围内随机抽取部分学生进行问卷调查,将调查结果整理后绘制成如图所示的不完整的条形统计图,其中最喜欢绘画小组的学生人数占所调查人数的30%.请你根据图中提供的信息回答下列问题:
(1)在这次调查中,一共抽取了多少名学生?
(2)请通过计算补全条形统计图;
(3)若冬威中学共有800名学生,请你估计该中学最喜欢剪纸小组的学生有多少名.
【分析】(1)最喜欢绘画小组的学生人数15人,占所调查人数的30%.可求出调查人数;
(2)求出“舞蹈”的人数,即可补全条形统计图;
(3)样本估计总体,样本中“喜欢剪纸”占调查人数的,因此估计总体800名的是最喜欢“剪纸”的人数.
【解析】(1)15÷30%=50(名),
答:在这次调查中,一共抽取了50名学生;
(2)50﹣15﹣20﹣5=10(名),补全条形统计图如图所示:
(3)800320(名),
答:冬威中学800名学生中最喜欢剪纸小组的学生有320名.
【变式8.3】(2020春?哈尔滨期末)疫情期间某校想了解六年级学生在家运动的情况,随机抽取该校六年级的若干名学生进行调查,调查内容是“你在家的体育活动项目是什么?(只写一项)”的问题,从而得到一组数据,如图是根据这组数据绘制的条形统计图、请结合统计图回答下列问题:
(1)此次调查采取的调查方式是 抽样调查 ;(填“全面调查”或“抽样调查”)
(2)该校对多少名学生进行了调查?
(3)若该校六年级共有500名学生,请你估计该校六年级学生中在家参与跳绳活动的有多少名学生?
【分析】(1)根据题意叙述可知,是抽样调查;
(2)求各组人数之和,即调查人数;
(3)样本中,“跳绳”占,因此估计总体500人的是参与“跳绳”的人数.
【解析】(1)根据题意,“随机抽取该校六年级的若干名学生进行调查”,因此调查发生为抽样调查,
故答案为:抽样调查;
(2)4+8+10+18+10=50(人),
答:该校对50名学生进行了调查;
(3)50080(人),
答:该校六年级学生中在家参与跳绳活动的约有80名学生.
【考点9】折线统计图
【例9】(2020秋?南岗区校级月考)下面是公司去年每月收入和支出情况统计图,请根据统计图填空并回答问题.
(1) 4 月收入和支出相差最小. 7 月收入和支出相差最大.
(2)12月收入和支出相差 30 万元.
(3)去年平均每月支出 30 万元.
【分析】(1)(2)利用折线统计图得到每月的收入与支出,从而得到收入和支出相差最小的月份和收入和支出相差最大的月份;
(3)利用平均数的计算方法,把12个月的支出相加除以12得到平均每月支出数.
【解析】(1)4月份收入为30万,支出为20万,收入与支出相差最小;7月份收入为80万,支出为20万,相差最大;
(2)12月份收入为80万,支出为50万,收入和支出相差30万元
(3)去年每月支出的平均数为(20+30+10+20+20+30+20+30+40+50+40+50)=30(万元).
故答案为4,7;30;30.
【变式9.1】(2020秋?沙坪坝区校级月考)嘉陵江为长江上游支流,因流经陕西风县东北嘉陵谷而得名.干流流经陕西省、甘肃省、四川省、重庆市,在重庆朝天门汇入长江,嘉陵江的警戒水位是237.1米,上周星期日的嘉陵江水位刚好达到警戒水位,如表记录的是本周内的水位变化情况.(正号表示水位比前一天上升,负号表示水位比前一天下降)
星期
一
二
三
四
五
六
日
水位变化(米)
+0.20
+0.80
﹣0.35
+0.30
+0.25
﹣0.30
﹣0.60
(1)本周哪一天河流的水位最高?最高水位是多少米?
(2)本周日与上周日相比,水位是增加了还是减少了?如果是增加了,求出增加了多少米,如果是减少了,求出减少了多少米?
(3)以警戒水位作为0点,用折线统计图表示本周的水位情况.
【分析】(1)求出每一天的水位值,即可得出答案;
(2)求出本周末的水位值,然后进行判断即可;
(3)根据每一天的增加或减小值,描点、连线即可.
【解析】(1)周一水位:237.1+0.20=237.30米;
周二水位:237.30+0.80=238.10米;
周三水位:238.10﹣0.35=237.75米;
周四水位:237.75+0.30=238.05米;
周五水位:238.05+0.25=238.30米;
周六水位:238.30﹣0.30=238米;
周日水位:238﹣0.60=237.40米;
故周五的水位最高,最高水位为238.30米;
(2)本周日与上周日相比,水位增加了237.40﹣237.10=0.30米,
(3)用折线统计图表示本周的水位情况.
【变式9.2】(2020春?定襄县期末)太原市某校积极开展中学社会实践活动,决定成立文明宣传、环境保护、交通监督三个志愿队伍,每名学生最多选择一个队伍.为了解学生的选择意向,随机抽取七年级(1)(2)(3)(4)四个班,共200名学生进行调查,将调查得到的数据进行整理,绘制成如图所示两幅不完整的统计图,根据统计图提供的信息解答下列
问题:
(1)求扇形统计图中,交通监督所占的百分比;
(2)求(4)班选择环境保护志愿者队伍的学生人数,补全折线统计图;
(3)若该校共有3000人,请你估计该校学生选择文明宣传志愿者队伍的人数.
【分析】(1)结合折线统计图即可求扇形统计图中,交通监督所占的百分比;
(2)根据扇形统计图中(4)班选择环境保护得到百分比即可求人数,进而可补全折线统计图;
(3)根据用样本估计总体的方法即可估计该校学生选择文明宣传志愿者队伍的人数.
【解析】(1)(12+15+13+14)÷200×100%=27%.
所以交通监督所占的百分比为27%;
(2)30%×200=60(人),
60﹣15﹣14﹣16=15(人).
答:(4)班选择环境保护志愿者队伍的学生人数为15人.
(3)3000×(1﹣30%﹣5%﹣27%)
=1140(人).
答:估计该校学生选择文明宣传志愿者队伍人数为1140人.
【变式9.3】(2020?大兴区一模)新冠肺炎疫情暴发后,一场同时间赛跑、与病魔较量的战役随即打响.在疫情防控一线,除了广大医务工作者义无反顾、日夜奋战之外,在另一条战线上,科研人员也在加班加点、紧急攻关.全国科技战线积极响应党中央号召,科技、卫健等12个部门组成科研攻关组,短短一个月的时间内就取得了积极进展.3月13日0﹣24时,31个省(自治区、直辖市)和新疆生产建设兵团新增确诊病例11例(数据不含港澳台),新增疑似病例17例(数据不含港澳台).
如图是根据国家卫健委关于新型冠状病毒肺炎通报的数据(数据不含港澳台)绘制的统计图:
根据以上信息,回答下列问题:
(1)下列推断合理的是 ①④ .
①2月15日武汉新增确诊病例约为1500例;
②从2月23日起到3月13日止,武汉每日新增确诊病例都在500例以下;
③从2月23日起到3月13日止,全国每日新增疑似病例逐渐减少.
④3月13日湖北新增疑似病例不超过17例.
(2)结合本题的信息及当前防疫形势,说说你的感受.
【分析】利用图中信息一一判断即可.
【解析】(1)由图中信息可知:①2月15日武汉新增确诊病例约为1500例,正确.
②从2月23日起到3月13日止,武汉每日新增确诊病例都在500例以下,错误,2月24日前每日新增确诊病例都在500以上.
③从2月23日起到3月13日止,全国每日新增疑似病例逐渐减少.错误,其中2月18日到2月20日是逐渐增加的.
④3月13日湖北新增疑似病例不超过17例.正确.
故答案为①④.
(2)国内疫情防控科学有效,防控形势持续向好.相信中国一定能打赢这场战疫.
【考点10】扇形统计图
【例10】(2020春?安新县期末)2019年底至2020年初我国爆发了新冠肺炎疫情,为了增加学生对疫情和新冠肺炎预防知识的了解,某学校利用网络开展了相关知识的宣传教育活动,为了解这次的宣传效果,学校从全校3600名学生中随机抽取200名学生进行知识测试(满分100分,得分均为整数),并根据这200人的测试成绩,绘制了统计图表:
200名学生成绩的频数表
等级
成绩/分
频数/人
E
50≤a<60
20
D
60≤a<70
30
C
70≤a<80
m
B
80≤a<90
n
A
90≤a≤100
30
(1)m= 40 ,n= 80 ;
(2)成绩最好的等级A所占的百分比 15% ;等级E在扇形图中所对应的圆心角的度数为 36° ;
(3)如果80分以上(包括80分)为优秀,请估计全校3600名学生中成绩优秀的人数.
【分析】(1)首先求出B所占百分比,再由总人数为200可得n的值,进而可得m的值;
(2)用等级A的人数除以总人数可得等级A所占的百分比;用360°乘以等级E所占的百分比可得在扇形图中所对应的圆心角的度数;
(3)利用样本估计总体思想求解可得.
【解析】(1)n=144÷360×200=80,
m=200﹣20﹣30﹣80﹣30=40.
故答案为:40,80;
(2)等级A所占的百分比:30÷200×100%=15%,
等级E在扇形图中所对应的圆心角的度数为360°36°.
故答案为:15%,36°;
(3)36001980(人),
答:估计全校3600名学生中成绩优秀的人数为1980人.
【变式10.1】(2020春?濮阳期末)某中学组织学生参加预防新冠知识网络测试小明对七年级一班全体学生的测试成绩进行统计,并绘制了如图不完整的频数分布表和扇形统计图:
组别
分数段(x)
频数
A
0≤x<60
2
B
60≤x<70
5
C
70≤x<80
17
D
80≤x<90
a
E
90≤x≤100
b
根据图表中的信息解答下列问题:
(1)七年级一班学生的人数为 50 ,频数分布表中a的值为 12 .
(2)已知该市共有9000名中学生参加这次安全知识测试,若规定80分以上(含80分)为优秀,估计该市本次测试成绩达到优秀的人数;
(3)小明通过该市教育网站搜索发现,全市参加本次测试的中学生中,成绩达到优秀有5632人.请你用所学统计知识简要说明实际优秀人数与估计人数出现较大偏差的原因.
【分析】(1)从表格中知道C组的频数为17,从扇形统计图中知道C占总体的34%,可以求出样本容量,即班级人数,由D组占总人数的24%可求出a的值;
(2)从样本中可以求出优秀人数所占的百分比,用样本估计总体,估计总体中优秀人数所占总人数的百分比,进而求出人数;
(3)偏差的原因可能用样本估计总体时,由于样本容量较小,且样本不具有代表性所致.
【解析】(1)17÷34%=50,a=50×24%=12,
故答案为:50,12;
(2)样本中,优秀所占的比为:100%=52%,
9000×52%=4680(人),
答:估计该市本次测试成绩达到优秀的人数为4680人.
(3)用样本估计总体时,由于样本容量较小,且样本不具有代表性,可能对整体的估计存在很大的偏差.
【变式10.2】(2019秋?道外区期末)学校图书馆有励志、文学、科技及漫画四类图书.为了了解学生上周图书借阅情况(每人仅限借阅一本),图书管理员统计后绘制了如图不完整的扇形统计图,请根据图中所给信息解答以下问题:
(1)借阅人数最少的是 文学 类图书;
(2)求借阅文学类图书人数是多少?
(3)如果借阅漫画类图书的人数占全校学生总人数的2%,那么全校学生总人数是多少?
【分析】(1)由扇形统计图中四个部分所对应扇形的圆心角大小可得答案;
(2)先由借阅科技类人数及其所占百分比求出总人数,再用总人数乘以借阅文学类书籍的人数所占百分比可得答案;
(3)先根据四个部分对应的人数之和等于被调查的总人数求出借阅漫画类图书的人数,再根据借阅漫画类图书的人数占全校学生总人数的2%可得答案.
【解析】(1)借阅人数最少的是文学类图书,
故答案为:文学.
(2)64÷32%=64÷0.32=200(人),
200×20%=40(人),
答:借阅文学类图书的人数是40人.
(3)200﹣64﹣50﹣40=46(人),
46÷2%=46÷0.02=2300(人),
答:全校学生总人数是2300人.
【变式10.3】(2020春?白云区期末)某中学开展主题为“垃圾分类知多少”的专题调查活动,采取随机抽样的方式进行问卷调查,问卷调查的结果分为“非常了解”、“比较了解”、“基本了解”、“不太了解”四个等级,调查结果统计如表:
等级
非常了解
比较了解
基本了解
不太了解
人数
50
110
36
4
百分比
25%
m
18%
2%
(1)本次问卷调查抽取的样本容量为 200 ,表中m= 55 %;
(2)求“非常了解”对应扇形的圆心角度数,并补全如图的扇形统计图.
【分析】(1)由“非常了解”的人数及其所占百分比可得样本容量,利用百分比的概念可得m的值;
(2)用360°乘以“非常了解”的人数对应的百分比可得其圆心角度数,结合m的值可补全图形.
【解析】(1)本次问卷调查抽取的样本容量为50÷25%=200,m=110÷200×100%=55%,
故答案为:200,55;
(2)“非常了解”对应扇形的圆心角度数为360°×25%=90°,
补全图形如下:
【变式10.4】(2020春?绥棱县期末)如图是星光电器厂职工学历情况统计图.
(1)该厂大专以上学历(包括大专)的职工占百分之几?
(2)本科学历的职工比中专学历的职工多120人,本科学历的职工有多少人?
【分析】(1)将大专、本科、研究生对应的百分比相加即可得;
(2)根据本科学历的职工比中专学历的职工多120人并结合各自百分比得出总人数,再乘以本科学历对应的百分比可得答案.
【解析】(1)该厂大专以上学历(包括大专)的职工所占百分比为:45%+35%+10%=90%;
(2)120÷(35%﹣10%)×35%=168(人)
答:本科学历的职工有168人.
【考点11】数据的收集与整理综合问题
【例11】(2020春?瑞安市月考)未成年人思想道德建设越来越受到社会的关注.某青少年研究机构随机调查了某校100名学生寒假花零花钱的数量(钱数取整数元),以便引导学生树立正确的消费观,根据调查数据制成了如下的频数分布表(部分空格未填).
某校100名学生寒假花零花钱数量的频数分布表
分组
组中值
频数
频率
0.5﹣50.5
25.5
10
0.1
50.5﹣100.5
75.5
20
0.2
100.5﹣150.5
125.5
25
0.25
150.5﹣200.5
175.5
30
0.3
200.5﹣250.5
225.5
10
0.1
250.5﹣300.5
275.5
5
0.05
合计
100
1.00
(1)完成该频数分布表;
(2)把频数分布直方图补全;
(3)研究认为应对消费200元以上的学生提出勤俭节约的建议,试估计应对该校1800学生中约多少名学生提出该项建议?
【分析】(1)根据频数、频率、总数之间的关系,求出频数即可;根据各组频数之和等于总数,可求出100.5﹣150.5的频数;
(2)根据各组频数补全频数分布直方图;
(3)求出“应提出建议”所占的百分比,即可求出总体1800名学生中“应提出建议”的学生人数.
【解析】(1)100×0.1=10,
100﹣5﹣10﹣30﹣20﹣10=25,
25÷100=0.25,
故答案为:10,25,0.25;
(2)补全频率分布直方图如下:
(3)1800×(0.1+0.05)=270(人),
答:该校1800学生中约270名学生提出节约建议.
【变式11.1】(2020秋?西城区校级月考)小明、小聪参加了100m跑的5期集训,每期集训结束时进行测试,根据他们的集训时间和测试成绩绘制成如图两个统计图.根据图中的信息,有如下四个推断:
①这五期集训共有56天;
②小明5次测试的平均成绩(时间)超过11.6秒;
③这5次测试成绩中,有3次小聪比小明好;
④从五期集训来看,集训时间越长,所测试出的成绩就越好.
其中合理推断的序号为( )
A.①
B.①②
C.①②③
D.①②③④
【分析】根据图中的信息可以求得这5期的集训共有多少天和小明5次测试的平均成绩,根据图中的信心和题意,说明自己的观点即可.
【解析】①这5期的集训共有:5+7+10+14+20=56(天);
②小明5次测试的平均成绩是:(11.83+11.72+11.52+11.58+11.65)÷5=11.66(秒);
③这5次测试成绩中,第一次、第二次和第三次小聪比小明好;
④从集训时间看,集训时间不是越多越好,集训时间过长,可能造成劳累,导致成绩下滑;
其中合理推断的序号为①②③;
故选:C.
【变式11.2】(2020秋?漳平市期中)从全校1200名学生中随机选取一部分学生一周上网时间进行调查,调查情况:A:上网时间≤1小时;B:1小时<上网时间≤4小时;C:4小时<上网时间≤7小时;D:上网时间>7小时.统计结果制成了如图统计图:
(1)参加调查的学生有 200 人,在扇形统计图中,D类学生所占扇形的圆心角度数为 72° ;
(2)请将条形统计图补全;
(3)请估计全校一周上网时间不超过7小时的学生人数.
【分析】(1)上网时间在A组的有20人,占调查人数的,可求出调查人数;求出D组的人数占调查人数的百分比,即可求出相应的圆心角的度数;
(2)求出C组人数即可补全条形统计图;
(3)求出样本中,上网时间不超过7小时的人数所占的百分比,即可求出全校学生中上网时间不超过7小时的人数.
【解析】(1)20200(人),360°72°,
故答案为:200,72°;
(2)C类的人数是200﹣20﹣80﹣40=60(人),补全条形统计图如图所示;
(3)(人).
答:全校一周上网时间不超过7小时的学生960人.
【变式11.3】(2020春?崇川区校级月考)为了了解南通市80万市民“获取新闻的最主要途径”,某市记者开展了一次调查,根据调查结果绘制了如下尚不完整的统计图.
根据以上信息解答下列问题:
(1)这次调查适合采用 抽样调查 的调查方式(填“全面调查”或“抽样调查”);
(2)这次调查样本容量是 1000 .
(3)扇形统计图中,“电视”所对应的圆心角的度数是 54° ;
(4)条形统计图中“报纸”对应的人数是 100 ;
(5)南通市约有80万人,请估计其中将“电脑和手机上网”作为“获取新闻的最主要途径”的总人数.
【分析】(1)根据全面调查与抽样调查的意义进行解答;
(2)用电脑上网的人数除以电脑上网所占的百分比得到总人数;
(3)根据电视所占的百分比乘以圆周角,可得答案;
(4)总人数乘以“报纸”对应的百分比求得其人数;
(5)根据样本估计总体,可得答案.
【解析】(1)∵人的数量较多,
∴适合采用抽样调查;
故答案为:抽样调查;
(2)这次调查样本容量是:260÷26%=1000,
故答案为:1000;
(3)扇形统计图中,“电视”所对应的圆心角的度数是360°54°,
故答案为:54°;
(4)用“报纸”获取新闻的途径的人数为:10%×1000=100(人),
故答案为:100;
(5)根据题意得:
800000×(26%+40%)=528000
(人),
答:将“电脑和手机上网”作为“获取新闻的最主要途径”的总人数为528000人.
21世纪教育网(www.21cnjy.com)