(共23张PPT)
数据处理与应用
1.
学习常用的数据分析方法,了解数据可视化的形式。掌握数据分析报告的撰写方
法,完成数据分析报告。
对于数据的分析和处理小组内进行讨论交流。通过项目研究感受数据分析和可视化表达对日常生活的影响。提高处理与应用数据的能力,体会数据应用的重要作用。
培养学生对新技术的兴趣和认识,提高学生的信息技术素养。体验成功,激发
求知欲。培养学生利用信息技术对其他课程进行学习和探讨的能力。
学习目标
01
数据分析与可视化
02
数据分析报告
目录
CONTENTS
01
数据分析与可视化
3.3.1数据分析
采集了所需要的数据,并对数据进行了组织和整理后,为了获得有价值的信息,还需要对数据做进一步的分析,数据分析指用适当的计算方法与工具对收集来的数据进行处理,提取有用信息,形成结论从而支持决策。
数据分析的作用
了解事物的现状
剖析事务的发展历程
预测事物的未来走向
通过数据分析可以帮助我们更好地认识所调研事物的目前状况。例如,通过分析游客人数变化,旅游花费等数据。能够了解旅游业当前整体的发展状况。帮助旅游业经营者有针对性的调整经营策略,制定发展方案。
通过数据分析可以剖析事物的发展历程。了解事物的过去,揭示某些现象产生的原因。
通过数据分析可以预测事物未来可能会发生什么?推断未来的发展趋势。并为制定相应的目标及策略提供依据,目前利用数据分析进行预测已经应用于各个领域。包括体育赛事预测,用户行为预测,能源消耗预测。交通行为预测和人体健康预测等。
数据分析的基本方法
对比分析法也叫比较分析法,是将两个或两个以上的数据进行比较,分析它们的差异,揭示出这些数据所反映的事物规律的方法,是一种常用的分析方法。
对比分析法
对比分析法通常用于从数量上展示和说明研究对象规模大小、水
平高低、速度快慢及各种关系是否协调等。例如,在商品生产中
,已完成商品数量与目标数量的差距对比,本月生产的数量与上
月生产数量的对比,同公司各部门间的对比等都是对比分析法的典型应用。
对比分析法分为横向和纵向对比两大类。任务完成量与目标量的对比,部门之间、地区之间的对比都是横向对比,而不同时期的比较则为典型的纵向对比。
数据分析的基本方法
平均分析法是运用计算平均数的方法来反映总体在一定时间、
地点等条件下某一数量特征的一般水平。
平均指标中最常用的是算术平均数,如平均身高、平均工资和平均降水量等。图3.3.5展示了我国2012-
2016
年国内旅游人均消费情况。
平均分析法
平均分析法多用于比较同类现象在不同地区、不同行业、不同类型单位等之间的差异程度,分析现象之间的依存关系,进行数量上的推算;也可以对某一现象在不同时间的水平进行比较,以说明现象的发展规律及趋势。
数据分析的基本方法
结构分析法也称构成分析法,是将各个部分与总体进行对比,是分析事物内部的结构和部分与整体之间关系的方法。结构分析法的基本表现形式就是计算结构指标。
结构分析法
结构指标即各个部分相对于总体所占的百分比,因此总体中各结构指标的总和等于100%。图13.3.6
为某网站的用户使用不同无线网络访问该网站的次数统计情况。可以看出使用4G网络访问该网站的占
63.19%,使用Wi-档的占28.08%,使用3C网络的占8.73%。图中清楚地反映出各部分在总体中所古的
百分比。
上述几种基本的数据分析方法分别适用不同的情况,在实际应用中,需要根据具体问题合理选取并综合运用。
体验数据分析
用电子表格软件进行数据分析
电子表格软件可对数据进行格式编辑、统计计算和图表处理等。在电子表格软件中,通常用若干工作表存储数据。下图就是使用电子表格软件处理数据的示意图。
用在线数据平台进行数据分析
随着数据规模越来越大,应用范围越来越广,分析数据和挖掘数据价值的需求也越来越多,许多在线数据分析平台应运而生。这些平台集成了多种分析功能,提供了简单易用的交互界面,使得多种数据分析需求得以实现。
数据分析除了可以对数值型数据进行统计和描述以外,还可以对文本、图像等数据进行分析。常用的文本分析有字词频率统计、语句分词、句法分析、分类分析和情感分析等。
使用编程工具进行数据分析
数据分析除了可以对数值型数据进行统计和描述以外,还可以对文本、图像等数据进行分析。常用的文本分析有字词频率统计、语句分词、句法分析、分类分析和情感分析等。例如,对一段描述南水北调工程的文字进行文本分析后,得到的结果如图3.3.8所示。
3.3.2数据可视化
数据可视化是以图形、图像和动画等方式直规生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等,便f人们更好地理解数据。可视化的作用体现在多个方面,如观察事物变化的趋势、揭示想法和关系、总结或汇聚数据、形成论点或意见等。例如,国家统计局网站中以可视化的形式星现的全国交通运输状况,如图所示。
其中,各柱形的高低呈现了各年的货物运输总量情况,折线点的变化反映出运输量增长速度在几年内的变化趋势
数据可视化
3.3.2数据可视化
数据可视化的形式丰富多样,常见的有图表、词云等。例如,
下图形象地展示了某公交线路的路线及客流情况。图中的蓝色线条显示了公交车行进的路线,右侧的柱形图显示了各站点乘车的人数,折线图显示出客流随时间的变化情况。
数据可视化的形式
数据可视化的实现
饼图
用于显示个部分数据在总数剧中的大小和比例关系。
散点图
用于表示若干数据系列中各数值之间的关系。以便判断两个变量之间是否存在某种关联。适用于三维数据集。但其中只有两维需要比较。
柱形图
通常用于显示一定范围内数据的变化情况或用于各项数据的比较。
折线图
折线图可显示随时间而变化的连续数据,常用于分析相等时间间隔下数据的发展趋势。
雷达图
用来比较每个数据相对中心的数字变化,适用于多维数据的呈现。且每个维度可以排列。
使用python语言绘制图表
使用Python语言可以灵活地制作出以上图表,绘制时可以使用Matplotib库。该库是提供数据绘图功能的第三方扩展库,其pyplot子库主要用于实现各种数据图表的绘制。绘图时可使用impont?matplolib.pyplot?as?plt语句导入该库,在后续的代码中,则用plt代替pyplot。
例如,使用pyplo子库中的画图函数plot(x,y)可以绘制折线图,程序如下:
import?matplotlib.pyplot?as?plt
x
[1,?2.2,?3,?4,5,?6,?7]
y=[1,?7,?25,?11,?8,?10,?16]
#绘制折线图
plt.plot(x,?y)
#显示图表
plt.?show(?)
若将plot(x,?y)修改为(plotsx,?y,?"o"),则可绘制出散点图?(函数中的?"o"表示的是点形标记符).
用词云将数据可视化
日常生活中需要处理大量的文本数据,如
新闻、邮件、报告等。面对日益加快的工作节奏,人们需要更高效的文本阅读和分
析方法。文本可视化通过丰富的图形或图像,以易于理解和接受的方式揭示文本中的
信息,因而得到广泛应用。
词云是目前常用的关键词可视化形式,它
能直接抽取文本中的关键词,并将其按照一定顺序和规律整齐美观地呈现在屏幕上。
关键词是从文本的文字描述中提取的语义单元,可反映出文本内容的重点。用词云可
视化文本数据可以帮助人们快速地了解文本的内容和特征等信息。
词云通常使用字体的大小和颜色表示关键词
的重要程度或出现频次。
02
数据分析报告与应用
通过数据采集、整理、分析和可视化等工作,我们完成了对数据的处理,得到的数据分析结果需要以数据分析报告的形式发布出来。数据分析报告不仅是对整个数据处理过程的总结与展示,更能为决策提供参考。通过数据分析报告,可以将分析结果、可行性建议及其他有价值的信息传递给使用者。
数据分析报告的基本结构
数据分析报告内容的呈现形式可以各不相同,但数据分析报告结构形式基本相似,
一般都包括王篇正文和结尼三部分。通常开篇部分包括标题、目录和前言,主要内容是分析背景、目的和思路等:正文部分主要包括具体的分析过程和结果;结尼部分包括结论、建议及附录,如图所示。
数据分析报告的基本组成部分
标题页
标题也包含报告基本信息标题作者。报告日期。标题应短小精悍体现数据分析的核心内容。
前言
前言是对报告的说明和概述,主要包括以下几部分内容:分析背景,包括开展此次外析的缘由及意义等;分析目的,也就是此次分析要解决的问题与要达到的目标;分析思路,包括数据分析的过程、方法与工具等。
正文
前言是对报告的说明和概述,主要包括以下几部分内容:分析背景,包括开展此次外析的缘由及意义等;分析目的,也就是此次分析要解决的问题与要达到的目标;分析思路,包括数据分析的过程、方法与工具等。
结论和建议
报告期尾部分应根据数据分析结果进行总结和提炼,给出明确的结论,具体建议或解决方案。这部分是整个报告的重点,能够帮助使用者深入思考。
附录是对全文的补充,可以将不便于在正文中体现的内容放在这里。包括名词解释数据收集方式、调查问卷、分析方法说明和参考资料等。
阅读拓展
数据分析成果的展示与交流
项目活动背景
确定本项目的原因,本项目的的价值和背景等
数据处理过程
数据采集的过程,采集、分析所需要的方法和工具,呈现数据使用的可视化形式和工具等
数据分析成果
数据分析的结果、结论和建议
项目活动体会
项目活动中的感悟和体验,对数据处理的重要意义和认识
展示交流
数据处理和问题解决
数据不仅对个人生活影响深刻,更对国家发展发挥着重要的作用。例如,国家统计局提供的大量数据,涵盖了国家各个主要行业和部门,应用这些数据,可以对国民经济、社会发展、科技进步和资源环境等情况进行分析、预测和监督,从而为国家有关部门提供决策依据和咨询建议。国家组织开展的全国住户调查,通过收集居民家庭的收入支出、
生产就业、教育医疗、社会保障和居住条件等数据,为促进城乡居民增收、制定社会保障标准提供了数据参考。
THANK
YOU