中图版 高中信息技术 必修1 3.3 数据分析与可视化 课件 (44张PPT)

文档属性

名称 中图版 高中信息技术 必修1 3.3 数据分析与可视化 课件 (44张PPT)
格式 pptx
文件大小 5.0MB
资源类型 试卷
版本资源 中图版(2019)
科目 信息技术(信息科技)
更新时间 2021-10-08 16:44:03

图片预览

文档简介

(共45张PPT)
第3章
算法与程序实现
人教版(2019版)
信息技术(高中)
必修1
数据与计算
3.3
数据分析与可视化
学习目标
1
3
掌握常用的数据分析方法,能根据需要选择恰当的方法进行数据分析。
了解数据可视化的形式,能选用合适的工具进行数据可视化表达与呈现。
通过项目研究,感受数据分析和可视化表达对日常生活的影响。
2
体验探究
你能读懂这些数据吗
为了解近年来我国水资源状况,访问国家统计局政府网站获得如图3.3.1所示的数据和图表。
图3.3.1
我国水资源部分数据指标呈现

考:
1、利用该网站数据可视化功能,调整水资源数据指标和数据呈现方式,进一步分析不同类型图表所表达信息的异同。
2、根据自己的需求,浏览网站栏目,了解相应的数据,并分析其中蕴含的信息。
3.3.1
数据分析
1、了解事物的现状
通过数据分析,可以帮助我们更好地认识所调研事物的目前状况。例如,通过分析游客人数变化、旅游花费等数据,能够了解旅游业当前整体的发展状况,帮助旅游业经营者有针对性的调整经营策略,制订发展方案。
图3.3.2
我国国内旅游总分数据呈现
2、剖析事物的发展历程
通过数据分析,可以剖析事物的发展历程,了解事物的过去,揭示某些现象产生的原因。例如,分析全国27个主要城市近50年来月平均降水量和降水天数,再对比相关城市航班正常率的数据,可以发现航班正常率的走向与月降水量和天数呈相反方向变化的趋势。对航空公司、空中交通管理措施和天气等各方面大量历史数据的分析研究、可以帮助管理者找到影响航班正常运行的干扰因素,从而选择最佳的应对措施。
3、预测事物的未来走向
通过数据分析、可以预测事物未来可能会发生什么、推断未来的发展趋势、并为制订相应的目标及策略提供依据。目前利用数据分析进行预测已经应用于各个领域,包括体育赛事预测、用户行为预测、能源消耗预测、交通行为预测和人体健康预测等。例如,通过各个家庭安装的智能电表,对电力的使用状况进行监控,检测出用电模式,从而对用电需求做出预测。
数据分析的基本方法
1、对比分析法
对比分析法也叫比较分析法,是将两个或两个以上的数据进行比较,分析它们的差异,揭示出这些数据所反映的事物规律的方法,是一种常用的分析方法。
图3.3.3
全国水资源开发利用综合对比
图3.3.4
中国创新能力指数数据
2、平均分析法
平均分析法是运用计算平均数的方法来反映总体在一定时间、地点等条件下某一数量特征的一般水平。
图3.3.5
我国2012—2016年国内旅游人均消费情况
3、结构分析法
结构分析法也称构成分析法,是将各个部分与总体进行对比,是分析事物内部的结构和部分与整体之间关系的方法。
图3.3.6
使用不同无线网络访问某些网站的百分比
1.用电子表格软件进行数据分析
电子表格软件可对数据进行格式编辑、统计计算和囹表处理等。在电子表格软件中,通常用若干工作表存储数据。图3.3.7就是使用电子表格软件处理数据的示意图。
图3.3.7
电子表格软件处理数据的示意图
2.用在线数据分析平台进行数据分析
随着数据规模越来越大,应用范围越来越广,分析数据和挖掘数据价值的需求也越来越多,许多在线数据分析平台应运而生。这些平台集成了多种分析功能,提供了简单易用的交互界面,使得多种数据分析需求得以实现。
使用在线数据分析平台分析全国供水情况
登录国家统计局网站,查找全国供水数据,体验在线数据分析平台分析数据的过程和方法。
1.注册账号并登录,熟悉国家统计局网站在线数据分析平台的使用方式;
2.查找全国供水数据,根据平台的提示,尝试完成在线数据分析,查看并保存分析结果;
3.分析该平台的数据分析功能,有哪些优缺点。
数据分析除了可以对数值型数据进行统计和描述以外、还可以对文本、图像等数据进行分析。常用的文本分析有字词频率统计、语句分词、句法分析、分类分析和情感分析等例如,对一段描述南水北调下程的文字进行文本分析后、得到的结果如图3.3.8所示。
阅读拓展
实践活动
阅读拓展
阅读拓展
在互联网浪潮的推动下、政府机构向信息化、网络化和智能化转变已成为一种趋势。中央和各级政府机构高度重视信息公开和数据发布,并在其官方网络平台为大众提供数据服务。例如,中华人民共和国国家统计局专门设立了国家数据网站,用于发布我国各级各类统计数据,如图3.3.9所示。国家数据网站不仅提供敏据的下载,还可以对数据进行在线处理,如编辑、计算和生成图表等。
图3.3.9
国家数据网站页面
3.使用编程工具进行数据分析
例1:编写程序统计分析南水北调中线工程各地区水资源情况。
问题:分析南水北调中线工程各地区水资源数据,有助于了解我国水资源的分布情况。将采集并整理后的中线工程各地区水资源数据保存为“07-16nsbd-csv“文件、如图3.3.10所示。编写程序,计算中线工程各地区2007一2016年水资源总量的平均值,并将结果保存到CSV文件中。
图3.3.10
整理后的2007-2016年中线工程各地区水资源数据
(1)分析问题
已知条件:已有中线工程各地区水资源数据文件“07-16nsbdesv“,其中包含了2007一2016年相关地区水资源数据。
求解目标:统计计算中线工程各地区2007一2016年水资源总量的平均值,将统计结果保存为CSV文件“nsbd_avgesv“,并显示中线工程各地区十年来的平均水资源总量。
已知与未知的关系:可以根据中线工程各地区水资源数据文件“07-16nshd.csv“中的2007一2016年水资源数据,计算出各地区这十年水资源总量的平均值。
(2)规划问题求解流程
首先导入用到的库,读入“07-16nsbd.csv“文件中的全部数据,然后统计各地区十年水资源总量的平均值,生成一个数据表,并将统计结果写人CSV文件。
(3)编程实现与调试
import
pandas
as
pd
df=pd.read_csv(“07-16nsbd.csv“,encoding=“gbk“,header=1)
df[“平均水资源总量“]=df.mean(axis=1)
print(df[[“地区“,“手均水资源总量“]])
df.to_csv(“nsbd_aVg.csv“,encodinga=“gbk“,f1oat_formata=“%.3f“)
(4)保存文件,调试运行程序
程序运行结果如图3.3.11所示。
数据可视化是以图形、图像和动画等方式直观生动地呈现数据及数据分析结果,
揭示数据之间的关系、趋势和规律等,便于人们更好地理解数据。
3.3.2
数据可视化
图3.3.14
全国交通运输状况
数据可视化的形式
数据可视化的形式丰富多样,常见的有图表、词云等。例如,图3.3.15形象地展示了某公交线路的路线及客流情况。图中的蓝色线条显示了公交车行进的路线、右侧的柱形图星示了各站点乘车的人数,折线图显示出客流随时间的变化情况。
图3.3.15
公交线路及客流情况的可视化呈现
实践活动
实践活动
了解数据可视化
了解各种数据可视化形式,体验数据可视化效果和魅力。
1.访问国家统计局网站,了解数据可视化在国家数据统计分析领域的应用(如图3.3.16所示),体验数据可视化效果。
图3.3.16
可视化示例
数据可视化的实现
数据可视化帮助人们形象地获取其中的信息。
1.用图表将数据可视化
图表是数据处理中常用的数据可视化形式之一。常用的图表包括折线图、柱形图、
饼图、散点图和雷达图等。各种图表呈现数据的形式各有特点,应该根据实际需要选择不同的图表进行数据呈现。

折线图:折线图可显示随时间而变化的连续数据,常用于分析相等时间间隔下数据的发展趋势。图3.3.17呈现了2017年2月一2018年1月鲜果类居民消费价格的变化趋势。
图3.3.17
折线图示例
图3.3.18
柱形图示例
柱形图:通常用于显示一定范围内数据的变化情况或用于各项数据的比较。
图3.3.19
饼图示例
饼图:用于显示各部分数据在总数据中的大小和比例关系。
散点图:用于表示若干数据系列各数值之间的关系。
图3.3.20
散点图示例
图3.3.21
雷达图示例
雷达图:用来比较每个数据相对中心的数值变化,适用于多维数据的呈现,且每个维度可以排序。下图显示了用户1和用户2在购买频率、购买商品各类等5个维度上的情况。
使用Pyhon语言可以灵活地制作出以上图表,绘制时可以使用Matploib库。该库是提供数据绘图功能的第三方扩展库,其pyplot子库主要用于实现各种数据图表的绘制。绘图时可使用import
matplotlib.
Pyplot
as
plt语句导入该库,在后续的代码中,则用plt代替pyplot.
例如,使用pyplot子库中的画图函数plot(x,y)可以绘制折线图,程序如下:
import
matplotlib.pyplot
as
p1t
X=[l,2.2,3,4,5,6,7]
y=[1,7,25,11,8,10,16]
plt.plot(x,y)
plt.show()
该程序运行的效果如图3.3.22所示。
图3.3.22
用函数plot()绘制的折线图
若将plot(x,y)修改为plot(x,y,”o”),则可绘制出散点图(函数中的“o”表示的是
点形标记符),程序运行效果下图所示。
图3.3.23
用函数plot()绘制的散点图
例2:编写程序用图表可视化呈现南水北调中线工程各地区水资源总量数据。
(1)分析问题
已有需要进行可视化的水资源数据,即供水区湖北省数据,受水区河南省、河北省、北京市和天津市数据,需制作图表呈现数据。为了便于对比各区域数据,选择用柱形图呈现。
(2)规划问题求解流程
首先导入绘制图表需要用到的matplollib库,然后从“nsbd_avg.csv“文件中读取数据,再绘制图表,设置图表标题和横、纵坐标轴、最后显示出柱形图。
(3)编程实现与调试
#导入需要的库
import
pandas
as
pd
import
numpy
as
np
import
matplotlib.pyplot
as
p1t
plt.rcParams[“font.sans-serif“]=[“SimHei“]
#指定Matplot1lib库使用的中文字体
#读取数据文件
#用pandas库中的函数read_csv打开数据文件,指定文件的文字编码方式,指定不包含列标题
df=pd.read_csv(“nsbd_avg.csv“,encoding=“gbk“,header=0)
water_resource=df[df.columns[12]]
#绘制图表
ind=np.arange(5)
width=0.35
plt.bar(ind,water_resource,width,Color=“#d62728“)
plt.ylabel(“平均水资源总量/亿立方米“)
plt.title(“2007一2016年南水北调中线各地区平均水资源总量对比“)
plt.xticks(ind,(“北京市“,“天津市“,“河北省“,“河南省“,“湖北省“))
#显示图表
plt.show()
(4)保存文件,调试运行程序
程序运行结果如图3.3.24所示。
图3.3.24
程序运行结果图
2007-2016年南水北调中线各地区平均水资源总量对比
表3.3.2
pyplot子库中部分函数
函数
功能说明
Pyplot.title
设置图表标题
Pyplot.bar
绘制柱形图
Pyplot.xlabel,pyplot.ylabel
设置横轴和纵轴标签
Pyplot.xticks,pyplot.yticks
设置横、纵坐标轴的刻度
Pyplot.show
弹出窗口显示图表
图3.3.25
地球大气环流可视化图
我们生活在三维空间中,来自现实世界的数据通常包含位置信息。地理空间特指真实的人类生活的空间,地理空间数据一直是可视化研究和应用的重要对象、地理信息可视化在现实生活中应用广泛。
人类长期以来通过对地球和自然环境的观测来研究和了解自然空间,科学家们也通过建立数学模型来模拟环境的变化。这些观测和模拟得到的数据通常包含了地理空间中的位置信息,最常见的是与气象相关的数据。例如,图3.3.25是某一时刻全球大气环流和风速的可视化在线动态展示,能维清晰地反映全球的大气环流状况。当有台风形成时,在地图上能清楚地看到台风的位置。
实践活动
阅读拓展
2、用词云将数据可视化
图3.3.26
词云示例
例3:编写程序制作词云。
(1)分析问题
已知条件:已有水资源公报文本文件“2016年中国水资源公报.xt“,制作词云需耍用到ScipPy、wordeloud、jieba和Matplotlib等第三方扩展库;求解目标:为“2016年中国水资源公报.txt“文件制作词云;已知与未知的关系:利用第一方扩展库可以对已有的文本文件进行分词,生成并绘制词云。
(2)规划问题求解流程
首先导入用于制作词云的第三方扩展库,再读入报告的文本文件、然后进行分词,随后配置制作词云的各项参数,如宇体、背景色和词云形状等,最后生成词云图片:
(3)编程实现与调试
进行编程实现,程序示例如下:
#导入需要用到的库
from
scipy.misc
import
imread
import
matplot1lib.pyplot
as
p1t
from
wordcloud
import
WordCloud
Import
jieba
text=open(“2916年中国水资源公报.txt“,“rb“).read()
text_jieba=““.join(jieba.cut(text))
bg_pic=imread(“1.png“)
#配置词云参数
WC=WordCloud(
font_path=“msyhbd.ttf“,
background_colorn=“white“,
max_words=200,
mask=bg_pic,
maXx_font_size=100
)
wc.generate(text_jieba)
#生成图片并显示
p1lt.figure()
p1lt.imshow(wc)
p1lt.axis(“off“)
p1lt.show()
wc.to_file(“水资源.jpg“)
(4)
保存文件,调试运行程序
图3.3.27
《2016年中国水资源公报》词云
1.制作词云用到的Python扩展库
Scipy:科学计算核心库之一。Scipy的misc摸块用于对图像进行操作,
函数imread()读入用于生成词云的图像文件。
jieba:中文分词工具,使用cut方法进行分词,
wordcloud:词云生成工具,使用generate方法读取文本生成词云。
导入上述库的语句如下:
from
scipy.misc
import
imread
from
wordcloud
import
WordCloud
import
jieba
制作词云使用的库和函数
2、涉及的pyplot子库函数
函数
功能说明
Pyplot.figure
创建一个绘图区
Pyplot.imshow
显示图片
Pyplot.axis
设置坐标轴,axis(“off”)为不显示坐标轴
谢谢
21世纪教育网(www.21cnjy.com)
中小学教育资源网站
有大把高质量资料?一线教师?一线教研员?
欢迎加入21世纪教育网教师合作团队!!月薪过万不是梦!!
详情请看:
https://www.21cnjy.com/help/help_extract.php