课题 5.4 数据的可视化表达 课型 新授课 课时安排 1
教 学 目 标 了解数据可视化呈现的主要方式,能够根据数据特点选择合适的表达方式。 能够选用恰当的工具可视化表达数据,提升数据分析的效率。 通过实践体验感受数据可视化表达的意义,培养学生的归纳总结能力和数据处理能力。
教 学 重难 点 重点:选用恰当的工具可视化表达数据,提升数据分析的效率。 难点:选用恰当的工具可视化表达数据,提升数据分析的效率。
教 学 方 法 讲授法、任务驱动法、演示法、实践体验法等
教 学 过 程 情境导入 通过网络游戏导入大数据,从而导入数据分析,通过中国游戏用户规模图表,进一步导入本节课题。 探究新知 数据可视化 是指以图形、图像、地图、动画等生动、易于理解的方式展示数据和诠释数据之间的关系、趋势与规律等,以便更好地理解数据。 作用: 把枯燥乏味的海量数据以丰富的视觉效果呈现数据所反映的本质问题,有效提升数据分析的效率。 二、数据可视化表达的方式 介绍常用的数据可视化表达方式 1.柱形图: 是一种以长方形的长度为变量的统计图表,用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。亦可横向排列,或用多维方式表达。 2.折线图: 是排列在工作表的列或行中的数据可以绘制到折线图中。折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势。 3.饼图: 显示一个数据系列 (数据系列:在图表中绘制的相关数据点,这些数据源自数据表的行或列)。图表中的每个数据系列具有唯一的颜色或图案并且在图表的图例中表示。 4.词云图: 词云图,一般多是用于重点突出文本数据中出现频率较高的“关键词”,特别适合突出关键词,让用户扫一眼就能看到主要的文本内容,因此也可以称之为文字云。 三、实践探究 在python中 运行下面的程序制作《三国演义》词云。学生在Python中调试运行代码 教师提供代码如下: from scipy.misc import imread import matplotlib.pyplot as plt from wordcloud import WordCloud import jieba import imageio import numpy as np text=open("sanguo.txt","rb").read() text_jieba=" ".join(jieba.cut(text)) mask=np.array(image.open("2.png")) wc =WordCloud( font_path="C:\Windows\Fonts\SimHei.ttf", background_color="white", max_words=200, mask=mask, max_font_size=30 ) wc.generate(text_jieba) wc.to_file("三国演义词云.jpg") plt.figure() plt.imshow(wc) 四、数据可视化表达的工具 1.Seaborn Seaborn主要关注统计模型的可视化。例如,直方图既可以总结数据,也可以描绘总体 分布。Seaborn基于且高度依赖于Matplotlib。 实践体验: 打开并运行配套资源包“第五章\课本素材\直方图程序5-7”文件 2.Bokeh Bokeh是一个很好的可视化库,可实现交互式可视化。与其他库相反,Bokeh是独立于 Matplotlib的。Bokeh的重点在其交互性,且是通过浏览器以数据驱动文档的风格呈现。 实践体验: 打开并运行配套资源包“第五章\课本素材\Bokeh示例程序5-8”文件 作业 归纳总结:柱状图、折线图、饼图、散点图、气泡图、雷达图等六种基本图表的特点及适用场合