(共20张PPT)
3.2
数据采集与整理
学习目标:
通过生活中的应用实例,体验数据分析的方法和作用,感受数据分析对人们日常生活的影响。
能够利用软件工具或平台、Python程序对数据进行计算与分析。
了解数据可视化的概念、作用和表现形式,能够根据需求选择合适的可视化形式,能够挖掘数据分析的社会价值。
理解南水北调工程的重要意义,提高合理用水、节约用水意识。
南水北调工程的起因是什么?
如今中线工程完工供水对沿途四省市有什么
具体影响?
对当地今后的经济和社会可持续发展战略作用是什么?
新课导入:
数据
收集、整理、存储
收集整理存储的这些数据到底有什么作用?
如何去分析处理才能有助决策?
数据分析
1.数据分析的作用
2.数据分析的基本方法
3.数据分析体验
数据
知识
信息
数据收集
数据整理
数据存储
数据分析
数据分析:
指用适当的计算方法与工具对收集来的数据进行处理,提取有用信息,形成结论,从而支持决策。
描述性
数据分析
探索性
数据分析
验证性
数据分析
侧重于对数据的各种特征进行分析,对变量之间的关系进行评估和描述。
主要用于在数据中发现新的特征。
为侧重于验证已有假设的真伪。
数据分析的基本方法
结构分析法:
也称构成分析法,是将各个部分与总体进行对比,是分析事物内部的结构和部分与整体之间关系的方法。结构分析法的基本表现形式就是计算结构指标。
对比分析法:
也叫比较分析法,是将两个或两个以上的数据进行比较,分析它们的差异,揭示出这些数据所反映的事物规律的方法,是一种常用的分析方法。
平均分析法:
运用计算平均数的方法来反映总体在一定时间、
地点等条件下某一数量特征的一般水平。
平均指标中最常用的是算术平均数,如平均身高、平均工资和平均降水量等。
体验数据分析
用电子表格软件进行数据分析
用在线数据平台进行数据分析
使用编程工具进行
数据分析
体验实践:
使用编程工具进行数据分析。
(1)问题:编写程序统计分析南水北调中线工程各地区2007-2016年水资源情况。
(2)任务:运用解析算法描述问题求解过程。
①分析问题(已知条件、求解目标、已知和未知的关系);
②规划问题求解流程;
③利用Python语言编程实现与调试;(教科书第111页)
④保存文件,运行程序。
(3)分析结论,思考下列两问题:
①中线各地区水资源的实际情况如何?
②政府实施南水北调工程的起因是什么?
数据可视化:
数据可视化是以图形、图像和动画等方式直规生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等,方便人们更好地理解数据。
体验探究1:
在Excel中实现数据的可视化
体验探究2:
在python中
编写程序制作《三国演义》词云。
from
scipy.misc
import
imread
import
matplotlib.pyplot
as
plt
from
wordcloud
import
WordCloud
import
jieba
import
imageio
import
numpy
as
np
text=open("sanguo.txt","rb").read()
text_jieba="
".join(jieba.cut(text))
mask=np.array(image.open("2.png"))
wc
=WordCloud(
font_path="C:\Windows\Fonts\SimHei.ttf",
background_color="white",
max_words=200,
mask=mask,
max_font_size=30
)
wc.generate(text_jieba)
wc.to_file("三国演义词云.jpg")
plt.figure()
plt.imshow(wc)
知识拓展:
1.Scipy:科学计算核心库之一。
Scipy的misc用于对图像进行操作,函数imread()读入用于生成词云的图像文件。
2.Jieba:中文分词工具,使用cut方法进行分词。
3.
Wordcloud:词云生成工具,使用generate方法读取文本生成词云。
作业:
现有5名篮球队员的比赛数据,如表3.3.5所示。试分析比较他们在各项能力上的差异。思考:哪种图表形式适合呈现队员的数据,比较他们在各个能力维度上的强弱。(
装
订
线
)课
题
3.3数据分析与可视化
课型
新授课
课时安排
2
教
学
过
程
(
授课教师
:
授课班级
:
)教学目标
通过生活中的应用实例,体验数据分析的方法和作用,感受数据分析对人们日常生活的影响。
能够利用软件工具或平台、Python程序对数据进行计算与分析。
了解数据可视化的概念、作用和表现形式,能够根据需求选择合适的可视化形式,能够挖掘数据分析的社会价值。
理解南水北调工程的重要意义,提高合理用水、节约用水意识。
一、问题引入:
学生思考:
1.
南水北调工程的起因是什么?
2.
如今中线工程完工供水对沿途四省市有什么具体影响?
3.
对当地今后的经济和社会可持续发展战略作用是什么?
教师引导:收集整理存储的这些数据到底有什么作用?如何去分析处理才能有助决策?
二、新知探究:
1.教师讲解:
1:数据分析的作用
2:数据分析的基本方法
2.
体验数据分析
体验1.
用电子表格软件进行数据分析
利用电子表格软件对“期中考试”中的数据进行分析。
体验2.
用在线数据平台进行数据分析
体验3.
使用编程工具进行
编写程序统计分析南水北调中线工程各地区2007-2016年水资源情况。(page111)
要求:调试运行成功
3.
数据可视化:
图表:
折线图:可显示随时间而变化的连续数据,常用于分析相等时间隔下数据的发展趋势。
饼图:用于显示各部分数据在总数据中的大小和比例关系。
柱形图:通常用于显示一定范围内数据的变化情况或用于各项数据的比较。
散点图:用于表示若干数据系列中各数值之间的关系,以便判断两个变量之间是否存在某种关联
雷达图:用来比较每个数据相对中心的数值变化,适用于多维数据的呈现,且每个维度可以排序。
体验探究1:将老师发送的Excel文件中的数据可视化(柱形图)
词云:
教师演示在python中
编写程序制作《三国演义》词云。
教师对程序代码加以讲解。
教学难点
教学重点
重点:数据分析体验,数据可视化的实现
难点:数据分析方法的选择运用,根据需求选取适当的数据可视化形式,呈现和表达数据。
教学
方法
体验探究、分组合作法、讨论交流法、云课堂演示等
板书设计
3.3数据分析与可视化
一、数据分析的基本方法:
1.对比分析法
2.平均分析法
3.结构分析法
二、数据可视化
图表:
折线图、饼图、柱形图、散点图、雷达图等
词云:
Scipy库
教学反思
学生对excel软件和python比较熟悉,对数据采集和整理掌握的较好,但是对数据分析的认识相对较少,所以要求学生了解图表和图云其作用和制作方法,由于词云程序中涉及到多个库,所以学生接受的比较吃力。
代码:
from
scipy.misc
import
imread
import
matplotlib.pyplot
as
plt
from
wordcloud
import
WordCloud
import
jieba
import
imageio
import
numpy
as
np
text=open("sanguo.txt","rb").read()
text_jieba="
".join(jieba.cut(text))
mask=np.array(image.open("2.png"))
wc
=WordCloud(
font_path="C:\Windows\Fonts\SimHei.ttf",
background_color="white",
max_words=200,
mask=mask,
max_font_size=30
)
wc.generate(text_jieba)
wc.to_file("三国演义词云.jpg")
plt.figure()
plt.imshow(wc)
教师详解:
1.
1.Scipy:科学计算核心库之一。
Scipy的misc用于对图像进行操作,函数imread()读入用于生成词云的图像文件。
2.Jieba:中文分词工具,使用cut方法进行分词。
3.
Wordcloud:词云生成工具,使用generate方法读取文本生成词云。
4.pyplot.figure:
创建一个绘图区
Pyplot.imshow:显示图片
Pyplot.axis:
设置坐标轴。Axis(“off”)时不显示坐标轴
体验探究2:学生在python中制作“中国特色社会主义新时代”的词云。
三、课堂小结:教师和学生一起总结本节知识点。
四、作业:
现有5名篮球队员的比赛数据,如表3.3.5所示。试分析比较他们在各项能力上的差异。思考:哪种图表形式适合呈现队员的数据,比较他们在各个能力维度上的强弱。