5.3 数据的分析 课件(共22张PPT)+教案+练习(含答案)+程序素材

文档属性

名称 5.3 数据的分析 课件(共22张PPT)+教案+练习(含答案)+程序素材
格式 zip
文件大小 100.1KB
资源类型 教案
版本资源 粤教版(2019)
科目 信息技术(信息科技)
更新时间 2020-11-11 11:49:57

文档简介

(共22张PPT)
第五章
数据处理和可视化表达
信息技术必修1《数据与计算》
5.3
数据的采集
上机课要求
上课前课代表同学提前与老师联系,确定上课事宜。
上课不能携带水、零食等进入机房。
进入机房按照编排机号入座,不得随意串座。
学习目标
1、能够体验多种数据分析技术;
2、能够掌握选用恰当的工具处理数据;
3、能够掌握总结和归纳数据分析的方法和步骤;
思考问题
生活中大数据时代的我们,前面我们学习了数据的采集与保护,那么我们获取的数据可以直接拿过来用吗?
任务一:体验特征探索
特征探索的定义
以小组为单位,通过查找资料、学习和交流,填写下表。
任务一:体验特征探索
特征探索的定义
以小组为单位,通过查找资料、学习和交流,填写下表。
对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。
任务一:体验特征探索
小程序体验:数据预处理.py
修改“数据预处理.py”代码,对采集到的商品销售数据进行预处理,包括发现和处理缺失值、处理异常数据、求最大值、最小值、极差、组距、绘制直方图,观察数据的分布特征,以小组为单位,通过学习、交流,探究(课本112-113页内容)
任务一:体验特征探索
#异常值处理、画散点图(横轴:价格,纵轴:评论数)找到异常值data2=data.Tprice=data2.values[2]comt=data2.values[3]plt.xlabel('price')
#显示X坐标标签plt.ylabel('paynum')
#显示Y坐标标签pyl.plot(price,comt,"o")pyl.show()
任务一:体验特征探索
#求最值
pricemax=da2[2].max()
pricemin=da2[2].min()
paynummax=da2[3].max()
paynummin=da2[3].min()
#极差
pricerg=pricemax-pricemin
paynumrg=paynummax-paynummin
任务一:体验特征探索
#极差pricerg=pricemax-priceminpaynumrg=paynummax-paynummin#组距pricedst=pricerg/13paynumdst=paynumrg/13
任务一:体验特征探索
#绘制价格直方图
#npy.arrange(最小,最大,组距)
pricesty=npy.arange(pricemin,pricemax+1,pricedst)
plt.xlabel('price')
#显示X坐标标签
plt.ylabel('number')
#显示Y坐标标签
pyl.hist(da2[2],pricesty)
pyl.show()
任务二:体验关联分析
要求:以小组为单位,通过网上查找资料、学习和交流。
关联分析的定义
分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。
任务二:体验关联分析
要求:以小组为单位,通过网上查找资料、学习和交流。
小程序体验:
运行关联分析.py”体验关联分析。
修改
关联分析.py”代码,对采集到的店铺销售订单数据进行关联分析,寻找商品之间的关联性,观察关联分析结果,以小组为单位,通过学习、交流,探究和实践,
任务三:体验聚类分析
以小组为单位,通过学习和交流,填写下表。
import
numpy
as
np
import
matplotlib.pyplot
as
plt
from
pylab
import
x
=
np.arange(-5.0,
5.0,
0.02)
y
=
np.sin(x)
plt.plot(x,
y)
plt.show()
任务三:体验聚类分析
以小组为单位,通过学习和交流,填写下表。
聚类分析的定义
是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。
任务三:体验聚类分析
体验小程序:
修改
聚类分析.py”代码,对采集到的商品销售数据“data_sample.csv”进行聚类分析,观察数据分析结果,以小组为单位,通过学习、交流,探究和实践。
from
sklearn.cluster
import
KMeans
#导入商品样本数据
fname="data_sample.csv"
dataf=pda.read_csv(fname,encoding="gbk")
x=dataf.as_matrix()
#聚类分析
kms=KMeans(n_clusters=3)
y=kms.fit_predict(x)
print(y)
任务四:数据分类
以小组为单位,通过查找资料、学习和交流,填写下表。
数据分类
是数据分析中最基本的方法。先基于样本数据构建分类器。然后进行预测。
任务四:数据分类
以小组为单位,通过查找资料、学习和交流。
运行数据分类.py”,体验数据分类。
通过修改或优化数据分类py”代码,对特征值A为128.8,特征值B为158,特征值C为4.7的商品进行分类,观察该商品分类结果,以小组为单位,通过学习、交流,探究和实践,
课堂练习
1、数据分析最基本的方法(
)
A.特征探索
B.数据分类
C.聚类分析
D.
关联分析
B
课堂练习
2、下列有关数据分析说法错误的是(

A.特征探索的主要任务是发现大量数据间的关联性。
B.关联分析的主要任务是发现大量数据间的关联性
c.聚类分析无需事先给出分类标准
D.数据分类是数据分析处理中最基本的方法。
A
课堂总结
下课!
完成测试题,下节课前由小组长批阅,课代表汇总。
作业布置5.3数据的分析
1、选择题(每题1分)
1、数据分析的基本方法包括(

A特征探索、关联分析、聚类分析、数据分类
B
特征探索、聚类分析、数据分类
C.特征探索、数据分类
D.关联分析、聚类分析、数据分类
2、数据特征探索的主要任务是(
)
A.对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。
B.
分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。C
.是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。
D.是数据分析中最基本的方法。先基于样本数据构建分类器,然后进行预测。
3、数据聚类分析的主要任务是(
)
A.对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。
B.
分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。C
.是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。
D.是数据分析中最基本的方法。先基于样本数据构建分类器,然后进行预测。
4、下列有关数据关联分析的说法正确的是(
)
A.对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。
B.
分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。C
.是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。
D.是数据分析中最基本的方法。先基于样本数据构建分类器,然后进行预测。
5、数据数据分类说法正确的是(
)
A.对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。
B.
分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。C
.是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。
D.是数据分析中最基本的方法。先基于样本数据构建分类器,然后进行预测。
6、贝叶斯分类技术属于(

A特征探索
B
聚类分析
C.数据分类
D.关联分析
2、论述题
1、总结归纳数据分析的常用方法。
2、结合现实生活中的体验,谈一下数据分析的意义。
试题答案
一、选择题
1
2
3
4
5
6
A
A
C
B
D
D
二、论述题
1、A.特征探索:对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。
B.
关联分析:分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。
C
.聚类分析:是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。
D.数据分类:是数据分析中最基本的方法。先基于样本数据构建分类器,然后进行预测。
2、无标准答案第五章
数据处理与可视化表达
5.3
数据的分析
课题
数据的分析
课时
1课时
教学目标
能够体验多种数据分析技术;能够掌握选用恰当的工具处理数据;能够掌握总结和归纳数据分析的方法和步骤;
重点与难点
重点:了解数据预处理及分析;体验多种数据分析技术。难点:体验多种数据分析技术。
辅助手段
多媒体,机房广播演示系统
教法学法
讲授法、任务驱动法,小组合作法,自主探究法。
课前准备
课代表同学负责班级分组(4-6人一组)。
教学设计
创设情境激趣导入
首先通过多媒体呈现问题:同学们,通过前面两节课的学习,我们了解了数据,知道了数据的采集与保护,那么我们获取的数据可以直接拿过来用吗?激发大家的学习兴趣,进而引入本节课题-------数据的分析。
任务驱动与知识讲授任务驱动与知识讲授自主探究
任务一:体验特征探索以小组为单位,阅读课本104-106页,通过查找资料、学习和交流,填写下表。特征探索的定义对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。小程序体验:数据预处理.py修改“数据预处理.py”代码,对采集到的商品销售数据进行预处理,包括发现和处理缺失值、处理异常数据、求最大值、最小值、极差、组距、绘制直方图,观察数据的分布特征,以小组为单位,通过学习、交流,探究(课本112-113页内容)#异常值处理、画散点图(横轴:价格,纵轴:评论数)找到异常值
data2=data.T
price=data2.values[2]
comt=data2.values[3]
plt.xlabel('price')
#显示X坐标标签
plt.ylabel('paynum')
#显示Y坐标标签
pyl.plot(price,comt,"o")
pyl.show()#求最值
pricemax=da2[2].max()
pricemin=da2[2].min()
paynummax=da2[3].max()
paynummin=da2[3].min()
#极差
pricerg=pricemax-pricemin
paynumrg=paynummax-paynummin
#组距
pricedst=pricerg/13
paynumdst=paynumrg/13#绘制价格直方图
#npy.arrange(最小,最大,组距)
pricesty=npy.arange(pricemin,pricemax+1,pricedst)
plt.xlabel('price')
#显示X坐标标签
plt.ylabel('number')
#显示Y坐标标签
pyl.hist(da2[2],pricesty)
pyl.show()#绘制销量数直方图
paynumsty=npy.arange(paynummin,paynummax+1,paynumdst)
plt.xlabel('paynum')
#显示X坐标标签
plt.ylabel('number')
#显示Y坐标标签
pyl.hist(da2[3],paynumsty)
pyl.show()任务二:体验关联分析关联分析的定义分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。小程序体验:运行关联分析.py”体验关联分析。修改
关联分析.py”代码,对采集到的店铺销售订单数据进行关联分析,寻找商品之间的关联性,观察关联分析结果,以小组为单位,通过学习、交流,探究和实践,任务三:体验聚类分析以小组为单位,通过学习和交流,填写下表。聚类分析的定义是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。体验小程序:修改
聚类分析.py”代码,对采集到的商品销售数据“data_sample.csv”进行聚类分析,观察数据分析结果,以小组为单位,通过学习、交流,探究和实践。from
sklearn.cluster
import
KMeans
#导入商品样本数据
fname="data_sample.csv"
dataf=pda.read_csv(fname,encoding="gbk")
x=dataf.as_matrix()
#聚类分析
kms=KMeans(n_clusters=3)
y=kms.fit_predict(x)
print(y)任务四:数据分类数据分类是数据分析中最基本的方法。先基于样本数据构建分类器。然后进行预测。运行数据分类.py”,体验数据分类。通过修改或优化数据分类py”代码,对特征值A为128.8,特征值B为158,特征值C为4.7的商品进行分类,观察该商品分类结果,以小组为单位,通过学习、交流,探究和实践,
课堂练习
1、数据分析最基本的方法(B
)A特征探索B.
数据分类C.聚类分析D.
关联分析2、下列有关数据分析说法错误的是(A
)A.特征探索的主要任务是发现大量数据间的关联性。B.关联分析的主要任务是发现大量数据间的关联性c.
聚类分析无需事先给出分类标准D.数据分类是数据分析处理中最基本的方法。
课堂总结
由学生总结归纳本节课所学知识,教师进行点拨。
板书设计
5.3
数据的分析一、特征探索二、关联分析三、聚类分析四、数据分类
课后作业
完成测试题,下节课前由小组长批阅,课代表汇总。