(共13张PPT)
3.3.1 数据分析
人民教育出版社 中国地图出版社
回顾 数据处理一般过程
数据采集
数据分析
数据呈现
数据整理
一、数据分析的作用
采集了所需要的数据,并对数据进行了组织和整理后,为了获得有价值的信息,还需要对数据做进一步的分析。
了解事物
现状
剖析事物
发展历程
预测事物
未来走向
二、数据分析的基本方法
描述性数据分析:侧重于对数据的各种特征进行分析,对变量之间的关系进行估计和描述;
探索性数据分析:探索性数据分析主要用于在数据之中发现新的特征;
验证性数据分析:验证性数据分析侧重于验证已有假设的真伪。
从统计应用上讲,数据分析可以分为:
常用的数据分析方法有对比分析法、平均分析法和结构分析法等。
1.对比分析法也叫比较分析法,是将两个或两个以上的数据进行比较,分析它们的差异,揭示出这些数据所反映的事物规律的方法,是一种常用的分析方法。
二、数据分析的基本方法
对比分析法通常用于从数量上展示和说明研究对象规模大小、水平高低、速度快慢及各种关系是否协调等。
二、数据分析的基本方法
2.平均分析法是运用计算平均数的方法来反映总体在一定时间、 地点等条件下某一数量特征的一般水平。
平均指标中最常用的是算术平均数,如平均身高、平均工资和平均降水量等。
平均分析法多用于比较同类现象在不同地区、不同行业、不同类型单位等之间的差异程度,分析现象之间的依存关系,进行数量上的推算;也可以对某一现象在不同时间的水平进行比较,以说明现象的发展规律及趋势。
3. 结构分析法也称构成分析法,是将各个部分与总体进行对比,是分析事物内部的结构和部分与整体之间关系的方法。结构分析法的基本表现形式就是计算结构指标。
二、数据分析的基本方法
结构指标即各个部分相对于总体所占的百分比,因此总体中各结构指标的总和等于100%。
三、体验数据分析
1、用电子表格软件进行数据分析(普及)
如:Excel或wps表格等软件
2、用在线数据分析平台进行数据分析
如:国家数据网(https://data.stats.)、好分数等网站
3、用编程工具进行数据分析(课本例题)
如:Python、VB、C等编程工具
三、体验数据分析
3、用Python进行数据分析(课本例题)
使用第三方库pandas
例题:求学生各科成绩总分,用python编程实现。
三、体验数据分析
3、用Python进行数据分析(课本例题)
例题:求学生各科成绩总分,用python编程实现。
import pandas as pd #导入pandas并设置pd别名
df=pd.read_csv(“cj.csv”,encoding=“gbk”,header=0) #读取cj文件
df[“总分”]=df.sum(axis=1) #增加“总分”列,并按一行求和
print(df[[“姓名”,“总分”]]) #显示姓名与总分列
df.to_csv(“cj_sum.csv”,encoding=“gbk”,float_format=“%.3f”) #保存为新文件
增加列
Sum求和,axis=1是按行统计
学生练习
四、pandas库中dataframe的方法
DataFrame具有一组常用的汇总和统计方法,包括计数、求和、求平均值等相关计算。
1.非空数据个数
格式: pandas.DataFrame.count()用于返回DataFrame的个数。
默认按列统计非空数据的个数,axis=1表示按行统计非空数据的个数。
如: pandas.DataFrame.count(axis=1)
2. 数据求和
格式: pandas.DataFrame.sum()用于返回所有列的和。
axis=1 表示对各行的数据计算和,如:pandas.DataFrame.sum(axis=1 ) 。
3. 数据平均值
格式: pandas.DataFrame.mean()用于返回所有列的平均值。
axis=1 表示对各行的数据计算平均值。如: pandas.DataFrame.mean(axis=1 )
import pandas as pd
v = [[38.8, 38.2], [27.2, 25.7]]
a = ["北京", "天津”]
y = [ "2016","2015"]
df = pd. DataFrame (v, a, y)
print ("DataFrame中的数据为:","\n", df, "\n")
df1 = df. sum()
print("按列求和结果为: ","\n", df1)
四、pandas库中dataframe的方法
案例分析:
默认按列求和
按行求和
df1=df.sum(axis=1)
课堂总结