4.2.2编程处理数据 课件(36张PPT,WPS打开)2022—2023学年浙教版(2019)高中信息技术必修1

文档属性

名称 4.2.2编程处理数据 课件(36张PPT,WPS打开)2022—2023学年浙教版(2019)高中信息技术必修1
格式 pptx
文件大小 1.8MB
资源类型 教案
版本资源 浙教版(2019)
科目 信息技术(信息科技)
更新时间 2024-03-01 16:56:13

图片预览

文档简介

(共36张PPT)
编程处理数据
编程处理数据
用excel处理数据方便、对专业要求低,但适用于小数据样本,且适用较为单一的功能需求。
编程处理数据
Numpy模块:是科学运算的基础库,主要提供科学计算中常用的随机数、数组运算等基础模块
Scipy模块:基于numpy构建的一个模块,增强了在高等数学、信号处理、图像处理、统计等方面的能力
Pandas模块:基于numpy实现,主要用于数据的处理与分析,提供了大量处理数据的函数和方法,能方便操作大型数据集
Matplotlib模块:绘图库,快速绘图和设置图标的坐标轴、坐标轴刻度、图例等
维度
一维结构
二维结构
二维表
1 2 3
1 2 3
4 5 6
7 8 9
1 4 7
2 5 8
3 6 9
由对等关系的有序或无序数据构成,采用线性方式组织。
利用pandas模块处理数据
Pandas 提供了Series和DataFrame两种数据结构,这两种数据结构可完成数据的整理、计算、统计、分析及简单可视化。
Series(一维结构):1个索引列+1个数据列.索引值默认是从0起递增的整数。列表,字典等都可以用来创建Series数据结构,与列表不同的是,Series的索引可以指定,类型可以是字符串类型。
Dataframe(二维结构):1个索引列+n个数据列. DataFrame是一种类似于关系表的表格型数据结构,DataFrame对象是一个二维表格, 其中每列中的元素类型必须一致,而不同的列可以拥有不同的元素类型。
利用pandas模块处理数据
Series Dataframe
导入模块
Import pandas as pd
利用pandas模块处理数据
Series
1.创建1个Series对象
语法:s=pd.Series(value,index)
参数:value:表示数据,支持数值、列表、字典等;index:表示索引(行标签)
Values:存放Series值的一个数组
index
数据类型
利用pandas模块处理数据
Series
1.创建1个Series对象
语法:s=pd.Series(values,index)
参数:value:表示数据,支持数值、列表、字典等;index:表示索引(行标签)
利用pandas模块处理数据
Series
2.如何查看Series对象中index、value属性值?
利用pandas模块处理数据
Series
3.如何查看、修改Series对象中的某个值
同学们!下课啦!
利用pandas模块处理数据
Dataframe
1.创建1个Dataframe对象-以相等长度的列表组成的字典形式创建
利用pandas模块处理数据
Dataframe
1.创建1个Dataframe对象-指定行索引
利用pandas模块处理数据
Dataframe
1.创建1个Dataframe对象-从excel文件读入二维数据表创建
语法:df=pd.read_excel(‘文件名.xlsx')
Index:dataframe的行索引
Values:存放值的二维数据
Columns:存放各列的列标题
import pandas as pd
df=pd.read_excel('test.xlsx')
print(df)
利用pandas模块处理数据
Dataframe
2.查看DataFrame的索引
利用pandas模块处理数据
Dataframe
3.查看DataFrame的列标题
利用pandas模块处理数据
Dataframe
4.查看DataFrame的值
利用pandas模块处理数据
Dataframe
5.将DataFrame的行、列转置
利用pandas模块处理数据
Dataframe
6.查看DataFrame中某一列的数据-通过属性检索列
利用pandas模块处理数据
Dataframe
6.查看DataFrame中某一列的数据-通过字典检索列
利用pandas模块处理数据
Dataframe
6.修改DataFrame中某一列的数据
通过字典修改:
dDf['姓名']=['a','b','c','d','e','f']
print(df)
DataFrame常用函数 函数 说明
count() 返回非空(NaN)数据项的数量;一般按列求;
sum() mean() max() min() 求和、求平均、求最大、求最小;一般按列求;
describe() 返回各列的基本描述统计值(计数、平均数、标注差、最大值、最小值及4分位差等)
groupby() 按列或行分组统计;一般按列求;
head() tail() 返回前n个、后n个数据记录;
drop() 按行列删除数据,通过axis=0/1确定行列;
append() 在末尾添加1行或多行数据;
insert() 在指定位置插入1列;
rename() 修改列标签或行索引;
sort_values() 排序,通过axis=0/1确定行列;
set_value() 根据行标签和列标签设置单个值
plot() 绘图
课堂练习
1.有Python程序段如下:
import pandas as pd
ser = pd.Series([1,3,5,7])
print(ser.index)
该程序段运行后输出结果为( )
A
利用pandas模块处理数据
Series
1.创建1个Series结构类型
语法:s=pd.Series(data,index)
参数:data:表示数据,支持数值、列表、字典等;index:表示索引(行标签)
利用pandas模块处理数据
Series
利用pandas模块处理数据
利用pandas模块处理数据
Dataframe
2.查看DataFrame的索引-通过属性检索,查看列数据
第一步:抽象与建模
1. 提炼核心要素并加以确定或假设
(1)本问题的已知数据有什么?
(2)本问题的求解问题是什么?
粽子单价5元
顾客的消费金额S元
假定顾客购买粽子个数X
赠送咸鸭蛋个数N
第一步:抽象与建模
2. 用数学符号描述解决问题的计算模型
5*X X<10
5*X*0.95 10≤X<20
5*X*0.9 20≤X<40
5*X*0.85 X>40
顾客消费金额:S=
赠送咸鸭蛋个数:N= X 5
第二步:设计算法
处理数据的一般过程
输入数据
处理数据
输出
处理结果
第二步:设计算法
1. 使用何种算法控制结构来处理数据?
2. 如何细化算法?
分支结构
第二步:设计算法
2. 细化算法
输入买粽子的个数X
根据粽子的个数X,求出赠送的咸鸭蛋个数N
判断X是否大于等于10 ,是转到④,否则计算不打折S,转到⑥
判断X是否大于等于20 ,是转到⑤,否则计算九五折计算S,转到⑥
判断X是否大于等于40 ,是则八五折计算S,否则九折计算S,转到⑥
输出变量N和S的值
第三步:描述算法
课堂作业
闰年(Leap Year)是为了弥补因人为历法规定造成的年度天数与地球实际公转周期的时间差而设立的。补上时间差的年份为闰年。
判定公历闰年应遵循的一般规律为:四年一闰,百年不闰,四百年再闰。
请设计一个算法判断某一年是否是闰年?
课堂作业
课堂练习
1.有Python程序段如下:
import pandas as pd
ser = pd.Series([1,3,5,7])
print(ser.index)
该程序段运行后输出结果为( )
A