浙教版(2019)信息技术新教材一轮复习课件(共26张PPT)——pandas复习

文档属性

名称 浙教版(2019)信息技术新教材一轮复习课件(共26张PPT)——pandas复习
格式 pptx
文件大小 13.5MB
资源类型 教案
版本资源 浙教版(2019)
科目 信息技术(信息科技)
更新时间 2023-01-13 09:10:38

图片预览

文档简介

(共26张PPT)
Pandas 复习
Series+DataFrame
数据结构 维度 组成部分 属性
Series 一维 由一个数组的数据(values)和一个与数据关联的索引(index) index、values
DataFrame
二维
由1个索引列(index)和若干个数据列组成
index、columns、values、T
Pandas模块——Series+DataFrame对象
Series

s2.groupby()
import pandas as pd
data1={"姓名":"新中","语文":123,"数学":128, "英语":142}
s1=pd.Series(data1)
print(s1)
print(s1.index)
print(s1.values)
print(s1.columns)
列表
s1.index[2]
s1.values[:2] / s1[2]
s1.values.head(2)
s2.values.min()
data2=[123,128,142]
s2=pd.Series(data2)
print(s2)
print(s2.index)
print(s2.values)
print(s2.columns)
s2.sort_values()
C
D
C
DataFrame

import pandas as pd
data={'学号':[1,2,3,4,5,6],
'姓名':['彭小亿','刘佳婷','张三','张元斌','齐铭','陈小红'],
'英语':[132,122,111,104,121,104],
'政治':[81,82,84,76,82,85],
'技术':[91,88,81,97,94,82],
'总分':[304,292,276,277,297,271]}
s=pd.DataFrame(data)
print(s)
print(s.index)
print(s.columns)
print(s.values)
print(s.T)
列表
s.index[2] /s.columns[2]
s.values[:2] / s.values[2]
s.values.head(2) /s.tail(2)
import pandas as pd
data={'学号':[1,2,3,4,5,6],
'姓名':['彭小亿','刘佳婷','张三','张元斌','齐铭','陈小红'],
'英语':[132,122,111,104,121,104],
'政治':[81,82,84,76,82,85],
'技术':[91,88,81,97,94,82],
'总分':[304,292,276,277,297,271]}
s=pd.DataFrame(data,
index=['no1','no2','no3','no4','no5','no6'])
print(s)
import pandas as pd
data={'学号':[1,2,3,4,5,6],
'姓名':['彭小亿','刘佳婷','张三','张元斌','齐铭','陈小红'],
'英语':[132,122,111,104,121,104],
'政治':[81,82,84,76,82,85],
'技术':[91,88,81,97,94,82],
'总分':[304,292,276,277,297,271]}
s=pd.DataFrame(data)
print(s.姓名)
print(s[["姓名","总分"]])
print(s.tail(2))
print(s[1:3])
print(s[2])
print(s[s.英语>120])
看列/看行/筛选
A
C
import pandas as pd
data={'学号':[1,2,3,4,5,6],
'姓名':['彭小亿','刘佳婷','张三','张元斌','齐铭','陈小红'],
'英语':[132,122,111,104,121,104],
'政治':[81,82,84,76,82,85],
'技术':[91,88,81,97,94,82],
'总分':[304,292,276,277,297,271]}
s=pd.DataFrame(data)
s.at[1,'姓名']='gai'
print(s)
看单元格
有如下python程序段:
import pandas as pd
data={'姓名':['杜牧',' 欧阳修','李白','杜甫 '],'借阅次数':[32,16,30,26]}
df1=pd.DataFrame(data,columns=['姓名','借阅次数'])
res=''
for i in range(4):
if df1.at[i,'借阅次数']>=30:
res+=df1.at[i,'姓名']
print(res)
B
C
题干:为了更好的检验教学效果,有9所学校一起组织了联考。信息技术的部分成绩截图如下图所示:
(1)将信息技术考试成绩分为A、B、C、D、E五个等级,用python的pandas模块分析并填写等级。请填空。
等级 分数范围
A >=40
B >=35
C >=30
D >=20
E 20分以下
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams["font.sans-serif"]=["SimHei"] #中文显示
df=pd.read_excel("各学校信息技术成绩.xlsx")
df[“等第”]=“E” #添加一个名为”等第”并将列数据初始化为E
n=len(df)
for i in range(n):
if df["总分"][i]>=40:
df.at[i,"等第"]="A"
elif df["总分"][i]>=35:
df.at[i,"等第"]="B"
elif df["总分"][i]>=30:
df.at[i,"等第"]="C"
elif df["总分"][i]>=20:
df.at[i,"等第"]="D"
df.to_excel("写好等第后的信息技术成绩.xlsx")
(2)统计每个学等第A和等第B的人数并用以下图表表示,请填空或改错。
(2)统计每个学等第A和等第B的人数并用以下图表表示,请填空或改错。
df1=df[(df.等第=="A") | (df.等第=="B")]
g=df1.groupby("学校",as_index=False).等第.count()
x,y=g.学校,g.等第
plt.bar(x,y,label="A和B")
plt.legend()
plt.title("各学校学考等第为A和B的人数对比图")
plt.show()
综合练习




同课章节目录