数据处理与应用大单元
——编程处理数据pandas模块巩固练习
班级 姓名
1.某DataFrame对象df共包含6个数据列、30个数据行,其中第5列为“总分”列,下列语句中能读取df对象中“总分”列所有数据的代码是( D )
A.df.[总分] B.df.columns[4] C.df. "总分" D.df.总分
2.某DataFrame对象df共包含6个数据列、30个数据行,其中第5列为“总分”列,下列语句中能读取df对象中第3行到第5行(列标题所在行不算)的所有数据的代码是( C )
A.df.[2:5] B.df[2:5] C.df[2:6] D.df[2,6]
3.将DataFrame对象df第3行“品牌”列的值修改为“OPPO”,程序代码是( A )
A.df.at[2,"品牌"]="OPPO" B.df.at[3,品牌]="OPPO"
C.df.at[3,"品牌"]="OPPO" D.df.品牌="OPPO"
4.某DataFrame对象df,包含“准考证号”、“姓名”、“学校”、“语文”、“数学”等数据列,下列语句中,可以以学校为单位,统计各校学生“数学”成绩平均值的代码是( A )
A.df.groupby("学校").数学.mean()
B.df.groupby("数学").学校.mean()
C.df.groupby("数学").mean()
D.df.groupby("学校")[数学].mean()
5. excel文件"xscj1.csv"中数据包含"xm","xh","yw","sx"等字段,有若干个数据行,下列程序段执行后,对象 df_data中的数据将( A )
import pandas as pd
df_data=pd.read_csv("xscj1.csv")
df_data.drop("yw",axis=1)
df_data.drop(0)
df_data.sort_values("sx",inplace=True)
A.按"sx"升序排序 B.不再包含"yw"数据列
C.删除了第一行记录 D增加了一个数据行
6.用 Python创建了一个DataFrame对象df1:
import pandas as pd
data=[[88,89,96],[95,93,92],[90,87,95]]
df1=pd.DataFrame(data,index=["小明", "小红","小兰"],columns=["语文","数学","英语"])
下列操作及描述不正确的是( C )
A.print(df1["英语"])输出英语列的数据
B.print(df1.数学)输出数学列的数据
C.print(df1.sort_values("语文",axis=1))输出语文列数据升序排序
D.print(df1[df1.语文<90])输出的是小明同学的成绩
7.某校高二年级技术考试的数据保存在文件“cj.xlsx”中(如图所示)。用python对其进行处理的代码如下:
import pandas as pd
df=pd.read_excel("cj.xlsx")
df.append({"考号":"0425","学号":"31","姓名":"伊默","班级":"214","信息":44},ignore_index=True)
df.drop(0,axis=0)
del df["学号"]
g=df.groupby("班级",as_index=False).mean()
sv=g.sort_values("信息",ascending=True)
print(sv.head(3)["信息"])
执行该代码,下列说法正确的是( C )
A.df对象新增了一条关于“伊默”的记录
B.df对象删除了一条关于“倪家颀”的记录
C.df对象减少了“学号”列数据
D.输出“信息”平均分最高的三个班级
8.有如下程序代码:
import pandas as pd
df1=pd.DataFrame([10],columns=["A"])
df2=pd.DataFrame([20],columns=["A"])
df3=pd.DataFrame(data=[30,40],columns=["B"])
df1.append(df2)
df=df1.append(df3,ignore_index=True)
print(df)
执行程序后,输出的结果为( A )
9.有如下程序代码:
import pandas as pd
df1=pd.DataFrame([10],columns=['A'])
df2=pd.DataFrame([20],columns=['A'])
df3=pd.DataFrame(data=[30,40],columns=['B'])
df1=df1.append(df2)
df=df1.append(df3,ignore_index=True)
print(df)
执行程序后,输出的结果为( D )
10.有如下程序代码:
import pandas as pd
data={'姓名':[ '李商隐','欧阳修','李白', '杜甫'],'借阅次数': [ 32,16,30,26]}
df1=pd.DataFrame (data, columns=['姓名','借阅次数'])
c = 0
for i in range (len(df1 ['姓名'])):
if df1.at[i,'姓名'][0]== '李':
c+ = df1.at[i,'借阅次数']
print(c)
该程序运行后,输出的内容为( D )
A.46 B. 48 C.58 D.62
11.小李收集了某市各噶种7选3选课数据存储在“各学校7选3选课情况.xlsx”中,其数据格式如图所示,学科列下的“1”表示相应行的学生选了该学科,“0”表示未选。
小李编写了如下程序,实现输出选考技术人数最多的3个学校的功能。
import pandas as pd
df=pd.read_excel("各学校7选3选课情况.xlsx")
s=df.groupby("学校").技术. ①
df=pd.DataFrame({"学校":s.index,"选技术人数":s.values})
df.sort_values('选技术人数', ② ,inplace=True)
print(df.③ )
划线处的代码应填( D )
A.①count() ②ascending=False ③tail(3)
B.①sum() ②ascending=True ③head(3)
C.①count() ②ascending=True ③tail(3)
D.①sum() ②ascending=False ③head(3)
12.App 活跃人数存储在″app.xlsx″文件中,如下图所示,现要编程进行统计结果,请回答下列问题:
若要把″app.xlsx″第 1 张工作表中的信息导入到 book1 对象中,并进行统计,实现这个功能的 python
代码如下,将程序划线处填入合适的代码。
import pandas as pd
(1)book1=__ pd.read_excel("app.xlsx")__ #读取 app.xlsx 文件数据,并存储在 book1 对象中
(2)book1_sum=___book1.10月人数.sum()__ #计算 10月人数之和
(3)book1_aver=_book1["11月人数"].mean() #计算 11月人数平均值
(4)book1_g=__ book1.groupby(by="应用领域")___ #按应用领域分组统计
(5)book1_sort=__book1.sort_values("11月人数",ascending=False)___ #按 11月人数值,降序排序
print(″10月人数之和:″,book1_sum)
print(″11月人数平均值:″,book1_aver)
13.小李利用他所学习的知识帮助老师整理学习成绩单,如图所示,部分界面如图所示:
(1)为统计每个学生的技术成绩排名,选中 F2 单元格输入公式,然后利用自动填充完成 F2:F392 的数据计算,发现结果有误,请修改 F2 单元格的计算公式 =RANK(E2,E$2:E$392) / =RANK(E2, $E$2: $E$392)
(提示:RANK 函数用于计算某单元格中数据在某区域内的排名,如=RANK(G2,G2:G100),计算 G2 单元格中数据在 G2:G100 的排名)
(2)根据”chengji.xlsx” 中的数据,利用python计算出如图 b 的结果,并建立如图 c 所示的图表。
代码如下,请将空白处补充完整
图 b 图 c
import pandas as pd
import matplotlib.pyplot as plt
df=pd.read_excel("chengji.xlsx")
g=① df.groupby(_"班级",as_index=False) _ / df.groupby(by="班级",as_index=False)___
print(round(g.mean(),1))
a= g.mean().班级
②b= g.mean().技术总分____
plt.title("Average Score")
plt.plot (a,b)
plt.show()数据处理与应用大单元
——编程处理数据pandas模块巩固练习
班级 姓名
1.某DataFrame对象df共包含6个数据列、30个数据行,其中第5列为“总分”列,下列语句中能读取df对象中“总分”列所有数据的代码是( )
A.df.[总分] B.df.columns[4] C.df. "总分" D.df.总分
2.某DataFrame对象df共包含6个数据列、30个数据行,其中第5列为“总分”列,下列语句中能读取df对象中第3行到第5行(列标题所在行不算)的所有数据的代码是( )
A.df.[2:5] B.df[2:5] C.df[2:6] D.df[2,6]
3.将DataFrame对象df第3行“品牌”列的值修改为“OPPO”,程序代码是( )
A.df.at[2,"品牌"]="OPPO" B.df.at[3,品牌]="OPPO"
C.df.at[3,"品牌"]="OPPO" D.df.品牌="OPPO"
4.某DataFrame对象df,包含“准考证号”、“姓名”、“学校”、“语文”、“数学”等数据列,下列语句中,可以以学校为单位,统计各校学生“数学”成绩平均值的代码是( )
A.df.groupby("学校").数学.mean()
B.df.groupby("数学").学校.mean()
C.df.groupby("数学").mean()
D.df.groupby("学校")[数学].mean()
5. excel文件"xscj1.csv"中数据包含"xm","xh","yw","sx"等字段,有若干个数据行,下列程序段执行后,对象 df_data 中的数据将( )
import pandas as pd
df_data=pd.read_csv("xscj1.csv")
df_data.drop("yw",axis=1)
df_data.drop(0)
df_data.sort_values("sx",inplace=True)
A.按"sx"升序排序 B.不再包含"yw"数据列
C.删除了第一行记录 D增加了一个数据行
6.用 Python创建了一个DataFrame对象df1:
import pandas as pd
data=[[88,89,96],[95,93,92],[90,87,95]]
df1=pd.DataFrame(data,index=["小明", "小红","小兰"],columns=["语文","数学","英语"])
下列操作及描述不正确的是( )
A.print(df1["英语"])输出英语列的数据
B.print(df1.数学)输出数学列的数据
C.print(df1.sort_values("语文",axis=1))输出语文列数据升序排序
D.print(df1[df1.语文<90])输出的是小明同学的成绩
7.某校高二年级技术考试的数据保存在文件“cj.xlsx”中(如图所示)。用python对其进行处理的代码如下:
import pandas as pd
df=pd.read_excel("cj.xlsx")
df.append({"考号":"0425","学号":"31","姓名":"伊默","班级":"214","信息":44},ignore_index=True)
df.drop(0,axis=0)
del df["学号"]
g=df.groupby("班级",as_index=False).mean()
sv=g.sort_values("信息",ascending=True)
print(sv.head(3)["信息"])
执行该代码,下列说法正确的是( )
A.df对象新增了一条关于“伊默”的记录
B.df对象删除了一条关于“倪家颀”的记录
C.df对象减少了“学号”列数据
D.输出“信息”平均分最高的三个班级
8.有如下程序代码:
import pandas as pd
df1=pd.DataFrame([10],columns=["A"])
df2=pd.DataFrame([20],columns=["A"])
df3=pd.DataFrame(data=[30,40],columns=["B"])
df1.append(df2)
df=df1.append(df3,ignore_index=True)
print(df)
执行程序后,输出的结果为( )
9.有如下程序代码:
import pandas as pd
df1=pd.DataFrame([10],columns=['A'])
df2=pd.DataFrame([20],columns=['A'])
df3=pd.DataFrame(data=[30,40],columns=['B'])
df1=df1.append(df2)
df=df1.append(df3,ignore_index=True)
print(df)
执行程序后,输出的结果为( )
10.有如下程序代码:
import pandas as pd
data={'姓名':[ '李商隐','欧阳修','李白','杜甫'],'借阅次数': [ 32,16,30,26]}
df1=pd.DataFrame (data, columns=['姓名','借阅次数'])
c = 0
for i in range (len(df1 ['姓名'])):
if df1.at[i,'姓名'][0]=='李':
c+= df1.at[i,'借阅次数']
print(c)
该程序运行后,输出的内容为( )
A、46 B、48 C、58 D、62
11.小李收集了某市各噶种7选3选课数据存储在“各学校7选3选课情况.xlsx”中,其数据格式如图所示,学科列下的“1”表示相应行的学生选了该学科,“0”表示未选。
小李编写了如下程序,实现输出选考技术人数最多的3个学校的功能。
import pandas as pd
df=pd.read_excel("各学校7选3选课情况.xlsx")
s=df.groupby("学校").技术. ①
df=pd.DataFrame({"学校":s.index,"选技术人数":s.values})
df.sort_values('选技术人数', ② ,inplace=True)
print(df.③ )
划线处的代码应填( )
A.①count() ②ascending=False ③tail(3)
B.①sum() ②ascending=True ③head(3)
C.①count() ②ascending=True ③tail(3)
D.①sum() ②ascending=False ③head(3)
12.App 活跃人数存储在″app.xlsx″文件中,如下图所示,现要编程进行统计结果,请回答下列问题:
若要把″app.xlsx″第 1 张工作表中的信息导入到 book1 对象中,并进行统计,实现这个功能的 python
代码如下,将程序划线处填入合适的代码。
import pandas as pd
(1)book1=_______________ #读取 app.xlsx 文件数据,并存储在 book1 对象中
(2)book1_sum=___________ #计算 10 月人数之和
(3)book1_aver=___________ #计算 11 月人数平均值
(4)book1_g=________________ #按应用领域分组统计
(5)book1_sort=___________ __ #按 11 月人数值,降序排序
print(″10 月人数之和:″,book1_sum)
print(″11 月人数平均值:″,book1_aver)
13.小李利用他所学习的知识帮助老师整理学习成绩单,如图所示,部分界面如图所示:
(1)为统计每个学生的技术成绩排名,选中 F2 单元格输入公式,然后利用自动填充完成 F2:F392 的数据计算,发现结果有误,请修改 F2 单元格的计算公式
(提示:RANK 函数用于计算某单元格中数据在某区域内的排名,如=RANK(G2,G2:G100),计算 G2 单元格中数据在 G2:G100 的排名)
(2)根据”chengji.xlsx” 中的数据,利用python计算出如图 b 的结果,并建立如图 c 所示的图表。
代码如下,请将空白处补充完整
图 b 图 c
import pandas as pd
import matplotlib.pyplot as plt
df=pd.read_excel("chengji.xlsx")
g=①_________ _
print(round(g.mean(),1))
a= g.mean().班级
②_____ ___ __
plt.title("Average Score")
plt.plot (a,b)
plt.show()