原始文件如下图所示,第一列为学生姓名,后面三列为各科考试成绩。
需求:
- 增加一列计算输出三门课程的平均值
- 增加一列计算输出三门课程的总分
- 增加一列按总分计算输出成绩排名
- 增加一列按总分设定等级
- 最后再增加一列是否及格
本节课用到的知识点如下:
- Pandas读取excel方法
- Numpy的select方法:根据某些条件筛选数据
- round()函数:四舍五入到特定的小数点位数
- sort_values()排序函数:ascending默认是True,上升排序,False则为降序排列
- rank()函数:用于计算数值列表中的排名
- astype()类型转换函数
开始撸代码:
import pandas as pd
import numpy as np
import os
# 指定文件读取的目录
os.chdir(r'C:\Users\jtian\Desktop\Phthon\If function with Python')
data = pd.read_excel("scores.xlsx")
print(data)
data["平均分"] = data.mean(axis=1).round(1)
data["总分"] = data.sum(axis=1).round(1)
data["成绩排名"] = data.总分.rank(method="min", ascending=False).astype(int)
print(data)
可以看到通过rank函数,已经按照总分做了对应的成绩排名,但是总分这列这样看起来不太舒服,我们可以再通过sort_values()做调整。
data.sort_values("总分", ascending=False, inplace=True)
data["成绩排名"] = data.总分.rank(method="min", ascending=False).astype(int)
print(data)
通过sort_values(),成绩排名这列从第一名开始往后排,现在应该比较符合常规的阅读习惯。
设置条件
condition = [
(data["平均分"] >= 95),
(data["平均分"] < 95) & (data["平均分"] >= 90),
(data["平均分"] < 90) & (data["平均分"] >= 70),
(data["平均分"] < 70) & (data["平均分"] >= 60),
(data["平均分"] < 60)]
results = ["A+", "A", "B", "C", "D"]
data["等级"] = np.select(condition, results)
data["Pass/Fail"] = ["Pass" if x > 60 else "Fail" for x in data["平均分"]]
print(data)
print(data.to_excel("考试统计结果.xlsx", index=None))
最终结果输出:
完整代码:
本文暂时没有评论,来添加一个吧(●'◡'●)