python处理指定xlsx文件排重第一列

次阅读

需求:python处理指定xlsx文件排重第一列

import pandas as pd

def remove_duplicates_in_excel(file_path):
    # 读取Excel文件
    df = pd.read_excel(file_path)

    # 记录删除前的行数
    original_row_count = df.shape[0]

    # 删除第一列中的重复项
    df.drop_duplicates(subset=df.columns[0], inplace=True)

    # 记录删除后的行数
    new_row_count = df.shape[0]

    # 覆盖原文件
    df.to_excel(file_path, index=False)

    # 打印结果
    print(f"原始行数: {original_row_count}, 删除重复后的行数: {new_row_count}")

# 使用示例
file_path = '你的文件路径'  # 替换为你的文件路径

remove_duplicates_in_excel(file_path)


相关文章:

版权声明:由yongbin2023-12-18 13:58:57发表,共计632字。
新手QQ群: 703975885,欢迎进群讨论 鲁班编程网