需求:python处理指定xlsx文件排重第一列
import pandas as pd def remove_duplicates_in_excel(file_path): # 读取Excel文件 df = pd.read_excel(file_path) # 记录删除前的行数 original_row_count = df.shape[0] # 删除第一列中的重复项 df.drop_duplicates(subset=df.columns[0], inplace=True) # 记录删除后的行数 new_row_count = df.shape[0] # 覆盖原文件 df.to_excel(file_path, index=False) # 打印结果 print(f"原始行数: {original_row_count}, 删除重复后的行数: {new_row_count}") # 使用示例 file_path = '你的文件路径' # 替换为你的文件路径 remove_duplicates_in_excel(file_path)