日常办公中,我们经常需要处理大量文件,尤其涉及文件重命名时,效率至关重要。本文介绍如何利用Python将以身份证号命名的文件批量重命名为以姓名命名的文件,并优化代码以提高效率和可靠性。
假设您有一批以身份证号命名的文件,以及一个包含身份证号和姓名映射的Excel表格(例如data.xls
)。初始代码尝试直接从Excel中查找对应姓名,但效率和鲁棒性有待提高:
import os import pandas as pd df = pd.read_excel("data.xls") id_list = os.listdir("./") for id_file in id_list: id_num = id_file[:id_file.find(".")] ext = id_file[id_file.find("."):] name = df[df["身份证号"] == id_num].姓名.values if len(name) > 0: new_name = name[0] + ext os.rename(id_file, new_name) print("重命名完成")
此代码存在效率问题,因为它对每个文件都进行一次完整的Excel数据查找。以下为优化后的代码,显著提升效率:
import os import pandas as pd df = pd.read_excel("data.xls", dtype={"身份证号": str}) # 保证身份证号列为字符串类型 name_map = {str(row[0]): row[1] for row in df.values} # 创建身份证号到姓名的映射字典 id_list = os.listdir("./") for id_file in id_list: id_num = id_file[:id_file.find(".")] ext = id_file[id_file.find("."):] if id_num in name_map: new_name = name_map[id_num] + ext print(f"重命名: {id_file} -> {new_name}") os.rename(id_file, new_name) print("重命名完成")
优化后的代码首先将Excel数据转换为字典,建立身份证号与姓名的键值对映射。这样,查找对应姓名的时间复杂度从O(n)降为O(1),极大提高了效率。此外,代码增加了数据类型转换,确保身份证号匹配的准确性。 每次重命名操作都会打印日志,方便追踪和调试。 这个改进后的版本更健壮,处理速度更快,更适合处理大量文件。
苹果芯片加持下PyTorch如何利用GPU和NPU?
NumPy保存和加载数据时如何处理None值?
遇到Python读取Excel测试用例时出现“list index out of range”错误,可以按照以下步骤解决:检查Excel文件内容:确保Excel文件中的数据完整且格式正确。错误常见于尝试访问不存在的列表索引,因此确认每一行都有足够的数据。查看代码逻辑:检查读取Excel文件的代码,特别是涉及到列表索引的部分。确保你访问的索引在列表的有效范围内。例如,如果列表长度为5,索引只能从0到4。调试代码:在可能出错的地方添加打印语句或使用调试器,查看变量的值和列表的长度,确保你在正确的位置访问正确的
微信扫码后小窗口变空白?解决方法在这里!
TCP端口占用:服务端程序退出后,端口为何依然被占用且如何解决?
初学者 Python 项目:使用 OpenCV 和 Mediapipe 构建增强现实绘图应用程序