首页　>　文章列表　>　如何高效合并两个DataFrame：基于索引的巧妙方法？

如何高效合并两个DataFrame：基于索引的巧妙方法？

254 2025-04-23

Pandas高效合并DataFrame：基于索引的优化策略

数据处理中，合并多个DataFrame是常见操作。本文介绍一种高效方法，实现基于日期和名称匹配，将一个DataFrame的数据添加到另一个DataFrame的新列中。

问题背景：

假设有两个DataFrame：df1和df2。df1包含日期（date）和名称（name）列以及其他数据。df2的列名与df1的date列相同，行名与df1的name列相同。目标是根据日期和名称将df2的数据匹配到df1，并在df1中添加名为“result”的新列存储匹配数据。避免低效的循环遍历，需要更优方案。

高效解决方案：

Pandas的join函数结合索引操作，可实现高效匹配。代码如下：

(
    df1.set_index(['date', 'name'])
    .join(
        df2.stack()
        .rename_axis(index=['date', 'name'])
        .rename('result')
    )
)

代码首先将df1的'date'和'name'列设为索引，方便连接。然后，stack()函数将df2转换为Series，创建多层索引（'date'和'name'）。rename_axis重命名索引，rename为Series命名为'result'。最后，join函数连接处理后的df2和df1，将匹配数据添加到df1的'result'列。此方法利用Pandas的向量化运算，避免循环，显著提高效率，尤其在大数据集处理中。

来源：1741143659

上一篇　0.01BNB即可参与币安投票上币：九大Meme币首选下一篇　Python中选择结构是什么