NumPy高效排序:按列排序详解
在数据分析中,对NumPy数组进行排序是常见操作。本文介绍如何利用NumPy库高效地对ndarray对象进行基于列的排序,特别是按指定列进行升序排序的方法。
假设有一个包含两列数据的NumPy数组,需要根据第二列的值进行升序排序。原始数组如下:
[[1577 2182]
[1812 2181]
[1813 2283]
[1578 2285]]
排序后的预期结果:
[
[1812 2181]
[1577 2182]
[1813 2283]
[1578 2285]
]
NumPy的argsort()
函数是实现此目标的关键。argsort()
函数返回排序后的数组索引,而非排序后的数组本身。结合argsort()
函数和数组索引,即可轻松实现按列排序。
以下代码演示了如何使用argsort()
函数按第二列进行升序排序:
import numpy as np arr = np.array([[1577, 2182], [1812, 2181], [1813, 2283], [1578, 2285]]) sorted_arr = arr[np.argsort(arr[:, 1])] print(sorted_arr)
代码中,arr[:, 1]
选择数组的第二列,np.argsort(arr[:, 1])
返回第二列升序排序后的索引。然后,使用这些索引重新排列原始数组arr
,得到按第二列升序排序的结果sorted_arr
。 这种方法可以灵活地根据任何一列对多维数组进行排序。