首页 > 文章列表 > python查找与排序算法实例代码分析

python查找与排序算法实例代码分析

Python
291 2023-05-16

python查找与排序算法实例代码分析

    查找

    二分查找

    二分搜索是一种在有序数组中查找某一特定元素的搜索算法。搜索过程从数组的中间元素开始,如果中间元素正好是要查找的元素,则搜索过程结束;如果某一特定元素大于或者小于中间元素,则在数组大于或小于中间元素的那一半中查找,而且跟开始一样从中间元素开始比较。如果在某一步骤数组为空,则代表找不到。这种搜索算法每一次比较都使搜索范围缩小一半。

    # 返回 x 在 arr 中的索引,如果不存在返回 -1
    
    def binarySearch (arr, l, r, x):
    
        # 基本判断
    
        if r >= l:
    
            mid = int(l + (r - l)/2)
    
            # 元素整好的中间位置
    
            if arr[mid] == x:
    
                return mid
    
            # 元素小于中间位置的元素,只需要再比较左边的元素
    
            elif arr[mid] > x:
    
                return binarySearch(arr, l, mid-1, x)
    
            # 元素大于中间位置的元素,只需要再比较右边的元素
    
            else:
    
                return binarySearch(arr, mid+1, r, x)
    
        else:
    
            # 不存在
    
            return -1
    
     
    
    # 测试数组
    
    arr = [ 2, 3, 4, 10, 40]
    
    x = int(input('请输入元素:'))
    
    # 函数调用
    
    result = binarySearch(arr, 0, len(arr)-1, x)
    
     
    
    if result != -1:
    
        print("元素在数组中的索引为 %d" % result)
    
    else:
    
        print("元素不在数组中")

    运行结果: 

    请输入元素:4

    元素在数组中的索引为 2

    请输入元素:5

    元素不在数组中

    线性查找

    线性查找:指按一定的顺序检查数组中每一个元素,直到找到所要寻找的特定值为止。 

    def search(arr, n, x):
    
        for i in range (0, n):
    
            if (arr[i] == x):
    
                return i
    
        return -1
    
     
    
    # 在数组 arr 中查找字符 D
    
    arr = [ 'A', 'B', 'C', 'D', 'E' ]
    
    x = input("请输入要查找的元素:")
    
    n = len(arr)
    
    result = search(arr, n, x)
    
    if(result == -1):
    
        print("元素不在数组中")
    
    else:
    
        print("元素在数组中的索引为", result)

     运行结果: 

    请输入要查找的元素:A

    元素在数组中的索引为 0

    请输入要查找的元素:a

    元素不在数组中

    排序 

    插入排序

     插入排序(Insertion Sort):是一种简单直观的排序算法。它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。

    def insertionSort(arr):
    
        for i in range(1, len(arr)):
    
            key = arr[i]
    
            j = i-1
    
            while j >= 0 and key < arr[j]:
    
                    arr[j+1] = arr[j]
    
                    j -= 1
    
            arr[j+1] = key
    
     
    
    arr = [12, 11, 13, 5, 6, 7, 9, 9, 17]
    
    insertionSort(arr)
    
    print("排序后的数组:")
    
    print(arr)

    运行结果:  

    排序后的数组:

    [5, 6, 7, 9, 9, 11, 12, 13, 17]

    当然也可以这样写,更简洁

    list1 = [12, 11, 13, 5, 6, 7, 9, 9, 17]
    
    for i in range(len(list1)-1, 0, -1):
    
        for j in range(0, i):
    
            if list1[i] < list1[j]:
    
                list1[i], list1[j] = list1[j], list1[i]
    
    print(list1)

    快速排序

     快速排序;使用分治法(Divide and conquer)策略来把一个序列(list)分为较小和较大的2个子序列,然后递归地排序两个子序列。

    步骤为:

    • 挑选基准值:从数列中挑出一个元素,称为"基准"(pivot);

    • 分割:重新排序数列,所有比基准值小的元素摆放在基准前面,所有比基准值大的元素摆在基准后面(与基准值相等的数可以到任何一边)。在这个分割结束之后,对基准值的排序就已经完成;

    • 递归排序子序列:递归地将小于基准值元素的子序列和大于基准值元素的子序列排序。

    递归到最底部的判断条件是数列的大小是零或一,此时该数列显然已经有序。

    选取基准值有数种具体方法,此选取方法对排序的时间性能有决定性影响。

    def partition(arr, low, high):
    
        i = (low-1)         # 最小元素索引
    
        pivot = arr[high]
    
     
    
        for j in range(low, high):
    
            # 当前元素小于或等于 pivot
    
            if arr[j] <= pivot:
    
                i = i+1
    
                arr[i], arr[j] = arr[j], arr[i]
    
     
    
        arr[i+1], arr[high] = arr[high], arr[i+1]
    
        return (i+1)
    
     
    
    # arr[] --> 排序数组
    
    # low  --> 起始索引
    
    # high  --> 结束索引
    
     
    
    # 快速排序函数
    
    def quickSort(arr, low, high):
    
        if low < high:
    
            pi = partition(arr, low, high)
    
            quickSort(arr, low, pi-1)
    
            quickSort(arr, pi+1, high)
    
        return arr
    
     
    
    arr = [10, 7, 8, 9, 1, 5]
    
    n = len(arr)
    
     
    
    print("排序后的数组:")
    
    print(quickSort(arr, 0, n-1))

     运行结果:   

    排序后的数组:

    [1, 5, 7, 8, 9, 10]

    选择排序

    选择排序(Selection sort):是一种简单直观的排序算法。它的工作原理如下。

    首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到所有元素均排序完毕。

    A = [64, 25, 12, 22, 11]
    
    for i in range(len(A)): 
    
        min_idx = i
    
        for j in range(i+1, len(A)):
    
            if A[min_idx] > A[j]:
    
                min_idx = j
    
     
    
        A[i], A[min_idx] = A[min_idx], A[i]
    
     
    
    print("排序后的数组:")
    
    print(A)

    运行结果:   

    排序后的数组:

    [11, 12, 22, 25, 64]

    冒泡排序

    冒泡排序(Bubble Sort):也是一种简单直观的排序算法。它重复地走访过要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢"浮"到数列的顶端。

    def bubbleSort(arr):
    
        n = len(arr)
    
        # 遍历所有数组元素
    
        for i in range(n):
    
            # Last i elements are already in place
    
            for j in range(0, n-i-1):
    
     
    
                if arr[j] > arr[j+1]:
    
                    arr[j], arr[j+1] = arr[j+1], arr[j]
    
        return arr
    
     
    
    arr = [64, 34, 25, 12, 22, 11, 90]
    
     
    
    print("排序后的数组:")
    
    print(bubbleSort(arr))

    运行结果:   

    排序后的数组:

    [11, 12, 22, 25, 34, 64, 90]

    归并排序

    归并排序(Merge sort,或mergesort):,是创建在归并操作上的一种有效的排序算法。该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。

    分治法:

    • 分割:递归地把当前序列平均分割成两半。

    • 集成:在保持元素顺序的同时将上一步得到的子序列集成到一起(归并)。

    def merge(arr, l, m, r):
    
        n1 = m - l + 1
    
        n2 = r - m
    
     
    
        # 创建临时数组
    
        L = [0] * (n1)
    
        R = [0] * (n2)
    
     
    
        # 拷贝数据到临时数组 arrays L[] 和 R[]
    
        for i in range(0, n1):
    
            L[i] = arr[l + i]
    
     
    
        for j in range(0, n2):
    
            R[j] = arr[m + 1 + j]
    
     
    
        # 归并临时数组到 arr[l..r]
    
        i = 0     # 初始化第一个子数组的索引
    
        j = 0     # 初始化第二个子数组的索引
    
        k = l     # 初始归并子数组的索引
    
     
    
        while i < n1 and j < n2:
    
            if L[i] <= R[j]:
    
                arr[k] = L[i]
    
                i += 1
    
            else:
    
                arr[k] = R[j]
    
                j += 1
    
            k += 1
    
     
    
        # 拷贝 L[] 的保留元素
    
        while i < n1:
    
            arr[k] = L[i]
    
            i += 1
    
            k += 1
    
     
    
        # 拷贝 R[] 的保留元素
    
        while j < n2:
    
            arr[k] = R[j]
    
            j += 1
    
            k += 1
    
     
    
    def mergeSort(arr, l, r):
    
        if l < r:
    
            m = int((l+(r-1))/2)
    
            mergeSort(arr, l, m)
    
            mergeSort(arr, m+1, r)
    
            merge(arr, l, m, r)
    
        return arr
    
     
    
    print ("给定的数组")
    
    arr = [12, 11, 13, 5, 6, 7, 13]
    
    print(arr)
    
    n = len(arr)
    
    mergeSort(arr, 0, n-1)
    
    print("排序后的数组")
    
    print(arr)

    运行结果:   

    给定的数组

    [12, 11, 13, 5, 6, 7, 13]

    排序后的数组

    [5, 6, 7, 11, 12, 13, 13]

    堆排序

    堆排序(Heapsort):是指利用堆这种数据结构所设计的一种排序算法。堆积是一个近似完全二叉树的结构,并同时满足堆积的性质:即子结点的键值或索引总是小于(或者大于)它的父节点。堆排序可以说是一种利用堆的概念来排序的选择排序。

    def heapify(arr, n, i):
    
        largest = i
    
        l = 2 * i + 1     # left = 2*i + 1
    
        r = 2 * i + 2     # right = 2*i + 2
    
        if l < n and arr[i] < arr[l]:
    
            largest = l
    
        if r < n and arr[largest] < arr[r]:
    
            largest = r
    
        if largest != i:
    
            arr[i], arr[largest] = arr[largest], arr[i]  # 交换
    
    def heapSort(arr):
    
        n = len(arr)
    
        # Build a maxheap.
    
        for i in range(n, -1, -1):
    
            heapify(arr, n, i)
    
        # 一个个交换元素
    
        for i in range(n-1, 0, -1):
    
            arr[i], arr[0] = arr[0], arr[i]   # 交换
    
            heapify(arr, i, 0)
    
        return arr
    
    arr = [12, 11, 13, 5, 6, 7, 13, 18]
    
    heapSort(arr)
    
    print("排序后的数组")
    
    print(heapSort(arr))

    运行结果:   

    排序后的数组

    [5, 6, 7, 12, 11, 13, 13, 18]

    计数排序

    计数排序:的核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数。

    def countSort(arr):
    
        output = [0 for i in range(256)]
    
        count = [0 for i in range(256)]
    
        ans = ["" for _ in arr]
    
        for i in arr:
    
            count[ord(i)] += 1
    
        for i in range(256):
    
            count[i] += count[i-1] 
    
        for i in range(len(arr)):
    
            output[count[ord(arr[i])]-1] = arr[i]
    
            count[ord(arr[i])] -= 1
    
        for i in range(len(arr)):
    
            ans[i] = output[i]
    
        return ans
    
    arr = "wwwnowcodercom"
    
    ans = countSort(arr)
    
    print("字符数组排序 %s" %("".join(ans)))

    运行结果:   

    字符数组排序 ccdemnooorwwww

    希尔排序

    希尔排序:也称递减增量排序算法,是插入排序的一种更高效的改进版本。但希尔排序是非稳定排序算法。

     希尔排序的基本思想是:先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序,待整个序列中的记录"基本有序"时,再对全体记录进行依次直接插入排序。

    def shellSort(arr):
    
        n = len(arr)
    
        gap = int(n/2)
    
     
    
        while gap > 0:
    
            for i in range(gap, n):
    
                temp = arr[i]
    
                j = i
    
                while j >= gap and arr[j-gap] > temp:
    
                    arr[j] = arr[j-gap]
    
                    j -= gap
    
                arr[j] = temp
    
            gap = int(gap/2)
    
        return arr
    
     
    
    arr = [12, 34, 54, 2, 3, 2, 5]
    
     
    
    print("排序前:")
    
    print(arr)
    
    print("排序后:")
    
    print(shellSort(arr))

    运行结果:   

    排序前:

    [12, 34, 54, 2, 3, 2, 5]

    排序后:

    [2, 2, 3, 5, 12, 34, 54]

    拓扑排序

    对一个有向无环图(Directed Acyclic Graph简称DAG)G进行拓扑排序,是将G中所有顶点排成一个线性序列,使得图中任意一对顶点u和v,若边(u,v)&isin;E(G),则u在线性序列中出现在v之前。通常,这样的线性序列称为满足拓扑次序(Topological Order)的序列,简称拓扑序列。简单的说,由某个集合上的一个偏序得到该集合上的一个全序,这个操作称之为拓扑排序。

    在图论中,由一个有向无环图的顶点组成的序列,当且仅当满足下列条件时,称为该图的一个拓扑排序(英语:Topological sorting):

    每个顶点出现且只出现一次;若A在序列中排在B的前面,则在图中不存在从B到A的路径。

    from collections import defaultdict
    
    class Graph:
    
        def __init__(self, vertices):
    
            self.graph = defaultdict(list)
    
            self.V = vertices
    
        def addEdge(self, u, v):
    
            self.graph[u].append(v)
    
        def topologicalSortUtil(self, v, visited, stack):
    
     
    
            visited[v] = True
    
     
    
            for i in self.graph[v]:
    
                if visited[i] == False:
    
                    self.topologicalSortUtil(i, visited, stack)
    
            stack.insert(0,v)
    
        def topologicalSort(self):
    
            visited = [False]*self.V
    
            stack = []
    
            for i in range(self.V):
    
                if visited[i] == False:
    
                    self.topologicalSortUtil(i, visited, stack)
    
            print(stack)
    
    g= Graph(6)
    
    g.addEdge(5, 2)
    
    g.addEdge(5, 0)
    
    g.addEdge(4, 0)
    
    g.addEdge(4, 1)
    
    g.addEdge(2, 3)
    
    g.addEdge(3, 1)
    
    print("拓扑排序结果:")
    
    g.topologicalSort()

    运行结果:   

    拓扑排序结果:

    [5, 4, 2, 3, 1, 0]