• 计数排序(Counting Sort)


    计数排序(Counting Sort)

    一、基本思想

    计数排序不是基于比较的排序算法,其核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。 作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数。它的基本思想是:给定的输入序列中的每一个元素 x x x,确定该序列中值小于等于 x x x 元素的个数,然后将 x x x 直接存放到最终的排序序列的正确位置上。

    二、实现逻辑

    由于用来计数的数组count的长度取决于待排序数组中数据的范围(等于待排序数组的最大值与最小值的差加上1),这使得计数排序对于数据范围很大的数组,需要大量时间和内存。计数排序是用来排序0到100之间的数字的最好的算法,但是它不适合按字母顺序排序人名。

    算法步骤:

    1. 找出待排序的数组种最大和最小的元素;
    2. 统计数组中每个值为 i i i 的元素出现的次数,存入数组count的第 i i i 项;
    3. 对所有的计数累加(从count中的第一个元素开始,每一项和前一项相加),为了直接求得元素的位置;
    4. 反向填充目标数组:将每个元素 i i i 放在新数组的第count[i]项,每放一个元素就将count[i]减去1。

    三、时间复杂度的分析

    遍历数组进行计数操作产生了 Ω ( n ) \Omega(n) Ω(n) O ( n ) O(n) O(n) Θ ( n ) \Theta(n) Θ(n)的时间复杂度,对计数数组进行前缀和操作产生了 Ω ( k ) \Omega(k) Ω(k) O ( k ) O(k) O(k) Θ ( k ) \Theta(k) Θ(k)的时间复杂度,进行反向填充操作同样产生了 Ω ( n ) \Omega(n) Ω(n) O ( n ) O(n) O(n) Θ ( n ) \Theta(n) Θ(n)的时间复杂度。综上所述: Ω ( n + k ) \Omega(n+k) Ω(n+k) O ( n + k ) O(n+k) O(n+k) Θ ( n + k ) \Theta(n+k) Θ(n+k) n n n 前常数可以忽略。

    四、空间复杂度的分析

    由于额外开辟了大小为k = max(array) - min(array) + 1的数组,所以空间复杂度为: O ( k ) O(k) O(k)。在算法实现中开辟了另外一个用于存储记录的列表result

    五、算法实现

    while循环

    def counting_sort(array: List[int], reverse: bool=False) -> None:
        '''
        array: 仅支持全为整数类型的数据。
        reverse: 是否降序, 默认采用升序。
        '''
        if not array:
            return None
        arrmin = min(array)
        arrmax = max(array)
        count = [0] * (arrmax - arrmin + 1)
        for value in array:
            count[value - arrmin] += 1
        pos = len(array) - 1 if reverse else 0 # 游标
        for index in range(arrmin, arrmax + 1): # 从最小的数开始
            amount = count[index - arrmin]
            while amount >= 1:
                array[pos] = index
                amount -= 1
                pos = pos - 1 if reverse else pos + 1
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19

    enumerate函数

    def counting_sort(array: List[int], reverse: bool=False) -> None:
        '''
        array: 仅支持全为整数类型的数据。
        reverse: 是否降序, 默认采用升序。
        '''
        if not array:
            return None
        arrmin = min(array)
        arrmax = max(array)
        count = [0] * (arrmax - arrmin + 1)
        for value in array:
            count[value - arrmin] += 1
        array.clear()
        for index, val in enumerate(count):
            for _ in range(val):
                _ = array.insert(0, index + arrmin) if reverse else array.append(index + arrmin)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16

    反向填充

    反向填充是为了维持排序算法的稳定性:

    def counting_sort(array: List[int], reverse: bool=False) -> List[int]:
        '''
        array: 仅支持全为整数类型的数据。
        reverse: 是否降序, 默认采用升序。
        '''
        if not array:
            return array
        arrmin = min(array)
        arrmax = max(array)
        length = len(array)
        count = [0] * (arrmax - arrmin + 1)
        result = [0] * length
        for value in array:
            count[value - arrmin] += 1
        for index in range(1, arrmax - arrmin + 1):
            count[index] += count[index - 1]
        for index in range(len(array) - 1, -1, -1):
            pos = count[array[index] - arrmin]
            result[length - pos if reverse else pos - 1] = array[index]
            pos -= 1
        return result
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
  • 相关阅读:
    甘特图的这些新玩法,你都知道吗?
    2023年中国智能电视柜产量、需求量、市场规模及行业价格走势[图]
    运维的进阶:用它解决90%以上问题
    【Java面经】阿里三面被挂、幸获内推,历经5轮终于拿到口碑offer
    1.软件测试基础
    C语言中自定义类型讲解
    Python自动化部署与配置管理:Ansible与Docker
    yum 安装的 nginx 添加自定义模块后重新编译安装
    2023高教社杯数学建模国赛题目这样选择
    Tomcat
  • 原文地址:https://blog.csdn.net/linjing_zyq/article/details/126149010