• Array and Set work process



    从单词来看,
    Array 很好理解一批一批的意思;

    Set 含义比较多,常见有放、集合、一套...;
    image

    从字面来记忆它们的区别,Array就是一批一批的,Set是特意放入、采集进去的,所以Array不区分重复,Set区分重复。

    下面是是将《秒懂算法:用常识解读数据结构》第一章的内容拷贝来这里,做了一些编辑。

    Array work principle

    数组示例:
    array = ["apples", "bananas", "cucumbers", "dates", "elderberries"]

    术语:

    • 大小
      数组大小指的是数组能存放的数据元素的数量。因为上面这个购物清单数组能存储 5 个值,
      所以它的大小是 5。
    • 索引
      数组的索引可以用来标记数据在数组中的位置。
      大部分的编程语言里,索引都是从0开始。
      image

    数组的操作:
    CURD

    速度计量:
    衡量操作的速度也被称作衡量其时间复杂度。
    不同人会混用速度、时间复杂度、效率、性能以及运行时间这几个术语。一般来说,它们指的都是一个操作所需要的步骤数。

    分析Array操作步骤数

    read

    O(1):常数复杂度,表示无论输入规模如何增长,算法的执行时间都保持不变。
    

    PS:不管有多少数据,读取都是一个步骤。

    为什么?
    我们在在创建和使用数组的时候,只会关注数组的大小和索引,
    image

    但是数组在计算机的底层,它在操作的时候,还需要一个内存地址,下面展示数据、内存地址和索引的关系,
    image

    以上的图示,基本就能解释了为什么计算机只用 1 步就能找到数组的第一个值。计算机只要再做一个简单的加法,就能找到任意索引的值。

    如果让计算机寻找索引 3 的值,那么它只需在索引 0 的内存地址上加 3 即可。(毕竟内存地址是连续的。)

    find

    O(n):线性复杂度。表示算法的执行时间与输入规模成线性关系。
    

    还是以之前的数组为例。计算机无法立刻弄清每个格子的内容。对计算机来说,
    这个数组看起来就像下面示例这样。
    【?,?,?,?,?】
    比如说需要它去找dates这个数据,那么就步骤如下,
    会第0索引开始找dates这个数据,

    1. 第一次,没找到:
      【apples,?,?,?,?】
    2. 第二次,没找到:
      【apples,bananas,?,?,?】
    3. 第三次,没找到:
      【apples,bananas,cucumbers,?,?】
    4. 第四次,找到:
      【apples,bananas,cucumbers,dates,?】
    5. 退出

    insert

    需要明白的是在Array里,插入到数组的最后一列,和从中间插入是两种不同的操作。

    最后一列插入

    image

    一旦计算机算出了存储新值的内存地址,它只需要 1 步就能完成插入。
    下图展示了在数组末尾插入"figs"的过程。
    image

    so, O(1):常数复杂度,表示无论输入规模如何增长,算法的执行时间都保持不变。
    

    中间插入

    假设我们要在索引 2 处插入"figs"。先来看下图,
    为此,需要向右移动"cucumbers"、"dates"和 "elderberries"来给"figs"腾出空间。这
    个过程需要多步,因为需要先把"elderberries"向右移动一个格子,才能移动"dates"。然后,
    再移动"dates"来给"cucumbers"让位。
    image

    在这个例子中,插入需要 4 步,其中 3 步是数据右移,剩下 1 步是插入新值。

    向数组开头插入元素需要步数最多,也就是所谓的最坏情况。 这是因为要在数组开头插入元
    素,必须把其他所有值都右移一个格子。
    对包含 N 个元素的数组来说,最坏的情况下需要 N + 1 步插入。这是因为需要移动 N 个元
    素,然后才能执行插入操作。

    so, O(n+1):线性复杂度。表示算法的执行时间与输入规模成线性关系。
    

    delete

    删除指的是删去特定索引的值的过程。
    下面以删除购物清单数组索引 2 处的值为例。在这个数组中,这个值是"cucumbers"。
    image

    严格意义上来说,删除"cucumbers"只需 1 步。但有一个问题:数组中间有了一个空格子。
    中间有空格子的数组是无效的。

    要解决这个问题,需要把"dates"和"elderberries"左移。因此删除操作还需要额外步骤。
    image

    这个删除操作用了 3 步。1 步是删除元素,另外 2 步是移动元素来填补空格子。

    和插入一样,删除元素的最坏情况是删除数组中的第一个元素。因为索引 0 会变成空格子,
    所以必须把剩余的所有元素都左移。

    so, O(n+1):线性复杂度。表示算法的执行时间与输入规模成线性关系。
    

    Set work principle

    why is Set ?
    集合的定义是,集合中包含的元素不能重复。

    集合有多种类型,但本节只讨论基于数组的集合。这种集合和数组很相似,它们都是存储值
    的简单列表,二者的唯一区别在于,不能往集合中插入重复的值。

    假设已知集合["a", "b", "c"],而你想再添加一个"b"。因为"b"已经存在于集合中,所以计算机会拒绝这次操作。

    当需要确保数据不重复时,集合非常有用。
    

    Set的操作:
    CURD

    分析Set操作步骤数

    read

    集合的读取和数组的读取完全一致,即计算机检查特定索引处的值只需要 1 步。这是因为计
    算机能跳转到集合内的任意索引,而这只需简单地计算并跳转到其内存地址即可。

    find

    集合的查找也和数组的查找没什么区别,即查找集合中的值最多需要 N 步。集合和数组的
    删除操作也一模一样,即要删除一个值并移动其他数据来填空最多需要 N 步。

    insert

    集合的插入和数组的插入则不同。先来看看在集合末尾插入值。这对数组来说只需要 1 步,
    是最好的情况。

    但集合不同,计算机需要先判断这个值是否存在于集合中——因为集合的规则是不允许插入
    重复数据。

    计算机要如何确保新数据不在集合中呢?

    • 计算机一开始并不知道数组或者集合的格子中都存储了什么值。

    • 因此,它必须先在集合中查找,才能知道要插入的值是否已经存在。只有集合中不存在这个新值的时候,计算机才能继续执行插入操作。(所以,所有的插入操作都需要先进行查找。)

    来看一个例子。假设之前提到的购物清单是用集合存储的。这个假设很合理,因为我们不想
    重复购物。假设集合目前是["apples", "bananas", "cucumbers", "dates", "elderberries"],
    而我们想插入"figs"。

    计算机必须执行以查找"figs"为首的如下操作:
    image
    "figs"不在索引 0 处,但可能在集合中的其他位置。在插入之前,需要确保"figs"也不在
    这些位置。
    image

    查找过整个集合后,我们确定其中没有"figs"。这时,就可以完成插入操作了。所以最后
    一步如下。
    第 6 步:在集合末尾插入"figs"。

    最后插入
    在集合末尾插入值是最好的情况,但对含有 5 个元素的集合来说仍然需要 6 步。换言之,必
    须查找其全部 5 个元素之后才能执行插入操作。

    换种说法:对包含 N 个元素的集合来说,在集合末尾插入值最多需要 N + 1 步。这是因为确
    定集合中不含该值需要 N 步,而实际的插入还需要 1 步。数组的相同操作则只需要 1 步。

    so, O(n+1):线性复杂度。表示算法的执行时间与输入规模成线性关系。
    

    中间插入
    向集合开头插入值是最坏的情况。为此,计算机需要先查找 N 个格子来确保该值不在集合
    中,然后再用 N 步来右移全部数据,最后再用 1 步来插入新值。全部加起来是 2N + 1 步。

    数组的相同操作则只需要 N + 1 步。

    so, O(2n+1):线性复杂度。表示算法的执行时间与输入规模成线性关系。
    

    delete

    集合和数组的删除操作也一模一样,即要删除一个值并移动其他数据来填空最多需要 N 步。

    Java Collection Class

    在Java中,想使用array和set,直接看Collection接口下实现的子类即可,

    Java中的集合(Collection)是指一组对象数据的总称。它提供了用于存储和操作一组对象的统一架构。Java集合框架被广泛应用于Java编程,它为不同类型的集合提供了成熟的接口和类,使程序员能够以相对简单、标准的方式对集合进行操作。

    Java集合框架主要包括主要有Collection和Map两个根接口:

    • Collection存储着单个元素
    • Map存储键-值对映射

    集合类:根据不同的数据特点,Collection接口又派生出多个子接口,如Set、List、Queue等,每个子接口都有多个具体的实现类。

    Collection
        |------List
        |       |------ArrayList
        |       |------LinkedList
        |       |------Vector
        |           |------Stack
        |
        |------Set
              |------HashSet
              |       |------LinkedHashSet
              |
              |------SortedSet
                      |------TreeSet
                      |------NavigableSet
        
        |------Queue
              |------Deque
              |       |------ArrayDeque
              |       |------LinkedList
        
        |------Map
              |------HashMap
              |       |------LinkedHashMap
              |
              |------SortedMap
                      |------TreeMap
                      |------NavigableMap
    

    如果从粗略的来看,
    array 就是 ArrayList,
    set 就是 TreeSet。

  • 相关阅读:
    责任链模式auto-pipeline工具使用及源码解析
    SpringCloud-Gateway解决跨域问题
    [免费专栏] Android安全之APK动态方式逆向应用【三种Smali注入方法】
    说一下HashMap的实现原理?
    【html5期末大作业】基于HTML+CSS+JavaScript管理系统页面模板
    一周侃 | 周末随笔
    浅析即时通讯开发前置 HTTP SSO 单点登陆接口的原理
    【中间件】Redis如何解决BigKey
    MySQL中如何识别低效的索引
    .Net6新版本的AssemblyLoadContext 加载程序集和卸载程序集
  • 原文地址:https://www.cnblogs.com/mysticbinary/p/18119479