数据结构与算法之Python实现——栈

在常用的数据结构中，有一批结构被称为容器——栈与队列。

本篇博客主要学习一下栈这种结构的特性，以及用python实现它的相关操作。

内容

顺序栈
链栈
栈的实际应用

在这之前，我们需要了解一下什么是栈，以及栈这种结构有什么用处？

🍁 顺序栈

🍃 理解

定义：
前面说到，栈相对于是一个容器，而这个容器里包含的是一些元素（这些元素的数据类型可以整型、浮点型、字符型等）。
同时，栈是保证元素后进先出关系的结构。例如，我们把几本书叠在一起，最上面的书也就是最后放上去的，我们要拿最下的面的书也只有先拿最上面的书，这满足了栈这种“后放先拿”的特性；又例如，做数学题时，遇到推导进行不下去的时候，我们通常是退回一步去考虑其它的可能性。

作用：
栈主要用来保存计算过程中的临时数据，这些数据是计算中发现或者产生的，在后面的计算中可能需要使用到它们。
栈也常常用来作为一种缓冲存储结构，用来存储工作中产生的暂时不用或者用不完的数据。

操作：
压栈：把数据压入栈
弹栈：把数据弹出栈

下面用一张图来说明栈的操作：
在这里插入图片描述

在Python中，我们可以用list来实现顺序栈，由于list才用动态顺序表技术，用它作为栈的表不会满，同时，python的内置函数append()和pop()也可以完美实现压栈和弹栈的操作。

因为用C语言刷过一遍数据结构，在这里呢，我就用两个指针来完成压栈和弹栈的操作。
base：栈底指针，始终指向栈底元素，一直不变。
top：栈顶指针，始终指向栈顶元素的后面。

请结合下图理解：

在这里插入图片描述

🍃 操作

🍂 定义

class stack:
    def __init__(self, maxsize):
        self.max = maxsize              # 栈的最大容量
        self.elem = [None] * self.max   # 用list数据类型来表示顺序栈
        self.top = 0                    # 栈顶指针
        self.base = 0                   # 栈底指针
1
2
3
4
5
6

🍂 压栈

    def push(self,elem):
        if self.top - self.base == self.max:            # 判断栈是否已满
            raise Exception("The stack is full!")
        self.elem[self.top] = elem                      # 元素入栈
        self.top += 1                                   # top指针指向栈顶元素的下一个
1
2
3
4
5

🍂 弹栈

    def pop(self):
        if self.top == self.base:
            raise Exception("The stack is empty")       # 判断栈是否已空
        self.top -= 1                                   # top指向栈顶元素（牢记top指针的定义:top始终指向“栈顶元素”的后面）
        e = self.elem[self.top]                         # 用e接收弹出的元素
        return e  
1
2
3
4
5
6

🍂 取栈顶元素

    def get_top(self):
        return self.elem[self.top - 1]
1
2

🍂 验证顺序栈的操作

data = list(map(int,input("Please input a series of datas:").split(" ")))

s = stack(len(data))            # 栈的初始化
for i in range(len(data)):      # 将元素压栈
    s.push(data[i])
for i in range(s.top - s.base): # 输入栈内元素
    print(s.elem[i],end=" ")

print("\n")

e = s.get_top()
print("The top elem of the stack is: %d" % e)	# 栈顶元素是：

print("\n")

for i in range(s.top - s.base): # 弹栈
    s.pop()     # 弹一次栈
    print("After popping the stack %d times,the stack is:" % (i + 1),end=" ")
    for j in range(s.top - s.base): # 输出每次弹栈后，栈内剩余的元素
        print(s.elem[j],end=" ")
    print("\n")
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

执行结果如下：在这里插入图片描述

🍁 链栈

🍃 理解

在顺序栈中，一个栈的大小是固定死了的，为了实现栈的空间的动态增减，我们下面引入链栈。

链栈相当于是将前面的顺序栈中的每个元素拆分开来，从一个大的整体变成一个一个的小部分，然后再用某种方式将这些小部分链接起来，如下图所示：
在这里插入图片描述
其中，“某种链接方式”就相当于是C语言里的指针，用指针来链接每个“小部分”。link_top为链栈的栈顶指针，始终指向栈顶元素（注意与顺序栈中的栈顶指针作区分）。

那么为了实现链栈，我们需另设一个“结点类”来存储每个结点的信息，由上面的叙述可知，一个结点应该包含数据域（存放东西的地方）和指针域（链接方式，用于实现结点之间的链接）。

🍃 操作

🍂 定义

class stacknode:					# 结点类
    def __init__(self):
        self.elem = None			# 数据域
        self.next = None			# 指针域

class link_stack:					# 链栈类
    def __init__(self):
        self.link_top = None        # 链栈的指针，指向栈顶元素
1
2
3
4
5
6
7
8

🍂 压栈

关于链栈的压栈，它的方法本质上跟链表的头插法是一样的。

    # 压栈（头插法）
    def link_push(self,elem):
        s = stacknode()             # 生成一个新结点
        s.elem = elem               # 填充结点的值
        s.next = self.link_top      # 该结点指向下一个结点
        self.link_top = s           # 指针移动，指向栈顶元素
1
2
3
4
5
6

结合下图理解：
在这里插入图片描述
图中的s代表新生成的结点

🍂 弹栈

    # 弹栈
    def link_pop(self):
        e = self.link_top.elem              # 记录弹栈的那个结点
        self.link_top = self.link_top.next  # 栈顶指针指向下一个结点
        return e                            # 返回弹栈的那个结点
1
2
3
4
5

🍂 获取链栈的长度

    def get_length(self):
        top = self.link_top                 # 用top来代替link_top移动
        count = 0                           # 计数器
        while top is not None:
            count += 1                      # 栈顶指针不为空，则加1
            top = top.next                  # 指针指向下一个结点
        return count                        # 返回count
1
2
3
4
5
6
7

🍂 获取栈顶元素

    def get_top(self):
        if self.link_top == None:
        	return None
        return self.link_top.elem
1
2
3
4

🍂 验证链栈的操作

s = link_stack()	# 链栈的初始化
data = list(map(int,input("Please input a series of datas:").split(" ")))   # 输入数据
for i in range(len(data)):          # 将data中的数据依次压栈，压栈顺序为1->2->3->4->5
    s.link_push(data[i])

top = s.link_top    # 用top代替link_top移动
print("The sequence of the datas in stack is:",end=" ") # 按先进后出的顺序输出链栈中的数据
while top is not None:		# 依次输出链栈中每个结点的值
    print(top.elem,end=" ")
    top = top.next
print("\n")

for i in range(s.get_length()):     # 按先进后出的顺序，输出每一次弹栈后链栈中的数据
    s.link_pop()    # 弹栈
    print("After popping the stack %d times,the stack is:" % (i + 1),end=" ")
    top = s.link_top
    while top is not None:
        print(top.elem,end=" ")
        top = top.next
    print("\n")
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

执行结果如下：
在这里插入图片描述

🍁 栈的实际应用

其实在前面验证顺序栈、链栈的操作时，我们已经完成了一个小小的应用，也就是颠倒一组元素的顺序。只需把所有元素按原来的顺序全部压栈，再依次弹栈，就能得到反序后的序列。

对于栈的应用，我们先从最简单的非递归应用开始。

🍃 栈与递归

先看一个关于阶乘的递归函数

def factorial(n):
    if n == 0:
        return 1
    else:
        return n * factorial(n - 1)
1
2
3
4
5

0的阶乘是1。

可以看到，在函数中这个递归过程就是一个“层层包围”的过程，是由里向外的一个计算过程。就像这个算式“(1+(2+(3+(4+5))))”一样，它总是先计算最里面的括号，然后一步一步地向外计算。

在程序执行时，函数的嵌套调用是按“后调用先返回”的规则进行，这种规则符合栈的使用模式，因此栈可以很自然地支持函数调用的实现。

下面给出用栈实现阶乘的算法：

def factorial_stack(n):
    res = 1							# 保留阶乘的结果
    st = link_stack()
    while n > 0:					# 先将需要计算的对象压栈
        st.link_push(n)
        n -= 1
    while st.get_length() != 0:		# 然后开始阶乘的计算
        res *= st.link_pop()
    return res
1
2
3
4
5
6
7
8
9

当然这只是列举了一个简单的例子，大家可自行用栈去实行其它复杂的过程

🍃 括号匹配问题

什么是括号匹配？

首先在这个问题中，我们只考虑三种括号，分别是：() [] {}。并命名“(”、“[”、“{”为开括号，“)”、“]”、“}”为闭括号。

所谓括号匹配，就是将开括号与闭括号匹配，也就是每对括号的开括号一定要在闭括号前，就算匹配成功。例如：
() 匹配成功
[()] 匹配成功
({[]}) 匹配成功
()[]{} 匹配成功
[) 匹配失败
{(]} 匹配失败

如何利用栈解决这个问题？

它的一个主要思想就是逐个处理遇到的括号，遇到开括号就直接进栈，遇到闭括号时与栈顶元素比较，若这俩是一对就将栈顶元素出栈，然后继续往下处理；若这俩不是一对，就说明匹配失败了。

由前面我们可以看到，匹配成功的情况有两种，一种是一对括号包围着另一对括号，就像([])一样；另一种就是一对括号接另一对括号，例如()[]。其实这个就跟“消消乐”差不多，第一种情况也就是由内向外消除，第二种情况就是依次消除。

在python中，“匹配”两个字是非常敏感的，因为字典这种数据结构不正好符合“匹配”的含义吗？所以，我们可以利用字典的特性来解决这个问题。下面上代码：

# 这里用的是链栈
def check(s):
    brackets = {")": "(", "]": "[", "}": "{"}       # 字典，用来当作判断的条件
    open_bracket = "([{"                            # 用来逐个判断字符是否为开括号

    length = len(s)          # 获取字符串长度
    if length % 2 == 1:      # 因为括号一定成对出现，所以出现奇数个括号时一定不匹配
        return False

    st = link_stack()                              # 链栈初始化
    for i in range(length):                        # 进入循环
        if s[i] in open_bracket:                   # 逐个判断字符是否为开括号
            st.link_push(s[i])                     # 若为开括号就进栈
        else:                                      # 若不为开括号，那么就是闭括号，进入else
            if brackets[s[i]] == st.get_top():     # 若该闭括号与栈顶元素相匹配
                st.link_pop()                      # 将栈顶元素出栈
            else:                                  # 若不匹配
                return False                       # 则整个字符串就不匹配
    if st.get_length() != 0:                       # 如果匹配成功，栈里此时一定没有元素，如果有，那么一定匹配失败
        return False    
    return True       							   # 执行到此处，说明不匹配的条件已全部排除，所以匹配成功
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

测试代码：

# 这里需要导入random包
import random
pairs = "()[]{}"                    # 定义括号集

for i in range(5):                  # 执行5个实例
    s = []							# 测试集
    pos = random.randint(1,6)       # 随机生成测试集的个数
    for j in range(pos):
        pr = random.randint(0,5)    # 随机产生一个括号集的序号
        while pairs[pr] in s:       # 排除相同的括号，也就是说测试集中的括号一定是不相同的！
            pr = random.randint(0,5)
        s += pairs[pr]              # 将随机产生的括号加入测试集
    print(s)
    print(check(s))

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

下面截取了几次的执行结果（不得不说，匹配成功的概率还是相当的低呀0.0）：
在这里插入图片描述

这可是我运行了好多次才有的结果

🍃 中缀表达式到后缀表达式的转换

中缀表达式：二元运算符写在两个运算对象中间的表达式。就是我们在日常生活中的数学表达式，例如“3+5*(8-4)”，上面这个表达式就是将运算符写在两个运算对象的中间。

那么由此，可以联想到后缀表达式是什么样。

后缀表达式：二元运算符写在两个运算对象后面的表达式。如果我们将上面的例子，转化为后缀表达式，那么就是“ 3 5 8 4 - * + ”。它的运算顺序就是：
1）8 4 - 也就是8 - 4，结果为4
2）5 4 * 也就是5 * 4，结果为20
3）3 20 + 也就是3 + 20，结果为23

自然而然地，也会有前缀表达式，那么前缀表达式呢就是将运算符号写在两个运算对象的前面。前缀表达式同时也被称为波兰表达式，那么后缀表达式也被称为逆波兰表达式。

为什么要将中缀表达式转换为后缀表达式？

首先，后缀表达式的出现一定是它在某些地方比中缀表达式更好。

中缀表达式的主要缺点就是：它不足以表示所有可能的运算顺序，需要通过辅助符号、约定等辅助描述机制。且中缀表达式必须引进括号的概念，规定括号里的运算先做，以便于一些特定顺序的计算。但这种处理方式非常麻烦，不适合计算机处理。

而后缀表达式中省去了括号，一个表达式只由运算对象和运算符组成，利用栈就可以实现一个后缀表达式的顺序计算。

所以类似于后缀表达式等很多不同于常规的东西，都是为了方便计算机处理而出现的。

如何利用栈进行后缀表达式的转换？

首先，利用栈无非就是存储一些数据等待后面再用，所以大概的转换过程就是先顺序读取前缀表达式，遇到运算对象直接输出，遇到运算符或括号就进栈，后面再出栈。
然后，基于中缀表达式中不同运算符号之间有优先级的限制，所以在进栈的时候有一定的困难。这里就需要我们人为地去规定运算符号的优先级大小。（下面数值越大的优先级越高，这里也将括号当作是运算符号）

“(”：1
“+”、“-”：2
“*”、“/”：3

下面以x表示顺序读取到前缀表达式中的一位，来讨论处理情况。

若x为运算对象：直接输出
若x为“(”：我们直接将左括号进栈
若x为“)”：这里不需要将右括号进栈，读取到右括号了就表示中缀表达式中一对括号内的读取已经结束，这时就需要挨着弹栈并输出，直到遇见左括号为止，最后再将左括号弹出。
若x为除括号外的其它运算符：我们需要将x入栈，但在x入栈前，我们还需要判断栈顶符号与x的优先级大小关系。若x的优先级大于等于栈顶符号，则x入栈；若x的优先级小于栈顶符号，先将栈顶元素弹出并输出后，再将x入栈（这里需要一直将x与栈顶元素比较，直到x的优先级大于栈顶符号为止，同时每次比较如果弹栈了，则还需要判断栈是否为空，为空则也直接将x入栈）
最后若栈内还有元素，就挨个弹出并输出

下面以上面举的例子来作一个说明“3+5*(8-4)” $\rightarrow$ “ 3 5 8 4 - * + ”。（红色表示读取到哪个字符了）

前缀	判断	栈内元素	后缀
3+5*(8-4)	为运算对象，直接输出		3
3+5*(8-4)	为除括号外的运算符，这里栈为空，不用与栈顶符号比较，直接进栈	+	3
3+5*(8-4)	为运算对象，直接输出	+	35
3+5*(8-4)	为除括号外的其它运算符，与栈顶符号“-”比较，x的优先级等于栈顶符号，直接进栈	+*	35
3+5*(8-4)	为左括号，直接进栈	+*(	35
3+5*(8-4)	为运算对象，直接输出	+*(	358
3+5*(8-4)	为除括号外的运算符，这里栈不为空，与栈顶符号“(”比较，“-”的优先级大于栈顶符号，直接进栈	+*(-	358
3+5*(8-4)	为运算对象，直接输出	+*(-	3584
3+5*(8-4)	为右括号，不进栈，开始挨个弹栈并输出，直到遇见左括号	+*(	3584-
3+5*(8-4)	弹栈后，栈顶符号此时为左括号，再继续将左括号弹出，不输出	+*	3584-
3+5*(8-4)	此时对前缀表达式的读取已经结束，挨个弹出栈内剩余元素并输出		3584-*+

这就是一个完整的转换过程，大家可自行写一个中缀表达式来试着转换，加深一下对这个过程的印象。下面还是用前面说的链栈来实现这个过程，上代码：

priority = {'(':1,'+':2,'-':2,'*':3,'/':3}      # 符号之间的优先级
operators = "+-*/()"                            # 符号集

def infix_to_suffix(infix):
    st = link_stack()
    suffix = []

    for x in infix:
        if x not in operators:          # 若x是运算对象
            suffix.append(x)

        elif x == '(':                  # 若x是左括号
            st.link_push(x)

        elif x == ')':                  # 若x为右括号
            while st.get_length() != 0 and st.get_top() != '(':     # 依次弹栈，直到遇到左括号为止
                suffix.append(st.link_pop())
            st.link_pop()               # 左括号出栈

        else:                           # 若x是除括号外的其它运算符
            while st.get_length() != 0 and priority[st.get_top()] >= priority[x]:        # 比较栈顶符号与x的优先级
                suffix.append(st.link_pop())                    # 若栈顶符号的优先级大于x，则应先将栈顶元素出栈并加入到后缀表达式中
            st.link_push(x)                                     # 直到栈顶符号优先级小于x，将x压栈

    while st.get_length() != 0:         # 弹出并输入栈内剩余的符号
        suffix.append(st.link_pop())

    return suffix                       # 返回后缀表达式
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28

示例

infix = "3+5*(8-4)"
print(infix_to_suffix(infix))
infix1 = "2+4*(5+3/(9+2))/5"
print(infix_to_suffix(infix1))
1
2
3
4

执行结果如下：
在这里插入图片描述
PS：上面的算法中有几个缺点：

运算对象只能是个位数，如果是其它位数还需另作考虑
输入的前缀表达式一定是符合逻辑的，没有排除不符合逻辑的情况

🍃 后缀表达式的计算

学会了中缀表达式转后缀表达式后，那么后缀表达式的计算就十分简单了。

因为后缀表达式只由运算符号和运算对象组成，没有了括号，所以它整体的一个思路就是遇到运算对象直接压栈，遇到运算符后不压栈，两次弹出栈顶元素，然后对它们作一个运算，运算完成后又压栈继续运算。

需要注意的是一下两点：

后缀表达式是一个字符串，对它作运算我们需要进行强制类型转换成整型或浮点型
依次弹出两个运算对象的时候，a表示运算符号左边的运算对象，b表示运算符号右边的运算对象，在代码里需要仔细看一下

代码如下：

def calculate_suffix(suffix):
    operators = "+-*/"
    st = link_stack()

    for x in suffix:
        if x not in operators:          # 若x为运算对象，直接进栈
            st.link_push(int(x))        # 注意这里要强制转换x的类型，不然后续的计算无法进行，因为不转换的话就是字符型
            continue                    # 退出本次循环读取下一个x

        # 后面的x一定是运算符号，遇到运算符号我们就需要将栈顶元素依次取出两个
        if st.get_length() >= 2:
            b = st.link_pop()           # b是右边的运算对象
            a = st.link_pop()           # a是左边的运算对象
        else:
            raise Exception("ERROR!The length of the stack is less than 2")

        if x == "+":
            c = a + b

        elif x == "-":
            c = a - b

        elif x == "*":
            c = a * b

        else:
            c = a / b

        st.link_push(c)             # 计算后将c压栈并继续后续的计算

    return st.link_pop()            # 计算的最后栈内一定只剩一个元素
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

示例：

infix1 = "2+4*(5+3/(9+2))/5"
print(calculate_suffix(infix_to_suffix(infix1)))
infix2 = "3+5*(8-4)"
print(calculate_suffix(infix_to_suffix(infix2)))
1
2
3
4

执行结果如下：
在这里插入图片描述

栈的学习到这里就结束了啦，如果大家有不懂的地方、或是我有不足的地方，欢迎在评论区留言！

相关阅读:
CPT-CY3/CY5/CY7/CY7.5/花菁染料CY3/Y5/CY7/CY7.5/抗Trop-2 IgG抗体偶联顺铂的制备
 13.2测试用例
 Go实现LogCollect：海量日志收集系统【下篇——开发LogTransfer】
摆脱推荐算法，实现万物皆可『RSS』
Kafka 架构
 WPF使用Shape实现复杂线条动画
 SpringBoot+Vue实现前后端的高校失物招领系统
 【读书笔记】《中央帝国的财政密码》
Coverage-based Greybox Fuzzing as Markov Chain
【第21天】SQL进阶-查询优化- performance_schema系列三：事件记录（SQL 小虚竹)
原文地址：https://blog.csdn.net/weixin_62917800/article/details/128005876