心有所向,日复一日,必有精进
准备好了吗?二叉树来了,准备好了吗?准备好了吗?准备好了吗?

目录
树的东西可太多了,主要是二叉树和堆实现比较详细,而且已经感觉到了难度,本文只是对基础概念进行梳理,在写作过程中文章篇幅较大,难免会出现纰漏,欢迎各位指出,也欢迎大家交流。本文涉及很多递归,要体会递归思想,刷题也是必不可少的。

一、树概念及结构
树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
有一个特殊的结点,称为根结点,根节点没有前驱结点
除根节点外,其余结点被分成M(M>0)个互不相交的集合T1、T2、……、Tm,其中每一个集合Ti(1<= i<= m)又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱,可以有0个或多个后继,因此,树是递归定义的。 
注意:树形结构中,子树之间不能有交集,否则就不是树形结构

概念好多啊,但是我们要了解
树结构相对线性表就比较复杂了,要存储表示起来就比较麻烦了,既然保存值域,也要保存结点和结点之间的关系,实际中树有很多种表示方式如:双亲表示法,孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。我们这里就简单的了解其中最常用的孩子兄弟表示法:

一棵二叉树是结点的一个有限集合,该集合:
1. 或者为空
2. 由一个根节点加上两棵别称为左子树和右子树的二叉树组成
注意:对于任意的二叉树都是由以下几种情况复合而成的:

1. 若i>0,i位置节点的双亲序号:(i-1)/2;i=0,i为根节点编号,无双亲节点
2. 若2i+1
3. 若2i+2
二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构
1. 顺序存储
顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储,关于堆我们后面的章节会专门讲解。二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树。
是不是有点神奇,所以人不可貌相啊

2. 链式存储
二叉树的链式存储结构是指,用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。 通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址 。链式结构又分为二叉链和三叉链,当前我们学习中一般都是二叉链,后面课程学到高阶数据结构如红黑树等会用到三叉链。
所以未来还有很难的需要我们挑战呢


- typedef int BTDataType;
- // 二叉链
- struct BinaryTreeNode
- {
- struct BinTreeNode* _pLeft; // 指向当前节点左孩子
- struct BinTreeNode* _pRight; // 指向当前节点右孩子
- BTDataType _data; // 当前节点值域
- }
- // 三叉链
- struct BinaryTreeNode
- {
- struct BinTreeNode* _pParent; // 指向当前节点的双亲
- struct BinTreeNode* _pLeft; // 指向当前节点左孩子
- struct BinTreeNode* _pRight; // 指向当前节点右孩子
- BTDataType _data; // 当前节点值域
- };
普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段。
如果有一个关键码的集合K={K0,K1,K2,……Kn-1};把它的所有元素按完全二叉树的顺序存储方式存储在一个一维数组中,并满足:Ki<=K2i+1并且Ki<=K2i+2,i=0,1,2……,则称为小堆(或大堆)。将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或大根堆。

在概念中提到,堆是按完全二叉树存储,在上面的存储结构中也提到,堆是比较合适用数组存储。
现在我们给出一个数组,逻辑上看做一颗完全二叉树。我们通过从根节点开始成一个小堆。向下调整算法有一个前提:左右子树必须是一个堆,才能调整。
int array[] = {27,15,19,18,28,34,65,49,25,37};
下面我们演示小根堆的向下调整,当左右结点比根结点小的时候,选取左右结点中最小的结点,交换,如图所示不断调整:

下面我们给出一个数组,这个数组逻辑上可以看做一颗完全二叉树,但是还不是一个堆,现在我们通过向下调整算法,把它构建成一个堆。根节点左右子树不是堆,我们怎么调整呢?这里我们从倒数的第一个非叶子节点的子树开始调整,一直调整到根节点的树,就可以调整成堆。(叶子结点是没有必要向下调整的,如图)
int a[] = {1,5,3,8,7,6};

- #include
- #include
- #include
- #include
-
- typedef int HPDataType;
- typedef struct Heap
- {
- HPDataType* a;
- int size;
- int capacity;
- }HP;
- //打印
- void HeapPrint(HP* php);
-
- //交换
- void Swap(HPDataType* p1, HPDataType* p2);
- //向上调整
- void AdjustUp(HPDataType* a, int child);
- //向下调整
- void AdjustDown(HPDataType* a, int n, int parent);
-
- //初始化堆
- void HeapInit(HP* php);
- //销毁堆
- void HeapDestroy(HP* php);
- //插入元素并保证为堆
- void HeapPush(HP* php, HPDataType x);
- //删除堆顶元素
- void HeapPop(HP* php);
-
- //取堆顶元素
- HPDataType HeapTop(HP* php);
- //判断堆是否为空
- bool HeapEmpty(HP* php);
- //返回元素大小
- int HeapSize(HP* php);

- //堆的打印
- void HeapPrint(HP*php){
- assert(php);
- for (int i = 0; i < php->size; i++){
- printf("%d ", php->a[i]);
- }
- printf("\n");
- }
- //堆的初始化
- void HeapInit(HP* php){
- php->a = NULL;
- php->capacity = php->size = 0;
- }
- //堆的销毁
- void HeapDestroy(HP* php){
- assert(php);
- free(php->a);
- php->a = NULL;
- php->capacity = php->size = 0;
- }
已经有一个现成数组,来实现堆,使用了向下调整的方法,这里插入使用的是向上调整的方法
先插入一个数在尾部,然后每插入一个数然后向上调整:
向上调整具体实现
- //交换
- void Swap(HPDataType* p1, HPDataType* p2){
- HPDataType tmp = *p1;
- *p1 = *p2;
- *p2 = tmp;
- }
- void AdjustUp(HPDataType* a, int child){
- assert(a);
- //终止条件:孩子大于等于0就继续调整
- while (child>0){
- //父亲结点
- int parent = (child - 1) / 2;
- if (a[parent] > a[child]){
- Swap(&a[parent], &a[child]);
- }
- child = parent;
- }
- }
插入具体实现:
- void HeapPush(HP* php, HPDataType x){
- //满了扩容
- if (php->capacity==php->size){
- HPDataType newCapacity = php->capacity == 0 ? 4 : php->capacity * 2;
- HPDataType* tmp = (HPDataType*)realloc(php->a,sizeof(HPDataType)*newCapacity);
- if (tmp == NULL){
- perror("malloc fail");
- exit(-1);
- }
- php->a = tmp;
- php->capacity = newCapacity;
- }
- php->a[php->size] = x;
- AdjustUp(php->a, php->size);
- php->size++;
- //两种方式都可以
- //php->size++;
- //AdjustUp(php->a, php->size-1);
-
- }
代码测试:
- //测试用例
- int a[] = { 1, 6, 3, 5, 7, 8, 2 };


在逻辑层面,我们需要把堆顶元素删除,但是在物理层面是数组,删除栈顶元素有相当大的难度,也比较费力,而且当我们删除首元素是,堆的结构已经被破坏的面目全非
int a[] = { 1, 6, 3, 5, 7, 8, 2 };
删除前:

删除后:

费力不讨好,那么我们知道数组删除最后一个元素是非常方便的,将堆顶的数据根最后一个数据一换,然后删除数组最后一个数据,再进行向下调整算法。(妙~)

向下调整具体实现
- void AdjustDown(HPDataType* a, int n, int parent)
- {
- int minChild = parent * 2 + 1;
- while (minChild < n)
- {
- // 找出小的那个孩子
- if (minChild+1 < n && a[minChild + 1] < a[minChild])
- {
- minChild++;
- }
-
- if (a[minChild] < a[parent])
- {
- Swap(&a[minChild], &a[parent]);
- parent = minChild;
- minChild = parent * 2 + 1;
- }
- else
- {
- break;
- }
- }
- }
删除栈顶元素:
- void HeapPop(HP* php){
- assert(php);
- assert(!HeapEmpty(php));
- php->a[0] = php->a[php->size - 1];
- php->size--;
- AdjustDown(php->a,php->size,0);
- }
- bool HeapEmpty(HP* php){
- assert(php);
- return php->size == 0;
- }
- HPDataType HeapTop(HP* php){
- assert(php);
- assert(!HeapEmpty(php));
- return php->a[0];
- }
- int HeapSize(HP* php){
- assert(php);
- return php->size;
- }
我们要实现对堆进行应用,我们就要建立一个堆,在上面我们已经介绍了向上调整,和向下调整的方式,那我们使用那种方式建堆呢?我们要讨论一下建堆的时间复杂度:
- //向上调整
- for (int i = 0; i < n; i++){
- AdjustUp(a,i);
- }
- //向下调整
- for (int i = (n-1-1)/2; i >= n; i--){
- AdjustDown(a,n,i);
- }
我们发现:
向下调整建堆,在结点越少的层数需要调整的越多,在结点越多的层数调整越少,最后一层结点甚至都不需要调整;
向上调整建堆,在结点越多的层数需要调整的越多,在结点越少的层数调整越少,最后一层结点需要大量调整;
二叉树的层数越大,结点个数是指数级上升,最后一层结点几乎占总结点数的50%(只是估计),在向下调整时我们可以跳过最后一层结点。
因为堆是完全二叉树,而满二叉树也是完全二叉树,此处为了简化使用满二叉树来证明(时间复杂度本来看的就是近似值,多几个节点不影响最终结果):

向上调整建堆算法和向下调整计算方法类似,这里给出向上调整建堆时间复杂度估值,

因此:最优的建堆的时间复杂度为O(N)
堆排序即利用堆的思想来进行排序,总共分为两个步骤:
1. 建堆
升序:建大堆
降序:建小堆
2. 利用堆删除思想来进行排序

所以这里使用向下调整建堆:
- //向下调整
- void AdjustDown(HPDataType* a, int n, int parent)
- {
- //最大的默认为左孩子
- int minchild = 2 * parent + 1;
- while (minchild
- {
- //找出大的那个孩子
- if (minchild + 1
1] > a[minchild]) - {
- minchild++;
- }
- //大堆
- if (a[minchild] > a[parent])
- {
- Swap(&a[minchild], &a[parent]);
- parent = minchild;
- minchild = 2 * parent + 1;
- }
- else
- {
- break;
- }
- }
- }
-
- void HeapSort(int* a, int n)
- {
- //建堆——向下调整建堆(从最后一个节点的父亲开始,开始向下调整,直到根)
- for (int i = (n - 1 - 1) / 2; i >= 0; i--)
- {
- AdjustDown(a, n, i);
- }
- //选数
- int i = 1;
- while (i < n)
- {
- Swap(&a[0], &a[n - i]);
- AdjustDown(a, n - i, 0);
- i++;
- }
-
- }
3. 5.2TOP-K问题
TOP-K问题:即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。
比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。
对于Top-K问题,能想到的最简单直接的方式就是排序,但是:如果数据量非常大,排序就不太可取了(可能数据都不能一下子全部加载到内存中)。最佳的方式就是用堆来解决,基本思路如下:
1. 用数据集合中前K个元素来建堆
前k个最大的元素,则建小堆
前k个最小的元素,则建大堆
2. 用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素将剩余N-K个元素依次与堆顶元素比完之后,堆中剩余的K个元素就是所求的前K个最小或者最大的 元素。

- void PrintTopK(int* arr,int n, int k)
- {
- assert(arr);
- // 建k个数小堆
- for (int j = (k - 2) / 2; j >= 0; --j)
- {
- AdjustDown(arr, k, j);
- }
- for (int i = k; i < n; i++){
- if (arr[i]>arr[0]){
- arr[0] = arr[i];
- AdjustDown(arr, k, 0);
- }
- }
- for (int i = 0; i < k; ++i)
- {
- printf("%d ", arr[i]);
- }
- }
四、二叉树链式结构的实现
在学习二叉树的基本操作前,需先要创建一棵二叉树,然后才能学习其相关的基本操作。由于现在对二叉树结构掌握还不够深入,为了降低学习成本,此处手动快速创建一棵简单的二叉树。
- typedef int BTDataType;
- typedef struct BinaryTreeNode
- {
- BTDataType data;
- struct BinaryTreeNode* left;
- struct BinaryTreeNode* right;
- }BTNode;
- BTNode* CreatBinaryTree()
- {
- BTNode* node1 = (BTNode*)malloc(sizeof(BTNode));
- BTNode* node2 = (BTNode*)malloc(sizeof(BTNode));
- BTNode* node3 = (BTNode*)malloc(sizeof(BTNode));
- BTNode* node4 = (BTNode*)malloc(sizeof(BTNode));
- BTNode* node5 = (BTNode*)malloc(sizeof(BTNode));
- BTNode* node6 = (BTNode*)malloc(sizeof(BTNode));
- BTNode* node7 = (BTNode*)malloc(sizeof(BTNode));
- node1->data = 1;
- node2->data = 2;
- node3->data = 3;
- node4->data = 4;
- node5->data = 5;
- node6->data = 6;
- node1->left = node2;
- node1->right = node4;
- node2->left = node3;
- node2->right = NULL;
- node4->left = node5;
- node4->right = node6;
- node3->left = NULL;
- node3->right = NULL;
- node5->right = NULL;
- node5->left = NULL;
- node6->right = NULL;
- node6->left = NULL;
- return node1;
- }
注意:就是创建一个二叉树,方便学习,不是真正的创建方式,请勿模仿哦
二叉树是:
1. 空树
2. 非空:根节点,根节点的左子树、根节点的右子树组成的。

从概念中可以看出,二叉树定义是递归式的,因此后序基本操作中基本都是按照该概念实现的。
4.1二叉树遍历
4.1.1前序、中序、后序遍历
学习二叉树结构,最简单的方式就是遍历。所谓二叉树遍历(Traversal)是按照某种特定的规则,依次对二叉树中的节点进行相应的操作,并且每个节点只操作一次。访问结点所做的操作依赖于具体的应用问题。 遍历是二叉树上最重要的运算之一,也是二叉树上进行其它运算的基础。
按照规则,二叉树的遍历有:前序/中序/后序的递归结构遍历:
1. 前序遍历(Preorder Traversal 亦称先序遍历)——访问根结点的操作发生在遍历其左右子树之前。
2. 中序遍历(Inorder Traversal)——访问根结点的操作发生在遍历其左右子树之中(间)。
3. 后序遍历(Postorder Traversal)——访问根结点的操作发生在遍历其左右子树之后。
由于被访问的结点必是某子树的根,所以N(Node)、L(Left subtree)和R(Right subtree)又可解释为根、根的左子树和根的右子树。NLR、LNR和LRN分别又称为先根遍历、中根遍历和后根遍历。
前序遍历递归图解:(中序、后序遍历类似,不展开)

分析一下,先序遍历前读取根结点,然后是左右结点,一个二叉树我们也可以看做是有小的二叉树组成,如图,我们可以把先序遍历一个二叉树的问题先解决一个分支问题,采用递归的思想;
- // 二叉树前序遍历
- void PreOrder(BTNode* root){
- if (root == NULL){
- return;
- }
- printf("%d ", root->data);
- PreOrder(root->left);
- PreOrder(root->right);
- }

递归是要慢慢自己体会的,不理解可以像上图一样画代码展开图分析,下面是中序遍历、后序遍历代码:
- // 二叉树中序遍历
- void InOrder(BTNode* root){
- if (root == NULL){
- return;
- }
- InOrder(root->left);
- printf("%d ", root->data);
- InOrder(root->right);
- }
- // 二叉树后序遍历
- void PostOrder(BTNode* root){
- if (root == NULL){
- return;
- }
- PostOrder(root->left);
- PostOrder(root->right);
- printf("%d ", root->data);
- }
测试结果:
前序遍历结果:1 2 3 4 5 6
中序遍历结果:3 2 1 5 4 6
后序遍历结果:3 2 5 6 4 1

可以通过前序遍历体会递归的思想
4.1.2层序遍历
实现了前序、中序、后序遍历后,是不是可以一层一层遍历呢?
在堆中,我们是有数组实现,层序遍历没有啥意义,但是这里的层序遍历有一定难度。

创建一个队列,让根节点入队,每次出队就让该结点的左右结点入队,效果如图所示,这样就实现了逐层遍历,当队列为空,遍历完成;
- // 层序遍历
- void BinaryTreeLevelOrder(BTNode* root){
- Queue pq;
- QueueInit(&pq);
- printf("层序遍历:");
- if (root)
- QueuePush(&pq, root);
- while (!QueueEmpty(&pq)){
- BTNode* Front = QueueFront(&pq);
- if (Front != NULL){printf("%d ", Front->data);
- }
- QueuePop(&pq);
- if (Front != NULL)QueuePush(&pq, Front->left);
- if (Front != NULL)QueuePush(&pq, Front->right);
- }
- QueueDestroy(&pq);
- }
测试结果:
不是听讲,我估计是想不到的
4.2二叉树的其他操作
好了到此,我们已近有了二叉树基础,我们来简单实现一下如下问题:
- // 二叉树节点个数
- int BinaryTreeSize(BTNode* root);
- // 二叉树叶子节点个数
- int BinaryTreeLeafSize(BTNode* root);
- // 二叉树第k层节点个数
- int BinaryTreeLevelKSize(BTNode* root, int k);
- // 二叉树查找值为x的节点
- BTNode* BinaryTreeFind(BTNode* root, BTDataType x);
- //二叉树树的高度
- int TreeHeight(BTNode*root);
- // 二叉树节点个数
- int BinaryTreeSize(BTNode* root){
- if (root == NULL)return 0;
- return BinaryTreeSize(root->left) + BinaryTreeSize(root->right) + 1;
- }
- // 二叉树叶子节点个数
- int BinaryTreeLeafSize(BTNode* root){
- if (root == NULL)return 0;
- if (root->left == NULL&&root->right == NULL)return 1;
- return BinaryTreeLeafSize(root->left) + BinaryTreeLeafSize(root->right);
- }
- // 二叉树第k层节点个数
- int BinaryTreeLevelKSize(BTNode* root, int k){
- if (root == NULL)return 0;
- if (k == 1)return 1;
- return BinaryTreeLevelKSize(root->left, k - 1)
- +BinaryTreeLevelKSize(root->right, k - 1);
- }
- //返回x所在结点
- BTNode* TreeFind(BTNode*root, int x){
- if (root == NULL){
- return NULL;
- }
- if (root->data == x){
- return root;
- }
- return TreeFind(root->left, x);
- return TreeFind(root->right, x);
- }
- //二叉树树的高度
- int TreeHeight(BTNode*root){
- if (root == NULL)return NULL;
- int left = TreeHeight(root->left);
- int right = TreeHeight(root->right);
- return left > right?left + 1 : right + 1;
- }
总结
后面应该会写几篇关于二叉树的OJ,一起进步吧!
