【C/C++】程序环境，探索程序的执行过程（习得无上内功《易筋经》的第一步）

【C/C++】程序环境，探索程序的执行过程（习得无上内功《易筋经》的第一步）
目录
1.程序的翻译环境和执行环境

在ANSIC（标准C，ANSI：美国国家标准总局）的任何一种实现中，存在两个不同的环境。

第一种：翻译环境，在这个环境中源代码被转换为可执行的机器指令。
第二次：执行环境，它用于实现执行代码。

2.详解编译+链接

 2.1翻译环境
- 组成一个程序的每个源文件通过编译过程分别转换成目标文件。
- 每个目标文件由链接器捆绑在一起，形成一个单一而完整的可执行程序。
- 链接器同时也会引入标准C函数库（链接库）中任何被该程序所用到的函数，而且它可以搜素程序员个人的程序集，将其需要的函数也链接到程序中。
2.2编译本身也分为几个阶段

我现在使用的是VS2019（IDE）—— 集成开发环境
有很多的功能：
编辑+|编译+链接+调试
编辑器+编译器（cl.ese）+ 链接器（link.exe）+ 调试器
VS已经封装的十分好了，我们无法看到编译的过程，想要刨析这些过程这里在Linux环境下进行演示，下面的演示会在Linux下进行。
```
gcc -E test.c -o test.i //预编译完成后就停下来，预处理之后产生的结果都放在test.i文件中
gcc -S test.c //编译完成后就停下来，结果保存在test.s中
gcc -c test.c  //汇编完成后就停下来，结果保存在test.o中。
1
2
3
```
代码：
test.c
```
#include
extern int Add(int, int);
#define MAX 10

int main()
{
	//zhushi
	int max = MAX;
	int a = 10;
	int b = 20;
	int c = Add(a, b);
	printf("%d\n", c);

	return 0;
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
```
Add.c
```
int Add(int a1, int a2)
{
	return a1 + a2;
}
1
2
3
4
```
输出结果

可执行程序
- 在项目文件夹的Debug下可以查看
预编译（预处理）
1. 展开头文件
  
  为头文件(如：#include，#include被称为预处理指令)中增加头文件信息，测试后大概增加800多行代码。
2. 注释删除
  
  经过预编译后，源文件中的注释会被删除。
3. #define符号替换
  
  在代码中所有#define定义的宏就会被替换到文本中原来的位置，而#define行会消失。（#define也被称为预处理指令）
4. 经过预编译后源文件中的C语言代码不会改变。
- 总的来说，预编译主要做一些文本相关的操作。
Linux命令
- 使用指令：gcc -E test.c -o test.i
- 预处理完成后就会停下，预处理的结果会放在test.i文件中。
- 如图说是，为test.i文件内容，它的头文件变为了800多行代码，删除了注释，#define符号被替换
  验证头文件展开
- 在include文件下，找到stdio.h文件，进行对比
  stdio.h文件内容：
  
  我们可以在下面的图中看到，test.i文件的增加内容来自stdio.h文件。
编译
1. 把C语言代码转换成了汇编代码
  将C语言代码转换为汇编代码需要经过4个步骤
  
  语法分析
  词法分析
  语义分析
  符号汇总
- 这里重点讲一下符号汇总
  将源文件转化为可执行程序（可执行程序有自己的格式 —— elf文件的格式，可执行程序内容是二进制的）
  符号汇总是将代码中全局变量、函数名汇总起来
  在test.c文件中汇总的是main、Add、printf符号
  在Add.c文件中汇总的是Add符号
  这些汇总在编译阶段看不出什么，符号汇总主要体现在汇编和链接阶段
Linux命令
- 使用指令：gcc -S test.c
- 预处理完成后就停下来，结果保存在test.s中。
进入test.s文件后，我们会发现代码已经被转化为汇编语言

 汇编
1. 汇编后的文件是我们之前在翻译环境中提到的目标文件，目标文件的格式也是elf的
  在Windows环境下的目标文件名是xxx.obj
  在Linux环境下的目标文件是xxx.o
2. 该文件把汇编指令转换成二进制指令
  
  因为计算机只认识二进制指令
3. 形成符号表
  
  对不同源文件已完成汇总的符号分别进行分配地址，形成符号表
Linux命令
- 使用指令：gcc -c test.c
- 编译完成之后就停下来，结果保存在test.o文件中。
这里我们可以看到，经过汇编后，文件转化为二进制形式

详解符号表
- 在Linux环境下，test.o文件为目标文件，它和可执行文件具有相同的格式：elf格式
- 在test.o文件中我们可以查看查看它对应源文件的符号表，虽然它是二进制形式的，但我们可以通过readelf工具查看。
查看readelf工具Linux展示：
- 使用指令：man readelf
- 这里我们使用-s选项查看符号表信息
  
  我们可以进行如下操作查看test.o的符号表：
- test.o符号表中有main、Add、printf符号
查看Add.o符号表：
- Add.o符号表中有Add符号
形成符号表
- 我们已经知道，每个.o文件都有它对应的符号表，符号表里有编译过程中记录的符号，还有与符号相关联的地址。
- 在编译过程中，test.i文件里面通过extern来声明Add函数，让编译器知道有这个符号。
- 但Add函数是定义在其他文件里面的，我们只知道有这么个函数，而不能确定它在哪，所以它对应的地址是无效的（随机分配的地址）
- 而main函数就在test.c文件中，我们可以找到它，所以我们会给它一个有效的地址。
- printf函数是库函数，我们暂时不考虑。
- 在Add.c文件里实现了Add函数，我们可以找到它的地址，所以在编译过程，Add.i文件会对Add进行符号汇总，Add.o文件会对Add形成符号表。
2.3.链接
1. 合并段表
  
  生成一份可执行程序（格式也是elf的），将不同.o文件中的相同段的数据合并
2. 符号表的合并和重定位
  
  合并：对所有符号进行合并，将相同的符号进行合并
  重定向：使用有意义的地址（在两个源文件中可能出现两个相同的符号，但一个的地址是无意义的）
合并段表
- 每个可执行程序或test.o这样的目标文件，它们的格式都是elf文件的格式。这样的文件都有各自的段而且每个文件相同段的格式是相同的，合并段表就是把相同的段合并在一起。
符号表的合并和重定位
- 对所有符号进行合并，将相同的符号进行合并。
- 取相同符号有意义的地址，进行合并。
- 如果一个符号直邮无意义的符号，那就会报错。
- 最终形成的符号表可以方便符号在调用时找到它的地址。
  
  演示调用函数没有定义：
- 将Add函数注释后运行
  
  链接错误，我们将Add函数注释后，编译器找不到Add的有效地址了，就会报错。
3.运行环境

程序执行的过程：
1. 程序必须载入内存中。在有操作系统的环境中：一般载入内存的操作是由操作系统完成的。在独立的环境中（如单片机），程序的载入必须由手工安排，也可能是通过可执行代码置入只读内存来完成。
2. 程序的执行便开始，接着便调用main函数。
3. 开始执行程序。这个时候程序将使用一个运行时堆栈（static，函数栈帧），存储函数的局部变量和返回地址。程序同时也可以使用静态（static）内存，存储于静态内存中的变量在程序的整个执行过程一直保留它们的值。
4. 终止程序。正常终止main函数；也可能时意外终止。
总结：

以上的内容只是程序环境和预处理的冰山一角，了解这些可以让你更好的去理解一些知识，比如说在武侠小说中，少林《易筋经》是无上的内功心法，学会的人无不纵横武林，学其它东西都快的很。如果想要了解的更多建议大家下来的看看《程序员的自我修养》这本书，是一本有关于链接、装载与库的书，虽然前期读会比较吃力，建议大家伴随着整个学习过程去看，相信会对你的内功有很大的提升。
相关阅读:
myssql基于Spring Boot的宠物猫店管理系统的设计与实现毕业设计源码140909
【Unity3D编辑器开发】Unity3D中实现Transform组件拓展，快速复制、粘贴、复原【非常实用】
学习资源网站分享
 PAC工单科目金额明细
 【Vue】computed方法生成计算属性
 Lfu缓存在Rust中的实现及源码解析
 STM32CubeMX学习笔记（47）——USB接口使用（MSC基于内部Flash模拟U盘）
[附源码]计算机毕业设计JAVAjsp建筑公司门户网站
 Next.js 热更新 Markdown 文件变更
 requests正常scrapy异常---终极解决方案
原文地址：https://blog.csdn.net/m0_52094687/article/details/127465219

目录

1.程序的翻译环境和执行环境

2.详解编译+链接

2.1翻译环境

2.2编译本身也分为几个阶段

预编译（预处理）

编译

汇编

详解符号表

形成符号表

2.3.链接

合并段表

符号表的合并和重定位

3.运行环境

总结：