上一篇计算机基础(二):汇编语言与内存介绍了汇编语言,却没有给出汇编代码,主要是因为汇编虽然简单、直接,但人们很少使用汇编直接编写程序。
汇编虽然不再要求我们写0、1组合,只需要对着CPU厂商的开发手册写程序就行,但是要我们熟悉CPU的构造,以及计算机组成原理、体系结构等等知识,其实我们只想关注要通过计算机解决的计算问题,使用、熟悉计算机并不是目的,这些只是手段。实现程序时思维需要在解决的问题与计算机底层知识之间相互切换,使用汇编的成本还是太高。因此编程语言更进一步,继续向前发展,抽象出了C语言,继而又产生了其他更多的高级语言。
编程语言到底干了一件什么事儿?一言以蔽之:操作数据。通过操作数据,实现通过有限次的运算步骤,得到最终结算问题的解。具体这些操作包括如下:
那如何设计一门语言,当然也应该围绕着操作数据而展开。另外,每一门语言都是为了解决它上一级语言的问题,也就是对它上一级语言的高度抽象,比如汇编语言是对ISA指令集的抽象,C语言是对汇编语言的高度抽象。但无论如何,设计一门语言始终包含如下三个方面:
C语言使用int、long定义数据类型,使用 +、-、*、/ 等符号抽象汇编中的运算指令操作,而对于语言自身的特性而言,C语言并没有其自身的特性,它是对汇编语言纯粹的抽象,具体表现为:
先来看一段C语言的HelloWorld:
#include
int main()
{
/* 我的第一个 C 程序 */
printf("Hello, World! \n");
return 0;
}
然后编译为汇编代码:
gcc -S -fno-asynchronous-unwind-tables helloc.c
cat helloc.s
具体展示汇编代码如下:
.file "helloc.c"
.text
.section .rodata
.LC0:
.string "Hello, World! "
.text
.globl main
.type main, @function
main:
endbr64
pushq %rbp
movq %rsp, %rbp
leaq .LC0(%rip), %rdi
call puts@PLT
movl $0, %eax
popq %rbp
ret
.size main, .-main
.ident "GCC: (Ubuntu 9.4.0-1ubuntu1~20.04.1) 9.4.0"
.section .note.GNU-stack,"",@progbits
.section .note.gnu.property,"a"
.align 8
.long 1f - 0f
.long 4f - 1f
.long 5
0:
.string "GNU"
1:
.align 8
.long 0xc0000002
.long 3f - 2f
2:
.long 0x3
3:
.align 8
4:
大致看一下main指令片段中的含义,首先是开辟当前指令片段的栈桢,rbp寄存器指向栈底,rsp指向栈顶:
pushq %rbp // 将上一个指令片段的栈底地址压栈
movq %rsp, %rbp // 将当前栈顶地址覆盖给栈底寄存器
leaq 取出 LCO 地址,赋值给rdi寄存器,然后 call 调用另一个指令片段,我们有理由猜测其实际上是对应的调用 printf 来实现打印的功能,上一步可能就是传参的动作。
leaq .LC0(%rip), %rdi
call puts@PLT
将 0 这个数放到 eax 寄存器,弹出rbp,即当前main的指令片段的栈底寄存器,ret退出执行,也就表示了main的执行结束,同时eax寄存器中存储着函数返回值。
movl $0, %eax
popq %rbp
ret
联系到上一篇的内容,这次我们从实际的汇编代码层面理解了函数调用的压栈与出栈操作。