产生性能瓶颈有多方面的原因,包括硬件(自身能力限制或BIOS设置不当)、操作系统(某些feature没打开)和软件。软件方面的性能瓶颈主要是由于编码不当导致,常见原因有以下几种:
本文讲述了在编码时如何利用x86平台的特点(主要是内存方面)来避免性能瓶颈的技巧,并对性能优化给出一种思路。
UMA与NUMA
UMA(Uniform Memory Access),即统一内存访问。在UMA内存架构中,所有处理器通过一条总线共享内存,如下图所示:

因为UMA结构中,所有处理器均通过同一条总线访问内存,故访问内存所花时间是一样的。且访问时间与数据在内存中的位置无关。而在NUMA(Non Uniform Memory Access,非一致性内存访问)结构中,访问内存所需时间与数据在内存中的位置有关,每个处理器都有自己的本地内存,访问本地内存速度很快,通过共享总线可以访问其他处理器的本地内存。结构如图所示:

正如前面所说,在NUMA结构中,访问内存所需时间与数据在内存中的位置有很大关系。处理器访问自己的本地内存要比访问其他处理器的本地内存要快得多。DPDK支持NUMA架构,接下来主要介绍一些进行内存操作方面需要注意的地方。
减少内存拷贝
出于性能考虑,要最小化数据的内存拷贝。在写代码的时候,当遇见需要拷贝数据时,考虑有没有一种更好的解决方式替代,如传递指针而非整个数据结构;在需要使用strcpy和memcpy时,用rte_strcpy和rte_memcpy作替。
合理分配内存
在实时处理数据包转发的系统中,一般不建议在数据面进行动态内存分配,因为不停的申请和释放动态内存会使堆产生碎片,管理这样的堆开销很大。如果真的需要在程序中动态申请内