MKL库矩阵乘法(cblas_dgemm)

MKL库中基本线性代数子程序，BLAS(Basic Linear Algebra Subprograms)库，是一个API标淮，用以规范发布基础线性代数操作的数值库（如向量或矩阵乘法）。其中CBLAS是BLAS的C语言接口。

库中前缀用来区分所支持处理的数据类型。

前缀	描述	函数名系列	描述
s-	实数、单精度	ge...	一般矩阵
c-	复数、单精度	sy...	对称矩阵
d-	实数、双精度	he...	Hermitian矩阵
z-	复数、双精度	tr...	三角矩阵

基本矩阵、向量操作

函数（采用常规的前缀为d的接口）	描述
cblas_dasum	向量元素值模的总和
cblas_daxpy	缩放向量
cblas_dcopy	复制向量
cblas_ddot	向量点积
cblas_dswap	交换两向量
cblas_dgemv	常规矩阵×向量

重点介绍矩阵的乘法运算。

此示例是利用Intel 的MKL库函数完成计算矩阵（乘法）运算，计算式为：

其通过调整矩阵及其系数，同样可以完成矩阵的加减；如若只需矩阵与的乘积，设置即可。

其中为维矩阵，为维矩阵，为维矩阵。

使用的函数为cblas_dgemm(Double precision GEneric Matrix Multiplication)，完成一般的矩阵乘法。

1 cblas_dgemm参数详解

fun cblas_dgemm(Layout,		//指定行优先(CblasRowMajor,C)或列优先(CblasColMajor,Fortran)数据排序
               TransA,		//指定是否转置矩阵A
               TransB,		//指定是否转置矩阵B
               M,		//矩阵A和C的行数
               N,		//矩阵B和C的列数
               K,		//矩阵A的列，B的行
               alpha,		//矩阵A和B乘积的比例因子
               A,		//A矩阵
               lda,		//矩阵A的第一维的大小
               B,		//B矩阵
               ldb,		//矩阵B的第一维的大小
               beta,		//矩阵C的比例因子
               C,		//(input/output) 矩阵C
               ldc		//矩阵C的第一维的大小
               )

2 定义待处理矩阵

#include <stdio.h>
#include <stdlib.h>
#include "mkl.h"		// 调用mkl头文件

#define min(x,y) (((x) < (y)) ? (x) : (y))

double* A, * B, * C;		//声明三个矩阵变量，并分配内存
int m, n, k, i, j;			//声明矩阵的维度，其中
double alpha, beta;

m = 2000, k = 200, n = 1000;
alpha = 1.0; beta = 0.0;

A = (double*)mkl_malloc(m * k * sizeof(double), 64);	//按照矩阵维度分配内存
B = (double*)mkl_malloc(k * n * sizeof(double), 64);	//mkl_malloc用法与malloc相似，64表示64位
C = (double*)mkl_malloc(m * n * sizeof(double), 64);
if (A == NULL || B == NULL || C == NULL) {		//判空

    mkl_free(A);				
    mkl_free(B);
    mkl_free(C);
    return 1;
}

for (i = 0; i < (m * k); i++) {		//赋值
    A[i] = (double)(i + 1);
}

for (i = 0; i < (k * n); i++) {
    B[i] = (double)(-i - 1);
}

for (i = 0; i < (m * n); i++) {
    C[i] = 0.0;
}

其中和矩阵设置为：

矩阵为全0。

3 执行矩阵乘法

回到例子中，对照上面的参数，将C矩阵用A与B的矩阵乘法表示：

cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans, m, n, k, alpha, A, k, B, n, beta, C, n);

执行后的得到结果如下：

完整代码

#include <stdio.h>
#include <stdlib.h>
#include "mkl.h"

#define min(x,y) (((x) < (y)) ? (x) : (y))

int main()
{
    double* A, * B, * C;
    int m, n, k, i, j;
    double alpha, beta;


    m = 2000, k = 200, n = 1000;

    alpha = 1.0; beta = 0.0;

    A = (double*)mkl_malloc(m * k * sizeof(double), 64);
    B = (double*)mkl_malloc(k * n * sizeof(double), 64);
    C = (double*)mkl_malloc(m * n * sizeof(double), 64);
    if (A == NULL || B == NULL || C == NULL) {

        mkl_free(A);
        mkl_free(B);
        mkl_free(C);
        return 1;
    }


    for (i = 0; i < (m * k); i++) {
        A[i] = (double)(i + 1);
    }

    for (i = 0; i < (k * n); i++) {
        B[i] = (double)(-i - 1);
    }

    for (i = 0; i < (m * n); i++) {
        C[i] = 0.0;
    }

    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
        m, n, k, alpha, A, k, B, n, beta, C, n);


    for (i = 0; i < min(m, 6); i++) {
        for (j = 0; j < min(k, 6); j++) {
            printf("%12.0f", A[j + i * k]);
        }
        printf("\n");
    }

    for (i = 0; i < min(k, 6); i++) {
        for (j = 0; j < min(n, 6); j++) {
            printf("%12.0f", B[j + i * n]);
        }
        printf("\n");
    }

    for (i = 0; i < min(m, 6); i++) {
        for (j = 0; j < min(n, 6); j++) {
            printf("%12.5G", C[j + i * n]);
        }
        printf("\n");
    }

    mkl_free(A);
    mkl_free(B);
    mkl_free(C);

    return 0;
}

相关阅读:
什么是系统集成项目管理工程师，证书难考吗？
Redisi消息队列
分布式ID性能评测：CosId VS 美团 Leaf
【第99题】JAVA高级技术-网络编程18（简易聊天室13：聊天室服务端)
Linux进程控制
htb-sense
动态行、列，并且合并
C++ //练习 14.49 为上一题提到的类定义一个转换目标是bool的类型转换运算符，先不用在意这么做是否应该。
Git学习笔记——超详细
ReactDOM.render在react源码中执行之后发生了什么？

原文地址：https://www.cnblogs.com/GeophysicsWorker/p/16175589.html