• 极智Coding | OpenMP 多线程使用


    欢迎关注我的公众号 [极智视界],获取我的更多笔记分享

      大家好,我是极智视界,本文讲解一下 OpenMP 多线程使用方法。

      OpenMP 是一种用于共享内存并行系统的多线程程序设计方案,其提供了对并行算法的高层抽象描述,特别适合在多核 CPU 机器上的并行程序设计。编译器根据程序中添加的 pragma 指令,自动将程序并行处理,使用 OpenMP 降低了并行编程的难度和复杂度。当编译器不支持 OpenMP 时,程序会退化成普通(串行)程序,程序中已有的 OpenMP 指令不会影响程序的正常编译运行。

    1 OpenMP 常用指令

      使用 OpenMP 时需要引入 omp.h 头文件,然后在编译时添加参数 -fopenmp 即可。在具体需要进行并行运算的部分,使用 #pragma omp 指令[子句] 来告诉编译器如何并行执行对应的语句。

      常用的指令如下:

    • parallel:即 #pragma omp parallel 后面需要有一个代码片段,使用 {} 括起来,表示会被并行执行;
    • parallel for:这里后面接 for 语句即可,不需要有额外的代码块;
    • sections;
    • parallel sections;
    • single:表示只能单线程执行;
    • critical:临界区,表示每次只能有一个 openmp 线程进入;
    • barrier:用于并行域内代码的线程同步,线程执行到 barrier 时停下来,直到所有线程都执行到barrier时才继续;

      常用的子句如下:

    • num_threads:指定并行域内线程的数目;
    • shared:指定一个或者多个变量为多个线程的共享变量;
    • private:指定一个变量或者多个变量在每个线程中都有它的副本;

      另外,openmp 还提供了一些列的 API 函数来获取并行线程的状态或控制并行线程的行为,常用 API 如下:

    • omp_in_parallel:判断当前是否在并行域中;
    • omp_get_thread_num:获取线程号;
    • omp_set_num_threads:设置并行域中线程格式;
    • omp_get_num_threads:返回并行域中线程数;
    • omp_get_dynamic:判断是否支持动态改变线程数目;
    • omp_get_max_threads: 获取并行域中可用的最大的并行线程数目;
    • omp_get_num_procs:返回系统中处理器的个数;

    2 OpenMP 使用示例

      这里介绍一个计算圆周率的示例:

    #include <stdio.h>
    #include <omp.h>
     
    #define MAX_THREADS 4
     
    static long num_steps = 100000000;
    double step;
    
    int spmd(){
        int i,j;
        double pi, full_sum = 0.0;
        double start_time, run_time;
        double sum[MAX_THREADS];
        step = 1.0/(double) num_steps;
     
        for(j=1;j<=MAX_THREADS ;j++){
            omp_set_num_threads(j);
            full_sum = 0.0;
            start_time = omp_get_wtime();
          
    #pragma omp parallel private(i)
          {
            int id = omp_get_thread_num();
            int numthreads = omp_get_num_threads();
            double x;
            double partial_sum = 0;
    #pragma omp single
            printf(" num_threads = %d",numthreads);
            for (i=id;i< num_steps; i+=numthreads){
                x = (i+0.5)*step;
                partial_sum += + 4.0/(1.0+x*x);
            }
    #pragma omp critical
            full_sum += partial_sum;
    }
          
            pi = step * full_sum;
            run_time = omp_get_wtime() - start_time;
            printf("\n pi is %f in %f seconds %d threds \n ",pi,run_time,j);
        }
    }
    
    int openMP(){
        int i;
        double x, pi, sum = 0.0;
        double start_time, run_time;
     
        step = 1.0/(double) num_steps;
        for (i=1;i<=4;i++){
            sum = 0.0;
            omp_set_num_threads(i);
            start_time = omp_get_wtime();
    #pragma omp parallel
          {
    #pragma omp single
            printf(" num_threads = %d",omp_get_num_threads());
    #pragma omp for reduction(+:sum)
            for (i=1;i<= num_steps; i++){
                x = (i-0.5)*step;
                sum = sum + 4.0/(1.0+x*x);
            }
          }
            pi = step * sum;
            run_time = omp_get_wtime() - start_time;
            printf("\n pi is %f in %f seconds and %d threads\n",pi,run_time,i);
        }
    }  
    
    int main() {
        spmd();
        printf("openMP Loop Paralelism:\n");
        openMP();
        return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57
    • 58
    • 59
    • 60
    • 61
    • 62
    • 63
    • 64
    • 65
    • 66
    • 67
    • 68
    • 69
    • 70
    • 71
    • 72
    • 73
    • 74

      运行结果如下:


      好了,以上分享了 OpenMP 多线程使用方法。希望我的分享能对你的学习有一点帮助。


     【公众号传送】

    《极智AI | OpenMP 多线程使用》


    在这里插入图片描述

    扫描下方二维码即可关注我的微信公众号【极智视界】,获取我的更多经验分享,让我们用极致+极客的心态来迎接AI !

  • 相关阅读:
    基于PBS向超算服务器队列提交任务的脚本模板与常用命令
    uncanny valley(恐怖谷)--学习笔记
    【漏洞复现】RARLAB WinRAR 代码执行漏洞RCE (CVE-2023-38831)
    GO语言实战之接口实现与方法集
    go语言中的读写操作以及文件的复制
    读书笔记:Effective+Debugging-软件和系统调试的66个有效方法
    高质量实现单文件导入、导出功能(使用EasyExcel )
    Spring Security(5)
    LeetCode 官方强推的算法笔记,是有什么与众不同的魅力?
    【Flutter】使用Android Studio 创建第一个flutter应用。
  • 原文地址:https://blog.csdn.net/weixin_42405819/article/details/125490628