• jps查看进程出现「xxxx -- process information unavailable」


    jps查看进程出现「xxxx – process information unavailable」


    在这里插入图片描述


    0. 写在前面

    • 实验背景:离线数仓使用Kerberos安全环境下
    • Linux:CentOS7.5
    • Azkaban:Azkaban3.84.4
    • Hadoop:Hadoop3.1.3
    • Hive:Hive3.1.2
    • Kylin:Kylin3.0.2
    • ZooKeeper:Zookeeper3.5.7
    • HBase:HBase2.0.5

    1. 报错

    • 场景

    Azkaban全流程调度」 & 「Kylin的Web端生成一个Cube」

    • 信息
    [root@node03 ~]# jps
    9361 Jps
    8764 -- process information unavailable
    
    • 1
    • 2
    • 3

    起初暴力kill -9并没有解决

    [root@node03 ~]# kill -9 8764
    bash: kill: (8764) - 没有那个进程
    [root@node03 ~]# jps
    9376 Jps
    8764 -- process information unavailable
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 原因分析
    1. 不同用户之间kill进程时,会造成这种现象

    比如:zhangsan用户启动了一个java进程,但是root用户kill掉这个进程,虽然杀掉了,但是查看进程时偶尔就会出现

    1. 因为某些进程没有被正常结束,比如资源占用过大时挂掉或者没有结束进程就直接重启计算机,会导致原有进程变为-- process information unavailable这样的空值

    很明显,由于「azkaban全流程调度」以及「Kylin的Web端生成一个Cube」这两个操作都是相当消耗资源的,内存使用率占比高达98%。

    不理会它,一段时间后可能会自动消失不见。

    此处需要手动处理

    • 方法如下:

    进入/tmp目录,找到hsperfdata_开头的目录,查找-- process information unavailable对应进程号的文件,将其删除即可

    [root@node03 ~]# cd /tmp/
    [root@node03 tmp]# ll
    总用量 44
    drwxr-xr-x. 3 hbase   hadoop 4096 9月  18 08:31 hbase-hbase
    drwxr-xr-x. 2 azkaban hadoop 4096 9月  18 05:42 hsperfdata_azkaban
    drwxr-xr-x. 2 hbase   hadoop 4096 9月  18 08:56 hsperfdata_hbase
    drwxr-xr-x. 2 hdfs    hadoop 4096 9月  18 08:59 hsperfdata_hdfs
    drwxr-xr-x. 2 hive    hadoop 4096 9月  18 08:53 hsperfdata_hive
    drwxr-xr-x. 2 presto  hadoop 4096 9月  18 08:55 hsperfdata_presto
    drwxr-xr-x. 2 root    root   4096 9月  18 09:00 hsperfdata_root
    drwxr-xr-x. 2 yarn    hadoop 4096 9月  18 08:59 hsperfdata_yarn
    drwx------. 2 root    root   4096 9月  14 07:12 vmware-root
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    [root@node03 tmp]# ls hsperfdata_azkaban/
    [root@node03 tmp]# ls hsperfdata_hbase/
    [root@node03 tmp]# ls hsperfdata_presto/
    [root@node03 tmp]# ls hsperfdata_hdfs/
    [root@node03 tmp]# ls hsperfdata_hive/
    8764
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    [root@node03 tmp]# cd hsperfdata_hive/
    [root@node03 hsperfdata_hive]# ll
    总用量 32
    -rw-------. 1 hive hadoop 32768 9月  18 16:53 8764
    [root@node03 hsperfdata_hive]# rm -rf 8764 
    [root@node03 hsperfdata_hive]# ll
    总用量 0
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    [root@node03 hsperfdata_hive]# jps
    9414 Jps
    
    • 1
    • 2

    2. 参考

    https://www.cnblogs.com/freeweb/p/5748424.html
    https://www.cnblogs.com/yjmyzz/p/6372334.html
    
    • 1
    • 2

    顺利完成

  • 相关阅读:
    Eureka详解
    LeetCode题目笔记——561. 数组拆分
    公共经济学考试题库完整
    【MySQL】初见数据库
    国内程序员真的不如国外国外程序员?到底差在哪里?
    post为什么会发送两次请求?
    jupyter中安装scala和spark内核详细教程
    C语言内存函数
    HTC手机如何进行官方解锁Unlock
    抖音预约服务小程序开发:前端与后端技术的完美融合
  • 原文地址:https://blog.csdn.net/m0_52735414/article/details/126920907