JVM第十八讲：调试排错 - Java 问题排查之工具单 - 码农知识堂

JVM第十八讲：调试排错 - Java 问题排查之工具单
调试排错 - Java 问题排查之工具单

程序员想要有更好的发展，排查问题的能力一定得加强。举个例子：cpu100% 怎么排查，线上接口逐渐变慢了该怎么排查？慢查询该如何治理？你的思路是啥？本文是JVM第十八讲， Java 问题调试排错。Java 在线问题排查主要分两篇：本文是第二篇，通过java调试/排查工具进行问题定位。
文章目录
- 调试排错 - Java 问题排查之工具单
- 1、Java 调试入门工具
  1.1、jps (常用)
  1.2、jstack (常用)
  1.3、jinfo (不常用)
  1.4、jmap (常用)
  1.5、jstat (常用)
  1.6、jdb
  1.7、CHLSDB
  
  2、Java 调试进阶工具
  2.1、btrace (常用) ☆
  2.2、Greys
  2.3、Arthas（常用）
  2.4、javOSize
  2.5、JProfiler
  
  3、其它工具
  3.1、dmesg
  
  4、参考文章
1、Java 调试入门工具

 1.1、jps (常用)

jps是jdk提供的一个查看当前java进程的小工具，可以看做是 JavaVirtual Machine Process Status Tool 的缩写。

jps常用命令
```
jps # 显示进程的ID 和 类的名称
jps –l # 输出输出完全的包名，应用主类名，jar的完全路径名
jps –v # 输出jvm参数
jps –q # 显示java进程号
jps -m # main 方法
jps -l xxx.xxx.xx.xx # 远程查看  如果没权限，应该怎么做？
1
2
3
4
5
6
```
jps参数
```
-q：仅输出VM标识符，不包括 classname,jar name,arguments in main method
-m：输出main method的参数
-l：输出完全的包名，应用主类名，jar的完全路径名
-v：输出jvm参数
-V：输出通过flag文件传递到JVM中的参数(.hotspotrc文件或-XX:Flags=所指定的文件
-Joption：传递参数到vm,例如:-J-Xms512m
1
2
3
4
5
6
```
jps原理

java程序在启动以后，会在 java.io.tmpdir 指定的目录下，就是临时文件夹里，生成一个类似于hsperfdata_User的文件夹，这个文件夹里（在Linux中为 /tmp/hsperfdata_{userName}/），有几个文件，名字就是java进程的pid，因此列出当前运行的java进程，只是把这个目录里的文件名列一下而已。至于系统的参数什么，就可以解析这几个文件获得。

更多请参考 jps - Java Virtual Machine Process Status Tool

1.2、jstack (常用)

jstack是jdk自带的线程堆栈分析工具，使用该命令可以查看或导出 Java 应用程序中线程堆栈信息。

jstack 常用命令：
```
# 基本
jstack 2815

# java和native c/c++框架的所有栈信息
jstack -m 2815

# 额外的锁信息列表，查看是否死锁
jstack -l 2815
1
2
3
4
5
6
7
8
```
jstack 参数：
```
-l 长列表. 打印关于锁的附加信息,例如属于java.util.concurrent 的 ownable synchronizers列表.

-F 当’jstack [-l] pid’没有相应的时候强制打印栈信息

-m 打印java和native c/c++框架的所有栈信息.

-h | -help 打印帮助信息
1
2
3
4
5
6
7
```
更多请参考: 《JVM调优》- Jstack指令详解

 1.3、jinfo (不常用)

jinfo 是 JDK 自带的命令，可以用来查看正在运行的 java 应用程序的扩展参数，包括 Java System 属性和JVM命令行参数；也可以动态的修改正在运行的 JVM 一些参数。当系统崩溃时，jinfo可以从core文件里面知道崩溃的Java应用程序的配置信息。

jinfo常用命令：
```
# 输出当前 jvm 进程的全部参数和系统属性
jinfo 42609

# 输出所有的参数
jinfo -flags 42609

# 查看指定的 jvm 参数的值
jinfo -flag PrintGC 42609

# 开启/关闭指定的JVM参数
jinfo -flag +PrintGC 42609

# 设置flag的参数
jinfo -flag name=value 42609

# 输出当前 jvm 进行的全部的系统属性
jinfo -sysprops 42609
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
```
jinfo参数：
```
no option 输出全部的参数和系统属性
-flag name 输出对应名称的参数
-flag [+|-]name 开启或者关闭对应名称的参数
-flag name=value 设定对应名称的参数
-flags 输出全部的参数
-sysprops 输出系统属性
1
2
3
4
5
6
```
更多请参考：jvm 性能调优工具之 jinfo

1.4、jmap (常用)

命令jmap是一个多功能的命令。它可以生成 java 程序的 dump 文件，也可以查看堆内对象示例的统计信息、查看 ClassLoader 的信息以及 finalizer 队列。

两个用途
```
# 查看堆的情况
jmap -heap 42609

# dump
jmap -dump:live,format=b,file=/tmp/heap2.bin 42609
jmap -dump:format=b,file=/tmp/heap3.bin 42609

# 查看堆的占用
jmap -histo 42609 | head -10
1
2
3
4
5
6
7
8
9
```
jmap 参数
```
no option： 查看进程的内存映像信息,类似 Solaris pmap 命令。
heap： 显示Java堆详细信息
histo[:live]： 显示堆中对象的统计信息
clstats：打印类加载器信息
finalizerinfo： 显示在F-Queue队列等待Finalizer线程执行finalizer方法的对象
dump:<dump-options>：生成堆转储快照
F： 当-dump没有响应时，使用-dump或者-histo参数. 在这个模式下,live子参数无效.
help：打印帮助信息
J<flag>：指定传递给运行jmap的JVM的参数
1
2
3
4
5
6
7
8
9
```
更多请参考：jvm 性能调优工具之 jmap 和 jmap - Memory Map

1.5、jstat (常用)

jstat参数众多，但是使用一个就够了
```
jstat -gcutil 42609 1000 
1
```
1.6、jdb

jdb可以用来预发debug，假设你预发的java_home是/opt/java/，远程调试端口是8000。那么
```
jdb -attach 8000
1
```
出现以上代表jdb启动成功。后续可以进行设置断点进行调试。

具体参数可见oracle官方说明 jdb - The Java Debugger

Java项目远程调试参数：-agentlib:jdwp=transport=dt_socket,server=y,suspend=n,address=*:5005

1.7、CHLSDB

CHLSDB感觉很多情况下可以看到更好玩的东西，不详细叙述了。查询资料听说jstack和jmap等工具就是基于它的。
```
java -classpath /opt/taobao/java/lib/sa-jdi.jar sun.jvm.hotspot.CLHSDB
1
```
更详细的可见R大此贴 http://rednaxelafx.iteye.com/blog/1847971

2、Java 调试进阶工具

 2.1、btrace (常用) ☆

首当其冲的要说的是btrace。真是生产环境&预发的排查问题大杀器。简介什么的就不说了。直接上代码干
- 查看当前谁调用了ArrayList的add方法，同时只打印当前ArrayList的size大于500的线程调用栈
```
@OnMethod(clazz = "java.util.ArrayList", method="add", location = @Location(value = Kind.CALL, clazz = "/./", method = "/./"))
public static void m(@ProbeClassName String probeClass, @ProbeMethodName String probeMethod, @TargetInstance Object instance, @TargetMethodOrField String method) {
    if(getInt(field("java.util.ArrayList", "size"), instance) > 500){
        println("check who ArrayList.add method:" + probeClass + "#" + probeMethod  + ", method:" + method + ", size:" + getInt(field("java.util.ArrayList", "size"), instance));
        jstack();
        println();
        println("===========================");
        println();
    }
}
1
2
3
4
5
6
7
8
9
10
```
- 监控当前服务方法被调用时返回的值以及请求的参数
```
@OnMethod(clazz = "com.taobao.sellerhome.transfer.biz.impl.C2CApplyerServiceImpl", method="nav", location = @Location(value = Kind.RETURN))
public static void mt(long userId, int current, int relation, String check, String redirectUrl, @Return AnyType result) {
    println("parameter# userId:" + userId + ", current:" + current + ", relation:" + relation + ", check:" + check + ", redirectUrl:" + redirectUrl + ", result:" + result);
}
1
2
3
4
```
btrace 具体可以参考这里：https://github.com/btraceio/btrace

注意:
- 经过观察，1.3.9 的 release输出不稳定，要多触发几次才能看到正确的结果
- 正则表达式匹配trace类时范围一定要控制，否则极有可能出现跑满CPU导致应用卡死的情况
- 由于是字节码注入的原理，想要应用恢复到正常情况，需要重启应用。
2.2、Greys

Greys是@杜琨的大作吧。说几个挺棒的功能(部分功能和btrace重合)：
- sc -df xxx：输出当前类的详情，包括源码位置和classloader结构；
- trace class method：打印出当前方法调用的耗时情况，细分到每个方法，对排查方法性能时很有帮助。
最牛逼的故障诊断工具！秒级定位线上问题

 2.3、Arthas（常用）

Arthas是基于Greys。

具体请参考：JVM第二十讲：Java 问题排查之应用在线调试Arthas

2.4、javOSize

就说一个功能：
- classes：通过修改了字节码，改变了类的内容，即时生效。所以可以做到快速的在某个地方打个日志看看输出，缺点是对代码的侵入性太大。但是如果自己知道自己在干嘛，的确是不错的玩意儿。
其他功能Greys和btrace都能很轻易做的到，不说了。

更多请参考：官网

 2.5、JProfiler

之前判断许多问题要通过JProfiler，但是现在Greys和btrace基本都能搞定了。再加上出问题的基本上都是生产环境(网络隔离)，所以基本不怎么使用了，但是还是要标记一下。

更多请参考：官网

 3、其它工具

 3.1、dmesg

如果发现自己的java进程悄无声息的消失了，几乎没有留下任何线索，那么dmesg一发，很有可能有你想要的。

sudo dmesg|grep -i kill|less 去找关键字oom_killer。找到的结果类似如下：
```
[6710782.021013] java invoked oom-killer: gfp_mask=0xd0, order=0, oom_adj=0, oom_scoe_adj=0
[6710782.070639] [<ffffffff81118898>] ? oom_kill_process+0x68/0x140 
[6710782.257588] Task in /LXC011175068174 killed as a result of limit of /LXC011175068174 
[6710784.698347] Memory cgroup out of memory: Kill process 215701 (java) score 854 or sacrifice child 
[6710784.707978] Killed process 215701, UID 679, (java) total-vm:11017300kB, anon-rss:7152432kB, file-rss:1232kB
1
2
3
4
5
```
以上表明，对应的java进程被系统的OOM Killer给干掉了，得分为854。解释一下OOM killer（Out-Of-Memory killer），该机制会监控机器的内存资源消耗。当机器内存耗尽前，该机制会扫描所有的进程（按照一定规则计算，内存占用，时间等），挑选出得分最高的进程，然后杀死，从而保护机器。

dmesg日志时间转换公式：log实际时间=格林威治1970-01-01+(当前时间秒数-系统启动至今的秒数+dmesg打印的log时间)秒数：

date -d “1970-01-01 UTC echo "$(date +%s)-$(cat /proc/uptime|cut -f 1 -d' ')+12288812.926194"|bc seconds” 剩下的，就是看看为什么内存这么大，触发了OOM-Killer了。

4、参考文章
- 我的java问题排查工具单
- 查看linux系统常用的命令，Linux查看系统配置常用命令
相关阅读:
linux学习
 计算机中的第二个伟大发明（JMP/JMPR）
SpringCloud微服务实战——搭建企业级开发框架（四十九）：数据字典注解的设计与实现
 【算法刷题-栈与队列篇】
区块链技术与人工智能如何相互赋能
 Android 接入ttf字体文件
 简单了解GaussDB
【华为OD机试真题 python】竖直四子棋【2022 Q4 | 200分】
深入理解final关键字
 台灯应该买什么样的才能护眼?五款专业的护眼台灯推荐
原文地址：https://blog.csdn.net/qq_28959087/article/details/133971587

JVM第十八讲：调试排错 - Java 问题排查之工具单

调试排错 - Java 问题排查之工具单

文章目录

1、Java 调试入门工具

1.1、jps (常用)

1.2、jstack (常用)

1.3、jinfo (不常用)

1.4、jmap (常用)

1.5、jstat (常用)

1.6、jdb

1.7、CHLSDB

2、Java 调试进阶工具

2.1、btrace (常用) ☆

2.2、Greys

2.3、Arthas（常用）

2.4、javOSize

2.5、JProfiler

3、其它工具

3.1、dmesg

4、参考文章