当你遇到以下类似问题而束手无策时,Arthas可以帮助你解决:

  1. 这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?
  2. 我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
  3. 遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?
  4. 线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!
  5. 是否有一个全局视角来查看系统的运行状况?
  6. 有什么办法可以监控到JVM的实时运行状态?

1.什么是Arthas

Arthas(阿尔萨斯)是Alibaba开源的Java诊断工具,深受开发者喜爱。

Arthas支持JDK 6+,支持Linux/Mac/Winodws,采用命令行交互模式,同时提供丰富的 Tab 自动补全功能,进一步方便进行问题的定位和诊断。

2.如何使用

在命令行下面执行(使用和目标进程一致的用户启动,否则可能attach失败):

wget https://alibaba.github.io/arthas/arthas-boot.jar
java -jar arthas-boot.jar
  • 执行该程序的用户需要和目标进程具有相同的权限。比如以admin用户来执行:sudo su admin && java -jar arthas-boot.jarsudo -u admin -EH java -jar arthas-boot.jar
  • 如果attach不上目标进程,可以查看~/logs/arthas/ 目录下的日志。

3.常用命令

  • dashboard

    当前系统的实时数据面板,按 ctrl+c 退出。

    image-20230714152836418

  • thread

    查看当前线程信息,查看线程的堆栈

  • watch

    方法执行数据观测,让你能方便的观察到指定方法的调用情况。能观察到的范围为:返回值抛出异常入参,通过编写 OGNL 表达式进行对应变量的查看。

    image-20230714152656357

代码:

/**
* 获取当前城市下关键字配置
* @param cityID
* @return
*/
public KeywordOutput getKeywordByCityID(Integer cityID) {
BannerParam bannerParam = new BannerParam();
bannerParam.setCityID(cityID);
bannerParam.setActivityStatus(ConstantUtil.BannerActivity.STATUS_PROCESS);
bannerParam.setBannerType(ConstantUtil.ADVERTISING_KEYWORDS_BANNER);
SearchKeywordRedis searchKeyRedis = recommendPlateService.listSeacherKeyWordsWithNoPage(bannerParam);
List<HotKeywordsRedis> hotKeyRedisList = iHotKeywordsRedisService.get(cityID);
return KeywordOutput.transform(hotKeyRedisList, searchKeyRedis);
}
  • trace

    方法内部调用路径,并输出方法路径上的每个节点上耗时。trace 命令能主动搜索 class-patternmethod-pattern 对应的方法调用路径,渲染和统计整个调用链路上的所有性能开销和追踪调用链路。

    image-20230714152757878

具体代码同watch中的示例。

3.小结

​ arthas是大厂作品,目前还在不断迭代。可以用作在线debug工具,可有效用于uat压测的性能缺陷排查、生产环境故障排查等场景,最常用的命令是trace,能替代较原始的通过日志查看接口时间消耗情况,是性能优化利器。

5.其他资料