linux的CPU使用率达到100%的快速定位过程

问题现象

Linux服务器(操作系统版本是centos7.9)上面部署了若干Java站点服务,突然收到运维的CPU异常g告警,到了影响业务的情况发生,经初步排查,未出现异常进程,排除挖矿病毒的原因。

排查思路

(1)找到最耗CPU的进程;

(2)找到最耗CPU的线程;

(3)查看堆栈,定位线程在干嘛,定位对应代码;

排查步骤

1.找到最耗CPU的进程

方法:使用top命令

  • 执行top -c ,显示进程运行信息列表
  • 键入P (大写p),进程按照CPU使用率排序

linux的CPU使用率达到100%的快速定位过程

2.找到最耗CPU的线程

方法:使用top工具

  • top -Hp ,显示一个进程的线程运行信息列表
  • 键入P (大写p),线程按照CPU使用率排序
  • top -Hp 30365

linux的CPU使用率达到100%的快速定位过程

3.查看堆栈,定位线程在干嘛,定位对应代码

  • 首先,将线程PID转化为16进制。
  • 工具:printf
  • 方法:printf "%x\n" 6080

linux的CPU使用率达到100%的快速定位过程

如上图,6080对应的16进制是0x17c0

之所以要转化为16进制,是因为堆栈里,线程id是用16进制表示的

4.查看堆栈,找到线程在干嘛

  • 工具:jstack
  • 方法:jstack 30365 | grep '0x17c0' -C5 –color
  • 最后,根据堆栈里的信息,找到对应的代码.

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持恩蓝小号。

原创文章,作者:XRBOU,如若转载,请注明出处:http://www.wangzhanshi.com/n/19341.html

(0)
XRBOU的头像XRBOU
上一篇 2025年2月24日 07:37:52
下一篇 2025年2月24日 07:37:55

相关推荐

发表回复

登录后才能评论