问题现象
Linux服务器(操作系统版本是centos7.9)上面部署了若干Java站点服务,突然收到运维的CPU异常g告警,到了影响业务的情况发生,经初步排查,未出现异常进程,排除挖矿病毒的原因。
排查思路
(1)找到最耗CPU的进程;
(2)找到最耗CPU的线程;
(3)查看堆栈,定位线程在干嘛,定位对应代码;
排查步骤
1.找到最耗CPU的进程
方法:使用top命令
- 执行top -c ,显示进程运行信息列表
- 键入P (大写p),进程按照CPU使用率排序
2.找到最耗CPU的线程
方法:使用top工具
- top -Hp ,显示一个进程的线程运行信息列表
- 键入P (大写p),线程按照CPU使用率排序
- top -Hp 30365
3.查看堆栈,定位线程在干嘛,定位对应代码
- 首先,将线程PID转化为16进制。
- 工具:printf
- 方法:printf "%x\n" 6080
如上图,6080对应的16进制是0x17c0
之所以要转化为16进制,是因为堆栈里,线程id是用16进制表示的
4.查看堆栈,找到线程在干嘛
- 工具:jstack
- 方法:jstack 30365 | grep '0x17c0' -C5 –color
- 最后,根据堆栈里的信息,找到对应的代码.
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持恩蓝小号。
原创文章,作者:XRBOU,如若转载,请注明出处:http://www.wangzhanshi.com/n/19341.html