博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
线上应用故障排查之一:高CPU占用
阅读量:5884 次
发布时间:2019-06-19

本文共 829 字,大约阅读时间需要 2 分钟。

流程执行命令:

1.top  查到pid 28555

2.ps aux|grep 28555 确定到是tomcat的进程
3.显示线程列表 ps -mp 28555 -o THREAD,tid,time   查到tid 28802
4. printf "%x\n" 28802 将线程id,tid进行16进制转换
5.jstack pid |grep tid -A 30 显示堆栈信息 jstack 28555 |grep 28802 -A 30

 

详细解释看下文:

 

一个应用占用CPU很高,除了确实是计算密集型应用之外,通常原因都是出现了死循环。

以我们最近出现的一个实际故障为例,介绍怎么定位和解决这类问题。

根据top命令,发现PID为28555的进程占用CPU高达200%,出现故障。

通过ps aux | grep PID命令,可以进一步确定是tomcat进程出现了问题。但是,怎么定位到具体线程或者代码呢?

 

首先显示线程列表:

ps -mp pid -o THREAD,tid,time

找到了耗时最高的线程28802,占用CPU时间快两个小时了!

其次将需要的线程ID转换为16进制格式:

printf "%x\n" tid

最后打印线程的堆栈信息:

jstack pid |grep tid -A 30

找到出现问题的代码了!

 

最后,总结下排查CPU故障的方法和技巧有哪些:

1、top命令:Linux命令。可以查看实时的CPU使用情况。也可以查看最近一段时间的CPU使用情况。

2、ps命令: Linux命令。强大的进程状态监控命令。可以查看进程以及进程中线程的当前CPU使用情况。属于当前状态的采样数据。

3、jstack:  Java提供的命令。可以查看某个进程的当前线程栈运行情况。根据这个命令的输出可以定位某个进程的所有线程的当前运行状态、运行代码,以及是否死锁等等。

4、pstack:Linux命令。可以查看某个进程的当前线程栈运行情况。

转载地址:http://oblix.baihongyu.com/

你可能感兴趣的文章
SharePoint 2013 Disaster Recovery——迁移内容数据库
查看>>
bleve搜索引擎源码分析之索引——mapping真复杂啊
查看>>
我的KT库之-----缓存与配置
查看>>
Logstash之Logstash inputs(file和redis插件)、Logstash outputs(elasticsearch 和redis插件)和Filter plugins...
查看>>
Linux中变量#,#,@,0,0,1,2,2,*,$$,$?的含义【转】
查看>>
v4l2驱动文档之——streaming IO【转】
查看>>
Java初学总结
查看>>
Android开发之旅:环境搭建及HelloWorld
查看>>
C# 中重用c/c++旧模块
查看>>
关于SWT/JFace中其他常用的事件
查看>>
JAVA中写时复制(Copy-On-Write)Map实现
查看>>
SQL Server 存储过程生成insert语句
查看>>
算法——字符串匹配算法自己有限的驾驶机器
查看>>
紧张的学习
查看>>
对一个正整数n,求出n!中末尾0的个数。
查看>>
Android中Services之异步IntentService
查看>>
Linux学习总结—缺页中断和交换技术【转】
查看>>
运用反射实现多层和多数据库开发
查看>>
银河台的文字语言转换自动广播做的不错啊
查看>>
jQuery打造智能提示插件
查看>>