YoungGC耗时太长
首先看一下这个机器是SPE机器,问题是YoungGC耗时太长,
我们内网如果登录正式机器的话,不管是正式的操作还是压测都走了安全生产的机器,
现在出问题的都是安全生产的机器;
以下是排查过程:
1、注意 11.131.192.219 这个机器,然后点击[2021/01/25 17:29]mz-pms[YoungGC总耗时]
2、选择单机视角 然后 11.131.192.219(cpuset)
3、点击JVM
GC次数和GC耗时
GC次数 一分钟以内超过了40次, 单次超过了 2秒
4、然后上eagleeye-console上面看看什么情况
https://eagleeye-console.alibaba-inc.com/#/home
然后输入 mz-pms_prehost:
5、然后选择数据库详情-->选择半小时的时间,然后 正常流量,精简表格
6、发现正常流量没问题,但是点击压测流量 在15,45 都有异常流量
7、问一下测试人员确实在这个时间点,做了压测,问题找到了
二、将SPE环境排除在agent外面:
参考:https://yuque.antfin-inc.com/fuqing.yfq/dsw1o1/krws7q
1、进入 https://x.alibaba-inc.com/application/appmonitor/mz-pms/monitor/basic
2、找到tddl:
3、critical的配置
4、
若有收获,就点个赞吧