细数一些环境原因发现的bug


1.pgsql最大连接数

案例:项目是采用微服务部署的,很多服务会连pgsql数据库,有些开发在写代码的时候连接了数据库,用完后没有释放,导致连接数不断增加,超过设置的最大限制数量,服务日志就会提示报错。

排查方式:

查询最大连接数 show max_connections; 查询活动的连接数 SELECT COUNT(*) from pg_stat_activity; 查询空闲的连接 SELECT * from pg_stat_activity where state='idle'; 临时解决办法一: 删除占用进程,彻底解决还需要开发该代码释放。 SELECT pg_terminate_backend(pid); 临时解决办法二: 修改pgsql的最大连接数 找到数据库安装目录下的postgresql.conf文件, max_connections = 500,将这个值调大   过滤pgsql连接数:netstat -nap|grep 5432|grep 192.168.0.1 |wc -l  

2.容器化部署问题,如容器中时区不对、验证码不显示

案例:1.时区不对,导致系统中业务数据不准确或者其他业务bug

2.图形验证码不显示,需要依赖内部库

3.系统调用容器外的接口访问不通

3.kafka连接数最大问题

此问题和pgsql类似,过滤kafka连接数:netstat -nap|grep 5432|grep 192.168.0.1 |wc -l

4.redis问题

1.有些服务只支持单节点部署和哨兵模式部署

2.程序同步机制有问题,redis和最新数据不对应

5.接口502、503问题

1.nginx

6.浏览器缓存问题