Java程序出错了,定位错误有哪些技巧?
在开发、测试、线上运行的过程中,程序难免会出现问题,如果快速地定位程序的问题,是每个程序员的必修课 。01. 日志是基础当程序报错,最简单且快速的方法就是查询日志中的报错信息了;所以我们在敲代码的时候,一定不能对 CheckedException 只捕捉不处理 。首先不要忽略异常,第一可以在捕捉到异常后将日志信息输出,要么通过 Throw 或 throws 向上抛,让上层的代码进行处理;接上,不要捕捉异常后,输出完日志又向上抛出异常,这样当查询定位错误时,会产生误导;对于捕捉到的异常,最好可以精确地指出具体是什么异常,而不要用 catch(Exception e) 替代;如果选择了输出异常,那么就要把异常单独打印到一个日志文件中,否则你很可能需要在一大堆日志文件中翻阅查找;另外,日志信息尽可能的详细,比如方法的入参、与其他系统交互的报文等等 。
如果你能在日志文件中快速的找到报错信息的话,那么再定位错误程序就容易很多:通常异常输出能看到报错的类、方法、甚至代码行数,可以先检查程序是不是有显而易见的错误;如果是开发测试环境,可以通过 IDE 进行代码调试,如果错误每次都可以复现,那就是一个明显的 BUG,如果是部分数据有问题,那么就要分析是程序不严谨,还是数据有问题;如果是生成环境的话,我们很难进行线上调试,那么只能通过日志来进行具体的分析了,条件允许的话,可以把生产环境的数据拿下来进行检查和调试 。
02. 完善的监控很多程序员会说,我的日志都很完善了,还需要监控么?我建议最好是有的,而且监控越完善越好 。首先,通过日志查询问题,通常都是业务人员或用户在操作过程中遇到问题,找到运维和开发之后,我们再去翻日志;如果有监控的话,可以实时地发现问题,提前解决问题 。第二,现在很多项目都不是单台部署,应用部署个几台、几十台甚至几百台都很常见,当发现问题之后,人肉翻日志已经不太现实了,如果有一个日志平台的话,那就会方便很多 。
第三,很多公司的项目都是分布式架构、微服务架构,越来越多的服务都是链路调用,A系统调B系统,B系统再调C系统和D系统,这种情况下翻一个服务的访问链路,就需要从几个系统上拿日志,人肉运维是很费时费力的 。03. OOM 、CPU 占用率高等异常分析上面说到的各种错误,基本上是有明确的代码问题,不管是代码本身的问题,还是数据的问题导致代码报错,另外一种不是“显性”的异常(最终可能依然是代码的问题),比如内存使用过高、CPU使用过高、 频繁 Full GC、OOM 等等,通常这一类的问题不好重现、定位困难 。
【elk日志分析系统,浅谈ELK日志分析平台】如果有报错信息,首先还是要查找关键报错信息,比如 java.lang.OutOfMemoryError: Java heap space,很明显就是堆溢出;这时候你需要知道堆里面存的是什么,这样有助于你进行问题的排查:Java 堆用于存储对象实例,如果有大量的对象无法被垃圾回收机制清除,那么超过堆容量限制之后,就会发生溢出;我们可以使用内存映像分析工具,对堆储存快照进行分析;如果有内存泄漏,可以通过工具查看泄漏对象;如果不存在泄漏的话,可以检查代码中是否有递归、死循环等等 。
当然,不同“部位”泄漏和溢出的原因都是不同的,需要具体分析 。如果是 CPU 过高,可以通过系统命令来定位问题:一般 Java 程序 CPU 过高,可能是这几种原因:死循环、计算比较密集、IO 读写高、请求堵塞等等;通过 top 命令,查看当前服务器占用 CPU 资源最多的进程,得到进程号 PID = 4454;通过 top -Hp 4454 查询 4454 进程中各个线程的资源使用率;比如有一个线程 4492 占用 CPU 特别高;通过 printf "%x\n" 4492 命令,把线程 id 转化为十六进制;4492 的十六进制是 118c;使用 jstack 命令打印堆栈信息:jstack 4454。
推荐阅读
- 焦点分析丨中国LVMH滑落启示录 中国资本运作投资行业管理办法
- 分析储能行业发展前景,储能市场前景
- 什么是大数据,万物分析的大数据
- 软件需求分析报告模板,如何写软件需求
- 文本情感分析,情感分析详细步骤
- 天天酷跑段位赛排名怎么排 段位赛排名规则分析
- 小米手机的价格,参数,功能介绍!优点和缺点分析具体!!
- 坚果 Pro 3 Smartisan OS v7.1 更新日志
- 坚果 Pro 3 Smartisan OS v8.0更新日志
- 《平凡的世界》人物形象分析 平凡的世界人物形象分析
