万字长文带你详解死锁!

网站建设4年前发布
38 0 0

20230306014822f115e409459cde941e6291cb11e20672d1d9dd165,作者 | 王磊,来源 | Java中文社群(ID:javacn666),转载请联系授权(微信ID:GG_Stone),死锁(Dead Lock)指的是两个或两个以上的运算单元(进程、线程或协程),都在等待对方停止执行,以取得系统资源,但是没有一方提前退出,就称为死锁。,20230306014823799057154553277374264932697bcb12b41d39450,死锁的形成分为两个方面,一个是使用内置锁 synchronized 形成的死锁,另一种是使用显式锁 Lock 实现的死锁,接下来我们分别来看。,以上程序的执行结果如下:,20230306014916b9329a94960c28c2979959bf591a0536aa6b4c552,从上述结果可以看出,线程 1 和线程 2 都在等待对方释放锁,这样就造成了死锁问题。,以上程序的执行结果如下:,20230306014824f8fd20b765c11a74ae9842c73890c531dd209b467,通过以上示例,我们可以得出结论,要产生死锁需要满足以下 4 个条件:,只有以上 4 个条件同时满足,才会造成死锁问题。,如果程序出现死锁问题,可通过以下 4 种方案中的任意一种进行分析和排查。,我们在使用 jstack 之前,先要通过 jps 得到运行程序的进程 ID,使用方法如下:,20230306014824d900a1e8061d2c521ed2666a00610898ab4ed9223,“jps -l”可以查询本机所有的 Java 程序,jps(Java Virtual Machine Process Status Tool)是 Java 提供的一个显示当前所有 Java 进程 pid 的命令,适合在 linux/unix/windows 平台上简单查看当前 Java 进程的一些简单情况,“-l”用于输出进程 pid 和运行程序完整路径名(包名和类名)。,有了进程 ID(PID)之后,我们就可以使用“jstack -l PID”来发现死锁问题了,如下图所示:,2023030601482546725cd37a3f1cc94dc010388e589e9a93ce4d117,jstack 用于生成 Java 虚拟机当前时刻的线程快照,“-l”表示长列表(long),打印关于锁的附加信息。,使用 jconsole 需要打开 JDK 的 bin 目录,找到 jconsole 并双击打开,如下图所示:,2023030601482621ab3fe5978e2ae745c697ba4796356fc5a89e954,然后选择要调试的程序,如下图所示:,20230306014826573523b95c5e872bd5a4397d5b0177895f8eaf338,之后点击连接进入,选择“不安全的连接”进入监控主页,如下图所示:,20230306014917d3fc81f00214c0ad64129739beb6e24c7e1dfc96520230306014827852f08d16416cb02f6a456419e2a3eb1ca21b8736,之后切换到“线程”模块,点击“检测死锁”按钮,如下图所示:,2023030601491717f244694918defae8388303ee80d1d25fa778700,之后稍等片刻就会检测出死锁的相关信息,如下图所示:,20230306014828392e346685845aedd998545ea85cd0d921e7a1694,jvisualvm 也在 JDK 的 bin 目录中,同样是双击打开:,20230306014828824faeb113d69543506314fe58c0ba66129aee775,稍等几秒之后,jvisualvm 中就会出现本地的所有 Java 程序,如下图所示:,20230306014829581ff8a786d57c4e0d876172a9a995ee5a420f875,双击选择要调试的程序:,20230306014829413da6861401e67de4484580dbdaed47a200fa801,单击鼠标进入“线程”模块,如下图所示:,20230306014830a407d2165fb62b083f5576e1c622557faa337e199,从上图可以看出,当我们切换到线程一栏之后就会直接显示出死锁信息,之后点击“线程 Dump”生成死锁的详情信息,如下图所示:,202303060149187591d89499ce2e4e12c694a43361f140e9cfba649,jmc 是 Oracle Java Mission Control 的缩写,是一个对 Java 程序进行管理、监控、概要分析和故障排查的工具套件。它也是在 JDK 的 bin 目录中,同样是双击启动,如下图所示:,2023030601483188c93e4278653028fe9491081c61afed7a6e4a674,jmc 主页信息如下:,20230306014832f3a1da401e14be0f0c21668123e95f0e0dc926751,之后选中要排查的程序,右键“启动 JMX 控制台”查看此程序的详细内容,如下图所示:,2023030601483254da73097b36c7e06d4202a7121c08bcf154a112020230306014832c24f151404e25e3faee960e3f12775f9c94906129,然后点击“线程”,勾中“死锁检测”就可以发现死锁和死锁的详情信息,如下图所示:,20230306014919e1036a200bb2ac31ae2054f7bfdb927e1b3a02554,接下来我们来分析一下,产生死锁的 4 个条件,哪些是可以破坏的?哪些是不能被破坏的?,通过上述分析,我们可以得出结论,我们只能通过破坏请求和保持条件或者是环路等待条件,从而来解决死锁的问题,那上线,我们就先从破坏“环路等待条件”开始来解决死锁问题。,所谓的顺序锁指的是通过有顺序的获取锁,从而避免产生环路等待条件,从而解决死锁问题的。,当我们没有使用顺序锁时,程序的执行可能是这样的:,20230306014834f62303f46347b048849989bbcff8bfd411ffd3183,线程 1 先获取了锁 A,再获取锁 B,线程 2 与 线程 1 同时执行,线程 2 先获取锁 B,再获取锁 A,这样双方都先占用了各自的资源(锁 A 和锁 B)之后,再尝试获取对方的锁,从而造成了环路等待问题,最后造成了死锁的问题。,此时我们只需要将线程 1 和线程 2 获取锁的顺序进行统一,也就是线程 1 和线程 2 同时执行之后,都先获取锁 A,再获取锁 B,执行流程如下图所示:,2023030601483499cec4e7568363e3b3588120d37275077221d4654,因为只有一个线程能成功获取到锁 A,没有获取到锁 A 的线程就会等待先获取锁 A,此时得到锁 A 的线程继续获取锁 B,因为没有线程争抢和拥有锁 B,那么得到锁 A 的线程就会顺利的拥有锁 B,之后执行相应的代码再将锁资源全部释放,然后另一个等待获取锁 A 的线程就可以成功获取到锁资源,执行后续的代码,这样就不会出现死锁的问题了。,顺序锁的实现代码如下所示:,以上程序的执行结果如下:,2023030601483431338939041c86a32452784331c5b6b36d77f8913,从上述执行结果可以看出,程序并没有出现死锁的问题。,轮询锁是通过打破“请求和保持条件”来避免造成死锁的,它的实现思路简单来说就是通过轮询来尝试获取锁,如果有一个锁获取失败,则释放当前线程拥有的所有锁,等待下一轮再尝试获取锁。,轮询锁的实现需要使用到 ReentrantLock 的 tryLock 方法,具体实现代码如下:,以上程序的执行结果如下:,20230306014919965844355499da97c3b833cb83f8076851c04b420,从上述结果可以看出,以上代码也没有出现死锁的问题。,使用轮询锁虽然可以解决死锁的问题,但并不是完美无缺的,比如以下这些问题。,以上简易版的轮询锁,如果遇到有一个线程一直霸占或者长时间霸占锁资源的情况,就会导致这个轮询锁进入死循环的状态,它会尝试一直获取锁资源,这样就会造成新的问题,带来不必要的性能开销,具体示例如下。,以上代码的执行结果如下:,2023030601483697f507444c21e68f80e11302b89fff6e097b88331,从上述结果可以看出,线程 1 轮询锁进入了死循环的状态。,针对以上死循环的情况,我们可以改进的思路有以下两种:,以上策略任选其一就可以解决死循环的问题,出于实现成本的考虑,我们可以采用轮询最大次数的方式来改进轮询锁,具体实现代码如下:,以上代码的执行结果如下:,20230306014836d9dcfd583acaa58360c906e315dd8f43e72cc5432,从以上结果可以看出,当我们改进之后,轮询锁就不会出现死循环的问题了,它会尝试一定次数之后终止执行。,我们以上的轮询锁的轮询等待时间是固定时间,如下代码所示:,这样在特殊情况下会造成线程饿死的问题,也就是轮询锁一直获取不到锁的问题,比如以下示例。,以上代码的执行结果如下:,20230306014837480405b66c7de67991c41606b7bde71b79ab7e475,从上述结果可以看出,线程 1(轮询锁)一直未成功获取到锁,造成这种结果的原因是:线程 1 每次轮询的等待时间为固定的 1s,而线程 2 也是相同的频率,每 1s 获取一次锁,这样就会导致线程 2 会一直先成功获取到锁,而线程 1 则会一直处于“饿死”的情况,执行流程如下图所示:,2023030601483705b6dd5126dcfd3c5ea81571a67c4e905f55f9866,接下来,我们可以将轮询锁的固定等待时间,改进为固定时间 + 随机时间的方式,这样就可以避免因为获取锁的频率一致,而造成轮询锁“饿死”的问题了,具体实现代码如下:,以上代码的执行结果如下:,20230306014838c481778638b530cea70298526dee9e3136b02b976,从上述结果可以看出,线程 1(轮询锁)加入随机等待时间之后就不会出现线程饿死的问题了。,本文介绍了死锁的概念,以及产生死锁的 4 个条件,排查死锁可以通过本文提供的 4 种工具中的任意一种来检测,从易用性和性能方面来考虑,推荐使用 jconsole 或 jvisualvm,最后我们介绍了死锁问题的两种解决方案:顺序锁和轮询锁。

© 版权声明

相关文章