如何诊断或检测Java静态初始化程序中的死锁
(在Java中使用静态初始化器是否是一个好主意超出了这个问题的范围。)
我在Scala应用程序中遇到死锁,我认为这是由编译类中的互锁静态初始化器引起的。
我的问题是如何检测和诊断这些死锁 – 我发现当涉及静态初始化程序块时,死锁的正常JVM工具似乎不起作用。
这是一个简单的Java应用程序示例,它在静态初始化程序中死锁:
public class StaticDeadlockExample implements Runnable { static { Thread thread = new Thread( new StaticDeadlockExample(), "StaticDeadlockExample child thread"); thread.start(); try { thread.join(); } catch (InterruptedException e) { e.printStackTrace(); } } public static void main(String[] args) { System.out.println("in main"); } public static void sayHello() { System.out.println("hello from thread " + Thread.currentThread().getName()); } @Override public void run() { StaticDeadlockExample.sayHello(); } }
如果你启动这个应用程序,它会死锁。 死锁时的堆栈跟踪(来自jstack
)包含以下两个死锁线程:
"StaticDeadlockExample child thread" prio=6 tid=0x000000006c86a000 nid=0x4f54 in Object.wait() [0x000000006d38f000] java.lang.Thread.State: RUNNABLE at StaticDeadlockExample.run(StaticDeadlockExample.java:37) at java.lang.Thread.run(Thread.java:619) Locked ownable synchronizers: - None "main" prio=6 tid=0x00000000005db000 nid=0x2fbc in Object.wait() [0x000000000254e000] java.lang.Thread.State: WAITING (on object monitor) at java.lang.Object.wait(Native Method) - waiting on (a java.lang.Thread) at java.lang.Thread.join(Thread.java:1143) - locked (a java.lang.Thread) at java.lang.Thread.join(Thread.java:1196) at StaticDeadlockExample.(StaticDeadlockExample.java:17) at java.lang.Class.forName0(Native Method) at java.lang.Class.forName(Class.java:169) at com.intellij.rt.execution.application.AppMain.main(AppMain.java:116) Locked ownable synchronizers: - None
我的问题如下
- 为什么第一个线程标记为RUNNABLE,当它实际上在等待锁定时? 我能以某种方式检测到这个线程的“真实”状态吗?
- 为什么两个线程都没有被标记为拥有任何(相关)锁,实际上一个持有静态初始化器锁而另一个正在等待它? 我能以某种方式检测静态初始化程序锁定所有权吗?
Scala很容易陷入陷阱。
简单的解决方法或诊断(如果你在堆栈跟踪中看到临床)是让你的对象扩展App让DelayedInit从静态初始化器中取出你的代码。
一些澄清链接:
https://issues.scala-lang.org/browse/SI-7646
Scala:对象初始化程序中的并行收集导致程序挂起
我用我的工具尝试了这个例子,它也无法将其视为死锁。 在与jconsole调试器稍作挣扎并重新运行该示例几次后,我注意到初始线程被标记为RUNNABLE因为它是可运行的,这里的问题是由于启动的线程访问静态成员,这个操作在静态初始化程序块完成后排队(这种语义在JVM规范中并不清楚,但似乎是这种情况)。
静态初始化程序没有完成,因为在这个奇怪的例子中,连接操作强制它等待线程终止,但是我注意到这个“排队”操作不会根据JVM规范明确地或隐式地获取锁。 也许这不应该被视为死锁本身,因为如果run方法的主体包含无限循环,情况也是如此。