在字节码中确定哪里是super()方法调用,所有构造函数必须在JVM上执行

我想知道在分析构造函数的字节码时是否有一种明显而快速的方法,以确定super()代码的结束位置。

更具体地说,与Java形成鲜明对比的是,构造函数中对任何super()构造函数方法的调用是可选的(或者更确切地说,当不存在时 – 隐式),在字节码世界中总是需要它。

出于黑魔法的目的,我需要通过字节码分析和最简单的方法来了解什么是与Java世界的super()调用相对应的INVOKESPECIAL调用。

我会带着一个简单的例子离开这里:

 public static class A { public A(Object o, Object b) { } } public static class B extends A { public B() { //the below super is in bold just to signal that's the one //I'm looking for SUPER(new A(new Object(), new Integer(2)), new Integer(1)); System.out.println(new A(new Object(), new Integer(2))); } } 

使用相应的字节码: 在此处输入图像描述

实际上,字节码构造函数的规则比Java的规则要宽松得多。

唯一的规则是必须在任何正常返回的路径上调用一个构造函数,如果构造函数调用抛出exception,那么您也必须抛出exception。

除此之外,这意味着构造函数可能包含对其他构造函数的多个调用,或者根本不包含任何构造函数。

无论如何,确定给定的invokespecial调用是否正在初始化当前对象的唯一保证方法是进行数据流分析,因为可以初始化同一类的其他对象,这会混淆一个天真的检测器。

编辑:这是一个完全有效的类(使用Krakatau汇编语法)的示例,显示了您可能遇到的一些问题。 除此之外,它还调用同一个类中的其他构造函数,构造函数的递归调用,以及在构造函数中构造同一个类的其他对象。

 .class public ctors .super java/lang/Object ; A normal constructor .method public  : ()V .limit locals 1 .limit stack 1 aload_0 invokespecial java/lang/Object  ()V return .end method ; A weird constructor .method public  : (I)V .limit locals 2 .limit stack 5 iload_1 ifne LREST aload_0 invokespecial ctors  ()V return LREST: aload_0 new ctors iinc 1 -1 iload_1 LFAKE_START: invokespecial ctors  (I)V LFAKE_END: iconst_0 invokespecial ctors  (I)V return .catch [0] from LFAKE_START to LFAKE_END using LCATCH LCATCH: aload_0 invokespecial java/lang/Object  ()V return .end method .method public static main : ([Ljava/lang/String;)V .limit locals 1 .limit stack 2 new ctors iconst_5 invokespecial ctors  (I)V return .end method 

一个简单的解决方案是计算new A对象的数量和A.的数量A.当有多个init不是new你已经调用了超级构造函数。 您必须对new BB.执行相同的检查B.如果调用this(...)B.

您必须找出哪个调用操作码操作数堆栈包含this引用, this引用将用作第一个参数。 为此,您只需要了解不同操作码对操作数堆栈的影响。 在你的例子中,你从aload_0 (这是this引用)开始,然后在this引用之上做一些魔术(一直更新操作数堆栈)。 过了一会儿,你正在寻找的调用操作码就在那里,它会使用this引用(以及参数的一些引用)。 这就是super电话。

super()调用的答案是第no行。 31。

我通过eclipse的类文件编辑器发现它很容易。 看看下面附带的按扣。

这里要记住的一件事是,前缀’a’表示操作码正在操纵对象引用。 前缀’i’表示操作码正在操纵整数。

那么,逐行解释如下,

 12 new java.lang.Integer //Create a new java.lang.Integer 15 dup //Make a extra reference to the same Integer 16 iconst_2 // this means opcode is manipulating Integer as Integer(2) 17 invokespecial java.lang.Integer(int) //Integer(2) is invoked 20 invokespecial A(java.lang.Object, java.lang.Object) //new A(new Object(), new Integer(2) is invoked 23 new java.lang.Integer //Create a new java.lang.Integer 26 dup //Make a extra reference to the same Integer 27 iconst_1 // this means opcode is manipulating Integer as Integer(1) 28 invokespecial java.lang.Integer(int) //Integer(1) is invoked 31 invokespecial A(java.lang.Object, java.lang.Object) **//super(new A(new Object(), new Integer(2)), new Integer(1)) is invoked** 

我希望后者很容易理解。 🙂

 56 - this invoke is for the sysout related A(object,object) invocation. 

在此处输入图像描述