* src/vm/jit/mips/emit.c (emit_verbosecall_enter): Switch to new call tracer.
[cacao.git] / src / vm / jit / mips / emit.c
index 5e4649a7b65e2878c6c51a57c05550a8e548e592..d2edc03ee94e175423b2c73f808c20a7084e25c1 100644 (file)
@@ -1,9 +1,7 @@
 /* src/vm/jit/mips/emit.c - MIPS code emitter functions
 
-   Copyright (C) 1996-2005, 2006, 2007 R. Grafl, A. Krall, C. Kruegel,
-   C. Oates, R. Obermaisser, M. Platter, M. Probst, S. Ring,
-   E. Steiner, C. Thalinger, D. Thuernbeck, P. Tomsich, C. Ullrich,
-   J. Wenninger, Institut f. Computersprachen - TU Wien
+   Copyright (C) 1996-2005, 2006, 2007, 2008
+   CACAOVM - Verein zur Foerderung der freien virtuellen Maschine CACAO
 
    This file is part of CACAO.
 
@@ -22,8 +20,6 @@
    Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
    02110-1301, USA.
 
-   $Id: emit.c 4398 2006-01-31 23:43:08Z twisti $
-
 */
 
 
 #include "vm/jit/mips/codegen.h"
 #include "vm/jit/mips/md-abi.h"
 
-#include "mm/memory.h"
+#include "mm/memory.hpp"
 
-#if defined(ENABLE_THREADS)
-# include "threads/native/lock.h"
-#endif
+#include "threads/lock.hpp"
 
-#include "vm/builtin.h"
-#include "vm/exceptions.h"
-#include "vm/stringlocal.h" /* XXX for gen_resolvebranch */
+#include "vm/jit/builtin.hpp"
+#include "vm/options.h"
 
 #include "vm/jit/abi.h"
 #include "vm/jit/abi-asm.h"
 #include "vm/jit/asmpart.h"
 #include "vm/jit/dseg.h"
-#include "vm/jit/emit-common.h"
-#include "vm/jit/jit.h"
-#include "vm/jit/replace.h"
-
-#include "vmcore/options.h"
+#include "vm/jit/emit-common.hpp"
+#include "vm/jit/jit.hpp"
+#include "vm/jit/patcher-common.hpp"
+#include "vm/jit/replace.hpp"
+#include "vm/jit/trace.hpp"
+#include "vm/jit/trap.hpp"
 
 
 /* emit_load *******************************************************************
@@ -76,7 +70,7 @@ s4 emit_load(jitdata *jd, instruction *iptr, varinfo *src, s4 tempreg)
        if (src->flags & INMEMORY) {
                COUNT_SPILLS;
 
-               disp = src->vv.regoff * 8;
+               disp = src->vv.regoff;
 
                switch (src->type) {
 #if SIZEOF_VOID_P == 8
@@ -135,7 +129,7 @@ s4 emit_load_low(jitdata *jd, instruction *iptr, varinfo *src, s4 tempreg)
        if (src->flags & INMEMORY) {
                COUNT_SPILLS;
 
-               disp = src->vv.regoff * 8;
+               disp = src->vv.regoff;
 
 #if WORDS_BIGENDIAN == 1
                M_ILD(tempreg, REG_SP, disp + 4);
@@ -175,7 +169,7 @@ s4 emit_load_high(jitdata *jd, instruction *iptr, varinfo *src, s4 tempreg)
        if (src->flags & INMEMORY) {
                COUNT_SPILLS;
 
-               disp = src->vv.regoff * 8;
+               disp = src->vv.regoff;
 
 #if WORDS_BIGENDIAN == 1
                M_ILD(tempreg, REG_SP, disp);
@@ -211,7 +205,7 @@ void emit_store(jitdata *jd, instruction *iptr, varinfo *dst, s4 d)
        if (dst->flags & INMEMORY) {
                COUNT_SPILLS;
 
-               disp = dst->vv.regoff * 8;
+               disp = dst->vv.regoff;
 
                switch (dst->type) {
 #if SIZEOF_VOID_P == 8
@@ -385,20 +379,15 @@ void emit_lconst(codegendata *cd, s4 d, s8 value)
 
 void emit_branch(codegendata *cd, s4 disp, s4 condition, s4 reg, u4 opt)
 {
-       s4 checkdisp;
-       s4 branchdisp;
-
-       /* calculate the different displacements */
-
-       checkdisp  = (disp - 4);
-       branchdisp = (disp - 4) >> 2;
+       // Calculate the displacements.
+       int32_t checkdisp  = (disp - 4);
+       int32_t branchdisp = (disp - 4) >> 2;
 
        /* check which branch to generate */
 
        if (condition == BRANCH_UNCONDITIONAL) {
-               /* check displacement for overflow */
-
-               if ((checkdisp < (s4) 0xffff8000) || (checkdisp > (s4) 0x00007fff)) {
+               // Check displacement for overflow.
+               if (opt_AlwaysEmitLongBranches || ((checkdisp < (int32_t) 0xffff8000) || (checkdisp > (int32_t) 0x00007fff))) {
                        /* if the long-branches flag isn't set yet, do it */
 
                        if (!CODEGENDATA_HAS_FLAG_LONGBRANCHES(cd)) {
@@ -406,7 +395,20 @@ void emit_branch(codegendata *cd, s4 disp, s4 condition, s4 reg, u4 opt)
                                                          CODEGENDATA_FLAG_LONGBRANCHES);
                        }
 
-                       vm_abort("emit_branch: emit unconditional long-branch code");
+                       // Calculate the offset relative to PV.
+                       int32_t currentrpc = cd->mcodeptr - cd->mcodebase;
+                       int32_t offset     = currentrpc + disp;
+
+                       // Sanity check.
+                       assert(offset % 4 == 0);
+
+                       // Do the long-branch.
+                       M_LUI(REG_ITMP3, offset >> 16);
+                       M_OR_IMM(REG_ITMP3, offset, REG_ITMP3);
+                       M_AADD(REG_PV, REG_ITMP3, REG_ITMP3);
+                       M_JMP(REG_ITMP3);
+                       M_NOP;
+                       M_NOP; // This nop is to have 6 instructions (see BRANCH_NOPS).
                }
                else {
                        M_BR(branchdisp);
@@ -414,9 +416,8 @@ void emit_branch(codegendata *cd, s4 disp, s4 condition, s4 reg, u4 opt)
                }
        }
        else {
-               /* and displacement for overflow */
-
-               if ((checkdisp < (s4) 0xffff8000) || (checkdisp > (s4) 0x00007fff)) {
+               // Check displacement for overflow.
+               if (opt_AlwaysEmitLongBranches || ((checkdisp < (int32_t) 0xffff8000) || (checkdisp > (int32_t) 0x00007fff))) {
                        /* if the long-branches flag isn't set yet, do it */
 
                        if (!CODEGENDATA_HAS_FLAG_LONGBRANCHES(cd)) {
@@ -424,6 +425,14 @@ void emit_branch(codegendata *cd, s4 disp, s4 condition, s4 reg, u4 opt)
                                                          CODEGENDATA_FLAG_LONGBRANCHES);
                        }
 
+                       // Calculate the offset relative to PV before we generate
+                       // new code.
+                       int32_t currentrpc = cd->mcodeptr - cd->mcodebase;
+                       int32_t offset     = currentrpc + disp;
+
+                       // Sanity check.
+                       assert(offset % 4 == 0);
+
                        switch (condition) {
                        case BRANCH_EQ:
                                M_BNE(GET_HIGH_REG(reg), GET_LOW_REG(reg), 5);
@@ -447,15 +456,16 @@ void emit_branch(codegendata *cd, s4 disp, s4 condition, s4 reg, u4 opt)
                                vm_abort("emit_branch: unknown condition %d", condition);
                        }
 
-                       /* The actual branch code which is over-jumped (NOTE: we
-                          don't use a branch delay slot here). */
+                       // The actual branch code which is over-jumped.  NOTE: We
+                       // don't use a branch delay slot for the conditional
+                       // branch.
 
-                       M_LUI(REG_ITMP3, branchdisp >> 16);
-                       M_OR_IMM(REG_ITMP3, branchdisp, REG_ITMP3);
+                       // Do the long-branch.
+                       M_LUI(REG_ITMP3, offset >> 16);
+                       M_OR_IMM(REG_ITMP3, offset, REG_ITMP3);
                        M_AADD(REG_PV, REG_ITMP3, REG_ITMP3);
                        M_JMP(REG_ITMP3);
                        M_NOP;
-
                }
                else {
                        switch (condition) {
@@ -499,7 +509,7 @@ void emit_arithmetic_check(codegendata *cd, instruction *iptr, s4 reg)
        if (INSTRUCTION_MUST_CHECK(iptr)) {
                M_BNEZ(reg, 2);
                M_NOP;
-               M_ALD_INTERN(REG_ZERO, REG_ZERO, EXCEPTION_HARDWARE_ARITHMETIC);
+               M_ALD_INTERN(REG_ZERO, REG_ZERO, TRAP_ArithmeticException);
        }
 }
 
@@ -513,11 +523,27 @@ void emit_arithmetic_check(codegendata *cd, instruction *iptr, s4 reg)
 void emit_arrayindexoutofbounds_check(codegendata *cd, instruction *iptr, s4 s1, s4 s2)
 {
        if (INSTRUCTION_MUST_CHECK(iptr)) {
-               M_ILD_INTERN(REG_ITMP3, s1, OFFSET(java_arrayheader, size));
+               M_ILD_INTERN(REG_ITMP3, s1, OFFSET(java_array_t, size));
                M_CMPULT(s2, REG_ITMP3, REG_ITMP3);
                M_BNEZ(REG_ITMP3, 2);
                M_NOP;
-               M_ALD_INTERN(s2, REG_ZERO, EXCEPTION_HARDWARE_ARRAYINDEXOUTOFBOUNDS);
+               M_ALD_INTERN(s2, REG_ZERO, TRAP_ArrayIndexOutOfBoundsException);
+       }
+}
+
+
+/* emit_arraystore_check *******************************************************
+
+   Emit an ArrayStoreException check.
+
+*******************************************************************************/
+
+void emit_arraystore_check(codegendata *cd, instruction *iptr)
+{
+       if (INSTRUCTION_MUST_CHECK(iptr)) {
+               M_BNEZ(REG_RESULT, 2);
+               M_NOP;
+               M_ALD_INTERN(REG_RESULT, REG_ZERO, TRAP_ArrayStoreException);
        }
 }
 
@@ -549,7 +575,7 @@ void emit_classcast_check(codegendata *cd, instruction *iptr, s4 condition, s4 r
                }
 
                M_NOP;
-               M_ALD_INTERN(s1, REG_ZERO, EXCEPTION_HARDWARE_CLASSCAST);
+               M_ALD_INTERN(s1, REG_ZERO, TRAP_ClassCastException);
        }
 }
 
@@ -565,7 +591,7 @@ void emit_nullpointer_check(codegendata *cd, instruction *iptr, s4 reg)
        if (INSTRUCTION_MUST_CHECK(iptr)) {
                M_BNEZ(reg, 2);
                M_NOP;
-               M_ALD_INTERN(REG_ZERO, REG_ZERO, EXCEPTION_HARDWARE_NULLPOINTER);
+               M_ALD_INTERN(REG_ZERO, REG_ZERO, TRAP_NullPointerException);
        }
 }
 
@@ -581,234 +607,39 @@ void emit_exception_check(codegendata *cd, instruction *iptr)
        if (INSTRUCTION_MUST_CHECK(iptr)) {
                M_BNEZ(REG_RESULT, 2);
                M_NOP;
-               M_ALD_INTERN(REG_RESULT, REG_ZERO, EXCEPTION_HARDWARE_EXCEPTION);
+               M_ALD_INTERN(REG_RESULT, REG_ZERO, TRAP_CHECK_EXCEPTION);
        }
 }
 
 
-/* emit_patcher_stubs **********************************************************
+/* emit_trap_compiler **********************************************************
 
-   Generates the code for the patcher stubs.
+   Emit a trap instruction which calls the JIT compiler.
 
 *******************************************************************************/
 
-void emit_patcher_stubs(jitdata *jd)
+void emit_trap_compiler(codegendata *cd)
 {
-       codegendata *cd;
-       patchref    *pr;
-       u4           mcode[5];
-       u1          *savedmcodeptr;
-       u1          *tmpmcodeptr;
-       s4           targetdisp;
-       s4           disp;
-
-       /* get required compiler data */
-
-       cd = jd->cd;
-
-       /* generate code patching stub call code */
-
-       targetdisp = 0;
-
-/*     for (pr = list_first_unsynced(cd->patchrefs); pr != NULL; */
-/*              pr = list_next_unsynced(cd->patchrefs, pr)) { */
-       for (pr = cd->patchrefs; pr != NULL; pr = pr->next) {
-               /* check code segment size */
-
-               MCODECHECK(100);
-
-               /* Get machine code which is patched back in later. The
-                  call is 2 instruction words long. */
-
-               tmpmcodeptr = (u1 *) (cd->mcodebase + pr->branchpos);
-
-               /* We use 2 loads here as an unaligned 8-byte read on 64-bit
-                  MIPS causes a SIGSEGV and using the same code for both
-                  architectures is much better. */
-
-               mcode[0] = ((u4 *) tmpmcodeptr)[0];
-               mcode[1] = ((u4 *) tmpmcodeptr)[1];
-
-               mcode[2] = ((u4 *) tmpmcodeptr)[2];
-               mcode[3] = ((u4 *) tmpmcodeptr)[3];
-               mcode[4] = ((u4 *) tmpmcodeptr)[4];
-
-               /* Patch in the call to call the following code (done at
-                  compile time). */
-
-               savedmcodeptr = cd->mcodeptr;   /* save current mcodeptr              */
-               cd->mcodeptr  = tmpmcodeptr;    /* set mcodeptr to patch position     */
-
-               disp = ((u4 *) savedmcodeptr) - (((u4 *) tmpmcodeptr) + 1);
-
-/*             if ((disp < (s4) 0xffff8000) || (disp > (s4) 0x00007fff)) { */
-                       /* Recalculate the displacement to be relative to PV. */
-
-                       disp = savedmcodeptr - cd->mcodebase;
-
-                       M_LUI(REG_ITMP3, disp >> 16);
-                       M_OR_IMM(REG_ITMP3, disp, REG_ITMP3);
-                       M_AADD(REG_PV, REG_ITMP3, REG_ITMP3);
-                       M_JMP(REG_ITMP3);
-                       M_NOP;
-/*             } */
-/*             else { */
-/*                     M_BR(disp); */
-/*                     M_NOP; */
-/*                     M_NOP; */
-/*                     M_NOP; */
-/*                     M_NOP; */
-/*             } */
-
-               cd->mcodeptr = savedmcodeptr;   /* restore the current mcodeptr   */
-
-               /* create stack frame */
-
-               M_ASUB_IMM(REG_SP, 8 * 8, REG_SP);
-
-               /* calculate return address and move it onto the stack */
-
-               M_LDA(REG_ITMP3, REG_PV, pr->branchpos);
-               M_AST(REG_ITMP3, REG_SP, 7 * 8);
-
-               /* move pointer to java_objectheader onto stack */
-
-#if defined(ENABLE_THREADS)
-               /* create a virtual java_objectheader */
-
-               (void) dseg_add_unique_address(cd, NULL);                  /* flcword */
-               (void) dseg_add_unique_address(cd, lock_get_initial_lock_word());
-               disp = dseg_add_unique_address(cd, NULL);                  /* vftbl   */
-
-               M_LDA(REG_ITMP3, REG_PV, disp);
-               M_AST(REG_ITMP3, REG_SP, 6 * 8);
-#else
-               /* do nothing */
-#endif
-
-               /* move machine code onto stack */
-
-               disp = dseg_add_s4(cd, mcode[0]);
-               M_ILD(REG_ITMP3, REG_PV, disp);
-               M_IST(REG_ITMP3, REG_SP, 3 * 8 + 0);
-
-               disp = dseg_add_s4(cd, mcode[1]);
-               M_ILD(REG_ITMP3, REG_PV, disp);
-               M_IST(REG_ITMP3, REG_SP, 3 * 8 + 4);
-
-               disp = dseg_add_s4(cd, mcode[2]);
-               M_ILD(REG_ITMP3, REG_PV, disp);
-               M_IST(REG_ITMP3, REG_SP, 4 * 8 + 0);
-
-               disp = dseg_add_s4(cd, mcode[3]);
-               M_ILD(REG_ITMP3, REG_PV, disp);
-               M_IST(REG_ITMP3, REG_SP, 4 * 8 + 4);
-
-               disp = dseg_add_s4(cd, mcode[4]);
-               M_ILD(REG_ITMP3, REG_PV, disp);
-               M_IST(REG_ITMP3, REG_SP, 5 * 8 + 0);
-
-               /* move class/method/field reference onto stack */
-
-               disp = dseg_add_address(cd, pr->ref);
-               M_ALD(REG_ITMP3, REG_PV, disp);
-               M_AST(REG_ITMP3, REG_SP, 2 * 8);
-
-               /* move data segment displacement onto stack */
-
-               disp = dseg_add_s4(cd, pr->disp);
-               M_ILD(REG_ITMP3, REG_PV, disp);
-               M_IST(REG_ITMP3, REG_SP, 1 * 8);
-
-               /* move patcher function pointer onto stack */
-
-               disp = dseg_add_functionptr(cd, pr->patcher);
-               M_ALD(REG_ITMP3, REG_PV, disp);
-               M_AST(REG_ITMP3, REG_SP, 0 * 8);
-
-               if (targetdisp == 0) {
-                       targetdisp = ((u4 *) cd->mcodeptr) - ((u4 *) cd->mcodebase);
-
-                       disp = dseg_add_functionptr(cd, asm_patcher_wrapper);
-                       M_ALD(REG_ITMP3, REG_PV, disp);
-                       M_JMP(REG_ITMP3);
-                       M_NOP;
-               }
-               else {
-                       disp = (((u4 *) cd->mcodebase) + targetdisp) -
-                               (((u4 *) cd->mcodeptr) + 1);
-
-                       M_BR(disp);
-                       M_NOP;
-               }
-       }
+       M_ALD_INTERN(REG_METHODPTR, REG_ZERO, TRAP_COMPILER);
 }
 
 
-/* emit_replacement_stubs ******************************************************
+/* emit_trap *******************************************************************
 
-   Generates the code for the replacement stubs.
+   Emit a trap instruction and return the original machine code.
 
 *******************************************************************************/
 
-#if defined(ENABLE_REPLACEMENT)
-void emit_replacement_stubs(jitdata *jd)
+uint32_t emit_trap(codegendata *cd)
 {
-       codegendata *cd;
-       codeinfo    *code;
-       rplpoint    *rplp;
-       s4           disp;
-       s4           i;
-#if !defined(NDEBUG)
-       u1          *savedmcodeptr;
-#endif
-
-       /* get required compiler data */
-
-       cd   = jd->cd;
-       code = jd->code;
-
-       rplp = code->rplpoints;
+       // Get machine code which is patched back in later. The trap is 1
+       // instruction word long.
+       uint32_t mcode = *((uint32_t*) cd->mcodeptr);
 
-       /* store beginning of replacement stubs */
+       M_RESERVED;
 
-       code->replacementstubs = (u1*) (cd->mcodeptr - cd->mcodebase);
-
-       for (i = 0; i < code->rplpointcount; ++i, ++rplp) {
-               /* do not generate stubs for non-trappable points */
-
-               if (rplp->flags & RPLPOINT_FLAG_NOTRAP)
-                       continue;
-
-               /* check code segment size */
-
-               MCODECHECK(100);
-
-#if !defined(NDEBUG)
-               savedmcodeptr = cd->mcodeptr;
-#endif
-
-               /* create stack frame - 16-byte aligned */
-
-               M_ASUB_IMM(REG_SP, 2 * 8, REG_SP);
-
-               /* push address of `rplpoint` struct */
-
-               disp = dseg_add_address(cd, rplp);
-               M_ALD(REG_ITMP3, REG_PV, disp);
-               M_AST(REG_ITMP3, REG_SP, 0 * 8);
-
-               /* jump to replacement function */
-
-               disp = dseg_add_functionptr(cd, asm_replacement_out);
-               M_ALD(REG_ITMP3, REG_PV, disp);
-               M_JMP(REG_ITMP3);
-               M_NOP; /* delay slot */
-
-               assert((cd->mcodeptr - savedmcodeptr) == 4*REPLACEMENT_STUB_SIZE);
-       }
+       return mcode;
 }
-#endif /* defined(ENABLE_REPLACEMENT) */
 
 
 /* emit_verbosecall_enter ******************************************************
@@ -821,17 +652,19 @@ void emit_replacement_stubs(jitdata *jd)
 void emit_verbosecall_enter(jitdata *jd)
 {
        methodinfo   *m;
+       codeinfo     *code;
        codegendata  *cd;
        registerdata *rd;
        methoddesc   *md;
        s4            disp;
-       s4            i, j, t;
+       s4            i, s;
 
        /* get required compiler data */
 
-       m  = jd->m;
-       cd = jd->cd;
-       rd = jd->rd;
+       m    = jd->m;
+       code = jd->code;
+       cd   = jd->cd;
+       rd   = jd->rd;
 
        md = m->parseddesc;
 
@@ -839,98 +672,91 @@ void emit_verbosecall_enter(jitdata *jd)
 
        M_NOP;
 
-       M_LDA(REG_SP, REG_SP, -(PA_SIZE + (2 + ARG_CNT + TMP_CNT) * 8));
-       M_AST(REG_RA, REG_SP, PA_SIZE + 1 * 8);
+       /* keep stack 16-byte aligned */
+
+       M_LDA(REG_SP, REG_SP, -(PA_SIZE + (md->paramcount + 2 + TMP_CNT) * 8));
+       M_AST(REG_RA, REG_SP, PA_SIZE + md->paramcount * 8);
 
        /* save argument registers (we store the registers as address
           types, so it's correct for MIPS32 too) */
 
-       for (i = 0; i < INT_ARG_CNT; i++)
-               M_AST(abi_registers_integer_argument[i], REG_SP, PA_SIZE + (2 + i) * 8);
-
-       for (i = 0; i < FLT_ARG_CNT; i++)
-               M_DST(abi_registers_float_argument[i], REG_SP, PA_SIZE + (2 + INT_ARG_CNT + i) * 8);
+       for (i = 0; i < md->paramcount; i++) {
+               if (!md->params[i].inmemory) {
+                       s = md->params[i].regoff;
+                       switch (md->paramtypes[i].type) {
+                       case TYPE_ADR:
+                       case TYPE_INT:
+                               M_AST(s, REG_SP, PA_SIZE + i * 8);
+                               break;
+                       case TYPE_LNG:
+                               M_LST(s, REG_SP, PA_SIZE + i * 8);
+                               break;
+                       case TYPE_FLT:
+                               M_FST(s, REG_SP, PA_SIZE + i * 8);
+                               break;
+                       case TYPE_DBL:
+                               M_DST(s, REG_SP, PA_SIZE + i * 8);
+                               break;
+                       }
+               }
+       }
 
        /* save temporary registers for leaf methods */
 
-       if (jd->isleafmethod) {
+       if (code_is_leafmethod(code)) {
                for (i = 0; i < INT_TMP_CNT; i++)
-                       M_AST(rd->tmpintregs[i], REG_SP, PA_SIZE + (2 + ARG_CNT + i) * 8);
+                       M_AST(rd->tmpintregs[i], REG_SP, PA_SIZE + (md->paramcount + 2 + i) * 8);
 
                for (i = 0; i < FLT_TMP_CNT; i++)
-                       M_DST(rd->tmpfltregs[i], REG_SP, PA_SIZE + (2 + ARG_CNT + INT_TMP_CNT + i) * 8);
+                       M_DST(rd->tmpfltregs[i], REG_SP, PA_SIZE + (md->paramcount + 2 + INT_TMP_CNT + i) * 8);
        }
 
-       /* Load float arguments into integer registers.  MIPS32 has less
-          float argument registers than integer ones, we need to check
-          that. */
-
-       for (i = 0; i < md->paramcount && i < INT_ARG_CNT && i < FLT_ARG_CNT; i++) {
-               t = md->paramtypes[i].type;
-
-               if (IS_FLT_DBL_TYPE(t)) {
-                       if (IS_2_WORD_TYPE(t)) {
-                               M_DST(abi_registers_float_argument[i], REG_SP, 0 * 8);
-                               M_LLD(abi_registers_integer_argument[i], REG_SP, 0 * 8);
-                       }
-                       else {
-                               M_FST(abi_registers_float_argument[i], REG_SP, 0 * 8);
-                               M_ILD(abi_registers_integer_argument[i], REG_SP, 0 * 8);
-                       }
-               }
-       }
-
-#if SIZEOF_VOID_P == 4
-               for (i = 0, j = 0; i < md->paramcount && i < TRACE_ARGS_NUM; i++) {
-                       t = md->paramtypes[i].type;
-
-                       if (IS_INT_LNG_TYPE(t)) {
-                               if (IS_2_WORD_TYPE(t)) {
-                                       M_ILD(abi_registers_integer_argument[j], REG_SP, PA_SIZE + (2 + i) * 8);
-                                       M_ILD(abi_registers_integer_argument[j + 1], REG_SP, PA_SIZE + (2 + i) * 8 + 4);
-                               }
-                               else {
-# if WORDS_BIGENDIAN == 1
-                                       M_MOV(REG_ZERO, abi_registers_integer_argument[j]);
-                                       M_ILD(abi_registers_integer_argument[j + 1], REG_SP, PA_SIZE + (2 + i) * 8);
-# else
-                                       M_ILD(abi_registers_integer_argument[j], REG_SP, PA_SIZE + (2 + i) * 8);
-                                       M_MOV(REG_ZERO, abi_registers_integer_argument[j + 1]);
-# endif
-                               }
-                               j += 2;
-                       }
-               }
-#endif
-
        disp = dseg_add_address(cd, m);
-       M_ALD(REG_ITMP1, REG_PV, disp);
-       M_AST(REG_ITMP1, REG_SP, PA_SIZE + 0 * 8);
-       disp = dseg_add_functionptr(cd, builtin_verbosecall_enter);
+       M_ALD(REG_A0, REG_PV, disp);
+       M_LDA(REG_A1, REG_SP, PA_SIZE);
+       M_LDA(REG_A2, REG_SP, PA_SIZE + (md->paramcount + 2 + TMP_CNT) * 8 + cd->stackframesize * 8);
+       disp = dseg_add_functionptr(cd, trace_java_call_enter);
        M_ALD(REG_ITMP3, REG_PV, disp);
        M_JSR(REG_RA, REG_ITMP3);
        M_NOP;
 
        /* restore argument registers */
 
-       for (i = 0; i < INT_ARG_CNT; i++)
-               M_ALD(abi_registers_integer_argument[i], REG_SP, PA_SIZE + (2 + i) * 8);
-
-       for (i = 0; i < FLT_ARG_CNT; i++)
-               M_DLD(abi_registers_float_argument[i], REG_SP, PA_SIZE + (2 + INT_ARG_CNT + i) * 8);
+       for (i = 0; i < md->paramcount; i++) {
+               if (!md->params[i].inmemory) {
+                       s = md->params[i].regoff;
+                       switch (md->paramtypes[i].type) {
+                       case TYPE_ADR:
+                       case TYPE_INT:
+                               M_ALD(s, REG_SP, PA_SIZE + i * 8);
+                               break;
+                       case TYPE_LNG:
+                               M_LLD(s, REG_SP, PA_SIZE + i * 8);
+                               break;
+                       case TYPE_FLT:
+                               M_FLD(s, REG_SP, PA_SIZE + i * 8);
+                               break;
+                       case TYPE_DBL:
+                               M_DLD(s, REG_SP, PA_SIZE + i * 8);
+                               break;
+                       }
+               }
+       }
 
        /* restore temporary registers for leaf methods */
 
-       if (jd->isleafmethod) {
+       if (code_is_leafmethod(code)) {
                for (i = 0; i < INT_TMP_CNT; i++)
-                       M_ALD(rd->tmpintregs[i], REG_SP, PA_SIZE + (2 + ARG_CNT + i) * 8);
+                       M_ALD(rd->tmpintregs[i], REG_SP, PA_SIZE + (md->paramcount + 2 + i) * 8);
 
                for (i = 0; i < FLT_TMP_CNT; i++)
-                       M_DLD(rd->tmpfltregs[i], REG_SP, PA_SIZE + (2 + ARG_CNT + INT_TMP_CNT + i) * 8);
+                       M_DLD(rd->tmpfltregs[i], REG_SP, PA_SIZE + (md->paramcount + 2 + INT_TMP_CNT + i) * 8);
        }
 
-       M_ALD(REG_RA, REG_SP, PA_SIZE + 1 * 8);
-       M_LDA(REG_SP, REG_SP, PA_SIZE + (2 + ARG_CNT + TMP_CNT) * 8);
+       /* keep stack 16-byte aligned */
+
+       M_ALD(REG_RA, REG_SP, PA_SIZE + md->paramcount * 8);
+       M_LDA(REG_SP, REG_SP, PA_SIZE + (md->paramcount + 2 + TMP_CNT) * 8);
 
        /* mark trace code */
 
@@ -943,8 +769,6 @@ void emit_verbosecall_enter(jitdata *jd)
 
    Generates the code for the call trace.
 
-   void builtin_verbosecall_exit(s8 l, double d, float f, methodinfo *m);
-
 *******************************************************************************/
 
 #if !defined(NDEBUG)
@@ -968,67 +792,68 @@ void emit_verbosecall_exit(jitdata *jd)
 
        M_NOP;
 
-#if SIZEOF_VOID_P == 8
-       M_ASUB_IMM(REG_SP, 4 * 8, REG_SP);          /* keep stack 16-byte aligned */
-       M_AST(REG_RA, REG_SP, 0 * 8);
+       /* keep stack 16-byte aligned */
 
-       M_LST(REG_RESULT, REG_SP, 1 * 8);
-       M_DST(REG_FRESULT, REG_SP, 2 * 8);
-
-       M_MOV(REG_RESULT, REG_A0);
-       M_DMOV(REG_FRESULT, REG_FA1);
-       M_FMOV(REG_FRESULT, REG_FA2);
-
-       disp = dseg_add_address(cd, m);
-       M_ALD(REG_A4, REG_PV, disp);
-#else
-       M_ASUB_IMM(REG_SP, (8*4 + 4 * 8), REG_SP);
-       M_AST(REG_RA, REG_SP, 8*4 + 0 * 8);
+#if SIZEOF_VOID_P == 8
+       assert(0); // XXX: Revisit this code for MIPS64!
+#endif
+       M_ASUB_IMM(REG_SP, PA_SIZE + 2 * 8, REG_SP);
+       M_AST(REG_RA, REG_SP, PA_SIZE + 1 * 8);
 
-       M_LST(REG_RESULT_PACKED, REG_SP, 8*4 + 1 * 8);
-       M_DST(REG_FRESULT, REG_SP, 8*4 + 2 * 8);
+       /* save return value */
 
        switch (md->returntype.type) {
+       case TYPE_ADR:
+       case TYPE_INT:
+               M_AST(REG_RESULT, REG_SP, PA_SIZE + 0 * 8);
+               break;
        case TYPE_LNG:
-               M_LNGMOVE(REG_RESULT_PACKED, REG_A0_A1_PACKED);
+#if SIZEOF_VOID_P == 8
+               M_LST(REG_RESULT, REG_SP, PA_SIZE + 0 * 8);
+#else
+               M_LST(REG_RESULT_PACKED, REG_SP, PA_SIZE + 0 * 8);
+#endif
                break;
-
-       default:
-# if WORDS_BIGENDIAN == 1
-               M_MOV(REG_ZERO, REG_A0);
-               M_MOV(REG_RESULT, REG_A1);
-# else
-               M_MOV(REG_RESULT, REG_A0);
-               M_MOV(REG_ZERO, REG_A1);
-# endif
+       case TYPE_FLT:
+               M_FST(REG_FRESULT, REG_SP, PA_SIZE + 0 * 8);
+               break;
+       case TYPE_DBL:
+               M_DST(REG_FRESULT, REG_SP, PA_SIZE + 0 * 8);
        }
 
-       M_LLD(REG_A2_A3_PACKED, REG_SP, 8*4 + 2 * 8);
-       M_FST(REG_FRESULT, REG_SP, 4*4 + 0 * 4);
-
        disp = dseg_add_address(cd, m);
-       M_ALD(REG_ITMP1, REG_PV, disp);
-       M_AST(REG_ITMP1, REG_SP, 4*4 + 1 * 4);
-#endif
-
-       disp = dseg_add_functionptr(cd, builtin_verbosecall_exit);
+       M_ALD(REG_A0, REG_PV, disp);
+       M_AADD_IMM(REG_SP, PA_SIZE, REG_A1);
+       disp = dseg_add_functionptr(cd, trace_java_call_exit);
        M_ALD(REG_ITMP3, REG_PV, disp);
        M_JSR(REG_RA, REG_ITMP3);
        M_NOP;
 
-#if SIZEOF_VOID_P == 8
-       M_DLD(REG_FRESULT, REG_SP, 2 * 8);
-       M_LLD(REG_RESULT, REG_SP, 1 * 8);
+       /* restore return value */
 
-       M_ALD(REG_RA, REG_SP, 0 * 8);
-       M_AADD_IMM(REG_SP, 4 * 8, REG_SP);
+       switch (md->returntype.type) {
+       case TYPE_ADR:
+       case TYPE_INT:
+               M_ALD(REG_RESULT, REG_SP, PA_SIZE + 0 * 8);
+               break;
+       case TYPE_LNG:
+#if SIZEOF_VOID_P == 8
+               M_LLD(REG_RESULT, REG_SP, PA_SIZE + 0 * 8);
 #else
-       M_DLD(REG_FRESULT, REG_SP, 8*4 + 2 * 8);
-       M_LLD(REG_RESULT_PACKED, REG_SP, 8*4 + 1 * 8);
-
-       M_ALD(REG_RA, REG_SP, 8*4 + 0 * 8);
-       M_AADD_IMM(REG_SP, 8*4 + 4 * 8, REG_SP);
+               M_LLD(REG_RESULT_PACKED, REG_SP, PA_SIZE + 0 * 8);
 #endif
+               break;
+       case TYPE_FLT:
+               M_FLD(REG_FRESULT, REG_SP, PA_SIZE + 0 * 8);
+               break;
+       case TYPE_DBL:
+               M_DLD(REG_FRESULT, REG_SP, PA_SIZE + 0 * 8);
+       }
+
+       /* keep stack 16-byte aligned */
+
+       M_ALD(REG_RA, REG_SP, PA_SIZE + 1 * 8);
+       M_AADD_IMM(REG_SP, PA_SIZE + 2 * 8, REG_SP);
 
        /* mark trace code */