2008-08-11 Zoltan Varga <vargaz@gmail.com>
[mono.git] / mono / mini / tramp-ppc.c
index ba9aad0a6fb10ef1cb5fa74c1fef6f4e82610d03..d79e81c8cd420de3f88a37acc98f552d3a6f8e31 100644 (file)
 #include <mono/metadata/marshal.h>
 #include <mono/metadata/tabledefs.h>
 #include <mono/arch/ppc/ppc-codegen.h>
-#include <mono/metadata/mono-debug-debugger.h>
 
 #include "mini.h"
 #include "mini-ppc.h"
 
-typedef enum {
-       MONO_TRAMPOLINE_GENERIC,
-       MONO_TRAMPOLINE_JUMP,
-       MONO_TRAMPOLINE_CLASS_INIT
-} MonoTrampolineType;
-
-/* adapt to mini later... */
-#define mono_jit_share_code (1)
-
 /*
- * Address of the x86 trampoline code.  This is used by the debugger to check
- * whether a method is a trampoline.
+ * Return the instruction to jump from code to target, 0 if not
+ * reachable with a single instruction
  */
-guint8 *mono_generic_trampoline_code = NULL;
+static guint32
+branch_for_target_reachable (guint8 *branch, guint8 *target)
+{
+       gint diff = target - branch;
+       g_assert ((diff & 3) == 0);
+       if (diff >= 0) {
+               if (diff <= 33554431)
+                       return (18 << 26) | (diff);
+       } else {
+               /* diff between 0 and -33554432 */
+               if (diff >= -33554432)
+                       return (18 << 26) | (diff & ~0xfc000000);
+       }
+       return 0;
+}
 
 /*
  * get_unbox_trampoline:
+ * @gsctx: the generic sharing context
  * @m: method pointer
  * @addr: pointer to native code for @m
  *
@@ -45,21 +50,33 @@ guint8 *mono_generic_trampoline_code = NULL;
  * this argument. This method returns a pointer to a trampoline which does
  * unboxing before calling the method
  */
-static gpointer
-get_unbox_trampoline (MonoMethod *m, gpointer addr)
+gpointer
+mono_arch_get_unbox_trampoline (MonoGenericSharingContext *gsctx, MonoMethod *m, gpointer addr)
 {
        guint8 *code, *start;
        int this_pos = 3;
+       guint32 short_branch;
+       MonoDomain *domain = mono_domain_get ();
 
-       if (!m->signature->ret->byref && MONO_TYPE_ISSTRUCT (m->signature->ret))
+       if (MONO_TYPE_ISSTRUCT (mono_method_signature (m)->ret))
                this_pos = 4;
            
-       start = code = g_malloc (20);
+       mono_domain_lock (domain);
+       start = code = mono_code_manager_reserve (domain->code_mp, 20);
+       short_branch = branch_for_target_reachable (code + 4, addr);
+       if (short_branch)
+               mono_code_manager_commit (domain->code_mp, code, 20, 8);
+       mono_domain_unlock (domain);
 
-       ppc_load (code, ppc_r0, addr);
-       ppc_mtctr (code, ppc_r0);
-       ppc_addi (code, this_pos, this_pos, sizeof (MonoObject));
-       ppc_bcctr (code, 20, 0);
+       if (short_branch) {
+               ppc_addi (code, this_pos, this_pos, sizeof (MonoObject));
+               ppc_emit32 (code, short_branch);
+       } else {
+               ppc_load (code, ppc_r0, addr);
+               ppc_mtctr (code, ppc_r0);
+               ppc_addi (code, this_pos, this_pos, sizeof (MonoObject));
+               ppc_bcctr (code, 20, 0);
+       }
        mono_arch_flush_icache (start, code - start);
        g_assert ((code - start) <= 20);
        /*g_print ("unbox trampoline at %d for %s:%s\n", this_pos, m->klass->name, m->name);
@@ -68,67 +85,10 @@ get_unbox_trampoline (MonoMethod *m, gpointer addr)
        return start;
 }
 
-/* Stack size for trampoline function 
- * PPC_MINIMAL_STACK_SIZE + 16 (args + alignment to ppc_magic_trampoline)
- * 32 * 4 gregs + 13 * 8 fregs
- */
-#define STACK (320)
-
-/* Method-specific trampoline code fragment size */
-#define METHOD_TRAMPOLINE_SIZE 64
-
-/* Jump-specific trampoline code fragment size */
-#define JUMP_TRAMPOLINE_SIZE   64
-
-/**
- * ppc_magic_trampoline:
- * @code: pointer into caller code
- * @method: the method to translate
- * @sp: stack pointer
- *
- * This method is called by the function 'arch_create_jit_trampoline', which in
- * turn is called by the trampoline functions for virtual methods.
- * After having called the JIT compiler to compile the method, it inspects the
- * caller code to find the address of the method-specific part of the
- * trampoline vtable slot for this method, updates it with a fragment that calls
- * the newly compiled code and returns this address of the compiled code to
- * 'arch_create_jit_trampoline' 
- */
-static gpointer
-ppc_magic_trampoline (MonoMethod *method, guint32 *code, char *sp)
+void
+mono_arch_patch_callsite (guint8 *method_start, guint8 *code_ptr, guint8 *addr)
 {
-       char *o, *start;
-       gpointer addr;
-       int reg, offset = 0;
-
-       addr = mono_compile_method(method);
-       /*g_print ("method code at %p for %s:%s\n", addr, method->klass->name, method->name);*/
-       g_assert(addr);
-
-       if (!code){
-               return addr;
-       }
-
-       /* Locate the address of the method-specific trampoline. The call using
-       the vtable slot that took the processing flow to 'arch_create_jit_trampoline' 
-       looks something like this:
-       
-               mtlr rA                 ; Move rA (a register containing the
-                                       ; target address) to LR
-               blrl                    ; Call function at LR
-       
-       PowerPC instructions are 32-bit long, which means that a 32-bit target
-       address cannot be encoded as an immediate value (because we already
-       have spent some bits to encode the branch instruction!). That's why a
-       'b'ranch to the contents of the 'l'ink 'r'egister (with 'l'ink register
-       update) is needed, instead of a simpler 'branch immediate'. This
-       complicates our purpose here, because 'blrl' overwrites LR, which holds
-       the value we're interested in.
-       
-       Therefore, we need to locate the 'mtlr rA' instruction to know which
-       register LR was loaded from, and then retrieve the value from that
-       register */
-       
+       guint32 *code = (guint32*)code_ptr;
        /* This is the 'blrl' instruction */
        --code;
        
@@ -137,225 +97,154 @@ ppc_magic_trampoline (MonoMethod *method, guint32 *code, char *sp)
         */
        if (((*code) >> 26) == 18) {
                /*g_print ("direct patching\n");*/
-               ppc_patch (code, addr);
-               mono_arch_flush_icache (code, 4);
-               return addr;
+               ppc_patch ((char*)code, addr);
+               mono_arch_flush_icache ((char*)code, 4);
+               return;
        }
        
        /* Sanity check: instruction must be 'blrl' */
        g_assert(*code == 0x4e800021);
-       
-       /* OK, we're now at the 'blrl' instruction. Now walk backwards
-       till we get to a 'mtlr rA' */
-       for(; --code;) {
-               if((*code & 0x7c0803a6) == 0x7c0803a6) {
-                       gint16 soff;
-                       /* Here we are: we reached the 'mtlr rA'.
-                       Extract the register from the instruction */
-                       reg = (*code & 0x03e00000) >> 21;
-                       --code;
-                       /* ok, this is a lwz reg, offset (vtreg) 
-                        * it is emitted with:
-                        * ppc_emit32 (c, (32 << 26) | ((D) << 21) | ((a) << 16) | (guint16)(d))
-                        */
-                       soff = (*code & 0xffff);
-                       offset = soff;
-                       reg = (*code >> 16) & 0x1f;
-                       /*g_print ("patching reg is %d\n", reg);*/
-                       switch(reg) {
-                               case 0 : o = *((int *) (sp + STACK - 8));   break;
-                               case 3 : o = *((int *) (sp + STACK - 12));   break;
-                               case 4 : o = *((int *) (sp + STACK - 16));   break;
-                               case 5 : o = *((int *) (sp + STACK - 20));   break;
-                               case 6 : o = *((int *) (sp + STACK - 24));   break;
-                               case 7 : o = *((int *) (sp + STACK - 28));   break;
-                               case 8 : o = *((int *) (sp + STACK - 32));   break;
-                               case 9 : o = *((int *) (sp + STACK - 36));   break;
-                               case 10: o = *((int *) (sp + STACK - 40));   break;
-                               case 11: o = *((int *) (sp + STACK - 44));  break;
-                               case 12: o = *((int *) (sp + STACK - 48));  break;
-                               case 13: o = *((int *) (sp + STACK - 52));  break;
-                               case 14: o = *((int *) (sp + STACK - 56));  break;
-                               case 15: o = *((int *) (sp + STACK - 60));  break;
-                               case 16: o = *((int *) (sp + STACK - 64));  break;
-                               case 17: o = *((int *) (sp + STACK - 68));  break;
-                               case 18: o = *((int *) (sp + STACK - 72));  break;
-                               case 19: o = *((int *) (sp + STACK - 76));  break;
-                               case 20: o = *((int *) (sp + STACK - 80));  break;
-                               case 21: o = *((int *) (sp + STACK - 84));  break;
-                               case 22: o = *((int *) (sp + STACK - 88));  break;
-                               case 23: o = *((int *) (sp + STACK - 92));  break;
-                               case 24: o = *((int *) (sp + STACK - 96));  break;
-                               case 25: o = *((int *) (sp + STACK - 100));  break;
-                               case 26: o = *((int *) (sp + STACK - 104));  break;
-                               case 27: o = *((int *) (sp + STACK - 108));  break;
-                               case 28: o = *((int *) (sp + STACK - 112));  break;
-                               case 29: o = *((int *) (sp + STACK - 116));  break;
-                               case 30: o = *((int *) (sp + STACK - 120)); break;
-                               case 31: o = *((int *) (sp + STACK - 4));   break;
-                               default:
-                                       printf("%s: Unexpected register %d\n",
-                                               __FUNCTION__, reg);
-                                       g_assert_not_reached();
-                       }
-                       break;
-               }
-       }
 
-       /* this is not done for non-virtual calls, because in that case
-          we won't have an object, but the actual pointer to the 
-          valuetype as the this argument
-        */
-       if (method->klass->valuetype)
-               addr = get_unbox_trampoline (method, addr);
+       /* the thunk-less direct call sequence: lis/ori/mtlr/blrl */
+       if ((code [-1] >> 26) == 31 && (code [-2] >> 26) == 24 && (code [-3] >> 26) == 15) {
+               ppc_patch ((char*)code, addr);
+               return;
+       }
+       g_assert_not_reached ();
+}
 
-       o += offset;
-       *((gpointer *)o) = addr;
-       return addr;
+void
+mono_arch_patch_plt_entry (guint8 *code, guint8 *addr)
+{
+       g_assert_not_reached ();
 }
 
-static void
-ppc_class_init_trampoline (void *vtable, guint32 *code, char *sp)
+void
+mono_arch_nullify_class_init_trampoline (guint8 *code, gssize *regs)
 {
-       mono_runtime_class_init (vtable);
+       return;
+}
 
-#if 0
-       /* This is the 'bl' instruction */
-       --code;
-       
-       if (((*code) >> 26) == 18) {
-               ppc_ori (code, 0, 0, 0); /* nop */
-               mono_arch_flush_icache (code, 4);
-               return;
-       } else {
-               g_assert_not_reached ();
-       }
-#endif
+void
+mono_arch_nullify_plt_entry (guint8 *code)
+{
+       g_assert_not_reached ();
 }
 
-static guchar*
-create_trampoline_code (MonoTrampolineType tramp_type)
+/* Stack size for trampoline function 
+ * PPC_MINIMAL_STACK_SIZE + 16 (args + alignment to ppc_magic_trampoline)
+ * + MonoLMF + 14 fp regs + 13 gregs + alignment
+ * #define STACK (PPC_MINIMAL_STACK_SIZE + 4 * sizeof (gulong) + sizeof (MonoLMF) + 14 * sizeof (double) + 13 * (sizeof (gulong)))
+ * STACK would be 444 for 32 bit darwin
+ */
+#define STACK (448)
+
+/* Method-specific trampoline code fragment size */
+#define METHOD_TRAMPOLINE_SIZE 64
+
+/* Jump-specific trampoline code fragment size */
+#define JUMP_TRAMPOLINE_SIZE   64
+
+/*
+ * Stack frame description when the generic trampoline is called.
+ * caller frame
+ * --------------------
+ *  MonoLMF
+ *  -------------------
+ *  Saved FP registers 0-13
+ *  -------------------
+ *  Saved general registers 0-12
+ *  -------------------
+ *  param area for 3 args to ppc_magic_trampoline
+ *  -------------------
+ *  linkage area
+ *  -------------------
+ */
+guchar*
+mono_arch_create_trampoline_code (MonoTrampolineType tramp_type)
 {
        guint8 *buf, *code = NULL;
-       static guint8* generic_jump_trampoline = NULL;
-       static guint8 *generic_class_init_trampoline = NULL;
        int i, offset;
-
-       switch (tramp_type) {
-       case MONO_TRAMPOLINE_GENERIC:
-               if (mono_generic_trampoline_code)
-                       return mono_generic_trampoline_code;
-               break;
-       case MONO_TRAMPOLINE_JUMP:
-               if (generic_jump_trampoline)
-                       return generic_jump_trampoline;
-               break;
-       case MONO_TRAMPOLINE_CLASS_INIT:
-               if (generic_class_init_trampoline)
-                       return generic_class_init_trampoline;
-               break;
-       }
+       gpointer tramp_handler;
 
        if(!code) {
                /* Now we'll create in 'buf' the PowerPC trampoline code. This
                 is the trampoline code common to all methods  */
                
-               code = buf = g_malloc(512);
-               
-               /*-----------------------------------------------------------
-               STEP 0: First create a non-standard function prologue with a
-               stack size big enough to save our registers:
-               
-                       lr              (We'll be calling functions here, so we
-                                       must save it)
-                       r0              (See ppc_magic_trampoline)
-                       r1 (sp)         (Stack pointer - must save)
-                       r3-r10          Function arguments.
-                       r11-r31         (See ppc_magic_trampoline)
-                       method in r11   (See ppc_magic_trampoline)
-                       
-               This prologue is non-standard because r0 is not saved here - it
-               was saved in the method-specific trampoline code
-               -----------------------------------------------------------*/
+               code = buf = mono_global_codeman_reserve (512);
                
                ppc_stwu (buf, ppc_r1, -STACK, ppc_r1);
-               
-               /* Save r0 before modifying it - we will need its contents in
-               'ppc_magic_trampoline' */
-               ppc_stw  (buf, ppc_r0,  STACK - 8,   ppc_r1);
-               
-               ppc_stw  (buf, ppc_r31, STACK - 4, ppc_r1);
-               ppc_mr   (buf, ppc_r31, ppc_r1);
-               
-               /* Now save our registers. */
-               ppc_stw  (buf, ppc_r3,  STACK - 12,  ppc_r1);
-               ppc_stw  (buf, ppc_r4,  STACK - 16,  ppc_r1);
-               ppc_stw  (buf, ppc_r5,  STACK - 20,  ppc_r1);
-               ppc_stw  (buf, ppc_r6,  STACK - 24,  ppc_r1);
-               ppc_stw  (buf, ppc_r7,  STACK - 28,  ppc_r1);
-               ppc_stw  (buf, ppc_r8,  STACK - 32,  ppc_r1);
-               ppc_stw  (buf, ppc_r9,  STACK - 36,  ppc_r1);
-               ppc_stw  (buf, ppc_r10, STACK - 40,  ppc_r1);
-               /* STACK - 44 contains r11, which is set in the method-specific
-               part of the trampoline (see bellow this 'if' block) */
-               ppc_stw  (buf, ppc_r12, STACK - 48,  ppc_r1);
-               ppc_stw  (buf, ppc_r13, STACK - 52,  ppc_r1);
-               ppc_stw  (buf, ppc_r14, STACK - 56,  ppc_r1);
-               ppc_stw  (buf, ppc_r15, STACK - 60,  ppc_r1);
-               ppc_stw  (buf, ppc_r16, STACK - 64,  ppc_r1);
-               ppc_stw  (buf, ppc_r17, STACK - 68,  ppc_r1);
-               ppc_stw  (buf, ppc_r18, STACK - 72,  ppc_r1);
-               ppc_stw  (buf, ppc_r19, STACK - 76,  ppc_r1);
-               ppc_stw  (buf, ppc_r20, STACK - 80,  ppc_r1);
-               ppc_stw  (buf, ppc_r21, STACK - 84,  ppc_r1);
-               ppc_stw  (buf, ppc_r22, STACK - 88,  ppc_r1);
-               ppc_stw  (buf, ppc_r23, STACK - 92,  ppc_r1);
-               ppc_stw  (buf, ppc_r24, STACK - 96,  ppc_r1);
-               ppc_stw  (buf, ppc_r25, STACK - 100, ppc_r1);
-               ppc_stw  (buf, ppc_r26, STACK - 104, ppc_r1);
-               ppc_stw  (buf, ppc_r27, STACK - 108, ppc_r1);
-               ppc_stw  (buf, ppc_r28, STACK - 112, ppc_r1);
-               ppc_stw  (buf, ppc_r29, STACK - 116, ppc_r1);
-               ppc_stw  (buf, ppc_r30, STACK - 120, ppc_r1);
-               /* Save 'method' pseudo-parameter - the one passed in r11 */
-               ppc_stw  (buf, ppc_r11, STACK - 124, ppc_r1);
-
-               /* Save the FP registers */
-               offset = 124 + 4 + 8;
-               for (i = ppc_f1; i <= PPC_LAST_FPARG_REG; ++i) {
-                       ppc_stfd  (buf, i, STACK - offset, ppc_r1);
-                       offset += 8;
-               }
 
-               /*----------------------------------------------------------
-               STEP 1: call 'mono_get_lmf_addr()' to get the address of our
-               LMF. We'll need to restore it after the call to
-               'ppc_magic_trampoline' and before the call to the native
-               method.
-               ----------------------------------------------------------*/
-                               
-               /* Calculate the address and make the call. Keep in mind that
-               we're using r0, so we'll have to restore it before calling
-               'ppc_magic_trampoline' */
-               ppc_lis  (buf, ppc_r0, (guint32) mono_get_lmf_addr >> 16);
-               ppc_ori  (buf, ppc_r0, ppc_r0, (guint32) mono_get_lmf_addr & 0xffff);
+               /* start building the MonoLMF on the stack */
+               offset = STACK - sizeof (double) * MONO_SAVED_FREGS;
+               for (i = 14; i < 32; i++) {
+                       ppc_stfd (buf, i, offset, ppc_r1);
+                       offset += sizeof (double);
+               }
+               /* 
+                * now the integer registers.
+                */
+               offset = STACK - sizeof (MonoLMF) + G_STRUCT_OFFSET (MonoLMF, iregs);
+               ppc_stmw (buf, ppc_r13, ppc_r1, offset);
+
+               /* Now save the rest of the registers below the MonoLMF struct, first 14
+                * fp regs and then the 13 gregs.
+                */
+               offset = STACK - sizeof (MonoLMF) - (14 * sizeof (double));
+               for (i = 0; i < 14; i++) {
+                       ppc_stfd (buf, i, offset, ppc_r1);
+                       offset += sizeof (double);
+               }
+#define GREGS_OFFSET (STACK - sizeof (MonoLMF) - (14 * sizeof (double)) - (13 * sizeof (gulong)))
+               offset = GREGS_OFFSET;
+               for (i = 0; i < 13; i++) {
+                       ppc_stw (buf, i, offset, ppc_r1);
+                       offset += sizeof (gulong);
+               }
+               /* we got here through a jump to the ctr reg, we must save the lr
+                * in the parent frame (we do it here to reduce the size of the
+                * method-specific trampoline)
+                */
+               ppc_mflr (buf, ppc_r0);
+               ppc_stw (buf, ppc_r0, STACK + PPC_RET_ADDR_OFFSET, ppc_r1);
+
+               /* ok, now we can continue with the MonoLMF setup, mostly untouched 
+                * from emit_prolog in mini-ppc.c
+                */
+               ppc_load (buf, ppc_r0, mono_get_lmf_addr);
                ppc_mtlr (buf, ppc_r0);
                ppc_blrl (buf);
-
-               /* XXX Update LMF !!! */
-               
-               /*----------------------------------------------------------
-               STEP 2: call 'ppc_magic_trampoline()', who will compile the
-               code and fix the method vtable entry for us
-               ----------------------------------------------------------*/
-                               
-               /* Set arguments */
-               
-               /* Arg 1: MonoMethod *method. It was put in r11 by the
-               method-specific trampoline code, and then saved before the call
-               to mono_get_lmf_addr()'. Restore r11, by the way :-) */
-               ppc_lwz  (buf, ppc_r3,  STACK - 124, ppc_r1);
-               ppc_lwz  (buf, ppc_r11, STACK - 44,  ppc_r1);
+               /* we build the MonoLMF structure on the stack - see mini-ppc.h
+                * The pointer to the struct is put in ppc_r11.
+                */
+               ppc_addi (buf, ppc_r11, ppc_sp, STACK - sizeof (MonoLMF));
+               ppc_stw (buf, ppc_r3, G_STRUCT_OFFSET(MonoLMF, lmf_addr), ppc_r11);
+               /* new_lmf->previous_lmf = *lmf_addr */
+               ppc_lwz (buf, ppc_r0, G_STRUCT_OFFSET(MonoLMF, previous_lmf), ppc_r3);
+               ppc_stw (buf, ppc_r0, G_STRUCT_OFFSET(MonoLMF, previous_lmf), ppc_r11);
+               /* *(lmf_addr) = r11 */
+               ppc_stw (buf, ppc_r11, G_STRUCT_OFFSET(MonoLMF, previous_lmf), ppc_r3);
+               /* save method info (it's stored on the stack, so get it first and put it
+                * in r5 as it's the third argument to the function)
+                */
+               ppc_lwz (buf, ppc_r5, GREGS_OFFSET, ppc_r1);
+               if ((tramp_type == MONO_TRAMPOLINE_JIT) || (tramp_type == MONO_TRAMPOLINE_JUMP))
+                       ppc_stw (buf, ppc_r5, G_STRUCT_OFFSET(MonoLMF, method), ppc_r11);
+               ppc_stw (buf, ppc_sp, G_STRUCT_OFFSET(MonoLMF, ebp), ppc_r11);
+               /* save the IP (caller ip) */
+               if (tramp_type == MONO_TRAMPOLINE_JUMP) {
+                       ppc_li (buf, ppc_r0, 0);
+               } else {
+                       ppc_lwz (buf, ppc_r0, STACK + PPC_RET_ADDR_OFFSET, ppc_r1);
+               }
+               ppc_stw (buf, ppc_r0, G_STRUCT_OFFSET(MonoLMF, eip), ppc_r11);
+
+               /*
+                * Now we're ready to call trampoline (gssize *regs, guint8 *code, gpointer value, guint8 *tramp)
+                * Note that the last argument is unused.
+                */
+               /* Arg 1: a pointer to the registers */
+               ppc_addi (buf, ppc_r3, ppc_r1, GREGS_OFFSET);
                
                /* Arg 2: code (next address to the instruction that called us) */
                if (tramp_type == MONO_TRAMPOLINE_JUMP) {
@@ -364,91 +253,68 @@ create_trampoline_code (MonoTrampolineType tramp_type)
                        ppc_lwz  (buf, ppc_r4, STACK + PPC_RET_ADDR_OFFSET, ppc_r1);
                }
                
-               /* Arg 3: stack pointer */
-               ppc_mr   (buf, ppc_r5, ppc_r1);
-               
-               /* Calculate call address, restore r0 and call
-               'ppc_magic_trampoline'. Return value will be in r3 */
-               if (tramp_type == MONO_TRAMPOLINE_CLASS_INIT) {
-                       ppc_lis  (buf, ppc_r0, (guint32) ppc_class_init_trampoline >> 16);
-                       ppc_ori  (buf, ppc_r0, ppc_r0, (guint32) ppc_class_init_trampoline & 0xffff);
-               } else {
-                       ppc_lis  (buf, ppc_r0, (guint32) ppc_magic_trampoline >> 16);
-                       ppc_ori  (buf, ppc_r0, ppc_r0, (guint32) ppc_magic_trampoline & 0xffff);
-               }
+               /* Arg 3: MonoMethod *method. It was put in r5 already above */
+               /*ppc_mr  (buf, ppc_r5, ppc_r5);*/
+
+               tramp_handler = mono_get_trampoline_func (tramp_type);
+               ppc_lis  (buf, ppc_r0, (guint32) tramp_handler >> 16);
+               ppc_ori  (buf, ppc_r0, ppc_r0, (guint32) tramp_handler & 0xffff);
                ppc_mtlr (buf, ppc_r0);
-               ppc_lwz  (buf, ppc_r0, STACK - 8,  ppc_r1);
                ppc_blrl (buf);
                
-               /* OK, code address is now on r3. Move it to r0, so that we
-               can restore r3 and use it from r0 later */
-               ppc_mr   (buf, ppc_r0, ppc_r3);
-               
+               /* OK, code address is now on r3. Move it to the counter reg
+                * so it will be ready for the final jump: this is safe since we
+                * won't do any more calls.
+                */
+               ppc_mtctr (buf, ppc_r3);
+
+               /*
+                * Now we restore the MonoLMF (see emit_epilogue in mini-ppc.c)
+                * and the rest of the registers, so the method called will see
+                * the same state as before we executed.
+                * The pointer to MonoLMF is in ppc_r11.
+                */
+               ppc_addi (buf, ppc_r11, ppc_r1, STACK - sizeof (MonoLMF));
+               /* r5 = previous_lmf */
+               ppc_lwz (buf, ppc_r5, G_STRUCT_OFFSET(MonoLMF, previous_lmf), ppc_r11);
+               /* r6 = lmf_addr */
+               ppc_lwz (buf, ppc_r6, G_STRUCT_OFFSET(MonoLMF, lmf_addr), ppc_r11);
+               /* *(lmf_addr) = previous_lmf */
+               ppc_stw (buf, ppc_r5, G_STRUCT_OFFSET(MonoLMF, previous_lmf), ppc_r6);
+               /* restore iregs */
+               ppc_lmw (buf, ppc_r13, ppc_r11, G_STRUCT_OFFSET(MonoLMF, iregs));
+               /* restore fregs */
+               for (i = 14; i < 32; i++) {
+                       ppc_lfd (buf, i, G_STRUCT_OFFSET(MonoLMF, fregs) + ((i-14) * sizeof (gdouble)), ppc_r11);
+               }
 
-               /*----------------------------------------------------------
-               STEP 3: Restore the LMF
-               ----------------------------------------------------------*/
-               
-               /* XXX Do it !!! */
-               
-               /*----------------------------------------------------------
-               STEP 4: call the compiled method
-               ----------------------------------------------------------*/
-               
-               /* Restore registers */
-
-               ppc_lwz  (buf, ppc_r3,  STACK - 12,  ppc_r1);
-               ppc_lwz  (buf, ppc_r4,  STACK - 16,  ppc_r1);
-               ppc_lwz  (buf, ppc_r5,  STACK - 20,  ppc_r1);
-               ppc_lwz  (buf, ppc_r6,  STACK - 24,  ppc_r1);
-               ppc_lwz  (buf, ppc_r7,  STACK - 28,  ppc_r1);
-               ppc_lwz  (buf, ppc_r8,  STACK - 32,  ppc_r1);
-               ppc_lwz  (buf, ppc_r9,  STACK - 36,  ppc_r1);
-               ppc_lwz  (buf, ppc_r10, STACK - 40,  ppc_r1);
-               ppc_lwz  (buf, ppc_r11, STACK - 44,  ppc_r1);
-               ppc_lwz  (buf, ppc_r12, STACK - 48,  ppc_r1);
-               ppc_stw  (buf, ppc_r13, STACK - 52,  ppc_r1);
-               
-               /* Restore the FP registers */
-               offset = 124 + 4 + 8;
-               for (i = ppc_f1; i <= PPC_LAST_FPARG_REG; ++i) {
-                       ppc_lfd  (buf, i, STACK - offset, ppc_r1);
-                       offset += 8;
+               /* restore the volatile registers, we skip r1, of course */
+               offset = STACK - sizeof (MonoLMF) - (14 * sizeof (double));
+               for (i = 0; i < 14; i++) {
+                       ppc_lfd (buf, i, offset, ppc_r1);
+                       offset += sizeof (double);
+               }
+               offset = STACK - sizeof (MonoLMF) - (14 * sizeof (double)) - (13 * sizeof (gulong));
+               ppc_lwz (buf, ppc_r0, offset, ppc_r1);
+               offset += 2 * sizeof (gulong);
+               for (i = 2; i < 13; i++) {
+                       ppc_lwz (buf, i, offset, ppc_r1);
+                       offset += sizeof (gulong);
                }
-               /* We haven't touched any of these, so there's no need to
-               restore them */
-               
-               ppc_lwz  (buf, ppc_r14, STACK - 56,  ppc_r1);
-               ppc_lwz  (buf, ppc_r15, STACK - 60,  ppc_r1);
-               ppc_lwz  (buf, ppc_r16, STACK - 64,  ppc_r1);
-               ppc_lwz  (buf, ppc_r17, STACK - 68,  ppc_r1);
-               ppc_lwz  (buf, ppc_r18, STACK - 72,  ppc_r1);
-               ppc_lwz  (buf, ppc_r19, STACK - 76,  ppc_r1);
-               ppc_lwz  (buf, ppc_r20, STACK - 80,  ppc_r1);
-               ppc_lwz  (buf, ppc_r21, STACK - 84,  ppc_r1);
-               ppc_lwz  (buf, ppc_r22, STACK - 88,  ppc_r1);
-               ppc_lwz  (buf, ppc_r23, STACK - 92,  ppc_r1);
-               ppc_lwz  (buf, ppc_r24, STACK - 96,  ppc_r1);
-               ppc_lwz  (buf, ppc_r25, STACK - 100, ppc_r1);
-               ppc_lwz  (buf, ppc_r26, STACK - 104, ppc_r1);
-               ppc_lwz  (buf, ppc_r27, STACK - 108, ppc_r1);
-               ppc_lwz  (buf, ppc_r28, STACK - 112, ppc_r1);
-               ppc_lwz  (buf, ppc_r29, STACK - 116, ppc_r1);
-               ppc_lwz  (buf, ppc_r30, STACK - 120, ppc_r1);
-               ppc_lwz  (buf, ppc_r31, STACK - 4, ppc_r1);
-               
 
                /* Non-standard function epilogue. Instead of doing a proper
-               return, we just call the compiled code, so
-               that, when it finishes, the method returns here. */
-       
-               /* Restore stack pointer, r31, LR and jump to the code */
+                * return, we just jump to the compiled code.
+                */
+               /* Restore stack pointer and LR and jump to the code */
                ppc_lwz  (buf, ppc_r1,  0, ppc_r1);
-               //ppc_lwz  (buf, ppc_r31, -4, ppc_r1);
                ppc_lwz  (buf, ppc_r11, PPC_RET_ADDR_OFFSET, ppc_r1);
                ppc_mtlr (buf, ppc_r11);
-               ppc_mtctr (buf, ppc_r0);
-               ppc_bcctr (buf, 20, 0);
+               if (tramp_type == MONO_TRAMPOLINE_CLASS_INIT) {
+                       ppc_blr (buf);
+               } else {
+                       ppc_bcctr (buf, 20, 0);
+               }
+
                /* Flush instruction cache, since we've generated code */
                mono_arch_flush_icache (code, buf - code);
        
@@ -456,182 +322,63 @@ create_trampoline_code (MonoTrampolineType tramp_type)
                g_assert ((buf - code) <= 512);
        }
 
-       switch (tramp_type) {
-       case MONO_TRAMPOLINE_GENERIC:
-               mono_generic_trampoline_code = code;
-               break;
-       case MONO_TRAMPOLINE_JUMP:
-               generic_jump_trampoline = code;
-               break;
-       case MONO_TRAMPOLINE_CLASS_INIT:
-               generic_class_init_trampoline = code;
-               break;
-       }
-
        return code;
 }
 
-static MonoJitInfo*
-create_specific_tramp (MonoMethod *method, guint8* tramp, MonoDomain *domain) {
-       guint8 *code, *buf;
-       MonoJitInfo *ji;
+#define TRAMPOLINE_SIZE 24
+gpointer
+mono_arch_create_specific_trampoline (gpointer arg1, MonoTrampolineType tramp_type, MonoDomain *domain, guint32 *code_len)
+{
+       guint8 *code, *buf, *tramp;
+       guint32 short_branch;
+
+       tramp = mono_get_trampoline_code (tramp_type);
 
        mono_domain_lock (domain);
-       code = buf = mono_code_manager_reserve (domain->code_mp, METHOD_TRAMPOLINE_SIZE);
+       code = buf = mono_code_manager_reserve_align (domain->code_mp, TRAMPOLINE_SIZE, 4);
+       short_branch = branch_for_target_reachable (code + 8, tramp);
+       if (short_branch)
+               mono_code_manager_commit (domain->code_mp, code, TRAMPOLINE_SIZE, 12);
        mono_domain_unlock (domain);
 
-       /* Save r11. There's nothing magic in the '44', its just an arbitrary
-       position - see above */
-       ppc_stw  (buf, ppc_r11, -44,  ppc_r1);
-       
-       /* Now save LR - we'll overwrite it now */
-       ppc_mflr (buf, ppc_r11);
-       ppc_stw  (buf, ppc_r11, PPC_RET_ADDR_OFFSET, ppc_r1);
-       
-       /* Prepare the jump to the generic trampoline code.*/
-       ppc_lis  (buf, ppc_r11, (guint32) tramp >> 16);
-       ppc_ori  (buf, ppc_r11, ppc_r11, (guint32) tramp & 0xffff);
-       ppc_mtlr (buf, ppc_r11);
+       if (short_branch) {
+               ppc_lis  (buf, ppc_r0, (guint32) arg1 >> 16);
+               ppc_ori  (buf, ppc_r0, ppc_r0, (guint32) arg1 & 0xffff);
+               ppc_emit32 (buf, short_branch);
+       } else {
+               /* Prepare the jump to the generic trampoline code.*/
+               ppc_lis  (buf, ppc_r0, (guint32) tramp >> 16);
+               ppc_ori  (buf, ppc_r0, ppc_r0, (guint32) tramp & 0xffff);
+               ppc_mtctr (buf, ppc_r0);
        
-       /* And finally put 'method' in r11 and fly! */
-       ppc_lis  (buf, ppc_r11, (guint32) method >> 16);
-       ppc_ori  (buf, ppc_r11, ppc_r11, (guint32) method & 0xffff);
-       ppc_blr  (buf);
+               /* And finally put 'arg1' in r0 and fly! */
+               ppc_lis  (buf, ppc_r0, (guint32) arg1 >> 16);
+               ppc_ori  (buf, ppc_r0, ppc_r0, (guint32) arg1 & 0xffff);
+               ppc_bcctr (buf, 20, 0);
+       }
        
        /* Flush instruction cache, since we've generated code */
        mono_arch_flush_icache (code, buf - code);
 
-       g_assert ((buf - code) <= JUMP_TRAMPOLINE_SIZE);
-
-       ji = g_new0 (MonoJitInfo, 1);
-       ji->method = method;
-       ji->code_start = code;
-       ji->code_size = buf - code;
-
-       mono_jit_stats.method_trampolines++;
+       g_assert ((buf - code) <= TRAMPOLINE_SIZE);
+       if (code_len)
+               *code_len = buf - code;
 
-       return ji;
-}
-
-MonoJitInfo*
-mono_arch_create_jump_trampoline (MonoMethod *method)
-{
-       guint8 *tramp;
-       MonoDomain* domain = mono_domain_get ();
-       
-       tramp = create_trampoline_code (MONO_TRAMPOLINE_JUMP);
-       return create_specific_tramp (method, tramp, domain);
+       return code;
 }
 
-/**
- * arch_create_jit_trampoline:
- * @method: pointer to the method info
- *
- * Creates a trampoline function for virtual methods. If the created
- * code is called it first starts JIT compilation of method,
- * and then calls the newly created method. It also replaces the
- * corresponding vtable entry (see ppc_magic_trampoline).
- *
- * A trampoline consists of two parts: a main fragment, shared by all method
- * trampolines, and some code specific to each method, which hard-codes a
- * reference to that method and then calls the main fragment.
- *
- * The main fragment contains a call to 'ppc_magic_trampoline', which performs
- * call to the JIT compiler and substitutes the method-specific fragment with
- * some code that directly calls the JIT-compiled method.
- * 
- * Returns: a pointer to the newly created code 
- */
 gpointer
-mono_arch_create_jit_trampoline (MonoMethod *method)
+mono_arch_create_rgctx_lazy_fetch_trampoline (guint32 encoded_offset)
 {
-       guint8 *tramp;
-       MonoJitInfo *ji;
-       MonoDomain* domain = mono_domain_get ();
-
-       /* previously created trampoline code */
-       if (method->info)
-               return method->info;
-
-       if (method->iflags & METHOD_IMPL_ATTRIBUTE_SYNCHRONIZED)
-               return mono_arch_create_jit_trampoline (mono_marshal_get_synchronized_wrapper (method));
-
-       tramp = create_trampoline_code (MONO_TRAMPOLINE_GENERIC);
-       /* FIXME: should pass the domain down tot his function */
-       ji = create_specific_tramp (method, tramp, domain);
-       /* Store trampoline address */
-       method->info = ji->code_start;
-       return ji->code_start;
+       /* FIXME: implement! */
+       g_assert_not_reached ();
+       return NULL;
 }
 
-/**
- * mono_arch_create_class_init_trampoline:
- *  @vtable: the type to initialize
- *
- * Creates a trampoline function to run a type initializer. 
- * If the trampoline is called, it calls mono_runtime_class_init with the
- * given vtable, then patches the caller code so it does not get called any
- * more.
- * 
- * Returns: a pointer to the newly created code 
- */
-gpointer
-mono_arch_create_class_init_trampoline (MonoVTable *vtable)
+guint32
+mono_arch_get_rgctx_lazy_fetch_offset (gpointer *regs)
 {
-       guint8 *code, *buf, *tramp;
-
-       tramp = create_trampoline_code (MONO_TRAMPOLINE_CLASS_INIT);
-
-       /* This is the method-specific part of the trampoline. Its purpose is
-       to provide the generic part with the MonoMethod *method pointer. We'll
-       use r11 to keep that value, for instance. However, the generic part of
-       the trampoline relies on r11 having the same value it had before coming
-       here, so we must save it before. */
-       //code = buf = g_malloc(METHOD_TRAMPOLINE_SIZE);
-       mono_domain_lock (vtable->domain);
-       code = buf = mono_code_manager_reserve (vtable->domain->code_mp, METHOD_TRAMPOLINE_SIZE);
-       mono_domain_unlock (vtable->domain);
-
-       ppc_mflr (buf, ppc_r4);
-       ppc_stw  (buf, ppc_r4, PPC_RET_ADDR_OFFSET, ppc_sp);
-       ppc_stwu (buf, ppc_sp, -32, ppc_sp);
-       ppc_load (buf, ppc_r3, vtable);
-       ppc_load (buf, ppc_r5, 0);
-
-       ppc_load (buf, ppc_r0, ppc_class_init_trampoline);
-       ppc_mtlr (buf, ppc_r0);
-       ppc_blrl (buf);
-
-       ppc_lwz (buf, ppc_r0, 32 + PPC_RET_ADDR_OFFSET, ppc_sp);
-       ppc_mtlr (buf, ppc_r0);
-       ppc_addic (buf, ppc_sp, ppc_sp, 32);
-       ppc_blr (buf);
-
-       /* Flush instruction cache, since we've generated code */
-       mono_arch_flush_icache (code, buf - code);
-               
-       /* Sanity check */
-       g_assert ((buf - code) <= METHOD_TRAMPOLINE_SIZE);
-
-       mono_jit_stats.method_trampolines++;
-
-       return code;
+       /* FIXME: implement! */
+       g_assert_not_reached ();
+       return 0;
 }
-
-/*
- * This method is only called when running in the Mono Debugger.
- */
-gpointer
-mono_debugger_create_notification_function (gpointer *notification_address)
-{
-       guint8 *ptr, *buf;
-
-       ptr = buf = g_malloc0 (16);
-       ppc_break (buf);
-       if (notification_address)
-               *notification_address = buf;
-       ppc_blr (buf);
-
-       return ptr;
-}
-