2009-06-12 Bill Holmes <billholmes54@gmail.com>
[mono.git] / mono / mini / tramp-arm.c
1 /*
2  * tramp-arm.c: JIT trampoline code for ARM
3  *
4  * Authors:
5  *   Paolo Molaro (lupus@ximian.com)
6  *
7  * (C) 2001 Ximian, Inc.
8  */
9
10 #include <config.h>
11 #include <glib.h>
12
13 #include <mono/metadata/appdomain.h>
14 #include <mono/metadata/marshal.h>
15 #include <mono/metadata/tabledefs.h>
16 #include <mono/arch/arm/arm-codegen.h>
17
18 #include "mini.h"
19 #include "mini-arm.h"
20
21 static guint8* nullified_class_init_trampoline;
22
23 /*
24  * Return the instruction to jump from code to target, 0 if not
25  * reachable with a single instruction
26  */
27 static guint32
28 branch_for_target_reachable (guint8 *branch, guint8 *target)
29 {
30         gint diff = target - branch - 8;
31         g_assert ((diff & 3) == 0);
32         if (diff >= 0) {
33                 if (diff <= 33554431)
34                         return (ARMCOND_AL << ARMCOND_SHIFT) | (ARM_BR_TAG) | (diff >> 2);
35         } else {
36                 /* diff between 0 and -33554432 */
37                 if (diff >= -33554432)
38                         return (ARMCOND_AL << ARMCOND_SHIFT) | (ARM_BR_TAG) | ((diff >> 2) & ~0xff000000);
39         }
40         return 0;
41 }
42
43 /*
44  * mono_arch_get_unbox_trampoline:
45  * @gsctx: the generic sharing context
46  * @m: method pointer
47  * @addr: pointer to native code for @m
48  *
49  * when value type methods are called through the vtable we need to unbox the
50  * this argument. This method returns a pointer to a trampoline which does
51  * unboxing before calling the method
52  */
53 gpointer
54 mono_arch_get_unbox_trampoline (MonoGenericSharingContext *gsctx, MonoMethod *m, gpointer addr)
55 {
56         guint8 *code, *start;
57         int this_pos = 0;
58         MonoDomain *domain = mono_domain_get ();
59
60         if (MONO_TYPE_ISSTRUCT (mono_method_signature (m)->ret))
61                 this_pos = 1;
62
63         start = code = mono_domain_code_reserve (domain, 16);
64
65         ARM_LDR_IMM (code, ARMREG_IP, ARMREG_PC, 4);
66         ARM_ADD_REG_IMM8 (code, this_pos, this_pos, sizeof (MonoObject));
67         ARM_MOV_REG_REG (code, ARMREG_PC, ARMREG_IP);
68         *(guint32*)code = (guint32)addr;
69         code += 4;
70         mono_arch_flush_icache (start, code - start);
71         g_assert ((code - start) <= 16);
72         /*g_print ("unbox trampoline at %d for %s:%s\n", this_pos, m->klass->name, m->name);
73         g_print ("unbox code is at %p for method at %p\n", start, addr);*/
74
75         return start;
76 }
77
78 gpointer
79 mono_arch_get_static_rgctx_trampoline (MonoMethod *m, MonoMethodRuntimeGenericContext *mrgctx, gpointer addr)
80 {
81         guint8 *code, *start;
82         int buf_len;
83
84         MonoDomain *domain = mono_domain_get ();
85
86         buf_len = 16;
87
88         start = code = mono_domain_code_reserve (domain, buf_len);
89
90         ARM_LDR_IMM (code, MONO_ARCH_RGCTX_REG, ARMREG_PC, 0);
91         ARM_LDR_IMM (code, ARMREG_PC, ARMREG_PC, 0);
92         *(guint32*)code = (guint32)mrgctx;
93         code += 4;
94         *(guint32*)code = (guint32)addr;
95         code += 4;
96
97         g_assert ((code - start) <= buf_len);
98
99         mono_arch_flush_icache (start, code - start);
100
101         return start;
102 }
103
104 void
105 mono_arch_patch_callsite (guint8 *method_start, guint8 *code_ptr, guint8 *addr)
106 {
107         guint32 *code = (guint32*)code_ptr;
108
109         /* This is the 'bl' or the 'mov pc' instruction */
110         --code;
111         
112         /*
113          * Note that methods are called also with the bl opcode.
114          */
115         if ((((*code) >> 25)  & 7) == 5) {
116                 /*g_print ("direct patching\n");*/
117                 arm_patch ((guint8*)code, addr);
118                 mono_arch_flush_icache ((guint8*)code, 4);
119                 return;
120         }
121
122         if ((((*code) >> 20) & 0xFF) == 0x12) {
123                 /*g_print ("patching bx\n");*/
124                 arm_patch ((guint8*)code, addr);
125                 mono_arch_flush_icache ((guint8*)(code - 2), 4);
126                 return;
127         }
128
129         g_assert_not_reached ();
130 }
131
132 void
133 mono_arch_patch_plt_entry (guint8 *code, guint8 *addr)
134 {
135         guint8 *jump_entry;
136
137         /* Patch the jump table entry used by the plt entry */
138         if (*(guint32*)code == 0xe59fc000) {
139                 /* ARM_LDR_IMM (code, ARMREG_IP, ARMREG_PC, 0); */
140                 guint32 offset = ((guint32*)code)[2];
141                 
142                 jump_entry = code + offset + 12;
143         } else {
144                 g_assert_not_reached ();
145         }
146
147         *(guint8**)jump_entry = addr;
148 }
149
150 void
151 mono_arch_nullify_class_init_trampoline (guint8 *code, gssize *regs)
152 {
153         mono_arch_patch_callsite (NULL, code, nullified_class_init_trampoline);
154 }
155
156 void
157 mono_arch_nullify_plt_entry (guint8 *code)
158 {
159         if (mono_aot_only && !nullified_class_init_trampoline)
160                 nullified_class_init_trampoline = mono_aot_get_named_code ("nullified_class_init_trampoline");
161
162         mono_arch_patch_plt_entry (code, nullified_class_init_trampoline);
163 }
164
165 /* Stack size for trampoline function 
166  */
167 #define STACK (sizeof (MonoLMF))
168
169 /* Method-specific trampoline code fragment size */
170 #define METHOD_TRAMPOLINE_SIZE 64
171
172 /* Jump-specific trampoline code fragment size */
173 #define JUMP_TRAMPOLINE_SIZE   64
174
175 #define GEN_TRAMP_SIZE 192
176
177 /*
178  * Stack frame description when the generic trampoline is called.
179  * caller frame
180  * ------------------- old sp
181  *  MonoLMF
182  * ------------------- sp
183  */
184 guchar*
185 mono_arch_create_trampoline_code (MonoTrampolineType tramp_type)
186 {
187         MonoJumpInfo *ji;
188         guint32 code_size;
189         guchar *code;
190         GSList *unwind_ops, *l;
191
192         code = mono_arch_create_trampoline_code_full (tramp_type, &code_size, &ji, &unwind_ops, FALSE);
193
194         mono_save_trampoline_xdebug_info ("<generic_trampoline>", code, code_size, unwind_ops);
195
196         for (l = unwind_ops; l; l = l->next)
197                 g_free (l->data);
198         g_slist_free (unwind_ops);
199
200         return code;
201 }
202         
203 guchar*
204 mono_arch_create_trampoline_code_full (MonoTrampolineType tramp_type, guint32 *code_size, MonoJumpInfo **ji, GSList **out_unwind_ops, gboolean aot)
205 {
206         guint8 *buf, *code = NULL;
207         guint8 *load_get_lmf_addr, *load_trampoline;
208         gpointer *constants;
209         GSList *unwind_ops = NULL;
210         int cfa_offset;
211
212         *ji = NULL;
213
214         /* Now we'll create in 'buf' the ARM trampoline code. This
215          is the trampoline code common to all methods  */
216         
217         code = buf = mono_global_codeman_reserve (GEN_TRAMP_SIZE);
218
219         /*
220          * At this point lr points to the specific arg and sp points to the saved
221          * regs on the stack (all but PC and SP). The original LR value has been
222          * saved as sp + LR_OFFSET by the push in the specific trampoline
223          */
224 #define LR_OFFSET (sizeof (gpointer) * 13)
225
226         // FIXME: Finish the unwind info, the current info allows us to unwind
227         // when the trampoline is not in the epilog
228
229         // CFA = SP + (num registers pushed) * 4
230         cfa_offset = 14 * sizeof (gpointer);
231         mono_add_unwind_op_def_cfa (unwind_ops, code, buf, ARMREG_SP, cfa_offset);
232         // PC saved at sp+LR_OFFSET
233         mono_add_unwind_op_offset (unwind_ops, code, buf, ARMREG_LR, -4);
234
235         ARM_MOV_REG_REG (code, ARMREG_V1, ARMREG_SP);
236         if (aot && tramp_type != MONO_TRAMPOLINE_GENERIC_CLASS_INIT) {
237                 /* 
238                  * The trampoline contains a pc-relative offset to the got slot 
239                  * preceeding the got slot where the value is stored. The offset can be
240                  * found at [lr + 0].
241                  */
242                 ARM_LDR_IMM (code, ARMREG_V2, ARMREG_LR, 0);
243                 ARM_ADD_REG_IMM (code, ARMREG_V2, ARMREG_V2, 4, 0);
244                 ARM_LDR_REG_REG (code, ARMREG_V2, ARMREG_V2, ARMREG_LR);
245         } else {
246                 if (tramp_type != MONO_TRAMPOLINE_GENERIC_CLASS_INIT)
247                         ARM_LDR_IMM (code, ARMREG_V2, ARMREG_LR, 0);
248                 else
249                         ARM_MOV_REG_REG (code, ARMREG_V2, MONO_ARCH_VTABLE_REG);
250         }
251         ARM_LDR_IMM (code, ARMREG_V3, ARMREG_SP, LR_OFFSET);
252
253         /* ok, now we can continue with the MonoLMF setup, mostly untouched 
254          * from emit_prolog in mini-arm.c
255          * This is a synthetized call to mono_get_lmf_addr ()
256          */
257         if (aot) {
258                 *ji = mono_patch_info_list_prepend (*ji, code - buf, MONO_PATCH_INFO_JIT_ICALL_ADDR, "mono_get_lmf_addr");
259                 ARM_LDR_IMM (code, ARMREG_R0, ARMREG_PC, 0);
260                 ARM_B (code, 0);
261                 *(gpointer*)code = NULL;
262                 code += 4;
263                 ARM_LDR_REG_REG (code, ARMREG_R0, ARMREG_PC, ARMREG_R0);
264         } else {
265                 load_get_lmf_addr = code;
266                 code += 4;
267         }
268         ARM_MOV_REG_REG (code, ARMREG_LR, ARMREG_PC);
269         ARM_MOV_REG_REG (code, ARMREG_PC, ARMREG_R0);
270
271         /* we build the MonoLMF structure on the stack - see mini-arm.h
272          * The pointer to the struct is put in r1.
273          * the iregs array is already allocated on the stack by push.
274          */
275         ARM_SUB_REG_IMM8 (code, ARMREG_SP, ARMREG_SP, sizeof (MonoLMF) - sizeof (guint) * 14);
276         cfa_offset += sizeof (MonoLMF) - sizeof (guint) * 14;
277         mono_add_unwind_op_def_cfa_offset (unwind_ops, code, buf, cfa_offset);
278         ARM_ADD_REG_IMM8 (code, ARMREG_R1, ARMREG_SP, STACK - sizeof (MonoLMF));
279         /* r0 is the result from mono_get_lmf_addr () */
280         ARM_STR_IMM (code, ARMREG_R0, ARMREG_R1, G_STRUCT_OFFSET (MonoLMF, lmf_addr));
281         /* new_lmf->previous_lmf = *lmf_addr */
282         ARM_LDR_IMM (code, ARMREG_R2, ARMREG_R0, G_STRUCT_OFFSET (MonoLMF, previous_lmf));
283         ARM_STR_IMM (code, ARMREG_R2, ARMREG_R1, G_STRUCT_OFFSET (MonoLMF, previous_lmf));
284         /* *(lmf_addr) = r1 */
285         ARM_STR_IMM (code, ARMREG_R1, ARMREG_R0, G_STRUCT_OFFSET (MonoLMF, previous_lmf));
286         /* save method info (it's in v2) */
287         if ((tramp_type == MONO_TRAMPOLINE_JIT) || (tramp_type == MONO_TRAMPOLINE_JUMP))
288                 ARM_STR_IMM (code, ARMREG_V2, ARMREG_R1, G_STRUCT_OFFSET (MonoLMF, method));
289         ARM_STR_IMM (code, ARMREG_SP, ARMREG_R1, G_STRUCT_OFFSET (MonoLMF, ebp));
290         /* save the IP (caller ip) */
291         if (tramp_type == MONO_TRAMPOLINE_JUMP) {
292                 ARM_MOV_REG_IMM8 (code, ARMREG_R2, 0);
293         } else {
294                 /* assumes STACK == sizeof (MonoLMF) */
295                 ARM_LDR_IMM (code, ARMREG_R2, ARMREG_SP, (G_STRUCT_OFFSET (MonoLMF, iregs) + 13*4));
296         }
297         ARM_STR_IMM (code, ARMREG_R2, ARMREG_R1, G_STRUCT_OFFSET (MonoLMF, eip));
298
299         /*
300          * Now we're ready to call xxx_trampoline ().
301          */
302         /* Arg 1: the saved registers. It was put in v1 */
303         ARM_MOV_REG_REG (code, ARMREG_R0, ARMREG_V1);
304
305         /* Arg 2: code (next address to the instruction that called us) */
306         if (tramp_type == MONO_TRAMPOLINE_JUMP) {
307                 ARM_MOV_REG_IMM8 (code, ARMREG_R1, 0);
308         } else {
309                 ARM_MOV_REG_REG (code, ARMREG_R1, ARMREG_V3);
310         }
311         
312         /* Arg 3: the specific argument, stored in v2
313          */
314         ARM_MOV_REG_REG (code, ARMREG_R2, ARMREG_V2);
315
316         if (aot) {
317                 char *icall_name = g_strdup_printf ("trampoline_func_%d", tramp_type);
318                 *ji = mono_patch_info_list_prepend (*ji, code - buf, MONO_PATCH_INFO_JIT_ICALL_ADDR, icall_name);
319                 ARM_LDR_IMM (code, ARMREG_IP, ARMREG_PC, 0);
320                 ARM_B (code, 0);
321                 *(gpointer*)code = NULL;
322                 code += 4;
323                 ARM_LDR_REG_REG (code, ARMREG_IP, ARMREG_PC, ARMREG_IP);
324         } else {
325                 load_trampoline = code;
326                 code += 4;
327         }
328
329         ARM_MOV_REG_REG (code, ARMREG_LR, ARMREG_PC);
330         ARM_MOV_REG_REG (code, ARMREG_PC, ARMREG_IP);
331         
332         /* OK, code address is now on r0. Move it to the place on the stack
333          * where IP was saved (it is now no more useful to us and it can be
334          * clobbered). This way we can just restore all the regs in one inst
335          * and branch to IP.
336          */
337         ARM_STR_IMM (code, ARMREG_R0, ARMREG_V1, (ARMREG_R12 * 4));
338
339         /* Check for thread interruption */
340         /* This is not perf critical code so no need to check the interrupt flag */
341         /* 
342          * Have to call the _force_ variant, since there could be a protected wrapper on the top of the stack.
343          */
344         if (aot) {
345                 *ji = mono_patch_info_list_prepend (*ji, code - buf, MONO_PATCH_INFO_JIT_ICALL_ADDR, "mono_thread_force_interruption_checkpoint");
346                 ARM_LDR_IMM (code, ARMREG_IP, ARMREG_PC, 0);
347                 ARM_B (code, 0);
348                 *(gpointer*)code = NULL;
349                 code += 4;
350                 ARM_LDR_REG_REG (code, ARMREG_IP, ARMREG_PC, ARMREG_IP);
351         } else {
352                 ARM_LDR_IMM (code, ARMREG_IP, ARMREG_PC, 0);
353                 ARM_B (code, 0);
354                 *(gpointer*)code = mono_thread_force_interruption_checkpoint;
355                 code += 4;
356         }
357         ARM_MOV_REG_REG (code, ARMREG_LR, ARMREG_PC);
358         ARM_MOV_REG_REG (code, ARMREG_PC, ARMREG_IP);
359
360         /*
361          * Now we restore the MonoLMF (see emit_epilogue in mini-arm.c)
362          * and the rest of the registers, so the method called will see
363          * the same state as before we executed.
364          * The pointer to MonoLMF is in r2.
365          */
366         ARM_MOV_REG_REG (code, ARMREG_R2, ARMREG_SP);
367         /* ip = previous_lmf */
368         ARM_LDR_IMM (code, ARMREG_IP, ARMREG_R2, G_STRUCT_OFFSET (MonoLMF, previous_lmf));
369         /* lr = lmf_addr */
370         ARM_LDR_IMM (code, ARMREG_LR, ARMREG_R2, G_STRUCT_OFFSET (MonoLMF, lmf_addr));
371         /* *(lmf_addr) = previous_lmf */
372         ARM_STR_IMM (code, ARMREG_IP, ARMREG_LR, G_STRUCT_OFFSET (MonoLMF, previous_lmf));
373
374         /* Non-standard function epilogue. Instead of doing a proper
375          * return, we just jump to the compiled code.
376          */
377         /* Restore the registers and jump to the code:
378          * Note that IP has been conveniently set to the method addr.
379          */
380         ARM_ADD_REG_IMM8 (code, ARMREG_SP, ARMREG_SP, sizeof (MonoLMF) - sizeof (guint) * 14);
381         ARM_POP_NWB (code, 0x5fff);
382         if (tramp_type == MONO_TRAMPOLINE_RGCTX_LAZY_FETCH)
383                 ARM_MOV_REG_REG (code, ARMREG_R0, ARMREG_IP);
384         /* do we need to set sp? */
385         ARM_ADD_REG_IMM8 (code, ARMREG_SP, ARMREG_SP, (14 * 4));
386         if ((tramp_type == MONO_TRAMPOLINE_CLASS_INIT) || (tramp_type == MONO_TRAMPOLINE_GENERIC_CLASS_INIT) || (tramp_type == MONO_TRAMPOLINE_RGCTX_LAZY_FETCH))
387                 ARM_MOV_REG_REG (code, ARMREG_PC, ARMREG_LR);
388         else
389                 ARM_MOV_REG_REG (code, ARMREG_PC, ARMREG_IP);
390
391         constants = (gpointer*)code;
392         constants [0] = mono_get_lmf_addr;
393         constants [1] = (gpointer)mono_get_trampoline_func (tramp_type);
394
395         if (!aot) {
396                 /* backpatch by emitting the missing instructions skipped above */
397                 ARM_LDR_IMM (load_get_lmf_addr, ARMREG_R0, ARMREG_PC, (code - load_get_lmf_addr - 8));
398                 ARM_LDR_IMM (load_trampoline, ARMREG_IP, ARMREG_PC, (code + 4 - load_trampoline - 8));
399         }
400
401         code += 8;
402
403         /* Flush instruction cache, since we've generated code */
404         mono_arch_flush_icache (buf, code - buf);
405
406         /* Sanity check */
407         g_assert ((code - buf) <= GEN_TRAMP_SIZE);
408
409         *code_size = code - buf;
410
411         if (tramp_type == MONO_TRAMPOLINE_CLASS_INIT) {
412                 guint32 code_len;
413
414                 /* Initialize the nullified class init trampoline used in the AOT case */
415                 nullified_class_init_trampoline = mono_arch_get_nullified_class_init_trampoline (&code_len);
416         }
417
418         *out_unwind_ops = unwind_ops;
419
420         return buf;
421 }
422
423 gpointer
424 mono_arch_get_nullified_class_init_trampoline (guint32 *code_len)
425 {
426         guint8 *buf, *code;
427
428         code = buf = mono_global_codeman_reserve (16);
429
430         ARM_MOV_REG_REG (code, ARMREG_PC, ARMREG_LR);
431
432         mono_arch_flush_icache (buf, code - buf);
433
434         *code_len = code - buf;
435
436         return buf;
437 }
438
439 #define SPEC_TRAMP_SIZE 24
440
441 gpointer
442 mono_arch_create_specific_trampoline (gpointer arg1, MonoTrampolineType tramp_type, MonoDomain *domain, guint32 *code_len)
443 {
444         guint8 *code, *buf, *tramp;
445         gpointer *constants;
446         guint32 short_branch, size = SPEC_TRAMP_SIZE;
447
448         tramp = mono_get_trampoline_code (tramp_type);
449
450         mono_domain_lock (domain);
451         code = buf = mono_domain_code_reserve_align (domain, size, 4);
452         if ((short_branch = branch_for_target_reachable (code + 8, tramp))) {
453                 size = 12;
454                 mono_domain_code_commit (domain, code, SPEC_TRAMP_SIZE, size);
455         }
456         mono_domain_unlock (domain);
457
458         /* we could reduce this to 12 bytes if tramp is within reach:
459          * ARM_PUSH ()
460          * ARM_BL ()
461          * method-literal
462          * The called code can access method using the lr register
463          * A 20 byte sequence could be:
464          * ARM_PUSH ()
465          * ARM_MOV_REG_REG (lr, pc)
466          * ARM_LDR_IMM (pc, pc, 0)
467          * method-literal
468          * tramp-literal
469          */
470         /* We save all the registers, except PC and SP */
471         ARM_PUSH (code, 0x5fff);
472         if (short_branch) {
473                 constants = (gpointer*)code;
474                 constants [0] = GUINT_TO_POINTER (short_branch | (1 << 24));
475                 constants [1] = arg1;
476                 code += 8;
477         } else {
478                 ARM_LDR_IMM (code, ARMREG_R1, ARMREG_PC, 8); /* temp reg */
479                 ARM_MOV_REG_REG (code, ARMREG_LR, ARMREG_PC);
480                 ARM_MOV_REG_REG (code, ARMREG_PC, ARMREG_R1);
481
482                 constants = (gpointer*)code;
483                 constants [0] = arg1;
484                 constants [1] = tramp;
485                 code += 8;
486         }
487
488         /* Flush instruction cache, since we've generated code */
489         mono_arch_flush_icache (buf, code - buf);
490
491         g_assert ((code - buf) <= size);
492
493         if (code_len)
494                 *code_len = code - buf;
495
496         return buf;
497 }
498
499 #define arm_is_imm12(v) ((int)(v) > -4096 && (int)(v) < 4096)
500
501 gpointer
502 mono_arch_create_rgctx_lazy_fetch_trampoline (guint32 slot)
503 {
504         guint32 code_size;
505         MonoJumpInfo *ji;
506
507         return mono_arch_create_rgctx_lazy_fetch_trampoline_full (slot, &code_size, &ji, FALSE);
508 }
509
510 gpointer
511 mono_arch_create_rgctx_lazy_fetch_trampoline_full (guint32 slot, guint32 *code_size, MonoJumpInfo **ji, gboolean aot)
512 {
513         guint8 *tramp;
514         guint8 *code, *buf;
515         int tramp_size;
516         guint32 code_len;
517         guint8 **rgctx_null_jumps;
518         int depth, index;
519         int i, njumps;
520         gboolean mrgctx;
521
522         *ji = NULL;
523
524         mrgctx = MONO_RGCTX_SLOT_IS_MRGCTX (slot);
525         index = MONO_RGCTX_SLOT_INDEX (slot);
526         if (mrgctx)
527                 index += sizeof (MonoMethodRuntimeGenericContext) / sizeof (gpointer);
528         for (depth = 0; ; ++depth) {
529                 int size = mono_class_rgctx_get_array_size (depth, mrgctx);
530
531                 if (index < size - 1)
532                         break;
533                 index -= size - 1;
534         }
535
536         tramp_size = 64 + 16 * depth;
537
538         code = buf = mono_global_codeman_reserve (tramp_size);
539
540         rgctx_null_jumps = g_malloc (sizeof (guint8*) * (depth + 2));
541         njumps = 0;
542
543         /* The vtable/mrgctx is in R0 */
544         g_assert (MONO_ARCH_VTABLE_REG == ARMREG_R0);
545
546         if (mrgctx) {
547                 /* get mrgctx ptr */
548                 ARM_MOV_REG_REG (code, ARMREG_R1, ARMREG_R0);
549         } else {
550                 /* load rgctx ptr from vtable */
551                 g_assert (arm_is_imm12 (G_STRUCT_OFFSET (MonoVTable, runtime_generic_context)));
552                 ARM_LDR_IMM (code, ARMREG_R1, ARMREG_R0, G_STRUCT_OFFSET (MonoVTable, runtime_generic_context));
553                 /* is the rgctx ptr null? */
554                 ARM_CMP_REG_IMM (code, ARMREG_R1, 0, 0);
555                 /* if yes, jump to actual trampoline */
556                 rgctx_null_jumps [njumps ++] = code;
557                 ARM_B_COND (code, ARMCOND_EQ, 0);
558         }
559
560         for (i = 0; i < depth; ++i) {
561                 /* load ptr to next array */
562                 if (mrgctx && i == 0) {
563                         g_assert (arm_is_imm12 (sizeof (MonoMethodRuntimeGenericContext)));
564                         ARM_LDR_IMM (code, ARMREG_R1, ARMREG_R1, sizeof (MonoMethodRuntimeGenericContext));
565                 } else {
566                         ARM_LDR_IMM (code, ARMREG_R1, ARMREG_R1, 0);
567                 }
568                 /* is the ptr null? */
569                 ARM_CMP_REG_IMM (code, ARMREG_R1, 0, 0);
570                 /* if yes, jump to actual trampoline */
571                 rgctx_null_jumps [njumps ++] = code;
572                 ARM_B_COND (code, ARMCOND_EQ, 0);
573         }
574
575         /* fetch slot */
576         code = mono_arm_emit_load_imm (code, ARMREG_R2, sizeof (gpointer) * (index + 1));
577         ARM_LDR_REG_REG (code, ARMREG_R1, ARMREG_R1, ARMREG_R2);
578         /* is the slot null? */
579         ARM_CMP_REG_IMM (code, ARMREG_R1, 0, 0);
580         /* if yes, jump to actual trampoline */
581         rgctx_null_jumps [njumps ++] = code;
582         ARM_B_COND (code, ARMCOND_EQ, 0);
583         /* otherwise return, result is in R1 */
584         ARM_MOV_REG_REG (code, ARMREG_R0, ARMREG_R1);
585         ARM_MOV_REG_REG (code, ARMREG_PC, ARMREG_LR);
586
587         g_assert (njumps <= depth + 2);
588         for (i = 0; i < njumps; ++i)
589                 arm_patch (rgctx_null_jumps [i], code);
590
591         g_free (rgctx_null_jumps);
592
593         /* Slowpath */
594
595         /* The vtable/mrgctx is still in R0 */
596
597         if (aot) {
598                 *ji = mono_patch_info_list_prepend (*ji, code - buf, MONO_PATCH_INFO_JIT_ICALL_ADDR, g_strdup_printf ("specific_trampoline_lazy_fetch_%u", slot));
599                 ARM_LDR_IMM (code, ARMREG_R1, ARMREG_PC, 0);
600                 ARM_B (code, 0);
601                 *(gpointer*)code = NULL;
602                 code += 4;
603                 ARM_LDR_REG_REG (code, ARMREG_PC, ARMREG_PC, ARMREG_R1);
604         } else {
605                 tramp = mono_arch_create_specific_trampoline (GUINT_TO_POINTER (slot), MONO_TRAMPOLINE_RGCTX_LAZY_FETCH, mono_get_root_domain (), &code_len);
606
607                 /* Jump to the actual trampoline */
608                 ARM_LDR_IMM (code, ARMREG_R1, ARMREG_PC, 0); /* temp reg */
609                 ARM_MOV_REG_REG (code, ARMREG_PC, ARMREG_R1);
610                 *(gpointer*)code = tramp;
611                 code += 4;
612         }
613
614         mono_arch_flush_icache (buf, code - buf);
615
616         g_assert (code - buf <= tramp_size);
617
618         *code_size = code - buf;
619
620         return buf;
621 }
622
623 #define arm_is_imm8(v) ((v) > -256 && (v) < 256)
624
625 gpointer
626 mono_arch_create_generic_class_init_trampoline (void)
627 {
628         guint32 code_size;
629         MonoJumpInfo *ji;
630
631         return mono_arch_create_generic_class_init_trampoline_full (&code_size, &ji, FALSE);
632 }
633
634 gpointer
635 mono_arch_create_generic_class_init_trampoline_full (guint32 *code_size, MonoJumpInfo **ji, gboolean aot)
636 {
637         guint8 *tramp;
638         guint8 *code, *buf;
639         static int byte_offset = -1;
640         static guint8 bitmask;
641         guint8 *jump;
642         int tramp_size;
643         guint32 code_len, imm8;
644         gint rot_amount;
645
646         *ji = NULL;
647
648         tramp_size = 64;
649
650         code = buf = mono_global_codeman_reserve (tramp_size);
651
652         if (byte_offset < 0)
653                 mono_marshal_find_bitfield_offset (MonoVTable, initialized, &byte_offset, &bitmask);
654
655         g_assert (arm_is_imm8 (byte_offset));
656         ARM_LDRSB_IMM (code, ARMREG_IP, MONO_ARCH_VTABLE_REG, byte_offset);
657         imm8 = mono_arm_is_rotated_imm8 (bitmask, &rot_amount);
658         g_assert (imm8 >= 0);
659         ARM_AND_REG_IMM (code, ARMREG_IP, ARMREG_IP, imm8, rot_amount);
660         ARM_CMP_REG_IMM (code, ARMREG_IP, 0, 0);
661         jump = code;
662         ARM_B_COND (code, ARMCOND_EQ, 0);
663
664         /* Initialized case */
665         ARM_MOV_REG_REG (code, ARMREG_PC, ARMREG_LR);   
666
667         /* Uninitialized case */
668         arm_patch (jump, code);
669
670         if (aot) {
671                 *ji = mono_patch_info_list_prepend (*ji, code - buf, MONO_PATCH_INFO_JIT_ICALL_ADDR, "specific_trampoline_generic_class_init");
672                 ARM_LDR_IMM (code, ARMREG_R1, ARMREG_PC, 0);
673                 ARM_B (code, 0);
674                 *(gpointer*)code = NULL;
675                 code += 4;
676                 ARM_LDR_REG_REG (code, ARMREG_PC, ARMREG_PC, ARMREG_R1);
677         } else {
678                 tramp = mono_arch_create_specific_trampoline (NULL, MONO_TRAMPOLINE_GENERIC_CLASS_INIT, mono_get_root_domain (), &code_len);
679
680                 /* Jump to the actual trampoline */
681                 ARM_LDR_IMM (code, ARMREG_R1, ARMREG_PC, 0); /* temp reg */
682                 ARM_MOV_REG_REG (code, ARMREG_PC, ARMREG_R1);
683                 *(gpointer*)code = tramp;
684                 code += 4;
685         }
686
687         mono_arch_flush_icache (buf, code - buf);
688
689         g_assert (code - buf <= tramp_size);
690
691         *code_size = code - buf;
692
693         return buf;
694 }