Added Symbolicate tool.
[mono.git] / mono / mini / mini-ppc.c
1 /*
2  * mini-ppc.c: PowerPC backend for the Mono code generator
3  *
4  * Authors:
5  *   Paolo Molaro (lupus@ximian.com)
6  *   Dietmar Maurer (dietmar@ximian.com)
7  *   Andreas Faerber <andreas.faerber@web.de>
8  *
9  * (C) 2003 Ximian, Inc.
10  * (C) 2007-2008 Andreas Faerber
11  */
12 #include "mini.h"
13 #include <string.h>
14
15 #include <mono/metadata/abi-details.h>
16 #include <mono/metadata/appdomain.h>
17 #include <mono/metadata/debug-helpers.h>
18 #include <mono/utils/mono-proclib.h>
19 #include <mono/utils/mono-mmap.h>
20 #include <mono/utils/mono-hwcap-ppc.h>
21
22 #include "mini-ppc.h"
23 #ifdef TARGET_POWERPC64
24 #include "cpu-ppc64.h"
25 #else
26 #include "cpu-ppc.h"
27 #endif
28 #include "trace.h"
29 #include "ir-emit.h"
30 #ifdef __APPLE__
31 #include <sys/sysctl.h>
32 #endif
33 #ifdef __linux__
34 #include <unistd.h>
35 #endif
36
37 #define FORCE_INDIR_CALL 1
38
39 enum {
40         TLS_MODE_DETECT,
41         TLS_MODE_FAILED,
42         TLS_MODE_LTHREADS,
43         TLS_MODE_NPTL,
44         TLS_MODE_DARWIN_G4,
45         TLS_MODE_DARWIN_G5
46 };
47
48 /* cpu_hw_caps contains the flags defined below */
49 static int cpu_hw_caps = 0;
50 static int cachelinesize = 0;
51 static int cachelineinc = 0;
52 enum {
53         PPC_ICACHE_SNOOP      = 1 << 0,
54         PPC_MULTIPLE_LS_UNITS = 1 << 1,
55         PPC_SMP_CAPABLE       = 1 << 2,
56         PPC_ISA_2X            = 1 << 3,
57         PPC_ISA_64            = 1 << 4,
58         PPC_MOVE_FPR_GPR      = 1 << 5,
59         PPC_HW_CAP_END
60 };
61
62 #define BREAKPOINT_SIZE (PPC_LOAD_SEQUENCE_LENGTH + 4)
63
64 /* This mutex protects architecture specific caches */
65 #define mono_mini_arch_lock() mono_mutex_lock (&mini_arch_mutex)
66 #define mono_mini_arch_unlock() mono_mutex_unlock (&mini_arch_mutex)
67 static mono_mutex_t mini_arch_mutex;
68
69 int mono_exc_esp_offset = 0;
70 static int tls_mode = TLS_MODE_DETECT;
71 static int lmf_pthread_key = -1;
72
73 /*
74  * The code generated for sequence points reads from this location, which is
75  * made read-only when single stepping is enabled.
76  */
77 static gpointer ss_trigger_page;
78
79 /* Enabled breakpoints read from this trigger page */
80 static gpointer bp_trigger_page;
81
82 static int
83 offsets_from_pthread_key (guint32 key, int *offset2)
84 {
85         int idx1 = key / 32;
86         int idx2 = key % 32;
87         *offset2 = idx2 * sizeof (gpointer);
88         return 284 + idx1 * sizeof (gpointer);
89 }
90
91 #define emit_linuxthreads_tls(code,dreg,key) do {\
92                 int off1, off2; \
93                 off1 = offsets_from_pthread_key ((key), &off2); \
94                 ppc_ldptr ((code), (dreg), off1, ppc_r2);       \
95                 ppc_ldptr ((code), (dreg), off2, (dreg));       \
96         } while (0);
97
98 #define emit_darwing5_tls(code,dreg,key) do {\
99                 int off1 = 0x48 + key * sizeof (gpointer);      \
100                 ppc_mfspr ((code), (dreg), 104);        \
101                 ppc_ldptr ((code), (dreg), off1, (dreg));       \
102         } while (0);
103
104 /* FIXME: ensure the sc call preserves all but r3 */
105 #define emit_darwing4_tls(code,dreg,key) do {\
106                 int off1 = 0x48 + key * sizeof (gpointer);      \
107                 if ((dreg) != ppc_r3) ppc_mr ((code), ppc_r11, ppc_r3); \
108                 ppc_li ((code), ppc_r0, 0x7FF2);        \
109                 ppc_sc ((code));        \
110                 ppc_lwz ((code), (dreg), off1, ppc_r3); \
111                 if ((dreg) != ppc_r3) ppc_mr ((code), ppc_r3, ppc_r11); \
112         } while (0);
113
114 #ifdef PPC_THREAD_PTR_REG
115 #define emit_nptl_tls(code,dreg,key) do { \
116                 int off1 = key; \
117                 int off2 = key >> 15; \
118                 if ((off2 == 0) || (off2 == -1)) { \
119                         ppc_ldptr ((code), (dreg), off1, PPC_THREAD_PTR_REG);   \
120                 } else { \
121                         int off3 = (off2 + 1) > 1; \
122                         ppc_addis ((code), ppc_r11, PPC_THREAD_PTR_REG, off3); \
123                         ppc_ldptr ((code), (dreg), off1, ppc_r11);      \
124                 } \
125         } while (0);
126 #else
127 #define emit_nptl_tls(code,dreg,key) do {       \
128                 g_assert_not_reached ();        \
129         } while (0)
130 #endif
131
132 #define emit_tls_access(code,dreg,key) do {     \
133                 switch (tls_mode) {     \
134                 case TLS_MODE_LTHREADS: emit_linuxthreads_tls(code,dreg,key); break;    \
135                 case TLS_MODE_NPTL: emit_nptl_tls(code,dreg,key); break;        \
136                 case TLS_MODE_DARWIN_G5: emit_darwing5_tls(code,dreg,key); break;       \
137                 case TLS_MODE_DARWIN_G4: emit_darwing4_tls(code,dreg,key); break;       \
138                 default: g_assert_not_reached ();       \
139                 }       \
140         } while (0)
141
142 #define MONO_EMIT_NEW_LOAD_R8(cfg,dr,addr) do { \
143                 MonoInst *inst;                                                    \
144                 MONO_INST_NEW ((cfg), (inst), OP_R8CONST); \
145                 inst->type = STACK_R8;                     \
146                 inst->dreg = (dr);                     \
147                 inst->inst_p0 = (void*)(addr);         \
148                 mono_bblock_add_inst (cfg->cbb, inst); \
149         } while (0)
150
151 const char*
152 mono_arch_regname (int reg) {
153         static const char rnames[][4] = {
154                 "r0", "sp", "r2", "r3", "r4",
155                 "r5", "r6", "r7", "r8", "r9",
156                 "r10", "r11", "r12", "r13", "r14",
157                 "r15", "r16", "r17", "r18", "r19",
158                 "r20", "r21", "r22", "r23", "r24",
159                 "r25", "r26", "r27", "r28", "r29",
160                 "r30", "r31"
161         };
162         if (reg >= 0 && reg < 32)
163                 return rnames [reg];
164         return "unknown";
165 }
166
167 const char*
168 mono_arch_fregname (int reg) {
169         static const char rnames[][4] = {
170                 "f0", "f1", "f2", "f3", "f4",
171                 "f5", "f6", "f7", "f8", "f9",
172                 "f10", "f11", "f12", "f13", "f14",
173                 "f15", "f16", "f17", "f18", "f19",
174                 "f20", "f21", "f22", "f23", "f24",
175                 "f25", "f26", "f27", "f28", "f29",
176                 "f30", "f31"
177         };
178         if (reg >= 0 && reg < 32)
179                 return rnames [reg];
180         return "unknown";
181 }
182
183 /* this function overwrites r0, r11, r12 */
184 static guint8*
185 emit_memcpy (guint8 *code, int size, int dreg, int doffset, int sreg, int soffset)
186 {
187         /* unrolled, use the counter in big */
188         if (size > sizeof (gpointer) * 5) {
189                 long shifted = size / SIZEOF_VOID_P;
190                 guint8 *copy_loop_start, *copy_loop_jump;
191
192                 ppc_load (code, ppc_r0, shifted);
193                 ppc_mtctr (code, ppc_r0);
194                 //g_assert (sreg == ppc_r11);
195                 ppc_addi (code, ppc_r12, dreg, (doffset - sizeof (gpointer)));
196                 ppc_addi (code, ppc_r11, sreg, (soffset - sizeof (gpointer)));
197                 copy_loop_start = code;
198                 ppc_ldptr_update (code, ppc_r0, (unsigned int)sizeof (gpointer), ppc_r11);
199                 ppc_stptr_update (code, ppc_r0, (unsigned int)sizeof (gpointer), ppc_r12);
200                 copy_loop_jump = code;
201                 ppc_bc (code, PPC_BR_DEC_CTR_NONZERO, 0, 0);
202                 ppc_patch (copy_loop_jump, copy_loop_start);
203                 size -= shifted * sizeof (gpointer);
204                 doffset = soffset = 0;
205                 dreg = ppc_r12;
206         }
207 #ifdef __mono_ppc64__
208         /* the hardware has multiple load/store units and the move is long
209            enough to use more then one regiester, then use load/load/store/store
210            to execute 2 instructions per cycle. */
211         if ((cpu_hw_caps & PPC_MULTIPLE_LS_UNITS) && (dreg != ppc_r12) && (sreg != ppc_r12)) { 
212                 while (size >= 16) {
213                         ppc_ldptr (code, ppc_r0, soffset, sreg);
214                         ppc_ldptr (code, ppc_r12, soffset+8, sreg);
215                         ppc_stptr (code, ppc_r0, doffset, dreg);
216                         ppc_stptr (code, ppc_r12, doffset+8, dreg);
217                         size -= 16;
218                         soffset += 16;
219                         doffset += 16; 
220                 }
221         }
222         while (size >= 8) {
223                 ppc_ldr (code, ppc_r0, soffset, sreg);
224                 ppc_str (code, ppc_r0, doffset, dreg);
225                 size -= 8;
226                 soffset += 8;
227                 doffset += 8;
228         }
229 #else
230         if ((cpu_hw_caps & PPC_MULTIPLE_LS_UNITS) && (dreg != ppc_r12) && (sreg != ppc_r12)) { 
231                 while (size >= 8) {
232                         ppc_lwz (code, ppc_r0, soffset, sreg);
233                         ppc_lwz (code, ppc_r12, soffset+4, sreg);
234                         ppc_stw (code, ppc_r0, doffset, dreg);
235                         ppc_stw (code, ppc_r12, doffset+4, dreg);
236                         size -= 8;
237                         soffset += 8;
238                         doffset += 8; 
239                 }
240         }
241 #endif
242         while (size >= 4) {
243                 ppc_lwz (code, ppc_r0, soffset, sreg);
244                 ppc_stw (code, ppc_r0, doffset, dreg);
245                 size -= 4;
246                 soffset += 4;
247                 doffset += 4;
248         }
249         while (size >= 2) {
250                 ppc_lhz (code, ppc_r0, soffset, sreg);
251                 ppc_sth (code, ppc_r0, doffset, dreg);
252                 size -= 2;
253                 soffset += 2;
254                 doffset += 2;
255         }
256         while (size >= 1) {
257                 ppc_lbz (code, ppc_r0, soffset, sreg);
258                 ppc_stb (code, ppc_r0, doffset, dreg);
259                 size -= 1;
260                 soffset += 1;
261                 doffset += 1;
262         }
263         return code;
264 }
265
266 /*
267  * mono_arch_get_argument_info:
268  * @csig:  a method signature
269  * @param_count: the number of parameters to consider
270  * @arg_info: an array to store the result infos
271  *
272  * Gathers information on parameters such as size, alignment and
273  * padding. arg_info should be large enought to hold param_count + 1 entries. 
274  *
275  * Returns the size of the activation frame.
276  */
277 int
278 mono_arch_get_argument_info (MonoGenericSharingContext *gsctx, MonoMethodSignature *csig, int param_count, MonoJitArgumentInfo *arg_info)
279 {
280 #ifdef __mono_ppc64__
281         NOT_IMPLEMENTED;
282         return -1;
283 #else
284         int k, frame_size = 0;
285         int size, align, pad;
286         int offset = 8;
287
288         if (MONO_TYPE_ISSTRUCT (csig->ret)) { 
289                 frame_size += sizeof (gpointer);
290                 offset += 4;
291         }
292
293         arg_info [0].offset = offset;
294
295         if (csig->hasthis) {
296                 frame_size += sizeof (gpointer);
297                 offset += 4;
298         }
299
300         arg_info [0].size = frame_size;
301
302         for (k = 0; k < param_count; k++) {
303                 
304                 if (csig->pinvoke)
305                         size = mono_type_native_stack_size (csig->params [k], (guint32*)&align);
306                 else
307                         size = mini_type_stack_size (NULL, csig->params [k], &align);
308
309                 /* ignore alignment for now */
310                 align = 1;
311
312                 frame_size += pad = (align - (frame_size & (align - 1))) & (align - 1); 
313                 arg_info [k].pad = pad;
314                 frame_size += size;
315                 arg_info [k + 1].pad = 0;
316                 arg_info [k + 1].size = size;
317                 offset += pad;
318                 arg_info [k + 1].offset = offset;
319                 offset += size;
320         }
321
322         align = MONO_ARCH_FRAME_ALIGNMENT;
323         frame_size += pad = (align - (frame_size & (align - 1))) & (align - 1);
324         arg_info [k].pad = pad;
325
326         return frame_size;
327 #endif
328 }
329
330 #ifdef __mono_ppc64__
331 static gboolean
332 is_load_sequence (guint32 *seq)
333 {
334         return ppc_opcode (seq [0]) == 15 && /* lis */
335                 ppc_opcode (seq [1]) == 24 && /* ori */
336                 ppc_opcode (seq [2]) == 30 && /* sldi */
337                 ppc_opcode (seq [3]) == 25 && /* oris */
338                 ppc_opcode (seq [4]) == 24; /* ori */
339 }
340
341 #define ppc_load_get_dest(l)    (((l)>>21) & 0x1f)
342 #define ppc_load_get_off(l)     ((gint16)((l) & 0xffff))
343 #endif
344
345 /* ld || lwz */
346 #define ppc_is_load_op(opcode) (ppc_opcode ((opcode)) == 58 || ppc_opcode ((opcode)) == 32)
347
348 /* code must point to the blrl */
349 gboolean
350 mono_ppc_is_direct_call_sequence (guint32 *code)
351 {
352 #ifdef __mono_ppc64__
353         g_assert(*code == 0x4e800021 || *code == 0x4e800020 || *code == 0x4e800420);
354
355         /* the thunk-less direct call sequence: lis/ori/sldi/oris/ori/mtlr/blrl */
356         if (ppc_opcode (code [-1]) == 31) { /* mtlr */
357                 if (ppc_is_load_op (code [-2]) && ppc_is_load_op (code [-3])) { /* ld/ld */
358                         if (!is_load_sequence (&code [-8]))
359                                 return FALSE;
360                         /* one of the loads must be "ld r2,8(rX)" or "ld r2,4(rX) for ilp32 */
361                         return (ppc_load_get_dest (code [-2]) == ppc_r2 && ppc_load_get_off (code [-2]) == sizeof (gpointer)) ||
362                                 (ppc_load_get_dest (code [-3]) == ppc_r2 && ppc_load_get_off (code [-3]) == sizeof (gpointer));
363                 }
364                 if (ppc_opcode (code [-2]) == 24 && ppc_opcode (code [-3]) == 31) /* mr/nop */
365                         return is_load_sequence (&code [-8]);
366                 else
367                         return is_load_sequence (&code [-6]);
368         }
369         return FALSE;
370 #else
371         g_assert(*code == 0x4e800021);
372
373         /* the thunk-less direct call sequence: lis/ori/mtlr/blrl */
374         return ppc_opcode (code [-1]) == 31 &&
375                 ppc_opcode (code [-2]) == 24 &&
376                 ppc_opcode (code [-3]) == 15;
377 #endif
378 }
379
380 #define MAX_ARCH_DELEGATE_PARAMS 7
381
382 static gpointer
383 get_delegate_invoke_impl (gboolean has_target, guint32 param_count, guint32 *code_len, gboolean aot)
384 {
385         guint8 *code, *start;
386
387         if (has_target) {
388                 int size = MONO_PPC_32_64_CASE (32, 32) + PPC_FTNPTR_SIZE;
389
390                 start = code = mono_global_codeman_reserve (size);
391                 if (!aot)
392                         code = mono_ppc_create_pre_code_ftnptr (code);
393
394                 /* Replace the this argument with the target */
395                 ppc_ldptr (code, ppc_r0, MONO_STRUCT_OFFSET (MonoDelegate, method_ptr), ppc_r3);
396 #ifdef PPC_USES_FUNCTION_DESCRIPTOR
397                 /* it's a function descriptor */
398                 /* Can't use ldptr as it doesn't work with r0 */
399                 ppc_ldptr_indexed (code, ppc_r0, 0, ppc_r0);
400 #endif
401                 ppc_mtctr (code, ppc_r0);
402                 ppc_ldptr (code, ppc_r3, MONO_STRUCT_OFFSET (MonoDelegate, target), ppc_r3);
403                 ppc_bcctr (code, PPC_BR_ALWAYS, 0);
404
405                 g_assert ((code - start) <= size);
406
407                 mono_arch_flush_icache (start, size);
408         } else {
409                 int size, i;
410
411                 size = MONO_PPC_32_64_CASE (32, 32) + param_count * 4 + PPC_FTNPTR_SIZE;
412                 start = code = mono_global_codeman_reserve (size);
413                 if (!aot)
414                         code = mono_ppc_create_pre_code_ftnptr (code);
415
416                 ppc_ldptr (code, ppc_r0, MONO_STRUCT_OFFSET (MonoDelegate, method_ptr), ppc_r3);
417 #ifdef PPC_USES_FUNCTION_DESCRIPTOR
418                 /* it's a function descriptor */
419                 ppc_ldptr_indexed (code, ppc_r0, 0, ppc_r0);
420 #endif
421                 ppc_mtctr (code, ppc_r0);
422                 /* slide down the arguments */
423                 for (i = 0; i < param_count; ++i) {
424                         ppc_mr (code, (ppc_r3 + i), (ppc_r3 + i + 1));
425                 }
426                 ppc_bcctr (code, PPC_BR_ALWAYS, 0);
427
428                 g_assert ((code - start) <= size);
429
430                 mono_arch_flush_icache (start, size);
431         }
432
433         if (code_len)
434                 *code_len = code - start;
435
436         return start;
437 }
438
439 GSList*
440 mono_arch_get_delegate_invoke_impls (void)
441 {
442         GSList *res = NULL;
443         guint8 *code;
444         guint32 code_len;
445         int i;
446         char *tramp_name;
447
448         code = get_delegate_invoke_impl (TRUE, 0, &code_len, TRUE);
449         res = g_slist_prepend (res, mono_tramp_info_create ("delegate_invoke_impl_has_target", code, code_len, NULL, NULL));
450
451         for (i = 0; i < MAX_ARCH_DELEGATE_PARAMS; ++i) {
452                 code = get_delegate_invoke_impl (FALSE, i, &code_len, TRUE);
453                 tramp_name = g_strdup_printf ("delegate_invoke_impl_target_%d", i);
454                 res = g_slist_prepend (res, mono_tramp_info_create (tramp_name, code, code_len, NULL, NULL));
455                 g_free (tramp_name);
456         }
457
458         return res;
459 }
460
461 gpointer
462 mono_arch_get_delegate_invoke_impl (MonoMethodSignature *sig, gboolean has_target)
463 {
464         guint8 *code, *start;
465
466         /* FIXME: Support more cases */
467         if (MONO_TYPE_ISSTRUCT (sig->ret))
468                 return NULL;
469
470         if (has_target) {
471                 static guint8* cached = NULL;
472
473                 if (cached)
474                         return cached;
475
476                 if (mono_aot_only)
477                         start = mono_aot_get_trampoline ("delegate_invoke_impl_has_target");
478                 else
479                         start = get_delegate_invoke_impl (TRUE, 0, NULL, FALSE);
480
481                 mono_memory_barrier ();
482
483                 cached = start;
484         } else {
485                 static guint8* cache [MAX_ARCH_DELEGATE_PARAMS + 1] = {NULL};
486                 int i;
487
488                 if (sig->param_count > MAX_ARCH_DELEGATE_PARAMS)
489                         return NULL;
490                 for (i = 0; i < sig->param_count; ++i)
491                         if (!mono_is_regsize_var (sig->params [i]))
492                                 return NULL;
493
494
495                 code = cache [sig->param_count];
496                 if (code)
497                         return code;
498
499                 if (mono_aot_only) {
500                         char *name = g_strdup_printf ("delegate_invoke_impl_target_%d", sig->param_count);
501                         start = mono_aot_get_trampoline (name);
502                         g_free (name);
503                 } else {
504                         start = get_delegate_invoke_impl (FALSE, sig->param_count, NULL, FALSE);
505                 }
506
507                 mono_memory_barrier ();
508
509                 cache [sig->param_count] = start;
510         }
511         return start;
512 }
513
514 gpointer
515 mono_arch_get_delegate_virtual_invoke_impl (MonoMethodSignature *sig, MonoMethod *method, int offset, gboolean load_imt_reg)
516 {
517         return NULL;
518 }
519
520 gpointer
521 mono_arch_get_this_arg_from_call (mgreg_t *regs, guint8 *code)
522 {
523         mgreg_t *r = (mgreg_t*)regs;
524
525         return (gpointer)(gsize)r [ppc_r3];
526 }
527
528 typedef struct {
529         long int type;
530         long int value;
531 } AuxVec;
532
533 #define MAX_AUX_ENTRIES 128
534 /* 
535  * PPC_FEATURE_POWER4, PPC_FEATURE_POWER5, PPC_FEATURE_POWER5_PLUS, PPC_FEATURE_CELL,
536  * PPC_FEATURE_PA6T, PPC_FEATURE_ARCH_2_05 are considered supporting 2X ISA features
537  */
538 #define ISA_2X (0x00080000 | 0x00040000 | 0x00020000 | 0x00010000 | 0x00000800 | 0x00001000)
539
540 /* define PPC_FEATURE_64 HWCAP for 64-bit category.  */
541 #define ISA_64 0x40000000
542
543 /* define PPC_FEATURE_POWER6_EXT HWCAP for power6x mffgpr/mftgpr instructions.  */
544 #define ISA_MOVE_FPR_GPR 0x00000200
545 /*
546  * Initialize the cpu to execute managed code.
547  */
548 void
549 mono_arch_cpu_init (void)
550 {
551 }
552
553 /*
554  * Initialize architecture specific code.
555  */
556 void
557 mono_arch_init (void)
558 {
559 #if defined(MONO_CROSS_COMPILE)
560 #elif defined(__APPLE__)
561         int mib [3];
562         size_t len = sizeof (cachelinesize);
563
564         mib [0] = CTL_HW;
565         mib [1] = HW_CACHELINE;
566
567         if (sysctl (mib, 2, &cachelinesize, &len, NULL, 0) == -1) {
568                 perror ("sysctl");
569                 cachelinesize = 128;
570         } else {
571                 cachelineinc = cachelinesize;
572         }
573 #elif defined(__linux__)
574         AuxVec vec [MAX_AUX_ENTRIES];
575         int i, vec_entries = 0;
576         /* sadly this will work only with 2.6 kernels... */
577         FILE* f = fopen ("/proc/self/auxv", "rb");
578
579         if (f) {
580                 vec_entries = fread (&vec, sizeof (AuxVec), MAX_AUX_ENTRIES, f);
581                 fclose (f);
582         }
583
584         for (i = 0; i < vec_entries; i++) {
585                 int type = vec [i].type;
586
587                 if (type == 19) { /* AT_DCACHEBSIZE */
588                         cachelinesize = vec [i].value;
589                         continue;
590                 }
591         }
592 #elif defined(G_COMPILER_CODEWARRIOR)
593         cachelinesize = 32;
594         cachelineinc = 32;
595 #else
596 //#error Need a way to get cache line size
597 #endif
598
599         if (mono_hwcap_ppc_has_icache_snoop)
600                 cpu_hw_caps |= PPC_ICACHE_SNOOP;
601
602         if (mono_hwcap_ppc_is_isa_2x)
603                 cpu_hw_caps |= PPC_ISA_2X;
604
605         if (mono_hwcap_ppc_is_isa_64)
606                 cpu_hw_caps |= PPC_ISA_64;
607
608         if (mono_hwcap_ppc_has_move_fpr_gpr)
609                 cpu_hw_caps |= PPC_MOVE_FPR_GPR;
610
611         if (mono_hwcap_ppc_has_multiple_ls_units)
612                 cpu_hw_caps |= PPC_MULTIPLE_LS_UNITS;
613
614         if (!cachelinesize)
615                 cachelinesize = 32;
616
617         if (!cachelineinc)
618                 cachelineinc = cachelinesize;
619
620         if (mono_cpu_count () > 1)
621                 cpu_hw_caps |= PPC_SMP_CAPABLE;
622
623         mono_mutex_init_recursive (&mini_arch_mutex);
624
625         ss_trigger_page = mono_valloc (NULL, mono_pagesize (), MONO_MMAP_READ|MONO_MMAP_32BIT);
626         bp_trigger_page = mono_valloc (NULL, mono_pagesize (), MONO_MMAP_READ|MONO_MMAP_32BIT);
627         mono_mprotect (bp_trigger_page, mono_pagesize (), 0);
628
629         mono_aot_register_jit_icall ("mono_ppc_throw_exception", mono_ppc_throw_exception);
630 }
631
632 /*
633  * Cleanup architecture specific code.
634  */
635 void
636 mono_arch_cleanup (void)
637 {
638         mono_mutex_destroy (&mini_arch_mutex);
639 }
640
641 /*
642  * This function returns the optimizations supported on this cpu.
643  */
644 guint32
645 mono_arch_cpu_optimizations (guint32 *exclude_mask)
646 {
647         guint32 opts = 0;
648
649         /* no ppc-specific optimizations yet */
650         *exclude_mask = 0;
651         return opts;
652 }
653
654 /*
655  * This function test for all SIMD functions supported.
656  *
657  * Returns a bitmask corresponding to all supported versions.
658  *
659  */
660 guint32
661 mono_arch_cpu_enumerate_simd_versions (void)
662 {
663         /* SIMD is currently unimplemented */
664         return 0;
665 }
666
667 #ifdef __mono_ppc64__
668 #define CASE_PPC32(c)
669 #define CASE_PPC64(c)   case c:
670 #else
671 #define CASE_PPC32(c)   case c:
672 #define CASE_PPC64(c)
673 #endif
674
675 static gboolean
676 is_regsize_var (MonoType *t) {
677         if (t->byref)
678                 return TRUE;
679         t = mini_type_get_underlying_type (NULL, t);
680         switch (t->type) {
681         case MONO_TYPE_I4:
682         case MONO_TYPE_U4:
683         CASE_PPC64 (MONO_TYPE_I8)
684         CASE_PPC64 (MONO_TYPE_U8)
685         case MONO_TYPE_I:
686         case MONO_TYPE_U:
687         case MONO_TYPE_PTR:
688         case MONO_TYPE_FNPTR:
689                 return TRUE;
690         case MONO_TYPE_OBJECT:
691         case MONO_TYPE_STRING:
692         case MONO_TYPE_CLASS:
693         case MONO_TYPE_SZARRAY:
694         case MONO_TYPE_ARRAY:
695                 return TRUE;
696         case MONO_TYPE_GENERICINST:
697                 if (!mono_type_generic_inst_is_valuetype (t))
698                         return TRUE;
699                 return FALSE;
700         case MONO_TYPE_VALUETYPE:
701                 return FALSE;
702         }
703         return FALSE;
704 }
705
706 #ifndef DISABLE_JIT
707 GList *
708 mono_arch_get_allocatable_int_vars (MonoCompile *cfg)
709 {
710         GList *vars = NULL;
711         int i;
712
713         for (i = 0; i < cfg->num_varinfo; i++) {
714                 MonoInst *ins = cfg->varinfo [i];
715                 MonoMethodVar *vmv = MONO_VARINFO (cfg, i);
716
717                 /* unused vars */
718                 if (vmv->range.first_use.abs_pos >= vmv->range.last_use.abs_pos)
719                         continue;
720
721                 if (ins->flags & (MONO_INST_VOLATILE|MONO_INST_INDIRECT) || (ins->opcode != OP_LOCAL && ins->opcode != OP_ARG))
722                         continue;
723
724                 /* we can only allocate 32 bit values */
725                 if (is_regsize_var (ins->inst_vtype)) {
726                         g_assert (MONO_VARINFO (cfg, i)->reg == -1);
727                         g_assert (i == vmv->idx);
728                         vars = mono_varlist_insert_sorted (cfg, vars, vmv, FALSE);
729                 }
730         }
731
732         return vars;
733 }
734 #endif /* ifndef DISABLE_JIT */
735
736 GList *
737 mono_arch_get_global_int_regs (MonoCompile *cfg)
738 {
739         GList *regs = NULL;
740         int i, top = 32;
741         if (cfg->frame_reg != ppc_sp)
742                 top = 31;
743         /* ppc_r13 is used by the system on PPC EABI */
744         for (i = 14; i < top; ++i) {
745                 /*
746                  * Reserve r29 for holding the vtable address for virtual calls in AOT mode,
747                  * since the trampolines can clobber r11.
748                  */
749                 if (!(cfg->compile_aot && i == 29))
750                         regs = g_list_prepend (regs, GUINT_TO_POINTER (i));
751         }
752
753         return regs;
754 }
755
756 /*
757  * mono_arch_regalloc_cost:
758  *
759  *  Return the cost, in number of memory references, of the action of 
760  * allocating the variable VMV into a register during global register
761  * allocation.
762  */
763 guint32
764 mono_arch_regalloc_cost (MonoCompile *cfg, MonoMethodVar *vmv)
765 {
766         /* FIXME: */
767         return 2;
768 }
769
770 void
771 mono_arch_flush_icache (guint8 *code, gint size)
772 {
773 #ifdef MONO_CROSS_COMPILE
774 #else
775         register guint8 *p;
776         guint8 *endp, *start;
777
778         p = start = code;
779         endp = p + size;
780         start = (guint8*)((gsize)start & ~(cachelinesize - 1));
781         /* use dcbf for smp support, later optimize for UP, see pem._64bit.d20030611.pdf page 211 */
782 #if defined(G_COMPILER_CODEWARRIOR)
783         if (cpu_hw_caps & PPC_SMP_CAPABLE) {
784                 for (p = start; p < endp; p += cachelineinc) {
785                         asm { dcbf 0, p };
786                 }
787         } else {
788                 for (p = start; p < endp; p += cachelineinc) {
789                         asm { dcbst 0, p };
790                 }
791         }
792         asm { sync };
793         p = code;
794         for (p = start; p < endp; p += cachelineinc) {
795                 asm {
796                         icbi 0, p
797                         sync
798                 }
799         }
800         asm {
801                 sync
802                 isync
803         }
804 #else
805         /* For POWER5/6 with ICACHE_SNOOPing only one icbi in the range is required.
806          * The sync is required to insure that the store queue is completely empty.
807          * While the icbi performs no cache operations, icbi/isync is required to
808          * kill local prefetch.
809          */
810         if (cpu_hw_caps & PPC_ICACHE_SNOOP) {
811                 asm ("sync");
812                 asm ("icbi 0,%0;" : : "r"(code) : "memory");
813                 asm ("isync");
814                 return;
815         }
816         /* use dcbf for smp support, see pem._64bit.d20030611.pdf page 211 */
817         if (cpu_hw_caps & PPC_SMP_CAPABLE) {
818                 for (p = start; p < endp; p += cachelineinc) {
819                         asm ("dcbf 0,%0;" : : "r"(p) : "memory");
820                 }
821         } else {
822                 for (p = start; p < endp; p += cachelineinc) {
823                         asm ("dcbst 0,%0;" : : "r"(p) : "memory");
824                 }
825         }
826         asm ("sync");
827         p = code;
828         for (p = start; p < endp; p += cachelineinc) {
829                 /* for ISA2.0+ implementations we should not need any extra sync between the
830                  * icbi instructions.  Both the 2.0 PEM and the PowerISA-2.05 say this.
831                  * So I am not sure which chip had this problem but its not an issue on
832                  * of the ISA V2 chips.
833                  */
834                 if (cpu_hw_caps & PPC_ISA_2X)
835                         asm ("icbi 0,%0;" : : "r"(p) : "memory");
836                 else
837                         asm ("icbi 0,%0; sync;" : : "r"(p) : "memory");
838         }
839         if (!(cpu_hw_caps & PPC_ISA_2X))
840                 asm ("sync");
841         asm ("isync");
842 #endif
843 #endif
844 }
845
846 void
847 mono_arch_flush_register_windows (void)
848 {
849 }
850
851 #ifdef __APPLE__
852 #define ALWAYS_ON_STACK(s) s
853 #define FP_ALSO_IN_REG(s) s
854 #else
855 #ifdef __mono_ppc64__
856 #define ALWAYS_ON_STACK(s) s
857 #define FP_ALSO_IN_REG(s) s
858 #else
859 #define ALWAYS_ON_STACK(s)
860 #define FP_ALSO_IN_REG(s)
861 #endif
862 #define ALIGN_DOUBLES
863 #endif
864
865 enum {
866         RegTypeGeneral,
867         RegTypeBase,
868         RegTypeFP,
869         RegTypeStructByVal,
870         RegTypeStructByAddr
871 };
872
873 typedef struct {
874         gint32  offset;
875         guint32 vtsize; /* in param area */
876         guint8  reg;
877         guint8  vtregs; /* number of registers used to pass a RegTypeStructByVal */
878         guint8  regtype : 4; /* 0 general, 1 basereg, 2 floating point register, see RegType* */
879         guint8  size    : 4; /* 1, 2, 4, 8, or regs used by RegTypeStructByVal */
880         guint8  bytes   : 4; /* size in bytes - only valid for
881                                 RegTypeStructByVal if the struct fits
882                                 in one word, otherwise it's 0*/
883 } ArgInfo;
884
885 typedef struct {
886         int nargs;
887         guint32 stack_usage;
888         guint32 struct_ret;
889         ArgInfo ret;
890         ArgInfo sig_cookie;
891         gboolean vtype_retaddr;
892         int vret_arg_index;
893         ArgInfo args [1];
894 } CallInfo;
895
896 #define DEBUG(a)
897
898 static void inline
899 add_general (guint *gr, guint *stack_size, ArgInfo *ainfo, gboolean simple)
900 {
901 #ifdef __mono_ppc64__
902         g_assert (simple);
903 #endif
904
905         if (simple) {
906                 if (*gr >= 3 + PPC_NUM_REG_ARGS) {
907                         ainfo->offset = PPC_STACK_PARAM_OFFSET + *stack_size;
908                         ainfo->reg = ppc_sp; /* in the caller */
909                         ainfo->regtype = RegTypeBase;
910                         *stack_size += sizeof (gpointer);
911                 } else {
912                         ALWAYS_ON_STACK (*stack_size += sizeof (gpointer));
913                         ainfo->reg = *gr;
914                 }
915         } else {
916                 if (*gr >= 3 + PPC_NUM_REG_ARGS - 1) {
917 #ifdef ALIGN_DOUBLES
918                         //*stack_size += (*stack_size % 8);
919 #endif
920                         ainfo->offset = PPC_STACK_PARAM_OFFSET + *stack_size;
921                         ainfo->reg = ppc_sp; /* in the caller */
922                         ainfo->regtype = RegTypeBase;
923                         *stack_size += 8;
924                 } else {
925 #ifdef ALIGN_DOUBLES
926                 if (!((*gr) & 1))
927                         (*gr) ++;
928 #endif
929                         ALWAYS_ON_STACK (*stack_size += 8);
930                         ainfo->reg = *gr;
931                 }
932                 (*gr) ++;
933         }
934         (*gr) ++;
935 }
936
937 #if defined(__APPLE__) || defined(__mono_ppc64__)
938 static gboolean
939 has_only_a_r48_field (MonoClass *klass)
940 {
941         gpointer iter;
942         MonoClassField *f;
943         gboolean have_field = FALSE;
944         iter = NULL;
945         while ((f = mono_class_get_fields (klass, &iter))) {
946                 if (!(f->type->attrs & FIELD_ATTRIBUTE_STATIC)) {
947                         if (have_field)
948                                 return FALSE;
949                         if (!f->type->byref && (f->type->type == MONO_TYPE_R4 || f->type->type == MONO_TYPE_R8))
950                                 have_field = TRUE;
951                         else
952                                 return FALSE;
953                 }
954         }
955         return have_field;
956 }
957 #endif
958
959 static CallInfo*
960 get_call_info (MonoGenericSharingContext *gsctx, MonoMethodSignature *sig)
961 {
962         guint i, fr, gr, pstart;
963         int n = sig->hasthis + sig->param_count;
964         MonoType *simpletype;
965         guint32 stack_size = 0;
966         CallInfo *cinfo = g_malloc0 (sizeof (CallInfo) + sizeof (ArgInfo) * n);
967         gboolean is_pinvoke = sig->pinvoke;
968
969         fr = PPC_FIRST_FPARG_REG;
970         gr = PPC_FIRST_ARG_REG;
971
972         /* FIXME: handle returning a struct */
973         if (MONO_TYPE_ISSTRUCT (sig->ret)) {
974                 cinfo->vtype_retaddr = TRUE;
975         }
976
977         pstart = 0;
978         n = 0;
979         /*
980          * To simplify get_this_arg_reg () and LLVM integration, emit the vret arg after
981          * the first argument, allowing 'this' to be always passed in the first arg reg.
982          * Also do this if the first argument is a reference type, since virtual calls
983          * are sometimes made using calli without sig->hasthis set, like in the delegate
984          * invoke wrappers.
985          */
986         if (cinfo->vtype_retaddr && !is_pinvoke && (sig->hasthis || (sig->param_count > 0 && MONO_TYPE_IS_REFERENCE (mini_type_get_underlying_type (gsctx, sig->params [0]))))) {
987                 if (sig->hasthis) {
988                         add_general (&gr, &stack_size, cinfo->args + 0, TRUE);
989                         n ++;
990                 } else {
991                         add_general (&gr, &stack_size, &cinfo->args [sig->hasthis + 0], TRUE);
992                         pstart = 1;
993                         n ++;
994                 }
995                 add_general (&gr, &stack_size, &cinfo->ret, TRUE);
996                 cinfo->struct_ret = cinfo->ret.reg;
997                 cinfo->vret_arg_index = 1;
998         } else {
999                 /* this */
1000                 if (sig->hasthis) {
1001                         add_general (&gr, &stack_size, cinfo->args + 0, TRUE);
1002                         n ++;
1003                 }
1004
1005                 if (cinfo->vtype_retaddr) {
1006                         add_general (&gr, &stack_size, &cinfo->ret, TRUE);
1007                         cinfo->struct_ret = cinfo->ret.reg;
1008                 }
1009         }
1010
1011         DEBUG(printf("params: %d\n", sig->param_count));
1012         for (i = pstart; i < sig->param_count; ++i) {
1013                 if (!sig->pinvoke && (sig->call_convention == MONO_CALL_VARARG) && (i == sig->sentinelpos)) {
1014                         /* Prevent implicit arguments and sig_cookie from
1015                            being passed in registers */
1016                         gr = PPC_LAST_ARG_REG + 1;
1017                         /* FIXME: don't we have to set fr, too? */
1018                         /* Emit the signature cookie just before the implicit arguments */
1019                         add_general (&gr, &stack_size, &cinfo->sig_cookie, TRUE);
1020                 }
1021                 DEBUG(printf("param %d: ", i));
1022                 if (sig->params [i]->byref) {
1023                         DEBUG(printf("byref\n"));
1024                         add_general (&gr, &stack_size, cinfo->args + n, TRUE);
1025                         n++;
1026                         continue;
1027                 }
1028                 simpletype = mini_type_get_underlying_type (NULL, sig->params [i]);
1029                 switch (simpletype->type) {
1030                 case MONO_TYPE_BOOLEAN:
1031                 case MONO_TYPE_I1:
1032                 case MONO_TYPE_U1:
1033                         cinfo->args [n].size = 1;
1034                         add_general (&gr, &stack_size, cinfo->args + n, TRUE);
1035                         n++;
1036                         break;
1037                 case MONO_TYPE_CHAR:
1038                 case MONO_TYPE_I2:
1039                 case MONO_TYPE_U2:
1040                         cinfo->args [n].size = 2;
1041                         add_general (&gr, &stack_size, cinfo->args + n, TRUE);
1042                         n++;
1043                         break;
1044                 case MONO_TYPE_I4:
1045                 case MONO_TYPE_U4:
1046                         cinfo->args [n].size = 4;
1047                         add_general (&gr, &stack_size, cinfo->args + n, TRUE);
1048                         n++;
1049                         break;
1050                 case MONO_TYPE_I:
1051                 case MONO_TYPE_U:
1052                 case MONO_TYPE_PTR:
1053                 case MONO_TYPE_FNPTR:
1054                 case MONO_TYPE_CLASS:
1055                 case MONO_TYPE_OBJECT:
1056                 case MONO_TYPE_STRING:
1057                 case MONO_TYPE_SZARRAY:
1058                 case MONO_TYPE_ARRAY:
1059                         cinfo->args [n].size = sizeof (gpointer);
1060                         add_general (&gr, &stack_size, cinfo->args + n, TRUE);
1061                         n++;
1062                         break;
1063                 case MONO_TYPE_GENERICINST:
1064                         if (!mono_type_generic_inst_is_valuetype (simpletype)) {
1065                                 cinfo->args [n].size = sizeof (gpointer);
1066                                 add_general (&gr, &stack_size, cinfo->args + n, TRUE);
1067                                 n++;
1068                                 break;
1069                         }
1070                         /* Fall through */
1071                 case MONO_TYPE_VALUETYPE:
1072                 case MONO_TYPE_TYPEDBYREF: {
1073                         gint size;
1074                         MonoClass *klass;
1075
1076                         klass = mono_class_from_mono_type (sig->params [i]);
1077                         if (simpletype->type == MONO_TYPE_TYPEDBYREF)
1078                                 size = sizeof (MonoTypedRef);
1079                         else if (is_pinvoke)
1080                             size = mono_class_native_size (klass, NULL);
1081                         else
1082                             size = mono_class_value_size (klass, NULL);
1083
1084 #if defined(__APPLE__) || defined(__mono_ppc64__)
1085                         if ((size == 4 || size == 8) && has_only_a_r48_field (klass)) {
1086                                 cinfo->args [n].size = size;
1087
1088                                 /* It was 7, now it is 8 in LinuxPPC */
1089                                 if (fr <= PPC_LAST_FPARG_REG) {
1090                                         cinfo->args [n].regtype = RegTypeFP;
1091                                         cinfo->args [n].reg = fr;
1092                                         fr ++;
1093                                         FP_ALSO_IN_REG (gr ++);
1094                                         if (size == 8)
1095                                                 FP_ALSO_IN_REG (gr ++);
1096                                         ALWAYS_ON_STACK (stack_size += size);
1097                                 } else {
1098                                         cinfo->args [n].offset = PPC_STACK_PARAM_OFFSET + stack_size;
1099                                         cinfo->args [n].regtype = RegTypeBase;
1100                                         cinfo->args [n].reg = ppc_sp; /* in the caller*/
1101                                         stack_size += 8;
1102                                 }
1103                                 n++;
1104                                 break;
1105                         }
1106 #endif
1107                         DEBUG(printf ("load %d bytes struct\n",
1108                                       mono_class_native_size (sig->params [i]->data.klass, NULL)));
1109
1110 #if PPC_PASS_STRUCTS_BY_VALUE
1111                         {
1112                                 int align_size = size;
1113                                 int nregs = 0;
1114                                 int rest = PPC_LAST_ARG_REG - gr + 1;
1115                                 int n_in_regs;
1116
1117                                 align_size += (sizeof (gpointer) - 1);
1118                                 align_size &= ~(sizeof (gpointer) - 1);
1119                                 nregs = (align_size + sizeof (gpointer) -1 ) / sizeof (gpointer);
1120                                 n_in_regs = MIN (rest, nregs);
1121                                 if (n_in_regs < 0)
1122                                         n_in_regs = 0;
1123 #ifdef __APPLE__
1124                                 /* FIXME: check this */
1125                                 if (size >= 3 && size % 4 != 0)
1126                                         n_in_regs = 0;
1127 #endif
1128                                 cinfo->args [n].regtype = RegTypeStructByVal;
1129                                 cinfo->args [n].vtregs = n_in_regs;
1130                                 cinfo->args [n].size = n_in_regs;
1131                                 cinfo->args [n].vtsize = nregs - n_in_regs;
1132                                 cinfo->args [n].reg = gr;
1133
1134 #ifdef __mono_ppc64__
1135                                 if (nregs == 1 && is_pinvoke)
1136                                         cinfo->args [n].bytes = size;
1137                                 else
1138 #endif
1139                                         cinfo->args [n].bytes = 0;
1140                                 gr += n_in_regs;
1141                                 cinfo->args [n].offset = PPC_STACK_PARAM_OFFSET + stack_size;
1142                                 /*g_print ("offset for arg %d at %d\n", n, PPC_STACK_PARAM_OFFSET + stack_size);*/
1143                                 stack_size += nregs * sizeof (gpointer);
1144                         }
1145 #else
1146                         add_general (&gr, &stack_size, cinfo->args + n, TRUE);
1147                         cinfo->args [n].regtype = RegTypeStructByAddr;
1148                         cinfo->args [n].vtsize = size;
1149 #endif
1150                         n++;
1151                         break;
1152                 }
1153                 case MONO_TYPE_U8:
1154                 case MONO_TYPE_I8:
1155                         cinfo->args [n].size = 8;
1156                         add_general (&gr, &stack_size, cinfo->args + n, SIZEOF_REGISTER == 8);
1157                         n++;
1158                         break;
1159                 case MONO_TYPE_R4:
1160                         cinfo->args [n].size = 4;
1161
1162                         /* It was 7, now it is 8 in LinuxPPC */
1163                         if (fr <= PPC_LAST_FPARG_REG) {
1164                                 cinfo->args [n].regtype = RegTypeFP;
1165                                 cinfo->args [n].reg = fr;
1166                                 fr ++;
1167                                 FP_ALSO_IN_REG (gr ++);
1168                                 ALWAYS_ON_STACK (stack_size += SIZEOF_REGISTER);
1169                         } else {
1170                                 cinfo->args [n].offset = PPC_STACK_PARAM_OFFSET + stack_size + MONO_PPC_32_64_CASE (0, 4);
1171                                 cinfo->args [n].regtype = RegTypeBase;
1172                                 cinfo->args [n].reg = ppc_sp; /* in the caller*/
1173                                 stack_size += SIZEOF_REGISTER;
1174                         }
1175                         n++;
1176                         break;
1177                 case MONO_TYPE_R8:
1178                         cinfo->args [n].size = 8;
1179                         /* It was 7, now it is 8 in LinuxPPC */
1180                         if (fr <= PPC_LAST_FPARG_REG) {
1181                                 cinfo->args [n].regtype = RegTypeFP;
1182                                 cinfo->args [n].reg = fr;
1183                                 fr ++;
1184                                 FP_ALSO_IN_REG (gr += sizeof (double) / SIZEOF_REGISTER);
1185                                 ALWAYS_ON_STACK (stack_size += 8);
1186                         } else {
1187                                 cinfo->args [n].offset = PPC_STACK_PARAM_OFFSET + stack_size;
1188                                 cinfo->args [n].regtype = RegTypeBase;
1189                                 cinfo->args [n].reg = ppc_sp; /* in the caller*/
1190                                 stack_size += 8;
1191                         }
1192                         n++;
1193                         break;
1194                 default:
1195                         g_error ("Can't trampoline 0x%x", sig->params [i]->type);
1196                 }
1197         }
1198         cinfo->nargs = n;
1199
1200         if (!sig->pinvoke && (sig->call_convention == MONO_CALL_VARARG) && (i == sig->sentinelpos)) {
1201                 /* Prevent implicit arguments and sig_cookie from
1202                    being passed in registers */
1203                 gr = PPC_LAST_ARG_REG + 1;
1204                 /* Emit the signature cookie just before the implicit arguments */
1205                 add_general (&gr, &stack_size, &cinfo->sig_cookie, TRUE);
1206         }
1207
1208         {
1209                 simpletype = mini_type_get_underlying_type (NULL, sig->ret);
1210                 switch (simpletype->type) {
1211                 case MONO_TYPE_BOOLEAN:
1212                 case MONO_TYPE_I1:
1213                 case MONO_TYPE_U1:
1214                 case MONO_TYPE_I2:
1215                 case MONO_TYPE_U2:
1216                 case MONO_TYPE_CHAR:
1217                 case MONO_TYPE_I4:
1218                 case MONO_TYPE_U4:
1219                 case MONO_TYPE_I:
1220                 case MONO_TYPE_U:
1221                 case MONO_TYPE_PTR:
1222                 case MONO_TYPE_FNPTR:
1223                 case MONO_TYPE_CLASS:
1224                 case MONO_TYPE_OBJECT:
1225                 case MONO_TYPE_SZARRAY:
1226                 case MONO_TYPE_ARRAY:
1227                 case MONO_TYPE_STRING:
1228                         cinfo->ret.reg = ppc_r3;
1229                         break;
1230                 case MONO_TYPE_U8:
1231                 case MONO_TYPE_I8:
1232                         cinfo->ret.reg = ppc_r3;
1233                         break;
1234                 case MONO_TYPE_R4:
1235                 case MONO_TYPE_R8:
1236                         cinfo->ret.reg = ppc_f1;
1237                         cinfo->ret.regtype = RegTypeFP;
1238                         break;
1239                 case MONO_TYPE_GENERICINST:
1240                         if (!mono_type_generic_inst_is_valuetype (simpletype)) {
1241                                 cinfo->ret.reg = ppc_r3;
1242                                 break;
1243                         }
1244                         break;
1245                 case MONO_TYPE_VALUETYPE:
1246                         break;
1247                 case MONO_TYPE_TYPEDBYREF:
1248                 case MONO_TYPE_VOID:
1249                         break;
1250                 default:
1251                         g_error ("Can't handle as return value 0x%x", sig->ret->type);
1252                 }
1253         }
1254
1255         /* align stack size to 16 */
1256         DEBUG (printf ("      stack size: %d (%d)\n", (stack_size + 15) & ~15, stack_size));
1257         stack_size = (stack_size + 15) & ~15;
1258
1259         cinfo->stack_usage = stack_size;
1260         return cinfo;
1261 }
1262
1263 gboolean
1264 mono_arch_tail_call_supported (MonoCompile *cfg, MonoMethodSignature *caller_sig, MonoMethodSignature *callee_sig)
1265 {
1266         CallInfo *c1, *c2;
1267         gboolean res;
1268         int i;
1269
1270         c1 = get_call_info (NULL, caller_sig);
1271         c2 = get_call_info (NULL, callee_sig);
1272         res = c1->stack_usage >= c2->stack_usage;
1273         if (callee_sig->ret && MONO_TYPE_ISSTRUCT (callee_sig->ret))
1274                 /* An address on the callee's stack is passed as the first argument */
1275                 res = FALSE;
1276         for (i = 0; i < c2->nargs; ++i) {
1277                 if (c2->args [i].regtype == RegTypeStructByAddr)
1278                         /* An address on the callee's stack is passed as the argument */
1279                         res = FALSE;
1280         }
1281
1282         /*
1283         if (!mono_debug_count ())
1284                 res = FALSE;
1285         */
1286
1287         g_free (c1);
1288         g_free (c2);
1289
1290         return res;
1291 }
1292
1293 /*
1294  * Set var information according to the calling convention. ppc version.
1295  * The locals var stuff should most likely be split in another method.
1296  */
1297 void
1298 mono_arch_allocate_vars (MonoCompile *m)
1299 {
1300         MonoMethodSignature *sig;
1301         MonoMethodHeader *header;
1302         MonoInst *inst;
1303         int i, offset, size, align, curinst;
1304         int frame_reg = ppc_sp;
1305         gint32 *offsets;
1306         guint32 locals_stack_size, locals_stack_align;
1307
1308         m->flags |= MONO_CFG_HAS_SPILLUP;
1309
1310         /* allow room for the vararg method args: void* and long/double */
1311         if (mono_jit_trace_calls != NULL && mono_trace_eval (m->method))
1312                 m->param_area = MAX (m->param_area, sizeof (gpointer)*8);
1313         /* this is bug #60332: remove when #59509 is fixed, so no weird vararg 
1314          * call convs needs to be handled this way.
1315          */
1316         if (m->flags & MONO_CFG_HAS_VARARGS)
1317                 m->param_area = MAX (m->param_area, sizeof (gpointer)*8);
1318         /* gtk-sharp and other broken code will dllimport vararg functions even with
1319          * non-varargs signatures. Since there is little hope people will get this right
1320          * we assume they won't.
1321          */
1322         if (m->method->wrapper_type == MONO_WRAPPER_MANAGED_TO_NATIVE)
1323                 m->param_area = MAX (m->param_area, sizeof (gpointer)*8);
1324
1325         header = m->header;
1326
1327         /* 
1328          * We use the frame register also for any method that has
1329          * exception clauses. This way, when the handlers are called,
1330          * the code will reference local variables using the frame reg instead of
1331          * the stack pointer: if we had to restore the stack pointer, we'd
1332          * corrupt the method frames that are already on the stack (since
1333          * filters get called before stack unwinding happens) when the filter
1334          * code would call any method (this also applies to finally etc.).
1335          */ 
1336         if ((m->flags & MONO_CFG_HAS_ALLOCA) || header->num_clauses)
1337                 frame_reg = ppc_r31;
1338         m->frame_reg = frame_reg;
1339         if (frame_reg != ppc_sp) {
1340                 m->used_int_regs |= 1 << frame_reg;
1341         }
1342
1343         sig = mono_method_signature (m->method);
1344         
1345         offset = 0;
1346         curinst = 0;
1347         if (MONO_TYPE_ISSTRUCT (sig->ret)) {
1348                 m->ret->opcode = OP_REGVAR;
1349                 m->ret->inst_c0 = m->ret->dreg = ppc_r3;
1350         } else {
1351                 /* FIXME: handle long values? */
1352                 switch (mini_type_get_underlying_type (m->generic_sharing_context, sig->ret)->type) {
1353                 case MONO_TYPE_VOID:
1354                         break;
1355                 case MONO_TYPE_R4:
1356                 case MONO_TYPE_R8:
1357                         m->ret->opcode = OP_REGVAR;
1358                         m->ret->inst_c0 = m->ret->dreg = ppc_f1;
1359                         break;
1360                 default:
1361                         m->ret->opcode = OP_REGVAR;
1362                         m->ret->inst_c0 = m->ret->dreg = ppc_r3;
1363                         break;
1364                 }
1365         }
1366         /* local vars are at a positive offset from the stack pointer */
1367         /* 
1368          * also note that if the function uses alloca, we use ppc_r31
1369          * to point at the local variables.
1370          */
1371         offset = PPC_MINIMAL_STACK_SIZE; /* linkage area */
1372         /* align the offset to 16 bytes: not sure this is needed here  */
1373         //offset += 16 - 1;
1374         //offset &= ~(16 - 1);
1375
1376         /* add parameter area size for called functions */
1377         offset += m->param_area;
1378         offset += 16 - 1;
1379         offset &= ~(16 - 1);
1380
1381         /* allow room to save the return value */
1382         if (mono_jit_trace_calls != NULL && mono_trace_eval (m->method))
1383                 offset += 8;
1384
1385         /* the MonoLMF structure is stored just below the stack pointer */
1386
1387 #if 0
1388         /* this stuff should not be needed on ppc and the new jit,
1389          * because a call on ppc to the handlers doesn't change the 
1390          * stack pointer and the jist doesn't manipulate the stack pointer
1391          * for operations involving valuetypes.
1392          */
1393         /* reserve space to store the esp */
1394         offset += sizeof (gpointer);
1395
1396         /* this is a global constant */
1397         mono_exc_esp_offset = offset;
1398 #endif
1399
1400         if (MONO_TYPE_ISSTRUCT (sig->ret)) {
1401                 offset += sizeof(gpointer) - 1;
1402                 offset &= ~(sizeof(gpointer) - 1);
1403
1404                 m->vret_addr->opcode = OP_REGOFFSET;
1405                 m->vret_addr->inst_basereg = frame_reg;
1406                 m->vret_addr->inst_offset = offset;
1407
1408                 if (G_UNLIKELY (m->verbose_level > 1)) {
1409                         printf ("vret_addr =");
1410                         mono_print_ins (m->vret_addr);
1411                 }
1412
1413                 offset += sizeof(gpointer);
1414         }
1415
1416         offsets = mono_allocate_stack_slots (m, FALSE, &locals_stack_size, &locals_stack_align);
1417         if (locals_stack_align) {
1418                 offset += (locals_stack_align - 1);
1419                 offset &= ~(locals_stack_align - 1);
1420         }
1421         for (i = m->locals_start; i < m->num_varinfo; i++) {
1422                 if (offsets [i] != -1) {
1423                         MonoInst *inst = m->varinfo [i];
1424                         inst->opcode = OP_REGOFFSET;
1425                         inst->inst_basereg = frame_reg;
1426                         inst->inst_offset = offset + offsets [i];
1427                         /*
1428                         g_print ("allocating local %d (%s) to %d\n",
1429                                 i, mono_type_get_name (inst->inst_vtype), inst->inst_offset);
1430                         */
1431                 }
1432         }
1433         offset += locals_stack_size;
1434
1435         curinst = 0;
1436         if (sig->hasthis) {
1437                 inst = m->args [curinst];
1438                 if (inst->opcode != OP_REGVAR) {
1439                         inst->opcode = OP_REGOFFSET;
1440                         inst->inst_basereg = frame_reg;
1441                         offset += sizeof (gpointer) - 1;
1442                         offset &= ~(sizeof (gpointer) - 1);
1443                         inst->inst_offset = offset;
1444                         offset += sizeof (gpointer);
1445                 }
1446                 curinst++;
1447         }
1448
1449         for (i = 0; i < sig->param_count; ++i) {
1450                 inst = m->args [curinst];
1451                 if (inst->opcode != OP_REGVAR) {
1452                         inst->opcode = OP_REGOFFSET;
1453                         inst->inst_basereg = frame_reg;
1454                         if (sig->pinvoke) {
1455                                 size = mono_type_native_stack_size (sig->params [i], (guint32*)&align);
1456                                 inst->backend.is_pinvoke = 1;
1457                         } else {
1458                                 size = mono_type_size (sig->params [i], &align);
1459                         }
1460                         if (MONO_TYPE_ISSTRUCT (sig->params [i]) && size < sizeof (gpointer))
1461                                 size = align = sizeof (gpointer);
1462                         /* 
1463                          * Use at least 4/8 byte alignment, since these might be passed in registers, and
1464                          * they are saved using std in the prolog.
1465                          */
1466                         align = sizeof (gpointer);
1467                         offset += align - 1;
1468                         offset &= ~(align - 1);
1469                         inst->inst_offset = offset;
1470                         offset += size;
1471                 }
1472                 curinst++;
1473         }
1474
1475         /* some storage for fp conversions */
1476         offset += 8 - 1;
1477         offset &= ~(8 - 1);
1478         m->arch.fp_conv_var_offset = offset;
1479         offset += 8;
1480
1481         /* align the offset to 16 bytes */
1482         offset += 16 - 1;
1483         offset &= ~(16 - 1);
1484
1485         /* change sign? */
1486         m->stack_offset = offset;
1487
1488         if (sig->call_convention == MONO_CALL_VARARG) {
1489                 CallInfo *cinfo = get_call_info (m->generic_sharing_context, m->method->signature);
1490
1491                 m->sig_cookie = cinfo->sig_cookie.offset;
1492
1493                 g_free(cinfo);
1494         }
1495 }
1496
1497 void
1498 mono_arch_create_vars (MonoCompile *cfg)
1499 {
1500         MonoMethodSignature *sig = mono_method_signature (cfg->method);
1501
1502         if (MONO_TYPE_ISSTRUCT (sig->ret)) {
1503                 cfg->vret_addr = mono_compile_create_var (cfg, &mono_defaults.int_class->byval_arg, OP_ARG);
1504         }
1505 }
1506
1507 /* Fixme: we need an alignment solution for enter_method and mono_arch_call_opcode,
1508  * currently alignment in mono_arch_call_opcode is computed without arch_get_argument_info 
1509  */
1510
1511 static void
1512 emit_sig_cookie (MonoCompile *cfg, MonoCallInst *call, CallInfo *cinfo)
1513 {
1514         int sig_reg = mono_alloc_ireg (cfg);
1515
1516         /* FIXME: Add support for signature tokens to AOT */
1517         cfg->disable_aot = TRUE;
1518
1519         MONO_EMIT_NEW_ICONST (cfg, sig_reg, (gulong)call->signature);
1520         MONO_EMIT_NEW_STORE_MEMBASE (cfg, OP_STORE_MEMBASE_REG,
1521                         ppc_r1, cinfo->sig_cookie.offset, sig_reg);
1522 }
1523
1524 void
1525 mono_arch_emit_call (MonoCompile *cfg, MonoCallInst *call)
1526 {
1527         MonoInst *in, *ins;
1528         MonoMethodSignature *sig;
1529         int i, n;
1530         CallInfo *cinfo;
1531
1532         sig = call->signature;
1533         n = sig->param_count + sig->hasthis;
1534         
1535         cinfo = get_call_info (cfg->generic_sharing_context, sig);
1536
1537         for (i = 0; i < n; ++i) {
1538                 ArgInfo *ainfo = cinfo->args + i;
1539                 MonoType *t;
1540
1541                 if (i >= sig->hasthis)
1542                         t = sig->params [i - sig->hasthis];
1543                 else
1544                         t = &mono_defaults.int_class->byval_arg;
1545                 t = mini_type_get_underlying_type (cfg->generic_sharing_context, t);
1546
1547                 if (!sig->pinvoke && (sig->call_convention == MONO_CALL_VARARG) && (i == sig->sentinelpos))
1548                         emit_sig_cookie (cfg, call, cinfo);
1549
1550                 in = call->args [i];
1551
1552                 if (ainfo->regtype == RegTypeGeneral) {
1553 #ifndef __mono_ppc64__
1554                         if (!t->byref && ((t->type == MONO_TYPE_I8) || (t->type == MONO_TYPE_U8))) {
1555                                 MONO_INST_NEW (cfg, ins, OP_MOVE);
1556                                 ins->dreg = mono_alloc_ireg (cfg);
1557                                 ins->sreg1 = in->dreg + 1;
1558                                 MONO_ADD_INS (cfg->cbb, ins);
1559                                 mono_call_inst_add_outarg_reg (cfg, call, ins->dreg, ainfo->reg + 1, FALSE);
1560
1561                                 MONO_INST_NEW (cfg, ins, OP_MOVE);
1562                                 ins->dreg = mono_alloc_ireg (cfg);
1563                                 ins->sreg1 = in->dreg + 2;
1564                                 MONO_ADD_INS (cfg->cbb, ins);
1565                                 mono_call_inst_add_outarg_reg (cfg, call, ins->dreg, ainfo->reg, FALSE);
1566                         } else
1567 #endif
1568                         {
1569                                 MONO_INST_NEW (cfg, ins, OP_MOVE);
1570                                 ins->dreg = mono_alloc_ireg (cfg);
1571                                 ins->sreg1 = in->dreg;
1572                                 MONO_ADD_INS (cfg->cbb, ins);
1573
1574                                 mono_call_inst_add_outarg_reg (cfg, call, ins->dreg, ainfo->reg, FALSE);
1575                         }
1576                 } else if (ainfo->regtype == RegTypeStructByAddr) {
1577                         MONO_INST_NEW (cfg, ins, OP_OUTARG_VT);
1578                         ins->opcode = OP_OUTARG_VT;
1579                         ins->sreg1 = in->dreg;
1580                         ins->klass = in->klass;
1581                         ins->inst_p0 = call;
1582                         ins->inst_p1 = mono_mempool_alloc (cfg->mempool, sizeof (ArgInfo));
1583                         memcpy (ins->inst_p1, ainfo, sizeof (ArgInfo));
1584                         MONO_ADD_INS (cfg->cbb, ins);
1585                 } else if (ainfo->regtype == RegTypeStructByVal) {
1586                         /* this is further handled in mono_arch_emit_outarg_vt () */
1587                         MONO_INST_NEW (cfg, ins, OP_OUTARG_VT);
1588                         ins->opcode = OP_OUTARG_VT;
1589                         ins->sreg1 = in->dreg;
1590                         ins->klass = in->klass;
1591                         ins->inst_p0 = call;
1592                         ins->inst_p1 = mono_mempool_alloc (cfg->mempool, sizeof (ArgInfo));
1593                         memcpy (ins->inst_p1, ainfo, sizeof (ArgInfo));
1594                         MONO_ADD_INS (cfg->cbb, ins);
1595                 } else if (ainfo->regtype == RegTypeBase) {
1596                         if (!t->byref && ((t->type == MONO_TYPE_I8) || (t->type == MONO_TYPE_U8))) {
1597                                 MONO_EMIT_NEW_STORE_MEMBASE (cfg, OP_STOREI8_MEMBASE_REG, ppc_r1, ainfo->offset, in->dreg);
1598                         } else if (!t->byref && ((t->type == MONO_TYPE_R4) || (t->type == MONO_TYPE_R8))) {
1599                                 if (t->type == MONO_TYPE_R8)
1600                                         MONO_EMIT_NEW_STORE_MEMBASE (cfg, OP_STORER8_MEMBASE_REG, ppc_r1, ainfo->offset, in->dreg);
1601                                 else
1602                                         MONO_EMIT_NEW_STORE_MEMBASE (cfg, OP_STORER4_MEMBASE_REG, ppc_r1, ainfo->offset, in->dreg);
1603                         } else {
1604                                 MONO_EMIT_NEW_STORE_MEMBASE (cfg, OP_STORE_MEMBASE_REG, ppc_r1, ainfo->offset, in->dreg);
1605                         }
1606                 } else if (ainfo->regtype == RegTypeFP) {
1607                         if (t->type == MONO_TYPE_VALUETYPE) {
1608                                 /* this is further handled in mono_arch_emit_outarg_vt () */
1609                                 MONO_INST_NEW (cfg, ins, OP_OUTARG_VT);
1610                                 ins->opcode = OP_OUTARG_VT;
1611                                 ins->sreg1 = in->dreg;
1612                                 ins->klass = in->klass;
1613                                 ins->inst_p0 = call;
1614                                 ins->inst_p1 = mono_mempool_alloc (cfg->mempool, sizeof (ArgInfo));
1615                                 memcpy (ins->inst_p1, ainfo, sizeof (ArgInfo));
1616                                 MONO_ADD_INS (cfg->cbb, ins);
1617
1618                                 cfg->flags |= MONO_CFG_HAS_FPOUT;
1619                         } else {
1620                                 int dreg = mono_alloc_freg (cfg);
1621
1622                                 if (ainfo->size == 4) {
1623                                         MONO_EMIT_NEW_UNALU (cfg, OP_FCONV_TO_R4, dreg, in->dreg);
1624                                 } else {
1625                                         MONO_INST_NEW (cfg, ins, OP_FMOVE);
1626                                         ins->dreg = dreg;
1627                                         ins->sreg1 = in->dreg;
1628                                         MONO_ADD_INS (cfg->cbb, ins);
1629                                 }
1630
1631                                 mono_call_inst_add_outarg_reg (cfg, call, dreg, ainfo->reg, TRUE);
1632                                 cfg->flags |= MONO_CFG_HAS_FPOUT;
1633                         }
1634                 } else {
1635                         g_assert_not_reached ();
1636                 }
1637         }
1638
1639         /* Emit the signature cookie in the case that there is no
1640            additional argument */
1641         if (!sig->pinvoke && (sig->call_convention == MONO_CALL_VARARG) && (n == sig->sentinelpos))
1642                 emit_sig_cookie (cfg, call, cinfo);
1643
1644         if (cinfo->struct_ret) {
1645                 MonoInst *vtarg;
1646
1647                 MONO_INST_NEW (cfg, vtarg, OP_MOVE);
1648                 vtarg->sreg1 = call->vret_var->dreg;
1649                 vtarg->dreg = mono_alloc_preg (cfg);
1650                 MONO_ADD_INS (cfg->cbb, vtarg);
1651
1652                 mono_call_inst_add_outarg_reg (cfg, call, vtarg->dreg, cinfo->struct_ret, FALSE);
1653         }
1654
1655         call->stack_usage = cinfo->stack_usage;
1656         cfg->param_area = MAX (PPC_MINIMAL_PARAM_AREA_SIZE, MAX (cfg->param_area, cinfo->stack_usage));
1657         cfg->flags |= MONO_CFG_HAS_CALLS;
1658
1659         g_free (cinfo);
1660 }
1661
1662 #ifndef DISABLE_JIT
1663
1664 void
1665 mono_arch_emit_outarg_vt (MonoCompile *cfg, MonoInst *ins, MonoInst *src)
1666 {
1667         MonoCallInst *call = (MonoCallInst*)ins->inst_p0;
1668         ArgInfo *ainfo = ins->inst_p1;
1669         int ovf_size = ainfo->vtsize;
1670         int doffset = ainfo->offset;
1671         int i, soffset, dreg;
1672
1673         if (ainfo->regtype == RegTypeStructByVal) {
1674 #ifdef __APPLE__
1675                 guint32 size = 0;
1676 #endif
1677                 soffset = 0;
1678 #ifdef __APPLE__
1679                 /*
1680                  * Darwin pinvokes needs some special handling for 1
1681                  * and 2 byte arguments
1682                  */
1683                 g_assert (ins->klass);
1684                 if (call->signature->pinvoke)
1685                         size =  mono_class_native_size (ins->klass, NULL);
1686                 if (size == 2 || size == 1) {
1687                         int tmpr = mono_alloc_ireg (cfg);
1688                         if (size == 1)
1689                                 MONO_EMIT_NEW_LOAD_MEMBASE_OP (cfg, OP_LOADI1_MEMBASE, tmpr, src->dreg, soffset);
1690                         else
1691                                 MONO_EMIT_NEW_LOAD_MEMBASE_OP (cfg, OP_LOADI2_MEMBASE, tmpr, src->dreg, soffset);
1692                         dreg = mono_alloc_ireg (cfg);
1693                         MONO_EMIT_NEW_UNALU (cfg, OP_MOVE, dreg, tmpr);
1694                         mono_call_inst_add_outarg_reg (cfg, call, dreg, ainfo->reg, FALSE);
1695                 } else
1696 #endif
1697                         for (i = 0; i < ainfo->vtregs; ++i) {
1698                                 int antipadding = 0;
1699                                 if (ainfo->bytes) {
1700                                         g_assert (i == 0);
1701                                         antipadding = sizeof (gpointer) - ainfo->bytes;
1702                                 }
1703                                 dreg = mono_alloc_ireg (cfg);
1704                                 MONO_EMIT_NEW_LOAD_MEMBASE (cfg, dreg, src->dreg, soffset);
1705                                 if (antipadding)
1706                                         MONO_EMIT_NEW_BIALU_IMM (cfg, OP_SHR_UN_IMM, dreg, dreg, antipadding * 8);
1707                                 mono_call_inst_add_outarg_reg (cfg, call, dreg, ainfo->reg + i, FALSE);
1708                                 soffset += sizeof (gpointer);
1709                         }
1710                 if (ovf_size != 0)
1711                         mini_emit_memcpy (cfg, ppc_r1, doffset + soffset, src->dreg, soffset, ovf_size * sizeof (gpointer), 0);
1712         } else if (ainfo->regtype == RegTypeFP) {
1713                 int tmpr = mono_alloc_freg (cfg);
1714                 if (ainfo->size == 4)
1715                         MONO_EMIT_NEW_LOAD_MEMBASE_OP (cfg, OP_LOADR4_MEMBASE, tmpr, src->dreg, 0);
1716                 else
1717                         MONO_EMIT_NEW_LOAD_MEMBASE_OP (cfg, OP_LOADR8_MEMBASE, tmpr, src->dreg, 0);
1718                 dreg = mono_alloc_freg (cfg);
1719                 MONO_EMIT_NEW_UNALU (cfg, OP_FMOVE, dreg, tmpr);
1720                 mono_call_inst_add_outarg_reg (cfg, call, dreg, ainfo->reg, TRUE);
1721         } else {
1722                 MonoInst *vtcopy = mono_compile_create_var (cfg, &src->klass->byval_arg, OP_LOCAL);
1723                 MonoInst *load;
1724                 guint32 size;
1725
1726                 /* FIXME: alignment? */
1727                 if (call->signature->pinvoke) {
1728                         size = mono_type_native_stack_size (&src->klass->byval_arg, NULL);
1729                         vtcopy->backend.is_pinvoke = 1;
1730                 } else {
1731                         size = mini_type_stack_size (cfg->generic_sharing_context, &src->klass->byval_arg, NULL);
1732                 }
1733                 if (size > 0)
1734                         g_assert (ovf_size > 0);
1735
1736                 EMIT_NEW_VARLOADA (cfg, load, vtcopy, vtcopy->inst_vtype);
1737                 mini_emit_memcpy (cfg, load->dreg, 0, src->dreg, 0, size, 0);
1738
1739                 if (ainfo->offset)
1740                         MONO_EMIT_NEW_STORE_MEMBASE (cfg, OP_STORE_MEMBASE_REG, ppc_r1, ainfo->offset, load->dreg);
1741                 else
1742                         mono_call_inst_add_outarg_reg (cfg, call, load->dreg, ainfo->reg, FALSE);
1743         }
1744 }
1745
1746 void
1747 mono_arch_emit_setret (MonoCompile *cfg, MonoMethod *method, MonoInst *val)
1748 {
1749         MonoType *ret = mini_type_get_underlying_type (cfg->generic_sharing_context,
1750                         mono_method_signature (method)->ret);
1751
1752         if (!ret->byref) {
1753 #ifndef __mono_ppc64__
1754                 if (ret->type == MONO_TYPE_I8 || ret->type == MONO_TYPE_U8) {
1755                         MonoInst *ins;
1756
1757                         MONO_INST_NEW (cfg, ins, OP_SETLRET);
1758                         ins->sreg1 = val->dreg + 1;
1759                         ins->sreg2 = val->dreg + 2;
1760                         MONO_ADD_INS (cfg->cbb, ins);
1761                         return;
1762                 }
1763 #endif
1764                 if (ret->type == MONO_TYPE_R8 || ret->type == MONO_TYPE_R4) {
1765                         MONO_EMIT_NEW_UNALU (cfg, OP_FMOVE, cfg->ret->dreg, val->dreg);
1766                         return;
1767                 }
1768         }
1769         MONO_EMIT_NEW_UNALU (cfg, OP_MOVE, cfg->ret->dreg, val->dreg);
1770 }
1771
1772 /* FIXME: this is just a useless hint: fix the interface to include the opcode */
1773 gboolean
1774 mono_arch_is_inst_imm (gint64 imm)
1775 {
1776        return TRUE;
1777 }
1778
1779 #endif /* DISABLE_JIT */
1780
1781 /*
1782  * Allow tracing to work with this interface (with an optional argument)
1783  */
1784
1785 void*
1786 mono_arch_instrument_prolog (MonoCompile *cfg, void *func, void *p, gboolean enable_arguments)
1787 {
1788         guchar *code = p;
1789
1790         ppc_load_ptr (code, ppc_r3, cfg->method);
1791         ppc_li (code, ppc_r4, 0); /* NULL ebp for now */
1792         ppc_load_func (code, ppc_r0, func);
1793         ppc_mtlr (code, ppc_r0);
1794         ppc_blrl (code);
1795         return code;
1796 }
1797
1798 enum {
1799         SAVE_NONE,
1800         SAVE_STRUCT,
1801         SAVE_ONE,
1802         SAVE_TWO,
1803         SAVE_FP
1804 };
1805
1806 void*
1807 mono_arch_instrument_epilog_full (MonoCompile *cfg, void *func, void *p, gboolean enable_arguments, gboolean preserve_argument_registers)
1808 {
1809         guchar *code = p;
1810         int save_mode = SAVE_NONE;
1811         int offset;
1812         MonoMethod *method = cfg->method;
1813         int rtype = mini_type_get_underlying_type (cfg->generic_sharing_context,
1814                         mono_method_signature (method)->ret)->type;
1815         int save_offset = PPC_STACK_PARAM_OFFSET + cfg->param_area;
1816         save_offset += 15;
1817         save_offset &= ~15;
1818         
1819         offset = code - cfg->native_code;
1820         /* we need about 16 instructions */
1821         if (offset > (cfg->code_size - 16 * 4)) {
1822                 cfg->code_size *= 2;
1823                 cfg->native_code = g_realloc (cfg->native_code, cfg->code_size);
1824                 code = cfg->native_code + offset;
1825         }
1826
1827         switch (rtype) {
1828         case MONO_TYPE_VOID:
1829                 /* special case string .ctor icall */
1830                 if (strcmp (".ctor", method->name) && method->klass == mono_defaults.string_class)
1831                         save_mode = SAVE_ONE;
1832                 else
1833                         save_mode = SAVE_NONE;
1834                 break;
1835 #ifndef __mono_ppc64__
1836         case MONO_TYPE_I8:
1837         case MONO_TYPE_U8:
1838                 save_mode = SAVE_TWO;
1839                 break;
1840 #endif
1841         case MONO_TYPE_R4:
1842         case MONO_TYPE_R8:
1843                 save_mode = SAVE_FP;
1844                 break;
1845         case MONO_TYPE_VALUETYPE:
1846                 save_mode = SAVE_STRUCT;
1847                 break;
1848         default:
1849                 save_mode = SAVE_ONE;
1850                 break;
1851         }
1852
1853         switch (save_mode) {
1854         case SAVE_TWO:
1855                 ppc_stw (code, ppc_r3, save_offset, cfg->frame_reg);
1856                 ppc_stw (code, ppc_r4, save_offset + 4, cfg->frame_reg);
1857                 if (enable_arguments) {
1858                         ppc_mr (code, ppc_r5, ppc_r4);
1859                         ppc_mr (code, ppc_r4, ppc_r3);
1860                 }
1861                 break;
1862         case SAVE_ONE:
1863                 ppc_stptr (code, ppc_r3, save_offset, cfg->frame_reg);
1864                 if (enable_arguments) {
1865                         ppc_mr (code, ppc_r4, ppc_r3);
1866                 }
1867                 break;
1868         case SAVE_FP:
1869                 ppc_stfd (code, ppc_f1, save_offset, cfg->frame_reg);
1870                 if (enable_arguments) {
1871                         /* FIXME: what reg?  */
1872                         ppc_fmr (code, ppc_f3, ppc_f1);
1873                         /* FIXME: use 8 byte load on PPC64 */
1874                         ppc_lwz (code, ppc_r4, save_offset, cfg->frame_reg);
1875                         ppc_lwz (code, ppc_r5, save_offset + 4, cfg->frame_reg);
1876                 }
1877                 break;
1878         case SAVE_STRUCT:
1879                 if (enable_arguments) {
1880                         /* FIXME: get the actual address  */
1881                         ppc_mr (code, ppc_r4, ppc_r3);
1882                 }
1883                 break;
1884         case SAVE_NONE:
1885         default:
1886                 break;
1887         }
1888
1889         ppc_load_ptr (code, ppc_r3, cfg->method);
1890         ppc_load_func (code, ppc_r0, func);
1891         ppc_mtlr (code, ppc_r0);
1892         ppc_blrl (code);
1893
1894         switch (save_mode) {
1895         case SAVE_TWO:
1896                 ppc_lwz (code, ppc_r3, save_offset, cfg->frame_reg);
1897                 ppc_lwz (code, ppc_r4, save_offset + 4, cfg->frame_reg);
1898                 break;
1899         case SAVE_ONE:
1900                 ppc_ldptr (code, ppc_r3, save_offset, cfg->frame_reg);
1901                 break;
1902         case SAVE_FP:
1903                 ppc_lfd (code, ppc_f1, save_offset, cfg->frame_reg);
1904                 break;
1905         case SAVE_NONE:
1906         default:
1907                 break;
1908         }
1909
1910         return code;
1911 }
1912 /*
1913  * Conditional branches have a small offset, so if it is likely overflowed,
1914  * we do a branch to the end of the method (uncond branches have much larger
1915  * offsets) where we perform the conditional and jump back unconditionally.
1916  * It's slightly slower, since we add two uncond branches, but it's very simple
1917  * with the current patch implementation and such large methods are likely not
1918  * going to be perf critical anyway.
1919  */
1920 typedef struct {
1921         union {
1922                 MonoBasicBlock *bb;
1923                 const char *exception;
1924         } data;
1925         guint32 ip_offset;
1926         guint16 b0_cond;
1927         guint16 b1_cond;
1928 } MonoOvfJump;
1929
1930 #define EMIT_COND_BRANCH_FLAGS(ins,b0,b1) \
1931 if (0 && ins->inst_true_bb->native_offset) { \
1932         ppc_bc (code, (b0), (b1), (code - cfg->native_code + ins->inst_true_bb->native_offset) & 0xffff); \
1933 } else { \
1934         int br_disp = ins->inst_true_bb->max_offset - offset;   \
1935         if (!ppc_is_imm16 (br_disp + 1024) || ! ppc_is_imm16 (ppc_is_imm16 (br_disp - 1024))) { \
1936                 MonoOvfJump *ovfj = mono_mempool_alloc (cfg->mempool, sizeof (MonoOvfJump));    \
1937                 ovfj->data.bb = ins->inst_true_bb;      \
1938                 ovfj->ip_offset = 0;    \
1939                 ovfj->b0_cond = (b0);   \
1940                 ovfj->b1_cond = (b1);   \
1941                 mono_add_patch_info (cfg, code - cfg->native_code, MONO_PATCH_INFO_BB_OVF, ovfj); \
1942                 ppc_b (code, 0);        \
1943         } else {        \
1944                 mono_add_patch_info (cfg, code - cfg->native_code, MONO_PATCH_INFO_BB, ins->inst_true_bb); \
1945                 ppc_bc (code, (b0), (b1), 0);   \
1946         }       \
1947 }
1948
1949 #define EMIT_COND_BRANCH(ins,cond) EMIT_COND_BRANCH_FLAGS(ins, branch_b0_table [(cond)], branch_b1_table [(cond)])
1950
1951 /* emit an exception if condition is fail
1952  *
1953  * We assign the extra code used to throw the implicit exceptions
1954  * to cfg->bb_exit as far as the big branch handling is concerned
1955  */
1956 #define EMIT_COND_SYSTEM_EXCEPTION_FLAGS(b0,b1,exc_name)            \
1957         do {                                                        \
1958                 int br_disp = cfg->bb_exit->max_offset - offset;        \
1959                 if (!ppc_is_imm16 (br_disp + 1024) || ! ppc_is_imm16 (ppc_is_imm16 (br_disp - 1024))) { \
1960                         MonoOvfJump *ovfj = mono_mempool_alloc (cfg->mempool, sizeof (MonoOvfJump));    \
1961                         ovfj->data.exception = (exc_name);      \
1962                         ovfj->ip_offset = code - cfg->native_code;      \
1963                         ovfj->b0_cond = (b0);   \
1964                         ovfj->b1_cond = (b1);   \
1965                         mono_add_patch_info (cfg, code - cfg->native_code, MONO_PATCH_INFO_EXC_OVF, ovfj); \
1966                         ppc_bl (code, 0);       \
1967                         cfg->bb_exit->max_offset += 24; \
1968                 } else {        \
1969                         mono_add_patch_info (cfg, code - cfg->native_code,   \
1970                                     MONO_PATCH_INFO_EXC, exc_name);  \
1971                         ppc_bcl (code, (b0), (b1), 0);  \
1972                 }       \
1973         } while (0); 
1974
1975 #define EMIT_COND_SYSTEM_EXCEPTION(cond,exc_name) EMIT_COND_SYSTEM_EXCEPTION_FLAGS(branch_b0_table [(cond)], branch_b1_table [(cond)], (exc_name))
1976
1977 void
1978 mono_arch_peephole_pass_1 (MonoCompile *cfg, MonoBasicBlock *bb)
1979 {
1980 }
1981
1982 static int
1983 normalize_opcode (int opcode)
1984 {
1985         switch (opcode) {
1986 #ifndef __mono_ilp32__
1987         case MONO_PPC_32_64_CASE (OP_LOADI4_MEMBASE, OP_LOADI8_MEMBASE):
1988                 return OP_LOAD_MEMBASE;
1989         case MONO_PPC_32_64_CASE (OP_LOADI4_MEMINDEX, OP_LOADI8_MEMINDEX):
1990                 return OP_LOAD_MEMINDEX;
1991         case MONO_PPC_32_64_CASE (OP_STOREI4_MEMBASE_REG, OP_STOREI8_MEMBASE_REG):
1992                 return OP_STORE_MEMBASE_REG;
1993         case MONO_PPC_32_64_CASE (OP_STOREI4_MEMBASE_IMM, OP_STOREI8_MEMBASE_IMM):
1994                 return OP_STORE_MEMBASE_IMM;
1995         case MONO_PPC_32_64_CASE (OP_STOREI4_MEMINDEX, OP_STOREI8_MEMINDEX):
1996                 return OP_STORE_MEMINDEX;
1997 #endif
1998         case MONO_PPC_32_64_CASE (OP_ISHR_IMM, OP_LSHR_IMM):
1999                 return OP_SHR_IMM;
2000         case MONO_PPC_32_64_CASE (OP_ISHR_UN_IMM, OP_LSHR_UN_IMM):
2001                 return OP_SHR_UN_IMM;
2002         default:
2003                 return opcode;
2004         }
2005 }
2006
2007 void
2008 mono_arch_peephole_pass_2 (MonoCompile *cfg, MonoBasicBlock *bb)
2009 {
2010         MonoInst *ins, *n, *last_ins = NULL;
2011
2012         MONO_BB_FOR_EACH_INS_SAFE (bb, n, ins) {
2013                 switch (normalize_opcode (ins->opcode)) {
2014                 case OP_MUL_IMM: 
2015                         /* remove unnecessary multiplication with 1 */
2016                         if (ins->inst_imm == 1) {
2017                                 if (ins->dreg != ins->sreg1) {
2018                                         ins->opcode = OP_MOVE;
2019                                 } else {
2020                                         MONO_DELETE_INS (bb, ins);
2021                                         continue;
2022                                 }
2023                         } else {
2024                                 int power2 = mono_is_power_of_two (ins->inst_imm);
2025                                 if (power2 > 0) {
2026                                         ins->opcode = OP_SHL_IMM;
2027                                         ins->inst_imm = power2;
2028                                 }
2029                         }
2030                         break;
2031                 case OP_LOAD_MEMBASE:
2032                         /* 
2033                          * OP_STORE_MEMBASE_REG reg, offset(basereg) 
2034                          * OP_LOAD_MEMBASE offset(basereg), reg
2035                          */
2036                         if (last_ins && normalize_opcode (last_ins->opcode) == OP_STORE_MEMBASE_REG &&
2037                             ins->inst_basereg == last_ins->inst_destbasereg &&
2038                             ins->inst_offset == last_ins->inst_offset) {
2039                                 if (ins->dreg == last_ins->sreg1) {
2040                                         MONO_DELETE_INS (bb, ins);
2041                                         continue;
2042                                 } else {
2043                                         //static int c = 0; printf ("MATCHX %s %d\n", cfg->method->name,c++);
2044                                         ins->opcode = OP_MOVE;
2045                                         ins->sreg1 = last_ins->sreg1;
2046                                 }
2047
2048                         /* 
2049                          * Note: reg1 must be different from the basereg in the second load
2050                          * OP_LOAD_MEMBASE offset(basereg), reg1
2051                          * OP_LOAD_MEMBASE offset(basereg), reg2
2052                          * -->
2053                          * OP_LOAD_MEMBASE offset(basereg), reg1
2054                          * OP_MOVE reg1, reg2
2055                          */
2056                         } else if (last_ins && normalize_opcode (last_ins->opcode) == OP_LOAD_MEMBASE &&
2057                               ins->inst_basereg != last_ins->dreg &&
2058                               ins->inst_basereg == last_ins->inst_basereg &&
2059                               ins->inst_offset == last_ins->inst_offset) {
2060
2061                                 if (ins->dreg == last_ins->dreg) {
2062                                         MONO_DELETE_INS (bb, ins);
2063                                         continue;
2064                                 } else {
2065                                         ins->opcode = OP_MOVE;
2066                                         ins->sreg1 = last_ins->dreg;
2067                                 }
2068
2069                                 //g_assert_not_reached ();
2070
2071 #if 0
2072                         /* 
2073                          * OP_STORE_MEMBASE_IMM imm, offset(basereg) 
2074                          * OP_LOAD_MEMBASE offset(basereg), reg
2075                          * -->
2076                          * OP_STORE_MEMBASE_IMM imm, offset(basereg) 
2077                          * OP_ICONST reg, imm
2078                          */
2079                         } else if (last_ins && normalize_opcode (last_ins->opcode) == OP_STORE_MEMBASE_IMM &&
2080                                    ins->inst_basereg == last_ins->inst_destbasereg &&
2081                                    ins->inst_offset == last_ins->inst_offset) {
2082                                 //static int c = 0; printf ("MATCHX %s %d\n", cfg->method->name,c++);
2083                                 ins->opcode = OP_ICONST;
2084                                 ins->inst_c0 = last_ins->inst_imm;
2085                                 g_assert_not_reached (); // check this rule
2086 #endif
2087                         }
2088                         break;
2089                 case OP_LOADU1_MEMBASE:
2090                 case OP_LOADI1_MEMBASE:
2091                         if (last_ins && (last_ins->opcode == OP_STOREI1_MEMBASE_REG) &&
2092                                         ins->inst_basereg == last_ins->inst_destbasereg &&
2093                                         ins->inst_offset == last_ins->inst_offset) {
2094                                 ins->opcode = (ins->opcode == OP_LOADI1_MEMBASE) ? OP_ICONV_TO_I1 : OP_ICONV_TO_U1;
2095                                 ins->sreg1 = last_ins->sreg1;                           
2096                         }
2097                         break;
2098                 case OP_LOADU2_MEMBASE:
2099                 case OP_LOADI2_MEMBASE:
2100                         if (last_ins && (last_ins->opcode == OP_STOREI2_MEMBASE_REG) &&
2101                                         ins->inst_basereg == last_ins->inst_destbasereg &&
2102                                         ins->inst_offset == last_ins->inst_offset) {
2103                                 ins->opcode = (ins->opcode == OP_LOADI2_MEMBASE) ? OP_ICONV_TO_I2 : OP_ICONV_TO_U2;
2104                                 ins->sreg1 = last_ins->sreg1;                           
2105                         }
2106                         break;
2107 #ifdef __mono_ppc64__
2108                 case OP_LOADU4_MEMBASE:
2109                 case OP_LOADI4_MEMBASE:
2110                         if (last_ins && (last_ins->opcode == OP_STOREI4_MEMBASE_REG) &&
2111                                         ins->inst_basereg == last_ins->inst_destbasereg &&
2112                                         ins->inst_offset == last_ins->inst_offset) {
2113                                 ins->opcode = (ins->opcode == OP_LOADI4_MEMBASE) ? OP_ICONV_TO_I4 : OP_ICONV_TO_U4;
2114                                 ins->sreg1 = last_ins->sreg1;
2115                         }
2116                         break;
2117 #endif
2118                 case OP_MOVE:
2119                         ins->opcode = OP_MOVE;
2120                         /* 
2121                          * OP_MOVE reg, reg 
2122                          */
2123                         if (ins->dreg == ins->sreg1) {
2124                                 MONO_DELETE_INS (bb, ins);
2125                                 continue;
2126                         }
2127                         /* 
2128                          * OP_MOVE sreg, dreg 
2129                          * OP_MOVE dreg, sreg
2130                          */
2131                         if (last_ins && last_ins->opcode == OP_MOVE &&
2132                             ins->sreg1 == last_ins->dreg &&
2133                             ins->dreg == last_ins->sreg1) {
2134                                 MONO_DELETE_INS (bb, ins);
2135                                 continue;
2136                         }
2137                         break;
2138                 }
2139                 last_ins = ins;
2140                 ins = ins->next;
2141         }
2142         bb->last_ins = last_ins;
2143 }
2144
2145 void
2146 mono_arch_decompose_opts (MonoCompile *cfg, MonoInst *ins)
2147 {
2148         switch (ins->opcode) {
2149         case OP_ICONV_TO_R_UN: {
2150 #if G_BYTE_ORDER == G_BIG_ENDIAN
2151                 static const guint64 adjust_val = 0x4330000000000000ULL;
2152 #else
2153                 static const guint64 adjust_val = 0x0000000000003043ULL;
2154 #endif
2155                 int msw_reg = mono_alloc_ireg (cfg);
2156                 int adj_reg = mono_alloc_freg (cfg);
2157                 int tmp_reg = mono_alloc_freg (cfg);
2158                 int basereg = ppc_sp;
2159                 int offset = -8;
2160                 MONO_EMIT_NEW_ICONST (cfg, msw_reg, 0x43300000);
2161                 if (!ppc_is_imm16 (offset + 4)) {
2162                         basereg = mono_alloc_ireg (cfg);
2163                         MONO_EMIT_NEW_BIALU_IMM (cfg, OP_IADD_IMM, basereg, cfg->frame_reg, offset);
2164                 }
2165                 MONO_EMIT_NEW_STORE_MEMBASE (cfg, OP_STOREI4_MEMBASE_REG, basereg, offset, msw_reg);
2166                 MONO_EMIT_NEW_STORE_MEMBASE (cfg, OP_STOREI4_MEMBASE_REG, basereg, offset + 4, ins->sreg1);
2167                 MONO_EMIT_NEW_LOAD_R8 (cfg, adj_reg, &adjust_val);
2168                 MONO_EMIT_NEW_LOAD_MEMBASE_OP (cfg, OP_LOADR8_MEMBASE, tmp_reg, basereg, offset);
2169                 MONO_EMIT_NEW_BIALU (cfg, OP_FSUB, ins->dreg, tmp_reg, adj_reg);
2170                 ins->opcode = OP_NOP;
2171                 break;
2172         }
2173 #ifndef __mono_ppc64__
2174         case OP_ICONV_TO_R4:
2175         case OP_ICONV_TO_R8: {
2176                 /* If we have a PPC_FEATURE_64 machine we can avoid
2177                    this and use the fcfid instruction.  Otherwise
2178                    on an old 32-bit chip and we have to do this the
2179                    hard way.  */
2180                 if (!(cpu_hw_caps & PPC_ISA_64)) {
2181                         /* FIXME: change precision for CEE_CONV_R4 */
2182                         static const guint64 adjust_val = 0x4330000080000000ULL;
2183                         int msw_reg = mono_alloc_ireg (cfg);
2184                         int xored = mono_alloc_ireg (cfg);
2185                         int adj_reg = mono_alloc_freg (cfg);
2186                         int tmp_reg = mono_alloc_freg (cfg);
2187                         int basereg = ppc_sp;
2188                         int offset = -8;
2189                         if (!ppc_is_imm16 (offset + 4)) {
2190                                 basereg = mono_alloc_ireg (cfg);
2191                                 MONO_EMIT_NEW_BIALU_IMM (cfg, OP_IADD_IMM, basereg, cfg->frame_reg, offset);
2192                         }
2193                         MONO_EMIT_NEW_ICONST (cfg, msw_reg, 0x43300000);
2194                         MONO_EMIT_NEW_STORE_MEMBASE (cfg, OP_STOREI4_MEMBASE_REG, basereg, offset, msw_reg);
2195                         MONO_EMIT_NEW_BIALU_IMM (cfg, OP_XOR_IMM, xored, ins->sreg1, 0x80000000);
2196                         MONO_EMIT_NEW_STORE_MEMBASE (cfg, OP_STOREI4_MEMBASE_REG, basereg, offset + 4, xored);
2197                         MONO_EMIT_NEW_LOAD_R8 (cfg, adj_reg, (gpointer)&adjust_val);
2198                         MONO_EMIT_NEW_LOAD_MEMBASE_OP (cfg, OP_LOADR8_MEMBASE, tmp_reg, basereg, offset);
2199                         MONO_EMIT_NEW_BIALU (cfg, OP_FSUB, ins->dreg, tmp_reg, adj_reg);
2200                         if (ins->opcode == OP_ICONV_TO_R4)
2201                                 MONO_EMIT_NEW_UNALU (cfg, OP_FCONV_TO_R4, ins->dreg, ins->dreg);
2202                         ins->opcode = OP_NOP;
2203                 }
2204                 break;
2205         }
2206 #endif
2207         case OP_CKFINITE: {
2208                 int msw_reg = mono_alloc_ireg (cfg);
2209                 int basereg = ppc_sp;
2210                 int offset = -8;
2211                 if (!ppc_is_imm16 (offset + 4)) {
2212                         basereg = mono_alloc_ireg (cfg);
2213                         MONO_EMIT_NEW_BIALU_IMM (cfg, OP_IADD_IMM, basereg, cfg->frame_reg, offset);
2214                 }
2215                 MONO_EMIT_NEW_STORE_MEMBASE (cfg, OP_STORER8_MEMBASE_REG, basereg, offset, ins->sreg1);
2216                 MONO_EMIT_NEW_LOAD_MEMBASE_OP (cfg, OP_LOADI4_MEMBASE, msw_reg, basereg, offset);
2217                 MONO_EMIT_NEW_UNALU (cfg, OP_CHECK_FINITE, -1, msw_reg);
2218                 MONO_EMIT_NEW_UNALU (cfg, OP_FMOVE, ins->dreg, ins->sreg1);
2219                 ins->opcode = OP_NOP;
2220                 break;
2221         }
2222 #ifdef __mono_ppc64__
2223         case OP_IADD_OVF:
2224         case OP_IADD_OVF_UN:
2225         case OP_ISUB_OVF: {
2226                 int shifted1_reg = mono_alloc_ireg (cfg);
2227                 int shifted2_reg = mono_alloc_ireg (cfg);
2228                 int result_shifted_reg = mono_alloc_ireg (cfg);
2229
2230                 MONO_EMIT_NEW_BIALU_IMM (cfg, OP_SHL_IMM, shifted1_reg, ins->sreg1, 32);
2231                 MONO_EMIT_NEW_BIALU_IMM (cfg, OP_SHL_IMM, shifted2_reg, ins->sreg2, 32);
2232                 MONO_EMIT_NEW_BIALU (cfg, ins->opcode, result_shifted_reg, shifted1_reg, shifted2_reg);
2233                 if (ins->opcode == OP_IADD_OVF_UN)
2234                         MONO_EMIT_NEW_BIALU_IMM (cfg, OP_SHR_UN_IMM, ins->dreg, result_shifted_reg, 32);
2235                 else
2236                         MONO_EMIT_NEW_BIALU_IMM (cfg, OP_SHR_IMM, ins->dreg, result_shifted_reg, 32);
2237                 ins->opcode = OP_NOP;
2238         }
2239 #endif
2240         }
2241 }
2242
2243 void
2244 mono_arch_decompose_long_opts (MonoCompile *cfg, MonoInst *ins)
2245 {
2246         switch (ins->opcode) {
2247         case OP_LADD_OVF:
2248                 /* ADC sets the condition code */
2249                 MONO_EMIT_NEW_BIALU (cfg, OP_ADDCC, ins->dreg + 1, ins->sreg1 + 1, ins->sreg2 + 1);
2250                 MONO_EMIT_NEW_BIALU (cfg, OP_ADD_OVF_CARRY, ins->dreg + 2, ins->sreg1 + 2, ins->sreg2 + 2);
2251                 NULLIFY_INS (ins);
2252                 break;
2253         case OP_LADD_OVF_UN:
2254                 /* ADC sets the condition code */
2255                 MONO_EMIT_NEW_BIALU (cfg, OP_ADDCC, ins->dreg + 1, ins->sreg1 + 1, ins->sreg2 + 1);
2256                 MONO_EMIT_NEW_BIALU (cfg, OP_ADD_OVF_UN_CARRY, ins->dreg + 2, ins->sreg1 + 2, ins->sreg2 + 2);
2257                 NULLIFY_INS (ins);
2258                 break;
2259         case OP_LSUB_OVF:
2260                 /* SBB sets the condition code */
2261                 MONO_EMIT_NEW_BIALU (cfg, OP_SUBCC, ins->dreg + 1, ins->sreg1 + 1, ins->sreg2 + 1);
2262                 MONO_EMIT_NEW_BIALU (cfg, OP_SUB_OVF_CARRY, ins->dreg + 2, ins->sreg1 + 2, ins->sreg2 + 2);
2263                 NULLIFY_INS (ins);
2264                 break;
2265         case OP_LSUB_OVF_UN:
2266                 /* SBB sets the condition code */
2267                 MONO_EMIT_NEW_BIALU (cfg, OP_SUBCC, ins->dreg + 1, ins->sreg1 + 1, ins->sreg2 + 1);
2268                 MONO_EMIT_NEW_BIALU (cfg, OP_SUB_OVF_UN_CARRY, ins->dreg + 2, ins->sreg1 + 2, ins->sreg2 + 2);
2269                 NULLIFY_INS (ins);
2270                 break;
2271         case OP_LNEG:
2272                 /* From gcc generated code */
2273                 MONO_EMIT_NEW_BIALU_IMM (cfg, OP_PPC_SUBFIC, ins->dreg + 1, ins->sreg1 + 1, 0);
2274                 MONO_EMIT_NEW_UNALU (cfg, OP_PPC_SUBFZE, ins->dreg + 2, ins->sreg1 + 2);
2275                 NULLIFY_INS (ins);
2276                 break;
2277         default:
2278                 break;
2279         }
2280 }
2281
2282 /* 
2283  * the branch_b0_table should maintain the order of these
2284  * opcodes.
2285 case CEE_BEQ:
2286 case CEE_BGE:
2287 case CEE_BGT:
2288 case CEE_BLE:
2289 case CEE_BLT:
2290 case CEE_BNE_UN:
2291 case CEE_BGE_UN:
2292 case CEE_BGT_UN:
2293 case CEE_BLE_UN:
2294 case CEE_BLT_UN:
2295  */
2296 static const guchar 
2297 branch_b0_table [] = {
2298         PPC_BR_TRUE, 
2299         PPC_BR_FALSE, 
2300         PPC_BR_TRUE, 
2301         PPC_BR_FALSE, 
2302         PPC_BR_TRUE, 
2303         
2304         PPC_BR_FALSE, 
2305         PPC_BR_FALSE, 
2306         PPC_BR_TRUE, 
2307         PPC_BR_FALSE,
2308         PPC_BR_TRUE
2309 };
2310
2311 static const guchar 
2312 branch_b1_table [] = {
2313         PPC_BR_EQ, 
2314         PPC_BR_LT, 
2315         PPC_BR_GT, 
2316         PPC_BR_GT,
2317         PPC_BR_LT, 
2318         
2319         PPC_BR_EQ, 
2320         PPC_BR_LT, 
2321         PPC_BR_GT, 
2322         PPC_BR_GT,
2323         PPC_BR_LT 
2324 };
2325
2326 #define NEW_INS(cfg,dest,op) do {                                       \
2327                 MONO_INST_NEW((cfg), (dest), (op));                     \
2328                 mono_bblock_insert_after_ins (bb, last_ins, (dest));    \
2329         } while (0)
2330
2331 static int
2332 map_to_reg_reg_op (int op)
2333 {
2334         switch (op) {
2335         case OP_ADD_IMM:
2336                 return OP_IADD;
2337         case OP_SUB_IMM:
2338                 return OP_ISUB;
2339         case OP_AND_IMM:
2340                 return OP_IAND;
2341         case OP_COMPARE_IMM:
2342                 return OP_COMPARE;
2343         case OP_ICOMPARE_IMM:
2344                 return OP_ICOMPARE;
2345         case OP_LCOMPARE_IMM:
2346                 return OP_LCOMPARE;
2347         case OP_ADDCC_IMM:
2348                 return OP_IADDCC;
2349         case OP_ADC_IMM:
2350                 return OP_IADC;
2351         case OP_SUBCC_IMM:
2352                 return OP_ISUBCC;
2353         case OP_SBB_IMM:
2354                 return OP_ISBB;
2355         case OP_OR_IMM:
2356                 return OP_IOR;
2357         case OP_XOR_IMM:
2358                 return OP_IXOR;
2359         case OP_MUL_IMM:
2360                 return OP_IMUL;
2361         case OP_LOAD_MEMBASE:
2362                 return OP_LOAD_MEMINDEX;
2363         case OP_LOADI4_MEMBASE:
2364                 return OP_LOADI4_MEMINDEX;
2365         case OP_LOADU4_MEMBASE:
2366                 return OP_LOADU4_MEMINDEX;
2367         case OP_LOADI8_MEMBASE:
2368                 return OP_LOADI8_MEMINDEX;
2369         case OP_LOADU1_MEMBASE:
2370                 return OP_LOADU1_MEMINDEX;
2371         case OP_LOADI2_MEMBASE:
2372                 return OP_LOADI2_MEMINDEX;
2373         case OP_LOADU2_MEMBASE:
2374                 return OP_LOADU2_MEMINDEX;
2375         case OP_LOADI1_MEMBASE:
2376                 return OP_LOADI1_MEMINDEX;
2377         case OP_LOADR4_MEMBASE:
2378                 return OP_LOADR4_MEMINDEX;
2379         case OP_LOADR8_MEMBASE:
2380                 return OP_LOADR8_MEMINDEX;
2381         case OP_STOREI1_MEMBASE_REG:
2382                 return OP_STOREI1_MEMINDEX;
2383         case OP_STOREI2_MEMBASE_REG:
2384                 return OP_STOREI2_MEMINDEX;
2385         case OP_STOREI4_MEMBASE_REG:
2386                 return OP_STOREI4_MEMINDEX;
2387         case OP_STOREI8_MEMBASE_REG:
2388                 return OP_STOREI8_MEMINDEX;
2389         case OP_STORE_MEMBASE_REG:
2390                 return OP_STORE_MEMINDEX;
2391         case OP_STORER4_MEMBASE_REG:
2392                 return OP_STORER4_MEMINDEX;
2393         case OP_STORER8_MEMBASE_REG:
2394                 return OP_STORER8_MEMINDEX;
2395         case OP_STORE_MEMBASE_IMM:
2396                 return OP_STORE_MEMBASE_REG;
2397         case OP_STOREI1_MEMBASE_IMM:
2398                 return OP_STOREI1_MEMBASE_REG;
2399         case OP_STOREI2_MEMBASE_IMM:
2400                 return OP_STOREI2_MEMBASE_REG;
2401         case OP_STOREI4_MEMBASE_IMM:
2402                 return OP_STOREI4_MEMBASE_REG;
2403         case OP_STOREI8_MEMBASE_IMM:
2404                 return OP_STOREI8_MEMBASE_REG;
2405         }
2406         return mono_op_imm_to_op (op);
2407 }
2408
2409 //#define map_to_reg_reg_op(op) (cfg->new_ir? mono_op_imm_to_op (op): map_to_reg_reg_op (op))
2410
2411 #define compare_opcode_is_unsigned(opcode) \
2412                 (((opcode) >= CEE_BNE_UN && (opcode) <= CEE_BLT_UN) ||  \
2413                 ((opcode) >= OP_IBNE_UN && (opcode) <= OP_IBLT_UN) ||   \
2414                 ((opcode) >= OP_LBNE_UN && (opcode) <= OP_LBLT_UN) ||   \
2415                 ((opcode) >= OP_COND_EXC_NE_UN && (opcode) <= OP_COND_EXC_LT_UN) ||     \
2416                 ((opcode) >= OP_COND_EXC_INE_UN && (opcode) <= OP_COND_EXC_ILT_UN) ||   \
2417                 ((opcode) == OP_CLT_UN || (opcode) == OP_CGT_UN ||      \
2418                  (opcode) == OP_ICLT_UN || (opcode) == OP_ICGT_UN ||    \
2419                  (opcode) == OP_LCLT_UN || (opcode) == OP_LCGT_UN))
2420
2421 /*
2422  * Remove from the instruction list the instructions that can't be
2423  * represented with very simple instructions with no register
2424  * requirements.
2425  */
2426 void
2427 mono_arch_lowering_pass (MonoCompile *cfg, MonoBasicBlock *bb)
2428 {
2429         MonoInst *ins, *next, *temp, *last_ins = NULL;
2430         int imm;
2431
2432         MONO_BB_FOR_EACH_INS (bb, ins) {
2433 loop_start:
2434                 switch (ins->opcode) {
2435                 case OP_IDIV_UN_IMM:
2436                 case OP_IDIV_IMM:
2437                 case OP_IREM_IMM:
2438                 case OP_IREM_UN_IMM:
2439                 CASE_PPC64 (OP_LREM_IMM) {
2440                         NEW_INS (cfg, temp, OP_ICONST);
2441                         temp->inst_c0 = ins->inst_imm;
2442                         temp->dreg = mono_alloc_ireg (cfg);
2443                         ins->sreg2 = temp->dreg;
2444                         if (ins->opcode == OP_IDIV_IMM)
2445                                 ins->opcode = OP_IDIV;
2446                         else if (ins->opcode == OP_IREM_IMM)
2447                                 ins->opcode = OP_IREM;
2448                         else if (ins->opcode == OP_IDIV_UN_IMM)
2449                                 ins->opcode = OP_IDIV_UN;
2450                         else if (ins->opcode == OP_IREM_UN_IMM)
2451                                 ins->opcode = OP_IREM_UN;
2452                         else if (ins->opcode == OP_LREM_IMM)
2453                                 ins->opcode = OP_LREM;
2454                         last_ins = temp;
2455                         /* handle rem separately */
2456                         goto loop_start;
2457                 }
2458                 case OP_IREM:
2459                 case OP_IREM_UN:
2460                 CASE_PPC64 (OP_LREM)
2461                 CASE_PPC64 (OP_LREM_UN) {
2462                         MonoInst *mul;
2463                         /* we change a rem dest, src1, src2 to
2464                          * div temp1, src1, src2
2465                          * mul temp2, temp1, src2
2466                          * sub dest, src1, temp2
2467                          */
2468                         if (ins->opcode == OP_IREM || ins->opcode == OP_IREM_UN) {
2469                                 NEW_INS (cfg, mul, OP_IMUL);
2470                                 NEW_INS (cfg, temp, ins->opcode == OP_IREM? OP_IDIV: OP_IDIV_UN);
2471                                 ins->opcode = OP_ISUB;
2472                         } else {
2473                                 NEW_INS (cfg, mul, OP_LMUL);
2474                                 NEW_INS (cfg, temp, ins->opcode == OP_LREM? OP_LDIV: OP_LDIV_UN);
2475                                 ins->opcode = OP_LSUB;
2476                         }
2477                         temp->sreg1 = ins->sreg1;
2478                         temp->sreg2 = ins->sreg2;
2479                         temp->dreg = mono_alloc_ireg (cfg);
2480                         mul->sreg1 = temp->dreg;
2481                         mul->sreg2 = ins->sreg2;
2482                         mul->dreg = mono_alloc_ireg (cfg);
2483                         ins->sreg2 = mul->dreg;
2484                         break;
2485                 }
2486                 case OP_IADD_IMM:
2487                 CASE_PPC64 (OP_LADD_IMM)
2488                 case OP_ADD_IMM:
2489                 case OP_ADDCC_IMM:
2490                         if (!ppc_is_imm16 (ins->inst_imm)) {
2491                                 NEW_INS (cfg,  temp, OP_ICONST);
2492                                 temp->inst_c0 = ins->inst_imm;
2493                                 temp->dreg = mono_alloc_ireg (cfg);
2494                                 ins->sreg2 = temp->dreg;
2495                                 ins->opcode = map_to_reg_reg_op (ins->opcode);
2496                         }
2497                         break;
2498                 case OP_ISUB_IMM:
2499                 CASE_PPC64 (OP_LSUB_IMM)
2500                 case OP_SUB_IMM:
2501                         if (!ppc_is_imm16 (-ins->inst_imm)) {
2502                                 NEW_INS (cfg, temp, OP_ICONST);
2503                                 temp->inst_c0 = ins->inst_imm;
2504                                 temp->dreg = mono_alloc_ireg (cfg);
2505                                 ins->sreg2 = temp->dreg;
2506                                 ins->opcode = map_to_reg_reg_op (ins->opcode);
2507                         }
2508                         break;
2509                 case OP_IAND_IMM:
2510                 case OP_IOR_IMM:
2511                 case OP_IXOR_IMM:
2512                 case OP_LAND_IMM:
2513                 case OP_LOR_IMM:
2514                 case OP_LXOR_IMM:
2515                 case OP_AND_IMM:
2516                 case OP_OR_IMM:
2517                 case OP_XOR_IMM: {
2518                         gboolean is_imm = ((ins->inst_imm & 0xffff0000) && (ins->inst_imm & 0xffff));
2519 #ifdef __mono_ppc64__
2520                         if (ins->inst_imm & 0xffffffff00000000ULL)
2521                                 is_imm = TRUE;
2522 #endif
2523                         if (is_imm) {
2524                                 NEW_INS (cfg, temp, OP_ICONST);
2525                                 temp->inst_c0 = ins->inst_imm;
2526                                 temp->dreg = mono_alloc_ireg (cfg);
2527                                 ins->sreg2 = temp->dreg;
2528                                 ins->opcode = map_to_reg_reg_op (ins->opcode);
2529                         }
2530                         break;
2531                 }
2532                 case OP_ISBB_IMM:
2533                 case OP_IADC_IMM:
2534                 case OP_SBB_IMM:
2535                 case OP_SUBCC_IMM:
2536                 case OP_ADC_IMM:
2537                         NEW_INS (cfg, temp, OP_ICONST);
2538                         temp->inst_c0 = ins->inst_imm;
2539                         temp->dreg = mono_alloc_ireg (cfg);
2540                         ins->sreg2 = temp->dreg;
2541                         ins->opcode = map_to_reg_reg_op (ins->opcode);
2542                         break;
2543                 case OP_COMPARE_IMM:
2544                 case OP_ICOMPARE_IMM:
2545                 CASE_PPC64 (OP_LCOMPARE_IMM)
2546                         next = ins->next;
2547                         /* Branch opts can eliminate the branch */
2548                         if (!next || (!(MONO_IS_COND_BRANCH_OP (next) || MONO_IS_COND_EXC (next) || MONO_IS_SETCC (next)))) {
2549                                 ins->opcode = OP_NOP;
2550                                 break;
2551                         }
2552                         g_assert(next);
2553                         if (compare_opcode_is_unsigned (next->opcode)) {
2554                                 if (!ppc_is_uimm16 (ins->inst_imm)) {
2555                                         NEW_INS (cfg, temp, OP_ICONST);
2556                                         temp->inst_c0 = ins->inst_imm;
2557                                         temp->dreg = mono_alloc_ireg (cfg);
2558                                         ins->sreg2 = temp->dreg;
2559                                         ins->opcode = map_to_reg_reg_op (ins->opcode);
2560                                 }
2561                         } else {
2562                                 if (!ppc_is_imm16 (ins->inst_imm)) {
2563                                         NEW_INS (cfg, temp, OP_ICONST);
2564                                         temp->inst_c0 = ins->inst_imm;
2565                                         temp->dreg = mono_alloc_ireg (cfg);
2566                                         ins->sreg2 = temp->dreg;
2567                                         ins->opcode = map_to_reg_reg_op (ins->opcode);
2568                                 }
2569                         }
2570                         break;
2571                 case OP_IMUL_IMM:
2572                 case OP_MUL_IMM:
2573                         if (ins->inst_imm == 1) {
2574                                 ins->opcode = OP_MOVE;
2575                                 break;
2576                         }
2577                         if (ins->inst_imm == 0) {
2578                                 ins->opcode = OP_ICONST;
2579                                 ins->inst_c0 = 0;
2580                                 break;
2581                         }
2582                         imm = mono_is_power_of_two (ins->inst_imm);
2583                         if (imm > 0) {
2584                                 ins->opcode = OP_SHL_IMM;
2585                                 ins->inst_imm = imm;
2586                                 break;
2587                         }
2588                         if (!ppc_is_imm16 (ins->inst_imm)) {
2589                                 NEW_INS (cfg, temp, OP_ICONST);
2590                                 temp->inst_c0 = ins->inst_imm;
2591                                 temp->dreg = mono_alloc_ireg (cfg);
2592                                 ins->sreg2 = temp->dreg;
2593                                 ins->opcode = map_to_reg_reg_op (ins->opcode);
2594                         }
2595                         break;
2596                 case OP_LOCALLOC_IMM:
2597                         NEW_INS (cfg, temp, OP_ICONST);
2598                         temp->inst_c0 = ins->inst_imm;
2599                         temp->dreg = mono_alloc_ireg (cfg);
2600                         ins->sreg1 = temp->dreg;
2601                         ins->opcode = OP_LOCALLOC;
2602                         break;
2603                 case OP_LOAD_MEMBASE:
2604                 case OP_LOADI4_MEMBASE:
2605                 CASE_PPC64 (OP_LOADI8_MEMBASE)
2606                 case OP_LOADU4_MEMBASE:
2607                 case OP_LOADI2_MEMBASE:
2608                 case OP_LOADU2_MEMBASE:
2609                 case OP_LOADI1_MEMBASE:
2610                 case OP_LOADU1_MEMBASE:
2611                 case OP_LOADR4_MEMBASE:
2612                 case OP_LOADR8_MEMBASE:
2613                 case OP_STORE_MEMBASE_REG:
2614                 CASE_PPC64 (OP_STOREI8_MEMBASE_REG)
2615                 case OP_STOREI4_MEMBASE_REG:
2616                 case OP_STOREI2_MEMBASE_REG:
2617                 case OP_STOREI1_MEMBASE_REG:
2618                 case OP_STORER4_MEMBASE_REG:
2619                 case OP_STORER8_MEMBASE_REG:
2620                         /* we can do two things: load the immed in a register
2621                          * and use an indexed load, or see if the immed can be
2622                          * represented as an ad_imm + a load with a smaller offset
2623                          * that fits. We just do the first for now, optimize later.
2624                          */
2625                         if (ppc_is_imm16 (ins->inst_offset))
2626                                 break;
2627                         NEW_INS (cfg, temp, OP_ICONST);
2628                         temp->inst_c0 = ins->inst_offset;
2629                         temp->dreg = mono_alloc_ireg (cfg);
2630                         ins->sreg2 = temp->dreg;
2631                         ins->opcode = map_to_reg_reg_op (ins->opcode);
2632                         break;
2633                 case OP_STORE_MEMBASE_IMM:
2634                 case OP_STOREI1_MEMBASE_IMM:
2635                 case OP_STOREI2_MEMBASE_IMM:
2636                 case OP_STOREI4_MEMBASE_IMM:
2637                 CASE_PPC64 (OP_STOREI8_MEMBASE_IMM)
2638                         NEW_INS (cfg, temp, OP_ICONST);
2639                         temp->inst_c0 = ins->inst_imm;
2640                         temp->dreg = mono_alloc_ireg (cfg);
2641                         ins->sreg1 = temp->dreg;
2642                         ins->opcode = map_to_reg_reg_op (ins->opcode);
2643                         last_ins = temp;
2644                         goto loop_start; /* make it handle the possibly big ins->inst_offset */
2645                 case OP_R8CONST:
2646                 case OP_R4CONST:
2647                         if (cfg->compile_aot) {
2648                                 /* Keep these in the aot case */
2649                                 break;
2650                         }
2651                         NEW_INS (cfg, temp, OP_ICONST);
2652                         temp->inst_c0 = (gulong)ins->inst_p0;
2653                         temp->dreg = mono_alloc_ireg (cfg);
2654                         ins->inst_basereg = temp->dreg;
2655                         ins->inst_offset = 0;
2656                         ins->opcode = ins->opcode == OP_R4CONST? OP_LOADR4_MEMBASE: OP_LOADR8_MEMBASE;
2657                         last_ins = temp;
2658                         /* make it handle the possibly big ins->inst_offset
2659                          * later optimize to use lis + load_membase
2660                          */
2661                         goto loop_start;
2662                 }
2663                 last_ins = ins;
2664         }
2665         bb->last_ins = last_ins;
2666         bb->max_vreg = cfg->next_vreg;  
2667 }
2668
2669 static guchar*
2670 emit_float_to_int (MonoCompile *cfg, guchar *code, int dreg, int sreg, int size, gboolean is_signed)
2671 {
2672         long offset = cfg->arch.fp_conv_var_offset;
2673         long sub_offset;
2674         /* sreg is a float, dreg is an integer reg. ppc_f0 is used a scratch */
2675 #ifdef __mono_ppc64__
2676         if (size == 8) {
2677                 ppc_fctidz (code, ppc_f0, sreg);
2678                 sub_offset = 0;
2679         } else
2680 #endif
2681         {
2682                 ppc_fctiwz (code, ppc_f0, sreg);
2683                 sub_offset = 4;
2684         }
2685         if (ppc_is_imm16 (offset + sub_offset)) {
2686                 ppc_stfd (code, ppc_f0, offset, cfg->frame_reg);
2687                 if (size == 8)
2688                         ppc_ldr (code, dreg, offset + sub_offset, cfg->frame_reg);
2689                 else
2690                         ppc_lwz (code, dreg, offset + sub_offset, cfg->frame_reg);
2691         } else {
2692                 ppc_load (code, dreg, offset);
2693                 ppc_add (code, dreg, dreg, cfg->frame_reg);
2694                 ppc_stfd (code, ppc_f0, 0, dreg);
2695                 if (size == 8)
2696                         ppc_ldr (code, dreg, sub_offset, dreg);
2697                 else
2698                         ppc_lwz (code, dreg, sub_offset, dreg);
2699         }
2700         if (!is_signed) {
2701                 if (size == 1)
2702                         ppc_andid (code, dreg, dreg, 0xff);
2703                 else if (size == 2)
2704                         ppc_andid (code, dreg, dreg, 0xffff);
2705 #ifdef __mono_ppc64__
2706                 else if (size == 4)
2707                         ppc_clrldi (code, dreg, dreg, 32);
2708 #endif
2709         } else {
2710                 if (size == 1)
2711                         ppc_extsb (code, dreg, dreg);
2712                 else if (size == 2)
2713                         ppc_extsh (code, dreg, dreg);
2714 #ifdef __mono_ppc64__
2715                 else if (size == 4)
2716                         ppc_extsw (code, dreg, dreg);
2717 #endif
2718         }
2719         return code;
2720 }
2721
2722 typedef struct {
2723         guchar *code;
2724         const guchar *target;
2725         int absolute;
2726         int found;
2727 } PatchData;
2728
2729 #define is_call_imm(diff) ((glong)(diff) >= -33554432 && (glong)(diff) <= 33554431)
2730
2731 static int
2732 search_thunk_slot (void *data, int csize, int bsize, void *user_data) {
2733 #ifdef __mono_ppc64__
2734         g_assert_not_reached ();
2735 #else
2736         PatchData *pdata = (PatchData*)user_data;
2737         guchar *code = data;
2738         guint32 *thunks = data;
2739         guint32 *endthunks = (guint32*)(code + bsize);
2740         guint32 load [2];
2741         guchar *templ;
2742         int count = 0;
2743         int difflow, diffhigh;
2744
2745         /* always ensure a call from pdata->code can reach to the thunks without further thunks */
2746         difflow = (char*)pdata->code - (char*)thunks;
2747         diffhigh = (char*)pdata->code - (char*)endthunks;
2748         if (!((is_call_imm (thunks) && is_call_imm (endthunks)) || (is_call_imm (difflow) && is_call_imm (diffhigh))))
2749                 return 0;
2750
2751         templ = (guchar*)load;
2752         ppc_load_sequence (templ, ppc_r0, pdata->target);
2753
2754         //g_print ("thunk nentries: %d\n", ((char*)endthunks - (char*)thunks)/16);
2755         if ((pdata->found == 2) || (pdata->code >= code && pdata->code <= code + csize)) {
2756                 while (thunks < endthunks) {
2757                         //g_print ("looking for target: %p at %p (%08x-%08x)\n", pdata->target, thunks, thunks [0], thunks [1]);
2758                         if ((thunks [0] == load [0]) && (thunks [1] == load [1])) {
2759                                 ppc_patch (pdata->code, (guchar*)thunks);
2760                                 pdata->found = 1;
2761                                 /*{
2762                                         static int num_thunks = 0;
2763                                         num_thunks++;
2764                                         if ((num_thunks % 20) == 0)
2765                                                 g_print ("num_thunks lookup: %d\n", num_thunks);
2766                                 }*/
2767                                 return 1;
2768                         } else if ((thunks [0] == 0) && (thunks [1] == 0)) {
2769                                 /* found a free slot instead: emit thunk */
2770                                 code = (guchar*)thunks;
2771                                 ppc_lis (code, ppc_r0, (gulong)(pdata->target) >> 16);
2772                                 ppc_ori (code, ppc_r0, ppc_r0, (gulong)(pdata->target) & 0xffff);
2773                                 ppc_mtctr (code, ppc_r0);
2774                                 ppc_bcctr (code, PPC_BR_ALWAYS, 0);
2775                                 mono_arch_flush_icache ((guchar*)thunks, 16);
2776
2777                                 ppc_patch (pdata->code, (guchar*)thunks);
2778                                 pdata->found = 1;
2779                                 /*{
2780                                         static int num_thunks = 0;
2781                                         num_thunks++;
2782                                         if ((num_thunks % 20) == 0)
2783                                                 g_print ("num_thunks: %d\n", num_thunks);
2784                                 }*/
2785                                 return 1;
2786                         }
2787                         /* skip 16 bytes, the size of the thunk */
2788                         thunks += 4;
2789                         count++;
2790                 }
2791                 //g_print ("failed thunk lookup for %p from %p at %p (%d entries)\n", pdata->target, pdata->code, data, count);
2792         }
2793 #endif
2794         return 0;
2795 }
2796
2797 static void
2798 handle_thunk (int absolute, guchar *code, const guchar *target) {
2799         MonoDomain *domain = mono_domain_get ();
2800         PatchData pdata;
2801
2802         pdata.code = code;
2803         pdata.target = target;
2804         pdata.absolute = absolute;
2805         pdata.found = 0;
2806
2807         mono_domain_lock (domain);
2808         mono_domain_code_foreach (domain, search_thunk_slot, &pdata);
2809
2810         if (!pdata.found) {
2811                 /* this uses the first available slot */
2812                 pdata.found = 2;
2813                 mono_domain_code_foreach (domain, search_thunk_slot, &pdata);
2814         }
2815         mono_domain_unlock (domain);
2816
2817         if (pdata.found != 1)
2818                 g_print ("thunk failed for %p from %p\n", target, code);
2819         g_assert (pdata.found == 1);
2820 }
2821
2822 static void
2823 patch_ins (guint8 *code, guint32 ins)
2824 {
2825         *(guint32*)code = GUINT32_TO_BE (ins);
2826         mono_arch_flush_icache (code, 4);
2827 }
2828
2829 void
2830 ppc_patch_full (guchar *code, const guchar *target, gboolean is_fd)
2831 {
2832         guint32 ins = GUINT32_FROM_BE (*(guint32*)code);
2833         guint32 prim = ins >> 26;
2834         guint32 ovf;
2835
2836         //g_print ("patching 0x%08x (0x%08x) to point to 0x%08x\n", code, ins, target);
2837         if (prim == 18) {
2838                 // prefer relative branches, they are more position independent (e.g. for AOT compilation).
2839                 gint diff = target - code;
2840                 g_assert (!is_fd);
2841                 if (diff >= 0){
2842                         if (diff <= 33554431){
2843                                 ins = (18 << 26) | (diff) | (ins & 1);
2844                                 patch_ins (code, ins);
2845                                 return;
2846                         }
2847                 } else {
2848                         /* diff between 0 and -33554432 */
2849                         if (diff >= -33554432){
2850                                 ins = (18 << 26) | (diff & ~0xfc000000) | (ins & 1);
2851                                 patch_ins (code, ins);
2852                                 return;
2853                         }
2854                 }
2855                 
2856                 if ((glong)target >= 0){
2857                         if ((glong)target <= 33554431){
2858                                 ins = (18 << 26) | ((gulong) target) | (ins & 1) | 2;
2859                                 patch_ins (code, ins);
2860                                 return;
2861                         }
2862                 } else {
2863                         if ((glong)target >= -33554432){
2864                                 ins = (18 << 26) | (((gulong)target) & ~0xfc000000) | (ins & 1) | 2;
2865                                 patch_ins (code, ins);
2866                                 return;
2867                         }
2868                 }
2869
2870                 handle_thunk (TRUE, code, target);
2871                 return;
2872
2873                 g_assert_not_reached ();
2874         }
2875         
2876         
2877         if (prim == 16) {
2878                 g_assert (!is_fd);
2879                 // absolute address
2880                 if (ins & 2) {
2881                         guint32 li = (gulong)target;
2882                         ins = (ins & 0xffff0000) | (ins & 3);
2883                         ovf  = li & 0xffff0000;
2884                         if (ovf != 0 && ovf != 0xffff0000)
2885                                 g_assert_not_reached ();
2886                         li &= 0xffff;
2887                         ins |= li;
2888                         // FIXME: assert the top bits of li are 0
2889                 } else {
2890                         gint diff = target - code;
2891                         ins = (ins & 0xffff0000) | (ins & 3);
2892                         ovf  = diff & 0xffff0000;
2893                         if (ovf != 0 && ovf != 0xffff0000)
2894                                 g_assert_not_reached ();
2895                         diff &= 0xffff;
2896                         ins |= diff;
2897                 }
2898                 patch_ins (code, ins);
2899                 return;
2900         }
2901
2902         if (prim == 15 || ins == 0x4e800021 || ins == 0x4e800020 || ins == 0x4e800420) {
2903 #ifdef __mono_ppc64__
2904                 guint32 *seq = (guint32*)code;
2905                 guint32 *branch_ins;
2906
2907                 /* the trampoline code will try to patch the blrl, blr, bcctr */
2908                 if (ins == 0x4e800021 || ins == 0x4e800020 || ins == 0x4e800420) {
2909                         branch_ins = seq;
2910                         if (ppc_is_load_op (seq [-3]) || ppc_opcode (seq [-3]) == 31) /* ld || lwz || mr */
2911                                 code -= 32;
2912                         else
2913                                 code -= 24;
2914                 } else {
2915                         if (ppc_is_load_op (seq [5]) || ppc_opcode (seq [5]) == 31) /* ld || lwz || mr */
2916                                 branch_ins = seq + 8;
2917                         else
2918                                 branch_ins = seq + 6;
2919                 }
2920
2921                 seq = (guint32*)code;
2922                 /* this is the lis/ori/sldi/oris/ori/(ld/ld|mr/nop)/mtlr/blrl sequence */
2923                 g_assert (mono_ppc_is_direct_call_sequence (branch_ins));
2924
2925                 if (ppc_is_load_op (seq [5])) {
2926                         g_assert (ppc_is_load_op (seq [6]));
2927
2928                         if (!is_fd) {
2929                                 guint8 *buf = (guint8*)&seq [5];
2930                                 ppc_mr (buf, ppc_r0, ppc_r11);
2931                                 ppc_nop (buf);
2932                         }
2933                 } else {
2934                         if (is_fd)
2935                                 target = mono_get_addr_from_ftnptr ((gpointer)target);
2936                 }
2937
2938                 /* FIXME: make this thread safe */
2939                 /* FIXME: we're assuming we're using r11 here */
2940                 ppc_load_ptr_sequence (code, ppc_r11, target);
2941                 mono_arch_flush_icache ((guint8*)seq, 28);
2942 #else
2943                 guint32 *seq;
2944                 /* the trampoline code will try to patch the blrl, blr, bcctr */
2945                 if (ins == 0x4e800021 || ins == 0x4e800020 || ins == 0x4e800420) {
2946                         code -= 12;
2947                 }
2948                 /* this is the lis/ori/mtlr/blrl sequence */
2949                 seq = (guint32*)code;
2950                 g_assert ((seq [0] >> 26) == 15);
2951                 g_assert ((seq [1] >> 26) == 24);
2952                 g_assert ((seq [2] >> 26) == 31);
2953                 g_assert (seq [3] == 0x4e800021 || seq [3] == 0x4e800020 || seq [3] == 0x4e800420);
2954                 /* FIXME: make this thread safe */
2955                 ppc_lis (code, ppc_r0, (guint32)(target) >> 16);
2956                 ppc_ori (code, ppc_r0, ppc_r0, (guint32)(target) & 0xffff);
2957                 mono_arch_flush_icache (code - 8, 8);
2958 #endif
2959         } else {
2960                 g_assert_not_reached ();
2961         }
2962 //      g_print ("patched with 0x%08x\n", ins);
2963 }
2964
2965 void
2966 ppc_patch (guchar *code, const guchar *target)
2967 {
2968         ppc_patch_full (code, target, FALSE);
2969 }
2970
2971 void
2972 mono_ppc_patch (guchar *code, const guchar *target)
2973 {
2974         ppc_patch (code, target);
2975 }
2976
2977 static guint8*
2978 emit_move_return_value (MonoCompile *cfg, MonoInst *ins, guint8 *code)
2979 {
2980         switch (ins->opcode) {
2981         case OP_FCALL:
2982         case OP_FCALL_REG:
2983         case OP_FCALL_MEMBASE:
2984                 if (ins->dreg != ppc_f1)
2985                         ppc_fmr (code, ins->dreg, ppc_f1);
2986                 break;
2987         }
2988
2989         return code;
2990 }
2991
2992 static int
2993 ins_native_length (MonoCompile *cfg, MonoInst *ins)
2994 {
2995         return ((guint8 *)ins_get_spec (ins->opcode))[MONO_INST_LEN];
2996 }
2997
2998 static guint8*
2999 emit_reserve_param_area (MonoCompile *cfg, guint8 *code)
3000 {
3001         long size = cfg->param_area;
3002
3003         size += MONO_ARCH_FRAME_ALIGNMENT - 1;
3004         size &= -MONO_ARCH_FRAME_ALIGNMENT;
3005
3006         if (!size)
3007                 return code;
3008
3009         ppc_ldptr (code, ppc_r0, 0, ppc_sp);
3010         if (ppc_is_imm16 (-size)) {
3011                 ppc_stptr_update (code, ppc_r0, -size, ppc_sp);
3012         } else {
3013                 ppc_load (code, ppc_r11, -size);
3014                 ppc_stptr_update_indexed (code, ppc_r0, ppc_sp, ppc_r11);
3015         }
3016
3017         return code;
3018 }
3019
3020 static guint8*
3021 emit_unreserve_param_area (MonoCompile *cfg, guint8 *code)
3022 {
3023         long size = cfg->param_area;
3024
3025         size += MONO_ARCH_FRAME_ALIGNMENT - 1;
3026         size &= -MONO_ARCH_FRAME_ALIGNMENT;
3027
3028         if (!size)
3029                 return code;
3030
3031         ppc_ldptr (code, ppc_r0, 0, ppc_sp);
3032         if (ppc_is_imm16 (size)) {
3033                 ppc_stptr_update (code, ppc_r0, size, ppc_sp);
3034         } else {
3035                 ppc_load (code, ppc_r11, size);
3036                 ppc_stptr_update_indexed (code, ppc_r0, ppc_sp, ppc_r11);
3037         }
3038
3039         return code;
3040 }
3041
3042 #define MASK_SHIFT_IMM(i)       ((i) & MONO_PPC_32_64_CASE (0x1f, 0x3f))
3043
3044 #ifndef DISABLE_JIT
3045 void
3046 mono_arch_output_basic_block (MonoCompile *cfg, MonoBasicBlock *bb)
3047 {
3048         MonoInst *ins, *next;
3049         MonoCallInst *call;
3050         guint offset;
3051         guint8 *code = cfg->native_code + cfg->code_len;
3052         MonoInst *last_ins = NULL;
3053         guint last_offset = 0;
3054         int max_len, cpos;
3055         int L;
3056
3057         /* we don't align basic blocks of loops on ppc */
3058
3059         if (cfg->verbose_level > 2)
3060                 g_print ("Basic block %d starting at offset 0x%x\n", bb->block_num, bb->native_offset);
3061
3062         cpos = bb->max_offset;
3063
3064         if (cfg->prof_options & MONO_PROFILE_COVERAGE) {
3065                 //MonoCoverageInfo *cov = mono_get_coverage_info (cfg->method);
3066                 //g_assert (!mono_compile_aot);
3067                 //cpos += 6;
3068                 //if (bb->cil_code)
3069                 //      cov->data [bb->dfn].iloffset = bb->cil_code - cfg->cil_code;
3070                 /* this is not thread save, but good enough */
3071                 /* fixme: howto handle overflows? */
3072                 //x86_inc_mem (code, &cov->data [bb->dfn].count); 
3073         }
3074
3075         MONO_BB_FOR_EACH_INS (bb, ins) {
3076                 offset = code - cfg->native_code;
3077
3078                 max_len = ins_native_length (cfg, ins);
3079
3080                 if (offset > (cfg->code_size - max_len - 16)) {
3081                         cfg->code_size *= 2;
3082                         cfg->native_code = g_realloc (cfg->native_code, cfg->code_size);
3083                         code = cfg->native_code + offset;
3084                 }
3085         //      if (ins->cil_code)
3086         //              g_print ("cil code\n");
3087                 mono_debug_record_line_number (cfg, ins, offset);
3088
3089                 switch (normalize_opcode (ins->opcode)) {
3090                 case OP_RELAXED_NOP:
3091                 case OP_NOP:
3092                 case OP_DUMMY_USE:
3093                 case OP_DUMMY_STORE:
3094                 case OP_NOT_REACHED:
3095                 case OP_NOT_NULL:
3096                         break;
3097                 case OP_IL_SEQ_POINT:
3098                         mono_add_seq_point (cfg, bb, ins, code - cfg->native_code);
3099                         break;
3100                 case OP_SEQ_POINT: {
3101                         int i;
3102
3103                         if (cfg->compile_aot)
3104                                 NOT_IMPLEMENTED;
3105
3106                         /* 
3107                          * Read from the single stepping trigger page. This will cause a
3108                          * SIGSEGV when single stepping is enabled.
3109                          * We do this _before_ the breakpoint, so single stepping after
3110                          * a breakpoint is hit will step to the next IL offset.
3111                          */
3112                         if (ins->flags & MONO_INST_SINGLE_STEP_LOC) {
3113                                 ppc_load (code, ppc_r11, (gsize)ss_trigger_page);
3114                                 ppc_ldptr (code, ppc_r11, 0, ppc_r11);
3115                         }
3116
3117                         mono_add_seq_point (cfg, bb, ins, code - cfg->native_code);
3118
3119                         /* 
3120                          * A placeholder for a possible breakpoint inserted by
3121                          * mono_arch_set_breakpoint ().
3122                          */
3123                         for (i = 0; i < BREAKPOINT_SIZE / 4; ++i)
3124                                 ppc_nop (code);
3125                         break;
3126                 }
3127                 case OP_TLS_GET:
3128                         emit_tls_access (code, ins->dreg, ins->inst_offset);
3129                         break;
3130                 case OP_BIGMUL:
3131                         ppc_mullw (code, ppc_r0, ins->sreg1, ins->sreg2);
3132                         ppc_mulhw (code, ppc_r3, ins->sreg1, ins->sreg2);
3133                         ppc_mr (code, ppc_r4, ppc_r0);
3134                         break;
3135                 case OP_BIGMUL_UN:
3136                         ppc_mullw (code, ppc_r0, ins->sreg1, ins->sreg2);
3137                         ppc_mulhwu (code, ppc_r3, ins->sreg1, ins->sreg2);
3138                         ppc_mr (code, ppc_r4, ppc_r0);
3139                         break;
3140                 case OP_MEMORY_BARRIER:
3141                         ppc_sync (code);
3142                         break;
3143                 case OP_STOREI1_MEMBASE_REG:
3144                         if (ppc_is_imm16 (ins->inst_offset)) {
3145                                 ppc_stb (code, ins->sreg1, ins->inst_offset, ins->inst_destbasereg);
3146                         } else {
3147                                 if (ppc_is_imm32 (ins->inst_offset)) {
3148                                         ppc_addis (code, ppc_r12, ins->inst_destbasereg, ppc_ha(ins->inst_offset));
3149                                         ppc_stb (code, ins->sreg1, ins->inst_offset, ppc_r12);
3150                                 } else {
3151                                         ppc_load (code, ppc_r0, ins->inst_offset);
3152                                         ppc_stbx (code, ins->sreg1, ins->inst_destbasereg, ppc_r0);
3153                                 }
3154                         }
3155                         break;
3156                 case OP_STOREI2_MEMBASE_REG:
3157                         if (ppc_is_imm16 (ins->inst_offset)) {
3158                                 ppc_sth (code, ins->sreg1, ins->inst_offset, ins->inst_destbasereg);
3159                         } else {
3160                                 if (ppc_is_imm32 (ins->inst_offset)) {
3161                                         ppc_addis (code, ppc_r12, ins->inst_destbasereg, ppc_ha(ins->inst_offset));
3162                                         ppc_sth (code, ins->sreg1, ins->inst_offset, ppc_r12);
3163                                 } else {
3164                                         ppc_load (code, ppc_r0, ins->inst_offset);
3165                                         ppc_sthx (code, ins->sreg1, ins->inst_destbasereg, ppc_r0);
3166                                 }
3167                         }
3168                         break;
3169                 case OP_STORE_MEMBASE_REG:
3170                         if (ppc_is_imm16 (ins->inst_offset)) {
3171                                 ppc_stptr (code, ins->sreg1, ins->inst_offset, ins->inst_destbasereg);
3172                         } else {
3173                                 if (ppc_is_imm32 (ins->inst_offset)) {
3174                                         ppc_addis (code, ppc_r12, ins->inst_destbasereg, ppc_ha(ins->inst_offset));
3175                                         ppc_stptr (code, ins->sreg1, ins->inst_offset, ppc_r12);
3176                                 } else {
3177                                         ppc_load (code, ppc_r0, ins->inst_offset);
3178                                         ppc_stptr_indexed (code, ins->sreg1, ins->inst_destbasereg, ppc_r0);
3179                                 }
3180                         }
3181                         break;
3182 #ifdef __mono_ilp32__
3183                 case OP_STOREI8_MEMBASE_REG:
3184                         if (ppc_is_imm16 (ins->inst_offset)) {
3185                                 ppc_str (code, ins->sreg1, ins->inst_offset, ins->inst_destbasereg);
3186                         } else {
3187                                 ppc_load (code, ppc_r0, ins->inst_offset);
3188                                 ppc_str_indexed (code, ins->sreg1, ins->inst_destbasereg, ppc_r0);
3189                         }
3190                         break;
3191 #endif
3192                 case OP_STOREI1_MEMINDEX:
3193                         ppc_stbx (code, ins->sreg1, ins->inst_destbasereg, ins->sreg2);
3194                         break;
3195                 case OP_STOREI2_MEMINDEX:
3196                         ppc_sthx (code, ins->sreg1, ins->inst_destbasereg, ins->sreg2);
3197                         break;
3198                 case OP_STORE_MEMINDEX:
3199                         ppc_stptr_indexed (code, ins->sreg1, ins->inst_destbasereg, ins->sreg2);
3200                         break;
3201                 case OP_LOADU4_MEM:
3202                         g_assert_not_reached ();
3203                         break;
3204                 case OP_LOAD_MEMBASE:
3205                         if (ppc_is_imm16 (ins->inst_offset)) {
3206                                 ppc_ldptr (code, ins->dreg, ins->inst_offset, ins->inst_basereg);
3207                         } else {
3208                                 if (ppc_is_imm32 (ins->inst_offset) && (ins->dreg > 0)) {
3209                                         ppc_addis (code, ins->dreg, ins->inst_basereg, ppc_ha(ins->inst_offset));
3210                                         ppc_ldptr (code, ins->dreg, ins->inst_offset, ins->dreg);
3211                                 } else {
3212                                         ppc_load (code, ppc_r0, ins->inst_offset);
3213                                         ppc_ldptr_indexed (code, ins->dreg, ins->inst_basereg, ppc_r0);
3214                                 }
3215                         }
3216                         break;
3217                 case OP_LOADI4_MEMBASE:
3218 #ifdef __mono_ppc64__
3219                         if (ppc_is_imm16 (ins->inst_offset)) {
3220                                 ppc_lwa (code, ins->dreg, ins->inst_offset, ins->inst_basereg);
3221                         } else {
3222                                 if (ppc_is_imm32 (ins->inst_offset) && (ins->dreg > 0)) {
3223                                         ppc_addis (code, ins->dreg, ins->inst_basereg, ppc_ha(ins->inst_offset));
3224                                         ppc_lwa (code, ins->dreg, ins->inst_offset, ins->dreg);
3225                                 } else {
3226                                         ppc_load (code, ppc_r0, ins->inst_offset);
3227                                         ppc_lwax (code, ins->dreg, ins->inst_basereg, ppc_r0);
3228                                 }
3229                         }
3230                         break;
3231 #endif
3232                 case OP_LOADU4_MEMBASE:
3233                         if (ppc_is_imm16 (ins->inst_offset)) {
3234                                 ppc_lwz (code, ins->dreg, ins->inst_offset, ins->inst_basereg);
3235                         } else {
3236                                 if (ppc_is_imm32 (ins->inst_offset) && (ins->dreg > 0)) {
3237                                         ppc_addis (code, ins->dreg, ins->inst_basereg, ppc_ha(ins->inst_offset));
3238                                         ppc_lwz (code, ins->dreg, ins->inst_offset, ins->dreg);
3239                                 } else {
3240                                         ppc_load (code, ppc_r0, ins->inst_offset);
3241                                         ppc_lwzx (code, ins->dreg, ins->inst_basereg, ppc_r0);
3242                                 }
3243                         }
3244                         break;
3245                 case OP_LOADI1_MEMBASE:
3246                 case OP_LOADU1_MEMBASE:
3247                         if (ppc_is_imm16 (ins->inst_offset)) {
3248                                 ppc_lbz (code, ins->dreg, ins->inst_offset, ins->inst_basereg);
3249                         } else {
3250                                 if (ppc_is_imm32 (ins->inst_offset) && (ins->dreg > 0)) {
3251                                         ppc_addis (code, ins->dreg, ins->inst_basereg, ppc_ha(ins->inst_offset));
3252                                         ppc_lbz (code, ins->dreg, ins->inst_offset, ins->dreg);
3253                                 } else {
3254                                         ppc_load (code, ppc_r0, ins->inst_offset);
3255                                         ppc_lbzx (code, ins->dreg, ins->inst_basereg, ppc_r0);
3256                                 }
3257                         }
3258                         if (ins->opcode == OP_LOADI1_MEMBASE)
3259                                 ppc_extsb (code, ins->dreg, ins->dreg);
3260                         break;
3261                 case OP_LOADU2_MEMBASE:
3262                         if (ppc_is_imm16 (ins->inst_offset)) {
3263                                 ppc_lhz (code, ins->dreg, ins->inst_offset, ins->inst_basereg);
3264                         } else {
3265                                 if (ppc_is_imm32 (ins->inst_offset) && (ins->dreg > 0)) {
3266                                         ppc_addis (code, ins->dreg, ins->inst_basereg, ppc_ha(ins->inst_offset));
3267                                         ppc_lhz (code, ins->dreg, ins->inst_offset, ins->dreg);
3268                                 } else {
3269                                         ppc_load (code, ppc_r0, ins->inst_offset);
3270                                         ppc_lhzx (code, ins->dreg, ins->inst_basereg, ppc_r0);
3271                                 }
3272                         }
3273                         break;
3274                 case OP_LOADI2_MEMBASE:
3275                         if (ppc_is_imm16 (ins->inst_offset)) {
3276                                 ppc_lha (code, ins->dreg, ins->inst_offset, ins->inst_basereg);
3277                         } else {
3278                                 if (ppc_is_imm32 (ins->inst_offset) && (ins->dreg > 0)) {
3279                                         ppc_addis (code, ins->dreg, ins->inst_basereg, ppc_ha(ins->inst_offset));
3280                                         ppc_lha (code, ins->dreg, ins->inst_offset, ins->dreg);
3281                                 } else {
3282                                         ppc_load (code, ppc_r0, ins->inst_offset);
3283                                         ppc_lhax (code, ins->dreg, ins->inst_basereg, ppc_r0);
3284                                 }
3285                         }
3286                         break;
3287 #ifdef __mono_ilp32__
3288                 case OP_LOADI8_MEMBASE:
3289                         if (ppc_is_imm16 (ins->inst_offset)) {
3290                                 ppc_ldr (code, ins->dreg, ins->inst_offset, ins->inst_basereg);
3291                         } else {
3292                                 ppc_load (code, ppc_r0, ins->inst_offset);
3293                                 ppc_ldr_indexed (code, ins->dreg, ins->inst_basereg, ppc_r0);
3294                         }
3295                         break;
3296 #endif
3297                 case OP_LOAD_MEMINDEX:
3298                         ppc_ldptr_indexed (code, ins->dreg, ins->inst_basereg, ins->sreg2);
3299                         break;
3300                 case OP_LOADI4_MEMINDEX:
3301 #ifdef __mono_ppc64__
3302                         ppc_lwax (code, ins->dreg, ins->inst_basereg, ins->sreg2);
3303                         break;
3304 #endif
3305                 case OP_LOADU4_MEMINDEX:
3306                         ppc_lwzx (code, ins->dreg, ins->inst_basereg, ins->sreg2);
3307                         break;
3308                 case OP_LOADU2_MEMINDEX:
3309                         ppc_lhzx (code, ins->dreg, ins->inst_basereg, ins->sreg2);
3310                         break;
3311                 case OP_LOADI2_MEMINDEX:
3312                         ppc_lhax (code, ins->dreg, ins->inst_basereg, ins->sreg2);
3313                         break;
3314                 case OP_LOADU1_MEMINDEX:
3315                         ppc_lbzx (code, ins->dreg, ins->inst_basereg, ins->sreg2);
3316                         break;
3317                 case OP_LOADI1_MEMINDEX:
3318                         ppc_lbzx (code, ins->dreg, ins->inst_basereg, ins->sreg2);
3319                         ppc_extsb (code, ins->dreg, ins->dreg);
3320                         break;
3321                 case OP_ICONV_TO_I1:
3322                 CASE_PPC64 (OP_LCONV_TO_I1)
3323                         ppc_extsb (code, ins->dreg, ins->sreg1);
3324                         break;
3325                 case OP_ICONV_TO_I2:
3326                 CASE_PPC64 (OP_LCONV_TO_I2)
3327                         ppc_extsh (code, ins->dreg, ins->sreg1);
3328                         break;
3329                 case OP_ICONV_TO_U1:
3330                 CASE_PPC64 (OP_LCONV_TO_U1)
3331                         ppc_clrlwi (code, ins->dreg, ins->sreg1, 24);
3332                         break;
3333                 case OP_ICONV_TO_U2:
3334                 CASE_PPC64 (OP_LCONV_TO_U2)
3335                         ppc_clrlwi (code, ins->dreg, ins->sreg1, 16);
3336                         break;
3337                 case OP_COMPARE:
3338                 case OP_ICOMPARE:
3339                 CASE_PPC64 (OP_LCOMPARE)
3340                         L = (sizeof (mgreg_t) == 4 || ins->opcode == OP_ICOMPARE) ? 0 : 1;
3341                         next = ins->next;
3342                         if (next && compare_opcode_is_unsigned (next->opcode))
3343                                 ppc_cmpl (code, 0, L, ins->sreg1, ins->sreg2);
3344                         else
3345                                 ppc_cmp (code, 0, L, ins->sreg1, ins->sreg2);
3346                         break;
3347                 case OP_COMPARE_IMM:
3348                 case OP_ICOMPARE_IMM:
3349                 CASE_PPC64 (OP_LCOMPARE_IMM)
3350                         L = (sizeof (mgreg_t) == 4 || ins->opcode == OP_ICOMPARE_IMM) ? 0 : 1;
3351                         next = ins->next;
3352                         if (next && compare_opcode_is_unsigned (next->opcode)) {
3353                                 if (ppc_is_uimm16 (ins->inst_imm)) {
3354                                         ppc_cmpli (code, 0, L, ins->sreg1, (ins->inst_imm & 0xffff));
3355                                 } else {
3356                                         g_assert_not_reached ();
3357                                 }
3358                         } else {
3359                                 if (ppc_is_imm16 (ins->inst_imm)) {
3360                                         ppc_cmpi (code, 0, L, ins->sreg1, (ins->inst_imm & 0xffff));
3361                                 } else {
3362                                         g_assert_not_reached ();
3363                                 }
3364                         }
3365                         break;
3366                 case OP_BREAK:
3367                         /*
3368                          * gdb does not like encountering a trap in the debugged code. So 
3369                          * instead of emitting a trap, we emit a call a C function and place a 
3370                          * breakpoint there.
3371                          */
3372                         //ppc_break (code);
3373                         ppc_mr (code, ppc_r3, ins->sreg1);
3374                         mono_add_patch_info (cfg, code - cfg->native_code, MONO_PATCH_INFO_INTERNAL_METHOD, 
3375                                              (gpointer)"mono_break");
3376                         if ((FORCE_INDIR_CALL || cfg->method->dynamic) && !cfg->compile_aot) {
3377                                 ppc_load_func (code, ppc_r0, 0);
3378                                 ppc_mtlr (code, ppc_r0);
3379                                 ppc_blrl (code);
3380                         } else {
3381                                 ppc_bl (code, 0);
3382                         }
3383                         break;
3384                 case OP_ADDCC:
3385                 case OP_IADDCC:
3386                         ppc_addco (code, ins->dreg, ins->sreg1, ins->sreg2);
3387                         break;
3388                 case OP_IADD:
3389                 CASE_PPC64 (OP_LADD)
3390                         ppc_add (code, ins->dreg, ins->sreg1, ins->sreg2);
3391                         break;
3392                 case OP_ADC:
3393                 case OP_IADC:
3394                         ppc_adde (code, ins->dreg, ins->sreg1, ins->sreg2);
3395                         break;
3396                 case OP_ADDCC_IMM:
3397                         if (ppc_is_imm16 (ins->inst_imm)) {
3398                                 ppc_addic (code, ins->dreg, ins->sreg1, ins->inst_imm);
3399                         } else {
3400                                 g_assert_not_reached ();
3401                         }
3402                         break;
3403                 case OP_ADD_IMM:
3404                 case OP_IADD_IMM:
3405                 CASE_PPC64 (OP_LADD_IMM)
3406                         if (ppc_is_imm16 (ins->inst_imm)) {
3407                                 ppc_addi (code, ins->dreg, ins->sreg1, ins->inst_imm);
3408                         } else {
3409                                 g_assert_not_reached ();
3410                         }
3411                         break;
3412                 case OP_IADD_OVF:
3413                         /* check XER [0-3] (SO, OV, CA): we can't use mcrxr
3414                          */
3415                         ppc_addo (code, ins->dreg, ins->sreg1, ins->sreg2);
3416                         ppc_mfspr (code, ppc_r0, ppc_xer);
3417                         ppc_andisd (code, ppc_r0, ppc_r0, (1<<14));
3418                         EMIT_COND_SYSTEM_EXCEPTION_FLAGS (PPC_BR_FALSE, PPC_BR_EQ, "OverflowException");
3419                         break;
3420                 case OP_IADD_OVF_UN:
3421                         /* check XER [0-3] (SO, OV, CA): we can't use mcrxr
3422                          */
3423                         ppc_addco (code, ins->dreg, ins->sreg1, ins->sreg2);
3424                         ppc_mfspr (code, ppc_r0, ppc_xer);
3425                         ppc_andisd (code, ppc_r0, ppc_r0, (1<<13));
3426                         EMIT_COND_SYSTEM_EXCEPTION_FLAGS (PPC_BR_FALSE, PPC_BR_EQ, "OverflowException");
3427                         break;
3428                 case OP_ISUB_OVF:
3429                 CASE_PPC64 (OP_LSUB_OVF)
3430                         /* check XER [0-3] (SO, OV, CA): we can't use mcrxr
3431                          */
3432                         ppc_subfo (code, ins->dreg, ins->sreg2, ins->sreg1);
3433                         ppc_mfspr (code, ppc_r0, ppc_xer);
3434                         ppc_andisd (code, ppc_r0, ppc_r0, (1<<14));
3435                         EMIT_COND_SYSTEM_EXCEPTION_FLAGS (PPC_BR_FALSE, PPC_BR_EQ, "OverflowException");
3436                         break;
3437                 case OP_ISUB_OVF_UN:
3438                 CASE_PPC64 (OP_LSUB_OVF_UN)
3439                         /* check XER [0-3] (SO, OV, CA): we can't use mcrxr
3440                          */
3441                         ppc_subfc (code, ins->dreg, ins->sreg2, ins->sreg1);
3442                         ppc_mfspr (code, ppc_r0, ppc_xer);
3443                         ppc_andisd (code, ppc_r0, ppc_r0, (1<<13));
3444                         EMIT_COND_SYSTEM_EXCEPTION_FLAGS (PPC_BR_TRUE, PPC_BR_EQ, "OverflowException");
3445                         break;
3446                 case OP_ADD_OVF_CARRY:
3447                         /* check XER [0-3] (SO, OV, CA): we can't use mcrxr
3448                          */
3449                         ppc_addeo (code, ins->dreg, ins->sreg1, ins->sreg2);
3450                         ppc_mfspr (code, ppc_r0, ppc_xer);
3451                         ppc_andisd (code, ppc_r0, ppc_r0, (1<<14));
3452                         EMIT_COND_SYSTEM_EXCEPTION_FLAGS (PPC_BR_FALSE, PPC_BR_EQ, "OverflowException");
3453                         break;
3454                 case OP_ADD_OVF_UN_CARRY:
3455                         /* check XER [0-3] (SO, OV, CA): we can't use mcrxr
3456                          */
3457                         ppc_addeo (code, ins->dreg, ins->sreg1, ins->sreg2);
3458                         ppc_mfspr (code, ppc_r0, ppc_xer);
3459                         ppc_andisd (code, ppc_r0, ppc_r0, (1<<13));
3460                         EMIT_COND_SYSTEM_EXCEPTION_FLAGS (PPC_BR_FALSE, PPC_BR_EQ, "OverflowException");
3461                         break;
3462                 case OP_SUB_OVF_CARRY:
3463                         /* check XER [0-3] (SO, OV, CA): we can't use mcrxr
3464                          */
3465                         ppc_subfeo (code, ins->dreg, ins->sreg2, ins->sreg1);
3466                         ppc_mfspr (code, ppc_r0, ppc_xer);
3467                         ppc_andisd (code, ppc_r0, ppc_r0, (1<<14));
3468                         EMIT_COND_SYSTEM_EXCEPTION_FLAGS (PPC_BR_FALSE, PPC_BR_EQ, "OverflowException");
3469                         break;
3470                 case OP_SUB_OVF_UN_CARRY:
3471                         /* check XER [0-3] (SO, OV, CA): we can't use mcrxr
3472                          */
3473                         ppc_subfeo (code, ins->dreg, ins->sreg2, ins->sreg1);
3474                         ppc_mfspr (code, ppc_r0, ppc_xer);
3475                         ppc_andisd (code, ppc_r0, ppc_r0, (1<<13));
3476                         EMIT_COND_SYSTEM_EXCEPTION_FLAGS (PPC_BR_TRUE, PPC_BR_EQ, "OverflowException");
3477                         break;
3478                 case OP_SUBCC:
3479                 case OP_ISUBCC:
3480                         ppc_subfco (code, ins->dreg, ins->sreg2, ins->sreg1);
3481                         break;
3482                 case OP_ISUB:
3483                 CASE_PPC64 (OP_LSUB)
3484                         ppc_subf (code, ins->dreg, ins->sreg2, ins->sreg1);
3485                         break;
3486                 case OP_SBB:
3487                 case OP_ISBB:
3488                         ppc_subfe (code, ins->dreg, ins->sreg2, ins->sreg1);
3489                         break;
3490                 case OP_SUB_IMM:
3491                 case OP_ISUB_IMM:
3492                 CASE_PPC64 (OP_LSUB_IMM)
3493                         // we add the negated value
3494                         if (ppc_is_imm16 (-ins->inst_imm))
3495                                 ppc_addi (code, ins->dreg, ins->sreg1, -ins->inst_imm);
3496                         else {
3497                                 g_assert_not_reached ();
3498                         }
3499                         break;
3500                 case OP_PPC_SUBFIC:
3501                         g_assert (ppc_is_imm16 (ins->inst_imm));
3502                         ppc_subfic (code, ins->dreg, ins->sreg1, ins->inst_imm);
3503                         break;
3504                 case OP_PPC_SUBFZE:
3505                         ppc_subfze (code, ins->dreg, ins->sreg1);
3506                         break;
3507                 case OP_IAND:
3508                 CASE_PPC64 (OP_LAND)
3509                         /* FIXME: the ppc macros as inconsistent here: put dest as the first arg! */
3510                         ppc_and (code, ins->sreg1, ins->dreg, ins->sreg2);
3511                         break;
3512                 case OP_AND_IMM:
3513                 case OP_IAND_IMM:
3514                 CASE_PPC64 (OP_LAND_IMM)
3515                         if (!(ins->inst_imm & 0xffff0000)) {
3516                                 ppc_andid (code, ins->sreg1, ins->dreg, ins->inst_imm);
3517                         } else if (!(ins->inst_imm & 0xffff)) {
3518                                 ppc_andisd (code, ins->sreg1, ins->dreg, ((guint32)ins->inst_imm >> 16));
3519                         } else {
3520                                 g_assert_not_reached ();
3521                         }
3522                         break;
3523                 case OP_IDIV:
3524                 CASE_PPC64 (OP_LDIV) {
3525                         guint8 *divisor_is_m1;
3526                          /* XER format: SO, OV, CA, reserved [21 bits], count [8 bits]
3527                          */
3528                         ppc_compare_reg_imm (code, 0, ins->sreg2, -1);
3529                         divisor_is_m1 = code;
3530                         ppc_bc (code, PPC_BR_FALSE | PPC_BR_LIKELY, PPC_BR_EQ, 0);
3531                         ppc_lis (code, ppc_r0, 0x8000);
3532 #ifdef __mono_ppc64__
3533                         if (ins->opcode == OP_LDIV)
3534                                 ppc_sldi (code, ppc_r0, ppc_r0, 32);
3535 #endif
3536                         ppc_compare (code, 0, ins->sreg1, ppc_r0);
3537                         EMIT_COND_SYSTEM_EXCEPTION_FLAGS (PPC_BR_TRUE, PPC_BR_EQ, "OverflowException");
3538                         ppc_patch (divisor_is_m1, code);
3539                          /* XER format: SO, OV, CA, reserved [21 bits], count [8 bits]
3540                          */
3541                         if (ins->opcode == OP_IDIV)
3542                                 ppc_divwod (code, ins->dreg, ins->sreg1, ins->sreg2);
3543 #ifdef __mono_ppc64__
3544                         else
3545                                 ppc_divdod (code, ins->dreg, ins->sreg1, ins->sreg2);
3546 #endif
3547                         ppc_mfspr (code, ppc_r0, ppc_xer);
3548                         ppc_andisd (code, ppc_r0, ppc_r0, (1<<14));
3549                         EMIT_COND_SYSTEM_EXCEPTION_FLAGS (PPC_BR_FALSE, PPC_BR_EQ, "DivideByZeroException");
3550                         break;
3551                 }
3552                 case OP_IDIV_UN:
3553                 CASE_PPC64 (OP_LDIV_UN)
3554                         if (ins->opcode == OP_IDIV_UN)
3555                                 ppc_divwuod (code, ins->dreg, ins->sreg1, ins->sreg2);
3556 #ifdef __mono_ppc64__
3557                         else
3558                                 ppc_divduod (code, ins->dreg, ins->sreg1, ins->sreg2);
3559 #endif
3560                         ppc_mfspr (code, ppc_r0, ppc_xer);
3561                         ppc_andisd (code, ppc_r0, ppc_r0, (1<<14));
3562                         EMIT_COND_SYSTEM_EXCEPTION_FLAGS (PPC_BR_FALSE, PPC_BR_EQ, "DivideByZeroException");
3563                         break;
3564                 case OP_DIV_IMM:
3565                 case OP_IREM:
3566                 case OP_IREM_UN:
3567                 case OP_REM_IMM:
3568                         g_assert_not_reached ();
3569                 case OP_IOR:
3570                 CASE_PPC64 (OP_LOR)
3571                         ppc_or (code, ins->dreg, ins->sreg1, ins->sreg2);
3572                         break;
3573                 case OP_OR_IMM:
3574                 case OP_IOR_IMM:
3575                 CASE_PPC64 (OP_LOR_IMM)
3576                         if (!(ins->inst_imm & 0xffff0000)) {
3577                                 ppc_ori (code, ins->sreg1, ins->dreg, ins->inst_imm);
3578                         } else if (!(ins->inst_imm & 0xffff)) {
3579                                 ppc_oris (code, ins->dreg, ins->sreg1, ((guint32)(ins->inst_imm) >> 16));
3580                         } else {
3581                                 g_assert_not_reached ();
3582                         }
3583                         break;
3584                 case OP_IXOR:
3585                 CASE_PPC64 (OP_LXOR)
3586                         ppc_xor (code, ins->dreg, ins->sreg1, ins->sreg2);
3587                         break;
3588                 case OP_IXOR_IMM:
3589                 case OP_XOR_IMM:
3590                 CASE_PPC64 (OP_LXOR_IMM)
3591                         if (!(ins->inst_imm & 0xffff0000)) {
3592                                 ppc_xori (code, ins->sreg1, ins->dreg, ins->inst_imm);
3593                         } else if (!(ins->inst_imm & 0xffff)) {
3594                                 ppc_xoris (code, ins->sreg1, ins->dreg, ((guint32)(ins->inst_imm) >> 16));
3595                         } else {
3596                                 g_assert_not_reached ();
3597                         }
3598                         break;
3599                 case OP_ISHL:
3600                 CASE_PPC64 (OP_LSHL)
3601                         ppc_shift_left (code, ins->dreg, ins->sreg1, ins->sreg2);
3602                         break;
3603                 case OP_SHL_IMM:
3604                 case OP_ISHL_IMM:
3605                 CASE_PPC64 (OP_LSHL_IMM)
3606                         ppc_shift_left_imm (code, ins->dreg, ins->sreg1, MASK_SHIFT_IMM (ins->inst_imm));
3607                         break;
3608                 case OP_ISHR:
3609                         ppc_sraw (code, ins->dreg, ins->sreg1, ins->sreg2);
3610                         break;
3611                 case OP_SHR_IMM:
3612                         ppc_shift_right_arith_imm (code, ins->dreg, ins->sreg1, MASK_SHIFT_IMM (ins->inst_imm));
3613                         break;
3614                 case OP_SHR_UN_IMM:
3615                         if (MASK_SHIFT_IMM (ins->inst_imm))
3616                                 ppc_shift_right_imm (code, ins->dreg, ins->sreg1, MASK_SHIFT_IMM (ins->inst_imm));
3617                         else
3618                                 ppc_mr (code, ins->dreg, ins->sreg1);
3619                         break;
3620                 case OP_ISHR_UN:
3621                         ppc_srw (code, ins->dreg, ins->sreg1, ins->sreg2);
3622                         break;
3623                 case OP_INOT:
3624                 CASE_PPC64 (OP_LNOT)
3625                         ppc_not (code, ins->dreg, ins->sreg1);
3626                         break;
3627                 case OP_INEG:
3628                 CASE_PPC64 (OP_LNEG)
3629                         ppc_neg (code, ins->dreg, ins->sreg1);
3630                         break;
3631                 case OP_IMUL:
3632                 CASE_PPC64 (OP_LMUL)
3633                         ppc_multiply (code, ins->dreg, ins->sreg1, ins->sreg2);
3634                         break;
3635                 case OP_IMUL_IMM:
3636                 case OP_MUL_IMM:
3637                 CASE_PPC64 (OP_LMUL_IMM)
3638                         if (ppc_is_imm16 (ins->inst_imm)) {
3639                             ppc_mulli (code, ins->dreg, ins->sreg1, ins->inst_imm);
3640                         } else {
3641                             g_assert_not_reached ();
3642                         }
3643                         break;
3644                 case OP_IMUL_OVF:
3645                 CASE_PPC64 (OP_LMUL_OVF)
3646                         /* we annot use mcrxr, since it's not implemented on some processors 
3647                          * XER format: SO, OV, CA, reserved [21 bits], count [8 bits]
3648                          */
3649                         if (ins->opcode == OP_IMUL_OVF)
3650                                 ppc_mullwo (code, ins->dreg, ins->sreg1, ins->sreg2);
3651 #ifdef __mono_ppc64__
3652                         else
3653                                 ppc_mulldo (code, ins->dreg, ins->sreg1, ins->sreg2);
3654 #endif
3655                         ppc_mfspr (code, ppc_r0, ppc_xer);
3656                         ppc_andisd (code, ppc_r0, ppc_r0, (1<<14));
3657                         EMIT_COND_SYSTEM_EXCEPTION_FLAGS (PPC_BR_FALSE, PPC_BR_EQ, "OverflowException");
3658                         break;
3659                 case OP_IMUL_OVF_UN:
3660                 CASE_PPC64 (OP_LMUL_OVF_UN)
3661                         /* we first multiply to get the high word and compare to 0
3662                          * to set the flags, then the result is discarded and then 
3663                          * we multiply to get the lower * bits result
3664                          */
3665                         if (ins->opcode == OP_IMUL_OVF_UN)
3666                                 ppc_mulhwu (code, ppc_r0, ins->sreg1, ins->sreg2);
3667 #ifdef __mono_ppc64__
3668                         else
3669                                 ppc_mulhdu (code, ppc_r0, ins->sreg1, ins->sreg2);
3670 #endif
3671                         ppc_cmpi (code, 0, 0, ppc_r0, 0);
3672                         EMIT_COND_SYSTEM_EXCEPTION (CEE_BNE_UN - CEE_BEQ, "OverflowException");
3673                         ppc_multiply (code, ins->dreg, ins->sreg1, ins->sreg2);
3674                         break;
3675                 case OP_ICONST:
3676                         ppc_load (code, ins->dreg, ins->inst_c0);
3677                         break;
3678                 case OP_I8CONST: {
3679                         ppc_load (code, ins->dreg, ins->inst_l);
3680                         break;
3681                 }
3682                 case OP_LOAD_GOTADDR:
3683                         /* The PLT implementation depends on this */
3684                         g_assert (ins->dreg == ppc_r30);
3685
3686                         code = mono_arch_emit_load_got_addr (cfg->native_code, code, cfg, NULL);
3687                         break;
3688                 case OP_GOT_ENTRY:
3689                         // FIXME: Fix max instruction length
3690                         mono_add_patch_info (cfg, offset, (MonoJumpInfoType)ins->inst_right->inst_i1, ins->inst_right->inst_p0);
3691                         /* arch_emit_got_access () patches this */
3692                         ppc_load32 (code, ppc_r0, 0);
3693                         ppc_ldptr_indexed (code, ins->dreg, ins->inst_basereg, ppc_r0);
3694                         break;
3695                 case OP_AOTCONST:
3696                         mono_add_patch_info (cfg, offset, (MonoJumpInfoType)ins->inst_i1, ins->inst_p0);
3697                         ppc_load_sequence (code, ins->dreg, 0);
3698                         break;
3699                 CASE_PPC32 (OP_ICONV_TO_I4)
3700                 CASE_PPC32 (OP_ICONV_TO_U4)
3701                 case OP_MOVE:
3702                         ppc_mr (code, ins->dreg, ins->sreg1);
3703                         break;
3704                 case OP_SETLRET: {
3705                         int saved = ins->sreg1;
3706                         if (ins->sreg1 == ppc_r3) {
3707                                 ppc_mr (code, ppc_r0, ins->sreg1);
3708                                 saved = ppc_r0;
3709                         }
3710                         if (ins->sreg2 != ppc_r3)
3711                                 ppc_mr (code, ppc_r3, ins->sreg2);
3712                         if (saved != ppc_r4)
3713                                 ppc_mr (code, ppc_r4, saved);
3714                         break;
3715                 }
3716                 case OP_FMOVE:
3717                         ppc_fmr (code, ins->dreg, ins->sreg1);
3718                         break;
3719                 case OP_FCONV_TO_R4:
3720                         ppc_frsp (code, ins->dreg, ins->sreg1);
3721                         break;
3722                 case OP_TAILCALL: {
3723                         int i, pos;
3724                         MonoCallInst *call = (MonoCallInst*)ins;
3725
3726                         /*
3727                          * Keep in sync with mono_arch_emit_epilog
3728                          */
3729                         g_assert (!cfg->method->save_lmf);
3730                         /*
3731                          * Note: we can use ppc_r11 here because it is dead anyway:
3732                          * we're leaving the method.
3733                          */
3734                         if (1 || cfg->flags & MONO_CFG_HAS_CALLS) {
3735                                 long ret_offset = cfg->stack_usage + PPC_RET_ADDR_OFFSET;
3736                                 if (ppc_is_imm16 (ret_offset)) {
3737                                         ppc_ldptr (code, ppc_r0, ret_offset, cfg->frame_reg);
3738                                 } else {
3739                                         ppc_load (code, ppc_r11, ret_offset);
3740                                         ppc_ldptr_indexed (code, ppc_r0, cfg->frame_reg, ppc_r11);
3741                                 }
3742                                 ppc_mtlr (code, ppc_r0);
3743                         }
3744
3745                         if (ppc_is_imm16 (cfg->stack_usage)) {
3746                                 ppc_addi (code, ppc_r11, cfg->frame_reg, cfg->stack_usage);
3747                         } else {
3748                                 /* cfg->stack_usage is an int, so we can use
3749                                  * an addis/addi sequence here even in 64-bit.  */
3750                                 ppc_addis (code, ppc_r11, cfg->frame_reg, ppc_ha(cfg->stack_usage));
3751                                 ppc_addi (code, ppc_r11, ppc_r11, cfg->stack_usage);
3752                         }
3753                         if (!cfg->method->save_lmf) {
3754                                 pos = 0;
3755                                 for (i = 31; i >= 13; --i) {
3756                                         if (cfg->used_int_regs & (1 << i)) {
3757                                                 pos += sizeof (gpointer);
3758                                                 ppc_ldptr (code, i, -pos, ppc_r11);
3759                                         }
3760                                 }
3761                         } else {
3762                                 /* FIXME restore from MonoLMF: though this can't happen yet */
3763                         }
3764
3765                         /* Copy arguments on the stack to our argument area */
3766                         if (call->stack_usage) {
3767                                 code = emit_memcpy (code, call->stack_usage, ppc_r11, PPC_STACK_PARAM_OFFSET, ppc_sp, PPC_STACK_PARAM_OFFSET);
3768                                 /* r11 was clobbered */
3769                                 g_assert (cfg->frame_reg == ppc_sp);
3770                                 if (ppc_is_imm16 (cfg->stack_usage)) {
3771                                         ppc_addi (code, ppc_r11, cfg->frame_reg, cfg->stack_usage);
3772                                 } else {
3773                                         /* cfg->stack_usage is an int, so we can use
3774                                          * an addis/addi sequence here even in 64-bit.  */
3775                                         ppc_addis (code, ppc_r11, cfg->frame_reg, ppc_ha(cfg->stack_usage));
3776                                         ppc_addi (code, ppc_r11, ppc_r11, cfg->stack_usage);
3777                                 }
3778                         }
3779
3780                         ppc_mr (code, ppc_sp, ppc_r11);
3781                         mono_add_patch_info (cfg, (guint8*) code - cfg->native_code, MONO_PATCH_INFO_METHOD_JUMP, call->method);
3782                         if (cfg->compile_aot) {
3783                                 /* arch_emit_got_access () patches this */
3784                                 ppc_load32 (code, ppc_r0, 0);
3785 #ifdef PPC_USES_FUNCTION_DESCRIPTOR
3786                                 ppc_ldptr_indexed (code, ppc_r11, ppc_r30, ppc_r0);
3787                                 ppc_ldptr (code, ppc_r0, 0, ppc_r11);
3788 #else
3789                                 ppc_ldptr_indexed (code, ppc_r0, ppc_r30, ppc_r0);
3790 #endif
3791                                 ppc_mtctr (code, ppc_r0);
3792                                 ppc_bcctr (code, PPC_BR_ALWAYS, 0);
3793                         } else {
3794                                 ppc_b (code, 0);
3795                         }
3796                         break;
3797                 }
3798                 case OP_CHECK_THIS:
3799                         /* ensure ins->sreg1 is not NULL */
3800                         ppc_ldptr (code, ppc_r0, 0, ins->sreg1);
3801                         break;
3802                 case OP_ARGLIST: {
3803                         long cookie_offset = cfg->sig_cookie + cfg->stack_usage;
3804                         if (ppc_is_imm16 (cookie_offset)) {
3805                                 ppc_addi (code, ppc_r0, cfg->frame_reg, cookie_offset);
3806                         } else {
3807                                 ppc_load (code, ppc_r0, cookie_offset);
3808                                 ppc_add (code, ppc_r0, cfg->frame_reg, ppc_r0);
3809                         }
3810                         ppc_stptr (code, ppc_r0, 0, ins->sreg1);
3811                         break;
3812                 }
3813                 case OP_FCALL:
3814                 case OP_LCALL:
3815                 case OP_VCALL:
3816                 case OP_VCALL2:
3817                 case OP_VOIDCALL:
3818                 case OP_CALL:
3819                         call = (MonoCallInst*)ins;
3820                         if (ins->flags & MONO_INST_HAS_METHOD)
3821                                 mono_add_patch_info (cfg, offset, MONO_PATCH_INFO_METHOD, call->method);
3822                         else
3823                                 mono_add_patch_info (cfg, offset, MONO_PATCH_INFO_ABS, call->fptr);
3824                         if ((FORCE_INDIR_CALL || cfg->method->dynamic) && !cfg->compile_aot) {
3825                                 ppc_load_func (code, ppc_r0, 0);
3826                                 ppc_mtlr (code, ppc_r0);
3827                                 ppc_blrl (code);
3828                         } else {
3829                                 ppc_bl (code, 0);
3830                         }
3831                         /* FIXME: this should be handled somewhere else in the new jit */
3832                         code = emit_move_return_value (cfg, ins, code);
3833                         break;
3834                 case OP_FCALL_REG:
3835                 case OP_LCALL_REG:
3836                 case OP_VCALL_REG:
3837                 case OP_VCALL2_REG:
3838                 case OP_VOIDCALL_REG:
3839                 case OP_CALL_REG:
3840 #ifdef PPC_USES_FUNCTION_DESCRIPTOR
3841                         ppc_ldptr (code, ppc_r0, 0, ins->sreg1);
3842                         /* FIXME: if we know that this is a method, we
3843                            can omit this load */
3844                         ppc_ldptr (code, ppc_r2, 8, ins->sreg1);
3845                         ppc_mtlr (code, ppc_r0);
3846 #else
3847                         ppc_mtlr (code, ins->sreg1);
3848 #endif
3849                         ppc_blrl (code);
3850                         /* FIXME: this should be handled somewhere else in the new jit */
3851                         code = emit_move_return_value (cfg, ins, code);
3852                         break;
3853                 case OP_FCALL_MEMBASE:
3854                 case OP_LCALL_MEMBASE:
3855                 case OP_VCALL_MEMBASE:
3856                 case OP_VCALL2_MEMBASE:
3857                 case OP_VOIDCALL_MEMBASE:
3858                 case OP_CALL_MEMBASE:
3859                         if (cfg->compile_aot && ins->sreg1 == ppc_r11) {
3860                                 /* The trampolines clobber this */
3861                                 ppc_mr (code, ppc_r29, ins->sreg1);
3862                                 ppc_ldptr (code, ppc_r0, ins->inst_offset, ppc_r29);
3863                         } else {
3864                                 ppc_ldptr (code, ppc_r0, ins->inst_offset, ins->sreg1);
3865                         }
3866                         ppc_mtlr (code, ppc_r0);
3867                         ppc_blrl (code);
3868                         /* FIXME: this should be handled somewhere else in the new jit */
3869                         code = emit_move_return_value (cfg, ins, code);
3870                         break;
3871                 case OP_LOCALLOC: {
3872                         guint8 * zero_loop_jump, * zero_loop_start;
3873                         /* keep alignment */
3874                         int alloca_waste = PPC_STACK_PARAM_OFFSET + cfg->param_area + 31;
3875                         int area_offset = alloca_waste;
3876                         area_offset &= ~31;
3877                         ppc_addi (code, ppc_r11, ins->sreg1, alloca_waste + 31);
3878                         /* FIXME: should be calculated from MONO_ARCH_FRAME_ALIGNMENT */
3879                         ppc_clear_right_imm (code, ppc_r11, ppc_r11, 4);
3880                         /* use ctr to store the number of words to 0 if needed */
3881                         if (ins->flags & MONO_INST_INIT) {
3882                                 /* we zero 4 bytes at a time:
3883                                  * we add 7 instead of 3 so that we set the counter to
3884                                  * at least 1, otherwise the bdnz instruction will make
3885                                  * it negative and iterate billions of times.
3886                                  */
3887                                 ppc_addi (code, ppc_r0, ins->sreg1, 7);
3888                                 ppc_shift_right_arith_imm (code, ppc_r0, ppc_r0, 2);
3889                                 ppc_mtctr (code, ppc_r0);
3890                         }
3891                         ppc_ldptr (code, ppc_r0, 0, ppc_sp);
3892                         ppc_neg (code, ppc_r11, ppc_r11);
3893                         ppc_stptr_update_indexed (code, ppc_r0, ppc_sp, ppc_r11);
3894
3895                         /* FIXME: make this loop work in 8 byte
3896                            increments on PPC64 */
3897                         if (ins->flags & MONO_INST_INIT) {
3898                                 /* adjust the dest reg by -4 so we can use stwu */
3899                                 /* we actually adjust -8 because we let the loop
3900                                  * run at least once
3901                                  */
3902                                 ppc_addi (code, ins->dreg, ppc_sp, (area_offset - 8));
3903                                 ppc_li (code, ppc_r11, 0);
3904                                 zero_loop_start = code;
3905                                 ppc_stwu (code, ppc_r11, 4, ins->dreg);
3906                                 zero_loop_jump = code;
3907                                 ppc_bc (code, PPC_BR_DEC_CTR_NONZERO, 0, 0);
3908                                 ppc_patch (zero_loop_jump, zero_loop_start);
3909                         }
3910                         ppc_addi (code, ins->dreg, ppc_sp, area_offset);
3911                         break;
3912                 }
3913                 case OP_THROW: {
3914                         //ppc_break (code);
3915                         ppc_mr (code, ppc_r3, ins->sreg1);
3916                         mono_add_patch_info (cfg, code - cfg->native_code, MONO_PATCH_INFO_INTERNAL_METHOD, 
3917                                              (gpointer)"mono_arch_throw_exception");
3918                         if ((FORCE_INDIR_CALL || cfg->method->dynamic) && !cfg->compile_aot) {
3919                                 ppc_load_func (code, ppc_r0, 0);
3920                                 ppc_mtlr (code, ppc_r0);
3921                                 ppc_blrl (code);
3922                         } else {
3923                                 ppc_bl (code, 0);
3924                         }
3925                         break;
3926                 }
3927                 case OP_RETHROW: {
3928                         //ppc_break (code);
3929                         ppc_mr (code, ppc_r3, ins->sreg1);
3930                         mono_add_patch_info (cfg, code - cfg->native_code, MONO_PATCH_INFO_INTERNAL_METHOD, 
3931                                              (gpointer)"mono_arch_rethrow_exception");
3932                         if ((FORCE_INDIR_CALL || cfg->method->dynamic) && !cfg->compile_aot) {
3933                                 ppc_load_func (code, ppc_r0, 0);
3934                                 ppc_mtlr (code, ppc_r0);
3935                                 ppc_blrl (code);
3936                         } else {
3937                                 ppc_bl (code, 0);
3938                         }
3939                         break;
3940                 }
3941                 case OP_START_HANDLER: {
3942                         MonoInst *spvar = mono_find_spvar_for_region (cfg, bb->region);
3943                         g_assert (spvar->inst_basereg != ppc_sp);
3944                         code = emit_reserve_param_area (cfg, code);
3945                         ppc_mflr (code, ppc_r0);
3946                         if (ppc_is_imm16 (spvar->inst_offset)) {
3947                                 ppc_stptr (code, ppc_r0, spvar->inst_offset, spvar->inst_basereg);
3948                         } else {
3949                                 ppc_load (code, ppc_r11, spvar->inst_offset);
3950                                 ppc_stptr_indexed (code, ppc_r0, ppc_r11, spvar->inst_basereg);
3951                         }
3952                         break;
3953                 }
3954                 case OP_ENDFILTER: {
3955                         MonoInst *spvar = mono_find_spvar_for_region (cfg, bb->region);
3956                         g_assert (spvar->inst_basereg != ppc_sp);
3957                         code = emit_unreserve_param_area (cfg, code);
3958                         if (ins->sreg1 != ppc_r3)
3959                                 ppc_mr (code, ppc_r3, ins->sreg1);
3960                         if (ppc_is_imm16 (spvar->inst_offset)) {
3961                                 ppc_ldptr (code, ppc_r0, spvar->inst_offset, spvar->inst_basereg);
3962                         } else {
3963                                 ppc_load (code, ppc_r11, spvar->inst_offset);
3964                                 ppc_ldptr_indexed (code, ppc_r0, spvar->inst_basereg, ppc_r11);
3965                         }
3966                         ppc_mtlr (code, ppc_r0);
3967                         ppc_blr (code);
3968                         break;
3969                 }
3970                 case OP_ENDFINALLY: {
3971                         MonoInst *spvar = mono_find_spvar_for_region (cfg, bb->region);
3972                         g_assert (spvar->inst_basereg != ppc_sp);
3973                         code = emit_unreserve_param_area (cfg, code);
3974                         ppc_ldptr (code, ppc_r0, spvar->inst_offset, spvar->inst_basereg);
3975                         ppc_mtlr (code, ppc_r0);
3976                         ppc_blr (code);
3977                         break;
3978                 }
3979                 case OP_CALL_HANDLER: 
3980                         mono_add_patch_info (cfg, code - cfg->native_code, MONO_PATCH_INFO_BB, ins->inst_target_bb);
3981                         ppc_bl (code, 0);
3982                         mono_cfg_add_try_hole (cfg, ins->inst_eh_block, code, bb);
3983                         break;
3984                 case OP_LABEL:
3985                         ins->inst_c0 = code - cfg->native_code;
3986                         break;
3987                 case OP_BR:
3988                         /*if (ins->inst_target_bb->native_offset) {
3989                                 ppc_b (code, 0);
3990                                 //x86_jump_code (code, cfg->native_code + ins->inst_target_bb->native_offset); 
3991                         } else*/ {
3992                                 mono_add_patch_info (cfg, offset, MONO_PATCH_INFO_BB, ins->inst_target_bb);
3993                                 ppc_b (code, 0);
3994                         }
3995                         break;
3996                 case OP_BR_REG:
3997                         ppc_mtctr (code, ins->sreg1);
3998                         ppc_bcctr (code, PPC_BR_ALWAYS, 0);
3999                         break;
4000                 case OP_CEQ:
4001                 case OP_ICEQ:
4002                 CASE_PPC64 (OP_LCEQ)
4003                         ppc_li (code, ins->dreg, 0);
4004                         ppc_bc (code, PPC_BR_FALSE, PPC_BR_EQ, 2);
4005                         ppc_li (code, ins->dreg, 1);
4006                         break;
4007                 case OP_CLT:
4008                 case OP_CLT_UN:
4009                 case OP_ICLT:
4010                 case OP_ICLT_UN:
4011                 CASE_PPC64 (OP_LCLT)
4012                 CASE_PPC64 (OP_LCLT_UN)
4013                         ppc_li (code, ins->dreg, 1);
4014                         ppc_bc (code, PPC_BR_TRUE, PPC_BR_LT, 2);
4015                         ppc_li (code, ins->dreg, 0);
4016                         break;
4017                 case OP_CGT:
4018                 case OP_CGT_UN:
4019                 case OP_ICGT:
4020                 case OP_ICGT_UN:
4021                 CASE_PPC64 (OP_LCGT)
4022                 CASE_PPC64 (OP_LCGT_UN)
4023                         ppc_li (code, ins->dreg, 1);
4024                         ppc_bc (code, PPC_BR_TRUE, PPC_BR_GT, 2);
4025                         ppc_li (code, ins->dreg, 0);
4026                         break;
4027                 case OP_COND_EXC_EQ:
4028                 case OP_COND_EXC_NE_UN:
4029                 case OP_COND_EXC_LT:
4030                 case OP_COND_EXC_LT_UN:
4031                 case OP_COND_EXC_GT:
4032                 case OP_COND_EXC_GT_UN:
4033                 case OP_COND_EXC_GE:
4034                 case OP_COND_EXC_GE_UN:
4035                 case OP_COND_EXC_LE:
4036                 case OP_COND_EXC_LE_UN:
4037                         EMIT_COND_SYSTEM_EXCEPTION (ins->opcode - OP_COND_EXC_EQ, ins->inst_p1);
4038                         break;
4039                 case OP_COND_EXC_IEQ:
4040                 case OP_COND_EXC_INE_UN:
4041                 case OP_COND_EXC_ILT:
4042                 case OP_COND_EXC_ILT_UN:
4043                 case OP_COND_EXC_IGT:
4044                 case OP_COND_EXC_IGT_UN:
4045                 case OP_COND_EXC_IGE:
4046                 case OP_COND_EXC_IGE_UN:
4047                 case OP_COND_EXC_ILE:
4048                 case OP_COND_EXC_ILE_UN:
4049                         EMIT_COND_SYSTEM_EXCEPTION (ins->opcode - OP_COND_EXC_IEQ, ins->inst_p1);
4050                         break;
4051                 case OP_IBEQ:
4052                 case OP_IBNE_UN:
4053                 case OP_IBLT:
4054                 case OP_IBLT_UN:
4055                 case OP_IBGT:
4056                 case OP_IBGT_UN:
4057                 case OP_IBGE:
4058                 case OP_IBGE_UN:
4059                 case OP_IBLE:
4060                 case OP_IBLE_UN:
4061                         EMIT_COND_BRANCH (ins, ins->opcode - OP_IBEQ);
4062                         break;
4063
4064                 /* floating point opcodes */
4065                 case OP_R8CONST:
4066                         g_assert (cfg->compile_aot);
4067
4068                         /* FIXME: Optimize this */
4069                         ppc_bl (code, 1);
4070                         ppc_mflr (code, ppc_r11);
4071                         ppc_b (code, 3);
4072                         *(double*)code = *(double*)ins->inst_p0;
4073                         code += 8;
4074                         ppc_lfd (code, ins->dreg, 8, ppc_r11);
4075                         break;
4076                 case OP_R4CONST:
4077                         g_assert_not_reached ();
4078                         break;
4079                 case OP_STORER8_MEMBASE_REG:
4080                         if (ppc_is_imm16 (ins->inst_offset)) {
4081                                 ppc_stfd (code, ins->sreg1, ins->inst_offset, ins->inst_destbasereg);
4082                         } else {
4083                                 if (ppc_is_imm32 (ins->inst_offset)) {
4084                                         ppc_addis (code, ppc_r12, ins->inst_destbasereg, ppc_ha(ins->inst_offset));
4085                                         ppc_stfd (code, ins->sreg1, ins->inst_offset, ppc_r12);
4086                                 } else {
4087                                         ppc_load (code, ppc_r0, ins->inst_offset);
4088                                         ppc_stfdx (code, ins->sreg1, ins->inst_destbasereg, ppc_r0);
4089                                 }
4090                         }
4091                         break;
4092                 case OP_LOADR8_MEMBASE:
4093                         if (ppc_is_imm16 (ins->inst_offset)) {
4094                                 ppc_lfd (code, ins->dreg, ins->inst_offset, ins->inst_basereg);
4095                         } else {
4096                                 if (ppc_is_imm32 (ins->inst_offset)) {
4097                                         ppc_addis (code, ppc_r12, ins->inst_destbasereg, ppc_ha(ins->inst_offset));
4098                                         ppc_lfd (code, ins->dreg, ins->inst_offset, ppc_r12);
4099                                 } else {
4100                                         ppc_load (code, ppc_r0, ins->inst_offset);
4101                                         ppc_lfdx (code, ins->dreg, ins->inst_destbasereg, ppc_r0);
4102                                 }
4103                         }
4104                         break;
4105                 case OP_STORER4_MEMBASE_REG:
4106                         ppc_frsp (code, ins->sreg1, ins->sreg1);
4107                         if (ppc_is_imm16 (ins->inst_offset)) {
4108                                 ppc_stfs (code, ins->sreg1, ins->inst_offset, ins->inst_destbasereg);
4109                         } else {
4110                                 if (ppc_is_imm32 (ins->inst_offset)) {
4111                                         ppc_addis (code, ppc_r12, ins->inst_destbasereg, ppc_ha(ins->inst_offset));
4112                                         ppc_stfs (code, ins->sreg1, ins->inst_offset, ppc_r12);
4113                                 } else {
4114                                         ppc_load (code, ppc_r0, ins->inst_offset);
4115                                         ppc_stfsx (code, ins->sreg1, ins->inst_destbasereg, ppc_r0);
4116                                 }
4117                         }
4118                         break;
4119                 case OP_LOADR4_MEMBASE:
4120                         if (ppc_is_imm16 (ins->inst_offset)) {
4121                                 ppc_lfs (code, ins->dreg, ins->inst_offset, ins->inst_basereg);
4122                         } else {
4123                                 if (ppc_is_imm32 (ins->inst_offset)) {
4124                                         ppc_addis (code, ppc_r12, ins->inst_destbasereg, ppc_ha(ins->inst_offset));
4125                                         ppc_lfs (code, ins->dreg, ins->inst_offset, ppc_r12);
4126                                 } else {
4127                                         ppc_load (code, ppc_r0, ins->inst_offset);
4128                                         ppc_lfsx (code, ins->dreg, ins->inst_destbasereg, ppc_r0);
4129                                 }
4130                         }
4131                         break;
4132                 case OP_LOADR4_MEMINDEX:
4133                         ppc_lfsx (code, ins->dreg, ins->inst_basereg, ins->sreg2);
4134                         break;
4135                 case OP_LOADR8_MEMINDEX:
4136                         ppc_lfdx (code, ins->dreg, ins->inst_basereg, ins->sreg2);
4137                         break;
4138                 case OP_STORER4_MEMINDEX:
4139                         ppc_frsp (code, ins->sreg1, ins->sreg1);
4140                         ppc_stfsx (code, ins->sreg1, ins->inst_destbasereg, ins->sreg2);
4141                         break;
4142                 case OP_STORER8_MEMINDEX:
4143                         ppc_stfdx (code, ins->sreg1, ins->inst_destbasereg, ins->sreg2);
4144                         break;
4145                 case CEE_CONV_R_UN:
4146                 case CEE_CONV_R4: /* FIXME: change precision */
4147                 case CEE_CONV_R8:
4148                         g_assert_not_reached ();
4149                 case OP_FCONV_TO_I1:
4150                         code = emit_float_to_int (cfg, code, ins->dreg, ins->sreg1, 1, TRUE);
4151                         break;
4152                 case OP_FCONV_TO_U1:
4153                         code = emit_float_to_int (cfg, code, ins->dreg, ins->sreg1, 1, FALSE);
4154                         break;
4155                 case OP_FCONV_TO_I2:
4156                         code = emit_float_to_int (cfg, code, ins->dreg, ins->sreg1, 2, TRUE);
4157                         break;
4158                 case OP_FCONV_TO_U2:
4159                         code = emit_float_to_int (cfg, code, ins->dreg, ins->sreg1, 2, FALSE);
4160                         break;
4161                 case OP_FCONV_TO_I4:
4162                 case OP_FCONV_TO_I:
4163                         code = emit_float_to_int (cfg, code, ins->dreg, ins->sreg1, 4, TRUE);
4164                         break;
4165                 case OP_FCONV_TO_U4:
4166                 case OP_FCONV_TO_U:
4167                         code = emit_float_to_int (cfg, code, ins->dreg, ins->sreg1, 4, FALSE);
4168                         break;
4169                 case OP_LCONV_TO_R_UN:
4170                         g_assert_not_reached ();
4171                         /* Implemented as helper calls */
4172                         break;
4173                 case OP_LCONV_TO_OVF_I4_2:
4174                 case OP_LCONV_TO_OVF_I: {
4175 #ifdef __mono_ppc64__
4176                         NOT_IMPLEMENTED;
4177 #else
4178                         guint8 *negative_branch, *msword_positive_branch, *msword_negative_branch, *ovf_ex_target;
4179                         // Check if its negative
4180                         ppc_cmpi (code, 0, 0, ins->sreg1, 0);
4181                         negative_branch = code;
4182                         ppc_bc (code, PPC_BR_TRUE, PPC_BR_LT, 0);
4183                         // Its positive msword == 0
4184                         ppc_cmpi (code, 0, 0, ins->sreg2, 0);
4185                         msword_positive_branch = code;
4186                         ppc_bc (code, PPC_BR_TRUE, PPC_BR_EQ, 0);
4187
4188                         ovf_ex_target = code;
4189                         EMIT_COND_SYSTEM_EXCEPTION_FLAGS (PPC_BR_ALWAYS, 0, "OverflowException");
4190                         // Negative
4191                         ppc_patch (negative_branch, code);
4192                         ppc_cmpi (code, 0, 0, ins->sreg2, -1);
4193                         msword_negative_branch = code;
4194                         ppc_bc (code, PPC_BR_FALSE, PPC_BR_EQ, 0);
4195                         ppc_patch (msword_negative_branch, ovf_ex_target);
4196                         
4197                         ppc_patch (msword_positive_branch, code);
4198                         if (ins->dreg != ins->sreg1)
4199                                 ppc_mr (code, ins->dreg, ins->sreg1);
4200                         break;
4201 #endif
4202                 }
4203                 case OP_SQRT:
4204                         ppc_fsqrtd (code, ins->dreg, ins->sreg1);
4205                         break;
4206                 case OP_FADD:
4207                         ppc_fadd (code, ins->dreg, ins->sreg1, ins->sreg2);
4208                         break;
4209                 case OP_FSUB:
4210                         ppc_fsub (code, ins->dreg, ins->sreg1, ins->sreg2);
4211                         break;          
4212                 case OP_FMUL:
4213                         ppc_fmul (code, ins->dreg, ins->sreg1, ins->sreg2);
4214                         break;          
4215                 case OP_FDIV:
4216                         ppc_fdiv (code, ins->dreg, ins->sreg1, ins->sreg2);
4217                         break;          
4218                 case OP_FNEG:
4219                         ppc_fneg (code, ins->dreg, ins->sreg1);
4220                         break;          
4221                 case OP_FREM:
4222                         /* emulated */
4223                         g_assert_not_reached ();
4224                         break;
4225                 case OP_FCOMPARE:
4226                         ppc_fcmpu (code, 0, ins->sreg1, ins->sreg2);
4227                         break;
4228                 case OP_FCEQ:
4229                         ppc_fcmpo (code, 0, ins->sreg1, ins->sreg2);
4230                         ppc_li (code, ins->dreg, 0);
4231                         ppc_bc (code, PPC_BR_FALSE, PPC_BR_EQ, 2);
4232                         ppc_li (code, ins->dreg, 1);
4233                         break;
4234                 case OP_FCLT:
4235                         ppc_fcmpo (code, 0, ins->sreg1, ins->sreg2);
4236                         ppc_li (code, ins->dreg, 1);
4237                         ppc_bc (code, PPC_BR_TRUE, PPC_BR_LT, 2);
4238                         ppc_li (code, ins->dreg, 0);
4239                         break;
4240                 case OP_FCLT_UN:
4241                         ppc_fcmpu (code, 0, ins->sreg1, ins->sreg2);
4242                         ppc_li (code, ins->dreg, 1);
4243                         ppc_bc (code, PPC_BR_TRUE, PPC_BR_SO, 3);
4244                         ppc_bc (code, PPC_BR_TRUE, PPC_BR_LT, 2);
4245                         ppc_li (code, ins->dreg, 0);
4246                         break;
4247                 case OP_FCGT:
4248                         ppc_fcmpo (code, 0, ins->sreg1, ins->sreg2);
4249                         ppc_li (code, ins->dreg, 1);
4250                         ppc_bc (code, PPC_BR_TRUE, PPC_BR_GT, 2);
4251                         ppc_li (code, ins->dreg, 0);
4252                         break;
4253                 case OP_FCGT_UN:
4254                         ppc_fcmpu (code, 0, ins->sreg1, ins->sreg2);
4255                         ppc_li (code, ins->dreg, 1);
4256                         ppc_bc (code, PPC_BR_TRUE, PPC_BR_SO, 3);
4257                         ppc_bc (code, PPC_BR_TRUE, PPC_BR_GT, 2);
4258                         ppc_li (code, ins->dreg, 0);
4259                         break;
4260                 case OP_FBEQ:
4261                         EMIT_COND_BRANCH (ins, CEE_BEQ - CEE_BEQ);
4262                         break;
4263                 case OP_FBNE_UN:
4264                         EMIT_COND_BRANCH (ins, CEE_BNE_UN - CEE_BEQ);
4265                         break;
4266                 case OP_FBLT:
4267                         ppc_bc (code, PPC_BR_TRUE, PPC_BR_SO, 2);
4268                         EMIT_COND_BRANCH (ins, CEE_BLT - CEE_BEQ);
4269                         break;
4270                 case OP_FBLT_UN:
4271                         EMIT_COND_BRANCH_FLAGS (ins, PPC_BR_TRUE, PPC_BR_SO);
4272                         EMIT_COND_BRANCH (ins, CEE_BLT_UN - CEE_BEQ);
4273                         break;
4274                 case OP_FBGT:
4275                         ppc_bc (code, PPC_BR_TRUE, PPC_BR_SO, 2);
4276                         EMIT_COND_BRANCH (ins, CEE_BGT - CEE_BEQ);
4277                         break;
4278                 case OP_FBGT_UN:
4279                         EMIT_COND_BRANCH_FLAGS (ins, PPC_BR_TRUE, PPC_BR_SO);
4280                         EMIT_COND_BRANCH (ins, CEE_BGT_UN - CEE_BEQ);
4281                         break;
4282                 case OP_FBGE:
4283                         ppc_bc (code, PPC_BR_TRUE, PPC_BR_SO, 2);
4284                         EMIT_COND_BRANCH (ins, CEE_BGE - CEE_BEQ);
4285                         break;
4286                 case OP_FBGE_UN:
4287                         EMIT_COND_BRANCH (ins, CEE_BGE_UN - CEE_BEQ);
4288                         break;
4289                 case OP_FBLE:
4290                         ppc_bc (code, PPC_BR_TRUE, PPC_BR_SO, 2);
4291                         EMIT_COND_BRANCH (ins, CEE_BLE - CEE_BEQ);
4292                         break;
4293                 case OP_FBLE_UN:
4294                         EMIT_COND_BRANCH (ins, CEE_BLE_UN - CEE_BEQ);
4295                         break;
4296                 case OP_CKFINITE:
4297                         g_assert_not_reached ();
4298                 case OP_CHECK_FINITE: {
4299                         ppc_rlwinm (code, ins->sreg1, ins->sreg1, 0, 1, 31);
4300                         ppc_addis (code, ins->sreg1, ins->sreg1, -32752);
4301                         ppc_rlwinmd (code, ins->sreg1, ins->sreg1, 1, 31, 31);
4302                         EMIT_COND_SYSTEM_EXCEPTION (CEE_BEQ - CEE_BEQ, "ArithmeticException");
4303                         break;
4304                 case OP_JUMP_TABLE:
4305                         mono_add_patch_info (cfg, offset, (MonoJumpInfoType)ins->inst_c1, ins->inst_p0);
4306 #ifdef __mono_ppc64__
4307                         ppc_load_sequence (code, ins->dreg, (guint64)0x0f0f0f0f0f0f0f0fLL);
4308 #else
4309                         ppc_load_sequence (code, ins->dreg, (gulong)0x0f0f0f0fL);
4310 #endif
4311                         break;
4312                 }
4313
4314 #ifdef __mono_ppc64__
4315                 case OP_ICONV_TO_I4:
4316                 case OP_SEXT_I4:
4317                         ppc_extsw (code, ins->dreg, ins->sreg1);
4318                         break;
4319                 case OP_ICONV_TO_U4:
4320                 case OP_ZEXT_I4:
4321                         ppc_clrldi (code, ins->dreg, ins->sreg1, 32);
4322                         break;
4323                 case OP_ICONV_TO_R4:
4324                 case OP_ICONV_TO_R8:
4325                 case OP_LCONV_TO_R4:
4326                 case OP_LCONV_TO_R8: {
4327                         int tmp;
4328                         if (ins->opcode == OP_ICONV_TO_R4 || ins->opcode == OP_ICONV_TO_R8) {
4329                                 ppc_extsw (code, ppc_r0, ins->sreg1);
4330                                 tmp = ppc_r0;
4331                         } else {
4332                                 tmp = ins->sreg1;
4333                         }
4334                         if (cpu_hw_caps & PPC_MOVE_FPR_GPR) {
4335                                 ppc_mffgpr (code, ins->dreg, tmp);
4336                         } else {
4337                                 ppc_str (code, tmp, -8, ppc_r1);
4338                                 ppc_lfd (code, ins->dreg, -8, ppc_r1);
4339                         }
4340                         ppc_fcfid (code, ins->dreg, ins->dreg);
4341                         if (ins->opcode == OP_ICONV_TO_R4 || ins->opcode == OP_LCONV_TO_R4)
4342                                 ppc_frsp (code, ins->dreg, ins->dreg);
4343                         break;
4344                 }
4345                 case OP_LSHR:
4346                         ppc_srad (code, ins->dreg, ins->sreg1, ins->sreg2);
4347                         break;
4348                 case OP_LSHR_UN:
4349                         ppc_srd (code, ins->dreg, ins->sreg1, ins->sreg2);
4350                         break;
4351                 case OP_COND_EXC_C:
4352                         /* check XER [0-3] (SO, OV, CA): we can't use mcrxr
4353                          */
4354                         ppc_mfspr (code, ppc_r0, ppc_xer);
4355                         ppc_andisd (code, ppc_r0, ppc_r0, (1 << 13)); /* CA */
4356                         EMIT_COND_SYSTEM_EXCEPTION_FLAGS (PPC_BR_FALSE, PPC_BR_EQ, ins->inst_p1);
4357                         break;
4358                 case OP_COND_EXC_OV:
4359                         ppc_mfspr (code, ppc_r0, ppc_xer);
4360                         ppc_andisd (code, ppc_r0, ppc_r0, (1 << 14)); /* OV */
4361                         EMIT_COND_SYSTEM_EXCEPTION_FLAGS (PPC_BR_FALSE, PPC_BR_EQ, ins->inst_p1);
4362                         break;
4363                 case OP_LBEQ:
4364                 case OP_LBNE_UN:
4365                 case OP_LBLT:
4366                 case OP_LBLT_UN:
4367                 case OP_LBGT:
4368                 case OP_LBGT_UN:
4369                 case OP_LBGE:
4370                 case OP_LBGE_UN:
4371                 case OP_LBLE:
4372                 case OP_LBLE_UN:
4373                         EMIT_COND_BRANCH (ins, ins->opcode - OP_LBEQ);
4374                         break;
4375                 case OP_FCONV_TO_I8:
4376                         code = emit_float_to_int (cfg, code, ins->dreg, ins->sreg1, 8, TRUE);
4377                         break;
4378                 case OP_FCONV_TO_U8:
4379                         code = emit_float_to_int (cfg, code, ins->dreg, ins->sreg1, 8, FALSE);
4380                         break;
4381                 case OP_STOREI4_MEMBASE_REG:
4382                         if (ppc_is_imm16 (ins->inst_offset)) {
4383                                 ppc_stw (code, ins->sreg1, ins->inst_offset, ins->inst_destbasereg);
4384                         } else {
4385                                 ppc_load (code, ppc_r0, ins->inst_offset);
4386                                 ppc_stwx (code, ins->sreg1, ins->inst_destbasereg, ppc_r0);
4387                         }
4388                         break;
4389                 case OP_STOREI4_MEMINDEX:
4390                         ppc_stwx (code, ins->sreg1, ins->sreg2, ins->inst_destbasereg);
4391                         break;
4392                 case OP_ISHR_IMM:
4393                         ppc_srawi (code, ins->dreg, ins->sreg1, (ins->inst_imm & 0x1f));
4394                         break;
4395                 case OP_ISHR_UN_IMM:
4396                         if (ins->inst_imm & 0x1f)
4397                                 ppc_srwi (code, ins->dreg, ins->sreg1, (ins->inst_imm & 0x1f));
4398                         else
4399                                 ppc_mr (code, ins->dreg, ins->sreg1);
4400                         break;
4401                 case OP_ATOMIC_ADD_I4:
4402                 CASE_PPC64 (OP_ATOMIC_ADD_I8) {
4403                         int location = ins->inst_basereg;
4404                         int addend = ins->sreg2;
4405                         guint8 *loop, *branch;
4406                         g_assert (ins->inst_offset == 0);
4407
4408                         loop = code;
4409                         ppc_sync (code);
4410                         if (ins->opcode == OP_ATOMIC_ADD_I4)
4411                                 ppc_lwarx (code, ppc_r0, 0, location);
4412 #ifdef __mono_ppc64__
4413                         else
4414                                 ppc_ldarx (code, ppc_r0, 0, location);
4415 #endif
4416
4417                         ppc_add (code, ppc_r0, ppc_r0, addend);
4418
4419                         if (ins->opcode == OP_ATOMIC_ADD_I4)
4420                                 ppc_stwcxd (code, ppc_r0, 0, location);
4421 #ifdef __mono_ppc64__
4422                         else
4423                                 ppc_stdcxd (code, ppc_r0, 0, location);
4424 #endif
4425
4426                         branch = code;
4427                         ppc_bc (code, PPC_BR_FALSE, PPC_BR_EQ, 0);
4428                         ppc_patch (branch, loop);
4429
4430                         ppc_sync (code);
4431                         ppc_mr (code, ins->dreg, ppc_r0);
4432                         break;
4433                 }
4434 #else
4435                 case OP_ICONV_TO_R4:
4436                 case OP_ICONV_TO_R8: {
4437                         if (cpu_hw_caps & PPC_ISA_64) {
4438                                 ppc_srawi(code, ppc_r0, ins->sreg1, 31);
4439                                 ppc_stw (code, ppc_r0, -8, ppc_r1);
4440                                 ppc_stw (code, ins->sreg1, -4, ppc_r1);
4441                                 ppc_lfd (code, ins->dreg, -8, ppc_r1);
4442                                 ppc_fcfid (code, ins->dreg, ins->dreg);
4443                                 if (ins->opcode == OP_ICONV_TO_R4)
4444                                         ppc_frsp (code, ins->dreg, ins->dreg);
4445                                 }
4446                         break;
4447                 }
4448 #endif
4449                 case OP_ATOMIC_CAS_I4:
4450                 CASE_PPC64 (OP_ATOMIC_CAS_I8) {
4451                         int location = ins->sreg1;
4452                         int value = ins->sreg2;
4453                         int comparand = ins->sreg3;
4454                         guint8 *start, *not_equal, *lost_reservation;
4455
4456                         start = code;
4457                         ppc_sync (code);
4458                         if (ins->opcode == OP_ATOMIC_CAS_I4)
4459                                 ppc_lwarx (code, ppc_r0, 0, location);
4460 #ifdef __mono_ppc64__
4461                         else
4462                                 ppc_ldarx (code, ppc_r0, 0, location);
4463 #endif
4464
4465                         ppc_cmp (code, 0, ins->opcode == OP_ATOMIC_CAS_I4 ? 0 : 1, ppc_r0, comparand);
4466                         not_equal = code;
4467                         ppc_bc (code, PPC_BR_FALSE, PPC_BR_EQ, 0);
4468
4469                         if (ins->opcode == OP_ATOMIC_CAS_I4)
4470                                 ppc_stwcxd (code, value, 0, location);
4471 #ifdef __mono_ppc64__
4472                         else
4473                                 ppc_stdcxd (code, value, 0, location);
4474 #endif
4475
4476                         lost_reservation = code;
4477                         ppc_bc (code, PPC_BR_FALSE, PPC_BR_EQ, 0);
4478                         ppc_patch (lost_reservation, start);
4479                         ppc_patch (not_equal, code);
4480
4481                         ppc_sync (code);
4482                         ppc_mr (code, ins->dreg, ppc_r0);
4483                         break;
4484                 }
4485
4486                 default:
4487                         g_warning ("unknown opcode %s in %s()\n", mono_inst_name (ins->opcode), __FUNCTION__);
4488                         g_assert_not_reached ();
4489                 }
4490
4491                 if ((cfg->opt & MONO_OPT_BRANCH) && ((code - cfg->native_code - offset) > max_len)) {
4492                         g_warning ("wrong maximal instruction length of instruction %s (expected %d, got %ld)",
4493                                    mono_inst_name (ins->opcode), max_len, (glong)(code - cfg->native_code - offset));
4494                         g_assert_not_reached ();
4495                 }
4496                
4497                 cpos += max_len;
4498
4499                 last_ins = ins;
4500                 last_offset = offset;
4501         }
4502
4503         cfg->code_len = code - cfg->native_code;
4504 }
4505 #endif /* !DISABLE_JIT */
4506
4507 void
4508 mono_arch_register_lowlevel_calls (void)
4509 {
4510         /* The signature doesn't matter */
4511         mono_register_jit_icall (mono_ppc_throw_exception, "mono_ppc_throw_exception", mono_create_icall_signature ("void"), TRUE);
4512 }
4513
4514 #ifdef __mono_ppc64__
4515 #define patch_load_sequence(ip,val) do {\
4516                 guint16 *__load = (guint16*)(ip);       \
4517                 g_assert (sizeof (val) == sizeof (gsize)); \
4518                 __load [1] = (((guint64)(gsize)(val)) >> 48) & 0xffff;  \
4519                 __load [3] = (((guint64)(gsize)(val)) >> 32) & 0xffff;  \
4520                 __load [7] = (((guint64)(gsize)(val)) >> 16) & 0xffff;  \
4521                 __load [9] =  ((guint64)(gsize)(val))        & 0xffff;  \
4522         } while (0)
4523 #else
4524 #define patch_load_sequence(ip,val) do {\
4525                 guint16 *__lis_ori = (guint16*)(ip);    \
4526                 __lis_ori [1] = (((gulong)(val)) >> 16) & 0xffff;       \
4527                 __lis_ori [3] = ((gulong)(val)) & 0xffff;       \
4528         } while (0)
4529 #endif
4530
4531 #ifndef DISABLE_JIT
4532 void
4533 mono_arch_patch_code (MonoMethod *method, MonoDomain *domain, guint8 *code, MonoJumpInfo *ji, MonoCodeManager *dyn_code_mp, gboolean run_cctors)
4534 {
4535         MonoJumpInfo *patch_info;
4536         gboolean compile_aot = !run_cctors;
4537
4538         for (patch_info = ji; patch_info; patch_info = patch_info->next) {
4539                 unsigned char *ip = patch_info->ip.i + code;
4540                 unsigned char *target;
4541                 gboolean is_fd = FALSE;
4542
4543                 target = mono_resolve_patch_target (method, domain, code, patch_info, run_cctors);
4544
4545                 if (compile_aot) {
4546                         switch (patch_info->type) {
4547                         case MONO_PATCH_INFO_BB:
4548                         case MONO_PATCH_INFO_LABEL:
4549                                 break;
4550                         default:
4551                                 /* No need to patch these */
4552                                 continue;
4553                         }
4554                 }
4555
4556                 switch (patch_info->type) {
4557                 case MONO_PATCH_INFO_IP:
4558                         patch_load_sequence (ip, ip);
4559                         continue;
4560                 case MONO_PATCH_INFO_METHOD_REL:
4561                         g_assert_not_reached ();
4562                         *((gpointer *)(ip)) = code + patch_info->data.offset;
4563                         continue;
4564                 case MONO_PATCH_INFO_SWITCH: {
4565                         gpointer *table = (gpointer *)patch_info->data.table->table;
4566                         int i;
4567
4568                         patch_load_sequence (ip, table);
4569
4570                         for (i = 0; i < patch_info->data.table->table_size; i++) {
4571                                 table [i] = (glong)patch_info->data.table->table [i] + code;
4572                         }
4573                         /* we put into the table the absolute address, no need for ppc_patch in this case */
4574                         continue;
4575                 }
4576                 case MONO_PATCH_INFO_METHODCONST:
4577                 case MONO_PATCH_INFO_CLASS:
4578                 case MONO_PATCH_INFO_IMAGE:
4579                 case MONO_PATCH_INFO_FIELD:
4580                 case MONO_PATCH_INFO_VTABLE:
4581                 case MONO_PATCH_INFO_IID:
4582                 case MONO_PATCH_INFO_SFLDA:
4583                 case MONO_PATCH_INFO_LDSTR:
4584                 case MONO_PATCH_INFO_TYPE_FROM_HANDLE:
4585                 case MONO_PATCH_INFO_LDTOKEN:
4586                         /* from OP_AOTCONST : lis + ori */
4587                         patch_load_sequence (ip, target);
4588                         continue;
4589                 case MONO_PATCH_INFO_R4:
4590                 case MONO_PATCH_INFO_R8:
4591                         g_assert_not_reached ();
4592                         *((gconstpointer *)(ip + 2)) = patch_info->data.target;
4593                         continue;
4594                 case MONO_PATCH_INFO_EXC_NAME:
4595                         g_assert_not_reached ();
4596                         *((gconstpointer *)(ip + 1)) = patch_info->data.name;
4597                         continue;
4598                 case MONO_PATCH_INFO_NONE:
4599                 case MONO_PATCH_INFO_BB_OVF:
4600                 case MONO_PATCH_INFO_EXC_OVF:
4601                         /* everything is dealt with at epilog output time */
4602                         continue;
4603 #ifdef PPC_USES_FUNCTION_DESCRIPTOR
4604                 case MONO_PATCH_INFO_INTERNAL_METHOD:
4605                 case MONO_PATCH_INFO_ABS:
4606                 case MONO_PATCH_INFO_CLASS_INIT:
4607                 case MONO_PATCH_INFO_RGCTX_FETCH:
4608                 case MONO_PATCH_INFO_JIT_ICALL_ADDR:
4609                         is_fd = TRUE;
4610                         break;
4611 #endif
4612                 default:
4613                         break;
4614                 }
4615                 ppc_patch_full (ip, target, is_fd);
4616         }
4617 }
4618
4619 /*
4620  * Emit code to save the registers in used_int_regs or the registers in the MonoLMF
4621  * structure at positive offset pos from register base_reg. pos is guaranteed to fit into
4622  * the instruction offset immediate for all the registers.
4623  */
4624 static guint8*
4625 save_registers (MonoCompile *cfg, guint8* code, int pos, int base_reg, gboolean save_lmf, guint32 used_int_regs, int cfa_offset)
4626 {
4627         int i;
4628         if (!save_lmf) {
4629                 for (i = 13; i <= 31; i++) {
4630                         if (used_int_regs & (1 << i)) {
4631                                 ppc_str (code, i, pos, base_reg);
4632                                 mono_emit_unwind_op_offset (cfg, code, i, pos - cfa_offset);
4633                                 pos += sizeof (mgreg_t);
4634                         }
4635                 }
4636         } else {
4637                 /* pos is the start of the MonoLMF structure */
4638                 int offset = pos + G_STRUCT_OFFSET (MonoLMF, iregs);
4639                 for (i = 13; i <= 31; i++) {
4640                         ppc_str (code, i, offset, base_reg);
4641                         mono_emit_unwind_op_offset (cfg, code, i, offset - cfa_offset);
4642                         offset += sizeof (mgreg_t);
4643                 }
4644                 offset = pos + G_STRUCT_OFFSET (MonoLMF, fregs);
4645                 for (i = 14; i < 32; i++) {
4646                         ppc_stfd (code, i, offset, base_reg);
4647                         offset += sizeof (gdouble);
4648                 }
4649         }
4650         return code;
4651 }
4652
4653 /*
4654  * Stack frame layout:
4655  * 
4656  *   ------------------- sp
4657  *      MonoLMF structure or saved registers
4658  *   -------------------
4659  *      spilled regs
4660  *   -------------------
4661  *      locals
4662  *   -------------------
4663  *      optional 8 bytes for tracing
4664  *   -------------------
4665  *      param area             size is cfg->param_area
4666  *   -------------------
4667  *      linkage area           size is PPC_STACK_PARAM_OFFSET
4668  *   ------------------- sp
4669  *      red zone
4670  */
4671 guint8 *
4672 mono_arch_emit_prolog (MonoCompile *cfg)
4673 {
4674         MonoMethod *method = cfg->method;
4675         MonoBasicBlock *bb;
4676         MonoMethodSignature *sig;
4677         MonoInst *inst;
4678         long alloc_size, pos, max_offset, cfa_offset;
4679         int i;
4680         guint8 *code;
4681         CallInfo *cinfo;
4682         int tracing = 0;
4683         int lmf_offset = 0;
4684         int tailcall_struct_index;
4685
4686         if (mono_jit_trace_calls != NULL && mono_trace_eval (method))
4687                 tracing = 1;
4688
4689         sig = mono_method_signature (method);
4690         cfg->code_size = 512 + sig->param_count * 32;
4691         code = cfg->native_code = g_malloc (cfg->code_size);
4692
4693         cfa_offset = 0;
4694
4695         /* We currently emit unwind info for aot, but don't use it */
4696         mono_emit_unwind_op_def_cfa (cfg, code, ppc_r1, 0);
4697
4698         if (1 || cfg->flags & MONO_CFG_HAS_CALLS) {
4699                 ppc_mflr (code, ppc_r0);
4700                 ppc_str (code, ppc_r0, PPC_RET_ADDR_OFFSET, ppc_sp);
4701                 mono_emit_unwind_op_offset (cfg, code, ppc_lr, PPC_RET_ADDR_OFFSET);
4702         }
4703
4704         alloc_size = cfg->stack_offset;
4705         pos = 0;
4706
4707         if (!method->save_lmf) {
4708                 for (i = 31; i >= 13; --i) {
4709                         if (cfg->used_int_regs & (1 << i)) {
4710                                 pos += sizeof (mgreg_t);
4711                         }
4712                 }
4713         } else {
4714                 pos += sizeof (MonoLMF);
4715                 lmf_offset = pos;
4716         }
4717         alloc_size += pos;
4718         // align to MONO_ARCH_FRAME_ALIGNMENT bytes
4719         if (alloc_size & (MONO_ARCH_FRAME_ALIGNMENT - 1)) {
4720                 alloc_size += MONO_ARCH_FRAME_ALIGNMENT - 1;
4721                 alloc_size &= ~(MONO_ARCH_FRAME_ALIGNMENT - 1);
4722         }
4723
4724         cfg->stack_usage = alloc_size;
4725         g_assert ((alloc_size & (MONO_ARCH_FRAME_ALIGNMENT-1)) == 0);
4726         if (alloc_size) {
4727                 if (ppc_is_imm16 (-alloc_size)) {
4728                         ppc_str_update (code, ppc_sp, -alloc_size, ppc_sp);
4729                         cfa_offset = alloc_size;
4730                         mono_emit_unwind_op_def_cfa_offset (cfg, code, alloc_size);
4731                         code = save_registers (cfg, code, alloc_size - pos, ppc_sp, method->save_lmf, cfg->used_int_regs, cfa_offset);
4732                 } else {
4733                         if (pos)
4734                                 ppc_addi (code, ppc_r11, ppc_sp, -pos);
4735                         ppc_load (code, ppc_r0, -alloc_size);
4736                         ppc_str_update_indexed (code, ppc_sp, ppc_sp, ppc_r0);
4737                         cfa_offset = alloc_size;
4738                         mono_emit_unwind_op_def_cfa_offset (cfg, code, alloc_size);
4739                         code = save_registers (cfg, code, 0, ppc_r11, method->save_lmf, cfg->used_int_regs, cfa_offset);
4740                 }
4741         }
4742         if (cfg->frame_reg != ppc_sp) {
4743                 ppc_mr (code, cfg->frame_reg, ppc_sp);
4744                 mono_emit_unwind_op_def_cfa_reg (cfg, code, cfg->frame_reg);
4745         }
4746
4747         /* store runtime generic context */
4748         if (cfg->rgctx_var) {
4749                 g_assert (cfg->rgctx_var->opcode == OP_REGOFFSET &&
4750                                 (cfg->rgctx_var->inst_basereg == ppc_r1 || cfg->rgctx_var->inst_basereg == ppc_r31));
4751
4752                 ppc_stptr (code, MONO_ARCH_RGCTX_REG, cfg->rgctx_var->inst_offset, cfg->rgctx_var->inst_basereg);
4753         }
4754
4755         /* compute max_offset in order to use short forward jumps
4756          * we always do it on ppc because the immediate displacement
4757          * for jumps is too small 
4758          */
4759         max_offset = 0;
4760         for (bb = cfg->bb_entry; bb; bb = bb->next_bb) {
4761                 MonoInst *ins;
4762                 bb->max_offset = max_offset;
4763
4764                 if (cfg->prof_options & MONO_PROFILE_COVERAGE)
4765                         max_offset += 6; 
4766
4767                 MONO_BB_FOR_EACH_INS (bb, ins)
4768                         max_offset += ins_native_length (cfg, ins);
4769         }
4770
4771         /* load arguments allocated to register from the stack */
4772         pos = 0;
4773
4774         cinfo = get_call_info (cfg->generic_sharing_context, sig);
4775
4776         if (MONO_TYPE_ISSTRUCT (sig->ret)) {
4777                 ArgInfo *ainfo = &cinfo->ret;
4778
4779                 inst = cfg->vret_addr;
4780                 g_assert (inst);
4781
4782                 if (ppc_is_imm16 (inst->inst_offset)) {
4783                         ppc_stptr (code, ainfo->reg, inst->inst_offset, inst->inst_basereg);
4784                 } else {
4785                         ppc_load (code, ppc_r11, inst->inst_offset);
4786                         ppc_stptr_indexed (code, ainfo->reg, ppc_r11, inst->inst_basereg);
4787                 }
4788         }
4789
4790         tailcall_struct_index = 0;
4791         for (i = 0; i < sig->param_count + sig->hasthis; ++i) {
4792                 ArgInfo *ainfo = cinfo->args + i;
4793                 inst = cfg->args [pos];
4794                 
4795                 if (cfg->verbose_level > 2)
4796                         g_print ("Saving argument %d (type: %d)\n", i, ainfo->regtype);
4797                 if (inst->opcode == OP_REGVAR) {
4798                         if (ainfo->regtype == RegTypeGeneral)
4799                                 ppc_mr (code, inst->dreg, ainfo->reg);
4800                         else if (ainfo->regtype == RegTypeFP)
4801                                 ppc_fmr (code, inst->dreg, ainfo->reg);
4802                         else if (ainfo->regtype == RegTypeBase) {
4803                                 ppc_ldr (code, ppc_r11, 0, ppc_sp);
4804                                 ppc_ldptr (code, inst->dreg, ainfo->offset, ppc_r11);
4805                         } else
4806                                 g_assert_not_reached ();
4807
4808                         if (cfg->verbose_level > 2)
4809                                 g_print ("Argument %ld assigned to register %s\n", pos, mono_arch_regname (inst->dreg));
4810                 } else {
4811                         /* the argument should be put on the stack: FIXME handle size != word  */
4812                         if (ainfo->regtype == RegTypeGeneral) {
4813                                 switch (ainfo->size) {
4814                                 case 1:
4815                                         if (ppc_is_imm16 (inst->inst_offset)) {
4816                                                 ppc_stb (code, ainfo->reg, inst->inst_offset, inst->inst_basereg);
4817                                         } else {
4818                                                 if (ppc_is_imm32 (inst->inst_offset)) {
4819                                                         ppc_addis (code, ppc_r11, inst->inst_basereg, ppc_ha(inst->inst_offset));
4820                                                         ppc_stb (code, ainfo->reg, inst->inst_offset, ppc_r11);
4821                                                 } else {
4822                                                         ppc_load (code, ppc_r11, inst->inst_offset);
4823                                                         ppc_stbx (code, ainfo->reg, inst->inst_basereg, ppc_r11);
4824                                                 }
4825                                         }
4826                                         break;
4827                                 case 2:
4828                                         if (ppc_is_imm16 (inst->inst_offset)) {
4829                                                 ppc_sth (code, ainfo->reg, inst->inst_offset, inst->inst_basereg);
4830                                         } else {
4831                                                 if (ppc_is_imm32 (inst->inst_offset)) {
4832                                                         ppc_addis (code, ppc_r11, inst->inst_basereg, ppc_ha(inst->inst_offset));
4833                                                         ppc_sth (code, ainfo->reg, inst->inst_offset, ppc_r11);
4834                                                 } else {
4835                                                         ppc_load (code, ppc_r11, inst->inst_offset);
4836                                                         ppc_sthx (code, ainfo->reg, inst->inst_basereg, ppc_r11);
4837                                                 }
4838                                         }
4839                                         break;
4840 #ifdef __mono_ppc64__
4841                                 case 4:
4842                                         if (ppc_is_imm16 (inst->inst_offset)) {
4843                                                 ppc_stw (code, ainfo->reg, inst->inst_offset, inst->inst_basereg);
4844                                         } else {
4845                                                 if (ppc_is_imm32 (inst->inst_offset)) {
4846                                                         ppc_addis (code, ppc_r11, inst->inst_basereg, ppc_ha(inst->inst_offset));
4847                                                         ppc_stw (code, ainfo->reg, inst->inst_offset, ppc_r11);
4848                                                 } else {
4849                                                         ppc_load (code, ppc_r11, inst->inst_offset);
4850                                                         ppc_stwx (code, ainfo->reg, inst->inst_basereg, ppc_r11);
4851                                                 }
4852                                         }
4853                                         break;
4854                                 case 8:
4855                                         if (ppc_is_imm16 (inst->inst_offset)) {
4856                                                 ppc_str (code, ainfo->reg, inst->inst_offset, inst->inst_basereg);
4857                                         } else {
4858                                                 ppc_load (code, ppc_r11, inst->inst_offset);
4859                                                 ppc_str_indexed (code, ainfo->reg, ppc_r11, inst->inst_basereg);
4860                                         }
4861                                         break;
4862 #else
4863                                 case 8:
4864                                         if (ppc_is_imm16 (inst->inst_offset + 4)) {
4865                                                 ppc_stw (code, ainfo->reg, inst->inst_offset, inst->inst_basereg);
4866                                                 ppc_stw (code, ainfo->reg + 1, inst->inst_offset + 4, inst->inst_basereg);
4867                                         } else {
4868                                                 ppc_addis (code, ppc_r11, inst->inst_basereg, ppc_ha(inst->inst_offset));
4869                                                 ppc_addi (code, ppc_r11, ppc_r11, inst->inst_offset);
4870                                                 ppc_stw (code, ainfo->reg, 0, ppc_r11);
4871                                                 ppc_stw (code, ainfo->reg + 1, 4, ppc_r11);
4872                                         }
4873                                         break;
4874 #endif
4875                                 default:
4876                                         if (ppc_is_imm16 (inst->inst_offset)) {
4877                                                 ppc_stptr (code, ainfo->reg, inst->inst_offset, inst->inst_basereg);
4878                                         } else {
4879                                                 if (ppc_is_imm32 (inst->inst_offset)) {
4880                                                         ppc_addis (code, ppc_r11, inst->inst_basereg, ppc_ha(inst->inst_offset));
4881                                                         ppc_stptr (code, ainfo->reg, inst->inst_offset, ppc_r11);
4882                                                 } else {
4883                                                         ppc_load (code, ppc_r11, inst->inst_offset);
4884                                                         ppc_stptr_indexed (code, ainfo->reg, inst->inst_basereg, ppc_r11);
4885                                                 }
4886                                         }
4887                                         break;
4888                                 }
4889                         } else if (ainfo->regtype == RegTypeBase) {
4890                                 g_assert (ppc_is_imm16 (ainfo->offset));
4891                                 /* load the previous stack pointer in r11 */
4892                                 ppc_ldr (code, ppc_r11, 0, ppc_sp);
4893                                 ppc_ldptr (code, ppc_r0, ainfo->offset, ppc_r11);
4894                                 switch (ainfo->size) {
4895                                 case 1:
4896                                         if (ppc_is_imm16 (inst->inst_offset)) {
4897                                                 ppc_stb (code, ppc_r0, inst->inst_offset, inst->inst_basereg);
4898                                         } else {
4899                                                 if (ppc_is_imm32 (inst->inst_offset)) {
4900                                                         ppc_addis (code, ppc_r11, inst->inst_basereg, ppc_ha(inst->inst_offset));
4901                                                         ppc_stb (code, ppc_r0, inst->inst_offset, ppc_r11);
4902                                                 } else {
4903                                                         ppc_load (code, ppc_r11, inst->inst_offset);
4904                                                         ppc_stbx (code, ppc_r0, inst->inst_basereg, ppc_r11);
4905                                                 }
4906                                         }
4907                                         break;
4908                                 case 2:
4909                                         if (ppc_is_imm16 (inst->inst_offset)) {
4910                                                 ppc_sth (code, ppc_r0, inst->inst_offset, inst->inst_basereg);
4911                                         } else {
4912                                                 if (ppc_is_imm32 (inst->inst_offset)) {
4913                                                         ppc_addis (code, ppc_r11, inst->inst_basereg, ppc_ha(inst->inst_offset));
4914                                                         ppc_sth (code, ppc_r0, inst->inst_offset, ppc_r11);
4915                                                 } else {
4916                                                         ppc_load (code, ppc_r11, inst->inst_offset);
4917                                                         ppc_sthx (code, ppc_r0, inst->inst_basereg, ppc_r11);
4918                                                 }
4919                                         }
4920                                         break;
4921 #ifdef __mono_ppc64__
4922                                 case 4:
4923                                         if (ppc_is_imm16 (inst->inst_offset)) {
4924                                                 ppc_stw (code, ppc_r0, inst->inst_offset, inst->inst_basereg);
4925                                         } else {
4926                                                 if (ppc_is_imm32 (inst->inst_offset)) {
4927                                                         ppc_addis (code, ppc_r11, inst->inst_basereg, ppc_ha(inst->inst_offset));
4928                                                         ppc_stw (code, ppc_r0, inst->inst_offset, ppc_r11);
4929                                                 } else {
4930                                                         ppc_load (code, ppc_r11, inst->inst_offset);
4931                                                         ppc_stwx (code, ppc_r0, inst->inst_basereg, ppc_r11);
4932                                                 }
4933                                         }
4934                                         break;
4935                                 case 8:
4936                                         if (ppc_is_imm16 (inst->inst_offset)) {
4937                                                 ppc_str (code, ppc_r0, inst->inst_offset, inst->inst_basereg);
4938                                         } else {
4939                                                 ppc_load (code, ppc_r11, inst->inst_offset);
4940                                                 ppc_str_indexed (code, ppc_r0, ppc_r11, inst->inst_basereg);
4941                                         }
4942                                         break;
4943 #else
4944                                 case 8:
4945                                         g_assert (ppc_is_imm16 (ainfo->offset + 4));
4946                                         if (ppc_is_imm16 (inst->inst_offset + 4)) {
4947                                                 ppc_stw (code, ppc_r0, inst->inst_offset, inst->inst_basereg);
4948                                                 ppc_lwz (code, ppc_r0, ainfo->offset + 4, ppc_r11);
4949                                                 ppc_stw (code, ppc_r0, inst->inst_offset + 4, inst->inst_basereg);
4950                                         } else {
4951                                                 /* use r12 to load the 2nd half of the long before we clobber r11.  */
4952                                                 ppc_lwz (code, ppc_r12, ainfo->offset + 4, ppc_r11);
4953                                                 ppc_addis (code, ppc_r11, inst->inst_basereg, ppc_ha(inst->inst_offset));
4954                                                 ppc_addi (code, ppc_r11, ppc_r11, inst->inst_offset);
4955                                                 ppc_stw (code, ppc_r0, 0, ppc_r11);
4956                                                 ppc_stw (code, ppc_r12, 4, ppc_r11);
4957                                         }
4958                                         break;
4959 #endif
4960                                 default:
4961                                         if (ppc_is_imm16 (inst->inst_offset)) {
4962                                                 ppc_stptr (code, ppc_r0, inst->inst_offset, inst->inst_basereg);
4963                                         } else {
4964                                                 if (ppc_is_imm32 (inst->inst_offset)) {
4965                                                         ppc_addis (code, ppc_r11, inst->inst_basereg, ppc_ha(inst->inst_offset));
4966                                                         ppc_stptr (code, ppc_r0, inst->inst_offset, ppc_r11);
4967                                                 } else {
4968                                                         ppc_load (code, ppc_r11, inst->inst_offset);
4969                                                         ppc_stptr_indexed (code, ppc_r0, inst->inst_basereg, ppc_r11);
4970                                                 }
4971                                         }
4972                                         break;
4973                                 }
4974                         } else if (ainfo->regtype == RegTypeFP) {
4975                                 g_assert (ppc_is_imm16 (inst->inst_offset));
4976                                 if (ainfo->size == 8)
4977                                         ppc_stfd (code, ainfo->reg, inst->inst_offset, inst->inst_basereg);
4978                                 else if (ainfo->size == 4)
4979                                         ppc_stfs (code, ainfo->reg, inst->inst_offset, inst->inst_basereg);
4980                                 else
4981                                         g_assert_not_reached ();
4982                         } else if (ainfo->regtype == RegTypeStructByVal) {
4983                                 int doffset = inst->inst_offset;
4984                                 int soffset = 0;
4985                                 int cur_reg;
4986                                 int size = 0;
4987                                 g_assert (ppc_is_imm16 (inst->inst_offset));
4988                                 g_assert (ppc_is_imm16 (inst->inst_offset + ainfo->vtregs * sizeof (gpointer)));
4989                                 /* FIXME: what if there is no class? */
4990                                 if (sig->pinvoke && mono_class_from_mono_type (inst->inst_vtype))
4991                                         size = mono_class_native_size (mono_class_from_mono_type (inst->inst_vtype), NULL);
4992                                 for (cur_reg = 0; cur_reg < ainfo->vtregs; ++cur_reg) {
4993 #if __APPLE__
4994                                         /*
4995                                          * Darwin handles 1 and 2 byte
4996                                          * structs specially by
4997                                          * loading h/b into the arg
4998                                          * register.  Only done for
4999                                          * pinvokes.
5000                                          */
5001                                         if (size == 2)
5002                                                 ppc_sth (code, ainfo->reg + cur_reg, doffset, inst->inst_basereg);
5003                                         else if (size == 1)
5004                                                 ppc_stb (code, ainfo->reg + cur_reg, doffset, inst->inst_basereg);
5005                                         else
5006 #endif
5007                                         {
5008 #ifdef __mono_ppc64__
5009                                                 if (ainfo->bytes) {
5010                                                         g_assert (cur_reg == 0);
5011                                                         ppc_sldi (code, ppc_r0, ainfo->reg,
5012                                                                         (sizeof (gpointer) - ainfo->bytes) * 8);
5013                                                         ppc_stptr (code, ppc_r0, doffset, inst->inst_basereg);
5014                                                 } else
5015 #endif
5016                                                 {
5017                                                         ppc_stptr (code, ainfo->reg + cur_reg, doffset,
5018                                                                         inst->inst_basereg);
5019                                                 }
5020                                         }
5021                                         soffset += sizeof (gpointer);
5022                                         doffset += sizeof (gpointer);
5023                                 }
5024                                 if (ainfo->vtsize) {
5025                                         /* FIXME: we need to do the shifting here, too */
5026                                         if (ainfo->bytes)
5027                                                 NOT_IMPLEMENTED;
5028                                         /* load the previous stack pointer in r11 (r0 gets overwritten by the memcpy) */
5029                                         ppc_ldr (code, ppc_r11, 0, ppc_sp);
5030                                         if ((size & MONO_PPC_32_64_CASE (3, 7)) != 0) {
5031                                                 code = emit_memcpy (code, size - soffset,
5032                                                         inst->inst_basereg, doffset,
5033                                                         ppc_r11, ainfo->offset + soffset);
5034                                         } else {
5035                                                 code = emit_memcpy (code, ainfo->vtsize * sizeof (gpointer),
5036                                                         inst->inst_basereg, doffset,
5037                                                         ppc_r11, ainfo->offset + soffset);
5038                                         }
5039                                 }
5040                         } else if (ainfo->regtype == RegTypeStructByAddr) {
5041                                 /* if it was originally a RegTypeBase */
5042                                 if (ainfo->offset) {
5043                                         /* load the previous stack pointer in r11 */
5044                                         ppc_ldr (code, ppc_r11, 0, ppc_sp);
5045                                         ppc_ldptr (code, ppc_r11, ainfo->offset, ppc_r11);
5046                                 } else {
5047                                         ppc_mr (code, ppc_r11, ainfo->reg);
5048                                 }
5049
5050                                 if (cfg->tailcall_valuetype_addrs) {
5051                                         MonoInst *addr = cfg->tailcall_valuetype_addrs [tailcall_struct_index];
5052
5053                                         g_assert (ppc_is_imm16 (addr->inst_offset));
5054                                         ppc_stptr (code, ppc_r11, addr->inst_offset, addr->inst_basereg);
5055
5056                                         tailcall_struct_index++;
5057                                 }
5058
5059                                 g_assert (ppc_is_imm16 (inst->inst_offset));
5060                                 code = emit_memcpy (code, ainfo->vtsize, inst->inst_basereg, inst->inst_offset, ppc_r11, 0);
5061                                 /*g_print ("copy in %s: %d bytes from %d to offset: %d\n", method->name, ainfo->vtsize, ainfo->reg, inst->inst_offset);*/
5062                         } else
5063                                 g_assert_not_reached ();
5064                 }
5065                 pos++;
5066         }
5067
5068         if (method->save_lmf) {
5069                 if (lmf_pthread_key != -1) {
5070                         emit_tls_access (code, ppc_r3, lmf_pthread_key);
5071                         if (tls_mode != TLS_MODE_NPTL && G_STRUCT_OFFSET (MonoJitTlsData, lmf))
5072                                 ppc_addi (code, ppc_r3, ppc_r3, G_STRUCT_OFFSET (MonoJitTlsData, lmf));
5073                 } else {
5074                         if (cfg->compile_aot) {
5075                                 /* Compute the got address which is needed by the PLT entry */
5076                                 code = mono_arch_emit_load_got_addr (cfg->native_code, code, cfg, NULL);
5077                         }
5078                         mono_add_patch_info (cfg, code - cfg->native_code, MONO_PATCH_INFO_INTERNAL_METHOD, 
5079                                      (gpointer)"mono_get_lmf_addr");
5080                         if ((FORCE_INDIR_CALL || cfg->method->dynamic) && !cfg->compile_aot) {
5081                                 ppc_load_func (code, ppc_r0, 0);
5082                                 ppc_mtlr (code, ppc_r0);
5083                                 ppc_blrl (code);
5084                         } else {
5085                                 ppc_bl (code, 0);
5086                         }
5087                 }
5088                 /* we build the MonoLMF structure on the stack - see mini-ppc.h */
5089                 /* lmf_offset is the offset from the previous stack pointer,
5090                  * alloc_size is the total stack space allocated, so the offset
5091                  * of MonoLMF from the current stack ptr is alloc_size - lmf_offset.
5092                  * The pointer to the struct is put in ppc_r11 (new_lmf).
5093                  * The callee-saved registers are already in the MonoLMF structure
5094                  */
5095                 ppc_addi (code, ppc_r11, ppc_sp, alloc_size - lmf_offset);
5096                 /* ppc_r3 is the result from mono_get_lmf_addr () */
5097                 ppc_stptr (code, ppc_r3, G_STRUCT_OFFSET(MonoLMF, lmf_addr), ppc_r11);
5098                 /* new_lmf->previous_lmf = *lmf_addr */
5099                 ppc_ldptr (code, ppc_r0, G_STRUCT_OFFSET(MonoLMF, previous_lmf), ppc_r3);
5100                 ppc_stptr (code, ppc_r0, G_STRUCT_OFFSET(MonoLMF, previous_lmf), ppc_r11);
5101                 /* *(lmf_addr) = r11 */
5102                 ppc_stptr (code, ppc_r11, G_STRUCT_OFFSET(MonoLMF, previous_lmf), ppc_r3);
5103                 /* save method info */
5104                 if (cfg->compile_aot)
5105                         // FIXME:
5106                         ppc_load (code, ppc_r0, 0);
5107                 else
5108                         ppc_load_ptr (code, ppc_r0, method);
5109                 ppc_stptr (code, ppc_r0, G_STRUCT_OFFSET(MonoLMF, method), ppc_r11);
5110                 ppc_stptr (code, ppc_sp, G_STRUCT_OFFSET(MonoLMF, ebp), ppc_r11);
5111                 /* save the current IP */
5112                 if (cfg->compile_aot) {
5113                         ppc_bl (code, 1);
5114                         ppc_mflr (code, ppc_r0);
5115                 } else {
5116                         mono_add_patch_info (cfg, code - cfg->native_code, MONO_PATCH_INFO_IP, NULL);
5117 #ifdef __mono_ppc64__
5118                         ppc_load_sequence (code, ppc_r0, (guint64)0x0101010101010101LL);
5119 #else
5120                         ppc_load_sequence (code, ppc_r0, (gulong)0x01010101L);
5121 #endif
5122                 }
5123                 ppc_stptr (code, ppc_r0, G_STRUCT_OFFSET(MonoLMF, eip), ppc_r11);
5124         }
5125
5126         if (tracing)
5127                 code = mono_arch_instrument_prolog (cfg, mono_trace_enter_method, code, TRUE);
5128
5129         cfg->code_len = code - cfg->native_code;
5130         g_assert (cfg->code_len <= cfg->code_size);
5131         g_free (cinfo);
5132
5133         return code;
5134 }
5135
5136 void
5137 mono_arch_emit_epilog (MonoCompile *cfg)
5138 {
5139         MonoMethod *method = cfg->method;
5140         int pos, i;
5141         int max_epilog_size = 16 + 20*4;
5142         guint8 *code;
5143
5144         if (cfg->method->save_lmf)
5145                 max_epilog_size += 128;
5146         
5147         if (mono_jit_trace_calls != NULL)
5148                 max_epilog_size += 50;
5149
5150         if (cfg->prof_options & MONO_PROFILE_ENTER_LEAVE)
5151                 max_epilog_size += 50;
5152
5153         while (cfg->code_len + max_epilog_size > (cfg->code_size - 16)) {
5154                 cfg->code_size *= 2;
5155                 cfg->native_code = g_realloc (cfg->native_code, cfg->code_size);
5156                 cfg->stat_code_reallocs++;
5157         }
5158
5159         /*
5160          * Keep in sync with OP_JMP
5161          */
5162         code = cfg->native_code + cfg->code_len;
5163
5164         if (mono_jit_trace_calls != NULL && mono_trace_eval (method)) {
5165                 code = mono_arch_instrument_epilog (cfg, mono_trace_leave_method, code, TRUE);
5166         }
5167         pos = 0;
5168
5169         if (method->save_lmf) {
5170                 int lmf_offset;
5171                 pos +=  sizeof (MonoLMF);
5172                 lmf_offset = pos;
5173                 /* save the frame reg in r8 */
5174                 ppc_mr (code, ppc_r8, cfg->frame_reg);
5175                 ppc_addi (code, ppc_r11, cfg->frame_reg, cfg->stack_usage - lmf_offset);
5176                 /* r5 = previous_lmf */
5177                 ppc_ldptr (code, ppc_r5, G_STRUCT_OFFSET(MonoLMF, previous_lmf), ppc_r11);
5178                 /* r6 = lmf_addr */
5179                 ppc_ldptr (code, ppc_r6, G_STRUCT_OFFSET(MonoLMF, lmf_addr), ppc_r11);
5180                 /* *(lmf_addr) = previous_lmf */
5181                 ppc_stptr (code, ppc_r5, G_STRUCT_OFFSET(MonoLMF, previous_lmf), ppc_r6);
5182                 /* FIXME: speedup: there is no actual need to restore the registers if
5183                  * we didn't actually change them (idea from Zoltan).
5184                  */
5185                 /* restore iregs */
5186                 ppc_ldr_multiple (code, ppc_r13, G_STRUCT_OFFSET(MonoLMF, iregs), ppc_r11);
5187                 /* restore fregs */
5188                 /*for (i = 14; i < 32; i++) {
5189                         ppc_lfd (code, i, G_STRUCT_OFFSET(MonoLMF, fregs) + ((i-14) * sizeof (gdouble)), ppc_r11);
5190                 }*/
5191                 g_assert (ppc_is_imm16 (cfg->stack_usage + PPC_RET_ADDR_OFFSET));
5192                 /* use the saved copy of the frame reg in r8 */
5193                 if (1 || cfg->flags & MONO_CFG_HAS_CALLS) {
5194                         ppc_ldr (code, ppc_r0, cfg->stack_usage + PPC_RET_ADDR_OFFSET, ppc_r8);
5195                         ppc_mtlr (code, ppc_r0);
5196                 }
5197                 ppc_addic (code, ppc_sp, ppc_r8, cfg->stack_usage);
5198         } else {
5199                 if (1 || cfg->flags & MONO_CFG_HAS_CALLS) {
5200                         long return_offset = cfg->stack_usage + PPC_RET_ADDR_OFFSET;
5201                         if (ppc_is_imm16 (return_offset)) {
5202                                 ppc_ldr (code, ppc_r0, return_offset, cfg->frame_reg);
5203                         } else {
5204                                 ppc_load (code, ppc_r11, return_offset);
5205                                 ppc_ldr_indexed (code, ppc_r0, cfg->frame_reg, ppc_r11);
5206                         }
5207                         ppc_mtlr (code, ppc_r0);
5208                 }
5209                 if (ppc_is_imm16 (cfg->stack_usage)) {
5210                         int offset = cfg->stack_usage;
5211                         for (i = 13; i <= 31; i++) {
5212                                 if (cfg->used_int_regs & (1 << i))
5213                                         offset -= sizeof (mgreg_t);
5214                         }
5215                         if (cfg->frame_reg != ppc_sp)
5216                                 ppc_mr (code, ppc_r11, cfg->frame_reg);
5217                         /* note r31 (possibly the frame register) is restored last */
5218                         for (i = 13; i <= 31; i++) {
5219                                 if (cfg->used_int_regs & (1 << i)) {
5220                                         ppc_ldr (code, i, offset, cfg->frame_reg);
5221                                         offset += sizeof (mgreg_t);
5222                                 }
5223                         }
5224                         if (cfg->frame_reg != ppc_sp)
5225                                 ppc_addi (code, ppc_sp, ppc_r11, cfg->stack_usage);
5226                         else
5227                                 ppc_addi (code, ppc_sp, ppc_sp, cfg->stack_usage);
5228                 } else {
5229                         ppc_load32 (code, ppc_r11, cfg->stack_usage);
5230                         if (cfg->used_int_regs) {
5231                                 ppc_add (code, ppc_r11, cfg->frame_reg, ppc_r11);
5232                                 for (i = 31; i >= 13; --i) {
5233                                         if (cfg->used_int_regs & (1 << i)) {
5234                                                 pos += sizeof (mgreg_t);
5235                                                 ppc_ldr (code, i, -pos, ppc_r11);
5236                                         }
5237                                 }
5238                                 ppc_mr (code, ppc_sp, ppc_r11);
5239                         } else {
5240                                 ppc_add (code, ppc_sp, cfg->frame_reg, ppc_r11);
5241                         }
5242                 }
5243
5244         }
5245         ppc_blr (code);
5246
5247         cfg->code_len = code - cfg->native_code;
5248
5249         g_assert (cfg->code_len < cfg->code_size);
5250
5251 }
5252 #endif /* ifndef DISABLE_JIT */
5253
5254 /* remove once throw_exception_by_name is eliminated */
5255 static int
5256 exception_id_by_name (const char *name)
5257 {
5258         if (strcmp (name, "IndexOutOfRangeException") == 0)
5259                 return MONO_EXC_INDEX_OUT_OF_RANGE;
5260         if (strcmp (name, "OverflowException") == 0)
5261                 return MONO_EXC_OVERFLOW;
5262         if (strcmp (name, "ArithmeticException") == 0)
5263                 return MONO_EXC_ARITHMETIC;
5264         if (strcmp (name, "DivideByZeroException") == 0)
5265                 return MONO_EXC_DIVIDE_BY_ZERO;
5266         if (strcmp (name, "InvalidCastException") == 0)
5267                 return MONO_EXC_INVALID_CAST;
5268         if (strcmp (name, "NullReferenceException") == 0)
5269                 return MONO_EXC_NULL_REF;
5270         if (strcmp (name, "ArrayTypeMismatchException") == 0)
5271                 return MONO_EXC_ARRAY_TYPE_MISMATCH;
5272         if (strcmp (name, "ArgumentException") == 0)
5273                 return MONO_EXC_ARGUMENT;
5274         g_error ("Unknown intrinsic exception %s\n", name);
5275         return 0;
5276 }
5277
5278 #ifndef DISABLE_JIT
5279 void
5280 mono_arch_emit_exceptions (MonoCompile *cfg)
5281 {
5282         MonoJumpInfo *patch_info;
5283         int i;
5284         guint8 *code;
5285         guint8* exc_throw_pos [MONO_EXC_INTRINS_NUM];
5286         guint8 exc_throw_found [MONO_EXC_INTRINS_NUM];
5287         int max_epilog_size = 50;
5288
5289         for (i = 0; i < MONO_EXC_INTRINS_NUM; i++) {
5290                 exc_throw_pos [i] = NULL;
5291                 exc_throw_found [i] = 0;
5292         }
5293
5294         /* count the number of exception infos */
5295      
5296         /* 
5297          * make sure we have enough space for exceptions
5298          */
5299         for (patch_info = cfg->patch_info; patch_info; patch_info = patch_info->next) {
5300                 if (patch_info->type == MONO_PATCH_INFO_EXC) {
5301                         i = exception_id_by_name (patch_info->data.target);
5302                         if (!exc_throw_found [i]) {
5303                                 max_epilog_size += (2 * PPC_LOAD_SEQUENCE_LENGTH) + 5 * 4;
5304                                 exc_throw_found [i] = TRUE;
5305                         }
5306                 } else if (patch_info->type == MONO_PATCH_INFO_BB_OVF)
5307                         max_epilog_size += 12;
5308                 else if (patch_info->type == MONO_PATCH_INFO_EXC_OVF) {
5309                         MonoOvfJump *ovfj = (MonoOvfJump*)patch_info->data.target;
5310                         i = exception_id_by_name (ovfj->data.exception);
5311                         if (!exc_throw_found [i]) {
5312                                 max_epilog_size += (2 * PPC_LOAD_SEQUENCE_LENGTH) + 5 * 4;
5313                                 exc_throw_found [i] = TRUE;
5314                         }
5315                         max_epilog_size += 8;
5316                 }
5317         }
5318
5319         while (cfg->code_len + max_epilog_size > (cfg->code_size - 16)) {
5320                 cfg->code_size *= 2;
5321                 cfg->native_code = g_realloc (cfg->native_code, cfg->code_size);
5322                 cfg->stat_code_reallocs++;
5323         }
5324
5325         code = cfg->native_code + cfg->code_len;
5326
5327         /* add code to raise exceptions */
5328         for (patch_info = cfg->patch_info; patch_info; patch_info = patch_info->next) {
5329                 switch (patch_info->type) {
5330                 case MONO_PATCH_INFO_BB_OVF: {
5331                         MonoOvfJump *ovfj = (MonoOvfJump*)patch_info->data.target;
5332                         unsigned char *ip = patch_info->ip.i + cfg->native_code;
5333                         /* patch the initial jump */
5334                         ppc_patch (ip, code);
5335                         ppc_bc (code, ovfj->b0_cond, ovfj->b1_cond, 2);
5336                         ppc_b (code, 0);
5337                         ppc_patch (code - 4, ip + 4); /* jump back after the initiali branch */
5338                         /* jump back to the true target */
5339                         ppc_b (code, 0);
5340                         ip = ovfj->data.bb->native_offset + cfg->native_code;
5341                         ppc_patch (code - 4, ip);
5342                         patch_info->type = MONO_PATCH_INFO_NONE;
5343                         break;
5344                 }
5345                 case MONO_PATCH_INFO_EXC_OVF: {
5346                         MonoOvfJump *ovfj = (MonoOvfJump*)patch_info->data.target;
5347                         MonoJumpInfo *newji;
5348                         unsigned char *ip = patch_info->ip.i + cfg->native_code;
5349                         unsigned char *bcl = code;
5350                         /* patch the initial jump: we arrived here with a call */
5351                         ppc_patch (ip, code);
5352                         ppc_bc (code, ovfj->b0_cond, ovfj->b1_cond, 0);
5353                         ppc_b (code, 0);
5354                         ppc_patch (code - 4, ip + 4); /* jump back after the initiali branch */
5355                         /* patch the conditional jump to the right handler */
5356                         /* make it processed next */
5357                         newji = mono_mempool_alloc (cfg->mempool, sizeof (MonoJumpInfo));
5358                         newji->type = MONO_PATCH_INFO_EXC;
5359                         newji->ip.i = bcl - cfg->native_code;
5360                         newji->data.target = ovfj->data.exception;
5361                         newji->next = patch_info->next;
5362                         patch_info->next = newji;
5363                         patch_info->type = MONO_PATCH_INFO_NONE;
5364                         break;
5365                 }
5366                 case MONO_PATCH_INFO_EXC: {
5367                         MonoClass *exc_class;
5368
5369                         unsigned char *ip = patch_info->ip.i + cfg->native_code;
5370                         i = exception_id_by_name (patch_info->data.target);
5371                         if (exc_throw_pos [i] && !(ip > exc_throw_pos [i] && ip - exc_throw_pos [i] > 50000)) {
5372                                 ppc_patch (ip, exc_throw_pos [i]);
5373                                 patch_info->type = MONO_PATCH_INFO_NONE;
5374                                 break;
5375                         } else {
5376                                 exc_throw_pos [i] = code;
5377                         }
5378
5379                         exc_class = mono_class_from_name (mono_defaults.corlib, "System", patch_info->data.name);
5380                         g_assert (exc_class);
5381
5382                         ppc_patch (ip, code);
5383                         /*mono_add_patch_info (cfg, code - cfg->native_code, MONO_PATCH_INFO_EXC_NAME, patch_info->data.target);*/
5384                         ppc_load (code, ppc_r3, exc_class->type_token);
5385                         /* we got here from a conditional call, so the calling ip is set in lr */
5386                         ppc_mflr (code, ppc_r4);
5387                         patch_info->type = MONO_PATCH_INFO_INTERNAL_METHOD;
5388                         patch_info->data.name = "mono_arch_throw_corlib_exception";
5389                         patch_info->ip.i = code - cfg->native_code;
5390                         if (FORCE_INDIR_CALL || cfg->method->dynamic) {
5391                                 ppc_load_func (code, ppc_r0, 0);
5392                                 ppc_mtctr (code, ppc_r0);
5393                                 ppc_bcctr (code, PPC_BR_ALWAYS, 0);
5394                         } else {
5395                                 ppc_bl (code, 0);
5396                         }
5397                         break;
5398                 }
5399                 default:
5400                         /* do nothing */
5401                         break;
5402                 }
5403         }
5404
5405         cfg->code_len = code - cfg->native_code;
5406
5407         g_assert (cfg->code_len <= cfg->code_size);
5408 }
5409 #endif
5410
5411 #if DEAD_CODE
5412 static int
5413 try_offset_access (void *value, guint32 idx)
5414 {
5415         register void* me __asm__ ("r2");
5416         void ***p = (void***)((char*)me + 284);
5417         int idx1 = idx / 32;
5418         int idx2 = idx % 32;
5419         if (!p [idx1])
5420                 return 0;
5421         if (value != p[idx1][idx2])
5422                 return 0;
5423         return 1;
5424 }
5425 #endif
5426
5427 static void
5428 setup_tls_access (void)
5429 {
5430 #if defined(__linux__) && defined(_CS_GNU_LIBPTHREAD_VERSION)
5431         size_t conf_size = 0;
5432         char confbuf[128];
5433 #else
5434         /* FIXME for darwin */
5435         guint32 *ins, *code;
5436         guint32 cmplwi_1023, li_0x48, blr_ins;
5437 #endif
5438
5439 #ifdef TARGET_PS3
5440         tls_mode = TLS_MODE_FAILED;
5441 #endif
5442
5443         if (tls_mode == TLS_MODE_FAILED)
5444                 return;
5445         if (g_getenv ("MONO_NO_TLS")) {
5446                 tls_mode = TLS_MODE_FAILED;
5447                 return;
5448         }
5449
5450         if (tls_mode == TLS_MODE_DETECT) {
5451 #if defined(__APPLE__) && defined(__mono_ppc__) && !defined(__mono_ppc64__)
5452                 tls_mode = TLS_MODE_DARWIN_G4;
5453 #elif defined(__linux__) && defined(_CS_GNU_LIBPTHREAD_VERSION)
5454                 conf_size = confstr ( _CS_GNU_LIBPTHREAD_VERSION, confbuf, sizeof(confbuf));
5455                 if ((conf_size > 4) && (strncmp (confbuf, "NPTL", 4) == 0))
5456                         tls_mode = TLS_MODE_NPTL;
5457 #elif !defined(TARGET_PS3)
5458                 ins = (guint32*)pthread_getspecific;
5459                 /* uncond branch to the real method */
5460                 if ((*ins >> 26) == 18) {
5461                         gint32 val;
5462                         val = (*ins & ~3) << 6;
5463                         val >>= 6;
5464                         if (*ins & 2) {
5465                                 /* absolute */
5466                                 ins = (guint32*)(long)val;
5467                         } else {
5468                                 ins = (guint32*) ((char*)ins + val);
5469                         }
5470                 }
5471                 code = &cmplwi_1023;
5472                 ppc_cmpli (code, 0, 0, ppc_r3, 1023);
5473                 code = &li_0x48;
5474                 ppc_li (code, ppc_r4, 0x48);
5475                 code = &blr_ins;
5476                 ppc_blr (code);
5477                 if (*ins == cmplwi_1023) {
5478                         int found_lwz_284 = 0;
5479                         guint32 ptk;
5480                         for (ptk = 0; ptk < 20; ++ptk) {
5481                                 ++ins;
5482                                 if (!*ins || *ins == blr_ins)
5483                                         break;
5484                                 if ((guint16)*ins == 284 && (*ins >> 26) == 32) {
5485                                         found_lwz_284 = 1;
5486                                         break;
5487                                 }
5488                         }
5489                         if (!found_lwz_284) {
5490                                 tls_mode = TLS_MODE_FAILED;
5491                                 return;
5492                         }
5493                         tls_mode = TLS_MODE_LTHREADS;
5494                 } else if (*ins == li_0x48) {
5495                         ++ins;
5496                         /* uncond branch to the real method */
5497                         if ((*ins >> 26) == 18) {
5498                                 gint32 val;
5499                                 val = (*ins & ~3) << 6;
5500                                 val >>= 6;
5501                                 if (*ins & 2) {
5502                                         /* absolute */
5503                                         ins = (guint32*)(long)val;
5504                                 } else {
5505                                         ins = (guint32*) ((char*)ins + val);
5506                                 }
5507                                 code = (guint32*)&val;
5508                                 ppc_li (code, ppc_r0, 0x7FF2);
5509                                 if (ins [1] == val) {
5510                                         /* Darwin on G4, implement */
5511                                         tls_mode = TLS_MODE_FAILED;
5512                                         return;
5513                                 } else {
5514                                         code = (guint32*)&val;
5515                                         ppc_mfspr (code, ppc_r3, 104);
5516                                         if (ins [1] != val) {
5517                                                 tls_mode = TLS_MODE_FAILED;
5518                                                 return;
5519                                         }
5520                                         tls_mode = TLS_MODE_DARWIN_G5;
5521                                 }
5522                         } else {
5523                                 tls_mode = TLS_MODE_FAILED;
5524                                 return;
5525                         }
5526                 } else {
5527                         tls_mode = TLS_MODE_FAILED;
5528                         return;
5529                 }
5530 #endif
5531         }
5532 #ifndef TARGET_PS3
5533         if (tls_mode == TLS_MODE_DETECT)
5534                 tls_mode = TLS_MODE_FAILED;
5535         if (tls_mode == TLS_MODE_FAILED)
5536                 return;
5537         if ((lmf_pthread_key == -1) && (tls_mode == TLS_MODE_NPTL)) {
5538                 lmf_pthread_key = mono_get_lmf_addr_tls_offset();
5539         }
5540
5541 #if 0
5542         /* if not TLS_MODE_NPTL or local dynamic (as indicated by
5543            mono_get_lmf_addr_tls_offset returning -1) then use keyed access. */
5544         if (lmf_pthread_key == -1) {
5545                 guint32 ptk = mono_jit_tls_id;
5546                 if (ptk < 1024) {
5547                         /*g_print ("MonoLMF at: %d\n", ptk);*/
5548                         /*if (!try_offset_access (mono_get_lmf_addr (), ptk)) {
5549                                 init_tls_failed = 1;
5550                                 return;
5551                         }*/
5552                         lmf_pthread_key = ptk;
5553                 }
5554         }
5555 #endif
5556
5557 #endif
5558 }
5559
5560 void
5561 mono_arch_finish_init (void)
5562 {
5563         setup_tls_access ();
5564 }
5565
5566 void
5567 mono_arch_free_jit_tls_data (MonoJitTlsData *tls)
5568 {
5569 }
5570
5571 #define CMP_SIZE (PPC_LOAD_SEQUENCE_LENGTH + 4)
5572 #define BR_SIZE 4
5573 #define LOADSTORE_SIZE 4
5574 #define JUMP_IMM_SIZE 12
5575 #define JUMP_IMM32_SIZE (PPC_LOAD_SEQUENCE_LENGTH + 8)
5576 #define ENABLE_WRONG_METHOD_CHECK 0
5577
5578 /*
5579  * LOCKING: called with the domain lock held
5580  */
5581 gpointer
5582 mono_arch_build_imt_thunk (MonoVTable *vtable, MonoDomain *domain, MonoIMTCheckItem **imt_entries, int count,
5583         gpointer fail_tramp)
5584 {
5585         int i;
5586         int size = 0;
5587         guint8 *code, *start;
5588
5589         for (i = 0; i < count; ++i) {
5590                 MonoIMTCheckItem *item = imt_entries [i];
5591                 if (item->is_equals) {
5592                         if (item->check_target_idx) {
5593                                 if (!item->compare_done)
5594                                         item->chunk_size += CMP_SIZE;
5595                                 if (item->has_target_code)
5596                                         item->chunk_size += BR_SIZE + JUMP_IMM32_SIZE;
5597                                 else
5598                                         item->chunk_size += LOADSTORE_SIZE + BR_SIZE + JUMP_IMM_SIZE;
5599                         } else {
5600                                 if (fail_tramp) {
5601                                         item->chunk_size += CMP_SIZE + BR_SIZE + JUMP_IMM32_SIZE * 2;
5602                                         if (!item->has_target_code)
5603                                                 item->chunk_size += LOADSTORE_SIZE;
5604                                 } else {
5605                                         item->chunk_size += LOADSTORE_SIZE + JUMP_IMM_SIZE;
5606 #if ENABLE_WRONG_METHOD_CHECK
5607                                         item->chunk_size += CMP_SIZE + BR_SIZE + 4;
5608 #endif
5609                                 }
5610                         }
5611                 } else {
5612                         item->chunk_size += CMP_SIZE + BR_SIZE;
5613                         imt_entries [item->check_target_idx]->compare_done = TRUE;
5614                 }
5615                 size += item->chunk_size;
5616         }
5617         /* the initial load of the vtable address */
5618         size += PPC_LOAD_SEQUENCE_LENGTH + LOADSTORE_SIZE;
5619         if (fail_tramp) {
5620                 code = mono_method_alloc_generic_virtual_thunk (domain, size);
5621         } else {
5622                 code = mono_domain_code_reserve (domain, size);
5623         }
5624         start = code;
5625
5626         /*
5627          * We need to save and restore r11 because it might be
5628          * used by the caller as the vtable register, so
5629          * clobbering it will trip up the magic trampoline.
5630          *
5631          * FIXME: Get rid of this by making sure that r11 is
5632          * not used as the vtable register in interface calls.
5633          */
5634         ppc_stptr (code, ppc_r11, PPC_RET_ADDR_OFFSET, ppc_sp);
5635         ppc_load (code, ppc_r11, (gsize)(& (vtable->vtable [0])));
5636
5637         for (i = 0; i < count; ++i) {
5638                 MonoIMTCheckItem *item = imt_entries [i];
5639                 item->code_target = code;
5640                 if (item->is_equals) {
5641                         if (item->check_target_idx) {
5642                                 if (!item->compare_done) {
5643                                         ppc_load (code, ppc_r0, (gsize)item->key);
5644                                         ppc_compare_log (code, 0, MONO_ARCH_IMT_REG, ppc_r0);
5645                                 }
5646                                 item->jmp_code = code;
5647                                 ppc_bc (code, PPC_BR_FALSE, PPC_BR_EQ, 0);
5648                                 if (item->has_target_code) {
5649                                         ppc_load_ptr (code, ppc_r0, item->value.target_code);
5650                                 } else {
5651                                         ppc_ldptr (code, ppc_r0, (sizeof (gpointer) * item->value.vtable_slot), ppc_r11);
5652                                         ppc_ldptr (code, ppc_r11, PPC_RET_ADDR_OFFSET, ppc_sp);
5653                                 }
5654                                 ppc_mtctr (code, ppc_r0);
5655                                 ppc_bcctr (code, PPC_BR_ALWAYS, 0);
5656                         } else {
5657                                 if (fail_tramp) {
5658                                         ppc_load (code, ppc_r0, (gulong)item->key);
5659                                         ppc_compare_log (code, 0, MONO_ARCH_IMT_REG, ppc_r0);
5660                                         item->jmp_code = code;
5661                                         ppc_bc (code, PPC_BR_FALSE, PPC_BR_EQ, 0);
5662                                         if (item->has_target_code) {
5663                                                 ppc_load_ptr (code, ppc_r0, item->value.target_code);
5664                                         } else {
5665                                                 g_assert (vtable);
5666                                                 ppc_load_ptr (code, ppc_r0, & (vtable->vtable [item->value.vtable_slot]));
5667                                                 ppc_ldptr_indexed (code, ppc_r0, 0, ppc_r0);
5668                                         }
5669                                         ppc_mtctr (code, ppc_r0);
5670                                         ppc_bcctr (code, PPC_BR_ALWAYS, 0);
5671                                         ppc_patch (item->jmp_code, code);
5672                                         ppc_load_ptr (code, ppc_r0, fail_tramp);
5673                                         ppc_mtctr (code, ppc_r0);
5674                                         ppc_bcctr (code, PPC_BR_ALWAYS, 0);
5675                                         item->jmp_code = NULL;
5676                                 } else {
5677                                         /* enable the commented code to assert on wrong method */
5678 #if ENABLE_WRONG_METHOD_CHECK
5679                                         ppc_load (code, ppc_r0, (guint32)item->key);
5680                                         ppc_compare_log (code, 0, MONO_ARCH_IMT_REG, ppc_r0);
5681                                         item->jmp_code = code;
5682                                         ppc_bc (code, PPC_BR_FALSE, PPC_BR_EQ, 0);
5683 #endif
5684                                         ppc_ldptr (code, ppc_r0, (sizeof (gpointer) * item->value.vtable_slot), ppc_r11);
5685                                         ppc_ldptr (code, ppc_r11, PPC_RET_ADDR_OFFSET, ppc_sp);
5686                                         ppc_mtctr (code, ppc_r0);
5687                                         ppc_bcctr (code, PPC_BR_ALWAYS, 0);
5688 #if ENABLE_WRONG_METHOD_CHECK
5689                                         ppc_patch (item->jmp_code, code);
5690                                         ppc_break (code);
5691                                         item->jmp_code = NULL;
5692 #endif
5693                                 }
5694                         }
5695                 } else {
5696                         ppc_load (code, ppc_r0, (gulong)item->key);
5697                         ppc_compare_log (code, 0, MONO_ARCH_IMT_REG, ppc_r0);
5698                         item->jmp_code = code;
5699                         ppc_bc (code, PPC_BR_FALSE, PPC_BR_LT, 0);
5700                 }
5701         }
5702         /* patch the branches to get to the target items */
5703         for (i = 0; i < count; ++i) {
5704                 MonoIMTCheckItem *item = imt_entries [i];
5705                 if (item->jmp_code) {
5706                         if (item->check_target_idx) {
5707                                 ppc_patch (item->jmp_code, imt_entries [item->check_target_idx]->code_target);
5708                         }
5709                 }
5710         }
5711
5712         if (!fail_tramp)
5713                 mono_stats.imt_thunks_size += code - start;
5714         g_assert (code - start <= size);
5715         mono_arch_flush_icache (start, size);
5716         return start;
5717 }
5718
5719 MonoMethod*
5720 mono_arch_find_imt_method (mgreg_t *regs, guint8 *code)
5721 {
5722         mgreg_t *r = (mgreg_t*)regs;
5723
5724         return (MonoMethod*)(gsize) r [MONO_ARCH_IMT_REG];
5725 }
5726
5727 MonoVTable*
5728 mono_arch_find_static_call_vtable (mgreg_t *regs, guint8 *code)
5729 {
5730         mgreg_t *r = (mgreg_t*)regs;
5731
5732         return (MonoVTable*)(gsize) r [MONO_ARCH_RGCTX_REG];
5733 }
5734
5735 GSList*
5736 mono_arch_get_cie_program (void)
5737 {
5738         GSList *l = NULL;
5739
5740         mono_add_unwind_op_def_cfa (l, (guint8*)NULL, (guint8*)NULL, ppc_r1, 0);
5741
5742         return l;
5743 }
5744
5745 MonoInst*
5746 mono_arch_emit_inst_for_method (MonoCompile *cfg, MonoMethod *cmethod, MonoMethodSignature *fsig, MonoInst **args)
5747 {
5748         /* FIXME: */
5749         return NULL;
5750 }
5751
5752 gboolean
5753 mono_arch_print_tree (MonoInst *tree, int arity)
5754 {
5755         return 0;
5756 }
5757
5758 mgreg_t
5759 mono_arch_context_get_int_reg (MonoContext *ctx, int reg)
5760 {
5761         if (reg == ppc_r1)
5762                 return (mgreg_t)MONO_CONTEXT_GET_SP (ctx);
5763
5764         g_assert (reg >= ppc_r13);
5765
5766         return ctx->regs [reg - ppc_r13];
5767 }
5768
5769 guint32
5770 mono_arch_get_patch_offset (guint8 *code)
5771 {
5772         return 0;
5773 }
5774
5775 /*
5776  * mono_aot_emit_load_got_addr:
5777  *
5778  *   Emit code to load the got address.
5779  * On PPC, the result is placed into r30.
5780  */
5781 guint8*
5782 mono_arch_emit_load_got_addr (guint8 *start, guint8 *code, MonoCompile *cfg, MonoJumpInfo **ji)
5783 {
5784         ppc_bl (code, 1);
5785         ppc_mflr (code, ppc_r30);
5786         if (cfg)
5787                 mono_add_patch_info (cfg, code - start, MONO_PATCH_INFO_GOT_OFFSET, NULL);
5788         else
5789                 *ji = mono_patch_info_list_prepend (*ji, code - start, MONO_PATCH_INFO_GOT_OFFSET, NULL);
5790         /* arch_emit_got_address () patches this */
5791 #if defined(TARGET_POWERPC64)
5792         ppc_nop (code);
5793         ppc_nop (code);
5794         ppc_nop (code);
5795         ppc_nop (code);
5796 #else
5797         ppc_load32 (code, ppc_r0, 0);
5798         ppc_add (code, ppc_r30, ppc_r30, ppc_r0);
5799 #endif
5800
5801         return code;
5802 }
5803
5804 /*
5805  * mono_ppc_emit_load_aotconst:
5806  *
5807  *   Emit code to load the contents of the GOT slot identified by TRAMP_TYPE and
5808  * TARGET from the mscorlib GOT in full-aot code.
5809  * On PPC, the GOT address is assumed to be in r30, and the result is placed into 
5810  * r11.
5811  */
5812 guint8*
5813 mono_arch_emit_load_aotconst (guint8 *start, guint8 *code, MonoJumpInfo **ji, int tramp_type, gconstpointer target)
5814 {
5815         /* Load the mscorlib got address */
5816         ppc_ldptr (code, ppc_r11, sizeof (gpointer), ppc_r30);
5817         *ji = mono_patch_info_list_prepend (*ji, code - start, tramp_type, target);
5818         /* arch_emit_got_access () patches this */
5819         ppc_load32 (code, ppc_r0, 0);
5820         ppc_ldptr_indexed (code, ppc_r11, ppc_r11, ppc_r0);
5821
5822         return code;
5823 }
5824
5825 /* Soft Debug support */
5826 #ifdef MONO_ARCH_SOFT_DEBUG_SUPPORTED
5827
5828 /*
5829  * BREAKPOINTS
5830  */
5831
5832 /*
5833  * mono_arch_set_breakpoint:
5834  *
5835  *   See mini-amd64.c for docs.
5836  */
5837 void
5838 mono_arch_set_breakpoint (MonoJitInfo *ji, guint8 *ip)
5839 {
5840         guint8 *code = ip;
5841         guint8 *orig_code = code;
5842
5843         ppc_load_sequence (code, ppc_r11, (gsize)bp_trigger_page);
5844         ppc_ldptr (code, ppc_r11, 0, ppc_r11);
5845
5846         g_assert (code - orig_code == BREAKPOINT_SIZE);
5847
5848         mono_arch_flush_icache (orig_code, code - orig_code);
5849 }
5850
5851 /*
5852  * mono_arch_clear_breakpoint:
5853  *
5854  *   See mini-amd64.c for docs.
5855  */
5856 void
5857 mono_arch_clear_breakpoint (MonoJitInfo *ji, guint8 *ip)
5858 {
5859         guint8 *code = ip;
5860         int i;
5861
5862         for (i = 0; i < BREAKPOINT_SIZE / 4; ++i)
5863                 ppc_nop (code);
5864
5865         mono_arch_flush_icache (ip, code - ip);
5866 }
5867
5868 /*
5869  * mono_arch_is_breakpoint_event:
5870  *
5871  *   See mini-amd64.c for docs.
5872  */
5873 gboolean
5874 mono_arch_is_breakpoint_event (void *info, void *sigctx)
5875 {
5876         siginfo_t* sinfo = (siginfo_t*) info;
5877         /* Sometimes the address is off by 4 */
5878         if (sinfo->si_addr >= bp_trigger_page && (guint8*)sinfo->si_addr <= (guint8*)bp_trigger_page + 128)
5879                 return TRUE;
5880         else
5881                 return FALSE;
5882 }
5883
5884 /*
5885  * mono_arch_skip_breakpoint:
5886  *
5887  *   See mini-amd64.c for docs.
5888  */
5889 void
5890 mono_arch_skip_breakpoint (MonoContext *ctx, MonoJitInfo *ji)
5891 {
5892         /* skip the ldptr */
5893         MONO_CONTEXT_SET_IP (ctx, (guint8*)MONO_CONTEXT_GET_IP (ctx) + 4);
5894 }
5895
5896 /*
5897  * SINGLE STEPPING
5898  */
5899         
5900 /*
5901  * mono_arch_start_single_stepping:
5902  *
5903  *   See mini-amd64.c for docs.
5904  */
5905 void
5906 mono_arch_start_single_stepping (void)
5907 {
5908         mono_mprotect (ss_trigger_page, mono_pagesize (), 0);
5909 }
5910         
5911 /*
5912  * mono_arch_stop_single_stepping:
5913  *
5914  *   See mini-amd64.c for docs.
5915  */
5916 void
5917 mono_arch_stop_single_stepping (void)
5918 {
5919         mono_mprotect (ss_trigger_page, mono_pagesize (), MONO_MMAP_READ);
5920 }
5921
5922 /*
5923  * mono_arch_is_single_step_event:
5924  *
5925  *   See mini-amd64.c for docs.
5926  */
5927 gboolean
5928 mono_arch_is_single_step_event (void *info, void *sigctx)
5929 {
5930         siginfo_t* sinfo = (siginfo_t*) info;
5931         /* Sometimes the address is off by 4 */
5932         if (sinfo->si_addr >= ss_trigger_page && (guint8*)sinfo->si_addr <= (guint8*)ss_trigger_page + 128)
5933                 return TRUE;
5934         else
5935                 return FALSE;
5936 }
5937
5938 /*
5939  * mono_arch_skip_single_step:
5940  *
5941  *   See mini-amd64.c for docs.
5942  */
5943 void
5944 mono_arch_skip_single_step (MonoContext *ctx)
5945 {
5946         /* skip the ldptr */
5947         MONO_CONTEXT_SET_IP (ctx, (guint8*)MONO_CONTEXT_GET_IP (ctx) + 4);
5948 }
5949
5950 /*
5951  * mono_arch_create_seq_point_info:
5952  *
5953  *   See mini-amd64.c for docs.
5954  */
5955 gpointer
5956 mono_arch_get_seq_point_info (MonoDomain *domain, guint8 *code)
5957 {
5958         NOT_IMPLEMENTED;
5959         return NULL;
5960 }
5961
5962 void
5963 mono_arch_init_lmf_ext (MonoLMFExt *ext, gpointer prev_lmf)
5964 {
5965         ext->lmf.previous_lmf = prev_lmf;
5966         /* Mark that this is a MonoLMFExt */
5967         ext->lmf.previous_lmf = (gpointer)(((gssize)ext->lmf.previous_lmf) | 2);
5968         ext->lmf.ebp = (gssize)ext;
5969 }
5970
5971 #endif
5972
5973 gboolean
5974 mono_arch_opcode_supported (int opcode)
5975 {
5976         switch (opcode) {
5977         case OP_ATOMIC_ADD_I4:
5978         case OP_ATOMIC_CAS_I4:
5979 #ifdef TARGET_POWERPC64
5980         case OP_ATOMIC_ADD_I8:
5981         case OP_ATOMIC_CAS_I8:
5982 #endif
5983                 return TRUE;
5984         default:
5985                 return FALSE;
5986         }
5987 }