2002-07-16 Dietmar Maurer <dietmar@ximian.com>
[mono.git] / mono / jit / emit-x86.c
1 /*
2  * emit-x86.c: Support functions for emitting x86 code
3  *
4  * Authors:
5  *   Dietmar Maurer (dietmar@ximian.com)
6  *   Miguel de Icaza (miguel@ximian.com)
7  *
8  * (C) 2001 Ximian, Inc.
9  */
10
11 #include <config.h>
12 #include <glib.h>
13
14 #include <mono/metadata/assembly.h>
15 #include <mono/metadata/loader.h>
16 #include <mono/metadata/cil-coff.h>
17 #include <mono/metadata/tabledefs.h>
18 #include <mono/metadata/class.h>
19 #include <mono/metadata/debug-helpers.h>
20 #include <mono/metadata/mono-endian.h>
21 #include <mono/arch/x86/x86-codegen.h>
22 #include <mono/metadata/profiler-private.h>
23
24 #include "jit.h"
25 #include "helpers.h"
26 #include "codegen.h"
27 #include "debug.h"
28
29
30 //#define DEBUG_REGALLOC
31 //#define DEBUG_SPILLS
32
33 const char *
34 arch_get_reg_name (int regnum)
35 {
36         switch (regnum) {
37         case 0:
38                 return "EAX";
39         case 1:
40                 return "ECX";
41         case 2:
42                 return "EDX";
43         case 3:
44                 return "EBX";
45         case 4:
46                 return "ESP";
47         case 5:
48                 return "EBP";
49         case 6:
50                 return "ESI";
51         case 7:
52                 return "EDI";
53         }
54
55         g_assert_not_reached ();
56         return NULL;
57 }
58
59
60 /* 
61  * we may want a x86-specific header or we 
62  * can just declare it extern in x86.brg.
63  */
64 int mono_x86_have_cmov = 0;
65
66 static int 
67 cpuid (int id, int* p_eax, int* p_ebx, int* p_ecx, int* p_edx)
68 {
69         int have_cpuid = 0;
70         __asm__  __volatile__ (
71                 "pushfl\n"
72                 "popl %%eax\n"
73                 "movl %%eax, %%edx\n"
74                 "xorl $0x200000, %%eax\n"
75                 "pushl %%eax\n"
76                 "popfl\n"
77                 "pushfl\n"
78                 "popl %%eax\n"
79                 "xorl %%edx, %%eax\n"
80                 "andl $0x200000, %%eax\n"
81                 "movl %%eax, %0"
82                 : "=r" (have_cpuid)
83                 :
84                 : "%eax", "%edx"
85         );
86
87         if (have_cpuid) {
88                 __asm__ __volatile__ ("cpuid"
89                         : "=a" (*p_eax), "=b" (*p_ebx), "=c" (*p_ecx), "=d" (*p_edx)
90                         : "a" (id));
91                 return 1;
92         }
93         return 0;
94 }
95
96 void
97 mono_cpu_detect (void) {
98         int eax, ebx, ecx, edx;
99
100         /* Feature Flags function, flags returned in EDX. */
101         if (cpuid(1, &eax, &ebx, &ecx, &edx)) {
102                 if (edx & (1U << 15)) {
103                         mono_x86_have_cmov = 1;
104                 }
105         }
106 }
107
108 static void
109 enter_method (MonoMethod *method, char *ebp)
110 {
111         int i, j;
112         MonoClass *class;
113         MonoObject *o;
114         char *fname;
115
116         fname = mono_method_full_name (method, TRUE);
117         printf ("ENTER: %s\n(", fname);
118         g_free (fname);
119         
120         if (((int)ebp & 3) != 0) {
121                 g_error ("unaligned stack detected (%p)", ebp);
122         }
123
124         ebp += 8;
125
126         if (ISSTRUCT (method->signature->ret)) {
127                 int size, align;
128                 
129                 g_assert (!method->signature->ret->byref);
130
131                 mono_get_param_info (method->signature, -1, &size, &align);
132
133                 printf ("VALUERET:%p, ", *((gpointer *)ebp));
134                 ebp += sizeof (gpointer);
135         }
136
137         if (method->signature->hasthis) {
138                 if (method->klass->valuetype) {
139                         printf ("value:%p, ", *((gpointer *)ebp));
140                 } else {
141                         o = *((MonoObject **)ebp);
142
143                         if (o) {
144                                 class = o->vtable->klass;
145
146                                 if (class == mono_defaults.string_class) {
147                                         printf ("this:[STRING:%p:%s], ", o, mono_string_to_utf8 ((MonoString *)o));
148                                 } else {
149                                         printf ("this:%p[%s.%s], ", o, class->name_space, class->name);
150                                 }
151                         } else 
152                                 printf ("this:NULL, ");
153                 }
154                 ebp += sizeof (gpointer);
155         }
156
157         for (i = 0; i < method->signature->param_count; ++i) {
158                 int size, align;
159                 MonoType *type = mono_get_param_info (method->signature, i, &size, &align);
160
161                 if (type->byref) {
162                         printf ("[BYREF:%p], ", *((gpointer *)ebp)); 
163                 } else switch (type->type) {
164                         
165                 case MONO_TYPE_BOOLEAN:
166                 case MONO_TYPE_CHAR:
167                 case MONO_TYPE_I1:
168                 case MONO_TYPE_U1:
169                 case MONO_TYPE_I2:
170                 case MONO_TYPE_U2:
171                 case MONO_TYPE_I4:
172                 case MONO_TYPE_U4:
173                 case MONO_TYPE_I:
174                 case MONO_TYPE_U:
175                         printf ("%d, ", *((int *)(ebp)));
176                         break;
177                 case MONO_TYPE_STRING: {
178                         MonoString *s = *((MonoString **)ebp);
179                         if (s) {
180                                 g_assert (((MonoObject *)s)->vtable->klass == mono_defaults.string_class);
181                                 printf ("[STRING:%p:%s], ", s, mono_string_to_utf8 (s));
182                         } else 
183                                 printf ("[STRING:null], ");
184                         break;
185                 }
186                 case MONO_TYPE_CLASS:
187                 case MONO_TYPE_OBJECT: {
188                         o = *((MonoObject **)ebp);
189                         if (o) {
190                                 class = o->vtable->klass;
191                     
192                                 if (class == mono_defaults.string_class) {
193                                         printf ("[STRING:%p:%s], ", o, mono_string_to_utf8 ((MonoString *)o));
194                                 } else if (class == mono_defaults.int32_class) {
195                                         printf ("[INT32:%p:%d], ", o, *(gint32 *)((char *)o + sizeof (MonoObject)));
196                                 } else
197                                         printf ("[%s.%s:%p], ", class->name_space, class->name, o);
198                         } else {
199                                 printf ("%p, ", *((gpointer *)(ebp)));                          
200                         }
201                         break;
202                 }
203                 case MONO_TYPE_PTR:
204                 case MONO_TYPE_FNPTR:
205                 case MONO_TYPE_ARRAY:
206                 case MONO_TYPE_SZARRAY:
207                         printf ("%p, ", *((gpointer *)(ebp)));
208                         break;
209                 case MONO_TYPE_I8:
210                         printf ("%lld, ", *((gint64 *)(ebp)));
211                         break;
212                 case MONO_TYPE_R4:
213                         printf ("%f, ", *((float *)(ebp)));
214                         break;
215                 case MONO_TYPE_R8:
216                         printf ("%f, ", *((double *)(ebp)));
217                         break;
218                 case MONO_TYPE_VALUETYPE: 
219                         printf ("[");
220                         for (j = 0; j < size; j++)
221                                 printf ("%02x,", *((guint8*)ebp +j));
222                         printf ("], ");
223                         break;
224                 default:
225                         printf ("XX, ");
226                 }
227
228                 g_assert (align == 4 || align == 8);
229                 ebp += size + align - 1;
230                 ebp = (gpointer)((unsigned)ebp & ~(align - 1));
231         }
232
233         printf (")\n");
234 }
235
236 static void
237 leave_method (MonoMethod *method, int edx, int eax, double test)
238 {
239         gint64 l;
240         char *fname;
241
242         fname = mono_method_full_name (method, TRUE);
243         printf ("LEAVE: %s", fname);
244         g_free (fname);
245
246         switch (method->signature->ret->type) {
247         case MONO_TYPE_VOID:
248                 break;
249         case MONO_TYPE_BOOLEAN:
250                 if (eax)
251                         printf ("TRUE:%d", eax);
252                 else 
253                         printf ("FALSE");
254                         
255                 break;
256         case MONO_TYPE_CHAR:
257         case MONO_TYPE_I1:
258         case MONO_TYPE_U1:
259         case MONO_TYPE_I2:
260         case MONO_TYPE_U2:
261         case MONO_TYPE_I4:
262         case MONO_TYPE_U4:
263         case MONO_TYPE_I:
264         case MONO_TYPE_U:
265                 printf ("EAX=%d", eax);
266                 break;
267         case MONO_TYPE_STRING: {
268                 MonoString *s = (MonoString *)eax;
269
270                 if (s) {
271                         g_assert (((MonoObject *)s)->vtable->klass == mono_defaults.string_class);
272                         printf ("[STRING:%p:%s]", s, mono_string_to_utf8 (s));
273                 } else 
274                         printf ("[STRING:null], ");
275                 break;
276         }
277         case MONO_TYPE_OBJECT: {
278                 MonoObject *o = (MonoObject *)eax;
279
280                 if (o) {
281                         if (o->vtable->klass == mono_defaults.boolean_class) {
282                                 printf ("[BOOLEAN:%p:%d]", o, *((guint8 *)o + sizeof (MonoObject)));            
283                         } else if  (o->vtable->klass == mono_defaults.int32_class) {
284                                 printf ("[INT32:%p:%d]", o, *((gint32 *)((char *)o + sizeof (MonoObject))));    
285                         } else if  (o->vtable->klass == mono_defaults.int64_class) {
286                                 printf ("[INT64:%p:%lld]", o, *((gint64 *)((char *)o + sizeof (MonoObject))));  
287                         } else
288                                 printf ("[%s.%s:%p]", o->vtable->klass->name_space, o->vtable->klass->name, o);
289                 } else
290                         printf ("[OBJECT:%p]", o);
291                
292                 break;
293         }
294         case MONO_TYPE_CLASS:
295         case MONO_TYPE_PTR:
296         case MONO_TYPE_FNPTR:
297         case MONO_TYPE_ARRAY:
298         case MONO_TYPE_SZARRAY:
299                 printf ("EAX=%p", (gpointer)eax);
300                 break;
301         case MONO_TYPE_I8:
302                 *((gint32 *)&l) = eax;
303                 *((gint32 *)&l + 1) = edx;
304                 printf ("EAX/EDX=%lld", l);
305                 break;
306         case MONO_TYPE_R8:
307                 printf ("FP=%f\n", test);
308                 break;
309         default:
310                 printf ("(unknown return type)");
311         }
312
313         printf ("\n");
314 }
315
316 /**
317  * arch_emit_prologue:
318  * @cfg: pointer to status information
319  *
320  * Emits the function prolog.
321  */
322 static void
323 arch_emit_prologue (MonoFlowGraph *cfg)
324 {
325         MonoMethod *method = cfg->method;
326         MonoMethodHeader *header = ((MonoMethodNormal *)method)->header;
327         int i, j, k, alloc_size, pos;
328
329         x86_push_reg (cfg->code, X86_EBP);
330         x86_mov_reg_reg (cfg->code, X86_EBP, X86_ESP, 4);
331
332         alloc_size = cfg->locals_size;
333         pos = 0;
334
335         if (method->save_lmf) {
336                 
337                 pos += sizeof (MonoLMF);
338
339                 /* save the current IP */
340                 cfg->lmfip_offset = cfg->code + 1 - cfg->start;
341                 x86_push_imm (cfg->code, 0);
342                 /* save all caller saved regs */
343                 x86_push_reg (cfg->code, X86_EBX);
344                 x86_push_reg (cfg->code, X86_EDI);
345                 x86_push_reg (cfg->code, X86_ESI);
346                 x86_push_reg (cfg->code, X86_EBP);
347
348                 /* save method info */
349                 x86_push_imm (cfg->code, method);
350         
351                 /* get the address of lmf for the current thread */
352                 x86_call_code (cfg->code, mono_get_lmf_addr);
353                 /* push lmf */
354                 x86_push_reg (cfg->code, X86_EAX); 
355                 /* push *lfm (previous_lmf) */
356                 x86_push_membase (cfg->code, X86_EAX, 0);
357                 /* *(lmf) = ESP */
358                 x86_mov_membase_reg (cfg->code, X86_EAX, 0, X86_ESP, 4);
359         }
360
361         if (mono_regset_reg_used (cfg->rs, X86_EBX)) {
362                 x86_push_reg (cfg->code, X86_EBX);
363                 pos += 4;
364         }
365
366         if (mono_regset_reg_used (cfg->rs, X86_EDI)) {
367                 x86_push_reg (cfg->code, X86_EDI);
368                 pos += 4;
369         }
370
371         if (mono_regset_reg_used (cfg->rs, X86_ESI)) {
372                 x86_push_reg (cfg->code, X86_ESI);
373                 pos += 4;
374         }
375
376         alloc_size -= pos;
377
378         if (alloc_size)
379                 x86_alu_reg_imm (cfg->code, X86_SUB, X86_ESP, alloc_size);
380
381         if (mono_jit_trace_calls) {
382                 x86_push_reg (cfg->code, X86_EBP);
383                 x86_push_imm (cfg->code, cfg->method);
384                 x86_mov_reg_imm (cfg->code, X86_EAX, enter_method);
385                 x86_call_reg (cfg->code, X86_EAX);
386                 x86_alu_reg_imm (cfg->code, X86_ADD, X86_ESP, 8);
387         }
388         if (mono_jit_profile) {
389                 x86_push_imm (cfg->code, cfg->method);
390                 x86_mov_reg_imm (cfg->code, X86_EAX, mono_profiler_method_enter);
391                 x86_call_reg (cfg->code, X86_EAX);
392                 x86_alu_reg_imm (cfg->code, X86_ADD, X86_ESP, 4);
393         }
394
395         /* initialize local vars */
396         if (header->num_locals) {
397                 gboolean unassigned_locals = TRUE;
398
399                 if (cfg->bblocks [0].live_in_set) {
400                         i = mono_bitset_find_first (cfg->bblocks [0].live_in_set, 
401                                                     cfg->locals_start_index - 1);
402                         unassigned_locals = (i >= 0 && i < cfg->locals_start_index + 
403                                              header->num_locals);
404                 }
405
406                 if (unassigned_locals && header->init_locals) {
407                         MonoVarInfo *vi = &VARINFO (cfg, cfg->locals_start_index + header->num_locals - 1);
408                         int offset = vi->offset;  
409                         int size = - offset;
410                         int inited = 0;
411                         
412                         /* do not clear caller saved registers */
413                         size -= 12;
414
415                         for (i = 0; i < header->num_locals; ++i) {
416                                 MonoVarInfo *rv = &VARINFO (cfg, cfg->locals_start_index + i);
417
418                                 if (rv->reg >= 0) {
419                                         int ind = 1 << rv->reg;
420                                         if (!(inited & ind))
421                                                 x86_alu_reg_reg (cfg->code, X86_XOR, rv->reg, rv->reg);
422                                         inited |= ind;
423                                 }
424                         }
425
426                         if (size == 1 || size == 2 || size == 4) {
427                                 x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, size);
428                                 return;
429                         }
430                         
431                         i = size / 4;
432                         j = size % 4;
433
434                         if (i < 3) {
435                                 for (k = 0; k < i; k++) {
436                                         x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, 4);
437                                         offset += 4;
438                                 }
439
440                                 if (j & 2) {
441                                         x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, 2);
442                                         offset += 2;
443                                 }
444                                 if (j & 1)
445                                         x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, 1);
446                                 return;
447                         }
448                         
449                         if (i) {
450                                 if (!mono_regset_reg_used (cfg->rs, X86_EDI)) 
451                                         x86_push_reg (cfg->code, X86_EDI);
452                                 x86_lea_membase (cfg->code, X86_EDI, X86_EBP, offset);
453                                 x86_alu_reg_reg (cfg->code, X86_XOR, X86_EAX, X86_EAX);
454                                 x86_mov_reg_imm (cfg->code, X86_ECX, i);
455                                 x86_cld (cfg->code);
456                                 x86_prefix (cfg->code, X86_REP_PREFIX);
457                                 x86_stosl (cfg->code);
458                                 for (i = 0; i < j; i++)
459                                         x86_stosb (cfg->code);
460                                 if (!mono_regset_reg_used (cfg->rs, X86_EDI)) 
461                                         x86_pop_reg (cfg->code, X86_EDI);
462                         } else {
463
464                                 g_assert (j == 3);
465                                 x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, 2);
466                                 x86_mov_membase_imm (cfg->code, X86_EBP, offset + 2, 0, 1);
467                         }
468                         
469                 } else {
470
471                         /* we always need to initialize object pointers */
472
473                         for (i = 0; i < header->num_locals; ++i) {
474                                 MonoType *t = header->locals [i];
475                                 int offset = VARINFO (cfg, cfg->locals_start_index + i).offset;  
476
477                                 if (t->byref) {
478                                         x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, 4);
479                                         continue;
480                                 }
481
482                                 switch (t->type) {
483                                 case MONO_TYPE_STRING:
484                                 case MONO_TYPE_CLASS:
485                                 case MONO_TYPE_ARRAY:
486                                 case MONO_TYPE_SZARRAY:
487                                 case MONO_TYPE_OBJECT:
488                                         x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, 4);
489                                         break;
490                                 }
491
492                         }
493                 }
494         }
495 }
496
497 /**
498  * arch_emit_epilogue:
499  * @cfg: pointer to status information
500  *
501  * Emits the function epilog.
502  */
503 static void
504 arch_emit_epilogue (MonoFlowGraph *cfg)
505 {
506         int pos;
507         /*
508          * note: with trace and profiling the value on the FP stack may get clobbered.
509          */
510         if (mono_jit_trace_calls) {
511                 x86_fld_reg (cfg->code, 0);
512                 x86_alu_reg_imm (cfg->code, X86_SUB, X86_ESP, 8);
513                 x86_fst_membase (cfg->code, X86_ESP, 0, TRUE, TRUE);
514                 x86_push_reg (cfg->code, X86_EAX);
515                 x86_push_reg (cfg->code, X86_EDX);
516                 x86_push_imm (cfg->code, cfg->method);
517                 x86_mov_reg_imm (cfg->code, X86_EAX, leave_method);
518                 x86_call_reg (cfg->code, X86_EAX);
519                 x86_alu_reg_imm (cfg->code, X86_ADD, X86_ESP, 4);
520                 x86_pop_reg (cfg->code, X86_EDX);
521                 x86_pop_reg (cfg->code, X86_EAX);
522                 x86_alu_reg_imm (cfg->code, X86_ADD, X86_ESP, 8);
523         }
524         if (mono_jit_profile) {
525                 x86_push_reg (cfg->code, X86_EAX);
526                 x86_push_reg (cfg->code, X86_EDX);
527                 x86_push_imm (cfg->code, cfg->method);
528                 x86_mov_reg_imm (cfg->code, X86_EAX, mono_profiler_method_leave);
529                 x86_call_reg (cfg->code, X86_EAX);
530                 x86_alu_reg_imm (cfg->code, X86_ADD, X86_ESP, 4);
531                 x86_pop_reg (cfg->code, X86_EDX);
532                 x86_pop_reg (cfg->code, X86_EAX);
533         }
534
535         if (cfg->method->save_lmf) {
536                 pos = -sizeof (MonoLMF) - 4;
537         } else
538                 pos = -4;
539
540         if (mono_regset_reg_used (cfg->rs, X86_EBX)) {
541                 x86_mov_reg_membase (cfg->code, X86_EBX, X86_EBP, pos, 4);
542                 pos -= 4;
543         }
544         if (mono_regset_reg_used (cfg->rs, X86_EDI)) {
545                 x86_mov_reg_membase (cfg->code, X86_EDI, X86_EBP, pos, 4);
546                 pos -= 4;
547         }
548         if (mono_regset_reg_used (cfg->rs, X86_ESI)) {
549                 x86_mov_reg_membase (cfg->code, X86_ESI, X86_EBP, pos, 4);
550                 pos -= 4;
551         }
552
553         if (cfg->method->save_lmf) {
554                 pos = -sizeof (MonoLMF);
555
556                 x86_lea_membase (cfg->code, X86_ESP, X86_EBP, pos);
557
558                 /* ebx = previous_lmf */
559                 x86_pop_reg (cfg->code, X86_EBX);
560                 /* edi = lmf */
561                 x86_pop_reg (cfg->code, X86_EDI);
562                 /* *(lmf) = previous_lmf */
563                 x86_mov_membase_reg (cfg->code, X86_EDI, 0, X86_EBX, 4);
564
565                 /* discard method info */
566                 x86_pop_reg (cfg->code, X86_ESI);
567
568                 /* restore caller saved regs */
569                 x86_pop_reg (cfg->code, X86_EBP);
570                 x86_pop_reg (cfg->code, X86_ESI);
571                 x86_pop_reg (cfg->code, X86_EDI);
572                 x86_pop_reg (cfg->code, X86_EBX);
573
574         }
575
576         x86_leave (cfg->code);
577         x86_ret (cfg->code);
578 }
579
580 int
581 arch_allocate_var (MonoFlowGraph *cfg, int size, int align, MonoVarType vartype, MonoValueType type)
582 {
583         MonoVarInfo vi;
584
585         mono_jit_stats.allocate_var++;
586
587         vi.range.last_use.abs_pos = 0;
588         vi.range.first_use.pos.bid = 0xffff;
589         vi.range.first_use.pos.tid = 0; 
590         vi.isvolatile = 0;
591         vi.reg = -1;
592         vi.varnum = cfg->varinfo->len;
593
594         if (size != sizeof (gpointer))
595                 vi.isvolatile = 1;
596         
597         switch (vartype) {
598         case MONO_TEMPVAR:
599         case MONO_LOCALVAR: {
600                 cfg->locals_size += size;
601                 cfg->locals_size += align - 1;
602                 cfg->locals_size &= ~(align - 1);
603
604                 SET_VARINFO (vi, type, vartype, - cfg->locals_size, size);
605                 g_array_append_val (cfg->varinfo, vi);
606                 break;
607         }
608         case MONO_ARGVAR: {
609                 int arg_start = 8 + cfg->has_vtarg*4;
610
611                 g_assert ((align & 3) == 0);
612
613                 SET_VARINFO (vi, type, vartype, cfg->args_size + arg_start, size);
614                 g_array_append_val (cfg->varinfo, vi);
615                 
616                 cfg->args_size += size;
617                 cfg->args_size += 3;
618                 cfg->args_size &= ~3;
619                 break;
620         }
621         default:
622                 g_assert_not_reached ();
623         }
624
625         return cfg->varinfo->len - 1;
626 }
627
628 static gboolean
629 mono_label_cfg (MonoFlowGraph *cfg)
630 {
631         int i, j;
632
633         for (i = 0; i < cfg->block_count; i++) {
634                 GPtrArray *forest = cfg->bblocks [i].forest;
635                 int top;
636
637                 if (!cfg->bblocks [i].reached) /* unreachable code */
638                         continue;
639                 
640                 top = forest->len;
641
642                 for (j = 0; j < top; j++) {
643                         MBTree *t1 = (MBTree *) g_ptr_array_index (forest, j);
644                         MBState *mbstate;
645                         
646                         mbstate =  mono_burg_label (t1, cfg);
647
648                         if (!mbstate) {
649                                 if (mono_debug_format != MONO_DEBUG_FORMAT_NONE)
650                                         return FALSE;
651                                 g_warning ("tree does not match in %s",
652                                            mono_method_full_name (cfg->method, TRUE));
653                                 mono_print_ctree (cfg, t1); printf ("\n\n");
654
655                                 mono_print_forest (cfg, forest);
656                                 g_assert_not_reached ();
657                         }
658                 }
659         }
660
661         return TRUE;
662 }
663
664 static gboolean
665 tree_allocate_regs (MonoFlowGraph *cfg, MBTree *tree, int goal, MonoRegSet *rs, 
666                     guint8 exclude_mask, int *spillcount) 
667 {
668         MBTree *kids[10];
669         int ern = mono_burg_rule (tree->state, goal);
670         const guint16 *nts = mono_burg_nts [ern];
671         guint8 left_exclude_mask = 0, right_exclude_mask = 0;
672         int i;
673         
674 #ifdef DEBUG_REGALLOC
675         printf ("tree_allocate_regs start %d %08x %d %d\n",  tree->op, rs->free_mask, goal, 
676                 (nts [0] && kids [0] == tree));
677 #endif
678
679         mono_burg_kids (tree, ern, kids);
680
681         switch (tree->op) {
682         case MB_TERM_SHL:
683         case MB_TERM_SHR:
684         case MB_TERM_SHR_UN:
685                 exclude_mask |= (1 << X86_ECX);
686                 left_exclude_mask |= (1 << X86_ECX);
687                 break;
688         case MB_TERM_MUL:
689         case MB_TERM_MUL_OVF:
690         case MB_TERM_MUL_OVF_UN:
691         case MB_TERM_DIV:
692         case MB_TERM_DIV_UN:
693         case MB_TERM_REM:
694         case MB_TERM_REM_UN:
695                 if (goal == MB_NTERM_reg) {
696                         left_exclude_mask |= (1 << X86_EDX);
697                         right_exclude_mask |= (1 << X86_EDX) | (1 << X86_EAX);
698                 }
699                 break;
700         default:
701                 break;
702         }
703
704         if (nts [0] && kids [0] == tree) {
705                 /* chain rule */
706                 if (!tree_allocate_regs (cfg, kids [0], nts [0], rs, exclude_mask, spillcount))
707                         return FALSE;
708                 return TRUE;
709         }
710
711         if (tree->spilled) {
712                 if (tree->reg1 >= 0)
713                         (*spillcount)--;
714                 if (tree->reg2 >= 0)
715                         (*spillcount)--;
716                 if (tree->reg3 >= 0)
717                         (*spillcount)--;
718         }
719
720         tree->reg1 = -1;
721         tree->reg2 = -1;
722         tree->reg3 = -1;
723         
724         tree->spilled = 0;
725  
726         if (nts [0]) {
727                 if (nts [1]) { /* two kids */
728                         MonoRegSet saved_rs;
729
730                         if (!tree_allocate_regs (cfg, kids [0], nts [0], rs, left_exclude_mask, spillcount))
731                                 return FALSE;
732
733                         saved_rs = *rs;
734
735                         if (!tree_allocate_regs (cfg, kids [1], nts [1], rs, right_exclude_mask, spillcount)) {
736
737 #ifdef DEBUG_REGALLOC
738                                 printf ("tree_allocate_regs try 1 failed %d %d %d %d\n", 
739                                         nts [1], kids [1]->reg1,
740                                         kids [1]->reg2,kids [1]->reg3);
741 #endif
742                                 *rs = saved_rs;
743
744                                 if (kids [0]->reg1 != -1) {
745                                         right_exclude_mask |= 1 << kids [0]->reg1;
746                                         (*spillcount)++;
747                                 }
748                                 if (kids [0]->reg2 != -1) {
749                                         right_exclude_mask |= 1 << kids [0]->reg2;
750                                         (*spillcount)++;
751                                 }
752                                 if (kids [0]->reg3 != -1) {
753                                         right_exclude_mask |= 1 << kids [0]->reg3;
754                                         (*spillcount)++;
755                                 }
756
757                                 mono_regset_free_reg (rs, kids [0]->reg1);
758                                 mono_regset_free_reg (rs, kids [0]->reg2);
759                                 mono_regset_free_reg (rs, kids [0]->reg3);
760
761                                 kids [0]->spilled = 1;
762
763                                 if (!tree_allocate_regs (cfg, kids [1], nts [1], rs, right_exclude_mask, spillcount)) {
764 #ifdef DEBUG_REGALLOC
765                                         printf ("tree_allocate_regs try 2 failed\n");
766 #endif
767                                         return FALSE;
768                                 }
769 #ifdef DEBUG_REGALLOC
770                                 printf ("tree_allocate_regs try 2 succesfull\n");
771 #endif
772                         }
773
774                         if (nts [2]) {
775                                 if (nts [3]) /* we cant handle four kids */
776                                         g_assert_not_reached ();
777
778                                 if (!tree_allocate_regs (cfg, kids [2], nts [2], rs, right_exclude_mask, spillcount))
779                                         return FALSE;
780                                 
781                         }
782
783                 } else { /* one kid */
784                         if (!tree_allocate_regs (cfg, kids [0], nts [0], rs, left_exclude_mask, spillcount))
785                                 return FALSE;                   
786                 }
787         }
788
789
790         for (i = 0; nts [i]; i++) {
791                 mono_regset_free_reg (rs, kids [i]->reg1);
792                 mono_regset_free_reg (rs, kids [i]->reg2);
793                 mono_regset_free_reg (rs, kids [i]->reg3);
794         }
795
796         tree->emit = mono_burg_func [ern];
797
798         switch (tree->op) {
799         case MB_TERM_CALL_I4:
800         case MB_TERM_CALL_I8:
801         case MB_TERM_CALL_R8:
802         // case MB_TERM_CALL_VOID :
803                 if ((tree->reg1 = mono_regset_alloc_reg (rs, X86_EAX, exclude_mask)) == -1)
804                         return FALSE;
805                 if ((tree->reg2 = mono_regset_alloc_reg (rs, X86_EDX, exclude_mask)) == -1)
806                         return FALSE;
807                 if ((tree->reg3 = mono_regset_alloc_reg (rs, X86_ECX, exclude_mask)) == -1)
808                         return FALSE;
809                 return TRUE;
810         }
811
812         switch (goal) {
813         case MB_NTERM_reg:
814                 switch (tree->op) {
815                 case MB_TERM_MUL_OVF_UN:
816                 case MB_TERM_DIV:
817                 case MB_TERM_DIV_UN:
818                 case MB_TERM_REM:
819                 case MB_TERM_REM_UN:
820                         if ((tree->reg1 = mono_regset_alloc_reg (rs, X86_EAX, exclude_mask)) == -1)
821                                 return FALSE;                   
822                         if ((tree->reg2 = mono_regset_alloc_reg (rs, X86_EDX, exclude_mask)) == -1)
823                                 return FALSE;
824                         break;
825                 default:
826                         if ((tree->reg1 = mono_regset_alloc_reg (rs, -1, exclude_mask)) == -1)
827                                 return FALSE;
828                 }
829                 break;
830
831         case MB_NTERM_lreg:
832                 switch (tree->op) {
833                 case MB_TERM_MUL:
834                 case MB_TERM_MUL_OVF:
835                 case MB_TERM_MUL_OVF_UN:
836                 case MB_TERM_DIV:
837                 case MB_TERM_DIV_UN:
838                 case MB_TERM_REM:
839                 case MB_TERM_REM_UN:
840                         if ((tree->reg1 = mono_regset_alloc_reg (rs, X86_EAX, exclude_mask)) == -1)
841                                 return FALSE;                   
842                         if ((tree->reg2 = mono_regset_alloc_reg (rs, X86_EDX, exclude_mask)) == -1)
843                                 return FALSE;
844                         break;
845                 default:
846                         if ((tree->reg1 = mono_regset_alloc_reg (rs, -1, exclude_mask)) == -1)
847                                 return FALSE;
848                         if ((tree->reg2 = mono_regset_alloc_reg (rs, -1, exclude_mask)) == -1)
849                                 return FALSE;
850                 }
851                 break;
852
853         case MB_NTERM_freg:
854                 /* fixme: allocate floating point registers */
855                 break;
856       
857         case MB_NTERM_addr:
858                 if (tree->op == MB_TERM_ADD) {
859                         if ((tree->reg1 = mono_regset_alloc_reg (rs, tree->left->reg1, exclude_mask)) == -1)
860                                 return FALSE;
861                         if ((tree->reg2 = mono_regset_alloc_reg (rs, tree->right->reg1, exclude_mask)) == -1)
862                                 return FALSE;
863                 }
864                 break;
865                 
866         case MB_NTERM_base:
867                 if (tree->op == MB_TERM_ADD) {
868                         if ((tree->reg1 = mono_regset_alloc_reg (rs, tree->left->reg1, exclude_mask)) == -1)
869                                 return FALSE;
870                 }
871                 break;
872                
873         case MB_NTERM_index:
874                 if (tree->op == MB_TERM_SHL ||
875                     tree->op == MB_TERM_MUL) {
876                         if ((tree->reg1 = mono_regset_alloc_reg (rs, tree->left->reg1, exclude_mask)) == -1)
877                                 return FALSE;
878                 }
879                 break;
880                
881         default:
882                 /* do nothing */
883                 break;
884         }
885
886 #ifdef DEBUG_REGALLOC
887         printf ("tree_allocate_regs end %d %08x\n",  tree->op, rs->free_mask);
888 #endif
889         return TRUE;
890 }
891
892 static void
893 arch_allocate_regs (MonoFlowGraph *cfg)
894 {
895         int i, j, max_spillcount = 0;
896         
897         for (i = 0; i < cfg->block_count; i++) {
898                 GPtrArray *forest = cfg->bblocks [i].forest;
899                 int top;
900
901                 if (!cfg->bblocks [i].reached) /* unreachable code */
902                         continue;
903
904                 top = forest->len;
905
906                 for (j = 0; j < top; j++) {
907                         MBTree *t1 = (MBTree *) g_ptr_array_index (forest, j);
908                         int spillcount = 0;
909 #ifdef DEBUG_REGALLOC
910                         printf ("arch_allocate_regs start %d:%d %08x\n", i, j, cfg->rs->free_mask);
911 #endif
912                         if (!tree_allocate_regs (cfg, t1, 1, cfg->rs, 0, &spillcount)) {
913                                 mono_print_ctree (cfg, t1);
914                                 printf ("\n");
915                                 g_error ("register allocation failed");
916                         }
917
918                         max_spillcount = MAX (max_spillcount, spillcount);
919
920 #ifdef DEBUG_REGALLOC
921                         printf ("arch_allocate_regs end %d:%d %08x\n", i, j, cfg->rs->free_mask);
922 #endif
923                         g_assert (cfg->rs->free_mask == 0xffffffff);
924                 }
925         }
926
927         /* allocate space for spilled regs */
928
929         cfg->spillvars = mono_mempool_alloc0 (cfg->mp, sizeof (gint) *  max_spillcount);
930         cfg->spillcount = max_spillcount;
931
932         for (i = 0; i < max_spillcount; i++) {
933                 int spillvar;
934                 spillvar = arch_allocate_var (cfg, sizeof (gpointer), sizeof (gpointer),
935                                               MONO_TEMPVAR, VAL_I32);
936                 cfg->spillvars [i] = VARINFO (cfg, spillvar).offset;
937         }
938 }
939
940 static void
941 tree_emit (int goal, MonoFlowGraph *cfg, MBTree *tree, int *spillcount) 
942 {
943         MBTree *kids[10];
944         int ern = mono_burg_rule (tree->state, goal);
945         const guint16 *nts = mono_burg_nts [ern];
946         MBEmitFunc emit;
947         int offset;
948
949         mono_burg_kids (tree, ern, kids);
950
951         if (nts [0]) {
952                 if (nts [1]) {
953                         int spilloffset1, spilloffset2, spilloffset3;
954                         
955                         tree_emit (nts [0], cfg, kids [0], spillcount);
956
957                         if (kids [0]->spilled) {
958 #ifdef DEBUG_SPILLS
959                                 printf ("SPILL_REGS %d %03x %s.%s:%s\n", 
960                                         nts [0], cfg->code - cfg->start,
961                                         cfg->method->klass->name_space,
962                                         cfg->method->klass->name, cfg->method->name);
963
964                                 mono_print_ctree (cfg, kids [0]);printf ("\n\n");
965 #endif
966                                 spilloffset1 = 0;
967                                 spilloffset2 = 0;
968                                 spilloffset3 = 0;
969
970                                 if (kids [0]->reg1 != -1) {
971                                         spilloffset1 = cfg->spillvars [(*spillcount)++];
972                                         x86_mov_membase_reg (cfg->code, X86_EBP, spilloffset1, 
973                                                              kids [0]->reg1, 4);
974                                 }
975                                 if (kids [0]->reg2 != -1) {
976                                         spilloffset2 = cfg->spillvars [(*spillcount)++];
977                                         x86_mov_membase_reg (cfg->code, X86_EBP, spilloffset2, 
978                                                              kids [0]->reg2, 4);
979                                 }
980                                 if (kids [0]->reg3 != -1) {
981                                         spilloffset3 = cfg->spillvars [(*spillcount)++];
982                                         x86_mov_membase_reg (cfg->code, X86_EBP, spilloffset3, 
983                                                              kids [0]->reg3, 4);
984                                 }
985                         }
986
987                         tree_emit (nts [1], cfg, kids [1], spillcount);
988
989                         if (kids [0]->spilled) {
990
991 #ifdef DEBUG_SPILLS
992                                 printf ("RELOAD_REGS %03x %s.%s:%s\n", 
993                                         cfg->code - cfg->start,
994                                         cfg->method->klass->name_space,
995                                         cfg->method->klass->name, cfg->method->name);
996 #endif
997
998                                 if (kids [0]->reg3 != -1) 
999                                         x86_mov_reg_membase (cfg->code, kids [0]->reg3, X86_EBP, 
1000                                                              spilloffset3, 4);
1001                                 if (kids [0]->reg2 != -1) 
1002                                         x86_mov_reg_membase (cfg->code, kids [0]->reg2, X86_EBP, 
1003                                                              spilloffset2, 4);
1004                                 if (kids [0]->reg1 != -1) 
1005                                         x86_mov_reg_membase (cfg->code, kids [0]->reg1, X86_EBP, 
1006                                                              spilloffset1, 4);
1007                         }
1008
1009                         if (nts [2]) {
1010                                 g_assert (!nts [3]);
1011                                 tree_emit (nts [2], cfg, kids [2], spillcount);
1012                         }
1013                 } else {
1014                         tree_emit (nts [0], cfg, kids [0], spillcount);
1015                 }
1016         }
1017
1018         g_assert ((*spillcount) <= cfg->spillcount);
1019
1020         tree->addr = offset = cfg->code - cfg->start;
1021
1022         /* we assume an instruction uses a maximum of 128 bytes */
1023         if ((cfg->code_size - offset) <= 128) {
1024                 int add = MIN (cfg->code_size, 128);
1025                 cfg->code_size += add;
1026                 mono_jit_stats.code_reallocs++;
1027                 cfg->start = g_realloc (cfg->start, cfg->code_size);
1028                 g_assert (cfg->start);
1029                 cfg->code = cfg->start + offset;
1030         }
1031
1032         if ((emit = mono_burg_func [ern]))
1033                 emit (tree, cfg);
1034
1035         g_assert ((cfg->code - cfg->start) < cfg->code_size);
1036 }
1037
1038 static void
1039 mono_emit_cfg (MonoFlowGraph *cfg)
1040 {
1041         int i, j, spillcount;
1042
1043         for (i = 0; i < cfg->block_count; i++) {
1044                 MonoBBlock *bb = &cfg->bblocks [i];
1045                 GPtrArray *forest = bb->forest;
1046                 int top;
1047
1048                 if (!bb->reached) /* unreachable code */
1049                         continue;
1050                 
1051                 top = forest->len;
1052
1053                 bb->addr = cfg->code - cfg->start;
1054           
1055                 for (j = 0; j < top; j++) {
1056                         MBTree *t1 = (MBTree *) g_ptr_array_index (forest, j);
1057                         
1058                         spillcount = 0;
1059                         tree_emit (1, cfg, t1, &spillcount);
1060                 }
1061         }
1062                 
1063         cfg->epilog = cfg->code - cfg->start;
1064 }
1065
1066 static void
1067 mono_compute_branches (MonoFlowGraph *cfg)
1068 {
1069         MonoJumpInfo *ji;
1070         guint8 *end;
1071         int i, j;
1072
1073         end = cfg->code;
1074
1075         for (j = 0; j < cfg->block_count; j++) {
1076                 MonoBBlock *bb = &cfg->bblocks [j];
1077                 GPtrArray *forest = bb->forest;
1078                 int top;
1079                 
1080                 if (!bb->reached) /* unreachable code */
1081                         continue;
1082
1083                 top = forest->len;
1084         
1085                 for (i = 0; i < top; i++) {
1086                         MBTree *t1 = (MBTree *) g_ptr_array_index (forest, i);
1087
1088                         if (t1->op == MB_TERM_SWITCH) {
1089                                 MonoBBlock **jt = (MonoBBlock **)t1->data.p;
1090                                 guint32 *rt = (guint32 *)t1->data.p;
1091                                 int m = *((guint32 *)t1->data.p) + 1;
1092                                 int k;
1093                                 
1094                                 for (k = 1; k <= m; k++)
1095                                         rt [k] = (int)(jt [k]->addr + cfg->start);
1096                                 
1097                                 /* emit the switch instruction again to update addresses */
1098                                 cfg->code = cfg->start + t1->addr;
1099                                 ((MBEmitFunc)t1->emit) (t1, cfg);
1100                         }
1101                 }
1102         }
1103
1104         cfg->code = end;
1105
1106         for (ji = cfg->jump_info; ji; ji = ji->next) {
1107                 unsigned char *ip = GUINT_TO_POINTER (GPOINTER_TO_UINT (ji->ip) + cfg->start);
1108                 unsigned char *target;
1109
1110                 switch (ji->type) {
1111                 case MONO_JUMP_INFO_BB:
1112                         target = ji->data.bb->addr + cfg->start;
1113                         break;
1114                 case MONO_JUMP_INFO_ABS:
1115                         target = ji->data.target;
1116                         break;
1117                 case MONO_JUMP_INFO_EPILOG:
1118                         target = cfg->epilog + cfg->start;
1119                         break;
1120                 case MONO_JUMP_INFO_IP:
1121                         *(unsigned char**)ip = ip;
1122                         continue;
1123                 default:
1124                         g_assert_not_reached ();
1125                 }
1126                 x86_patch (ip, target);
1127         }
1128
1129         /* patch the IP in the LMF saving code */
1130         if (cfg->lmfip_offset) {
1131                 *((guint32 *)(cfg->start + cfg->lmfip_offset)) =  
1132                         (gint32)(cfg->start + cfg->lmfip_offset);
1133         }
1134 }
1135
1136 void
1137 mono_add_jump_info (MonoFlowGraph *cfg, gpointer ip, MonoJumpInfoType type, gpointer target)
1138 {
1139         MonoJumpInfo *ji = mono_mempool_alloc (cfg->mp, sizeof (MonoJumpInfo));
1140
1141         ji->type = type;
1142         ji->ip = GUINT_TO_POINTER (GPOINTER_TO_UINT (ip) - GPOINTER_TO_UINT (cfg->start));
1143         ji->data.target = target;
1144         ji->next = cfg->jump_info;
1145
1146         cfg->jump_info = ji;
1147 }
1148
1149 MonoJitInfo *
1150 arch_jit_compile_cfg (MonoDomain *target_domain, MonoFlowGraph *cfg)
1151 {
1152         MonoJitInfo *ji;
1153         guint32 ls_used_mask = 0;
1154         MonoMethod *method = cfg->method;
1155
1156         ji = mono_mempool_alloc0 (target_domain->mp, sizeof (MonoJitInfo));
1157                 
1158         cfg->rs = mono_regset_new (X86_NREG);
1159         mono_regset_reserve_reg (cfg->rs, X86_ESP);
1160         mono_regset_reserve_reg (cfg->rs, X86_EBP);
1161
1162         /* we can use this regs for global register allocation */
1163         mono_regset_reserve_reg (cfg->rs, X86_EBX);
1164         mono_regset_reserve_reg (cfg->rs, X86_ESI);
1165
1166         if (mono_use_linear_scan) {
1167                 mono_linear_scan (cfg, &ls_used_mask);
1168                 cfg->rs->used_mask |= ls_used_mask;
1169         }
1170         
1171         if (mono_jit_dump_forest) {
1172                 int i;
1173                 printf ("FOREST %s\n", mono_method_full_name (method, TRUE));
1174                 for (i = 0; i < cfg->block_count; i++) {
1175                         printf ("BLOCK %d:\n", i);
1176                         mono_print_forest (cfg, cfg->bblocks [i].forest);
1177                 }
1178         }
1179                         
1180         if (!mono_label_cfg (cfg))
1181                 return NULL;
1182                 
1183         arch_allocate_regs (cfg);
1184
1185         /* align to 8 byte boundary */
1186         cfg->locals_size += 7;
1187         cfg->locals_size &= ~7;
1188
1189         arch_emit_prologue (cfg);
1190         cfg->prologue_end = cfg->code - cfg->start;
1191         mono_emit_cfg (cfg);
1192         arch_emit_epilogue (cfg);               
1193         cfg->epilogue_end = cfg->code - cfg->start;
1194
1195         mono_compute_branches (cfg);
1196
1197         ji->code_size = cfg->code - cfg->start;
1198         ji->used_regs = cfg->rs->used_mask;
1199         ji->method = method;
1200         ji->code_start = cfg->start;
1201
1202         return ji;
1203 }
1204