2002-07-12 Dietmar Maurer <dietmar@ximian.com>
[mono.git] / mono / jit / emit-x86.c
1 /*
2  * emit-x86.c: Support functions for emitting x86 code
3  *
4  * Authors:
5  *   Dietmar Maurer (dietmar@ximian.com)
6  *   Miguel de Icaza (miguel@ximian.com)
7  *
8  * (C) 2001 Ximian, Inc.
9  */
10
11 #include <config.h>
12 #include <glib.h>
13
14 #include <mono/metadata/assembly.h>
15 #include <mono/metadata/loader.h>
16 #include <mono/metadata/cil-coff.h>
17 #include <mono/metadata/tabledefs.h>
18 #include <mono/metadata/class.h>
19 #include <mono/metadata/debug-helpers.h>
20 #include <mono/metadata/mono-endian.h>
21 #include <mono/arch/x86/x86-codegen.h>
22 #include <mono/metadata/profiler-private.h>
23
24 #include "jit.h"
25 #include "helpers.h"
26 #include "codegen.h"
27 #include "debug.h"
28
29
30 //#define DEBUG_REGALLOC
31 //#define DEBUG_SPILLS
32
33 const char *
34 arch_get_reg_name (int regnum)
35 {
36         switch (regnum) {
37         case 0:
38                 return "EAX";
39         case 1:
40                 return "ECX";
41         case 2:
42                 return "EDX";
43         case 3:
44                 return "EBX";
45         case 4:
46                 return "ESP";
47         case 5:
48                 return "EBP";
49         case 6:
50                 return "ESI";
51         case 7:
52                 return "EDI";
53         }
54
55         g_assert_not_reached ();
56         return NULL;
57 }
58
59
60 /* 
61  * we may want a x86-specific header or we 
62  * can just declare it extern in x86.brg.
63  */
64 int mono_x86_have_cmov = 0;
65
66 static int 
67 cpuid (int id, int* p_eax, int* p_ebx, int* p_ecx, int* p_edx)
68 {
69         int have_cpuid = 0;
70         __asm__  __volatile__ (
71                 "pushfl\n"
72                 "popl %%eax\n"
73                 "movl %%eax, %%edx\n"
74                 "xorl $0x200000, %%eax\n"
75                 "pushl %%eax\n"
76                 "popfl\n"
77                 "pushfl\n"
78                 "popl %%eax\n"
79                 "xorl %%edx, %%eax\n"
80                 "andl $0x200000, %%eax\n"
81                 "movl %%eax, %0"
82                 : "=r" (have_cpuid)
83                 :
84                 : "%eax", "%edx"
85         );
86
87         if (have_cpuid) {
88                 __asm__ __volatile__ ("cpuid"
89                         : "=a" (*p_eax), "=b" (*p_ebx), "=c" (*p_ecx), "=d" (*p_edx)
90                         : "a" (id));
91                 return 1;
92         }
93         return 0;
94 }
95
96 void
97 mono_cpu_detect (void) {
98         int eax, ebx, ecx, edx;
99
100         /* Feature Flags function, flags returned in EDX. */
101         if (cpuid(1, &eax, &ebx, &ecx, &edx)) {
102                 if (edx & (1U << 15)) {
103                         mono_x86_have_cmov = 1;
104                 }
105         }
106 }
107
108 static void
109 enter_method (MonoMethod *method, char *ebp)
110 {
111         int i, j;
112         MonoClass *class;
113         MonoObject *o;
114         char *fname;
115
116         fname = mono_method_full_name (method, TRUE);
117         printf ("ENTER: %s\n(", fname);
118         g_free (fname);
119         
120         if (((int)ebp & 3) != 0) {
121                 g_error ("unaligned stack detected (%p)", ebp);
122         }
123
124         ebp += 8;
125
126         if (ISSTRUCT (method->signature->ret)) {
127                 int size, align;
128                 
129                 g_assert (!method->signature->ret->byref);
130
131                 size = mono_type_stack_size (method->signature->ret, &align);
132
133                 printf ("VALUERET:%p, ", *((gpointer *)ebp));
134                 ebp += sizeof (gpointer);
135         }
136
137         if (method->signature->hasthis) {
138                 if (method->klass->valuetype) {
139                         printf ("value:%p, ", *((gpointer *)ebp));
140                 } else {
141                         o = *((MonoObject **)ebp);
142
143                         if (o) {
144                                 class = o->vtable->klass;
145
146                                 if (class == mono_defaults.string_class) {
147                                         printf ("this:[STRING:%p:%s], ", o, mono_string_to_utf8 ((MonoString *)o));
148                                 } else {
149                                         printf ("this:%p[%s.%s], ", o, class->name_space, class->name);
150                                 }
151                         } else 
152                                 printf ("this:NULL, ");
153                 }
154                 ebp += sizeof (gpointer);
155         }
156
157         for (i = 0; i < method->signature->param_count; ++i) {
158                 MonoType *type = method->signature->params [i];
159                 int size, align;
160                 size = mono_type_stack_size (type, &align);
161
162                 if (type->byref) {
163                         printf ("[BYREF:%p], ", *((gpointer *)ebp)); 
164                 } else switch (type->type) {
165                         
166                 case MONO_TYPE_BOOLEAN:
167                 case MONO_TYPE_CHAR:
168                 case MONO_TYPE_I1:
169                 case MONO_TYPE_U1:
170                 case MONO_TYPE_I2:
171                 case MONO_TYPE_U2:
172                 case MONO_TYPE_I4:
173                 case MONO_TYPE_U4:
174                 case MONO_TYPE_I:
175                 case MONO_TYPE_U:
176                         printf ("%d, ", *((int *)(ebp)));
177                         break;
178                 case MONO_TYPE_STRING: {
179                         MonoString *s = *((MonoString **)ebp);
180                         if (s) {
181                                 g_assert (((MonoObject *)s)->vtable->klass == mono_defaults.string_class);
182                                 printf ("[STRING:%p:%s], ", s, mono_string_to_utf8 (s));
183                         } else 
184                                 printf ("[STRING:null], ");
185                         break;
186                 }
187                 case MONO_TYPE_CLASS:
188                 case MONO_TYPE_OBJECT: {
189                         o = *((MonoObject **)ebp);
190                         if (o) {
191                                 class = o->vtable->klass;
192                     
193                                 if (class == mono_defaults.string_class) {
194                                         printf ("[STRING:%p:%s], ", o, mono_string_to_utf8 ((MonoString *)o));
195                                 } else if (class == mono_defaults.int32_class) {
196                                         printf ("[INT32:%p:%d], ", o, *(gint32 *)((char *)o + sizeof (MonoObject)));
197                                 } else
198                                         printf ("[%s.%s:%p], ", class->name_space, class->name, o);
199                         } else {
200                                 printf ("%p, ", *((gpointer *)(ebp)));                          
201                         }
202                         break;
203                 }
204                 case MONO_TYPE_PTR:
205                 case MONO_TYPE_FNPTR:
206                 case MONO_TYPE_ARRAY:
207                 case MONO_TYPE_SZARRAY:
208                         printf ("%p, ", *((gpointer *)(ebp)));
209                         break;
210                 case MONO_TYPE_I8:
211                         printf ("%lld, ", *((gint64 *)(ebp)));
212                         break;
213                 case MONO_TYPE_R4:
214                         printf ("%f, ", *((float *)(ebp)));
215                         break;
216                 case MONO_TYPE_R8:
217                         printf ("%f, ", *((double *)(ebp)));
218                         break;
219                 case MONO_TYPE_VALUETYPE: 
220                         printf ("[");
221                         for (j = 0; j < size; j++)
222                                 printf ("%02x,", *((guint8*)ebp +j));
223                         printf ("], ");
224                         break;
225                 default:
226                         printf ("XX, ");
227                 }
228
229                 g_assert (align == 4 || align == 8);
230                 ebp += size + align - 1;
231                 ebp = (gpointer)((unsigned)ebp & ~(align - 1));
232         }
233
234         printf (")\n");
235 }
236
237 static void
238 leave_method (MonoMethod *method, int edx, int eax, double test)
239 {
240         gint64 l;
241         char *fname;
242
243         fname = mono_method_full_name (method, TRUE);
244         printf ("LEAVE: %s", fname);
245         g_free (fname);
246
247         switch (method->signature->ret->type) {
248         case MONO_TYPE_VOID:
249                 break;
250         case MONO_TYPE_BOOLEAN:
251                 if (eax)
252                         printf ("TRUE:%d", eax);
253                 else 
254                         printf ("FALSE");
255                         
256                 break;
257         case MONO_TYPE_CHAR:
258         case MONO_TYPE_I1:
259         case MONO_TYPE_U1:
260         case MONO_TYPE_I2:
261         case MONO_TYPE_U2:
262         case MONO_TYPE_I4:
263         case MONO_TYPE_U4:
264         case MONO_TYPE_I:
265         case MONO_TYPE_U:
266                 printf ("EAX=%d", eax);
267                 break;
268         case MONO_TYPE_STRING: {
269                 MonoString *s = (MonoString *)eax;
270
271                 if (s) {
272                         g_assert (((MonoObject *)s)->vtable->klass == mono_defaults.string_class);
273                         printf ("[STRING:%p:%s]", s, mono_string_to_utf8 (s));
274                 } else 
275                         printf ("[STRING:null], ");
276                 break;
277         }
278         case MONO_TYPE_OBJECT: {
279                 MonoObject *o = (MonoObject *)eax;
280
281                 if (o) {
282                         if (o->vtable->klass == mono_defaults.boolean_class) {
283                                 printf ("[BOOLEAN:%p:%d]", o, *((guint8 *)o + sizeof (MonoObject)));            
284                         } else if  (o->vtable->klass == mono_defaults.int32_class) {
285                                 printf ("[INT32:%p:%d]", o, *((gint32 *)((char *)o + sizeof (MonoObject))));    
286                         } else
287                                 printf ("[%s.%s:%p]", o->vtable->klass->name_space, o->vtable->klass->name, o);
288                 } else
289                         printf ("[OBJECT:%p]", o);
290                
291                 break;
292         }
293         case MONO_TYPE_CLASS:
294         case MONO_TYPE_PTR:
295         case MONO_TYPE_FNPTR:
296         case MONO_TYPE_ARRAY:
297         case MONO_TYPE_SZARRAY:
298                 printf ("EAX=%p", (gpointer)eax);
299                 break;
300         case MONO_TYPE_I8:
301                 *((gint32 *)&l) = eax;
302                 *((gint32 *)&l + 1) = edx;
303                 printf ("EAX/EDX=%lld", l);
304                 break;
305         case MONO_TYPE_R8:
306                 printf ("FP=%f\n", test);
307                 break;
308         default:
309                 printf ("(unknown return type)");
310         }
311
312         printf ("\n");
313 }
314
315 /**
316  * arch_emit_prologue:
317  * @cfg: pointer to status information
318  *
319  * Emits the function prolog.
320  */
321 static void
322 arch_emit_prologue (MonoFlowGraph *cfg)
323 {
324         MonoMethod *method = cfg->method;
325         MonoMethodHeader *header = ((MonoMethodNormal *)method)->header;
326         int i, j, k, alloc_size, pos;
327
328         x86_push_reg (cfg->code, X86_EBP);
329         x86_mov_reg_reg (cfg->code, X86_EBP, X86_ESP, 4);
330
331         alloc_size = cfg->locals_size;
332         pos = 0;
333
334         if (method->save_lmf) {
335                 
336                 pos += sizeof (MonoLMF);
337
338                 /* save the current IP */
339                 cfg->lmfip_offset = cfg->code + 1 - cfg->start;
340                 x86_push_imm (cfg->code, 0);
341                 /* save all caller saved regs */
342                 x86_push_reg (cfg->code, X86_EBX);
343                 x86_push_reg (cfg->code, X86_EDI);
344                 x86_push_reg (cfg->code, X86_ESI);
345                 x86_push_reg (cfg->code, X86_EBP);
346
347                 /* save method info */
348                 x86_push_imm (cfg->code, method);
349         
350                 /* get the address of lmf for the current thread */
351                 x86_call_code (cfg->code, mono_get_lmf_addr);
352                 /* push lmf */
353                 x86_push_reg (cfg->code, X86_EAX); 
354                 /* push *lfm (previous_lmf) */
355                 x86_push_membase (cfg->code, X86_EAX, 0);
356                 /* *(lmf) = ESP */
357                 x86_mov_membase_reg (cfg->code, X86_EAX, 0, X86_ESP, 4);
358         }
359
360         if (mono_regset_reg_used (cfg->rs, X86_EBX)) {
361                 x86_push_reg (cfg->code, X86_EBX);
362                 pos += 4;
363         }
364
365         if (mono_regset_reg_used (cfg->rs, X86_EDI)) {
366                 x86_push_reg (cfg->code, X86_EDI);
367                 pos += 4;
368         }
369
370         if (mono_regset_reg_used (cfg->rs, X86_ESI)) {
371                 x86_push_reg (cfg->code, X86_ESI);
372                 pos += 4;
373         }
374
375         alloc_size -= pos;
376
377         if (alloc_size)
378                 x86_alu_reg_imm (cfg->code, X86_SUB, X86_ESP, alloc_size);
379
380         if (mono_jit_trace_calls) {
381                 x86_push_reg (cfg->code, X86_EBP);
382                 x86_push_imm (cfg->code, cfg->method);
383                 x86_mov_reg_imm (cfg->code, X86_EAX, enter_method);
384                 x86_call_reg (cfg->code, X86_EAX);
385                 x86_alu_reg_imm (cfg->code, X86_ADD, X86_ESP, 8);
386         }
387         if (mono_jit_profile) {
388                 x86_push_imm (cfg->code, cfg->method);
389                 x86_mov_reg_imm (cfg->code, X86_EAX, mono_profiler_method_enter);
390                 x86_call_reg (cfg->code, X86_EAX);
391                 x86_alu_reg_imm (cfg->code, X86_ADD, X86_ESP, 4);
392         }
393
394         /* initialize local vars */
395         if (header->num_locals) {
396                 gboolean unassigned_locals = TRUE;
397
398                 if (cfg->bblocks [0].live_in_set) {
399                         i = mono_bitset_find_first (cfg->bblocks [0].live_in_set, 
400                                                     cfg->locals_start_index - 1);
401                         unassigned_locals = (i >= 0 && i < cfg->locals_start_index + 
402                                              header->num_locals);
403                 }
404
405                 if (unassigned_locals && header->init_locals) {
406                         MonoVarInfo *vi = &VARINFO (cfg, cfg->locals_start_index + header->num_locals - 1);
407                         int offset = vi->offset;  
408                         int size = - offset;
409                         int inited = 0;
410                         
411                         /* do not clear caller saved registers */
412                         size -= 12;
413
414                         for (i = 0; i < header->num_locals; ++i) {
415                                 MonoVarInfo *rv = &VARINFO (cfg, cfg->locals_start_index + i);
416
417                                 if (rv->reg >= 0) {
418                                         int ind = 1 << rv->reg;
419                                         if (!(inited & ind))
420                                                 x86_alu_reg_reg (cfg->code, X86_XOR, rv->reg, rv->reg);
421                                         inited |= ind;
422                                 }
423                         }
424
425                         if (size == 1 || size == 2 || size == 4) {
426                                 x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, size);
427                                 return;
428                         }
429                         
430                         i = size / 4;
431                         j = size % 4;
432
433                         if (i < 3) {
434                                 for (k = 0; k < i; k++) {
435                                         x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, 4);
436                                         offset += 4;
437                                 }
438
439                                 if (j & 2) {
440                                         x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, 2);
441                                         offset += 2;
442                                 }
443                                 if (j & 1)
444                                         x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, 1);
445                                 return;
446                         }
447                         
448                         if (i) {
449                                 if (!mono_regset_reg_used (cfg->rs, X86_EDI)) 
450                                         x86_push_reg (cfg->code, X86_EDI);
451                                 x86_lea_membase (cfg->code, X86_EDI, X86_EBP, offset);
452                                 x86_alu_reg_reg (cfg->code, X86_XOR, X86_EAX, X86_EAX);
453                                 x86_mov_reg_imm (cfg->code, X86_ECX, i);
454                                 x86_cld (cfg->code);
455                                 x86_prefix (cfg->code, X86_REP_PREFIX);
456                                 x86_stosl (cfg->code);
457                                 for (i = 0; i < j; i++)
458                                         x86_stosb (cfg->code);
459                                 if (!mono_regset_reg_used (cfg->rs, X86_EDI)) 
460                                         x86_pop_reg (cfg->code, X86_EDI);
461                         } else {
462
463                                 g_assert (j == 3);
464                                 x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, 2);
465                                 x86_mov_membase_imm (cfg->code, X86_EBP, offset + 2, 0, 1);
466                         }
467                         
468                 } else {
469
470                         /* we always need to initialize object pointers */
471
472                         for (i = 0; i < header->num_locals; ++i) {
473                                 MonoType *t = header->locals [i];
474                                 int offset = VARINFO (cfg, cfg->locals_start_index + i).offset;  
475
476                                 if (t->byref) {
477                                         x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, 4);
478                                         continue;
479                                 }
480
481                                 switch (t->type) {
482                                 case MONO_TYPE_STRING:
483                                 case MONO_TYPE_CLASS:
484                                 case MONO_TYPE_ARRAY:
485                                 case MONO_TYPE_SZARRAY:
486                                 case MONO_TYPE_OBJECT:
487                                         x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, 4);
488                                         break;
489                                 }
490
491                         }
492                 }
493         }
494 }
495
496 /**
497  * arch_emit_epilogue:
498  * @cfg: pointer to status information
499  *
500  * Emits the function epilog.
501  */
502 static void
503 arch_emit_epilogue (MonoFlowGraph *cfg)
504 {
505         int pos;
506         /*
507          * note: with trace and profiling the value on the FP stack may get clobbered.
508          */
509         if (mono_jit_trace_calls) {
510                 x86_fld_reg (cfg->code, 0);
511                 x86_alu_reg_imm (cfg->code, X86_SUB, X86_ESP, 8);
512                 x86_fst_membase (cfg->code, X86_ESP, 0, TRUE, TRUE);
513                 x86_push_reg (cfg->code, X86_EAX);
514                 x86_push_reg (cfg->code, X86_EDX);
515                 x86_push_imm (cfg->code, cfg->method);
516                 x86_mov_reg_imm (cfg->code, X86_EAX, leave_method);
517                 x86_call_reg (cfg->code, X86_EAX);
518                 x86_alu_reg_imm (cfg->code, X86_ADD, X86_ESP, 4);
519                 x86_pop_reg (cfg->code, X86_EDX);
520                 x86_pop_reg (cfg->code, X86_EAX);
521                 x86_alu_reg_imm (cfg->code, X86_ADD, X86_ESP, 8);
522         }
523         if (mono_jit_profile) {
524                 x86_push_reg (cfg->code, X86_EAX);
525                 x86_push_reg (cfg->code, X86_EDX);
526                 x86_push_imm (cfg->code, cfg->method);
527                 x86_mov_reg_imm (cfg->code, X86_EAX, mono_profiler_method_leave);
528                 x86_call_reg (cfg->code, X86_EAX);
529                 x86_alu_reg_imm (cfg->code, X86_ADD, X86_ESP, 4);
530                 x86_pop_reg (cfg->code, X86_EDX);
531                 x86_pop_reg (cfg->code, X86_EAX);
532         }
533
534         if (cfg->method->save_lmf) {
535                 pos = -sizeof (MonoLMF) - 4;
536         } else
537                 pos = -4;
538
539         if (mono_regset_reg_used (cfg->rs, X86_EBX)) {
540                 x86_mov_reg_membase (cfg->code, X86_EBX, X86_EBP, pos, 4);
541                 pos -= 4;
542         }
543         if (mono_regset_reg_used (cfg->rs, X86_EDI)) {
544                 x86_mov_reg_membase (cfg->code, X86_EDI, X86_EBP, pos, 4);
545                 pos -= 4;
546         }
547         if (mono_regset_reg_used (cfg->rs, X86_ESI)) {
548                 x86_mov_reg_membase (cfg->code, X86_ESI, X86_EBP, pos, 4);
549                 pos -= 4;
550         }
551
552         if (cfg->method->save_lmf) {
553                 pos = -sizeof (MonoLMF);
554
555                 x86_lea_membase (cfg->code, X86_ESP, X86_EBP, pos);
556
557                 /* ebx = previous_lmf */
558                 x86_pop_reg (cfg->code, X86_EBX);
559                 /* edi = lmf */
560                 x86_pop_reg (cfg->code, X86_EDI);
561                 /* *(lmf) = previous_lmf */
562                 x86_mov_membase_reg (cfg->code, X86_EDI, 0, X86_EBX, 4);
563
564                 /* discard method info */
565                 x86_pop_reg (cfg->code, X86_ESI);
566
567                 /* restore caller saved regs */
568                 x86_pop_reg (cfg->code, X86_EBP);
569                 x86_pop_reg (cfg->code, X86_ESI);
570                 x86_pop_reg (cfg->code, X86_EDI);
571                 x86_pop_reg (cfg->code, X86_EBX);
572
573         }
574
575         x86_leave (cfg->code);
576         x86_ret (cfg->code);
577 }
578
579 int
580 arch_allocate_var (MonoFlowGraph *cfg, int size, int align, MonoVarType vartype, MonoValueType type)
581 {
582         MonoVarInfo vi;
583
584         mono_jit_stats.allocate_var++;
585
586         vi.range.last_use.abs_pos = 0;
587         vi.range.first_use.pos.bid = 0xffff;
588         vi.range.first_use.pos.tid = 0; 
589         vi.isvolatile = 0;
590         vi.reg = -1;
591         vi.varnum = cfg->varinfo->len;
592
593         if (size != sizeof (gpointer))
594                 vi.isvolatile = 1;
595         
596         switch (vartype) {
597         case MONO_TEMPVAR:
598         case MONO_LOCALVAR: {
599                 cfg->locals_size += size;
600                 cfg->locals_size += align - 1;
601                 cfg->locals_size &= ~(align - 1);
602
603                 SET_VARINFO (vi, type, vartype, - cfg->locals_size, size);
604                 g_array_append_val (cfg->varinfo, vi);
605                 break;
606         }
607         case MONO_ARGVAR: {
608                 int arg_start = 8 + cfg->has_vtarg*4;
609
610                 g_assert ((align & 3) == 0);
611
612                 SET_VARINFO (vi, type, vartype, cfg->args_size + arg_start, size);
613                 g_array_append_val (cfg->varinfo, vi);
614                 
615                 cfg->args_size += size;
616                 cfg->args_size += 3;
617                 cfg->args_size &= ~3;
618                 break;
619         }
620         default:
621                 g_assert_not_reached ();
622         }
623
624         return cfg->varinfo->len - 1;
625 }
626
627 static gboolean
628 mono_label_cfg (MonoFlowGraph *cfg)
629 {
630         int i, j;
631
632         for (i = 0; i < cfg->block_count; i++) {
633                 GPtrArray *forest = cfg->bblocks [i].forest;
634                 int top;
635
636                 if (!cfg->bblocks [i].reached) /* unreachable code */
637                         continue;
638                 
639                 top = forest->len;
640
641                 for (j = 0; j < top; j++) {
642                         MBTree *t1 = (MBTree *) g_ptr_array_index (forest, j);
643                         MBState *mbstate;
644                         
645                         mbstate =  mono_burg_label (t1, cfg);
646
647                         if (!mbstate) {
648                                 if (mono_debug_format != MONO_DEBUG_FORMAT_NONE)
649                                         return FALSE;
650                                 g_warning ("tree does not match in %s",
651                                            mono_method_full_name (cfg->method, TRUE));
652                                 mono_print_ctree (cfg, t1); printf ("\n\n");
653
654                                 mono_print_forest (cfg, forest);
655                                 g_assert_not_reached ();
656                         }
657                 }
658         }
659
660         return TRUE;
661 }
662
663 static gboolean
664 tree_allocate_regs (MonoFlowGraph *cfg, MBTree *tree, int goal, MonoRegSet *rs, 
665                     guint8 exclude_mask, int *spillcount) 
666 {
667         MBTree *kids[10];
668         int ern = mono_burg_rule (tree->state, goal);
669         const guint16 *nts = mono_burg_nts [ern];
670         guint8 left_exclude_mask = 0, right_exclude_mask = 0;
671         int i;
672         
673 #ifdef DEBUG_REGALLOC
674         printf ("tree_allocate_regs start %d %08x %d %d\n",  tree->op, rs->free_mask, goal, 
675                 (nts [0] && kids [0] == tree));
676 #endif
677
678         mono_burg_kids (tree, ern, kids);
679
680         switch (tree->op) {
681         case MB_TERM_SHL:
682         case MB_TERM_SHR:
683         case MB_TERM_SHR_UN:
684                 exclude_mask |= (1 << X86_ECX);
685                 left_exclude_mask |= (1 << X86_ECX);
686                 break;
687         case MB_TERM_MUL:
688         case MB_TERM_MUL_OVF:
689         case MB_TERM_MUL_OVF_UN:
690         case MB_TERM_DIV:
691         case MB_TERM_DIV_UN:
692         case MB_TERM_REM:
693         case MB_TERM_REM_UN:
694                 if (goal == MB_NTERM_reg) {
695                         left_exclude_mask |= (1 << X86_EDX);
696                         right_exclude_mask |= (1 << X86_EDX) | (1 << X86_EAX);
697                 }
698                 break;
699         default:
700                 break;
701         }
702
703         if (nts [0] && kids [0] == tree) {
704                 /* chain rule */
705                 if (!tree_allocate_regs (cfg, kids [0], nts [0], rs, exclude_mask, spillcount))
706                         return FALSE;
707                 return TRUE;
708         }
709
710         if (tree->spilled) {
711                 if (tree->reg1 >= 0)
712                         (*spillcount)--;
713                 if (tree->reg2 >= 0)
714                         (*spillcount)--;
715                 if (tree->reg3 >= 0)
716                         (*spillcount)--;
717         }
718
719         tree->reg1 = -1;
720         tree->reg2 = -1;
721         tree->reg3 = -1;
722         
723         tree->spilled = 0;
724  
725         if (nts [0]) {
726                 if (nts [1]) { /* two kids */
727                         MonoRegSet saved_rs;
728
729                         if (!tree_allocate_regs (cfg, kids [0], nts [0], rs, left_exclude_mask, spillcount))
730                                 return FALSE;
731
732                         saved_rs = *rs;
733
734                         if (!tree_allocate_regs (cfg, kids [1], nts [1], rs, right_exclude_mask, spillcount)) {
735
736 #ifdef DEBUG_REGALLOC
737                                 printf ("tree_allocate_regs try 1 failed %d %d %d %d\n", 
738                                         nts [1], kids [1]->reg1,
739                                         kids [1]->reg2,kids [1]->reg3);
740 #endif
741                                 *rs = saved_rs;
742
743                                 if (kids [0]->reg1 != -1) {
744                                         right_exclude_mask |= 1 << kids [0]->reg1;
745                                         (*spillcount)++;
746                                 }
747                                 if (kids [0]->reg2 != -1) {
748                                         right_exclude_mask |= 1 << kids [0]->reg2;
749                                         (*spillcount)++;
750                                 }
751                                 if (kids [0]->reg3 != -1) {
752                                         right_exclude_mask |= 1 << kids [0]->reg3;
753                                         (*spillcount)++;
754                                 }
755
756                                 mono_regset_free_reg (rs, kids [0]->reg1);
757                                 mono_regset_free_reg (rs, kids [0]->reg2);
758                                 mono_regset_free_reg (rs, kids [0]->reg3);
759
760                                 kids [0]->spilled = 1;
761
762                                 if (!tree_allocate_regs (cfg, kids [1], nts [1], rs, right_exclude_mask, spillcount)) {
763 #ifdef DEBUG_REGALLOC
764                                         printf ("tree_allocate_regs try 2 failed\n");
765 #endif
766                                         return FALSE;
767                                 }
768 #ifdef DEBUG_REGALLOC
769                                 printf ("tree_allocate_regs try 2 succesfull\n");
770 #endif
771                         }
772
773                         if (nts [2]) {
774                                 if (nts [3]) /* we cant handle four kids */
775                                         g_assert_not_reached ();
776
777                                 if (!tree_allocate_regs (cfg, kids [2], nts [2], rs, right_exclude_mask, spillcount))
778                                         return FALSE;
779                                 
780                         }
781
782                 } else { /* one kid */
783                         if (!tree_allocate_regs (cfg, kids [0], nts [0], rs, left_exclude_mask, spillcount))
784                                 return FALSE;                   
785                 }
786         }
787
788
789         for (i = 0; nts [i]; i++) {
790                 mono_regset_free_reg (rs, kids [i]->reg1);
791                 mono_regset_free_reg (rs, kids [i]->reg2);
792                 mono_regset_free_reg (rs, kids [i]->reg3);
793         }
794
795         tree->emit = mono_burg_func [ern];
796
797         switch (tree->op) {
798         case MB_TERM_CALL_I4:
799         case MB_TERM_CALL_I8:
800         case MB_TERM_CALL_R8:
801         // case MB_TERM_CALL_VOID :
802                 if ((tree->reg1 = mono_regset_alloc_reg (rs, X86_EAX, exclude_mask)) == -1)
803                         return FALSE;
804                 if ((tree->reg2 = mono_regset_alloc_reg (rs, X86_EDX, exclude_mask)) == -1)
805                         return FALSE;
806                 if ((tree->reg3 = mono_regset_alloc_reg (rs, X86_ECX, exclude_mask)) == -1)
807                         return FALSE;
808                 return TRUE;
809         }
810
811         switch (goal) {
812         case MB_NTERM_reg:
813                 switch (tree->op) {
814                 case MB_TERM_MUL_OVF_UN:
815                 case MB_TERM_DIV:
816                 case MB_TERM_DIV_UN:
817                 case MB_TERM_REM:
818                 case MB_TERM_REM_UN:
819                         if ((tree->reg1 = mono_regset_alloc_reg (rs, X86_EAX, exclude_mask)) == -1)
820                                 return FALSE;                   
821                         if ((tree->reg2 = mono_regset_alloc_reg (rs, X86_EDX, exclude_mask)) == -1)
822                                 return FALSE;
823                         break;
824                 default:
825                         if ((tree->reg1 = mono_regset_alloc_reg (rs, -1, exclude_mask)) == -1)
826                                 return FALSE;
827                 }
828                 break;
829
830         case MB_NTERM_lreg:
831                 switch (tree->op) {
832                 case MB_TERM_MUL:
833                 case MB_TERM_MUL_OVF:
834                 case MB_TERM_MUL_OVF_UN:
835                 case MB_TERM_DIV:
836                 case MB_TERM_DIV_UN:
837                 case MB_TERM_REM:
838                 case MB_TERM_REM_UN:
839                         if ((tree->reg1 = mono_regset_alloc_reg (rs, X86_EAX, exclude_mask)) == -1)
840                                 return FALSE;                   
841                         if ((tree->reg2 = mono_regset_alloc_reg (rs, X86_EDX, exclude_mask)) == -1)
842                                 return FALSE;
843                         break;
844                 default:
845                         if ((tree->reg1 = mono_regset_alloc_reg (rs, -1, exclude_mask)) == -1)
846                                 return FALSE;
847                         if ((tree->reg2 = mono_regset_alloc_reg (rs, -1, exclude_mask)) == -1)
848                                 return FALSE;
849                 }
850                 break;
851
852         case MB_NTERM_freg:
853                 /* fixme: allocate floating point registers */
854                 break;
855       
856         case MB_NTERM_addr:
857                 if (tree->op == MB_TERM_ADD) {
858                         if ((tree->reg1 = mono_regset_alloc_reg (rs, tree->left->reg1, exclude_mask)) == -1)
859                                 return FALSE;
860                         if ((tree->reg2 = mono_regset_alloc_reg (rs, tree->right->reg1, exclude_mask)) == -1)
861                                 return FALSE;
862                 }
863                 break;
864                 
865         case MB_NTERM_base:
866                 if (tree->op == MB_TERM_ADD) {
867                         if ((tree->reg1 = mono_regset_alloc_reg (rs, tree->left->reg1, exclude_mask)) == -1)
868                                 return FALSE;
869                 }
870                 break;
871                
872         case MB_NTERM_index:
873                 if (tree->op == MB_TERM_SHL ||
874                     tree->op == MB_TERM_MUL) {
875                         if ((tree->reg1 = mono_regset_alloc_reg (rs, tree->left->reg1, exclude_mask)) == -1)
876                                 return FALSE;
877                 }
878                 break;
879                
880         default:
881                 /* do nothing */
882                 break;
883         }
884
885 #ifdef DEBUG_REGALLOC
886         printf ("tree_allocate_regs end %d %08x\n",  tree->op, rs->free_mask);
887 #endif
888         return TRUE;
889 }
890
891 static void
892 arch_allocate_regs (MonoFlowGraph *cfg)
893 {
894         int i, j, max_spillcount = 0;
895         
896         for (i = 0; i < cfg->block_count; i++) {
897                 GPtrArray *forest = cfg->bblocks [i].forest;
898                 int top;
899
900                 if (!cfg->bblocks [i].reached) /* unreachable code */
901                         continue;
902
903                 top = forest->len;
904
905                 for (j = 0; j < top; j++) {
906                         MBTree *t1 = (MBTree *) g_ptr_array_index (forest, j);
907                         int spillcount = 0;
908 #ifdef DEBUG_REGALLOC
909                         printf ("arch_allocate_regs start %d:%d %08x\n", i, j, cfg->rs->free_mask);
910 #endif
911                         if (!tree_allocate_regs (cfg, t1, 1, cfg->rs, 0, &spillcount)) {
912                                 mono_print_ctree (cfg, t1);
913                                 printf ("\n");
914                                 g_error ("register allocation failed");
915                         }
916
917                         max_spillcount = MAX (max_spillcount, spillcount);
918
919 #ifdef DEBUG_REGALLOC
920                         printf ("arch_allocate_regs end %d:%d %08x\n", i, j, cfg->rs->free_mask);
921 #endif
922                         g_assert (cfg->rs->free_mask == 0xffffffff);
923                 }
924         }
925
926         /* allocate space for spilled regs */
927
928         cfg->spillvars = mono_mempool_alloc0 (cfg->mp, sizeof (gint) *  max_spillcount);
929         cfg->spillcount = max_spillcount;
930
931         for (i = 0; i < max_spillcount; i++) {
932                 int spillvar;
933                 spillvar = arch_allocate_var (cfg, sizeof (gpointer), sizeof (gpointer),
934                                               MONO_TEMPVAR, VAL_I32);
935                 cfg->spillvars [i] = VARINFO (cfg, spillvar).offset;
936         }
937 }
938
939 static void
940 tree_emit (int goal, MonoFlowGraph *cfg, MBTree *tree, int *spillcount) 
941 {
942         MBTree *kids[10];
943         int ern = mono_burg_rule (tree->state, goal);
944         const guint16 *nts = mono_burg_nts [ern];
945         MBEmitFunc emit;
946         int offset;
947
948         mono_burg_kids (tree, ern, kids);
949
950         if (nts [0]) {
951                 if (nts [1]) {
952                         int spilloffset1, spilloffset2, spilloffset3;
953                         
954                         tree_emit (nts [0], cfg, kids [0], spillcount);
955
956                         if (kids [0]->spilled) {
957 #ifdef DEBUG_SPILLS
958                                 printf ("SPILL_REGS %d %03x %s.%s:%s\n", 
959                                         nts [0], cfg->code - cfg->start,
960                                         cfg->method->klass->name_space,
961                                         cfg->method->klass->name, cfg->method->name);
962
963                                 mono_print_ctree (cfg, kids [0]);printf ("\n\n");
964 #endif
965                                 spilloffset1 = 0;
966                                 spilloffset2 = 0;
967                                 spilloffset3 = 0;
968
969                                 if (kids [0]->reg1 != -1) {
970                                         spilloffset1 = cfg->spillvars [(*spillcount)++];
971                                         x86_mov_membase_reg (cfg->code, X86_EBP, spilloffset1, 
972                                                              kids [0]->reg1, 4);
973                                 }
974                                 if (kids [0]->reg2 != -1) {
975                                         spilloffset2 = cfg->spillvars [(*spillcount)++];
976                                         x86_mov_membase_reg (cfg->code, X86_EBP, spilloffset2, 
977                                                              kids [0]->reg2, 4);
978                                 }
979                                 if (kids [0]->reg3 != -1) {
980                                         spilloffset3 = cfg->spillvars [(*spillcount)++];
981                                         x86_mov_membase_reg (cfg->code, X86_EBP, spilloffset3, 
982                                                              kids [0]->reg3, 4);
983                                 }
984                         }
985
986                         tree_emit (nts [1], cfg, kids [1], spillcount);
987
988                         if (kids [0]->spilled) {
989
990 #ifdef DEBUG_SPILLS
991                                 printf ("RELOAD_REGS %03x %s.%s:%s\n", 
992                                         cfg->code - cfg->start,
993                                         cfg->method->klass->name_space,
994                                         cfg->method->klass->name, cfg->method->name);
995 #endif
996
997                                 if (kids [0]->reg3 != -1) 
998                                         x86_mov_reg_membase (cfg->code, kids [0]->reg3, X86_EBP, 
999                                                              spilloffset3, 4);
1000                                 if (kids [0]->reg2 != -1) 
1001                                         x86_mov_reg_membase (cfg->code, kids [0]->reg2, X86_EBP, 
1002                                                              spilloffset2, 4);
1003                                 if (kids [0]->reg1 != -1) 
1004                                         x86_mov_reg_membase (cfg->code, kids [0]->reg1, X86_EBP, 
1005                                                              spilloffset1, 4);
1006                         }
1007
1008                         if (nts [2]) {
1009                                 g_assert (!nts [3]);
1010                                 tree_emit (nts [2], cfg, kids [2], spillcount);
1011                         }
1012                 } else {
1013                         tree_emit (nts [0], cfg, kids [0], spillcount);
1014                 }
1015         }
1016
1017         g_assert ((*spillcount) <= cfg->spillcount);
1018
1019         tree->addr = offset = cfg->code - cfg->start;
1020
1021         /* we assume an instruction uses a maximum of 128 bytes */
1022         if ((cfg->code_size - offset) <= 128) {
1023                 int add = MIN (cfg->code_size, 128);
1024                 cfg->code_size += add;
1025                 mono_jit_stats.code_reallocs++;
1026                 cfg->start = g_realloc (cfg->start, cfg->code_size);
1027                 g_assert (cfg->start);
1028                 cfg->code = cfg->start + offset;
1029         }
1030
1031         if ((emit = mono_burg_func [ern]))
1032                 emit (tree, cfg);
1033
1034         g_assert ((cfg->code - cfg->start) < cfg->code_size);
1035 }
1036
1037 static void
1038 mono_emit_cfg (MonoFlowGraph *cfg)
1039 {
1040         int i, j, spillcount;
1041
1042         for (i = 0; i < cfg->block_count; i++) {
1043                 MonoBBlock *bb = &cfg->bblocks [i];
1044                 GPtrArray *forest = bb->forest;
1045                 int top;
1046
1047                 if (!bb->reached) /* unreachable code */
1048                         continue;
1049                 
1050                 top = forest->len;
1051
1052                 bb->addr = cfg->code - cfg->start;
1053           
1054                 for (j = 0; j < top; j++) {
1055                         MBTree *t1 = (MBTree *) g_ptr_array_index (forest, j);
1056                         
1057                         spillcount = 0;
1058                         tree_emit (1, cfg, t1, &spillcount);
1059                 }
1060         }
1061                 
1062         cfg->epilog = cfg->code - cfg->start;
1063 }
1064
1065 static void
1066 mono_compute_branches (MonoFlowGraph *cfg)
1067 {
1068         MonoJumpInfo *ji;
1069         guint8 *end;
1070         int i, j;
1071
1072         end = cfg->code;
1073
1074         for (j = 0; j < cfg->block_count; j++) {
1075                 MonoBBlock *bb = &cfg->bblocks [j];
1076                 GPtrArray *forest = bb->forest;
1077                 int top;
1078                 
1079                 if (!bb->reached) /* unreachable code */
1080                         continue;
1081
1082                 top = forest->len;
1083         
1084                 for (i = 0; i < top; i++) {
1085                         MBTree *t1 = (MBTree *) g_ptr_array_index (forest, i);
1086
1087                         if (t1->op == MB_TERM_SWITCH) {
1088                                 MonoBBlock **jt = (MonoBBlock **)t1->data.p;
1089                                 guint32 *rt = (guint32 *)t1->data.p;
1090                                 int m = *((guint32 *)t1->data.p) + 1;
1091                                 int k;
1092                                 
1093                                 for (k = 1; k <= m; k++)
1094                                         rt [k] = (int)(jt [k]->addr + cfg->start);
1095                                 
1096                                 /* emit the switch instruction again to update addresses */
1097                                 cfg->code = cfg->start + t1->addr;
1098                                 ((MBEmitFunc)t1->emit) (t1, cfg);
1099                         }
1100                 }
1101         }
1102
1103         cfg->code = end;
1104
1105         for (ji = cfg->jump_info; ji; ji = ji->next) {
1106                 unsigned char *ip = GUINT_TO_POINTER (GPOINTER_TO_UINT (ji->ip) + cfg->start);
1107                 unsigned char *target;
1108
1109                 switch (ji->type) {
1110                 case MONO_JUMP_INFO_BB:
1111                         target = ji->data.bb->addr + cfg->start;
1112                         break;
1113                 case MONO_JUMP_INFO_ABS:
1114                         target = ji->data.target;
1115                         break;
1116                 case MONO_JUMP_INFO_EPILOG:
1117                         target = cfg->epilog + cfg->start;
1118                         break;
1119                 case MONO_JUMP_INFO_IP:
1120                         *(unsigned char**)ip = ip;
1121                         continue;
1122                 default:
1123                         g_assert_not_reached ();
1124                 }
1125                 x86_patch (ip, target);
1126         }
1127
1128         /* patch the IP in the LMF saving code */
1129         if (cfg->lmfip_offset) {
1130                 *((guint32 *)(cfg->start + cfg->lmfip_offset)) =  
1131                         (gint32)(cfg->start + cfg->lmfip_offset);
1132         }
1133 }
1134
1135 void
1136 mono_add_jump_info (MonoFlowGraph *cfg, gpointer ip, MonoJumpInfoType type, gpointer target)
1137 {
1138         MonoJumpInfo *ji = mono_mempool_alloc (cfg->mp, sizeof (MonoJumpInfo));
1139
1140         ji->type = type;
1141         ji->ip = GUINT_TO_POINTER (GPOINTER_TO_UINT (ip) - GPOINTER_TO_UINT (cfg->start));
1142         ji->data.target = target;
1143         ji->next = cfg->jump_info;
1144
1145         cfg->jump_info = ji;
1146 }
1147
1148 MonoJitInfo *
1149 arch_jit_compile_cfg (MonoDomain *target_domain, MonoFlowGraph *cfg)
1150 {
1151         MonoJitInfo *ji;
1152         guint32 ls_used_mask = 0;
1153         MonoMethod *method = cfg->method;
1154
1155         ji = mono_mempool_alloc0 (target_domain->mp, sizeof (MonoJitInfo));
1156                 
1157         cfg->rs = mono_regset_new (X86_NREG);
1158         mono_regset_reserve_reg (cfg->rs, X86_ESP);
1159         mono_regset_reserve_reg (cfg->rs, X86_EBP);
1160
1161         /* we can use this regs for global register allocation */
1162         mono_regset_reserve_reg (cfg->rs, X86_EBX);
1163         mono_regset_reserve_reg (cfg->rs, X86_ESI);
1164
1165         if (mono_use_linear_scan) {
1166                 mono_linear_scan (cfg, &ls_used_mask);
1167                 cfg->rs->used_mask |= ls_used_mask;
1168         }
1169         
1170         if (mono_jit_dump_forest) {
1171                 int i;
1172                 printf ("FOREST %s\n", mono_method_full_name (method, TRUE));
1173                 for (i = 0; i < cfg->block_count; i++) {
1174                         printf ("BLOCK %d:\n", i);
1175                         mono_print_forest (cfg, cfg->bblocks [i].forest);
1176                 }
1177         }
1178                         
1179         if (!mono_label_cfg (cfg))
1180                 return NULL;
1181                 
1182         arch_allocate_regs (cfg);
1183
1184         /* align to 8 byte boundary */
1185         cfg->locals_size += 7;
1186         cfg->locals_size &= ~7;
1187
1188         arch_emit_prologue (cfg);
1189         cfg->prologue_end = cfg->code - cfg->start;
1190         mono_emit_cfg (cfg);
1191         arch_emit_epilogue (cfg);               
1192         cfg->epilogue_end = cfg->code - cfg->start;
1193
1194         mono_compute_branches (cfg);
1195
1196         ji->code_size = cfg->code - cfg->start;
1197         ji->used_regs = cfg->rs->used_mask;
1198         ji->method = method;
1199         ji->code_start = cfg->start;
1200
1201         return ji;
1202 }
1203