2002-09-06 Dietmar Maurer <dietmar@ximian.com>
[mono.git] / mono / jit / emit-x86.c
1 /*
2  * emit-x86.c: Support functions for emitting x86 code
3  *
4  * Authors:
5  *   Dietmar Maurer (dietmar@ximian.com)
6  *   Miguel de Icaza (miguel@ximian.com)
7  *
8  * (C) 2001 Ximian, Inc.
9  */
10
11 #include <config.h>
12 #include <glib.h>
13
14 #include <mono/metadata/assembly.h>
15 #include <mono/metadata/loader.h>
16 #include <mono/metadata/cil-coff.h>
17 #include <mono/metadata/tabledefs.h>
18 #include <mono/metadata/class.h>
19 #include <mono/metadata/debug-helpers.h>
20 #include <mono/metadata/mono-endian.h>
21 #include <mono/arch/x86/x86-codegen.h>
22 #include <mono/metadata/profiler-private.h>
23
24 #include "jit.h"
25 #include "helpers.h"
26 #include "codegen.h"
27 #include "debug.h"
28
29
30 //#define DEBUG_REGALLOC
31 //#define DEBUG_SPILLS
32
33 const char *
34 arch_get_reg_name (int regnum)
35 {
36         switch (regnum) {
37         case 0:
38                 return "EAX";
39         case 1:
40                 return "ECX";
41         case 2:
42                 return "EDX";
43         case 3:
44                 return "EBX";
45         case 4:
46                 return "ESP";
47         case 5:
48                 return "EBP";
49         case 6:
50                 return "ESI";
51         case 7:
52                 return "EDI";
53         }
54
55         g_assert_not_reached ();
56         return NULL;
57 }
58
59
60 /* 
61  * we may want a x86-specific header or we 
62  * can just declare it extern in x86.brg.
63  */
64 int mono_x86_have_cmov = 0;
65
66 static int 
67 cpuid (int id, int* p_eax, int* p_ebx, int* p_ecx, int* p_edx)
68 {
69 #ifdef PIC
70         return 0;
71 #else
72         int have_cpuid = 0;
73         __asm__  __volatile__ (
74                 "pushfl\n"
75                 "popl %%eax\n"
76                 "movl %%eax, %%edx\n"
77                 "xorl $0x200000, %%eax\n"
78                 "pushl %%eax\n"
79                 "popfl\n"
80                 "pushfl\n"
81                 "popl %%eax\n"
82                 "xorl %%edx, %%eax\n"
83                 "andl $0x200000, %%eax\n"
84                 "movl %%eax, %0"
85                 : "=r" (have_cpuid)
86                 :
87                 : "%eax", "%edx"
88         );
89
90         if (have_cpuid) {
91                 __asm__ __volatile__ ("cpuid"
92                         : "=a" (*p_eax), "=b" (*p_ebx), "=c" (*p_ecx), "=d" (*p_edx)
93                         : "a" (id));
94                 return 1;
95         }
96         return 0;
97 #endif
98 }
99
100 void
101 mono_cpu_detect (void) {
102         int eax, ebx, ecx, edx;
103
104         /* Feature Flags function, flags returned in EDX. */
105         if (cpuid(1, &eax, &ebx, &ecx, &edx)) {
106                 if (edx & (1U << 15)) {
107                         mono_x86_have_cmov = 1;
108                 }
109         }
110 }
111
112 /*
113  * arch_get_argument_info:
114  * @csig:  a method signature
115  * @param_count: the number of parameters to consider
116  * @arg_info: an array to store the result infos
117  *
118  * Gathers information on parameters such as size, alignment and
119  * padding. arg_info should be large enought to hold param_count + 1 entries. 
120  *
121  * Returns the size of the activation frame.
122  */
123 int
124 arch_get_argument_info (MonoMethodSignature *csig, int param_count, MonoJitArgumentInfo *arg_info)
125 {
126         int k, frame_size = 0;
127         int size, align, pad;
128         int offset = 8;
129
130         if (MONO_TYPE_ISSTRUCT (csig->ret)) { 
131                 frame_size += sizeof (gpointer);
132                 offset += 4;
133         }
134
135         arg_info [0].offset = offset;
136
137         if (csig->hasthis) {
138                 frame_size += sizeof (gpointer);
139                 offset += 4;
140         }
141
142         arg_info [0].size = frame_size;
143
144         for (k = 0; k < param_count; k++) {
145                 
146                 if (csig->pinvoke)
147                         size = mono_type_native_stack_size (csig->params [k], &align);
148                 else
149                         size = mono_type_stack_size (csig->params [k], &align);
150                 
151                 frame_size += pad = (align - (frame_size & (align - 1))) & (align - 1); 
152                 arg_info [k].pad = pad;
153                 frame_size += size;
154                 arg_info [k + 1].pad = 0;
155                 arg_info [k + 1].size = size;
156                 offset += pad;
157                 arg_info [k + 1].offset = offset;
158                 offset += size;
159         }
160
161         align = MONO_FRAME_ALIGNMENT;
162         frame_size += pad = (align - (frame_size & (align - 1))) & (align - 1);
163         arg_info [k].pad = pad;
164
165         return frame_size;
166 }
167
168 static void
169 enter_method (MonoMethod *method, char *ebp)
170 {
171         int i, j;
172         MonoClass *class;
173         MonoObject *o;
174         MonoJitArgumentInfo *arg_info;
175         MonoMethodSignature *sig;
176         char *fname;
177
178         fname = mono_method_full_name (method, TRUE);
179         printf ("ENTER: %s\n(", fname);
180         g_free (fname);
181         
182         if (((int)ebp & (MONO_FRAME_ALIGNMENT - 1)) != 0) {
183                 g_error ("unaligned stack detected (%p)", ebp);
184         }
185
186         sig = method->signature;
187
188         arg_info = alloca (sizeof (MonoJitArgumentInfo) * (sig->param_count + 1));
189
190         arch_get_argument_info (sig, sig->param_count, arg_info);
191
192         if (MONO_TYPE_ISSTRUCT (method->signature->ret)) {
193                 g_assert (!method->signature->ret->byref);
194
195                 printf ("VALUERET:%p, ", *((gpointer *)(ebp + 8)));
196         }
197
198         if (method->signature->hasthis) {
199                 gpointer *this = (gpointer *)(ebp + arg_info [0].offset);
200                 if (method->klass->valuetype) {
201                         printf ("value:%p, ", *this);
202                 } else {
203                         o = *((MonoObject **)this);
204
205                         if (o) {
206                                 class = o->vtable->klass;
207
208                                 if (class == mono_defaults.string_class) {
209                                         printf ("this:[STRING:%p:%s], ", o, mono_string_to_utf8 ((MonoString *)o));
210                                 } else {
211                                         printf ("this:%p[%s.%s], ", o, class->name_space, class->name);
212                                 }
213                         } else 
214                                 printf ("this:NULL, ");
215                 }
216         }
217
218         for (i = 0; i < method->signature->param_count; ++i) {
219                 gpointer *cpos = (gpointer *)(ebp + arg_info [i + 1].offset);
220                 int size = arg_info [i + 1].size;
221
222                 MonoType *type = method->signature->params [i];
223                 
224                 if (type->byref) {
225                         printf ("[BYREF:%p], ", *cpos); 
226                 } else switch (type->type) {
227                         
228                 case MONO_TYPE_BOOLEAN:
229                 case MONO_TYPE_CHAR:
230                 case MONO_TYPE_I1:
231                 case MONO_TYPE_U1:
232                 case MONO_TYPE_I2:
233                 case MONO_TYPE_U2:
234                 case MONO_TYPE_I4:
235                 case MONO_TYPE_U4:
236                 case MONO_TYPE_I:
237                 case MONO_TYPE_U:
238                         printf ("%d, ", *((int *)(cpos)));
239                         break;
240                 case MONO_TYPE_STRING: {
241                         MonoString *s = *((MonoString **)cpos);
242                         if (s) {
243                                 g_assert (((MonoObject *)s)->vtable->klass == mono_defaults.string_class);
244                                 printf ("[STRING:%p:%s], ", s, mono_string_to_utf8 (s));
245                         } else 
246                                 printf ("[STRING:null], ");
247                         break;
248                 }
249                 case MONO_TYPE_CLASS:
250                 case MONO_TYPE_OBJECT: {
251                         o = *((MonoObject **)cpos);
252                         if (o) {
253                                 class = o->vtable->klass;
254                     
255                                 if (class == mono_defaults.string_class) {
256                                         printf ("[STRING:%p:%s], ", o, mono_string_to_utf8 ((MonoString *)o));
257                                 } else if (class == mono_defaults.int32_class) {
258                                         printf ("[INT32:%p:%d], ", o, *(gint32 *)((char *)o + sizeof (MonoObject)));
259                                 } else
260                                         printf ("[%s.%s:%p], ", class->name_space, class->name, o);
261                         } else {
262                                 printf ("%p, ", *((gpointer *)(cpos)));                         
263                         }
264                         break;
265                 }
266                 case MONO_TYPE_PTR:
267                 case MONO_TYPE_FNPTR:
268                 case MONO_TYPE_ARRAY:
269                 case MONO_TYPE_SZARRAY:
270                         printf ("%p, ", *((gpointer *)(cpos)));
271                         break;
272                 case MONO_TYPE_I8:
273                         printf ("%lld, ", *((gint64 *)(cpos)));
274                         break;
275                 case MONO_TYPE_R4:
276                         printf ("%f, ", *((float *)(cpos)));
277                         break;
278                 case MONO_TYPE_R8:
279                         printf ("%f, ", *((double *)(cpos)));
280                         break;
281                 case MONO_TYPE_VALUETYPE: 
282                         printf ("[");
283                         for (j = 0; j < size; j++)
284                                 printf ("%02x,", *((guint8*)cpos +j));
285                         printf ("], ");
286                         break;
287                 default:
288                         printf ("XX, ");
289                 }
290         }
291
292         printf (")\n");
293 }
294
295 static void
296 leave_method (MonoMethod *method, int edx, int eax, double test)
297 {
298         gint64 l;
299         char *fname;
300
301         fname = mono_method_full_name (method, TRUE);
302         printf ("LEAVE: %s", fname);
303         g_free (fname);
304
305         switch (method->signature->ret->type) {
306         case MONO_TYPE_VOID:
307                 break;
308         case MONO_TYPE_BOOLEAN:
309                 if (eax)
310                         printf ("TRUE:%d", eax);
311                 else 
312                         printf ("FALSE");
313                         
314                 break;
315         case MONO_TYPE_CHAR:
316         case MONO_TYPE_I1:
317         case MONO_TYPE_U1:
318         case MONO_TYPE_I2:
319         case MONO_TYPE_U2:
320         case MONO_TYPE_I4:
321         case MONO_TYPE_U4:
322         case MONO_TYPE_I:
323         case MONO_TYPE_U:
324                 printf ("EAX=%d", eax);
325                 break;
326         case MONO_TYPE_STRING: {
327                 MonoString *s = (MonoString *)eax;
328
329                 if (s) {
330                         g_assert (((MonoObject *)s)->vtable->klass == mono_defaults.string_class);
331                         printf ("[STRING:%p:%s]", s, mono_string_to_utf8 (s));
332                 } else 
333                         printf ("[STRING:null], ");
334                 break;
335         }
336         case MONO_TYPE_OBJECT: {
337                 MonoObject *o = (MonoObject *)eax;
338
339                 if (o) {
340                         if (o->vtable->klass == mono_defaults.boolean_class) {
341                                 printf ("[BOOLEAN:%p:%d]", o, *((guint8 *)o + sizeof (MonoObject)));            
342                         } else if  (o->vtable->klass == mono_defaults.int32_class) {
343                                 printf ("[INT32:%p:%d]", o, *((gint32 *)((char *)o + sizeof (MonoObject))));    
344                         } else if  (o->vtable->klass == mono_defaults.int64_class) {
345                                 printf ("[INT64:%p:%lld]", o, *((gint64 *)((char *)o + sizeof (MonoObject))));  
346                         } else
347                                 printf ("[%s.%s:%p]", o->vtable->klass->name_space, o->vtable->klass->name, o);
348                 } else
349                         printf ("[OBJECT:%p]", o);
350                
351                 break;
352         }
353         case MONO_TYPE_CLASS:
354         case MONO_TYPE_PTR:
355         case MONO_TYPE_FNPTR:
356         case MONO_TYPE_ARRAY:
357         case MONO_TYPE_SZARRAY:
358                 printf ("EAX=%p", (gpointer)eax);
359                 break;
360         case MONO_TYPE_I8:
361                 *((gint32 *)&l) = eax;
362                 *((gint32 *)&l + 1) = edx;
363                 printf ("EAX/EDX=%lld", l);
364                 break;
365         case MONO_TYPE_R8:
366                 printf ("FP=%f\n", test);
367                 break;
368         default:
369                 printf ("(unknown return type)");
370         }
371
372         printf ("\n");
373 }
374
375 /**
376  * arch_emit_prologue:
377  * @cfg: pointer to status information
378  *
379  * Emits the function prolog.
380  */
381 static void
382 arch_emit_prologue (MonoFlowGraph *cfg)
383 {
384         MonoMethod *method = cfg->method;
385         MonoMethodHeader *header = ((MonoMethodNormal *)method)->header;
386         int i, j, k, alloc_size, pos;
387
388         x86_push_reg (cfg->code, X86_EBP);
389         x86_mov_reg_reg (cfg->code, X86_EBP, X86_ESP, 4);
390
391         alloc_size = cfg->locals_size;
392         pos = 0;
393
394         if (method->save_lmf) {
395                 
396                 pos += sizeof (MonoLMF);
397
398                 /* save the current IP */
399                 cfg->lmfip_offset = cfg->code + 1 - cfg->start;
400                 x86_push_imm (cfg->code, 0);
401                 /* save all caller saved regs */
402                 x86_push_reg (cfg->code, X86_EBX);
403                 x86_push_reg (cfg->code, X86_EDI);
404                 x86_push_reg (cfg->code, X86_ESI);
405                 x86_push_reg (cfg->code, X86_EBP);
406
407                 /* save method info */
408                 x86_push_imm (cfg->code, method);
409         
410                 /* get the address of lmf for the current thread */
411                 mono_add_jump_info (cfg, cfg->code, MONO_JUMP_INFO_ABS, mono_get_lmf_addr);
412                 x86_call_code (cfg->code, 0);
413
414                 /* push lmf */
415                 x86_push_reg (cfg->code, X86_EAX); 
416                 /* push *lfm (previous_lmf) */
417                 x86_push_membase (cfg->code, X86_EAX, 0);
418                 /* *(lmf) = ESP */
419                 x86_mov_membase_reg (cfg->code, X86_EAX, 0, X86_ESP, 4);
420         }
421
422 #if 0
423         /* activation frame alignment check */
424         x86_mov_reg_reg (cfg->code, X86_EAX, X86_ESP, 4);
425         x86_alu_reg_imm (cfg->code, X86_AND, X86_EAX, MONO_FRAME_ALIGNMENT - 1);
426         x86_alu_reg_imm (cfg->code, X86_CMP, X86_EAX, 0);
427         x86_branch32 (cfg->code, X86_CC_EQ, 1, FALSE);
428         x86_breakpoint (cfg->code);
429
430 #endif
431
432         if (mono_regset_reg_used (cfg->rs, X86_EBX)) {
433                 x86_push_reg (cfg->code, X86_EBX);
434                 pos += 4;
435         }
436
437         if (mono_regset_reg_used (cfg->rs, X86_EDI)) {
438                 x86_push_reg (cfg->code, X86_EDI);
439                 pos += 4;
440         }
441
442         if (mono_regset_reg_used (cfg->rs, X86_ESI)) {
443                 x86_push_reg (cfg->code, X86_ESI);
444                 pos += 4;
445         }
446
447         alloc_size -= pos;
448
449         if (alloc_size)
450                 x86_alu_reg_imm (cfg->code, X86_SUB, X86_ESP, alloc_size);
451
452         if (mono_jit_trace_calls) {
453                 x86_push_reg (cfg->code, X86_EBP);
454                 x86_push_imm (cfg->code, cfg->method);
455                 x86_mov_reg_imm (cfg->code, X86_EAX, enter_method);
456                 x86_call_reg (cfg->code, X86_EAX);
457                 x86_alu_reg_imm (cfg->code, X86_ADD, X86_ESP, 8);
458         }
459         if (mono_jit_profile) {
460                 x86_push_imm (cfg->code, cfg->method);
461                 x86_mov_reg_imm (cfg->code, X86_EAX, mono_profiler_method_enter);
462                 x86_call_reg (cfg->code, X86_EAX);
463                 x86_alu_reg_imm (cfg->code, X86_ADD, X86_ESP, 4);
464         }
465
466         /* initialize local vars */
467         if (header->num_locals) {
468                 gboolean unassigned_locals = TRUE;
469
470                 if (cfg->bblocks [0].live_in_set) {
471                         i = mono_bitset_find_first (cfg->bblocks [0].live_in_set, 
472                                                     cfg->locals_start_index - 1);
473                         unassigned_locals = (i >= 0 && i < cfg->locals_start_index + 
474                                              header->num_locals);
475                 }
476
477                 if (unassigned_locals && header->init_locals) {
478                         MonoVarInfo *vi = &VARINFO (cfg, cfg->locals_start_index + header->num_locals - 1);
479                         int offset = vi->offset;  
480                         int size = - offset;
481                         int inited = 0;
482                         
483                         /* do not clear caller saved registers */
484                         size -= 12;
485
486                         for (i = 0; i < header->num_locals; ++i) {
487                                 MonoVarInfo *rv = &VARINFO (cfg, cfg->locals_start_index + i);
488
489                                 if (rv->reg >= 0) {
490                                         int ind = 1 << rv->reg;
491                                         if (!(inited & ind))
492                                                 x86_alu_reg_reg (cfg->code, X86_XOR, rv->reg, rv->reg);
493                                         inited |= ind;
494                                 }
495                         }
496
497                         if (size == 1 || size == 2 || size == 4) {
498                                 x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, size);
499                                 return;
500                         }
501                         
502                         i = size / 4;
503                         j = size % 4;
504
505                         if (i < 3) {
506                                 for (k = 0; k < i; k++) {
507                                         x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, 4);
508                                         offset += 4;
509                                 }
510
511                                 if (j & 2) {
512                                         x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, 2);
513                                         offset += 2;
514                                 }
515                                 if (j & 1)
516                                         x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, 1);
517                                 return;
518                         }
519                         
520                         if (i) {
521                                 if (!mono_regset_reg_used (cfg->rs, X86_EDI)) 
522                                         x86_push_reg (cfg->code, X86_EDI);
523                                 x86_lea_membase (cfg->code, X86_EDI, X86_EBP, offset);
524                                 x86_alu_reg_reg (cfg->code, X86_XOR, X86_EAX, X86_EAX);
525                                 x86_mov_reg_imm (cfg->code, X86_ECX, i);
526                                 x86_cld (cfg->code);
527                                 x86_prefix (cfg->code, X86_REP_PREFIX);
528                                 x86_stosl (cfg->code);
529                                 for (i = 0; i < j; i++)
530                                         x86_stosb (cfg->code);
531                                 if (!mono_regset_reg_used (cfg->rs, X86_EDI)) 
532                                         x86_pop_reg (cfg->code, X86_EDI);
533                         } else {
534
535                                 g_assert (j == 3);
536                                 x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, 2);
537                                 x86_mov_membase_imm (cfg->code, X86_EBP, offset + 2, 0, 1);
538                         }
539                         
540                 } else {
541
542                         /* we always need to initialize object pointers */
543
544                         for (i = 0; i < header->num_locals; ++i) {
545                                 MonoType *t = header->locals [i];
546                                 int offset = VARINFO (cfg, cfg->locals_start_index + i).offset;  
547
548                                 if (t->byref) {
549                                         x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, 4);
550                                         continue;
551                                 }
552
553                                 switch (t->type) {
554                                 case MONO_TYPE_STRING:
555                                 case MONO_TYPE_CLASS:
556                                 case MONO_TYPE_ARRAY:
557                                 case MONO_TYPE_SZARRAY:
558                                 case MONO_TYPE_OBJECT:
559                                         x86_mov_membase_imm (cfg->code, X86_EBP, offset, 0, 4);
560                                         break;
561                                 }
562
563                         }
564                 }
565         }
566 }
567
568 /**
569  * arch_emit_epilogue:
570  * @cfg: pointer to status information
571  *
572  * Emits the function epilog.
573  */
574 static void
575 arch_emit_epilogue (MonoFlowGraph *cfg)
576 {
577         int pos;
578         /*
579          * note: with trace and profiling the value on the FP stack may get clobbered.
580          */
581         if (mono_jit_trace_calls) {
582                 x86_fld_reg (cfg->code, 0);
583                 x86_alu_reg_imm (cfg->code, X86_SUB, X86_ESP, 8);
584                 x86_fst_membase (cfg->code, X86_ESP, 0, TRUE, TRUE);
585                 x86_push_reg (cfg->code, X86_EAX);
586                 x86_push_reg (cfg->code, X86_EDX);
587                 x86_push_imm (cfg->code, cfg->method);
588                 x86_mov_reg_imm (cfg->code, X86_EAX, leave_method);
589                 x86_call_reg (cfg->code, X86_EAX);
590                 x86_alu_reg_imm (cfg->code, X86_ADD, X86_ESP, 4);
591                 x86_pop_reg (cfg->code, X86_EDX);
592                 x86_pop_reg (cfg->code, X86_EAX);
593                 x86_alu_reg_imm (cfg->code, X86_ADD, X86_ESP, 8);
594         }
595         if (mono_jit_profile) {
596                 x86_push_reg (cfg->code, X86_EAX);
597                 x86_push_reg (cfg->code, X86_EDX);
598                 x86_push_imm (cfg->code, cfg->method);
599                 x86_mov_reg_imm (cfg->code, X86_EAX, mono_profiler_method_leave);
600                 x86_call_reg (cfg->code, X86_EAX);
601                 x86_alu_reg_imm (cfg->code, X86_ADD, X86_ESP, 4);
602                 x86_pop_reg (cfg->code, X86_EDX);
603                 x86_pop_reg (cfg->code, X86_EAX);
604         }
605
606         pos = 0;
607         
608         if (cfg->method->save_lmf)
609                 pos = -sizeof (MonoLMF);
610         
611         if (mono_regset_reg_used (cfg->rs, X86_EBX)) {
612                 pos -= 4;
613         }
614         if (mono_regset_reg_used (cfg->rs, X86_EDI)) {
615                 pos -= 4;
616         }
617         if (mono_regset_reg_used (cfg->rs, X86_ESI)) {
618                 pos -= 4;
619         }
620
621         x86_lea_membase (cfg->code, X86_ESP, X86_EBP, pos);
622
623         if (mono_regset_reg_used (cfg->rs, X86_ESI)) {
624                 x86_pop_reg (cfg->code, X86_ESI);
625         }
626         if (mono_regset_reg_used (cfg->rs, X86_EDI)) {
627                 x86_pop_reg (cfg->code, X86_EDI);
628         }
629         if (mono_regset_reg_used (cfg->rs, X86_EBX)) {
630                 x86_pop_reg (cfg->code, X86_EBX);
631         }
632
633         if (cfg->method->save_lmf) {
634                 /* ebx = previous_lmf */
635                 x86_pop_reg (cfg->code, X86_EBX);
636                 /* edi = lmf */
637                 x86_pop_reg (cfg->code, X86_EDI);
638                 /* *(lmf) = previous_lmf */
639                 x86_mov_membase_reg (cfg->code, X86_EDI, 0, X86_EBX, 4);
640
641                 /* discard method info */
642                 x86_pop_reg (cfg->code, X86_ESI);
643
644                 /* restore caller saved regs */
645                 x86_pop_reg (cfg->code, X86_EBP);
646                 x86_pop_reg (cfg->code, X86_ESI);
647                 x86_pop_reg (cfg->code, X86_EDI);
648                 x86_pop_reg (cfg->code, X86_EBX);
649
650         }
651
652         x86_leave (cfg->code);
653         x86_ret (cfg->code);
654 }
655
656 static void
657 init_varinfo (MonoFlowGraph *cfg, MonoVarInfo *vi)
658 {
659         vi->range.last_use.abs_pos = 0;
660         vi->range.first_use.pos.bid = 0xffff;
661         vi->range.first_use.pos.tid = 0;        
662         vi->isvolatile = 0;
663         vi->reg = -1;
664         vi->varnum = cfg->varinfo->len;
665 }
666
667 int
668 arch_allocate_arg (MonoFlowGraph *cfg, MonoJitArgumentInfo *info, MonoValueType type)
669 {
670         MonoVarInfo vi;
671
672         mono_jit_stats.allocate_var++;
673
674         init_varinfo (cfg, &vi);
675         vi.isvolatile = 1;
676         
677         SET_VARINFO (vi, type, MONO_ARGVAR, info->offset, info->size);
678         g_array_append_val (cfg->varinfo, vi);
679
680         return cfg->varinfo->len - 1;
681 }
682
683 int
684 arch_allocate_var (MonoFlowGraph *cfg, int size, int align, MonoVarType vartype, MonoValueType type)
685 {
686         MonoVarInfo vi;
687
688         mono_jit_stats.allocate_var++;
689
690         init_varinfo (cfg, &vi);
691
692         if (size != sizeof (gpointer))
693                 vi.isvolatile = 1;
694         
695         cfg->locals_size += size;
696         cfg->locals_size += align - 1;
697         cfg->locals_size &= ~(align - 1);
698
699         SET_VARINFO (vi, type, vartype, - cfg->locals_size, size);
700         g_array_append_val (cfg->varinfo, vi);
701
702         return cfg->varinfo->len - 1;
703 }
704
705 static gboolean
706 mono_label_cfg (MonoFlowGraph *cfg)
707 {
708         int i, j;
709
710         for (i = 0; i < cfg->block_count; i++) {
711                 GPtrArray *forest = cfg->bblocks [i].forest;
712                 int top;
713
714                 if (!cfg->bblocks [i].reached) /* unreachable code */
715                         continue;
716                 
717                 top = forest->len;
718
719                 for (j = 0; j < top; j++) {
720                         MBTree *t1 = (MBTree *) g_ptr_array_index (forest, j);
721                         MBState *mbstate;
722                         
723                         mbstate =  mono_burg_label (t1, cfg);
724
725                         if (!mbstate) {
726                                 if (mono_debug_format != MONO_DEBUG_FORMAT_NONE)
727                                         return FALSE;
728                                 g_warning ("tree does not match in %s: 0x%04x",
729                                            mono_method_full_name (cfg->method, TRUE), t1->cli_addr);
730                                 mono_print_ctree (cfg, t1); printf ("\n\n");
731
732                                 mono_print_forest (cfg, forest);
733                                 g_assert_not_reached ();
734                         }
735                 }
736         }
737
738         return TRUE;
739 }
740
741 static gboolean
742 tree_allocate_regs (MonoFlowGraph *cfg, MBTree *tree, int goal, MonoRegSet *rs, 
743                     guint8 exclude_mask, int *spillcount) 
744 {
745         MBTree *kids[10];
746         int ern = mono_burg_rule (tree->state, goal);
747         const guint16 *nts = mono_burg_nts [ern];
748         guint8 left_exclude_mask = 0, right_exclude_mask = 0;
749         int i;
750         
751 #ifdef DEBUG_REGALLOC
752         printf ("tree_allocate_regs start %d %08x %d %d\n",  tree->op, rs->free_mask, goal, 
753                 (nts [0] && kids [0] == tree));
754 #endif
755
756         mono_burg_kids (tree, ern, kids);
757
758         switch (tree->op) {
759         case MB_TERM_SHL:
760         case MB_TERM_SHR:
761         case MB_TERM_SHR_UN:
762                 exclude_mask |= (1 << X86_ECX);
763                 left_exclude_mask |= (1 << X86_ECX);
764                 break;
765         case MB_TERM_MUL:
766         case MB_TERM_MUL_OVF:
767         case MB_TERM_MUL_OVF_UN:
768         case MB_TERM_DIV:
769         case MB_TERM_DIV_UN:
770         case MB_TERM_REM:
771         case MB_TERM_REM_UN:
772                 if (goal == MB_NTERM_reg) {
773                         left_exclude_mask |= (1 << X86_EDX);
774                         right_exclude_mask |= (1 << X86_EDX) | (1 << X86_EAX);
775                 }
776                 break;
777         default:
778                 break;
779         }
780
781         if (nts [0] && kids [0] == tree) {
782                 /* chain rule */
783                 if (!tree_allocate_regs (cfg, kids [0], nts [0], rs, exclude_mask, spillcount))
784                         return FALSE;
785                 return TRUE;
786         }
787
788         if (tree->spilled) {
789                 if (tree->reg1 >= 0)
790                         (*spillcount)--;
791                 if (tree->reg2 >= 0)
792                         (*spillcount)--;
793                 if (tree->reg3 >= 0)
794                         (*spillcount)--;
795         }
796
797         tree->reg1 = -1;
798         tree->reg2 = -1;
799         tree->reg3 = -1;
800         
801         tree->spilled = 0;
802  
803         if (nts [0]) {
804                 if (nts [1]) { /* two kids */
805                         MonoRegSet saved_rs;
806
807                         if (!tree_allocate_regs (cfg, kids [0], nts [0], rs, left_exclude_mask, spillcount))
808                                 return FALSE;
809
810                         saved_rs = *rs;
811
812                         if (!tree_allocate_regs (cfg, kids [1], nts [1], rs, right_exclude_mask, spillcount)) {
813
814 #ifdef DEBUG_REGALLOC
815                                 printf ("tree_allocate_regs try 1 failed %d %d %d %d\n", 
816                                         nts [1], kids [1]->reg1,
817                                         kids [1]->reg2,kids [1]->reg3);
818 #endif
819                                 *rs = saved_rs;
820
821                                 if (kids [0]->reg1 != -1) {
822                                         right_exclude_mask |= 1 << kids [0]->reg1;
823                                         (*spillcount)++;
824                                 }
825                                 if (kids [0]->reg2 != -1) {
826                                         right_exclude_mask |= 1 << kids [0]->reg2;
827                                         (*spillcount)++;
828                                 }
829                                 if (kids [0]->reg3 != -1) {
830                                         right_exclude_mask |= 1 << kids [0]->reg3;
831                                         (*spillcount)++;
832                                 }
833
834                                 mono_regset_free_reg (rs, kids [0]->reg1);
835                                 mono_regset_free_reg (rs, kids [0]->reg2);
836                                 mono_regset_free_reg (rs, kids [0]->reg3);
837
838                                 kids [0]->spilled = 1;
839
840                                 if (!tree_allocate_regs (cfg, kids [1], nts [1], rs, right_exclude_mask, spillcount)) {
841 #ifdef DEBUG_REGALLOC
842                                         printf ("tree_allocate_regs try 2 failed\n");
843 #endif
844                                         return FALSE;
845                                 }
846 #ifdef DEBUG_REGALLOC
847                                 printf ("tree_allocate_regs try 2 succesfull\n");
848 #endif
849                         }
850
851                         if (nts [2]) {
852                                 if (nts [3]) /* we cant handle four kids */
853                                         g_assert_not_reached ();
854
855                                 if (!tree_allocate_regs (cfg, kids [2], nts [2], rs, right_exclude_mask, spillcount))
856                                         return FALSE;
857                                 
858                         }
859
860                 } else { /* one kid */
861                         if (!tree_allocate_regs (cfg, kids [0], nts [0], rs, left_exclude_mask, spillcount))
862                                 return FALSE;                   
863                 }
864         }
865
866
867         for (i = 0; nts [i]; i++) {
868                 mono_regset_free_reg (rs, kids [i]->reg1);
869                 mono_regset_free_reg (rs, kids [i]->reg2);
870                 mono_regset_free_reg (rs, kids [i]->reg3);
871         }
872
873         tree->emit = mono_burg_func [ern];
874
875         switch (tree->op) {
876         case MB_TERM_CALL_I4:
877         case MB_TERM_CALL_I8:
878         case MB_TERM_CALL_R8:
879         // case MB_TERM_CALL_VOID :
880                 if ((tree->reg1 = mono_regset_alloc_reg (rs, X86_EAX, exclude_mask)) == -1)
881                         return FALSE;
882                 if ((tree->reg2 = mono_regset_alloc_reg (rs, X86_EDX, exclude_mask)) == -1)
883                         return FALSE;
884                 if ((tree->reg3 = mono_regset_alloc_reg (rs, X86_ECX, exclude_mask)) == -1)
885                         return FALSE;
886                 return TRUE;
887         }
888
889         switch (goal) {
890         case MB_NTERM_reg:
891                 switch (tree->op) {
892                 case MB_TERM_MUL_OVF_UN:
893                 case MB_TERM_DIV:
894                 case MB_TERM_DIV_UN:
895                 case MB_TERM_REM:
896                 case MB_TERM_REM_UN:
897                         if ((tree->reg1 = mono_regset_alloc_reg (rs, X86_EAX, exclude_mask)) == -1)
898                                 return FALSE;                   
899                         if ((tree->reg2 = mono_regset_alloc_reg (rs, X86_EDX, exclude_mask)) == -1)
900                                 return FALSE;
901                         break;
902                 default:
903                         if ((tree->reg1 = mono_regset_alloc_reg (rs, -1, exclude_mask)) == -1)
904                                 return FALSE;
905                 }
906                 break;
907
908         case MB_NTERM_lreg:
909                 switch (tree->op) {
910                 case MB_TERM_MUL:
911                 case MB_TERM_MUL_OVF:
912                 case MB_TERM_MUL_OVF_UN:
913                 case MB_TERM_DIV:
914                 case MB_TERM_DIV_UN:
915                 case MB_TERM_REM:
916                 case MB_TERM_REM_UN:
917                         if ((tree->reg1 = mono_regset_alloc_reg (rs, X86_EAX, exclude_mask)) == -1)
918                                 return FALSE;                   
919                         if ((tree->reg2 = mono_regset_alloc_reg (rs, X86_EDX, exclude_mask)) == -1)
920                                 return FALSE;
921                         break;
922                 default:
923                         if ((tree->reg1 = mono_regset_alloc_reg (rs, -1, exclude_mask)) == -1)
924                                 return FALSE;
925                         if ((tree->reg2 = mono_regset_alloc_reg (rs, -1, exclude_mask)) == -1)
926                                 return FALSE;
927                 }
928                 break;
929
930         case MB_NTERM_freg:
931                 /* fixme: allocate floating point registers */
932                 break;
933       
934         case MB_NTERM_addr:
935                 if (tree->op == MB_TERM_ADD) {
936                         if ((tree->reg1 = mono_regset_alloc_reg (rs, tree->left->reg1, exclude_mask)) == -1)
937                                 return FALSE;
938                         if ((tree->reg2 = mono_regset_alloc_reg (rs, tree->right->reg1, exclude_mask)) == -1)
939                                 return FALSE;
940                 }
941                 break;
942                 
943         case MB_NTERM_base:
944                 if (tree->op == MB_TERM_ADD) {
945                         if ((tree->reg1 = mono_regset_alloc_reg (rs, tree->left->reg1, exclude_mask)) == -1)
946                                 return FALSE;
947                 }
948                 break;
949                
950         case MB_NTERM_index:
951                 if (tree->op == MB_TERM_SHL ||
952                     tree->op == MB_TERM_MUL) {
953                         if ((tree->reg1 = mono_regset_alloc_reg (rs, tree->left->reg1, exclude_mask)) == -1)
954                                 return FALSE;
955                 }
956                 break;
957                
958         default:
959                 /* do nothing */
960                 break;
961         }
962
963 #ifdef DEBUG_REGALLOC
964         printf ("tree_allocate_regs end %d %08x\n",  tree->op, rs->free_mask);
965 #endif
966         return TRUE;
967 }
968
969 static void
970 arch_allocate_regs (MonoFlowGraph *cfg)
971 {
972         int i, j, max_spillcount = 0;
973         
974         for (i = 0; i < cfg->block_count; i++) {
975                 GPtrArray *forest = cfg->bblocks [i].forest;
976                 int top;
977
978                 if (!cfg->bblocks [i].reached) /* unreachable code */
979                         continue;
980
981                 top = forest->len;
982
983                 for (j = 0; j < top; j++) {
984                         MBTree *t1 = (MBTree *) g_ptr_array_index (forest, j);
985                         int spillcount = 0;
986 #ifdef DEBUG_REGALLOC
987                         printf ("arch_allocate_regs start %d:%d %08x\n", i, j, cfg->rs->free_mask);
988 #endif
989                         if (!tree_allocate_regs (cfg, t1, 1, cfg->rs, 0, &spillcount)) {
990                                 mono_print_ctree (cfg, t1);
991                                 printf ("\n");
992                                 g_error ("register allocation failed");
993                         }
994
995                         max_spillcount = MAX (max_spillcount, spillcount);
996
997 #ifdef DEBUG_REGALLOC
998                         printf ("arch_allocate_regs end %d:%d %08x\n", i, j, cfg->rs->free_mask);
999 #endif
1000                         g_assert (cfg->rs->free_mask == 0xffffffff);
1001                 }
1002         }
1003
1004         /* allocate space for spilled regs */
1005
1006         cfg->spillvars = mono_mempool_alloc0 (cfg->mp, sizeof (gint) *  max_spillcount);
1007         cfg->spillcount = max_spillcount;
1008
1009         for (i = 0; i < max_spillcount; i++) {
1010                 int spillvar;
1011                 spillvar = arch_allocate_var (cfg, sizeof (gpointer), sizeof (gpointer),
1012                                               MONO_TEMPVAR, VAL_I32);
1013                 cfg->spillvars [i] = VARINFO (cfg, spillvar).offset;
1014         }
1015 }
1016
1017 static void
1018 tree_emit (int goal, MonoFlowGraph *cfg, MBTree *tree, int *spillcount) 
1019 {
1020         MBTree *kids[10];
1021         int ern = mono_burg_rule (tree->state, goal);
1022         const guint16 *nts = mono_burg_nts [ern];
1023         MBEmitFunc emit;
1024         int offset;
1025
1026         mono_burg_kids (tree, ern, kids);
1027
1028         if (nts [0]) {
1029                 if (nts [1]) {
1030                         int spilloffset1, spilloffset2, spilloffset3;
1031                         
1032                         tree_emit (nts [0], cfg, kids [0], spillcount);
1033
1034                         if (kids [0]->spilled) {
1035 #ifdef DEBUG_SPILLS
1036                                 printf ("SPILL_REGS %d %03x %s.%s:%s\n", 
1037                                         nts [0], cfg->code - cfg->start,
1038                                         cfg->method->klass->name_space,
1039                                         cfg->method->klass->name, cfg->method->name);
1040
1041                                 mono_print_ctree (cfg, kids [0]);printf ("\n\n");
1042 #endif
1043                                 spilloffset1 = 0;
1044                                 spilloffset2 = 0;
1045                                 spilloffset3 = 0;
1046
1047                                 if (kids [0]->reg1 != -1) {
1048                                         spilloffset1 = cfg->spillvars [(*spillcount)++];
1049                                         x86_mov_membase_reg (cfg->code, X86_EBP, spilloffset1, 
1050                                                              kids [0]->reg1, 4);
1051                                 }
1052                                 if (kids [0]->reg2 != -1) {
1053                                         spilloffset2 = cfg->spillvars [(*spillcount)++];
1054                                         x86_mov_membase_reg (cfg->code, X86_EBP, spilloffset2, 
1055                                                              kids [0]->reg2, 4);
1056                                 }
1057                                 if (kids [0]->reg3 != -1) {
1058                                         spilloffset3 = cfg->spillvars [(*spillcount)++];
1059                                         x86_mov_membase_reg (cfg->code, X86_EBP, spilloffset3, 
1060                                                              kids [0]->reg3, 4);
1061                                 }
1062                         }
1063
1064                         tree_emit (nts [1], cfg, kids [1], spillcount);
1065
1066                         if (kids [0]->spilled) {
1067
1068 #ifdef DEBUG_SPILLS
1069                                 printf ("RELOAD_REGS %03x %s.%s:%s\n", 
1070                                         cfg->code - cfg->start,
1071                                         cfg->method->klass->name_space,
1072                                         cfg->method->klass->name, cfg->method->name);
1073 #endif
1074
1075                                 if (kids [0]->reg3 != -1) 
1076                                         x86_mov_reg_membase (cfg->code, kids [0]->reg3, X86_EBP, 
1077                                                              spilloffset3, 4);
1078                                 if (kids [0]->reg2 != -1) 
1079                                         x86_mov_reg_membase (cfg->code, kids [0]->reg2, X86_EBP, 
1080                                                              spilloffset2, 4);
1081                                 if (kids [0]->reg1 != -1) 
1082                                         x86_mov_reg_membase (cfg->code, kids [0]->reg1, X86_EBP, 
1083                                                              spilloffset1, 4);
1084                         }
1085
1086                         if (nts [2]) {
1087                                 g_assert (!nts [3]);
1088                                 tree_emit (nts [2], cfg, kids [2], spillcount);
1089                         }
1090                 } else {
1091                         tree_emit (nts [0], cfg, kids [0], spillcount);
1092                 }
1093         }
1094
1095         g_assert ((*spillcount) <= cfg->spillcount);
1096
1097         tree->addr = offset = cfg->code - cfg->start;
1098
1099         /* we assume an instruction uses a maximum of 128 bytes */
1100         if ((cfg->code_size - offset) <= 128) {
1101                 int add = MIN (cfg->code_size, 128);
1102                 cfg->code_size += add;
1103                 mono_jit_stats.code_reallocs++;
1104                 cfg->start = g_realloc (cfg->start, cfg->code_size);
1105                 g_assert (cfg->start);
1106                 cfg->code = cfg->start + offset;
1107         }
1108
1109         if ((emit = mono_burg_func [ern]))
1110                 emit (tree, cfg);
1111
1112         g_assert ((cfg->code - cfg->start) < cfg->code_size);
1113 }
1114
1115 static void
1116 mono_emit_cfg (MonoFlowGraph *cfg)
1117 {
1118         int i, j, spillcount;
1119
1120         for (i = 0; i < cfg->block_count; i++) {
1121                 MonoBBlock *bb = &cfg->bblocks [i];
1122                 GPtrArray *forest = bb->forest;
1123                 int top;
1124
1125                 if (!bb->reached) /* unreachable code */
1126                         continue;
1127                 
1128                 top = forest->len;
1129
1130                 bb->addr = cfg->code - cfg->start;
1131           
1132                 for (j = 0; j < top; j++) {
1133                         MBTree *t1 = (MBTree *) g_ptr_array_index (forest, j);
1134                         
1135                         spillcount = 0;
1136                         tree_emit (1, cfg, t1, &spillcount);
1137                 }
1138         }
1139                 
1140         cfg->epilog = cfg->code - cfg->start;
1141 }
1142
1143 static void
1144 mono_compute_branches (MonoFlowGraph *cfg)
1145 {
1146         MonoJumpInfo *ji;
1147         guint8 *end;
1148         int i, j;
1149
1150         end = cfg->code;
1151
1152         for (j = 0; j < cfg->block_count; j++) {
1153                 MonoBBlock *bb = &cfg->bblocks [j];
1154                 GPtrArray *forest = bb->forest;
1155                 int top;
1156                 
1157                 if (!bb->reached) /* unreachable code */
1158                         continue;
1159
1160                 top = forest->len;
1161         
1162                 for (i = 0; i < top; i++) {
1163                         MBTree *t1 = (MBTree *) g_ptr_array_index (forest, i);
1164
1165                         if (t1->op == MB_TERM_SWITCH) {
1166                                 MonoBBlock **jt = (MonoBBlock **)t1->data.p;
1167                                 guint32 *rt = (guint32 *)t1->data.p;
1168                                 int m = *((guint32 *)t1->data.p) + 1;
1169                                 int k;
1170                                 
1171                                 for (k = 1; k <= m; k++)
1172                                         rt [k] = (int)(jt [k]->addr + cfg->start);
1173                                 
1174                                 /* emit the switch instruction again to update addresses */
1175                                 cfg->code = cfg->start + t1->addr;
1176                                 ((MBEmitFunc)t1->emit) (t1, cfg);
1177                         }
1178                 }
1179         }
1180
1181         cfg->code = end;
1182
1183         for (ji = cfg->jump_info; ji; ji = ji->next) {
1184                 unsigned char *ip = GUINT_TO_POINTER (GPOINTER_TO_UINT (ji->ip) + cfg->start);
1185                 unsigned char *target;
1186
1187                 switch (ji->type) {
1188                 case MONO_JUMP_INFO_BB:
1189                         target = ji->data.bb->addr + cfg->start;
1190                         break;
1191                 case MONO_JUMP_INFO_ABS:
1192                         target = ji->data.target;
1193                         break;
1194                 case MONO_JUMP_INFO_EPILOG:
1195                         target = cfg->epilog + cfg->start;
1196                         break;
1197                 case MONO_JUMP_INFO_IP:
1198                         *(unsigned char**)ip = ip;
1199                         continue;
1200                 default:
1201                         g_assert_not_reached ();
1202                 }
1203                 x86_patch (ip, target);
1204         }
1205
1206         /* patch the IP in the LMF saving code */
1207         if (cfg->lmfip_offset) {
1208                 *((guint32 *)(cfg->start + cfg->lmfip_offset)) =  
1209                         (gint32)(cfg->start + cfg->lmfip_offset);
1210         }
1211 }
1212
1213 void
1214 mono_add_jump_info (MonoFlowGraph *cfg, gpointer ip, MonoJumpInfoType type, gpointer target)
1215 {
1216         MonoJumpInfo *ji = mono_mempool_alloc (cfg->mp, sizeof (MonoJumpInfo));
1217
1218         ji->type = type;
1219         ji->ip = GUINT_TO_POINTER (GPOINTER_TO_UINT (ip) - GPOINTER_TO_UINT (cfg->start));
1220         ji->data.target = target;
1221         ji->next = cfg->jump_info;
1222
1223         cfg->jump_info = ji;
1224 }
1225
1226 MonoJitInfo *
1227 arch_jit_compile_cfg (MonoDomain *target_domain, MonoFlowGraph *cfg)
1228 {
1229         MonoJitInfo *ji;
1230         guint32 ls_used_mask = 0;
1231         MonoMethod *method = cfg->method;
1232         int offset, gap;
1233
1234         ji = mono_mempool_alloc0 (target_domain->mp, sizeof (MonoJitInfo));
1235                 
1236         cfg->rs = mono_regset_new (X86_NREG);
1237         mono_regset_reserve_reg (cfg->rs, X86_ESP);
1238         mono_regset_reserve_reg (cfg->rs, X86_EBP);
1239
1240         /* we can use this regs for global register allocation */
1241         mono_regset_reserve_reg (cfg->rs, X86_EBX);
1242         mono_regset_reserve_reg (cfg->rs, X86_ESI);
1243
1244         if (mono_use_linear_scan) {
1245                 mono_linear_scan (cfg, &ls_used_mask);
1246                 cfg->rs->used_mask |= ls_used_mask;
1247         }
1248         
1249         if (mono_jit_dump_forest) {
1250                 int i;
1251                 printf ("FOREST %s\n", mono_method_full_name (method, TRUE));
1252                 for (i = 0; i < cfg->block_count; i++) {
1253                         printf ("BLOCK %d:\n", i);
1254                         mono_print_forest (cfg, cfg->bblocks [i].forest);
1255                 }
1256         }
1257                         
1258         if (!mono_label_cfg (cfg))
1259                 return NULL;
1260                 
1261         arch_allocate_regs (cfg);
1262
1263         /* align to 8 byte boundary */
1264         cfg->locals_size += 7;
1265         cfg->locals_size &= ~7;
1266
1267         arch_emit_prologue (cfg);
1268         cfg->prologue_end = cfg->code - cfg->start;
1269         mono_emit_cfg (cfg);
1270         arch_emit_epilogue (cfg);               
1271         cfg->epilogue_end = cfg->code - cfg->start;
1272
1273         offset = cfg->code - cfg->start;
1274         gap = cfg->code_size - offset;
1275         if (gap > 0) {
1276                 char *org = cfg->start;
1277 #if 0
1278                 cfg->start = g_realloc (cfg->start, offset);
1279 #else
1280                 cfg->start = mono_mempool_alloc (target_domain->code_mp, offset);
1281                 memcpy (cfg->start, org, offset);
1282                 g_free (org);
1283 #endif
1284                 cfg->code_size = offset;
1285                 cfg->code = cfg->start + offset;
1286         }
1287
1288         mono_compute_branches (cfg);
1289
1290         ji->code_size = cfg->code - cfg->start;
1291         ji->used_regs = cfg->rs->used_mask;
1292         ji->method = method;
1293         ji->code_start = cfg->start;
1294
1295         return ji;
1296 }
1297