Merge pull request #2998 from lateralusX/jlorenss/win-x64-full-aot-support
[mono.git] / mono / mini / mini-amd64.h
1 #ifndef __MONO_MINI_AMD64_H__
2 #define __MONO_MINI_AMD64_H__
3
4 #include <mono/arch/amd64/amd64-codegen.h>
5 #include <mono/utils/mono-sigcontext.h>
6 #include <mono/utils/mono-context.h>
7 #include <glib.h>
8
9 #ifdef HOST_WIN32
10 #include <windows.h>
11 /* use SIG* defines if possible */
12 #ifdef HAVE_SIGNAL_H
13 #include <signal.h>
14 #endif
15
16 #if !defined(_MSC_VER)
17 /* sigcontext surrogate */
18 struct sigcontext {
19         guint64 eax;
20         guint64 ebx;
21         guint64 ecx;
22         guint64 edx;
23         guint64 ebp;
24         guint64 esp;
25     guint64 esi;
26         guint64 edi;
27         guint64 eip;
28 };
29 #endif
30
31 typedef void (* MonoW32ExceptionHandler) (int _dummy, EXCEPTION_POINTERS *info, void *context);
32 void win32_seh_init(void);
33 void win32_seh_cleanup(void);
34 void win32_seh_set_handler(int type, MonoW32ExceptionHandler handler);
35
36 #ifndef SIGFPE
37 #define SIGFPE 4
38 #endif
39
40 #ifndef SIGILL
41 #define SIGILL 8
42 #endif
43
44 #ifndef SIGSEGV
45 #define SIGSEGV 11
46 #endif
47
48 LONG CALLBACK seh_handler(EXCEPTION_POINTERS* ep);
49
50 #endif /* HOST_WIN32 */
51
52 #ifdef sun    // Solaris x86
53 #  undef SIGSEGV_ON_ALTSTACK
54 #  define MONO_ARCH_NOMAP32BIT
55
56 struct sigcontext {
57         unsigned short gs, __gsh;
58         unsigned short fs, __fsh;
59         unsigned short es, __esh;
60         unsigned short ds, __dsh;
61         unsigned long edi;
62         unsigned long esi;
63         unsigned long ebp;
64         unsigned long esp;
65         unsigned long ebx;
66         unsigned long edx;
67         unsigned long ecx;
68         unsigned long eax;
69         unsigned long trapno;
70         unsigned long err;
71         unsigned long eip;
72         unsigned short cs, __csh;
73         unsigned long eflags;
74         unsigned long esp_at_signal;
75         unsigned short ss, __ssh;
76         unsigned long fpstate[95];
77       unsigned long filler[5];
78 };
79 #endif  // sun, Solaris x86
80
81 #ifndef DISABLE_SIMD
82 #define MONO_ARCH_SIMD_INTRINSICS 1
83 #define MONO_ARCH_NEED_SIMD_BANK 1
84 #define MONO_ARCH_USE_SHARED_FP_SIMD_BANK 1
85 #endif
86
87
88
89 #if defined(__APPLE__)
90 #define MONO_ARCH_SIGNAL_STACK_SIZE MINSIGSTKSZ
91 #else
92 #define MONO_ARCH_SIGNAL_STACK_SIZE (16 * 1024)
93 #endif
94
95 #define MONO_ARCH_HAVE_RESTORE_STACK_SUPPORT 1
96
97 #define MONO_ARCH_CPU_SPEC mono_amd64_desc
98
99 #define MONO_MAX_IREGS 16
100
101 #define MONO_MAX_FREGS AMD64_XMM_NREG
102
103 #define MONO_ARCH_FP_RETURN_REG AMD64_XMM0
104
105 #ifdef TARGET_WIN32
106 /* xmm5 is used as a scratch register */
107 #define MONO_ARCH_CALLEE_FREGS 0x1f
108 /* xmm6:xmm15 */
109 #define MONO_ARCH_CALLEE_SAVED_FREGS (0xffff - 0x3f)
110 #define MONO_ARCH_FP_SCRATCH_REG AMD64_XMM5
111 #else
112 /* xmm15 is used as a scratch register */
113 #define MONO_ARCH_CALLEE_FREGS 0x7fff
114 #define MONO_ARCH_CALLEE_SAVED_FREGS 0
115 #define MONO_ARCH_FP_SCRATCH_REG AMD64_XMM15
116 #endif
117
118 #define MONO_MAX_XREGS MONO_MAX_FREGS
119
120 #define MONO_ARCH_CALLEE_XREGS MONO_ARCH_CALLEE_FREGS
121 #define MONO_ARCH_CALLEE_SAVED_XREGS MONO_ARCH_CALLEE_SAVED_FREGS
122
123
124 #define MONO_ARCH_CALLEE_REGS AMD64_CALLEE_REGS
125 #define MONO_ARCH_CALLEE_SAVED_REGS AMD64_CALLEE_SAVED_REGS
126
127 #define MONO_ARCH_USE_FPSTACK FALSE
128 #define MONO_ARCH_FPSTACK_SIZE 0
129
130 #define MONO_ARCH_INST_FIXED_REG(desc) ((desc == '\0') ? -1 : ((desc == 'i' ? -1 : ((desc == 'a') ? AMD64_RAX : ((desc == 's') ? AMD64_RCX : ((desc == 'd') ? AMD64_RDX : ((desc == 'A') ? MONO_AMD64_ARG_REG1 : -1)))))))
131
132 /* RDX is clobbered by the opcode implementation before accessing sreg2 */
133 #define MONO_ARCH_INST_SREG2_MASK(ins) (((ins [MONO_INST_CLOB] == 'a') || (ins [MONO_INST_CLOB] == 'd')) ? (1 << AMD64_RDX) : 0)
134
135 #define MONO_ARCH_INST_IS_REGPAIR(desc) FALSE
136 #define MONO_ARCH_INST_REGPAIR_REG2(desc,hreg1) (-1)
137
138 #define MONO_ARCH_FRAME_ALIGNMENT 16
139
140 /* fixme: align to 16byte instead of 32byte (we align to 32byte to get 
141  * reproduceable results for benchmarks */
142 #define MONO_ARCH_CODE_ALIGNMENT 32
143
144 /*This is the max size of the locals area of a given frame. I think 1MB is a safe default for now*/
145 #define MONO_ARCH_MAX_FRAME_SIZE 0x100000
146
147 struct MonoLMF {
148         /* 
149          * If the lowest bit is set, then this LMF has the rip field set. Otherwise,
150          * the rip field is not set, and the rsp field points to the stack location where
151          * the caller ip is saved.
152          * If the second lowest bit is set, then this is a MonoLMFExt structure, and
153          * the other fields are not valid.
154          * If the third lowest bit is set, then this is a MonoLMFTramp structure, and
155          * the 'rbp' field is not valid.
156          */
157         gpointer    previous_lmf;
158         guint64     rip;
159         guint64     rbp;
160         guint64     rsp;
161 };
162
163 /* LMF structure used by the JIT trampolines */
164 typedef struct {
165         struct MonoLMF lmf;
166         MonoContext *ctx;
167         gpointer lmf_addr;
168 } MonoLMFTramp;
169
170 typedef struct MonoCompileArch {
171         gint32 localloc_offset;
172         gint32 reg_save_area_offset;
173         gint32 stack_alloc_size;
174         gint32 sp_fp_offset;
175         guint32 saved_iregs;
176         gboolean omit_fp, omit_fp_computed;
177         gpointer cinfo;
178         gint32 async_point_count;
179         gpointer vret_addr_loc;
180 #ifdef HOST_WIN32
181         gpointer        unwindinfo;
182 #endif
183         gpointer seq_point_info_var;
184         gpointer ss_trigger_page_var;
185         gpointer ss_tramp_var;
186         gpointer bp_tramp_var;
187         gpointer lmf_var;
188 } MonoCompileArch;
189
190 #ifdef TARGET_WIN32
191 #define PARAM_REGS 4
192 #define FLOAT_PARAM_REGS 4
193
194 static AMD64_Reg_No param_regs [] = { AMD64_RCX, AMD64_RDX, AMD64_R8, AMD64_R9 };
195
196 static AMD64_Reg_No return_regs [] = { AMD64_RAX, AMD64_RDX };
197 #else
198 #define PARAM_REGS 6
199 #define FLOAT_PARAM_REGS 8
200
201 static AMD64_Reg_No param_regs [] = { AMD64_RDI, AMD64_RSI, AMD64_RDX, AMD64_RCX, AMD64_R8, AMD64_R9 };
202
203 static AMD64_Reg_No return_regs [] = { AMD64_RAX, AMD64_RDX };
204 #endif
205
206 typedef struct {
207         /* Method address to call */
208         gpointer addr;
209         /* The trampoline reads this, so keep the size explicit */
210         int ret_marshal;
211         /* If ret_marshal != NONE, this is the reg of the vret arg, else -1 (used in out case) */
212         /* Equivalent of vret_arg_slot in the x86 implementation. */
213         int vret_arg_reg;
214         /* The stack slot where the return value will be stored (used in in case) */
215         int vret_slot;
216         int stack_usage, map_count;
217         /* If not -1, then make a virtual call using this vtable offset */
218         int vcall_offset;
219         /* If 1, make an indirect call to the address in the rgctx reg */
220         int calli;
221         /* Whenever this is a in or an out call */
222         int gsharedvt_in;
223         /* Maps stack slots/registers in the caller to the stack slots/registers in the callee */
224         int map [MONO_ZERO_LEN_ARRAY];
225 } GSharedVtCallInfo;
226
227 /* Structure used by the sequence points in AOTed code */
228 typedef struct {
229         gpointer ss_tramp_addr;
230         gpointer bp_addrs [MONO_ZERO_LEN_ARRAY];
231 } SeqPointInfo;
232
233 typedef struct {
234         mgreg_t regs [PARAM_REGS];
235         mgreg_t res;
236         guint8 *ret;
237         double fregs [8];
238         mgreg_t has_fp;
239         guint8 buffer [256];
240 } DynCallArgs;
241
242 typedef enum {
243         ArgInIReg,
244         ArgInFloatSSEReg,
245         ArgInDoubleSSEReg,
246         ArgOnStack,
247         ArgValuetypeInReg,
248         ArgValuetypeAddrInIReg,
249         /* gsharedvt argument passed by addr */
250         ArgGSharedVtInReg,
251         ArgGSharedVtOnStack,
252         /* Variable sized gsharedvt argument passed/returned by addr */
253         ArgGsharedvtVariableInReg,
254         ArgNone /* only in pair_storage */
255 } ArgStorage;
256
257 typedef struct {
258         gint16 offset;
259         gint8  reg;
260         ArgStorage storage : 8;
261
262         /* Only if storage == ArgValuetypeInReg */
263         ArgStorage pair_storage [2];
264         gint8 pair_regs [2];
265         /* The size of each pair (bytes) */
266         int pair_size [2];
267         int nregs;
268         /* Only if storage == ArgOnStack */
269         int arg_size; // Bytes, will always be rounded up/aligned to 8 byte boundary
270 } ArgInfo;
271
272 typedef struct {
273         int nargs;
274         guint32 stack_usage;
275         guint32 reg_usage;
276         guint32 freg_usage;
277         gboolean need_stack_align;
278         gboolean gsharedvt;
279         /* The index of the vret arg in the argument list */
280         int vret_arg_index;
281         ArgInfo ret;
282         ArgInfo sig_cookie;
283         ArgInfo args [1];
284 } CallInfo;
285
286
287 #define MONO_CONTEXT_SET_LLVM_EXC_REG(ctx, exc) do { (ctx)->gregs [AMD64_RAX] = (gsize)exc; } while (0)
288 #define MONO_CONTEXT_SET_LLVM_EH_SELECTOR_REG(ctx, sel) do { (ctx)->gregs [AMD64_RDX] = (gsize)(sel); } while (0)
289
290 #define MONO_ARCH_INIT_TOP_LMF_ENTRY(lmf)
291
292 #ifdef _MSC_VER
293
294 #define MONO_INIT_CONTEXT_FROM_FUNC(ctx, start_func) do { \
295     guint64 stackptr; \
296         mono_arch_flush_register_windows (); \
297         stackptr = ((guint64)_AddressOfReturnAddress () - sizeof (void*));\
298         MONO_CONTEXT_SET_IP ((ctx), (start_func)); \
299         MONO_CONTEXT_SET_BP ((ctx), stackptr); \
300         MONO_CONTEXT_SET_SP ((ctx), stackptr); \
301 } while (0)
302
303 #else
304
305 /* 
306  * __builtin_frame_address () is broken on some older gcc versions in the presence of
307  * frame pointer elimination, see bug #82095.
308  */
309 #define MONO_INIT_CONTEXT_FROM_FUNC(ctx,start_func) do {        \
310         int tmp; \
311         guint64 stackptr = (guint64)&tmp; \
312                 mono_arch_flush_register_windows ();    \
313                 MONO_CONTEXT_SET_IP ((ctx), (start_func));      \
314                 MONO_CONTEXT_SET_BP ((ctx), stackptr);  \
315                 MONO_CONTEXT_SET_SP ((ctx), stackptr);  \
316         } while (0)
317
318 #endif
319
320 /*
321  * some icalls like mono_array_new_va needs to be called using a different 
322  * calling convention.
323  */
324 #define MONO_ARCH_VARARG_ICALLS 1
325
326 #if !defined( HOST_WIN32 ) && defined (HAVE_SIGACTION)
327
328 #define MONO_ARCH_USE_SIGACTION 1
329
330 #ifdef HAVE_WORKING_SIGALTSTACK
331
332 #define MONO_ARCH_SIGSEGV_ON_ALTSTACK
333
334 #endif
335
336 #endif /* !HOST_WIN32 */
337
338 #if !defined(__linux__)
339 #define MONO_ARCH_NOMAP32BIT 1
340 #endif
341
342 #ifdef TARGET_WIN32
343 #define MONO_AMD64_ARG_REG1 AMD64_RCX
344 #define MONO_AMD64_ARG_REG2 AMD64_RDX
345 #define MONO_AMD64_ARG_REG3 AMD64_R8
346 #define MONO_AMD64_ARG_REG4 AMD64_R9
347 #else
348 #define MONO_AMD64_ARG_REG1 AMD64_RDI
349 #define MONO_AMD64_ARG_REG2 AMD64_RSI
350 #define MONO_AMD64_ARG_REG3 AMD64_RDX
351 #define MONO_AMD64_ARG_REG4 AMD64_RCX
352 #endif
353
354 #define MONO_ARCH_NO_EMULATE_LONG_SHIFT_OPS
355 #define MONO_ARCH_NO_EMULATE_LONG_MUL_OPTS
356
357 #define MONO_ARCH_EMULATE_CONV_R8_UN    1
358 #define MONO_ARCH_EMULATE_FREM 1
359 #define MONO_ARCH_HAVE_IS_INT_OVERFLOW 1
360
361 #define MONO_ARCH_ENABLE_MONO_LMF_VAR 1
362 #define MONO_ARCH_HAVE_INVALIDATE_METHOD 1
363 #define MONO_ARCH_HAVE_FULL_AOT_TRAMPOLINES 1
364 #define MONO_ARCH_HAVE_TLS_GET (mono_amd64_have_tls_get ())
365 #define MONO_ARCH_IMT_REG AMD64_R10
366 #define MONO_ARCH_IMT_SCRATCH_REG AMD64_R11
367 #define MONO_ARCH_VTABLE_REG MONO_AMD64_ARG_REG1
368 /*
369  * We use r10 for the imt/rgctx register rather than r11 because r11 is
370  * used by the trampoline as a scratch register and hence might be
371  * clobbered across method call boundaries.
372  */
373 #define MONO_ARCH_RGCTX_REG MONO_ARCH_IMT_REG
374 #define MONO_ARCH_EXC_REG AMD64_RAX
375 #define MONO_ARCH_HAVE_CMOV_OPS 1
376 #define MONO_ARCH_HAVE_EXCEPTIONS_INIT 1
377 #define MONO_ARCH_HAVE_GENERALIZED_IMT_THUNK 1
378 #define MONO_ARCH_HAVE_LIVERANGE_OPS 1
379 #define MONO_ARCH_HAVE_SIGCTX_TO_MONOCTX 1
380 #define MONO_ARCH_HAVE_GET_TRAMPOLINES 1
381
382 #define MONO_ARCH_AOT_SUPPORTED 1
383 #define MONO_ARCH_SOFT_DEBUG_SUPPORTED 1
384
385 #define MONO_ARCH_SUPPORT_TASKLETS 1
386
387 #define MONO_ARCH_GSHARED_SUPPORTED 1
388 #define MONO_ARCH_DYN_CALL_SUPPORTED 1
389 #define MONO_ARCH_DYN_CALL_PARAM_AREA 0
390
391 #define MONO_ARCH_LLVM_SUPPORTED 1
392 #define MONO_ARCH_HAVE_HANDLER_BLOCK_GUARD 1
393 #define MONO_ARCH_HAVE_CARD_TABLE_WBARRIER 1
394 #define MONO_ARCH_HAVE_SETUP_RESUME_FROM_SIGNAL_HANDLER_CTX 1
395 #define MONO_ARCH_GC_MAPS_SUPPORTED 1
396 #define MONO_ARCH_HAVE_CONTEXT_SET_INT_REG 1
397 #define MONO_ARCH_HAVE_SETUP_ASYNC_CALLBACK 1
398 #define MONO_ARCH_HAVE_CREATE_LLVM_NATIVE_THUNK 1
399 #define MONO_ARCH_HAVE_OP_TAIL_CALL 1
400 #define MONO_ARCH_HAVE_TRANSLATE_TLS_OFFSET 1
401 #define MONO_ARCH_HAVE_DUMMY_INIT 1
402 #define MONO_ARCH_HAVE_SDB_TRAMPOLINES 1
403 #define MONO_ARCH_HAVE_PATCH_CODE_NEW 1
404 #define MONO_ARCH_HAVE_OP_GENERIC_CLASS_INIT 1
405
406 #if defined(TARGET_OSX) || defined(__linux__)
407 #define MONO_ARCH_HAVE_UNWIND_BACKTRACE 1
408 #endif
409
410 #if defined(TARGET_OSX) || defined(__linux__) || defined(TARGET_WIN32)
411 #define MONO_ARCH_HAVE_TLS_GET_REG 1
412 #endif
413
414 #if !defined (TARGET_WIN32)
415 #define MONO_ARCH_GSHAREDVT_SUPPORTED 1
416 #endif
417
418
419 #if defined(TARGET_APPLETVOS)
420 /* No signals */
421 #define MONO_ARCH_NEED_DIV_CHECK 1
422 #endif
423
424 /* Used for optimization, not complete */
425 #define MONO_ARCH_IS_OP_MEMBASE(opcode) ((opcode) == OP_X86_PUSH_MEMBASE)
426
427 #define MONO_ARCH_EMIT_BOUNDS_CHECK(cfg, array_reg, offset, index_reg) do { \
428             MonoInst *inst; \
429             MONO_INST_NEW ((cfg), inst, OP_AMD64_ICOMPARE_MEMBASE_REG); \
430             inst->inst_basereg = array_reg; \
431             inst->inst_offset = offset; \
432             inst->sreg2 = index_reg; \
433             MONO_ADD_INS ((cfg)->cbb, inst); \
434             MONO_EMIT_NEW_COND_EXC (cfg, LE_UN, "IndexOutOfRangeException"); \
435        } while (0)
436
437 void 
438 mono_amd64_patch (unsigned char* code, gpointer target);
439
440 void
441 mono_amd64_throw_exception (guint64 dummy1, guint64 dummy2, guint64 dummy3, guint64 dummy4,
442                                                         guint64 dummy5, guint64 dummy6,
443                                                         MonoContext *mctx, MonoObject *exc, gboolean rethrow);
444
445 void
446 mono_amd64_throw_corlib_exception (guint64 dummy1, guint64 dummy2, guint64 dummy3, guint64 dummy4,
447                                                                    guint64 dummy5, guint64 dummy6,
448                                                                    MonoContext *mctx, guint32 ex_token_index, gint64 pc_offset);
449
450 void
451 mono_amd64_resume_unwind (guint64 dummy1, guint64 dummy2, guint64 dummy3, guint64 dummy4,
452                                                   guint64 dummy5, guint64 dummy6,
453                                                   MonoContext *mctx, guint32 dummy7, gint64 dummy8);
454
455 gpointer
456 mono_amd64_start_gsharedvt_call (GSharedVtCallInfo *info, gpointer *caller, gpointer *callee, gpointer mrgctx_reg);
457
458 guint64
459 mono_amd64_get_original_ip (void);
460
461 guint8*
462 mono_amd64_emit_tls_get (guint8* code, int dreg, int tls_offset);
463
464 gboolean
465 mono_amd64_have_tls_get (void);
466
467 GSList*
468 mono_amd64_get_exception_trampolines (gboolean aot);
469
470 int
471 mono_amd64_get_tls_gs_offset (void) MONO_LLVM_INTERNAL;
472
473 #ifdef TARGET_WIN32
474
475 void mono_arch_unwindinfo_add_push_nonvol (gpointer* monoui, gpointer codebegin, gpointer nextip, guchar reg );
476 void mono_arch_unwindinfo_add_set_fpreg (gpointer* monoui, gpointer codebegin, gpointer nextip, guchar reg );
477 void mono_arch_unwindinfo_add_alloc_stack (gpointer* monoui, gpointer codebegin, gpointer nextip, guint size );
478 guint mono_arch_unwindinfo_get_size (gpointer monoui);
479 void mono_arch_unwindinfo_install_unwind_info (gpointer* monoui, gpointer code, guint code_size);
480
481 #define MONO_ARCH_HAVE_UNWIND_TABLE 1
482 #endif
483
484 CallInfo* mono_arch_get_call_info (MonoMemPool *mp, MonoMethodSignature *sig);
485
486 #endif /* __MONO_MINI_AMD64_H__ */  
487