This commit was manufactured by cvs2svn to create branch 'mono-1-0'.
[mono.git] / mono / arch / x86 / x86-codegen.h
index c08df80ea9c7b4cecb4c1dfd66096c5253f0616a..e0b12ff5378beb24b78541eb787bccf7561c6ede 100644 (file)
@@ -1,8 +1,16 @@
-/* Copyright (C)  2000 Intel Corporation.  All rights reserved.
-   Copyright (C)  2001 Ximian, Inc. 
-//
-// $Header: /home/miguel/third-conversion/public/mono/mono/arch/x86/x86-codegen.h,v 1.25 2002/03/30 11:19:25 dietmar Exp $
-*/
+/*
+ * x86-codegen.h: Macros for generating x86 code
+ *
+ * Authors:
+ *   Paolo Molaro (lupus@ximian.com)
+ *   Intel Corporation (ORP Project)
+ *   Sergey Chaban (serge@wildwestsoftware.com)
+ *   Dietmar Maurer (dietmar@ximian.com)
+ *   Patrik Torstensson
+ * 
+ * Copyright (C)  2000 Intel Corporation.  All rights reserved.
+ * Copyright (C)  2001, 2002 Ximian, Inc.
+ */
 
 #ifndef X86_H
 #define X86_H
@@ -41,6 +49,10 @@ typedef enum {
 typedef enum {
        X86_SHLD,
        X86_SHLR,
+       X86_ROL = 0,
+       X86_ROR = 1,
+       X86_RCL = 2,
+       X86_RCR = 3,
        X86_SHL = 4,
        X86_SHR = 5,
        X86_SAR = 7,
@@ -78,6 +90,39 @@ typedef enum {
        X86_CC_NO = 11,
        X86_NCC
 } X86_CC;
+
+/* FP status */
+enum {
+       X86_FP_C0 = 0x100,
+       X86_FP_C1 = 0x200,
+       X86_FP_C2 = 0x400,
+       X86_FP_C3 = 0x4000,
+       X86_FP_CC_MASK = 0x4500
+};
+
+/* FP control word */
+enum {
+       X86_FPCW_INVOPEX_MASK = 0x1,
+       X86_FPCW_DENOPEX_MASK = 0x2,
+       X86_FPCW_ZERODIV_MASK = 0x4,
+       X86_FPCW_OVFEX_MASK   = 0x8,
+       X86_FPCW_UNDFEX_MASK  = 0x10,
+       X86_FPCW_PRECEX_MASK  = 0x20,
+       X86_FPCW_PRECC_MASK   = 0x300,
+       X86_FPCW_ROUNDC_MASK  = 0xc00,
+
+       /* values for precision control */
+       X86_FPCW_PREC_SINGLE    = 0,
+       X86_FPCW_PREC_DOUBLE    = 0x200,
+       X86_FPCW_PREC_EXTENDED  = 0x300,
+
+       /* values for rounding control */
+       X86_FPCW_ROUND_NEAREST  = 0,
+       X86_FPCW_ROUND_DOWN     = 0x400,
+       X86_FPCW_ROUND_UP       = 0x800,
+       X86_FPCW_ROUND_TOZERO   = 0xc00
+};
+
 /*
 // prefix code
 */
@@ -92,6 +137,8 @@ typedef enum {
        X86_ES_PREFIX = 0x26,
        X86_FS_PREFIX = 0x64,
        X86_GS_PREFIX = 0x65,
+       X86_UNLIKELY_PREFIX = 0x2E,
+       X86_LIKELY_PREFIX = 0x3E,
        X86_OPERAND_PREFIX = 0x66,
        X86_ADDRESS_PREFIX = 0x67
 } X86_Prefix;
@@ -150,6 +197,8 @@ typedef union {
 #define X86_IS_SCRATCH(reg) (X86_CALLER_REGS & (1 << (reg))) /* X86_EAX, X86_ECX, or X86_EDX */
 #define X86_IS_CALLEE(reg)  (X86_CALLEE_REGS & (1 << (reg)))   /* X86_ESI, X86_EDI, X86_EBX, or X86_EBP */
 
+#define X86_IS_BYTE_REG(reg) ((reg) < 4)
+
 /*
 // Frame structure:
 //
@@ -208,6 +257,7 @@ typedef union {
 #define x86_is_imm16(imm)            (((int)(imm) >= -(1<<16) && (int)(imm) <= ((1<<16)-1)))
 
 #define x86_reg_emit(inst,r,regno)   do { x86_address_byte ((inst), 3, (r), (regno)); } while (0)
+#define x86_reg8_emit(inst,r,regno,is_rh,is_rnoh)   do {x86_address_byte ((inst), 3, (is_rh)?((r)|4):(r), (is_rnoh)?((regno)|4):(regno));} while (0)
 #define x86_regp_emit(inst,r,regno)  do { x86_address_byte ((inst), 0, (r), (regno)); } while (0)
 #define x86_mem_emit(inst,r,disp)    do { x86_address_byte ((inst), 0, (r), 5); x86_imm_emit32((inst), (disp)); } while (0)
 
@@ -254,21 +304,39 @@ typedef union {
                        x86_address_byte ((inst), (shift), (indexreg), (basereg));      \
                        x86_imm_emit8 ((inst), (disp)); \
                } else {        \
-                       x86_address_byte ((inst), 0, (r), 4);   \
+                       x86_address_byte ((inst), 2, (r), 4);   \
                        x86_address_byte ((inst), (shift), (indexreg), 5);      \
                        x86_imm_emit32 ((inst), (disp));        \
                }       \
        } while (0)
 
-/* disp will need to be relative to the start position... */
-#define x86_patch(ins,disp)    \
+/*
+ * target is the position in the code where to jump to:
+ * target = code;
+ * .. output loop code...
+ * x86_mov_reg_imm (code, X86_EAX, 0);
+ * loop = code;
+ * x86_loop (code, -1);
+ * ... finish method
+ *
+ * patch displacement
+ * x86_patch (loop, target);
+ *
+ * ins should point at the start of the instruction that encodes a target.
+ * the instruction is inspected for validity and the correct displacement
+ * is inserted.
+ */
+#define x86_patch(ins,target)  \
        do {    \
                unsigned char* pos = (ins) + 1; \
-               int size = 0;   \
-               switch (*(ins)) {       \
-               case 0xe9: ++size; break;       \
-               case 0x0f: ++size; ++pos; break;        \
-               case 0xeb:      \
+               int disp, size = 0;     \
+               switch (*(unsigned char*)(ins)) {       \
+               case 0xe8: case 0xe9: ++size; break; /* call, jump32 */ \
+               case 0x0f: if (!(*pos >= 0x70 && *pos <= 0x8f)) assert (0);     \
+                  ++size; ++pos; break; /* prefix for 32-bit disp */   \
+               case 0xe0: case 0xe1: case 0xe2: /* loop */     \
+               case 0xeb: /* jump8 */  \
+               /* conditional jump opcodes */  \
                case 0x70: case 0x71: case 0x72: case 0x73:     \
                case 0x74: case 0x75: case 0x76: case 0x77:     \
                case 0x78: case 0x79: case 0x7a: case 0x7b:     \
@@ -276,8 +344,10 @@ typedef union {
                        break;  \
                default: assert (0);    \
                }       \
-               if (size) x86_imm_emit32 (pos, (disp)); \
-               else x86_imm_emit8 (pos, (disp));       \
+               disp = (target) - pos;  \
+               if (size) x86_imm_emit32 (pos, disp - 4);       \
+               else if (x86_is_imm8 (disp - 1)) x86_imm_emit8 (pos, disp - 1); \
+               else assert (0);        \
        } while (0)
 
 #define x86_breakpoint(inst) \
@@ -288,6 +358,10 @@ typedef union {
 #define x86_cld(inst) do { *(inst)++ =(unsigned char)0xfc; } while (0)
 #define x86_stosb(inst) do { *(inst)++ =(unsigned char)0xaa; } while (0)
 #define x86_stosl(inst) do { *(inst)++ =(unsigned char)0xab; } while (0)
+#define x86_stosd(inst) x86_stosl((inst))
+#define x86_movsb(inst) do { *(inst)++ =(unsigned char)0xa4; } while (0)
+#define x86_movsl(inst) do { *(inst)++ =(unsigned char)0xa5; } while (0)
+#define x86_movsd(inst) x86_movsl((inst))
 
 #define x86_prefix(inst,p) do { *(inst)++ =(unsigned char) (p); } while (0)
 
@@ -473,6 +547,21 @@ typedef union {
                x86_reg_emit ((inst), (dreg), (reg));   \
        } while (0)
 
+/**
+ * @x86_alu_reg8_reg8:
+ * Supports ALU operations between two 8-bit registers.
+ * dreg := dreg opc reg
+ * X86_Reg_No enum is used to specify the registers.
+ * Additionally is_*_h flags are used to specify what part
+ * of a given 32-bit register is used - high (TRUE) or low (FALSE).
+ * For example: dreg = X86_EAX, is_dreg_h = TRUE -> use AH
+ */
+#define x86_alu_reg8_reg8(inst,opc,dreg,reg,is_dreg_h,is_reg_h)        \
+       do {    \
+               *(inst)++ = (((unsigned char)(opc)) << 3) + 2;  \
+               x86_reg8_emit ((inst), (dreg), (reg), (is_dreg_h), (is_reg_h)); \
+       } while (0)
+
 #define x86_alu_reg_mem(inst,opc,reg,mem)      \
        do {    \
                *(inst)++ = (((unsigned char)(opc)) << 3) + 3;  \
@@ -900,6 +989,7 @@ typedef union {
 #define x86_widen_reg(inst,dreg,reg,is_signed,is_half) \
        do {    \
                unsigned char op = 0xb6;        \
+                g_assert (is_half ||  X86_IS_BYTE_REG (reg)); \
                *(inst)++ = (unsigned char)0x0f;        \
                if ((is_signed)) op += 0x08;    \
                if ((is_half)) op += 0x01;      \
@@ -946,6 +1036,12 @@ typedef union {
                x86_mem_emit ((inst), (opc), (mem));    \
        } while (0)
 
+#define x86_fp_op_membase(inst,opc,basereg,disp,is_double)     \
+       do {    \
+               *(inst)++ = (is_double) ? (unsigned char)0xdc : (unsigned char)0xd8;    \
+               x86_membase_emit ((inst), (opc), (basereg), (disp));    \
+       } while (0)
+
 #define x86_fp_op(inst,opc,index)      \
        do {    \
                *(inst)++ = (unsigned char)0xd8;        \
@@ -959,6 +1055,19 @@ typedef union {
                *(inst)++ = (unsigned char)0xc0+(map[(opc)]<<3)+((index)&0x07); \
        } while (0)
 
+/**
+ * @x86_fp_int_op_membase
+ * Supports FPU operations between ST(0) and integer operand in memory.
+ * Operation encoded using X86_FP_Opcode enum.
+ * Operand is addressed by [basereg + disp].
+ * is_int specifies whether operand is int32 (TRUE) or int16 (FALSE).
+ */
+#define x86_fp_int_op_membase(inst,opc,basereg,disp,is_int)    \
+       do {    \
+               *(inst)++ = (is_int) ? (unsigned char)0xda : (unsigned char)0xde;       \
+               x86_membase_emit ((inst), opc, (basereg), (disp));      \
+       } while (0)
+
 #define x86_fstp(inst,index)   \
        do {    \
                *(inst)++ = (unsigned char)0xdd;        \
@@ -971,6 +1080,12 @@ typedef union {
                *(inst)++ = (unsigned char)0xd9;        \
        } while (0)
 
+#define x86_fucompp(inst)      \
+       do {    \
+               *(inst)++ = (unsigned char)0xda;        \
+               *(inst)++ = (unsigned char)0xe9;        \
+       } while (0)
+
 #define x86_fnstsw(inst)       \
        do {    \
                *(inst)++ = (unsigned char)0xdf;        \
@@ -1019,12 +1134,30 @@ typedef union {
                *(inst)++ = (unsigned char)0xc8 + ((index) & 0x07);     \
        } while (0)
 
+#define x86_fcomi(inst,index)  \
+       do {    \
+               *(inst)++ = (unsigned char)0xdb;        \
+               *(inst)++ = (unsigned char)0xf0 + ((index) & 0x07);     \
+       } while (0)
+
 #define x86_fcomip(inst,index) \
        do {    \
                *(inst)++ = (unsigned char)0xdf;        \
                *(inst)++ = (unsigned char)0xf0 + ((index) & 0x07);     \
        } while (0)
 
+#define x86_fucomi(inst,index) \
+       do {    \
+               *(inst)++ = (unsigned char)0xdb;        \
+               *(inst)++ = (unsigned char)0xe8 + ((index) & 0x07);     \
+       } while (0)
+
+#define x86_fucomip(inst,index)        \
+       do {    \
+               *(inst)++ = (unsigned char)0xdf;        \
+               *(inst)++ = (unsigned char)0xe8 + ((index) & 0x07);     \
+       } while (0)
+
 #define x86_fld(inst,mem,is_double)    \
        do {    \
                *(inst)++ = (is_double) ? (unsigned char)0xdd : (unsigned char)0xd9;    \
@@ -1089,6 +1222,12 @@ typedef union {
                *(inst)++ = (unsigned char)0xe8;        \
        } while (0)
 
+#define x86_fldpi(inst)        \
+       do {    \
+               *(inst)++ = (unsigned char)0xd9;        \
+               *(inst)++ = (unsigned char)0xeb;        \
+       } while (0)
+
 #define x86_fst(inst,mem,is_double,pop_stack)  \
        do {    \
                *(inst)++ = (is_double) ? (unsigned char)0xdd: (unsigned char)0xd9;     \
@@ -1137,6 +1276,31 @@ typedef union {
                }       \
        } while (0)
 
+#define x86_fstsw(inst)        \
+       do {    \
+                       *(inst)++ = (unsigned char)0x9b;        \
+                       *(inst)++ = (unsigned char)0xdf;        \
+                       *(inst)++ = (unsigned char)0xe0;        \
+       } while (0)
+
+/**
+ * @x86_fist_membase
+ * Converts content of ST(0) to integer and stores it at memory location
+ * addressed by [basereg + disp].
+ * is_int specifies whether destination is int32 (TRUE) or int16 (FALSE).
+ */
+#define x86_fist_membase(inst,basereg,disp,is_int)     \
+       do {    \
+               if ((is_int)) { \
+                       *(inst)++ = (unsigned char)0xdb;        \
+                       x86_membase_emit ((inst), 2, (basereg), (disp));        \
+               } else {        \
+                       *(inst)++ = (unsigned char)0xdf;        \
+                       x86_membase_emit ((inst), 2, (basereg), (disp));        \
+               }       \
+       } while (0)
+
+
 #define x86_push_reg(inst,reg) \
        do {    \
                *(inst)++ = (unsigned char)0x50 + (reg);        \
@@ -1194,6 +1358,24 @@ typedef union {
 #define x86_popad(inst)  do { *(inst)++ = (unsigned char)0x61; } while (0)
 #define x86_popfd(inst)  do { *(inst)++ = (unsigned char)0x9d; } while (0)
 
+#define x86_loop(inst,imm)     \
+       do {    \
+               *(inst)++ = (unsigned char)0xe2;        \
+               x86_imm_emit8 ((inst), (imm));  \
+       } while (0)
+
+#define x86_loope(inst,imm)    \
+       do {    \
+               *(inst)++ = (unsigned char)0xe1;        \
+               x86_imm_emit8 ((inst), (imm));  \
+       } while (0)
+
+#define x86_loopne(inst,imm)   \
+       do {    \
+               *(inst)++ = (unsigned char)0xe0;        \
+               x86_imm_emit8 ((inst), (imm));  \
+       } while (0)
+
 #define x86_jump32(inst,imm)   \
        do {    \
                *(inst)++ = (unsigned char)0xe9;        \
@@ -1292,6 +1474,7 @@ typedef union {
 
 #define x86_set_reg(inst,cond,reg,is_signed)   \
        do {    \
+                g_assert (X86_IS_BYTE_REG (reg)); \
                *(inst)++ = (unsigned char)0x0f;        \
                if ((is_signed))        \
                        *(inst)++ = x86_cc_signed_map [(cond)] + 0x20;  \
@@ -1406,6 +1589,8 @@ typedef union {
 #define x86_fsin(inst) do { *(inst)++ = (unsigned char)0xd9; *(inst)++ = (unsigned char)0xfe; } while (0)
 #define x86_fcos(inst) do { *(inst)++ = (unsigned char)0xd9; *(inst)++ = (unsigned char)0xff; } while (0)
 #define x86_fabs(inst) do { *(inst)++ = (unsigned char)0xd9; *(inst)++ = (unsigned char)0xe1; } while (0)
+#define x86_ftst(inst) do { *(inst)++ = (unsigned char)0xd9; *(inst)++ = (unsigned char)0xe4; } while (0)
+#define x86_fxam(inst) do { *(inst)++ = (unsigned char)0xd9; *(inst)++ = (unsigned char)0xe5; } while (0)
 #define x86_fpatan(inst) do { *(inst)++ = (unsigned char)0xd9; *(inst)++ = (unsigned char)0xf3; } while (0)
 #define x86_fprem(inst) do { *(inst)++ = (unsigned char)0xd9; *(inst)++ = (unsigned char)0xf8; } while (0)
 #define x86_fprem1(inst) do { *(inst)++ = (unsigned char)0xd9; *(inst)++ = (unsigned char)0xf5; } while (0)