* src/vm/jit/x86_64/emit.c: Changed x86_64 function prefix to
[cacao.git] / src / vm / jit / x86_64 / codegen.h
index 9abd96fa1dabc0e9be0e6aa847b2553915e25a60..65b94d3c6124c9188ac3dd38b239075ee47dcded 100644 (file)
@@ -1,9 +1,9 @@
-/* jit/i386/codegen.h - code generation macros and definitions for x86_64
+/* src/vm/jit/x86_64/codegen.h - code generation macros for x86_64
 
-   Copyright (C) 1996, 1997, 1998, 1999, 2000, 2001, 2002, 2003
-   R. Grafl, A. Krall, C. Kruegel, C. Oates, R. Obermaisser,
-   M. Probst, S. Ring, E. Steiner, C. Thalinger, D. Thuernbeck,
-   P. Tomsich, J. Wenninger
+   Copyright (C) 1996-2005, 2006 R. Grafl, A. Krall, C. Kruegel,
+   C. Oates, R. Obermaisser, M. Platter, M. Probst, S. Ring,
+   E. Steiner, C. Thalinger, D. Thuernbeck, P. Tomsich, C. Ullrich,
+   J. Wenninger, Institut f. Computersprachen - TU Wien
 
    This file is part of CACAO.
 
 
    You should have received a copy of the GNU General Public License
    along with this program; if not, write to the Free Software
-   Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA
-   02111-1307, USA.
+   Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
+   02110-1301, USA.
 
-   Contact: cacao@complang.tuwien.ac.at
+   Contact: cacao@cacaojvm.org
 
    Authors: Andreas Krall
             Christian Thalinger
 
-   $Id: codegen.h 559 2003-11-02 23:20:06Z twisti $
+   Changes:
 
-*/
-
-
-#ifndef _CODEGEN_H
-#define _CODEGEN_H
-
-#include "jit.h"
-
-
-/* x86_64 register numbers */
-#define RIP    -1
-#define RAX    0
-#define RCX    1
-#define RDX    2
-#define RBX    3
-#define RSP    4
-#define RBP    5
-#define RSI    6
-#define RDI    7
-#define R8     8
-#define R9     9
-#define R10    10
-#define R11    11
-#define R12    12
-#define R13    13
-#define R14    14
-#define R15    15
-
-
-#define XMM0   0
-#define XMM1   1
-#define XMM2   2
-#define XMM3   3
-#define XMM4   4
-#define XMM5   5
-#define XMM6   6
-#define XMM7   7
-#define XMM8   8
-#define XMM9   9
-#define XMM10  10
-#define XMM11  11
-#define XMM12  12
-#define XMM13  13
-#define XMM14  14
-#define XMM15  15
-
-
-/* preallocated registers *****************************************************/
-
-/* integer registers */
-  
-#define REG_RESULT      RAX      /* to deliver method results                 */
-
-#define REG_ITMP1       RAX      /* temporary register                        */
-#define REG_ITMP2       R10      /* temporary register and method pointer     */
-#define REG_ITMP3       R11      /* temporary register                        */
-
-#define REG_NULL        -1       /* used for reg_of_var where d is not needed */
-
-#define REG_ITMP1_XPTR  RAX      /* exception pointer = temporary register 1  */
-#define REG_ITMP2_XPC   R10      /* exception pc = temporary register 2       */
-
-#define REG_SP          RSP      /* stack pointer                             */
-
-/* floating point registers */
-
-#define REG_FRESULT     XMM0     /* to deliver floating point method results  */
-
-#define REG_FTMP1       XMM8     /* temporary floating point register         */
-#define REG_FTMP2       XMM9     /* temporary floating point register         */
-#define REG_FTMP3       XMM10    /* temporary floating point register         */
-
-/* register descripton - array ************************************************/
-
-/* #define REG_RES   0         reserved register for OS or code generator     */
-/* #define REG_RET   1         return value register                          */
-/* #define REG_EXC   2         exception value register (only old jit)        */
-/* #define REG_SAV   3         (callee) saved register                        */
-/* #define REG_TMP   4         scratch temporary register (caller saved)      */
-/* #define REG_ARG   5         argument register (caller saved)               */
-
-/* #define REG_END   -1        last entry in tables                           */
-
-int nregdescint[] = {
-    REG_RET, REG_ARG, REG_ARG, REG_TMP, REG_RES, REG_SAV, REG_ARG, REG_ARG,
-    REG_ARG, REG_ARG, REG_RES, REG_RES, REG_SAV, REG_SAV, REG_SAV, REG_SAV,
-    REG_END
-};
-
-/* for use of reserved registers, see comment above */
-
-int nregdescfloat[] = {
-/*      REG_ARG, REG_ARG, REG_ARG, REG_ARG, REG_TMP, REG_TMP, REG_TMP, REG_TMP, */
-/*      REG_RES, REG_RES, REG_RES, REG_SAV, REG_SAV, REG_SAV, REG_SAV, REG_SAV, */
-    REG_ARG, REG_ARG, REG_ARG, REG_ARG, REG_TMP, REG_TMP, REG_TMP, REG_TMP,
-    REG_RES, REG_RES, REG_RES, REG_TMP, REG_TMP, REG_TMP, REG_TMP, REG_TMP,
-    REG_END
-};
-
-/* for use of reserved registers, see comment above */
-
-
-/* stackframe-infos ***********************************************************/
-
-int parentargs_base; /* offset in stackframe for the parameter from the caller*/
-
-
-/* macros to create code ******************************************************/
-
-/*
- * immediate data union
- */
-typedef union {
-    s4 i;
-    s8 l;
-    float f;
-    double d;
-    void *a;
-    u1 b[8];
-} x86_64_imm_buf;
-
-
-/*
- * opcodes for alu instructions
- */
-typedef enum {
-    X86_64_ADD = 0,
-    X86_64_OR  = 1,
-    X86_64_ADC = 2,
-    X86_64_SBB = 3,
-    X86_64_AND = 4,
-    X86_64_SUB = 5,
-    X86_64_XOR = 6,
-    X86_64_CMP = 7,
-    X86_64_NALU
-} X86_64_ALU_Opcode;
-
-typedef enum {
-    X86_64_ROL = 0,
-    X86_64_ROR = 1,
-    X86_64_RCL = 2,
-    X86_64_RCR = 3,
-    X86_64_SHL = 4,
-    X86_64_SHR = 5,
-    X86_64_SAR = 7,
-    X86_64_NSHIFT = 8
-} X86_64_Shift_Opcode;
-
-typedef enum {
-    X86_64_CC_O = 0,
-    X86_64_CC_NO = 1,
-    X86_64_CC_B = 2, X86_64_CC_C = 2, X86_64_CC_NAE = 2,
-    X86_64_CC_BE = 6, X86_64_CC_NA = 6,
-    X86_64_CC_AE = 3, X86_64_CC_NB = 3, X86_64_CC_NC = 3,
-    X86_64_CC_E = 4, X86_64_CC_Z = 4,
-    X86_64_CC_NE = 5, X86_64_CC_NZ = 5,
-    X86_64_CC_A = 7, X86_64_CC_NBE = 7,
-    X86_64_CC_S = 8, X86_64_CC_LZ = 8,
-    X86_64_CC_NS = 9, X86_64_CC_GEZ = 9,
-    X86_64_CC_P = 0x0a, X86_64_CC_PE = 0x0a,
-    X86_64_CC_NP = 0x0b, X86_64_CC_PO = 0x0b,
-    X86_64_CC_L = 0x0c, X86_64_CC_NGE = 0x0c,
-    X86_64_CC_GE = 0x0d, X86_64_CC_NL = 0x0d,
-    X86_64_CC_LE = 0x0e, X86_64_CC_NG = 0x0e,
-    X86_64_CC_G = 0x0f, X86_64_CC_NLE = 0x0f,
-    X86_64_NCC
-} X86_64_CC;
-
-static const unsigned char x86_64_cc_map[] = {
-    0x00, /* o  */
-    0x01, /* no */
-    0x02, /* b, lt  */
-    0x03, /* ae */
-    0x04, /* e  */
-    0x05, /* ne */
-    0x06, /* be */
-    0x07, /* a  */
-    0x08, /* s  */
-    0x09, /* ns */
-    0x0a, /* p  */
-    0x0b, /* np */
-    0x0c, /* l  */
-    0x0d, /* ge */
-    0x0e, /* le */
-    0x0f  /* g  */
-};
-
-
-
-/*
- * modrm and stuff
- */
-#define x86_64_address_byte(mod,reg,rm) \
-    *(mcodeptr++) = ((((mod) & 0x03) << 6) | (((reg) & 0x07) << 3) | ((rm) & 0x07));
-
-
-#define x86_64_emit_reg(reg,rm) \
-    x86_64_address_byte(3,(reg),(rm));
-
-
-#define x86_64_emit_rex(size,reg,index,rm) \
-    if ((size) == 1 || (reg) > 7 || (index) > 7 || (rm) > 7) { \
-        *(mcodeptr++) = (0x40 | (((size) & 0x01) << 3) | ((((reg) >> 3) & 0x01) << 2) | ((((index) >> 3) & 0x01) << 1) | (((rm) >> 3) & 0x01)); \
-    }
-
-
-#define x86_64_emit_mem(r,disp) \
-    do { \
-        x86_64_address_byte(0,(r),5); \
-        x86_64_emit_imm32((disp)); \
-    } while (0)
-
-
-#define x86_64_emit_membase(basereg,disp,dreg) \
-    do { \
-        if ((basereg) == REG_SP || (basereg) == R12) { \
-            if ((disp) == 0) { \
-                x86_64_address_byte(0,(dreg),REG_SP); \
-                x86_64_address_byte(0,REG_SP,REG_SP); \
-            } else if (x86_64_is_imm8((disp))) { \
-                x86_64_address_byte(1,(dreg),REG_SP); \
-                x86_64_address_byte(0,REG_SP,REG_SP); \
-                x86_64_emit_imm8((disp)); \
-            } else { \
-                x86_64_address_byte(2,(dreg),REG_SP); \
-                x86_64_address_byte(0,REG_SP,REG_SP); \
-                x86_64_emit_imm32((disp)); \
-            } \
-            break; \
-        } \
-        if ((disp) == 0 && (basereg) != RBP && (basereg) != R13) { \
-            x86_64_address_byte(0,(dreg),(basereg)); \
-            break; \
-        } \
-        \
-        if ((basereg) == RIP) { \
-            x86_64_address_byte(0,(dreg),RBP); \
-            x86_64_emit_imm32((disp)); \
-            break; \
-        } \
-        \
-        if (x86_64_is_imm8((disp))) { \
-            x86_64_address_byte(1,(dreg),(basereg)); \
-            x86_64_emit_imm8((disp)); \
-        } else { \
-            x86_64_address_byte(2,(dreg),(basereg)); \
-            x86_64_emit_imm32((disp)); \
-        } \
-    } while (0)
-
-
-#define x86_64_emit_memindex(reg,disp,basereg,indexreg,scale) \
-    do { \
-        if ((basereg) == -1) { \
-            x86_64_address_byte(0,(reg),4); \
-            x86_64_address_byte((scale),(indexreg),5); \
-            x86_64_emit_imm32((disp)); \
-        \
-        } else if ((disp) == 0 && (basereg) != RBP && (basereg) != R13) { \
-            x86_64_address_byte(0,(reg),4); \
-            x86_64_address_byte((scale),(indexreg),(basereg)); \
-        \
-        } else if (x86_64_is_imm8((disp))) { \
-            x86_64_address_byte(1,(reg),4); \
-            x86_64_address_byte((scale),(indexreg),(basereg)); \
-            x86_64_emit_imm8 ((disp)); \
-        \
-        } else { \
-            x86_64_address_byte(2,(reg),4); \
-            x86_64_address_byte((scale),(indexreg),(basereg)); \
-            x86_64_emit_imm32((disp)); \
-        }    \
-     } while (0)
-
-
-#define x86_64_is_imm8(imm) \
-    (((long)(imm) >= -128 && (long)(imm) <= 127))
-
-
-#define x86_64_is_imm32(imm) \
-    ((long)(imm) >= (-2147483647-1) && (long)(imm) <= 2147483647)
-
-
-#define x86_64_emit_imm8(imm) \
-    *(mcodeptr++) = (u1) ((imm) & 0xff);
-
-
-#define x86_64_emit_imm16(imm) \
-    do { \
-        x86_64_imm_buf imb; \
-        imb.i = (s4) (imm); \
-        *(mcodeptr++) = imb.b[0]; \
-        *(mcodeptr++) = imb.b[1]; \
-    } while (0)
-
-
-#define x86_64_emit_imm32(imm) \
-    do { \
-        x86_64_imm_buf imb; \
-        imb.i = (s4) (imm); \
-        *(mcodeptr++) = imb.b[0]; \
-        *(mcodeptr++) = imb.b[1]; \
-        *(mcodeptr++) = imb.b[2]; \
-        *(mcodeptr++) = imb.b[3]; \
-    } while (0)
-
-
-#define x86_64_emit_imm64(imm) \
-    do { \
-        x86_64_imm_buf imb; \
-        imb.l = (s8) (imm); \
-        *(mcodeptr++) = imb.b[0]; \
-        *(mcodeptr++) = imb.b[1]; \
-        *(mcodeptr++) = imb.b[2]; \
-        *(mcodeptr++) = imb.b[3]; \
-        *(mcodeptr++) = imb.b[4]; \
-        *(mcodeptr++) = imb.b[5]; \
-        *(mcodeptr++) = imb.b[6]; \
-        *(mcodeptr++) = imb.b[7]; \
-    } while (0)
-
-
-
-void x86_64_emit_ialu(s4 alu_op, stackptr src, instruction *iptr);
-void x86_64_emit_lalu(s4 alu_op, stackptr src, instruction *iptr);
-void x86_64_emit_ialuconst(s4 alu_op, stackptr src, instruction *iptr);
-void x86_64_emit_laluconst(s4 alu_op, stackptr src, instruction *iptr);
-void x86_64_emit_ishift(s4 shift_op, stackptr src, instruction *iptr);
-void x86_64_emit_lshift(s4 shift_op, stackptr src, instruction *iptr);
-void x86_64_emit_ishiftconst(s4 shift_op, stackptr src, instruction *iptr);
-void x86_64_emit_lshiftconst(s4 shift_op, stackptr src, instruction *iptr);
-void x86_64_emit_ifcc(s4 if_op, stackptr src, instruction *iptr);
-void x86_64_emit_if_lcc(s4 if_op, stackptr src, instruction *iptr);
-void x86_64_emit_if_icmpcc(s4 if_op, stackptr src, instruction *iptr);
-void x86_64_emit_if_lcmpcc(s4 if_op, stackptr src, instruction *iptr);
-
-
-
-#if 0
-
-/*
- * mov ops
- */
-#define x86_64_mov_reg_reg(reg,dreg) \
-    do { \
-        x86_64_emit_rex(1,(reg),0,(dreg)); \
-        *(mcodeptr++) = (u1) 0x89; \
-        x86_64_emit_reg((reg),(dreg)); \
-    } while (0)
-
-
-#define x86_64_mov_imm_reg(imm,reg) \
-    do { \
-        x86_64_emit_rex(1,0,0,(reg)); \
-        *(mcodeptr++) = (u1) 0xb8 + ((reg) & 0x07); \
-        x86_64_emit_imm64((imm)); \
-    } while (0)
-
-
-#define x86_64_mov_fimm_reg(imm,reg) \
-    do { \
-        x86_64_emit_rex(1,0,0,(reg)); \
-        *(mcodeptr++) = (u1) 0xb8 + ((reg) & 0x07); \
-        x86_64_emit_fimm64((imm)); \
-    } while (0)
-
-
-#define x86_64_movl_imm_reg(imm,reg) \
-    do { \
-        x86_64_emit_rex(0,0,0,(reg)); \
-        *(mcodeptr++) = (u1) 0xb8 + ((reg) & 0x07); \
-        x86_64_emit_imm32((imm)); \
-    } while (0)
-
-
-#define x86_64_movl_fimm_reg(imm,reg) \
-    do { \
-        x86_64_emit_rex(0,0,0,(reg)); \
-        *(mcodeptr++) = (u1) 0xb8 + ((reg) & 0x07); \
-        x86_64_emit_fimm32((imm)); \
-    } while (0)
-
-
-#define x86_64_mov_membase_reg(basereg,disp,reg) \
-    do { \
-        x86_64_emit_rex(1,(reg),0,(basereg)); \
-        *(mcodeptr++) = (u1) 0x8b; \
-        x86_64_emit_membase((basereg),(disp),(reg)); \
-    } while (0)
-
-
-#define x86_64_movl_membase_reg(basereg,disp,reg) \
-    do { \
-        x86_64_emit_rex(0,(reg),0,(basereg)); \
-        *(mcodeptr++) = (u1) 0x8b; \
-        x86_64_emit_membase((basereg),(disp),(reg)); \
-    } while (0)
-
-
-/*
- * this one is for INVOKEVIRTUAL/INVOKEINTERFACE to have a
- * constant membase immediate length of 32bit
- */
-#define x86_64_mov_membase32_reg(basereg,disp,reg) \
-    do { \
-        x86_64_emit_rex(1,(reg),0,(basereg)); \
-        *(mcodeptr++) = (u1) 0x8b; \
-        x86_64_address_byte(2, (reg), (basereg)); \
-        x86_64_emit_imm32((disp)); \
-    } while (0)
-
-
-#define x86_64_mov_reg_membase(reg,basereg,disp) \
-    do { \
-        x86_64_emit_rex(1,(reg),0,(basereg)); \
-        *(mcodeptr++) = (u1) 0x89; \
-        x86_64_emit_membase((basereg),(disp),(reg)); \
-    } while (0)
-
-
-#define x86_64_movl_reg_membase(reg,basereg,disp) \
-    do { \
-        x86_64_emit_rex(0,(reg),0,(basereg)); \
-        *(mcodeptr++) = (u1) 0x89; \
-        x86_64_emit_membase((basereg),(disp),(reg)); \
-    } while (0)
-
-
-#define x86_64_mov_memindex_reg(disp,basereg,indexreg,scale,reg) \
-    do { \
-        x86_64_emit_rex(1,(reg),(indexreg),(basereg)); \
-        *(mcodeptr++) = (u1) 0x8b; \
-        x86_64_emit_memindex((reg),(disp),(basereg),(indexreg),(scale)); \
-    } while (0)
-
-
-#define x86_64_movl_memindex_reg(disp,basereg,indexreg,scale,reg) \
-    do { \
-        x86_64_emit_rex(0,(reg),(indexreg),(basereg)); \
-        *(mcodeptr++) = (u1) 0x8b; \
-        x86_64_emit_memindex((reg),(disp),(basereg),(indexreg),(scale)); \
-    } while (0)
-
-
-#define x86_64_movw_memindex_reg(disp,basereg,indexreg,scale,reg) \
-    do { \
-        *(mcodeptr++) = (u1) 0x66; \
-        x86_64_emit_rex(0,(reg),(indexreg),(basereg)); \
-        *(mcodeptr++) = (u1) 0x8b; \
-        x86_64_emit_memindex((reg),(disp),(basereg),(indexreg),(scale)); \
-    } while (0)
-
-
-#define x86_64_movb_memindex_reg(disp,basereg,indexreg,scale,reg) \
-    do { \
-        x86_64_emit_rex(0,(reg),(indexreg),(basereg)); \
-        *(mcodeptr++) = (u1) 0x8a; \
-        x86_64_emit_memindex((reg),(disp),(basereg),(indexreg),(scale)); \
-    } while (0)
-
-
-#define x86_64_mov_reg_memindex(reg,disp,basereg,indexreg,scale) \
-    do { \
-        x86_64_emit_rex(1,(reg),(indexreg),(basereg)); \
-        *(mcodeptr++) = (u1) 0x89; \
-        x86_64_emit_memindex((reg),(disp),(basereg),(indexreg),(scale)); \
-    } while (0)
-
-
-#define x86_64_movl_reg_memindex(reg,disp,basereg,indexreg,scale) \
-    do { \
-        x86_64_emit_rex(0,(reg),(indexreg),(basereg)); \
-        *(mcodeptr++) = (u1) 0x89; \
-        x86_64_emit_memindex((reg),(disp),(basereg),(indexreg),(scale)); \
-    } while (0)
-
-
-#define x86_64_movw_reg_memindex(reg,disp,basereg,indexreg,scale) \
-    do { \
-        *(mcodeptr++) = (u1) 0x66; \
-        x86_64_emit_rex(0,(reg),(indexreg),(basereg)); \
-        *(mcodeptr++) = (u1) 0x89; \
-        x86_64_emit_memindex((reg),(disp),(basereg),(indexreg),(scale)); \
-    } while (0)
-
-
-#define x86_64_movb_reg_memindex(reg,disp,basereg,indexreg,scale) \
-    do { \
-        x86_64_emit_rex(0,(reg),(indexreg),(basereg)); \
-        *(mcodeptr++) = (u1) 0x88; \
-        x86_64_emit_memindex((reg),(disp),(basereg),(indexreg),(scale)); \
-    } while (0)
-
-
-#define x86_64_mov_imm_membase(imm,basereg,disp) \
-    do { \
-        x86_64_emit_rex(1,0,0,(basereg)); \
-        *(mcodeptr++) = (u1) 0xc7; \
-        x86_64_emit_membase((basereg),(disp),0); \
-        x86_64_emit_imm32((imm)); \
-    } while (0)
-
-
-#define x86_64_movl_imm_membase(imm,basereg,disp) \
-    do { \
-        x86_64_emit_rex(0,0,0,(basereg)); \
-        *(mcodeptr++) = (u1) 0xc7; \
-        x86_64_emit_membase((basereg),(disp),0); \
-        x86_64_emit_imm32((imm)); \
-    } while (0)
-
-
-#define x86_64_movsbq_reg_reg(reg,dreg) \
-    do { \
-        x86_64_emit_rex(1,(dreg),0,(reg)); \
-        *(mcodeptr++) = (u1) 0x0f; \
-        *(mcodeptr++) = (u1) 0xbe; \
-        /* XXX: why do reg and dreg have to be exchanged */ \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
-
-#define x86_64_movsbq_membase_reg(basereg,disp,dreg) \
-    do { \
-        x86_64_emit_rex(1,(dreg),0,(basereg)); \
-        *(mcodeptr++) = (u1) 0x0f; \
-        *(mcodeptr++) = (u1) 0xbe; \
-        x86_64_emit_membase((basereg),(disp),(dreg)); \
-    } while (0)
-
-
-#define x86_64_movsbl_reg_reg(reg,dreg) \
-    do { \
-        x86_64_emit_rex(0,(reg),0,(dreg)); \
-        *(mcodeptr++) = (u1) 0x0f; \
-        *(mcodeptr++) = (u1) 0xbe; \
-        x86_64_emit_reg((reg),(dreg)); \
-    } while (0)
-
-
-#define x86_64_movswq_reg_reg(reg,dreg) \
-    do { \
-        x86_64_emit_rex(1,(dreg),0,(reg)); \
-        *(mcodeptr++) = (u1) 0x0f; \
-        *(mcodeptr++) = (u1) 0xbf; \
-        /* XXX: why do reg and dreg have to be exchanged */ \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
-
-#define x86_64_movswq_membase_reg(basereg,disp,dreg) \
-    do { \
-        x86_64_emit_rex(1,(dreg),0,(basereg)); \
-        *(mcodeptr++) = (u1) 0x0f; \
-        *(mcodeptr++) = (u1) 0xbf; \
-        x86_64_emit_membase((basereg),(disp),(dreg)); \
-    } while (0)
-
-
-#define x86_64_movswl_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = (u1) 0x0f; \
-        *(mcodeptr++) = (u1) 0xbf; \
-        x86_64_emit_reg((reg),(dreg)); \
-    } while (0)
-
-
-#define x86_64_movslq_reg_reg(reg,dreg) \
-    do { \
-        x86_64_emit_rex(1,(dreg),0,(reg)); \
-        *(mcodeptr++) = (u1) 0x63; \
-        /* XXX: why do reg and dreg have to be exchanged */ \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
-
-#define x86_64_movslq_membase_reg(basereg,disp,dreg) \
-    do { \
-        x86_64_emit_rex(1,(dreg),0,(basereg)); \
-        *(mcodeptr++) = (u1) 0x63; \
-        x86_64_emit_membase((basereg),(disp),(dreg)); \
-    } while (0)
-
-
-#define x86_64_movzwq_reg_reg(reg,dreg) \
-    do { \
-        x86_64_emit_rex(1,(dreg),0,(reg)); \
-        *(mcodeptr++) = (u1) 0x0f; \
-        *(mcodeptr++) = (u1) 0xb7; \
-        /* XXX: why do reg and dreg have to be exchanged */ \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
-
-#define x86_64_movzwq_membase_reg(basereg,disp,dreg) \
-    do { \
-        x86_64_emit_rex(1,(dreg),0,(basereg)); \
-        *(mcodeptr++) = (u1) 0x0f; \
-        *(mcodeptr++) = (u1) 0xb7; \
-        x86_64_emit_membase((basereg),(disp),(dreg)); \
-    } while (0)
-
-
-#define x86_64_movswq_memindex_reg(disp,basereg,indexreg,scale,reg) \
-    do { \
-        x86_64_emit_rex(1,(reg),(indexreg),(basereg)); \
-        *(mcodeptr++) = (u1) 0x0f; \
-        *(mcodeptr++) = (u1) 0xbf; \
-        x86_64_emit_memindex((reg),(disp),(basereg),(indexreg),(scale)); \
-    } while (0)
-
-
-#define x86_64_movsbq_memindex_reg(disp,basereg,indexreg,scale,reg) \
-    do { \
-        x86_64_emit_rex(1,(reg),(indexreg),(basereg)); \
-        *(mcodeptr++) = (u1) 0x0f; \
-        *(mcodeptr++) = (u1) 0xbe; \
-        x86_64_emit_memindex((reg),(disp),(basereg),(indexreg),(scale)); \
-    } while (0)
-
-
-#define x86_64_movzwq_memindex_reg(disp,basereg,indexreg,scale,reg) \
-    do { \
-        x86_64_emit_rex(1,(reg),(indexreg),(basereg)); \
-        *(mcodeptr++) = (u1) 0x0f; \
-        *(mcodeptr++) = (u1) 0xb7; \
-        x86_64_emit_memindex((reg),(disp),(basereg),(indexreg),(scale)); \
-    } while (0)
-
-
-#define x86_64_movzbq_memindex_reg(disp,basereg,indexreg,scale,reg) \
-    do { \
-        x86_64_emit_rex(1,(reg),(indexreg),(basereg)); \
-        *(mcodeptr++) = (u1) 0x0f; \
-        *(mcodeptr++) = (u1) 0xb6; \
-        x86_64_emit_memindex((reg),(disp),(basereg),(indexreg),(scale)); \
-    } while (0)
-
-
-
-/*
- * alu operations
- */
-#define x86_64_alu_reg_reg(opc,reg,dreg) \
-    do { \
-        x86_64_emit_rex(1,(reg),0,(dreg)); \
-        *(mcodeptr++) = (((u1) (opc)) << 3) + 1; \
-        x86_64_emit_reg((reg),(dreg)); \
-    } while (0)
-
-
-#define x86_64_alul_reg_reg(opc,reg,dreg) \
-    do { \
-        x86_64_emit_rex(0,(reg),0,(dreg)); \
-        *(mcodeptr++) = (((u1) (opc)) << 3) + 1; \
-        x86_64_emit_reg((reg),(dreg)); \
-    } while (0)
-
-
-#define x86_64_alu_reg_membase(opc,reg,basereg,disp) \
-    do { \
-        x86_64_emit_rex(1,(reg),0,(basereg)); \
-        *(mcodeptr++) = (((u1) (opc)) << 3) + 1; \
-        x86_64_emit_membase((basereg),(disp),(reg)); \
-    } while (0)
-
-
-#define x86_64_alul_reg_membase(opc,reg,basereg,disp) \
-    do { \
-        x86_64_emit_rex(0,(reg),0,(basereg)); \
-        *(mcodeptr++) = (((u1) (opc)) << 3) + 1; \
-        x86_64_emit_membase((basereg),(disp),(reg)); \
-    } while (0)
-
-
-#define x86_64_alu_membase_reg(opc,basereg,disp,reg) \
-    do { \
-        x86_64_emit_rex(1,(reg),0,(basereg)); \
-        *(mcodeptr++) = (((u1) (opc)) << 3) + 3; \
-        x86_64_emit_membase((basereg),(disp),(reg)); \
-    } while (0)
-
-
-#define x86_64_alul_membase_reg(opc,basereg,disp,reg) \
-    do { \
-        x86_64_emit_rex(0,(reg),0,(basereg)); \
-        *(mcodeptr++) = (((u1) (opc)) << 3) + 3; \
-        x86_64_emit_membase((basereg),(disp),(reg)); \
-    } while (0)
-
-
-#define x86_64_alu_imm_reg(opc,imm,dreg) \
-    do { \
-        if (x86_64_is_imm8(imm)) { \
-            x86_64_emit_rex(1,0,0,(dreg)); \
-            *(mcodeptr++) = (u1) 0x83; \
-            x86_64_emit_reg((opc),(dreg)); \
-            x86_64_emit_imm8((imm)); \
-        } else { \
-            x86_64_emit_rex(1,0,0,(dreg)); \
-            *(mcodeptr++) = (u1) 0x81; \
-            x86_64_emit_reg((opc),(dreg)); \
-            x86_64_emit_imm32((imm)); \
-        } \
-    } while (0)
-
-
-#define x86_64_alul_imm_reg(opc,imm,dreg) \
-    do { \
-        if (x86_64_is_imm8(imm)) { \
-            x86_64_emit_rex(0,0,0,(dreg)); \
-            *(mcodeptr++) = (u1) 0x83; \
-            x86_64_emit_reg((opc),(dreg)); \
-            x86_64_emit_imm8((imm)); \
-        } else { \
-            x86_64_emit_rex(0,0,0,(dreg)); \
-            *(mcodeptr++) = (u1) 0x81; \
-            x86_64_emit_reg((opc),(dreg)); \
-            x86_64_emit_imm32((imm)); \
-        } \
-    } while (0)
-
-
-#define x86_64_alu_imm_membase(opc,imm,basereg,disp) \
-    do { \
-        if (x86_64_is_imm8(imm)) { \
-            x86_64_emit_rex(1,(basereg),0,0); \
-            *(mcodeptr++) = (u1) 0x83; \
-            x86_64_emit_membase((basereg),(disp),(opc)); \
-            x86_64_emit_imm8((imm)); \
-        } else { \
-            x86_64_emit_rex(1,(basereg),0,0); \
-            *(mcodeptr++) = (u1) 0x81; \
-            x86_64_emit_membase((basereg),(disp),(opc)); \
-            x86_64_emit_imm32((imm)); \
-        } \
-    } while (0)
-
-
-#define x86_64_alul_imm_membase(opc,imm,basereg,disp) \
-    do { \
-        if (x86_64_is_imm8(imm)) { \
-            x86_64_emit_rex(0,(basereg),0,0); \
-            *(mcodeptr++) = (u1) 0x83; \
-            x86_64_emit_membase((basereg),(disp),(opc)); \
-            x86_64_emit_imm8((imm)); \
-        } else { \
-            x86_64_emit_rex(0,(basereg),0,0); \
-            *(mcodeptr++) = (u1) 0x81; \
-            x86_64_emit_membase((basereg),(disp),(opc)); \
-            x86_64_emit_imm32((imm)); \
-        } \
-    } while (0)
-
-
-#define x86_64_test_reg_reg(reg,dreg) \
-    do { \
-        x86_64_emit_rex(1,(reg),0,(dreg)); \
-        *(mcodeptr++) = (u1) 0x85; \
-        x86_64_emit_reg((reg),(dreg)); \
-    } while (0)
-
-
-#define x86_64_testl_reg_reg(reg,dreg) \
-    do { \
-        x86_64_emit_rex(0,(reg),0,(dreg)); \
-        *(mcodeptr++) = (u1) 0x85; \
-        x86_64_emit_reg((reg),(dreg)); \
-    } while (0)
-
-
-#define x86_64_test_imm_reg(imm,reg) \
-    do { \
-        *(mcodeptr++) = (u1) 0xf7; \
-        x86_64_emit_reg(0,(reg)); \
-        x86_64_emit_imm32((imm)); \
-    } while (0)
-
-
-#define x86_64_testw_imm_reg(imm,reg) \
-    do { \
-        *(mcodeptr++) = (u1) 0x66; \
-        *(mcodeptr++) = (u1) 0xf7; \
-        x86_64_emit_reg(0,(reg)); \
-        x86_64_emit_imm16((imm)); \
-    } while (0)
-
-
-#define x86_64_testb_imm_reg(imm,reg) \
-    do { \
-        *(mcodeptr++) = (u1) 0xf6; \
-        x86_64_emit_reg(0,(reg)); \
-        x86_64_emit_imm8((imm)); \
-    } while (0)
-
-
-#define x86_64_lea_membase_reg(basereg, disp, reg) \
-    do { \
-        x86_64_emit_rex(1,(reg),0,(basereg)); \
-        *(mcodeptr++) = 0x8d; \
-        x86_64_emit_membase((basereg),(disp),(reg)); \
-    } while (0)
-
-
-#define x86_64_leal_membase_reg(basereg, disp, reg) \
-    do { \
-        x86_64_emit_rex(0,(reg),0,(basereg)); \
-        *(mcodeptr++) = 0x8d; \
-        x86_64_emit_membase((basereg),(disp),(reg)); \
-    } while (0)
-
-
-
-/*
- * inc, dec operations
- */
-#define x86_64_inc_reg(reg) \
-    do { \
-        x86_64_emit_rex(1,0,0,(reg)); \
-        *(mcodeptr++) = 0xff; \
-        x86_64_emit_reg(0,(reg)); \
-    } while (0)
-
-
-#define x86_64_incl_reg(reg) \
-    do { \
-        x86_64_emit_rex(0,0,0,(reg)); \
-        *(mcodeptr++) = 0xff; \
-        x86_64_emit_reg(0,(reg)); \
-    } while (0)
-
-
-#define x86_64_inc_membase(basereg,disp) \
-    do { \
-        x86_64_emit_rex(1,(basereg),0,0); \
-        *(mcodeptr++) = 0xff; \
-        x86_64_emit_membase((basereg),(disp),0); \
-    } while (0)
-
-
-#define x86_64_incl_membase(basereg,disp) \
-    do { \
-        x86_64_emit_rex(0,(basereg),0,0); \
-        *(mcodeptr++) = 0xff; \
-        x86_64_emit_membase((basereg),(disp),0); \
-    } while (0)
-
-
-#define x86_64_dec_reg(reg) \
-    do { \
-        x86_64_emit_rex(1,0,0,(reg)); \
-        *(mcodeptr++) = 0xff; \
-        x86_64_emit_reg(1,(reg)); \
-    } while (0)
-
-        
-#define x86_64_decl_reg(reg) \
-    do { \
-        x86_64_emit_rex(0,0,0,(reg)); \
-        *(mcodeptr++) = 0xff; \
-        x86_64_emit_reg(1,(reg)); \
-    } while (0)
-
-        
-#define x86_64_dec_membase(basereg,disp) \
-    do { \
-        x86_64_emit_rex(1,(basereg),0,0); \
-        *(mcodeptr++) = 0xff; \
-        x86_64_emit_membase((basereg),(disp),1); \
-    } while (0)
-
-
-#define x86_64_decl_membase(basereg,disp) \
-    do { \
-        x86_64_emit_rex(0,(basereg),0,0); \
-        *(mcodeptr++) = 0xff; \
-        x86_64_emit_membase((basereg),(disp),1); \
-    } while (0)
-
-
-
-
-#define x86_64_cltd() \
-    *(mcodeptr++) = 0x99;
-
-
-#define x86_64_cqto() \
-    do { \
-        x86_64_emit_rex(1,0,0,0); \
-        *(mcodeptr++) = 0x99; \
-    } while (0)
-
-
-
-#define x86_64_imul_reg_reg(reg,dreg) \
-    do { \
-        x86_64_emit_rex(1,(dreg),0,(reg)); \
-        *(mcodeptr++) = (u1) 0x0f; \
-        *(mcodeptr++) = (u1) 0xaf; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
-
-#define x86_64_imull_reg_reg(reg,dreg) \
-    do { \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = (u1) 0x0f; \
-        *(mcodeptr++) = (u1) 0xaf; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
-
-#define x86_64_imul_membase_reg(basereg,disp,dreg) \
-    do { \
-        x86_64_emit_rex(1,(dreg),0,(basereg)); \
-        *(mcodeptr++) = (u1) 0x0f; \
-        *(mcodeptr++) = (u1) 0xaf; \
-        x86_64_emit_membase((basereg),(disp),(dreg)); \
-    } while (0)
-
-
-#define x86_64_imull_membase_reg(basereg,disp,dreg) \
-    do { \
-        x86_64_emit_rex(0,(dreg),0,(basereg)); \
-        *(mcodeptr++) = (u1) 0x0f; \
-        *(mcodeptr++) = (u1) 0xaf; \
-        x86_64_emit_membase((basereg),(disp),(dreg)); \
-    } while (0)
-
-
-#define x86_64_imul_imm_reg(imm,dreg) \
-    do { \
-        if (x86_64_is_imm8((imm))) { \
-            x86_64_emit_rex(1,0,0,(dreg)); \
-            *(mcodeptr++) = (u1) 0x6b; \
-            x86_64_emit_reg(0,(dreg)); \
-            x86_64_emit_imm8((imm)); \
-        } else { \
-            x86_64_emit_rex(1,0,0,(dreg)); \
-            *(mcodeptr++) = (u1) 0x69; \
-            x86_64_emit_reg(0,(dreg)); \
-            x86_64_emit_imm32((imm)); \
-        } \
-    } while (0)
-
-
-#define x86_64_imul_imm_reg_reg(imm,reg,dreg) \
-    do { \
-        if (x86_64_is_imm8((imm))) { \
-            x86_64_emit_rex(1,(dreg),0,(reg)); \
-            *(mcodeptr++) = (u1) 0x6b; \
-            x86_64_emit_reg((dreg),(reg)); \
-            x86_64_emit_imm8((imm)); \
-        } else { \
-            x86_64_emit_rex(1,(dreg),0,(reg)); \
-            *(mcodeptr++) = (u1) 0x69; \
-            x86_64_emit_reg((dreg),(reg)); \
-            x86_64_emit_imm32((imm)); \
-        } \
-    } while (0)
-
-
-#define x86_64_imull_imm_reg_reg(imm,reg,dreg) \
-    do { \
-        if (x86_64_is_imm8((imm))) { \
-            x86_64_emit_rex(0,(dreg),0,(reg)); \
-            *(mcodeptr++) = (u1) 0x6b; \
-            x86_64_emit_reg((dreg),(reg)); \
-            x86_64_emit_imm8((imm)); \
-        } else { \
-            x86_64_emit_rex(0,(dreg),0,(reg)); \
-            *(mcodeptr++) = (u1) 0x69; \
-            x86_64_emit_reg((dreg),(reg)); \
-            x86_64_emit_imm32((imm)); \
-        } \
-    } while (0)
-
-
-#define x86_64_imul_imm_membase_reg(imm,basereg,disp,dreg) \
-    do { \
-        if (x86_64_is_imm8((imm))) { \
-            x86_64_emit_rex(1,(dreg),0,(basereg)); \
-            *(mcodeptr++) = (u1) 0x6b; \
-            x86_64_emit_membase((basereg),(disp),(dreg)); \
-            x86_64_emit_imm8((imm)); \
-        } else { \
-            x86_64_emit_rex(1,(dreg),0,(basereg)); \
-            *(mcodeptr++) = (u1) 0x69; \
-            x86_64_emit_membase((basereg),(disp),(dreg)); \
-            x86_64_emit_imm32((imm)); \
-        } \
-    } while (0)
-
-
-#define x86_64_imull_imm_membase_reg(imm,basereg,disp,dreg) \
-    do { \
-        if (x86_64_is_imm8((imm))) { \
-            x86_64_emit_rex(0,(dreg),0,(basereg)); \
-            *(mcodeptr++) = (u1) 0x6b; \
-            x86_64_emit_membase((basereg),(disp),(dreg)); \
-            x86_64_emit_imm8((imm)); \
-        } else { \
-            x86_64_emit_rex(0,(dreg),0,(basereg)); \
-            *(mcodeptr++) = (u1) 0x69; \
-            x86_64_emit_membase((basereg),(disp),(dreg)); \
-            x86_64_emit_imm32((imm)); \
-        } \
-    } while (0)
-
-
-#define x86_64_idiv_reg(reg) \
-    do { \
-        x86_64_emit_rex(1,0,0,(reg)); \
-        *(mcodeptr++) = (u1) 0xf7; \
-        x86_64_emit_reg(7,(reg)); \
-    } while (0)
-
-
-#define x86_64_idivl_reg(reg) \
-    do { \
-        x86_64_emit_rex(0,0,0,(reg)); \
-        *(mcodeptr++) = (u1) 0xf7; \
-        x86_64_emit_reg(7,(reg)); \
-    } while (0)
+   $Id: codegen.h 4853 2006-04-27 12:33:20Z twisti $
 
+*/
 
 
-#define x86_64_ret() \
-    *(mcodeptr++) = (u1) 0xc3;
+#ifndef _CODEGEN_H
+#define _CODEGEN_H
 
+#include "config.h"
 
-#define x86_64_leave() \
-    *(mcodeptr++) = (u1) 0xc9;
+#include <ucontext.h>
 
+#include "vm/types.h"
 
+#include "vm/jit/jit.h"
 
-/*
- * shift ops
- */
-#define x86_64_shift_reg(opc,reg) \
-    do { \
-        x86_64_emit_rex(1,0,0,(reg)); \
-        *(mcodeptr++) = (u1) 0xd3; \
-        x86_64_emit_reg((opc),(reg)); \
-    } while (0)
 
+/* some defines ***************************************************************/
 
-#define x86_64_shiftl_reg(opc,reg) \
-    do { \
-        x86_64_emit_rex(0,0,0,(reg)); \
-        *(mcodeptr++) = (u1) 0xd3; \
-        x86_64_emit_reg((opc),(reg)); \
-    } while (0)
+#define PATCHER_CALL_SIZE    5          /* size in bytes of a patcher call    */
 
 
-#define x86_64_shift_membase(opc,basereg,disp) \
-    do { \
-        x86_64_emit_rex(1,0,0,(basereg)); \
-        *(mcodeptr++) = (u1) 0xd3; \
-        x86_64_emit_membase((basereg),(disp),(opc)); \
-    } while (0)
+/* additional functions and macros to generate code ***************************/
 
+#define CALCOFFSETBYTES(var, reg, val) \
+    if ((s4) (val) < -128 || (s4) (val) > 127) (var) += 4; \
+    else if ((s4) (val) != 0) (var) += 1; \
+    else if ((reg) == RBP || (reg) == RSP || (reg) == R12 || (reg) == R13) (var) += 1;
 
-#define x86_64_shiftl_membase(opc,basereg,disp) \
-    do { \
-        x86_64_emit_rex(0,0,0,(basereg)); \
-        *(mcodeptr++) = (u1) 0xd3; \
-        x86_64_emit_membase((basereg),(disp),(opc)); \
-    } while (0)
 
+#define CALCIMMEDIATEBYTES(var, val) \
+    if ((s4) (val) < -128 || (s4) (val) > 127) (var) += 4; \
+    else (var) += 1;
 
-#define x86_64_shift_imm_reg(opc,imm,dreg) \
-    do { \
-        if ((imm) == 1) { \
-            x86_64_emit_rex(1,0,0,(dreg)); \
-            *(mcodeptr++) = (u1) 0xd1; \
-            x86_64_emit_reg((opc),(dreg)); \
-        } else { \
-            x86_64_emit_rex(1,0,0,(dreg)); \
-            *(mcodeptr++) = (u1) 0xc1; \
-            x86_64_emit_reg((opc),(dreg)); \
-            x86_64_emit_imm8((imm)); \
-        } \
-    } while (0)
 
+/* gen_nullptr_check(objreg) */
 
-#define x86_64_shiftl_imm_reg(opc,imm,dreg) \
-    do { \
-        if ((imm) == 1) { \
-            x86_64_emit_rex(0,0,0,(dreg)); \
-            *(mcodeptr++) = (u1) 0xd1; \
-            x86_64_emit_reg((opc),(dreg)); \
-        } else { \
-            x86_64_emit_rex(0,0,0,(dreg)); \
-            *(mcodeptr++) = (u1) 0xc1; \
-            x86_64_emit_reg((opc),(dreg)); \
-            x86_64_emit_imm8((imm)); \
-        } \
-    } while (0)
+#define gen_nullptr_check(objreg) \
+       if (checknull) { \
+        M_TEST(objreg); \
+        M_BEQ(0); \
+           codegen_add_nullpointerexception_ref(cd); \
+       }
 
 
-#define x86_64_shift_imm_membase(opc,imm,basereg,disp) \
-    do { \
-        if ((imm) == 1) { \
-            x86_64_emit_rex(1,0,0,(basereg)); \
-            *(mcodeptr++) = (u1) 0xd1; \
-            x86_64_emit_membase((basereg),(disp),(opc)); \
-        } else { \
-            x86_64_emit_rex(1,0,0,(basereg)); \
-            *(mcodeptr++) = (u1) 0xc1; \
-            x86_64_emit_membase((basereg),(disp),(opc)); \
-            x86_64_emit_imm8((imm)); \
-        } \
-    } while (0)
+#define gen_bound_check \
+    if (checkbounds) { \
+        M_CMP_MEMBASE(s1, OFFSET(java_arrayheader, size), s2); \
+        M_BAE(0); \
+        codegen_add_arrayindexoutofboundsexception_ref(cd, s2); \
+    }
 
 
-#define x86_64_shiftl_imm_membase(opc,imm,basereg,disp) \
-    do { \
-        if ((imm) == 1) { \
-            x86_64_emit_rex(0,0,0,(basereg)); \
-            *(mcodeptr++) = (u1) 0xd1; \
-            x86_64_emit_membase((basereg),(disp),(opc)); \
+#define gen_div_check(v) \
+    if (checknull) { \
+        if ((v)->flags & INMEMORY) { \
+            M_CMP_IMM_MEMBASE(0, REG_SP, src->regoff * 8); \
         } else { \
-            x86_64_emit_rex(0,0,0,(basereg)); \
-            *(mcodeptr++) = (u1) 0xc1; \
-            x86_64_emit_membase((basereg),(disp),(opc)); \
-            x86_64_emit_imm8((imm)); \
+            M_TEST(src->regoff); \
         } \
-    } while (0)
-
-
-
-/*
- * jump operations
- */
-#define x86_64_jmp_imm(imm) \
-    do { \
-        *(mcodeptr++) = 0xe9; \
-        x86_64_emit_imm32((imm)); \
-    } while (0)
-
-
-#define x86_64_jmp_reg(reg) \
-    do { \
-        x86_64_emit_rex(0,0,0,(reg)); \
-        *(mcodeptr++) = 0xff; \
-        x86_64_emit_reg(4,(reg)); \
-    } while (0)
-
-
-#define x86_64_jcc(opc,imm) \
-    do { \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = (0x80 + x86_64_cc_map[(opc)]); \
-        x86_64_emit_imm32((imm)); \
-    } while (0)
-
-
-
-/*
- * conditional set and move operations
- */
-
-/* we need the rex byte to get all low bytes */
-#define x86_64_setcc_reg(opc,reg) \
-    do { \
-        *(mcodeptr++) = (0x40 | (((reg) >> 3) & 0x01)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = (0x90 + x86_64_cc_map[(opc)]); \
-        x86_64_emit_reg(0,(reg)); \
-    } while (0)
-
-
-/* we need the rex byte to get all low bytes */
-#define x86_64_setcc_membase(opc,basereg,disp) \
-    do { \
-        *(mcodeptr++) = (0x40 | (((basereg) >> 3) & 0x01)); \
-        *(mcodeptr++) = (u1) 0x0f; \
-        *(mcodeptr++) = (u1) (0x90 + x86_64_cc_map[(opc)]); \
-        x86_64_emit_membase((basereg),(disp),0); \
-    } while (0)
-
-
-#define x86_64_cmovcc_reg_reg(opc,reg,dreg) \
-    do { \
-        x86_64_emit_rex(1,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x40 + x86_64_cc_map[(opc)]; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
-
-#define x86_64_cmovccl_reg_reg(opc,reg,dreg) \
-    do { \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x40 + x86_64_cc_map[(opc)]; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
-
-
-#define x86_64_neg_reg(reg) \
-    do { \
-        x86_64_emit_rex(1,0,0,(reg)); \
-        *(mcodeptr++) = (u1) 0xf7; \
-        x86_64_emit_reg(3,(reg)); \
-    } while (0)
-
-
-#define x86_64_negl_reg(reg) \
-    do { \
-        x86_64_emit_rex(0,0,0,(reg)); \
-        *(mcodeptr++) = (u1) 0xf7; \
-        x86_64_emit_reg(3,(reg)); \
-    } while (0)
-
-
-#define x86_64_neg_membase(basereg,disp) \
-    do { \
-        x86_64_emit_rex(1,0,0,(basereg)); \
-        *(mcodeptr++) = (u1) 0xf7; \
-        x86_64_emit_membase((basereg),(disp),3); \
-    } while (0)
-
-
-#define x86_64_negl_membase(basereg,disp) \
-    do { \
-        x86_64_emit_rex(0,0,0,(basereg)); \
-        *(mcodeptr++) = (u1) 0xf7; \
-        x86_64_emit_membase((basereg),(disp),3); \
-    } while (0)
-
-
-
-#define x86_64_push_reg(reg) \
-    *(mcodeptr++) = (u1) 0x50 + (0x07 & (reg));
-
-
-#define x86_64_push_membase(basereg,disp) \
-    do { \
-        *(mcodeptr++) = (u1) 0xff; \
-        x86_64_emit_membase((basereg),(disp),6); \
-    } while (0)
-
-
-#define x86_64_push_imm(imm) \
-    do { \
-        *(mcodeptr++) = (u1) 0x68; \
-        x86_64_emit_imm32((imm)); \
-    } while (0)
-
-
-#define x86_64_pop_reg(reg) \
-    do { \
-        x86_64_emit_rex(0,0,0,(reg)); \
-        *(mcodeptr++) = (u1) 0x58 + (0x07 & (reg)); \
-    } while (0)
-
-
-#define x86_64_xchg_reg_reg(reg,dreg) \
-    do { \
-        x86_64_emit_rex(1,(reg),0,(dreg)); \
-        *(mcodeptr++) = 0x87; \
-        x86_64_emit_reg((reg),(dreg)); \
-    } while (0)
-
-
-#define x86_64_nop() \
-    *(mcodeptr++) = (u1) 0x90;
-
-
-#define x86_64_hlt() \
-    *(mcodeptr++) = 0xf4;
-
-
-
-/*
- * call instructions
- */
-#define x86_64_call_reg(reg) \
-    do { \
-        x86_64_emit_rex(1,0,0,(reg)); \
-        *(mcodeptr++) = (u1) 0xff; \
-        x86_64_emit_reg(2,(reg)); \
-    } while (0)
-
-
-#define x86_64_call_imm(imm) \
-    do { \
-        *(mcodeptr++) = (u1) 0xe8; \
-        x86_64_emit_imm32((imm)); \
-    } while (0)
-
-
-
-/*
- * floating point instructions (SSE2)
- */
-#define x86_64_addsd_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf2; \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x58; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
-
-#define x86_64_addss_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf3; \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x58; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
-
-#define x86_64_cvtsi2ssq_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf3; \
-        x86_64_emit_rex(1,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x2a; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
-
-#define x86_64_cvtsi2ss_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf3; \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x2a; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
-
-#define x86_64_cvtsi2sdq_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf2; \
-        x86_64_emit_rex(1,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x2a; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
-
-#define x86_64_cvtsi2sd_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf2; \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x2a; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
-
-#define x86_64_cvtss2sd_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf3; \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x5a; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
-
-#define x86_64_cvtsd2ss_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf2; \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x5a; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
-
-#define x86_64_cvttss2siq_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf3; \
-        x86_64_emit_rex(1,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x2c; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
-
-#define x86_64_cvttss2si_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf3; \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x2c; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
-
-#define x86_64_cvttsd2siq_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf2; \
-        x86_64_emit_rex(1,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x2c; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
+        M_BEQ(0); \
+        codegen_add_arithmeticexception_ref(cd); \
+    }
 
-#define x86_64_cvttsd2si_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf2; \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x2c; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
 
+/* MCODECHECK(icnt) */
 
-#define x86_64_divss_reg_reg(reg,dreg) \
+#define MCODECHECK(icnt) \
     do { \
-        *(mcodeptr++) = 0xf3; \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x5e; \
-        x86_64_emit_reg((dreg),(reg)); \
+        if ((cd->mcodeptr + (icnt)) > cd->mcodeend) \
+            codegen_increase(cd); \
     } while (0)
 
 
-#define x86_64_divsd_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf2; \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x5e; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
+#define ALIGNCODENOP \
+    if ((s4) (((ptrint) cd->mcodeptr) & 7)) { \
+        M_NOP; \
+    }
 
-#define x86_64_movd_reg_freg(reg,freg) \
-    do { \
-        *(mcodeptr++) = 0x66; \
-        x86_64_emit_rex(1,(freg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x6e; \
-        x86_64_emit_reg((freg),(reg)); \
-    } while (0)
 
+/* M_INTMOVE:
+    generates an integer-move from register a to b.
+    if a and b are the same int-register, no code will be generated.
+*/ 
 
-#define x86_64_movd_freg_reg(freg,reg) \
+#define M_INTMOVE(reg,dreg) \
     do { \
-        *(mcodeptr++) = 0x66; \
-        x86_64_emit_rex(1,(freg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x7e; \
-        x86_64_emit_reg((freg),(reg)); \
+        if ((reg) != (dreg)) { \
+            M_MOV(reg, dreg); \
+        } \
     } while (0)
 
 
-#define x86_64_movd_reg_membase(reg,basereg,disp) \
-    do { \
-        *(mcodeptr++) = 0x66; \
-        x86_64_emit_rex(0,(reg),0,(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x7e; \
-        x86_64_emit_membase((basereg),(disp),(reg)); \
-    } while (0)
-
+/* M_FLTMOVE:
+    generates a floating-point-move from register a to b.
+    if a and b are the same float-register, no code will be generated
+*/ 
 
-#define x86_64_movd_reg_memindex(reg,disp,basereg,indexreg,scale) \
+#define M_FLTMOVE(reg,dreg) \
     do { \
-        *(mcodeptr++) = 0x66; \
-        x86_64_emit_rex(0,(reg),(indexreg),(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x7e; \
-        x86_64_emit_memindex((reg),(disp),(basereg),(indexreg),(scale)); \
+        if ((reg) != (dreg)) { \
+            M_FMOV(reg, dreg); \
+        } \
     } while (0)
 
 
-#define x86_64_movd_membase_reg(basereg,disp,dreg) \
-    do { \
-        *(mcodeptr++) = 0x66; \
-        x86_64_emit_rex(1,(dreg),0,(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x6e; \
-        x86_64_emit_membase((basereg),(disp),(dreg)); \
-    } while (0)
-
+#define M_COPY(s,d)                     emit_copy(jd, iptr, (s), (d))
 
-#define x86_64_movdl_membase_reg(basereg,disp,dreg) \
+#define ICONST(r,c) \
     do { \
-        *(mcodeptr++) = 0x66; \
-        x86_64_emit_rex(0,(dreg),0,(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x6e; \
-        x86_64_emit_membase((basereg),(disp),(dreg)); \
+        if (iptr->val.i == 0) \
+            M_CLR(d); \
+        else \
+            M_IMOV_IMM(iptr->val.i, d); \
     } while (0)
+/*     do { \ */
+/*        M_IMOV_IMM(iptr->val.i, d); \ */
+/*     } while (0) */
 
 
-#define x86_64_movd_memindex_reg(disp,basereg,indexreg,scale,dreg) \
+#define LCONST(r,c) \
     do { \
-        *(mcodeptr++) = 0x66; \
-        x86_64_emit_rex(0,(dreg),(indexreg),(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x6e; \
-        x86_64_emit_memindex((dreg),(disp),(basereg),(indexreg),(scale)); \
+        if (iptr->val.l == 0) \
+            M_CLR(d); \
+        else \
+            M_MOV_IMM(iptr->val.l, d); \
     } while (0)
 
 
-#define x86_64_movq_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf3; \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x7e; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
-
+/* macros to create code ******************************************************/
 
-#define x86_64_movq_reg_membase(reg,basereg,disp) \
-    do { \
-        *(mcodeptr++) = 0x66; \
-        x86_64_emit_rex(0,(reg),0,(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0xd6; \
-        x86_64_emit_membase((basereg),(disp),(reg)); \
-    } while (0)
+#define M_MOV(a,b)              emit_mov_reg_reg(cd, (a), (b))
+#define M_MOV_IMM(a,b)          emit_mov_imm_reg(cd, (u8) (a), (b))
 
+#define M_FMOV(a,b)             emit_movq_reg_reg(cd, (a), (b))
 
-#define x86_64_movq_membase_reg(basereg,disp,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf3; \
-        x86_64_emit_rex(0,(dreg),0,(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x7e; \
-        x86_64_emit_membase((basereg),(disp),(dreg)); \
-    } while (0)
+#define M_IMOV_IMM(a,b)         emit_movl_imm_reg(cd, (u4) (a), (b))
 
+#define M_ILD(a,b,disp)         emit_movl_membase_reg(cd, (b), (disp), (a))
+#define M_LLD(a,b,disp)         emit_mov_membase_reg(cd, (b), (disp), (a))
 
-#define x86_64_movss_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf3; \
-        x86_64_emit_rex(0,(reg),0,(dreg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x10; \
-        x86_64_emit_reg((reg),(dreg)); \
-    } while (0)
+#define M_ILD32(a,b,disp)       emit_movl_membase32_reg(cd, (b), (disp), (a))
+#define M_LLD32(a,b,disp)       emit_mov_membase32_reg(cd, (b), (disp), (a))
 
+#define M_IST(a,b,disp)         emit_movl_reg_membase(cd, (a), (b), (disp))
+#define M_LST(a,b,disp)         emit_mov_reg_membase(cd, (a), (b), (disp))
 
-#define x86_64_movsd_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf2; \
-        x86_64_emit_rex(0,(reg),0,(dreg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x10; \
-        x86_64_emit_reg((reg),(dreg)); \
-    } while (0)
+#define M_IST_IMM(a,b,disp)     emit_movl_imm_membase(cd, (a), (b), (disp))
+#define M_LST_IMM32(a,b,disp)   emit_mov_imm_membase(cd, (a), (b), (disp))
 
+#define M_IST32(a,b,disp)       emit_movl_reg_membase32(cd, (a), (b), (disp))
+#define M_LST32(a,b,disp)       emit_mov_reg_membase32(cd, (a), (b), (disp))
 
-#define x86_64_movss_reg_membase(reg,basereg,disp) \
-    do { \
-        *(mcodeptr++) = 0xf3; \
-        x86_64_emit_rex(0,(reg),0,(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x11; \
-        x86_64_emit_membase((basereg),(disp),(reg)); \
-    } while (0)
+#define M_IST32_IMM(a,b,disp)   emit_movl_imm_membase32(cd, (a), (b), (disp))
+#define M_LST32_IMM32(a,b,disp) emit_mov_imm_membase32(cd, (a), (b), (disp))
 
+#define M_IADD(a,b)             emit_alul_reg_reg(cd, ALU_ADD, (a), (b))
+#define M_IADD_IMM(a,b)         emit_alul_reg_reg(cd, ALU_ADD, (a), (b))
 
-#define x86_64_movsd_reg_membase(reg,basereg,disp) \
-    do { \
-        *(mcodeptr++) = 0xf2; \
-        x86_64_emit_rex(0,(reg),0,(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x11; \
-        x86_64_emit_membase((basereg),(disp),(reg)); \
-    } while (0)
+#define M_LADD(a,b)             emit_alu_reg_reg(cd, ALU_ADD, (a), (b))
+#define M_LADD_IMM(a,b)         emit_alu_imm_reg(cd, ALU_ADD, (a), (b))
+#define M_LSUB(a,b)             emit_alu_reg_reg(cd, ALU_SUB, (a), (b))
+#define M_LSUB_IMM(a,b)         emit_alu_imm_reg(cd, ALU_SUB, (a), (b))
 
+#define M_IINC_MEMBASE(a,b)     emit_incl_membase(cd, (a), (b))
 
-#define x86_64_movss_membase_reg(basereg,disp,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf3; \
-        x86_64_emit_rex(0,(dreg),0,(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x10; \
-        x86_64_emit_membase((basereg),(disp),(dreg)); \
-    } while (0)
+#define M_IADD_MEMBASE(a,b,c)   emit_alul_reg_membase(cd, ALU_ADD, (a), (b), (c))
+#define M_IADC_MEMBASE(a,b,c)   emit_alul_reg_membase(cd, ALU_ADC, (a), (b), (c))
+#define M_ISUB_MEMBASE(a,b,c)   emit_alul_reg_membase(cd, ALU_SUB, (a), (b), (c))
+#define M_ISBB_MEMBASE(a,b,c)   emit_alul_reg_membase(cd, ALU_SBB, (a), (b), (c))
 
+#define M_ALD(a,b,disp)         M_LLD(a,b,disp)
+#define M_ALD32(a,b,disp)       M_LLD32(a,b,disp)
 
-#define x86_64_movlps_membase_reg(basereg,disp,dreg) \
-    do { \
-        x86_64_emit_rex(0,(dreg),0,(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x12; \
-        x86_64_emit_membase((basereg),(disp),(dreg)); \
-    } while (0)
+#define M_AST(a,b,c)            M_LST(a,b,c)
+#define M_AST_IMM32(a,b,c)      M_LST_IMM32(a,b,c)
 
+#define M_AADD(a,b)             M_LADD(a,b)
+#define M_AADD_IMM(a,b)         M_LADD_IMM(a,b)
+#define M_ASUB_IMM(a,b)         M_LSUB_IMM(a,b)
 
-#define x86_64_movsd_membase_reg(basereg,disp,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf2; \
-        x86_64_emit_rex(0,(dreg),0,(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x10; \
-        x86_64_emit_membase((basereg),(disp),(dreg)); \
-    } while (0)
+#define M_LADD_IMM32(a,b)       emit_alu_imm32_reg(cd, ALU_ADD, (a), (b))
+#define M_AADD_IMM32(a,b)       M_LADD_IMM32(a,b)
+#define M_LSUB_IMM32(a,b)       emit_alu_imm32_reg(cd, ALU_SUB, (a), (b))
 
+#define M_ILEA(a,b,c)           emit_leal_membase_reg(cd, (a), (b), (c))
+#define M_LLEA(a,b,c)           emit_lea_membase_reg(cd, (a), (b), (c))
+#define M_ALEA(a,b,c)           M_LLEA(a,b,c)
 
-#define x86_64_movlpd_membase_reg(basereg,disp,dreg) \
-    do { \
-        *(mcodeptr++) = 0x66; \
-        x86_64_emit_rex(0,(dreg),0,(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x12; \
-        x86_64_emit_membase((basereg),(disp),(dreg)); \
-    } while (0)
+#define M_INEG(a)               emit_negl_reg(cd, (a))
+#define M_LNEG(a)               emit_neg_reg(cd, (a))
 
+#define M_INEG_MEMBASE(a,b)     emit_negl_membase(cd, (a), (b))
+#define M_LNEG_MEMBASE(a,b)     emit_neg_membase(cd, (a), (b))
 
-#define x86_64_movss_reg_memindex(reg,disp,basereg,indexreg,scale) \
-    do { \
-        *(mcodeptr++) = 0xf3; \
-        x86_64_emit_rex(0,(reg),(indexreg),(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x11; \
-        x86_64_emit_memindex((reg),(disp),(basereg),(indexreg),(scale)); \
-    } while (0)
+#define M_AND(a,b)              emit_alu_reg_reg(cd, ALU_AND, (a), (b))
+#define M_XOR(a,b)              emit_alu_reg_reg(cd, ALU_XOR, (a), (b))
 
+#define M_IAND(a,b)             emit_alul_reg_reg(cd, ALU_AND, (a), (b))
+#define M_IAND_IMM(a,b)         emit_alul_imm_reg(cd, ALU_AND, (a), (b))
+#define M_IXOR(a,b)             emit_alul_reg_reg(cd, ALU_XOR, (a), (b))
 
-#define x86_64_movsd_reg_memindex(reg,disp,basereg,indexreg,scale) \
-    do { \
-        *(mcodeptr++) = 0xf2; \
-        x86_64_emit_rex(0,(reg),(indexreg),(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x11; \
-        x86_64_emit_memindex((reg),(disp),(basereg),(indexreg),(scale)); \
-    } while (0)
+#define M_BSEXT(a,b)            emit_movsbq_reg_reg(cd, (a), (b))
+#define M_SSEXT(a,b)            emit_movswq_reg_reg(cd, (a), (b))
+#define M_ISEXT(a,b)            emit_movslq_reg_reg(cd, (a), (b))
 
+#define M_CZEXT(a,b)            emit_movzwq_reg_reg(cd, (a), (b))
 
-#define x86_64_movss_memindex_reg(disp,basereg,indexreg,scale,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf3; \
-        x86_64_emit_rex(0,(dreg),(indexreg),(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x10; \
-        x86_64_emit_memindex((dreg),(disp),(basereg),(indexreg),(scale)); \
-    } while (0)
+#define M_BSEXT_MEMBASE(a,disp,b) emit_movsbq_membase_reg(cd, (a), (disp), (b))
+#define M_SSEXT_MEMBASE(a,disp,b) emit_movswq_membase_reg(cd, (a), (disp), (b))
+#define M_ISEXT_MEMBASE(a,disp,b) emit_movslq_membase_reg(cd, (a), (disp), (b))
 
+#define M_CZEXT_MEMBASE(a,disp,b) emit_movzwq_membase_reg(cd, (a), (disp), (b))
 
-#define x86_64_movsd_memindex_reg(disp,basereg,indexreg,scale,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf2; \
-        x86_64_emit_rex(0,(dreg),(indexreg),(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x10; \
-        x86_64_emit_memindex((dreg),(disp),(basereg),(indexreg),(scale)); \
-    } while (0)
+#define M_TEST(a)               emit_test_reg_reg(cd, (a), (a))
+#define M_ITEST(a)              emit_testl_reg_reg(cd, (a), (a))
 
+#define M_CMP(a,b)              emit_alu_reg_reg(cd, ALU_CMP, (a), (b))
+#define M_CMP_IMM(a,b)          emit_alu_imm_reg(cd, ALU_CMP, (a), (b))
+#define M_CMP_IMM_MEMBASE(a,b,c) emit_alu_imm_membase(cd, ALU_CMP, (a), (b), (c))
+#define M_CMP_MEMBASE(a,b,c)    emit_alu_membase_reg(cd, ALU_CMP, (a), (b), (c))
 
-#define x86_64_mulss_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf3; \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x59; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
+#define M_ICMP(a,b)             emit_alul_reg_reg(cd, ALU_CMP, (a), (b))
+#define M_ICMP_IMM(a,b)         emit_alul_imm_reg(cd, ALU_CMP, (a), (b))
+#define M_ICMP_IMM_MEMBASE(a,b,c) emit_alul_imm_membase(cd, ALU_CMP, (a), (b), (c))
 
+#define M_BEQ(disp)             emit_jcc(cd, CC_E, (disp))
+#define M_BNE(disp)             emit_jcc(cd, CC_NE, (disp))
+#define M_BLT(disp)             emit_jcc(cd, CC_L, (disp))
+#define M_BLE(disp)             emit_jcc(cd, CC_LE, (disp))
+#define M_BAE(disp)             emit_jcc(cd, CC_AE, (disp))
+#define M_BA(disp)              emit_jcc(cd, CC_A, (disp))
 
-#define x86_64_mulsd_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf2; \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x59; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
+#define M_CMOVEQ(a,b)           emit_cmovcc_reg_reg(cd, CC_E, (a), (b))
+#define M_CMOVNE(a,b)           emit_cmovcc_reg_reg(cd, CC_NE, (a), (b))
+#define M_CMOVLT(a,b)           emit_cmovcc_reg_reg(cd, CC_L, (a), (b))
+#define M_CMOVLE(a,b)           emit_cmovcc_reg_reg(cd, CC_LE, (a), (b))
+#define M_CMOVGE(a,b)           emit_cmovcc_reg_reg(cd, CC_GE, (a), (b))
+#define M_CMOVGT(a,b)           emit_cmovcc_reg_reg(cd, CC_G, (a), (b))
 
+#define M_CMOVEQ_MEMBASE(a,b,c) emit_cmovcc_reg_membase(cd, CC_E, (a), (b))
+#define M_CMOVNE_MEMBASE(a,b,c) emit_cmovcc_reg_membase(cd, CC_NE, (a), (b))
+#define M_CMOVLT_MEMBASE(a,b,c) emit_cmovcc_reg_membase(cd, CC_L, (a), (b))
+#define M_CMOVLE_MEMBASE(a,b,c) emit_cmovcc_reg_membase(cd, CC_LE, (a), (b))
+#define M_CMOVGE_MEMBASE(a,b,c) emit_cmovcc_reg_membase(cd, CC_GE, (a), (b))
+#define M_CMOVGT_MEMBASE(a,b,c) emit_cmovcc_reg_membase(cd, CC_G, (a), (b))
 
-#define x86_64_subss_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf3; \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x5c; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
+#define M_CMOVB(a,b)            emit_cmovcc_reg_reg(cd, CC_B, (a), (b))
+#define M_CMOVA(a,b)            emit_cmovcc_reg_reg(cd, CC_A, (a), (b))
+#define M_CMOVP(a,b)            emit_cmovcc_reg_reg(cd, CC_P, (a), (b))
 
+#define M_PUSH(a)               emit_push_reg(cd, (a))
+#define M_PUSH_IMM(a)           emit_push_imm(cd, (a))
+#define M_POP(a)                emit_pop_reg(cd, (a))
 
-#define x86_64_subsd_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0xf2; \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x5c; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
+#define M_JMP(a)                emit_jmp_reg(cd, (a))
+#define M_JMP_IMM(a)            emit_jmp_imm(cd, (a))
+#define M_CALL(a)               emit_call_reg(cd, (a))
+#define M_CALL_IMM(a)           emit_call_imm(cd, (a))
+#define M_RET                   emit_ret(cd)
 
+#define M_NOP                   emit_nop(cd)
 
-#define x86_64_ucomiss_reg_reg(reg,dreg) \
-    do { \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x2e; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
+#define M_CLR(a)                M_XOR(a,a)
 
 
-#define x86_64_ucomisd_reg_reg(reg,dreg) \
-    do { \
-        *(mcodeptr++) = 0x66; \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x2e; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
+#if 0
+#define M_FLD(a,b,c)            emit_movlps_membase_reg(cd, (a), (b), (c))
+#define M_DLD(a,b,c)            emit_movlpd_membase_reg(cd, (a), (b), (c))
 
+#define M_FST(a,b,c)            emit_movlps_reg_membase(cd, (a), (b), (c))
+#define M_DST(a,b,c)            emit_movlpd_reg_membase(cd, (a), (b), (c))
+#endif
 
-#define x86_64_xorps_reg_reg(reg,dreg) \
-    do { \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x57; \
-        x86_64_emit_reg((dreg),(reg)); \
-    } while (0)
+#define M_DLD(a,b,disp)         emit_movq_membase_reg(cd, (b), (disp), (a))
+#define M_DST(a,b,disp)         emit_movq_reg_membase(cd, (a), (b), (disp))
 
 
-#define x86_64_xorps_membase_reg(basereg,disp,dreg) \
-    do { \
-        x86_64_emit_rex(0,(dreg),0,(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x57; \
-        x86_64_emit_membase((basereg),(disp),(dreg)); \
-    } while (0)
+/* system instructions ********************************************************/
 
+#define M_RDTSC                 emit_rdtsc(cd)
 
-#define x86_64_xorpd_reg_reg(reg,dreg) \
+#define PROFILE_CYCLE_START \
     do { \
-        *(mcodeptr++) = 0x66; \
-        x86_64_emit_rex(0,(dreg),0,(reg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x57; \
-        x86_64_emit_reg((dreg),(reg)); \
+        if (opt_prof) { \
+            M_PUSH(RAX); \
+            M_PUSH(RDX); \
+            \
+            M_MOV_IMM((ptrint) m, REG_ITMP3); \
+            M_RDTSC; \
+            M_ISUB_MEMBASE(RAX, REG_ITMP3, OFFSET(methodinfo, cycles)); \
+            M_ISBB_MEMBASE(RDX, REG_ITMP3, OFFSET(methodinfo, cycles) + 4); \
+            \
+            M_POP(RDX); \
+            M_POP(RAX); \
+        } \
     } while (0)
 
-
-#define x86_64_xorpd_membase_reg(basereg,disp,dreg) \
+#define PROFILE_CYCLE_STOP \
     do { \
-        *(mcodeptr++) = 0x66; \
-        x86_64_emit_rex(0,(dreg),0,(basereg)); \
-        *(mcodeptr++) = 0x0f; \
-        *(mcodeptr++) = 0x57; \
-        x86_64_emit_membase((basereg),(disp),(dreg)); \
+        if (opt_prof) { \
+            M_PUSH(RAX); \
+            M_PUSH(RDX); \
+            \
+            M_MOV_IMM((ptrint) m, REG_ITMP3); \
+            M_RDTSC; \
+            M_IADD_MEMBASE(RAX, REG_ITMP3, OFFSET(methodinfo, cycles)); \
+            M_IADC_MEMBASE(RDX, REG_ITMP3, OFFSET(methodinfo, cycles) + 4); \
+            \
+            M_POP(RDX); \
+            M_POP(RAX); \
+        } \
     } while (0)
 
-#else
-
-/*
- * integer instructions
- */
-void x86_64_mov_reg_reg(s8 reg, s8 dreg);
-void x86_64_mov_imm_reg(s8 imm, s8 reg);
-void x86_64_movl_imm_reg(s8 imm, s8 reg);
-void x86_64_mov_membase_reg(s8 basereg, s8 disp, s8 reg);
-void x86_64_movl_membase_reg(s8 basereg, s8 disp, s8 reg);
-void x86_64_mov_membase32_reg(s8 basereg, s8 disp, s8 reg);
-void x86_64_mov_reg_membase(s8 reg, s8 basereg, s8 disp);
-void x86_64_movl_reg_membase(s8 reg, s8 basereg, s8 disp);
-void x86_64_mov_memindex_reg(s8 disp, s8 basereg, s8 indexreg, s8 scale, s8 reg);
-void x86_64_movl_memindex_reg(s8 disp, s8 basereg, s8 indexreg, s8 scale, s8 reg);
-void x86_64_mov_reg_memindex(s8 reg, s8 disp, s8 basereg, s8 indexreg, s8 scale);
-void x86_64_movl_reg_memindex(s8 reg, s8 disp, s8 basereg, s8 indexreg, s8 scale);
-void x86_64_movw_reg_memindex(s8 reg, s8 disp, s8 basereg, s8 indexreg, s8 scale);
-void x86_64_movb_reg_memindex(s8 reg, s8 disp, s8 basereg, s8 indexreg, s8 scale);
-void x86_64_mov_imm_membase(s8 imm, s8 basereg, s8 disp);
-void x86_64_movl_imm_membase(s8 imm, s8 basereg, s8 disp);
-void x86_64_movsbq_reg_reg(s8 reg, s8 dreg);
-void x86_64_movsbq_membase_reg(s8 basereg, s8 disp, s8 dreg);
-void x86_64_movswq_reg_reg(s8 reg, s8 dreg);
-void x86_64_movswq_membase_reg(s8 basereg, s8 disp, s8 dreg);
-void x86_64_movslq_reg_reg(s8 reg, s8 dreg);
-void x86_64_movslq_membase_reg(s8 basereg, s8 disp, s8 dreg);
-void x86_64_movzwq_reg_reg(s8 reg, s8 dreg);
-void x86_64_movzwq_membase_reg(s8 basereg, s8 disp, s8 dreg);
-void x86_64_movswq_memindex_reg(s8 disp, s8 basereg, s8 indexreg, s8 scale, s8 reg);
-void x86_64_movsbq_memindex_reg(s8 disp, s8 basereg, s8 indexreg, s8 scale, s8 reg);
-void x86_64_movzwq_memindex_reg(s8 disp, s8 basereg, s8 indexreg, s8 scale, s8 reg);
-void x86_64_alu_reg_reg(s8 opc, s8 reg, s8 dreg);
-void x86_64_alul_reg_reg(s8 opc, s8 reg, s8 dreg);
-void x86_64_alu_reg_membase(s8 opc, s8 reg, s8 basereg, s8 disp);
-void x86_64_alul_reg_membase(s8 opc, s8 reg, s8 basereg, s8 disp);
-void x86_64_alu_membase_reg(s8 opc, s8 basereg, s8 disp, s8 reg);
-void x86_64_alul_membase_reg(s8 opc, s8 basereg, s8 disp, s8 reg);
-void x86_64_alu_imm_reg(s8 opc, s8 imm, s8 dreg);
-void x86_64_alul_imm_reg(s8 opc, s8 imm, s8 dreg);
-void x86_64_alu_imm_membase(s8 opc, s8 imm, s8 basereg, s8 disp);
-void x86_64_alul_imm_membase(s8 opc, s8 imm, s8 basereg, s8 disp);
-void x86_64_test_reg_reg(s8 reg, s8 dreg);
-void x86_64_testl_reg_reg(s8 reg, s8 dreg);
-void x86_64_test_imm_reg(s8 imm, s8 reg);
-void x86_64_testw_imm_reg(s8 imm, s8 reg);
-void x86_64_testb_imm_reg(s8 imm, s8 reg);
-void x86_64_lea_membase_reg(s8 basereg, s8 disp, s8 reg);
-void x86_64_leal_membase_reg(s8 basereg, s8 disp, s8 reg);
-void x86_64_inc_reg(s8 reg);
-void x86_64_incl_reg(s8 reg);
-void x86_64_inc_membase(s8 basereg, s8 disp);
-void x86_64_incl_membase(s8 basereg, s8 disp);
-void x86_64_dec_reg(s8 reg);
-void x86_64_decl_reg(s8 reg);
-void x86_64_dec_membase(s8 basereg, s8 disp);
-void x86_64_decl_membase(s8 basereg, s8 disp);
-void x86_64_cltd();
-void x86_64_cqto();
-void x86_64_imul_reg_reg(s8 reg, s8 dreg);
-void x86_64_imull_reg_reg(s8 reg, s8 dreg);
-void x86_64_imul_membase_reg(s8 basereg, s8 disp, s8 dreg);
-void x86_64_imull_membase_reg(s8 basereg, s8 disp, s8 dreg);
-void x86_64_imul_imm_reg(s8 imm, s8 dreg);
-void x86_64_imul_imm_reg_reg(s8 imm,s8 reg, s8 dreg);
-void x86_64_imull_imm_reg_reg(s8 imm, s8 reg, s8 dreg);
-void x86_64_imul_imm_membase_reg(s8 imm, s8 basereg, s8 disp, s8 dreg);
-void x86_64_imull_imm_membase_reg(s8 imm, s8 basereg, s8 disp, s8 dreg);
-void x86_64_idiv_reg(s8 reg);
-void x86_64_idivl_reg(s8 reg);
-void x86_64_ret();
-void x86_64_shift_reg(s8 opc, s8 reg);
-void x86_64_shiftl_reg(s8 opc, s8 reg);
-void x86_64_shift_membase(s8 opc, s8 basereg, s8 disp);
-void x86_64_shiftl_membase(s8 opc, s8 basereg, s8 disp);
-void x86_64_shift_imm_reg(s8 opc, s8 imm, s8 dreg);
-void x86_64_shiftl_imm_reg(s8 opc, s8 imm, s8 dreg);
-void x86_64_shift_imm_membase(s8 opc, s8 imm, s8 basereg, s8 disp);
-void x86_64_shiftl_imm_membase(s8 opc, s8 imm, s8 basereg, s8 disp);
-void x86_64_jmp_imm(s8 imm);
-void x86_64_jmp_reg(s8 reg);
-void x86_64_jcc(s8 opc, s8 imm);
-void x86_64_setcc_reg(s8 opc, s8 reg);
-void x86_64_setcc_membase(s8 opc, s8 basereg, s8 disp);
-void x86_64_cmovcc_reg_reg(s8 opc, s8 reg, s8 dreg);
-void x86_64_cmovccl_reg_reg(s8 opc, s8 reg, s8 dreg);
-void x86_64_neg_reg(s8 reg);
-void x86_64_negl_reg(s8 reg);
-void x86_64_neg_membase(s8 basereg, s8 disp);
-void x86_64_negl_membase(s8 basereg, s8 disp);
-void x86_64_push_imm(s8 imm);
-void x86_64_pop_reg(s8 reg);
-void x86_64_xchg_reg_reg(s8 reg, s8 dreg);
-void x86_64_nop();
-void x86_64_call_reg(s8 reg);
-void x86_64_call_imm(s8 imm);
-
-
-
-/*
- * floating point instructions (SSE2)
- */
-void x86_64_addsd_reg_reg(s8 reg, s8 dreg);
-void x86_64_addss_reg_reg(s8 reg, s8 dreg);
-void x86_64_cvtsi2ssq_reg_reg(s8 reg, s8 dreg);
-void x86_64_cvtsi2ss_reg_reg(s8 reg, s8 dreg);
-void x86_64_cvtsi2sdq_reg_reg(s8 reg, s8 dreg);
-void x86_64_cvtsi2sd_reg_reg(s8 reg, s8 dreg);
-void x86_64_cvtss2sd_reg_reg(s8 reg, s8 dreg);
-void x86_64_cvtsd2ss_reg_reg(s8 reg, s8 dreg);
-void x86_64_cvttss2siq_reg_reg(s8 reg, s8 dreg);
-void x86_64_cvttss2si_reg_reg(s8 reg, s8 dreg);
-void x86_64_cvttsd2siq_reg_reg(s8 reg, s8 dreg);
-void x86_64_cvttsd2si_reg_reg(s8 reg, s8 dreg);
-void x86_64_divss_reg_reg(s8 reg, s8 dreg);
-void x86_64_divsd_reg_reg(s8 reg, s8 dreg);
-void x86_64_movd_reg_freg(s8 reg, s8 freg);
-void x86_64_movd_freg_reg(s8 freg, s8 reg);
-void x86_64_movd_reg_membase(s8 reg, s8 basereg, s8 disp);
-void x86_64_movd_reg_memindex(s8 reg, s8 disp, s8 basereg, s8 indexreg, s8 scale);
-void x86_64_movd_membase_reg(s8 basereg, s8 disp, s8 dreg);
-void x86_64_movdl_membase_reg(s8 basereg, s8 disp, s8 dreg);
-void x86_64_movd_memindex_reg(s8 disp, s8 basereg, s8 indexreg, s8 scale, s8 dreg);
-void x86_64_movq_reg_reg(s8 reg, s8 dreg);
-void x86_64_movq_reg_membase(s8 reg, s8 basereg, s8 disp);
-void x86_64_movq_membase_reg(s8 basereg, s8 disp, s8 dreg);
-void x86_64_movss_reg_reg(s8 reg, s8 dreg);
-void x86_64_movsd_reg_reg(s8 reg, s8 dreg);
-void x86_64_movss_reg_membase(s8 reg, s8 basereg, s8 disp);
-void x86_64_movsd_reg_membase(s8 reg, s8 basereg, s8 disp);
-void x86_64_movss_membase_reg(s8 basereg, s8 disp, s8 dreg);
-void x86_64_movlps_membase_reg(s8 basereg, s8 disp, s8 dreg);
-void x86_64_movsd_membase_reg(s8 basereg, s8 disp, s8 dreg);
-void x86_64_movlpd_membase_reg(s8 basereg, s8 disp, s8 dreg);
-void x86_64_movss_reg_memindex(s8 reg, s8 disp, s8 basereg, s8 indexreg, s8 scale);
-void x86_64_movsd_reg_memindex(s8 reg, s8 disp, s8 basereg, s8 indexreg, s8 scale);
-void x86_64_movss_memindex_reg(s8 disp, s8 basereg, s8 indexreg, s8 scale, s8 dreg);
-void x86_64_movsd_memindex_reg(s8 disp, s8 basereg, s8 indexreg, s8 scale, s8 dreg);
-void x86_64_mulss_reg_reg(s8 reg, s8 dreg);
-void x86_64_mulsd_reg_reg(s8 reg, s8 dreg);
-void x86_64_subss_reg_reg(s8 reg, s8 dreg);
-void x86_64_subsd_reg_reg(s8 reg, s8 dreg);
-void x86_64_ucomiss_reg_reg(s8 reg, s8 dreg);
-void x86_64_ucomisd_reg_reg(s8 reg, s8 dreg);
-void x86_64_xorps_reg_reg(s8 reg, s8 dreg);
-void x86_64_xorps_membase_reg(s8 basereg, s8 disp, s8 dreg);
-void x86_64_xorpd_reg_reg(s8 reg, s8 dreg);
-void x86_64_xorpd_membase_reg(s8 basereg, s8 disp, s8 dreg);
-
-#endif
-
-
 
 /* function gen_resolvebranch **************************************************
 
@@ -1949,8 +357,6 @@ void x86_64_xorpd_membase_reg(s8 basereg, s8 disp, s8 dreg);
 #define gen_resolvebranch(ip,so,to) \
     *((s4*) ((ip) - 4)) = (s4) ((to) - (so));
 
-#define SOFTNULLPTRCHECK       /* soft null pointer check supportet as option */
-
 #endif /* _CODEGEN_H */
 
 
@@ -1966,4 +372,3 @@ void x86_64_xorpd_membase_reg(s8 basereg, s8 disp, s8 dreg);
  * tab-width: 4
  * End:
  */
-