Merge remote branch 'upstream/master'
[mono.git] / mono / mini / cpu-x86.md
index b1a846fe5c8d097828f036e11e4a9b51d6609367..41dcbbedfad8d7080f843d9447df75dab27368de 100644 (file)
 # the required specifiers are: len, clob (if registers are clobbered), the registers
 # specifiers if the registers are actually used, flags (when scheduling is implemented).
 #
+# Templates can be defined by using the 'template' keyword instead of an opcode name.
+# The template name is assigned from a (required) 'name' specifier.
+# To apply a template to an opcode, just use the template:template_name specifier: any value
+# defined by the template can be overridden by adding more specifiers after the template.
+#
 # See the code in mini-x86.c for more details on how the specifiers are used.
 #
 break: len:1
-jmp: len:32
+jmp: len:32 clob:c
 call: dest:a clob:c len:17
+tailcall: len:120 clob:c
 br: len:5
+seq_point: len:16
+
 int_beq: len:6
 int_bge: len:6
 int_bgt: len:6
@@ -73,16 +81,18 @@ int_ble_un: len:6
 int_blt_un: len:6
 label: len:0
 
-int_add: dest:i src1:i src2:i len:2 clob:1
-int_sub: dest:i src1:i src2:i len:2 clob:1
-int_mul: dest:i src1:i src2:i len:3 clob:1
+template: name:ibalu dest:i src1:i src2:i clob:1 len:2
+
+int_add: template:ibalu
+int_sub: template:ibalu
+int_mul: template:ibalu len:3
 int_div: dest:a src1:a src2:i len:15 clob:d
 int_div_un: dest:a src1:a src2:i len:15 clob:d
 int_rem: dest:d src1:a src2:i len:15 clob:a
 int_rem_un: dest:d src1:a src2:i len:15 clob:a
-int_and: dest:i src1:i src2:i len:2 clob:1
-int_or: dest:i src1:i src2:i len:2 clob:1
-int_xor: dest:i src1:i src2:i len:2 clob:1
+int_and: template:ibalu
+int_or: template:ibalu
+int_xor: template:ibalu
 int_shl: dest:i src1:i src2:s clob:1 len:2
 int_shr: dest:i src1:i src2:s clob:1 len:2
 int_shr_un: dest:i src1:i src2:s clob:1 len:2
@@ -96,7 +106,7 @@ int_not: dest:i src1:i len:2 clob:1
 int_conv_to_i1: dest:i src1:y len:3
 int_conv_to_i2: dest:i src1:i len:3
 int_conv_to_i4: dest:i src1:i len:2
-int_conv_to_r4: dest:f src1:i len:7
+int_conv_to_r4: dest:f src1:i len:13
 int_conv_to_r8: dest:f src1:i len:7
 int_conv_to_u4: dest:i src1:i
 int_conv_to_u2: dest:i src1:i len:3
@@ -108,8 +118,8 @@ int_mul_ovf_un: dest:i src1:i src2:i len:16
 throw: src1:i len:13
 rethrow: src1:i len:13
 start_handler: len:16
-endfinally: len:16
-endfilter: src1:a len:16
+endfinally: len:16 nacl:21
+endfilter: src1:a len:16 nacl:21
 
 ckfinite: dest:f src1:f len:32
 ceq: dest:y len:6
@@ -117,31 +127,26 @@ cgt: dest:y len:6
 cgt.un: dest:y len:6
 clt: dest:y len:6
 clt.un: dest:y len:6
-cne: dest:y len:6
 localloc: dest:i src1:i len:120
 compare: src1:i src2:i len:2
 compare_imm: src1:i len:6
 fcompare: src1:f src2:f clob:a len:9
 oparglist: src1:b len:10
-outarg: src1:i len:1
-outarg_imm: len:5
-setret: dest:a src1:i len:2
-setlret: dest:l src1:i src2:i len:4
 checkthis: src1:b len:3
 voidcall: len:17 clob:c
 voidcall_reg: src1:i len:11 clob:c
-voidcall_membase: src1:b len:16 clob:c
-fcall: dest:f len:48 clob:c
-fcall_reg: dest:f src1:i len:48 clob:c
-fcall_membase: dest:f src1:b len:48 clob:c
+voidcall_membase: src1:b len:16 nacl:17 clob:c
+fcall: dest:f len:17 clob:c
+fcall_reg: dest:f src1:i len:11 clob:c
+fcall_membase: dest:f src1:b len:16 nacl:17 clob:c
 lcall: dest:l len:17 clob:c
 lcall_reg: dest:l src1:i len:11 clob:c
-lcall_membase: dest:l src1:b len:16 clob:c
+lcall_membase: dest:l src1:b len:16 nacl:17 clob:c
 vcall: len:17 clob:c
 vcall_reg: src1:i len:11 clob:c
-vcall_membase: src1:b len:16 clob:c
-call_reg: dest:a src1:i len:11 clob:c
-call_membase: dest:a src1:b len:16 clob:c
+vcall_membase: src1:b len:16 nacl:17 clob:c
+call_reg: dest:a src1:i len:11 nacl:14 clob:c
+call_membase: dest:a src1:b len:16 nacl:18 clob:c
 iconst: dest:i len:5
 r4const: dest:f len:15
 r8const: dest:f len:16
@@ -157,6 +162,7 @@ storei8_membase_imm: dest:b
 storei8_membase_reg: dest:b src1:i 
 storer4_membase_reg: dest:b src1:f len:7
 storer8_membase_reg: dest:b src1:f len:7
+store_mem_imm: len:12
 load_membase: dest:i src1:b len:7
 loadi1_membase: dest:y src1:b len:7
 loadu1_membase: dest:y src1:b len:7
@@ -167,7 +173,6 @@ loadu4_membase: dest:i src1:b len:7
 loadi8_membase: dest:i src1:b
 loadr4_membase: dest:f src1:b len:7
 loadr8_membase: dest:f src1:b len:7
-loadr8_spill_membase: src1:b len:9
 loadu4_mem: dest:i len:9
 move: dest:i src1:i len:2
 addcc_imm: dest:i src1:i len:6 clob:1
@@ -175,13 +180,6 @@ add_imm: dest:i src1:i len:6 clob:1
 subcc_imm: dest:i src1:i len:6 clob:1
 sub_imm: dest:i src1:i len:6 clob:1
 mul_imm: dest:i src1:i len:9
-# there is no actual support for division or reminder by immediate
-# we simulate them, though (but we need to change the burg rules 
-# to allocate a symbolic reg for src2)
-div_imm: dest:a src1:a src2:i len:15 clob:d
-div_un_imm: dest:a src1:a src2:i len:15 clob:d
-rem_imm: dest:d src1:a src2:i len:15 clob:a
-rem_un_imm: dest:d src1:a src2:i len:15 clob:a
 and_imm: dest:i src1:i len:6 clob:1
 or_imm: dest:i src1:i len:6 clob:1
 xor_imm: dest:i src1:i len:6 clob:1
@@ -205,9 +203,6 @@ cond_exc_nc: len:6
 long_shl: dest:L src1:L src2:s clob:1 len:21
 long_shr: dest:L src1:L src2:s clob:1 len:22
 long_shr_un: dest:L src1:L src2:s clob:1 len:22
-long_conv_to_ovf_i: dest:i src1:i src2:i len:30
-long_mul_ovf: 
-long_conv_to_r_un: dest:f src1:i src2:i len:37 
 long_shr_imm: dest:L src1:L clob:1 len:10
 long_shr_un_imm: dest:L src1:L clob:1 len:10
 long_shl_imm: dest:L src1:L clob:1 len:10
@@ -248,10 +243,11 @@ float_cgt_un: dest:y src1:f src2:f len:37
 float_clt: dest:y src1:f src2:f len:25
 float_clt_un: dest:y src1:f src2:f len:32
 float_conv_to_u: dest:i src1:f len:36
-call_handler: len:11
+call_handler: len:11 clob:c
 aot_const: dest:i len:5
 load_gotaddr: dest:i len:64
 got_entry: dest:i src1:b len:7
+nacl_gc_safe_point: clob:c
 x86_test_null: src1:i len:2
 x86_compare_membase_reg: src1:b src2:i len:7
 x86_compare_membase_imm: src1:b len:11
@@ -291,13 +287,14 @@ subcc: dest:i src1:i src2:i len:2 clob:1
 adc_imm: dest:i src1:i len:6 clob:1
 sbb: dest:i src1:i src2:i len:2 clob:1
 sbb_imm: dest:i src1:i len:6 clob:1
-br_reg: src1:i len:2
+br_reg: src1:i len:2 nacl:5
 sin: dest:f src1:f len:6
 cos: dest:f src1:f len:6
 abs: dest:f src1:f len:2
 tan: dest:f src1:f len:49
 atan: dest:f src1:f len:8
 sqrt: dest:f src1:f len:2
+round: dest:f src1:f len:2
 bigmul: len:2 dest:l src1:a src2:i
 bigmul_un: len:2 dest:l src1:a src2:i
 sext_i1: dest:i src1:y len:3
@@ -306,14 +303,17 @@ tls_get: dest:i len:20
 atomic_add_i4: src1:b src2:i dest:i len:16
 atomic_add_new_i4: src1:b src2:i dest:i len:16
 atomic_exchange_i4: src1:b src2:i dest:a len:24
-atomic_cas_imm_i4: src1:b src2:i dest:a len:24
+atomic_cas_i4: src1:b src2:i src3:a dest:a len:24
 memory_barrier: len:16
 
+card_table_wbarrier: src1:a src2:i clob:d len:34
+
 relaxed_nop: len:2
+hard_nop: len:1
 
 # Linear IR opcodes
 nop: len:0
-dummy_use: len:0
+dummy_use: src1:i len:0
 dummy_store: len:0
 not_reached: len:0
 not_null: src1:i len:0
@@ -377,12 +377,12 @@ cmov_ile_un: dest:i src1:i src2:i len:16 clob:1
 cmov_ilt_un: dest:i src1:i src2:i len:16 clob:1
 
 long_conv_to_ovf_i4_2: dest:i src1:i src2:i len:30
-long_conv_to_r8_2: dest:f src1:i src2:i len:37 
-long_conv_to_r4_2: dest:f src1:i src2:i len:64
-long_conv_to_r_un_2: dest:f src1:i src2:i len:37 
+long_conv_to_r8_2: dest:f src1:i src2:i len:14 
+long_conv_to_r4_2: dest:f src1:i src2:i len:14
+long_conv_to_r_un_2: dest:f src1:i src2:i len:26 
 
 fmove: dest:f src1:f
-float_conv_to_r4: dest:f src1:f
+float_conv_to_r4: dest:f src1:f  len:12
 
 load_mem: dest:i len:9
 loadi4_mem: dest:i len:9
@@ -391,7 +391,7 @@ loadu2_mem: dest:i len:9
 
 vcall2: len:17 clob:c
 vcall2_reg: src1:i len:11 clob:c
-vcall2_membase: src1:b len:16 clob:c
+vcall2_membase: src1:b len:16 nacl:17 clob:c
 
 localloc_imm: dest:i len:120
 
@@ -414,10 +414,35 @@ mulps: dest:x src1:x src2:x len:3 clob:1
 subps: dest:x src1:x src2:x len:3 clob:1
 maxps: dest:x src1:x src2:x len:3 clob:1
 minps: dest:x src1:x src2:x len:3 clob:1
+compps: dest:x src1:x src2:x len:4 clob:1
+andps: dest:x src1:x src2:x len:3 clob:1
+andnps: dest:x src1:x src2:x len:3 clob:1
+orps: dest:x src1:x src2:x len:3 clob:1
+xorps: dest:x src1:x src2:x len:3 clob:1
 
 haddps: dest:x src1:x src2:x len:4 clob:1
 hsubps: dest:x src1:x src2:x len:4 clob:1
 addsubps: dest:x src1:x src2:x len:4 clob:1
+dupps_low: dest:x src1:x len:4
+dupps_high: dest:x src1:x len:4
+
+addpd: dest:x src1:x src2:x len:4 clob:1
+divpd: dest:x src1:x src2:x len:4 clob:1
+mulpd: dest:x src1:x src2:x len:4 clob:1
+subpd: dest:x src1:x src2:x len:4 clob:1
+maxpd: dest:x src1:x src2:x len:4 clob:1
+minpd: dest:x src1:x src2:x len:4 clob:1
+comppd: dest:x src1:x src2:x len:5 clob:1
+andpd: dest:x src1:x src2:x len:4 clob:1
+andnpd: dest:x src1:x src2:x len:4 clob:1
+orpd: dest:x src1:x src2:x len:4 clob:1
+xorpd: dest:x src1:x src2:x len:4 clob:1
+sqrtpd: dest:x src1:x len:4 clob:1
+
+haddpd: dest:x src1:x src2:x len:5 clob:1
+hsubpd: dest:x src1:x src2:x len:5 clob:1
+addsubpd: dest:x src1:x src2:x len:5 clob:1
+duppd: dest:x src1:x len:5
 
 pand: dest:x src1:x src2:x len:4 clob:1
 por: dest:x src1:x src2:x len:4 clob:1
@@ -425,28 +450,74 @@ pxor: dest:x src1:x src2:x len:4 clob:1
 
 sqrtps: dest:x src1:x len:4
 rsqrtps: dest:x src1:x len:4
-shuffleps: dest:x src1:x len:5
+rcpps: dest:x src1:x len:4
+
+pshufflew_high: dest:x src1:x len:5
+pshufflew_low: dest:x src1:x len:5
+pshuffled: dest:x src1:x len:5
+
+extract_mask: dest:i src1:x len:4
 
 paddb: dest:x src1:x src2:x len:4 clob:1
 paddw: dest:x src1:x src2:x len:4 clob:1
 paddd: dest:x src1:x src2:x len:4 clob:1
+paddq: dest:x src1:x src2:x len:4 clob:1
 
 psubb: dest:x src1:x src2:x len:4 clob:1
 psubw: dest:x src1:x src2:x len:4 clob:1
 psubd: dest:x src1:x src2:x len:4 clob:1
+psubq: dest:x src1:x src2:x len:4 clob:1
+
+pmaxb_un: dest:x src1:x src2:x len:4 clob:1
+pmaxw_un: dest:x src1:x src2:x len:5 clob:1
+pmaxd_un: dest:x src1:x src2:x len:5 clob:1
+
+pmaxb: dest:x src1:x src2:x len:5 clob:1
+pmaxw: dest:x src1:x src2:x len:4 clob:1
+pmaxd: dest:x src1:x src2:x len:5 clob:1
+
+pavgb_un: dest:x src1:x src2:x len:4 clob:1
+pavgw_un: dest:x src1:x src2:x len:4 clob:1
+
+pminb_un: dest:x src1:x src2:x len:4 clob:1
+pminw_un: dest:x src1:x src2:x len:5 clob:1
+pmind_un: dest:x src1:x src2:x len:5 clob:1
+
+pminb: dest:x src1:x src2:x len:5 clob:1
+pminw: dest:x src1:x src2:x len:4 clob:1
+pmind: dest:x src1:x src2:x len:5 clob:1
+
+pcmpeqb: dest:x src1:x src2:x len:4 clob:1
+pcmpeqw: dest:x src1:x src2:x len:4 clob:1
+pcmpeqd: dest:x src1:x src2:x len:4 clob:1
+pcmpeqq: dest:x src1:x src2:x len:5 clob:1
+
+pcmpgtb: dest:x src1:x src2:x len:4 clob:1
+pcmpgtw: dest:x src1:x src2:x len:4 clob:1
+pcmpgtd: dest:x src1:x src2:x len:4 clob:1
+pcmpgtq: dest:x src1:x src2:x len:5 clob:1
+
+psumabsdiff: dest:x src1:x src2:x len:4 clob:1
 
 unpack_lowb: dest:x src1:x src2:x len:4 clob:1
 unpack_loww: dest:x src1:x src2:x len:4 clob:1
 unpack_lowd: dest:x src1:x src2:x len:4 clob:1
 unpack_lowq: dest:x src1:x src2:x len:4 clob:1
+unpack_lowps: dest:x src1:x src2:x len:3 clob:1
+unpack_lowpd: dest:x src1:x src2:x len:4 clob:1
 
 unpack_highb: dest:x src1:x src2:x len:4 clob:1
 unpack_highw: dest:x src1:x src2:x len:4 clob:1
 unpack_highd: dest:x src1:x src2:x len:4 clob:1
 unpack_highq: dest:x src1:x src2:x len:4 clob:1
+unpack_highps: dest:x src1:x src2:x len:3 clob:1
+unpack_highpd: dest:x src1:x src2:x len:4 clob:1
 
 packw: dest:x src1:x src2:x len:4 clob:1 
-packd: dest:x src1:x src2:x len:5 clob:1 
+packd: dest:x src1:x src2:x len:4 clob:1 
+
+packw_un: dest:x src1:x src2:x len:4 clob:1 
+packd_un: dest:x src1:x src2:x len:5 clob:1 
 
 paddb_sat: dest:x src1:x src2:x len:4 clob:1
 paddb_sat_un: dest:x src1:x src2:x len:4 clob:1
@@ -454,56 +525,88 @@ paddb_sat_un: dest:x src1:x src2:x len:4 clob:1
 paddw_sat: dest:x src1:x src2:x len:4 clob:1
 paddw_sat_un: dest:x src1:x src2:x len:4 clob:1
 
-paddd_sat: dest:x src1:x src2:x len:4 clob:1
-paddd_sat_un: dest:x src1:x src2:x len:4 clob:1
-
 psubb_sat: dest:x src1:x src2:x len:4 clob:1
 psubb_sat_un: dest:x src1:x src2:x len:4 clob:1
 
 psubw_sat: dest:x src1:x src2:x len:4 clob:1
 psubw_sat_un: dest:x src1:x src2:x len:4 clob:1
 
-psubd_sat: dest:x src1:x src2:x len:4 clob:1
-psubd_sat_un: dest:x src1:x src2:x len:4 clob:1
-
 pmulw: dest:x src1:x src2:x len:4 clob:1
 pmuld: dest:x src1:x src2:x len:5 clob:1
+pmulq: dest:x src1:x src2:x len:4 clob:1
+
+pmul_high_un: dest:x src1:x src2:x len:4 clob:1
+pmul_high: dest:x src1:x src2:x len:4 clob:1
 
-pshrw: dest:x src1:x len:8 clob:1
-pshrw_reg: dest:x src1:x src2:x len:8 clob:1
+pshrw: dest:x src1:x len:5 clob:1
+pshrw_reg: dest:x src1:x src2:x len:4 clob:1
 
-psarw: dest:x src1:x len:8 clob:1
-psarw_reg: dest:x src1:x src2:x len:8 clob:1
+psarw: dest:x src1:x len:5 clob:1
+psarw_reg: dest:x src1:x src2:x len:4 clob:1
 
-pshlw: dest:x src1:x len:8 clob:1
-pshlw_reg: dest:x src1:x src2:x len:8 clob:1
+pshlw: dest:x src1:x len:5 clob:1
+pshlw_reg: dest:x src1:x src2:x len:4 clob:1
 
-pshrd: dest:x src1:x len:8 clob:1
-pshrd_reg: dest:x src1:x src2:x len:8 clob:1
+pshrd: dest:x src1:x len:5 clob:1
+pshrd_reg: dest:x src1:x src2:x len:4 clob:1
 
-psard: dest:x src1:x len:8 clob:1
-psard_reg: dest:x src1:x src2:x len:8 clob:1
+psard: dest:x src1:x len:5 clob:1
+psard_reg: dest:x src1:x src2:x len:4 clob:1
 
-pshld: dest:x src1:x len:8 clob:1
-pshld_reg: dest:x src1:x src2:x len:8 clob:1
+pshld: dest:x src1:x len:5 clob:1
+pshld_reg: dest:x src1:x src2:x len:4 clob:1
+
+pshrq: dest:x src1:x len:5 clob:1
+pshrq_reg: dest:x src1:x src2:x len:4 clob:1
+
+pshlq: dest:x src1:x len:5 clob:1
+pshlq_reg: dest:x src1:x src2:x len:4 clob:1
 
 xmove: dest:x src1:x len:4
 xzero: dest:x len:4
 
 iconv_to_x: dest:x src1:i len:4
 extract_i4: dest:i src1:x len:4
+
+extract_i2: dest:i src1:x len:10
+extract_u2: dest:i src1:x len:10
+extract_i1: dest:i src1:x len:10
+extract_u1: dest:i src1:x len:10
+extract_r8: dest:f src1:x len:8 
+
 iconv_to_r8_raw: dest:f src1:i len:17 
 
+insert_i2: dest:x src1:x src2:i len:5 clob:1
+
+extractx_u2: dest:i src1:x len:5
+insertx_u1_slow: dest:x src1:i src2:i len:16 clob:x
+
+insertx_i4_slow: dest:x src1:x src2:i len:13 clob:x
+insertx_r4_slow: dest:x src1:x src2:f len:24 clob:1
+insertx_r8_slow: dest:x src1:x src2:f len:24 clob:1
+
 loadx_membase: dest:x src1:b len:7
 storex_membase: dest:b src1:x len:7
 storex_membase_reg: dest:b src1:x len:7
 
 loadx_aligned_membase: dest:x src1:b len:7
 storex_aligned_membase_reg: dest:b src1:x len:7
-
-push_r4: src1:f len:13
-loadx_stack: dest:x len: 13
+storex_nta_membase_reg: dest:b src1:x len:7
 
 fconv_to_r8_x: dest:x src1:f len:14 
 xconv_r8_to_i4: dest:y src1:x len:7
 
+prefetch_membase: src1:b len:4
+
+expand_i1: dest:x src1:y len:17 clob:1
+expand_i2: dest:x src1:i len:15
+expand_i4: dest:x src1:i len:9
+expand_r4: dest:x src1:f len:13
+expand_r8: dest:x src1:f len:13
+
+liverange_start: len:0
+liverange_end: len:0
+gc_liveness_def: len:0
+gc_liveness_use: len:0
+gc_spill_slot_liveness_def: len:0
+gc_param_slot_liveness_def: len:0