* cpu-x86.md: Added new instructions to handle float to int using SSE regs.
[mono.git] / mono / mini / cpu-x86.md
1 # x86-class cpu description file
2 # this file is read by genmdesc to pruduce a table with all the relevant information
3 # about the cpu instructions that may be used by the regsiter allocator, the scheduler
4 # and other parts of the arch-dependent part of mini.
5 #
6 # An opcode name is followed by a colon and optional specifiers.
7 # A specifier has a name, a colon and a value. Specifiers are separated by white space.
8 # Here is a description of the specifiers valid for this file and their possible values.
9 #
10 # dest:register       describes the destination register of an instruction
11 # src1:register       describes the first source register of an instruction
12 # src2:register       describes the second source register of an instruction
13 #
14 # register may have the following values:
15 #       i  integer register
16 #       b  base register (used in address references)
17 #       f  floating point register
18 #       a  EAX register
19 #       d  EDX register
20 #   s  ECX register
21 #       l  long reg (forced eax:edx)
22 #       L  long reg (dynamic)
23 #       y  the reg needs to be one of EAX,EBX,ECX,EDX (sete opcodes)
24 #       x  XMM reg (XMM0 - X007)
25 #
26 # len:number         describe the maximun length in bytes of the instruction
27 #                    number is a positive integer.  If the length is not specified
28 #                    it defaults to zero.   But lengths are only checked if the given opcode 
29 #                    is encountered during compilation. Some opcodes, like CONV_U4 are 
30 #                    transformed into other opcodes in the brg files, so they do not show up 
31 #                    during code generation.
32 #
33 # cost:number        describe how many cycles are needed to complete the instruction (unused)
34 #
35 # clob:spec          describe if the instruction clobbers registers or has special needs
36 #
37 # spec can be one of the following characters:
38 #       c  clobbers caller-save registers
39 #       1  clobbers the first source register
40 #       a  EAX is clobbered
41 #   d  EDX is clobbered
42 #       x  both the source operands are clobbered (xchg)
43 #
44 # flags:spec        describe if the instruction uses or sets the flags (unused)
45 #
46 # spec can be one of the following chars:
47 #       s  sets the flags
48 #       u  uses the flags
49 #       m  uses and modifies the flags
50 #
51 # res:spec          describe what units are used in the processor (unused)
52 #
53 # delay:            describe delay slots (unused)
54 #
55 # the required specifiers are: len, clob (if registers are clobbered), the registers
56 # specifiers if the registers are actually used, flags (when scheduling is implemented).
57 #
58 # See the code in mini-x86.c for more details on how the specifiers are used.
59 #
60 break: len:1
61 jmp: len:32
62 call: dest:a clob:c len:17
63 br: len:5
64 int_beq: len:6
65 int_bge: len:6
66 int_bgt: len:6
67 int_ble: len:6
68 int_blt: len:6
69 int_bne_un: len:6
70 int_bge_un: len:6
71 int_bgt_un: len:6
72 int_ble_un: len:6
73 int_blt_un: len:6
74 label: len:0
75
76 int_add: dest:i src1:i src2:i len:2 clob:1
77 int_sub: dest:i src1:i src2:i len:2 clob:1
78 int_mul: dest:i src1:i src2:i len:3 clob:1
79 int_div: dest:a src1:a src2:i len:15 clob:d
80 int_div_un: dest:a src1:a src2:i len:15 clob:d
81 int_rem: dest:d src1:a src2:i len:15 clob:a
82 int_rem_un: dest:d src1:a src2:i len:15 clob:a
83 int_and: dest:i src1:i src2:i len:2 clob:1
84 int_or: dest:i src1:i src2:i len:2 clob:1
85 int_xor: dest:i src1:i src2:i len:2 clob:1
86 int_shl: dest:i src1:i src2:s clob:1 len:2
87 int_shr: dest:i src1:i src2:s clob:1 len:2
88 int_shr_un: dest:i src1:i src2:s clob:1 len:2
89 int_min: dest:i src1:i src2:i len:16 clob:1
90 int_min_un: dest:i src1:i src2:i len:16 clob:1
91 int_max: dest:i src1:i src2:i len:16 clob:1
92 int_max_un: dest:i src1:i src2:i len:16 clob:1
93
94 int_neg: dest:i src1:i len:2 clob:1
95 int_not: dest:i src1:i len:2 clob:1
96 int_conv_to_i1: dest:i src1:y len:3
97 int_conv_to_i2: dest:i src1:i len:3
98 int_conv_to_i4: dest:i src1:i len:2
99 int_conv_to_r4: dest:f src1:i len:7
100 int_conv_to_r8: dest:f src1:i len:7
101 int_conv_to_u4: dest:i src1:i
102 int_conv_to_u2: dest:i src1:i len:3
103 int_conv_to_u1: dest:i src1:y len:3
104 int_conv_to_i: dest:i src1:i len:3
105 int_mul_ovf: dest:i src1:i src2:i clob:1 len:9
106 int_mul_ovf_un: dest:i src1:i src2:i len:16
107
108 throw: src1:i len:13
109 rethrow: src1:i len:13
110 start_handler: len:16
111 endfinally: len:16
112 endfilter: src1:a len:16
113
114 ckfinite: dest:f src1:f len:32
115 ceq: dest:y len:6
116 cgt: dest:y len:6
117 cgt.un: dest:y len:6
118 clt: dest:y len:6
119 clt.un: dest:y len:6
120 cne: dest:y len:6
121 localloc: dest:i src1:i len:120
122 compare: src1:i src2:i len:2
123 compare_imm: src1:i len:6
124 fcompare: src1:f src2:f clob:a len:9
125 oparglist: src1:b len:10
126 outarg: src1:i len:1
127 outarg_imm: len:5
128 setret: dest:a src1:i len:2
129 setlret: dest:l src1:i src2:i len:4
130 checkthis: src1:b len:3
131 voidcall: len:17 clob:c
132 voidcall_reg: src1:i len:11 clob:c
133 voidcall_membase: src1:b len:16 clob:c
134 fcall: dest:f len:48 clob:c
135 fcall_reg: dest:f src1:i len:48 clob:c
136 fcall_membase: dest:f src1:b len:48 clob:c
137 lcall: dest:l len:17 clob:c
138 lcall_reg: dest:l src1:i len:11 clob:c
139 lcall_membase: dest:l src1:b len:16 clob:c
140 vcall: len:17 clob:c
141 vcall_reg: src1:i len:11 clob:c
142 vcall_membase: src1:b len:16 clob:c
143 call_reg: dest:a src1:i len:11 clob:c
144 call_membase: dest:a src1:b len:16 clob:c
145 iconst: dest:i len:5
146 r4const: dest:f len:15
147 r8const: dest:f len:16
148 store_membase_imm: dest:b len:10
149 store_membase_reg: dest:b src1:i len:7
150 storei1_membase_imm: dest:b len:10
151 storei1_membase_reg: dest:b src1:y len:7
152 storei2_membase_imm: dest:b len:11
153 storei2_membase_reg: dest:b src1:i len:7
154 storei4_membase_imm: dest:b len:10
155 storei4_membase_reg: dest:b src1:i len:7
156 storei8_membase_imm: dest:b 
157 storei8_membase_reg: dest:b src1:i 
158 storer4_membase_reg: dest:b src1:f len:7
159 storer8_membase_reg: dest:b src1:f len:7
160 load_membase: dest:i src1:b len:7
161 loadi1_membase: dest:y src1:b len:7
162 loadu1_membase: dest:y src1:b len:7
163 loadi2_membase: dest:i src1:b len:7
164 loadu2_membase: dest:i src1:b len:7
165 loadi4_membase: dest:i src1:b len:7
166 loadu4_membase: dest:i src1:b len:7
167 loadi8_membase: dest:i src1:b
168 loadr4_membase: dest:f src1:b len:7
169 loadr8_membase: dest:f src1:b len:7
170 loadr8_spill_membase: src1:b len:9
171 loadu4_mem: dest:i len:9
172 move: dest:i src1:i len:2
173 addcc_imm: dest:i src1:i len:6 clob:1
174 add_imm: dest:i src1:i len:6 clob:1
175 subcc_imm: dest:i src1:i len:6 clob:1
176 sub_imm: dest:i src1:i len:6 clob:1
177 mul_imm: dest:i src1:i len:9
178 # there is no actual support for division or reminder by immediate
179 # we simulate them, though (but we need to change the burg rules 
180 # to allocate a symbolic reg for src2)
181 div_imm: dest:a src1:a src2:i len:15 clob:d
182 div_un_imm: dest:a src1:a src2:i len:15 clob:d
183 rem_imm: dest:d src1:a src2:i len:15 clob:a
184 rem_un_imm: dest:d src1:a src2:i len:15 clob:a
185 and_imm: dest:i src1:i len:6 clob:1
186 or_imm: dest:i src1:i len:6 clob:1
187 xor_imm: dest:i src1:i len:6 clob:1
188 shl_imm: dest:i src1:i len:6 clob:1
189 shr_imm: dest:i src1:i len:6 clob:1
190 shr_un_imm: dest:i src1:i len:6 clob:1
191 cond_exc_eq: len:6
192 cond_exc_ne_un: len:6
193 cond_exc_lt: len:6
194 cond_exc_lt_un: len:6
195 cond_exc_gt: len:6
196 cond_exc_gt_un: len:6
197 cond_exc_ge: len:6
198 cond_exc_ge_un: len:6
199 cond_exc_le: len:6
200 cond_exc_le_un: len:6
201 cond_exc_ov: len:6
202 cond_exc_no: len:6
203 cond_exc_c: len:6
204 cond_exc_nc: len:6
205 long_shl: dest:L src1:L src2:s clob:1 len:21
206 long_shr: dest:L src1:L src2:s clob:1 len:22
207 long_shr_un: dest:L src1:L src2:s clob:1 len:22
208 long_conv_to_ovf_i: dest:i src1:i src2:i len:30
209 long_mul_ovf: 
210 long_conv_to_r_un: dest:f src1:i src2:i len:37 
211 long_shr_imm: dest:L src1:L clob:1 len:10
212 long_shr_un_imm: dest:L src1:L clob:1 len:10
213 long_shl_imm: dest:L src1:L clob:1 len:10
214 float_beq: len:12
215 float_bne_un: len:18
216 float_blt: len:12
217 float_blt_un: len:20
218 float_bgt: len:12
219 float_bgt_un: len:20
220 float_bge: len:22
221 float_bge_un: len:12
222 float_ble: len:22
223 float_ble_un: len:12
224 float_add: dest:f src1:f src2:f len:2
225 float_sub: dest:f src1:f src2:f len:2
226 float_mul: dest:f src1:f src2:f len:2
227 float_div: dest:f src1:f src2:f len:2
228 float_div_un: dest:f src1:f src2:f len:2
229 float_rem: dest:f src1:f src2:f len:17
230 float_rem_un: dest:f src1:f src2:f len:17
231 float_neg: dest:f src1:f len:2
232 float_not: dest:f src1:f len:2
233 float_conv_to_i1: dest:y src1:f len:39
234 float_conv_to_i2: dest:y src1:f len:39
235 float_conv_to_i4: dest:i src1:f len:39
236 float_conv_to_i8: dest:L src1:f len:39
237 float_conv_to_u4: dest:i src1:f len:39
238 float_conv_to_u8: dest:L src1:f len:39
239 float_conv_to_u2: dest:y src1:f len:39
240 float_conv_to_u1: dest:y src1:f len:39
241 float_conv_to_i: dest:i src1:f len:39
242 float_conv_to_ovf_i: dest:a src1:f len:30
243 float_conv_to_ovd_u: dest:a src1:f len:30
244 float_mul_ovf: 
245 float_ceq: dest:y src1:f src2:f len:25
246 float_cgt: dest:y src1:f src2:f len:25
247 float_cgt_un: dest:y src1:f src2:f len:37
248 float_clt: dest:y src1:f src2:f len:25
249 float_clt_un: dest:y src1:f src2:f len:32
250 float_conv_to_u: dest:i src1:f len:36
251 call_handler: len:11
252 aot_const: dest:i len:5
253 load_gotaddr: dest:i len:64
254 got_entry: dest:i src1:b len:7
255 x86_test_null: src1:i len:2
256 x86_compare_membase_reg: src1:b src2:i len:7
257 x86_compare_membase_imm: src1:b len:11
258 x86_compare_membase8_imm: src1:b len:8
259 x86_compare_mem_imm: len:11
260 x86_compare_reg_membase: src1:i src2:b len:7
261 x86_inc_reg: dest:i src1:i clob:1 len:1
262 x86_inc_membase: src1:b len:7
263 x86_dec_reg: dest:i src1:i clob:1 len:1
264 x86_dec_membase: src1:b len:7
265 x86_add_membase_imm: src1:b len:11
266 x86_sub_membase_imm: src1:b len:11
267 x86_and_membase_imm: src1:b len:11
268 x86_or_membase_imm: src1:b len:11
269 x86_xor_membase_imm: src1:b len:11
270 x86_push: src1:i len:1
271 x86_push_imm: len:5
272 x86_push_membase: src1:b len:7
273 x86_push_obj: src1:b len:30
274 x86_push_got_entry: src1:b len:7
275 x86_lea: dest:i src1:i src2:i len:7
276 x86_lea_membase: dest:i src1:i len:10
277 x86_xchg: src1:i src2:i clob:x len:1
278 x86_fpop: src1:f len:2
279 x86_fp_load_i8: dest:f src1:b len:7
280 x86_fp_load_i4: dest:f src1:b len:7
281 x86_seteq_membase: src1:b len:7
282 x86_setne_membase: src1:b len:7
283
284 x86_add_reg_membase: dest:i src1:i src2:b clob:1 len:11
285 x86_sub_reg_membase: dest:i src1:i src2:b clob:1 len:11
286 x86_mul_reg_membase: dest:i src1:i src2:b clob:1 len:13
287
288 adc: dest:i src1:i src2:i len:2 clob:1
289 addcc: dest:i src1:i src2:i len:2 clob:1
290 subcc: dest:i src1:i src2:i len:2 clob:1
291 adc_imm: dest:i src1:i len:6 clob:1
292 sbb: dest:i src1:i src2:i len:2 clob:1
293 sbb_imm: dest:i src1:i len:6 clob:1
294 br_reg: src1:i len:2
295 sin: dest:f src1:f len:6
296 cos: dest:f src1:f len:6
297 abs: dest:f src1:f len:2
298 tan: dest:f src1:f len:49
299 atan: dest:f src1:f len:8
300 sqrt: dest:f src1:f len:2
301 bigmul: len:2 dest:l src1:a src2:i
302 bigmul_un: len:2 dest:l src1:a src2:i
303 sext_i1: dest:i src1:y len:3
304 sext_i2: dest:i src1:y len:3
305 tls_get: dest:i len:20
306 atomic_add_i4: src1:b src2:i dest:i len:16
307 atomic_add_new_i4: src1:b src2:i dest:i len:16
308 atomic_exchange_i4: src1:b src2:i dest:a len:24
309 atomic_cas_imm_i4: src1:b src2:i dest:a len:24
310 memory_barrier: len:16
311
312 relaxed_nop: len:2
313
314 # Linear IR opcodes
315 nop: len:0
316 dummy_use: len:0
317 dummy_store: len:0
318 not_reached: len:0
319 not_null: src1:i len:0
320
321 jump_table: dest:i len:5
322
323 int_adc: dest:i src1:i src2:i len:2 clob:1
324 int_addcc: dest:i src1:i src2:i len:2 clob:1
325 int_subcc: dest:i src1:i src2:i len:2 clob:1
326 int_sbb: dest:i src1:i src2:i len:2 clob:1
327
328 int_add_imm: dest:i src1:i len:6 clob:1
329 int_sub_imm: dest:i src1:i len:6 clob:1
330 int_mul_imm: dest:i src1:i len:9
331 int_div_imm: dest:a src1:a len:15 clob:d
332 int_div_un_imm: dest:a src1:a len:15 clob:d
333 int_rem_imm: dest:a src1:a len:15 clob:d
334 int_rem_un_imm: dest:d src1:a len:15 clob:a
335 int_and_imm: dest:i src1:i len:6 clob:1
336 int_or_imm: dest:i src1:i len:6 clob:1
337 int_xor_imm: dest:i src1:i len:6 clob:1
338 int_shl_imm: dest:i src1:i len:6 clob:1
339 int_shr_imm: dest:i src1:i len:6 clob:1
340 int_shr_un_imm: dest:i src1:i len:6 clob:1
341
342 int_conv_to_r_un: dest:f src1:i len:32
343
344 int_ceq: dest:y len:6
345 int_cgt: dest:y len:6
346 int_cgt_un: dest:y len:6
347 int_clt: dest:y len:6
348 int_clt_un: dest:y len:6
349
350 cond_exc_ieq: len:6
351 cond_exc_ine_un: len:6
352 cond_exc_ilt: len:6
353 cond_exc_ilt_un: len:6
354 cond_exc_igt: len:6
355 cond_exc_igt_un: len:6
356 cond_exc_ige: len:6
357 cond_exc_ige_un: len:6
358 cond_exc_ile: len:6
359 cond_exc_ile_un: len:6
360 cond_exc_iov: len:6
361 cond_exc_ino: len:6
362 cond_exc_ic: len:6
363 cond_exc_inc: len:6
364
365 icompare: src1:i src2:i len:2
366 icompare_imm: src1:i len:6
367
368 cmov_ieq: dest:i src1:i src2:i len:16 clob:1
369 cmov_ige: dest:i src1:i src2:i len:16 clob:1
370 cmov_igt: dest:i src1:i src2:i len:16 clob:1
371 cmov_ile: dest:i src1:i src2:i len:16 clob:1
372 cmov_ilt: dest:i src1:i src2:i len:16 clob:1
373 cmov_ine_un: dest:i src1:i src2:i len:16 clob:1
374 cmov_ige_un: dest:i src1:i src2:i len:16 clob:1
375 cmov_igt_un: dest:i src1:i src2:i len:16 clob:1
376 cmov_ile_un: dest:i src1:i src2:i len:16 clob:1
377 cmov_ilt_un: dest:i src1:i src2:i len:16 clob:1
378
379 long_conv_to_ovf_i4_2: dest:i src1:i src2:i len:30
380 long_conv_to_r8_2: dest:f src1:i src2:i len:37 
381 long_conv_to_r4_2: dest:f src1:i src2:i len:64
382 long_conv_to_r_un_2: dest:f src1:i src2:i len:37 
383
384 fmove: dest:f src1:f
385 float_conv_to_r4: dest:f src1:f
386
387 load_mem: dest:i len:9
388 loadi4_mem: dest:i len:9
389 loadu1_mem: dest:i len:9
390 loadu2_mem: dest:i len:9
391
392 vcall2: len:17 clob:c
393 vcall2_reg: src1:i len:11 clob:c
394 vcall2_membase: src1:b len:16 clob:c
395
396 localloc_imm: dest:i len:120
397
398 x86_add_membase_reg: src1:b src2:i len:11
399 x86_sub_membase_reg: src1:b src2:i len:11
400 x86_and_membase_reg: src1:b src2:i len:11
401 x86_or_membase_reg: src1:b src2:i len:11
402 x86_xor_membase_reg: src1:b src2:i len:11
403 x86_mul_membase_reg: src1:b src2:i len:13
404
405 x86_and_reg_membase: dest:i src1:i src2:b clob:1 len:6
406 x86_or_reg_membase: dest:i src1:i src2:b clob:1 len:6
407 x86_xor_reg_membase: dest:i src1:i src2:b clob:1 len:6
408
409 x86_fxch: len:2
410
411 addps: dest:x src1:x src2:x len:3 clob:1
412 divps: dest:x src1:x src2:x len:3 clob:1
413 mulps: dest:x src1:x src2:x len:3 clob:1
414 subps: dest:x src1:x src2:x len:3 clob:1
415 maxps: dest:x src1:x src2:x len:3 clob:1
416 minps: dest:x src1:x src2:x len:3 clob:1
417
418 haddps: dest:x src1:x src2:x len:4 clob:1
419 hsubps: dest:x src1:x src2:x len:4 clob:1
420 addsubps: dest:x src1:x src2:x len:4 clob:1
421
422 pand: dest:x src1:x src2:x len:4 clob:1
423 por: dest:x src1:x src2:x len:4 clob:1
424 pxor: dest:x src1:x src2:x len:4 clob:1
425
426 sqrtps: dest:x src1:x len:4
427 rsqrtps: dest:x src1:x len:4
428 shuffleps: dest:x src1:x len:5
429
430 xmove: dest:x src1:x len:4
431 xzero: dest:x len:4
432
433 extract_i4: dest:i src1:x len:4
434 iconv_to_r8_raw: dest:f src1:i len:17 
435
436 loadx_membase: dest:x src1:b len:7
437 storex_membase: dest:b src1:x len:7
438 storex_membase_reg: dest:b src1:x len:7
439
440 loadx_aligned_membase: dest:x src1:b len:7
441 storex_aligned_membase_reg: dest:b src1:x len:7
442
443 push_r4: src1:f len:13
444 loadx_stack: dest:x len: 13
445
446 fconv_to_r8_x: dest:x src1:f len:60 
447 xconv_r8_to_i4: dest:y src1:x len:60
448