projects
/
uebersetzerbau-ss10.git
/ blobdiff
commit
grep
author
committer
pickaxe
?
search:
re
summary
|
shortlog
|
log
|
commit
|
commitdiff
|
tree
raw
|
inline
| side by side
asma: ... offizielle testfaelle rennen jetzt auch durch
[uebersetzerbau-ss10.git]
/
asma
/
asma.s
diff --git
a/asma/asma.s
b/asma/asma.s
index 84151dbc1036afc4dc32a8cf596cccca3de318f8..d1202ced60a193c1466f7ae3035f0d99abff2a5a 100644
(file)
--- a/
asma/asma.s
+++ b/
asma/asma.s
@@
-1,4
+1,20
@@
.file "asma.c"
.file "asma.c"
+
+.section .rodata
+.align 128
+const9a:
+ .rept 16
+ .byte 0x9a
+ .endr
+const20:
+ .rept 16
+ .byte 0x20
+ .endr
+const3f:
+ .rept 16
+ .byte 0x3f
+ .endr
+
.text
.globl asma
.type asma, @function
.text
.globl asma
.type asma, @function
@@
-9,27
+25,15
@@
asma:
* 102 = 01100110
* ~102 = 10011001
* (~102)+1 = 10011010 = 0x9A */
* 102 = 01100110
* ~102 = 10011001
* (~102)+1 = 10011010 = 0x9A */
- mov $0x9a9a9a9a9a9a9a9a, %rax
- movq %rax, %xmm15
- movddup %xmm15, %xmm8
-
- //init %xmm9 mit "'a'-'A'= 97-65 = 32 = 0x20
- mov $0x2020202020202020, %rax
- movq %rax, %xmm15
- movddup %xmm15, %xmm9
+ movdqa const9a, %xmm8
//speicheradresse des pointers zeigt auf 16*8 feld = 128bit
movdqu (%rdi), %xmm11
//speicheradresse des pointers zeigt auf 16*8 feld = 128bit
movdqu (%rdi), %xmm11
- movdqu (%rdi), %xmm12
/*addiere in %xmm11 "min_t-'A'"
/*addiere in %xmm11 "min_t-'A'"
- * = -128 - 65 = 63 = 0x3f */
- mov $0x3f3f3f3f3f3f3f3f, %rax
- movq %rax, %xmm15
- movddup %xmm15, %xmm10
-
- //c+min_t-'A'
- paddb %xmm10, %xmm11
+ * = -128 - 65 = 63 = 0x3f
+ * c+min_t-'A' */
+ paddb const3f, %xmm11
/*"Packed COMpare Greater Than (Byte)"
* X = 'Z' + 1 + min_t - 'A' > c + min_t - 'A' ? 0xff : 0
/*"Packed COMpare Greater Than (Byte)"
* X = 'Z' + 1 + min_t - 'A' > c + min_t - 'A' ? 0xff : 0
@@
-37,15
+41,17
@@
asma:
* ist mit 'groesser' vertauscht und vice versa */
pcmpgtb %xmm11, %xmm8
* ist mit 'groesser' vertauscht und vice versa */
pcmpgtb %xmm11, %xmm8
- //Y = min(X, 'a' - 'A')
- pminub %xmm9, %xmm8
-
- //c += Y
- paddb %xmm8, %xmm12
+ /*Y = min(X, 'a' - 'A')
+ * mit "'a'-'A'= 97-65 = 32 = 0x20 */
+ pminub const20, %xmm8
//retuniere an die richtige speicheradresse
mov %rdi, %rax
//retuniere an die richtige speicheradresse
mov %rdi, %rax
- movapd %xmm12, (%rax)
+ //c += Y
+ psubb const3f, %xmm11
+ paddb %xmm11, %xmm8
+ movdqu %xmm8, (%rax)
+
ret
.LFE2:
.size asma, .-asma
ret
.LFE2:
.size asma, .-asma