asm{a,b}: 16byte alignment reicht
[uebersetzerbau-ss10.git] / asma / asma.s
index b7da2c710c3b4718792be329263b9d5753f53b23..cb1e8bcf36317fda065159f731e50d9f0ef17882 100644 (file)
@@ -1,38 +1,58 @@
        .file   "asma.c"
+
+       .data
+       .align 16
+const65:
+       .rept 16
+       .byte 0x65
+       .endr
+const20:
+       .rept 16
+       .byte 0x20
+       .endr
+constc0:
+       .rept 16
+       .byte 0xc0
+       .endr
+
        .text
 .globl asma
        .type   asma, @function
 asma:
 .LFB2:
+       // folgendes kann umgeformt werden (max_t = 127)
+       // X = 'Z' + 1 + min_t - 'A' > c + min_t - 'A' ? 0xff : 0
+       // X =      -c + max_t + 'A' > - 'Z' -1 + max_t + 'A' ? 0xff : 0
+       // X =         -c + 127 + 65 > - 90 - 1 + 127 + 65 ? 0xff : 0
+       // X =               -c - 64 > 101 ? 0xff : 0
+       // X =               -64 - c > 101 ? 0xff : 0
+       // ...
+       // 101 = 0x65
+       // -64 = 0xc0
 
-/* unsigned char *asma(unsigned char *s)  
-{  
-  int i;  
-  for (i=0; i<16; i++) {  
-    unsigned char c=s[i];  
-    c += (c>=’A’ && c<=’Z’) ? ’a’-’A’ : 0;  
-    s[i] = c;  
-  }  
-  return s;  
-}
+       // speicheradresse des pointers zeigt auf 16*8 feld = 128bit
+       movdqu (%rdi), %xmm11
 
-Schreiben Sie diese Funktion in Assembler unter Verwendung von pcmpgtb. Dabei ist folgende Äquivalenz hilfreich:
-(c>=’A’ && c<=’Z’) ? ’a’-’A’ : 0;
+       // -64 - c
+       movdqa constc0, %xmm9
+       psubb %xmm11, %xmm9
 
-ist (bei Verwendung von Überlauf-Arithmetik) äquivalent zu
-min(’Z’+1+min_t-’A’ > c+min_t-’A’ ? 0xff : 0, ’a’-’A’)
+       // "Packed COMpare Greater Than (Byte)"
+       // achtung beim intuitiven lesen des befehles. 'kleiner'
+       // ist mit 'groesser' vertauscht und vice versa
+       pcmpgtb const65, %xmm9
 
-wobei min_t der minimale Wert des Datentyps ist, den der Vergleich behandelt (bei pcmpgtb also -128). Zusätzlich zu dem oben genannten dürften die Befehle pminub, paddb, und psubb nützlich sein. */
-       #clear %xmm1
-       pxor %xmm1, %xmm1
+       // Y = min(X, 'a' - 'A')
+       // mit 'a'-'A'= 97-65 = 32 = 0x20
+       pminub const20, %xmm9
 
-       #speicheradresse des pointers zeigt auf 16*8 feld = 128bit
-       movdqa (%rdi), %xmm1
+       // c += Y
+       paddb %xmm9, %xmm11
 
-       #todo
-       #pcmpgtb %xmm1, %xmm2
+       // retuniere an die richtige speicheradresse
+       mov %rdi, %rax
+       movdqu %xmm11, (%rax)
 
-       movq %xmm1, (%rax)
        ret
 .LFE2:
        .size   asma, .-asma