asma: ... offizielle testfaelle rennen jetzt auch durch
[uebersetzerbau-ss10.git] / asma / asma.s
index b7da2c710c3b4718792be329263b9d5753f53b23..d1202ced60a193c1466f7ae3035f0d99abff2a5a 100644 (file)
@@ -1,38 +1,57 @@
        .file   "asma.c"
+
+.section .rodata
+.align 128
+const9a:
+       .rept 16
+       .byte 0x9a
+       .endr
+const20:
+       .rept 16
+       .byte 0x20
+       .endr
+const3f:
+       .rept 16
+       .byte 0x3f
+       .endr
+
        .text
 .globl asma
        .type   asma, @function
 asma:
 .LFB2:
+       /*init %xmm8 mit "'Z' + 1 + min_t - 'A'" fuer jedes byte
+       * 'Z' + 1 + min_t - 'A' = 90 + 1 - 128 - 65 = -102
+       * 102 = 01100110
+       * ~102 = 10011001
+       * (~102)+1 = 10011010 = 0x9A */
+       movdqa const9a, %xmm8
 
-/* unsigned char *asma(unsigned char *s)  
-{  
-  int i;  
-  for (i=0; i<16; i++) {  
-    unsigned char c=s[i];  
-    c += (c>=’A’ && c<=’Z’) ? ’a’-’A’ : 0;  
-    s[i] = c;  
-  }  
-  return s;  
-}
-
-Schreiben Sie diese Funktion in Assembler unter Verwendung von pcmpgtb. Dabei ist folgende Äquivalenz hilfreich:
-(c>=’A’ && c<=’Z’) ? ’a’-’A’ : 0;
+       //speicheradresse des pointers zeigt auf 16*8 feld = 128bit
+       movdqu (%rdi), %xmm11
 
-ist (bei Verwendung von Überlauf-Arithmetik) äquivalent zu
-min(’Z’+1+min_t-’A’ > c+min_t-’A’ ? 0xff : 0, ’a’-’A’)
+       /*addiere in %xmm11 "min_t-'A'"
+       * = -128 - 65 = 63 = 0x3f
+       * c+min_t-'A' */
+       paddb const3f, %xmm11
 
-wobei min_t der minimale Wert des Datentyps ist, den der Vergleich behandelt (bei pcmpgtb also -128). Zusätzlich zu dem oben genannten dürften die Befehle pminub, paddb, und psubb nützlich sein. */
-       #clear %xmm1
-       pxor %xmm1, %xmm1
+       /*"Packed COMpare Greater Than (Byte)"
+       * X = 'Z' + 1 + min_t - 'A' > c + min_t - 'A' ? 0xff : 0
+       * achtung beim intuitiven lesen des befehles. 'kleiner' 
+       * ist mit 'groesser' vertauscht und vice versa */
+       pcmpgtb %xmm11, %xmm8
 
-       #speicheradresse des pointers zeigt auf 16*8 feld = 128bit
-       movdqa (%rdi), %xmm1
+       /*Y = min(X, 'a' - 'A')
+       * mit "'a'-'A'= 97-65 = 32 = 0x20 */
+       pminub const20, %xmm8
 
-       #todo
-       #pcmpgtb %xmm1, %xmm2
+       //retuniere an die richtige speicheradresse
+       mov %rdi, %rax
+       //c += Y
+       psubb const3f, %xmm11
+       paddb %xmm11, %xmm8
+       movdqu %xmm8, (%rax)
 
-       movq %xmm1, (%rax)
        ret
 .LFE2:
        .size   asma, .-asma