9 //soll einfach null sein
12 /*init %xmm8 mit "'Z' + 1 + min_t - 'A'" fuer jedes byte
13 * 'Z' + 1 + min_t - 'A' = 90 + 1 - 128 - 65 = -102
16 * (~102)+1 = 10011010 = 0x9A */
17 mov $0x9a9a9a9a9a9a9a9a, %rax
19 punpcklbw %xmm8, %xmm8
21 //init %xmm9 mit "'a'-'A'= 97-65 = 32 = 0x20
22 mov $0x2020202020202020, %rax
24 punpcklbw %xmm9, %xmm9
26 /*addiere in %xmm11 "min_t-'A'"
27 * = -128 - 65 = 63 = 0x3f */
28 mov $0x3f3f3f3f3f3f3f3f, %rax
30 punpcklbw %xmm10, %xmm10
33 //speicheradresse des pointers zeigt auf 16*8 feld = 128bit
34 movdqu (%rdi, %rdx, 8), %xmm11
35 movdqu (%rdi, %rdx, 8), %xmm12
40 //0x9a9a... zwischenspeichern
43 /*"Packed COMpare Greater Than (Byte)"
44 * X = 'Z' + 1 + min_t - 'A' > c + min_t - 'A' ? 0xff : 0
45 * achtung beim intuitiven lesen des befehles. 'kleiner'
46 * ist mit 'groesser' vertauscht und vice versa */
47 pcmpgtb %xmm11, %xmm15
50 //Y = min(X, 'a' - 'A')
56 //retuniere an die richtige speicheradresse
57 movapd %xmm12, (%rdi, %rdx, 8)
59 //entspricht ein byte dem nullbyte dann steht an jener stelle 0xff sonst 0x00
60 pcmpeqb %xmm14, %xmm12
61 //hol die MSBs aller bytes raus
65 //ist %ecx gleich null? dann die naechsten 16byte bitte
68 //speicheradresse des parameters zurueckgeben (wird noch modifziert)
72 * ab hier uebler hax um nach \0 trotzdem die gleichen bytes wie
73 * input zu haben, also um selbiges verhalten wie asmb_ref zu erzwingen */
75 //\0 byte stelle durch rausfinden des MSB des %ecx
78 //das ergebnis zweimal abspeichern
81 //hint: in %xmm15 ist differenz gespeichert (vgl .differenz)
83 //leider shiften nur mit immediate! :(
124 //betreffende speicherstelle in %xmm11 laden
125 movdqu -16(%rax, %rdx, 8), %xmm11
126 //und overhead wieder subtrahieren
129 //ergebnis zurueckspielen und fertig \o/
130 movapd %xmm11, -16(%rax, %rdx, 8)
135 .section .eh_frame,"a",@progbits
137 .long .LECIE1-.LSCIE1
155 .long .LEFDE1-.LASFDE1
157 .long .LASFDE1-.Lframe1
163 .ident "GCC: (Debian 4.3.2-1.1) 4.3.2"
164 .section .note.GNU-stack,"",@progbits