9 //soll einfach null sein
12 /*init %xmm8 mit "'Z' + 1 + min_t - 'A'" fuer jedes byte
13 * 'Z' + 1 + min_t - 'A' = 90 + 1 - 128 - 65 = -102
16 * (~102)+1 = 10011010 = 0x9A */
17 mov $0x9a9a9a9a9a9a9a9a, %rax
21 //init %xmm9 mit "'a'-'A'= 97-65 = 32 = 0x20
22 mov $0x2020202020202020, %rax
26 //speicheradresse des pointers zeigt auf 16*8 feld = 128bit
27 movdqu (%rdi, %rdx, 8), %xmm11
28 movdqu (%rdi, %rdx, 8), %xmm12
30 /*addiere in %xmm11 "min_t-'A'"
31 * = -128 - 65 = 63 = 0x3f */
32 mov $0x3f3f3f3f3f3f3f3f, %rax
34 movddup %xmm15, %xmm10
37 //speicheradresse des pointers zeigt auf 16*8 feld = 128bit
38 movdqu (%rdi, %rdx, 8), %xmm11
39 movdqu (%rdi, %rdx, 8), %xmm12
44 //0x9a9a... zwischenspeichern
47 /*"Packed COMpare Greater Than (Byte)"
48 * X = 'Z' + 1 + min_t - 'A' > c + min_t - 'A' ? 0xff : 0
49 * achtung beim intuitiven lesen des befehles. 'kleiner'
50 * ist mit 'groesser' vertauscht und vice versa */
51 pcmpgtb %xmm11, %xmm15
53 //Y = min(X, 'a' - 'A')
59 //retuniere an die richtige speicheradresse
60 movapd %xmm12, (%rdi, %rdx, 8)
62 //ist ein byte groesser als 0? dann steht 0xff drin
63 pcmpeqb %xmm14, %xmm12
64 //hol die MSBs aller bytes raus
68 //ist %ecx gleich null? dann die naechsten 16byte bitte
75 .section .eh_frame,"a",@progbits
95 .long .LEFDE1-.LASFDE1
97 .long .LASFDE1-.Lframe1
103 .ident "GCC: (Debian 4.3.2-1.1) 4.3.2"
104 .section .note.GNU-stack,"",@progbits