.file "asmb.c" .data .align 16 const65: .rept 16 .byte 0x65 .endr const20: .rept 16 .byte 0x20 .endr constc0: .rept 16 .byte 0xc0 .endr const00: .rept 16 .byte 0x00 .endr .text .globl asmb .type asmb, @function asmb: .LFB2: //speicheradresse des parameters zurueckgeben mov %rdi, %rax .nextround: //speicheradresse des pointers zeigt auf 16*8 feld = 128bit movdqu (%rdi), %xmm11 // -64 - c movdqa constc0, %xmm9 psubb %xmm11, %xmm9 // Packed COMpare Greater Than (Byte)" // achtung beim intuitiven lesen des befehles. 'kleiner' // ist mit 'groesser' vertauscht und vice versa pcmpgtb const65, %xmm9 .differenz: // Y = min(X, 'a' - 'A') pand const20, %xmm9 // c += Y paddb %xmm9, %xmm11 // retuniere an die richtige speicheradresse movdqu %xmm11, (%rdi) //entspricht ein byte dem nullbyte dann steht an jener stelle 0xff sonst 0x00 pcmpeqb const00, %xmm11 //hol die MSBs aller bytes raus pmovmskb %xmm11, %ecx add $16, %rdi //ist %ecx gleich null? dann die naechsten 16byte bitte jecxz .nextround /* //=============== //ab hier uebler hax um nach \0 trotzdem die gleichen bytes wie //input zu haben, also um selbiges verhalten wie asmb_ref zu erzwingen //\0 byte stelle durch rausfinden des MSB des %ecx bsf %ecx, %r11d //das ergebnis zweimal abspeichern mov %r11d, %ecx //hint: in %xmm9 ist differenz gespeichert (vgl .differenz) //leider shiften nur mit immediate! :( btr $3, %r11d jnc .rechtsshift1 psrldq $8, %xmm9 .rechtsshift1: btr $2, %r11d jnc .rechtsshift2 psrldq $4, %xmm9 .rechtsshift2: btr $1, %r11d jnc .rechtsshift3 psrldq $2, %xmm9 .rechtsshift3: btr $0, %r11d jnc .linksshift psrldq $1, %xmm9 #================== .linksshift: btr $3, %ecx jnc .linksshift1 pslldq $8, %xmm9 .linksshift1: btr $2, %ecx jnc .linksshift2 pslldq $4, %xmm9 .linksshift2: btr $1, %ecx jnc .linksshift3 pslldq $2, %xmm9 .linksshift3: btr $0, %ecx jnc .endshift pslldq $1, %xmm9 .endshift: //betreffende speicherstelle in %xmm11 laden movdqu -16(%rdi), %xmm11 //und overhead wieder subtrahieren psubb %xmm9, %xmm11 //ergebnis zurueckspielen und fertig \o/ movdqu %xmm11, -16(%rdi) */ ret .LFE2: .size asmb, .-asmb .section .eh_frame,"a",@progbits .Lframe1: .long .LECIE1-.LSCIE1 .LSCIE1: .long 0x0 .byte 0x1 .string "zR" .uleb128 0x1 .sleb128 -8 .byte 0x10 .uleb128 0x1 .byte 0x3 .byte 0xc .uleb128 0x7 .uleb128 0x8 .byte 0x90 .uleb128 0x1 .align 8 .LECIE1: .LSFDE1: .long .LEFDE1-.LASFDE1 .LASFDE1: .long .LASFDE1-.Lframe1 .long .LFB2 .long .LFE2-.LFB2 .uleb128 0x0 .align 8 .LEFDE1: .ident "GCC: (Debian 4.3.2-1.1) 4.3.2" .section .note.GNU-stack,"",@progbits