みればわかるがbswap使ってる

SIMDでもエンディアン変換くらいは簡単にできるよ
{ 3, 2, 1, 0, 7, 6, 5, 4, 11, 10, 9, 8, 15, 14, 13, 12 }
みたいなバイト列レジスタに置いといてvec_perm(vperm)とか_mm_shuffle_epi8(pshufb)とかな