Das sind ja nur minimale Unterschiede, halt Messungenauigkeiten. Hab den Benchmark gerade nochmal durchlaufen lassen, jetzt ist 16 langsamer als 32:
1 thread : 6095 ms (1,00x)
2 threads: 3716 ms (1,64x)
4 threads: 3448 ms (1,77x)
8 threads: 3447 ms (1,77x)
16 threads: 3487 ms...