Gromacs + HT

さっきは疑われたHTですが、小さな計算で試したところ、4並列→8並列で約20%性能向上。効果ありでした。テスト系はGromacs 4.0.7 + Lennard-Jones粒子系。ただ、領域分割で並列化されているようなので、8全部使うのはちょっと・・・→7より6のほうが2x3とかできそう→じゃあ4でいいんじゃね?という結論に。使わない夜中に終わる計算とかだったら8並列してもよさそうです。
ちなみにOpenMPで並列化したとある自作プログラムでは、4スレッド→8スレッドで約5%の性能向上。一応効いてはいる模様。