数値計算

次世代スパコン2種

富士通とNECからスパコンの話が出てきました。 富士通の方は京の正常進化版を来年1月から出荷開始という話。CPUは45nmから40nmにシュリンクしてコア数を16へと倍増、SIMD命令を拡張といったもののようです。理論演算性能も消費電力もコア数に従ってアップし…

GROMACS on AIX

そんなわけで?スレッド並列が可能になったGROMACS-4.5系をインストール。前にもちょろっと登場したPower7マシンでは、4.0系はMPI周りでconfigureがこけて(configureしている環境ではMPI実行できないのが原因らしく、intだかなんだかのsizeが計算できないと…

GROMACSのgroファイルに99999個以上の原子を入れてみた

あのインデックス、99999を越えたら0に戻してOKらしいです。普通に食べて計算してくれました。ただしまだ結果未確認につき話半分でお願いします。 あと試したのは単原子分子なので巨大な高分子とかは知りませんので悪しからず。 でも計算が……重ひ……

HTと発熱

気分的に1スレッド残し、多少遅くなってもいいからと4スレッド+3スレッドで計算を投入。すると、7スレッドフルに動くとうおーん、とファンが低い音を立て始め、片方が並列でない部分にさしかかると静かに。やはり仮想コアでも、動かしたぶん発熱は増えるよう…

Gromacs + HT

さっきは疑われたHTですが、小さな計算で試したところ、4並列→8並列で約20%性能向上。効果ありでした。テスト系はGromacs 4.0.7 + Lennard-Jones粒子系。ただ、領域分割で並列化されているようなので、8全部使うのはちょっと・・・→7より6のほうが2x3とかで…

Ubuntu 10.10 + Gromacs + MPI

遅まきながら、あけましておめでとうございます。 ちまちまといくつかメモ。 まずは先日インストールしたUbuntu 10.10マシンでのGromacsの挙動。年末から計算を放り込んでおいたら、異常に遅い。HTが原因かと思いましたが、ファイルが複数出力されているあた…

aptで入れたGromacsは遅い?

前にもちょろっと出てきたかもしれないGromacs。Ubuntuの10.04だと最新の4.0.7がapt-get一発で入るので、ずぼらしてそっちをちまちまいじっていたのですが、改めてtarballを落としてきてmakeしたら、50%以上の速度向上。手元でコンパイルすると最適化でこん…

素因数分解

NTTが共同研究で768bit(10進232桁)の合成数の素因数分解に成功したとか。なんでも現在広く用いられているRSA暗号は1024bitの素因数分解がキモらしく、将来これも達成される可能性が出てきた、とのこと。 素因数分解はべらぼうに重いことで知られていますが…

OpenMPのすすめ

いよいよ冬本番、大学の近くの店でもメニューにカキフライが加わっていました。かなり久しぶりに食べましたが、やはり美味ですね。 さて、最近気分がいまいちぱっとしないのですが、ぱっとしないついでに、Jacobi法にOpenMPで並列化をかましてみました。一般…

iccでC++ソースをコンパイルするMakefile

一瞬考えたので、ささやかなメモ。 ぼちぼちソースの分割を考え始めたので、複数のファイルを楽にコンパイルできるように、Makefileを書くことにしました。iccを使う場合、最も単純には次のようになります。 hoge:hoge1.o hoge2.o icpc -o hoge hoge1.o hoge…

訂正

大ぼけをかましておりました。ここで100x100と書いた行列のサイズ、正しくは(100x100)x(100x100)です。えらい違い・・・(汗 あと補足。メモリは大丈夫などと書きましたが、サイズからわかる通り、かなり食います。実行したマシンは2GBあったので大丈夫でし…

ただのバグだった件

昨日ごちゃごちゃと書きましたが、Gaussの消去法がうまくいかないのは、絶対値を取り忘れるという初歩的なバグが原因だったことが判明。このぶんだと、まだまだバグが仕込んでありそうで・・・ おまけに何も考えずに解かせると25分くらいかかるので、高速化…

連立一次方程式って難しい

昨夜は月が非常にきれいでしたが、今日は変わって雨模様。昼は結構寒かった・・・ それはさておき。数値計算の練習中、連立方程式を解く場面に出くわしたのですが、それがなかなか難しいようで。 講義で出てきた計算例なのですが、その例ではSOR法で解くとあ…

少し数値計算の練習なんぞをやっていたのですが、そこでの話。プログラムを書いてコンパイルするときにはだいたい最適化をするわけですが、演算子の評価順序をいじるときには計算結果が微妙に違ってきます。 マニュアルを読んだってそう書いてあるし、知って…