dblp グラフの続き

ちょっと、やけくそになる時期が来ました。ストリームアルゴリズムがどうとか、ちょっとおいといて、とりあえず全体のグラフをつくって、そっから幅優先すれば良いじゃんて思ってしまいました。

とりあえず構造の構築。著者名(string)をノード、共著関係(ポインタのペア)をエッジ。これまずダメ。リミット外さないとメモリ制限にひっかかって速攻で落ちます。リミットは外したくないです。あそびですので。

ということで、(最小)完全ハッシュライブラリbepを利用させてもらいました。頂点集合を取得するのに25秒。インデクス貼るのに2秒。良い!これでエッジを整数のペアで表せて、グラフが出力できました。

こっから描画に向けての準備です。なのですが、とりあえず全部ダメ... ちょっとでかすぎ。次の手順でいろいろやってみました。なんかバグもありそうだし、もう少し小さなグラフで試してみようかなって思います。

LGLが使えるかなと思ったので、まずは、ncol形式でグラフを出力しました。それから、igraphライブラリを使って、lgl形式に変換しました。グラフのncol形式およびlgl形式は、LGLのページを参照して下さい。でも、うまく表示できませんでした。つぎに、GML形式に変換してcytoscapeを使おうとしました。ダメでした。Graphvizはまだ試していません。