京橋のバイオインフォマティシャンの日常

まずは、データ分析、コマンドラインのメモとして

R・ビッグデータ解析の処方箋

【R・ビッグデータ解析の処方箋】Rで、10万ノードを超える大きなネットワーク図を描画するTips 〜 igraph::plot.igraphは使い物にならない件 〜

Rでのネットワーク図の作成では、igraph packageがよく使われる。 ただ、igraphによるネットワーク図の描写は、1万ノードを超えたあたりから、結構な時間がかかる。 そのため、10万ノードを超えるような、大規模なネットワーク図の描画には、ちょっとした…

【R・ビッグデータ解析の処方箋①】readLines、connection オブジェクトを使って、テキストファイルの1行ずつ読み込みを実行してみた件〜

現状、数十GB・数百GBといった、大きなファイルを扱う際には、R/メモリ上で全データを読み込むことはややリスキーである。 ファイル全体を読み込まず、ファイル内の1行ずつで処理を実施する工夫が必要となる。*1 Rで、1行ずつの処理を実行するには、readLi…