京橋のバイオインフォマティシャンの日常

南国のビーチパラソルの下で、Rプログラムを打ってる日常を求めて、、Daily Life of Bioinformatician in Kyobashi of Osaka

R - ビッグデータ解析の処方箋

【R・ビッグデータ解析の処方箋】Rで、10万ノードを超える大きなネットワーク図を描画するTips 〜 igraph::plot.igraphは使い物にならない件 〜

はじめに graphics::plot.defaultによるネットワーク図の作成例 グラフ・ノード数による描画時間の比較 実行時間の可視化 まとめ 参考資料 はじめに Rでのネットワーク図の作成では、igraph packageがよく使われる。 ただ、igraphによるネットワーク図の描写…

【R・ビッグデータ解析の処方箋①】readLines、connection オブジェクトを使って、テキストファイルの1行ずつ読み込みを実行してみた件〜

はじめに 練習ファイルのダウンロード readLinesのダメな実行例 readLinesの実行コード例 まとめ R・ビッグデータ解析の処方箋 関連記事 R言語 お勧め書籍 補足 readLines関数で、10万行の同時読み込み 参考資料 はじめに 現状、数十GB・数百GBといった、…

【Rのジミ〜な小技シリーズ】データ解析の前処理で悩まされるデータ重複の問題を扱ってみた件

はじめに 練習データの準備 ベクトル内で、データの重複があるかどうか?どう扱うか? 2つのベクトル間で、データの重複があるかどうか?・重複をどう扱うか? データフレーム内で、データの重複があるかどうか?・重複をどう扱うか? まとめ 参考資料 【R…