京橋のバイオインフォマティシャンの日常

南国のビーチパラソルの下で、Rプログラムを打ってる日常を求めて、、Daily Life of Bioinformatician in Kyobashi of Osaka

R - ビッグデータ解析の処方箋

【R・ビッグデータ解析の処方箋】Rで、10万ノードを超える大きなネットワーク図を描画するTips 〜 igraph::plot.igraphは使い物にならない件 〜

はじめに graphics::plot.defaultによるネットワーク図の作成例 グラフ・ノード数による描画時間の比較 実行時間の可視化 まとめ 参考資料 はじめに Rでのネットワーク図の作成では、igraph packageがよく使われる。 ただ、igraphによるネットワーク図の描写…

【R・ビッグデータ解析の処方箋】readLines、connection オブジェクトを使って、テキストファイルの1行ずつ読み込みを実行してみた件〜

はじめに 練習ファイルのダウンロード readLinesのダメな実行例 readLinesの実行コード例 まとめ R・ビッグデータ解析の処方箋 関連記事 R言語 お勧め書籍 補足 readLines関数で、10万行の同時読み込み 参考資料 はじめに 現状、数十GB・数百GBといった、…

【Rのジミ〜な小技シリーズ】データ解析の前処理で悩まされるデータ重複の問題を扱ってみた件

はじめに 練習データの準備 ベクトル内で、データの重複があるかどうか?どう扱うか? 2つのベクトル間で、データの重複があるかどうか?・重複をどう扱うか? データフレーム内で、データの重複があるかどうか?・重複をどう扱うか? まとめ 参考資料 【R…