京橋のバイオインフォマティシャンの日常

南国のビーチパラソルの下で、Rプログラムを打ってる日常を求めて、、Daily Life of Bioinformatician in Kyobashi of Osaka

Terminalコマンド - cat

grepコマンドで文字列処理をやってみた件【その2】検索語のヒット数カウントとか検索語の前後文字の抽出とか色々

はじめに まずは、サンプルデータをダウンロードする 検索語に一致した文字列のみを抜き出して出力する 大文字・小文字を区別せず、検索語に一致した文字列のみを抜き出して出力する 検索語に一致した文字列の数をカウントする【部分一致検索】 検索語に一致…

grepコマンドで文字列処理をやってみた件【その1】ファイル内のテキストに対する処理とか

はじめに 練習用のファイルのダウンロード ファイル内のテキストに対する処理 ある特定の文字列を含む行を表示する ある特定の文字列を含まない行を表示する ある特定の文字列を含まない行を別ファイルに出力する 空白行を削除する ファイル内の行数をカウン…

【LINUX/Macの基本コマンド④】cd, cat, head/tailなどのコマンドの使い方メモ

はじめに cd : ディレクトリ移動 cat : ファイル内表示・結合・作成 head / tail : ファイルの先頭や末尾を表示 覚えておくと良いターミナルコマンド ターミナルコマンド補足編 まとめ LINUX/Macの基本コマンドの関連記事 はじめに ターミナル上で、よく使う…

文字コード変換のLINUXコマンド 〜文字化け変換、シングルバイト文字、マルチバイト文字、JIS、Shift_JIS、UTF-8、BOM付きUTF-8、Unicodeエスケープ文字、URLエンコードなどの諸問題について〜

シングルバイト文字・マルチバイト文字 UTF・BOM Unicodeエスケープ文字・パーセントエンコード文字 nkfコマンドの基本的な使い方 nkfコマンドでの文字コードの変換例 UTF-8からUTF-8(BOM付)への変換 Unicodeエスケープシーケンス形式を日本語文字に変換す…

【LINUX/Macの基本コマンド①】 システム情報、CPU情報、メモリ情報を表示してみる

前書き システム情報 CPU情報 メモリ情報の確認 LINUX/Macの基本コマンドの関連記事 前書き このコーナーでは、CentOSで使う、基本的なコマンドラインをまとめてみることにする。 第1回目として、ターミナルコマンドで、 システム情報、CPU情報、メモリ情報…

【R・ビッグデータ解析の処方箋①】readLines、connection オブジェクトを使って、テキストファイルの1行ずつ読み込みを実行してみた件〜

はじめに 練習ファイルのダウンロード readLinesのダメな実行例 readLinesの実行コード例 まとめ R・ビッグデータ解析の処方箋 関連記事 R言語 お勧め書籍 補足 readLines関数で、10万行の同時読み込み 参考資料 はじめに 現状、数十GB・数百GBといった、…