京橋のバイオインフォマティシャンの日常

南国のビーチパラソルの下で、Rプログラムを打ってる日常を求めて、、Daily Life of Bioinformatician in Kyobashi of Osaka

2022-01-01から1ヶ月間の記事一覧

【Rのジミ〜な小技シリーズ】変数で、データフレームに「任意の列名」を追加するTips

はじめに データフレームの列名を追加する 文字列の変数で、データフレームの列名を追加する はじめに pasteなどで連結して作成した文字列をもとにして、それらをデータフレームの列名にしたい。 そういうケースがよくあるのです。 食わず嫌い的に試して無か…

【Rのジミ〜な小技シリーズ】エクセルデータをクリップボードにコピーして、Rのread.table関数でデータフレームとして読み込むTips

エクセルデータをクリップボードにコピーしてR環境に読み込む コピーしたセルがヘッダーを含む場合 コピーしたセルがヘッダーを含まない場合 追記(2020年6月10日): マークダウンなどでテーブル出力 【Rのジミ〜な小技シリーズ】 参考資料 エクセルデータを…

grepコマンドで文字列処理をやってみた件【その2】検索語のヒット数カウントとか検索語の前後文字の抽出とか色々

はじめに まずは、サンプルデータをダウンロードする 検索語に一致した文字列のみを抜き出して出力する 大文字・小文字を区別せず、検索語に一致した文字列のみを抜き出して出力する 検索語に一致した文字列の数をカウントする【部分一致検索】 検索語に一致…

grepコマンドで文字列処理をやってみた件【その1】ファイル内のテキストに対する処理とか

はじめに 練習用のファイルのダウンロード ファイル内のテキストに対する処理 ある特定の文字列を含む行を表示する ある特定の文字列を含まない行を表示する ある特定の文字列を含まない行を別ファイルに出力する 空白行を削除する ファイル内の行数をカウン…

htmlwidgets for R のShowcaseにあるパッケージがCodePenでブログ表示できるかを調べた件

はじめに とりあえず、結果 表示結果 Leaflet Dygraphs networkD3 d3heatmap DataTables MetricsGraphics まとめ はじめに htmlwidgets for R パッケージは、Rでインタラクティブな図が作成できる王道的なパッケージであり、 それを使った色々な依存パッケー…

MacOSXターミナルでのbz2形式の圧縮・解凍についてまとめてみた件

.bz2について bzip2コマンドによるbzip2圧縮 bzip2圧縮を行い、任意のファイル名で保存する場合 bunzip2コマンドによるbzip2解凍 .tar.bz2について tarコマンドによるtar.bz2圧縮 tarコマンドによるtar.bz2解凍 .bz2について bzip2では、 圧縮効率を良くする…

R/Keras/TensorFlowでやる『ディープラーニング(Deep Learning)』のすゝめ【その2】教師なしニューラルネットワーク Autoencoder with 2D CNNの実装、そして色ムラ・ノイズ除去(Denoising)をやってみた件

はじめに R/Kerasのセットアップ MNISTデータの準備 Autoencoder with 2D CNN のモデル構築 ちょっとした関数の説明 DLモデルの出力 結果の評価 色ムラに対するDenoising Autoencoder 色ムラがある手書き文字の生成 Autoencoder for denoising モデルの構築 …

Homebrew を使って、Python 3.9 をインストールしたときの設定諸々 〜インストール先が「/opt/homebrew/bin」になってるよ!!〜

はじめに(2022年1月アップデート版) Homebrew でPython3をインストールする。 実行環境 Homebrew で、Python3 をインストールする Pythonパスを確認する 次にやること・・・パスの優先度の変更 /opt/homebrew/binのエイリアス名を変える まとめ Python …

R言語/Webスクレイピングで、Wikipediaページのテーブル情報からNASDAQ-100の銘柄リストを取得して、2021年中の株価推移を見てみた件

はじめに NASDAQ-100のWikipediaページ、Rでの下準備 NASDAQ-100 使用するパッケージの事前準備 Wikipediaページからの銘柄リストの取得 NASDAQ-100 NASDAQ-100銘柄の年間パフォーマンスをアニメーションにする 1年間のパフォーマンス ツリーマップのアニメ…

Rで、デフォルトパッケージ以外のパッケージを削除するTips

特定パッケージだけを削除する方法 R環境での実行例 補足: 他の関数群 特定パッケージだけを削除する方法 Rのデフォルトパッケージを残して、 追加でインストールしたパッケージだけを削除する方法をメモしておく。 パッケージがいろいろと増えてくると、 パ…

【SRA Toolkitの続編】Mac版のSRA Toolkitを設定して、fastq-dumpの高速版「fasterq-dump」を試してみた件

SRA Toolkitの設定 fasterq-dumpコマンドで、FASTQファイルを高速に取得する fasterq-dumpの基本形 複数のSRAオブジェクトに対する、fasterq-dumpの実行 fasterq-dumpのオプション 補足 single-endか、paired-endの判定プログラム fastq-dumpコマンドとの相…

R言語/rstudio 初心者におすすめ入門本・参考書・R本: 厳選 5 選+α !!

はじめに R言語のおすすめ入門本 5 選 + アルファを紹介!! 改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界 R言語ではじめるプログラミングとデータ分析 Rでらくらくデータ分析入門 ~効率的なデータ加工のための基礎…

Mac版のSRA-toolkitのprefetchコマンドを使用して、SRA(Sequence Read Archive)ファイルをダウンロードしてみた件

SRA Toolkitの設定 prefetchコマンドについて prefetchの基本形 prefetchの代表的なオプション 複数のSRAファイルを一度にダウンロードする 補足 シェルスクリプトで、複数のFASTA形式ファイル(+ gz圧縮)をダウンロードする。 ゲノム解析の関連記事 参考資…

R/ShortReadパッケージを使って、FASTQ形式ファイルを読み込む

はじめに 関連パッケージの読み込み SRA Toolkit / fastq-dump コマンドを使って、FASTQファイルを取得する。 FASTQファイルの読み込み リード長を取り出す方法 クオリティスコアを可視化する サイクルごとにクオリティスコアを可視化する まとめ ゲノム解析…

Wikipedia 英語記事「COVID-19」の日本語訳を公開してみた【その3: COVID感染症の病態生理】

はじめに Pathophysiology / 病態生理 過去の記事 はじめに この記事は、2021年12月30日現在のWikipedia 英語記事「COVID-19」を日本語訳したものである。 en.wikipedia.org この情報は英語ページにはありますが、まだ日本語ページは存在していません。結構…

Wikipedia 英語記事「COVID-19」の日本語訳を公開してみた【その2: COVIDの伝染】

はじめに Transmission / 伝染 その3に続く はじめに この記事は、2021年12月30日現在のWikipedia 英語記事「COVID-19」を日本語訳したものである。 en.wikipedia.org この情報は英語ページにはありますが、まだ日本語ページは存在していません。結構しっか…