京橋のバイオインフォマティシャンの日常

南国のビーチパラソルの下で、Rプログラムを打ってる日常を求めて、、Daily Life of Bioinformatician in Kyobashi of Osaka

R

MacでOpen-interpreterのインストールとR言語の実行について: Macターミナル上でLLMを動かしてみよう

この記事の音声読み上げ はじめに プレインストールの設定 open-interpreterのインストールと設定 Open-interpreterの使用 まとめ M1 Macでstream resultが制御できないバグについて 補足: interpreter -yでの実行時の表示 補足: Code-Llamaに進んだ場合のメ…

R言語で核酸配列データを扱ってみた件【その2: FASTAフォーマット・ファイルの読み込み】

はじめに seqinrパッケージのインストール Biostringsパッケージのインストール seqinr::read.fastaを使って、HIV-1 全ゲノムのFASTAファイルの読み込み場合 seqinr::read.fastaを使って、FASTAを「ベクトル」として読み込む seqinr::read.fastaを使って、FA…

Mac版wgetコマンドのプログレス・ログ詳細を表示させないTips

はじめに - 問題提起 Googleドライブからのファイルダウンロード デフォルトログ表示への対策 R言語でのwget実行 参考資料 はじめに - 問題提起 wgetコマンドを使ってたら、そのデフォルトログが冗長で嫌になりませんか?? 今回の記事では、その対策として…

【R言語/速度論/数値計算】10倍量のヨーグルトを作りながら、乳酸菌の増殖曲線を考えてみた件

この記事は、2020年6月13日記事のアップデート版です。 はじめに 方法 (1): 10倍量ヨーグルト作製のマテリアル 方法 (2): 10倍量ヨーグルトの作製プロトコール 結果: 種菌の増殖曲線の検討 まとめ 参考文献 はじめに 最近、ヨーグルト作りにハマっていま…

【Rのジミ〜な小技シリーズ】エクセルデータをクリップボードにコピーして、Rのread.table関数でデータフレームとして読み込むTips

エクセルデータをクリップボードにコピーしてR環境に読み込む コピーしたセルがヘッダーを含む場合 コピーしたセルがヘッダーを含まない場合 追記(2020年6月10日): マークダウンなどでテーブル出力 【Rのジミ〜な小技シリーズ】 参考資料 エクセルデータを…

htmlwidgets for R のShowcaseにあるパッケージがCodePenでブログ表示できるかを調べた件

はじめに とりあえず、結果 表示結果 Leaflet Dygraphs networkD3 d3heatmap DataTables MetricsGraphics まとめ はじめに htmlwidgets for R パッケージは、Rでインタラクティブな図が作成できる王道的なパッケージであり、 それを使った色々な依存パッケー…

R/Keras/TensorFlowでやる『ディープラーニング(Deep Learning)』のすゝめ【その2】教師なしニューラルネットワーク Autoencoder with 2D CNNの実装、そして色ムラ・ノイズ除去(Denoising)をやってみた件

はじめに R/Kerasのセットアップ MNISTデータの準備 Autoencoder with 2D CNN のモデル構築 ちょっとした関数の説明 DLモデルの出力 結果の評価 色ムラに対するDenoising Autoencoder 色ムラがある手書き文字の生成 Autoencoder for denoising モデルの構築 …

R言語で核酸配列データを扱ってみた件【その1: 生物学的配列の検索と解析パッケージ seqinr】

はじめに DNAの基礎知識 seqinrパッケージのインストール seqinrパッケージを使って、DNA配列データを扱う 配列データを使った基本的な処理 seqinr::AAstat 関数 補足 seqinr: Biological Sequences Retrieval and Analysis DNAコドン表 RNAコドン表 はじめ…

R言語で『eval + parse + paste関数』を使って、文字列をRプログラムとして実行するTips

はじめに 使用する関数群の概要 paste関数 parse関数 eval関数 「eval + parse + text + paste」型の実装例 (1) 基本形 「eval + parse + text + paste」型の実装例 (2) assign関数を使う まとめ 参考資料 はじめに R言語では、文字列をRの命令文として実行…

【Rでの文字列処理シリーズ(その6)】類似文字列検索ライブラリpython版simstringをRから使って、文字列の距離計算をやってみた件

はじめに テキスト処理の関連記事 python版simstringのインストール R言語で、simstringライブラリを実行してみる。 まとめ はじめに 文字列処理・テキスト処理とは、プログラミングを行うなかで、文字列・テキストに対する色々な操作のことを指します。それ…

【Rでの文字列処理シリーズ(その5)】文字列の抽出・切り出し・検出

はじめに テキスト処理の関連記事 関連パッケージをロードする 文字列の抽出/切り出しについて 文字数指定で、文字列を抽出する 文字列の検出 「月の英語表記」を「月の数字」に置換する方法について 参考資料 はじめに 文字列処理・テキスト処理とは、プロ…

【Rでの文字列処理シリーズ(その4)】文字列の近似的文字列マッチング

はじめに テキスト処理の関連記事 下準備について 近似的文字列マッティング agrep & agrepl 関数 adist 関数 stringdist / stringdistmatrix関数で、文字列間の距離指標を計算する あとがき 参考資料 はじめに 文字列処理・テキスト処理とは、プログラミン…

【Rでの文字列処理シリーズ(その3)】文字列/テキストの検出・検索: 完全一致、部分一致、拡張正規表現、曖昧一致判定

はじめに テキスト処理の関連記事 下準備について 【1】完全一致で、その文字列を含むかどうかのの判定 比較演算子 == != base::match、stringr::str_match、演算子 %in% 【2】部分一致で、その文字列を含むかどうかの判定 charmatch関数、pmatch関数 grep…

R/Slack APIの諸設定、slackrの使い方、及びGoogle scholarで検索された新着論文情報を知らせるTips

はじめに : R版Slack API Salck API設定の手順 1. Slackのワークスペースに、任意のチャネルを作る。(必要なら) 2. Slack アプリを新規作成する 3. Incomming WebhooksをActiveにする 4. Bot User OAuth Tokenの取得、OAuth & Permissionsの設定 5. Slack ア…

【Rでの文字列処理シリーズ(その2)】文字列ベクトルの連結と文字列長のカウント

はじめに テキスト処理の関連記事 下準備について 【1】文字列ベクトルの連結 base::paste0 関数・ stringr::str_c 関数 stringr::str_c 関数 【2】文字列長のカウント base::nchar 関数 stringr::str_length 関数 ・ stringr::str_count 関数 補足 format…

【R言語で作成するアニメーション】データ分布のアニメーション 〜正規分布編〜

正規分布に従うデータのアニメーション 実行したスクリプト 補足 累積分布関数 コルモゴロフ・スミルノフ検定 Q-Qプロット 正規分布に従うデータのアニメーション 正規分布に従うデータ(乱数)を、異なるサンプルサイズで準備して、 それらデータについて、…

RからのKaggleコマンド実行のTips 〜コンペ一覧・データセット取得・submitなどを一通りやってみた。Predictionはまた今度で編〜

はじめに Pythonの設定・configについて Kaggleコマンドの使い方 基本的な文法 【1】コンペ一覧の表示①: 全一覧の表示 【2】コンペ一覧の表示②: titanicで検索した一覧の表示 【3】コンペ・ランキングの表示: titanic 【4】コンペ・データセットの表示: …

最近、CentOS7で、R言語のインストールでややハマった件

はじめに EPELリポジトリをダウンロードする リポジトリの有効・無効を調べる yumに--enablerepo=epelのフラッグを追加する Rのセットアップ 参考資料 はじめに CentOS7でのR言語のインストールにハマったので、メモを残しておく。 結局、デフォルトのまま…

【Rのジミ〜な小技シリーズ】フォルダ・ディレクトリの作成・削除・コピー・名前変更 〜フォルダが存在しない時にだけ作成を実行する〜

はじめに フォルダ・ディレクトリの作成・削除・コピー・名前変更 フォルダの作成・削除について フォルダのコピー・フォルダ削除(file.removeで消せない時の対応) フォルダ名を変更する 複数階層のフォルダを作成する フォルダが存在しない時にだけ、フォ…

画像解析関連のRパッケージについて調査してみた件 〜ANTsRNetを用いた、RにおけるU-NETの実装事例〜

今回、画像処理・画像解析に関するRパッケージを調査したので、見つかったパッケージを(広く浅く)紹介する。 調査対象は、CRAN、Bioconductor、Neuroconductor (= GitHub/CRAN) とかで、検索キーワードは、imag(e), microscop(y) あたりで調べた。 あと、…

【Rのジミ〜な小技シリーズ】空リストの作成とリスト操作、それと空ベクトルを使ったベクトル結合とデータフレーム結合のトピックスを扱う

はじめに 空リストlist()からリストを作成する 空ベクトルc()からベクトルを作成する 空ベクトルc()からデータフレームを作成する %>% (パイプ演算子あるいは単にパイプ)について まとめ はじめに またもや、ジミーなトピックですけど、空リストlist()と空…

【Rのジミ〜な小技シリーズ】ベクトルに「含まれる」「含まれない」要素の取り出し、論理値について

はじめに あるベクトルから他ベクトルに「含まれる要素」あるいは「含まれない要素」を抽出する方法 例1: 共通に含まれている要素を取り出す 例2: 共通に含まれない要素を取り出す ベクトル間で、「すべて」あるいは「いずれか」と一致する関係があるか? …

【Rのジミ〜な小技シリーズ】Rのどぎついレインボー・カラーを和らげて、使える色へと変換するTipsについて

はじめに レインボー色(grDevices::rainbow関数)の設定 レインボー・カラー 透明度 FF レインボー・カラー 透明度 80 レインボー・カラー 透明度 60 レインボー・カラー 透明度 40 レインボー・カラー 透明度 20 Rで使える他のカラーパレットについて palet…

【Rのジミ〜な小技シリーズ】時々にしたくなる、Rの古いバージョンのパッケージ(The previous version packages)をインストールする件

はじめに 過去のバージョンのRパッケージをインストールする まとめ 【Rのジミ〜な小技シリーズ】 はじめに Rを使っていると、稀に、パッケージのバージョン違いで問題が起こることがあります。 そのとき、以前の古いバージョンのパッケージをインストールす…

【R言語と学術論文】PubMed API「RISmed」と googletrans を使って、PubMed掲載論文のAbstract和訳をRでやってみた件

はじめに Rパッケージのセットアップ PubMed全体でキーワード検索をやってみる 少し脱線して、年ごとの論文数をまとめてみた 本題に入って、googletransによる論文情報の和訳とレポート作成をやってみる まとめ 全Rコード in gist 補足 MEDLINEタグ情報*5 Pu…

【R言語と日英翻訳】「reticulate」パッケージを使えば、Pythonライブラリがインポート・実行できる。そして、R上で「googletrans」を用いた日英翻訳をやってみた件

はじめに googletransライブラリのメリット・デメリット googletransのインストール reticulateのセットアップ RからPython googletransを呼び出す googletransの実行 まとめ 補足 Rから、Python ライブラリのヘルプ表示 googleLanguageRの「No authorizatio…

R/Keras/TensorFlowでやる『ディープラーニング(Deep Learning)』のすゝめ【その1】教師なしニューラルネットワークDeep Autoencoder のsimple modelをやってみた件

はじめに Keras/TensorFlowのセットアップ 手書き文字MNISTデータセットの用意 Autoencoderのモデル構築 シンプルAutoencoderモデル 01 RStudioセッションの初期化 シンプルAutoencoderモデル 02 シンプルAutoencoderモデル 03 各モデルのlossの比較 …

Mac Jupyterで、RとかPythonとかシェルとかのセットアップをするの巻

はじめに まずは、 ターミナルを立ち上げて、Macの実行環境確認 jupyterの設定 jupyter notebook のインストール jupyter lab のインストール いまさらながら、python2の設定(失敗) Rの設定 ibashの設定 SPARQLの設定 ijsの設定 まとめ 補足 jupyterのipyn…

【R言語】データサイズ・行数が異なるテキストファイルにおけるファイル読み込み関数の速度比較

はじめに 実行環境 検証用のファイル生成 opensslコマンドを用いた、ランダム文字列の生成 echoとtrコマンドを用いた文字列の生成 seqコマンドを用いた連番数字の生成 seqコマンドを用いた検証用ファイルの生成 Rでのファイル読み込み検証 utils::read.table…

Rパッケージ探索のための情報サイトをまとめてみた件 〜2020年版〜

はじめに CRAN系 CRAN Task Views The R Journal RWeekly.org CRANberries RStudio系 R Views RStudio Blog RStudio AI Blog Conductor系 Bioconductor Neuroconductor その他 rOpenSci seekR R bloggers Awesome DataCamp はじめに 特に、パッケージユーザ…