京橋のバイオインフォマティシャンの日常

まずは、データ分析、コマンドラインのメモとして

R言語/Bioconductorを用いた、RNA-seq解析チュートリアル(HGEN 473 - Genomics, Spring 2017, 日本語版)

R言語を使った、RNA-seq解析チュートリアルを作成してみた。 データは、RNA-seqのカウント済みのデータを使用している。 本記事は、以下のArticleの日本語訳記事 + α である。 # HGEN 473 - Genomics # Spring 2017 # Tuesday, May 9 & Thursday, May 11 # R…

Rにおけるテーブル表示(1)knitr & mmtable2

Rでの気の利いたテーブル表示について、knitr & mmtable2の実行例をまとめてみた。 パッケージのインストール #パッケージのインストール install.packages("devtools") devtools::install_github("ianmoran11/mmtable2") install.packages("knitr") install…

pdflatexが必要になって、久々にMacTexをインストールしてみた件

OSをクリーンインストールすると、色々と消えてて面倒である。 本記事は、消えたその1つである、MacTexをインストールした時の話である。 Homebrewをインストールして、ターミナルで以下を実行する。 skume.net brew update brew install mactex #実行時に…

【CentOS/LINUXの基本コマンド②】ユーザーの追加・権限付与をする

CentOSでの、ユーザー追加や変更、権限付与についてまとめた。 今回は、基本、sudo権限でコマンド実行する。 「root」ユーザーで実行する場合には、sudoは不要。 まずは、デフォルト情報の確認 ターミナルを起動して、以下のコマンドで見える。 #作成される…

「Devel版R の Dockerイメージ for Bioconductor」を使ってみた件

Devel版R(あるいは、R-devel)は、 パッケージ開発者用に配布されていて、 最新(安定版)の次のRバージョンである。 Bioconductorのページを参考にして、 Devel版RのDockerイメージを使ってみたので、その方法をメモしておく。 bioconductor.org Mac版 Docke…

CentOS7に、R-4.0シリーズをインストールするTips

現在(2021年4月)、CentOS7のepelリポジトリからインストールできるRバージョンは、「R-3.6.0-1.el7.x86_64」である。 「R-4.x」シリーズをインストールするために、、、いろいろと試して、結局、、、 springdaleのリポジトリではなくて、 CRANにあるソース…

R言語で使用できるデータセット一覧 〜 R package ‘datasets’ version 4.1.0 〜

2021年4月現在、R言語で使用できるデータセット一覧をまとめてみた。 概要の和訳部分は、DeepLにて機械翻訳した。 # ToothGrowth の使用例 libary(datasets) data(ToothGrowth) head(ToothGrowth) # len supp dose #1 4.2 VC 0.5 #2 11.5 VC 0.5 #3 7.3 VC …

分子モデリングシミュレーションソフトウェア AutoDock関連資料のまとめ

過去に作成した、Autodock関係の説明資料(AutoDock、AutoDock Vina、Raccoon、Ligplot+)をこちらにもまとめてみた。 AutoDock AutoDock_japanese_ver.1.0 AutoDock_japanese_ver.1.0 from Satoshi Kume Autodock Vina AutoDock_vina_japanese_ver.3.0 Auto…

Rstudio-Server on CentOS7 のインストール方法 + nginxのリダイレクト設定 について

CentOS7版Rstudio-Serverのインストール方法 + nginx設定についてまとめてみた。 Mac版やDocker版のRstudio-Serverのインストール方法については、以下の記事を参考のこと。 skume.net skume.net RStudio Server for Red Hat/CentOS のダウンロード・インス…

R言語で、jsTree・jsTreeR パッケージを使った、 インタラクティブなツリーリスト表示をやってみた件

Rで、インタラクティブに開閉できる、ツリー構造表示をやってみたくて、ちょっと関連パッケージを調べてみた。。 そうすると、jsTreeとjsTreeRというRパッケージがあることが分かった*1。 jsTreeもjsTreeRも同じく、バックエンドはjsライブラリのjsTreeを使…

R言語で、サイコロ・ゲームを一様分布に従う確率でシミュレーションしてみた件

サイコロを振って、1から6のそれぞれの目が出る確率は、等しいと仮定する。 いわゆる、一様分布に従うと考える。 Rでは、一様分布に従う、1〜6までの整数値の乱数は、以下で表される。 as.integer( runif(1, min = 1, max = 7) ) この乱数で、サイコロの振…

【Rでの文字列処理シリーズ(その3)】文字列の検出: 完全一致、部分一致、拡張正規表現

今回、Rでの文字列の検出について、いろいろと試してみた。 主に、base、stringrのパッケージを扱う。 Rでの文字列処理に関する過去記事 skume.net skume.net 下準備について ######################## #シリーズ共通 ######################## #必要なパッ…

R言語のRSeleniumを使って、ブラウザ(自動)操作とWebスクレイピングをやってみた件 〜Google検索でのトップヒットページ・ヒット件数・スクショの取得〜

RでのWebスクレイピングのやり方の1つとして、rvestパッケージを使う方法がある。 詳細は、過去の記事を参照 skume.net skume.net ただ、このパッケージだと、Webスクレイピングがやや難解なケースがある。 実際、Google検索のヒット件数項目を取得するのを…

gtrendsRを使って、Googleトレンドの情報取得・可視化をやってみた件

今回紹介する、gtrendsRは、Google Trendsの情報を取得・表示するためのパッケージである。 そもそも、Google Trendsは、Googleが提供する無料ツールで、Googleの検索エンジンでの検索クエリの人気動向を分析できる。現在、Google検索のシェアが、世界中で約…

Rで、S&P500 index (SPY: SPDR S&P500 ETF) のSeasonalityを考えてみた件

2021年3月のアメリカ株式市場は、初旬からテック株、小型株がかなりの暴落であった。まさか、ここまで下がるとは、、、*1 こうなると、常識的な相場のSeasonalityをちゃんと理解して、相場の乗り降りのタイミングを考えないといけないなと強く思えてきた。 …

R/Slack APIの諸設定、slackrの使い方、及びGoogle scholarで検索された新着論文情報を知らせるTips

RのSlack APIであるslackrパッケージの使い方について、いろいろとまとめてみた*1。 APIの諸設定、基本的なslackrの使い方に加えて、新着論文情報をRからチャネルに送信するプログラムも実装してみた。 まずは、Salck API設定の手順からはじめよう。 Salck A…

【R・ビッグデータ解析の処方箋】Rで、10万ノードを超える大きなネットワーク図を描画するTips 〜 igraph::plot.igraphは使い物にならない件 〜

Rでのネットワーク図の作成では、igraph packageがよく使われる。 ただ、igraphによるネットワーク図の描写は、1万ノードを超えたあたりから、結構な時間がかかる。 そのため、10万ノードを超えるような、大規模なネットワーク図の描画には、ちょっとした…

【Rのジミ〜な小技シリーズ】変数で、データフレームに「任意の列名」を追加するTips

pasteなどで連結した文字列を、データフレームの列名にしたい。 そういうときがよくある。 食わず嫌い的に試して無かったけど、「えっ、これできるの?!」という感じである・・・。 文字列の変数で、データフレームの列名を追加できることがわかったので、…

【Rでの文字列処理シリーズ(その2)】文字列ベクトルの連結とカウント

Rでの文字列ベクトルの連結とカウントについて、いろいろと試してまとめてみた。 主に、baseやstringrとかのパッケージ内の関数群を扱う。 文字列の連結・結合は普段もよく使うので簡単と思ってたけど、いろいろと試してみると奥が深いかも。 下準備について…

【Rでの文字列処理シリーズ(その1)】テキストファイルの読み込み・文字列の分割

Rでのテキストファイルの読み込み、および文字列の分割について、いろいろと試してまとめてみた。 主に、baseやstringrとかのパッケージ内の関数群を扱う。 結論としては、ファイル読み込み関数は用途によって使い分けが必要である。また、文字列の分割につ…

MacOS Xでやってはいけないコマンド実行、やったら初期化は逃れないかも 〜.DS_Storeファイルが邪魔なのですべて消してみた件〜

この記事の内容を実行してしまったばっかりに、 Mac PCのクリーンアップ(初期化)を余儀なくされても、 一切保証できるものではありませんので、あしからず。 先日、.DS_Storeファイルが無性に邪魔に感じて、 Mac内にある同ファイルすべてを消してみたのだ…

Mac PyMolで使う基本コマンドラインのまとめ

PyMOLは、オープンソースの分子グラフィックスツールである。 いまも、教育版(Educational-use-only PyMOL)は、以下のフォームで登録すれば、フリーで使用できるらしい。 pymol.org 少し前にまとめた資料であるが、PyMolコマンドのメモとしてアップしてお…

Rで作成するデータ分布のアニメーション 〜正規分布編〜

正規分布に従うデータ(乱数)を、異なるサンプルサイズで準備して、 それらデータについて、ヒストグラム・密度分布、累積分布、Q-Qプロットとかで可視化して、 アニメーションにもしてみた。 以下のアニメーションを作成した。 実験的に、こういうのを試す…

文字コード変換コマンド 〜シングルバイト文字、マルチバイト文字、JIS、Shift_JIS、UTF-8、BOM付きUTF-8、Unicodeエスケープ文字、URLエンコードなどの諸問題について〜

シングルバイト文字・マルチバイト文字 「シングルバイト文字」は、1バイト(7ビット、または8ビット)のデータ量で表現できる文字である。文字コードとしては、ASCIIコードなどが該当する。 一方、ダブルバイト文字は、1文字を2バイト以上(16ビット以上…

RからのKaggleコマンド実行のTips 〜コンペ一覧・データセット取得・submitなどを一通りやってみた。Predictionはまた今度で編〜

Kaggle(読み方は「ケグル」??、どうも「カグル」らしい)は、世界中のデータサイエンティストや統計分析者がその最適モデルを競い合う、予測モデリング及び分析手法関連プラットフォームである*1。 この記事では、Terminalを使わずに、R上からすべてのKag…

【CentOS/LINUXの基本コマンド①】 システム情報、CPU情報、メモリ情報を表示してみる

このコーナーでは、CentOSで使う、基本的なコマンドラインをまとめてみることにする。 第1回目として、ターミナルコマンドで、 システム情報、CPU情報、メモリ情報を表示するやり方について、 以下に示す。 システム情報 # システム情報の表示 # -a: コンピ…

最近、CentOS7で、R言語のインストールでややハマった件

CentOS7でのR言語のインストールにハマったので、メモを残しておく。 結局、デフォルトのままだと、EPELリポジトリが無効になっているっぽい。 まずは、パッケージのバージョンを最新版にあげておく、 #リポジトリのアップデートなど $ sudo yum update #OR…

Macターミナル・コマンドのショートカットメモ

(削除) ショートカットキー 1文字の削除 DeleteCtrl (Control) + h 1単語の削除 Ctrl + w カーソル位置から行頭まで削除 Ctrl + u カーソル位置から行末まで削除 Ctrl + k カーソル上の1文字削除 Ctrl + d (履歴) ショートカットキー 一つ前のコマンド…

Mac brew で、pythonの古いバージョンを管理するときのTips 〜「python3」から「python」にコマンド名を書き換える〜

pythonの古いバージョン(例えば、3.8とか)をインストールしたいとき、 パッケージのlinkをしないと、それが使えなくなっている。 今回、python3.8をbrewでインストールして、パッケージのlinkをやり直して、 コマンド名を「python」に書き換えるまでをやっ…

Mac Dockerインストール後に、docker-compose のバージョンを「1.27.4」から「1.28.4」にアップグレードさせるTips

Dockerインストール後に、docker-compose のバージョンが合わないということがある。 今回、「1.27.4」から「1.28.4」にアップグレードさせる実行例を取り上げる。 #Docker のインストール $ brew install --cask docker #Docker.appの起動 $ open /Applicat…