京橋のバイオインフォマティシャンの日常

データ分析、コマンドライン、プログラミングについての技術資料・自己アップデート・悩み事などをまとめています。最近、ディープラーニング関連のR言語の資料をまとめるべく注力してます。

M1チップ搭載の MacBook Air におけるAutoDock Vina (1.2.2) の諸設定とドッキングシミュレーションについて

はじめに - AutoDock Vina AutoDockは、 30年近く開発が進められている、分子モデリングシミュレーションソフトウェアの一つです。 主に、タンパク質–リガンドのドッキングに利用されています。 2009年からオープンソース・ソフトウェアとなり、非商業的利用…

【Rのジミ〜な小技シリーズ】変数で、データフレームに「任意の列名」を追加するTips

はじめに pasteなどで連結して作成した文字列をもとにして、それらをデータフレームの列名にしたい。 そういうケースがよくあるのです。 食わず嫌い的に試して無かったけど、「えっ、これできるの?!」という感じなことが起こったようです・・・。 文字列の…

【Rのジミ〜な小技シリーズ】エクセルデータをクリップボードにコピーして、Rのread.table関数でデータフレームとして読み込むTips

はじめに 今までほぼやってなかったけど、さっき使ってみて思いの外、便利でよかったです。 今後はこれを使いたいと強いメッセージを込めて、これのみでメモっておきます。 まずは、Macでエクセルを起動します。 文字や数字が書かれた、エクセルの任意のセル…

grepコマンドで文字列処理をやってみた件【その2】検索語のヒット数カウントとか検索語の前後文字の抽出とか色々

はじめに 「grepコマンドによる文字列処理をやってみた」の続編です。 以前扱えていなかった内容をやっていきたいです。 grepコマンドの基本については過去の記事を参照のこと。 skume.hatenablog.com まずは、サンプルデータをダウンロードする $ svn expor…

grepコマンドで文字列処理をやってみた件【その1】ファイル内のテキストに対する処理とか

はじめに grepコマンドは、ある特定の文字列を含むものを取り出す・検索するときに使用します。 大別して、ファイル内のテキストに対してgrepを行うか、ファイル名に対してgrepを行うかでやり方が変わってきます。 やってることは単純だが、いろいろと応用で…

htmlwidgets for R のShowcaseにあるパッケージがCodePenでブログ表示できるかを調べた件

はじめに htmlwidgets for R パッケージは、Rでインタラクティブな図が作成できる王道的なパッケージであり、 それを使った色々な依存パッケージが開発されています。 www.htmlwidgets.org 今回、htmlwidgetsのshowcaseにある12パッケージをHatena Blog内…

MacOSXターミナルでのbz2形式の圧縮・解凍についてまとめてみた件

.bz2について bzip2では、 圧縮効率を良くするために、ブロックソート法などを用いています。 gzipやzipといったデータ圧縮に比べて、より高い圧縮率を示します。 また、bz2単独では、アーカイブ機能はありません。 Macでは、bzip2コマンドでbzip2圧縮、 bun…

R/Keras/TensorFlowでやる『ディープラーニング(Deep Learning)』のすゝめ【その2】教師なしニューラルネットワーク Autoencoder with 2D CNNの実装、そして色ムラ・ノイズ除去(Denoising)をやってみた件

はじめに 「R/Keras/TensorFlowでやるディープラーニングのすゝめ」の連載2回目です(2022年1月19日アップデート版)。 【1】では、ベクトルデータに対する Autoencoderを取り上げましたが、 今回は、 2D Convolutional Neural Network (CNN: 畳み込みニュ…

Homebrew を使って、Python 3.9 をインストールしたときの設定諸々 〜インストール先が「/opt/homebrew/bin」になってるよ!!〜

はじめに(2022年1月アップデート版) Homebrewで、Python3をインストールする際の諸設定をまとめてみました。 この記事では、Anacondaを使わずに、 Homebrewでインストールして、ターミナル上から、Python3をPyhonコマンド、pip3をpipコマンドとして使うこ…

R言語/Webスクレイピングで、Wikipediaページのテーブル情報からNASDAQ-100の銘柄リストを取得して、2021年中の株価推移を見てみた件

はじめに R言語を利用して、 Wikipediaページから銘柄コード情報を「Webスクレイピング」で取得して、 さらに各銘柄の株価情報を「quantmod パッケージ」を使って収集する。 今回の記事では、2021年年初から12月末までのNASDAQ-100銘柄(2022年1月3日現在)…

Rで、デフォルトパッケージ以外のパッケージを削除するTips

はじめに Rのデフォルトパッケージを残して、 追加でインストールしたパッケージだけを削除する方法をメモしておく。 パッケージがいろいろと増えてくると、 パッケージすべてを削除したいとか、 1つのパッケージだけを削除したいといったことを考え出す。 …

【SRA Toolkitの続編】Mac版のSRA Toolkitを設定して、fastq-dumpの高速版「fasterq-dump」を試してみた件

SRA Toolkitの設定 SRA Toolkitの設定は、以前の記事を参考のこと。 skume.net Mac版のSRA Toolkitを設定すれば、 そのままの設定で、fasterq-dumpコマンドも実行できる。 fasterq-dumpコマンドで、FASTQファイルを高速に取得する SRA toolsの2.9.1リリース…

R言語/rstudio 初心者におすすめ入門本・参考書: 厳選 5 選!【2022年1月版】

はじめに R言語の公式ホームページ(https://www.r-project.org/) R言語は、統計解析やグラフィクス(データの可視化)に適した命令システムを持つ、インタープリタ型のプログラム言語です。 インタープリタ型は、Python言語やPerl言語などとも同じ方式で、…

Mac版のSRA-toolkitのprefetchコマンドを使用して、SRA(Sequence Read Archive)ファイルをダウンロードしてみた件

SRA Toolkitの設定 SRA Toolkitの設定は、以前の記事を参考のこと。 skume.net prefetchコマンドについて prefetchは、SRA(Sequence Read Archive)、dbGaP、ADSPデータのコマンドライン・ダウンロードを行うSRA Toolkit内のツールである。 prefetchコマンド…

R/ShortReadパッケージを使って、FASTQ形式ファイルを読み込む

はじめに 今回は、MacOSX環境で、SRA Toolkitのfastq-dumpを用いて取得した、 FASTQ形式ファイルをRに読み込む方法を扱う。 FASTQ形式ファイルの読み込みには、 Bioconductorパッケージの1つである、 ShortReadパッケージのreadFastq関数を用いる。 readFast…

Wikipedia 英語記事「COVID-19」の日本語訳を公開してみた【その3: COVID感染症の病態生理】

この記事は、2021年12月30日現在のWikipedia 英語記事「COVID-19」を日本語訳したものである。 en.wikipedia.org この情報は英語ページにはありますが、まだ日本語ページは存在していません。結構しっかりした内容だったので、このwikipedia記事の日本語訳を…

Wikipedia 英語記事「COVID-19」の日本語訳を公開してみた【その2: COVIDの伝染】

はじめに この記事は、2021年12月30日現在のWikipedia 英語記事「COVID-19」を日本語訳したものである。 en.wikipedia.org この情報は英語ページにはありますが、まだ日本語ページは存在していません。結構しっかりした内容だったので、このwikipedia記事の…

Wikipedia 英語記事「COVID-19」の日本語訳を公開してみた【その1: COVIDの概要】

この記事は、2021年12月30日現在のWikipedia 英語記事「COVID-19」を日本語訳したものである。 en.wikipedia.org この情報は英語ページにはありますが、まだ日本語ページは存在していません。結構しっかりした内容だったので、このwikipedia記事の日本語訳を…

最も重要な ribosomal RNA(rRNA)の1つである『16S rRNA』の生命科学的な話

リボソームは、細胞内のタンパク質の合成装置である まず、リボソーム(ribosome)について概説します。 リボソームでは、mRNAの情報を読み取り、tRNAに結びついたアミノ酸から所定のタンパク質を合成する。(出典元) 細胞の核内で、DNAの二重螺旋構造が部…

Mac版のSRA Toolkitを設定して、fastq-dumpを使ってみた件

はじめに - SRA Toolkitについて - SRA Toolkitは、NCBIのデータベースである、Sequence Read Archivesのデータを扱うためのツール群である。 もっと簡単に言うと、コマンドラインでシークエンス・データを取得・処理するための、入れておくと便利なツール群…

Macで、DS_Storeとか、Rの隠しファイルをバッチファイル(.command)で削除するTips

Macで、フォルダごとファイルをアップロードしたときに、 一緒についてくる隠しファイルが邪魔と感じたことがあるのではないだろうか。 この記事では、シェル(sh)スクリプトのバッチ処理で、 DS_Storeとか、R関連の隠しファイルを削除するやり方を紹介する…

Wikipedia 英語記事「Coronavirus / コロナウイルス」の日本語訳 その3

この記事は、2021年12月15日現在のWikipedia 英語記事「Coronavirus」の一部を日本語翻訳したものである。 en.wikipedia.org この情報は、Wikipediaの英語ページのみにあり、まだ日本語ページは存在していません。結構しっかりした内容で発信するのに有用だ…

Wikipedia 英語記事「Coronavirus / コロナウイルス」の日本語訳 その2

この記事は、2021年12月15日現在のWikipedia 英語記事「Coronavirus」の一部を日本語翻訳したものである。 en.wikipedia.org この情報は、Wikipediaの英語ページのみにあり、まだ日本語ページは存在していません。結構しっかりした内容で発信するのに有用だ…

Wikipedia 英語記事「Coronavirus / コロナウイルス」の日本語訳 その1

この記事は、2021年12月15日現在のWikipedia 英語記事「Coronavirus」の一部を日本語翻訳したものである。 en.wikipedia.org この情報は、Wikipediaの英語ページのみにあり、まだ日本語ページは存在していません。結構しっかりした内容で発信するのに有用だ…

Wikipedia 英語記事「HIV(ヒト免疫不全ウイルス)の構造とゲノム」の日本語訳 その2

この記事は、2021年12月13日現在のWikipedia 英語記事「Structure and genome of HIV」を日本語翻訳したものである。 en.wikipedia.org この情報は、Wikipediaの英語ページのみにあり、まだ日本語ページは存在していません。結構しっかりした内容で発信する…

MacでPower Point(パワポ)ファイル(.pptx)を展開して、xmlファイル、画像メディアなどの構成ファイルを見る方法 〜パワポファイルがクラッシュしたときにも使える〜

今回、やることは、タイトルの通りである。 パワポファイル(.pptx)は、ZIPファイルを解凍する要領で、 スライドに対応する XMLファイル、relsファイルや画像ファイルなどに分解して 各構成ファイルを確認することができる。 これは、パワポファイルがクラ…

Wikipedia 英語記事「HIV(ヒト免疫不全ウイルス)の構造とゲノム」の日本語訳 その1

この記事は、2021年12月13日現在のWikipedia 英語記事「Structure and genome of HIV」を日本語翻訳したものである。 en.wikipedia.org この情報は、Wikipediaの英語ページのみにあり、まだ日本語ページは存在していません。結構しっかりした内容で発信する…

R言語で『eval + parse + paste関数』を使って、文字列をRプログラムとして実行するTips

はじめに R言語では、文字列をRの命令文として実行することができる。 このプログラム実行のやり方は、 「eval + parse + text + paste」型と表現されることがあるが、 実際には、eval関数、parse関数、paste関数を組み合わせて実行する。 使用する関数群の…

Macターミナルのコマンドライン先頭に表示されるディレクトリ表示を無くすTips【zsh編】

MacOS X Catalina(10.15)より、Macのデフォルトシェルが、Z Shell(zsh)に代わった。 どうも、Macで使用していたbashはバージョンが古いままで、 当時、セキュリティの問題が浮上したようだ。 そのため、ターミナルのログイン時の設定は、 デフォルトシェ…

Wikipedia 英語記事「SARS-CoV-2 オミクロン変異体」の日本語訳 その4

この記事は、2021年12月8日現在のWikipedia 英語記事「SARS-CoV-2 Omicron variant」を日本語翻訳したものである。 過去の記事「Wikipedia 英語記事「SARS-CoV-2 オミクロン変異体」の日本語訳 その1〜3」もご参考のこと skume.net skume.net skume.net 情報…