京橋のバイオインフォマティシャンの日常

南国のビーチパラソルの下で、Rプログラムを打ってる日常を求めて、、

Mac

R/rtweetを使って、Twitterでつぶやくための基本的な関数『post_tweet』のこと

rOpenSci (v. 0.6.9) によってレビューされたrtweetパッケージは、TwitterのRESTおよびストリームAPIを介して、Twitterのデータを収集・整理するために設計・実装された。 それを使用するためのR環境の初期設定については、 過去記事の「R/rtweetとか諸々を…

M1チップ搭載の MacBook Air におけるAutoDock Vina (1.2.2) の諸設定とドッキングシミュレーションについて

はじめに - AutoDock Vina AutoDockは、 30年近く開発が進められている、分子モデリングシミュレーションソフトウェアの一つです。 主に、タンパク質–リガンドのドッキングに利用されています。 2009年からオープンソース・ソフトウェアとなり、非商業的利用…

【Rのジミ〜な小技シリーズ】エクセルデータをクリップボードにコピーして、Rのread.table関数でデータフレームとして読み込むTips

はじめに 今までほぼやってなかったけど、さっき使ってみて思いの外、便利でよかったです。 今後はこれを使いたいと強いメッセージを込めて、これのみでメモっておきます。 まずは、Macでエクセルを起動します。 文字や数字が書かれた、エクセルの任意のセル…

grepコマンドで文字列処理をやってみた件【その2】検索語のヒット数カウントとか検索語の前後文字の抽出とか色々

はじめに 「grepコマンドによる文字列処理をやってみた」の続編です。 以前扱えていなかった内容をやっていきたいです。 grepコマンドの基本については過去の記事を参照のこと。 skume.hatenablog.com まずは、サンプルデータをダウンロードする $ svn expor…

grepコマンドで文字列処理をやってみた件【その1】ファイル内のテキストに対する処理とか

はじめに grepコマンドは、ある特定の文字列を含むものを取り出す・検索するときに使用します。 大別して、ファイル内のテキストに対してgrepを行うか、ファイル名に対してgrepを行うかでやり方が変わってきます。 やってることは単純だが、いろいろと応用で…

MacOSXターミナルでのbz2形式の圧縮・解凍についてまとめてみた件

.bz2について bzip2では、 圧縮効率を良くするために、ブロックソート法などを用いています。 gzipやzipといったデータ圧縮に比べて、より高い圧縮率を示します。 また、bz2単独では、アーカイブ機能はありません。 Macでは、bzip2コマンドでbzip2圧縮、 bun…

Homebrew を使って、Python 3.9 をインストールしたときの設定諸々 〜インストール先が「/opt/homebrew/bin」になってるよ!!〜

はじめに(2022年1月アップデート版) Homebrewで、Python3をインストールする際の諸設定をまとめてみました。 この記事では、Anacondaを使わずに、 Homebrewでインストールして、ターミナル上から、Python3をPyhonコマンド、pip3をpipコマンドとして使うこ…

Mac版のSRA-toolkitのprefetchコマンドを使用して、SRA(Sequence Read Archive)ファイルをダウンロードしてみた件

SRA Toolkitの設定 SRA Toolkitの設定は、以前の記事を参考のこと。 skume.net prefetchコマンドについて prefetchは、SRA(Sequence Read Archive)、dbGaP、ADSPデータのコマンドライン・ダウンロードを行うSRA Toolkit内のツールである。 prefetchコマンド…

R/ShortReadパッケージを使って、FASTQ形式ファイルを読み込む

はじめに 今回は、MacOSX環境で、SRA Toolkitのfastq-dumpを用いて取得した、 FASTQ形式ファイルをRに読み込む方法を扱う。 FASTQ形式ファイルの読み込みには、 Bioconductorパッケージの1つである、 ShortReadパッケージのreadFastq関数を用いる。 readFast…

Macで、DS_Storeとか、Rの隠しファイルをバッチファイル(.command)で削除するTips

Macで、フォルダごとファイルをアップロードしたときに、 一緒についてくる隠しファイルが邪魔と感じたことがあるのではないだろうか。 この記事では、シェル(sh)スクリプトのバッチ処理で、 DS_Storeとか、R関連の隠しファイルを削除するやり方を紹介する…

MacでPower Point(パワポ)ファイル(.pptx)を展開して、xmlファイル、画像メディアなどの構成ファイルを見る方法 〜パワポファイルがクラッシュしたときにも使える〜

今回、やることは、タイトルの通りである。 パワポファイル(.pptx)は、ZIPファイルを解凍する要領で、 スライドに対応する XMLファイル、relsファイルや画像ファイルなどに分解して 各構成ファイルを確認することができる。 これは、パワポファイルがクラ…

R言語で『eval + parse + paste関数』を使って、文字列をRプログラムとして実行するTips

はじめに R言語では、文字列をRの命令文として実行することができる。 このプログラム実行のやり方は、 「eval + parse + text + paste」型と表現されることがあるが、 実際には、eval関数、parse関数、paste関数を組み合わせて実行する。 使用する関数群の…

Macで、RをTerminalコマンドでアンインストールするときにやること

Mac版Rは、GUI(R.APP)とR frameworkから構成されている。 そのため、アンイストール時には、それらフォルダを削除する。 一般的なインストールの手順では、GUIは/Applications/R.appフォルダに、R frameworkは/Library/Frameworks/R.frameworkフォルダにイ…

Mac Homebrewで、pandocのインストール

R/Knitで、bibtexのリファレンスの処理ができなくなったと思ったら、pandocが消えてるっぽい。 Pandocというのは、文書作成ツール や出版作業時に用いられるドキュメント・コンバータの1つであり、、、、 なので、pandocを再度インストールしてみた。 pando…

Mac Homebrewで、AWS CLIをインストールする

はじめに Amazon Web Services(AWS)とは、 Amazon.comにより提供されているクラウドコンピューティングサービスである。 今回、AWSサービスを管理するための統合ツールである、 AWS CLIのインストールとかセットアップについてまとめてみた。 まずは、ター…

【Mac OSX編】Finder上で隠しファイルを表示させるショートカット

隠しファイル表示の概要 Macのショートカットで、隠しファイル( . から始まるファイルやフォルダ)の表示・非表示を切り替えることができる。 Finderで表示したいフォルダを選択して、 ⌘(コマンド) + Shift + . (ドット) を同時に押すと、隠しファイルが表…

【R言語での画像処理シリーズ(その2)】主成分分析(PCA)を用いて、画像特徴の次元圧縮をやってみた件

今回は、Karhunen-Loève変換(KL変換)という手法を使って、 ヒマワリ画像の圧縮を行ってみた*1。 この手法のデフォルトでは、 主成分分析(PCA; Principal Component Analysis)をクロップ画像に適用することで、一度、画像を主成分ベクトルに変換する。 その後…

【R言語での画像処理シリーズ(その1)】R/EBImageとかを使った画像処理(読み込み、表示、リサイズetc)をやってみた件

はじめに 今回は、EBImageとimagerを使った、 R環境での画像処理をいろいろと紹介する。 具体的に、画像ファイルの読み込み・表示、 ヒストグラム表示、グレー画像変換、リサイズ(縮小)とかのプログラムを作成・実行してみた。 はじめに、EBImageとimagerを…

R/rtweetとか諸々を使って、つぶやきのテキスト解析 (形態素分析 + 感情分析) をやってみた件

はじめに twitterのつぶやきを集めて、形態素分析 + 感情分析をやってみた。 つぶやきの感情分析は、単語感情極性対応表を使って、positiveかnegativeかを評価してみた。やってみると、案外、面白かった。 まずは、Rの関連パッケージをインストールしてみる…

【LINUX/Macの基本コマンド③】lsコマンドの使い方メモ

LINUX/Macのコマンドライン入門を目指したポストです。 lsコマンド(list segments)は、ディレクトリにあるファイルやフォルダの名前を表示するUNIXコマンドである。 今回は、代表的なオプションの使い方をまとめてみた。 あと、MacOSXでは動作確認をしている…

まさに、Chromeでのタブ管理・収納の女神「OneTab」を使ってみた件

OneTab は、ブラウザで開いている沢山のタブをワンクリックでリスト化、 またはリストを復元・共有できてしまう神的ツールである。 日頃から、沢山のタブを開いたままにして、ブラウザが重くて仕方ないという状況には効果テキメンである。 OneTab自体はGoogl…

こういうキラーアプリを探していた!!重複ファイルを検索・削除するツール dupeguru を使ってみた件

今回は、コンピュータ上の重複ファイルを検索するツール「dupeguru」の紹介記事である。 ファイル名またはコンテンツのいずれかをスキャンして、 重複したファイルを見つけて削除することができる。 コンテンツのスキャンでは、kbオーダーでのサイズ差分を検…

洒落乙 htop でタスクマネージをやってみた件

今回は、ターミナル・タスクマネージャーであるhtopの紹介記事である。 htopのインストール MacOSXとCentOSでのCUIインストール方法は、 ターミナルを起動して、以下のコマンドを打つだけである。 #MacOSXの場合 brew install htop #CentOSの場合 yum instal…

pdflatexが必要になって、久々にMacTexをインストールしてみた件

はじめに OSをクリーンインストールすると、色々と消えてて面倒である。 本記事は、消えたその1つである、MacTexをインストールした時の話である。 Homebrewをインストールして、ターミナルで以下を実行する。 skume.net brew update brew install mactex #…

「Devel版R の Dockerイメージ for Bioconductor」を使ってみた件

Devel版R(あるいは、R-devel)は、 パッケージ開発者用に配布されていて、 最新(安定版)の次のRバージョンである。 Bioconductorのページを参考にして、 Devel版RのDockerイメージを使ってみたので、その方法をメモしておく。 bioconductor.org Mac版 Docke…

R言語のRSeleniumを使って、ブラウザ(自動)操作とWebスクレイピングをやってみた件 〜Google検索でのトップヒットページ・ヒット件数・スクショの取得〜

はじめに RでのWebスクレイピングのやり方の1つとして、rvestパッケージを使う方法がある。 詳細は、過去の記事を参照 skume.net skume.net ただ、このパッケージだと、Webスクレイピングがやや難解なケースがある。 実際、Google検索のヒット件数項目を取…

R/Slack APIの諸設定、slackrの使い方、及びGoogle scholarで検索された新着論文情報を知らせるTips

RのSlack APIであるslackrパッケージの使い方について、いろいろとまとめてみた*1。 APIの諸設定、基本的なslackrの使い方に加えて、新着論文情報をRからチャネルに送信するプログラムも実装してみた。 まずは、Salck API設定の手順からはじめよう。 Salck A…

MacOSXでやってはいけないコマンド実行、やったら初期化は逃れないかも 〜.DS_Storeファイルが邪魔なのですべて消してみた件〜

この記事の内容を実行してしまったばっかりに、 Mac PCのクリーンアップ(初期化)を余儀なくされても、 一切保証できるものではありませんので、あしからず。 先日、.DS_Storeファイルが無性に邪魔に感じて、 Mac内にある同ファイルすべてを消してみたのだ…

Mac PyMolで使う基本コマンドラインのまとめ

PyMOLは、オープンソースの分子グラフィックスツールである。 いまも、教育版(Educational-use-only PyMOL)は、以下のフォームで登録すれば、フリーで使用できるらしい。 pymol.org 少し前にまとめた資料であるが、PyMolコマンドのメモとしてアップしてお…

文字コード変換コマンド 〜シングルバイト文字、マルチバイト文字、JIS、Shift_JIS、UTF-8、BOM付きUTF-8、Unicodeエスケープ文字、URLエンコードなどの諸問題について〜

シングルバイト文字・マルチバイト文字 「シングルバイト文字」は、1バイト(7ビット、または8ビット)のデータ量で表現できる文字である。文字コードとしては、ASCIIコードなどが該当する。 一方、ダブルバイト文字は、1文字を2バイト以上(16ビット以上…